Simulacion y Optimizacion Avanzadas en La Industria Quimica y de Procesos HYSYS - Susana Luque
Short Description
Descripción: Simulacion en HYSYS...
Description
Simulación y optimización avanzadas en la industria química y de procesos: HYSYS
Susana Luque Rodríguez Aurelio B. Vega Granda
Tercera edición ISBN: 84-689-3028-8 D.L. AS/3604-2005 Editora: Susana Luque Rodríguez © Los autores, 2005. TODOS LOS DERECHOS RESERVADOS. Ninguna parte de esta publicación se puede reproducir, guardar o transmitir de ningún modo, electrónico o de otro tipo, sin el permiso de los autores.
Impreso y encuadernado en España Universidad de Oviedo, Oviedo
Índice general
ÍNDICE GENERAL
Tema 1.
Introducción. La simulación de procesos en la industria química actual
Página 1
Susana Luque Rodríguez y Aurelio B. Vega Granda
Tema 2.
Termodinámica de sistemas no ideales
17
Julio L. Bueno de las Heras
Tema 3.
Modelos de predicción de propiedades físico-químicas
47
M. Carmen Pazos Medina
Tema 4.
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
77
Aurelio B. Vega Granda
Tema 5.
Modelos rigurosos de separaciones de equilibrio
97
Fernando V. Díez Sanz
Tema 6.
Modelos rigurosos de operaciones unitarias
107
Aurelio B. Vega Granda
Tema 7.
Modos de simulación de procesos
125
Aurelio B. Vega Granda
Tema 8.
Métodos de resolución de ecuaciones no lineales I: métodos tipo Newton
137
José Ramón Álvarez Saiz
Tema 9.
Métodos de resolución de ecuaciones no lineales II: métodos que no requieren derivadas y de primer orden
José Ramón Álvarez Saiz Tema 10. Recirculaciones: partición y seccionado de corrientes Susana Luque Rodríguez Tema 11. Simulación en diseño y operación de procesos. Aplicaciones Aurelio B. Vega Granda
Tema 12. Introducción a la programación no lineal (NLP) con restricciones Ramón Álvarez Saiz Tema 13. José Programación cuadrática sucesiva (SQP) José Ramón Álvarez Saiz Tema 14. Optimización de procesos con simuladores modulares Susana Luque Rodríguez Tema 15. Optimización de procesos con simuladores orientados a ecuaciones Susana Luque Rodríguez Tema 16. Optimización en diseño y operación en la industria química. Aplicaciones Susana Luque Rodríguez i
149 163 179
195 217 231 243 257
Índice general Tema H1. Introducción al uso de HYSYS. Modelos simples de operaciones unitarias Aurelio B. Vega Granda y Susana Luque Rodríguez Tema H2. Simulación de procesos con HYSYS. Aspectos básicos Susana Luque Rodríguez y Aurelio B. Vega Granda Tema H3. Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones Aurelio B. Vega Granda y Susana Luque Rodríguez Tema H4. Simulación de procesos con HYSYS. Especificaciones de diseño Susana Luque Rodríguez y Aurelio B. Vega Granda Tema H5. Simulación de procesos con HYSYS. Optimización de diagramas de flujo Susana Luque Rodríguez y Aurelio B. Vega Granda
ii
275 289 303 313 327
Introducción. La simulación de procesos en la industria química actual
Introducción y planificación del curso. La simulación de procesos en la industria química actual
ÍNDICE 1. INTRODUCCIÓN........................................................................................................3 2. ORGANIZACIÓN DEL CURSO ................................................................................4 2.1. Objetivos del curso................................................................................................4 2.2. Programa del curso................................................................................................4 2.3. Evaluación.............................................................................................................6 2.4. Bibliografía............................................................................................................6 3. LA SIMULACIÓN DE PROCESOS EN LA INDUSTRIA QUÍMICA ACTUAL . 7 4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO DE CEBOLLA”...................................................................................................................9 5. MODELIZACIÓN EN PROCESOS QUÍMICOS .................................................. 12 5.1. Los métodos numéricos como herramienta para la modelización de procesos en ingeniería química...............................................................................................13 6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS ........................... 16 7. BIBLIOGRAFÍA ........................................................................................................ 16
1. INTRODUCCIÓN El desarrollo de modelos de balances de materia y energía es la base para la evaluación de procesos y la toma de decisiones en el diseño de nuevas plantas o modificaciones de las ya existentes. El modelo del diagrama de flujo comprende un conjunto grande de ecuaciones no lineales que describen: 1. las condiciones de las unidades del proceso mediante corrientes de proceso 2. las ecuaciones específicas de cada unidad (leyes de conservación y ecuaciones de diseño específicas) 3. los datos y relaciones de éstos con las propiedades físicas de las sustancias procesadas En este curso veremos todos estos aspectos incluyendo la influencia que tiene el comportamiento real (no ideal) de los sistemas en equilibrio, así como el desarrollo de modelos detallados, que se encuentran implementados en los simuladores comerciales. Los modelos detallados se basan en relaciones de equilibrio entre fases (para lo cual se repasarán algunos conceptos termodinámicos) y balances de materia y energía. Los cálculos en los simuladores comerciales se simplifican bastante al no incluir en muchos casos las propiedades de transporte. Es decir, se aprovecha la posibilidad de llevar a cabo los balances de materia y energía sin conocer la capacidad o geometría de las unidades. Esto implica que para llevar a cabo una estimación económica del proceso, tras la simulación se tiene que llevar a cabo un diseño de las unidades, que incluya su dimensionado y estimación de coste. Los simuladores comerciales tienen esta opción disponible, habitualmente como un paquete informático adicional, al que se pueden incorporar los datos obtenidos en la simulación. 3
Introducción y planificación del curso. La simulación de procesos en la industria química actual
Otra de las implicaciones importantes de esta forma de trabajo es que, aunque resulta correcta para nuevos diseño de plantas o secciones de planta, su aplicación a simulación de equipos existentes es más problemática (ya que se precisarían modelos del funcionamiento de dichos equipos). En otros casos, por ejemplo en operaciones no controladas por el equilibrio sino por un proceso de velocidad, los modelos basados en consideraciones termodinámicas tampoco son adecuados. En el curso también se abordarán los métodos de resolución de los sistemas de ecuaciones no lineales que resultan de los modelos de las unidades del proceso y de las propiedades físicoquímicas de las corrientes involucradas. Para ello se introducirán métodos numéricos que permiten trabajar con sistemas a gran escala, como los habitualmente encontrados en simulación de procesos. Con este objetivo se introducirán brevemente los algoritmos de resolución más habituales en los simuladores comerciales. Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de proceso, se va a considerar un aspecto clave en diseño de procesos. El objetivo de muchas simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en mejorar el proceso. Con esta idea se verán las estrategias de optimización para procesos químicos con variables continuas. En particular nos centraremos en el algoritmo de programación cuadrática sucesiva (SQP o “Successive Quadratic Programming”) que se ha convertido en el estándar en optimación de procesos.
2. ORGANIZACIÓN DEL CURSO 2.1. Objetivos del curso El curso profundiza en las herramientas actualmente disponibles para la simulación de procesos reales de la industria química y de procesos. Se pretende que los participantes adquieran: •
•
•
los conocimientos teóricos básicos necesarios para comprender la implementación de los modelos en los simuladores y su resolución las estrategias actualmente empleadas en optimización de procesos químicos experiencia en la formulación y resolución de problemas industriales de diseño y optimización, con una herramienta informática que en la actualidad emplea la industria de procesos: HYSYS v. 3.
2.2. Programa del curso El curso consta de 30 horas lectivas, 15 de las cuales se imparten en el aula 26 y 15 en aula de informática (aula D, edificio de departamentos), con una ratio máxima de 2 alumnos/ordenador. El curso es convalidable por 4.5 créditos de libre configuración. El curso se ha estructurado en tres bloques temáticos: I. Introducción. Termodinámica y modelización rigurosa de procesos II. III. 4
Simulación de procesos en la industria química y de procesos: HYSYS Optimización de diagramas de flujo con HYSYS
Introducción y planificación del curso. La simulación de procesos en la industria química actual
El curso incluye, además de los aspectos teóricos básicos necesarios para comprender la implementación de los modelos en los simuladores y su resolución, un gran número de horas de clases en las que es posible, mediante el acceso directo a un ordenador con un programa de simulación comercial (HYSYS, v.3.) adquirir experiencia en la formulación y resolución de problemas industriales de diseño y optimización, con las mismas herramientas que en la actualidad emplea la industria de procesos. El temario detallado del curso se indica a continuación: Tema Título
Profesor/a
Duración (h) 1
0
Introducción y planificación del curso. La simulación Susana Luque de procesos en la industria química actual I. Introducción. Termodinámica y modelización rigurosa de procesos 1 Termodinámica de sistemas no ideales Julio Bueno 2 Modelos de predicción de propiedades físico-químicas Carmen Pazos 3 Implementación de modelos de propiedades físicas y Aurelio Vega criterios de selección 4 Modelos rigurosos de separaciones de equilibrio Fernando Díez 5 Modelos rigurosos de operaciones unitarias Aurelio Vega II. Simulación de procesos en la industria química y de procesos HYSYS 6 Modos de simulación de procesos Aurelio Vega 7 Métodos de resolución de ecuaciones no lineales I: José R. Álvarez métodos tipo Newton 8 Métodos de resolución de ecuaciones no lineales II: José R. Álvarez métodos que no requieren derivadas y de primer orden 9 Recirculaciones: partición y seccionado de corrientes Susana Luque 10 Simulación en diseño y operación de procesos. Aurelio Vega Aplicaciones III. Optimización de diagramas de flujo con HYSYS 11 Introducción a la programación no lineal (NLP) con José R. Álvarez restricciones 12 Programación cuadrática sucesiva (SQP) José R. Álvarez 13 Optimización de procesos con simuladores modulares Susana Luque 14 Optimización de procesos con simuladores orientados Susana Luque a ecuaciones 15 Optimización en diseño y operación en la industria Susana Luque / química. Aplicaciones Aurelio Vega H1 Introducción al uso de HYSYS. Modelos simples de Aurelio Vega / operaciones unitarias
Susana AurelioLuque Vega Susana Luque H3 Simulación de procesos con HYSYS. Sistemas de Aurelio Vega reacción y recirculaciones Susana Luque H4 Simulación de procesos con HYSYS. Especificaciones Susana Luque de diseño Aurelio Vega H5 Simulación de procesos con HYSYS. Optimización de Susana Luque diagramas de flujo Aurelio Vega H2 Simulación de procesos con HYSYS. Aspectos básicos
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
/
3
/
3
/
3
/
3 5
Introducción y planificación del curso. La simulación de procesos en la industria química actual
La carga docente se haya repartida de forma relativamente uniforme, como se muestra en la figura 1. I.Termodinámica y modelización rigurosa 20 %
II. Simulación de procesos 17 %
III. Optimización de diagramas de flujo 13 % HYSYS 50 %
Fig. 1. Distribución de la carga docente del curso, según bloques temáticos
2.3. Evaluación A los efectos de la obtención del certificado de homologación de créditos de libre configuración es obligatoria la asistencia en un 80 % como mínimo. La evaluación se llevará a cabo mediante la realización de una prueba escrita (1 hora de duración, inmediata a la finalización del curso) y un trabajo adicional sobre alguno de los temas tratados en el curso, que los alumnos tendrán que entregar antes del 31 de julio a los directores del curso. 2.4. Bibliografía La documentación que se entrega está fundamentalmente obtenida de las siguientes fuentes: •
•
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997). Hyprotech “HYSYS user’s guide”, disponible http://engineering.eng.rowan.edu/~hesketh/hysyshelp/Menu.pdf, www.hyprotech.com y en support.aspectech.com
en en
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999).
Otros libros de consulta son los siguientes: Bequette, B.W., “Process Dynamics: Modeling, Analysis and Simulation”, Prentice Hall, New Jersey (1998). •
•
•
6
Ingham, J., Dunn, I.J., Keinzle, E., Prenosil, J.E., “Chemical Engineering Dynamics”, Verlagsgesellschaft, Weinheim (1994). Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and Design of Chemical Processes”, Prentice Hall, Nueva Jersey (1998).
Introducción y planificación del curso. La simulación de procesos en la industria química actual
3. LA SIMULACIÓN DE PROCESOS EN LA INDUSTRIA QUÍMICA ACTUAL En un proceso químico, la transformación de materias primas en los productos deseados habitualmente conlleva más de una etapa. El proceso suele constar de una serie de etapas de transformación intermedias que involucran, por ejemplo, reacción, separación, mezcla, calentamiento, enfriamiento, cambio de presión, reducción o aumento del tamaño de partícula, etc. Una vez que se han seleccionado las etapas individuales, es necesario interconectarlas para llevar a cabo la transformación global.
Materias primas
¿PROCESO?
Productos deseados
Fig. 2. Esquema genérico del diseño de un proceso químico El diseño de un proceso involucra una descripción abstracta de lo que se quiere, y otra descripción más detallada (esto es, más refinada) en cada una de las etapas del diseño, construcción y operación del proceso. Por ejemplo, la dirección de la empresa desea mejorar el valor futuro de la empresa, lo que constituye la descripción abstracta de sus deseos. En consecuencia genera y selecciona entre las alternativas posibles a llevar a cabo en la empresa para lograr este fin; esto representa una descripción más detallada de lo que se quiere llevar a cabo. Esta descripción se transforma en la descripción abstracta para aquellos que trabajan en las siguientes etapas del diseño. Por ejemplo, en el diseño preliminar del proceso, la descripción abstracta podría ser convertir el exceso de etileno de la planta en alcohol etílico. La descripción más detallada será el diseño preliminar necesario para llevar a cabo este fin. Denominamos síntesis al proceso de transformar la descripción abstracta en otra más detallada, y comprende varias etapas como se indica en la figura 3. La primera etapa es la generación del concepto , donde se identifican las claves principales en que se basará el diseño. Para el ejemplo anterior, deberemos decidir si nos restringimos a la química que se encuentra en la bibliografía, si sólo consideramos procesos convencionales bien contrastados o por el contrario optamos por procesos novedosos. Se debe considerar aquí también si se compra un proceso llave en mano, etc. En la siguiente etapa consideramos la generación de alternativas, para ello se suele partir de fuentes bibliográficas (patentes, artículos científicos, enciclopedias de tecnología). La siguiente etapa es el análisis de cada una de las alternativas propuestas para evaluar su funcionamiento. Típicamente, esto significa llevar a cabo los balances de materia y energía del proceso para calcular los flujos, temperaturas, presiones, composiciones, etc.
7
Introducción y planificación del curso. La simulación de procesos en la industria química actual Descripción inicial
Entradas y Resultados Especificación del Problema
(Nuevo) Enfoque del Diseño
Etapas Generación de Conceptos
Generación de Alt er nat ivas
En la siguiente etapa tenemos que evaluar el funcionamiento del proceso, tanto desde el punto de vista de su rentabilidad económica, como flexibilidad, seguridad, de impacto medioambiental, etc. Finalmente, se requiere llevar a cabo una optimización para mejorar el diseño. Al final de todo este proceso se espera tener el mejor diseño que satisface nuestro objetivo inicial, y habremos transformado una descripción abstracta en una más detallada que da lugar al diagrama de flujo del proceso.
Alt er nat iva s de Diseño
Aná lis is Representación
Evaluación Coste, Seguridad, etc.
Un DIAGRAMA DE FLUJO (Process Flow Diagram, PFD) no es más que la representación de las etapas del proceso y sus interconexiones.
Comparación y Optimización
Por tanto, una vez que se ha definido la estructura del diagrama, es posible llevar a cabo un ANALISIS y SIMULACIÓN del proceso. La simulación requiere un modelo Descripción refinada matemático del proceso que intenta predecir el comportamiento del proceso si éste se Fig. 3. Etapas en la síntesis de un proceso construyese (Fig. 4). químico
Materias primas
PROCESO
¿Productos?
Fig. 4. Flujo de información en la simulación de procesos Una vez que se tiene un modelo del proceso, suponiendo conocidos unos caudales, composiciones, temperaturas y presiones de las corrientes correspondientes a las materias primas, la simulación permite predecir caudales, composiciones, temperaturas y presiones de las corrientes producto. También permite el forma dimensionado de equipos y el cálculo del consumo de materias primas y energía. De esta se puede evaluar el diseño. En la evaluación del diseño hay muchos aspectos involucrados: la economía del proceso es el primer criterio obvio, pero no el único. Los procesos químicos se han de diseñar como parte de un desarrollo industrial sostenible, que permite mantener la capacidad de nuestro ecosistema para seguir permitiendo las actividades industriales y la vida. En la práctica, esto significa que se deben minimizar las emisiones de residuos y que los subproductos residuales no han de ser perjudiciales para el medio ambiente. El desarrollo sostenible también implica que el consumo energético sea el mínimo posible. El proceso, además, ha de cumplir con 8
Introducción y planificación del curso. La simulación de procesos en la industria química actual
criterios de seguridad e higiene (salud). La puesta en marcha, la parada en caso de emergencia y la facilidad de control son otros factores importantes. La flexibilidad (posibilidad de operar en otras condiciones, tales como materias primas diferentes o diferentes especificaciones de productos) puede ser también importante, al igual que la disponibilidad anual de tiempo. Algunos de estos factores se pueden cuantificar fácilmente (economía), otros con frecuencia no. Para estos últimos el criterio del ingeniero de diseño juega un papel importante. Una vez que se ha evaluado el diseño básico, es posible mejorar éste realizando cambios, es decir, optimizándolo. La OPTIMIZACIÓN puede involucrar la síntesis de estructuras alternativas (optimización estructural) en cuyo caso se realizaría una nueva simulación y evaluación, y así sucesivamente. O, alternativamente, se puede realizar una optimización paramétrica de una estructura, modificando las condiciones de operación. El hecho de que hasta los procesos ya establecidos y que llevan operando un gran número de años se siguen modificando hoy en día es una muestra de lo difícil que todo este mecanismo de SÍNTESIS+SIMULACIÓN+OPTIMIZACIÓN resulta en la práctica.
4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO DE CEBOLLA” El diseño del proceso comienza en el reactor. El diseño del reactor dicta las necesidades de separación y recirculación del proceso. Alimentación
Reactor
Producto Subproductos + Reactivos no reaccionados
Pero no toda la alimentación reacciona, además, también se generan subproductos, que es preciso separar para obtener el producto en la pureza requerida. Recirculación de react ivos
Alimentación
Reactor
Producto
Subproducto
En este diagrama de flujo, las necesidades energéticas (calentamiento/enfriamiento) se obtienen de sistemas auxiliares externos (vapor y agua de refrigeración), por lo que es ineficaz energéticamente. Por ello se debe intentar recuperar la energía: integración energética (intercambio de calor entre las corrientes que tienen que enfriarse y los que tienen que 9
Introducción y planificación del curso. La simulación de procesos en la industria química actual
calentarse, resultando en una red de cambiadores de calor (HEN)–cuya estructura tiene muchas posibilidades).
Sin embargo, si cambiamos el reactor o las condiciones del mismo, se modifica el problema de separación y recirculación. Por ejemplo, si queremos, aumentado el tamaño del reactor, aumentar la conversión, el resultado será que hay menos reactivos no reaccionados, más cantidad de producto y una cantidad significativamente mayor de subproductos, por lo que puede ser necesaria una secuencia diferente de los procesos de separación posterior. Recirculación de reactivos
Alimentación
Reactor
Producto
Subproducto
Si además realizamos la integración energética, tendremos nuevos esquemas de HEN.
Los diferentes diagramas de flujo se pueden evaluar mediante simulación y cálculos económicos (por ejemplo, dando como resultado que una de las opciones es más prometedora que las demás). Sin embargo, no podemos estar seguros de haber encontrado el diagrama de 10
Introducción y planificación del curso. La simulación de procesos en la industria química actual
flujo óptimo antes de haber optimizado las condiciones de operación para cada uno de ellos (por ejemplo, puede haber otra alternativa con más posibilidades de mejora). Por lo tanto, la complejidad de la síntesis de procesos es doble: •
•
¿Podemos identificar todas las estructuras posibles? ¿Podemos optimizar cada estructura para obtener una comparación válida? (en la optimización de una estructura puede haber muchas maneras en las que llevar a cabo una tarea dada, y también muchas formas de interconectar las tareas individuales...)
Todo esto implica simular y optimizar un gran número de opciones, lo que supone una complejidad abrumadora. Por ello, para desarrollar una metodología es preciso tener una idea clara de la estructura del problema. Si el proceso requiere un reactor, entonces el diseño comienza con éste. Como hemos visto, la selección del reactor dicta los problemas posteriores de separación y recirculación, que son los pasos siguientes en el diseño. Conjuntamente con el reactor, definen las necesidades energéticas del proceso, por que el diseño de la HEN viene a continuación. Las necesidades energéticas que no se pueden suplir mediante integración energética srcinan las necesidades de sistemas auxiliares (vapor, agua de refrigeración, etc.). Esta jerarquía se puede representar simbólicamente por las capas de una cebolla, diagrama que enfatiza la naturaleza secuencial (o jerárquica) del diseño de procesos químicos: REACTOR SEPARACIONES Y RECIRCULACIONES
Fig. 5. Diagrama de “cebolla” del diseño jerarquizado de procesos químicos Por supuesto, algunos procesos no necesitan un reactor (por ejemplo, en refino de petróleo). En estos casos el diseño comienza con el sistema de separación y va también hacia la parte exterior. La jerarquía se mantiene. En la práctica hay muchas opciones y para su evaluación completa es preciso llegar al diseño completo, lo cual muchas veces no es posible, prácticamente hablando. Por lo tanto, como vemos, la tarea de diseño involucra un procedimiento iterativo, en el cual la etapa de síntesis está siempre seguida por una etapa de análisis, la cual determina si la estructura y los parámetros propuestos funcionarán como se espera. Si las metas de diseño no se alcanzan, se requiere un nuevo paso de síntesis para crear o una solución factible o una solución mejorada. En cualquier caso, para el diseño de un proceso siempre se necesita un modelo matemático del proceso que nos permita efectuar el análisis y optimización de las diferentes alternativas posibles.
11
Introducción y planificación del curso. La simulación de procesos en la industria química actual
5. MODELIZACIÓN EN PROCESOS QUÍMICOS Es sabido que el procedimiento metodológico fundamental para resolver un problema en ingeniería consiste en representarlo de una manera adecuada, para lograr una sustitución del sistema real (equipo, proceso, etc.) por uno más adecuado para su tratamiento formal. Por lo general, las herramientas lógico-matemáticas nos brindan un marco útil para representar mediante un sistema de símbolos y reglas, el comportamiento de los sistemas reales. Bajo el métodolascientífico, porexpresables ejemplo, seporconsolidan y teorías en diversas ramas del conocimiento, cuales son medio de leyes sistemas de ecuaciones diferenciales. En otras palabras, se logra construir un nuevo sistema, del cual conocemos sus reglas de juego y símbolos, como un resultado de un proceso de abstracción de la realidad. Obviamente, dado la infinita complejidad de los fenómenos fisicoquímicos, estas construcciones abstractas, conocidas genéricamente como modelos, son sólo meras aproximaciones de la realidad. En efecto, no es otra cosa lo que se realiza cuando en física utilizamos ecuaciones para describir el movimiento de una partícula, o resolvemos los balances correspondientes aplicando las leyes de conservación de la materia, energía o cantidad de movimiento; o bien cuando nos enfrentamos al diseño de un equipo según los procedimientos que conocemos a partir del campo de las operaciones unitarias. De aquí se desprende que si bien el sistema real a estudiar es único, puede existir un número muy grande de modelos asociados al mismo. En efecto, para obtener un modelo que pueda resolverse (es decir que sea útil), resulta necesario adoptar un conjunto de hipótesis. Por ejemplo, si consideramos la fricción, si es importante o no contemplar el intercambio de energía radiación, etc. Las de necesidades exactitud que el problema a resolver impone, por determinan el conjunto hipótesis a de utilizar. En resumen, dado el sistema real ynos los objetivos tecnológicos perseguidos, existirá un conjunto de hipótesis adecuadas que determinarán las características del modelo, o sistema de ecuaciones a resolver. Resulta evidente que no todo sistema de ecuaciones puede resolverse fácilmente, al menos desde el punto de vista analítico. Esto impuso a lo largo de la historia limitaciones importantes al tipo de modelos que podían resolverse, o de otra forma, la necesidad de recurrir a hipótesis inadecuadas o restrictivas (supersimplificaciones) para al menos poder tratar el problema. Es por ello también que en los orígenes de las ciencias tecnológicas los modelos podían ser considerados en gran medida como empíricos, esto es, con parámetros incorporados que surgían de experiencias, y no a partir de los primeros principios o leyes fundamentales. No debe extrañar que aún hoy, pese a todos nuestros avances, exista la necesidad de utilizar permanentemente parámetros en nuestros modelos, que no son otra cosa que la medida de nuestra ignorancia, y por lo tanto, implican la necesidad de reemplazar las leyes básicas por aproximaciones causales obtenidas de datos experimentales. Este es el caso, por ejemplo, la estimación de las propiedades de equilibrio de mezclas de comportamiento altamente no de ideal. A medida que evolucionaron las diversas ramas de las matemáticas y con la incorporación de la ciencia de la computación, poderosa herramienta complementaria al análisis numérico y simbólico, se abrieron caminos revolucionarios. Contar con herramientas más potentes para resolver sistemas de ecuaciones, o lo que es lo mismo, relativizar la necesidad de adoptar hipótesis inadecuadas al plantear modelos para resolver problemas complejos, resultó un gran paso adelante. Más aún, la velocidad de cálculo provocó que la dimensión abordable se incrementara rápidamente. En efecto, si bien el grado de complejidad conceptual para resolver 12
Introducción y planificación del curso. La simulación de procesos en la industria química actual
la inversa de una matriz de dimensión tres es equivalente al de una de cinco mil, resulta obvio que la complejidad operativa no resulta comparable. La computación ha acabado literalmente con dicha limitación, haciendo ahora tratables problemas cuya dimensión es tal, que décadas atrás ni siquiera era pensable plantearlos. Dentro de este contexto, el propósito de los siguientes capítulos es mostrar cómo implementar modelos para resolver problemas comunes en el campo de la ingeniería química, cómo resolverlos desde el punto de vista computacional, y otro punto importante, qué tipos de problemas (modelos) surgen al cubrir distintos aspectos de la ingeniería. En este punto resulta necesario comentar que los problemas de diseño, optimización, simulación dinámica o estacionaria, supervisión o diagnóstico de fallos en tiempo real, etc., tienen cada uno particularidades específicas, lo cual a su vez implica la conveniencia de utilizar modelos apropiados para cada caso.
5.1. Los métodos numéricos como herramienta para la modelización de procesos en ingeniería química La simulación digital constituye una poderosa herramienta para la resolución de las ecuaciones que describen a los sistemas en ingeniería química. Las principales dificultades que se plantean son principalmente: a) Encontrar la solución de un sistema de ecuaciones algebraicas no lineales (que usualmente se efectúa mediante un método iterativo. b) Efectuar la integración numérica de ecuaciones diferenciales ordinarias y en derivadas parciales mediante ecuaciones discretizadas en diferencias finitas que aproximan a las soluciones de las ecuaciones diferenciales continuas. Los métodos numéricos son una clase de algoritmos para resolver una amplia variedad de problemas matemáticos. Únicamente se emplean operaciones lógicas y aritméticas; por consiguiente, pueden implementarse fácilmente sobre ordenadores digitales. En realidad, los métodos numéricos fueron desarrollados muchos años antes que surgieran los ordenadores electrónicos digitales. En efecto, un gran número de los métodos numéricos usualmente utilizados datan de los comienzos de las matemáticas modernas. Sin embargo, el empleo de tales métodos estuvo restringido hasta la llegada de los ordenadores, incrementándose drásticamente al llegar a la mayoría de edad con la introducción de los ordenadores electrónicos digitales. La combinación de métodos numéricos y ordenadores digitales constituye una poderosa herramienta para el análisis matemático. Por ejemplo, los métodos numéricos son capaces de manejar no linealidades, modelos asociados a geometrías complejas y sistemas de ecuaciones acopladas que son necesarios para la modelización eficiente de muchos sistemas fisicoquímicos que se presentan en ingeniería. En la práctica, rara vez se consideran enfoques analíticos a los problemas de ingeniería en razón de la complejidad de los sistemas a resolver. Aún en problemas para los que podrían obtenerse con cierto esfuerzo soluciones analíticas, los métodos numéricos son poco costosos, fáciles de emplear y con frecuencia se dispone de ellos en programas comerciales. Es sabido que si un problema no puede resolverse analíticamente, lo mejor es programarlo en un ordenador (mediante un algoritmo adecuado). Este punto de vista se debe, sin lugar a 13
Introducción y planificación del curso. La simulación de procesos en la industria química actual
dudas, al enorme poder de cálculo de los métodos numéricos. Sin embargo, también es cierto que existen muchos problemas que son imposibles de resolver utilizando métodos numéricos. Para diversos problemas no se ha encontrado todavía un modelo matemático completo y seguro, de manera que resulta obvio que es imposible encontrarles una solución numérica. La dimensión de otros problemas es tan grande que su solución está más allá de los límites prácticos en términos de la tecnología computacional disponible. Por ejemplo, en problemas fluido-dinámicos que involucran flujos turbulentos, en estimaciones meteorológicas o c1imáticas (campos de vientos, presiones, temperaturas, etc.), y como veremos más adelante, en diversos problemas que se plantean en el área de la ingeniería química, existen serias limitaciones en el área de diseño y de optimización en tiempo real, etc. En los últimos años se han desarrollado grandes programas computacionales comerciales para simular el comportamiento de sistemas de ingeniería de todo tipo. Usualmente, estos programas se diseñan para que sean utilizados por aquellos profesionales de la ingeniería sin un conocimiento intensivo de su funcionamiento interno. Por otra parte, existen bibliotecas (en continua expansión) de subrutinas de cálculo que utilizan sofisticados métodos numéricos para realizar una amplia variedad de tareas matemáticas, cubriendo virtualmente todos los campos del análisis numérico, aplicaciones estadísticas, etc. Resulta obvio que cuando se disponga de programas o subprogramas que han sido probados y demostrado su buen funcionamiento, lo más razonable es utilizarlos. No obstante, es altamente valioso el conocimiento del funcionamiento de tales herramientas, dado que por lo general el usuario de tales programas o subrutinas encontrará dificultades en su utilización. Estas dificultades pueden provenir de múltiples causas. Por ejemplo, es necesario remarcar que los métodos numéricos no están completamente libres de dificultades en todas las situaciones en las que se los utilice. Por otra parte, aún en el caso que no presenten dificultades de cálculo, podrían no funcionar de manera óptima en todas las situaciones que se planteen. Siempre debe tenerse presente que la exactitud y la estabilidad numérica afectan a la ecuación discretizada utilizada (algoritmo de integración). En la literatura respectiva se han propuesto muchos algoritmos. Algunos de ellos trabajan mejor que otros sobre determinados problemas (por ejemplo más rápido y por consiguiente son menos costosos para un grado especificado de exactitud). Desgraciadamente no existe un algoritmo que funcione en forma óptima para todos los problemas que se plantean. Por otra parte, el usuario en búsqueda de una subrutina de cálculo para realizar una determinada tarea, puede encontrar una agobiante variedad de subprogramas que pueden ser aplicables, pero el material descriptivo rara vez dará una indicación sobre la eficiencia de la subrutina para resolver un problema específico. Esto sucede además, en la mayoría de los productos comerciales más elaborados, por ejemplo, para la modelización en ingeniería. Dentro de este contexto, es muy probable que el ingeniero que espera utilizar un programa o una subrutina de una biblioteca para resolver un problema matemático determinado encuentre dificultades inesperadas, a menos que tenga una preparación adecuada. En efecto, la selección y aplicación de un método numérico en una situación específica, por lo general resulta más una actividad propia de un arte que de una ciencia. Por último, nunca resulta trivial la interpretación de los resultados obtenidos. Por consiguiente, el usuario que no tenga la habilidad ni el conocimiento para seleccionar y utilizar un método numérico para aplicar a un problema específico y efectuar la programación del método, encontrará una severa restricción en el rango de problemas que puede manejar. En general deberá buscar a alguien con la información necesaria, si es que existe ese alguien a 14
Introducción y planificación del curso. La simulación de procesos en la industria química actual
quien consultar. Más aún, en esta situación resultará poco probable que el usuario pueda formular las preguntas correctas y el consultor suministrar las respuestas adecuadas, dado que el nivel de conocimientos de ambos resultaría muy diferente, dificultando la comunicación entre ambos. En resumen, en los últimos tiempos se ha desarrollado una gran variedad de paquetes informáticos para resolver numéricamente sistemas de ecuaciones que se plantean en problemas en modelización en ingeniería. En teoría, estos paquetes relevan al ingeniero de adquirir conocimientos acerca de los métodos de integración numérica. Supervisan automáticamente los errores y la estabilidad del método ajustando el paso o intervalo de integración para satisfacer un criterio de exactitud. En la práctica, es sabido que estos lenguajes no resuelven todos los problemas. En su afán por generalizar, usualmente se vuelven ineficientes en muchas aplicaciones específicas, por ejemplo, desde el punto de vista del tiempo computacional. En estos casos resulta más conveniente desarrollar un programa específico escrito, por ejemplo, en lenguaje FORTRAN, BASIC o PASCAL. Con respecto a los productos informáticos que utilizan para la modelización un lenguaje de alto nivel, debe remarcarse que el tiempo de formulación y de resolución del modelo se reduce, en especial para aquellos ingenieros que no dominan métodos de programación y utilizan el ordenador ocasionalmente. Cualquiera que sea la situación, es evidente que la utilización de un paquete integrado que facilite escribir un modelo para simulación y permita directamente la resolución numérica requiere el aprendizaje de un nuevo lenguaje y de un nuevo utilitario. En el caso que se conozca algún lenguaje de programación, dado que las técnicas numéricas programadas de manera sencilla funcionan bien, deberá compararse el esfuerzo que implica desarrollar un programa específico para el problema que se desea resolver, con el uso de subprogramas. En efecto, la experiencia demuestra que es más conveniente el desarrollo propio, ya que no sólo es computacionalmente más eficiente, sino que además garantiza al estudiante o ingeniero el conocimiento de cómo funciona el programa (por ejemplo, un simulador para un equipo dado) y cuáles son las hipótesis realizadas y las técnicas utilizadas. Esta metodología permite la supervisión del programa y su modificación, para manejar de manera más fácil y eficiente nuevas situaciones que se planteen. Una solución intermedia es programar el modelo particular (sistema específico de ecuaciones a resolver), utilizando para el cálculo alguno de los métodos disponibles para tal fin, aprovechando la disponibilidad de los numerosos paquetes numéricos de resolución, tanto de sistemas de ecuaciones algebraicas como de ecuaciones diferenciales, ordinarias o a derivadas parciales. En muchos lugares (universidades, institutos de investigación, etc.) y en el mercado, se dispone de bibliotecas de subrutinas de cálculo como las IMSL, NAG, Numerical Recipes, entre otras. En general, para rama, tantoendeellas matemáticas, la estadística y/o de laspara aplicaciones de ingeniería, se cada han presentado mercado un grandenúmero de aplicaciones resolver muchos problemas de modelización de procesos, tales como diseño, simulación, síntesis, optimización, etc. Además, desde el punto de vista del alcance, los hay diseñados para un uso general así como para uno específico (por ejemplo, hornos, procesos petroquímicos, procesos que manipulan sólidos, sistemas con electrolitos, reactores biológicos, síntesis de moléculas, etc.). No es el objetivo del presente curso efectuar un análisis detallado del software disponible comercialmente ni de las aplicaciones específicas desarrolladas, ni realizar una descripción 15
Introducción y planificación del curso. La simulación de procesos en la industria química actual
exhaustiva de todos los paquetes informáticos existentes, dado que el mercado actual es muy dinámico. Sí resulta importante que el alumno adquiera habilidad para comprender claramente el alcance general de los instrumentos computacionales disponibles, las tendencias, la necesidad de disponer de capacidad para generar sus propias herramientas para modelizar problemas específicos o para adquirir o utilizar nuevos productos.
6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS Las tendencias actuales en el diseño de procesos pasan por: Reducción de los costes de las materias primas •
•
Reducción de la inversión de capital
•
Reducción del consumo energético
•
Incremento de la flexibilidad del proceso y reducción del almacenamiento de productos
•
Mayor énfasis en seguridad
•
Mayor atención a la calidad
Mejor comportamiento medioambiental Para la consecución de todos estos objetivos la simulación de procesos juega un papel muy importante, ya que: •
•
•
•
Reduce el tiempo de diseño de la planta, permitiendo al diseñador comprobar varias configuraciones de planta Ayuda a optimizar el proceso, permitiendo responder a preguntas del tipo “y si”, así como determinar las condiciones de proceso óptimas para unas restricciones dadas. Predice los costes de planta y la viabilidad económica
7. BIBLIOGRAFÍA •
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons,
•
Nueva York (1999) Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
•
16
Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and Design of Chemical Processes”, Prentice Hall, Nueva Jersey (1998). Scenna, N.J.; Editor, “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
I.
Termodinámic a y modelizac ión rigurosa de procesos
Termodinámica de sistemas no ideales
Termodinámica de sistemas no ideales
ÍNDICE CONTEXTO, OBJETIVOS Y CONTENIDO ...............................................................19 1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS .................................. 19 1.1. El modelo termodinámico .....................................................................................22
2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE FASES .............25 2.1. Equilibrio de de mezclas sustancias puras ............................................................................... 25 2.2. Equilibrio multicomponentes ..............................................................34
3. PRINCIPALES LIBROS RECOMENDADOS .......................................................45
CONTEXTO, OBJETIVOS Y CONTENIDO Estamos en un curso sobre
modelización avanzada de procesos químicos.
La modelización es una forma eficaz de aproximarse a una realidad compleja sustituyéndola por interpretaciones fragmentarias o particularmente focalizadas de sus distintas facetas o elementos integrantes. Lenguaje, filosofía y matemáticas, por citar obviedades, son ámbitos de modelización, donde fonemas vehiculizan conceptos de acuerdo con convenios idiomáticos, morfológicos y sintácticos; donde conceptos, definiciones y convenios aproximan ordenadamente a la percepción de la realidad material e inmaterial al socaire de teorías o principios; y donde operadores, ecuaciones, algoritmos, transformaciones y otros recursos configuran probablemente su interpretación cuantitativa más eficaz, abstracta, y universal. La Termodinámica es una ciencia teórica y experimental que aporta un eficaz bagaje de modelos, capaces de describir las complejas relaciones de equilibrio que se producen entre las sustancias químicas. Los modelos termodinámicos pretenden interpretar y predecir el comportamiento físicoquímico de la materia en equilibrio estático o dinámico. De introducir y justificar de forma somera estos modelos de de describirlos de forma resumida se ocupa el siguiente.
forma práctica se trata en este tema, y
1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS Parece asumido que un proceso químico es un conjunto armónico, espontáneo o finalista, de transformaciones de la energía, incluida la materia como forma sustanciada de aquélla. La naturaleza es un bullente escenario de procesos químicos, buena parte de los cuales, probablemente los más complejos, son las transformaciones que configuran las distintas formas de la vida. Generalmente el concepto de proceso químico se aplica a transformaciones artificiales, con las que se pretende producir unas sustancias a partir de otras, aislar unas sustancias de otras, o modificar sus características.
procesos químicos naturales son el resultado de complejos fenómenos interactivos y evolutivos. Los procesos químicos artificiales son el resultado de una selección inteligente entre las más afortunadas Los
sugerencias, resultantes ocasionalmente de casualidades y frecuentemente de pruebas sucesivas, ejecutadas con variopintas tácticas y recompensadas con diferente fortuna. La experiencia -saber qué- y la habilidad técnica saber hacer- terminan por suscitar, antes o después, el pensamiento reflexivo - saber por qué-. La reflexión
19
Termodinámica de sistemas no ideales tiene una proyección generalista, el conocimiento filosófico y científico de la realidad tangible - y una finalidad práctica - el conocimiento estratégico que permite adelantarse a la experiencia o encauzarla para hacerla más eficaz. Las ingenierías son las disciplinas resultantes de la aplicación sistemática de la intuición - de ahí su componente artística-, de principios heurísticos - de ahí su componente “ingeniosa”- y de conocimientos científicos a la resolución de problemas preexistentes, a la satisfacción de necesidades y a la búsqueda de retos, resolviendo eficazmente el compromiso entre tiempo, medios y objetivos (ingenio = maquina). Toda ingeniería se vincula a máquinas, a artefactos o a protocolos pautados capaces de coordinar ordenadamente esfuerzos para hacer cosas útiles. La Ingeniería de Procesos ofrece recursos versátiles para la gestión de situaciones complejas integradas por fenómenos interrelacionados. La Química y la Ingeniería Química ofrecen recursos eficaces para dar contenido científico riguroso de esos fenómenos. convolución saber hacer genérico y de un saber qué concreto crea el ámbito científico y profesional de La la Ingeniería dede losunProcesos Químicos.
Fig.1. Modelos y conceptos termodinámicos en su contexto 20
Termodinámica de sistemas no ideales
La pieza clave del conocimiento científico analítico y sintético- el learning object por excelencia- es su unidad lógica, el modelo. Ante la imposibilidad radical o coyuntural del conocimiento absoluto- probablemente vedado a la humana condición- no existe otra forma de construcción del edificio de la ciencia que la aproximación analógica - el como-si, el modelo -. Los modelos son válidos en tanto explican la realidad y permiten interpretar o predecir sus cambios. Si un modelo falla se sustituye, o más frecuentemente, se apuntala con otros modelos que tratan de explicar sus desviaciones, hasta que resulta más rentable intelectualmente introducir otro modelo radicalmente innovador, que ha de resolver lo que el anterior resolvía y ser capaz de superar con elegancia y éxito sus limitaciones Los modelos han de resolver, también, muchos compromisos, principalmente los que existen entre precisión y tiempo, y los que existen entre complejidad y disponibilidad de información.
Figura 2. Modelización lógica típica de ingeniería de procesos: Un proceso complejo resulta de la interrelación de unidades más sencillas tipo caja negra, convencionalmente identificadas, sometidas a condicionantes externos, interconectadas a través del flujo de información común y provistas de ciertos grados de libertad.
Fig.3. Modelización fenomenológica típica en Ingeniería Química 21
Termodinámica de sistemas no ideales
El subsistema - la pieza funcionalmente diferencial- en un proceso químico es la operación básica. El modelo de operaciones básicas en un modelo basado en ecuaciones de diseño de etapas discernibles y repetitivas dentro de los procesos. Miles de procesos que manejan y producen millones de sustancias químicas se configuran a partir de una decenas de operaciones básicas. El modelo de operaciones básicas, que se describe en la Fig. 3. muestra cómo se integran los modelos de equilibrio (Termodinámica) con los modelos cinéticos (Fenómenos de transporte y Reactividad Química ) y con los modelos estequiométricos, que no son otra cosa que traducciones del principio de conservación.
1.1. El modelo termodinámico La Termodinámica es una ciencia que nació de la necesidad de optimizar el rendimiento de procesos de separación y de conversión termomecánica.. La Termodinámica clásica es una termodinámica macroscópica de equilibrio. La Termodinámica actual abarca la energética de reacciones y buena parte de los fenómenos de transporte y reactividad química en el contexto de la llamada Termodinámica de los procesos irreversibles, proyectándose en el ámbito corpuscular a través de los modelos de Termodinámica Estadística.
Fig. 4. El “modelo Termodinámico” resulta de la integración de definiciones, recursos, principios y modelos de comportamiento a distintos niveles de descripción.
a. Ámbito de la termodinámica El procedimiento termodinámico se basa en la introducción coherente de propiedades de interés práctico - P, V, T, H, F, G, S, F...- asume unos principios generales de evidencia 22
Termodinámica de sistemas no ideales
incuestionable - por el momento cuatro- y adopta unos formalismos matemáticos - relaciones de Maxwell- derivados de las cualidades atribuidas a estas propiedades - ligadas por ecuaciones diferenciales exactas en campos continuos-.
ámbito formal, la Termodinámica discurre en dos dominios paralelos y permeables. En el dominio experimental se nutre de constantes aportaciones de la experimentación sistemática y de la propia En torno a este
práctica de los procesos, que son fuente inagotable de datos. El análisis de estos datos ha permitido inferir algunos principios generales de la naturaleza concernientes a las relaciones energéticas - equilibrio térmico, equivalencia teórica y práctica entre calor-trabajo y orígenes de entropía, así como la correlación de estos para deducir modelos empíricos de comportamiento. En el dominio teórico la Termodinámica desarrollamodelos
ideales - gas ideal, principio de estados correspondientes, mezcla ideal...- que contrasta con la evidencia
experimental introduciendo sucesivas correcciones - modelos de estado de fluido reales, discrepancias del P.E.C., fugacidades, modelos para mezclas reales, coeficientes de actividad, etc.- Los modelos de estado son relaciones PVT macroscópicas que permiten obtener formas prácticas de las relaciones entre otras propiedades termodinámicas de significación más compleja y que, auxiliados por modelos de estructura molecular (corpusculares y estadísticos) permiten una explicación mecanística de las propias teorías de estado y una interpretación rigurosa de las propiedades.
b. Propiedades y principios termodinámicos Las propiedades termodinámicas son las piezas conceptuales con las que explicar las leyes y describir los fenómenos. La única restricción en la definición de propiedades termodinámicas está en su utilidad, en su coherencia interna y en la coherencia de su incorporación al contexto de otras propiedades predefinidas y consolidadas. Las propiedades termodinámicas básicas se introducen a partir de la experiencia, y parece consensuado que sean P y V. La temperatura T se introduce a partir de la evidencia conocida como “principio cero” y las demás propiedades energéticas -U,conceptos H, F y G de y sus derivadasa partir de los principios primero y segundo. Los entropía -S- se y introducen reversibilidad surgen de la evidencia titulada “tercer principio”. Salvo en el caso de la temperatura, el volumen y la entropía, no es preciso especificar ningún srcen, atendiéndose sólo a las variaciones que experimentan en el transcurso de los procesos. Hay otras propiedades termodinámicas que permiten describir otros fenómenos -eléctricos o magnéticos- o modelizar otras situaciones más complejas, como es el caso sistemas multifásicos y multicomponentes. Por ejemplo, la composición como descriptor de mezclas, la tensión superficial, como descriptor de la energía vinculada a la presencia de interfases, las funciones de trabajo para describir las vías de comunicación del sistema termodinámico con el entorno o el potencial químico para describir la tendencia hacia equilibrio entre fases o a través de reacciones químicas.
El calor y el trabajo son formas de relacionarse los sistemas con otros sistemas concretos o con un entorno abstracto, modificando su estado. Como es sabido, el estado es reproducible en todas sus propiedades cuando un número determinado de propiedades intrínsecas independientes adopta los mismos valores (coordenadas de estado), pero se puede cambiar de estados con muy diferentes intercambios de calor y de trabajo. Las leyes de la termodinámica son evidencias experimentales de carácter general, independientes de cualquier teoría de estado. La naturaleza establece también una correspondencia biunívoca entre los valores de un determinado número de propiedades de estado del sistema y ese estado. Ese número depende de la complejidad del sistema a través de un modelo de estado o regla lógica que establece dos grados de libertad para fases simples de un solo componente, un grado de libertad más por cada componente y un grado menos por cada fase más en equilibrio. Es la llamada regla de las fases , que bien podría ser considerada como una ley o principio termodinámico más.
23
Termodinámica de sistemas no ideales
c. Termodinámica formal La naturaleza ha establecido que las sustancias puras ven definido inequívocamente su estado termodinámico, es decir, el valor de todas sus propiedades termodinámicas, cuando dos de éstas adoptan valores concretos. Trasponiendo esta evidencia al ámbito matemático, resulta que cualquier variable de estado se vincula a una superficie continua Z(X,Y), en principio indefinida, pero en la práctica reducida e las coordenadas de existencia de la materia en los distintos estados en los que esta se pueda encontrar. Una vez establecida una correspondencia entre definiciones (propiedades) y funciones matemáticas (coordenadas), los propios mecanismos permiten establecer relaciones que podríanson no ser por un procedimiento inductivo directo.matemáticos Los principales mecanismos matemáticos de relación las evidentes llamadas relaciones de Maxwell, que establecen relaciones bien conocidas, como: dz= (∂z/∂x)y dx + (∂z/∂Y)x dY = mdx + n dY ∂m/∂Y
= ∂n/∂X
y las de ellas derivadas, que permiten establecer relaciones concatenadas entre variables termodinámicas del tenor : (∂G/∂P)T=V
-(∂S/∂P)T=(∂V/∂T)P
F= G- P(∂G/∂P)T
F= H-S(∂U/∂S)V-V(∂U/∂V)S
que facilitan acometer la resolución de problemas termodinámicos con gran eficacia en un campo imagen que no precisa sentido físico evidente, pero sí muy fiable en los cálculos:
Fig.5. Simulación gráfica de algunas cualidades de las diferenciales exactas útiles en la formulación y análisis de rutas termodinámicas 24
Termodinámica de sistemas no ideales
De hecho el estado de una substancia viene integrado por tantas superficies continuas de estado yuxtapuestas como fases en las que tenga existencia, limitadas por las coordenadas de existencia de la substancia (por ejemplo, hasta temperaturas inferiores a las de autoreactividad o descomposición química, que son puertas a otros escenarios de fases). El equilibrio entre fases para sustancias puras será una región común a dos superficies de estado- asimilable una línea- y el equilibrio entre tres fases será una región común a tres superficies de estado asimilable a un punto-. En situaciones termodinámicas más complejas, por ejemplo sistemas multicomponentes, la definición del estado va vinculada matemáticamente a la de un hiperespacio
2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE FASES 2.1. Equilibrio de sustancias puras a. Relaciones entre propiedades termodinámicas Según el primer principio, un cambio discreto de energía interna se debe al balance: U = Calor recibido + trabajo realizado sobre el sistema = =- calor cedido- trabajo realizado por el sistema sobre el entorno En ausencia de otras formas posibles de trabajo distintas al mecánico de expansión compresión, restricción que se mantendrá en lo sucesivo en tanto no se diga lo contrario, para un cambio diferencial y reversible, y de acuerdo con el tercer principio, dS= dq/T, resulta dU = dq - pdV = TdS - pdV Si el proceso no es reversible, ni el calor es TdS ni el trabajo se puede calcular mediante la integración de la función continua pdV, aunque sí se puede deducir su balance neto a través de los cambios de energía interna. De la misma forma, si se conocen estos datos, calor recibido y trabajo realizado, sí que se puede calcular el cambio de energía interna experimentado por el sistema. El concepto de trabajo útil va vinculado a la capacidad de producir cambios en el entorno y, por tanto, al grado de reversibilidad, por lo que es un concepto vinculado al tipo de proceso. De hecho hay procesos de expansión que no producen trabajo útil alguno, como la expansión libre irreversible de gases, lo cual no quiere decir que no haya cambios del tipo p ∆V o V∆p invertidos en turbulencia interna y, por tanto, en un aumento de entropía no predecible teóricamente, pero sí evaluable a partir de las condiciones finales (por ejemplo en coordenadas P, T).
La entalpía se define incluyendo el término de entidad PV en la forma H = U + PV por lo que para un cambio diferencial resulta dH= dq + VdP= TdS+VdP Las propiedades que pueden definirse sin una vinculación a la materia se denominan propiedades de campo. Las más intuitivas son P y T. Las propiedades vinculadas a la materia se denominan propiedades de densidad (V, U, H y S). Si se definen para un sistema lo hacen en formaextensiva, pero si se refieren a una unidad de referencia lo hacen de forma intensiva (por ejemplo la densidad, el volumen molar o la energía interna específica). Obviamente, y para mayor generalidad, las propiedades se correlacionan en sus formas intensivas.
25
Termodinámica de sistemas no ideales
De la misma forma se introducen las funciones de trabajo útil - funciones de Gibbs y Helmoltz- excluyendo de las formas energéticas anteriores la fracción vinculada al desorden térmico, y por tanto, la parte de la capacidad energética incapaz de ser puesta en juego en la producción de trabajo útil reversible. Así: F = U - TS dF= -pdV-SdT G = H - TS dG= Vdp-SdT Como se verá más adelante, la función de Gibbs es igual para fases en equilibrio, es decir, que no depende de la densidad, por lo que resulta la propiedad más adecuada para definir el equilibrio, junto con la presión y la temperatura que son propiedades de campo. Su utilidad se pone de manifiesto al tratar de mezclas en equilibrio, ya que a partir de ella se define el concepto de potencial químico µ. La ventaja de las formulaciones típicas de las propiedades termodinámicas es su significación en situaciones simples, como cambios isotermos, isóbaros, isócoros, etc. Así los cambios de entalpía pueden calcularse a partir del balance calorífico en condiciones isóbaras, y la variación de la función de Gibbs, G, representa el trabajo de flujo en condiciones isotermas. Gracias a las características de estado, un proceso real entre dos estados conduce a los mismos cambios en propiedades de estado que estos cambios producidos a través de procesos ficticios, lo que es un excelente recurso para optar por sendas de cálculo alternativas cuando se disponga de los datos oportunos. Cualquier formulación termodinámica representa casos particulares de una forma no restringida de vinculación de las propiedades tomadas como variables dependientes de otra pareja tomada como variables dependientes De hecho, cualquier propiedad puede analizarse en función de cambios experimentados en otras dos cualesquiera, es decir, que serían posibles formulaciones U(P,V), F(P,T), G(H,S), V(H,G), H(F,G) etc. Estas otras formas más infrecuentes de las formulaciones no suelen introducirse directamente como las anteriores, sino que suelen aparecer en el contexto de cálculos, y su único problema es la posible incomodidad del manejo de las propiedades implicadas, cuestión menor que se resuelve gracias a las relaciones formales ya mencionadas.
b. Estado de componentes puros En principio cualquier pareja de propiedades puede adoptarse como coordenadas para definir el estado, pero la práctica ha decantado P y T como variables primarias, no tanto por su simplicidad teórica (de hecho el concepto de entropía pudiera ser más simple o primigenio con respecto al de temperatura) como por su carácter de propiedades de campo y su más fácil mensurabilidad experimental.
b.1. Modelos ideales El modelo de estado ideal(Leyes es el modelo de gas perfecto. El gas ideal puede que definirse a partir de distintas interpretaciones de Boyle, Joule, Gay Lussac y Amagat) no son más que aspectos parciales del modelo de Clapeyron, PV= nRT. Una evidencia de que estas leyes son redundantes está en que pueden obtenerse unas a partir de otras. Por ejemplo, la misma relación de Joule: dU = dq - pdV = TdS - pdV
(si PV= RT)
dUT= 0
Llevando este modelo a las relaciones termodinámicas en las formas dependientes de PVT que pueden inferirse de las relaciones de Maxwell se obtienen relaciones teóricas que 26
Termodinámica de sistemas no ideales
permiten estimar los cambios de las propiedades energéticas en condiciones de idealidad, por ejemplo variaciones de energía interna o entalpía simplemente a partir de calores específicos ideales:
∆U ∗ = ∫ c v dT ∗
y
∆H ∗ = ∫ c p dT ∗
y análogamente para otras propiedades termodinámicas. En fluidos reales estos cambios pueden tomarse como referencia sobre la que evaluar los modelos reales a partir de discrepancias (Ver Figura 6).
b.2. Modelos para fluidos reales En la Figura 7 se presentan las evidencias experimentales de la discrepancia entre un gas real y un gas ideal. La naturaleza pone de manifiesto que estas discrepancias cuantitativas pueden hacerse cualitativas, apareciendo fases condensadas imprevisibles por el modelo de fluido ideal, de forma que, en distintas regiones, las sustancias pueden encontrase en distinto estado de agregación y que el estado de agregación de distintas sustancias las mismas coordenadas de estado puede no ser el mismo. El concepto de estado de agregación concierne a las relaciones intermoleculares, por lo que en la termodinámica clásica se ha definido tradicionalmente en función de la manifestación macroscópica estereotipada de estas interacciones: Estado sólido, cohesionado de forma invariante debido a las fuertes interacciones, estado líquido deformable pero cohesionado debido a interacciones fuertes pero difusas y estado gaseoso, deformable y escasamente cohesionado. La naturaleza permite todas las formas de equilibrio binario (SL, SV y LV) en un amplio intervalo de condiciones, y permite el equilibrio ternario en el llamado punto triple (SLV), por debajo de cuya presión no puede darse el estado Otro punto característico es el llamado críticotemperatura , por encimayde cuya temperatura no puede existirlíquido. estado líquido.
punto
Fig.6. Interpretación de un cambio real a partir de cambios virtuales 27
Termodinámica de sistemas no ideales
El estado de fluidos reales se puede modelizar por ecuaciones que introducen desviaciones con respecto al modelo de Clapeyron (Fig.7). Las principales correlaciones corresponden a los tipos de discrepancia aditiva (modelos de virial) y discrepancia factorial (modelos de coeficiente de compresibilidad), existiendo modelos mixtos, como los de Van der Waals, Beattie-Bridgeman, Benedict-Webb-Rubin, Redlich-Kwong, etc.
Onnes
P=
RT ⎛ V ⎝
1+
B V
+
C V
2
+
Factor de compresibilidad P =
D V
3
RT V
+...⎞
Van der Waals
Z
Redlich-Kwong P =
⎠
P= RT V −b
RT V −b
−
−
a V
2
a 0,5
T V (V + b)
La correlación del coeficiente de compresibilidad es muy útil para cálculo de propiedades de fases de un solo componente. Sin embargo, para cálculos rigurosos y para la deducción de equilibrio en sistemas multicomponentes son más útiles las formas paramétricas con adecuadas reglas de mezcla para definir los coeficientes particulares.
Fig.7. Evidencia experimental de las discrepancias entre fluidos reales y gas ideal al correlacionar determinadas propiedades o grupos de propiedades. En la Fig. 8 en se puede apreciar que estas diferencias meramente cuantitativas dan lugar, en otras regiones, a discrepancias cualitativas de las sustancias son calificadas convencionalmente como sólidos, líquidos o gases en función de cuál sea su estado de agregación en la región de estado que coincide con las condiciones ambientales más frecuentes (recuadro), pero que, en principio, cualquier sustancia puede encontrase en cualquier estado si su estructura es estable en sus coordenadas definitorias. Si bien diagramas caricaturescos como los de la figura ponen de manifiesto que hay múltiples formas de discrepar de la idealidad, también ponen de manifiesto una cierta analogía morfológica en torno a puntos o regiones características. Estos diagramas ponen de manifiesto también que las propiedades de campo son iguales en fases en equilibrio, mientras que las propiedades de densidad, vinculadas a la agregación, difieren entre fases en equilibrio.
La ecuación de Van der Waals permite inferir el modelo del factor de compresibilidad de una forma generalizada que se sustancia en el llamado Principio de Estados correspondientes, (PEC), que Young extendió con gran éxito a las regiones condensadas y que otros autores han extendido, a su vez, a la correlación de propiedades de transporte. Según este principio, muchas substancias presentan un estado similar cuando se encuentran en situaciones homólogas con respecto al punto crítico. La mejor concordancia se observa cuando estas coordenadas son las llamadas coordenadas reducidas, Pr=P/Pc, Tr=T/Tc. El valor de la compresibilidad en el punto crítico adopta un valor teórico a partir del modelo de Van der Waals, zc=3/8, que no coincide con los valores observados en la realidad, que oscilan en torno a zc=0,27 como valor
28
Termodinámica de sistemas no ideales
más frecuente para muchas substancias de interés. Según este principio, las discrepancias existentes entre modelos ideales y reales (Fig.9) son o adoptan formas funcionales análogas en las mismas coordenadas termodinámicas reducidas (primer nivel de discrepancia ) pero, además, las discrepancias observadas en sustancias que no tienen una compresibilidad crítica similar a la predicha por el modelo pueden correlacionarse a su vez (segundo nivel de discrepancia ) en función de parámetros característicos, como el factor de Riedel o de Pitzer o, con un mayor sentido práctico, en función de la diferencia entre el valor real y el teórico del coeficiente de compresibilidad, [zc - 0,27].
Fig. 8. Representación cualitativa de las regiones de estado de sustancias puras en las coordenadas más f recuentes
Fig.9. Discrepancia de la idealidad. Inferencia de la correlación del coeficiente de compresibilidad y de las discrepancias de otras funciones termodinámicas
De esta forma, las discrepancias indicadas en la figura 6 están integradas por dos componentes: 29
Termodinámica de sistemas no ideales
Fig.10. Morfología de los diagramas termodinámicos de uso más frecuente Primera componente de discrepancia : f1(P *-P)= f2(Tr,Pr). Las funciones f1 y f 2 han de esbozarse teóricamente a partir de las diferencias resultantes de calcular las respectivas funciones a través de las distintas ecuaciones de estado, P * a partir de P*V*= RT y P a partir de PV= zRT. ej: V*-V= RT(1-z) /P =α
H∗ − H Tc
2
= RT r
∫
Pr
0
⎛ ∂ z ⎞ dPr ⎜ ⎟ ⎝ ∂ Tr ⎠ P Pr r
y análogamente (U*-U)/Tc=f(Pr,Tr), (S*-S)=f(Tr,Pr), (Véase Fig.10), así como las funciones termodinámicas derivadas, (cp* - c p), (kp* - k p), Estas ecuaciones permiten deducir los diagramas de discrepancia de cualquier propiedad a partir del diagrama matriz z(Tr,Pr) o tener una guía para una más eficaz correlación de datos experimentales.
Segunda componente: f1(P *- P) (zc#0,27) =f1(P *- P)PEC + f2(Tr,Pr) Un caso particular es la función de Gibbs, que da lugar a una correlación más útil, en forma de discrepancia factorial, a través de la introducción del concepto de fugacidad, una presión aparente vinculada a la presión real, que permite formular la variación isotérmica de G con el mismo tipo de expresión que la deducida para el gas ideal (ver figura 11): (G*2-G*1)T = RT ln (P*2/P*1)
(G2-G 1)T = RT ln (P2/P1)
30
P*1= P1= P0= 1
(G*= G0 +RTlnP)T
(baja presión, ideal = real)
(G= G0+ RTlnf)T
f P S , νo es el coeficiente de i i fugacidad del líquido. La presión de saturación corresponde a la condición ν oL = ν oV . ⎡
A 2 ⎛ BP ⎞⎤ ⎟⎥ ln ⎜1 + B ⎜⎝ Z V ⎟⎠⎥⎦
(35)
A 2 ⎛ BP ⎞⎤ ⎟⎥ ln ⎜1 + B ⎜⎝ Z L ⎟⎠⎦
(36)
ν oV = exp ⎢ Z V − 1 − ln (Z V − BP ) −
⎢⎣
⎡
ν oL = exp ⎢ Z L − 1 − ln (Z L − BP ) −
⎣
58
Modelos de predicción de propiedades físico-químicas
Presión de vapor
Para una temperatura T < Tc, la presión de saturación (presión de vapor), PiS, se puede estimar a partir de la ecuación de estado RK igualando las ecuaciones (35) y (36) y calculando P por un procedimiento iterativo. Los resultados, obtenidos por Edmister, se muestran en la Figura 2. La curva de presión de vapor R-K no representan satisfactoriamente los datos para un amplio intervalo de formas moleculares, como indican las curvas experimentales para metano, tolueno, ndecano y alcohol etílico. Este hecho, ya mencionado anteriormente, constituye uno de los principales fallos de la ecuación RK. Aparentemente, las constantes críticas Tc y Pc son por sí solas insuficientes para generalizar el comportamiento termodinámico. Sin embargo, la generalización mejora notablemente si se incorpora a la ecuación una tercera constante que represente las diferencias genéricas de las curvas de presión de vapor reducida. Esta modificación es la que condujo a la Figura 2 Presión de vapor reducida ecuación de estado S-R-K. Alternativamente, la presión de vapor se puede estimar a partir de muchas correlaciones empíricas, como la conocida ecuación de Antoine. Asimismo, y como ya se ha mencionado, cuando una ecuación de estado resulta adecuada para la presión de vapor de la fase vapor, pero inadecuada para la fase líquida, se puede utilizar la corrección de Poynting. Si el líquido es incompresible, se llega a: ⎛ PS ⎞
⎡ v L (P − PiS )⎤ ⎥ RT ⎦
ν oL = ⎜⎜ i ⎟⎟ ν oVS exp ⎢ ⎝ P ⎠ ⎣
(37)
Para presiones muy altas, la corrección de Poynting para gases ligeros es importante. A bajas presiones, ν oVS es igual a la unidad y el argumento del término exponencial tiende a cero. Por tanto, ν oL tiende a la relación entre la presión de vapor y la presión total.
Coeficientes de fugacidad de mezclas
⎡
φ iV = exp ⎢(Z V)−( 1
⎣⎢
⎡
φ iL = exp ⎢(Z L )− 1
⎣
Bi A2 − ln) Z V − BP − B B
B ⎞ ⎛ BP ⎞⎤ ⎛ 2A i ⎟⎥ − i ⎟ ln ⎜⎜1 + ⎜ B⎠ ⎝ Z V ⎟⎠⎥⎦ ⎝ A
⎛ Bi B A 2 2A BP ⎞⎤ ⎟⎥ ( − ln) Z L − BP − ⎛⎜ i − i ⎞⎟ ln ⎜⎜1 + B B ⎝ A B⎠ ⎝ Z L ⎟⎠⎦
(38) (39)
59
Modelos de predicción de propiedades físico-químicas
2.1.2. Ecuación de estado S-R-K Las expresiones que se obtienen utilizando esta ecuación de estado se indican a continuación y resultan aplicables, tanto a la fase líquida como a la fase vapor, siempre que se utilice la composición de la fase y el factor de compresibilidad adecuados. Z 3 − Z 2 + Z A − B − B 2 − AB = 0 ⎡
ν oi = exp ⎢ Z − 1 − ln (Z − B i ) −
⎣
⎡
)1 φ i = exp ⎢(Z − ⎣⎢
⎧ ⎪
H = H oV + RT ⎨Z − 1 − ⎪⎩
(40)
A i ⎛ Z + B i ⎞⎤ ln ⎜ ⎟ B i ⎝ Z ⎠ ⎥⎦
(41)
Bi Z + B ⎞⎤ A ⎛ 2A 0.5 B ⎞ ( − ln ) Z − B − ⎜⎜ 0i.5 − i ⎟⎟ ln ⎛⎜ ⎟⎥ B B⎝ A B ⎠ ⎝ Z ⎠⎦⎥
⎡ m i Tr0.5 m j Tr0.5 1 ⎛ Z+B⎞ C C j i ln ⎜ − ⎟ ∑ ∑ y i y j A ij ⎢1 − B ⎝ Z ⎠i =1 j=1 ⎢ a i0.5 a 0j .5 2 2 ⎣
(42)
⎤ ⎫⎪ ⎥⎬ ⎥⎪ ⎦⎭
(43)
En la ecuación (41), Z es el factor de compresibilidad para la especie pura. Las constantes A i, Bi, A y B para especies puras son: * A i = 0.42747 a i * B i = 0.08664
Pri
(44)
Tr2i
Pri
(45)
Tri Las reglas de mezcla para especies no polares son las mismas de la ecuación srcinal R-K. Por ejemplo, para mezclas en fase vapor, C
⎛
C
⎞
A = ∑ ⎜⎜ ∑ y i y j A ij ⎟⎟ i =1⎝ j=1
A ij = (A i A j )1 / 2 C
B = ∑ y i Bi
⎠
(46) (47) (48)
i =1
Excepto para el hidrógeno, las ecuaciones S-R-K pueden aplicarse a gases ligeros tales como nitrógeno, monóxido de carbono, dióxido de carbono y sulfuro de hidrógeno, si se incorporan los parámetros kij de interacción, obtenidos a partir de datos experimentales, en la forma siguiente: Aij = (1 - kij)(AiAj)1/2 (49) En la Figura 3 se muestra la capacidad de la correlación S-R-K para predecir valores K para un sistema multicomponente de 10 especies, incluso cuando la presión se aproxima a la presión de convergencia. Los cálculos del equilibrio entre fases con las ecuaciones S-R-K requieren una estimación inicial de las composiciones de las fases.
60
Modelos de predicción de propiedades físico-químicas
Sin embargo, la correlación S-R-K, análogamente a lo que ocurre con la ecuación R-K, no es capaz de predecir la densidad del líquido con buena exactitud. Por esta razón, como ya se ha mencionado, han aparecido posteriores desarrollos, como el de Peng y Robinson, dirigidos a mejorar las predicciones de la densidad del líquido y del equilibrio entre fases en la región crítica. Sin embargo, el uso de tales ecuaciones está en general limitado a moléculas no polares relativamente pequeñas.
Figura 3. Ajuste de datos experimentales del valor K y los obtenidos con la ecuación S-R-K Cuando se tratan disoluciones más complejas en las que intervienen compuestos polares, se emplea para el cálculo de los valores K la siguiente ecuación: Ki =
γ iL f iLo γ νo = iL iL φ iV P φ iV
(50)
Los coeficientes de fugacidad de los componentes puros en fase líquida y de los componentes en fase gaseosa se obtienen, evidentemente, a partir de una ecuación de estado. Los coeficientes de actividad en fase líquida se obtienen a partir de los modelos de coeficientes de actividad que se tratan a continuación.
3. MODELOS DE COEFICIENTES DE ACTIVIDAD Los coeficientes de actividad pueden calcularse experimentalmente cuando se conoce el equilibrio vapor-líquido. Pero habitualmente lo que se pretende es predecir dicho equilibrio, sobre todo para sistemas multicomponentes, por medio de los coeficientes de actividad. Existen diferentes métodos o correlaciones basados en la energía libre de Gibbs en exceso con la cual se pueden obtener los coeficientes de actividad. Estas correlaciones expresan la influencia de la composición y de la temperatura en los coeficientes de actividad. La influencia de la presión sólo se hace efectiva cuando se opera a presiones elevadas, 61
Modelos de predicción de propiedades físico-químicas
circunstancia que impide el empleo de estos modelos termodinámicos para la determinación del equilibrio a presiones elevadas. Inicialmente se emplearon las ecuaciones de Van Laar y de Margules, descritas en trabajos y libros de Termodinámica, las cuales son correlaciones puramente empíricas que dan buenas descripciones del equilibrio vapor-líquido de mezclas binarias. En el caso de mezclas multicomponentes, se requiere un mayor número de parámetros, con lo que su complejidad aumenta sin conseguir mejoras apreciables con respecto a otras correlaciones. Las ecuaciones que mejores ajustes presentan para mezclas multicomponentes, sin aumentar el númerodededisoluciones parámetros regulares requerido,y son , que se basa en ely concepto sólocuatro: requiereScatchard-Hildebrand propiedades de los componentes puros; Wilson, NRTL y UNIQUAC, que se basan en la existencia de interacciones entre las distintas moléculas de las que consta la mezcla. Estas, al igual que las ecuaciones de Van Laar y de Margules, derivan de las energías libres de Gibbs en exceso necesitando, al menos un dato experimental de equilibrio líquido-vapor, para determinar los parámetros binarios de interacción. Por otra parte, la ecuación de Scatchard-Hildebrand también puede resultar de utilidad para sistemas en los que no se dispone de datos experimentales. En este sentido, sin embargo, se emplean más las correlaciones basadas en contribuciones de grupos, como UNIFAC y ASOG.
3.1. Disoluciones regulares. Correlación de Chao-Seader (C-S) Para las especies menos volátiles de una mezcla, la dependencia de los valores K con respecto a la composición se debe principalmente al comportamiento no ideal de la disolución líquida. Prausnitz, Edmister y Chao demostraron que la relativamente simple teoría de las disoluciones regulares de Scatchard y Hildebrand puede utilizarse para estimar las desviaciones del comportamiento ideal de mezclas líquidas de hidrocarburos. Ellos expresaron los valores K según la ecuación (50). Chao y Seader simplificaron y ampliaron la aplicación de esta ecuación a una correlación general de hidrocarburos y de algunos gases ligeros en la forma de un conjunto compacto de ecuaciones especialmente adecuadas para su utilización en ordenadores. Las correlaciones sencillas para los coeficientes de actividad en fase líquida, basadas exclusivamente en las propiedades de los componentes puros, no son generalmente exactas. Sin embargo, para mezclas de hidrocarburos, la teoría de las disoluciones regulares resulta adecuada y se utiliza mucho. La teoría se basa en la premisa de que la no idealidad se debe a diferencias de las fuerzas de van del Waals de atracción de las especies presentes. Las disoluciones regulares tienen un calor mezcla endotérmico y todos los coeficientes de actividad son superiores a la unidad. Estas disoluciones son regulares en el sentido de que las moléculas se dispersan al azar. Las desiguales fuerzas atractivas entre parejas de moléculas similares y diferentes inducen a provocar la segregación de las mismas. Sin embargo, puede suponerse que esta segregación tiende a ser contrarrestada por la energía térmica dando lugar a que las concentraciones moleculares locales sean idénticas a las concentraciones globales de la disolución. Por tanto, la entropía en exceso es cero, de forma que la entropía de las disoluciones regulares es igual a la de las disoluciones ideales, en las que las moléculas están dispersas al azar.
62
Modelos de predicción de propiedades físico-químicas
Para una disolución real, la energía libre molar, g, es la suma de las energías libres molares de la disolución ideal y la energía libre molar en exceso g E, debida a los efectos de la no idealidad. Para una disolución líquida, C
C
C
i =1
i =1
i =1
g = ∑ x i g i + RT ∑ x i ln x i + g E = ∑ x i (g i + RT ln x i + g iE ) (51) en donde la energía libre molar en exceso es la suma de las energías parciales molares en exceso. La energía fase líquidalibre por: parcial molar en exceso está relacionada con el coeficiente de actividad de la g iE 1 ⎛⎜ ∂ n T g E ⎞⎟ = ln γ i = RT RT ⎜⎝ ∂ n i ⎟⎠ P ,T,n j
(52)
Para una disolución líquida regular multicomponente, la energía libre molar en exceso es: 2⎤ C ⎡1 C C g E = ∑ (x i v iL ) ⎢ ∑ ∑ Φ i Φ j (δ i − δ j ) ⎥ i =1 ⎣ 2 i =1 j=1 ⎦
(53)
Φ es la fracción en volumen y suponiendo volúmenes aditivos,
x j v jL
Φj =
C
=
∑ x i v iL
x j v jL vL
(54)
i =1
δ es el parámetro de solubilida d,
⎛ λ j − RT ⎞ ⎟ ⎜ v jL ⎟ ⎝ ⎠
1/ 2
δj = ⎜
(55)
A partir de estas ecuaciones se obtiene una expresión para el coeficiente de actividad: ⎛
C
⎝
j=1
⎞
2
v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟
⎠ (56) RT Cuando las diferencias de tamaños moleculares, reflejados por los volúmenes molares del líquido, son apreciables, pueden añadirse a la contribución de la energía libre de una disolución regular la siguiente corrección de tamaño de Flory-Huggins para disoluciones atérmicas (entalpía en exceso igual a cero):
ln γ iL =
g E = RT ∑ x i ln ⎛⎜⎜ Φ i i =1 ⎝ xi C
⎞⎟ ⎟ ⎠
⎛v ⎞ v ln γ iL = ln⎜⎜ iL ⎟⎟ + 1 − iL vL ⎝ vL ⎠
(57) (58)
La expresión completa para el coeficiente de actividad de una especie en una disolución regular, incluyendo la corrección de Flory-Huggins, es: 63
Modelos de predicción de propiedades físico-químicas
γ iL
2 ⎧ ⎡ C ⎤ ⎪ v iL ⎢δ i − ∑ Φ j δ j ⎥ j=1 ⎪ ⎣ ⎦ + ln ⎛⎜ v iL = exp ⎨ ⎜v RT ⎝ L ⎪ ⎪ ⎩
⎫ ⎪ ⎞ v ⎪ ⎟⎟ + 1 − iL ⎬ vL ⎪ ⎠ ⎪ ⎭
(59)
A partir de la correlación de Chao-Seader también se pueden calcular los coeficientes de o fugacidad de los componentes puros en fase líquida, ν iL , mediante una expresión empírica en S
función de Tr, calculando P r y ω. Para condiciones hipotéticas del líquido (PTci) la correlación ν oiL a partir de datos de equilibrio vapor-líquido. La ecuación C-S fue ampliada o para ν iL es: (o) (1) o = log ν iL + ω i log ν iL log ν iL
log ν iL( o ) = A 0 +
(60)
A1 + A 2 Tri + A 3 Tr2i + A 4 Tr3i + (A 5 + A 6 Tri + A 7 Tr2i ) Pri Tri
(61)
+ (A 8 + A 9 Tri )Pr2i − log Pri (1) log ν iL = A 10 + A 11Tri +
A 12 + A 13 Tr3i + A 14 (Pri − 0.6 ) Tri
Las constantes para la ecuación (62) son: A10 = -4.23893 A11 = 8.65808
(62)
A12 = -1.22060
A13 = -3.15224 A14 = -0.025 Las constantes para la ecuación (61) son: A0 A1 A2 A3 A4 A5 A6 A7 A8 A9
Fluido simple, ω=0 Metano Hidrógeno 2.05135 1.36822 1.50709 -2.10899 -1.54831 2.74283 0 0 -0.02110 -0.19396 0.02889 0.00011 0.02282 -0.01076 0 0.08852 0.10486 0.008585 0 -0.02529 0 -0.00872 0 0 -0.00353 0 0 0.00203 0 0
Las condiciones de aplicabilidad de la correlación C-S son: T < 500 ºF (260 ºC). No se aconseja para temperaturas inferiores a 0 ºF. P < 1000 psia (6.89 MPa) Para hidrocarburos (excepto metano), 0.5 < Tri < 1.3 y la presión crítica de la mezcla < 0.8. Para sistemas que contienen metano y/o hidrógeno, T r < 0.93, y fracción molar de metano < 0.3. Fracción molar de otros gases disueltos 0.5. A partir de la correlación C-S para el valor K se pueden calcular otras propiedades termodinámicas. La ecuación de estado R-K (Tabla 2) se emplea para determinar la densidad y la ecuación (33) para obtener la entalpía de la mezcla en fase vapor. La entalpía del gas ideal o H iV se calcula con la ecuación (30). La entalpía de la mezcla en fase líquida se calcula a
partir de las ecuaciones de ν oiL y γiL con la correlación C-S. La ecuación de partida es la siguiente: ⎡ o C ⎛ ∂ ln ν oiL ⎞ ⎛ ∂ ln γ iL ⎞ ⎤ ⎟⎟ − RT 2 ⎜⎜ ⎟⎟ ⎥ − RT 2 ⎜⎜ H L = ∑ x i ⎢H iV i =1 ⎝ ∂ T ⎠ P , x i ⎦⎥ ⎝ ∂ T ⎠P ⎣⎢
(63)
Derivando el coeficiente de fugacidad del componente líquido puro con respecto a la temperatura se obtiene la siguiente relación para los efectos combinados de la presión y el calor latente de cambio de fase vapor a líquido: o ⎞ ⎛ ∂ ln ν iL 2.30258 RT 2 o ⎟ = (H iV − H iL ) = ⎟ Tci ⎝ ∂ T ⎠P
RT 2 ⎜⎜
+ Pri (A 6 + 2A 7 Tri )
⎡ A ⎢− 21 + A 2 + Tri (2A 3 + 3A 4 Tri ) ⎢⎣ Tri + A 9 Pr2i
(64)
⎛ ⎞⎤ A 2 ⎟⎥ + ω i ⎜ A 11 − 12 + 3 A T 13 r i ⎟ ⎜ Tr2i ⎝ ⎠⎥⎦
Las constantes Ai son las de las ecuaciones (61) y (62). La derivada del coeficiente de actividad en la fase líquida conduce a la entalpía en exceso de la especie H iE (calor de mezcla). Para disoluciones regulares, H iE >0 (endotérmica). C ⎛ ∂ ln γ iL ⎞ ⎛ ⎞ E = (H iL − H iL ) = − H iL = − v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟ ⎟⎟ ∂ T j 1 = ⎝ ⎠ ⎝ ⎠ P, x i
2
RT 2 ⎜⎜
(65)
Una ecuación para el volumen molar de la fase líquida, consistente con la correlación C-S, se deduce sumando los volúmenes molares de las especies y efectuando la corrección del volumen en exceso (volumen de mezcla): ⎡ C C ⎛ ∂ ln γ iL ⎞ ⎤ ⎟⎟ ⎥ v L = ∑ x i (v iL + v iLE ) = ∑ x i ⎢ v iL + RT⎜⎜ i =1 i =1 ⎢⎣ ⎝ ∂ P ⎠ T , x i ⎥⎦
(66) E
γiL se puede considerar independiente de la presión, y v iL = 0 . Para Para disoluciones el cálculo de regulares los volúmenes molares de los componentes se puede utilizar la siguiente ecuación:
v iL =
2.30258 RT [A 5 + A 6 Tri + A 7 Tr2i + 2Pri (A 8 + A 9 Tri )+ ωi A14 ] PCi
(67)
La correlación de Chao y Seader se utiliza ampliamente en las industrias del petróleo y gas natural, habiéndose aplicado al diseño de una gran variedad de separaciones de hidrocarburos ligeros por destilación. 65
Modelos de predicción de propiedades físico-químicas
3.2. Mezclas no ideales que contienen compuestos polares En los líquidos que contienen especies polares diferentes, especialmente cuando se forman o se rompen enlaces de hidrógeno, casi nunca es válida la suposición de disolución líquida ideal. Ewell, Harrison y Berg propusieron una clasificación muy útil de las moléculas basada en el potencial de asociación o de solvatación debidas a la formación de enlaces de hidrógeno. Si una molécula contiene un átomo de hidrógeno unido a un átomo dado (O, N, F y, en ciertos casos, C), el átomo activo de hidrógeno puede formar un enlace con otra molécula que contenga un átomo dador. La clasificación de la Tabla 6 permite una estimación cualitativa de las desviaciones de la ley de Raoult para parejas binarias, si se usa conjuntamente con la Tabla 7. Desviaciones positivas corresponden a valores de γiL>1. Tabla 6. Clasificación de las moléculas según su potencial de formación de enlaces de hidrógeno Clase I
II
III
IV
V
Descripción Ejemplos Moléculas capaces de formar redes Agua, glicoles, glicerina, aminoalcoholes, tridimensionales con enlaces de hidrógeno hidroxilaminas, hidroxiácidos, polifenoles y amidas fuertes. Alcoholes, ácidos, fenoles, aminas primerias y Otras moléculas que contienen tanto secundarias, oximas, compuestos nitro y nitrilos con átomos de hidrógeno activos como otros átomos de H en α, amoniaco, hidracina, fluoruro de átomos donadores (O, N, F). hidrógeno y cloruro de hidrógeno. Éteres, cetonas, aldehídos, ésteres, aminas terciarias Moléculas que contienen átomos donadores (incluyendo las de tipo piridina), compuestos nitro y pero no hidrógenos activos. nitrilos sin átomos de H en α. Moléculas átomos de hidrógeno que activoscontienen pero no átomos donadores con dos o tres átomos de cloro sobre el mismo átomo de carbono y uno o más átomos de cloro sobre átomos de carbono adyacentes. Todas las demás moléculas que no tienen átomos de hidrógeno activos ni átomos donadores.
CHCl3, CH2Cl2, CH3CHCl2, CH2ClCHClCH2Cl y CH2ClCHCl2.
CH3ClCH2Cl,
Hidrocarburos, sulfuro de carbono, sulfuros, mercaptanos, y derivados halogenados no incluidos en la clase IV.
Tabla 7. Interacciones moleculares que causan desviaciones de la ley de Raoult Tipo de desviación Siempre negativa. Cuasi-ideal; siempre positiva o ideal. Generalmente positiva, pero algunas veces negativa. Siempre positiva. Siempre positiva.
Clases Efecto sobre el enlace de hidrógeno III + IV Solamente se forman enlaces-H. III + III; III + V; IV + IV; No intervienen enlaces-H. IV + V; V + V. I + I; I + II; I + III; II + II; Se forman y se rompen enlaces-H. II + III. I + IV (frecuentemente con Se forman y se rompen enlaces-H, pero solubilidad limitada); la disociación de las Clases I o II es el II + IV. efecto más importante. I + V; II + V. Solamente se rompen enlaces-H.
Los efectos de la disolución no ideal pueden incorporarse en las formulaciones del valor K, tal y como se ha visto, en dos formas diferentes. La primera utiliza el coeficiente de fugacidad φi, juntamente con la ecuación de estado y adecuadas reglas de mezcla. Este método es el más 66
Modelos de predicción de propiedades físico-químicas
empleado para tratar no idealidades en fase vapor. Sin embargo, φiV refleja los efectos combinados de un gas no ideal y de una mezcla gaseosa no ideal. A bajas presiones ambos efectos son despreciables. A presiones moderadas una mezcla en fase vapor puede ser todavía ideal, aún cuando la misma no siga la ley de los gases ideales. Sin embargo, en fase líquida las no idealidades pueden ser muy importantes aún a bajas presiones. Como ya se ha visto, el coeficiente de fugacidad, φiL, puede utilizarse para expresar las no idealidades en fase líquida de especies no polares. Cuando están presentes especies polares, la técnica habitual para tratar no idealidades de o
disoluciones es retener φiV pero sustituir φiL por el producto de γiL por ν iL , donde el primero tiene en cuenta las desviaciones del comportamiento ideal: Ki =
o γ iL ν iL φ iV
(68)
o Para bajas presiones, ν iL = PiS P y φiV = 1.0, de forma que la ecuación (68) se transforma en una modificación de la ley de Raoult para el valor K: γ iL PiS Ki = (69) P C
P = ∑ x i γ iL PiS
(70)
i =1
Para presiones moderadas, se puede aplicar la siguiente ecuación: ⎛ PiS ⎞⎛⎜ ν oiVS ⎜ ⎟ o K i = γ iL ⎝⎜ P ⎠⎟⎜⎝ ν iV
⎞ ⎡ v iL (P − PiS )⎤ ⎟ RT ⎟⎠ exp ⎢⎣ ⎥⎦
(71)
Para el caso general se aplica directamente la ecuación (68). Los modelos de coeficientes de actividad más conocidos (algunos de los cuales se presentan con más detalle en los apartados siguientes) se indican en la Tabla 8, con estas ecuaciones se pueden calcular volúmenes, entalpías y entropías en exceso. Tabla 8
Ecuaciones empíricas y semi-teóricas para la estimación de coeficientes de actividad de mezclas líquidas binarias
67
Modelos de predicción de propiedades físico-químicas
3.3. Ecuación de Wilson La correlación semi-empírica de Wilson, publicada en 1964, es una extensión de la ecuación teórica de Flory-Huggins. Las moléculas no sólo difieren en tamaño, como ocurre en la ecuación de Flory-Huggins, sino también en las fuerzas intermoleculares, por lo que la ecuación de Wilson introduce una contribución debida a las energías de interacción entre las moléculas. Supone que la distribución de las moléculas no es al azar, sino que se distribuyen en términos probabilísticos, según la distribución de energías de Boltzmann, en función de las energías intermoleculares e introduce el concepto de composición local (xji), fracción molar del componente j de la mezcla que rodea a una molécula central i. En la Figura 4 se muestra esquemáticamente la composición local para una disolución binaria globalmente equimolar. Alrededor de una molécula central de tipo 1 la fracción Figura 4. Concepto de composiciones locales molar local de moléculas de tipo 2 es 5/8. La siguiente de expresión representa la probabilidad de encontrar a una molécula de componente j alrededor la molécula central i, con respecto a la probabilidad de encontrar a una molécula de componente i alrededor de la molécula central i. x ji x j exp − λ ji RT = x ii x i exp(− λ ii RT )
(72)
siendo: xji y xii la composición local del componente i rodeado de moléculas del componente j o i; λji y λii las energías de interacción entre las moléculas j e i o i e i (λji = λij y λii ≠ 0); R la constante universal de los gases ideales y T la temperatura de la mezcla. La fracción volumét rica local , ξi, del componente i en una mezcla multicomponente se define como el cociente entre el volumen molar que ocupan las moléculas del componente i alrededor de la molécula i central, y el volumen total que ocupan todas las moléculas que rodean a la molécula i central: ξi =
x ii v i C x v ∑ ji j j=1
=
x i v i exp(− λ ii RT ) C x v exp − λ ∑ j j ( ji RT ) j=1
xi
=
(73)
C x Λ ∑ j ji j=1
vi y vj son los volúmenes molares de los componentes i y j; Λji ≠ Λij y Λii = 1, parámetro característico de dos componentes de la mezcla, cuya dependencia con la temperatura es igual a: Λ ji =
68
⎛ λ ji − λ jj ⎞ vi ⎟ exp⎜⎜ − vj RT ⎟⎠ ⎝
(74)
Modelos de predicción de propiedades físico-químicas
Sustituyendo la fracción volumétrica de la energía libre de Gibbs molar en exceso por la fracción volumétrica local se obtiene la ecuación de Wilson: C gE ⎛C ⎞ = − ∑ x i ln ⎜⎜ ∑ x j Λ ij ⎟⎟ (75) RT i =1 ⎝ j=1 ⎠ Mediante la relación entre la energía libre de Gibbs molar en exceso y los coeficientes de actividad, se obtiene la siguiente expresión: E C x Λ ⎞ C k ki = − ln⎛⎜⎜ ∑ ln γ i = 1 ⎛⎜⎜ ∂n i g ⎞⎟⎟ j ij ⎟ ⎟ + 1 − k∑=1 Cx Λ RT ⎝ ∂n i ⎠ T ,P ,n ⎝ j=1 ⎠ x Λ
∑
j
j=1
j
(76)
kj
Los parámetros binarios de interacción λij - λii y λij - λjj (o Λij y Λji) se deben determinar inicialmente a partir de datos experimentales de equilibrio vapor-líquido para mezclas binarias y posteriormente emplearse en el cálculo de los coeficientes de actividad de cada uno de 1os componentes de la mezcla multicomponente.
3.4. Ecuación NRTL (Non-Random Two-Liquid) La ecuación NRTL, introducida por Renon y Prausnitz en 1968, se basa en la teoría quasiquímica de Guggenheim que establece que las moléculas no se distribuyen aleatoriamente en una disolución, por lo que incorpora un parámetro que indica el efecto de la no-aleatoriedad. Además, al igual que la correlación de Wilson, emplea el concepto de composición local con la inclusión del parámetro αji en la exponencial: x ji x j exp − α ji g ji RT = x ii x i exp(− α ji g ii RT )
(77)
En la ecuación (77), gji tiene el mismo significado que λji en la ecuación de Wilson, es decir, la energía de interacción entre las moléculas j e i. La obtención de la expresión para la energía libre de Gibbs en exceso molar se realiza mediante la teoría de dos líquidos de Scott, llegando a la siguiente ecuación: ⎛ τ 21G 21 τ12 G 12 ⎞ gE ⎟⎟ = x 1 x 2 ⎜⎜ + RT ⎝ x 1 + x 2 G 21 x 2 + x 1G 12 ⎠
(78)
g ji − g ii RT
(79)
G ji = exp − α ji τ ji
(80)
τ ji =
Para una mezcla binaria, hay tres parámetros ajustables: (g12-g22), (g21-g11), y α12. Para mezclas multicomponentes, la ecuación NRTL se expresa como: C
g
E
C
∑ τ ji G ji x j
j=1 = ∑ xi C i =1
(81)
∑ G ki x k
k =1
69
Modelos de predicción de propiedades físico-químicas
Los coeficientes de actividad se obtienen fácilmente a partir de la energía libre de Gibbs: C
∑ τ ji G ji x j
ln γ i =
j=1 C
∑ G ki x k
k =1
⎡
C ⎤ ∑ τ rj G rj x r ⎥ r =1 +∑ C ⎢τ ij − C ⎥ j=1 ∑ G kj x k ⎢ ∑ G kj x k ⎥ ⎢⎣ ⎥⎦ k =1 k =1 C
x j G ij ⎢
(82)
Los parámetros de interacción, que se deben determinar inicialmente a partir de datos experimentales de equilibrio de mezclas binarias, son las energías de interacción intermoleculares, (gij-gii) y (gij-gjj) (o τij y τji), y el parámetro de no-aleatoriedad, αij. El parámetro αij, tal y como se indica en la Tabla 9, oscila entre 0.2 y 0.47 y es adimensional. Suele expresar el doble del inverso del número de coordinación, es decir, el número de moléculas que están alrededor de la molécula central, por lo que dependerá de la naturaleza química de los componentes. La principal ventaja de este método estriba en la buena determinación del equilibrio líquidolíquido para mezclas binarias. Para el equilibrio V-L de ciertos sistemas, por ejemplo mezclas de agua y compuestos orgánicos, da mejores resultados que la ecuación de Wilson, aunque en general sus predicciones son peores. Al igual que la correlación de Wilson, incluye la influencia de la temperatura en los parámetros τij. Su dificultad radica en el ajuste de tres parámetros para mezclas binarias, en lugar de los dos que se emplean tanto en la ecuación de Wilson como en el método UNIQUAC. Tabla 9 Valores del parámetro de no aleatoriedad de la ecuación NRTL ij
0.20 0.30
0.40 0.47
Ámbito de aplicación Mezclas de hidrocarburos saturados y especies polares no asociadas (n-heptano-acetona). Mezclas de compuestos no polares (benceno-n-heptano), excepto fluorocarbonos y parafinas. Mezclas de especies no polares y polares no asociadas (benceno-acetona). Mezclas de especies polares que presentan desviaciones negativas con respecto a la ley de Raoult (acetona-cloroformo) y desviaciones positivas moderadas (etanol-agua). Mezclas de agua y especies polares no asociadas (agua-acetona). Mezclas de hidrocarburos saturados y perfluorocarbonos homólogos (n-hexano-perfluoro-nhexano). Mezclas de un alcohol u otra especie fuertemente autoasociada con especies no polares (etanolbenceno). Mezclas de tetracloruro de carbono con acetonitrilo o nitrometano. Mezclas de agua con butil-glicol o piridina.
3.5. Ecuación UNIQUAC (Universal Quasi-Chemical) La correlación UNIQUAC fue introducida por Abrams y Prausnitz en 1975 y tiene una base mecánica-estadística. Este modelo generaliza un análisis previo de Guggenheim y lo amplía a mezclas de moléculas que difieren apreciablemente, tanto en la forma como en el tamaño. Al igual que en las ecuaciones de Wilson y NRTL, se emplean concentraciones locales. Sin embargo, en vez de fracciones en volumen locales y fracciones molares locales, UNIQUAC utiliza la fracción de área local, θij, como variable primaria de concentración, que se determina representando una molécula como un conjunto de segmentos unidos. Cada molécula está caracterizada por dos parámetros estructurales, que se determinan con relación a un segmento estándar, que se toma como una esfera equivalente de una unidad monomérica de una molécula lineal de polimetileno de longitud infinita. Los dos parámetros estructurales 70
Modelos de predicción de propiedades físico-químicas
son el número relativo de segmentos por molécula, r ( parámetro de volumen) y la superficie relativa de la molécula, q ( parámetro de superficie). En el modelo UNIQUAC, la energía libre de Gibbs en exceso consta de dos contribuciones: •
Una debida a las diferencias de tamaño y forma de las moléculas, llamada combinatorial o configuracional , que para un sistema binario se expresa como: E g combinator Φ Φ θ θ ⎞ z⎛ ial = x 1 ln 1 + x 2 ln 2 + ⎜⎜ q 1 x 1 ln 1 + q 2 x 2 ln 2 ⎟⎟ Φ1 Φ2 ⎠ RT x1 x2 2 ⎝
(83)
Φi =
x i ri x 1 r1 + x 2 r2
(84)
θi =
xiqi x 1q 1 + x 2 q 2
(85)
Φ1 y Φ2 son las fracciones volumétricas de las moléculas 1 y 2; θ1 y θ2, las fracciones
superficiales; r1 y r 2, los volúmenes de van der Waals respecto a un estándar; q1 y q 2, las áreas de van der Waals respecto a un estándar y z, el número de coordinación, que suele oscilar entre 6 y 12. •
Y otra debida a las interacciones energéticas entre las moléculas, llamada residual. g Eresidual = −q 1 x 1 ln (θ1 + θ)2 τ 21 (− q 2 x 2) ln θ 2 + θ1 τ12 RT
(86)
τ 21 = exp ⎡⎢ − (u 21 − u 11 ) ⎤⎥
(87)
⎡ − (u 12 − u 22 ) ⎤ ⎥ RT ⎣ ⎦
(88)
⎣
RT
⎦
τ12 = exp ⎢
u11, u22, u12 = u21 son las energías de interacción intermoleculares 1-1, 2-2 y 1-2, respectivamente. Mientras que la contribución combinatorial contiene dos variables (Φi, θi) que dependen de la composición, y se obtiene únicamente a partir de parámetros estructurales (ri, qi) de los componentes puros, la contribución residual tan sólo depende de una variable (θi), aunque posee dos parámetros binarios ajustables: u21-u11 y u21-u22 (o τ21 y τ12). La expresión del coeficiente de actividad para una mezcla multicomponente se obtiene directamente por diferenciación de la energía libre de Gibbs, resultando la siguiente expresión: Φ θ Φ C ln γ i = ln γ iC + ln γ iR = ln i + z q i ln i + l i − i ∑ x j l j Φi xi 2 x i j=1 (89) C C θ j τ ij ⎛ ⎞ − q i ln ⎜⎜ ∑ θ j τ ji ⎟⎟ + q i − q i ∑ C ⎝ j=1
⎠
j=1
∑ θ k τ kj
k =1 li
=
z (r − q i ) − ri + 1 2 i
(90) 71
Modelos de predicción de propiedades físico-químicas
Los parámetros estructurales ri y qi se determinan a partir de medidas cristalográficas (ángulos de enlace y distancias de enlace). Las ventajas que presenta con respecto a los dos métodos anteriores son: • Predice el equilibrio líquido-líquido con sólo dos parámetros. • Sus parámetros poseen una menor dependencia con la temperatura debido a su
mejor base teórica. • Resulta aplicable a disoluciones que posean moléculas de diferentes tamaños, ya
que incluyen en su ecuación contribuciones estructurales. Este modelo termodinámico es la base de otro modelo de contribución de grupos, llamado UNIFAC (UNIQUAC Functional Activity Coefficients), que está ampliamente extendido y se emplea para la predicción de los coeficientes de actividad en fase líquida de mezclas binarias para las que no se posee información experimental o ésta es escasa.
3.6. Modelos de contribución de grupos: UNIFAC Los modelos termodinámicos de contribuciones de grupos más establecidos en la actualidad son el método ASOG, introducido por Deal y Derr en 1968, y el método UNIFAC de Fredenslund y colaboradores, en 1975. Ambos modelos predicen los coeficientes de actividad de la fase líquida de mezclas de no-electrolitos considerando la mezcla líquida como una disolución de grupos en lugar de una disolución de moléculas. Los grupos son las unidades estructurales que constituyen una molécula, de tal forma que, si bien el número de moléculas es infinito, el número de grupos es limitado. El hecho de que estos métodos operen con grupos presenta la ventaja de que simplemente con una serie reducida de grupos se pueden predecir los coeficientes de actividad de infinidad de mezclas muy diferentes entre sí. Así, por ejemplo, en una disolución de tolueno y acetona, las contribuciones de grupo pueden deberse a 5 grupos CH aromáticos, 1 grupo C aromático y 1 grupo CH 3 del tolueno; y 2 grupos CH3 más 1 grupo CO carbonilo de la acetona. Alternativamente, pueden emplearse grupos más grandes para formar 5 grupos CH aromáticos y un grupo CCH3 del tolueno; y un grupo CH3 y un grupo CH3CO de la acetona. Cuanto más grandes sean los grupos funcionales tomados, mayor es la exactitud de la representación molecular, aunque disminuye la ventaja del método de contribución de grupos, ya que se requiere un mayor número de grupos. En la práctica se pueden utilizar unos 50 grupos funcionales para representar miles de mezclas líquidas multicomponentes. Ambos métodos permiten calcular los coeficientes de actividad mediante dos términos o contribuciones al igual que el modelo UNIQUAC: una combinatorial, debida a las diferencias de forma y tamaño de las moléculas, y una residual, debida a las interacciones energéticas entre los grupos, aunque difieren en algunos aspectos. Sin embargo, la aplicabilidad del modelo ASOG es mucho menor que la del modelo UNIFAC, debido a la escasez de parámetros de interacción de grupos que se encuentran publicados. A continuación se describe de manera breve el modelo UNIFAC. UNIFAC se basa en el modelo termodinámico UNIQUAC, y en la bibliografía se encuentran numerosos trabajos en los que se han determinado las contribuciones de un elevado número 72
Modelos de predicción de propiedades físico-químicas
de grupos. El intervalo de aplicabilidad está comprendido entre 300 y 425 K y bajas presiones de operación. En este método, los parámetros moleculares de volumen y de área en los términos combinatoriales se sustituyen por: ri = ∑ ν (ki ) R k
(91)
q i = ∑ ν (ki ) Q k
(92)
k
k
ν (ki ) el número de grupos funcionales de tipo k en la molécula i, y Rk y Q k, los parámetros de
volumen y de área, respectivamente, para el grupo funcional de tipo k. El término residual de la ecuación (89), que está representado por ln γ iR , se sustituye por la expresión: ln γ iR = ∑ ν (ki ) (ln Γk − ln Γk( i ) )
(93)
k
todos los grupos funcionales de la mezcla
Γk es el coeficiente de actividad residual del grupo funcional k en la mezcla real, y ln Γk(i ) es la
misma magnitud pero en una mezcla de referencia que solamente contiene moléculas de tipo i. Se requiere esta última magnitud, ya que γ iR → 1.0, cuando x1 → 1.0. Tanto ln Γk(i ) como Γk tienen la misma forma que el término residual de la ecuación (89). Por tanto, ⎡
⎛
⎢⎣
⎝
⎞
ln Γk = Q k ⎢⎢1 − ln⎜⎜ ∑ θ m Tmk ⎟⎟ − ∑ ⎠
m
m
θ m Tkm ⎤⎥
∑ θ n Tnm ⎥⎥ n
(94)
⎦
θm es la fracción de área del grupo m, dada por una ecuación análoga a la (85): θm =
X mQm ∑ XnQn
(95)
n
Xm es la fracción molar del grupo m en la disolución: ∑ v (mj) x j
Xm =
j
( j) ∑ ∑ vn x j
(96)
j n
y Tmk es un parámetro de interacción de grupo dado por una ecuación similar a la (89): ⎛ a ⎞ Tmk = exp⎜ − mk ⎟ ⎝ T ⎠
(97)
amk ≠ akm y cuando m = k, entonces a mk = 0 y Tmk = 1.0. Para Γk(i ) , también es aplicable la ecuación (94), y los términos θ corresponden al componente i puro.
73
Modelos de predicción de propiedades físico-químicas
Se dispone de amplias tablas de valores para Rk, Qk, amk, y akm, algunos de los cuales se indican a modo de ejemplo en la Tabla 10, que van siendo puestas al día a medida que se obtienen nuevos datos experimentales. Aunque los valores de Rk y Qk son diferentes para cada grupo funcional, los valores de amk son iguales para todos los subgrupos de un grupo principal. Por tanto, la cantidad de datos experimentales que se requieren para obtener valores de a mk y a km, y el tamaño del banco de datos para estos parámetros no son tan grandes como cabría esperar.
k), de superficie (Qk) y de interacción Tabla 10. (aValores de los parámetros volumétricos (R mk) para algunos grupos funcionales
Grupos y subgrupos Grupo Subgrupo
k
Rk
Qk
CH3 1 CH2 2 CH 3 C 4 10 3 ACH ACH (AC = carbono aromático) 12 4 ACCH2 ACCH3 ACCH2 13 OH 15 5 OH H2O 17 7 H 2O
0.9011 0.6744 0.4469 0.2195 0.5313
0.848 0.540 0.228 0.000 0.400
1.2663 1.0396 1.0000 0.9200
0.968 0.660 1.200 1.400
9 CH2CO CH3CO CH2CO 13 CH2O CH3O CH2O CH-O 15 CNH CH3NH CH2NH CHNH
1.6724 1.4457 1.1450 0.9183 0.6908 1.4337 1.2070 0.9795
1.488 1.180 1.088 0.780 0.468 1.244 0.936 0.624
1 CH2
19 20 25 26 27 32 33 34
Parámetros de interacción amk 1 1 CH2 3 ACH 4 ACCH2
3
4
0.00 -11.12 -69.70
61.13 0.00 -146.80
76.50 167.00 0.00
156.40 300.00 26.76 83.36 65.33 24.82
89.60 362.30 140.10 52.13 -22.31 -22.97
25.82 377.60 365.80 65.69 223.00 -138.40
5
7
986.50 1318.00 636.10 903.80 803.20 5695.00
9
476.40 25.77 -52.10
13
15
251.50 32.14 213.10
255.70 122.80 -49.29
19
597.00 212.50 6096.00
5 OH 7 H2O 9 CH2CO 13 CH2O 15 CNH 19 CCN
74
0.00 353.50 84.00 -229.10 0.00 -195.40 164.50 472.50 0.00 237.70 -314.70 191.10 -150.00 -448.20 394.60 185.40 242.80 -287.50
28.06 42.70 540.50 168.00 -103.60 -174.20 0.00 251.50 -56.08 0.00 38.81 -108.50
6.712 112.60 481.70 -18.51 147.10 0.00
Modelos de predicción de propiedades físico-químicas
3.7. Determinación de los parámetros de interacción molecular El equilibrio entre fases se puede predecir conocidos los coeficientes de actividad de los componentes que integran el sistema y su dependencia con la composición y la temperatura. Esto último se determina mediante las correlaciones o modelos termodinámicos presentados en los apartados precedentes, los cuales incluyen unos parámetros ajustables que se deben conocer inicialmente. Estos parámetros corresponden a interacciones binarias intermoleculares, y se pueden determinar a partir de mezclas binarias de las formas siguientes: a. Datos de equilibrio líquido-vapor en el intervalo de composición . Mediante un proceso iterativo el que libre se tienen en cuenta los errores experimentales, de forma que se minimiza en la energía de Gibbs del sistema, y los resultados son termodinámicamente consistentes (verifican la ecuación de Gibbs-Duhem). b. Datos de azeótropos. La determinación de los parámetros de interacción se realiza fácilmente a partir de datos de equilibrio del azeótropo, debido a que las composiciones de ambas fases coinciden. c. Datos de solubilidad para mezclas parcialmente insolubles. Su cálculo es semejante al del equilibrio vapor-líquido. d. Datos de coeficientes de actividad a dilución infinita. El componente para el que se pretende determinar el coeficiente de actividad se encuentra en una cantidad muy pequeña con respecto al otro componente. Los modelos termodinámicos poseen expresiones del coeficiente de actividad a dilución infinita, de forma que, conocido su valor para cada uno de los componentes, se determina fácilmente el valor de los parámetros binarios de interacción. De todos ellos, el más empleado es el de los coeficientes de actividad a dilución infinita, por su sencillez, rapidez y facilidad de obtención. Además, como su valor normalmente es el más elevado, hay menor incertidumbre en la interpolación que en la extrapolación de datos. La determinación experimental de los coeficientes de actividad a dilución infinita se realiza mediante técnicas cromatográficas y ebullométricas. Tales técnicas son complementarias, ya que las primeras se emplean cuando los solutos tienen una volatilidad muy alta con respecto al disolvente (componente de la mezcla en concentración elevada), y las segundas cuando la volatilidad es similar.
4. BIBLIOGRAFÍA •
Biegler, L.T.; Grossmann; I.E.; Westerberg, A.W.,Systematic Methods of Chemical Process Design, Prentice Hall, New Jersey (1997)
•
Gess, M.A.; Danner, R.P.; Nagvekar, M.,Thermodynamic Analysis of Vapor-Liquid Equilibria: Recommended Models and Standard Data Base, DIPPR (1991)
•
Henley, E.J.; Seader, J.D., Operaciones de Separación por Etapas de Equilibrio en Ingeniería Química, Reverté, Barcelona (1988)
•
Walas, S.M., Phase Equilibria in Chemical Engineering, Butterworth, Boston (1985)
•
Seader, J.D; Henley, E.J., Separation Process Principles, John Wiley & Sons, New York (1998) 75
I.
Termodinámic a y modelizac ión rigurosa de procesos
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ÍNDICE 1. INTRODUCCIÓN......................................................................................................79 2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS .................... 86 2.1. Ecuaciones de estado .............................................................................................86 2.2. Modelos de actividad.............................................................................................88 2.3. Métodos semiempíricos.........................................................................................92 2.4. Métodos de presión de vapor.................................................................................93
3. SELECCIÓN DE MÉTODOS DE PROPIEDADES............................................... 93
1. INTRODUCCIÓN A la hora de afrontar cualquier simulación de un proceso químico hay que considerar en primer lugar qué datos termodinámicos son necesarios para llegar a cabo esa simulación. Con carácter general, se puede decir que estos datos serán: •
Para resolver los balances de materia se necesitarán valores de la constante de equilibrio entre fases, K, para columnas, flash, …
•
Para los balances de energía se precisarán datos de entalpías, especialmente para el caso de cambiadores de calor.
•
Se necesitarán entropías para compresores y expansores (turbinas).
•
Energía libres para el equilibrio químico.
•
Volumen molar para el dimensionado de equipos.
•
Propiedades de transporte también para el dimensionado de equipos.
También habrá que estimar algunas propiedades, como: •
Propiedades de componentes puros: presión de vapor, calor de vaporización, ..
•
Propiedades de mezclas: densidad, viscosidad, …
•
Equilibrios entre fases (LV, LL, VLL) para los sistemas multicomponentes.
Para llevar a cabo todas estas tareas los simuladores comerciales disponen de una serie de información básica, a partir de la cual se calculan todas las propiedades anteriores. Esta información básica está compuesta por: •
Propiedades de componentes puros: almacenadas como parámetros dependientes de la temperatura y/o presión, o bien almacenados como valores (propiedades críticas, puntos de ebullición, etc.).
•
Datos de equilibrio entre fases (LV, LL, VLL), generalmente almacenados como parámetros de interacción. 79
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
En el caso del simulador HYSYS los datos disponibles se resumen en: •
Base de datos con 1500 componentes puros.
•
Base de datos con 16000 ajustes binarios para el equilibrio entre fases.
•
Posibilidad de añadir nuevos componentes (pseudocomponentes).
Evidentemente, el elemento vital del proceso de modelización y simulación es la
especificación de las propiedades termofísicas. Para la estimación de propiedades, existe una información mínima necesaria, que es: •
Si el punto de ebullición , PB < 370 ºC, se necesita como mínimo el PB.
•
Si PB > 370 ºC, se precisa el PB y la densidad del líquido.
•
Si el PB es desconocido se necesita como mínimo el peso molecular y la densidad
En cualquier caso, recomendable:
¡cuanta mayor información se suministre mejor¡,
•
Estructura molecular
•
Peso molecular
•
Punto de ebullición
siendo
Para comprender mejor la importancia decisiva del modelo de propiedades en cualquier simulación, a continuación se presentan algunos ejemplos clarificadores. En las figuras siguientes se muestran los diagramas ternarios para el sistema bencenoheptano-dimetilformamida, estimados empleando el modelo termodinámico de Margules y NRTL. Como se puede observar existen claras discrepancias entre ambos, así por ejemplo el máximo de la curva binodal se encuentra para la estimación de Margules alrededor de 0.5 % de benceno, mientras que la estimación NRTL lo sitúa alrededor del 0.36. A la vista de estos dos diagramas, necesarios por ejemplo para el diseño de una separación por extracción L-L, ¿cuál es la estimación correcta?.
80
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Otro ejemplo es el sistema de refrigeración siguiente:
En la tabla mostrada los valores en azul corresponden a valores fijados por el usuario, por tanto corresponden a las especificaciones del problema. Los valores en negro que se mostrarán en las siguientes tablas corresponden a valores calculados por el programa, en este caso HYSYS. Los resultados obtenidos con dos modelos termodinámicos: Peng-Robinson (PR), y NRTL presentan grandes diferencias. Así para la corriente “Alimento” se pueden observar las diferencias existentes en cuanto a la fracción de vapor, según las cuáles para el modelo PR se trata de una corriente en forma de vapor, mientras que para NRTL es una mezcla L-V.
TERMODINAMICA
PR
NRTL
81
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Para la corriente “Producto”, los resultados muestran también serias discrepancias en la fracción de vapor y en menor medida en la temperatura de la misma.
TERMODINAMICA
PR
NRTL
Lo mismo ocurre en las corrientes “Ref ent E-102” pero en este caso con grandes diferencias en las temperaturas.
TERMODINAMICA
PR
NRTL
Y en la corriente “Salida E-100”, donde las diferencias se centran en fracción de vapor y flujo molar.
82
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
TERMODINAMICA
PR
NRTL
el uso de la termodinámica, como el de otras muchas cosas, no es tan sencillo. A partir de estos ejemplos, y otros muchos que se podrían poner, se resume que
Para complicar aún más las cosas, a continuación se muestra una simulación para separar por destilación etilbenceno y estireno, usando tres simuladores distintos, pero empleando todos ellos el mismo modelo termodinámico (ecuación de estado de Soave-Redlich-Kwong). Como se puede observar existen serias discrepancia s entre los resultados proporcio nados por los tres simuladores. Modelo: SRK-EOS en los tres simuladores
Etilbenceno: 51,0 kmol/h Estireno: 47,8 kmol/h
Producto de colas (kmol/h)
Simul1 Simul2 Simul3 Ref.: Sadeq et al. AIChE Annual Meeting, 1995
Etilbenceno Estireno
2,90
8,55
5,63
2 6 , 76 2 1 , 1 0 2 4 , 0 3
83
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Por otra parte, entre el 50 y el 80 % de los costes de los procesos químicos corresponden a los procesos de separación los procesos de separación, lo cual es un gran incentivo para estudiar el equilibrio entre fases, ya que los procesos de separación se encuentran controlados por el equilibrio entre fases, ver figura siguiente. Entre todos los procesos de separación la destilación es la tecnología dominante, representando el 95 % de todas las separaciones del mundo. De todo esto se deduce la gran atención que se ha prestado al equilibrio liquido-vapor (LV).
Procesos de separación controlados por el equilibrio Por adición de energía o de otra sustancia, una mezcla homogénea se separa en (al menos) dos fases de diferente composición. Destilado
Coste de los procesos químicos de producción Están fuertemente influenciados por los procesos de separación (50-80%). Esto es un gran incentivo para conocer el equilibrio entre fases del proceso.
Corriente lateral F Producto
Destilación
de colas
Es la tecnología dominante, el 95% de todas las separaciones en el mundo (más de 40000 columnas en USA, con una inversión de 8000 M$ y una energía equivalente a 54 Mton/año de crudo, es decir el 15% del consumo industrial de energía en USA).
La constante de equilibrio LV se puede determinar, partir de dos formas genéricas:
Forma simétrica
Ki =
φiL φiV
Forma asimétrica o
Ki =
γ iL f iL φiV P
o
=
γ iLν iL φiV
o Siendo, f la fugacidad de la especie en la mezcla, f la fugacidad de la especie pura, coeficiente de fugacidad en la mezcla, γ el coeficiente de actividad en la mezcla, y coeficiente de fugacidad de la especie pura. Los subíndices i, V y L, indican, respectivam ente, compo nente, fase vapo r y fase líquida.
φ el o ν el
Estas dos formas implican el cálculo de los coeficientes de fugacidad del componente puro como de la mezcla, y/o coeficiente de actividad, lo que se puede hacer a través de una ecuación de estado, un modelo de actividad, modelos empíricos, o métodos de presiones de vapor. Los métodos más utilizados en la práctica son a partir de las ecuaciones o los modelos de actividad. En la siguiente tabla se comparan estos métodos.
84
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Ecuación de Estado (EOS) •
•
•
•
Capacidad limitada para representar líquidos no ideales Se necesitan pocos parámetros Parámetros se extrapolan razonablemente bien con la temperatura Consistente en la región crítica
Modelos de actividad •
•
•
•
Pueden representar líquidos altamente no ideales Se necesitan muchos parámetros binarios Parámetros son altamente dependientes de la temperatura Inconsistente en la región crítica
La otra posible comparación es entre comportamiento ideal y no-ideal, que se muestra a continuación:
¿Qué significa comportamiento ideal?
¿Qué sistemas se comportan idealmente?
Componentes no polares de tamaño y forma similar
¿Qué controla el grado de no idealidad?
Ley gases ideales y ley de Raoult
Interacción molecular (p.e. Polaridad, forma y tamaño de las moléculas)
¿Cómo se estudia el grado de no idealidad de un sistema?
Representación de propiedades (p.e. Diagramas TXY y XY)
Toda la información relativa al cálculo de las propiedades físicas y del flash se encuentran en HYSYS en lo que se denomina “Fluid Package”, e incluye: •
Los modelos de propiedades (Property Package) que proporcionan predicciones seguras de las propiedades físicas, termodinámicas y de transporte.
•
Componentes
•
Parámetros
•
Coeficientes binarios
•
Reacciones químicas
Además toda la información se organiza en entornos donde se permite acceder e introducir información en un área determinada, mientras las otras áreas están en espera. Existen dos tipos de entornos, que se indican a continuación:
85
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Entorno base
Entorno base de simulación. Permite crear, definir, y modificar los Fluid Package. La información mínima:
Al menos 1 Fluid Package
Al menos 1 componente
Un Fluid Package especificado como Fluid Package por defecto
Entorno de caracterización de aceites
Entorno de simulación
Entorno diagrama de flujo principal
Entorno de sub-diagrama de flujo de columna -
En esta sección vamos a presentar en primer lugar información más detallada sobre la implementación en HYSYS de cada uno de los modelos de propiedades físicas. Posteriormente, proporcionaremos la selección de los métodos de cálculo de propiedades, donde indicaremos para varios procesos típicos en la industria química los métodos recomendados para la estimación de las propiedades termodinámicas.
2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS 2.1. Ecuaciones de estado
HYSYS ofrece actualmente la ecuación de estado mejorada de Peng-Robinson (PR), y la de Soave-Redlich-Kwong (SRK). Además, ofrece varios métodos que son modificaciones de éstas, tales como Zudkevitch-Joffe (ZJ) y Kabadi-Danner (KD). Lee-Kesler-Plocker (LKP) es una adaptación de la ecuación para mezclas de Lee-Kesler, que a su vez es una modificación de la ecuación Benedit-Webb-Rubin (BWR). De éstas, la de Peng-Robinson es la que presenta un intervalo mayor de aplicación y una mayor variedad de sistemas a los que es aplicable. Las ecuaciones de estado de Peng-Robinson y Soave-Redlich-Kwong proporcionan directamente todas las propiedades termodinámicas y de equilibrio requeridas. Aunque las formas de estas ecuaciones son comunes a otros simuladores comerciales, han sido mejoradas significativamente por Hyprotech para extender su intervalo de aplicabilidad.
PR y SRK
Los métodos PR y SRK contienen parámetros de interacción binaria mejorados para todos los pares hidrocarburo-hidrocarburo, así como para la mayoría de sistemas binarios hidrocarburono hidrocarburo. Para los componentes no presentes en la base de datos de HYSYS o para pseudocomponentes de la clase hidrocarburo, los parámetros de interacción HC-CH se generan automáticamente para mejorar las predicciones del equilibrio L-V.
86
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La ecuación PR aplica un tratamiento especial en los parámetros de interacción de ciertos componentes como He, N2, H2, CO2, H2S, H2O,CH3OH, EG y TEG.
Kabadi-Danner (KD)
Este modelo es una modificación de la ecuación srcinal SRK, modificada para mejorar el equilibrio L-V de los sistemas H2O-hidrocarburo, particularmente en la región diluida. La modificación está basada en una regla de mezcla asimétrica, donde la interacción en la fase acuosa (con fuerte presencia de puentes de hidrógeno) se calcula basada tanto en la interacción entre los hidrocarburos y el agua, como en la perturbación provocada por el hidrocarburo en la interacción H2O-H2O. Lee-Kesler-Plöcker (LKP)
Esta ecuación es un método general exacto para las sustancias no polares y para las mezclas. Plöcker aplicó la ecuación de Lee-Kesler a las mezclas, desarrollando reglas de mezclas para las propiedades pseudocríticas.
Peng-Robinson Stryjek-Vera (PRSV)
Es una doble modificación de la ecuación de estado PR, que extiende su aplicabilidad a sistemas moderadamente no ideales. Se ha demostrado que reproduce las curvas de presión de vapor de componentes puros y mezclas de forma más exacta que el método de PR, especialmente a bajas presiones de vapor. Se ha extendido satisfactoriamente para manejar sistemas no ideales, dando resultados tan buenos como los obtenidos usando funciones de energía de Gibbs en exceso, tales como Wilson, NRTL o UNIQUAC. Una de las modificaciones de la ecuación de PR introducidas por Stryjek-Vera es la expansión del término α que se transforma en una función del factor acéntrico y de un parámetro empírico κ usado para ajustar las presiones de vapor de los componentes puros. Para los pseudocomponentes generados para representar las fracciones de petróleo, HYSYS regresiona automáticamente este término para cada pseudocomponente frente a las curvas de presión de vapor de Lee-Kesler. La segunda modificación consiste en un nuevo conjunto de reglas de mezcla. De las dos reglas de mezcla propuestas en el artículo srcinal, HYSYS solamente ha incorporado la expresión de Margules para el término cruzado. Aunque solamente se han ajustado en HYSYS un número limitado de pares binarios, la experiencia aunque limitada sugiere que PRSV se puede emplear como modelo para sistemas moderadamente no ideales, tales como los sistemas agua-alcohol, y algunos sistemas hidrocarburo-alcohol. También se puede emplear para sistemas de hidrocarburos con buena exactitud.
87
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Opciones de aguas ácidas
La opción de aguas ácidas está disponible para las ecuaciones de estado PR y SRK. La opción Sour PR combina la ecuación de estado PR con el modelo API Sour de Wilson para el manejo de sistemas de aguas ácidas, mientras que el Sour SRK utiliza la ecuación SRK con el modelo de Wilson. Las opciones Sour emplean la ecuación de estado correspondiente para calcular las fugacidades de las fases liquida y vapor de hidrocarburos, así como la entalpía para las tres fases. Los valores de la constante de equilibrio para la fase acuosa se calcula con el método API Sour de Wilson que toma en consideración la ionización en la fase acuosa del 2HS, CO2 y NH3. El modelo srcinal es aplicable para temperaturas entre 20 ºC y 140 ºC, y hasta presiones de 50 psi. El empleo de las ecuaciones de estado PR o SRK para corregir la no idealidad de la fase vapor extiende su intervalo de aplicación, pero debido a la falta de datos experimentales, no se puede fijar un intervalo exacto. El intervalo de presión aceptable para el modelo empleado en HYSYS depende de la concentración de gases ácidos y agua, pero funciona bien para presiones parciales de agua menores de 100 psi. Esta opción se puede emplear en desorbedores de aguas ácidas, procesos de hidrotratamiento, columnas de crudo, o cualquier proceso que contenga hidrocarburos, gases ácidos y agua.
Cálculo de la entalpía con modelos de ecuaciones de estado
Con cualquiera de los modelos de ecuaciones de estado, excepto LKP se puede especificar si la entalpía se calcula mediante la ecuación de estado correspondiente o bien se hace a través del método de Lee-Kesler. La opción de cálculo de entalpía mediante la ecuación de Lee-Kesler, resulta en um modelo combinado en el que los valores del equilibrio L-V se hacen mediante la ecuación de estado correspondiente, mientras que los cálculos de entalpías y entropías se hacen mediante la ecuación de Lee-Kesler. Las entalpías calculadas mediante la ecuación de Lee-Kesler pueden ser ligeramente más exactas para los hidrocarburos pesados, pero requieren más recursos computacionales debido a que se tiene que emplear un método separado.
2.2. Modelos de actividad Aunque las ecuaciones de estado han demostrado ser muy fiables en la predicción de las propiedades de los sistemas constituidos por hidrocarburos en un amplio intervalo de condiciones de operación, su aplicación ha quedado limitada a los componentes no polares o ligeramente polares. Los sistemas químicos polares o no ideales tradicionalmente se han tratado con modelos duales. En estos modelos se emplea una ecuación de estado para predecir los coeficientes de fugacidad de la fase vapor, y un modelo de coeficientes de actividad para la fase líquida. Aunque se ha hecho un esfuerzo considerable para extender las ecuaciones de estado a este tipo de sistemas (por ejemplo, PRSV), la predicción de las propiedades en sistemas químicos está dominada principalmente por los modelos de actividad. Los modelos de actividad son de naturaleza mucho más empírica que los modelos de ecuaciones de estado. Por ejemplo, no se pueden usar de una forma tan fiable como las 88
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ecuaciones de estado para aplicaciones generalizadas o para extrapolar fuera de las condiciones ensayadas. En la siguiente Tabla se resume los modelos recomendados para diferentes aplicaciones.
La no idealidad de la fase vapor se puede tener en cuenta para cada modelo de actividad seleccionando las ecuaciones de estado de Redlich-Kwong, PR, o SRK como modelo para la fase vapor. Cuando se usa alguna de estas ecuaciones de estado para la fase vapor, siempre se corrige la fase líquida con el factor de Poynting. Si se produce dimerización en la fase vapor, se debería emplear la ecuación de Virial como ecuación de estado. Hay que tener en cuenta, que todos los parámetros binarios de interacción en la base de datos de HYSYS están obtenidos usando el modelo de gas ideal para la fase vapor, por lo que debería emplearse este modelo.
Observaciones generales Estos modelos duales no se pueden emplear con el mismo grado de flexibilidad y fiabilidad con que las ecuaciones de estado se pueden emplear en sistemas de hidrocarburos. Para asegurar un buen nivel de fiabilidad, se debe tener en cuenta algunas observaciones:
•
Comprobar que el modelo seleccionado es aplicable al sistema considerado, y comprobar que tal ajusta las presiones de vapor de los componentes puros. Aunque las presiones de vapor de los componentes puros normalmente ajustan de manera aceptable, los parámetros se han ajustado en un intervalo ampliodedetemperatura temperaturas. Se puede mejorar la exactitud ajustando los parámetros en el intervalo deseado.
•
La generación automática de parámetros de interacción mediante UNIFAC es una herramienta muy útil y disponible para todos los modelos de actividad. Sin embargo, se debe usar con precaución. Los valores estándar ajustados en HYSYS producen resultados mucho mejores en los sistemas binarios que los parámetros generados por UNIFAC.
•
Siempre que sea posible se deben usar parámetros de interacción obtenidos por regresión de datos experimentales. Los parámetros de interacción en HYSYS se han obtenido 89
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ajustando datos experimentales, sin embargo, es posible mejorar los resultados ajustando los parámetros con datos experimentales en el intervalo de operación esperado. Dado que los datos de parámetros de interacción presentes en HYSYS se han obtenido a partir de datos a presión atmosférica, se debe tener precaución al extrapolar a presiones más altas o bajas. •
Hay que comprobar la exactitud de las predicciones (tanto en cuanto a temperatura como composición) en el caso de sistemas con azeótropos.
•
Si se sospecha la presencia de tres fases, se podrían requerir ajustes adicionales para reproducir de forma fiable las condiciones de equilibrio LLV.
2.2.1. Modelos de actividad disponibles en HYSYS Margules
Las ecuación de Margules fue la primera representación desarrollada parala energía en exceso de Gibbs, y no tiene ninguna base teórica, aunque es útil para estimaciones rápidas y para interpolación de datos. HYSYS dispone de la ecuación de Margules extendida a sistemas multicomponentes con hasta 4 parámetros ajustables por par binario (dos independientes de la temperatura, y otros dependientes).
Van Laar La ecuación de Van Laar fue la primera representación de la energía en exceso de Gibbs con significado físico. La ecuación implementada en HYSYS es una versión modificada por Null, que es bastante útil en muchos sistemas, particularmente para el equilibrio de distribución LL. Se puede usar para sistemas con desviaciones positivas y negativas de la ley de Raoult, sin embargo, no permite predecir máximos o mínimos en el coeficiente de actividad. Por tanto, no va bien en sistemas con hidrocarburos halogenados y alcoholes. Tiene tendencia predecir dos fases líquidas, cuando en realidad no existen.
Wilson
La experiencia demuestra que la ecuación de Wilson se puede emplear para extrapolar con razonable fiabilidad a otras condiciones de operación empleando los mismos parámetros de interacción. También representa satisfactoriamente casi todos las disoluciones liquidas no ideales, excepto electrolitos y disoluciones con miscibilidad limitada. Por tanto, no se puede emplear en problemas que involucren equilibrio L-L. Predice bastante bien los equilibrios ternarios usando parámetros ajustados a partir de datos binarios. La ecuación implementada en HYSYS contiene de 2 a 4 parámetros por par binario. Hay que tener en cuenta que aún poniendo los 4 parámetros a cero no se reduce el par binario a una disolución ideal, ya que mantiene un pequeño efecto debido a la diferencias de tamaño de las moléculas.
90
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
NRTL
Esta ecuación es una extensión de la ecuación de Wilson, que es capaz de representar los equilibrios L-V, L-L y L-L-V. Como la ecuación de Wilson es termodinámicamente consistente y se puede aplicar a sistemas ternarios o de orden superior usando parámetros ajustados a partir de datos de equilibrio binarios. Contiene 5 parámetros por cada par binario (independientes y dependientes de la temperatura). Debido a su estructura matemática puede producir intervalos falsos de miscibilidad.
Extended and General NRTL
Son variaciones del modelo NRTL, que emplean más parámetros binarios de interacción. Se aplican a sistemas: •
Con un amplio intervalo de puntos de ebullición entre sus componentes.
•
Cuando se necesite la solución simultánea de los equilibrios L-V y L-L, y exista entre los componentes un amplio intervalo de puntos de ebullición o de concentración.
UNIQUAC
Es capaz de representar los equilibrios L-V, L-L y L-L-V con exactitud comparable a la ecuación NRTL, pero sin necesidad del parámetro de aleatoriedad. Su principal ventaja es que se puede obtener una buena representación de los equilibrios L-V y L-L para una amplia variedad de mezclas de no electrolitos usando sólo dos parámetros por par binario. Parámetros que presentan muy poca dependencia con la temperatura, lo que la hace más válida para extrapolaciones.
Chien-Null
En realidad no se trata de un nuevo modelo, sino de un marco para aplicar los modelos de actividad existentes de un forma binario por binario. De esta forma, el modelo de Chien-Null permite seleccionar para cada par binario el modelo de actividad que mejor se ajuste, independientemente de los empleados en el resto de pares binarios. Una precaución a tener con los modelos de Wilson, NRTL y UNIQUAC son las dimensiones de los parámetros de interacción (cal/mol-g para el independiente de la temperatura, y cal/mol-g K para el dependiente de la temperatura) ya que en la bibliografía pueden tener dimensiones diferentes al tener integrada la constante universal de los gases R (por ejemplo, DECHEMA, Chemistry Data Series).
Ley de Henry
La ley de Henry no se puede seleccionar explícitamente como un método, aunque HYSYS la emplea cuando se selecciona un modelo de actividad y entre los componentes se encuentra un componente no condensable. HYSYS considera no condensables los siguientes componentes: metano, etano, etileno, acetileno, hidrógeno, helio, argón, nitrógeno, oxígeno, óxido nítrico, sulfuro de hidrógeno, dióxido de carbono, y monóxido de carbono. 91
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La ecuación extendida de Henry en HYSYS se usa para modelizar las interacciones soluto/disolvente en la región diluida. La ecuación tiene la siguiente forma: ln H ij = A +
B + C ln T + D T T
donde: i = soluto o componente no condensable j = disolvente o componente condensable Hij = coeficiente de Henry entre i y j en kPa T = temperatura absoluta A = coeficiente introducido en la matriz de parámetros como a ij B = coeficiente introducido en la matriz de parámetros como a ji C = coeficiente introducido en la matriz de parámetros como b ij D = coeficiente introducido en la matriz de parámetros como b ji Un ejemplo del uso de los coeficientes de la ley de Henry se muestra a continuación:
Si HYSYS no contiene los coeficientes necesarios y no están disponibles, los estimará. Para ello marcamos el par binario presionado el ratón sobre él, y a continuación se presiona sobre el botón “Individual Pair”. Los parámetros de obtienen ajustando las fugacidades calculadas usando las correlaciones de Chao-Seader y Prausnitz-Shair para la fugacidad en el estado estándar y disolución regular.
2.3. Métodos semiempíricos Los métodos de Chao-Seader (CS) y Grayson-Streed (GS) son métodos empíricos antiguos. La correlación GS es una extensión del método CS con énfasis especial en el hidrógeno. HYSYS solo obtienen los datos de equilibrio a partir de estos métodos, mientras que las entalpías y entropías se obtienen, tanto para la fase vapor como la fase líquida mediante el método de Lee-Kesler. 92
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La correlación GS se recomienda para simular sistemas de hidrocarburos pesados con alto contenido en hidrógeno, tales como unidades de hidrotratamiento. La siguiente tabla muestra los intervalos aproximados de aplicabilidad:
Método
Temperatura (ºC)
Presión (kPa)
CS
18 a 260
< 10 000
GS
18 a 425
< 20 000
Condiciones de aplicabilidad: Para todos los hidrocarburos excepto CH4
0.5 < Tri < 1.3 Prmezcla < 0.8
Si están presentes CH4 o H2
Tr < 0.93 Fracción molar CH4 < 0.3 Fracción molar de gases disueltos < 0.2
Cuando se predicen valores de K para: Mezclas de parafinas u olefinas
Mezclas de aromáticos
Fracción molar aromáticos en la líquida < 0.5
de fase
Fracción molar aromáticos en la líquida > 0.5
de fase
2.4. Métodos de presión de vapor Se pueden emplear para mezclas ideales a bajas presiones, tales como sistemas de hidrocarburos, cetonas o alcoholes donde las mezclas se comporten aproximadamente como ideales. Para el cálculo de entalpías y entropías se emplea el método de Lee-Kesler, excepto para el caso del agua que se trata separadamente mediante las tablas de vapor. En todos los cálculos en las tres fases se supone que la fase acuosa es agua pura, y que la solubilidad del agua en la fase hidrocarburo se puede describir usando la ecuación de solubilidad del queroseno del API Data Book. Los métodos disponibles son: Modificado de Antoine, Braun K10, y EssoK.
3. SELECCIÓN DE MÉTODOS DE PROPIEDADES En la siguiente tabla se muestran algunos sistemas típicos y las correlaciones recomendadas. Para aceites, gases, y aplicaciones petroquímicas se recomienda la ecuación de estado de Peng-Robinson (PR), ya que Hyprotech ha mejorado esta ecuación para ser exacta para una amplia variedad de sistemas y en un amplio intervalo de condiciones. Resuelve rigurosamente 93
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
sistemas de una, dos o tres fases con un alto grado de eficacia y fiabilidad, y es aplicable en un amplio intervalo de condiciones de presión (< 100 MPa) y temperatura (> -456 ºC). La misma ecuación predice satisfactoriamente la distribución de componentes tales como aceites pesados, disoluciones acuosas de glicoles y etanol, así como sistemas con gases ácidos o aguas ácidas, aunque existen modelos específicos para las aguas ácidas (Sour PR y Sour SRK). Aunque la ecuación de Soave-Redlich-Kwong (SRK) proporciona resultados comparables en muchos casos a la ecuación PR, se ha constatado que su intervalo de aplicación es significativamente más limitado, y nos es tan fiable para sistemas no ideales. Por ejemplo, (temperaturas > -225 ºC, y presiones < 35 MPa) y no se debe emplear para sistemas con etanol y glicoles.
Como una alternativa, la ecuación de estado de Peng-Robinson-Stryjek-Vera (PRSV)puede manejar los mismos sistemas que la ecuación PR con exactitud equivalente o mejor, y además es más adecuada el tratamiento de sistemas moderadamente no ideales, dondedesventajas rivaliza en exactitud con lospara métodos tradicionales de coeficientes de actividad. Las únicas son el aumento del tiempo de cálculo, y la necesidad de parámetros adicionales de interacción. Las ecuaciones de estado PR y PRSV realizan cálculos rigurosos de flash en tres fases para sistemas acuosos que contienen etanol, o glicoles, así como sistemas que contengan en la segunda fase otros hidrocarburos o no hidrocarburos. Para SRK el único componente que inicia una fase acuosa es el agua. Los modelos de Chao-Seader (CS) y Grayson-Streed (GS) 94
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
también se pueden emplear en cálculos de flash en tres fases pero están restringidos a usar agua pura en la segunda fase líquida. La ecuación PR también se puede emplear para sistema con crudo petrolífero, que tradicionalmente han sido tratados con modelos termodinámicos duales (coeficiente de actividad para la fase líquida, y ecuación de estado o comportamiento de gas ideal para la fase vapor). Las mejoras introducidas en las ecuaciones PR y SRK permite a estos métodos representar correctamente las condiciones de vacío y los componentes pesados (principal problema de los métodos de ecuaciones de estado tradicionales), así como manejar los ligeros y sistemas de alta presión. Los modelos de actividad, que manejan sistemas altamente no ideales, son de naturaleza mucho más empírica. Los sistemas polares o no ideales se han tratado tradicionalmente con modelos duales, en los que una ecuación de estado se usa para predecir los coeficientes de fugacidad en la fase vapor, y el modelo de coeficientes de actividad se usa en la fase líquida. Dado que los parámetros del modelo de coeficientes de actividad se determinan a partir de datos experimentales en un intervalo determinado, estos métodos no se pueden usar de una manera fiable para una aplicación generalizada. Aunque el campo de aplicación de los métodos CS y GS es restringido, es recomendable su utilización en algunos problemas que contengan principalmente agua en fase líquida o vapor, debido a que incluyen correlaciones especiales para representar de forma fidedigna las tablas de vapor. La correlación de Chao-Seader (CS) se puede emplear para mezclas de hidrocarburos ligeros, mientras que la de Grayson-Streed (GS) se recomienda para sistemas con alta concentración de Esta hidrógeno, debido al tratamiento especial al en hidrógeno en el desarrollo de este modelo. correlación puede ser ligeramente másdado exacta la simulación de torres de vacío. Los modelos K de presión de vapor, Antoine, Braun K10 y EssoK se han diseñado para manejar los sistemas de los hidrocarburos más pesados a bajas presiones. Estas ecuaciones se han aplicado tradicionalmente al fraccionamiento de los hidrocarburos más pesados, por lo que proporcionan un buen medio para la comparación con los métodos más rigurosos. Sin embargo, no se deben emplear para la predicción del equilibrio L-V en sistemas que operen a altas presiones o que contengan cantidades significativas de hidrocarburos ligeros. En la Tabla siguiente se presentan los métodos de propiedades empleados en HYSYS junto con los métodos disponibles para el cálculo del equilibrio L-V, y de entalpía/entropía.
95
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
96
I.
Termodinámic a y modelizac ión rigurosa de procesos
Modelos rigurosos de separaciones de equilibrio
Modelos rigurosos de separaciones de equilibrio
ÍNDICE 1. INTRODUCCIÓN............................................................................................................99 2. CÁLCULOS FLASH........................................................................................................ 99 2.1. Estrategias para cálculos flash ..................................................................................101 2.2. Secuencia TP para cálculos flash..............................................................................102 2.3. Método inside-out para cálculos flash ......................................................................102
3. PROCESOS POR ETAPAS ........................................................................................... 103 4. BIBLIOGRAFÍA ............................................................................................................106
1. INTRODUCCIÓN En este tema se estudiarán los modelos rigurosos de etapas de equilibrio, adecuados para su implementación en programas de ordenados dedicados a la simulación y diseño de procesos. Los modelos que se estudiarán están basados exclusivamente en las relaciones de equilibrio entre fases y en los balances de materia y energía. Esta aproximación simplifica mucho los cálculos, ya que sólo es necesario tener en cuenta las propiedades termodinámicas, sin que sea necesario considerar las propiedades de transporte. Además, los balances de materia y energía se pueden realizar sin conocer la capacidad y geometría de los equipos. Por otra parte, los modelos que se estudiarán están limitados a estado estacionario, sin que se consideren operaciones discontinuas, ni comportamiento dinámico de operaciones estacionarias. Se estudiarán dos tipos de cálculos: cálculos flash, y cálculos para procesos por etapas en contracorriente. Aunque estos cálculos se desarrollarán referidos a operaciones de destilación, pueden aplicarse también a otras operaciones unitarias muy frecuentes en la industria química, como absorción y extracción con disolventes.
2. CÁLCULOS FLASH Estos cálculos son al mismo tiempo los cálculos más básicos y los que se realizan más frecuentemente en los programas de simulación. La destilación flash, evaporación rápida o destilación en equilibrio, es una operación en una etapa, en la que una mezcla líquida se evapora parcialmente, de modo que resultan una fase líquida y una fase vapor en equilibrio, que se separan y extraen del equipo. De forma más general, un cálculo flash consiste en determinar el estado de un sistema después de una transformación física o química, por ejemplo la adición o retirada de calor, o cambios en la presión o composición del sistema. Consideremos el sistema representado en la Fig. 1. Asumiremos que la alimentación está completamente definida, de modo que se conoce su caudal, composición y entalpía. Si la alimentación contiene NC componentes, podremos escribir las siguientes ecuaciones: 99
Modelos rigurosos de separaciones de equilibrio
Fig. 1. Esquema de una unidad flash (Biegler y cols., 1977)
Balances de materia:
fi = vi + Li
i = 1,……., NC
[1]
Donde fi, vi y Li son los caudales molares del componente i en la alimentación, corriente vapor y corriente líquida, respectivamente. Relaciones de equilibrio: 0
γi fi xi = Φi P yi
i = 1,……., NC
[2] 0
Donde xi e yi son las fracciones molares en el líquido y vapor, respectivamente, f i es la fugacidad del componente puro, γi es el coeficiente de actividad, Φi el coeficiente de fugacidad, todas estas variables referidas al componente i, y P la presión total del sistema.
Balance de entalpía:
F Hf + Q = V Hv + L HL
[3]
Donde F, V y L son los flujos molares de alimentación, vapor y líquido, respectivamente, Hf, Hv y HL las respectivas entalpías molares, y Q el calor añadido o retirado del sistema.
100
Modelos rigurosos de separaciones de equilibrio
Disponemos, entonces, de un total de (2*NC + 1) ecuaciones. Las variables del sistema son las composiciones del líquido y del vapor, la P y T de las corrientes de salida y Q, en total (2 * NC + 3). Hay, por tanto, dos grados de libertad para especificar en este problema. Este modelo puede modificarse, de modo que sea más fácil de utilizar para los cálculos:
Balances de materia:
zi F = V yi + L xi
i = 1,……., NC
[4]
Donde zi, yi y xi son las fracciones molares del componente i en la alimentación, vapor y líquido, respectivamente.
Balance de entalpía:
F Hf + Q = V Hv + L HL
[5]
Expresiones de equilibrio:
yi = Ki xi
i = 1,……., NC
[6]
Donde Ki = γi fi0 / Φi P
i = 1,……., NC
[7]
De esta forma tenemos (3* NC + 5) variables (P, T, L, V, Q, y las fracciones molares en líquido y vapor, y K i para cada componente), y (3 * NC + 1) ecuaciones. Las dos ecuaciones adicionales más útiles para describir el sistema son:
F = L + V (balance total de materia)
[8]
Σ yi – Σ xi = 0
[9]
2.1. Estrategias para cálculos flash El modelo flash puede considerarse entonces formado por las ecuaciones 4 a 9, conservando el sistema 2 grados de libertad. Ciertamente, pueden darse muchas posibilidades respecto de las variables fijadas y las que se obtienen resolviendo el sistema. Para hacer frente a la gran variedad de problemas que pueden plantearse, se han desarrollado muchos sistemas de cálculo. De estas alternativas posibles, es muy común que los grados de libertad se escojan entre las variables V/F, Q, P y T. 101
Modelos rigurosos de separaciones de equilibrio
2.2. Secuencia TP para cálculosflash El caso más sencillo se presenta cuando los grados de libertad escogidos son P y T, ya que no requiere iteración para el balance de energía. La secuencia de cálculo sería la siguiente:
1. Fijados zi, especificar T y P. 2. Suponer un valor de V/F 3. Calcular los valores de Ki 4. Calcular xi e yi 5. Calcular (Σ yi – Σ xi); si es igual a 0, o a un valor dentro de la tolerancia aceptada, el problema está resuelto. En otro caso, continuar. 6. Proponer otro valor de V/F y continuar en 3.
Si dada la naturaleza del sistema las relaciones de equilibrio dependen de la concentración de las fases, es necesaria una estimación previa de x i e yi en el punto 1, que ha de ser comprobada después. Las especificaciones T y P son comunes para mezclas en la que todos los componentes tienen puntos de ebullición próximos, como las que se encuentran en destilación, para las que V/F varía entre 0 y 1 en un intervalo estrecho de temperatura. Cuando los componentes de la mezcla tienen puntos de ebullición muy distintos, como en los sistemas de absorción, pequeños cambios en V/F pueden provocar grandes cambios en T, y se suelen utilizar la especificaciones V/F, T o V/F, P. Cuando se especifica el calor intercambiado Q, es necesario resolver el balance de energía en el algoritmo de solución. Esto se puede hacer, por ejemplo, suponiendo una temperatura y resolviendo para esta temperatura el problema T, P. Una vez resuelto este problema, se resuelve el balance de energía y se comprueba si la temperatura supuesta es correcta, reiterando el proceso las veces necesarias.
2.3. Método inside-out para cálculos flash Los métodos indicados anteriormente presentan dos inconvenientes principales. En primer lugar, son adecuados bien para mezclas con intervalos de ebullición pequeños, o bien para mezclas con intervalos de puntos de ebullición amplios, pero no tienen aplicabilidad general. Por otra parte, necesitan evaluar frecuentemente funciones termodinámicas no ideales, especialmente cuando es necesario incorporar el balance de energía. Para hacer frente a estos problemas, Boston y Britt desarrollaron el método “inside-out” o dentro-fuera. En este método se utilizan dos bucles de cálculo. En el bucle externo se utilizan ecuaciones aproximadas para calcular valores de las constantes de equilibrio y las entalpías. Estos valores se utilizan para resolver las ecuaciones del proceso flash en un bucle interno. La solución del bucle interno se utiliza para revisar los valores de las propiedades termodinámicas del bucle externo, terminando el proceso cuando las propiedades termodinámicas aproximadas coinciden con el grado de exactitud requerido con las obtenidas por los métodos rigurosos. 102
Modelos rigurosos de separaciones de equilibrio
Por ejemplo, para resolver un problema con especificaciones P, Q, se pueden utilizar las siguientes ecuaciones para las propiedades termodinámicas:
Ki = αi Kb
[10]
Ln (Kb) = A + B (1/T – 1/T*)
[11]
H’v = C + D (T - T*)
[12]
H’L = E + F (T - T*)
[13]
donde H’v y H’L son las entalpías en base másica referidas a las temperatura T*, K b es un valor medio para la mezcla, y αi es la volatilidad relativa. Los valores de A, B, C, D, E, F y αi se ajustan con los resultados obtenidos suponiendo sistemas no ideales. Para la iteración en el bucle interno se puede utilizar la variable:
R = Kb / (Kb + L/V)
[14]
que es adecuada tanto para sistemas con puntos de ebullición próximos como dispares. La secuencia de cálculo sería la siguiente: 1. Iniciar valores de A, B, C, D, E, F y αi 2. Suponer R 3. Resolver el sistema de los bances de materia y suma 4. Resolver el balance de entalpía 5. Si el error en el balance de entalpía es mayor que el admitido, volver a 2. En caso contrario, ir a 6. 6. Con los resultados obtenidos, recalcular los valores de A, B, C, D, E, F y αi que ajusten a las propiedades termodinámicas del sistema, y volver a 2, hasta que el sistema converja.
3. PROCESOS POR ETAPAS Una columna de destilación, ejemplo típico de un proceso de separación de etapas de equilibrio, se puede modelizar como una cascada de etapas de equilibrio flash interconectadas. Los modelos se basan en la consideración de que se alcanza el equilibrio en 103
Modelos rigurosos de separaciones de equilibrio
cada plato, y en los balances de materia y energía entre platos. La Fig. 2 muestra un esquema de una columna de destilación típica, formada por NT platos, numerados desde la parte superior a la inferior y denotados por el subíndice j. En el sistema hay presentes NC componentes, denotados por el subíndice i. Cada plato contiene unas determinadas cantidades de líquido y vapor, en equilibrio, con composiciones x ij e yij, respectivamente. De cada plato sale una corriente de vapor Vj hacia el plato superior, y una corriente líquida Lj hacia el plato inferior. Cada plato puede recibir una alimentación (líquido, vapor, o ambos) Fj, de composición zij, y de él pueden retirarse corrientes de producto líquido PL j o vapor, PVj, así como retirar o añadir una cantidad de energía Q j. Dada la composición, presión y temperatura de cada corriente, se puede determinar su entalpía con los modelos termodinámicos adecuados.
Fig. 2. Esquema de una columna de destilación (Biegler y cols., 1977)
Las ecuaciones resultantes del modelo son las siguientes:
Balances de materia:
Fj zij + Lj-1 xi,j-1 + Vj+1 yi,j+1 –(PLj + Lj) xij – (Vj + PVj) yij = 0 i = 1, …….. NC
104
j = 1, …….. NT
[15]
Modelos rigurosos de separaciones de equilibrio
Relaciones de equilibrio:
yij = Kij xij i = 1, …….. NC
[16] j = 1, …….. NT
Ecuaciones de suma:
Σi xij = 1
Σi yij = 1
[17]
j = 1, …….. NT
Balances de energía:
Fj HFj + Lj-1 HL,j-1 + Vj+1 Hv,j+1 – (PLj + Lj) Hij – (Vj + PVj) Hvj + Qj = 0 j = 1, …….. NT
[18]
Este conjunto de ecuaciones se denomina ecuaciones de materia, equilibrio, suma y calor, en inglés Mass, Equilibrium, Summation and Heat (MESH). Para el condensador y el calderín estas ecuaciones se simplifican, al ser menor el número de corrientes sistema combinado consiste en [(NT + 2)(2 * NC + 3) + que 2] intervienen. ecuaciones, El y [(NT + 2)(2 * NC + 5) + 3] variables. Si se especifican el número de platos, y las localizaciones, caudal, composición y entalpía de las alimentaciones, quedan (NT + 1) grados de libertad. Una especificación típica para este problema sería la presión en cada plato, y la relación de reflujo. La resolución del problema requiere la resolución del sistema de ecuaciones MESH, para lo que se han propuesto decenas de sistemas. Uno de los sistemas más utilizados consiste en la aplicación del método de Newton-Raphson al conjunto de las ecuaciones MESH. También se aplican métodos inside-out, similares a los aplicados a separaciones flash, en los que en un primer paso se consideran valores de K y entalpías independientes de las concentraciones, a continuación se resuelven las ecuaciones MESH simplificadas resultantes, se comprueba la exactitud de la predicción de las variables termodinámicas, y se reitera el proceso hasta que se obtiene una solución satisfactoria.
105
Modelos rigurosos de separaciones de equilibrio
4. BIBLIOGRAFÍA
106
•
L. B. Biegler, I. E. Grossmann y A. W. Westerberg, “Systematic Methods of Chemical Process Design”, Prentice Hall, Upper Saddle River (N. J., EE.UU.), 1977.
•
R. H. Perry y D. W. Green, “Manual del Ingeniero Químico”, 7ª Ed., McGraw Hill,
•
Madrid, 2001. W.L McCabe, J.C. Smith, “Operaciones básicas de Ingeniería Química”, Ed. Reverté, Barcelona (1975).
I.
Termodinámic a y modelizac ión rigurosa de procesos
Modelos rigurosos de operaciones unitarias
Modelos rigurosos de operaciones unitarias
ÍNDICE 1. 2. 3. 4.
INTRODUCCIÓN....................................................................................................109 INTERCAMBIADOR DE CALOR (HEAT EXCHANGER) .............................. 110 SEPARADOR/SEPARADOR DE 3 FASES/TANQUE ......................................... 111 REACTORES QUÍMICOS ..................................................................................... 112 4.1. Reacciones en HYSYS ........................................................................................113 4.2. Reactor de conversión ......................................................................................... 115 4.3. CSTR. Reactor continuo de tanque agitado.........................................................116 4.4. Reactor de equilibrio ...........................................................................................117 4.5. Reactor de Gibbs ................................................................................................. 118 4.6. Reactor de flujo de pistón (PFR) ......................................................................... 118
1. INTRODUCCIÓN En este capítulo presentaremos un sumario de los modelos rigurosos de operaciones unitarias más complejas disponibles en HYSYS, que permiten resolver los balances de materia y energía sin necesidad de suponer un comportamiento ideal. El desarrollo de los balances de materia y energía es un componente básico en función del cual se tomarán decisiones durante las etapas de evaluación y diseño del proceso. El posible diagrama de flujo se considera como un conjunto muy elevado de ecuaciones no lineales que describen:
•
La interconexiones entre las distintas unidades del diagrama de flujo a través de las corrientes de proceso.
•
Las ecuaciones específicas de cada unidad, descritas mediante las leyes de conservación, así como las ecuaciones constitutivas de la unidad.
•
Los datos subyacentes y las expresiones que los relacionan con las propiedades físicas.
En este capítulo nos centraremos en los dos primeros apartados para presentar una representación detallada de las unidades de operación. El principal objetivo de este capítulo es alcanzar un mejor conocimiento del nivel de detalle de los modelos empleados en los simuladores comerciales, en concreto en HYSYS. En el capítulo anterior se han desarrollado los modelos rigurosos de las operaciones de separación de equilibrio, así como su resolución. Ahora trataremos con modelos de unidades menos detalladas, que incluyen operaciones de transferencia y intercambio llevadas cabo por bombas, compresores, cambiadores de calor, así como modelos para reactores químicos.
109
Modelos rigurosos de operaciones unitarias
2. INTERCAMBIADOR DE CALOR (HEAT EXCHANGER) Esta operación realiza un balance de materia y energía a ambos lados de la unidad. Es muy flexible, de manera que puede calcular temperaturas, presiones, flujos de calor flujos de materia o UA. Esta operación permite dividir la curva de calor a ambos lados del intercambiador en intervalos, de manera que en lugar de calcular la transferencia de energía en las condiciones terminales del cambiador, se calcula en cada uno de los intervalos, que posteriormente se suman para obtener la transferencia global. Los cálculos llevados a cabo en esta operación están basados en los balances de energía a los fluidos caliente y frío: (Mfrío (Hout-Hin)frío – Qfugas) – (Mcaliente (Hout-Hin)caliente – Qpérdidas) = Error balance donde:
M = flujo másico de fluido H = entalpía Qfugas = Pérdidas de calor por fugas en el fluido frío Qpérdidas = Pérdidas de calor en el fluido caliente
El error del balance, en la mayoría de las aplicaciones es cero. La corriente de energía del cambiador también se puede definir en términos del coeficiente global de transmisión de calor, el área disponible, y la diferencia media logarítmica: Q = UA ∆Tln Ft
∆Tln =
∆T1 − ∆T2
ln (∆T1 / ∆T2
)
∆Τ1 = Τcaliente,out – Tfrío,in ∆Τ2 = Τcaliente,in – Tfrío,out donde:
U = coeficiente global de transmisión de calor A = superficie disponible para la transmisión de calor
∆Tln = diferencia media logarítmica 110
Modelos rigurosos de operaciones unitarias
Ft = factor de corrección El coeficiente global de transmisión de calor se calcula a partir de la expresión:
U =
donde:
1
⎡1 Do ⎢ + ro + rw + Di ⎣ ho
⎛ 1 ⎞⎤ ⎜⎜ ri + ⎟⎟⎥ hi ⎠⎦ ⎝
ho, h i = coeficientes individuales de transmisión de calor el fluido en los tubos externo e interno, respectivamente. ro, ri = factor de ensuciamiento en los tubos exterior e interior, respectivamente. rw = resistencia de la pared del tubo. Do, Di = diámetros de los tubos externo e interno, respectivamente.
Para fluidos sin cambio de fase, los coeficientes individuales de transmisión de calor se calculan de acuerdo con la ecuación empírica de Sieder-Tate:
hi = 0.023
donde:
km Di
⎛ Di Gi ⎞ ⎜⎜ ⎟⎟ ⎝ µi ⎠
0.8
⎛ C p ,i µ i ⎞ ⎜⎜ ⎟⎟ ⎝ km ⎠
1/ 3
⎛ µi ⎞ ⎜ ⎟ ⎜µ ⎟ ⎝ i ,w ⎠
0.14
Gi = densidad de flujo másico del fluido en los tubos internos = velocidad densidad
×
µi = viscosidad del fluido en los tubos internos µi,w = viscosidad del fluido en los tubos internos, en la pared del tubo Cp,i = calor específico del fluido en los tubos internos km = conductividad térmica del fluido referida a las condiciones medias en la masa global
3. SEPARADOR/SEPARADOR DE 3 FASES/TANQUE •
•
•
Separador: dispone múltiples entradas, y una corriente de producto de salida vapor y otra líquida. El separador divide el contenido en la unidad en sus fases líquida y vapor en equilibrio. Separador de 3 fases: dispone de múltiples entradas y tres salidas, una vapor y dos líquidas. La operación divide el contenido de la operación es sus fases constituyentes vapor, líquida ligera y líquida pesada.
Tanque: dispone de múltiples entradas y una sola fase líquida de salida. Se utiliza para simular tanques de almacenamiento.
111
Modelos rigurosos de operaciones unitarias
Para determinar las condiciones y fases producto se realiza un flash P-H. La presión es la menor presión de alimentación menos la caída de presión a través del tanque. La entalpía es la entalpía combinada de las alimentaciones más o menos el intercambio de energía (duty): Hfeed ± Duty = Hvapor + Hpesada + Hligera El separador y el separador de 3 fases proporcionan un alto grado de flexibilidad en cuanto a la forma de resolver la operación. Además, de la aplicación estándar (alimentación a separar completamente definida, a la presión y entalpía del tanque), el separador puede también usar una composición conocida parade determinar la composición otra corriente producto, y por un balance de la producto composición la alimentación. Para usardeellaseparador para calcular hacia atrás se debe conocer:
•
La composición de un producto
•
La temperatura o presión de una corriente producto
•
Dos (para el separador) o 3 (para el separador de 3 fases) flujos
4. REACTORES QUÍMICOS Todos los reactores, excepto el PFR, comparten el mismo formulario, siendo las principales diferencias función del tipo de reacción (conversión, cinética, equilibrio).
Cada tipo específico de reactor solo admite un tipo particular de reacción, por ejemplo un reactor de conversión sólo admite reacciones de conversión (reacciones en las que la conversión está fijada). Existe una gran flexibilidad cuando se definen y agrupan reacciones, se puede:
•
112
Definir las reacciones dentro del Administrador Base (Basis Manager), agruparlas en un conjunto y después asociarlo al reactor.
Modelos rigurosos de operaciones unitarias
•
Crear reacciones en el Reaction Package en el diagrama de flujo principal, agruparlas en un conjunto y asociarlas al reactor.
•
Crear reacciones y conjuntos de reacciones en el Entorno Base (Basis Environment) y hacer cambios en Reaction Package del Entorno Principal (Main Environment).
No obstante, hay que tener cuidado con algunas sutilezas. Cuando se hacen cambios en las reacciones en el formulario del propio reactor, esos cambios solamente serán válidos en ese determinado reactor. Modificaciones en las reacciones en el Entorno Base o en Reaction Package se reflejan automáticamente en todos los reactores que usen ese conjunto de reacciones, siempre que no se hubieran hecho cambios locales.
4.1. Reacciones en HYSYS La siguiente figura muestra las relaciones que existen entre los distintos tipos de reacción en HYSYS y los diferentes reactores.
Reacciones y reactores en HYSYS
Reacciones en HYSYS
Conversión
Equilibrio
Gibbs
van’t Hoff
Reactores en HYSYS
Conversión
Gibbs
Equilibrio
CSTR
PFR
K vs. T K fixed
Cinéticas
Directa e inversa
Directa y K equilibrio
Catalíticas heterogéneas
24
4.1.1. Reacciones de conversión Se requiere:
•
Coeficientes estequiométricos
•
Conversión del componente base
•
NA = Nao (1 - X) 113
Modelos rigurosos de operaciones unitarias
•
Los moles de reactivos disponibles para conversión incluyen cualquier cantidad producida en otras reacciones y se calculan simultáneamente, excepto en las marcadas como secuenciales
•
Cuando hay reacciones competitivas
•
A + B→C B + D →E se puede usar el Rango para especificar qué valor de conversión se debe alcanzar antes (p.e. Si la reacción 1 tiene Rango 1, la conversión especificada para la reacción 2 solo se aplicará a la cantidad de B que quede después de haberse alcanzado la conversión 1).
4.1.2. Reacciones de equilibrio La constante de equilibrio se expresa: N
K = ∏ [([base] j )
νj
j =1
]
•
Reacciones de Gibbs: La constante de equilibrio se calcula a partir de la energía libre de Gibbs ideal
•
Van´t Hoff: Se supone que el ln K es solo una función de la temperatura:
•
ln K = A + B/T + C * T + D ln T
•
K vs. T: Se especifican datos de K a distintas temperaturas, que HYSYS ajustará a la
•
expresión anterior. K fijo, e independiente de la temperatura.
4.1.3. Reacciones cinéticas
•
Directa e inversa Se definen en función de los parámetros de la ecuación de Arrhenius para la reacción directa (y opcionalmente la inversa), los coeficientes estequiométricos, y los órdenes de reacción directos (e inversos): R
rA = k ∗ ∏ (base ) j =1
nj j
P
− (k '∗) ∏ base i =1
n 'i i
k = A ∗ exp(− E / RT ) k ' = A'∗ exp(− E ' / RT ) F A 0 = FA +
•
V
∫
rA dV = 0
Velocidad simple Similar a la anterior, excepto que la constante de velocidad de la reacción inversa se obtiene a partir de datos de equilibrio:
k ' = k / K eq 114
Modelos rigurosos de operaciones unitarias
4.1.4. Reacciones catalíticas heterogéneas
•
Involucran catalizadores sólidos
•
Adsorción y desorción de reactivos y productos
•
Reoxidación superficial Para una reacción del tipo: aA + bB → cC dependiendo del mecanismo de reacción, la velocidad de reacción puede ser:
Modelo de Langmuir-Hinshelwood:
r=
Modelo de Eley-Rideal:
r=
Modelo de Mars-van Krevelen:
r=
k + K A K B C AC B
(1 + K A C A + K B C B + K P C P )2 k + K B C AC B
(1 + K B C B + K P C P ) kK A 1 + (a )/ b( k / k) * C A C B n −
La forma general para introducir estos modelos en HYSYS es: R
P
i =1
j =1
β
k f ∏ C iα i − k r ∏ C j j r=
M γ ⎡ M ⎛ ⎞⎤ k g K ∏ =1 C g ⎢⎣1 + ∑ ⎜ ⎟⎠⎥⎦ ⎝ k =1
2
kg
donde Kf, kr y Kk se expresan en forma de ecuación de Arrhenius.
Existen 4 tipos de reactores que comparten el mismo formulario: CSTR, reactor de conversión, reactor de equilibrio, reactor de Gibbs. La página de Parámetros permite especificar la caída de presión, el volumen de reactor, y flujo de energía (duty). La presión se emplea en el cálculo de las reacciones, y el volumen del reactor es necesario para calcular el tiempo de residencia.
4.2. Reactor de conversión El reactor de conversión es un reactor en el que tienen lugar reacciones de conversión fija. Cada reacción prosigue hasta que se alcanza la conversión especificada o hasta que se agote un reactivo limitante.
115
Modelos rigurosos de operaciones unitarias
En la página de reacciones se tiene que asociar un conjunto de reacciones (Reaction Set) al reactor y especificar la conversión para cada reacción del conjunto. El conjunto de reacciones solo puede contener reacciones de conversión.
4.3. CSTR. Reactor continuo de tanque agitado El CSTR es un reactor en el que tiene lugar una reacción cinética, de manera que la conversión depende de las velocidades de reacción.
116
Modelos rigurosos de operaciones unitarias
Las corrientes de entrada se suponen instantánea y perfectamente mezcladas con el contenido del reactor, de manera que la composición de la corriente de salida es idéntica a la del contenido del reactor. Dado un volumen de reactor, una constante de velocidad de reacción y la estequiometría de cada reacción, se calcula la conversión de cada componente que entra al reactor.
4.4. Reactor de equilibrio En este reactor solo pueden tener lugar reacciones de equilibrio, de manera que las corrientes de salida se encuentran en equilibrio físico y químico. Dado que HYSYS calcula la actividad de cada componente en la mezcla a partir de las fugacidades de los componentes puros, ni el proceso de mezcla ni los componentes tienen que ser ideales. La constante de equilibrio se calcula a la temperatura del reactor mediante la expresión: ln K = A +
B + C T + D ln T T
donde T es la temperatura absoluta, y A, B, C, D son constantes. N
K = ∏ [([Base] j )
νj
]
j =1
donde:
K = constante de equilibrio [Base]j = base para el componente j (concentración, presión parcial, etc.)
νj = coeficiente estequiométrico para el componente j N = número de componentes
117
Modelos rigurosos de operaciones unitarias
4.5. Reactor de Gibbs Calcula las composiciones de salida de tal forma que a la salida del reactor se alcanza el equilibrio químico y entre fases. Sin embargo, no necesita utilizar una estequiometría específica para la reacción, ya que la composición de la mezcla de salida se calcula minimizando la energía libre de Gibbs (condición de equilibrio). Al igual que el reactor de equilibrio no necesita suponer comportamiento ideal ni los componentes puros ni la mezcla. En la página de composición se pueden ver los flujos de las corrientes de alimentación y productos en base molar. En este formulario se puede fijar algunos componentes como inerte de manera que se excluyen de los cálculos de minimización de la energía libre de Gibbs. Se puede especificar la velocidad de producción de cualquier componente como una restricción a la composición de equilibrio.
El flujo de producto se calcula basado en los valores fijados en la Frac. Spec. y Fixed Spec. como: Total Prod = FracSpec × Total Feed + FixedSpec
4.6. Reactor de flujo de pistón (PFR) Generalmente consiste en una bancada de tubos cilíndricos. El flujo de modeliza como flujo de pistón, por lo que no existen gradientes radiales de materia ni energía, lo que implica que la mezcla radial es despreciable. Conforme los reactivos avanzan a lo largo del reactor son continuamente consumidos, por lo que existe una variación axial de concentración y temperatura. Para obtener la solución del PFR (perfiles axiales de composición, temperatura, etc.) se divide el reactor varios subvolúmenes. cada unoEnde balance estos subvolúmenes se considera velocidad de en reacción espacialmente En uniforme. molar a cada subvolumen j es:
F jo − F j +
∫ r dV = V
j
dN j dt
Dado que se considera velocidad de reacción uniforme en cada subvolumen, el tercer término se reduce a rj V. En estado estacionario, el lado derecho de la ecuación es cero, de manera que la ecuación se reduce a: 118
Modelos rigurosos de operaciones unitarias
F jo = F j + r jV La página de Parámetros está divida en tres partes, relacionadas con los cálculos de la caída de presión, la transmisión de calor, y también para decidir si la operación se incluye en los cálculos. La caída de presión en el reactor se puede especificar directamente, o se puede calcular mediante la ecuación de Ergum: 3 ϕ D ∆P g c s 2p ε = 150(1 − ε ) + 1.75 L ρ V 1− ε Vρ / µ
donde:
∆P = caída de presión a través del reactor gc = factor de proporcionalidad de la ley de Newton para las unidades de la fuerza gravitacional L = longitud del reactor
ϕs = esfericidad de la partícula Dp = diámetro de la partícula
ρ = densidad del fluido V = velocidad superficial o velocidad del fluido con la torre vacía
ε = porosidad µ = viscosidad del fluido En la sección de transmisión de calor hay que indicar si se especifica directamente el intercambio de energía, o lo calcula HYSYS a partir de datos que se deben especificar en la página de transmisión de calor. La página de Transmisión de Calor (Heat Transfer) cambia dependiendo de la selección indicada anteriormente. Cuando se ha seleccionado anteriormente “Direct Q Value” aparece un cuadro de dialogo en el que hay que indicar el nombre de la corriente de energía, el valor del flujo de calor, y si es preciso calentar o enfriar.
Cuando se ha seleccionado la opción fórmula, HYSYS calculará rigurosamente el flujo de calor en cada subvolumen usando coeficientes locales de transmisión de calor para el interior y exterior de los tubos usando las siguientes fórmulas:
119
Modelos rigurosos de operaciones unitarias
Q j = U j A Tbulkj − Toutj 1 1 1 = + U hout hw donde:
Qj = flujo de calor en el subvolumen j Uj = coeficiente global de transmisión de calor en el subvolumen j A = área superficial del tubo PFR Tbulkj = temperatura global del fluido Toutj = temperatura en el exterior del tubo PFR (fluido de utilidad) hout = coeficiente local para la transmisión de calor en el exterior (fluido de utilidad) hw = coeficiente local para la transmisión de calor en el interior del tubo
En los cálculos se desprecia la resistencia de la pared del tubo a la transmisión de calor. En cada subvolumen, el calor se transmite radialmente del fluido del PFR al fluido de utilidad. Los dos grupos de cuadros de dialogo que aparecen nos permiten especificar los valores necesarios para evaluar la transmisión de calor.
La ecuación usada para determinar la temperatura del fluido de utilidad en cada subvolumen es:
Q j = mρC p Tout , j − Tout , j +1 y los parámetros que aparecen en el cuadro de dialogo “Heat Medium Side Heat Transfer Infos Group” son: Wall Heat Transfer Coefficient = h out Mole flow = m Heat capacity = Cp 120
Modelos rigurosos de operaciones unitarias
Inlet temperatura = temperatura del fluido de utilidad a la entrada del PFR Calculated duty = Qj En el cuadro de dialogo “Tube Side Heat Transfer Info Group” se puede especificar directamente el valor del coeficiente local de transmisión de calor, hw, que se puede calcular a través de una ecuación empírica:
hw = A flujo B debiéndose asignar valores a las constantes A y B, o bien escogiendo la opción estándar se calcula a partir de ecuación:
N u = A Re B Pr C hw =
Nu k g Dp
En la página de Reacciones, hay que asociar un conjunto de reacciones al PFR. Los tipos de reacciones permitidas son cinéticas, catalíticas heterogéneas, o simples. También deberemos especificar el número de segmentos en que se desea dividir el reactor. La fracción mínima en que se dividirá un segmento (Minimum Step Fraction), y la longitud de paso mínima (Minimum Step Length) que es el producto de la longitud del reactor por la fracción de paso mínima.
Durante el cálculo de cada segmento, HYSYS intentará obtener una solución a lo largo de toda la longitud del segmento. Si la solución no converge, el segmento se divide en dos partes, y HYSYS intentará de nuevo obtener una solución en la primera mitad del segmento dividido. El segmento se seguirá subdividiendo en mitades hasta que se alcanza una solución, en cuyo caso se calculará la porción restante del segmento. Si el segmento se divide hasta un punto en que su longitud es menor que la longitud de paso mínima, entonces se interrumpen los cálculos. 121
Modelos rigurosos de operaciones unitarias
Si se ha especificado una porosidad menor que 1 aparece el cuadro del grupo de datos de catalizador, en el que hay que proporcionar la siguiente información:
•
Diámetro de la partícula de catalizador, D p
•
Esfericidad de la partícula, ϕs, definida como el área superficial de la esfera con el mismo volumen que la partícula dividido por el área de la partícula.
•
Densidad del sólido, ρs, incluyendo el espacio poroso de la partícula (microporosidad).
•
Densidad, ρb, definida como: ρb = ρs(1-εm), siendo εm la microporosidad.
•
Capacidad calorífica del sólido
En la pestañas “ Worksheet” y “Performance” se nos presentan los resultados de la simulación en diferentes formas.
122
Modelos rigurosos de operaciones unitarias
123
II. Simulac ión de procesos en la indus tria químic a y de procesos: HYSYS
Modos de simulación de procesos
Modos de simulación de procesos
ÍNDICE 1. INTRODUCCIÓN....................................................................................................127 2. MODOS DE SIMULACIÓN ...................................................................................130 2.1. Modo modular .....................................................................................................133 2.2. Modo orientado a ecuaciones ..............................................................................135
1. INTRODUCCIÓN Los simuladores de procesos actuales se pueden clasificar en los siguientes tipos según la estructura bajo la cual se plantea el modelo matemático que representa el proceso a simular:
-simuladores globales u orientados a ecuaciones -simuladores modulares secuenciales -simuladores híbridos o modular secuencial-simultáneo Bajo el enfoque de la simulación global u orientada a ecuaciones, se plantea el modelo matemático que representa al proceso (unidad, corrientes de interconexión, y algunas veces modelos termodinámicos) construyendo un gran sistema de ecuaciones algebraicas que representa a todo el conjunto o planta a simular y que se resuelve simultáneamente. De esta forma el problema se traduce en resolver un gran sistema de ecuaciones algebraicas, por lo general altamente no lineales. Como ejemplo puede citarse que en problemas típicos de simulación de columnas de destilación por métodos rigurosos el sistema de ecuaciones puede llegar a contener más de mil variables. De ello se desprende la magnitud del sistema que represente el modelo de una planta completa típica. En la década del 70, cuando se generan los primeros simuladores, no existían los medios apropiados (principalmente hardware) para la resolución numérica de sistemas de ecuaciones de gran dimensión. Es por ello que los primeros simuladores comerciales adoptaron principalmente la arquitectura modular secuencial, en detrimento de la global. El principal problema asociado a la filosofía de resolución global u orientada a ecuaciones es la convergencia del sistema y la consistencia de las soluciones que se encuentran. En efecto, los sistemas altamente no lineales como los que corresponden a modelos de plantas químicas pueden, por ejemplo, producir múltiples soluciones (un ejemplo es el caso de los reactores adiabáticos con reacciones exotérmicas). Además, la solución numérica para grandes sistemas exige inicializaciones apropiadas, es decir próximas a un entorno de la solución, de lo contrario pueden presentarse serios problemas de convergencia. Históricamente, estas dificultades han sido la causa que ha limitado el desarrollo de este tipo de simuladores en forma masiva. Una de las críticas fundamentales para la operabilidad de los mismos que se realizaba a menudo por parte de usuarios no entrenados, era la imposibilidad de identificar los sectores de la planta en correspondencia con el sistema de ecuaciones que lo representa, dado que una vez que el sistema total se ha ensamblado, éste esta integrado y se pierde la correspondencia biunívoca entre el equipo y el subsistema de ecuaciones que lo representa. De esta manera, si existieran inconvenientes durante la simulación, resulta difícil 127
Modos de simulación de procesos
asignar el problema a un sector específico de la planta, o bien inicializar convenientemente. Las principales características (virtudes y defectos históricamente remarcados) se resumen a continuación: •
Cada equipo se representa por las ecuaciones que lo modelizan. El modelo es la integración de todos los subsistemas.
•
Desaparece la distinción entre variables de proceso y parámetros operativos, por lo tanto se simplifican los problemas de diseño.
•
Resolución resultante. simultánea del sistema de ecuaciones algebraicas (no lineales)
•
Mayor velocidad de convergencia.
•
Necesita una mejor inicialización (mejor cuanto mayor sea el problema a resolver).
•
A mayor complejidad, menor fiabilidad en los resultados y más problemas de convergencia (soluciones sin sentido físico).
•
Más difícil de usar por "no especialistas".
Una ventaja importante es que puede lograrse una velocidad de convergencia mayor que en los simuladores modulares secuenciales. Además, dado que el sistema se plantea orientado a ecuaciones, es posible incorporar fácilmente las expresiones de restricción para definir problemas de optimización en forma directa, ya que basta solo con plantear las restricciones y la función de optimización. Esta flexibilidad es imposible en los simuladores modulares secuenciales, debido a que los módulos están orientados y definidos en forma rígida; esto es, resulta imposible agregar restricciones y/o variables, además de la expresión analítica de la función de optimización. Los simuladores modulares secuencia/es se basan, en módulos de simulación independientes que siguen aproximadamente la misma filosofía que las operaciones unitarias, es decir, cada equipo: bomba, válvula, intercambiadores, etc.; se modeliza a través de modelos específicos para los mismos y además, el sentido de la información coincide con el "flujo físico" en la planta. Esta estructura tiene como ventaja el hecho de que cada sistema de ecuaciones se resuelve con una metodología que resulta adecuada para el mismo, ya que es posible analizar bajo todas las circunstancias posibles, el comportamiento del método de resolución propuesto, esto es sistemas ideales, no ideales, topologías diversas del equipo, distintas variantes, etc. Dado que se puede analizar específicamente la rendimiento de los distintos métodos de resolución es factible lograr un modelo robusto y eficiente para cada módulo específico. El enfoque en la teoría modular secuencial, por definición, supone que se conocen (especifican} las variables de las corrientes de entrada, o sea las alimentaciones a los equipos, mientras que deben calcularse las corrientes de salida y los correspondientes parámetros de operacióndesi encontrar correspondiera. Esto impone ciertaminimicen rigidez que según sea el caso, la posibilidad asignaciones tales que el sacrifica, tiempo de cálculo (secuencias acíclicas de resolución del sistema de ecuaciones asociado). Sin embargo esto resulta conveniente desde otro punto de vista, ya que de esta manera se impone una dirección al flujo de información entre módulos. Por otra parte, las combinaciones posibles de especificación de variables son enormes, incrementándose de forma drástica la cantidad de módulos a disponer si se quisiera cubrir todas las posibilidades. Por ejemplo, en los intercambiadores de calor en contracorriente si se suponen conocidas las corrientes de entrada, (esto es, la presión, la temperatura, la composición y el estado de fase, 128
Modos de simulación de procesos
vapor, líquido o mezcla- ); dado que para calcular las corrientes de salida el sistema de ecuaciones correspondientes queda determinado sólo cuando se asignan ciertos parámetros de equipo, será necesario que el usuario los asigne como datos. Una opción simplificada de cálculo implica la necesidad de fijar como parámetros de equipo el factor UA, (producto del coeficiente global de transferencia y el área de intercambio). En general, fijada la orientación en el cálculo (esto es, dadas las entradas calcular las salidas del equipo), lograr que el sistema de ecuaciones sea compatible y tenga tantas incógnitas como ecuaciones no implica necesariamente una única opción, ya que debemos analizar las variables o parámetros de operación del equipo. En efecto, en la mayoría de los casos existirán varias combinaciones de valores posibles, es decir, existirán varias posibilidades de asignación de parámetros de equipos. Además, existen variantes para cada módulo que tienen en cuenta varios factores, como puede ser la topología, -por ejemplo, el número de entradas y salidas a una torre de destilación, o si hay condensadores parciales o totales-, o bien el nivel de las hipótesis realizadas (si se considera hidráulica de platos o no, pérdidas de calor al ambiente, etc.). Resumiendo, en un simulador modular se define cada módulo por un sistema de ecuaciones independiente que se resuelve de la manera óptima, subordinados sin embargo a las limitaciones que ha impuesto la especificación de variables seleccionada. Esto implica una ventaja en el sentido que se podrían utilizar progresivamente distintos niveles de cálculo dependiendo de la etapa del proyecto en la que se realiza la simulación, o bien en función de los datos disponibles hasta el momento, aprovechando el conocimiento que proviene de la experiencia y análisis del método de convergencia para cada caso en particular. No obstante, uno de los problemas que se srcinan es la conexión de los módulos según el proceso a simular y las rigideces que ello impone. En la década de los 70 se desarrollaron métodos avanzados para la descomposición y resolución de diagramas de flujo modulares, conduciendo al desarrollo de simuladores modulares simultáneos. En este tipo de simuladores aunque los modelos de las unidades permanecen intactos, la resolución de las corrientes del diagrama de flujo se llevan a cabo de una forma global o simultánea, en lugar de secuencial. Además, se incorporaron algoritmos y modelos más generales (tales como tratamiento de sólidos) junto con métodos numéricos más sofisticados. Este desarrollo fue motivado por el proyecto ASPEN en el Instituto de Tecnología de Massachussets (MIT). En las décadas de los 80 y 90, se desarrolló de forma considerable el modo de simulación orientado a ecuaciones, especialmente para modelización y optimización en línea. Además, los nuevos conceptos de ingeniería informática condujeron a interfases amigables e incluso a algoritmos más potentes. Finalmente, el espectacular desarrollo de los ordenadores personales contribuyó a la rápida extensión de la simulación. Actualmente, los simuladores modulares más importantes incluyen ASPEN PLUS de Aspen Technology Inc., HYSYS de Hyprotech Ltd. (actualmente Aspen Technology), PRO/II de Simulations Sciences Inc., y CHEMCAD de Chemstations. Simuladores orientados a ecuaciones incluyen SPEEDUP de Aspen Technology Inc., así como una serie de programas para la modelización y optimización en tiempo real.
129
Modos de simulación de procesos
2. MODOS DE SIMULACIÓN Para facilitar una descripción más clara de las estrategias de simulación de proceso, vamos a presentar un ejemplo sencillo de un diagrama de flujo. Consideremos el diagrama de flujo de la figura, que corresponde a un diagrama de flujo propuesto por Williams y Otto como un proceso químico típico.
n ió c la it s e d e d a n m u l o C
Decantador
Reactor
Cambiador de calor
Recirculación
Aze ótr op o (P=10% E)
(Combustible)
Las corrientes de alimentación de los componentes puros A y B se mezclan con una corriente de reciclo y entran a un reactor continuo de tanque agitado, donde tienen lugar las siguientes reacciones: A+ B→C C+B→P+E P+C→G Aquí C es un producto intermedio, P es el producto principal, E es un subproducto, y G es un residuo tipo aceite. Tanto C como E se pueden vender debido a su valor como combustibles, mientras que G se debe tratar como un residuo y por tanto con un coste. La planta consta de un reactor, un cambiador de calor para enfriar el efluente de salida del reactor, un decantador para separar el residuo G de los reactivos y productos, y una columna de destilación para separar el producto deseado P. Debido a la formación de un azeótropo, parte del producto (equivalente al 10 % en peso del flujo de componente E) queda retenido en la corriente de colas de la columna. La mayoría del producto de colas se recicla al reactor, y el resto se usa como combustible. El modelo de la planta se puede definir sin el balance de energía, de manera que se va a simplificar el problema considerando reacciones isotérmicas. El resto de unidades también se simplificarán para no complicar en exceso el ejemplo y emplearlo solo con fines ilustrativos. La información topológica para el diagrama de flujo se muestra en la siguiente tabla.
130
Modos de simulación de procesos
Unidad
Tipo
Entrada F1, F2, FR
Salida
1
Reactor
2
Intercambiador F eff
Feff Fex
3
Decantador
Fex
Fd, Fwaste
4
Columna
Fd
Fprod, Fbottom
5
Divisor
Fbottom
Fpurge, FR
Vamos a considerar ahora los modelos de las unidades en el orden en que se ejecutan en el diagrama de flujo. Todos los flujos se expresan en forma de flujos másicos.
Modelo para el reactor Las composiciones de los distintos componentes en le reactor se obtienen a partir de las cinéticas. Por simplicidad supondremos reactor isotérmico (con temperatura prefijada en 674 ºR). Las ecuaciones para este reactor vienen dadas por: A A A Feff = F1 + FR − (k 1 X A X B )Vρ B B B Feff = F2 + FR − (k 1 X A + k 2 X c )X B Vρ c C = FR + (2 k 1 X A X B − 2 k 2 X B X C − k 3 X p X C )Vρ Feff
F E = F E + (2 k X X eff
R
2
B
)Vρ C
P P = FR + (k 2 X B X C − 0.5k 3 X p X C )Vρ Feff
XJ =
j Feff
(F
A eff
B eff
C eff
F +F j = A, B, C, E, G, P +
+
E P G Feff + Feff + Feff )
Con constantes de velocidad de reacción dadas por:
k1
= 5.9755 ⋅ 10
k2
=
k3
= 9.6283 ⋅ 10
9
exp(− 12000 / T )h −1 ( fracción en peso) −1
2.5962 ⋅ 10 12 exp(− 15000 / T )h −1 ( fracción en peso) −1 15
exp(− 20000 / T )h −1 ( fracción en peso) −1
Siendo Xj la fracción en peso del componente j, V el volumen del reactor, T su temperatura, y ρ la densidad de la mezcla.
Modelo para el intercambiador de calor Dado que no es necesario el balance de energía, las ecuaciones para esta unidad son simplemente que las salidas son iguales a las entradas: j Fexj = Feff
j = A, B, C, E, G , P
131
Modos de simulación de procesos
Decantador Esta unidad supone separación perfecta entre el componente G y el resto de componentes, de manera que las ecuaciones son: Fdj = Fexj
j = A, B, C, E, P
G d
F =0 G G Fwaste = Fex j =0 Fwaste
j = A, B, C, E, P
Columna de destilación Esta unidad supone una separación de componente P puro por cabezas, pero supone que una parte del producto P se pierde por colas junto el resto de componentes debido a la formación de un azeótropo con el componente E, conduciendo a las ecuaciones: j j Fbottom = Fd
j = A, B, C, E
j =0 Fprod P bottom
F
=
j = A, B, C, E E d
0.1F
P P E Fprod = Fd − 0.1Fd
Divisor de flujo Las ecuaciones para esta unidad son: j j Fpurgue = ηFbottom j R
j bottom
F = (1 − η) F
j = A, B, C, E, P j = A, B, C, E, P
A pesar de las simplificaciones del modelo del proceso, tenemos 58 variables y 54 ecuaciones. También, obsérvese que el sistema no se puede resolver secuencialmente debido a la corriente de reciclo, y a la necesidad de resolver las ecuaciones del reactor simultáneamente. En concreto, el sistema tiene 4 grados de libertad, y las especificaciones para estas variables conducen a diferentes problemas simulación. Por ejemplo, si especificamos flujos F 1de y η, entonces F2, el volumen del reactor V, y ladefracción de división tenemos unlosproblema evaluación de funcionamiento que trata con un proceso o diseño ya existente. Esto se considera la entrada normal al proceso dado que la secuencia de cálculo sigue el flujo de materia en el mismo. Por otra parte, si especificamos 4 flujos de salida P A B E ( F prod ) estamos ante un problema de diseño y se necesita calcular las , F purge , F purge , F purge entradas a partir de estas especificaciones. Intuitivamente, se puede ver que la resolución del problema de evaluación es más simple que el de diseño. En efecto, para algunos valores de las especificaciones de diseño podría no haber solución. Sin embargo, los dos tipos de problemas 132
Modos de simulación de procesos
necesitan ser considerados en las herramientas de simulación. Con esta descripción del proceso Williams-Otto, vamos a considerar las estrategias de resolución de los modos modular y orientado a ecuaciones.
2.1. Modo modular En este tipo de modo, las unidades de proceso están encapsuladas como procedimientos, donde las corrientes de salida (y otra información calculada) se evalúa a partir de las corrientes de entradas y los parámetros de diseño. Estos procedimientos se resuelven de una manera secuencial, que a grandes rasgos sigue de forma paralela al flujo de materia en el proceso. Los simuladores están construidos de una manera jerárquica con tres niveles, como se muestra en la figura. Topología del diagrama de flujo
Modelos de operaciones unitarias
Modelos de propiedades físicas
El nivel superior se encarga de la topología del diagrama de flujo, siendo su tarea principal ordenar la secuencia de los módulos de las unidades, inicializar el diagrama de flujo, identificar los bucles de reciclo (particionado), seccionarlas corrientes, y asegurar la convergencia de estas corrientes en los balances globales de materia y energía. El nivel intermedio se encarga de los procedimientos de las operaciones unitarias, y representa la biblioteca de modelos de unidades, cada una resuelta con un procedimiento especializado. Las entradas desde el nivel superior incluyen las corrientes de entrada y parámetros de cada unidad, y las salidas de unidad (corrientes y parámetros) se retroalimentan al nivel superior una vez calculada la unidad. La biblioteca de unidades incluye separadores, reactores y unidades de transferencia. Finalmente, el nivel más bajo trata con los modelos de propiedades físicas. Esto incluye los modelos termodinámicos para el equilibrio entre fases, entalpías, entropías, densidades, etc. Este nivel es llamado frecuentemente por los procedimientos de las operaciones unitarias, y también por el nivel superior para la inicialización del diagrama de flujo y el cálculo de corrientes. En cada nivel, una tarea clave es la resolución de un sistema de ecuaciones no lineales que puede representar los cálculos del equilibrio entre fases, que involucran modelos termodinámicos no ideales; también los balances de materia y energía que representan los modelos de las operaciones unitarias acoplados a estas relaciones termodinámicas. La 133
Modos de simulación de procesos
resolución de estos sistemas requiere un proceso iterativo que no está al alcance de la resolución manual o de herramientas de hojas de cálculo. Además, la topología del diagrama de flujo o los reciclos tratan con la descomposición estructural del diagrama de flujo y la secuenciación de las unidades, donde es preciso identificar los bucles de reciclo y las corrientes de seccionado. Una vez identificados, los valores de las corrientes se determinan mediante un proceso iterativo.
2.1.1. Resolución del proceso Williams-Otto en modo modular En el modo modular agrupamos las ecuaciones del proceso dentro de cada unidad y ejecutamos estas unidades en secuencia. La primera tarea consiste en identificar las corrientes que rompen todos los bucles de reciclo (particionado). Dado que el diagrama de flujo tiene solo un reciclo, cualquiera de las corrientes en el reciclo se puede usar como corriente de seccionado. Escogemos como corriente de seccionado la corriente de entrada al reactor y consideramos el proceso como se muestra en la figura.
Ahora resolveremos las unidades de acuerdo con la tabla de topología que hemos mostrado anteriormente (reactor, cambiador, decantador, columna de destilación, divisor) donde las corrientes de salida de cada unidad se calculan a partir de las entradas. Para cada módulo, necesitamos estar seguros que están especificadas todas las entradas. Especificamos los flujos de alimentación F1 y F2, el volumen del reactor, y la fracción de purga del divisor de flujo. Entonces, inicializamos el problema suponiendo un valor para el flujo de la corriente de reciclo FR y evaluamos un valor calculado para esta corriente. La ejecución secuencial de las unidades, comenzando por el reactor, nos permite obtener la corriente de entrada en cada unidad. El problema de convergencia viene dado por la ecuación de punto fijo: FR = g(FR) Donde g(FR) se encuentra implícitamente después de la ejecución de la secuencia de unidades. El valor de FR se determina después de varios pasos por el diagrama de flujo mediante un proceso iterativo. Estos pasos iterativos son los procesos dominantes en la simulación, de manera que el algoritmo de convergencia del reciclo determina la eficacia de la simulación. La resolución este diagrama de flujo en el nivel superior es sencillo si se supone que todas las corrientes de salida se pueden determinar rápidamente dentro de cada unidad. Para este 134
Modos de simulación de procesos
proceso se requiere un esquema de resolución iterativa robusto para las ecuaciones del reactor. La estructura de este diagrama de flujo es un simple y único bucle de reciclo, pero frecuentemente nos encontramos con topologías mucho más complejas, donde la determinación de buenas corrientes de seccionado está lejos de ser trivial.
2.2. Modo orientado a ecuaciones En el modo orientado a ecuaciones se combinan las ecuaciones de la topología del diagrama de flujo (por ejemplo, las corrientes de conexión) con las ecuaciones de las unidades (y si es posible, con las ecuaciones de las propiedades físicas) en un gran sistema de ecuaciones. Esta estructura permite mucha más flexibilidad al especificar las variables independientes como parámetros y resolver para las restantes. Además, la solución de este sistema de ecuaciones se lleva a cabo por un algoritmo general de resolución de ecuaciones no lineales. En casi todos los casos se emplea el método de Newton-Raphson. En la figura se muestra la estructura de la simulación orientada a ecuaciones, donde se puede ver que los modelos de propiedades físicas, dado su número y naturaleza no lineal, se mantiene como un procedimiento independiente, y se mantiene separado de las ecuaciones de las operaciones unitarias y de conexión. Topología del diagrama de flujo Operaciones unitarias
Modelos de propiedades físicas
En el modo modular, estábamos interesados en sacar provecho de la topología del diagrama de flujo mediante el seccionado de corrientes y de los procedimientos especializados para la resolución de las operaciones unitarias. Por el contrario, con la simulación orientada a ecuaciones aplicamos directamente estrategias de resolución simultánea en gran escala a las ecuaciones para todo el diagrama de flujo. Estos grandes sistemas de ecuaciones tienen una estructura dispersa, en el sentido de que solamente una pequeña fracción del número total de variables participan en una ecuación dada. Debido a su estructura, los simuladores orientados a ecuaciones tienden a converger mucho más rápido que los modulares. Sin embargo, los simuladores modulares son mucho más fáciles de inicializar debido a que ejecutan las unidades de proceso en secuencia de acuerdo con la estructura del diagrama de flujo. Los simuladores orientados a ecuaciones no tienen esquemas de inicialización análogos, de manera que se requiere un considerable esfuerzo para inicializar estos problemas (esencialmente, se necesitan agrupar las ecuaciones en una estructura modular).
135
Modos de simulación de procesos
Aplicando al proceso Williams-Otto el modo orientado a ecuaciones, combinamos todas las ecuaciones del proceso y las resolvemos simultáneamente. Como ya hemos visto, las ecuaciones del diagrama de flujo son: A A A = (F1 + FR ) − (k 1 X A X B )Vρ Feff B B B = (F2 + FR ) − (k 1 X A + k 2 X c )X B Vρ Feff c C = FR + (2 k 1 X A X B − 2 k 2 X B X C − k 3 X p X C )Vρ Feff E = Feff FRE + (2 k 2 X B X C )Vρ
P P Feff = FR + (k 2 X B X C − 0.5k 3 X p X C )Vρ
XJ =
j Feff
(F
A eff
+
B C E P G Feff + Feff + Feff + Feff + Feff
j Fexj = Feff j d
)
j = A, B, C, E, G, P
j = A, B, C, E, G, P
j ex
F =F
j = A, B, C, E, P
FdG = 0 G G = Fex Fwaste j =0 Fwaste j bottom
F
=
j = A, B, C, E, P j d
F
j = A, B, C, E
j Fprod =0 P bottom
F
=
j = A, B, C, E E d
0.1F
P P E = Fd − 0.1Fd Fprod j j Fpurgue = ηFbottom j R
j bottom
F = (1 − η) F
j = A, B, C, E, P j = A, B, C, E, P
La estructura de estas ecuaciones tiene un fuerte impacto en la eficacia del proceso de resolución. En particular, obsérvese que muy pocas variables aparecen en una ecuación dada (normalmente, dos o tres), de manera que esta dispersión debe ser aprovechada. Dado que la estructura del problema se explota al nivel de ecuaciones, hay un gran campo de acción para especificar los cuatro grados de libertad. También, las ecuaciones de este ejemplo se pueden simplificar considerablemente. Por ejemplo, como se ve en el modelo, las ecuaciones y variables correspondientes al intercambiador de calor y decantador se pueden eliminar de forma trivial.
136
II. Simulac ión de procesos en la indus tria químic a y de procesos: HYSYS
Métodos de resolución de ecuaciones no lineales I: métodos tipo Newton
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
ÍNDICE 1. INTRODUCCIÓN....................................................................................................139 2. MÉTODOS TIPO NEWTON .................................................................................. 140 3. FUNCIONES ACOTADAS Y DERIVADAS ..........................................................141 3.1. Funciones acotadas y derivadas...........................................................................141 3.2. la solución .....................................................................................142 3.3. Proximidad Singularidadadel Jacobiano. Modificación del paso del método de Newton.......145 3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano ............148
4. BIBLIOGRAFÍA ...................................................................................................... 148
1. INTRODUCCIÓN La resolución de ecuaciones algebraicas no lineales es la tarea principal en la simulación de procesos en estado estacionario. Para ambos modos, modular y orientado a ecuaciones, hay que resolver las ecuaciones obtenidas a partir de las operaciones unitarias, las propiedades físicas y la topología derivada de los diagramas de flujo. Los problemas se pueden plantear en un formato estándar: resolver f(x) formato denominado de punto fijo, es decir: x = g(x).
= 0, o bien en el
Ambas formas son equivalentes, y los métodos que se describen a continuación se pueden aplicar a ambos formatos, ya que
f(x) = x – g(x)= 0 o bien:
x = x + h(f(x)) = g(x). donde h es cualquier función siempre que h(y) = 0 si y solo si y = 0. De hecho el formato de punto fijo es más sencillo de operar cuando se requiere la convergencia de corrientes de recirculación trabajando en modo modular. Este tema corresponde a la descripción de los métodos tipo Newton utilizando el formato estándar. El método de Newton-Raphson es el más utilizado en la resolución de ecuaciones no lineales. yEnselautiliza simulación de procesos el algoritmo esencial para elde modo orientado a ecuaciones a menudo para la esresolución de las ecuaciones las operaciones unitarias, en particular para los modelos de separación detallados. También se verán métodos quasi-Newton o Broyden. En el tema siguiente se abordarán los métodos de punto fijo de primer orden . A diferencia de los de Newton, no requieren información de las derivadas de las ecuaciones, pero convergen más lentamente. Se utilizan en convergencia de recirculaciones y en otros procedimientos de cálculo cuando las derivadas son difíciles de obtener. 139
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
2. MÉTODOS TIPO NEWTON Considérese el problema en su forma estándar f(x) = 0, donde x es un vector de n variables reales y f() es un vector de n funciones reales. Si se establece una estimación de las variables en un punto dado, x´, se puede realizar una expansión en serie de Taylor para extrapolar alrededor del punto de resolución (x*):
f i ( x*) ≡ 0 = f i ( x ' ) + ∂f i ( x ' ) / ∂x T ( x * − x ' ) + 1 / 2( x * − x ' ) T ∂ 2 f i ( x ' ) / ∂x 2 ( x * − x ' ) + .... i = 1,...n o bien: f i ( x*) ≡ 0 = f i ( x ' ) + ∇f i ( x ' ) T ( x * − x ' ) + 1 / 2( x * − x ' ) T ∇ 2 f i ( x ' )( x * − x ' ) + .... i = 1,...n donde ∇f i ( x ) y ∇ 2 f i ( x ) son el vector gradiente y la matriz Hessiana de la función f(x), respectivamente. Si se trunca la serie (sólo dos primeros términos), se tiene:
f ( x '+)p ≡ 0 =( ) f (x) ' + J x ' p Donde se ha definido el vector p = (x* - x’) como dirección de búsqueda y la matriz J con elementos ∂f {J }ij = i
∂x j para la fila i y la columna j de la matriz J. Esta matriz se denomina Jacobiano. Si J no es singular, se puede resolver directamente para obtener p, con una aproximación lineal a la solución de las ecuaciones no lineales: p = −(J ( x '))(
−1
)f
x'
Esto permite una estrategia recursiva para encontrar el vector solución x*
p k = −(J k)
( f )x
−1
x k +1 = x k + p k
k
0
Siendo x la primera estimación, k el contador de iteraciones y J k ≡ J ( x)k . La estrategia recursiva se puede formalizar en el siguiente algoritmo básico para el método de Newton:
Algoritmo 0
0. Suponer x , k = 0 1. Calcular f(xk), Jk k k -1 k 2. Calcular p = -(J ) f(x ) k+1
3. Establecer x
k
=x +p
k k T
k
k
4. Comprobar convergencia: Si f(x ) f(x ) ≤ ε1 y p ≤ ε2, terminar (ε1 y ε2 son valores próximos a cero) 5. En caso de no convergencia, k = k+1, volver al paso 1
140
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
El método de Newton tiene algunas propiedades de convergencia muy adecuadas. En particular, tiene una rápida velocidad de convergencia cerca de la solución. De manera más precisa, el método de Newton converge a una velocidad cuadrática dada por la expresión:
xk − x * x k −1 − x * donde x
2
≤K
(xTx)1/2 es la norma Euclídea que define la longitud de un vector x determinado.
Una forma de interpretar esta relación es considerar que si K = 1 y se tiene un decimal de -1 precisión para xk , es decir ||xk-1 – x*|| = 0.1, entonces, en la siguiente iteración se tendrán dos dígitos de precisión, cuatro, ocho, y así sucesivamente. Por otro lado, esta convergencia tan rápida solamente tiene lugar si el método funciona adecuadamente. El método puede fallar en problemas de simulación complicados. Las condiciones suficientes de manera cualitativa para la convergencia del algoritmo de Newton son:
•
Las funciones f(x) y J(x) existen y están acotadas para cualquier valor de x
•
La suposición inicial x0, debe de estar cerca de la solución real.
•
La matriz J(x) no debe de ser singular para ningún valor de x.
3. FUNCIONES ACOTADAS Y DERIVADAS 3.1. Funciones acotadas y derivadas Mediante un análisis detallado, se pueden evitar los casos en los que las funciones resultan divididas por cero, o bien no tienen valores posibles, como es el caso del logaritmo de un número negativo. Además se pueden especificar nuevas variables añadiendo también nuevas ecuaciones. En los dos ejemplos siguientes se detallan estas consideraciones:
Ejemplo 1: Para resolver f(t) = 10 – e3/t = 0, se observa que para valores de t próximos a cero, el término exponencial aumenta de valor muy rápidamente, así como la derivada de la función, -3e 3/t. Si se define una nueva variable x = 3/ t, y se añade la ecuación xt –3 = 0, se tienen mayor número de ecuaciones a resolver, pero en este caso las funciones están perfectamente acotadas, de modo que se debería de resolver el sistema:
f1(x) = 10 – ex = 0 f2(x) = xt – 3 = 0 siendo la matriz jacobiana:
⎡− e x
0⎤
⎣ t
x⎦
J(x) = ⎢
⎥
141
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton Hay que destacar que tanto ambas funciones f1 y f2 como J tienen valores acotados y definidos para valores finitos de x, sin embargo J puede llegar a ser singular para determinados valores de x y t.
Ejemplo 2: Para la función f(x) = ln x – 5 = 0, la función no tiene soluciones válidas para valores negativos de x. Este problema se puede reformular introduciendo una nueva variable y una nueva ecuación. Se define x2 = ln x1 o bien f1 = x1 – exp(x2) = 0. El sistema de ecuaciones que resulta es:
f1 = x1 – exp(x2) = 0 f2 = x 2 – 5 = 0 siendo la matriz jacobiana:
⎡1 − e x ⎤ ⎥ 1 ⎦ ⎣0 2
J(x) = ⎢
De nuevo en este caso ambas funciones y las derivadas tienen valores acotados.
3.2. Proximidad a la solución En general, asegurar un punto de partida próximo a la solución no es práctico, de tal modo que normalmente se comienza por una estimación lejana, o arbitraria, y lo que importa es el control de acercamiento, esto es, el paso de aproximación del método de Newton para asegurar que se progresa hacia la solución. Con este objetivo, el paso de acercamiento se modifica, de tal modo que el para nuevo punto es solamente una fracción del paso máximo que predice el método de Newton cada iteración.
x k +1 = x k + αp k k
siendo un número entre 0 y 1, y p el paso en la dirección predicha por la iteración del método de Newton. Si = 1 el paso a dar es el predicho por el método de Newton. Para evaluar automáticamente se ha de llevar a cabo un método que proporcione una convergencia adecuada. Para ello se define una función objetivo a minimizar:
φ( x ) = 1 / 2 f ( x ) T f ( x ) Utilizando α para calcular el nuevo punto se tiene: x k +1 = x k + αp k realizando una expansión de Taylor de la función objetivo (x) se tiene:
φ( x k +1 ) = φ( x k ) + αdφ / dα + α 2 / 2d 2 φ / dα 2 + ... o bien:
φ( x k +1 ) = φ( x k ) + ∇φ( x k )T (αp k ) + α 2 / 2 p kT ∇ 2φ( x k ) p k + ...
Definimos nuevamente J
k
{J ( x )}
J k ≡ J(xk ) a partir de donde se obtiene la derivada de 142
k
ij
(x):
=
∂f i ∂x j
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
∇φ( x k ) T = f ( x k ) T J k y el paso del método de Newton:
p k = −(J ( x k)) Multiplicando la derivada de
( )f
−1
xk
(x) por pk y sustituyendo el valor del intervalo se llega a :
∇φ( x k ) T p k = −( f ( x k ) T J k ( J k ) −1 f ( x k )) = − f ( x k ) T f ( x k ) = −2φ( x k ) < 0 Y si → 0, en la expansión de Taylor tenemos:
φ( x k +1 ) − φ( x k ) ≈ −2αφ( x k ) < 0 Para un suficientemente pequeño, el paso de la iteración del método de Newton hace que (x) disminuya. Esta propiedad permite crear un algoritmo y mejorar la estimación de (x). Se podría minimizar entonces la función (xk + pk) y encontrar un valor de α óptimo. Este proceso, no obstante, resulta excesivo debido a la gran cantidad de cálculos a realizar y la posible dirección cambiante, sobre todo en las últimas iteraciones. En lugar de esta opción, se k elegirá un paso de iteración α que proporciona suficiente disminución de la función (x). Esta aproximación se conoce como la búsqueda de la línea de Armijo, y se ilustra en la fig. 1. Comenzando en el srcen, se observa la pendiente negativa incluso cuando α = 0, y también k k se observa que hay un valor del paso de iteración para el cual (x + p ) es mínimo. En vez de una minimización directa de α, se define como condición suficiente para reducir el valor k k de la función, cuando (x + p ) está por debajo de la cuerda de Armijo, esto es:
φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k ) siendo δ la fracción de la pendiente (normalmente comprendida entre 0 y ½) que define esta cuerda. De esta manera se asegura que hay una disminución satisfactoria de (x) que es al menos una fracción, , de la velocidad de disminución en el punto presente, xk.
Fig. 1. Esquema para la búsqueda de la línea de Armijo (Biegler et al., 1997)
143
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Si esta relación se satisface para un valor suficientemente alto de α, se toma este paso como válido. En caso contrario, se considera el caso de la figura 1 donde α = 1. En este caso el k k valor de (x + p ) se encuentra por encima de la cuerda de Armijo, en consecuencia, no hay reducción de la función (xk), por lo que hay que elegir un paso de iteración más pequeño. Hay que procurar también que este paso no sea demasiado pequeño (en el intervalo, por ejemplo, comprendido entre j y u), de otro modo, los movimientos en la dirección x tenderán a cero antes de que la función converja. Para lograr este propósito se hace una interpolación cuadrática para , definiendo una función de interpolación q( ) basada en tres k k k parámetros: el valor de (x) en un punto base, x , en el nuevo punto de iteración, x + p , y k la pendiente en el punto base, ∂ q(0)/ ∂ =-2 φ( x ). La minimización de q( ) se puede hacer analíticamente, de modo que se llega a un valor de ( denominado q) que normalmente se encuentra dentro del intervalo antes mencionado. Basándose en estas propiedades, se describe a continuación el algoritmo de búsqueda de la línea de Armijo, ello requiere sustituir el paso 3 del algoritmo de Newton detallado en el apartado 2.
MÉTODO DE BÚSQUEDA DE LA LÍNEA DE ARMIJO a.
Hacer
=1
b.
Evaluar φ( x k + αp k )
c.
Si
φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k ) , el intervalo es el correcto. Hacer
k +1
x = x k + αp k e ir al paso 4 en el algoritmo de Newton. En caso contrario continuar con el paso d. d.
Hacer hacer =
=max{ ,
q},
donde α q = αφ( x k ) α q =
αφ( x k ) (2α − 1)φ( x k ) + φ( x k + αp k )
y volver al paso b.
Típicamente, = = 0.1. Este procedimiento proporciona robustez y confianza al método de Newton, especialmente si el valor inicial está lejos de la solución real. Sin embargo, si no se encuentra la longitud del paso después de 5 iteraciones por este algoritmo, la dirección del k método de Newton, p puede ser no adecuada debido al mal planteamiento del problema (por ejemplo, porque J(xk) sea casi singular). Ello llevaría al fracaso del método de búsqueda, recomendándose en este caso la inspección de las ecuaciones del problema. En el caso k extremo de que J(x ) sea singular, entonces no existiría el paso del método de Newton y el algoritmo de Newton no se podría aplicar. En este caso se pueden adoptar las estrategias para resolver el problema que se detallan a continuación.
Ejemplo: Sea la función : f ( x ) = 0.05 x 4 − 3 La derivada de la función será
df ( x ) dx
= 0.2 x 3
Y de acuerdo con el método de Newton, el siguiente punto se obtendrá mediante la expresión:
144
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
x k +1 =
f (xk ) df ( x ) dx k
De este modo se pueden calcular los nuevos valores de x mediante un número de iteraciones que se muestran en la siguiente tabla, que implican el valor de la función, la derivada, y el nuevo valor calculado.
k 0 1 2 3 4 5 6 7
x 10 7.515 5.672 4.336 3.436 2.947 2.796 2.783
f(x) 497 156.473 48.736 14.672 3.969 0.770 0.057 0.000
df(x) 200 84.882 36.488 16.303 8.113 5.118 4.373 4.312
xk+1 7.515 5.672 4.336 3.436 2.947 2.796 2.783 2.783
Este mismo proceso de iteración que se describe numéricamente en la tabla, se muestra gráficamente en la siguiente figura:
3.3. Singularidad del Jacobiano. Modificación del paso del método de Newton Si el Jacobiano es singular o casi singular, en cuyo caso el problema está mal planteado, el paso del método de Newton es casi ortogonal a la dirección del gradiente máximo para la función (x). La dirección del gradiente máximo está definida como - (x) y, para un paso pequeño, el gradiente da la máxima reducción para la función (x). Como resultado, se podría considerar el gradiente máximo en vez de la dirección de Newton, cuando la dirección de Newton no es la adecuada. El gradiente máximo viene dado por la siguiente expresión:
p sd = −∇φ( x k ) = J ( x k ) T f ( x k ) Este paso tiene la propiedad de ser el gradiente máximo, pero solamente una velocidad lineal de convergencia que viene definida por: 145
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
x k − x * < x k −1 − x * Una ventaja de los métodos del gradiente máximo es que siempre que
p sd = − J ( x k ) T f ( x k ) ≠ 0 se tendrá un nuevo punto más cerca de la solución, incluso si la matriz J es singular. Sin embargo, este método puede ser muy lento. Un método de compromiso para llegar a la solución es combinar métodos de gradiente máximo y de de”estas estrategias el método Levenberg-Marquardt el método de la Newton. “pata deDos perro de Powell. En son el primero se de combinan ambos pasos yy se resuelve el siguiente sistema lineal de ecuaciones para encontrar la dirección de avance.
(J ( x
) J ( x k ) + λI ) p k = − J ( x k ) T f ( x k )
k T
siendo λ un escalar positivo que ajusta la dirección y la longitud del paso. Para λ = 0 se obtiene directamente el método de Newton.
p k = −(J ( x k ) T J ( x k ) ) J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k ) −1
En el otro extremo, si se aproxima a :
k T
se hace grande, y domina sobre J(x
) J(xk), el sistema de ecuaciones
−1
p k = −(λI ) J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k ) / λ que es el paso del método del gradiente máximo, con un tamaño de paso muy pequeño. Valores intermedios de dan direcciones de avance que están comprendidas entre el arco definido por el gradiente máximo y el paso de Newton, tal y como se muestra en la figura 2a. Una desventaja del método de Levenberg-Marquardt es la necesidad de resolver un sistema de ecuaciones lineales cada vez que se cambia . Esto puede resultar costoso, ya que el algoritmo puede necesitar varios cálculos de antes de tener el paso de iteración apropiado. En vez de esto se considera un algoritmo que combina el método de Newton y el del gradiente máximo y elige una dirección de avance entre los das métodos automáticamente. Este método denominado “pata de perro” se ilustra en la figura 2b y fue desarrollado por Powell. Este método utiliza un paso que es combinación lineal del paso del método de Newton y el del gradiente máximo. Si el paso calculado es menor que el del gradiente máximo, se tomará este último como paso de la iteración. Para desarrollar este método se necesita primero encontrar la longitud adecuada (dado por un escalar ) en la dirección del gradiente máximo.
p sd = J T f ( x k ) Se considera de entonces la minimización de una linealización las ecuaciones en la dirección del función gradientecuadrática máximo. que se construye de la
Minβ 1 / 2( f ( x k ) +( β)Jp sd
T
f) ( x k ) + β Jp sd
Sustituyendo la definición dada para el método del gradiente máximo:
β = [ f ( x k )[T JJ T] f ( x k ) / f ( x]k ) T J ( J T J ) J T f ( x k ) = p sd
146
2
/ Jp sd
2
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Fig. 2a. Método Levenberg-Marquardt (Biegler et al., 1997)
Fig. 2b. Método “pata de perro” de Powell (Biegler et al., 1997)
sd
El paso p se conoce como paso de Cauchy. Se puede demostrar que la longitud de este paso N -1 nunca es superior a la longitud del paso de Newton: p = -J f(xk). Para una fracción de longitud de paso deseada γ, se puede calcular la dirección de avance para el método “pata de perro” de Powell. Si se desea ajustar la fracción de la longitud γ automáticamente, la dirección de avance, p, se puede determinar de la siguiente manera: Para γ ≤ β p sd , p = γp sd / p sd Para γ ≥ p N , p = p N Para p N > γ > β p sd , p = ηp N + (1 − η)β p sd siendo η = γ − β p sd / p N − β p sd Si la fracción de la longitud de paso γ es pequeña, se elige la dirección del gradiente máximo; si es grande, se elige el paso de Newton. Para valores de γ entre los pasos de Newton y Cauchy, se elige una combinación lineal de estos pasos, como se ha mostrado en la figura 2. Como esta aproximación se necesitan solamente dos direcciones predeterminadas y cálculos sencillos para la determinación del tamaño del paso, y es más rápido que el método de Levenberg-Marquardt. Incluso en los casos en los que el jacobiano está mal condicionado, y consiguientemente el paso de Newton se hace demasiado largo, este método sencillamente se autorregula considerando pasos de Cauchy con fracciones de longitud γ. Finalmente, debe mencionarse que las aproximaciones de ambos métodos se agrupan en una clase general de algoritmos denominada métodos de la región de confianza. Para estos problemas, la fracción de la longitud del paso γ corresponde al tamaño de la región alrededor k del punto x en la que la aproximación cuadrática de p (basado en una linealización de f(x), esto es ½(f(xk + J p)T (f(xk) + J p)) es una representación apropiada de (x). Una minimización aproximada de este modelo cuadrático necesita el ajuste bien de λ, bien de η para cada iteración en los métodos de Levenberg-Marquardt o de Powell, respectivamente.
147
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Mientras que los métodos de la región de confianza pueden ser más costosos que la estrategia de la búsqueda de la línea de Armijo, poseen una mayor capacidad de convergencia, particularmente para aquellos problemas con problemas de condicionamiento inicial.
3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano Para jacobianos singulares o mal condicionados de partida, se pueden tener en cuenta los métodos de continuación. Estos métodos, a diferencia de los métodos de la región de confianza, no se resuelven forzando la función f(x) a cero. En su lugar, se evalúa la función para un valor inicial f(x0) y se resuelve un problema incluso más simple, por ejemplo f(x) –0.9 f(x0) = 0. Se espera que este planteamiento no precise un cambio excesivo para x, de tal modo que el método de resolución (por ejemplo, Newton) no tenga dificultades a la hora de resolverlo. Si se llega a solucionar el problema modificado con 0.9, se reduce este parámetro de continuación a 0.8 y se repite la resolución del problema. Finalmente, reduciendo el parámetro a 0, se logra resolver el problema srcinal. Con esta aproximación hay que tener en cuenta dos aspectos:
•
La rapidez en la reducción del parámetro de continuación
•
El coste de este método en comparación con los vistos previamente.
El uso de un parámetro fijo es una forma algebraica del método de continuación. Existen diferentes modificaciones al método que incluyen por ejemplo, alternar el parámetro de continuación con una variable, en el momento en el que se detecta un jacobiano singular. La sustitución de este parámetro puede dar lugar a un jacobiano no singular, de tal modo que se incrementa la posibilidad de éxito en problemas más difíciles, aunque no sin un aumento del coste computacional.
4. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
148
II. Simulac ión de procesos en la indus tria químic a y de procesos: HYSYS
Métodos de resolución de ecuaciones no lineales II: métodos que no requieren derivadas
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
ÍNDICE 1. 2. 3. 4.
INTRODUCCIÓN....................................................................................................151 MÉTODO DE LA SECANTE .................................................................................151 MÉTODO DE BROYDEN. CASO MULTIVARIABLE....................................... 152 MÉTODOS DE PRIMER ORDEN ......................................................................... 155
5. MÉTODOS DE SUSTITUCIÓN DIRECTA.......................................................... 156 6. MÉTODOS DE RELAJACIÓN.............................................................................. 157 6.1. Método del valor propio dominante (DEM)........................................................157 6.2. Método de Wegstein ............................................................................................158
7. BIBLIOGRAFÍA ...................................................................................................... 161
1. INTRODUCCIÓN Los métodos considerados hasta ahora requieren el cálculo del jacobiano en cada iteración. Este proceso es probablemente el que más tiempo de cálculo consume para algunos problemas, especialmente si hay procedimientos no lineales anidados. Una alternativa sencilla al cálculo exacto de las derivadas es la aproximación por el uso de diferencias finitas, dado de manera genérica por:
⎛ ∂f ⎞ f (x k + he) j (−) f x k ⎜ ⎟ ⎜ ∂x ⎟ = h ⎝ j ⎠x k
en donde cada elemento i del vector ej viene dado por (e j)i = 0 si i ≠ j o (e j)i = 1 si i = j, y h es -6 -3 un escalar cuyo valor normalmente se encuentra entre 10 y 10 . Esta aproximación requiere una evaluación/iteración de n funciones adicionales. Por otro lado, se pueden considerar los métodos Quasi-Newton donde el jacobiano se aproxima mediante diferencias de x y de f(x) obtenidas de iteraciones previas.
2. MÉTODO DE LA SECANTE En el caso de los métodos Quasi-Newton, hay una fuerte motivación para evitar la evaluación (y descomposición) del jacobiano. El fundamento de estos métodos se puede comprender considerando una única ecuación con una única variable, tal y como se muestra en la Fig. 1:
151
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
f( x)
xc xd
xb
xa
x
Fig. 1. Comparación del método de Newton y el de la secante para una única ecuación (adaptado de Biegler et al., 1997) a Si se aplica el método de Newton al sistema comenzando desde x , se obtiene un nuevo punto xc a partir de la tangente a la curva en el punto xa, como se muestra en la Fig. 1, que responde a la relación:
Paso de Newton: x c = x a − f ( x a ) / f ' ( x a ) Donde f’ (x) es la pendiente. Si no se dispone de esta derivada, se puede realizar una a b aproximación mediante diferencias entre dos puntos, por ejemplo, x y x . En la Fig. 1, el d nuevo punto calculado sería x resultado de prolongar la secante entre los puntos xa y xb. La d expresión para obtener x sería:
⎡
⎤ b a ⎥ ⎣ f (x ) − f (x )⎦
Paso de secante: x d = x a − f ( x a ) ⎢
xb − xa
Incluso se puede definir una relación general para la secante, de tal modo que para un escalar B, se tiene:
B( x b − x a ) = f ( x b ) − f ( x a ) x d = x a − B −1 f ( x a ) ya que f(xd) = 0 El método de la secante se recomienda en simulación de procesos para especificaciones generadas por el usuario dentro del diagrama de flujo y resuelve una especificación de cada vez. Este método es adecuado si la función a resolver es discontinua y no monotónica, o bien plana, en un determinado intervalo.
3. MÉTODO DE BROYDEN. CASO MULTIVARIABLE En el caso multivariable, se necesitan considerar condiciones adicionales para obtener el paso mediante la secante. En este caso se define una matriz B que sustituye al jacobiano y que satisface la relación de la secante, de tal modo que:
B k +1 ( x k +1 − x k ) = f ( x k +1 ) − f ( x k ) 152
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
y suponiendo que f(x
k+1
k
) ≈ 0, B se puede emplear para calcular el cambio en x:
x k +1 = x k − (B) k
( f )x
−1
k
Sin embargo, para el caso multivariable, la secante no es suficiente para definir B. En este caso, dada una matriz Bk, se calcula el menor cambio para Bk+1 respecto de Bk que satisface la ecuación de la secante. Este es un problema de minimización con restricciones que se puede formular del siguiente modo: k +1
Min B
k
−B
F
sujeto a la restricción:
B k +1 s = y siendo:
y = f (x k +1) −( f) x k s = x k +1 − x k y ||B||F es la norma de Frobenius dada por la expresión:
[∑ ∑ B ] i
1/ 2
ij
j
Este problema se puede plantear y resolver más fácilmente con variables escalares. Sean bij tales que:
bij = B k
, bij = B k +1
ij
ij
e yi, y si los elementos de los vectores y y s, respectivamente. Entonces se tiene: Min
∑ ∑ (b j
j
= yi
− bij )
2
ij
i
sujeto a:
∑b s ij
i = 1,...n
j
Se pretende encontrar los mejores valores de bij que componen los elementos de la nueva matriz Bk+1. Este es un problema de optimización estrictamente convexo que tiene un mínimo único. Construyendo la función de Lagrange correspondiente:
L=
∑ ∑ (b
ij
i
− bij ) + 2
j
∑
⎛
i
λ i ⎜⎜
i
∑b s ij
⎞
j
j
⎝
− y i ⎟⎟
⎠
Las condiciones estacionarias de dicha función son:
∂L para encontrar
i
∂bij
= 2(bij − bij ) + λ i s j = 0
⇒
bij = bij − λ i s j / 2
se aplica la relación de la secante de nuevo:
yi =
∑b s = ∑b s ij
j
j
ij
j
j
−
λi 2
∑s
2 j
153
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
λi 2 Sustituyendo ahora
i/2
=
∑b s − y ∑s ij
j
i
2 j
en la condición estacionaria para bij y escribiendo en notación
matricial se llega a la fórmula de Broyden:
( y − B s )s k
B k +1 = B k +
T
T
s s
Mediante esta relación se puede calcular la nueva dirección de avance mediante la resolución del sistema lineal de ecuaciones:
B k +1 p k +1 = − f (x k +1 ) k+1
Sin embargo, también se puede calcular p de manera explicita mediante la actualización de la inversa de Bk+1 mediante una modificación de la fórmula de Broyden. Para este caso, se aplica la fórmula de Sheman-Morrison-Woodbury para una matriz cuadrada A con un conjunto actualizado de vectores x y v:
(A + xv )
T −1
= A −1 −
A −1 xv T A −1 1 + v T A−1 x
como la matriz xvT tiene solo un valor propio (eigenvalor) positivo, tiene un rango igual a T uno, denominándose la relación (A + xv ) una actualización de A de rango uno. Si se tiene en cuenta que:
A + xv T = B k +1
= Bk
x = y − B k s / sT s k
v=s
k -1
simplificando se tendrá que si H = (B )
(s − H y )s k
H k +1 = H k +
T
T
Hk
k
s H y
El algoritmo completo de Broyden se puede establecer de la siguiente manera:
1. Suponer x0 y B0 (por ejemplo = J0 o I) y calcular H0 ( por ejemplo (J0)-1) 2. Si k = 0, ir al paso 3, si no, calcular f(x k), y = f(x k) – f(x k-1), s = x k – x k-1 y Hk o Bk 3. Calcular la dirección de avance como pk = Hk f(x k) o resolviendo Bkpk = -f(x k) k
k
4. si ||p ||≤ ε1 y || f(x )||≤ ε2 detener el proceso, si no, encontrar un paso α y actualizar las k+1
k
k
variables de modo que x = x +α p 5. Establecer k = k+1. Ir al paso 2
El método de Broyden se ha utilizado ampliamente en la simulación de procesos, especialmente cuando el número de ecuaciones es relativamente pequeño. Por ejemplo, este método se usa para cálculos flash por el método “ inside-out” y para convergencia de recirculaciones en diagramas de flujo. Las fórmulas actualizadas de rango uno para el método 154
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
de Broyden que aproximan el jacobiano aseguran convergencia rápida. De hecho, el método converge de manera superlineal de acuerdo con la expresión: lim
k →∞
x k +1 − x * xk − x *
→0
que es más lento que el método de Newton, pero significativamente más rápido que el del gradiente máximo. Por otro lado, tanto Hk como Bk son generalmente matrices densas, aunque recientes estudios han considerado la utilización de fórmulas de actualización que se benefician de estructuras menos densas. Además, también es posible que ambas matrices puedan estar mal condicionadas inicialmente (independientemente) a través de las actualizaciones de rango uno. Para evita esto, se puede emplear un proceso de actualización más estable mediante factores de descomposición de la matriz Bk. En particular, las fórmulas de actualización de k Broyden se han desarrollado para los factores LU o los factores QR de B . Finalmente, no hay garantía de que el método de Broyden produzca una dirección de descenso de la función. Como resultado, la inecuación de Armijo puede no satisfacerse incluso aunque se apliquen métodos de búsqueda de línea. Sin embargo, muchas implementaciones en ingeniería de procesos utilizan simplemente los pasos completos de Broyden, a no ser que los residuos aumenten mucho su valor. El método de Broyden es muy útil en la convergencia de bucles de recirculación, cuando se especifican una o más especificaciones de diseño o cuando se tienen ambos requerimientos simultáneamente. La aplicación del método de Broyden puede romper el comportamiento oscilatorio que a veces se observa en la convergencia, tal y como se muestra en la Fig. 2.
Fig. 2. Oscilación en la convergencia
4. MÉTODOS DE PRIMER ORDEN Estos métodos no calculan o aproximan la matriz jacobiana y tienen una estructura mucho más simple. Sin embargo, convergen a velocidad lineal, lo que puede resultar demasiado lento en algunos casos. 155
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
Estos métodos se desarrollaron con el formato de punto fijo, x = g(x), donde x y g(x) son vectores de variables de n corrientes. Estos métodos se utilizan a menudo en la convergencia de las corrientes de recirculación, siendo normalmente x una estimación inicial de la corriente, y g(x) el valor calculado después de realizar los cálculos de las unidades conectadas por el diagrama de flujo hasta volver a la corriente de recirculación (después de un paso completo por el diagrama de flujo).
5. MÉTODOS DE SUSTITUCIÓN DIRECTA El método más sencillo para el modo del punto fijo es el de sustitución directa. En este caso se k+1 k 0 define x = g(x ), con un valor inicial estimado de x . Se considera una expansión en serie de Taylor de la función g (x): T
⎛ ∂g ⎞ ⎟) ⎝ ∂x ⎠ x
g (x) k( =) g x k −1 (+ ⎜
x k − x k −1 + ... k −1
*
Si se supone que ∂ g /∂x ≠0, por lo que éste es el término dominante cerca de la solución x . Si se supone también que es prácticamente constante cerca de la solución, entonces: T
⎛ ∂g ⎞ ⎟)
x k +1 − x k = g (x ) k( −) g x k −1 (= ⎜
⎝ ∂x ⎠
x k − x k −1
x k −1
y en consecuencia para:
⎛ ∂g ⎞ ⎟ ⎝ ∂x ⎠
x k +1 − x k = ∆x k +1 = Γ∆x k
T
Γ=⎜
se pueden escribir las expresiones de la norma:
∆x k +1 ≤ Γ ∆x k A partir de esta expresión se puede demostrar que la convergencia es lineal, pero la velocidad max de las iteraciones depende de ||Γ||. Si se utiliza la norma euclídea, entonces ||Γ|| = |λ| , que es el mayor valor propio de Γ, de tal modo que para las iteraciones se tendría:
(
∆x k +1 ≤ λ
)
max k
∆x 0 max
Una condición necesaria y suficiente para que el método max converja es que |λ| 0 y que λmax ≈ λmin. En definitiva, se llega a que ω*=1/(1-λmax). Es importante destacar que si se modifica esta suposición, y que los valores propios máximo y mínimo de son muy diferentes, el método no converge. Esta aproximación se ha hecho extensiva al método generalizado del valor propio dominante (GDEM) en el que se estiman varios valores propios para la determinación del siguiente paso de iteración.
6.2. Método de Wegstein Por otro lado, el método de Wegstein calcula el factor de relajación aplicando un método de la secante independientemente para cada componente de x:
x ik +1 = x ik − f i (x k )
x ik − x ik −1
f i (x)k −( f i )x k −1
Si se definen
fi(xk) = xk – gi(xk)
y
si =
se tiene:
x ik +1 = x ik − f i (x k )
x ik − x ik −1
f i (x)k −( f i )x k −1
[
]
[
]
= x ik − x ik − g i (x k ) = x ik − x ik − g i (x k ) 158
x ik − x ik −1 x − g i (x ) k − x ik −1( +)gi x k −1 k i
k i
x −x
k −1 i
x ik − x ik −1 + g i (x k −)1 −( g)i x k
g i (x)k −( g i )x k −1 x ik − x ik −1
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
[
]
= x ik − x ik − g i (x k )
1 1 − si
= ϖ i g (x k )i + (1 − ϖ i )x ik donde ωi = 1/[1 – si]. Esta aproximación funciona adecuadamente en diagramas de flujo en los que los componentes no interaccionan excesivamente (por ejemplo, reactores sin recirculación). Las interacciones debidas a bucles de recirculación pueden generar dificultades a este método. Para garantizar un funcionamiento estable, los factores de relajación de ambos métodos, DEM y Wegstein, se acotan y se evitan extrapolaciones excesivamente grandes. Los algoritmos mencionados en este apartado 6 se pueden resumir en los siguientes pasos: 1. Comenzar con una estimación de x0 y g(x) 2. Realizar un número finito de iteraciones (normalmente entre 2 y 5) y comprobar la convergencia en cada iteración *
3. Método del valor propio dominante: Aplicar la aceleración ω =1/(1-λ acotado de ω para encontrar el siguiente punto y volver al paso 2.
max
) con un valor
Método de Wegstein: Aplicar la aceleración: ωi = 1/[1 – si]. Para un valor acotado de ωi para encontrar el siguiente punto. Iterar hasta convergencia. Se muestra a continuación un ejemplo para ilustrar la aplicación de los métodos de primer orden, en el que se destaca el funcionamiento del método y la velocidad de convergencia.
Ejemplo: Resolver el sistema: x 1 = 1 − 0.5 exp 0.7(1 − x 2 )
−1
x 2 = 2 − 0.3 exp (0.5(x 1 − x 2 ))
Utilizando el método de sustitución directa, comenzando por x1 = 0.8 y x 2 = 0.8, se estima el valor propio máximo mediante una secuencia de iteraciones La sustitución directa implica: xk+1 = g(xk), obteniéndose las siguientes iteraciones:
k 0 1
x 1k 0.8 0.9248
x2k 0.8 1.3323
2 3 4 5 6
1.10378 1.02478 1.0368 1.04284 1.038503
1.0726 1.10933 1.12796 1.11447 1.11778
Este método converge hacia x1 = 1.03957 y x2 = 1.11756 en 7 iteraciones con ||∆xk|| < 10-3. A partir de estas iteraciones se puede estimar el máximo valor propio mediante: 159
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
|λ|max = ||x5 – x4||/|| x4 – x3|| = 0.6666 También a partir de ||∆x5|| = 0.01478 y δ = 10 -3 se puede estimar el número de iteraciones necesarias para del método de sustitución directa:
niter = ln(δ/||∆x 5||) / ln |λ|max = 7
El método de Wegstein es el más rápido y fiable para la convergencia de recirculaciones. Es aplicable a cualquier número de corrientes y presenta la posibilidad de ajuste de parámetros tales como cota superior e inferior y la aceleración del paso de iteración. En la Fig. 4. se muestra gráficamente la aproximación del método de Wegstein, en la Fig. 5 se muestra una ventana de HYSYS donde se pueden introducir los parámetros de este método
Fig. 4. Convergencia del método de Wegstein
Fig. 5. Ventana de dialogo de HYSYS para el ajuste de parámetros del método de Wegstein
160
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
7. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
161
II. Simulac ión de procesos en la indus tria químic a y de procesos: HYSYS
Recirculaciones: partición y seccionado de corrientes
Recirculaciones: partición y seccionado de corrientes
ÍNDICE 1. 2. 3. 4.
INTRODUCCIÓN....................................................................................................165 PARTICIONADO (PARTITIONING) .....................................................................166 SECCIONADO (TEARING)....................................................................................168 EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE LOS MÉTODOS TIPO NEWTON .................................................................................. 175 5. DESCOMPOSICIÓN PARA SIMULACIÓN ORIENTADAA ECUACIONES 177 6. BIBLIOGRAFÍA ...................................................................................................... 178
1. INTRODUCCIÓN En este tema se van a abordar tres aspectos relacionados con la topología de los diagramas de flujo y las recirculaciones: particionado ( partitioning), establecimiento de orden para resolución (precedence ordering) y seccionado de corrientes ( tearing). Para definir estos conceptos usaremos un diagrama de flujo ejemplo de la bibliografía (Biegler et al., 1997, p. 272), mostrado en la figura 1, el cual queremos resolver de la forma más eficaz posible.
Figura 1. Diagrama de flujo ejemplo para el particionado y establecimiento de orden (Biegler et al., 1997). 165
Recirculaciones: partición y seccionado de corrientes
2. PARTICIONADO (PARTITIONING)
En el diagrama de flujo de la figura 1, las unidades A, B, C, D y E se encuentran en un bucle (con recirculación) y, por lo tanto, tendrán que ser calculadas conjuntamente. Observando con detalle, se puede concluir que las unidades F y G también se tienen que añadir al grupo anterior, que se puede resolver en primer lugar, dado que no hay recirculaciones de otras unidades del diagrama de flujo hacia ninguna de estas unidades. Las unidades que se resuelven como un grupo se llaman particiones, y encontrarlas se denomina particionado o “partitioning” mientras que el orden en que se deben resolver se conoce como “precedence ordering”. El agrupamiento es único, mientras que el orden puede no serlo y depende del diagrama de flujo particular. El ejemplo es sencillo y no va a haber muchos problemas en buscar las particiones y evaluarlas. Sin embargo, algunos diagramas de flujo tienen cientos de unidades y estas tareas son más difíciles. Para ello, existe un algoritmo que se va a aplicar en este ejemplo. Se puede empezar por cualquier unidad, por ejemplo, la unidad I, y ésta se pone en una lista, llamada lista 1: Lista 1: I La lista se extiende siguiendo las corrientes de salida a partir de la última unidad de la lista y continuando hasta que se encuentra una unidad repetida o bien no hay más corrientes. En el ejemplo, I tiene una corriente de salida que entra en J, la cual a su vez tiene una corriente de salida que va a L y así sucesivamente, obteniéndose la siguiente lista: Lista 1: IJKLMNL Sin embargo, la unidad L se repite en la secuencia, lo cual indica la existencia de un bucle que va de L a M, de M a N y de N de nuevo a L. Por lo tanto estas unidades deben estar en un grupo, por lo que se unen y consideran como una entrada única en la lista 1. Lista 1: IJK {LMN} Se continúa trazando el camino con corrientes de salida: Lista 1: IJK {LMN} OPK Y de nuevo se observa una unidad ( K) que se repite, existiendo un bucle desde K al grupo {LMN} a través de O, P y K, agrupando todas estas unidades en un bucle, la lista 1 tiene el aspecto siguiente: Lista 1: IJ{KLMNOP} y continuamos, para obtener: Lista 1: IJ{KLMNOP}SQRJ Donde nuevamente se repite la unidad J: Lista 1: I{JKLMNOPSQR} En este punto no hay unidades del último grupo de las que salgan corrientes hacia otras unidades del diagrama de flujo. Se elimina este grupo de la lista 1 y se pasa a una segunda lista. (lista 2) Lista 2: {JKLNOPSQR} 166
Recirculaciones: partición y seccionado de corrientes
y esas unidades se eliminan del diagrama de flujo, puesto que su análisis ha concluido. Volviendo a la lista 1, ésta está constituida por la unidad I, que no ha sido enviada a la lista 2: Lista 1: I Y se buscan más corrientes de salida que no vayan a unidades ya eliminadas, observándose que no existe ninguna, por lo que la unidad I se elimina de la lista 1 y pasa a estar a la cabeza de la lista 2, eliminándola también del diagrama de flujo: Lista 2: I{JKLMNOPSQR} Lista 1: La lista 1 está vacía y para continuar se toma otra unidad cualquiera del diagrama de flujo restante y se coloca en la lista, por ejemplo, la unidad F: Lista 1: F Y nuevamente se continúa el trazado de corrientes de salida: Lista 1: FH y nuevamente se para, puesto que H no tiene más salidas (excepto a unidades que ya han sido eliminadas y puestas en la lista 2), por lo que se elimina de la lista 1 y se coloca a la cabeza de la lista 2: Lista 2: HI{JKLMOPSQR} Lista 1: F Comenzando meramente en la unidad F seguimos la lista 1: Lista 1: FGCDEABC Observándose que la unidad C se repite, por lo que se agrupa junto con las unidades que hay entre las dos apariciones de c: Lista 1: FG{CDEAB} Continuamos el trazado obteniendo: Lista 1: FG{CDEAB}F y agrupando F y G con las otras unidades se tiene: Lista 1: {FGCDDEAB} En este punto se observa que no hay más corrientes de salida, por que este grupo se elimina de la lista 1 y se coloca a la cabeza de la lista 2, eliminando también las unidades correspondientes del diagrama de flujo: Lista 2: {FGCDEAB}HI{JKLMNOPSQR} Lista 1: La lista 1 está vacía y ya no quedan más unidades en el proceso, con lo cual se ha acabado el análisis. La lista 2 es l lista de particiones con un orden de cálculo. Se puede resolver primero la partición {FGCDEAB}, luego la unidad H, a continuación la unidad I y finalmente la partición restante {JKLMNOPSQR}. El algoritmo funciona independientemente de la unidad con la que se empiece en la lista 1. Proporciona un conjunto de particiones (es decir, de unidades agrupadas) único. Sin embargo, 167
Recirculaciones: partición y seccionado de corrientes
el orden entre particiones puede variar, aunque ello no sucede en este ejemplo sencillo que se acaba de emplear.
3. SECCIONADO (TEARING) El siguiente paso es cómo se van a resolver las particiones que contienen más de una unidad. En el ejemplo hay dos. La primera es sencilla, por lo que se va a ilustrar la metodología de seccionado aplicada a la segunda (más grande), cuyo diagrama de flujo se muestra en la figura 2. En esta parte del diagrama de flujo se ven que en algunas unidades hay una sola corriente que entra y una sola que sale, por lo que éstas unidades se pueden eliminar, ya que no añaden nada a la topología del diagrama base, quedando el diagrama como se muestra en la figura 3.
Figura 2. La segunda partición del diagrama Figura 3. Reducción de la segunda partición de flujo de la figura 1. Todas las del diagrama de flujo mostrada en la corrientes y unidades que no figura 2. La reducción se consigue pertenecen a esta partición se han eliminando las unidades que tiene eliminado (Biegler et al., 1997). una sola entrada y una sola salida (Biegler et al., 1997).
El diagrama se puede rescribir de forma esquemática y numerando las corrientes como se muestra en la figura 4. Comparando las figuras 2 y 3, se observa que si se decide seccionar la corriente 8 (la unión entre S y K) sería posible seleccionar para seccionar cualquier otra de las corrientes que hay en el camino ente ambas unidades. Para problemas pequeños como éste, es posible encontrar un buen sistema de seccionado mediante inspección directa, pero en diagramas más complejos se necesita un procedimiento sistemático. La selección de la(s) corriente(s) a seccionar es muy 168
Recirculaciones: partición y seccionado de corrientes
importante, porque el funcionamiento de los algoritmos de punto fijo depende en gran medida de dicha elección.
Figura 4. Topología de la partición de la figura 3 (Biegler et al., 1997).
Con este objetivo se va a considerar inicialmente un método genérico sencillo, que posteriormente se utilizará para introducir otras metodologías habitualmente empleadas. El método trata el problema de elección de corrientes a seccionar como una optimización con variables binarias (0-1) o como una programación entera. Introducido en 1973, se conoce como “set covering problem” y permite una flexibilidad considerable en la selección del sistema deseado de corrientes seccionadas. Además, la formulación con variables enteras permite interpretar una gran variedad de métodos basados en la teoría gráfica de un modo compacto. La selección se trata como un problema de minimización (del número de corrientes o variables seccionadas) sujeto a la restricción de que se deben romper todos los bucles al menos una vez. El primer paso es la identificación de bucles, lo cual se ilustrará con el siguiente ejemplo.
Ejemplo: Búsqueda de bucles en la figura 4 Comenzamos con cualquier unidad en la partición; por ejemplo, la unidad K
K − (1) → L − (2) → M
− (3) → L
Y observamos que L se repite, por lo que las dos corrientes 2 y 3 que conectan las dos apariciones de L se sitúan en una lista de bucles, denominada lista 3: Lista 3: {2, 3} Comenzamos de nuevo en la unidad justo antes del bucle y buscamos otros caminos alternativos:
K − (1) → L − (2) → M
│
− (3) → L
(7) → S − (8) → K Ahora K se repite, por lo que se colocan las corrientes {1, 2, 7, 8} en la lista de bucles: Lista 3: {2, 3}, {1, 2, 7, 8}
169
Recirculaciones: partición y seccionado de corrientes Volvemos a S y buscamos un camino alternativo que salga de esta unidad, encontrando que no hay. En M sucede lo mismo. Si volvemos a L encontramos otro camino alternativo:
K − (1) → L − (2) → M
│ │ │
│
− (3) → L
(7) → S − (8) → K
(4) → O − (5) → K repitiéndose nuevamente K, por lo que se añade {1, 4, 5} a la lista de bucles: Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5} Volviendo a la unidad O en la última rama, es posible identificar otro camino alternativo:
K − (1) → L − (2) → M
│ │ │
│
− (3) → L
(7) → S − (8) → K
(4) → O − (5) → K
│
(6) → S − (8) → K en la nuevamente se repite K, por lo que se coloca {1, 4, 6, 8} en la lista de bucles: Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5}, {1, 4, 6, 8} Volviendo a S, O, L y finalmente a K, se encuentra que ninguna de estas unidades tienen caminos alternativos saliendo de ellas. Dado que se ha regresado a la primera unidad de la lista, el análisis está completo y hay únicamente cuatro bucles en esta partición. Un listado de los mismos en una tabla de incidencias se muestra a continuación: Tabla 1.Tabla de incidencias de bucles para la partición
Bucle 1 2 3 4
1 X X X
2 X X
3 X
Corriente 4 5
X X
6
7
8
X
X
X X
X
La tabla de incidencias es la base para una matriz, A, con elementos:
aij = 1 si la corriente j está en el bucle i
0 en caso contrario De este modo, la estructura de la matriz es idéntica a la tabla de incidencias. Se define a continuación la selección de las corrientes a seccionar a través de una variable entera yj para cada corriente j. Los valores óptimos de estas variables determinan:
yj = 1 si la corriente j se secciona
0 en caso contrario Para asegurar que cada bucle se rompe al menos una vez por seccionado de corriente, se escriben las siguientes restricciones para cada bucle i: 170
Recirculaciones: partición y seccionado de corrientes n
∑ a ij y j ≥ 1
i= 1, L
j =1
donde n es el número de corrientes y L el número de bucles. Una vez se dispone de las ecuaciones de los bucles, se formula una función objetivo coste para la sección de corrientes a seccionar: ∑wjyj j
y asignamos un valor wj al coste de seccionar la corriente j. Este coste frecuentemente lo dicta el tipo de problema de convergencia de recirculación. Los métodos más populares para ello son: •
wj = 1 (todas las corrientes iguales) lo cual permite minimizar el número de corrientes seccionadas. Esta opción srcina que se obtengan muchos sistemas de corrientes seccionadas posibles. Es el caso más común.
•
wj = nj, donde nj es el número de variables en la corriente j.
•
wj = Σ aij (suma de las restricciones del bucle) el coeficiente que se obtiene indica el número de bucles que se rompen si se secciona la corriente j. Romper un bucle más de una vez srcina un retraso en la iteración de variables en el algoritmo de punto fijo y un peor funcionamiento del mismo. Minimizando el número de bucles que se rompen simultáneamente se busca un sistema de ecuaciones de seccionado no redundante para mejorar el funcionamiento del algoritmo.
El “set covering problem” viene entonces dado por: n
Min ∑ w j y j yj
j =1 n
donde
∑ a ij y j ≥ 1
i=1–L
j =1
yj = {0, 1} La solución a este problema es combinatorial y una cota superior del número de alternativas n es 2 . Sin embargo, con sencillas reglas de reducción se puede hacer este problema y el subsiguiente esfuerzo para su resolución mucho menor. Las reglas permiten aplicar el “set covering problem” sólo a las variables enteras que permanecen después de su reducción. Para facilitar la solución, la metodología más extendida es la de rama y acotamiento (Branch & Bound), aunque hay algoritmos más eficaces especializados para este tipo de problemas. Se define ri como el vector fila i de la matriz A y cj como el vector columna de la matriz A. Las siguientes propiedades permiten reducir el tamaño del problema: • Si ri tiene solo un elemento distinto de 0, (ri)k, hacer yk = 1 y elegir la corriente k para seccionar. Se eliminan esta fila y columna, dado que es un bucle de una corriente consigo misma. •
Si la fila k domina la fila l (todas las corrientes de l están también en k), entonces se borra rk (una corriente seccionada en rl automáticamente satisface rk). Es un bucle cubierto con otro bucle.
171
Recirculaciones: partición y seccionado de corrientes •
Si ck domina cj y wk ≤ wj, o para algún grupo de columnas, S, ΣkεS ck domina cj y ΣkεS wk ≤ wj, entonces se puede eliminar la columna j, dado que yk siempre contendrá la solución óptima.
Estas reglas se aplican sistemáticamente para reducir la matriz de bucles. Si no proporcionan mejora es preciso iniciar una búsqueda combinatorial en las corrientes a seccionar restantes. No obstante, las soluciones óptimas generadas por este procedimiento de reducción y búsqueda no son únicas si las desigualdades en wj no son estrictas. En estos casos, este procedimiento encontrará un sistema óptimo de seccionadas, pero pueden existir otras soluciones que funcionen con una eficacia análoga. Para ilustrar la aplicación de estas reglas, se continuará con el ejemplo anteriormente visto
Ejemplo: Seccionado de corrientes Consideramos ahora la partición del diagrama de flujo del ejemplo anterior. De la tabla 1 se puede obtener la matriz de bucles directamente, como se muestra en la tabla 2:
Tabla 2.Matriz de incidencia de bucles, A, para la partición de la figura 4
Bucle 1 2 3
1
4
1
1 1
2 1 1
3 1
Corriente 4 5
1
6
7
8
1
1
1
1
1
1
Para resolver este problema, se van a considerar dos casos posibles: 1.Minimización del número de corrientes a seccionar 2.Minimización del número de veces que se rompen los bucles y se van a emplear las propiedades de reducción en la matriz A.
Caso 1. Minimización del número de corrientes a seccionar En este caso, se especifican todos los valores wj de las corrientes como la unidad. Tras
inspeccionar la matriz A, se observa que no hay ninguna fila que domine, por lo que no es posible eliminar ninguna por ahora. Por otro lado, la columna 2 domina a la 3, la columna 4 domina a las columnas 5 y 6 y la columna 1 domina a las columnas 4, 7 y 8.Por lo tanto, eliminando las corrientes 3, 4, 5, 6, 7 y 8 se llega a la siguiente tabla reducida:
Bucle
1 2 3 4
172
Corriente 1 2 1 1 1 1 1
Recirculaciones: partición y seccionado de corrientes A continuación, puesto que las filas 2 y 4 dominan a la fila 3, es posible eliminar dichas filas 2 y 4, y obtener una representación mínima del problema:
Corriente 1 2 1 1
Bucle
1 3
Ambas filas tienen sólo un elemento y es preciso seleccionar las corrientes 1 y 2 para romper los bucles. Este es el mínimo número de corrientes a seccionar. Sin embargo, el bucle 2, con corrientes {1, 2, 7, 8} se rompe dos veces. Siguiendo la información de la figura 4, el primer paso sería suponer inicialmente los datos de la corriente 2 y luego calcular la unidad M, lo cual permite obtener la corriente 3, que junto con una estimación inicial de la corriente 1 permite calcular la unidad L. Continuando con el diagrama de flujo, se tiene que el orden de cálculo de las unidades es MLOSK, como se muestra a continuación:
Las consecuencias que esta selección tiene sobre la doble ruptura del bucle 2 (marcado con líneas gruesas) son evidentes. Para la resolución de esta partición, se han de estimar las corrientes 1 y 2 y se calculan el resto en el orden mostrado. El nuevo valor que la unidad L calcula para la corriente 2 influye en el siguiente cálculo de M, pero dicho cálculo se basa en el valor anterior de 1. El nuevo valor de 1 impactará en el siguiente cálculo de L pero no de la unidad M. En realidad, impacta L y todas las unidades siguientes cuando el cálculo se realiza la segunda vez. Su nuevo valor no afectará M hasta que calculemos esa unidad una tercera vez.. Esto retrasa la transmisión de información en este bucle un poco y reduce la velocidad de convergencia para la sustitución sucesiva.
Caso 2. Minimización del número de veces que se rompen los bucles En este caso los valores de wj para la función objetivo vienen dados por wj = ∑i aij , que es la suma para cada corriente de los valores de su columna correspondiente. Dado que los wj son distintos, las reducciones de filas y columnas del caso anterior no son aplicables. En su lugar calculamos wj y adicionamos el valor a la información de la matriz A.
Tabla 3.Matriz de incidencias, A, para la minimización del número de veces que se rompen los bucles
Bucle
1 2 3 4
1
2
3
w1 = 3
w2 = 2 1 1
w3 = 1 1
1 1 1
Corriente 4 5 w4 = 2
w5 = 1
1 1
1
6
7
8
w6 = 1
w7 = 1
w8 = 2
1
1
1
1
No hay líneas dominantes de nuevo, pero hay combinaciones de columnas que dominan otras: •
Las columnas 3 y 7 dominan a la columna 2 [(w 3 + w7) ≤ w2] 173
Recirculaciones: partición y seccionado de corrientes •
Las columnas 5 y 6 dominan a la columna 4
•
Las columnas 5, 6 y 7 dominan a la columna 1
•
Las columnas 6 y 7 dominan a la columna 8
Lo cual lleva a la siguiente matriz reducida:
Bucle
3
1 2 3 4
w3 1= 1
Corriente 5 6 w5 = 1
w6 = 1
7 w7 = 1 1
1 1
Como hay solo un elemento en cada fila, se ha alcanzado una solución óptima (
∑ w j y j = 4 ) con las j
corrientes 3, 5, 6 y 7 que rompen cada bucle una sola vez. Sin embargo, hay varias soluciones óptimas en este caso. Por ejemplo, se pueden seccionar las corrientes 1 y 3, que por inspección también se ve que es una solución óptima. En realidad, tenemos una familia de soluciones óptimas: {1, 3}, {3, 5, 8}, {3, 5, 6, 7}, {2, 5, 6}, {2, 4}, {3, 4, 7}, siendo todas ellas no redundantes. Si elegimos la solución {1, 3}, se puede entonces calcular la unidad L, que proporciona las corrientes 2 y 4. A continuación, se pueden calcular las unidades O y M en cualquier orden, dando las corrientes 5,
6 y 7, lo cual permite calcular la unidad S y finalmente la unidad K.
El orden no es necesariamente único, puede ser LOMSK o bien LMOSK. Si decidimos resolver el diagrama de flujo por sustituciones sucesivas, se elige un grupo de corrientes a seccionar y se estiman inicialmente sus valores. Supóngase que se elige {1, 3}. En este caso se pueden calcular las unidades en el orden LOMSK, lo cual permite obtener nuevos valores de las corrientesy repitiendo 1 y 3. A continuación usan éstos valores calculados comenzando de nuevo el cálculo LMOSK hasta lograr laseconvergencia. Estas familias de grupos de corrientes a seccionar (por ejemplo, {1, 3} y {3, 5, 6, 7}) proporcionan los mismos valores de las variables de las corrientes si se emplea un algoritmo de sustitución directa. También hay algoritmos basados en teoría gráfica para identificar las familias de grupos de variables a seccionar no redundantes, y -por lo tanto- para generar corrientes a seccionar que presentan una convergencia más rápida.
174
Recirculaciones: partición y seccionado de corrientes
4. EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE LOS MÉTODOS TIPO NEWTON En último lugar, se va considerar el empleo un algoritmo de Newton o quasi–Newton en la convergencia de un diagrama de flujo en modo modular. Para ello se forma (o aproxima) la matriz jacobiana por las ecuaciones de las corrientes seccionadas. Se rescriben las ecuaciones:
x = g(x)
f(x) = x – g(x) = 0
donde x son valores de las corrientes seccionadas y g(x) es el valor calculado tras dar un paso por las unidades del bucle. Estas ecuaciones se resuelven mediante las iteraciones de Newton– Raphson o Broyden aplicadas a f (x) = 0. Un caso extremo para resolver las ecuaciones es seccionar todas las corrientes en los bucles. Aplicado al ejemplo que se ha analizado, por ejemplo, para la unidad K:
S1 = G(S5, S8)
o bien F(S1, S5, S8) = S1 – G(S5, S8) = 0
En este caso, se define el vector SJ como los valores de la corriente J y G(*,*) representa funciones implícitas que relacionan las corrientes de salida de una unidad con las de entrada. Escribiendo ecuaciones análogas para todas las unidades se llega a obtener un sistema de ecuaciones de las corrientes. La linealización de dicho sistema leva a las ecuaciones que definen el paso de Newton, como se ha visto en los temas anteriores y se ilustra en la figura 5. En la matriz de las ecuaciones se observa que la diagonal es la matriz identidad mientras que los elementos que no están en la diagonal son los jacobianos ∂G ∂SI con respecto a las corrientes de entrada, SI. Para apreciar el efecto de la selección de corrientes a seccionar, una corriente que no ha convergido corresponde a FJ ≠ 0. Por otro lado, si una corriente se calcula directamente como salida de una unidad, el término de la derecha correspondiente es nulo. Por lo tanto, si se seccionan todas las variables, todos los elementos del término de la derecha en la figura 5 la derecha serían vectores no nulos. Si sólo se seccionasen 1 y 3, solo F1 y F3 serían no nulos, como se muestra en la figura 6.
Figura 5. Ecuaciones linealizadas para la partición del diagrama de flujo (Biegler et al., 1997).
En el caso de que todas las unidades sean lineales, las estrategias de sustitución directa de primer orden siguen estando afectadas por la selección del sistema de corrientes seccionadas y por el acondicionamiento (y los valores propios) de las matrices unidad. Por otro lado, en un 175
Recirculaciones: partición y seccionado de corrientes
sistema lineal, el método de Newton converge en solo una iteración, independientemente de la localización de los elementos no nulos en la matriz de la derecha. A partir de esto es posible generalizar una observación importante:
Mientras que todos los bucles de recirculación se rompan, la selección de las corrientes a seccionar tiene poca influencia en la velocidad de convergencia con los métodos de Newton o Broyden.
Figura 6. Ecuaciones linealizadas con S1 y S3 como corrientes seccionadas (Biegler et al., 1997).
En este caso, un criterio razonable para la selección de corrientes a seccionar está basado en la reestructuración de las filas y columnas de la matriz de la figura 6 para identificar la estructura de una estrategia de convergencia de reciclo. En la aplicación de los métodos de Newton o Broyden, los elementos jacobianos de las unidades individuales puede que no estén disponibles directamente. En su lugar, se emplean aproximaciones por perturbaciones finitas diferenciales de las fórmulas quasi–Newton. Por ello, no es necesario mantener la estructura lineal de la matriz I. En su lugar, se separan las corrientes y ecuaciones a seccionar y se permutan el resto de las variables de corrientes y ecuaciones para obtener una forma de bloque triangular. Por ejemplo, si elegimos S1 y S3 y éstas se mantiene constantes, es fácil ver que las corrientes en la diagonal se pueden calcular directamente de corrientes que se determinan a partir de S1 y S3. Consecuentemente, S2, S4, S5, S6, S7 y S8 son funciones implícitas de S1 y S3 y pueden eliminarse simbólicamente del sistema de ecuaciones, lo cual resulta en un sistema a resolver mucho más pequeño, con solo las variables de corrientes S1 y S3. Dado que la matriz jacobiana se constituye por diferencias finitas, una metodología con menos variables es siempre más sencilla de implementación. Por ello, para los métodos de Broyden o Newton, es deseable obtener el mínimo número de variables de corrientes que rompen todos los bucles de recirculación.
176
Recirculaciones: partición y seccionado de corrientes
5. DESCOMPOSICIÓN PARA SIMULACIÓN ORIENTADA A ECUACIONES Dado que la simulación orientada a ecuaciones considera el conjunto entero de ecuaciones del diagrama de flujo y adopta una estrategia simultánea para su resolución, parecería que no sería tan necesario el análisis de la estructura del diagrama de flujo. En realidad las estrategias de descomposición son una parte importante de este modo simultáneo, pero se introducen en una etapaesposterior, durante la resolución de lasempleado ecuaciones. casos,del el método Newton el más eficaz y más habitualmente paraEn la estos resolución sistema de de ecuaciones. Además, se suelen introducir varias modificaciones del mismo, para asegurar la convergencia en un amplio intervalo de problemas no lineales. Sin embargo, a la vez que un problema de simulación orientado a ecuaciones se hace mayor, el coste computacional dominante corresponde a la evaluación del paso de Newton a través de la resolución de un sistema de ecuaciones lineales: (Jk) pk = - f(xk) Para problemas de diagramas de flujo a gran escala, se ha visto en los temas anteriores que las ecuaciones y la matriz J tiene una estructura dispersa. En problemas con más de unos pocos cientos de variables, es importante explotar esta estructura tanto para una eficaz descomposición de J y la subsiguiente resolución del sistema de ecuaciones lineales, como para el almacenamiento de la matriz descompuesta. De otro modo, si no se explota la estructura dispersa de la matriz para un sistema de n ecuaciones, el número de elementos a 2 almacenar es n y el coste computacional para descomponer la matriz correspondiente es proporcional a n3. Consecuentemente, incluso para sistemas relativamente pequeños de 1000 variables y ecuaciones, el gasto computacional puede ser muy elevado. Por otro lado, si se tiene en cuenta que la mayor parte de estos elementos son nulos (y la descomposición se organiza de modo que permanezcan como valores nulos durante el proceso de resolución), entonces en muchos casos tanto el almacenamiento como el esfuerzo computacional para calcular el paso de Newton pueden llegar a crecer sólo linealmente con el tamaño del problema, en el mejor de los casos. En la actualidad existen varios algoritmos y paquetes informáticos excelentes fácilmente accesibles y aplicables de a los problemas de simulación de procesos. En general estos métodos se pueden clasificar en estructuras especializadas y generales. En el primero de estos tipos, se tiene matrices que presentan una estructura regular, la cual no cambia con el tamaño del problema; ejemplos de esto son matrices con los elementos no nulos agrupados alrededor de la diagonal, matrices aproximadamente diagonales y matrices con una estructura de bloque en sus bordes. Por otro lado, la descomposición de estructuras generales requiere un análisis previo de la estructura y determinación de la secuencia de descomposición que reduzca la aparición de nuevos elementos no nulos y no incremente las necesidades de almacenamiento. Con este objetivo se emplean reglas heurísticas, que se encuentran a su vez implementadas en las rutinas de cálculo. Como resultado, los algoritmos basados en el método de Newton para la resolución de sistemas de ecuaciones no lineales y los métodos de descomposición para la descomposición de la matriz dispersa del sistema lineal son aspectos clave en un simulador orientado a ecuaciones.
177
Recirculaciones: partición y seccionado de corrientes
6. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. http://www.modeladoeningenieria.edu.ar
•
178
Rosario
(1999).
Versión
electrónica
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
II. Simulac ión de procesos en la indus tria químic a y de procesos: HYSYS
Simulación en diseño y operación de procesos. Aplicaciones
Simulación en diseño y operación de procesos. Aplicaciones
ÍNDICE 1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL.................................. 181 2. SELECCIÓN DE UN MODELO DE PROPIEDADES ........................................182 2.1. Cálculo de los coeficientes binarios de interacción.............................................184 3. DEFINICIÓN DE LA REACCIÓN QUÍMICA .................................................... 184 4. ENTORNO DE SIMULACIÓN .............................................................................. 187 4.1. Definir las corrientes de alimentación .................................................................187 4.2. Añadir la operación unitaria Mixer .....................................................................187 4.3. Añadir la operación reactor CSTR ......................................................................188 4.4. Añadir la columna de destilación ........................................................................190 5. RESULTADOS..........................................................................................................193 6. BIBLIOGRAFÍA ...................................................................................................... 194
1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL El propilenglicol (12-C3diol) se obtiene por reacción del óxido de propileno (12C3Oxide) y agua, y posterior separación en una columna de destilación. En la figura se presenta un diagrama de flujo del proceso.
Las condiciones de las corrientes de alimentación al sistema, se indican en la Tabla siguiente. Las corrientes de alimentación se mezclan previamente en un mezclador (Mixer). La corriente resultante se introduce en un reactor CSTR que funciona a temperatura constante de 60 ºC y a presión de 1.1 atm. El reactor tiene un volumen de 7.929 m3, se supone caída de presión nula, y se mantiene un nivel de líquido de 85 %. La reacción química que tiene lugar es: H2O + C3H6O
→
C3H8O2 181
Simulación en diseño y operación de procesos. Aplicaciones
Nombre Prop Oxide Water Feed Temperatura (ºC) 23.89 23.89 Presión (atm) 1.1 1.1 Flujo molar (kgmole/h) 68.04 Flijo másico (kg/h) 4990 Composición de las corrientes Óxido de propileno 1 0 Agua 0 1 Propilenglicol 0 0 Los datos cinéticos para esta reacción son: ⎛ −E ⎞ ⎜ ⎟
r
=
A e ⎝ RT ⎠ C OP
A = 1.7 × 1013 lbmol/ft3
E = 7.5 × 104 kJ/kgmol-K
Siendo COP la concentración molar de óxido de propileno en lbmol/ft3.
2. SELECCIÓN DE UN MODELO DE PROPIEDADES Lo primero que hay que hacer es seleccionar el modelo de propiedades (Fluid Package) dentro del Simulation Basis Manager que será lo primero que aparece si se inicia un nuevo caso. Aquí presionando sobre el botón Add añadiremos un nuevo modelo.
La elección del paquete de propiedades de realiza en la página Prop Pkg. En nuestro ejemplo elegiremos UNIQUAC.
182
Simulación en diseño y operación de procesos. Aplicaciones
El siguiente paso es añadir los componentes utilizados en la simulación, pera ello se selecciona la página Components.
En la casilla Match, se introduce H2O (o water). Una vez aparece el componente en azul, se presiona el botón Add Pure, o se presiona la tecla Enter. En la sección Current Component List aparecerá H2O. Se vuelve a la casilla Match, se hace clic para marcar el componente anterior y se introduce el siguiente componente PropylenOxide, se presiona Add Pure, y se repite el procedimiento con el PropylenGlycol. Una vez seleccionados todos los componentes aparecerá en la pantalla, dentro de la sección Current Component List, una lista con los tres componentes adicionados.
183
Simulación en diseño y operación de procesos. Aplicaciones
2.1. Cálculo de los coeficientes binarios de interacción Ir a la página Binary Coeffs, si aparecen algunos coeficientes binarios sin calcular (esto es, si hay guiones de color rojo), presionar el botón Unknowns only
3. DEFINICIÓN DE LA REACCIÓN QUÍMICA Se cierra el Fluid Package: Basis 1, y una vez en el Basis Manager se va a la Reactions. página Se presiona el botón Add Comps.... Aparecerán los componentes en el recuadro Selected Reaction Components, y se debe pulsar en Add This Group of Components, después cerrar
el formulario. En el Simulation Basis Manager en la pestaña Reactions habrán aparecido los componentes adicionados dentro de la sección Rxn Components. Pulsar ahora sobre el botón Add Rxn para añadir la reacción.
184
Simulación en diseño y operación de procesos. Aplicaciones
Aparecerá una pantalla titulada Reactions donde se debe elegir el tipo de reacción a definir. En nuestro caso seleccionaremos Kinetic.
Agregar los componentes de la reacción seleccionándolos de la lista desplegable en el campo superior de la pantalla. Aparecerán los pesos moleculares de cada componente. Completar los coeficientes estequiométricos, recordando que se deben poner valores negativos para los reactivos y positivos para los productos. Verificar que el campo denominado Balance Error sea igual a cero. Nótese que los órdenes de reacción aparecen automáticamente, y son iguales a los coeficientes estequiométricos, aunque se pueden modificar. De hecho el orden respecto del agua es cero. Pasar a la página Basis donde seleccionaremos Molar Concn, en el campo Base Component colocaremos seleccionándolo de la lista desplegable del campo superior. de En las el campo Rxn 12C3Oxide Phase seleccionar CombinedLiquid . Tener en cuenta las unidades velocidades de reacción y de la base, ya que son las que determinarán las unidades de la constante de velocidad en la ecuación de Arrhenius.
Pasar a la página Parameters e introducir los valores de los parámetros de la reacción con las unidades correspondientes. Para el caso de E, es posible introducir el valor y seleccionar la unidad correspondiente de la lista desplegable.
185
Simulación en diseño y operación de procesos. Aplicaciones
Una vez introducidos todos los datos el cartel en rojo Not Ready cambiará por el de Ready en color verde, indicándonos que HYSYS ya cuenta con datos suficientes para la reacción elegida. La reacción que hemos definido se encuentra dentro del grupo de reacciones denominado Global Rxn Set, y es necesario adicionarlo al paquete de propiedades que hemos definido, para ello en la página Reactions se pulsa sobre el botón Add to FP. Aparecerá una pantalla titulada Add “Global Rxn Set”, donde seleccionaremos el paquete Basis-1 NC-3 PP:UNIQUAC, y cuando se haya coloreado de azul pulsaremos sobre el botón Add Set to Fluid Package. La palabra Basis-1 aparecerá en el recuadro Assoc. Fluid Pkgs.
Hasta aquí hemos definido las bases del caso. Pulsando sobre el botón Return to Simulation Environment entraremos en el entorno de simulación.
186
Simulación en diseño y operación de procesos. Aplicaciones
4. ENTORNO DE SIMULACIÓN 4.1. Definir las corrientes de alimentación Al entrar en el entorno de simulación, y dependiendo de la configuración del programa entraremos en una ventana denominada PFD (Process Flow Diagram) o en la ventana correspondiente al Workbook. Si entramos en el Workbook definiremos en primer lugar las corrientes de alimentación, posicionándonos en la celda **New** y añadiendo además del nombre los datos que se han indicado al principio. En la pestaña Compositions se añaden las composiciones de las corrientes, con lo cual quedan definidas completamente las alimentaciones al mezclador y en consecuencia se calcularan el resto de sus propiedades mediante un flash.
4.2. Añadir la operación unitaria Mixer A continuación en la pestaña Unit Ops procederemos a añadir la operación unitaria Mixer, para lo cual pulsamos sobre el botón Add UnitOp. Aparecerá una nueva ventana en la cual podremos seleccionar la unidad Mixer.
187
Simulación en diseño y operación de procesos. Aplicaciones
Al pulsar sobre el botón Add aparecerá el formulario de entrada de datos del Mixer. En él indicaremos los nombres de las corrientes de alimentación y de salida. Estos datos son suficientes para llevar a cabo los cálculos necesarios para determinar las propiedades de la corriente de salida del Mixer.
4.3. Añadir la operación reactor CSTR Al igual que se hizo con el Mixer se añade el reactor CSTR. En la página de conexiones se introducen los nombres de como las se hizo corrientes correspondientes en la unidad anterior. En la página de parámetros se introduce el volumen del reactor, 7.929 m3, el nivel de líquido en el reactor y se selecciona Cooling (la reacción es exotérmica y por tanto es preciso refrigerar el reactor) En la pestaña Reactions hay que asignar un conjunto de reacciones al reactor. Se abre el menú desplegable de la celda Reaction Set y se selecciona Global Rxn Set, con lo que aparecerá el cartel amarilloelindicando que está sin especificar flujo de energía en el reactor. Esto es debido a que el reactor tiene un grado de libertad. En este punto hay que especificar o la temperatura de la corriente de salida (en cuyo caso HYSYS calculará el flujo de energía) o bien el flujo de energía en el reactor 188
Simulación en diseño y operación de procesos. Aplicaciones
(en cuyo caso HYSYS calculará la temperatura de la corriente de salida). En principio vamos a suponer que el reactor opera de forma isotérmica, de manera que en la pestaña Worksheet especificamos 23.89 ºC para la corriente de salida del reactor. HYSYS calculará el proceso. No hay cambio de fase en el reactor bajo condiciones isotérmicas por lo que el flujo de la corriente de vapor es cero. A continuación vamos a examinar la conversión alcanzada en el reactor. Para ello nos dirigimos a la pestaña Reactions del reactor y seleccionamos la página Results, con lo que veremos que la conversión es muy baja 40.3 %.
Para aumentar la conversión entorno al 85-95 % se tiene que aumentar la temperatura del mismo, de manera que vamos aumentar la temperatura de la salida del reactor hasta conversión aproximada del 95 %. Veremos como a 60 ºC la conversión es del 94.7 %.
189
Simulación en diseño y operación de procesos. Aplicaciones
4.4. Añadir la columna de destilación HYSYS dispone de una serie de plantillas de columna preconstruidas que se pueden instalar y personalizar cambiando las corrientes de conexión, el número de etapas y las especificaciones por defecto. Entre éstas se encuentra la columna de destilación, que añadiremos de la misma forma que hicimos con el resto de operaciones unitarias.
Cuando se instalan columnas preconstruidas HYSYS proporciona cierta información por defecto, como por ejemplo 10 etapas en la columna, más condensador y más calderín. En la primera pantalla hay que especificar el número de etapas, las corrientes de alimentación y de salida, plato de las alimentaciones, y si el condensador es total o parcial. Al pulsar sobre el botón Next (que solamente está activo cuando se han introducido todos los datos necesarios) aparece otro formulario donde hay que especificar el perfil de presiones en la columna a través de las presiones en el condensador y calderín. La siguiente página corresponde a opciones de estimación que no son necesarias. La siguiente página es la final y 190
Simulación en diseño y operación de procesos. Aplicaciones
corresponde a las especificaciones. Para una columna con condensador parcial, definidas las alimentaciones y fijados el número de platos, y perfil de presiones, quedan tres grados de libertad, y en consecuencia son necesarias tres especificaciones que HYSYS fija por defecto en flujo molar de líquido y vapor en cabezas, y relación de reflujo. Estas especificaciones se pueden posteriormente cambiar y adaptar a nuestras expectativas. Usaremos 0.0 lbmol/h para el flujo de vapor en cabezas, y 1.0 para la relación de reflujo, dejando sin valor el flujo de líquido en cabezas. Pulsando en el botón Done aparecerá el formulario de propiedades de la columna.
Accediendo a la página Monitor, podremos ver que el número de grados de libertad es cero, pero también que una de las especificaciones (el flujo molar de líquido en cabezas) no tiene asignado ningún valor ().
191
Simulación en diseño y operación de procesos. Aplicaciones
Vamos a añadir una nueva especificación. Pulsar sobre el botón Add Spec y se abrirá una nueva ventana de especificaciones donde podemos elegir Column Component Fraction, después pulsamos sobre Add Spec(s)..., con lo que aparecerá la vista de Comp Frac Spec.
Ahora editando el nombre de la especificación lo cambiamos a H2O Fraction, seleccionamos la etapa Reboiler , le asignamos el valor 0.005, y especificamos como componente H2O.
Pulsamos el botón Close para volver a la vista de propiedades de la columna. La nueva especificación aparece en la lista Column Specifications. Se desactiva la especificación de flujo de líquido en cabezas y se activa esta ultima especificación, con lo que comenzará el cálculo de la columna.
192
Simulación en diseño y operación de procesos. Aplicaciones
5. RESULTADOS Pulsando sobre el icono del Workbook podremos ver los resultados del proceso completo.
193
Simulación en diseño y operación de procesos. Aplicaciones
6. BIBLIOGRAFÍA •
194
Hyprotech “HYSYS Tutorial & Applications” (2001).
III. Optimizac ión de diagramas de flujo c on HYSYS
Introducción a la programación no lineal (NLP) con restricciones
Introducción a la programación no lineal (NLP) con restricciones
ÍNDICE 1. 2. 3.
INTRODUCCIÓN..........................................................................................................197 PROGRAMACIÓN NO LINEAL CON RESTRICCIONES ........................................198 2.1. Condiciones para que exista un óptimo en programación no lineal....................202 APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN.....................................207
4.
3.1. Condiciones Conceptos básicos................................................................................................207 3.2. de optimalidad ................................................................................ 211 BIBLIOGRAFÍA............................................................................................................215
1. INTRODUCCIÓN Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de proceso, vamos a considerar un aspecto clave en diseño de procesos. El objetivo de muchas simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en mejorar el proceso. Vamos a ver las mejoras sistemáticas estrategias de optimización para procesos químicos con variables continuas. En particularo nos centraremos en el algoritmo de programación cuadrática sucesiva (SQP o “Sucessive Quadratic Programming”) que se ha convertido en el estándar en optimización de procesos. El método se deriva desde una perspectiva tipo Newton y en los temas siguientes se verá su aplicación tanto para simulación en modo modular como en modo orientado a ecuaciones, discutiendo las ventajas y limitaciones de cada uno. En un nivel práctico, se puede definir el término “optimización” como: “Dado un sistema o proceso, encontrar la mejor solución al mismo con restricciones”. Para cuantificar la “mejor solución” se necesita primero una función objetivo que sirva de indicador de la bondad de la solución. Típicamente en problemas relacionados con la industria química y de procesos son: costes de capital, operación, rendimiento del producto, beneficios globales, etc. Los valores de la función objetivo se determinan por manipulación de las variables del problema, las cuales pueden representar físicamente tamaños de equipo o condiciones de operación (temperatura, presión, caudal, composición, etc.). Los de operación del proceso, pureza del producto, validez del modelo y relaciones ente límites las variables del proceso han de ser consideradas como restricciones y los valores de las variables se han de ajustar de forma que se satisfagan dichas restricciones. Frecuentemente, las variables del proceso se clasifican en: • Variables de decisión, que representan las grados de libertad de la optimización. • Variables dependientes, que se pueden resolver mediante las restricciones.
197
Introducción a la programación no lineal (NLP) con restricciones
En el desarrollo del problema de optimización, esta distinción es importante, tanto desde un punto de vista conceptual como en problemas de optimización de procesos modelizados en modo modular. En muchos casos, la búsqueda de un diagrama de flujo mejor mediante la manipulación de las variables de decisión se lleva a cabo mediante ensayo y error (a través de casos). En lugar de esto, estamos interesados en métodos de optimización que impliquen una aproximación sistemática para encontrar el diagrama de flujo óptimo (y esta metodología debe ser tan eficaz como sea posible). Las áreas relacionadas con la teoría y los conceptos de optimización son la programación matemática y la investigación operacional: •
Programación matemática: caracterización de las propiedades teóricas de los problemas de optimización y algoritmos, incluyendo existencia de soluciones, convergencia hacia estas soluciones y velocidades de convergencia locales.
•
Investigación operativa: aplicación e implementación de métodos de optimización para su uso eficaz y fiable.
Ingeniería de procesos: aplicación de métodos de optimización a problemas del mundo real. Es preciso, pues, familiarizarse con el funcionamiento del algoritmo de optimización, incluyendo las limitaciones de los métodos (para conocer cuándo pueden fallar). Además, también se necesita formular problemas de optimización que capturen la esencia del proceso real, y que sean resolubles por los métodos de optimización actuales. Este tema se centra en la optimización de sistemas en los que las variables pueden variar de forma continua en una región (se trata de variables del tipo presión, temperatura, caudales, etc., o bien dimensiones de equipo) y que incluyen funciones objetivo o restricciones no lineales, por lo que este tipo de problemas recibe el nombre de programación no lineal (“nonlinear programming” o NLP). A continuación, se a ver una introducción a la programación no lineal y la definición de las condiciones óptimas para la solución del mismo. En el tema siguiente nos centraremos en el método SQP para resolución de programas no lineales (es el más que usa con más frecuencia, tanto en ingeniería de procesos como en otras aplicaciones). En los temas siguientes se verá la aplicación del método SQP a la simulación de procesos en el modo modular secuencial (para lo cual resulta ser un método muy eficaz) y en el modo orientado a ecuaciones (en cuyo caso se necesita un algoritmo a gran escala y es preciso adaptar el SQP). •
2. PROGRAMACIÓN NO LINEAL CON RESTRICCIONES Consideramos el problema de programación lineal dado en forma genérica como: Min f (x) x
s.a.
g(x) ≤ 0 h(x) =0
198
Introducción a la programación no lineal (NLP) con restricciones
donde x es un vector de n variables continuas, f (x)es una función objetivo escalar, g(x) es un vector de m funciones de restricción en forma de inecuaciones y h(x) es un vector de meq funciones de restricción en forma de ecuaciones. Las restricciones crean una región para las variables, x, denominada “región factible” y se requiere que n ≥ meq para que el problema tenga grados de libertad para la optimización. Aunque la formulación anterior suele ser la más habitual, los problemas NPL se pueden expresar de muy diversas formas. Por ejemplo, se puede cambiar el signo de la función objetivo y de las restricciones: Max q (x) x
s.a.
w(x) ≤ 0 h(x) =0
para las funciones definidas como q(x) = - f(x) y w(x) = - g(x). Lo que se pretende es desarrollar un método que encuentre un mínimo local x* para f(x) en una región posible definida por las restricciones, es decir, f(x*) ≤ f(x) para cualquier x, satisfaciendo las restricciones en el entorno de x*. Si la región posible no está vacía y la función objetivo tiene una cota inferior en esta región posible, sabemos que esta solución local existe. Una solución local a un NLP es también una solución global bajo las condiciones de suficiencia siguientes, basadas en el concepto de convexidad. Una función Ф(x) es convexa para x en un dominio X si y sólo si se satisface la ecuación Ф[
+ (1 −
)
]≤
( ) + (1 −
)
( )
para cualquier α, 0 ≤ α ≤ 1, en todos los puntos en ξ y η en X. Las condiciones suficientes para una solución global del NPL son: • La solución es un mínimo local del NLP. • f(x) es convexa • todas las g(x) son convexas • todas las h(x) son lineales Las dos últimas condiciones implican que la región factible sea convexa, es decir, que para cualquier punto ξ y η en X y cualquier α (0 ≤ α ≤ 1), el punto ( + (1 − ) está ) también en la región. En optimización de procesos, estas propiedades indican que cualquier problema con restricciones en forma de igualdades no lineales es no convexo y, ante la ausencia de información adicional, no hay garantía de que el óptimo local sea también global si estas condiciones de convexidad no se cumplen. Esto se ilustrará con los siguientes ejemplos.
Ejemplo 1. Dimensiones óptimas de un recipiente cilíndrico
Considérese la optimización de un recipiente cilíndrico con un volumen dado. ¿Cuál sería la relación L/D para este recipiente que supone un coste mínimo? 199
Introducción a la programación no lineal (NLP) con restricciones
Este problema con restricciones se puede formular como un NLP en el que se minimiza el coste basado en la cantidad de material que se necesitan para fabricar las paredes laterales y las dos bases del cilindro. Para un grosor pequeño de pared, la cantidad de material es proporcional a la superficie de dichas piezas. Si el coste de los materiales es de CT para las bases y CL para las paredes laterales, respectivamente, la función objetivo a minimizar (costes totales), tendrá la forma siguiente: ⎧
πD 2
⎩
4
Min ⎨C T
⎫ + C L πDL = coste ⎬ ⎭
y deberá estar sujeta a la restricción del volumen en la forma V−
πD 2
4 D, L ≥ 0
=0
En este ejemplo, la región factible en las variables D y L es no convexa, puesto que la restricción es no lineal. Sin embargo, en este ejemplo es posible realizar una modificación en la formulación del problema y eliminar L en la función objetivo a partir de la expresión L = 4V πD 2 , con lo que el problema de optimización queda como sigue: ⎧
πD 2
⎩
4
Min ⎨C T
+CL
4V ⎫
con D ≥ 0
⎬
D⎭
ya que al incorporar la restricción en la función objetivo ésta ya no es necesaria. Si el valor óptimo de D es positivo, podemos encontrar el mínimo de la función por diferenciación del coste respecto de D e igualando a cero: 4VC L d (Coste ) = C T πD − D 2 = 0 dD
Resolviendo para la variable D, se obtiene la expresión siguiente, con L determinado a través de la especificación del volumen: 1/ 3
⎛ 4V C S ⎞ ⎟⎟ ⎝ π CL ⎠
D = ⎜⎜
1/ 3
⎛ 4V ⎞ ⎟ ⎝ π ⎠
L=⎜
⎛ CL ⎞ ⎜⎜ ⎟⎟ ⎝CS ⎠
2/3
Además, se puede obtener que la relación de aspecto (L/D) para el cilindro óptimo ha de ser igual a CT/CL. Si obtenemos la segunda derivada C d 2 (Coste ) = C t π + 8V L3 > 0 dD 2 D
si D >0
por lo que la es función convexa en la región factible (abierta) de D. Como resultado, la solución a este NLP es GLOBAL y no existen más soluciones locales. Ejemplo 2. Minimización de dimensiones de empaquetado
Considérense a continuación tres objetos cilíndricos de igual altura, pero diferente radio, como se ilustra en la figura siguiente. Se desea encontrar la caja con el perímetro mínimo que contenga los tres cilindros, problema que se puede plantear como un NLP.
200
Introducción a la programación no lineal (NLP) con restricciones
En este caso, las variables de decisión son las dimensiones de la caja (A, B) y las coordenadas del centro de los cilindros ( x1, y 1), (x 2, y2), (x 3, y 3). Los parámetros especificados serían los radios de los cilindros: R 1, R 2, R 3.
2
A 3
1
B
Lo que se desea es minimizar el perímetro, 2(A+B), incluyendo como restricciones que los cilindros permanezcan en el interior de la caja y que éstos no se pueden superponer. Con este objetivo, se puede formular el siguiente NLP: Min (A + B)
Cilindros en caja enteramente
x1, y1 ≥ R1
x1 ≤ B – R1, y1 ≤ A – R1
x2, y2 ≥ R2
x2 ≤ B – R2, y2 ≤ A – R2
x3, y3 ≥ R3
x3 ≤ B – R3, y3 ≤ A – R3
(x1 –x2)2 + (y1 – y2)2 ≥ (R1+R2)2 Cilindros no se superponen
(x1 –x3)2 + (y1 – y3)2 ≥ (R1+R3)2 (x2 –x3)2 + (y2 – y3)2 ≥ (R2+R3)2 x1, x2, x3, y1, y2, y3, A, B ≥ 0
La función objetivo y las restricciones “en la caja” son lineales y, por lo tanto, convexas. Del mismo modo, las cotas de las variables son también convexas. no convexidades se observan las desigualdades (restricciones) no lineales – lo cual se puedeLas verificar en las propiedades que se en verán posteriormente. Por ello, no es posible asegurar que hay una solución global única. Intuitivamente, podemos imaginar la existencia de soluciones múltiples, por ejemplo, tras encontrar una solución, observar una equivalente girando la caja 90º, o bien, tras distribuir aleatoriamente los cilindros y reducir las paredes de la caja, se puede observar que la solución depende de la posición inicial de los cilindros. Este problema tiene muchos óptimos locales, debido a que la región factible es no convexa.
Estos dos ejemplos plantean una serie de cuestiones. En primer lugar, ¿cuáles son las condiciones que caracterizan una solución local en un programa no lineal?. En el ejemplo 1, al eliminar L las restricciones perdieron su importancia. En el ejemplo 2, por el contrario, la solución estaba completamente definida por las restricciones. En la solución, estas restricciones se tienen que cumplir como ecuaciones y, por ello, se denominan activas. A continuación ser verán las condiciones de optimalidad de Kuhn Tucker, que permiten definir las soluciones que son óptimos locales. En segundo lugar, la búsqueda de la solución del NLP viene guiada por la determinación del conjunto de restricciones que son activas y la resolución de las ecuaciones que representan las condiciones de optimalidad. En el primer ejemplo, esta tarea fue sencilla, puesto que no se tuvieron que considerar restricciones activas, y porque fue posible encontrar una solución analítica a partir de la función objetivo. Sin embargo, en el segundo ejemplo aún es necesario llevar a cabo esta búsqueda. Estas estrategias de búsqueda se presentarán cuando se desarrolle el algoritmo SQP en el siguiente tema. 201
Introducción a la programación no lineal (NLP) con restricciones
2.1. Condiciones para que exista un óptimo en programación no lineal Antes de pasar a presentar matemáticamente las condiciones de optimalidad, se van a introducir éstas mediante una explicación intuitiva: Consideremos un diagrama de contorno de la función f(x) en dos dimensiones (Fig.1). El mínimo de la función se sitúa en x*. Si imaginamos la representación de esta función como un valle, entonces una “bola” rodando en el valle se pararía en x* (el punto más bajo). En ese punto estacionario tenemos un gradiente nulo, ∇f(x*)=0, y las derivadas segundas revelan la curvatura positiva de f(x). En otras palabras, si movemos la bola alejándola de x* en cualquier dirección, ésta volverá rodando hacia x*.
Figura 1. Diagrama de contorno en minimización sin restricciones (Biegler et al., 1997) Ahora introducimos dos restricciones en forma de desigualdades, g1(x) ≤ 0 y g2 (x) ≤ 0, en el problema de minimización, lo cual podríamos visualizar como dos muros en el valle (Fig. 2). De nuevo, una bola rodando en el valle dentro de la zona delimitada por los muros llegará hasta el punto más bajo posible. Sin embargo, si x* está en el límite (o borde) de una restricción (p.ej. g1(x*)=0), entonces esta desigualdad se dice que es activa, la bola se para en el muro y en ese punto ya no se cumple que ∇f(x*)=0. En su lugar, lo que sucede es que la bola se queda detenida por un balance de fuerzas: la de “gravedad” (-∇f(x*)). y la fuerza “normal” que ejerce el muro sobre la bola (- ∇g1(x*)). Además, se puede ver en la figura que la restricción g2 (x) ≤ 0 es inactiva en x* y no participa en este “balance de fuerzas”. Además de este balance de fuerzas, es de esperar que haya curvatura positiva a lo largo de la restricción activa, es decir, si movemos la bola separándola de x* en cualquier dirección siguiendo la valla, ésta volverá rodando hacia x*. Finalmente, introducimos una restricción h (x)=0, visualizada como si introdujéramos un rail dentro de la zona vallada (Fig. 3). Una bola rodando sobre el rail en la zona vallada también se parará en el punto más bajo, x*, el cual está caracterizado también por un balance de fuerzas: la “fuerza de la gravedad” (- ∇f(x*)), la fuerza “normal” debido al muro (- ∇g1(x*)) y la fuerza “normal” que ejerce el rail sobre la bola (-∇h(x*)). Además, es de esperar que exista curvatura positiva a lo largo de las restricciones activas. Sin embargo, como se puede ver en la figura 3 ya no tenemos direcciones permitidas en las restricciones activas. En su lugar, la bola 202
Introducción a la programación no lineal (NLP) con restricciones
permanece estacionaria en la intersección del rail y el muro (y ésta es la condición suficiente para que éste sea el óptimo).
Figura 2. Problema de minimización con restricciones de inecuaciones (Biegler et al., 1997)
Figura 3. Problema de minimización con ecuaciones e inecuaciones (Biegler et al., 1997) A continuación, se generalizarán estos conceptos, desarrollando las condiciones de optimalidad para minimización con restricciones, denominadas condiciones de Kuhn Tucker (KT) o de Karush Kuhn Tucker (KKT). Por conveniencia en la notación se define una función lagrangiana de la forma siguiente: L( x , µ, λ ) = f ( x ) + g ( x ) T µ + h( x ) T λ = 0
Los vectores µ y λ permiten ponderar las “fuerzas” del balance y se denominan variables duales o multiplicadores de KT. La solución del problema de minimización NLP: 203
Introducción a la programación no lineal (NLP) con restricciones
Min f (x) x
s.a.
g(x) ≤ 0 h(x) =0
satisface las condiciones de KT de primer orden, necesarias para que haya un óptimo: Condiciones de Kuhn Tucker de primer orden:
1. Dependencia lineal de los gradientes (“el balance de fuerzas”): ∇L( x*, µ*, λ *) = ∇f ( x*) + ∇g ( x*) µ * +∇h( x*) λ* = 0
2. Posibilidad de que exista una solución NLP que cumpla todas las restricciones (que la pelota pueda estar entre los muros y sobre el rail): g (x*) ≤ 0 , h (x*) =0
3. Condición de complementariedad, bien µi*= 0 (la restricción es inactiva y se ignora en la condiciones KT) o gi (x*) = 0 (la restricción es activa y el multiplicador es positivo)(la pelota está bien en el borde del muro o no está en la Fig. 3): µ*T g (x*) =0
4. Los multiplicadores de las restricciones son no negativos (las fuerzas normales desde los muros sólo actúan en una dirección): µ* ≥ 0 (si activa, >0) 5. Los gradientes de las restricciones activas tienen que ser linealmente independientes:
[∇g A ( x*)
∇h( x*)] para i ∈ A , A = {i g i ( x*) = 0}
Estas condiciones son sólo necesarias. Sin embargo, se precisa de condiciones adicionales para asegurar que x* es una solución local. Por ahora, las condiciones de primer orden sólo definen x* como un punto estacionario que cumple las restricciones. Es decir, las condiciones KT 1 a 4 son equivalentes a hacer al gradiente de la función nulo. Para confirmar un óptimo local se precisa evaluar las derivadas segundas y que estas sean positivas (o, al menos, no negativas.) En un problema multivariables, las derivadas segundas se evalúan mediante los términos de una matriz Hessiana de una función dada. Por ejemplo, la matriz Hessiana de la función objetivo, ∇xx f (x), está constituida por elementos
{∇ xx f ( x )}ij = Además, como
∂2 f ∂2 f = , se cumple que {∇ xx f (}x{ ) ∂x i ∂x j ∂x j ∂x i
Hessiana es simétrica.
204
∂2 f ∂x i ∂x j ij
= }∇ xx f ( x )
ji
y la matriz
Introducción a la programación no lineal (NLP) con restricciones
La curvatura positiva de la superficie de la función se puede evaluar basándose en la matriz Hessiana. Por ejemplo, si la función objetivo f (x) tiene curvatura positiva en x*, si su matriz Hessiana es positiva definida, es decir, p T ∇ xx f ( x*) p > 0
∀ vector p ≠ 0
p T ∇ xx f ( x*) p ≥ 0
∀ vector p = 0
o positiva semidefinida:
Para el problema NPL con restricciones, se definen condiciones de segundo orden usando la matriz Hessiana de la función Lagrangiana y definiendo direcciones permitidas no nulas para las variables de optimización basadas en las restricciones activas. Comenzando en la solución, x*, las direcciones permitidas, p, satisfacen las restricciones activas como igualdades y, por lo tanto, permanecen en la región factible. Puesto que el cambio en x en esta dirección puede ser arbitrariamente pequeño, estas direcciones también tiene que satisfacer las correspondientes linealizaciones de las restricciones y, por lo tanto, están definidas por: ∇h( x*)T p = 0 ∇g i ( x*)T p = 0
∀i ∈ A , A = {i g i ( x*) = 0}
Las condiciones de segundo orden suficientes (y necesarias) requieren curvatura positiva (no negativa) de la función lagrangiana en estas direcciones permitidas o “restringidas” p. Usando la matriz de las derivadas segundas para definir esta curvatura, estas condiciones se expresan en la forma siguiente: p T ∇ xx L( x*, µ*, λ*) p > 0
condición suficiente
p T ∇ xx L( x*, µ*, λ*) p ≥ 0
condición necesaria
para todas las direcciones permitidas p. Para ilustrar la condiciones de Kuhn Tucker, se van a considerar los dos ejemplos sencillos de la Fig 4.
-a
x
a
f(x)
-a
x
f(x)
a
Figura 4. Ilustración de las condiciones KT para el ejemplo (adaptado de Biegler et al., 1997) Considérese primeramente un problema de una única variable: Min x2 s.a. –a ≤ x ≤ a, donde a > 0 205
Introducción a la programación no lineal (NLP) con restricciones
el mínimo, x*=0, se encuentra por simple inspección visual. La función lagrangiana para este problema tiene la forma: L( x , µ ) = x 2 + µ 1 ( x − a ) + µ 2 ( −a − x ) = 0
estando las condiciones KT de primer orden dadas por: ∇L( x , µ ) = 2 x + µ 1 − µ 2 = 0
µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a
µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran tres casos: •
µ1 = µ2 = 0
•
µ1 > 0 y µ2 = 0
•
µ1 = 0 y µ2 > 0
(el caso en que µ1 > 0 y µ2 > 0 no puede existir si a>0). Satisfacer estas condiciones requiere la evaluación de las tres posibles soluciones: •
Si la cota superior es activa: x = a, µ1 = −2a, µ2 = 0
•
Si la cota inferior es activa: x = -a, µ2 = −2a, µ1 = 0
•
Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Claramente, sólo la última de las posibilidades cumple las condiciones de KT, puesto que en las dos primeras opciones se tienen valores negativos para µ1 o µ2. Si se evalúan las condiciones de segundo orden, las direcciones permitidas p = ∆x, con ∆x >0 y ∆x 0 p ∇ xx L( x*, µ*, λ*) p = 2∆x 2 > 0 T
para todas las direcciones permitidas. Por lo tanto, la solución x*=0 satisface las condiciones suficientes de primer orden y segundo orden de KT para que exista un mínimo local. Considérese a continuación una variación del ejemplo anterior. Supóngase que se cambia el signo de la función objetivo y se tiene que resolver el problema: Min -x2 s.a. –a ≤ x ≤ a, donde a > 0 En este caso, las posibles soluciones, x*= a o x*=-a se encuentran también por inspección visual. La función lagrangiana para este problema tiene la forma: L( x ,µ ) = − x 2 + µ1 ( x − a ) + µ 2 ( −a − x )
estando las condiciones KT de primer orden dadas por: ∇L( x , µ ) = −2 x + µ1 − µ 2 = 0 µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a
µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran nuevamente los tres casos: µ1 = µ2 = 0; µ1 > 0 y µ2 = 0 y µ1 = 0 y µ2 > 0: •
206
Si la cota superior es activa: x = a, µ1 = 2a, µ2 = 0
Introducción a la programación no lineal (NLP) con restricciones
•
Si la cota inferior es activa: x = -a, µ2 = 2a, µ1 = 0
•
Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Y en este caso las tres posibles soluciones cumplen las condiciones de KT de primer orden. A continuación, es preciso evaluar las condiciones de segundo orden. Para el punto x = 0 las direcciones permitidas p = ∆x >0 y -∆x y se cumple que: pT ∇ xx L( x*, µ*, λ*) p = −2∆x 2 < 0
por lo que este punto no satisface las condiciones de segundo orden. En los otros dos casos, sin embargo, se requiere que las direcciones permitidas satisfagan las restricciones activas exactamente. En estos casos, cualquier punto a lo largo de la dirección permitida, x* tiene que permanecer en la cota. Consecuentemente, la solución está totalmente definida por la restricción activa. La condición: pT ∇ xx L( x*,µ*,λ*) p > 0
para todas las direcciones permitidas, se cumple, ya que no hay direcciones permitidas.
Las condiciones KT de primer y segundo orden constituyen una linealización útil para identificar soluciones locales a problemas no lineales (No obstante, las derivadas segundas no se suelen calcular en problemas de optimización de procesos, por lo que raramente se comprueban las condiciones de segundo orden). Sin embargo, se necesitan estrategias de búsqueda eficaces que permitan localizar los puntos que satisfagan estas condiciones. En el tema siguiente se vamos a desarrollar un algoritmo de NLP llamado programación cuadrática sucesiva (“Successive Quadratic Programming” o SQP), el cual tiene unas características adecuadas para procesos y sedepude comprobado queoptimización es adaptabledea varios tipos NLP.usar en muchas aplicaciones, ya que se ha
3. APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN Este epígrafe, tomado del libro de Biegler et al. (1997), presenta de un modo conciso los conceptos básicos en optimización y las condiciones de optimalidad.
3.1. Conceptos básicos Se considerará el siguiente problema de optimización con restricciones: Min f (x) x
s.a.
g(x) ≤ 0 h(x) =0 x ∈ Rn
donde f (x) es la función objetivo, h(x) = 0 es el conjunto de m ecuaciones con n incógnitas x, y g(x) ≤ 0 corresponde a un conjunto de r restricciones en forma de inecuación. En general, el 207
Introducción a la programación no lineal (NLP) con restricciones
numero de variables n será mayor que el número de ecuaciones m, y la diferencia (n-m) es el número de grados de libertad del problema de optimización. Cualquier problema de optimización se puede representar en la forma arriba indicada. Por ejemplo, si se quiere maximizar una función, según esta notación, el problema sería equivalente a minimizar esa función puesta en modo negativo. Las inecuaciones que sean mayores o iguales a cero se pueden pasar a inecuaciones que sean menores o iguales a cero simplemente con multiplicar los términos de la inecuación por –1 e invirtiendo el signo de la inecuación.
Figura 1. Región factible para tres inecuaciones (Biegler et al., 1997) DEFINICIÓN 1 La región factible (“feasible region” o FR) del problema de optimización viene dada por. FR={x | h(x)=0, g(x) ≤ 0, x ∈ Rn } La figura 1 muestra un ejemplo de una región factible en dos dimensiones que implica tres inecuaciones. Los límites de la región vienen dados por los puntos definidos por la siguiente expresión gi(x)=0, i= 1, 2, 3. El lado no factible de las restricciones viene representado por la zona rayada. Si se añade la ecuación h(x)=0, la región factible se reduce a la línea recta más gruesa, como se muestra en la figura 2.
Figura 2. Región factible para tres inecuaciones y una ecuación (Biegler et al., 1997)
208
Introducción a la programación no lineal (NLP) con restricciones
Figura 3. (a) regiones factibles convexas; (b) regiones factibles no convexas (Biegler et al., 1997) DEFINICIÓN 2 La región factible FR es convexa si para cualquier x1, x 2 ∈ FR, x = α x 1 + ( 1-α) x 2 ∈ FR,
α ∈ [0,1] Esta definición se ilustra en la figura 3, la figura 3a muestra un ejemplo de una región factible convexa, mientras que la región mostrada en la figura 3b es no convexa, porque algunos de los puntos de la línea que resulta de unir x1y x2 caen fuera de la región factible. La condición necesaria para que haya una región factible convexa viene dada por la siguiente:
PROPIEDAD 1 Si h(x) = 0 son funciones lineales y g(x) son funciones convexas, entonces FR es una región factible convexa. DEFINICIÓN 3 La función f(x) es una función convexa si para cualquier x1, x 2 ∈ R, f [α x1 + ( 1- α) x 2 ] ≤ f (x1) + ( 1- α) f (x 2)
α ∈ [0,1]. La figura 4a presenta un ejemplo de una función convexa, cuyo valor en el intervalo [ x1, x 2], es inferior a la combinación lineal de los valores de la función en los extremos del intervalo. En contraposición, la figura 4b muestra una función no convexa. Si en la expresión anterior se tuviera una inecuación estricta para los puntos en el intervalo [ x1, x 2], entonces se podría decir que f (x) es estrictamente convexa.
DEFINICIÓN 4 La función f (x) tiene un mínimo local en xˆ ∈ FR, si y sólo si existe δ > 0, f (x) ≥ f( xˆ ) para todo | x- xˆ | < δ, x ∈ FR. Si la desigualdad es estricta se dice que es un mínimo local fuerte (ver figura 5a); de otro modo, s trataría de un mínimo local débil (véase figura 5b).
209
Introducción a la programación no lineal (NLP) con restricciones
Figura 4. (a) Función convexa; (b) Función no convexa (Biegler et al., 1997)
Figura 5 (a) Función como mínimo local fuerte; (b) función con mínimo local débil (Biegler et al., 1997) DEFINICIÓN 5 La función f (x) tiene un mínimo global en xˆ ∈ FR, si y sólo si f (x) ≥ f ( xˆ ) x ∈ FR. Claramente, todo mínimo global es un mínimo local, pero el inverso no es cierto. La figura 6 representa una función con dos mínimos locales fuertes, siendo uno de ellos el mínimo global.
Figura 6. Función con dos mínimos locales (Biegler et al., 1997)
210
Introducción a la programación no lineal (NLP) con restricciones
3.2. Condiciones de optimalidad Minimización sin restricciones
Se considérese a continuación el siguiente problema de optimización sin restricciones: Min f (x) x n
x∈R
donde se supone que f (x)es una función continua y diferenciable. Las condiciones de primer orden, aquellas que son necesarias para que exista un mínimo local en xˆ , vienen dadas por un punto estacionario, esto es, un xˆ que satisfaga ∇f ( xˆ ) = 0 . Esto implica la resolución de un sistema de n ecuaciones con n incógnitas dado por: ∂f =0 ∂x1 ∂f =0 ∂x 2
... ∂f =0 ∂x n
Las condiciones de segundo orden para que exista un mínimo local fuerte, que son condiciones suficientes, requieren que la matriz Hessiana H de las derivadas parciales segundas sea positiva definida. Para dos dimensiones, la matriz Hessiana vienen dada por: ⎡∂2 f ∂2 f ⎤ ⎢ ∂x 2 ∂x ∂x ⎥ 1 2⎥ ⎢ 1 ⎢ δ2 f δ2 f ⎥ ⎢ 2 ⎥ ⎣ ∂x 2 ∂x1 ∂x 2 ⎦
Como se puede observar, la matriz Hessiana es simétrica. La matriz H es positiva definida si y sólo si ∆x T H∆x > 0, ∀∆x ≠ 0. Las dos propiedades siguientes son útiles para determinar en la práctica si la matriz H es positiva definida: 1. H es positiva definida si y sólo si los eigenvalores ρi> 0, i = 1, 2, ..., n. 2. Si H es positiva definida, entonces f (x) es estrictamente convexa Es decir, la propiedad (1) afirma que la matriz Hessiana es estrictamente positiva si los eigenvalores calculados a partir de la misma son todos positivos. La propiedad (2) simplemente indica que aquellas funciones cuya matriz Hessiana es positiva son estrictamente funciones convexas. Por tanto, analizando únicamente la matriz Hessiana de una función se puede determinar si ésta es convexa.
211
Introducción a la programación no lineal (NLP) con restricciones
El siguiente teorema determina la condición de suficiencia para que un mínimo local sea único en un problema de optimización sin restricciones: TEOREMA 1 Si f (x) es estrictamente convexa y diferenciable, entonces si existe un punto estacionario xˆ , este corresponderá a un mínimo local. Minimización con Igualdades
Consideremos ahora un problema de minimización con restricciones en el que sólo hay igualdades. Min f (x) x
s.a.
h(x) =0 n x∈R
en este caso, las condiciones necesarias para que haya un mínimo local con restricciones vienen dadas por el punto estacionario de la función lagrangiana: m
L = f ( x) +
∑1 λ h ( x ) j
j
j=
donde λ j son los multiplicadores de Lagrange. Las condiciones para un punto estacionario vienen dadas por a.
m ∂L = ∇f ( x ) + ∑ λ j h j ( x ) = 0 ∂x j =1
b.
∂L = h j ( x) = 0 ∂λ j
j=1,2... m
Obsérvese que (a) y (b) definen un sistema de n+m ecuaciones con n+m incógnitas (x, λ). Además, la ecuación (a) implica que los gradientes de la función objetivo y las restricciones en forma de igualdad deben ser linealmente dependientes, mientras que la ecuación (b) implica la factibilidad de las restricciones en forma de igualdades. Para que las ecuaciones arriba mencionadas sea válidas se tienen que cumplir condiciones adicionales, que siempre se verifican si el problema es convexo. Las condiciones suficientes de segundo orden para que exista un mínimo local fuerte vienen satisfechas cuando la matriz Hessiana del lagrangiano es definida positiva. Esto es, dada una dirección permitida p que está en el espacio nulo, ∇hT p = 0 , se tiene que pT ∇ 2 L( x*, λ*) p > 0 , donde ∇ 2 L( x*, λ*) p = ∇ 2 f ( x*) + λ *i ∇ 2 hi ( x*) . Minimización con igualdades y desigualdades
Considerando el problema de optimización con restricciones en el que hay igualdades y desigualdades: 212
Introducción a la programación no lineal (NLP) con restricciones
Min f (x) x
s.a.
g(x) ≤ 0 h(x) =0 n x∈R
en este caso, las condiciones necesarias para que exista un mínimo local en xˆ vienen dadas por las condiciones Karush-Kuhn-Tucker: a. Dependencia lineal de los gradientes m
r
j =1
j =1
∇f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇ g j ( x ) = 0
b. Restricciones a la factibilidad hj(x) = 0 j=1,2...m gj ≤ 0 j=1,2...r c. Condiciones complementarias µ j g j ( x ) = 0 µ j ≥ 0 j=1,2...r
donde µj son los multiplicadores de Kuhn-Tucker correspondientes a las desigualdades, los cuales están restringidos a valores no negativos. Las condiciones complementarias en (c) implican un valor nulo para los multiplicadores de las desigualdades inactivas (cuando gj < 0), y en general un valor no nulo para las restricciones en forma de inecuación activas (cuando gj = 0) La figura 7 muestra una representación geométrica de un punto que satisface las condiciones de Karush-Kuhn-Tucker. Se puede observar que ∇f viene dado por una combinación de los gradientes de las restricciones activas ∇g1 , ∇g 2 .
Figura 7. Representación geométrica de un punto que satisface las condiciones de KarushKuhn-Tucker. Además, los multiplicadores µ j vienen dados por
213
Introducción a la programación no lineal (NLP) con restricciones
⎛ ∂f ⎞ ⎟ ⎜ ∂g j ⎟ ∂g =0,i ≠ j ⎝ ⎠
µ j = −⎜
i
En otras palabras, representan la disminución de la función objetivo cuando se produce un incremento en las funciones que representan las restricciones; o alternativamente, el aumento de la función objetivo cuando se produce una disminución en las funciones que representan las restricciones. De esto último, se puede deducir que los multiplicadores de las desigualdades activas deben ser no negativos. El siguiente teorema es la condición suficiente para que un óptimo local en problemas de optimización con restricciones sea único. TEOREMA 2 Si f(x) es una función convexa y la región factible ( FR) es también convexa, entonces si existe un mínimo local en xˆ , i. Es un mínimo global ii. Las condiciones de Karush-Kuhn-Tucker son condiciones necesarias y suficientes. La dificultad con las ecuaciones en (a), (b), (c) para las condiciones de optimalidad del problema de optimización es que no se pueden resolver directamente como en el caso en el que sólo haya igualdades. En general, la solución a estas ecuaciones se puede obtener por medio de un procedimiento iterativo, el cual, de una forma simplificada, consta de los siguientes pasos: Paso 1: Se supone que no hay desigualdades inactivas. Se ajusta el índice de las desigualdades activas JA=Ø, y los multiplicadores µj=0, j=1,2,...r Paso 2: Se resuelve la ecuación en (a) y en (b) para x, los multiplicadores λj de las restricciones en forma de igualdad, y los multiplicadores µj de las restricciones en forma de desigualdades activas (en la primera iteración no hay ninguna) m
m
j =1
jeJ A
∇f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇g j ( x ) = 0 hj(x) = 0 j=1,2...m
gj(x)=0
j ∈ JA
Paso 3. Si g(x) ≤ 0 y µj ≥ 0 j=1,2,...r, entonces se para, ya que se ha encontrado la solución. Si no es así, se va al paso número 4. Paso 4. a. Si uno o mas multiplicadores µj son negativos, se elimina de JA la desigualdad activa con el multiplicador negativo de valor absoluto mayor. b. Se añaden a JA las restricciones en forma de desigualdades que violadas gj(x) > 0 y se vuelve al paso 2. Este método arriba indicado es un procedimiento muy general, adecuado sólo para cálculos manuales en problemas pequeños.
214
Introducción a la programación no lineal (NLP) con restricciones
4. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
215
III. Optimizac ión de diagramas de flujo c on HYSYS
Programación cuadrática sucesiva (SQP)
Programación cuadrática sucesiva (SQP)
ÍNDICE 1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS............... 219 1.1. Programación Lineal............................................................................................219 1.2. Programación No Lineal (NLP) .......................................................................... 220
2. DERIVACIÓN DE SQP ........................................................................................... 223 2.1. Aproximación BFGS para ∇xxL (Broyden, Fletcher, Goldfarb, Shanno)............225 2.2. Características del SQP .......................................................................................225
3. BIBLIOGRAFÍA ...................................................................................................... 229
1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS 1.1. Programación Lineal Cuando solamente hay funciones lineales en el problema, y las variables continuas x están restringidas a valores no negativos, se dice que se tiene un problema LP: Min Z=cTx s.a. A x ≤ a
x≥0 donde el signo ≤ se usa para indicar que puede haber restricciones en forma de igualdades o desigualdades. Sabiendo que las funciones lineales son convexas por la Propiedad 1 y por el Teorema 2, el LP tiene un mínimo único, el cual, no obstante, puede ser débil, pudiendo haber otros valores de las variables que conduzcan al mismo valor mínimo de la función objetivo. El método de resolución estándar en el algoritmo Simplex, que explota el hecho de que en un LP el óptimo yace en el vértice de la región factible (véase la figura 1). En este óptimo se satisfacen las condiciones Karush-Kuhn-Tucker. El método Simplex ha sufrido muchas modificaciones durante las tres últimas décadas, y en la actualidad muchos de los códigos comerciales para ordenadores (OSL, CPLEX, LINDO) están basados en él. Permite resolver muy eficazmente problemas con muchísimas ecuaciones (miles de variables y restricciones) pero con un número escaso de variables en cada restricción. En general, el esfuerzo computacional con el algoritmo simplex depende mucho del número de restricciones (filas, en terminología de LP), no dependiendo demasiado del número de variables (columnas). En problemas con muchas filas y relativamente pocas variables, es aconsejables resolver el LP por medio de su problema dual. En el caso de que las variables x puedan ser positivas y negativas, en un LP se realiza un P N P N N cambio de variable, reemplazando éstas por x=x -x , donde x y x son no negativas. Si x es P cero entonces tendremos un valor positivo, si x es cero el valor será negativo. Esta manipulación sólo se debe utilizar cuando la variable x aparece con un coeficiente positivo en la minimización de una función objetivo. 219
Programación cuadrática sucesiva (SQP)
*
Figura 1. El óptimo yace en el vértice x para problemas LP (Biegler et al., 1997)
Recientemente se han desarrollado los métodos del punto interior para LP, los cuales están emplean polinomios acotados. Aunque estos métodos son teóricamente superiores al algoritmo Simplex, se usan solamente para casos en los que haya un número elevadísimo de variables y restricciones (por ejemplo, problemas con 100000 restricciones y variables) en los que se observa un ahorro en la carga computacional considerable. Hay, sin embargo, clases especiales de problemas LP para aplicaciones concretas que resultan más eficaces que los códigos LP estándar, por ejemplo, para los problemas de redes de flujo, donde la matriz de los coeficientes solo tiene elementos con valores 0, 1 o –1. En este caso, el método Simplex se puede implementar con cálculos computacionales simbólicos para reducir el orden de magnitud del tiempo de computación.
1.2. Programación No Lineal (NLP) En este caso el problema se corresponde con Min f (x) x s.a.
g(x)
≤0 h(x) =0 n xєR
donde, en general, f (x), h(x), g(x) son funciones no lineales. Los métodos NLP más eficaces resuelven este tipo de problemas por determinación directa de un punto que satisfaga las condiciones de Karush-Kuhn-Tucker. Como se ha indicado en el Teorema 2 del tema anterior, se pueden garantizar la obtención de un mínimo global cuando la función objetivo y las restricciones son funciones no lineales convexas y las igualdades son lineales. Como las condiciones de Karush-Khun-Tucker incluyen gradientes de la función objetivo y de las restricciones, es preciso obtener éstas analíticamente o por medio de perturbaciones numéricas. Sin embargo, la última opción supone un gran coste computacional en problemas con un gran número de variables.
220
Programación cuadrática sucesiva (SQP)
Actualmente los dos métodos NLP más utilizados son el algoritmo de programación cuadrática sucesiva (SQP) y el método de gradiente reducido. En el caso del algoritmo SQP la idea básica es resolver en cada iteración un problema cuadrático de la forma: Min
∇f ( x k ) T d + 1 / 2d T B K d
s.a. h( x k ) + ∇h( x k )T d
g ( x k ) + ∇g ( x k ) T d xk
=0
≤0
Bk
donde es el punto actual, es la estimación de la matriz Hessiana de la Lagrangiana, y d k es la dirección de búsqueda predicha. La matriz B normalmente se estima con la formula de actualización BFGS –que se verá más adelante-, y el QP se resuelve con métodos estándar k para programación cuadrática (por ejemplo, la rutina QPSOL). Dado que el punto x será, en k+1 k+1 k general, no factible, el siguiente punto x se ajustará a x = x +αd, donde el tamaño del paso α se determina con el objeto de reducir una función de penalización que trata de compensar las mejoras en la función objetivo con la violación de las restricciones. Un aspecto importante del algoritmo SQP es el hecho de que el QP, cuando se emplea la matriz hessiana exacta de la Lagrangiana en B, es equivalente a aplicar el método de Newton, a las condiciones de Karush-Khun-Tucker. Por ello, es posible obtener una convergencia rápida con este algoritmo. En el método de gradiente reducido, la idea básica es resolver una secuencia de subproblemas con restricciones lineales, donde los subproblemas se resuelven por medio de eliminación de variables. En el caso particular de la implementación por medio de MINOS, el NLP se reformula a través de la introducción de variables en igualdades; por medio de esto el NLP se reduce de a: holgura para convertir las desigualdades Min f (x) x s.a.
r(x) = 0
Las aproximaciones lineales de las restricciones se consideran en una Lagrangiana ampliada para la función objetivo: Min
Φ( x ) =
f ( x ) + (λk ) T [r ( x ) − r ( x k ) ] s.a. J(x k)x=b
donde λk es el vector de los multiplicadores de Lagrange, y J(xk) es el jacobiano de la k función r(x) evaluada en el punto x . El subproblema NLP2, que es un problema de optimización con restricciones lineales, viene dado por Min Φ( x ) s.a. Ax=b donde A es una matriz m x n con m100 variables) dado que las aproximaciones BFGS y el subproblema QP (en paso 3) se resuelven mediante el uso de álgebra lineal excesivamente densa, que implica un coste elevado de tiempo de computación. En estos casos, se deben usar los métodos de espacio reducido, como MINOS (1982) o adaptaciones de SQP que se verán en los temas siguientes. Hay varias formas de llegar al algoritmo SQP. Vamos a ver una basada en condiciones KT, como un sistema de ecuaciones no lineales en x, µ y λ. Estas ecuaciones se pueden resolver mediante el método de Newton. Esto es en esencia el método SQP y la razón de su éxito. En el desarrollo que se va a ver se incluirán algunas modificaciones para poder aplicarlo a las condiciones KT directamente. Se considera inicialmente una modificación de las condiciones KT. Si se conocen a priori las desigualdades activas, se define A =
l
g l ( x*) = 0 y se hace que las gA(x) sean restricciones
gl(x), l ∈ A con lo que las condiciones KT se pueden simplificar:
∇ X L( x*, µ*, λ *) = ∇f ( x*) + ∇g A ( x*) µ * +∇h( x*) λ* = 0 (gradiente con respecto a x)
gA (x*) = 0 h (x*) = 0 Y la solución se puede obtener resolviendo estas ecuaciones para x, µ y λ. Aplicando el método de Newton para resolver las ecuaciones en la iteración, i, da lugar al siguiente sistema de ecuaciones que definen el intervalo de Newton:
223
Programación cuadrática sucesiva (SQP)
⎛ ∇ XX L ∇g A ⎜ T 0 ⎜ ∇g A T ⎜ ∇h 0 ⎝
∇h ⎞⎛ ⎟⎜ 0 ⎟⎜ 0 ⎟⎠⎜⎝
⎛ ∇ X L(x i , i , ⎜ ⎟ g A (x i ) ⎟ = −⎜ ⎜ ⎟ ⎜ h(x i ) ⎠ ⎝
x⎞
i
)⎞⎟ ⎟ ⎟⎟ ⎠
Lo cual corresponde a las condiciones KT del siguiente problema de minimización:
Min ∇f ( x i )T d
+ 1 / 2d T ∇ XX L( x i , µ i , λi )d
s.a. g A ( x i ) + ∇g A ( x i )T d
h( x i ) + ∇h( x i ) T d
=0
=0
La programación no lineal (NPL) con una función objetivo cuadrática (en la variable vectorial d) y con restricciones lineales se denomina Programación Cuadrática (QP) y si ∇ XX L( x i , µ i , λi ) es positivo definido, es decir, y T ∇ XX L( x i , µ i , λi ) y > 0 , para todos los vectores y no nulos, se dispone de algoritmos de pasos finitos efectivos para la resolución de estos problemas. La resolución srcina un vector solución d con los multiplicadores µ y λ para gA y h, i respectivamente. Haciendo d = ∆x, ∆µ = µ - µ y ∆ = - λi, la solución es equivalente al intervalo de Newton mencionado inmediatamente antes. Para relajar el problema e incluir las desigualdades g(x*) ≤ 0 se generaliza el QP, modificándolo de forma que determine de forma automática el conjunto de desigualdades activas gA, resolviéndose el siguiente QP: Min
∇f ( x i )T d + 1 / 2d T ∇ XX L( x i , µ i , λi )d s.a. g ( x i ) + ∇g ( x i ) T d
h( x i ) + ∇h( x i ) T d
≤0
=0
El QP genera una dirección de búsqueda en x y proporciona valores estimados razonables de los multiplicadores KT. Sin embargo, para su implementación se necesita la evaluación de derivadas segundas de la función objetivo, las restricciones y unos buenos valores iniciales de µ y λ para calcular la matriz Hessiana de la función de Lagrange ( ∇ XX L ). Estas dos tareas son las principales limitaciones del método. Este es un método propuesto en 1963 y aplicado en 1967, al que le condiciona una circunstancia clave: si ∇ XX L no es positiva definida se tiene un problema QP no convexo, difícil de resolver con métodos QP disponibles. En 1977 se desarrollaron los métodos Quasi-Newton y funciones de penalización exacta para resolver los NPL. Consisten en una aproximación de ∇ XX L (matriz Hessiana de la función de i Lagrange) por una matriz simétrica positiva definida B . Esta aproximación está basada en un i método de secante, muy similar al método de Broyden. En este caso, el cálculo de B se basa en la diferencia del gradiente de la función de Lagrange ente un punto y el siguiente.
224
Programación cuadrática sucesiva (SQP)
2.1. Aproximación BFGS para
xxL
(Broyden, Fletcher, Goldfarb, Shanno)
Si se considera la aproximación de la matriz hessiana de la función de Lagrange, ∇ XX L mediante una matriz simétrica Bi, se puede llevar a cabo una actualización de la aproximación mediante una secante:
B i +1 ( x i +1
− x i ) = ∇ X L( x i +1 ,
i +1
,
i +1
) − ∇ X L( x i ,
i +1
,
i +1
)
donde se definen:
s = xi+1 – xi , y = ∇ X L( x i +1 ,
i +1
,
i +1
) − ∇ X L( x i1 ,
i +1
,
i +1
)
dando lugar a una matriz simétrica, positiva definida:
Bi+1 s = y En este caso, ∇ XX L es una matriz simétrica, y se pretende que B también lo sea, así como definida positiva. i
i
i+1
Se puede obtener la actualización de la matriz B a B utilizando la misma estrategia que se siguió en la derivación del método de Broyden, llegándose finalmente a la expresión:
B i +1
= B i + yy T / s T y − B i ss T B i / s T B i s
Si B es positiva definida y s T y > 0 entonces B i
i+1
también lo es. Se debe de comprobar que la
condición s y > 0 sea satisfecha antes de realizar la actualización del valor de B . i
T
Esta última expresión es la que se denomina actualización de Broyden-Fletcher-GoldfarbShanno (BFGS). El resultado de esta actualización es la obtención de una aproximación razonable de la matriz hessiana que es también positiva definida, lo cual convierte al problema en uno convexo de QP con propiedades de convergencia adecuadas.
2.2. Características del SQP El método SQP posee una rápida convergencia y necesita pocas evaluaciones de funciones y de gradientes. En un entorno próximo a solución se obtienen las siguientes velocidades de convergencia:
•
Si Bi =
∇ XX L( x i , µ i , λi ) , la velocidad de convergencia es cuadrática (K positiva) lim i →∞ x i +1
•
Si Bi se obtiene a partir de una actualización de BFGS y definida, la velocidad de convergencia es superlineal: lim i →∞ x i
•
2
− x * / xi − x * ≤ K
+1
∇ XX L( x i , µ i , λi )
es positiva
− x * / xi − x * = 0
i
Si B se obtiene de una actualización de BFGS, la velocidad de convergencia es superlineal tras dos etapas: lim i →∞ x i +1
− x * / x i −1 − x * = 0 225
Programación cuadrática sucesiva (SQP)
Como para la resolución de ecuaciones no lineales, el método SQP se puede modificar para que pueda empezar lejos de la solución. En este caso, se introduce un algoritmo de búsqueda de línea que usa una dirección de búsqueda generada por el método SQP pero en la que se modifica el paso de la siguiente forma:
xi+1 = xi + α d
α (escalar ) 0 < α ≤ 1
α se elige para asegurar la disminución de una función que representa a la función objetivo más una suma ponderada de las restricciones. La función elegida para este propósito es la denominada función de penalización exacta ( exact penalty function), y es la elección más habitual para los algoritmos SQP:
P ( x , γ , η) = f ( x ) +
∑γ j
j
max(0, g j ) +
∑
j
η jhj
γj > µj,
donde las factores de ponderación se eligen lo suficientemente grandes de modo que
ηj > λ j
, siendo µi y λi los multiplicadores estimados en el algoritmo.
Con esta función y la actualización BFGS, se garantiza que el SQP converge hacia una solución local si la función objetivo tiene una cota inferior y los subproblemas QP son resolubles. Existen distintas funciones disponibles junto con modificaciones del algoritmo SQP, pero los elementos básicos del mismo se muestran en la tabla I.
Tabla I. Algoritmo SQP básico 0. Se supone x0, y se fija B0 = I (la matriz identidad se elige por defecto). Se evalúan f(x0), g(x0) y h(x0). i
1. En x , evalúa
∇f ( x i ) , ∇h( x i ) , ∇h( x i ) . Si i>0, se calculan s e y.
T
i
2. Si i > 0 y s y > 0, se actualiza B usando la formula BFGS. 3. Se resuelve:
Min d
∇f ( x i )T d + 1 / 2d T B i d
s.a. g ( x i ) + ∇g( x i )T d
h( x i ) + ∇h( x i ) T d
≤0
=0
4. Si d es menor que la mínima tolerancia o las condiciones Kuhn Tucker están dentro de la mínima tolerancia, el algoritmo se para y ya se tiene la solución. i
i
x + α d) de 5. Se busca un elegir tamaño paso del forma que 0la
View more...
Comments