TesisMCMRM
Short Description
tesis...
Description
U N I V ERSI DAD DE CAN T ABRI A
T e sis Doc t ora l “Sistemas Inteligentes para el ajuste de Modelos Hidrológicos. Aplicación al Río Paraná”
María del Carmen Montserrat la Red Martínez
Doc t ora do e n M a te má t ic a s y Com puta c ión
Fa c ult a d de Cie nc ia s ET S de I nge nie ros I ndust ria le s y de T e le c om unic a c ión De pa rt a m e nt o de M a t e m á t ic a Aplic a da y Cie nc ia s de la Com put a c ión
2013
U N I V ERSI DAD DE CAN T ABRI A Fa c ult a d de Cie nc ia s ET S de I nge nie ros I ndust ria le s y de T e le c om unic a c ión
T e sis Doc t ora l pa ra a lc a nza r e l gra do de Doc t or e n M a t e m á t ic a s y Com puta c ión
“Sistemas Inteligentes para el ajuste de Modelos Hidrológicos. Aplicación al Río Paraná” Realizada por:
María del Carmen Montserrat la Red Martínez Bajo la dirección del:
Dr. José Luis Crespo Fidalgo Presentada en el: Departamento de Matemática Aplicada y Ciencias de la Computación
Santander, Julio 2013
Página de Evaluación Doctorando:
María del Carmen Montserrat la Red Martínez Dr. José Luis Crespo Fidalgo
Director Tesis Doctoral:
Integrantes del Tribunal
................................................................... Presidente: Nombres y Apellidos
........................................
................................................................... Secretario: Nombres y Apellidos
......................................
................................................................... Vocal: Nombres y Apellidos
.......................................
Calificación:
....................................... Fecha:
............ día
………… mes
2013 año
A mi querida hermana Blanqui, y a mi ejemplar padre, en sus cumpleaños.
´Indice general Agradecimientos
5
Resumen
7
Pr´ ologo
9
I
Estado del Conocimiento y Marco de Referencia
1. Introducci´ on a la Problem´ atica Planteada
13 15
1.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.2. Problem´atica de la Predicci´on Cient´ıfica . . . . . . . . . . . . . . . . . . . 15 1.2.1. Predicci´on de Inundaciones . . . . . . . . . . . . . . . . . . . . . . . 17 1.2.2. Predicciones Meteorol´ogicas a Largo Plazo . . . . . . . . . . . . . . 17 1.2.3. Predicciones Meteorol´ogicas Estacionales Regionales . . . . . . . . . 19 1.2.4. Predicciones de Avenidas . . . . . . . . . . . . . . . . . . . . . . . . 19 1.3. Aspectos Hidrol´ogicos de la Regi´on . . . . . . . . . . . . . . . . . . . . . . 20 1.3.1. Cuencas Hidrogr´aficas . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.3.2. La Cuenca del Plata . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.3.3. La Cuenca del R´ıo Paran´a . . . . . . . . . . . . . . . . . . . . . . . 24 1.3.4. El R´ıo Paran´a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.3.5. Las Inundaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.3.6. Las Inundaciones en Corrientes . . . . . . . . . . . . . . . . . . . . 28 1.3.7. Estudios Actuales sobre Pron´osticos de Inundaciones en Corrientes
29
1.3.8. Fuentes de Datos para el Desarrollo de la Tesis . . . . . . . . . . . . 30 1.4. Estructura de la Tesis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2. Estado del Conocimiento
33
2.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2. Procesos Estoc´asticos
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1
2.3. Procesos Deterministas Ca´oticos . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4. Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.4.1. Modelos F´ısicos. Caso de R´ıos . . . . . . . . . . . . . . . . . . . . . 38 2.4.2. Series Temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.4.3. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.5. Redes Est´aticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 2.5.1. Redes Multicapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 2.5.2. Perceptr´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 2.6. Redes Din´amicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.6.1. La Red de Hopfield . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.6.2. Redes con Retraso de Tiempo-FTDNN . . . . . . . . . . . . . . . . 73 2.6.3. Redes con Estructura NAR . . . . . . . . . . . . . . . . . . . . . . 73 2.6.4. Redes con Estructura NARX . . . . . . . . . . . . . . . . . . . . . 75 2.7. Redes Profundas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2.7.1. Autocodificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 2.8. Algoritmos Evolutivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 2.8.1. Mecanismos de Cambio en la Evoluci´on . . . . . . . . . . . . . . . . 79 2.8.2. Algoritmos Gen´eticos . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3. Descripci´ on Estad´ıstica del r´ıo Paran´ a
85
3.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.2. Estudio Estad´ıstico Descriptivo . . . . . . . . . . . . . . . . . . . . . . . . 85 3.2.1. Estad´ısticos de las Alturas Hidrom´etricas en la localidad de Corrientes en los a˜ nos 1989-2008 . . . . . . . . . . . . . . . . . . . . . 86 3.2.2. Estad´ısticos de las Alturas Hidrom´etricas en la localidad de Corrientes, en Per´ıodo sin Inundaci´on A˜ nos 2005-2006 . . . . . . . . . 87 3.2.3. Estad´ısticos de las Alturas Hidrom´etricas en la localidad de Corrientesde, en Per´ıodo de Inundaci´on A˜ nos 1991-1992 . . . . . . . . 88 3.2.4. Estad´ısticos de las Alturas Hidrom´etricas en la localidad de Corrientesde, en Per´ıodo de Inundaci´on A˜ nos 1997-1998 . . . . . . . . 89 3.3. Gr´aficos de Evoluci´on Temporal . . . . . . . . . . . . . . . . . . . . . . . . 90 3.4. Tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.4.1. Tendencia Evolutiva . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.5. Gr´aficos de Recurrencia y Frecuencia . . . . . . . . . . . . . . . . . . . . . 96 3.6. Conclusiones Cualitativas y Cuantitativas . . . . . . . . . . . . . . . . . . 98 2
II Implementaci´ on y Validaci´ on de las Aportaciones Propuestas 103 4. Aplicaci´ on de Modelos de Series Temporales Lineales para Predicci´ on 105 4.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.2. Series Temporales Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.2.1. Modelos ARIMA - Herramientas Implementadas . . . . . . . . . . . 105 4.3. An´alisis de Alturas Hidrom´etricas del r´ıo y Variables Meteorol´ogicas en Corrientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 4.3.1. An´alisis con FreeFore . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.3.2. An´alisis con Herramienta de Identificaci´on de Sistemas de Matlab . 109 4.4. An´alisis de Alturas y Caudales de Corrientes, con estaciones del Alto Paran´a 111 4.4.1. An´alisis con FreeFore . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.4.2. An´alisis con Herramienta de Identificaci´on de Sistemas de Matlab . 114 5. Aplicaci´ on de Modelos de Redes Neuronales para Predicci´ on a Corto Plazo 117 5.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.2. Perceptr´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.2.1. Implementaci´on en Matlab - Herramienta de Redes Neuronales NNTool . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.3. Optimizaci´on de Ajuste de Perceptr´on. Adaptaciones de la Funci´on de Error121 5.3.1. Funciones de Redes Neuronales de Matlab . . . . . . . . . . . . . . 121 5.3.2. Modificaci´on de la Funci´on de Error . . . . . . . . . . . . . . . . . . 123 5.4. Funci´on de Penalizaci´on Propuesta . . . . . . . . . . . . . . . . . . . . . . 124 5.5. Redes Neuronales con Funci´on de Penalizaci´on Propuesta . . . . . . . . . . 125 5.5.1. Generaci´on y Entrenamiento . . . . . . . . . . . . . . . . . . . . . . 125 5.5.2. Aplicaci´on de la Red Neuronal generada a los datos del r´ıo Paran´a . 127 5.6. Combinaci´on de Archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.7. Resultados de Redes Neuronales con Funci´on de Penalizaci´on entrenada con Archivos Combinados . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 5.8. Resultados Comparativos de Predicciones a Corto Plazo . . . . . . . . . . 131 6. Aplicaci´ on de Modelos de Redes Neuronales para Predicci´ on a Mediano Plazo 133 6.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 6.2. Implementaci´on en Matlab . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 6.2.1. Procedimiento de Chequeo de las Redes Generadas . . . . . . . . . 134 3
6.2.2. Matlab - Herramienta de Redes Neuronales - NNStart . . . . . . . . 134 6.3. Implementaciones con Redes Neuronales con Estructura NAR . . . . . . . 135 6.3.1. An´alisis de redes NAR con Matlab NNStart . . . . . . . . . . . . . 136 6.3.2. An´alisis de redes NAR con Programaci´on en Matlab . . . . . . . . . 145 6.3.3. An´alisis Comparativo de Redes NAR . . . . . . . . . . . . . . . . . 147 6.4. Implementaciones con Redes Neuronales con Estructura NARX . . . . . . 147 6.4.1. An´alisis de redes NARX con Matlab NNStart . . . . . . . . . . . . 147 6.4.2. An´alisis de redes NARX con Programaci´on en Matlab . . . . . . . . 156 6.4.3. An´alisis Comparativo de Redes NARX . . . . . . . . . . . . . . . . 159 6.5. Red Neuronal con Estructura NARX Multicapa . . . . . . . . . . . . . . . 159 6.5.1. Configuraci´on y Creaci´on de la Red con estructura NARX Multicapa160 6.5.2. Resultados de Predicci´on a 7 d´ıas con NARXMultiCtes . . . . . . . 169 6.6. Combinaci´on de Redes FTDNN, NAR y NARX Multicapa . . . . . . . . . 169 6.6.1. Configuraci´on y Creaci´on de la Red integrando diferentes arquitecturas de redes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 6.6.2. Resultados de Predicci´on a 7 d´ıas con FtdnnNarNarxMCtes . . . . 182 6.7. Combinaci´on de Redes NLP y NARX Multicapa . . . . . . . . . . . . . . . 182 6.7.1. Configuraci´on y Creaci´on de la Red integrando diferentes arquitecturas de redes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 6.7.2. Resultados de Predicci´on a 7 d´ıas con FtdnnNarNarxMCtes . . . . 197 6.8. Resultados Comparativos de Predicciones a Mediano Plazo . . . . . . . . . 197 7. An´ alisis de los Resultados Obtenidos
201
7.1. Pulso 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 7.2. Predicci´on con Pulso 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 7.3. Comparaci´on de Resultados con Pulso 2 . . . . . . . . . . . . . . . . . . . 202 Conclusiones
207
Bibliograf´ıa
209
4
Agradecimientos Primeramente quiero agradecer al Dr. Jos´e Luis Crespo, quien me ha dirigido el presente trabajo, haciendo posible la realizaci´on de esta tesis doctoral. Tambi´en debo mencionar la colaboraci´on del Dr. Pablo Jacovkis, que ha hecho viable la obtenci´on de los datos del r´ıo Paran´a, ha asesorado sobre los aspectos hidrol´ogicos necesarios para el desarrollo de la presente tesis y ha sido el profesor responsable de mi estancia en Argentina. Agradecer a los profesores de este Doctorado, a los profesores, compa˜ neros y amigos del Departamento de Matem´atica Aplicada y Ciencias de la Computaci´on, a mi compa˜ nero de despacho, que han colaborado apoy´andome y acompa˜ na´ndome en la realizaci´on de esta tesis. Quiero tener presente, en este momento a mis amigos de Espa˜ na, de Sudam´erica toda y de Argentina en especial, que son la familia que uno elige, a mi familia, a mis hermanos y sobrinos, que me han acompa˜ nado en todo momento con su apoyo y buenos consejos, para seguir adelante a pesar de las dificultades y de las distancias, han estado cerca acompa˜ nado con la oraci´on y por Internet. Y por u ´ltimo y de una manera muy especial, quiero agradecer a mis padres y a mi hermana Blanqui, que ya no estan conmigo, pero me han dejado un ejemplo de vida y de superaci´on que intentar´e seguir siempre y que me ha permitido llegar hasta donde estoy hoy, superando todo y presentando esta Tesis Doctoral.
Figura 1: Atardecer en el r´ıo Paran´a.
5
6
Resumen Sistemas Inteligentes para el ajuste de Modelos Hidrol´ ogicos. Aplicaci´ on al R´ıo Paran´ a El objetivo principal de esta tesis doctoral es la implementaci´on de sistemas inteligentes para el ajuste de modelos hidrol´ogicos, utilizando para ello series temporales y redes neuronales, aplicados a modelos hidrol´ogicos o de onda cinem´atica, que permitan el aprendizaje y ajuste de par´ametros para la obtenci´on de modelos que realicen predicciones o´ptimas de las alturas del r´ıo Paran´a, en per´ıodos cr´ıticos de inundaciones. Se realiza un an´alisis con series temporales que permite establecer las variables y factores que determinan las alturas hidrom´etricas, en per´ıodos cr´ıticos de inundaci´on en la localidad de Corrientes. Posteriormente se presenta un pron´ostico a corto plazo en per´ıodos de crecidas, que predice las alturas hidrom´etricas a tres d´ıas implementando redes neuronales con funci´on de penalizaci´on modificada. Se finaliza con un pron´ostico a mediano plazo, para per´ıodos de inundaci´on, de alturas hidrom´etricas a siete d´ıas que se realiza con redes neuronales que integran redes neuronales con diferentes arquitecturas. El inter´es de este proyecto radica en su aplicaci´on para el pron´osticos de crecidas en la provincia de Corrientes, Rep´ ublica Argentina, que actualmente no dispone de ning´ un sistema de pron´ostico de crecidas del R´ıo Paran´a en organismos oficiales de la provincia, por lo cual el desarrollo del mencionado trabajo ser´ıa de gran importancia provincial y regional para una mejor predicci´on de las crecidas del R´ıo, que ocasionan p´erdidas de gran importancia en la econom´ıa de la regi´on. As´ı mismo, el problema gen´erico planteado en este proyecto es com´ un a otras muchas situaciones, donde se podr´ıan aplicar los resultados obtenidos en la realizaci´on de esta tesis, como son las dem´as provincias que se encuentran en las m´argenes del R´ıo Paran´a. Palabras Claves: Sistemas Inteligentes, Modelos Hidrol´ogicos. Aprendizaje Autom´atico, Redes Neuronales, Redes Neuronales Modifiadas, Series Temporales, Inundaciones, R´ıo Paran´a.
Figura 2: Atardecer en el r´ıo Paran´a.
7
8
Pr´ ologo Corrientes es una provincia de la Rep´ ublica Argentina, situada en el nordeste del pa´ıs, como se indica en el mapa de la Figura (3), se encuentra emplazada dentro de la regi´on mesopot´amica, con una superficie de 88.886 Km2 , ocupando el 2.3 % del territorio nacional, con una poblaci´on de 1.002.416 habitantes aproximadamente, cuya capital es la ciudad hom´onima, situada al margen izquierdo del r´ıo Paran´a, en 27◦ 27′ de latitud sur y 58◦ 49′ de longitud oeste. La delimita al norte y oeste el r´ıo Paran´a, que la separa de Paraguay y las provincias de Chaco y Santa Fe; su linde este est´a marcado por el r´ıo Uruguay, que la separa de Uruguay y Brasil; los r´ıos Guayquirar´o y Mocoret´a y los arroyos Basualdo y Tunas marcan su l´ımite sur con la provincia de Entre R´ıos; al nordeste los arroyos Itaemb´e y Chimiray junto con un tramo de ”l´ımite seco”de 30 km, la separan de la Provincia de Misiones, con lo cual podemos apreciar que la Provincia de Corrientes es una Provincia totalmente rodeada de r´ıos de grandes caudales y adem´as todo su territorio esta surcado por r´ıos de menor importancia, ubic´andose en la zona central de la provincia los mundialmente conocidos Esteros del Iber´a, como puede observarse en la imagen satelital de la Figura (4). Analizando la geograf´ıa provincial, puede considerarse que los municipios de Esquina, Goya, Lavalle, Bella Vista, Empedrado, Paso de la Patria e Itat´ı, junto con la ciudad de Corrientes Capital, son las localidades de mayor exposici´on ante un posible desastre h´ıdrico, teniendo cada localidad problemas para la concreci´on de los proyectos en defensa de las inundaciones. La Provincia de Corrientes esta en constante riesgo de inundaci´on de varias zonas, en muchos casos no se hacen los trabajos en todas las ´areas inundables por no contar con los fondos suficientes para desarrollar la actividad preventiva que se debe realizar. En las siguientes fotos puede observarse el mismo tramo de la Costanera Gral. San Mart´ın, sobre la margen izquierda del r´ıo Paran´a en la ciudad de Corrientes. La Figura (5), en la foto izq., muestra el r´ıo con altura y cauce normal de entre 3,50 a 4,50 m y la Figura (5), en la foto drcha., muestra el r´ıo durante una gran inundaci´on con alturas r´ecord que oscilan entre los 8,30 y 9,00 m de altura, pudiendo observarse como las aguas del r´ıo han superado el muro de contenci´on de la defensa permanente que forma la costanera. La provincia no cuenta actualmente con un programa integral de prevenci´on ante posibles inundaciones, el cual se deber´ıa realizar en conjunto, ya que est´a comprobado que dentro de una provincia el trabajo llevado a cabo por los municipios en forma unilateral, no es lo o´ptimo cuando se tiene que hacer frente a contingencias de esta magnitud. El estudio y evaluaci´on de posibles soluciones ante una gran inundaci´on, deben ser estudiados de igual manera por todos los departamentos provinciales y por supuesto siempre con un orden de prioridades para la ejecuci´on de las obras a nivel provincial. Las Inundaciones de las u ´ltimas d´ecadas provocaron p´erdidas millonarias; desde 1982 9
Figura 3: Ubicaci´on de la Provincia de Corrientes en la Rep´ ublica Argentina.
Figura 4: Imagen satelital de la regi´on mesopot´amica donde se ubica la provincia de Corrientes.
10
Figura 5: R´ıo Paran´a en la Costanera de Corrientes, Foto Izq.: con altura y caudal normal y Foto Drcha.: con altura y caudal en una gran inundaci´on.
hasta el 2000 las inundaciones y vendavales en Corrientes provocaron p´erdidas por un valor de 70 millones de d´olares. A los desastres naturales se agregan situaciones de vulnerabilidad generadas por la precaria infraestructura vial, falta de acceso a servicios b´asicos y cobertura social para grandes sectores de la poblaci´on. El impacto de los desastres naturales y antr´opicos en Corrientes adquiere una considerable dimensi´on, consigna el informe que a su vez se nutre de datos registrados por la Red DesInventar, [DesInventar, 2010] y [DesEnredando, 2010], orientada al estudio y prevenci´on de desastres en Am´erica Latina. Desde 1982 hasta el a˜ no 2000, las p´erdidas ocasionadas por inundaciones, especialmente la ocurrida durante 1998, se estiman en los 70.000.000 de d´olares. En la cifra tambi´en se encuentran los perjuicios ocasionados por vendavales durante el mismo per´ıodo, aunque estos fen´omenos implican una incidencia menor en la provincia. Mientras que con la cifra de 64.150.100 d´olares el total de p´erdidas por inundaciones alcanza el 91.4 % del total de p´erdidas por desastres, los perjuicios ocasionados por vendavales abarcan s´olo un 7.6 %, que se traduce en 6.000.000 de d´olares. Los mayores da˜ nos econ´omicos se produjeron durante 1998 y afectaron especialmente al sector agr´ıcolaganadero. Los fen´omenos hidrometereol´ogicos, inundaciones por precipitaciones o por crecientes de recursos h´ıdricos, constituyen las principales amenazas de riesgo. Las caracter´ısticas del relieve correntino perfilan esta situaci´on: grandes planicies aluviales y enorme presencia de recursos h´ıdricos superficiales, con el 97,6 % del per´ımetro provincial formado por r´ıos, no obstante, amenazas similares se presentan en todo el resto de la regi´on del noreste argentino, conocida como NEA. Por toda la problem´atica que presenta la Provincia de Corrientes ante la permanente amenaza de inundaciones en especial, aquellas provocadas por el r´ıo Paran´a, por la morfolog´ıa del terreno, es de suma importancia contar en la provincia con un estudio pormenorizado y relevante, sobre el comportamiento del r´ıo Paran´a, que permita previamente poder analizar las situaciones de crecida del r´ıo con una antelaci´on suficiente, permitiendo de esta forma organizar con tiempo necesario las tareas inherentes de evacuaci´on y refuerzo de las defensas costeras, contra las inundaciones; cuyas obras tendr´ıan car´acter de provisorias, algunas de ellas, pero el an´alisis de los resultados que se obtuvieran, ser´ıa la base para el dise˜ no de las defensas definitivas contra las inundaciones. 11
Por todo lo mencionado, al llegar el momento de seleccionar el tema de la presente Tesis Doctoral: ”Sistemas Inteligentes para el ajuste de Modelos Hidrol´ ogicos. Aplicaci´ on al r´ıo Paran´ a”, el factor determinante a tener en consideraci´on fu´e el de elegir un tema que me permitiese desarrollar investigaciones, que enriquecieran mi formaci´on profesional y a su vez que las mismas, con los resultados que se obtuviesen en consecuencia, pudieran posteriormente redundar no solo en un beneficio para la provincia de Corrientes sino tambi´en para toda la regi´on del NEA, terru˜ no en el que vivo y desempe˜ no mis labores. Este objetivo perseguido, con pol´ıticas de Estado acordes al tema que nos ocupa y medidas implementadas en un Mediano Plazo, redundar´ıan sin lugar a dudas en un amplio beneficio para toda la sociedad. Considerando adem´as el hecho de haber trabajado en el Ministerio de Obras y Servicios P´ ublicos de la Provincia de Corrientes, en la Direcci´on de Hidr´aulica, en el Centro de Inform´atica H´ıdrica, y al ser miembro del Equipo de Emergencia H´ıdrica de la Provincia de Corrientes, en las inundaciones que azotaron a la regi´on en el a˜ no 1992, me permiti´o apreciar en el lugar de los hechos y con toda claridad, la gravedad de una emergencia provincial producida por inundaciones. El proyecto de la presente Tesis Doctoral, fue presentado ante el Ministerio de Obras y Servicios P´ ublicos de la Provincia de Corrientes, obteni´endose el aval total al proyecto por parte del Ing Anibal D. Godoy, en su car´acter de Ministro de Obras y Servicios P´ ublicos de la Provincia de Corrientes, Rep´ ublica Argentina.
12
Parte I Estado del Conocimiento y Marco de Referencia
13
14
Cap´ıtulo 1 Introducci´ on a la Problem´ atica Planteada 1.1.
Introducci´ on
En este Cap´ıtulo se presenta una descripci´on de la Problem´atica Planteada en la Tesis, comenzando en la Secci´on (1.2) con generalidades de la Problem´atica de la Predicci´on Cient´ıfica, luego se presenta en la Secci´on (1.2.1) la Predicci´on de Inundaciones, analizando su relaci´on con las Predicciones Meteorol´ogicas a Largo Plazo en Secci´on (1.2.2), las Predicciones Estacionales Regionales en Secci´on (1.2.3) y las Predicciones de Avenidas en Secci´on (1.2.4). Seguidamente se presentan en la Secci´on (1.3) los Aspectos Hidrol´ogicos comenzando en la Secci´on (1.3.1) con una breve menci´on de las Cuencas Hidrogr´aficas, siguiendo con la descripci´on de la regi´on en la cual se estudiar´an las inundaciones por crecientes del r´ıo Paran´a, en la Secci´on (1.3.2) se presenta la Cuenca del Plata, en la Secci´on (1.3.3), se detalla la Cuenca del r´ıo Paran´a, en la Secci´on (1.3.4) se describe las car´acter´ısticas del r´ıo Paran´a, en la Secci´on (1.3.5) se analiza el fen´omeno clim´atico de las Inundaciones, en la Secci´on (1.3.6) se caracterizan las inundaciones de la regi´on correntina, en la Secci´on (1.3.7) se presentan los Estudios de Pron´ostico de Crecida existentes para la regi´on y en la Secci´on (1.3.8), se enumeran las fuentes de los datos que se trabajaron para el desarrollo de la presente tesis. Posteriormente en la Secci´on (1.4) se describe la Estructura de la Tesis.
1.2.
Problem´ atica de la Predicci´ on Cient´ıfica
La predicci´on en el contexto cient´ıfico es una declaraci´on precisa de lo que ocurrir´a en determinadas condiciones especificadas, se puede expresar a trav´es del silogismo: Si A es cierto, entonces B tambi´en ser´a cierto. El m´etodo cient´ıfico concluye con la prueba de afirmaciones que son consecuencias l´ogicas de las teor´ıas cient´ıficas, la verificaci´on se hace a trav´es de experimentos que deben poder repetirse o mediante estudios de observacionales rigurosos, porque una teor´ıa cient´ıfica cuyas aseveraciones no son corroboradas por experimentos, pruebas u observaciones, es descartada. El falsacionismo de Karl Popper [Popper, 2002] considera que todas las teor´ıas deben ser puestas en cuesti´on para comprobar su rigor. Las teor´ıas que generan muchas predicciones, resultan valoradas, tanto por su inter´es 15
cient´ıfico como por sus aplicaciones, se confirman o se falsean f´acilmente y, en muchos campos cient´ıficos, las m´as deseables son aquellas que, con n´ umero bajo de principios b´asicos, predicen un gran n´ umero de sucesos. La teor´ıa de la predicci´on ci´entifica, tiene su origen en la d´ecada de los a˜ nos 50, siendo actualmente un a´rea en la que se han realizado avances te´oricos muy importantes y se ha probado su eficiencia en m´ ultiples a´reas, como se detalla en lo siguiente. 1948: Primera aplicaci´on del m´etodo DELPHI, desarrollado por la Rand Corporation, para predecir los resultados de las carreras de caballos. 1949: A. Kaplan, A.L. Skogstad y M.A. Girshick publican ”The prediction of social technological events”, donde se da el soporte cient´ıfico a la t´ecnica Delphi. 1951: Primer experimento Delphi con fines militares (Dalkey y Helmer). 1958: Aparici´on del art´ıculo de Brown que sienta las bases para los m´etodos de alisado. 1963: Primer experimento Delphi con fines no militares (Helmer y Quade). 1970: Primera edici´on del cl´asico de Box, G. E. P.; Jenkins, G. M.; and Reinsel, G. C., Time Series Analysis, Forecasting and Control. 1974: Hasta este a˜ no, el m´etodo Delphi ha estado creciendo en popularidad: casi 500 art´ıculos publicados. Pero a partir de aqu´ı se inicia un periodo de crisis de este m´etodo. 1980: Creaci´on de la revista Journal of Time Series Analysis. 1980: Se da por terminada la fase de crisis del m´etodo Delphi. 1981: Celebraci´on del primer simposio internacional sobre predicci´on (ISF1981). 1981: Creaci´on de la revista Journal of Forecasting. 1984: Creaci´on de la revista International Journal of Forecasting. 1985: Inicio de la recuperaci´on y aplicaci´on continua de la t´ecnica Delphi a problemas concretos y refinamiento de la metodolog´ıa. 1986: Publicaci´on de PDP Books (Parallel Distributed Processing, Vol. I and II) editados por David Rumelhart y James Mc Clelland que supuso un verdadero acontecimiento por la presentaci´on del m´etodo de aprendizaje de retropropagaci´on (”backpropagation”) para redes neuronales tipo Perceptr´on Multicapa. 1987: Creaci´on de la International Neural Networks Society (INNS) en la celebraci´on de la IEEE International Conference on Neural Networks con 1700 participantes (San Diego). 1990: Publicaci´on de la revista Transactions on Neural Networks por el IEEE. 1999: G. Rowe y G.Wrigth publican en el International Journal of Forecasting un art´ıculo de referencia fundamental, The Delphi tehnique as a forecasting tool: issues and analysis, recopilatorio del estado del arte y posibilidades abiertas al m´etodo Delphi. 16
1999: Publicaci´on en Espa˜ na de un peque˜ no pero magn´ıfico libro sobre el m´etodo Delphi. Jon Landeta, El m´etodo Delphi, Ariel Practicum, Barcelona. 2001: Publicaci´on del tratado ”Principles of Forecasting”, editado por J. S. Armstrong. 2005: Bodas de Plata del International Symposium on Forecasting, el foro mundial de mayor relevancia sobre la predicci´on.
1.2.1.
Predicci´ on de Inundaciones
La predicci´on de las inundaciones es la estimaci´on de la ocurrencia de un evento futuro empleando el conocimiento del medio ambiente y la recopilaci´on de datos historicos. La predicci´on precisa de inundaciones permite estimar cu´ando ocurrir´an y de que magnitud ser´an, lo que permite tomar medidas proactivas para proteger las ´areas pobladas, como la evacuaci´on de poblaciones en situaci´on de riesgo y levantar barreras antes que llegue el desastre, lo que permite minimizar su impacto devastador. La predicci´on de inundaciones se desarrolla en distintas etapas: Predicci´on Meteorol´ogica: parte del conocimiento cient´ıfico y la utilizaci´on de nuevas tecnolog´ıas, realizan la predicci´on del estado atmosf´erico a corto plazo y en un lugar determinado. Predicci´on de Avenidas: parte de la situaci´on meteorol´ogica futura para predecir las inundaciones resultantes y su magnitud, mediante modelos hidrol´ogicos. Las nuevas tecnolog´ıas y en especial los Sistemas Inteligentes, hacen posible que los investigadores combinen los datos de numerosas fuentes como datos de observaciones recopilados por radares, sat´elites o estaciones meteorol´ogicas y base de datos, que integrados a la comprensi´on de los sistemas meteorol´ogicos y los r´ıos, adem´as de la influencia de factores humanos y naturales, permiten generar modelos complejos de estos fen´omenos naturales. Varios de estos proyectos son financiados por la Uni´on Europea como EURAINSAT, CARPE DIEM, MUSIC, MANTISSA y VOLTAIRE y est´an explorando formas de utilizar estos avances para mejorar el rendimiento de los modelos de inundaciones. El proyecto transnacional DEMETER, coordinado por el Centro Europeo de Pron´ostico Meteorol´ogico a Plazo Mediano, est´a trabajando en el primer sistema de modelaje mundial que produce previsiones del tiempo por estaciones a largo plazo. Estas previsiones pueden dar datos sobre las precipitaciones muy valiosos ya que ayudan a saber por anticipado cu´ando habr´a inundaciones, proporcionando predicciones sobre la probabilidad de que se d´e un cierto r´egimen o patr´on meteorol´ogico en varias estaciones o incluso a˜ nos antes, incluyendo el impacto que tendr´a sobre la agricultura y la salud, [Europea, 2013]. Para m´as informaci´on sobre DEMETER se puede consultar en: http://www.ecmwf.int/research/demeter/.
1.2.2.
Predicciones Meteorol´ ogicas a Largo Plazo
Las predicciones meteorol´ogico a largo plazo consideran interacciones conocidas entre la atm´osfera y los oc´eanos, analizan las anomal´ıas de la temperatura de la superficie del 17
agua en los oc´eanos Pac´ıfico, Atl´antico e ´Indico, la superficie y espesor de los hielos en las regiones polares y la nieve acumulada en latitudes elevadas, factores que inciden en el clima mundial y regional en las siguientes estaciones, prediciendo el clima a escala estacional a interanual, [OMM, 2013]. El fen´omeno de El Ni˜ no/Oscilaci´on Austral (ENOA), es un ciclo de la interacci´on oc´eano/atm´osfera que supone variaciones anormales peri´odicas de la temperatura de las aguas, demasiado c´alidas o muy fr´ıas, en grandes extensiones de las zonas oriental y central del oc´eano Pac´ıfico, as´ı como las variaciones conexas en los patrones de la circulaci´on atmosf´erica, que reciben el nombre de El Ni˜ no y La Ni˜ na, respectivamente. En estos casos se analiza informaci´on m´as generalizada, que permite realizar an´alisis de los fen´omenos que se reiteran en secuencias en el tiempo, pudiendo realizar predicciones de mediano plazo. Se analizan episodios de fen´omeno de tres a seis estaciones, de una periodicidad de dos a siete a˜ nos y presentan efectos predecibles en el clima. En las predicciones a largo plazo se emplean generalmente m´etodos estad´ısticos basados en datos clim´aticos hist´oricos, registros de per´ıodos de 30 a 50 a˜ nos, que son analizados con modelos computadorizados din´amicos como los modelos de circulaci´on general del acoplamiento oc´eanoatm´osfera y modelos regionales con mayor resoluci´on, basados en las leyes f´ısicas que gobiernan el sistema clim´atico. Por lo que respecta a la predicci´on por conjuntos, se aplican los modelos de circulaci´on general haciendo varias pasadas con diferentes valores iniciales. En muchos casos se combinan las t´ecnicas de modelizaci´on estad´ıstica y din´amica con el fin de estimar con mayor precisi´on la probabilidad y la incertidumbre de las predicciones, [OMM, 2013]. El climat´ologo Eduardo Sierra, [Sierra, 2013], se˜ nala que en los u ´ltimos cincuenta a˜ nos, en Argentina se suceden, por cada ciclo Ni˜ no, dos de Ni˜ na consecutivos, uno moderado y otro m´as intenso, esto es lo que provoca las p´erdidas m´as cuantiosas, porque los productores no logran recuperarse de un a˜ no a otro. Tambi´en manifesto que los a˜ nos 2012/13 tendran presencia de un fen´omeno Ni˜ no; luego se espera una secuencia de dos ciclos con preponderancia a Ni˜ na, por lo cual el per´ıodo 2013/14 estar´ıa marcado por una prevalencia de Ni˜ na leve, que puede ocasionar p´erdidas en los rendimientos, pero no en cifras dr´asticas; en tanto, hacia el 2014/2015 este fen´omeno podr´ıa intensificarse, si se presenta sin lluvias durante enero, los da˜ nos pueden ser a´ un m´as grandes, las caracter´ısticas de estos fen´omenos clim´aticos se detalla en las gr´aficas de la Figura (1.1).
Figura 1.1: Caracter´ısticas comparativas de los fen´omenos de El Ni˜ no y La Ni˜ na.
18
1.2.3.
Predicciones Meteorol´ ogicas Estacionales Regionales
El objetivo no es predecir las condiciones meteorol´ogicas concretas en un d´ıa dado, sino determinar las condiciones medias del tiempo a lo largo de varios d´ıas. De hecho, se pronostica el comportamiento a gran escala de la atm´osfera y como lo afectan los mecanismos de influencia en mayor medida, al ser imposibles de predecir de forma precisa las caracter´ısticas atmosf´ericas a peque˜ na escala, por estar sujetas cambios r´apidos no predecibles, [Ogallo, 2013]. Durante 2007 Argentina, Chile, Uruguay, Paraguay y Brasil estuvieron afectados por sequ´ıas regionales y esto est´a relacionado al efecto de La Ni˜ na que se desarrollo entre 2007 y culmino a principios de 2008. Por efecto de La Ni˜ na 2007/08, los antecedentes hidrol´ogicos y el desarrollo de la situaci´on sin´optica particular hubo tambi´en grandes inundaciones en Bolivia y el noroeste de Argentina. Esto se debe a que el desarrollo de las temperaturas del Pac´ıfico y su interacci´on con la atm´osfera son siempre un poco diferentes. Esto sumado a las condiciones del Atl´antico hace que los sistemas sin´opticos cambien y a veces modifican fuertemente el clima por un cierto tiempo. Por eso es necesario poder ajustar mejor una predicci´on estacional operativa, teniendo en cuenta la modificaci´on de la situaci´on sin´optica por los oc´eanos tanto Pac´ıfico como Atl´antico y las condiciones hidrol´ogicas antecedentes, de cada regi´on en particular.
1.2.4.
Predicciones de Avenidas
Las Avenidas son inundaciones ocurridas dentro de los cauces de las aguas continentales, siendo relevante la estimaci´on de su desarrollo, tiempo y duraci´on, especialmente del caudal m´aximo, en un punto espec´ıfico del cauce, ocasionada mayormente por fuertes precipitaciones y/o deshielo. La predicci´on de avenidas se realiza mediante modelos que realizan estimaciones futuras de variables hidrol´ogicas relacionadas con la avenida, en funci´on de los datos disponibles actuales, datos hist´oricos o datos producto de simulaciones de la cuenca. En la predicci´on de avenidas se debe analizar lo siguiente: [Mediero Ordu˜ na, 2007]:
1. Detecci´on de avenidas: Consiste en la estimaci´on de la posibilidad de formaci´on de una avenida a partir de un an´alisis hidrometeorol´ogico. 2. Pron´ostico de avenidas: Consiste en la estimaci´on cuantitativa de los valores futuros de una variable hidrol´ogica durante una inminente situaci´on de avenida. 3. Alerta de avenidas: Consiste en la comunicaci´on del nivel de peligrosidad y el tiempo de llegada de una avenida, junto con alguna estimaci´on de tipo cualitativo que indique la posibilidad de excedencia de un umbral determinado. Las alertas de avenidas normalmente van dirigidas a las autoridades responsables de las actuaciones en caso de avenidas y a los usuarios afectados por la misma. 19
1.3. 1.3.1.
Aspectos Hidrol´ ogicos de la Regi´ on Cuencas Hidrogr´ aficas
Una Cuenca Hidrogr´afica consiste en una cuenca de drenaje, considerando el ´area de territorio que aporta agua a la corriente principal o sistema de drenaje natural, que drena sus aguas a trav´es de un u ´nico r´ıo, al mar o un lago endorreico. La naturaleza de un modelo de drenaje puede variar mucho de un tipo de terreno a otro, fundamentalmente en respuesta a los tipos de suelos sobre los cuales se desarrolla la corriente o al modelo estructural de fallas y pliegues. Tambi´en recibe los nombres de hoya hidrogr´afica, cuenca de drenaje y cuenca imbr´ıfera. Existen tres tipos de cuencas seg´ un el destino final del drenaje de sus aguas: Exorreicas: drenan sus aguas al mar o al oc´eano. Un ejemplo es la cuenca del Plata, en Argentina. Endorreicas: desembocan en lagos, lagunas o salares que no tienen comunicaci´on fluvial al mar. Por ejemplo, la cuenca del r´ıo Desaguadero, en Bolivia. Arreicas: las aguas se evaporan o se filtran en el terreno antes de encauzarse en una red de drenaje, son frecuentes en a´reas des´erticas. Por ejemplo, los arroyos, aguadas y ca˜ nadones de la meseta patag´onica central, en Argentina, pertenecen a este tipo, ya que no desaguan en ning´ un r´ıo u otro cuerpo hidrogr´afico de importancia. Una cuenca y una cuenca hidrol´ogica se diferencian en lo siguiente: Cuenca: se refiere exclusivamente a las aguas superficiales. Cuenca Hidrol´ogica: considera las aguas superficiales, incluyendo tambi´en las aguas subterr´aneas o acu´ıferos. La cuenca hidrogr´afica es delimitada de otra cuenca por una l´ınea imaginaria denominada l´ınea de las cumbres o divisoria de aguas, como se detalla en la imagen de la Figura (1.2). La delimitaci´on de la cuenca debe seguir las altas cumbres, debe cortar ortogonalmente a las curvas de nivel y no debe cortar ninguno de los cauces de la red de drenaje. Esta delimitaci´on tambi´en es usada en la ubicaci´on de los recursos naturales, los cuales se regulan administrativamente separando el territorio por cuencas hidrogr´aficas. Tradicionalmente la delimitaci´on de cuencas, se ha realizado mediante la interpretaci´on de los mapas cartogr´aficos, este proceso, ha evolucionando con la tecnolog´ıa y actualmente los Sistemas de Informaci´on Geogr´afica (SIG), proporcionan aplicaciones que facilitan el an´alisis y delimitaci´on de cuencas. La generaci´on de caudales circulante en una cuenca hasta el punto de desag¨ ue, pueden observase en la Figura (1.3), el cual comienza al producirse una precipitaci´on sobre el conjunto de la misma, cabe indicar que la precipitaci´on puede tener lugar sobre diferentes tipos de superficie como vegetaci´on, superficie del terreno, o masas de agua, con la consiguiente repercusi´on en la continuaci´on del proceso. Una parte del agua procedente de la precipitaci´on, seg´ un las ´epocas y las caracter´ısticas concretas de la cuenca, retorna a la atm´osfera a trav´es de evaporaci´on desde la vegetaci´on, desde la superficie del terreno 20
Figura 1.2: Una cuenca de drenaje es la zona de tierra drenada por una corriente y sus afluentes. Las divisorias son los l´ımites que separan las cuencas de drenaje. Fuente: AGUSUP-21.
y desde la superficie de las masas de agua. El agua tambi´en puede volver a la atm´osfera a trav´es del fen´omeno de transpiraci´on de las plantas, que se suma a la precipitada directamente sobre dicha superficie, [UNICAN, 2004]. Las aguas superficiales de la cuenca se infiltran en el suelo dependiendo de su caracter´ısticas y su contenido de humedad, quedando almacenada temporalmente en la capa superior del suelo, para luego moverse en forma ascendente hacia la superficie del terreno por capilaridad, o moverse horizontalmente, como flujo hipod´ermico, alcanzando eventualmente un cauce fluvial, o puede percolar verticalmente hacia capas acu´ıferas m´as profundas. El agua en el acu´ıfero se mueve lentamente, si bien puede constituir el flujo base que se incorpora a los cauces fluviales. El agua superficial que no es capaz de ser almacenada ni infiltrada escurre sobre la superficie del terreno, siguiendo la l´ınea de m´axima pendiente, hasta alcanzar un cauce fluvial, a lo largo del cual se desplaza, combin´andose con otras incorporaciones, hasta alcanzar el punto final de desag¨ ue de la cuenca, [UNICAN, 2004]. El caudal circulante por un determinado punto de un cauce fluvial est´a constituido por la agrupaci´on de caudales procedentes de escorrent´ıa superficial, del flujo hipod´ermico y del flujo base, la agrupaci´on se produce de forma arborescente, debi´endose tener presente los tiempos de tr´ansito a lo largo de los diferentes cauces y los almacenamientos transitorios en los mismos, que repercuten en la forma del hidrograma, [UNICAN, 2004]. La forma de la cuenca hidrogr´afica es importante porque determina el Tiempo de Concentraci´on (Tc), el cual es el tiempo necesario, desde el inicio de la precipitaci´on, para que toda la cuenca contribuya al cauce principal en estudio, es decir, el tiempo que toma el agua precipitada en los l´ımites m´as extremos de la cuenca para llegar al punto de salida de la misma. Es importante destacar que, en la medida que el tiempo de concentraci´on de la cuenca sea mayor, su respuesta a determinada precipitaci´on en la producci´on de 21
Figura 1.3: Representaci´on esquem´atica del comportamiento hidrol´ogico de una cuenca.
caudal, tender´a a ser menor y viceversa. Coeficiente de Compacidad o Indice de Gravelius (Kc): Es la relaci´on entre el per´ımetro de la cuenca y el per´ımetro de un c´ırculo de a´rea igual al de la cuenca, el cual se calcula con la Ecuaci´on (1.1), [Tutoriales, 2013]: P Kc = 0, 28 √ A
(1.1)
donde: P : es el per´ımetro de la cuenca (Km) A: el a´rea de la cuenca (Km2 ). El Coeficiente de Compacidad podr´a ser menor a la unidad y en la medida que se acerque a la unidad la forma de la cuenca tender´a a parecerse a la de un c´ırculo. Si se asocia el Coeficiente de Compacidad de cada cuenca con el Tiempo de Concentraci´on, tendr´ıamos que en el caso de la cuenca con mayor Coeficiente de Compacidad, ver cuenca de la izquierda en la Figura (1.4), se tiene que al mayor Tiempo de Concentraci´on, la magnitud de la escorrent´ıa generada por una precipitaci´on en ella sea menor que en aqu´ella que posee el menor Coeficiente de Compacidad, ver cuenca de la derecha en la Figura (1.4). Coeficiente de Forma (Kf ): Es la relaci´on entre el ancho medio de la cuenca (B) y la longitud de su cauce principal (Lc). El ancho medio se obtiene cuando se divide el ´area de la cuenca por la longitud del cauce principal, por lo tanto el Coeficiente de Forma queda definido por la Ecuaci´on (1.2), [Tutoriales, 2013]: 22
Figura 1.4: Formas de Cuencas y Coeficiente de Compacidad asociados.
B A Kf = √ = √ Lc Lc2
(1.2)
donde: B : es el ancho medio de la cuenca (Km) Lc: es la longitud de su cauce principal (Km) A: el a´rea de la cuenca (Km2 ). En la medida que el Coeficiente de Forma de una cuenca determinada sea m´as bajo, estar´a menos sujeta a crecientes que otra del mismo tama˜ no, ´area, pero con mayor Coeficiente de Forma, es el caso inverso al presentado para el Coeficiente de Compacidad o ´Indice de Gravelius.
1.3.2.
La Cuenca del Plata
La Cuenca del Plata, con una superficie de 3.200.000 km2 , es el sistema h´ıdrico m´as grande de Sudam´erica despu´es del Amazonas y es la quinta cuenca hidrogr´afica m´as grande del mundo, en superficie es casi igual al a´rea de la Uni´on Europea. Esta Cuenca incluye la Cuenca del Paran´a, es el asentamiento de la mayor parte de la agricultura de los pa´ıses del MERCOSUR. La navegaci´on fluvial es importante desde el r´ıo de la Plata hasta el Paraguay. Varias presas utilizan el potencial el´ectrico del r´ıo, que tambi´en se aprovecha para la pesca y el regad´ıo, [Wikipedia, 2013]. Comprende una parte importante de los territorios pertenecientes a Argentina, Bolivia, Brasil y Uruguay y la totalidad del territorio de Paraguay, como se indica en el mapa de la Figura (1.5). Las precipitaciones en su a´mbito se re´ unen en dos grandes afluentes, los r´ıos Paran´a y Uruguay, que luego vierten sus aguas en el r´ıo de la Plata. El conjunto fluvial y lacustre de la Cuenca del Plata forma el principal sistema de recarga del acu´ıfero guaran´ı, uno de los mayores reservorios continentales de agua dulce del mundo. La cuenca sirve de asiento a una poblaci´on de decenas de millones de habitantes, por lo que la interacci´on humana con la misma a lo largo del tiempo en forma incontrolada 23
Figura 1.5: Mapa de la Cuenca del Plata, que comprende territorios pertenecientes a Argentina, Bolivia, Brasil y Uruguay y la totalidad del territorio de Paraguay.
produce cambios significativos, tanto para la cuenca como para la calidad de vida de sus habitantes. Los dos grandes r´ıos de la cuenca, el Paran´a y el Uruguay, tienen una densa red de afluentes, subafluentes y tributarios menores, como los r´ıos Paraguay, Pilcomayo, Bermejo, Iguaz´ u, entre otros. Es una regi´on de extraordinario valor ecol´ogico y econ´omico, con una rica variedad morfol´ogica y clim´atica, calidad de suelos, recursos acu´aticos y diversidad biol´ogica y cultural, que la hacen sumamente apropiada para la implementaci´on de estrategias de desarrollo sustentable.
1.3.3.
La Cuenca del R´ıo Paran´ a
La Cuenca sedimentaria del Paran´a, es una amplia cuenca sedimentaria situada en el ´area centro-este de Am´erica del Sur, forma parte de la extensa cuenca combinada del Plata. Su ´area cubre principalmente el centro-sur de Brasil, desde el estado del Mato Grosso hasta el estado de Rio Grande do Sul, donde se encuentra el 75 % de su superficie. Adem´as de Brasil, tambi´en se extiende por el nordeste de Argentina y por la regi´on este de Paraguay y el norte de Uruguay. Es una depresi´on ovalada, con el eje mayor orientado de norte a sur, y posee un a´rea de cerca de 1.500.000 millones de km2 , [Wikipedia, 2013]. Esta cuenca recoge las aguas de la mayor´ıa de los r´ıos del sur del continente, como el Paran´a, el Paraguay, el Uruguay, sus afluentes y diversos humedales, como el Pantanal, 24
los Esteros del Iber´a y el Ba˜ nado la Estrella, siendo la segunda cuenca m´as extensa de Suram´erica, s´olo superada por la del r´ıo Amazonas, siendo el colector principal el r´ıo Paran´a, que corre su eje central de norte a sur. Presenta un enorme potencial hidroel´ectrico, debido al gran volumen de agua de sus r´ıos, tanto del r´ıo Paran´a como de diversos afluentes, sumado al terreno accidentado de la cuenca. Un importante recurso natural de la cuenca es el agua subterr´anea del Acu´ıfero Guaran´ı, que constituye uno de los mayores acu´ıferos del mundo y es la mayor reserva subterr´anea de agua de Am´erica del Sur. El acu´ıfero posee un a´rea de presencia de cerca de 1,2 millones de km2 , un volumen de aproximadamente 46 mil km3 .
1.3.4.
El R´ıo Paran´ a
El r´ıo Paran´a es el segundo en longitud de Sudam´erica, despu´es del Amazonas, con una longitud de 4.880 km desde su nacimiento en los estados brasile˜ nos de S˜ao Paulo, Minas Gerais y Mato Grosso del Sur, de la confluencia del r´ıo Grande y el r´ıo Parana´ıba, hasta su desembocadura en delta en el R´ıo de la Plata, en las provincias argentina de Santa F´e y Entre R´ıos, con un caudal promedio de 17.290 m3 /s y un cauce que varia de 3.500 m a 6.000 m de ancho, sembrado de islas y bancos de arena de todas dimensiones, que en per´ıodos de inundaci´on llega a superar los 10.000 m de ancho, [Wikipedia, 2013]. Desde su nacimiento hasta la desembocadura pueden diferenciarse tres tramos: Superior o Alto Paran´ a: desde el nacimiento hasta la confluencia del r´ıo Paraguay, 1.550 km, Medio Paran´ a: desde la Confluencia con el r´ıo Paraguay hasta Diamante, a lo largo de aproximadamente 722 km, Paran´ a Inferior o Delta: desde Diamante hasta la confluencia con el r´ıo Uruguay, 298 km. Los saltos de agua y r´apidos del alto Paran´a han sido aprovechados para la generaci´on de energ´ıa el´ectrica y el almacenamiento de agua para consumo y riego, a trav´es de la construcci´on de centrales hidroel´ectricas, existiendo m´as de 130 represas en la cuenca, considerando s´olo aquellas con altura superior a 10 metros, que transformaron el r´ıo Paran´a y sus principales afluentes en una sucesi´on de lagos. En territorio argentino se ubica una gran represa en el Alto Paran´a, muy pr´oxima a la ciudad de Corrientes, se encuentran las obras del complejo Apip´e-Yaciret´a, acordado entre Argentina con Paraguay, el cual provoca un fuerte impacto sobre la regi´on. En el mapa de la Figura (1.6), puede observase la ubicaci´on de las represas hidroel´ectricas de Itaip´ u que se encuentra entre Paraguay y Brasil y la de Yacyret´a que se encuentra entre Paraguay y Argentina, ambas represas ejercen una acci´on reguladora del cauce del r´ıo y un efecto directo en toda la cuenca. La localidad de Corrientes se encuentra en el Paran´a Medio, muy cerca de la confluencia del r´ıo Paraguay, ubicando el a´rea que se estudia, entre el Alto y Medio Paran´a. Las variaciones de caudal del r´ıo Paran´a dependen de las precipitaciones que se registran en territorio brasile˜ no, el mencionado r´ıo atraviesa zonas con distintos tipos y 25
variedades clim´aticas. El curso superior presenta una creciente anual durante el verano, mientras que los cursos medio e inferior ven modificado su r´egimen por los aportes del r´ıo Paraguay, lo que provoca una segunda creciente durante el invierno. El m´aximo caudal del r´ıo se registra hacia fines del verano (febrero-marzo) y el estiaje a fines del invierno (agosto-septiembre).
Figura 1.6: Ubicaci´on de las Represas de Itaip´ u y de Yacyret´a, en el curso del r´ıo Paran´a.
1.3.5.
Las Inundaciones
La mayor´ıa de inundaciones tiene un origen meteorol´ogico provocado por los procesos atmosf´ericos que pueden variar mucho tanto en tiempo como en espacio. Solamente una hora o menos de tormenta puede desencadenar inundaciones en los valles peque˜ nos. Por el contrario, las grandes inundaciones en los grandes valles fluviales suelen ser el resultado de una serie de precipitaciones extraordinarias sobre una regi´on amplia durante un intervalo largo de tiempo. Los efectos de los fen´omenos clim´aticos pueden presentarse con diferentes magnitudes, desde peque˜ nos inconveniente o llegar a ser grandes cat´astrofes, con consecuencias directas en la calidad de vida de las diferentes poblaciones y en la econom´ıa regional. En la d´ecada de 1990, la mayor´ıa de los desastres naturales tuvieron que ver con fen´omenos extremos clim´aticos, con consecuencias de p´erdidas humanas en promedio anual de 80.000 v´ıctimas; se vieron afectadas 200 millones de personas y las p´erdidas econ´omicas se elevaron a 63.000 millones de d´olares EE.UU., siendo las Inundaciones el fen´omemo que m´as se presenta de estas cat´astrofes, como puede observarse en el gr´afico de la de la Figura (1.7), [OMM, 2013]. El fen´omeno de Inundaci´on, es definido por la Directiva 2007/60/EC de la Uni´on Europea, como: el cubrimiento temporal por agua de una tierra que normalmente no se encuentra cubierta, [Parliament, 2007]. Por lo tanto, se incluyen las inundaciones producidas por r´ıos, torrentes, corrientes de agua ef´ımeras mediterr´aneas e inundaciones 26
Figura 1.7: Fuente: Oficina de asistencia al exterior en casos de desastres OFDA de los EE.UU./ Centro de Investigaciones sobre la epidemiolog´ıa de los desastres CRED; IFRC.
mar´ıtimas en zonas costeras, por ser un fen´omeno tan frecuente y al no poder ser eliminado en algunas situaciones o solo puede ser atenuado, es importante contar con sistemas de predicci´on, de planeamiento y de alerta, que permitan la estimaci´on de las zonas que ser´an afectadas, los riesgos econon´omicos y productivos de las regiones afectadas, que sirvan de apoyo a la toma de medidas preventivas, para que sean minimizados los da˜ nos. Las principales fuentes que pueden causar una inundaci´on en un ´area urbana son, [Esc]: Inundaci´on Pluvial : Lluvias de alta intensidad pueden producir inundaciones en a´reas urbanas. Este tipo de inundaci´on puede ser m´as peligrosa en aquellas situaciones en las que el sistema de drenaje de la ciudad sea ineficaz o est´e mal dimensionado. Inundaci´on Fluvial : El caudal en r´ıos y cauces puede desbordar las m´argenes e inundar ´areas urbanas. Aunque las inundaciones de origen fluvial suelen estar asociadas a fen´omenos de tormenta, deben analizarse diferentes fuentes de riesgo, dado que precipitaciones en cuencas situadas aguas arriba pueden ocasionar inundaciones, independientemente de la precipitaci´on ocurrida en el a´rea urbana. Adem´as, otros procesos naturales como el deshielo pueden derivar en importantes inundaciones fluviales. Inundaci´on Mar´ıtima: El mar puede inundar zonas urbanas situadas en la costa como resultado de la acci´on de huracanes, ciclones o tifones. Adem´as, en el caso de zonas urbanas situadas bajo el nivel del mar, si las infraestructuras de protecci´on no son capaces de contener la acci´on del oleaje, las consecuencias de una posible inundaci´on mar´ıtima podr´ıan ser de gran importancia. El mar ejerce, a su vez, de condici´on de contorno concomitante a la inundaci´on fluvial, no permitiendo desaguar al mar y elevando el nivel del r´ıo. Colapso Estructural : El fallo de una infraestructura puede ocasionar importantes inundaciones y puede incrementar las consecuencias por inundaci´on producidas por otras fuentes. Por ejemplo, el fallo de una presa producir´ıa un elevado aumento del caudal de descarga en el r´ıo, ocasionando elevadas consecuencias aguas abajo. Por 27
ello, las medidas estructurales para la reducci´on del riesgo de inundaci´on presentan normalmente un doble papel. Adem´as de las fuentes de riesgo citadas anteriormente, existen fen´omenos como el cambio clim´atico que pueden aumentar el riesgo de inundaci´on. Tambi´en existen otras amenazas importantes como el terrorismo, el sabotaje o el vandalismo que pueden llevar a la destrucci´on de estructuras como diques y presas, provocando importantes inundaciones.
1.3.6.
Las Inundaciones en Corrientes
Desde 1982 hasta el a˜ no 2000 se produjeron 174 eventos de inundaciones en diferentes a´reas de Corrientes. En los a˜ nos 1982-1986 y 1998-2000 fueron los dos per´ıodos donde se registraron los niveles de alerta m´as alarmantes, ya sea por exceso de precipitaciones o por creciente de r´ıos. De esos per´ıodos, los principales da˜ nos se concentraron en 1983, 1992 y 1998, todos coincidentes con eventos de la corriente de El Ni˜ no. La crecida extraordinaria del Paran´a deton´o las inundaciones catastr´oficas de los a˜ nos 1983 (recurrencia 130 a˜ nos) y de 1992 (recurrencia 100 a˜ nos). Se trat´o de crecidas ligadas a la aparici´on de sendos eventos ENOS. En 1998, se produjo una nueva inundaci´on que, a diferencia de las anteriores, combin´o niveles altos del r´ıo Paran´a (recurrencia de 40 a˜ nos) con grandes precipitaciones al interior de la provincia, lo que gener´o mayores da˜ nos econ´omicos; esta inundaci´on produjo, sobre todo, graves impactos sobre el sector agropecuario. Para apreciar la magnitud de las a´reas inundadas en estos per´ıodos puede apreciarse en la imagen de la Figura (1.8), Foto Izq., el valle fluvial en oportunidad del fen´omeno de El Ni˜ no de 1998 y en la Foto Dcha., puede observarse el curso normal del r´ıo Paran´a.
Figura 1.8: Valle fluvial R´ıo Paran´a aleda˜ no a Corrientes, Foto Izq.:imagen Landsat 5 TM del 04/05/1998. Altura R´ıo Paran´a en Puerto Corrientes = 8.38m. Fuente: www.conae.gov.ar. Foto Dcha.: imagen Landsat 5 TM del 02/09/2007. Altura R´ıo Paran´a en Puerto Corrientes = 2.63m. Fuente: www.inpe.br.
En las inundaciones de 1998, producidas por la crecida de los r´ıos Paran´a y Uruguay afectaron principalmente a las zonas urbanas y periurbanas de las localidades ribere˜ nas, 28
mientras que las lluvias perjudicaron a las localidades del interior de la provincia con deficientes sistemas de drenaje urbano y a la zona rural. Durante todo el per´ıodo mencionado, las inundaciones afectaron a 135.763 personas, lo que representa el 79.1 % de los afectados por desastres en la provincia. Si se consideran los tres grandes eventos de inundaci´on, se tiene que El Ni˜ no de 19821983 afect´o sobre todo las localidades ribere˜ nas de Corrientes y Goya, donde las aguas permanecieron entre uno y varios meses.
1.3.7.
Estudios Actuales sobre Pron´ osticos de Inundaciones en Corrientes
De los estudios que actualmente se estan realizando sobre el pron´ostico de crecida y alturas del r´ıo Paran´a, podemos destacar dos estudios en especial:
1. Modelo de pron´ostico de inundaciones en el R´ıo Paran´a en Corrientes, basado en el Fen´omeno ENSO (El Ni˜ no / Oscilaci´on del Sur) 2. Evaluaci´on del riesgo ambiental por inundaci´on con SIG del valle fluvial del r´ıo Paran´a pr´oximo a los n´ ucleos urbanos de Resistencia y Corrientes
Modelo de pron´ ostico de inundaciones en el R´ıo Paran´ a en Corrientes, basado en el Fen´ omeno ENSO (El Ni˜ no / Oscilaci´ on del Sur) Es un estudio realizado por Flamenco, [Flamenco, 2010], [INTA and Flamenco, 2010], [INTA, 2010], en el que analiza la ocurrencia de episodios fuertes del fen´omeno El Ni˜ no que provocan impactos clim´aticos severos (sequ´ıas, inundaciones) en distintas regiones del planeta y en particular en el litoral de la Rep´ ublica Argentina, donde las consecuencias son inundaciones en el r´ıo Paran´a. Este trabajo trata de incorporar la influencia de la variabilidad clim´atica interanual en la predicci´on de los vol´ umenes de descarga del r´ıo Paran´a, en especial analiza que en el mes de Junio de 1997 hab´ıa evidencias claras del comienzo de un episodio El Ni˜ no en el centro y este del Oc´eano Pac´ıfico Ecuatorial, siendo necesario tener conocimiento con la mayor antelaci´on posible, de la magnitud de la crecida a esperar en el r´ıo Paran´a. Flamenco en base a ello elabora un modelo estad´ıstico de predicci´on de inundaciones en el r´ıo Paran´a, en la estaci´on de Corrientes Capital, basado en la variabilidad clim´atica global. El modelo es calibrado en el per´ıodo 1950-1996 aplicando la t´ecnica de Regresi´on M´ ultiple Lineal. Usa como predictores observaciones de las temperaturas de la superficie del mar (SST) del Oc´eano Pac´ıfico Ecuatorial, las de una regi´on oce´anica ubicada frente a las costas peruanas y el Indice de Oscilaci´on del Sur (SOI), y es posible aplicarlo en los primeros d´ıas del mes de Setiembre de cada a˜ no Ni˜ no. Con el objeto de evaluar la habilidad predictiva de este modelo, es realizado un an´alisis entre los vol´ umenes observados y simulados, aplicando la t´ecnica de validaci´on cruzada, siendo la diferencia promedio hist´orica entre dichos valores del 8.4 %. 29
Evaluaci´ on del riesgo ambiental por inundaci´ on con SIG del valle fluvial del R´ıo Paran´ a pr´ oximo a los n´ ucleos urbanos de Resistencia y Corrientes Basterra-Valiente-Glibota, [UNNE et al., 2010], analizan los pulsos hidrol´ogicos anuales del r´ıo Paran´a y su afectaci´on superficial en ´epocas de inundaciones en la morfolog´ıa de su complejo y extenso valle fluvial. En las cercan´ıas de Resistencia y Corrientes esta particularidad ha sido muy notoria en 1982/83, 1991/92 y 1997/98, a˜ nos en los que este r´ıo ha presentado caudales y vol´ umenes de escurrimiento extraordinarios por exceso. Como resultado final ellos determinan categor´ıas o niveles de riesgo ambiental por inundaci´on seg´ un que las inundaciones sean espor´adicas, poco frecuentes o moderadamente frecuentes y teniendo en cuenta su probabilidad de ocurrencia, las jerarquiza elaborando finalmente un mapa de riesgo que contempla los escenarios planteados.
1.3.8.
Fuentes de Datos para el Desarrollo de la Tesis
La recopilaci´on de informaci´on para el desarrrollo del presente trabajo, fue una tarea ardua, involucrando la solicitud de datos en varios Organismos P´ ublicos del ´ambito provincial y nacional. Inicialmente se solicit´o un historial completo de variables hidrol´ogicas y Meteorol´ogicas, en ocho intituciones. Los Organismos P´ ublicos, no cuentan con toda la informaci´on que se soliticitaba, en otros casos la tienen parcialmente, o con per´ıodos sin informaci´on en algunos datos solicitados; esta situaci´on dificult´o la obtenci´on de los datos, lo que prolong´o el tr´amite burocr´atico. Los datos finales con que se trabaja en la presente tesis, son datos diarios del per´ıodo de a˜ nos de 1989 a 2009, que han sido facilitados por las siguientes instituciones: SMN-Servicio Meteorol´ogico Nacional, Subsecretar´ıa de Planeamiento, Ministerio de Defensa, Rep. Argentina, [SMN, 2008 a 2013]. • Precipitaciones (mm)
• Temperaturas M´axima (o C)
• Temperaturas M´ınima (o C) • Temperaturas Media (o C)
• Humedad Relativa ( %)
• Viento Escalar Medio en Km/h
• Presi´on Atmosf´erica a nivel de la estaci´on (hPa) SNIH-Sistema Nacional de Informaci´on H´ıdrica de la Subsecretar´ıa de Recursos H´ıdricos, Secretar´ıa de Obras P´ ublicas, Ministerio de Planificacion Federal, Inversi´on Publica y Servicios, Rep. Argentina, [SNIH, 2008 a 2013]. • Altura del r´ıo Media (m)
• Caudal del r´ıo M´aximo (m3 /seg)
• Caudal del r´ıo M´ınimo (m3 /seg) • Caudal del r´ıo Media (m3 /seg)
• Precipitaciones (mm)
30
1.4.
Estructura de la Tesis
La presente Tesis Doctoral est´a organizada en dos partes, la Primera Parte corresponde al Estado del Conocimiento y Marco de Referencia que incluye el Cap´ıtulo (1) Introducci´on a la Problem´atica Planteada, que describe la problem´atica y las fundamentaciones que llevaron a la elecci´on del tema de la tesis, el Cap´ıtulo (2) Estado del Conocimiento, en el que se abordan los Fundamentos Te´oricos en los que se basan las Aportaciones Propuestas en la tesis y el Cap´ıtulo (3) Descripci´on Estad´ıstica del r´ıo Paran´a, en el que se realiza un estudio estad´ıstico descriptivo del comportamiento del r´ıo Paran´a. La Segunda Parte es la Implementaci´on y Validaci´on de las Aportaciones Propuestas en la tesis, que comprende el Cap´ıtulo (4) Aplicaci´on de Modelos de Series Temporales Lineales para Predicci´on, se presenta la generaci´on y chequeo de diferentes modelos de series temporales en la predicci´on de alturas del r´ıo en la localidad de Corrientes, en el Cap´ıtulo (5) Aplicaci´on de Modelos de Rede Neuronales para Predicci´on a Corto Plazo, se analizan y testean modelos de redes neuronales para hacer predicci´on a tres d´ıas de las alturas hidrom´etricas , en per´ıodos de inundaci´on, en la estaci´on de Corriente, en el Cap´ıtulo (6) Aplicaci´on de Modelos de Redes Neuronales para Predicci´on a Mediano Plazo, se presentan modelos de redes neuronales de diferentes arquitecturas y combinaci´on de ellos para hacer predicciones de alturas hidrom´etricas en per´ıodos de inundaci´on en la localidad de Corrientes, en el Cap´ıtulo (7) An´alisis de los Resultados Obtenidos, se realiza un An´alisis de los Resultados Obtenidos, comparando los resultados obtenidos en la investigaci´on de la presente tesis con los resultados de predicci´on del programa Pulso y se finaliza con las Conclusiones, donde se presentan los resultados finales a los que se ha llegado luego de la investigaci´on de la presente Tesis Doctoral.
31
32
Cap´ıtulo 2 Estado del Conocimiento 2.1.
Introducci´ on
En este Cap´ıtulo se analiza el Estado del Conocimiento en el que se fundamenta el presente trabajo, inicialmente en la Secci´on (2.2) se analiza los Procesos Estoc´asticos, siguiendo en la Secci´on (2.3), con los Procesos Deterministas Ca´oticos, continuando en la Secci´on (2.4), se inicia el an´alisis de los diferentes tipos de Modelos, como los Modelos F´ısicos , en particular los Casos de R´ıos, detallando los Modelos Hidrol´ogicos o de Onda Cinem´atica, los Modelos Hidrodin´amicos, los Modelos de Cuencas y Redes Fluviale, se presentan las Series Temporales, analizando los modelos ARIMA y las Redes Neuronales describiendo sus diferentes estructura, el entrenamiento, el aprendizaje y las funciones de activaci´on, analizando algunos tipos de redes, en la Secci´on (2.5) se mencionan las Redes Est´aticas, describiendo principalmente el Perceptr´on y las Redes Multicapa, en la Secci´on (2.6) se presentan las Redes Din´amicas, detallando las Redes con Retraso de TiempoFTDNN y redes de estructuras NAR, NARX y en la Secci´on (2.7) se describen las Redes Profundas y en la Secci´on (2.8) se describen los Algoritmos Evolutivos y en particular se mencionan los Algoritmos Gen´eticos.
2.2.
Procesos Estoc´ asticos
Constituye un Proceso Estoc´astico cada variable o conjunto de variables sometidas a influencias o impactos aleatorios, que evoluciona a lo largo del tiempo de forma parcial o totalmente aleatoria. Estas variables aleatorias (estoc´asticas) que evolucionan en funci´on de otra variable, generalmente el tiempo, teniendo cada una de las variables aleatorias del proceso su propia funci´on de distribuci´on de probabilidad y, entre ellas, pueden estar correlacionadas o no. Se pueden encontrar patrones de regularidad en diferentes secciones de una serie temporal, que pueden ser descritas mediante modelos basados en distribuciones de probabilidad, por lo cual se denomina un proceso estoc´astico a la secuencia ordenada de variables aleatorias Xt y su distribuci´on de probabilidad asociada, [Alberola L´opez, 2004]. Un ejemplo de este tipo de variables son las temperaturas en la ciudad de Corrientes, con variaciones diarias aumentando durante el d´ıa y bajando durante la noche y con variaciones estacionales aumenta en el verano a valores muy altos y desciende en invierno; su variaci´on es parcialmente determin´ıstica y parcialmente aleatoria como puede observarse 33
en la gr´afica de la Figura (2.1).
Figura 2.1: Ejemplo de Procesos Estoc´asticos: Temperaturas M´aximas y M´ınimas diarias de la ciudad de Corrientes en el a˜ no 1998. Al analizar variables con caracter´ısticas aleatorias que permanecen constantes a trav´es del tiempo, al incluir en el estudio la presencia de la variable determin´ıstica tiempo se considera que la variable aleatoria depende del tiempo y del fen´omeno probabil´ıstico, en consecuencia, cualquier funci´on que se establezca en t´erminos de la variable aleatoria, como lo son la funci´on de distribuci´on o la funci´on de densidad, ser´an tambi´en dependientes del tiempo. Tambi´en puede definirse un proceso estoc´astico como una colecci´on o familia de variables aleatorias Xt con t ǫ T , ordenadas seg´ un el sub´ındice t que se identifica con el tiempo. Por tanto, para cada instante t tendremos una variable aleatoria distinta representada por Xt , con lo que un proceso estoc´astico puede interpretarse como una sucesi´on de variables aleatorias cuyas caracter´ısticas pueden variar a lo largo del tiempo. Los posibles valores que puede tomar la variable aleatoria se denomina estados, por lo que se puede tener un espacio de estados discreto y un espacio de estados continuo, adem´as la variable tiempo puede ser de tipo discreto cuando los cambios de estado ocurren cada d´ıa por ejmplo y o de tipo continuo, donde los cambios de estado se podr´ıan realizar en cualquier instante. Dependiendo de c´omo sea el conjunto de sub´ındices T y el tipo de variable aleatoria dado Xt , se puede establecer la siguiente clasificaci´on de Procesos Estoc´asticos, que se sintetiza en el cuadro de la Figura (2.2): Cadena: el tiempo se mueve en forma discreta y la variable aleatoria s´olo toma valores discretos en el espacio de estados. 34
Proceso de Saltos Puros: los cambios de estados ocurren en forma aislada y aleatoria pero la variable aleatoria s´olo toma valores discretos en el espacio de estados. Proceso Continuo: los cambios de estado se producen en cualquier instante y hacia cualquier estado dentro de un espacio continuo de estados. Los cambios de estado se producen en instante determinados de tiempo y hacia cualquier estado dentro de un espacio continuo de estados.
Figura 2.2: Clasificaci´on de Procesos Estoc´asticos. Los Procesos Estoc´asticos pueden ser clasificados seg´ un el tiempo en: Tiempo Discreto: Cuando el valor de la variable s´olo puede cambiar en una serie de momentos determinados del tiempo, por ejemplo, los sorteos de la loter´ıa tienen lugar en determinadas fechas. Tiempo Continuo: Cuando el valor de la variable puede cambiar en cualquier momento del tiempo, por ejemplo, los cambios diarios de temperatura. Otra forma de clasificar a los Procesos Estoc´asticos es seg´ un la variable aleatoria en: Variable Continua: La variable puede tomar cualquier valor comprendido en un rango, por ejemplo la temperatura. Variable Discreta: La variable s´olo puede tomar determinados valores o estados discretos, por ejemplo los mercados financieros cotizan sus activos con unos precios que oscilan: de c´entimo de euro en c´entimo de euro, o en 1/8 de punto, etc.). Un proceso estoc´astico se define por una ley de probabilidad que gobierna la evoluci´on de una variable X (temperaturas, rendimientos, variaci´on de los tipos de inter´es etc.) a lo largo de un horizonte temporal t. De tal manera que para diferentes momentos del tiempo t1 < t2 < t3 ... podemos obtener la probabilidad de que los valores correspondientes x1 , x2 , x3 ..., se sit´ uen dentro de un rango espec´ıfico como, por ejemplo: P rob[a1 < x1 = b1 ]. P rob[a2 < x2 = b2 ]. P rob[a3 < x3 = b3 ]. Cuando se llegue al momento t1 y observemos el valor correspondiente de x1 , podemos condicionar la probabilidad de futuros sucesos, en base a la informaci´on conocida en un momento ti , como se ejemplifica en la Figura (2.3). 35
Figura 2.3: Procesos Estoc´asticos.
2.3.
Procesos Deterministas Ca´ oticos
La Teor´ıa del Caos trata ciertos tipos de sistemas din´amicos muy sensibles a las variaciones en las condiciones iniciales; son sistemas determin´ısticos, donde su comportamiento puede ser completamente establecido conociendo sus condiciones iniciales, pero con la caracter´ıstica particular de que peque˜ nas variaciones en las condiciones iniciales pueden implicar grandes diferencias en el comportamiento futuro, lo que hace dificil su predicci´on a largo plazo. El caos termina con la dicotom´ıa que exist´ıa bajo el enfoque determinista tradicional entre determinismo y aleatoriedad, [Prigogine, 1997]. La incertidumbre proviene de la ignorancia de las diversas causas involucradas en la realizaci´on de un evento as´ı como de la complejidad del mismo. Henri Poincar´e, uno de los pioneros en este campo, menciona que no son necesarios sistemas complejos para producir aleatoriedad, lo describe como sensibilidad a las condiciones iniciales, lo cual origina que un error peque˜ no en la medici´on de ´estas, se convierte en un gran efecto en el fen´omeno final, de manera que la predicci´on se convierte en imposible, [Poincar´e, 2009]. Tambi´en se puede definir un sistema ca´otico como un sistema din´amico no lineal, lo que constituye un ingrediente b´asico para garantizar la presencia del caos, tal que, si se parte de condiciones iniciales localizadas en una cierta regi´on, todas las trayectorias que se generan est´an uniformemente acotadas, pero, de tal modo que, aunque al principio est´an muy pr´oximas, con el tiempo unas divergen de otras de modo exponencial y sin embargo, todas las trayectorias poseen las mismas propiedades estad´ısticas. De modo que una trayectoria generada por un sistema determinista ca´otico se asemeja a la realizaci´on de un cierto proceso estoc´astico o serie temporal. Vemos as´ı que ciertas formas de determinismo pueden originar comportamientos ca´oticos que, a su vez, se asemejan a procesos aleatorios, [Gir´on Gonz´alez-Torre, 2013]. Los aspectos importantes asociados a la presencia del caos determinista son, [Gir´on Gonz´alez-Torre, 2013]: La no linealidad del sistema. La p´erdida de precisi´on, de car´acter exponencial, en la predicci´on. La imposibilidad de predecir a largo plazo. 36
El saber c´omo se comportan las trayectorias. El conocer las propiedades estad´ısticas de las trayectorias, en el caso de que presenten alguna regularidad de tipo estad´ıstico. La teor´ıa del caos proporciona un medio para producir un origen determinista para un proceso estoc´astico, a˜ nadiendo a las variables aleatorias otra posible fuente de azar, siendo de interer´es algunos aspectos, [Mateos de Cabo, 2013]: El comportamiento ca´otico puede ser extra˜ no, pero no es raro, de ah´ı su aplicaci´on a disciplinas tan diversas como la f´ısica, la qu´ımica, la meteorolog´ıa, la biolog´ıa, la epidemiolog´ıa y la medicina. El caos en una clase creciente de sistemas din´amicos, que puede ser descriptos a trav´es de un n´ umero relativamente peque˜ no de objetos matem´aticos y se han descubierto ciertas propiedades universales que no parecen depender del sistema espec´ıfico bajo estudio. La teor´ıa del caos presenta un car´acter interdisciplinario. Un ejemplo de Procesos Deterministas Ca´oticos, puede observarse en la Figura (2.4), en la que se presenta la simulaci´on de mercado en Monte Carlo del Costo Param´etrico Estimado o CER, los ejes de los gr´aficos son temporales y se presentan cinco ejemplos distintos interactuando entre s´ı, al observar las gr´aficas en su conjunto podr´ıamos decir que es ca´otico, pero si miramos cada ejemplo individualmente podemos predecir bastante bien, dentro de los l´ımites de Monte Carlo, d´onde se va a girar al alza o a la baja, [Ball, 2013].
2.4.
Modelos
Se denomina Modelo Cient´ıfico a una representaci´on conceptual, gr´afica, f´ısica o matem´atica, de fen´omenos, sistemas o procesos a fin de analizar, describir, explicar, simular, controlar y predecir esos fen´omenos o procesos; permite determinar un resultado final a partir de unos datos de entrada. Un modelo hace posible conocer o predecir propiedades que se desconocen del objeto real, porque debe existir una relaci´on de simetr´ıa entre el objeto real y el modelo, que permita asignar al primero las propiedades observadas en el segundo, lo que dar´a sentido a la aplicaci´on real de las respuestas derivadas del modelo. Puede considerarse que un modelo consta de: Conjunto de Reglas, de Representaci´ on de Entradas y de Salidas: permiten, partiendo de una realidad f´ısica definir un conjunto de datos de entrada o input, a partir de los cuales el modelo proporcionar´a un output o resultado final, que tambi´en ser´a una interpretaci´on del efecto de las condiciones iniciales elegidas sobre la realidad f´ısica. Estructura Interna: depende del tipo de modelo y permite definir una correspondencia entre entrada y salida, pudiendo ser: • Modelo Determinista: si a la mismo entrada le corresponde la misma salida. 37
Figura 2.4: Ejemplo de Procesos Deterministas Ca´oticos: Comportamiento de Mercados. Fuente: [Ball, 2013].
• Modelo no Determinista: si a la misma entrada, pueden corresponderle diferentes salidas. Un modelo es una representaci´on simplificada de la realidad, en la que se considera no toda la complejidad de la realidad sino el conjunto de propiedades que se desea estudiar y se construye estableciendo una relaci´on de correspondencia con la realidad, cuyas variantes pueden producir modelos de caracter´ısticas notablemente diferentes; por esta raz´on las reglas de representaci´on del modelo corresponden a un ´ambito cient´ıfico. En otras situaciones puede no existir una representaci´on adecuada de los datos o los resultados no ser interpretables, porque solo corresponden a las condiciones consideradas en el desarrollo del modelo.
2.4.1.
Modelos F´ısicos. Caso de R´ıos
Los modelos f´ısicos junto con los num´ericos, las mediciones reales y la experimentaci´on en el terreno, constituyen las herramientas de estudio del comportamiento de los r´ıos en per´ıodos normales como en situaciones extremas de inundaciones o de sequ´ıas prolongadas, de los procesos de sedimentaci´on o de erosi´on, como tambien las consecuencias que puede tener en su comportamiendo, la construccion de puentes, represas, centrales hidrol´ogica o defensas contra inundaciones. Este tipo de modelos son importantes para realizar estudios del comportamiento del 38
r´ıo y su influencia en zonas costeras inundables en relaci´on con las diferentes alturas del r´ıo, que deben ser analizadas en el dise˜ no de las obras definitivas de defensa contra las inundaciones fluviales y constituyen un conjunto de medios complementarios, cuya aplicaci´on permite optimizar sus capacidades y utilizar sus sinergias para alcanzar la mejor soluci´on para el problema en estudio. El modelo f´ısico, en el caso de estudios de r´ıos es la reproducci´on a escala reducida de las magnitudes m´as representativas del sistema hidrol´ogico o elementos a ensayar, el cual, con las simplificaciones introducidas seg´ un las necesidades de cada caso, constituye el prototipo, como se detalla en las im´agenes de la Figura (2.5), que presentan el desarrollo del prototipo de estudio de inundaciones del r´ıo Mero, en La Coru˜ na, Espa˜ na.
Figura 2.5: Modelo F´ısico del r´ıo Mero, (La Coru˜ na-Espa˜ na), con el objetivo de hidrodin´amica (flujo complejo) y altura de inundaci´on. Fuente: [Vide, 2013].
La teor´ıa de los modelos f´ısicos se basa en que a partir de las magnitudes fundamentales como longitud (L), tiempo (t) y masa (M ), considerando las restantes magnitudes que intervienen en la mec´anica de fluidos como predeterminadas o son magnitudes derivadas y en que en este sistema (L − t − M ) las ecuaciones hidrodin´amicas del fluido son adimensionales, por lo tanto se mantienen invariantes frente a una transformaci´on del tipo, [Guti´errez Serret, 2013]: Lp = λLm ; t p = λt t m ; Mp =λM Mm ; siendo [m: modelo, p: prototipo] De esta manera, si se conoce el comportamiento en el modelo (sistema Lm −tm −Mm ) de un determinado fen´omeno, te´oricamente es posible deducir dicho fen´omeno en el prototipo (sistema Lp − tp − Mp ), sin m´as que utilizar para cada magnitud el cambio de escala seg´ un los valores de los par´ametros λ, λt y λM adoptados en la transformaci´on anterior. En dicha transformaci´on cada ecuaci´on representa lo que en la teor´ıa de modelos f´ısicos se conoce como semejanzas modelo-prototipo, pudiendo considerarse las siguientes semejanzas, [Guti´errez Serret, 2013]: Semejanza Geom´etrica (λ): determina que la relaci´on de dimensiones hom´ologas modelo-prototipo es constante, denomin´andose a dicha relaci´on escala geom´etrica o 39
simplemente escala. En esta semejanza s´olo influyen aspectos de forma, destac´andose los detalles geom´etricos y la rugosidad superficial, los cuales representan una primera dificultad para que la semejanza modelo-prototipo sea completa. Semejanza Cinem´atica (λt ): implica la similitud de movimientos modelo-prototipo, lo que junto a la semejanza geom´etrica determina que las trayectorias de part´ıculas hom´ologas modelo-prototipo sean semejantes. En este caso, la relaci´on de semejanza (λt ) se conoce como escala de tiempos. Semejanza Din´ amica (λM ): entre dos sistemas geom´etrica y cinem´aticamente semejantes supone la constancia de la relaci´on de masas y, por lo tanto, de fuerzas en elementos hom´ologos. La relaci´on entre masas es la escala de masas (λM ). Como se ha indicado, las ecuaciones de la hidrodin´amica permanecen invariantes en la transformaci´on modelo-prototipo, pero no ocurre lo mismo con el fluido, que no se puede reproducir a escala. Sus caracter´ısticas f´ısicas (densidad, viscosidad, etc.), a efectos del modelo, cambian respecto a las que tiene en el prototipo de acuerdo con las escalas elegidas (λ, λt y λM ). La imposibilidad de lograr una semejanza geom´etrica completa por la dificultad de reproducir plenamente forma y rugosidad. Con la semejanza din´amica este problema aumenta, pues la relaci´on entre las fuerzas que act´ uan en el prototipo gravedad, viscosidad, tensi´on superficial, el´asticas y de presi´on y en el modelo no se mantiene constante, ni su importancia en ambos sistemas es la misma. Sin embargo, en la pr´actica, una semejanza din´amica parcial, basada en las fuerzas predominantes en cada caso es suficiente para que el modelo facilite la soluci´on del problema que con el ensayo se busca, surgen as´ı los diversos criterios de semejanza din´amica parcial, en esta semejanza parcial dos de sus escalas, tiempo y masa (λt y λM ), quedan prefijadas al determinar la fuerza preponderante en el fen´omeno y el fluido a utilizar, por lo que la u ´nica escala a elegir es la geom´etrica (λ). Esto se realiza de forma que el modelo tenga las dimensiones necesarias para que los ensayos sean representativos de la realidad, [Guti´errez Serret, 2013]. Modelos Hidrol´ ogicos o de Onda Cinem´ atica Tr´ ansito de Caudales El tr´ansito de caudales es un procedimiento para determinar la magnitud del caudal, las elevaciones y sus tiempos, en un punto del curso de agua utilizando hidrogramas conocidos o supuestos en uno o m´as puntos. Si el flujo es una creciente, el procedimiento se conoce espec´ıficamente como tr´ansito de crecientes, [EFN-UNCOR, 2013]. El tr´ansito de inundaci´on, describe el movimiento de esa onda de creciente cuando atraviesa un cauce, teniendo particular inter´es analizar la reducci´on del caudal pico mientras se dirige aguas abajo, denominada atenuaci´on, como el tiempo m´aximo que el flujo de agua llega hacia los puntos de importancia, estimar la altura m´axima de agua que se puede acumular en puntos de importancia y de qu´e manera cambia la hidrograf´ıa del lugar mientras se mueve aguas abajo, terminar´ıa cuando entra en un embalse o en un gran cuerpo de agua que pueda recibir el volumen de agua sin un incremento significativo en el nivel o cuando la creciente se ha atenuado presentando un caudal que no supera el correspondiente al caudal de 100 a˜ nos de recurrencia para la planicie de inundaci´on. 40
El escurrimiento de una onda de creciente en un canal produce la atenuaci´on y disminuci´on de la onda debido al: Almacenamiento tanto en el canal principal como en las planicies de inundaci´on, la existencia de a´reas en las que se pueda acumular agua fuera del canal principal. Rugosidad entre las superficies del canal y zonas aleda˜ nas. Difusi´on debido al gradiente de presi´on. Forma del hidrograma de creciente cuando llega al cauce. Escurrimiento Superficial Las ecuaciones de Saint-Venant, escritas por primera vez por Barr´e de Saint Venant en 1871, sirven para describir el escurrimiento superficial tanto del r´egimen gradualmente variable, como el r´apidamente variable, esos efectos son representados por medio de la ecuaci´on de Continuidad, Primera Ecuaci´on, ver (2.1), que considera la amortiguaci´on debido a la variaci´on de la capacidad de almacenamiento del sistema y a la ecuaci´on de la Cantidad de Movimiento, Segunda Ecuaci´on, ver (2.2), que representa a la gravedad, agotamiento, presi´on e inercia del flujo. δQ δA + =q δx δt
(2.1)
donde: Q es el caudal en (m3 /s) que circula por A, x distancia longitudinal a lo largo del canal o r´ıo (m), A a´rea hidr´aulica (m2 ), ´area de la secci´on transversal al flujo, t tiempo, q descarga lateral (m2 /s) (q > 0: flujo entrante y q < 0: flujo saliente).
δQ δ + δt δx
2 Q δy = g.A.(S0 − Sf ) + g.A. A δx
donde: Q es el caudal en (m3 /s) que circula por A, t tiempo, x distancia longitudinal a lo largo del canal o r´ıo (m), A a´rea hidr´aulica (m2 ), ´area de la secci´on transversal al flujo, g aceleraci´on de la gravedad (m/s2 ). 41
(2.2)
y cota de la superficie de la l´amina de agua (m), S0 pendiente del fondo del canal, Sf pendiente de fricci´on, El escurrimiento superficial se encuentra regido por leyes f´ısicas que son representadas cuantitativamente por variables tales como el caudal (Q), el a´rea hidra´ ulica (A) y la cota de superficie de la l´amina de agua (y), mientras que el comportamiento del mismo, es descrito por tres principios fundamentales, [EFN-UNCOR, 2013]: Conservaci´ on de la Masa: que se estima por la Primer Ecuaci´on de Saint Venant,(2.1). Conservaci´ on de la Cantidad de Movimiento: que se calcula por la Segunda Ecuaci´on de Saint Venant, (2.2). Conservaci´ on de Energ´ıa: la cual normalmente no es empleada en flujo a superficie libre. Las ecuaciones de Saint Venant, a pesar de las simplificaciones adoptadas, son capaces de representar la mayor´ıa de los problemas de escurrimientos en r´ıos, canales, embalses y sobre la cuenca de aporte, describen el movimiento del agua a superficie libre en un canal y son el resultado de aplicar los principios de la conservaci´on de la masa y de la cantidad de movimiento, bajo las siguientes hip´otesis simplificatorias, [Chow, 2004] : El flujo es unidimensional e incompresible: con densidad constante, el tirante hidr´aulico y la velocidad del flujo var´ıan s´olo en la direcci´on del eje longitudinal del canal. La velocidad es uniforme y la superficie libre es horizontal a trav´es de cualquier secci´on perpendicular al eje. Las l´ıneas de flujo no tienen curvatura pronunciada: esto significa que el flujo var´ıa gradualmente a lo largo del canal, de forma que las aceleraciones verticales puedan considerarse despreciables. Lo anterior implica que la distribuci´on de presiones sea hidrost´atica. El fondo del canal es fijo y de pendiente peque˜ na: de modo que la profundidad del flujo y el tirante son aproximadamente id´enticos, de tal suerte que los efectos de socavaci´on y deposici´on son despreciables. Los coeficientes de resistencia: para flujo uniforme permanente turbulento son aplicables relaciones como la ecuaci´on de Manning, que puede utilizarse para describir los efectos de resistencia, esta f´ormula utiliza el coeficiente de rugosidad de Manning que depende del material con el que se halla construido el canal y se encuentra tabulado, lo que facilicta su aplicaci´on. Los sistemas de escurrimiento pueden tener diferentes caracter´ısticas predominando en cada caso, con uno o m´as efectos sobre el flujo. El tr´ansito de caudales puede considerarse como un an´alisis para seguir el caudal a trav´es de un sistema, dada una entrada. Los m´etodos existentes para el tr´ansito en cauces se pueden dividir en dos tipos, [Chow, 2004]: 42
M´etodos Hidr´aulicos: tambi´en llamados distribuidos, el flujo se calcula como una funci´on del tiempo y el espacio. Son aquellos modelos que emplean las dos ecuaciones de Saint Venant. M´etodos Hidrol´ogicos: los flujos se calculan como una funci´on del tiempo u ´nicamente en un lugar particular. Son modelos que consideran solamente los efectos de almacenamiento, despreciando los t´erminos de la ecuaci´on de cantidad de movimiento de la Segunda Ecuaci´on de Saint Venant.
Modelos Hidr´ aulicos Los modelos hidr´aulicos son sistemas que simulan una situaci´on de la realidad, con un prototipo el cual mediante la entrada de cierta informaci´on, la procesa y presenta la salida resultante, que puede emplearse para el estudio del fen´omeno de la realidad implementado en el prototipo, con ciertas condiciones matem´aticas definidas. Al definir la investigaci´on experimental de la situaci´on a ser estudiada, por ejemplo como afectar´a una inundaci´on a una regi´on, se analizan todas las variables que intervienen, en forma particular o en grupo, para poder verificar en su caso la validez de soluciones anal´ıticas de un problema dado, o determinar las relaciones entre las diferentes variables que, extrapoladas al prototipo, permitan optimizar la eficiencia de cada uno de los elementos del sistema modelo-prototipo. Este tipo de modelos se basa en esquemas num´ericos de relativa sencillez, de gran eficacia, que pueden contemplar cambios de r´egimen, cauces de geometr´ıas completas y c´alculos para determinaci´on de llanuras de inundaci´on. Modelos Hidrol´ ogicos o de Onda Cinem´ atica Un Modelo Hidrol´ogico se incluye en la categor´ıa de modelos simb´olicos, los cuales llegan a un nivel superior de abstracci´on ya que el objeto queda representado mediante una simbolizaci´on matem´atica o gr´afica, consecuentemente, las relaciones de correspondencia que se establecen con el objeto tienen la forma de algoritmos o formalismos matem´aticos. El modelo hidrol´ogico tiene en cuenta dos tipos de par´ametros, unos dependen u ´nicamente de caracter´ısticas f´ısicas de la cuenca como fisiograf´ıa, vegetaci´on, usos y tipo de suelo, y son por tanto invariables e independientes, en un principio, de los fen´omenos de precipitaci´on. Otros par´ametros en cambio est´an sujetos a la consideraci´on de ciertas hip´otesis a la hora de su definici´on; estos u ´ltimos son todos aquellos relacionados con las precipitaciones; la duraci´on de las precipitaciones, cantidad de precipitaci´on, y su distribuci´on temporal. La definici´on de estos u ´ltimos par´ametros dar´a como resultado el c´alculo de la precipitaci´on. Conocidos todos los par´ametros se puede realizar una simulaci´on del fen´omeno de avenida, conociendo de esta manera los caudales generados por la cuenca, y por las subunidades que la integran en particular. Si en los m´etodos se desprecian los t´erminos de aceleraci´on local, convectiva y si adem´as no se consideran los t´erminos de presi´on estamos en presencia de un modelo hidrol´ogico de onda cinem´atica. En la onda cinem´atica el modelo queda descripto por la ecuaci´on de continuidad o Primera Ecuaci´on de Saint Venant, que se detalla en la Ecuaci´on (2.1) y por la ecuaci´on de cantidad de movimiento, se tiene que S0 = Sf . 43
Modelos Hidrodin´ amicos La modelaci´on hidrodin´amica de procesos de inundaci´on en valles aluviales constituye la base para el an´alisis de importantes problemas hidroambientales, siendo el modelo num´erico la representaci´on del sistema real, utilizando desarrollos matem´aticos. Algunos autores indican que los modelos Hidrodin´amicos 2D son la tecnolog´ıa actual para la modelaci´on de inundaciones, sin embargo, ´estos modelos tienen la desventaja de que su aplicaci´on est´a limitada por los altos requerimientos de datos, hardware y software. A su vez, los modelos Hidrodin´amicos 1D son ampliamente usados y dan resultados precisos en el cauce principal del r´ıo, pero son menos exactos para modelar el flujo de desbordamiento sobre las m´argenes hacia las planicies adyacentes. Por u ´ltimos, los modelos Hidrodin´amicos cuasi-2D permiten simular num´ericamente los procesos de inundaci´on en sistemas de cauce-planicie en grandes r´ıos aluviales de llanura. [UDC, 2011]. Los modelos de r´ıos usados para la modelaci´on de inundaciones pueden clasificarse como modelos hidrodin´amicos 1D o 2D o cuasi-2D, presentando las siguientes particularidades cada uno de ellos: Modelos Hidrodin´ amicos Unidimensional del Flujo de Canal - 1D: son ampliamente usados, est´an basados en las ecuaciones de San Venant, leyes de conservaci´on de la masa, (2.1) y momento (2.2), para calcular la superficie libre del agua para flujo estacionario y no estacionario en canales abiertos. Estas ecuaciones diferenciales parciales se resuelven mediante discretizaci´on num´erica, usando frecuentemente el m´etodo de diferencias finitas, en algunos casos mediante elementos finitos o vol´ umenes finitos, en un esquema impl´ıcito. Modelos Hidrodin´ amicos Bidimensional del Flujo de Superficie - 2D: son los mas actuales para la modelaci´on de inundaciones. En estos modelos las ecuaciones de conservaci´on de la masa ver (2.1) y momento ver (2.2), son expresadas en dos dimensiones. Los resultados se calculan en cada punto de la malla en el dominio de soluci´on y pueden resolverse usando el m´etodo de los elementos finitos. Modelos Hidrodin´ amicos cuasi-2D: es una aproximaci´on a los modelos-2D, son los mas aplicables en llanuras de inundaci´on, son modeladas como ramales de r´ıo separados y conectadas al cauce principal por medio de vertederos o estructuras de desbordamiento. Esto permite el modelado del flujo de agua que desborda sobre la planicie de inundaci´on cuando el nivel del agua excede los bancos o diques del r´ıo. Un modelo hidrodin´amico 2D, resuelve las ecuaciones de aguas someras promediadas en profundidad, tambi´en conocidas como 2D Shallow Water Equations (Ecuaciones en aguas poco profundas)(2D-SWE) o ecuaciones de St.Venant bidimensionales. Dichas ecuaciones asumen una distribuci´on de presi´on hidrost´atica y una distribuci´on relativamente uniforme de la velocidad en profundidad. La hip´otesis de presi´on hidrost´atica se cumple razonablemente en el flujo en r´ıos, as´ı como en las corrientes generadas por la marea en estuarios y zonas costeras. As´ımismo, la hip´otesis de distribuci´on uniforme de velocidad en profundidad se cumple habitualmente en r´ıos y estuarios, aunque pueden existir zonas en las que dicha hip´otesis no se cumpla debido a flujos locales tridimensionales o a cu˜ nas salinas. En estos casos es necesario estudiar la extensi´on de dichas zonas y su posible repercusi´on en los resultados del modelo. En la actualidad, los modelos num´ericos basados en las 2D-SWE son los m´as utilizados en estudios de din´amica fluvial y litoral, 44
evaluaci´on de zonas inundables, transporte de sedimentos y contaminantes. Consideran para la modelaci´on, los siguientes t´erminos fuente en las ecuaciones 2D-SWE, [UDC, 2011]: Pendiente del fondo Presi´on hidrost´atica Tensiones tangenciales viscosas Tensiones tangenciales turbulentas Rozamiento superficial por viento Rozamiento del fondo Fuerza de Coriolis Fuente sumidero de masa de agua (simulaci´on de lluvia, infiltraci´on, sumideros,etc.) Modelos Comerciales: Se detallan algunos de los Modelos Hidrodin´amicos, disponibles comercialmente: Mike 11/21 : Entorno integral para la modelizaci´on hidrodin´amica 1D y 2D, desarrollado por Danish Hydraulic Institute. Guad 2D: Modelo desarrollado a partir de los resultados de la Universidad de Zaragoza y comercializado por la empresa INCLAM. Riverine: Interfaz com´ un para un conjunto de aplicaciones hidrodin´amicas, distribuido por Scientific Software Group. Incluye las licencias para los modelos RMA, FESWMS y HIVEL 2D. TUFLOW : Modelo distribuido por Scientific Software Group con una interfaz similar a la del paquete Riverine. Sobek : Entorno integral para la modelizaci´on hidrodin´amica 1D y 2D, desarrollado por Delft Hydraulics. Inforworks: Entorno integral para la modelizaci´on hidrodin´amica 1D y 2D, desarrollado por Wallingford. Modelos Gratuitos: Se detallan algunos de los Modelos Hidrodin´amicos, disponibles gatuitamente: HEC-RAS : Modelo de c´alculo de perfiles de l´amina de agua, desarrollado por Hydrologic Engineering center del U.S. Army Corps of Engineers. River 2D: Modelo hidrodin´amico bidimensional desarrollado para la simulaci´on de h´abitats fluviales. Iber : Modelo de c´alculo 2D en r´ıos y estuarios desarrollado a partir de los modelos Carpa (UPC) y Turbill´on (UC) y distribuido por el CEDEX. 45
Modelos de Cuencas y Redes Fluviales Con objeto de poder representar adecuadamente el comportamiento hidrol´ogico de una determinada cuenca es preciso, llevar a cabo una representaci´on esquem´atica de la misma, que refleje de la mejor manera posible, su morfolog´ıa y las caracter´ısticas de su red de drenaje. En dicha representaci´on esquem´atica se utilizan generalmente diversos tipos de elementos, dentro de los cuales se desarrollan los procesos hidrol´ogicos, [UNICAN, 2004]. La modelaci´on de sistemas hidrol´ogicos entre otras caracter´ısticas, es un medio relativamente de bajo costo utilizado para evaluar los efectos de corto y largo plazo de las actividades humanas sobre los procesos hidrol´ogicos en una cuenca. Adicionalmente, estos Modelos Hidrol´ogicos proveen una herramienta de ayuda en la toma de decisiones para mitigar y disminuir los impactos de proyectos sobre la cuenca. Los problemas de toma de decisiones en ingenier´ıa de recursos h´ıdricos referentes a la asignaci´on eficiente de agua pueden ser modelados y formulados como problemas de optimizaci´on. El gran n´ umero de variables, la no linealidad, la naturaleza estoc´astica de los flujos, los conflictos provocados por los m´ ultiples usos del agua, la operaci´on integrada de varios reservorios y las restricciones existentes, conforman un sistema h´ıdrico complejo. Con el avance computacional tanto en equipos y en programas, en los u ´ltimos a˜ nos el problema de asignaci´on de agua entre m´ ultiples usos se ha solucionado de manera satisfactoria. La elecci´on del m´etodo depende de las caracter´ısticas del sistema, de la disponibilidad de informaci´on, de los objetivos y restricciones, [Laqui Vilca, 2007]. En el modelado de Cuencas se incluyen diferentes de elementos, cuya descripci´on y funcionalidad se indican a continuaci´on, [UNICAN, 2004]: Subcuenca: Este tipo de elemento se caracteriza porque no recibe ning´ un flujo entrante y da lugar a un u ´nico flujo saliente, que es el que se genera en la subcuenca a partir de los datos meteorol´ogicos, una vez descontadas las p´erdidas de agua, transformado el exceso de precipitaci´on en escorrent´ıa superficial y a˜ nadido el flujo base. Se utiliza para representar cuencas vertientes de muy variado tama˜ no. Tramo de cauce: Se caracteriza porque recibe uno o varios flujos entrantes y da lugar a un solo flujo saliente. Los flujos entrantes, que provienen de otros elementos de la cuenca, tales como subcuencas u otros tramos de cauce, se suman antes de abordar el c´alculo del flujo saliente. Este tipo de elementos se suele utilizar para representar tramos de r´ıos o arroyos en los que se produce el tr´ansito de un determinado hidrograma. Embalse: Es un tipo de elemento que recibe uno o varios flujos entrantes, procedentes de otros elementos, y proporciona como resultado del c´alculo un u ´nico flujo saliente. Se utiliza para poder representar fen´omenos de laminaci´on de avenidas en lagos y embalses. Confluencia: Se caracteriza porque recibe uno o varios flujos entrantes y da lugar a un solo flujo saliente, con la particularidad de que el flujo saliente se obtiene directamente como suma de los flujos entrantes, considerando nula la variaci´on del volumen almacenado en la misma. Permite representar la confluencia propiamente dicha de r´ıos o arroyos, aunque ello no es imprescindible, ya que los flujos entrantes pueden proceder tambi´en de subcuencas parciales. 46
Derivaci´on: Este tipo de elemento se caracteriza porque da lugar a dos flujos salientes, principal y derivado, procedentes de uno o m´as flujos entrantes. Se puede utilizar para representar la existencia de vertederos laterales que derivan el agua hacia canales o zonas de almacenamiento separadas del cauce propiamente dicho. Fuente: Junto con la subcuenca, es una de las dos maneras de generar caudal en el modelo de cuenca. Se suele utilizar para representar condiciones de contorno en el extremo de aguas arriba y el caudal considerado puede proceder del resultado del c´alculo efectuado en otras cuencas. Sumidero: Recibe uno o varios flujos entrantes y no da lugar a ning´ un flujo saliente. Este tipo de elemento puede ser utilizado para representar el punto m´as bajo de una cuenca endorreica o el punto de desag¨ ue final de la cuenca en cuesti´on. Analizando aspectos generales del modelado de Cuencas Hidrograficas se presentan los modelos matem´aticos de simulaci´on y optimizaci´on de sistemas hidr´aulicos, con sus car´acterisitcas propias [Laqui Vilca, 2007]: Modelos de Simulaci´on: ofrecen una representaci´on del mundo real a trav´es de la realidad computacional con el objetivo de permitir la planificaci´on y generaci´on de un an´alisis de alternativas, antes de la implementaci´on de cualquiera de ellas, dando una gran libertad y flexibilidad. La simulaci´on se define como un conjunto de expresiones matem´aticas estructuradas en una secuencia l´ogica que describen la operaci´on del sistema en el espacio y en el tiempo. Asimismo la simulaci´on procura presentar un sistema con sus aspectos m´as importantes, un modelo de simulaci´on no determina, por ejemplo, la pol´ıtica o´ptima de un sistema de reservorios, sino que a partir de la definici´on de la pol´ıtica de operaci´on a seguir, el modelo de simulaci´on permite conocer los niveles de los reservorios y de otras variables pertinentes a lo largo del tiempo. Los modelos de simulaci´on son clasificados en: modelos f´ısicos, modelos anal´ogicos e modelos digitales y/o matem´aticos. • F´ısicos: El sistema es representado por un prototipo a escala reducida. • Anal´ogicos: Vali´endose de la analog´ıa de las ecuaciones que rigen diferentes fen´omenos para modelar, el sistema m´as conveniente, el fen´omeno m´as complejo. • Matem´ aticos y/o Digitales: Representan la naturaleza del sistema a trav´es de ecuaciones matem´aticas. Los modelos f´ısicos y anal´ogicos tienen ventajas cuando las leyes f´ısicas no pueden ser expresadas en forma resumida y con ecuaciones f´aciles de resolver, en cuanto a los modelos matem´aticos son m´as vers´atiles, pudi´endose modificar su l´ogica, obteni´endose resultados de diferentes situaciones de un mismo sistema o de diferentes sistemas, otras ventajas son la alta velocidad de procesamiento de las computadoras, bajo costo y mayor flexibilidad para los modeladores que gustan de hacer cambios. Modelos de Optimizaci´on: cuando en el an´alisis de sistemas existe el inter´es de optimizar el proceso de acuerdo con la valoraci´on establecida por la funci´on objetivo se deben aplicar las t´ecnicas de optimizaci´on. 47
Para decidir entre un modelo de optimizaci´on y otro de simulaci´on, se debe considerar la complejidad del sistema estudiado, las caracter´ısticas del sistema considerado, la disponibilidad de informaci´on, los objetivos y restricciones especificadas, los cuales posibilitar´an la elecci´on de modelos de optimizaci´on o modelos de simulaci´on, o una combinaci´on de los mismos. En los casos donde se tenga el conocimiento de los fen´omenos y donde se pueda deducir ecuaciones que describan y gobiernen el sistema, estos pueden ser tratados por un modelo de simulaci´on matem´aticos. Para sistemas complejos que no pueden ser analizados directamente a trav´es de metodolog´ıas anal´ıticas formales, se usar´a la simulaci´on f´ısica o anal´ogica, [Laqui Vilca, 2007].
2.4.2.
Series Temporales
Una serie temporal o cronol´ogica es una secuencia de datos, observaciones o valores, medidos en determinados momentos del tiempo, hist´orica u ordenados cronol´ogicamente, normalmente espaciados entre s´ı de manera uniforme; tambi´en puede definirse como una sucesi´on de observaciones cuantitativas de un fen´omeno ordenadas en el tiempo. El an´alisis de series temporales comprende m´etodos que ayudan a interpretar este tipo de datos, extrayendo informaci´on representativa, tanto referente a los or´ıgenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro, [Pe˜ na S´anchez de Rivera, 2005]. Los valores de una serie temporal van ligados a instantes del tiempo, entonces, el an´alisis de una serie implica el manejo conjunto de dos variables, siendo una de ellas la serie temporal y la otra los intervalos o instantes del tiempo sobre los cuales se han realizado las observaciones. Hay que se˜ nalar que esa observaci´on sincronizada de la variable en el tiempo, implica que los valores de la misma han de estar perfectamente ordenados, de igual modo que los intervalos del tiempo lo est´an. Para que el an´alisis de una serie temporal conduzca a conclusiones acertadas, adem´as de utilizar las t´ecnicas apropiadas, ser´a imprescindible que esos datos sean comparables y no lo ser´an nunca si no son homog´eneos, por ejemplo si cada a˜ no cambia la metodolog´ıa de observaci´on, se cambian las definiciones, se modifica la poblaci´on de referencia, etc., el resultado ser´a una serie temporal compuesta por un conjunto de valores no comparables porque son muy heterog´eneos. Esta falta de homogeneidad se pierde, de una forma natural, con el transcurso del tiempo, de manera que cuando las series son muy largas no hay garant´ıa de que los datos iniciales y finales sean comparables, pero esta necesidad es recomendable que las series no sean muy largas, para que sus datos no pierdan la deseable homogeneidad, [S´anchez Fern´andez, 2004]. Lo que se pretende con una serie es describir y predecir el comportamiento de un fen´omeno que cambia en el tiempo. Esas variaciones que experimenta una serie temporal pueden ser de naturaleza doble, por un lado las variaciones pueden ser, evolutivas o estaciones, por lo cual se tendr´an: Series Evolutivas: presentan variaciones evolutivas, cuando el valor medio de la serie cambia, no permanece fijo a lo largo del tiempo. Series Estacionarias: presentan variaciones estacionarias, son aquellas en las que su valor medio no cambia, aunque sufra oscilaciones en torno a ese valor medio fijo o constante. Una serie es estacionaria cuando se encuentra en equilibrio estad´ıstico, en el sentido de que sus propiedades no var´ıan a lo largo del tiempo, por lo tanto no 48
pueden existir tendencias. Un proceso es no estacionario si sus propiedades var´ıan con el tiempo, como el clima o la altura de un r´ıo. Hay dos aspectos en el estudio de las series de tiempo, [Abril, 2004]: 1. An´alisis: El objetivo del an´alisis es resumir las propiedades de una serie y remarcar sus caracter´ısticas salientes, pudiendo hacerse tanto: En el dominio del Tiempo: se relacionan las observaciones en puntos distintos de tiempos. En el dominio de las Frecuencias: se estudian los movimientos con diferente periodicidad. 2. Modelado: La raz´on de modelar una serie de tiempo es para permitir la predicci´on de sus valores futuros. La caracter´ıstica distintiva de un modelado de serie de tiempo, opuesto a un modelado econom´etrico de serie de tiempo, es que no se realiza ning´ un intento para formular una relaci´on de comportamiento entre la serie de tiempo considerada y otras variables. Los movimientos de la serie son explicados solamente en t´erminos de su propio pasado o por su posici´on en relaci´on al tiempo y las predicciones se realizan mediante extrapolaci´on. Modelado Cl´ asico de Series Temporales La forma m´as sencilla de iniciar el an´alisis de una serie temporal, es mediante su representaci´on gr´afica con un sistema cartesiano en el que los valores o periodos de tiempo t se llevan al eje de abscisas y los valores de la serie, yt , se tienen en el eje de ordenadas, obteniendo un diagrama de dispersi´on, con la particularidad de que el eje de abscisas se reserva siempre a la misma variable: el tiempo, t . Mediante este tipo de representaci´on se pueden detectar las caracter´ısticas m´as sobresalientes de una serie, tales como el movimiento a largo plazo, la amplitud de las oscilaciones, la posible existencia de ciclos, los puntos de ruptura, la presencia de valores at´ıpicos o an´omalos, etc. Un ejemplo de este tipo de an´alisis de gr´aficas se presenta en la Figura (2.6), donde se ha representado la serie del paro registrado en Espa˜ na para un periodo de cinco a˜ nos con datos mensuales. Los datos base del gr´afico se detallan en la Tabla de la Figura (2.7). Una vez iniciado el proceso de descripci´on de una serie y superado el primer paso que consiste en su representaci´on gr´afica, para poder llegar a conclusiones m´as definitivas respecto del comportamiento de la serie, es conveniente recurrir a otras t´ecnicas que superen el an´alisis gr´afico. El objetivo del an´alisis de series temporales es doble, por un lado se busca explicar las variaciones observadas en la serie en el pasado, tratando de determinar si responden a un determinado patr´on de comportamiento y por otro, si se consigue definir ese patr´on o modelo, se intentar´a predecir valores futuro de la misma. Para alcanzar este doble objetivo se utiliza una metodolog´ıa, seg´ un la cual la serie temporal es una funci´on del tiempo: yt = f (t), la serie es una variable dependiente y el tiempo una variable independiente o explicativa. Sin embargo, el tiempo, no es una variable explicativa, es simplemente el soporte o escenario en el que se realiza o tiene lugar la serie temporal. El tiempo no sirve para explicar el comportamiento de la serie. 49
Figura 2.6: Series Temporales: Gr´afica de la Evoluci´on del paro en Espa˜ na. Fuente: [S´anchez Fern´andez, 2004].
Figura 2.7: Series Temporales: Tabla de datos de la Evoluci´on del paro en Espa˜ na. Fuente: Servidor Web INE, en [S´anchez Fern´andez, 2004].
Tambi´en se puede optar por otro enfoque de tipo causal, donde las variaciones de una serie podr´ıan explicarse mediante las de otro conjunto de series temporales. El an´alisis m´as cl´asico de las series temporales se basa en la suposici´on de que los valores que toma la variable de observaci´on es la consecuencia de cuatro componentes: Tendencia Regular o Secular, Variaci´on Estacional, Variaci´on C´ıclica y Variaci´on Aleatoria, 50
Figura 2.8: Series Temporales: Gr´afica de la Evoluci´on del paro en Espa˜ na conjuntamente con la Tendencia de la serie. Fuente: [S´anchez Fern´andez, 2004].
cuya actuaci´on conjunta da como resultado los valores medidos. Pero esta descomposici´on de la serie, no deja de ser un procedimiento dise˜ nado para que el estudio de la misma resulte m´as f´acil, pues esas componentes no siempre existen. As´ı cuando se trabaja con datos anuales la serie no puede presentar estacionalidad. A su vez las variaciones c´ıclicas son una componente ligada especialmente a las variables de tipo econ´omico, pero que en variables de otra naturaleza puede que no est´e presente. Estos componentes se definen de la siguiente manera, [Spiegel, 1978] y [S´anchez Fern´andez, 2004]: 1. Tendencia Regular o Secular - T : Indica la marcha general y persistente del fen´omeno observado, es una componente de la serie que refleja la evoluci´on a largo plazo. Para poder detectarla es necesario que la serie conste de un n´ umero de observaciones elevado, a lo largo de muchos a˜ nos, para que se pueda determinar si la serie muestra un movimiento a largo plazo que responda a una determinada ley de crecimiento, decrecimiento o estabilidad. Ese comportamiento tendencial puede responder a distintos perfiles: lineal, exponencial, parab´olico, log´ıstico, etc., adem´as mediante la tendencia se puede ver si la serie es estacionaria o evolutiva. Al considerar estos movimientos a largo plazo, se prescinde de las variaciones a corto y medio plazo. Para el ejemplo del paro registrado en Espa˜ na, Figuras (2.6) y (2.8), puede observarse que la tendencia de esa serie a lo largo de esos seis a˜ nos, (este periodo de tiempo no es muy largo para hablar de tendencia a largo plazo), es pr´acticamente una l´ınea 51
recta con pendiente negativa, aunque el ritmo de decrecimiento no solo se reduce al final del per´ıodo sino que a lo largo de 2002 parece tener lugar un incipiente cambio de tendencia, se tiene una serie que es decreciente para el periodo considerado. Otro ejemplo, es el uso creciente de Internet en la sociedad argentina, independientemente de que en un mes concreto en Argentina, por determinadas causas econ´omicas, haya una bajada de la utilizaci´on de Internet, como ocurrio en la crisis del a˜ no 2001. 2. Variaci´on Estacional VE : Es el movimiento peri´odico de corto periodo, se trata de una componente causal debida a la influencia de ciertos fen´omenos que se repiten de manera peri´odica en un a˜ no, como las estaciones, se basa en causas de tipo climatol´ogico (producci´on, turismo, etc.) o de ordenaci´on del tiempo (los d´ıas de la semana condiciona el comportamiento de ciertas series). La periodicidad generalmente es el a˜ no, aunque puede ser el mes, la semana o incluso el d´ıa. En el ejemplo del paro en Espa˜ na, Figura (2.6), se observa un patr´on de estacionalidad bastante bien definido: el paro registrado desciende notablemente en los meses estivales y el resto del a˜ no se mantiene en niveles m´as elevados, salvo en el mes de diciembre que, de forma sistem´atica es algo m´as reducido que en los anteriores y posteriores. Otro ejemplo, es el caso particular del r´ıo Paran´a, una variable estacional, ser´a la ´epoca de lluvias de verano, en la alta cuenca en territorio brasile˜ no, que determina incrementos en las alturas de r´ıo, en ´esta estaci´on en territorio argentino. 3. Variaci´on C´ıclica C : Es el componente de la serie que recoge las oscilaciones peri´odicas de amplitud superior a un a˜ no, movimientos a plazo medio normalmente irregulares alrededor de la tendencia, en las que a diferencia de las variaciones estacionales, tiene un per´ıodo y amplitud variables, pudiendo clasificarse como c´ıclicos, cuasic´ıclicos o recurrentes. Esta componente tiene un marcado car´acter econ´omico, pues suele ser el resultado de la sucesi´on de las fases expansivas y recesivas de la econom´ıa. Esta componente resulta dif´ıcil de aislar, pues ocurre, con frecuencia, que se pueden superponer ciclos de distintos periodos o amplitudes. La amplitud es el n´ umero de a˜ nos que dura un ciclo completo. En el ejemplo del paro en Espa˜ na, Figura (2.6), no se detecta de forma clara la presencia de ciclos, bien sea porque el periodo de tiempo estudiado sea muy corto o porque realmente no hay ciclos, aunque lo m´as veros´ımil en este caso sea que el empleo responde a los ciclos de la econom´ıa. 4. Variaci´on Aleatoria R: Es un componente accidental, de car´acter err´atico, tambi´en denominada residuo, no muestran ninguna regularidad, debidos a fen´omenos de car´acter ocasional son resultado de factores fortuitos o aleatorios que inciden de forma aislada y no permanente en una serie. Por ejemplo en el comportamiento del r´ıo Paran´a pueden ser lluvias extraordinarias en la localidad de Corrientes en un per´ıodo de inundaciones. La interacci´on de estas cuatro componentes genera la serie temporal. La forma en que se combinen puede ser muy variada, pero tradicionalmente se ha optado por dos modelos distintos. El aditivo y el multiplicativo, aunque en algunas ocasiones se mezclan ambos. Seg´ un el modelo que se adopte, la serie temporal ser´a, [Spiegel, 1978]: Modelo Aditivo y t = T t + V E t + C t + Rt 52
Modelo Multiplicativo yt = (Tt ) ∗ (V Et ) ∗ (Ct ) ∗ (Rt ) Modelos ARIMA, el enfoque moderno de Series Temporales A comienzo de los a˜ nos 70, G.E.P. Box, profesor de Estad´ıstica de la Universidad de Wisconsin, y G.M. Jenkins, profesor de Ingenier´ıa de Sistemas de la Universidad de Lancaster, introdujeron una peque˜ na revoluci´on en el enfoque del an´alisis de series temporales, en sus trabajos sobre el comportamiento de la contaminaci´on en la bah´ıa de San Francisco, con el prop´osito de establecer mejores mecanismos de pron´ostico y control. Publican un libro en el a˜ no 1976, en el que describen la metodolog´ıa, se convirti´o r´apidamente en un cl´asico y sus procedimientos se utilizan ampliamente desde entonces en diferentes ramas de la ciencia, conoci´endose como modelos ARIMA y tambi´en como modelos Box-Jenkins. La palabra ARIMA significa Modelos Autorregresivos Integrados de Medias M´oviles, definiendo un modelo como autorregresivo si la variable end´ogena de un per´ıodo t es explicada por las observaciones de ella misma correspondientes a per´ıodos anteriores a˜ nadi´endose, un t´ermino de error . En el caso de procesos estacionarios con distribuci´on normal, la teor´ıa estad´ıstica de los Procesos Estoc´asticos dice que, bajo determinadas condiciones previas, toda Xt puede expresarse como una combinanci´on lineal de sus valores pasados (parte sistem´atica), m´as un t´ermino de error (innovaci´on). En el modelo, cada valor tomado por la variable en un instante dado, est´a influido por los valores de la variable en momentos anteriores y se expresa como una relaci´on lineal, funci´on de: 1. Valores recientes de la variable 2. Ruidos en valores recientes de la variable 3. Valores remotos de la variable 4. Ruidos en valores remotos de la variable El esquema general del modelo es la funci´on que se indica en la F´ormula (2.3): Xt = a1 Xt−1 + a2 Xt−2 + · · · + ap Xt−p + Zt + b1 Zt−1 + · · · + bq Zt−q
(2.3)
Una de las ventajas de estos modelos es su gran simplicidad, son sumas de t´erminos, frente a los modelos propuestos en la formulaci´on cl´asica. Esta f´ormula general de los modelos denominados ARMA, est´a constituido por una combinaci´on de: p t´erminos AR, proceso autorregresivo, modela la influencia de los valores anteriores de la serie Xt−1 hacia atr´as, q t´erminos MA, proceso de medias m´oviles, modela la influencia del ruido en valores anteriores de la serie Zt−1 hacia atr´as, junto con el t´ermino Zt que corresponde al ruido esperado en el mismo momento t en el que se estima el nuevo valor de la variable X. La letra I que aparece en el nombre del modelo completo ARIMA, corresponde al proceso de diferenciaci´on (su inverso es la Integraci´on) que hay que hacer cuando la serie no cumple la hip´otesis de estacionariedad. 53
2.4.3.
Redes Neuronales
Redes Neuronales Artificiales Son modelos computacionales que tratan de replicar, de manera simplificada, el complejo funcionamiento del cerebro humano. Su capacidad de aprendizaje a trav´es de ensayos repetidos las hace muy utilizables en una amplia variedad de aplicaciones en todas las ciencias. Han demostrado ser una herramienta muy u ´til por su sorprendente habilidad para capturar relaciones no lineales entre variables. De hecho, pueden aproximar cualquier funci´on no lineal si son correctamente especificadas, [Tkacz and Hu, 1999]. En 1943, Warren McCulloc y Walter Pitts originaron el primer modelo de operaci´on neuronal, el cual fu´e mejorado en sus aspectos biol´ogicos por Donald Hebb en 1948. En 1962 Bernard Widrow propuso la regla de aprendizaje Widrow-Hoff, posteriormente Frank Rosenblatt desarroll´o una prueba de convergencia y defini´o el rango de problemas para los que su algoritmo aseguraba una soluci´on, ´el propuso los Perceptrones como herramienta computacional, [Crespo, 1996] y [Fausett, 2006]. El cerebro humano continuamente recibe se˜ nales de entrada de muchas fuentes y las procesa a manera de crear una apropiada respuesta de salida; nuestros cerebros cuentan con millones de neuronas que se interconectan para elaborar redes neuronales, estas redes ejecutan los millones de instrucciones necesarias para mantener una vida normal. Las neuronas son las c´elulas que forman la corteza cerebral de los seres vivos, cada una est´a formada por elementos llamados cuerpo, ax´on y dendritas, como se muestra en la Figura (2.9). Las dendritas forman una estructura de filamentos muy fina que rodean el cuerpo de la neurona, el ax´on es un tubo largo y delgado que se ramifica en su extremo en peque˜ nos bulbos finales que casi tocan las dendritas de las c´elulas vecinas, la peque˜ na separaci´on entre los bulbos finales y las dentritas se le denomina sin´apsis.
Figura 2.9: Descripci´on de una neurona natural. Las neuronas, al igual que las dem´as c´elulas del cuerpo, funcionan a trav´es de impulsos el´ectricos y reacciones qu´ımicas. Los impulsos el´ectricos que utiliza una neurona para intercambiar informaci´on con las dem´as viajan por el ax´on que hace contacto con las dendritas de la neurona vecina mediante las sin´apsis; la intensidad de la corriente transmitida depende de la eficiencia de la transmisi´on sin´aptica. Una neurona en especial 54
transmitir´a un impulso el´ectrico por su ax´on; adem´as cada neurona en un tiempo corto recibe varias se˜ nales de las neuronas vecinas que transmiten a trav´es de sus dendritas; la se˜ nal que se transmite a la neurona podr´a ser adem´as inhibitoria o excitatoria. La neurona manda el impulso por su ax´on si la excitaci´on que recibe de sus neuronas vecinas excede su inhibici´on por un valor cr´ıtico, que supera el umbral de activaci´on de la neurona. Las redes neuronales artificiales est´an compuestas de gran cantidad de procesadores conectados entre si y actuando en paralelo. Los modelos neuronales biol´ogicos son mucho m´as complejos que los modelos computacionales actuales, estando el comportamiento de la red determinado por su topolog´ıa, los pesos de las conexiones y la funci´on caracter´ıstica de las neuronas, [Guti´errez, 2013]. En la Figura (2.10), puede observarse una comparaci´on entre los procesos de una neurona natural y una artificial.
Figura 2.10: Comparaci´on entre neurona natural y neurona artificial.
Funci´ on de Activaci´ on La funci´on de activaci´on de un nodo define la salida de ese nodo dada una entrada o un conjunto de entradas, la neurona necesita saber si se activa o inhibe; de activarse emite o transfiere un impulso a las neurona s adyacentes y para ello debe cumplirse la condici´on para activarse y ejecutar la expresi´on de salida que transmite a otra neurona. Ambas funciones son del tipo f (xi , wi , dj ), que dependen de las entradas, sus pesos y de un par´ametro variable de ajuste. Esto se entiende de la siguiente manera: para cada grupo de entradas i hay otro grupo de salidas j, [Guti´errez, 2013]. Las Funciones de Activaci´on pueden ser: Funciones Lineales: f (x) = x
(2.4)
Funciones Paso: Dan una salida binaria dependiente de si el valor de entrada est´a por encima o por debajo del valor umbral. 55
sgn(x)=
Θ(x) =
-1 , si x < 0, 1 , sino,
(2.5)
0 , si x < 0, 1 , sino,
(2.6)
Funciones Sigmoidales: Funciones mon´otonas acotadas que dan una salida gradual no lineal. 1. La funci´on log´ıstica de 0 a 1, ver la gr´afica en la Figura (2.11): f c(x) =
1 1 + e−cx
(2.7)
2. La funci´on tangente hiperb´olica de −1 a 1, ver la gr´afica en la Figura (2.12): fc (x) = tanh(cx)
(2.8)
Figura 2.11: La funci´on log´ıstica de 0 a 1.
Figura 2.12: La funci´on tangente hiperb´olica de −1 a 1.
Neurona o Unidad Procesadora Todo modelo de red neuronal consta de dispositivos elementales de procesamiento: las neuronas. A partir de ellas, se pueden generar representaciones espec´ıficas, de tal forma que un estado conjunto de ellas pueda significar una letra, un n´ umero o cualquier otro objeto. Generalmente se pueden encontrar tres tipos de neuronas: 56
Figura 2.13: Descripci´on de una Neurona Artificial.
1. Aquellas que reciben est´ımulos externos, relacionas con el aparato sensorial, que tomar´an la informaci´on de la entrada, denominadas unidades de entrada. 2. Dicha informaci´on se transmite a ciertos elementos internos que se ocupan de su proceso. Es la sinapsis y neuronas correspondientes a este segundo nivel donde se genera cualquier tipo de representaci´on interna de la informaci´on. Puesto que no tienen relaci´on directa con la informaci´on de entrada y de salida, estos elementos se denominan unidades ocultas. 3. Una vez finalizado el periodo de procesado, la informaci´on llega a las unidades de salida, cuya misi´on es dar la respuesta del sistema. La neurona artificial, que se detalla en la Figura (2.13), intenta modelar el comportamiento de la neurona biol´ogica, aqu´ı el cuerpo de la neurona se representa como una sumatoria lineal de los est´ımulos externos zj , seguida de una funci´on no lineal yj = f (zj ). La funci´on f (zj ), es llamada la funci´on de activaci´on o funci´on neuronal y es la funci´on que utiliza la suma de est´ımulos para determinar la actividad de salida de la neurona. Red Neuronal Artificial Una red neuronal artificial (RNA) es un par (N, U ), donde N es un conjunto de nodos y U es un conjunto de unidades procesadoras sobre N que satisface la siguiente condici´on: cada nodo Xi ǫ N tiene que ser un nodo de entrada o de salida de al menos una unidad procesadora de U , [Guti´errez, 2013]. Analizando la red neuronal de la Figura (2.14), se tendr´ıa el siguiente conjunto de unidades procesadoras U , sobre N . R U1 = ({x1 , x2 , x3 }, 1 , {x4 }), R U2 = ({x1 , x2 , x3 }, 2 , {x5 }), R U3 = ({x1 , x2 , x3 }, 3 , {x6 }), R U4 = ({x4 , x5 , x6 }, 4 , {x7 })y R U5 = ({x1 , x2 , x3 }, 5 , {x8 }). 57
Figura 2.14: Descripci´on de una Red Neuronal Artificial.
Arquitecturas de Red Las redes neuronales artificiales replican el comportamiento de las redes neuronales naturales, interconectando neuronas artificiales organizadas en capas, presentando arquitecuras diferentes, como puede apreciarse en la Figura (2.15), que presenta un perceptr´on simple y un perceptr´on multicapa. La arquitectura de una red neuronal se forma conectando m´ ultiples procesadores elementales, organizados en diferentes capas, como puede observarse en la Figura (2.16), siendo ´este un sistema adaptivo que pose un algoritmo para ajustar sus pesos (par´ametros libres) para alcanzar los requerimientos de desempe˜ no del problema, basado en muestras representativas. Por lo tanto se puede se˜ nalar que es un sistema de computaci´on distribuida que se caracteriza por:
Figura 2.15: Arquitecturas de redes neuronales artificiales.
Un conjunto de unidades elementales, cada una de las cuales posee bajas capacidades de procesamiento. 58
Una densa estructura interconectada usando enlaces ponderados. Par´ametros libres que deben ser ajustados para satisfacer los requerimientos de desempe˜ no. Un alto grado de paralelismo.
Figura 2.16: Ejemplo de una red neuronal que realiza un diagnostico m´edico. La arquitectura de las redes neuronales consiste en la organizaci´on y disposici´on de las neuronas formando capas m´as o menos alejadas de la entrada y salida de la red, como puede observarse en la Figura (2.16), siendo en este sentido, los par´ametros fundamentales de la red: el n´ umero de capas, el n´ umero de neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas. Seg´ un los tipos de conexiones que conectan a las neuronas de cada capa o de distintas capas, se identifican los siguientes tipos de conexiones, [Guti´errez, 2013]: Conexiones hacia Delante: Existe una capa de entrada con n neuronas y una capa de salida con m neuronas y al menos una capa oculta de neuronas internas. Cada neurona de una capa, excepto las de entrada, recibe entradas de todas las neuronas de la capa anterior y env´ıa su salida a todas las neuronas de la capa posterior, excepto las de salida. No hay conexiones hacia atr´as ni laterales entre neuronas de la misma capa. La estructura de este tipo de redes puede observarse en la Figura (2.17). Conexiones Laterales: Un ejemplo t´ıpico de este tipo es el circuito el ganador toma todo, que cumple un papel importante en la elecci´on del ganador. La estructura de este tipo de redes se presenta en la Figura (2.18). Conexiones hacia Atr´as o Recurrentes: Adem´as de la red contar con las conexiones hacia adelante estas redes incoporan conexiones hacia atr´as y llevan los datos de las neuronas de una capa superior a otras de la capa inferior. La estructura de este tipo de redes puede observarse en la Figura (2.19). 59
Figura 2.17: Conexiones hacia delante.
Figura 2.18: Conexiones laterales.
Entrenamiento de una Red Neuronal En el entrenamiento se presentan las entradas y respuestas deseadas, entonces la red neuronal partiendo de un conjunto de pesos sin´apticos iniciales, inicia el proceso de aprendizaje que busca un conjunto de pesos que permitan a la red desarrollar correctamente la salida deseada, minimizando los errores, [Crone, 2002a] y [Crone, 2002b]. Los valores de entrada se recomiendan que previamente sean de alg´ un modo transformados a una escala. Existen dos fases en el entrenamiento de toda aplicaci´on de las redes neuronales: la fase de aprendizaje y la fase de prueba, con las siguientes caracter´ısticas, [Guti´errez, 2013]: Fase de Aprendizaje: Una caracter´ıstica de las redes neuronales es su capacidad de aprender. Aprenden por la actualizaci´on o cambio de los pesos sin´apticos que caracterizan a las conexiones. Los pesos son adaptados de acuerdo a la informaci´on 60
Figura 2.19: Conexiones hacia atr´as o recurrentes.
extra´ıda de los patrones de entrenamiento nuevos que se van presentando. Normalmente, los pesos o´ptimos se obtienen optimizando (minimizando o maximizando) alguna funci´on de energ´ıa. Por ejemplo, un criterio popular en el entrenamiento supervisado es minimizar el error cuadr´atico medio, entre el valor deseado y el valor de salida de la red. Fase de Prueba: Una vez calculados los pesos de la red, las neuronas de la u ´ltima capa se comparan con la salida deseada para determinar la validez del dise˜ no. Una buena implementaci´on pr´actica radica en el numero adecuado de neuronas, en el numero id´oneo de capas ocultas, la extensi´on de la funci´on de activaci´on, el tiempo de entrenamiento de la red, las implicaciones de la generaci´on de ruido, [Crespo, 1996]. M´ etodos de Aprendizaje en Redes Neuronales Es importante se˜ nalar que la propiedad m´as importantes de las redes neuronales artificiales es su capacidad de aprender a partir de un conjunto de patrones de entrenamientos, es decir, es capaz de encontrar un modelo que ajuste los datos. El proceso de aprendizaje tambi´en conocido como entrenamiento se realiza mediante patrones-ejemplo, siendo dos los tipos de aprendizaje: supervisado y no supervisado, [Fausett, 2006]. El Aprendizaje Supervisado: consiste en entrenar la red a partir de un conjunto de datos o patrones de entrenamiento compuesto por patrones de entrada y salida. El objetivo del algoritmo de aprendizaje es ajustar los pesos de la red w de manera tal que la salida generada sea lo m´as cercanamente posible a la verdadera salida dada una cierta entrada. Es decir, la red neuronal trata de encontrar un modelo al proceso desconocido que gener´o la salida y. Este aprendizaje se llama supervisado pues se conoce el patr´on de salida el cual hace el papel de supervisor de la red. Se debe proporcionar parejas de patrones entrada-salida y la red neuronal aprende a asociarlos. En terminolog´ıa estad´ıstica equivale a los modelos en los que hay vectores de variables independientes y dependientes, por ejemplo t´ecnicas de regresi´on y modelos de series temporales. 61
Aprendizaje No Supervisado: se presenta s´olo un conjunto de patrones y el objetivo del algoritmo de aprendizaje es ajustar los pesos de la red de manera tal que la ´ red encuentre alguna estructura o configuraci´on presente en los datos. Unicamente se debe suministrar a la red los datos de entrada para que extraiga los rasgos caracter´ısticos esenciales. En terminolog´ıa estad´ıstica equivale a los modelos en los que s´olo hay vectores de variables independientes y buscan el agrupamiento de los patrones de entrada, por ejemplo an´alisis de conglomerados o cluster. Validaci´ on del Modelo Una vez que ha terminado el proceso de aprendizaje y los pesos de la red neuronal han sido calculados, es importante comprobar la calidad del modelo resultante, siendo algunas medidas est´andar del error las siguientes, [Guti´errez, 2013]: 1. La suma de los cuadrados de los error es (Sum Square Error s, SSE), definida como: r X p=1
kbp − ˆbp k2
(2.9)
2. La ra´ız cuadrada del error cuadr´atico medio (Root Mean Square Error , RMSE), definida como: v uX u r t kbp − ˆbp k2 /r
(2.10)
max{kbp − ˆbp k, p = 1, ...., r}
(2.11)
p=1
3. El error m´aximo, definido como:
donde ˆbp es la salida de la red para el vector de entrada ap . N´otese que en el caso de una u ´nica salida, la funci´on norma k : k se reduce a la funci´on valor absoluto | : | usual. Sobreajuste - Overfitting En estad´ıstica es conocido que cuando se utiliza un modelo con muchos par´ametros para ajustar un conjunto de datos procedente de proceso con pocos grados de libertad, el modelo obtenido puede no descubrir las tendencias reales del proceso original, aunque pueda presentar un error peque˜ no. Las diferentes curvas resultantes pueden observarse y compararse en la Figura (2.20), [Guti´errez, 2013]: La curva (a) pasa exactamente por los puntos de entrenamiento. La curva (b) muestra el comportamiento sobre un conjunto alternativo. La curva (c) es un polinomio de tercer grado. La diferencia entre ambos modelos puede verse en (d). 62
Figura 2.20: Sobreajuste de Redes Neuronales. Fuente: [Guti´errez, 2013].
Se puede identificar el comienzo del sobreajuste a trav´es del uso de la validaci´on cruzada, para lo cual los ejemplos de entrenamiento se separan en un subset de estimaci´on y un subset de validaci´on. El subset de estimaci´on se utiliza para entrenar a la red en el modo usual, excepto por una modificaci´on menor: la sesi´on de entrenamiento se detiene peri´odicamente, cada tantas repeticiones y se eval´ ua la red con el set de validaci´on despu´es de cada per´ıodo de entrenamiento. M´as espec´ıficamente, el proceso peri´odico de estimaci´on seguida de validaci´on, se denomina m´etodo de entrenamiento con detenci´on temprana y procede de la siguiente manera, [Fiszelew, 2013]: Despu´es del per´ıodo de estimaci´on (entrenamiento), se fijan todos los pesos y los umbrales del Perceptr´on multicapa y la red opera en su modo hacia delante. El error de validaci´on se mide as´ı para cada ejemplo en el set de validaci´on. Cuando la fase de validaci´on se completa, la estimaci´on (entrenamiento) se reanuda para otro per´ıodo y el proceso se repite. En la Figura (2.21), se muestra las formas conceptualizadas de dos curvas de aprendizaje, una perteneciente a las medidas sobre el subset de estimaci´on y la otra sobre el subset de validaci´on. Normalmente, el modelo no trabaja tan bien sobre el subset de validaci´on como lo hace sobre el set de estimaci´on, en el cual se bas´o su dise˜ no. La curva de aprendizaje de estimaci´on decrece mon´otonamente para un n´ umero creciente de repeticiones en la forma acostumbrada. En contraste, la curva de aprendizaje de validaci´on decrece mon´otonamente hasta un m´ınimo, entonces empieza a incrementarse mientras contin´ ue el entrenamiento. Cuando miramos a la curva de aprendizaje de estimaci´on puede parecer que podr´ıamos mejorar si vamos m´as all´a del punto m´ınimo sobre la curva de aprendizaje de validaci´on. En realidad, lo que la red est´a aprendiendo m´as all´a de ese punto es 63
Figura 2.21: Ilustraci´on de la regla de detenci´on temprana basada en la validaci´on cruzada. Fuente: [Fiszelew, 2013].
esencialmente ruido contenido en el set de entrenamiento. Esta heur´ıstica sugiere que el punto m´ınimo sobre la curva de aprendizaje de validaci´on sea utilizado como un criterio para detener la sesi´on de entrenamiento, [Fiszelew, 2013]. Optimizaci´ on de Ajuste de Perceptr´ on. Adaptaciones de la Funci´ on de Error Los m´etodos de ajuste son un punto importante en la implementaci´on de las redes neuronales como se mencion´o en (2.4.3), donde se plantearon algunas medidas est´andar del error como la suma de los cuadrados de los errores, la ra´ız cuadrada del error cuadr´atico medio, el error m´aximo y como t´ecnica de ajuste un descenso gradiente de la funci´on de error. El objetivo com´ un es que la funci´on de error se anule en el caso de predecir con exactitud la respuesta del sistema y sea positiva en cualquier otro punto, con mayor valor cuanto m´as lejos est´e del mejor ajuste. La funci´on de error elegida condiciona el resultado ya que, en general, el m´ınimo no ser´a el mismo, la funci´on de error cuadr´atica es de uso com´ un pero no resulta aconsejable cuando el ruido no es gaussiano o hay muchos valores err´oneos en la muestra. Los m´etodos de ajuste deben ser computacionalmente eficaces, deben converger, es decir, acercarse hacia un m´ınimo en forma estable y que este m´ınimo sea global, evitando valles locales que pueda tener la funci´on objetivo. Los m´etodos de ajuste se pueden clasificar seg´ un, [Zorrilla Pantale´on, 2001]: La amplitud de la b´ usqueda. Los algoritmos que realizan la b´ usqueda por todo el espacio de pesos se denominan globales, y aquellos que buscan el m´ınimo en las proximidades del punto inicial, se designan locales. El grado de derivadas que utiliza el algoritmo: • Grado 0, no utilizan derivadas,
• Grado 1, usan la primera derivada,
• Grado 2, utilizan la segunda derivada. 64
A mayor grado, el algoritmo es m´as veloz y complejo. Existen diversos m´etodos de optimizaci´on de grado cero y b´ usqueda global, como son, el algoritmo de cristalizaci´on, algoritmos gen´eticos, algoritmos de perturbaci´on, etc., que se pueden utilizar para la obtenci´on preliminar de los pesos a partir de los cuales se aplique otro m´etodo de ajuste m´as eficaz (basado en derivadas). A continuaci´on se describen los m´etodos de ajuste m´as com´ unmente utilizados en el a´mbito de las redes neuronales. Descenso de Gradiente Conjugado Es un algoritmo de grado 1 y b´ usqueda local, trata de solventar la poca eficiencia que presenta el descenso de gradiente al avanzar en direcciones ortogonales. Las direcciones conjugadas son suficientemente decrecientes a pesar de que no sean las del gradiente y no son ortogonales. En cada momento se conoce el gradiente, gi , y la direcci´on a tomar di . La primera direcci´on es la del gradiente cambiado de signo y la siguiente direcci´on se calcula seg´ un, [Zorrilla Pantale´on, 2001]: dn+1 = −gin+1 + βdni i
(2.12)
donde: P
gjn+1 (gjn+1 − gjn ) P β= dnj (gjn+1 − gjn )
(2.13)
En cada paso hay una minimizaci´on unidimensional a lo largo de la direcci´on a tomar, en esta minimizaci´on se pueden aplicar varios algoritmos como el de Newton. Newton. Levenberg-Marquardt El m´etodo de Newton es una alternativa a los m´etodos de gradiente conjugado para una optimizaci´on m´as r´apida, es un algoritmo local de grado 2. Toma una aproximaci´on hasta la segunda derivada del desarrollo en serie del error y busca el m´ınimo a partir de esa expresi´on. Como la funci´on no ser´a de segundo orden, el proceso ser´a iterativo. En cada iteraci´on el vector incremento de pesos se calcula seg´ un, [Zorrilla Pantale´on, 2001]: ∆p = −Hg
(2.14)
donde: g es el vector gradiente H la matriz hessiana de segundas derivadas. El vector incremento de pesos puede actuar como tal o como direcci´on a lo largo de la cual realizar una minimizaci´on. Dado que el c´alculo de las segundas derivadas es m´as dif´ıcil de obtener, existen variantes de este algoritmo en los que se realiza una aproximaci´on de H, mediante el algoritmo Gauss-Newton y Levenberg-Marquardt. En el algoritmo Gauss-Newton, se aproxima H seg´ un: 65
H = JT J
(2.15)
donde: J es la matriz Jacobiana cuyos componentes son la derivada primera de los error es de la red respecto a los pesos. En el algoritmo Levenberg-Marquardt, se aproxima H seg´ un: H = J T J + µI
(2.16)
donde µ es un escalar que cambia en cada iteraci´on, decrece si el error decrece y aumenta en caso contrario.
M´ etrica Variable. Cuasi-Newton Este m´etodo se basa en el de Newton pero evita calcular las segundas derivadas y la inversi´on matricial, mediante la aproximaci´on de la matriz inversa de la hessiana, obtiene una direcci´on de incremento de los pesos, a lo largo de la cual realiza una busca unidimensional. Esta direcci´on se calcula seg´ un, [Zorrilla Pantale´on, 2001]: ˜ d = −Hg
(2.17)
donde: g, es el vector gradiente ˜ la aproximaci´on a la inversa de la matriz hessiana. Una aproximaci´on a la matriz H, hessiana inversa se puede obtener seg´ un:
d = pn − pn−1 A=
1 d(gn − gn−1 )
˜ n−1 (gn − gn−1 ) B = (gn − gn−1 )T H h i n n−1 T n−1 T T ˜ n−1 ˜ ˜ ˜ H =H + A (1 + AB)dd − H (gn − gn−1 )d − d(gn − gn−1 ) H
(2.18)
(2.19) (2.20)
(2.21)
Para comenzar el algoritmo se toma el gradiente negativo como direcci´on inicial y una matriz diagonal pr´oxima a la identidad se asignar´a a la aproximaci´on de la hessiana. En 66
cada paso hay una minimizaci´on unidimensional a lo largo de la direcci´on a tomar. En esta minimizaci´on se pueden aplicar varios algoritmos como el de Newton. Criterios de Parada Los algoritmos de ajuste funcionan por iteraciones, por eso se requiere alg´ un criterio que indique detener el proceso y dar el resultado por bueno. Algunos de ´estos pueden ser, [Zorrilla Pantale´on, 2001]: Detener el algoritmo cuando el progreso es muy peque˜ no. Llegar a cierto valor de la funci´on de error. Que todos los puntos de la muestran tengan su error por debajo de un umbral. Que el gradiente, en algoritmos de grado 1 ´o 2, sea casi nulo.
Regularizaci´ on Al dise˜ nar un Perceptr´on multicapa por diferentes m´etodos, se est´a construyendo un modelo no-lineal del fen´omeno f´ısico responsable de la generaci´on de ejemplos de entradasalida usados para entrenar la red. En la medida que el dise˜ no de la red es estad´ıstico por naturaleza, necesitamos un balance adecuado entre la confiabilidad de los datos de entrenamiento y la calidad del modelo. En el contexto del aprendizaje back-propagation o cualquier otro procedimiento de aprendizaje supervisado, se puede puede producir el balance minimizando el riesgo total expresado como, [Haykin, 1999]: R(w) = εS (W ) + λεC (w)
(2.22)
donde: El primer t´ermino, εS (W ), es la medida de performance est´andar, la cual depende tanto de la red (modelo) y de los datos de entrada. En el aprendizaje backpropagation se define t´ıpicamente como un error cuadr´atico medio cuya evaluaci´on se extiende sobre las neuronas de salida de la red y el cual se lleva a cabo para todos los ejemplos de entrenamiento. El segundo t´ermino, λεC (w), es la penalidad de complejidad, la cual depende solamente de la red (modelo); su inclusi´on impone sobre la soluci´on un conocimiento a priori sobre los modelos que est´an siendo considerados. Podemos pensar a λ como un par´ametro de regularizaci´on, representando la importancia relativa del t´ermino de la penalidad de complejidad con respecto al t´ermino de la medida de performance. • Cuando λ es cero, el proceso de aprendizaje no est´a restringido y la red se determina completamente con los ejemplos de entrenamiento. • Cuando λ se hace infinitamente grande, por el contrario, la implicaci´on es que la restricci´on impuesta por la penalidad de complejidad es por s´ı misma suficiente para especificar la red, lo cual es otra manera de decir que los ejemplos de entrenamiento no son confiables. 67
En los casos pr´acticos donde se utiliza la regularizaci´on de la complejidad para mejorar la generalizaci´on, al par´ametro λ se le asigna un valor entre medio de estos dos casos extremos. La forma de regularizaci´on de complejidad que puede utilizarse es la degradaci´on de pesos (weight decay), [Hinton, 1989]. En el procedimiento weight-decay, el t´ermino penalidad de complejidad se define como la norma al cuadrado del vector de pesos w (es decir, todos los par´ametros libres) en la red, como se muestra en la siguiente ecuaci´on: εC (w) = kW k2 =
X
wi2
(2.23)
iǫCtotal
donde: el conjunto Ctotal se refiere a todos los pesos de la red. Este procedimiento opera al forzar a algunos de los pesos en la red a tomar valores cercanos a cero, mientras permite que otros pesos retengan sus valores relativamente grandes. En consecuencia, los pesos de la red se agrupan a grandes rasgos en dos categor´ıas: aquellos que tienen una gran influencia sobre la red (modelo), aquellos que tienen poca o ninguna influencia sobre la red. Los pesos en la u ´ltima categor´ıa se llaman pesos excedentes. En la ausencia de la regularizaci´on de complejidad, estos pesos resultan en una generalizaci´on pobre en virtud de sus altas probabilidades de tomar valores completamente arbitrarios o causar que la red sobreajuste los datos al tratar de producir una leve reducci´on en el error de entrenamiento. El uso de la regularizaci´on de complejidad fomenta que los pesos excedentes suman valores cercanos a cero y por lo tanto mejoran la generalizaci´on, [Fiszelew, 2013].
2.5.
Redes Est´ aticas
Las Redes Neuronales Est´aticas, tienen como caracter´ıstica com´ un el no poseer memoria, es decir, s´olo son capaces de transformar un conjunto de entradas en un conjunto de salidas, de tal manera que una vez establecidos todos los par´ametros de la red las salidas u ´nicamente dependen de las entradas, en general la relaci´on deseada de entradas y salidas se determina en este caso externamente mediante alguna forma de ajuste de los par´ametros del sistema supervisado. Este tipo de redes se han empleado con ´exito en muchos problemas de clasificaci´on, como funciones l´ogicas, as´ı como en el campo de la aproximaci´on funcional. Son ejemplo de este tipo de redes, las redes Multicapa de Perceptrones, las redes de Funciones de Base Radial y las redes Neuronal Probabil´ıstica. En estos modelos, el flujo de informaci´on es generalmente s´ıncrono, todos los estados de las neuronas se actualizan al mismo tiempo o siguiendo una secuencia determin´ıstica. 68
2.5.1.
Redes Multicapa
Las Redes Multicapa o de retropropagaci´on, seg´ un la cantidad de capas ocultas que tenga, puede resolver una gran variedad de problemas en diferentes ´areas del conocimiento, siendo entre las arquitecturas de redes la m´as popular; en la Figura (2.22), se identifican sus componentes.
Figura 2.22: Descripci´on de una red neuronal artificial multicapa.
Capa de Entrada de una Red Neuronal : Est´a compuesta por unidades que se ubican en la capa de entrada de una red neuronal (X, U ), siendo cada unidad la entrada de al menos una unidad funcional de U y no es la salida de ninguna unidad procesadora de U . Capa de Salida de una Red Neuronal: Est´a compuesta por unidades que se encuentran en la capa de salida de una red funcional (X, U ), donde cada unidad es la salida de al menos una unidad funcional de U y no es la entrada de ninguna unidad procesadora de U . Capas Intermedias u Ocultas de una Red Neuronal : Est´a compuesta por unidades que se distribuyen en las distintas capas intermedias de una red neuronal (X, U ), donde las unidades son la entrada de al menos una unidad funcional de U y al mismo tiempo, es la salida de al menos una unidad procesadora de U , [Guti´errez, 2013].
2.5.2.
Perceptr´ on
En un perceptr´on, cada entrada es multiplicada por el peso W correspondiente y los resultados son sumados, siendo evaluados contra el valor de umbral, si el resultado es mayor al mismo, el perceptr´on se activa, como se detalla en la Figuras (2.23) y (2.24).
69
Figura 2.23: Estructura del Perceptr´on.
Figura 2.24: Capas de un Perceptr´on.
70
Entrenamiento de un Perceptr´ on Aprendizaje Hebbiano: Inicialmente se eligen valores aleatorios para los pesos, la idea del aprendizaje Hebiano es modificar los pesos acorde a la correlaci´on entre las unidades. Se eligen los patrones de uno en uno; por ejemplo (ap ; bp ). Si bpi 6= bbpi , entonces se modifica el peso, como puede visualizarse en la Figura (2.25): ∆wij = η bpi − bbpi apj
(2.24)
Figura 2.25: Aprendizaje Hebbiano del Perceptr´on.
Descenso de Gradiente: Inicialmente se eligen valores aleatorios para los pesos, la idea de este m´etodo es utilizar un proceso iterativo que minimice la funci´on de error: E(w) =
1 X p bp 2 bi − bi 2 i,p
(2.25)
En el caso lineal (f (x) = x) se tiene: ∆wij = −η En general, se tiene: ∆wij = −η
X p ∂E =η bi − bbpi apj ∂wij p
X p ∂E =η bi − bbpi f ′(Bip )apj ∂wij p
El par´ametro η se llama tasa de aprendizaje. 71
(2.26)
(2.27)
2.6.
Redes Din´ amicas
Las Redes Neuronales Din´amicas, a diferencia de las est´aticas permiten establecer una relaci´on entre salidas y entradas y/o salidas y entradas previas, esto a˜ nade cierta memoria a estas redes, lo que se traduce en que pueden modelar ecuaciones diferenciales. Las redes neuronales din´amicas se han revelado u ´tiles en problemas de modelizaci´on de la din´amica directa e inversa de sistemas complejos, tales como robots, cohetes, naves espaciales, as´ı como en la modelizaci´on de circuitos secuenciales y en la conversi´on de texto a voz. Como ejemplos de este tipo de redes encontramos las redes de Hopfield, las redes de retardos en el tiempo (Time Delay Neural Network), las redes de tiempo discreto (Time Discrete Neural Network). Al considerar realimentaciones y operadores de retardo en las arquitecturas, surgen las denominadas redes recurrentes, que se caracterizan por su capacidad de modelar tanto la no linealidad como las componentes din´amicas de un sistema, donde en algunos casos el flujo de informaci´on puede ser as´ıncrono, es decir que los estados de cada neurona se actualizan de acuerdo al comportamiento interno de cada neurona, as´ı la secuencia de actualizaci´on resulta estoc´astica, [Pham, 1995].
2.6.1.
La Red de Hopfield
La red neuronal de Hopfield es una arquitectura formada por una sola capa principal, como se describe en la Figura (2.26); se utiliza principalmente como memoria autoasociativa, para almacenar y recuperar informaci´on. La informaci´on se almacena usando un m´etodo simple de aprendizaje no supervisado que obtiene la matriz de pesos que hace que dado cada uno de los patrones de entrenamiento, almacenamiento, la red devuelva el mismo patr´on, recuperaci´on.
Figura 2.26: Red de Hopfield.
Posteriormente, cuando se tenga una configuraci´on arbitraria de las neuronas como entradas, la red devolver´a aquel patr´on almacenado que est´e m´as cerca de la configuraci´on de partida en t´erminos de la distancia de Hamming, siendo esta distancia el n´ umero de 72
bits en que difieren dos palabras del c´odigo, si dos palabras est´an separadas por una distancia d, se requerir´an de un simple error para convertir una en la otra, la m´ınima es la distancia d del c´odigo. Se considera una red neuronal de una sola capa sobre un conjunto de neuronas binarias {x1 , . . . , xn }, con valores en {−1, 1}, donde cada neurona x1 posee un vector de pesos wi = (wi1 , . . . , win ), con wii = 0 indicando que no existe conexi´on consigo misma. Se considera tambi´en la siguiente definici´on binaria de la neurona, [Guti´errez, 2013]: n X
xi = sgn
wij xj
j=1
!
(2.28)
Ahora, si se quieren obtener los pesos apropiados para memorizar un patr´on a = (a1 , . . . , an ), entonces, los pesos tienen que satisfacer las siguientes condiciones de estabilidad:
ai = sgn
n X
wij aj
j=1
!
, i = 1, . . . , n
(2.29)
Por tanto la red devuelve el mismo patr´on dado como entrada, como se est´an usando los valores neuronales {−1, 1}, entonces a2j = 1 y las condiciones anteriores de estabilidad se pueden alcanzar considerando los pesos: wij =
2.6.2.
1 ai aj n
(2.30)
Redes con Retraso de Tiempo-FTDNN
Las Redes con retraso de Tiempo son similares a las redes de alimentaci´on hacia delante, excepto que las entradas tiene una l´ınea de retardo asociada. Esto permite que la red tenga una respuesta din´amica finita a los datos de entrada de series de tiempo, su estructura puede observarse en la Figura (2.27), [Matlab, 2010]. En la Figura (2.28), se presenta una de las arquitecturas probadas en los modelos de esta tesis, puede observarse la estructura de la red con retardo de tiempo, que se utiliza para resolver el problema de series temporales de la predicci´on de alturas del r´ıo Paran´a.
2.6.3.
Redes con Estructura NAR
Las redes NAR, son redes con din´amica recurrente con conexiones de realimentaci´on donde la informaci´on de salida vuelve a realimentar la red neuronal, estos modelos est´an basados en el modelo lineal ARX que es utilizado para la predicci´on de series temporales, al que incorporan la no linealidad. La Ecuaci´on (2.31), es la definici´on para el modelo NAR, donde el siguiente valor de salida y(t), depende de los valores anteriores de la salida, (y(t − 1), y(t − 2), . . . , y(t − ny )), [Matlab, 2010]. y(t) = f (y(t − 1), y(t − 2), . . . , y(t − ny )) 73
(2.31)
Figura 2.27: Arquitectura de las Redes FTDNN, donde TDL son retardos asociados.
Figura 2.28: Red neuronal FTDNN: Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı.
Esta arquitecturas ha sido implementa en esta tesis, en la Figura (2.29), puede observarse la estructura de la red con retardo de tiempo NAR, generada con datos de la serie temporal de las alturas hidrom´etricas de la localidad de Corrientes, para predecir las alturas de mencionada ciudad.
Figura 2.29: Red neuronal NAR: Alturas Hidrom´etricas de Corrientes.
74
2.6.4.
Redes con Estructura NARX
Las redes NARX, son unas redes que combinan la estructura NAR con la FTDNN es decir, que tienen retardos asociados a variables de entrada y otros asociados a la propia respuesta de la red, funcionando como un lazo de realimentaci´on, como en las NAR, como se observa en la Figura (2.30), que presenta la red NARXIP que es una de las arquitecturas analizadas en este trabajo.
Figura 2.30: Red neuronal NARXIP: Serie Alturas Hidrom´etricas de Corrientes, siendo las entradas asociadas las Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı. La Ecuaci´on (2.32), es la definici´on para el modelo NARX, donde el siguiente valor de salida y(t), depende de los valores anteriores de la salida, (y(t−1), y(t−2), . . . , y(t−ny )) y los valores anteriores de las entradas independientes o ex´ogenas, (u(t−1), u(t−2), . . . , u(t− nu )).
y(t) = f (y(t − 1), y(t − 2), . . . , y(t − ny ), u(t − 1), u(t − 2), . . . , u(t − nu ))
(2.32)
Se puede implementar el modelo NARX utilizando una red neuronal feedforward para aproximar la funci´on f , un diagrama de la red resultante se muestra a continuaci´on en la Figura (2.31), donde una red de alimentaci´on directa de dos capas se utiliza para la aproximaci´on, esta aplicaci´on tambi´en permite un modelo vector, donde la entrada y la salida pueden ser multidimension. Las redes NARX tienen muchas aplicaciones, por ejemplo pueden utilizarse como un factor de predicci´on, para predecir el siguiente valor de la se˜ nal de entrada, tambi´en se pueden utilizar para el filtrado no lineal, para la salida final de una versi´on libre de ruido de la se˜ nal de entrada, siendo otra aplicaci´on importante, el modelado de sistemas din´amicos no lineales. Puede considerarse la salida de la red NARX como una estimaci´on del resultado de un sistema din´amico no lineal que se est´a tratando de modelar, la salida realimenta la entrada de la red neuronal feedforward como parte de la arquitectura NARX est´andar, como se muestra a la izquierda en la Figura (2.32). Porque la verdadera salida est´a disponible durante el entrenamiento de la red, se puede crear una arquitectura de serie-paralelo, en la que se utiliza la verdadera salida en lugar de retroalimentar la producci´on estimada, como se muestra a la derecha de la Figura (2.32). Esto tiene dos ventajas, la primera es que la entrada a la red de alimentaci´on directa es m´as precisa y la segunda es que la red resultante tiene una arquitectura puramente de alimentaci´on directa y se pueden usar algoritmos de ajuste estandar, [Matlab, 2010]. 75
Figura 2.31: Diagrama de las Redes NARX, donde TDL son retardos asociados a variables de entrada y otros asociados a la propia respuesta de la red.
Figura 2.32: Arquitectura de las Redes NARX, donde TDL son retardos asociados.
2.7.
Redes Profundas
En estos u ´ltimos a˜ nos, el concepto de las arquitecturas profundas ha despertado un creciente inter´es dentro de la comunidad de la inteligencia artificial y el aprendizaje autom´atico. Estos modelos de arquitecturas profundas, pueden considerarse como una tercera generaci´on de redes neuronales, las cuales se caracterizan por estar formadas por varias capas de neuronas ocultas que realizan una abstracci´on de la informaci´on, como puede observarse en la Figura (2.33). Aunque estos modelos ya eran conocidos en la d´ecada de los 80, en la pr´actica se hab´ıa visto que estas Redes Profundas no proporcionaban ventajas importantes sobre las habituales redes neuronales, de una u ´nica capa oculta. Sin embargo, avances cient´ıficos recientes han demostrado que, si se utilizan algoritmos de construcci´on apropiados, las Redes Profundas s´ı son capaces de obtener niveles de rendimiento fuera del alcance de las redes cl´asicas. Las mejoras en los algoritmos, junto con la reciente disponibilidad de computadoras muy r´apidos y grandes conjuntos de datos, est´an permitiendo importantes aumentos en 76
Figura 2.33: Redes Profundas: Estructura con varias capas ocultas.
el poder en los sistemas de aprendizaje, en particular en las redes neuronales artificiales multicapa. Se est´an produciendo mejoras en a´reas como la precisi´on de la visi´on por computador, reconocimiento de voz y otras aplicaciones, generando un campo que es conocido como, aprendizaje profundo, [Anthes, 2013]. En la d´ecada de 1980, Hinton y otros propusieron un tipo m´as poderoso de aprendizaje supervisado, que emplea aprendizaje en m´ ultiples capas, combinaci´on de caracter´ısticas de bajo nivel en forma sucesiva hasta los niveles m´as altos. Sin embargo, Hinton dice que, con algunas excepciones, estos sistemas no funcionan tan bien como era esperado. El proceso de iniciar con caracter´ısticas de muy bajo nivel, tales como la intensidades de p´ıxeles individuales y el aprendizaje de m´ ultiples capas, al hacerse todo al mismo tiempo, implica una enorme cantidad de c´alculos, los ordenadores de esos a˜ nos no eran lo suficientemente r´apido, no hab´ıa suficientes datos etiquetados y no ten´ıan una buena forma de inicializar los pesos. Desde 2005, Hinton con Yann Le Cun, profesores de inform´atica y neurociencia, en la Universidad de Nueva York y otros hicieron una serie de los avances fundamentales en redes neuronales, principalmente en apredizaje sin supervisi´on y el aprendizaje de m´ ultiples capas, haciendo viable su aplicaci´on, [Anthes, 2013]. La complejidad de construir Redes Profundas, no puede resolverse de forma efectiva empleando algoritmos cl´asicos de redes neuronales. Tras identificar las causas de esta complejidad se presentan dos m´etodos capaces de llevar a cabo esta tarea, las M´aquinas de Boltzmann Restringidas (Restricted Boltzmann Machines) y los Autocodificadores Dispersos (Sparse Autoencoders), as´ı como algunas t´ecnicas de optimizaci´on adecuadas 77
para este tipo de redes. Adem´as las posibilidades de aplicaci´on de estas t´ecnicas a tareas de modelizaci´on complejas como pueden ser el aprendizaje semiautom´atico, la reducci´on de ruido y la correcci´on de datos incompletos, [Bengio, 2013]. El uso del aprendizaje semi-supervisado y las redes neuronales profundas , es la base para algunos de los resultados recientemente en el reconocimiento de patrones. Durante 20 a˜ nos, la mayor´ıa de los sistemas de reconocimeinto de voz se han basado en un m´etodo de aprendizaje que no utiliza las redes neuronales, en 2011 sin embargo, bas´andose en el trabajo de la Universidad de Toronto, se utiliza una combinaci´on de datos etiquetados y sin etiquetar en una red neuronal profunda para bajar la tasa de error de los sistema de reconocimiento de voz, que ha bajando el error est´andar de 24 % a aproximadamente 16 %, [Anthes, 2013]. En 2012, los investigadores de Google y la Universidad de Stanford informaron que hab´ıan obtenido una mejora del 70 %, con respecto a resultados anteriores con lo que denomiraron un mamut, una red neuronal de nueve capas, que aprendi´o a reconocer caras, el sistema con mil millones de conexiones, fue entrenado durante tres d´ıas en 10 millones de im´agenes utilizando un conjunto de m´aquinas con un total de 16.000 n´ ucleos, [Bengio, 2013].
2.7.1.
Autocodificadores
Los Autocodificadores, son una red neuronal con unidades lineales, entrenadas con la funci´on de error cuadr´atica, donde la salida tiene la capacidad para replicar la entrada, en la capa oculta desarrolla una proyecci´on en un subespacio de la capa de entrada principal, como puede observarse en la Figura (2.34).
Figura 2.34: Redes Profundas: Autocodificador.
2.8.
Algoritmos Evolutivos
La teor´ıa de la evoluci´on, fue descrita en 1859 por Charles Darwin, 20 a˜ nos despu´es de su viaje por las islas Gal´apagos, en el libro Sobre el Origen de las Especies por medio de la Selecci´on Natural. En los a˜ nos 50, Watson y Crick descubrieron que la base molecular de 78
los genes est´a en el ADN, ´acido desoxirribonucleico. Los cromosomas est´an compuestos de ADN, estando los genes en los cromosomas. La macromol´ecula de ADN est´a compuesta por bases y la combinaci´on y secuencia de estas bases forma el c´odigo gen´etico, u ´nico para cada ser vivo, como puede observarse en la Figura (2.35),
Figura 2.35: Cadena de ADN.
Seg´ un los inform´aticos evolutivos, la evoluci´on optimiza, puesto que va creando seres cada vez m´as perfectos, sin embargo, los genetistas y bi´ologos evolutivos afirman que la evoluci´on no optimiza, sino que adapta y optimiza localmente en el espacio y el tiempo; evoluci´on no significa progreso. Un organismo m´as evolucionado puede estar en desventaja competitiva con uno de sus antepasados, si se colocan en el ambiente del u ´ltimo, [Merelo Guerv´os, 2013].
2.8.1.
Mecanismos de Cambio en la Evoluci´ on
Estos mecanismos de cambio son necesarios para entender los algoritmos evolutivos, pues se trata de imitarlos para resolver problemas de ingenier´ıa; los mecanismos de cambio alteran la proporci´on de alelos de un tipo determinado en una poblaci´on y se dividen en dos tipos: los que disminuyen la variabilidad y los que la aumentan. Los principales mecanismos que disminuyen la variabilidad son los siguientes: Selecci´on Natural : los individuos que tengan alg´ un rasgo que los haga menos v´alidos para realizar su tarea de seres vivos, no llegar´an a reproducirse y su patrimonio gen´etico desaparecer´a; algunos no llegar´an ni siquiera a nacer. Deriva G´enica: el simple hecho de que un alelo sea m´as com´ un en la poblaci´on que otro, causar´a que la proporci´on de alelos de esa poblaci´on vaya aumentando en una poblaci´on aislada. Otros mecanismos aumentan la diversidad, suceden generalmente en el ´ambito molecular, los m´as importantes son: Mutaci´ on: la mutaci´on es una alteraci´on del c´odigo gen´etico, que puede suceder por m´ ultiples razones, las mutaciones son totalmente aleatorias, siendo el mecanismo b´asico de generaci´on de variedad gen´etica; la mayor´ıa de las mutaciones ocurren de forma natural, aunque existen sustancias mutag´enicas que aumentan su frecuencia. 79
Poliploid´ıa: mientras que las c´elulas normales poseen dos copias de cada cromosoma, las c´elulas reproductivas una (haploides), puede suceder por accidente que alguna c´elula reproductiva tenga dos copias; si se logra combinar con otra c´elula diploide o haploide dar´a lugar a un ser vivo con varias copias de cada cromosoma. Recombinaci´ on: cuando las dos c´elulas sexuales o gametos, una masculina y otra femenina se combinan, los cromosomas de cada una tambi´en lo hacen, intercambi´andose genes, que a partir de ese momento pertenecer´an a un cromosoma diferente. Flujo Gen´etico: o intercambio de material gen´etico entre seres vivos de diferentes especies. La selecci´on natural act´ ua sobre el fenotipo y suele disminuir la diversidad, haciendo que sobrevivan solo los individuos m´as aptos, los mecanismos que generan diversidad y que combinan caracter´ısticas act´ uan habitualmente sobre el genotipo, [Merelo Guerv´os, 2013]. Los algoritmos evolutivos y la computaci´on evolutiva, son una rama de la inteligencia artificial, son utilizados principalmente en problemas con espacios de b´ usqueda extensos y no lineales, en donde otros m´etodos no son capaces de encontrar soluciones en un tiempo razonable. Siguiendo la terminolog´ıa de la teor´ıa de la evoluci´on, las entidades que representan las soluciones al problema se denominan individuos o cromosomas y el conjunto de ´estos, poblaci´on.
2.8.2.
Algoritmos Gen´ eticos
Los algoritmos gen´eticos (AGs) son m´etodos adaptativos que pueden usarse para resolver problemas de b´ usqueda y optimizaci´on. Est´an basados en el proceso gen´etico de los organismos vivos, los cuales a lo largo de las generaciones, evolucionan en la naturaleza de acorde con los principios de la selecci´on natural y la supervivencia de los m´as fuertes, postulados por Darwin en 1859. Por imitaci´on de este proceso, los algoritmos gen´eticos son capaces de ir creando soluciones para problemas del mundo real, la evoluci´on de dichas soluciones hacia valores ´optimos del problema depende en buena medida de una adecuada codificaci´on de las mismas, ver detalle en la Figura (2.36). La primera menci´on del t´ermino y la primer publicaci´on sobre su aplicaci´on, se deben a Bagley en 1967, que dise˜ no´ algoritmos gen´eticos para buscar conjuntos de par´ametros en funciones de evaluaci´on de juegos y los compar´o con los algoritmos de correlaci´on. Pero es considerado su creador John Holland, que los desarroll´o, junto a su equipo, durante las d´ecadas de 1960 y 1970, [Holland, 1992]. Los algoritmos gen´eticos usan una analog´ıa directa con el comportamiento natural; trabajan con una poblaci´on de individuos, cada uno de los cuales representa una soluci´on factible a un problema dado. Este cruce producir´a nuevos individuos, descendientes de los anteriores los cuales comparten algunas de las caracter´ısticas de sus padres, como se detalla en la Figura (2.37). Se implementa el operador de selecci´on, que escoge, entre los cromosomas de la poblaci´on, aquellos con capacidad de reproducci´on y m´as compatibles, para producir m´as descendencia que el resto. La poblaci´on convergera hacia una soluci´on o´ptima del problema, 80
Figura 2.36: Descripci´on del Algoritmo Gen´etico.
Figura 2.37: Descripci´on de un Cruce en los Algoritmos Gen´eticos.
generando para la evoluci´on un algoritmo basado en poblaciones con cruces, mutaciones e inversiones:, [Holland, 1992]. Cruce: extrae partes de dos cromosomas, imitando la combinaci´on biol´ogica de dos cromosomas aislados (gametos). Mutaci´ on: se encarga de cambiar, de modo aleatorio, los valores del alelo en algunas localizaciones del cromosoma. Inversi´ on: invierte el orden de una secci´on contigua del cromosoma, recolocando por tanto el orden en el que se almacenan los genes. Siendo actualmente una t´ecnica robusta, que puede tratar con ´exito gran variedad de problemas de diferentes a´reas, incluyendo aquellos en los que otros m´etodos encuentran dificultades. No se garantiza que se encuentre la soluci´on ´optima del problema, pero si que se encuentran soluciones de un nivel aceptable, en un tiempo competitivo con el resto de algoritmos de optimizaci´on. Al trasladar estos conceptos a la vida artificial en los algoritmos gen´eticos, el t´ermino cromosoma se refiere a un candidato a soluci´on del problema, que a menudo se codifica como una cadena de bits. Los genes son tanto un bit o bloques cortos de bits adyacentes que codifican un elemento particular del candidato a soluci´on, por ejemplo, en el caso de la optimizaci´on de una funci´on multiparam´etrica, los bits que codifican un par´ametro particular, se considera un gen. Un alelo en una cadena de bits ser´a un 0 o un 1 (para alfabetos largos cada lugar puede tener m´as alelos), como se visualiza en la Figura (2.38). La forma m´as simple de algoritmo gen´etico utiliza tres tipos de operadores: 81
Figura 2.38: Detalle de Cromosona, Gen y Alelo.
Figura 2.39: Operaci´on de Cruce.
Figura 2.40: Operaci´on de Mutaci´on.
Selecci´on o Reproducci´on: Este operador escoge cromosomas entre la poblaci´on para efectuar la reproducci´on. Cuanto m´as capaz sea el cromosoma, m´as veces ser´a seleccionado para reproducirse. Cruce: El cruce consiste, normalmente, como en su espejo biol´ogico, en un intercambio de material gen´etico entre dos cromosomas de dos padres haploides. Se trata de un operador cuya labor es elegir un lugar y cambiar las secuencias antes y despu´es de esa posici´on entre dos cromosomas, para crear nueva descendencia, por ejemplo, las cadenas 0110001110 y 1001100011 pueden cruzarse despu´es del sesto lugar para producir la descendencia 0110000011 y 1001101110. Imita la recombinaci´on biol´ogica entre dos organismos haploides, como se detalla en la Figura (2.39). Mutaci´ on: La mutaci´on es una permutaci´on en un bit en un lugar aleatorio o en los alfabetos largos, remplaza el s´ımbolo de un lugar escogido aleatoriamente con un s´ımbolo nuevo escogido tambi´en aleatoriamente. Este operador produce variaciones de modo aleatorio en un cromosoma, por ejemplo, la cadena 0100101110 puede mutar su cuarta y novena posici´on para dar lugar a la cadena 0101101100. La mutaci´on puede darse en cada posici´on de un bit en una cadena, con una probabilidad, normalmente muy peque˜ na, por ejemplo 0,001, como se detalla en la Figura (2.40). 82
El Algoritmo Gen´ etico Simple La implementaci´on del Algoritmo Gen´etico necesita una codificaci´on o representaci´on del problema, que resulte adecuada al mismo. El resultado de la combinaci´on de las anteriores funciones ser´a un conjunto de individuos, posibles soluciones al problema, los cuales en la evoluci´on del Algoritmo formar´an parte de la siguiente poblaci´on, [Michalewicz, 1992]. El Algoritmo Gen´etico Simple, tambi´en denominado Can´onico, se detalla a continuaci´on y se presenta su diagrama en la Figura (2.41). Pseudoc´ odigo del Algoritmo Gen´ etico Simple BEGIN /* Algoritmo Genetico Simple */ Generar una poblacion inicial. Computar la funcion de evaluacion de cada individuo. WHILE NOT Terminado DO BEGIN /* Producir nueva generacion */ FOR Tama~ nno poblacion/2 DO BEGIN /*Ciclo Reproductivo */ Seleccionar: dos individuos de la anterior generacion, para el cruce (probabilidad de seleccion proporcional a la funcion de evaluacion del individuo). Cruzar: con cierta probabilidad los dos individuos obteniendo dos descendientes. Mutar: los dos descendientes con cierta probabilidad. Computar: la funcion de evaluacion de los dos descendientes mutados. Insertar: los dos descendientes mutados en la nueva generacion. END IF la poblacion ha convergido THEN Terminado := TRUE END END
83
Figura 2.41: Diagrama del Algoritmo Gen´etico Simple o Can´onico.
84
Cap´ıtulo 3 Descripci´ on Estad´ıstica del r´ıo Paran´ a 3.1.
Introducci´ on
En este Cap´ıtulo se realiza la Descripci´on Estad´ıstica del r´ıo Paran´a, iniciando en la Secci´on (3.2) con el Estudio Estad´ıstico Descriptivo del r´ıo en la localidad de Corrientes, en la Secci´on (3.3) se presentan los Gr´aficos de Evoluci´on Temporal, en la Secci´on (3.4) se analizan las Tendencias, en la Secci´on (3.5), se presentan los Gr´aficos de Recurrencia y finalizando en la Secci´on (3.6) con las Conclusiones Cualitativas y Cuantitativas sobre el comportamiento del r´ıo Paran´a.
3.2.
Estudio Estad´ıstico Descriptivo
Los datos que se trabajan en la presente tesis, son datos diarios del per´ıodo de a˜ nos de 1989 a 2009, los cuales han sido obtenido de las siguientes instituciones, como se detalla en el Cap´ıtulo 1, en la Secci´on (1.3.8): SMN-Servicio Meteorol´ogico Nacional, Subsecretar´ıa de Planeamiento, Ministerio de Defensa, Rep. Argentina, [SMN, 2008 a 2013]. SNIH-Sistema Nacional de Informaci´on H´ıdrica de la Subsecretar´ıa de Recursos H´ıdricos, Secretar´ıa de Obras P´ ublicas, Ministerio de Planificacion Federal, Inversi´on Publica y Servicios, Rep. Argentina, [SNIH, 2008 a 2013]. La informaci´on facilitada por ambos Organismos P´ ublicos, presenta irregularidades de falta de informaci´on en algunos subper´ıodos, del per´ıodo de a˜ nos de 1989 a 2009, por lo cual se analizan los datos para detectar estas situaciones y hacer estimaciones de los datos faltanes en base a promedios y considerando la tendencia de los datos. Para el estudio estad´ıstico descriptivo se considera el per´ıodo de a˜ nos de 1989 a 2008, por contar con datos anuales completos en ese per´ıodo, los datos del a˜ no 2009 son incompletos al contar solamente con informaci´on de los meses de enero a abril, por lo cual no es considerado para estudio estad´ıstico descriptivo, aunque si se han utilizado para validaci´on y testeo de diferentes modelos. 85
Se consideran para el desarrollo de la presente tesis las dos u ´ltimas per´ıodos de inundaciones, que han superado los 8, 00m, los a˜ nos de 1991-1992 y de 1997-1998, por ser ambas posteriores a la construcci´on de la Central Hidroel´ectrica Binacional Argentina-Paraguaya de Yacyreta, la cual ha modificado y regulado el curso normal del r´ıo Paran´a aguas abajo. En la inundaci´on de 1991-1992, la represa estaba en etapa avanzada de construcci´on y en la de 1997-1998 en etapa de funcionamiento parcial.
3.2.1.
Estad´ısticos de las Alturas Hidrom´ etricas en la localidad de Corrientes en los a˜ nos 1989-2008
Inicialmente se realiza un estudio estd´ıstico descriptivo de las Alturas Hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, analizando el per´ıodo del 1 de enero de 1989 al 31 de diciembre de 2008, obteni´endose los siguientes estad´ısticos, para este per´ıodo de 20 a˜ nos: Media o Promedio: 3, 95m Mediana: 3, 72m Moda: 3, 40m M´aximo: 8, 61m M´ınimo: 1, 40m Rango: 7, 21m Q1 : 3, 02m Q2 : 3, 72m Q3 : 4, 74m Coef. Asimetr´ıa: 0, 74 Desviaci´on Estandar: 1, 23 Curtosis: 0, 28 Varianza: 1, 52m2 Esto indica las siguientes caracter´ısticas estad´ısticas del r´ıo en la localidad de Corrientes, una Altura Promedio de 3, 95m, por lo cual podemos deducir que en promedio la altura del r´ıo presenta valores por debajo de los valores de alerta, la Moda es de 3, 40m lo que indica que es el valor mas frecuente en la altura del r´ıo, las alturas hidrom´etricas se distribuyen en un rango de 7, 21m siendo el valor M´aximo de 8, 61m y el M´ınimo de 1, 40m, el Cuartil Q1 es de 3, 02m lo que indica que el 25 % se presentan valores inferiores a este valor, el Cuartil Q2 y la Mediana es de 3, 72m lo que nos indica que el 50 % de las alturas presentan valores inferiores a esta altura y el Cuartil Q3 es de 4, 74m, indicando que el 75 % de las mediciones presentan valores inferiores a este valor. 86
El Coeficiente de Asimetr´ıa de la serie es de 0, 74, por lo cual presenta una distribuci´on asim´etrica positiva, que indica que se concentran m´as valores a la derecha de la media aritm´etica o promedio, que a su izquierda. La Desviaci´on Estandar es de 1, 23, siendo la desviaci´on est´andar una medida del grado de dispersi´on de los datos con respecto al valor promedio, nos indica que los datos se distribuyen en promedio con respecto a la media aritm´etica en 1, 23. El Coeficiente de Curtosis es de 0, 28, siendo que analiza el grado de concentraci´on que presentan los valores alrededor de la zona central de la distribuci´on, al ser positivo nos indica que los datos son sesgados a la derecha y que se trata de una distribuci´on leptoc´ urtica, que presenta un elevado grado de concentraci´on alrededor de los valores centrales de la variable. Analizando estos estad´ısticos puede observarse que el r´ıo Paran´a en la ciudad de Corrientes, presenta la mayor parte del tiempo valores inferior a los 5, 00m, que es el primer valor de alerta de emergencia de inundaci´on, por ello podemos deducir que las inundaciones son fen´omenos no frecuentes pero de gran magnitud, porque en per´ıodos de inundaci´on, los valores de alturas hidrom´etrica alcanzan los 8, 61m, lo que supera el doble de los valores promedio, media y moda de la serie.
3.2.2.
Estad´ısticos de las Alturas Hidrom´ etricas en la localidad de Corrientes, en Per´ıodo sin Inundaci´ on A˜ nos 2005-2006
Media o Promedio: 3, 31m Mediana: 3, 21m Moda: 2, 49m Maximo: 5, 80m M´ınimo: 1, 95m Rango: 3, 85m Q1 : 2, 74m Q2 : 3, 21m Q3 : 3, 72m Coef. Asimetr´ıa: 0, 92 Desviaci´on Estandar: 0, 77 Curtosis: 0, 90 Varianza: 0, 59m2 Las caracter´ısticas estad´ısticas del r´ıo en la localidad de Corrientes en el per´ıodo de curso nomal considerando los a˜ nos de 2005-2006, presenta una Altura Promedio de 3, 31m, por lo cual podemos deducir que en promedio la altura del r´ıo se mantuvo por debajo de los valores de alerta, al igual que la Moda que es de 2, 49m, las alturas hidrom´etricas se 87
distribuyen en un rango de 3, 85m siendo el valor M´aximo de 5, 80m, el M´ınimo de 1, 95m y la Mediana es de 3, 21m. El Coeficiente de Asimetr´ıa de la serie es de 0, 92, por lo cual presenta una distribuci´on asim´etrica positiva, que indica que se concentran m´as valores a la derecha de la media aritm´etica o promedio, que a su izquierda. El Coeficiente de Curtosis es de 0, 90, siendo que analiza el grado de concentraci´on que presentan los valores alrededor de la zona central de la distribuci´on, al ser positivo nos indica que los datos son sesgados a la derecha y que se trata de una distribuci´on leptoc´ urtica, que presenta un elevado grado de concentraci´on alrededor de los valores centrales de la variable. Analizando estos estad´ısticos puede observarse que el r´ıo Paran´a en la ciudad de Corrientes, en per´ıodos de alturas normales presenta la mayor parte del tiempo valores inferior a los 5, 00m, que es el primer valor de alerta de emergencia de inundaci´on y que el valor de alerta es superados en raras ocasiones y por pocos d´ıas.
3.2.3.
Estad´ısticos de las Alturas Hidrom´ etricas en la localidad de Corrientesde, en Per´ıodo de Inundaci´ on A˜ nos 19911992
Media o Promedio: 4, 53m Mediana: 4, 57m Moda: 4, 70m M´aximo: 8, 61m M´ınimo: 2, 14m Rango: 6, 47m Q1 : 3, 54m Q2 : 4, 57m Q3 : 5, 22m Coef. Asimetr´ıa: 0, 53 Desviaci´on Estandar: 1, 33 Curtosis: 0, 17 Varianza: 1, 76m2 Analizando las caracter´ısticas estad´ısticas del r´ıo en la localidad de Corrientes en el per´ıodo de Inundaci´on 1991-1992, se observa una Altura Promedio de 4, 53m, por lo cual podemos deducir que en promedio la altura del r´ıo se mantuvo por debajo de los valores de alerta, al igual que la Moda que es de 4, 70m, las alturas hidrom´etricas se distribuyen en un rango de 6, 47m, siendo el valor M´aximo de 8, 61m, el M´ınimo de 2, 14m y la Mediana es de 4, 57m. 88
El Coeficiente de Asimetr´ıa de la serie es de 0, 53, por lo cual presenta una distribuci´on practicamente sim´etrica, que indica que se concentran m´ınimamente m´as valores a la derecha de la media aritm´etica o promedio, que a su izquierda. El Coeficiente de Curtosis es de 0, 17, al ser positivo nos indica que los datos son sesgados a la derecha y que se trata de una distribuci´on leptoc´ urtica, que presenta un elevado grado de concentraci´on alrededor de los valores centrales de la variable. Analizando estos estad´ısticos puede observarse que el r´ıo Paran´a en la ciudad de Corrientes, presenta la mayor parte del tiempo valores inferior a los 5, 00m, que es el primer valor de alerta de emergencia de inundaci´on, a pesar de ser per´ıodos de inundaci´on, aunque presenta en estos a˜ nos alturas m´as altas que oscilan entre 0, 50m y 1, 00m, que los valores promedio generales, por ello podemos deducir que las inundaciones son fen´omenos no frecuentes pero de gran magnitud y con una permanencia en valores altos cercanos o superiores al nivel de alerta, que cuando se presenta el pico de crecida en los per´ıodos de inundaci´on, los valores de alturas hidrom´etrica alcanzan los 8, 61m, conservando valores pr´oximo a este valor por varios d´ıas, siendo en la onda de crecida valores de altura hidrom´etrica que superan notablemente los valores promedio, media y moda de la serie en per´ıodo de inundaci´on.
3.2.4.
Estad´ısticos de las Alturas Hidrom´ etricas en la localidad de Corrientesde, en Per´ıodo de Inundaci´ on A˜ nos 19971998
Media o Promedio: 5, 31m Mediana: 5, 38m Moda: 5, 61m Maximo: 8, 38m M´ınimo: 2, 83m Rango: 5, 55m Q1 : 4, 15m Q2 : 5, 38m Q3 : 6, 29m Coef. Asimetr´ıa: 0, 07 Desviaci´on Estandar: 1, 32 Curtosis: −0, 82 Varianza: 1, 75m2 Los siguientes estad´ısticas del r´ıo en la localidad de Corrientes en el per´ıodo de Inundaci´on de 1997-1998, presenta una Altura Promedio de 5, 31m, por lo cual podemos deducir que en promedio la altura del r´ıo se mantiene por encima de los valores de alerta, al igual 89
que la Moda que es de 5, 61m, las alturas hidrom´etricas se distribuyen en un rango de 5, 55m siendo el valor M´aximo de 8, 38m, el M´ınimo de 2, 83m y la Mediana es de 5, 38m. El Coeficiente de Asimetr´ıa de la serie es de 0, 07, por ser un valor cercano a cero, puede considerarse que la distribuci´on es sim´etrica, presentando aproximadamente la misma cantidad de valores a ambos lados de la media. El Coeficiente de Curtosis es de −0, 82, siendo que analiza el grado de concentraci´on que presentan los valores alrededor de la zona central de la distribuci´on, al ser negativo nos indica que los datos son sesgados minimamente a la izquierda y que se trata de una distribuci´on platic´ urtica, que presenta un reducido grado de concentraci´on alrededor de los valores centrales de la variable. Analizando estos estad´ısticos puede observarse que el r´ıo Paran´a en la ciudad de Corrientes en el per´ıodo de Inundaci´on de 1997-1998, presenta la mayor parte del tiempo valores superiores a los 5, 00m, que es el primer valor de alerta de emergencia de inundaci´on, aunque presenta en estos a˜ nos alturas mas altas que oxilan entre 0, 50m y 1, 00m, que el promedio general. Al comparar los estad´ısticos de esta inundaci´on con los valores de la inundaci´on de 1991-1992, podemos destacar que en esta inundaci´on el valor m´aximo ha sido menor en 0, 23m, pero la onda de crecida ha permanecido con valores altos m´as tiempo que la inundaci´on de 1991-1992, lo cual se aprecia al comparar los valores de las medianas para 1991-1992 es de 4, 57m y para 1997-1998 es de 5, 38m.
3.3.
Gr´ aficos de Evoluci´ on Temporal
Al observar los gr´aficos de las Alturas Hidrom´etricas del r´ıo Paran´a, es notable que presenta un amplio rango de fluctuai´on hidrom´etrica, tanto en per´ıodos de inundaciones como en a˜ nos de curso normal, como puede observarse en las Figuras (3.1), (3.2) y (3.3). En la Figura (3.1), puede observar que cada a˜ no en los primeros meses de enero a marzo se presenta una onda de crecida, que en a˜ nos de curso normal no alcanza los valores de alerta de inundaci´on y que en los meses de agosto a noviembre se repite en algunos a˜ nos un nuevo aumento en las alturas pero de menor intensidad. En la Figura (3.2), se comparan alturas hidrom´eticas en la localidad de Corrientes, de las u ´ltimas inundaciones de gran importancia las de 1991-1992 y de 1997-1998, con las alturas de a˜ nos de curso normal como 2005-2006, donde puede observarse que el r´ıo no mantiene patrones de comportamiento homog´eneos, los per´ıodos de inundaci´on se presentan en diferentes meses, con intensidad y amplitud diferente, siendo la caracter´ıstica com´ un lo imprevisible del comportamiento del r´ıo en especial cuando la inundaci´on alcanza el piso de crecida como puedo observarse en detalle en la gr´afica de la Figura (3.3), donde se comparan las alturas m´aximas alcanzadas por el r´ıo en las mencionadas inundaciones.
3.4.
Tendencia
El funcionamiento y estructura de los r´ıos con planicie de inundaci´on, como el r´ıo Paran´a, est´an condicionados por las inundaciones peri´odicas o pulsos de energ´ıa y materia o pulso hidrosedimentol´ogico, en r´ıos como el Paran´a, las crecientes y las bajantes 90
Figura 3.1: Variaciones de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodo 1989-2008.
Figura 3.2: Comparacion de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en per´ıodos normales y de inundaciones.
91
Figura 3.3: Comparaci´on de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en los per´ıodos de picos de inundaci´on.
conforman dos fases complementarias del pulso: aguas altas o potamofase y aguas bajas o limnofase, como se observa en la Figura (3.4), las cuales tienen una influencia notable en la estabilidad de los ecosistemas del macrosistema fluvial. La frecuencia, la intensidad y la duraci´on de ambas fases dependen de la posici´on topogr´afica de las islas del r´ıo, por lo cual, en cada punto de la planicie inundable, los efectos de una misma creciente son potencialmente distintos, [Neiff, 1999]. La din´amica de pulsos est´a caracterizada por atributos hidrol´ogicos, definidos en la funci´on f FITRAS, que es el acr´onimo de: Frecuencia (F), Intensidad (I), Tensi´on (TM: tensi´on m´axima; Tm: Tensi´on m´ınima), Regularidad (R), Amplitud (A), Estacionalidad (S), como se detalla en la Figura (3.5), [Neiff, 1999]: Frecuencia (F): n´ umero de veces que ocurre un fen´omeno determinado dentro de una unidad de tiempo (ej. inundaciones de 8 m en el hidr´ometro de Corrientes a lo largo de un siglo). Intensidad (I): magnitud alcanzada por una fase de inundaci´on o de sequ´ıa. Se mide generalmente por el valor alcanzado en el hidr´ometro m´as pr´oximo o en t´erminos de caudal de agua. Tensi´ on (TM: Tensi´ on m´ axima; Tm: Tensi´ on m´ınima): valor de la desviaci´on t´ıpica desde las medias m´aximas o desde las medias m´ınimas de una curva de fluctuaci´on hidrom´etrica del r´ıo. Se la define tambi´en como envolvente de fluctuaci´on y permite establecer la variabilidad en la magnitud de los eventos de inundaci´on y sequ´ıa. Se expresa generalmente en valores hidrom´etricos o en caudal. 92
Figura 3.4: Representaci´on esquem´atica de las fases de aguas altas y bajas en el r´ıo Paran´a.
Regularidad o Recurrencia (R): corresponde a la probabilidad estad´ıstica de un evento de inundaci´on o sequ´ıa de magnitud determinada dentro de una centuria o de un milenio. Est´a dado por la frecuencia relativa. Amplitud (A): tambi´en expresada como duraci´on, es el segmento de tiempo que permanece el r´ıo en una fase de inundaci´on o de sequ´ıa de determinada magnitud. Estacionalidad (S): se refiere a la frecuencia estacional en que ocurren las fases de sequ´ıas o inundaciones. Los organismos, excepto el hombre, tienen ajustes de sus ciclos de vida (fertilidad, reproducci´on, crecimiento) a la ´epoca en que ocurren los eventos hidrol´ogicos. Las diferencias en la posici´on topogr´afica en distintos puntos de una planicie, determinar´an diferente frecuencia, intensidad y duraci´on de las fases de inundaci´on y de sequ´ıa. La oferta de h´abitat para micro y macro organismos tambi´en ser´a distinta y puede ser calificada y cuantificada, como se grafica en la Figura (3.6), [Neiff, 1999]. El r´ıo Paran´a en la localidad de Corrientes, es un r´ıo poco predecible, com bajo isocronismo, baja recurrencia de pulsos y magnitud muy variable de fases, como se observa en la Figura (3.1), esto se debe a su r´egimen hidrol´ogico mixto, complejo y al hecho de captar agua de regiones clim´aticas diferentes, por estar orientado de norte a sur recoge las lluvias en el extenso recorrido en Brasil, considerando adem´as que el r´ıo Iguaz´ u tiene una influencia muy marcada en el bajo Paran´a.
3.4.1.
Tendencia Evolutiva
Para la tendencia evolutiva, pueden implementarse las medias m´oviles, siendo esta una funci´on que evoluciona lentamente, que puede aproximarse en intervalos muy cortos, este m´etodo de suavizado consiste, en promediar la serie, estos promedios ser´an las medias 93
Figura 3.5: Variaciones hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes desde enero de 1998 hasta enero de 2006, [Neiff, 1999].
Figura 3.6: Representaci´on esquem´atica de un Pulso de Inundaci´on del r´ıo Paran´a, [Neiff, 1999].
aritm´eticas de un conjunto k de valores consecutivos, con el requisito de que k sea inferior al total de observaciones. Con este m´etodo lo que se hace es suavizar la serie promediando los valores de la misma para periodos de tiempo fijos pero que se desplazan a lo largo de todo el horizonte de la serie, el resultado de este proceso es la eliminaci´on de los movimientos a corto y medio plazo as´ı como las irregularidades debidas a factores no controlables ni predecibles. Es decir, a la serie se le quitan tres de sus componentes y se le deja s´olo la tendencia. La idea que subyace detr´as de este m´etodo es que la media de cualquier conjunto de valores sirve para eliminar la dispersi´on o variabilidad de la serie motivada por factores coyunturales 94
o espor´adicos. Como se detalla en la Figura (3.7), que presenta las alturas en la localidad de Corrientes en el per´ıodo 1989-2008, y l´ınea de tendencia, para la cual se consideran medias m´oviles de orden 7, en este caso se consideran 7 datos, como la componente irregular tiene media cero, la media de los siete valores del componente irregular se puede suponer que es despreciable frente a la tendencia y representa la tendencia en ese instante.
Figura 3.7: Alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodo 1989-2008 y l´ınea de tendencia aproximada por medias m´oviles de orden 7.
En las Figuras (3.8) y (3.9), se detallan las alturas hidrom´etricas para la misma localidad, en per´ıodos de inundaciones, con sus correspondientes l´ıneas de tendencia, para ambos per´ıodos de inundacion la tendencia se aproxima por medias m´oviles de orden 2, lo que denota que el comportamiento del desplamienzo de la onda de agua en per´ıodos de crecida, tiene un desplazamiento distinto a per´ıodos de cauce normal del r´ıo. Al analizar la serie de las alturas en la localidad de Corrientes en el per´ıodo 19892008, es notable que la tendencia con medias m´oviles de orden 7, dan una tendencia muy aceptable a la serie, es de destacar que 7 son los d´ıas que tarda en llegar la onda de agua desde la localidad de Pto. Iguaz´ u a la localidad de Corriente. Al analizar las alturas en la localidad de Corrientes en los per´ıodos de inundaci´on de los a˜ nos 1991-1992 y 1997-1998, las tendencia s son paroximadas con medias m´oviles de orden 2, dan una tendencia muy aceptable a la serie, siendo aproximadamente 2 d´ıas el tiempo que tarda en llegar la onda de agua desde la salida de vertederos de la represa de Yacyret´a a la localidad de Corriente. 95
Figura 3.8: Alturas hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes en el per´ıodo de Inundaci´on de 1991-1992 y l´ınea de tendencia aproximada por medias m´oviles de orden 2.
3.5.
Gr´ aficos de Recurrencia y Frecuencia
La frecuencia y la recurrencia tambi´en definen la modalidad de fluctuaci´on del r´ıo, la frecuencia indica el n´ umero de veces que ocurre un proceso en un determinado lapso de tiempo, por ejemplo el n´ umero de crecidas extraordinarias del r´ıo Paran´a en un siglo y la recurrencia define la regularidad con que el fen´omeno ocurre en el tiempo, por ejemplo cada 6 a˜ nos. En el cuadro de la Figura (3.10), se detallan la recurrencia de las Inundaciones seg´ un las alturas hidrom´etricas m´aximas alcanzadas en cada una de ellas, puede observarse que a mayor altura hidrom´etrica del r´ıo, es menor su recurrencia. En la Figura (3.11), se puede observar el histograma mensual de la localidad de Corrientes para el per´ıodo de 1989 a 2008, donde se aprecia claramente como en los meses de enero, febrero y marzo, el r´ıo presenta alturas hidrom´etricas que superan los 5, 00m, que es el valor de alerta de crecida y que representa el primer pico de crecida y de mayor intensidad, siendo febrero el mes de que presenta m´as d´ıas con valores altos, luego en los meses de septiembre, octubre y noviembre se observa la seguna onda de crecida pero de menor intensidad, presentando los valores m´as altos el mes de octubre. En la Figura (3.12), se detalla el histograma anual de la localidad de Corrientes para el per´ıodo de 1989 a 2008, donde se observa claramente la presencia de los dos per´ıodos de inundaci´on que se analizan en el presente trabajo, el primer a˜ no es 1992, que corresponde a la creciente de los a˜ nos 1991-1992 y el segundo de los a˜ nos 1997-1998, los mencionados 96
Figura 3.9: Alturas hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes en el per´ıodo de Inundaci´on de 1991-1992 y l´ınea de tendencia aproximada por medias m´oviles de orden 2.
Figura 3.10: Recurrencia de Inundaciones seg´ un Alturas Hidrom´etricas M´aximas.
a˜ nos denotan alturas hidrom´etricas que superan los 5, 00m, que es el valor de alerta de crecida. Puede observarse claramente como en el a˜ no 1998 superan notablemente los d´ıas con valores altos, lo que corresponde con el pico de la inundaci´on de 1997-1998, que aunque no supera el valor m´aximo de altura de la inundaci´on de 1991-1992, s´ı es la inundaci´on de mayor permanencia de aguas altas, siendo la inundaci´on de mayor amplitud en el per´ıodo analizado. En la Figura (3.13), se describen las frecuencias de las alturas hidrom´etricas de la localidad de Corrientes para el per´ıodo de 1989 a 2008, donde se observa en detalle que se presentan frecuencias muy bajas para las alturas menores a los 2, 5m, que corresponde a per´ıodos de sequ´ıa, las frecuencias m´as altas corresponden para las alturas medias del r´ıo que oscilan, entre los 2, 5m y los 4, 5m, que son las alturas de curso normal del r´ıo, frecuencias medias para las alturas que oscilan entre los 4, 5m y los 6, 5m, que indican per´ıodos de alturas hidrom´etricas cercanas al nivel de alerta de inundaci´on o que la superan 97
Figura 3.11: Histograma mensual de alturas hidrom´etricas del r´ıo Paran´a en a localidad de Corrientes en el per´ıodos de 1989 a 2008.
en poco grado, luego frecuencias bajas para las alturas entre los 6, 5m y los 7, 5m, y frecuencias muy bajas para las alturas que superan los 7, 5m, lo cual nos indica que las grandes inundaciones son sucesos de poca frecuencia, aunque si de gran intensidad alcanzando alturas hidrom´etricas que duplican la altura del curso normal del r´ıo.
3.6.
Conclusiones Cualitativas y Cuantitativas
En el r´ıo Paran´a, como en otros grandes fluvios, las variables fundamentales y primarias que lo definen corresponden a los caudales de energ´ıa y materia que transporta. La estimaci´on de caudal l´ıquido y de volumen acumulado permite conocer el perfil del comportamiento energ´etico del r´ıo, permite evaluar la din´amica fluvial que transforma los flujos h´ıdricos y conocer las diferentes salidas en cada estado del sistema. El valle actual del r´ıo Paran´a es un geosistema inestable en el marco t´emporo espacial, conformado por las condiciones morfoestructurales y clim´aticas que determinan el origen y evoluci´on de la cuenca fluvial, el an´alisis de las alturas hidrom´etricas y caudales revelan un comportamiento biperi´odico del r´egimen fluvial con manifestaciones plurianuales de estiajes y crecidas extraordinarias. Existen observaciones hist´oricas de grandes inundaciones ocurridas en siglos pasados, como las de 1612 y 1748 que son destacadas por haber sido las m´as grandes, aunque no se dispone de datos registrados y suficientemente conocidas como para reconstruir los valores de alturas y caudales. Las mayores crecidas, registradas, del r´ıo Paran´a en la 98
Figura 3.12: Histograma anual de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodos de 1989 a 2008.
ciudad de Corrientes, son las que se detallan en la Figura (3.14). La mayor´ıa de ellas se manifiestan en verano o en oto˜ no-invierno con alturas superiores a 7m, pero presentan notables diferencias en cuanto a volumen, permanencia de las aguas y lapso de recurrencia. Las variaciones de caudal del r´ıo dependen de las precipitaciones en la alta cuenca en Brasil, el r´ıo Paran´a atraviesa zonas con distintos tipos y variedades clim´aticas, el curso superior presenta una creciente anual durante el verano, mientras que los cursos medio e inferior ven modificado su r´egimen por los aportes del r´ıo Paraguay, lo que provoca una segunda creciente durante el invierno. El m´aximo caudal del r´ıo se registra hacia fines del verano en los meses de enero, febrero y marzo y el estiaje a fines del invierno y la primavera en los meses de agosto, septiembre, octubre y noviembre, presentando los siguientes caudales medios en su recorrido en territorio argentino, en a˜ nos sin inundaciones: 11.500 m3 /s en Apip´e, 15.240 m3 /s en Corrientes, 15.000 m3 /s en Rosario. En su desembocadura en el R´ıo de la Plata, considerando todos los brazos del delta, su caudal da una media de 17.000 m3 /s, comparable a la de r´ıos como el Misisipi de 18.000 m3 /s y el Ganges 16.000 m3 /s. En el cuadro de la Figura (3.15), se presenta un comparativo de los valores estad´ısticos del r´ıo en la localidad de Corrientes, donde puede observarse el comportamiento inestable 99
Figura 3.13: Frecuencias de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodos de 1989 a 2008.
Figura 3.14: Alturas y Cuadales de per´ıodos de Inundaciones en la localidad de Corrientes.
y no predecible del r´ıo Paran´a, en especial en per´ıodos de inundaci´on. Puede observarse que en ´epocas de crecidas los valores de altura promedio, como la moda y la media son duplicados con referencia a los valores de a˜ nos normales y que las inundaciones tienen comportamientos diferentes en 1991-1992 alcanzo una mayor altura llegando a los 8, 61m, pero la inundaci´on fue de menor duraci´on, sin embargo en 1997-1998 el r´ıo alcanz´o 8, 38m, pero con una mayor duraci´on o amplitud, lo cual se denota en los estad´ısticos del per´ıodo de inundacion, con valores de mediana y del cuartil Q3 de 5, 38m, como el valor de la moda de 5, 61m, siendo valores que superan el nivel de alerta de inundaci´on de 5, 00m.
100
Figura 3.15: Cuadro Comparativo de Estad´ısticos de las Alturas Hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes.
101
102
Parte II Implementaci´ on y Validaci´ on de las Aportaciones Propuestas
103
104
Cap´ıtulo 4 Aplicaci´ on de Modelos de Series Temporales Lineales para Predicci´ on 4.1.
Introducci´ on
En este Cap´ıtulo se detalla la Aplicaci´on de Modelos de Series Temporales Lineales para Predicci´on, iniciando en la Secci´on (4.2) con el An´alisis de Series Ttemporales, presentando diferentes modelos, en la Secci´on (4.3) se presenta el An´alisis de Altura del r´ıo y Variables Meteorol´ogicas con diferentes Modelos de Series Temporales y en la Secci´on (4.4), se detallan Modelos de Series Temporales aplicados en el An´alisis de Alturas y Caudales, los an´alisis que se presentan en este cap´ıtulo son para realizar predicciones de alturas hidrom´etricas en la localidad Corrientes, con informaci´on de esta estaci´on y las estaciones del Alto Paran´a de Pueto Iguaz´ u, Posadas e Itat´ı.
4.2.
Series Temporales Lineales
En esta cap´ıtulo se aplican diferentes modelos de series temporales lineales para predicciones de las alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, se analizan inicialmente las series completas de 20 a˜ nos de informaci´on de las diferentes estaciones que han sido facilitadas por los organismos p´ ublicos, mencionados en la Secci´on (1.3.8). Cuando se tiene una secuencia de valores observados a lo largo del tiempo, ordenados cronol´ogicamente, se denominan serie temporal, analizando el conjunto de datos recopilados para realizar el estudio del comportamiento de r´ıo Paran´a, se denota claramente que cumple esta caracter´ıstica, por ello se comienza el an´alisis aplicando an´alisis de series temporales lineales a los datos del r´ıo.
4.2.1.
Modelos ARIMA - Herramientas Implementadas
Implementaci´ on en FreeFore Para realizar el an´alisis de Serie Temporales a los datos del r´ıo Paran´a se usa FreeFore que es un Sistema de Predicci´on Autom´atico. FreeFore es una antigua versi´on gratuita 105
de Autobox (www.autobox.com), para construir modelos Box-Jenkins, presenta un buen conjunto de modelos de regresi´on y de series de tiempo ARIMA para los datos univariados y multivariados. Freefore usa modelos heur´ısticos autom´aticos, no elige el mejor, trabaja con detecci´on de intervenci´on. Se adapta el modelo de previsi´on para el problema bajo analisis, incluyendo la selecci´on de las mejores estructuras de pulso y de retraso para cada serie de entrada. Se corrige la omisi´on de variables, por ejemplo, los cambios que han afectado a los datos hist´oricos. FreeFore es un software gratuito, una versi´on reducida del programa comercial Autobox, pero tiene el mismo modelo y motor de pron´ostico. FreeFore tiene un conjunto de herramientas gr´aficas que ayudan a presentar informaci´on estad´ıstica compleja de una forma que sea f´acil y claro en cada etapa del proceso de previsi´on e incluso una descripci´on simple del modelo final. Los gr´aficos de autocorrelaci´on, autocorrelaci´on parcial y funciones de correlaci´on cruzada est´an todos disponibles. An´ alisis con Matlab, Herramienta de Identificaci´ on de Sistemas GUI Las Herramientas de Identificaci´on de Sistemas GUI, que tiene Matlab, permite construir modelos matem´aticos en forma din´amica bas´andose en los datos, generando varios modelos, permitiendo su posterior an´alisis, para determinar el modelo que mejor ajusta a los datos que estamos estudiando y permite seleccionar el tipo de modelo que se desea trabajar.
4.3.
An´ alisis de Alturas Hidrom´ etricas del r´ıo y Variables Meteorol´ ogicas en Corrientes
Primeramente se realiza el an´alisis con los datos Meteorol´ogicos y la Altura de r´ıo en la localidad de Corrientes, para determinar la incidencia de los datos meteorol´ogicos sobre la altura del r´ıo Paran´a, considerando las siguientes variables Meteorol´ogicas: Precipitacion (mm) Temperatura M´axima (o C) Temperatura M´ınima (o C) Temperatura Media (o C) Humedad Relativa ( %) Viento Escalar Medio en Km/h Presi´on Atmosf´erica a nivel de la estaci´on (hPa) Altura del r´ıo Media (m) 106
Este conjunto de datos comprende registros diarios por un per´ıodo de 20 a˜ nos, pero presenta muchos intervalos faltantes de informaci´on en cada variable, siendo estos intervalos de tiempo distintos para cada variable, por lo cual es una ardua tarea encontrar un per´ıodo de varios a˜ nos con datos completos en todas las variables. Con este an´alisis de busca determinar la incidencia de las variables Meteorol´ogicas sobre la altura del r´ıo y si existe, poder determinar su grado de influencia en la altura hidromm´etrica del r´ıo Paran´a en la localidad de Corrientes.
4.3.1.
An´ alisis con FreeFore
Se consideran las variables Meteorol´ogicas y la altura hidrom´etrica del r´ıo en la localidad de Corrientes en el per´ıodo de 2005 a 2008, tomando adem´as el a˜ no 2009 para posteriores controles de validaci´on de resultados, en la Figura(4.1), se muestra el detalle de los datos a procesar.
Figura 4.1: FreeFore: Datos Meteorol´ogicos y Alturas Hidromm´etricas del r´ıo en la localidad de Corrientes. FreeFore luego del procesado de los datos genera el siguiente modelo de Autorregresi´on, que se indica en la F´ormula (4.1): Y (T ) = 3,3004 + [(1 − 0,992B 1 )]−1 [A(T )] donde: 107
(4.1)
Figura 4.2: FreeFore: Errores del modelo generado, al pronosticar la Altura del r´ıo en Corrientes con 7 d´ıas de antelaci´on.
3,3004, es la media de la altura del r´ıo, [(1 − 0,992B 1 )]−1 , es el coeficiente B de retardo aplicado con un d´ıa de atraso, en los valores de altura del r´ıo en Corrientes, T , es el tiempo, A, es la Altura del r´ıo en Corrientes, Y , es la variable estimada Altura del r´ıo en Corrientes. Al analizar el modelo generado por FreeFore, las variables Meteorol´ogicas han sido descartadas en el modelo, porque el modelo utiliza solamente los datos de altura de r´ıo en el d´ıa anterior, para predecir la altura del r´ıo. Este an´alisis se ha repetido con distintos per´ıodos de tiempo para la localidad de Corrientes, tambi´en incluyendo datos meteorol´ogicos de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, obteniendose en todos los casos resultados similares, en los que las variables Meteorol´ogicas no eran inclu´ıdas en el modelo generado. En el modelo de Autorregresi´on generado por FreeFore, se ha utilizado para realizar predicciones de Altura del r´ıo en la localidad de Corrientes con un pron´ostico a 7 d´ıas, en base a los datos meteorol´ogicos, en la Figura (4.2), puede observarse que los errores del modelo oscilando entre 0, 43m y −0, 17m, que el error promedio es de un 0, 18m, que el 71 % de los pron´osticos superan un error de 0, 10m y que el 43 % de los pron´osticos est´an por debajo de la altura real del r´ıo, cuando el r´ıo presenta cuace normal. Al aplicar el mismo modelo a per´ıodos de inudaci´on, los errores crecen alcanzando para la inundaci´on de 1991-1992, un error promedio en valor absoluto de 2, 25m y con datos de la inundaci´on de 1997-1998, un valor 1, 98m, lo cual indica que el r´ıo presenta comportamientos muy distintos en per´ıodos de inundaci´on que en per´ıodos normales o de bajantes. 108
4.3.2.
An´ alisis con Herramienta de Identificaci´ on de Sistemas de Matlab
Para este an´alisis, con las herramientas de Matlab, se trabaja con el mismo conjunto de datos que se han analizado con FreeFore, para poder comparar los resultados y analizar las variables que estan siendo priorizadas en los modelos generados. Se consideran las variables Meteorol´ogicas y la altura hidrom´etrica del r´ıo en la localidad de Corrientes en el per´ıodo de 2005 a 2008, tomando adem´as el a˜ no 2009 para posteriores controles de validaci´on de resultados, en la Figura (4.3), se muestra el detalle de los datos a procesar.
Figura 4.3: Herramienta de Identificaci´on de Sistemas de Matlab-Datos Meteorol´ogicos y Altura Hidrom´etricas del r´ıo en la localidad de Corrientes y el modelo Autorregresi´on seleccionado, que ser´a aplicado.
En Matlab, luego del procesado de los datos se genera el siguiente modelo ARX de Autorregresi´on, el cual se detalla en la F´ormula (4.2):
A(q)y(t) = B(q)u(t) + e(t) A(q) = 1 − 2,155(±0,0378)q −1 + 1,925(±0,08332)q −2 − 1,006 (±0,08306)q −3 + 0,2516(±0,03742)q −4 109
(4.2)
B1(q) = −0,001247(±0,00107)q −32 − 0,0002419(±0,001669)q −33 +0,002567(±0,001775)q −34 − 0,0003788(±0,001166)q −35 B2(q) = −0,0008386(±0,0003551)q −33 + 0,0004097(±0,0004322)q −34 −0,000299(±0,0003955)q −35 + 0,000415(±0,0003253)q −36 B3(q) = 0,0004321(±0,0008554)q −16 − 0,0002909(±0,001299)q −17 +0,001177(±0,001293)q −18 − 0,001154(±0,0008504)q −19 B4(q) = −0,000246(±0,0006276) + 0,0001825(±0,000684)q −1 +0,001176(±0,000683)q −2 + 0,0001153(±0,0006289)q −3 B5(q) = 0,0003662(±0,0002217) + 0,0003618(±0,0002231)q −1 −0,0004074(±0,0002233)q −2 + 3,058e − 005(±0,0002223)q −3 donde: q, es el coeficiente de retardo aplicado a cada variable meteorol´ogica y a la altura del r´ıo del modelo, e, es una estimaci´on del error aleatorio del c´alculo, t, es el tiempo, u, es cada una de las variables Meteorol´ogicas A, es la Altura del r´ıo en Corrientes, Y , es la variable estimada Altura del r´ıo en Corrientes. Al analizar el modelo generado, por Matlab, se aprecia que las variables Meteorol´ogicas son anuladas en el modelo por estar multiplicadas por valores muy cercanos a cero, lo que indica su influencia nula, el modelo utiliza solamente los datos de altura del r´ıo en los d´ıas anteriores, para predecir la altura actual, teniendo mayor incidencia la altura del d´ıa anterior y en grado decreciente las alturas de 2 d´ıas antes, 3 d´ıas antes y 4 d´ıas antes, ya con una influencia marcadamente menor. Este an´alisis se ha repetido con distintos per´ıodos de tiempo para la localidad de Corrientes, tambi´en incluyendo datos meteorol´ogicos de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, obteniendose en todos los casos resultados similares, en los que las variables Meteorol´ogicas eran anuladas en el modelo generado por coeficientes muy cercanos a cero. El modelo de Autorregresi´on generado se ha utilizado para realizar predicciones de Alturas Hidrom´etricas del r´ıo en la localidad de Corrientes, en la Figura (4.4) en el gr´afico izquierdo, puede observarse los errores del modelo en un pron´ostico a 3 d´ıas, puede apreciarse que el error oscila entre 0, 30m y −0, 70m, y en el gr´afico de la derecha pueden observase los errores al realizar un pron´ostico a 5 d´ıas, donde se observa que el rango de los error es se ha incrementado de 0, 60m a −0, 80m. 110
Figura 4.4: Errores de predicci´on de Altura del R´ıo: Gr´afico Izq.: a 3 d´ıas y Gr´afico Dcho.: a 5 d´ıas.
4.4.
An´ alisis de Alturas y Caudales de Corrientes, con estaciones del Alto Paran´ a
En esta segunda etapa se an´alizan los datos de Alturas y Caudales del r´ıo Paran´a, en estaciones argentinas que se encuentran en el Alto Paran´a en conjunto con los datos de la localidad Corrientes, para determinar la influencia de las alturas y caudales de las estaciones r´ıo arriba, sobre la altura del r´ıo en esta u ´ltima estaci´on y estimar su altura. En la etapa anterior de an´alisis los modelos han descartado la influencia de las variables Meteorol´ogicas en la determinaci´on de la altura del r´ıo en la localidad de Corrientes, lo que se busca en esta nuevo an´alisis es determinar si la altura del r´ıo en esta estaci´on es determinada por las alturas y caudales de las estaciones que se encuentran r´ıo arriba y los valores hidrom´etricos de la misma estaci´on en d´ıas anteriores. Se consideran para este an´alisis las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes, considerando para cada estaci´on las siguientes variables: altura media del r´ıo (m) caudal medio del r´ıo (m3 /seg)
4.4.1.
An´ alisis con FreeFore
El conjunto de datos comprende registros medios diarios de alturas y caudales de las estaciones argentinas del Alto Parn´a y Corrientes en el per´ıodo de 1997 a 1998, siendo estos a˜ nos de inundaciones y tomando el a˜ no 2009 para controles de validaci´on de resultados, en la Figura(4.5), se muestra el detalle de los datos a procesar. En FreeFore luego del procesado de los datos genera el siguiente modelo de Autorregresi´on, que se detalla en la F´ormula (4.3):
111
Figura 4.5: FreeFore: Datos de Alturas y Cuadales en las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes.
Figura 4.6: FreeFore: Errores del modelo generado, al pronosticar la Altura del r´ıo en Corrientes con 7 d´ıas de antelaci´on.
112
Y (T ) = 1,2648 +[X1(T )][(−0,089B 2 )] +[X2(T )][(+0,367 + 0,441B 1 )]
(4.3)
+[(1 − 0,996B 1 )]−1 [A(T )] donde: 1,2648, es la media de la altura del r´ıo, (−0,089B 2 ), es el coeficiente B de retardo aplicado con 2 d´ıas de atraso, en los valores de altura de r´ıo en la estaci´on de Posadas, [(+0,367 + 0,441B 1 )], es el coeficiente B de retardo aplicado con 1 d´ıa de atraso, en los valores de altura de r´ıo en la estaci´on de Itat´ı, [(1 − 0,996B 1 )]−1 , es el coeficiente B de retardo aplicado con 1 d´ıa de atraso, en los valores de altura de r´ıo en la estaci´on de Corrientes, T , es el tiempo, X1, es la Altura del r´ıo en Posadas, X2, es la Altura del r´ıo en Itat´ı, A, es la Altura del r´ıo en Corrientes, Y , es la variable estimada Altura del r´ıo en Corrientes. Al analizar el modelo generado por Freefore, se nota que todas las variables de Caudales en las distintas estaciones y la Altura en Puerto Iguaz´ u, han sido descartadas en el modelo, porque el modelo utiliza solamente los datos de Altura en Posadas de 2 d´ıas atr´as, Altura en Itat´ı de 1 d´ıa atr´as y Altura en Corrientes de 1 d´ıa anterior, para predecir la Altura del r´ıo en Corrientes. Este an´alisis se ha repetido con distintos per´ıodos de tiempo y niveles de altura del r´ıo con valores de Alturas y Caudales para la estaci´on de Corrientes y las estaciones r´ıo arriba de Puerto Iguaz´ u, Posadas e Itat´ı, obteni´endose en todos los casos resultados similares, no incluyendo en ning´ un caso las variables de caudales de todas las estaciones y la de altura de r´ıo de Puerto Iguaz´ u. El modelo de Autorregresi´on generado por FreeFore, se ha utilizado para realizar predicciones de Altura Hidrom´etrica del r´ıo en la localidad de Corrientes con un pron´ostico a 7 d´ıas, en base a las Alturas y Caudales, en la Figura (4.6), puede observarse los errores del modelo oscila entre 0, 05m y −0, 30m, que el error promedio es de un 0, 11m, que el 43 % de los pron´osticos superan un error de 0, 10m y que el 71 % de los pron´osticos est´an por debajo de la altura real del r´ıo, esto siempre en a˜ nos de normales, sin per´ıodos de inundaci´on. Al aplicar el modelo con datos de la inundaci´on de 1991-1992, se presenta un error promedio en valor absoluto de 1, 67m y con datos de la inundaci´on de 1997-1998, se presenta un error promedio de 1, 31m, lo que indica que deber´ıa focalizarse el estudio para per´ıodos de inundaci´on. 113
4.4.2.
An´ alisis con Herramienta de Identificaci´ on de Sistemas de Matlab
Para este an´alisis, con las herramientas de Matlab, se trabaja con el mismo conjunto de datos que se han analizado con FreeFore, para poder posteriormente comparar los resultados y analizar las variables que est´an siendo descartadas o valorizadas en los modelos generados. Se consideran las variables de Alturas y Caudales en estaciones del Alto Paran´a y en Corrientes en el per´ıodo de inundaci´on de 1997 a 1998, considerando datos del a˜ no 1999 para validaci´on de resultados, en la Figura (4.7), se muestra el detalle de los datos a procesar.
Figura 4.7: Herramienta de Identificaci´on de Sistemas de Matlab-Datos de Alturas y Cuadales en las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes.
Matlab, luego del procesado de los datos genera el siguiente modelo ARX de Autorregresi´on, el cual se detalla en la F´ormula (4.4): 114
A(q)y(t) = B(q)u(t) + e(t) A(q) = 1 − 1,328(±0,02371)q −1 + 0,3999(±0,03746)q −2 −0,08286(±0,02515)q −3 + 0,03342(±0,00727)q −4 B1(q) = −0,0008986(±0,0006657)q −3 − 0,0003085(±0,0009166)q −4 −0,0005605(±0,0008918)q −5 + 0,001424(±0,0005833)q −6 B2(q) = 1,371e − 006(±7,189e − 007) − 3,158e − 006(±1,476e − 006)q −1 +3,724e − 006(±1,603e − 006)q −2 − 1,831e − 006(±1,025e − 006)q −3 B3(q) = 0,01381(±0,004508)q − 36 − 0,01861(±0,009044)q −37 +0,0008583(±0,009037)q −38 + 0,005235(±0,004456)q −39 B4(q) = −0,0001492(±5,974e − 006) + 0,0001256(±1,238e − 005)q −1 −5,651e − 007(±1,296e − 005)q −2 + 1,53e − 005(±7,168e − 006)q −3 B5(q) = 0,5576(±0,01577) − 0,4055(±0,03507)q −1 −0,04753(±0,03831)q −2 − 0,06789(±0,02271)q −3
B6(q) = 0,0001757(±2,958e − 006) − 0,0002389(±6,659e − 006)q −1 +6,469e − 005(±8,438e − 006)q −2 + 1,932e − 006(±4,524e − 006)q −3 (4.4)
donde: q, es el coeficiente de retardo aplicado a cada variable meteorol´ogica y a la altura del r´ıo, del modelo, e, es una estimaci´on del error aleatorio del c´alculo, t, es el tiempo, u, es cada una de las variables de Altura y Caudal de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes A, es la Altura del r´ıo en Corrientes, Y , es la variable estimada Altura del r´ıo en Corrientes. Al analizar el modelo generado por Matlab, se aprecia que las variables Caudales de todas las estaciones, como las Alturas de Puerto Iguaz´ u y Posadas, son anuladas en el modelo por estar multiplicadas por valores muy cercanos a cero, lo que indican su influencia nula en el modelo generado utiliza solamente los datos de altura de r´ıo en Corrientes en los d´ıas anteriores, para predecir la altura del r´ıo, teniendo mayor incidencia la altura del d´ıa anterior, y en grado decreciente las alturas de 2 d´ıas antes, 3 d´ıas antes y 4 d´ıas antes, ya con una influencia marcadamente menor y los datos de Altura de Itat´ı del d´ıa anterior y en grado decreciente las alturas de 2 d´ıas antes, 3 d´ıas antes. Este an´alisis se ha repetido con distintos per´ıodos de tiempo y niveles de altura del r´ıo con valores de Alturas y Caudales para la estaci´on de Corrientes y las estaciones r´ıo arriba de Puerto Iguaz´ u, Posadas e Itat´ı, obteniendose en todos los casos resultados similares, 115
con las variables de caudales de todas las estaciones y las de altura de r´ıo de Puerto Iguaz´ u y Posadas, anuladas en el modelo generado por coeficientes muy cercanos a cero. Con este modelo de Autorregresi´on se realizan predicciones de Altura del r´ıo en la localidad de Corrientes, en la Figura (4.8) en el gr´afico izquierdo, pueden observarse los error es del modelo en un pron´ostico a 3 d´ıas, y puede apreciarse que el error oscila entre 0, 50m y −0, 30m, y en el gr´afico de la derecha, pueden observarse los error es al realizar un pron´ostico a 5 d´ıas, siendo el rango de los error es incrementado de 0, 60m a −0, 30m.
Figura 4.8: Errores de predicci´on de Altura del R´ıo: Gr´afico Izq.: a 3 d´ıas y Gr´afico Dcho.: a 5 d´ıas.
116
Cap´ıtulo 5 Aplicaci´ on de Modelos de Redes Neuronales para Predicci´ on a Corto Plazo 5.1.
Introducci´ on
En este Cap´ıtulo se detallan las Aplicaciones de Modelos de Rede Neuronales para Predicci´on a Corto Plazo, de las alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, en per´ıodos de inundaci´on, iniciando en la Secci´on (5.2) con el An´alisis de los Perceptrones, en la Secci´on (5.3) Optimizaci´on de Ajuste de Perceptr´on y las Adaptaciones de la Funci´on de Error, en la Secci´on (5.4) se detalla la funci´on de penalizaci´on Propuesta, en la Secci´on (5.5) se presentan Redes Neuronales con la Funci´on de Penalizaci´on Propuesta, en la Secci´on (5.6) se propone una Combinaci´on de Archivos para mejorar el aprendizaje de la red, en la Secci´on (5.7) se detallan los Resultados de Redes Neuronales con Funci´on de Penalizaci´on entrenada con Archivos Combinados y en la Secci´on (5.8), se visulizan los Resultados Comparativos de las Predicciones a Corto Plazo.
5.2. 5.2.1.
Perceptr´ on Implementaci´ on en Matlab - Herramienta de Redes Neuronales - NNTool
La Herramienta de Redes Neuronales de Matlab, NNTool, consiste de un conjunto de funciones y estructuras que manejan las redes neuronales, que se presenta en un entorno de ventanas de trabajo, donde se ingresan los datos del problema a resolver y se seleccionan las funciones de activaci´on, los algoritmos de formaci´on, que se usaran, con distintas opciones se ingresa o selecciona informaci´on sobre la estructura de la red neuronal, por ejemplo el n´ umero y estructura de sus capas, la conectividad entre las capas, datos necesarios para generar la red neuroral, [Demuth and Beale, 1998]. El an´alisis con red neuronal usando la NNTool de Matlab, se inicia en el entorno de trabajo de la Herramienta de redes neuronales, se ingresan los datos a ser analizados, en las Figuras (5.1) y (5.2), puede observarse que el algoritmo trainbr o de regularizaci´on bayesiana, es el que se propone para ser utilizado en la red neuronal, porque present´o un 117
mejor desempe˜ no con los disitintos grupos de datos de entrenamiento que se probaron en la generaci´on de la red neuronal; considerando tambi´en que este algoritmo reduce al m´ınimo una combinaci´on estrictamente convexa del error cuadrado medio y de los pesos cuadrados medios. El algoritmo trainbr es una modificaci´on del trainlm, que es la funci´on de entrenamiento de retropropagaci´on Levenberg-Marquardt.
Figura 5.1: Matlab-NNTool: Ventana de NNTool, con la RN y los datos usados en la generaci´on.
En la Figura (5.3), pueden observarse los pasos que se siguen para construir y entrenar la red neuronal se visualiza la estructura que se ha dise˜ nado para la red neuronal RNH643, como funci´on de entrenamiento se ha seleccionado trainbr, como funci´on de transferencia para el nivel 1 se fija tansig, tangente hiperb´olica, donde se han definido 5 neuronas ocultas y funci´on de transferencia en nivel 2 Purelin, lineal. En la Figura (5.4), se observan los archivos que se utilizan para realizar el entrenamiento, siendo: AE: Incluye registros de Alturas diarias del r´ıo en las estaciones de Puerto Iguaz´ u con un retardo de 6 d´ıas, Posadas con un retardo de 4 d´ıas, Itat´ı con un retardo de 3 d´ıas, y Corrientes Capital, con un retardo de 3 d´ıas, los retardos son con respecto a las alturas del r´ıo en Corrientes Capital que se ingresan en el archivo, AT, los datos corresponden a los a˜ nos 1997 y 1998 siendo estos a˜ nos de inundaci´on. AT: Tiene registros de Alturas diarias del r´ıo en la estaci´on de Corrientes Capital, en los a˜ nos 1997 y 1998, siendo estos a˜ nos de un per´ıodo de inundaci´on. En la Figura (5.5), se observan las gr´aficas de los resultados obtenidos en el entrenamiento de la red neuronal, con la funci´on trainbr. En este an´alisis se generaron distintas redes neuronales, con diferentes retrasos en los datos, como tambi´en tomando distintos per´ıodos de a˜ nos, haciendo entrenamiento de la 118
Figura 5.2: Matlab-NNTool: Ventana de Creaci´on de la red neuronal, donde se indican datos y se configuran las funciones y la estructura de la red neuronal.
red con datos de per´ıodos normales, de per´ıodos mixtos que comprend´ıan a˜ nos con valores normales y con valores de inundaciones y tambi´en se realiz´o entrenamiento con per´ıodos de inundaciones, buscando con ello que la red aprenda el comportamiento del r´ıo en etapas normales, como de crecidas e inundaciones. De las pruebas realizadas se pudo concluir que cuando la red neuronal era entrenada con datos de diferentes estados del r´ıo, cuando se predecian alturas de r´ıo para per´ıodos de inundaci´on cometia errores mayores. Tambi´en se consider´o redes entrenadas con datos de per´ıodos de inundaci´on, con este entrenamiento focalizado en inundaciones se lograron mejores resultados, pero se presentaban resultados con errores de gran magnitud, al pronosticar valores extremos de inundaci´on alta, no considerados en los datos de entrenamiento de la red. En la tabla de la Figura (5.6), se presenta una s´ıntesis de los resultados obtenidos con dos redes neuronales RNH643 y RNHQ643, entrenadas en el mismo per´ıodo de tiempo a˜ nos 1997 y 1998, que comprenden un per´ıodo de inundaciones, pero con distintos datos de entrenamiento, como se detalla a continuaci´on: 119
Figura 5.3: Matlab-NNTool: Estructura de a Red Neuronal.
Figura 5.4: Matlab-NNTool: Entrenamiento de la Red Neuronal, indicando los archivos de entrenamiento.
RNH643 : Red neuronal que ha sido entrenada con datos de Alturas de r´ıo de la estaci´on de Corrientes, Alturas de Puerto Iguaz´ u con 6 d´ıas de retardo, Alturas de Posadas con 4 d´ıas de retardo, Alturas de Itat´ı con 3 d´ıas de retardo y Alturas de Corrientes con 3 d´ıas de retardo. RNHQ643 : Red neuronal que ha sido entrenada con datos de Alturas de r´ıo de la estaci´on de Corrientes, Alturas de Puerto Iguaz´ u con 6 d´ıas de retardo, Alturas y Caudales de Posadas con 4 d´ıas de retardo, Alturas y Caudales de Itat´ı con 3 d´ıas de retardo y Alturas y Caudales de Corrientes con 3 d´ıas de retardo. Podemos observar en la tabla de la Figura (5.6), que la red neuronal RNH643, al realizar pron´ostico en el mes de mayo de 1998, que el error absoluto promedio es de 120
Figura 5.5: Matlab-NNTool: gr´aficas con los resultados del entrenamiento de la RN, funci´on de entrenamiento Trainbr.
un 0, 06m, que el 20 % de los pron´osticos superan un error de 0, 10m y que el 45 % de los pron´osticos est´an por debajo de la altura real del r´ıo y que al realizar el pron´ostico para el mes de junio de 1992, los errores se incrementan, siendo los siguientes, el error absoluto promedio es de 0, 44m, que el 100 % de los pron´osticos superan un error de 0, 10m y que el 95 % de los pron´osticos est´an por debajo de la altura real del r´ıo. Tambi´en podemos observar que que la red RN HQ643, que incorpora los caudales en la predicci´on, al pron´osticar valores para el mes de junio de 1992, que el error absoluto promedio es de 0, 54m, que el 95 % de los pron´osticos superan un error de 0, 10m y que el 25 % de los pron´osticos est´an por debajo de la altura real del r´ıo.
5.3.
5.3.1.
Optimizaci´ on de Ajuste de Perceptr´ on. Adaptaciones de la Funci´ on de Error Funciones de Redes Neuronales de Matlab
Normalmente a la hora de trabajar con redes neuronales, es necesario por la complejidad de los datos, o del problema a resolver, poder contar con un tipo de red neuronal concreto, el cual se ajuste mejor a las necesidades de la situaci´on en consideraci´on, en este caso en vez de utilizar la funci´on network para la creaci´on de la estructura base, puede utilizarse funciones espec´ıficas para cada tipo de red neuronal, de manera que la estructura base que Matlab devuelva tenga una configuraci´on de capas de entrada, ocul121
Figura 5.6: Resultados y errores al realizar pron´ostico a 3 d´ıas de Altura del r´ıo en Corrientes, con RNH643, entrenada con datos de Alturas Hidrom´etricas y RNHQ643, entrenada con datos de Alturas y Caudales del r´ıo.
tas, conexiones, m´as apropiada para el tipo de red neuronal deseada. [Demuth and Beale, 1998] Matlab cuenta con diferentes funciones para poder crear redes neuronales espec´ıficas, entre las que destacan: 1. Perceptron: newp(P, S) 2. Backpropagation: newf f (P, [S1, . . . ., Sn]) 3. Radiales: newgrnm(P, T ) 4. Mapas Autoorganizados: newsom(P, S) De estas funciones de alto nivel que proporciona Matlab, para la creaci´on de redes, seg´ un las caracter´ısticas del problema de Ajuste de Modelos Hidrol´ogicos, para su aplicaci´on al r´ıo Paran´a, la estructura de red m´as apropiada es la que se crea con la funci´on newff, backpropagation o retropropagaci´on, lo que permitie una f´acil construcci´on de la red perceptr´on multicapa. Matlab utiliza una estructura u ´nica que dar´a acceso a todas las propiedades de la red neuronal, independientemente del tipo que ´esta sea, de manera que utilizando esta propiedad podremos modificar las entradas, capas , conexiones, pesos, etc.. De esta manera una vez configurada la red neuronal seg´ un las necesidades, se invocar´an las funciones de manipulaci´on de redes neuronales disponibles en Matlab, como: simulaci´on, entrenamiento, inicializaci´on, pas´andole como par´ametro la estructura de la red neuronal. 122
La variable red neuronal se puede dividir en cinco secciones: 1. Arquitectura: Define las caracter´ısticas b´asicas de la red neuronal, n´ umero de entradas, capas, conexiones de vias, etc. 2. Subobjetos: Contiene referencias a las subestructuras de la red neuronal, que permitir´a configurar las propiedades de los distintos componentes que forman la red (capas, entradas, salidas, etc.). 3. Funciones: Funciones principales de la red neuronal, utilizadas para ejecutar las operaciones de inicializaci´on, entrenamiento o simulaci´on. 4. Par´ametros: Configuraci´on de los par´ametros asociados a las funciones seleccionadas en el bloque de funciones. 5. Valores: Aqu´ı se definen las matrices con los valores de los pesos de entrada, conexiones entre capas y v´ıas. Funciones Una vez creada la red neuronal, para trabajar con la misma, podremos utilizar las siguientes funciones para realizar las operaciones t´ıpicas: 1. Inicializaci´on (net = init(net)): Mediante la funci´on de inicializaci´on, se obtiene una red neuronal con los valores de los pesos y vias actualizados seg´ un las funciones de inicializaci´on que le hayamos asociado a la red. 2. Entrenamiento ([net, tr, Y, E, P f, Af ] = train(net, P, T, P i, Ai, V V, T V ); ): Realiza el entrenamiento de la red neuronal, modificando los pesos asociados a las conexiones entre las diferentes capas y neuronas de la misma. Para esto, debemos indicar unos patrones de entrada a la red (P , matriz de dimensiones M xN siendo M la suma de los tama˜ nos de las capas de entrada de la red neuronal y N el n´ umero de patrones que se desea aplicar en el entrenamiento). En caso de ser un entrenamiento supervisado tambi´en indicaremos los targets (T , matriz de M xN ), con estos datos la matriz de patrones se aplica a la red neuronal y el toolbox utilizando las funciones de entrenamiento que se han indicado en las propiedades ”trainFcn”se encargar´a de actualizar los pesos asociados a las conexiones de la red. Los resultados del entrenamiento se obtendr´an en la variable de retorno Y y los errores para cada patr´on de entrada respecto a la salida esperada en la variable de retorno E. 3. Simulaci´on ([Y, P f, Af, E, perf ] = sim(net, P, P i, Ai, T )): Funci´on parecida a la anterior pero que no actualizar´a los pesos de la red neuronal. Una vez que se tiene entrenada la red neuronal y que ´esta ofrezca unos resultados v´alidos, se utilizar´a esta funci´on para analizar nuevos patrones de entrada.
5.3.2.
Modificaci´ on de la Funci´ on de Error
Generalmente las redes neuronales artificiales minimizan una suma de errores al cuadrado, tanto para su estimaci´on como para la evaluaci´on de sus pron´osticos por dentro y fuera de muestra. 123
Los problemas de pron´osticos requieren de medidas alternativas del error y por lo tanto para su evaluaci´on se minimizar´a una funci´on de costos asim´etrica que no penalice de igual forma cuando el pron´ostico se ubique por encima o por debajo del dato observado, como ocurre en la realidad, [Crone, 2002a] y [Crone, 2002b]. Esta situaci´on es concretamente el caso bajo estudio de pronosticar la altura del r´ıo en un per´ıodo de inundaci´on, resulta mucho m´as costoso en t´erminos de seguridad, credibilidad y costos, cuando dentro de su esquema de alerta de inundaci´on se anuncia una meta inferior a la que posteriormente se registra, que cuando ocurre lo contrario. Como tampoco es la misma situaci´on que el pron´ostico tenga un error de 0, 15m cuando el r´ıo tiene una altura de cauce normal de 3, 50m, que cuando el r´ıo esta con alerta de inundaci´on de 7, 00 m, o cuando esta en un pico de inundaci´on de 8, 80m, porque las consecuencias, tanto en costo social como econ´omico ser´a mayor cuando mayor sea la altura del r´ıo.
5.4.
Funci´ on de Penalizaci´ on Propuesta
Se propone una funci´on de error modificada, que penalice los errores cuando el r´ıo alcanza una altura mayor a 5m, que es la altura de r´ıo previa a una alerta de posible inundaci´on, se descartar´an los errores por debajo de 5m, porque la modificaci´on de la funci´on de error de la red neuronal incorpora penalizaci´on a los errores grandes y penalizarlos m´as cuando la altura del r´ıo es m´as alta. En la Ecuaci´on (5.1), se presenta la funci´on de penalizaci´on de error propuesta, en el cuadro comparativo de la Figura (5.7), puede observarse como la funci´on propuesta penaliza el error m´as que la funci´on cuadr´atica en los valores de altura mayor a 5m, que son los valores de riesgo, tambi´en puede observarse como a mayor altura del r´ıo se incrementa la penalizaci´on del error. EP = (e.2 + e. ∗ (e > 0)). ∗ (h − 5). ∗ (h > 5)
(5.1)
donde: e.2 es el error cuadr´atico h es la altura real del r´ıo e. ∗ ((e > 0)). ∗ (h − 5). ∗ (h > 5) es la penalizaci´on donde: • (e > 0) penaliza los errores • (h > 5) penaliza los errores cuando la altura del r´ıo por encima a 5m, se toma esta cota de altura por ser previa al alerta de posible inundaci´on • (h − 5) penaliza mas los errores cuando mas supera la altura del r´ıo los 5m. En el gr´afico de la Figura (5.8), puede observarse el comportamiento de la funci´on de penalizaci´on propuesta, gr´aficamente puede observarse como la penalizaci´on se comienza a aplicar a partir de los 5m, y como crece la penalizaci´on en forma proporcional al incremento de altura del r´ıo. En el gr´afico de la Figura (5.9), puede observarse el comportamiento de la funci´on de error Cuadr´atica, que es la funci´on estandar que tienen implementadas las redes neuronales en Matlab, puede observarse claramente al comparar ambas gr´aficas que a las mismas alturas del r´ıo la funci´on de penalizaci´on propuesta, penaliza el error en mayor grado que la funci´on cudr´atica. 124
Figura 5.7: Tabla comparativa de la penalizaci´on de Errores con la Funci´on Cuadr´atica y la Funci´on de Penalizaci´on Propuesta.
Figura 5.8: Gr´afico de la funci´on de Penalizaci´on, que penaliza los errrores cuando mayor es la altura del r´ıo.
5.5. 5.5.1.
Redes Neuronales con Funci´ on de Penalizaci´ on Propuesta Generaci´ on y Entrenamiento
Se define la red neuronal con la funci´on de Matlab newf f , que nos genera una red neuronal de retropropagaci´on, que es el tipo de red que m´as se adapta a las series temporales como los datos del r´ıo Paran´a, del que se busca aprender su comportamiento, como se puede observar en la siguiente l´ınea de c´odigo: red1=newff(entred,salred,5); 125
Figura 5.9: Gr´afico de la funci´on Cuadr´atica.
donde: entred : es el archivo de entrada para el entrenamiento o ajuste de la red neuronal, salred : es el archivo con las salidas que debe aprender la red neuronal en el entrenamiento o ajuste en base al archivo de entrada, 5 : con la cantidad de neuronas en la capa oculta. Cuando la red neuronal ya ha sido creada, se procede al entrenamiento pero antes de realizar el entrenamiento, se establece la funci´on de entrenamiento a usarse, en este caso de fija trainbfg, lo cual har´a que en la red neuronal utilice CuasiNewton en vez de Levenberg-Marquardt, como puede observarse en la siguiente l´ınea de c´odigo: red1.trainFcn=’trainbfg’; Tambi´en antes de realizar el entrenamiento se indica, que se usar´a la funci´on de penalizaci´on que se ha definido, en lugar de usar la funcion estandar de redes neuronales que es la funcion cuadr´atica, lo cual se visuliza en la siguiente l´ınea, donde se indica que la funci´on a usar es errorcons: red1.performFcn=’errorcons’; Para realizar el entrenamiento de la red neuronal se usa la funci´on train con los siguientes par´ametros: redaj=train(red1,entred,salred,[],[],VV,TV); 126
donde: redaj : red neuronal que ser´a entrenada, red1 : estructura de red neuronal que ha sido definida y que se usar´a en el entrenamiento, entred : es el archivo de entrada para el entrenamiento o ajuste de la red neuronal, salred : es el archivo con las salidas que debe aprender la red neuronal en el entrenamiento en base al archivo de entrada. VV : es el archivo de validaci´on, que se usar´a para la validaci´on del entrenamiento de la red neuronal, TV : es el archivo de test, que se usar´a para el testeo del entrenamiento de la red neuronal.
5.5.2.
Aplicaci´ on de la Red Neuronal generada a los datos del r´ıo Paran´ a
Una vez que la red neuronal ya ha sido entrenada puede usarse para pronosticar o estimar los datos que se est´an analizando, si el aprendizaje de la red fue aceptable nos dar´a resultados que se acercan a la realidad que se est´a modelizando, lo cual se implementa de la siguiente manera: Corred=sim(redaj,P98entred); donde: Corred : son los resultados que da la red neuronal, luego de aplicar el aprendizaje a los datos que se le presentan en una situaci´on en particular. redaj : es la red neuronal que se usar´a para pronosticar, que ha sido entrenada anteriormente. P98entred : son los datos que se dan a la red neuronal, de un momento determinado para que la red haga el pron´ostico, en este caso se le estan dando valores correspondientes a la inundaci´on de 1998. En la Tabla de la Figura (5.10), pueden observarse los resultados obtenidos con la Red Neuronal con Funci´on de Penalizaci´on, puede observarse que los errores en la predicci´on a 3 d´ıas se han reducido en algunos casos manteni´endo alto en otros, como se observa en los valores obtenidos de error promedio de 0, 21m, 0, 10m, 0, 13m, y 0, 87m. 127
Figura 5.10: Errores obtenidos al implementar la RN con la Funci´on de Penalizaci´on propuesta.
5.6.
Combinaci´ on de Archivos
Del an´alisis de los resultados obtenidos al ingresar datos de Alturas y Caudales en las redes neurorales que se implementaron con NNTool, en la Secci´on (5.2.1), en los que se denotaba que las variables de caudales de las distintas estaciones no aportaban informaci´on sobre la altura del r´ıo Paran´a en la estaci´on de Corrientes, en esta etapa no ser´an consideradas. Se trabajara con las alturas del r´ıo en las estaciones de Puerto Iguaz´ u,con un retardo de 7 d´ıas, Posadas, con un retardo de 5 d´ıas, Itat´ı y Corrientes con retardos de 3 d´ıas, y las diferencias de alturas de 1 o 3 d´ıas en las estaciones de Posadas, Itati y Corrientes, incopor´andose la variable tiempo, la cual es presentada con las funciones seno y coseno del tiempo, se busca con la trasformaci´on del tiempo en grados que luego del 31 de diciembre viene el 1 de enero, reflejando la continuidad de los datos de un a˜ no en el siguiente, siendo las variables utilizadas las siguientes: 1. ACorr3 : Corrientes con 3 d´ıas de retardo 2. ACorrdif1 : Diferencia de Corrientes entre d´ıas 3 y 4 3. ACorrdif2 : Diferencia de Corrientes entre d´ıas 4 y 5 128
4. AItati3 : Itat´ı con 3 d´ıas de retardo 5. AItatidif1 : Diferencia de Itat´ı entre d´ıas 3 y 4 6. AItatidif2 : Diferencia de Itat´ı entre d´ıas 4 y 5 7. APosadas5 : Posadas con 5 d´ıas de retardo 8. APosadasdif1 : Diferencia de Posadas entre d´ıas 5 y 6 9. APosadasdif2 : Diferencia de Posadas entre d´ıas 6 y 7 10. AIguazu7 : Puerto de Iguaz´ u con 7 d´ıas de retardo 11. At1 : seno del tiempo 12. At2 : coseno del tiempo 13. ACorrpred : Altura de Corrientes a ser pronosticada Para obtener un mejor aprendizaje del comportamiento del r´ıo Paran´a, se ingresan las Alturas de las estaciones combinando los datos de 4 a˜ nos, los cuales corresponden a las inundaciones de 1991-1992 y de 1997-1998, en la imagen de la Figura (5.11), puede observarse con distintos colores como fue realizada la combinaci´on de los datos de estos a˜ nos. Esta combinaci´on de archivos se utiliza para generar los archivos de Entrenamiento, Validaci´on y Testeo , que se utilizan en el entremamiento de la Red Neuronal Modificada, buscando mejorar el aprendizaje de los per´ıodos de inundaci´on.
Figura 5.11: Archivo con datos combinados de 2 per´ıodos de inundaciones.
129
5.7.
Resultados de Redes Neuronales con Funci´ on de Penalizaci´ on entrenada con Archivos Combinados
En la Tabla de la Figura (5.12), pueden observarse los resultados obtenidos con la Red Neuronal con funci´on de penalizaci´on, que se detall´o en la Secci´on (5.5) y los archivos combinados que se analizaron en la Secci´on (5.6).
Figura 5.12: Errores obtenidos al implementar la RN con la Funci´on de Penalizaci´on propuesta y entrenada con Archivos Combinados. En las cuatro primeras columnas se presentan los resultados que se obtuvieron con estos archivos combinados de distintas inundaciones, en los cuales los datos faltantes han sido generados en relaci´on a los datos existentes y se pronostican 20 d´ıas de crecidas en los per´ıodos de inundaci´on de abril de 1998 y junio de 1992, con una antelaci´on de 3 d´ıas. Para abril de 1998 : se obtuvo que el error promedio es de un 0, 12m, que el 70 % de los pron´osticos superan un error de 0, 10m y que el 15 % de los pron´osticos est´an por debajo de la altura real del r´ıo. Para junio de 1992 : se tiene que el error promedio es de un 0, 11m, que el 45 % de los pron´osticos superan un error de 0, 10m y que el 20 % de los pron´osticos est´an por debajo de la altura real del r´ıo. En las cuatro u ´ltimas columnas se presentan los resultados que se obtuvieron con estos archivos combinados de distintas inundaciones, pero eliminando los datos imcompletos y se pronostican 20 d´ıas de crecidas en los per´ıodos de inundacion de abril de 1998 y junio de 1992, con una antelaci´on de 3 d´ıas. Para abril de 1998 : se observa que el error promedio es de un 0, 12m, que el 70 % de los pron´osticos superan un error de 0, 10m y que el 5 % de los pron´osticos est´an por debajo de la altura real del r´ıo. 130
Para junio de 1992 : se aprecia que el error promedio es de un 0, 12m, que el 35 % de los pron´osticos superan un error de 0, 10m y que el 20 % de los pron´osticos est´an por debajo de la altura real del r´ıo.
5.8.
Resultados Comparativos de Predicciones a Corto Plazo
En el cuadro compartivo de la Figura (5.13), pueden observarse los errores en valor absoluto que se fueron obteniendo aplicando Modelos de Redes Neuronales, para hacer predicciones a 3 d´ıas en per´ıodos de inundaci´on, compar´anadose tambi´en con los resultados de predicci´on a 3 d´ıas que se obtuvieron con los modelos de Series Temporales que ser analizaron en el Cap´ıtulo (4). Puede observarse que en la predicci´on a 3 d´ıas, la Red Neuronal con Funci´on de Penalizaci´on Modificada y entrenada con los Archivos Combinados con datos de ambas inundaciones, presenta un error promedio en valor absoluto de 0, 12m, que el error por defecto de mayor riesgo se presenta solo en el 15 % y el error por exceso de menor riesgo se presenta en el 85 %. Puede observarse que al predecir a tres d´ıas las magnitudes de los errores son menores que en la predicci´on a Mediano Plazo que se detalla en la secci´on (6.8), en el Cap´ıtulo (6).
Figura 5.13: Errores Comparativos de Predicci´on a 3 d´ıas en per´ıodos de Inundaci´on. Estas aportaciones y conclusiones analizadas en este cap´ıtulo de la Tesis Doctoral fueron presentadas en: Conferencia Internacional sobre Matem´ aticas Aplicadas y Inform´ atica - ICAMI 2010 : bajo la Ponencia: Paran´a River Water Level Prediction with Neural Networks - (Predicci´on de Alturas del r´ıo Paran´a con Redes Neurales). Con Publicaci´on con Referato: ISBN 978-958-670-843-2. San Andr´es, Colombia. A˜ no: 2010. IX Encuentro Cient´ıfico Tecnol´ ogico E.C.T. 2012 : bajo la Ponencia: Predicci´on de Alturas del R´ıo Paran`a con Redes Neruronales. Facultad Polit´ecnica, Universidad Nacional del Este, Ciudad del Este, Rep´ ublica del Paraguay. A˜ no: 2012.
131
132
Cap´ıtulo 6 Aplicaci´ on de Modelos de Redes Neuronales para Predicci´ on a Mediano Plazo 6.1.
Introducci´ on
En este Cap´ıtulo se detallan las Aplicaciones de Modelos de Redes Neuronales para Predicci´on a Mediano Plazo, iniciando en la Secci´on (6.2) Implementaci´on en Matlab, describiendo como se desarrollaran los modelos en Matlab, en la Secci´on (6.3) Implementaciones con Redes Neuronales con estructura NAR, se presentan diferentes modelos de redes neuronales con esta arquitectura, en la Secci´on (6.4) Implementaciones con Redes Neuronales con arquitectura NARX, se implementan diferentes modelos NARX y se comparan sus resultados, en la Secci´on (6.5) Redes Neuronales con estructura NARX Multicapa, se implementan y testean diferentes modelos de redes neuronales con esta arquitectura NARX Multicapa, en la Secci´on (6.6) Combinaci´on de Redes FTDNN, NAR y NARX Multicapa, se describe la construcci´on y testeo de una red que integra redes con estas arquitecturas, en la Secci´on (6.7) Combinaci´on de Redes NLP y NARX Multicapa se detalla la estructura y chequeo de redes que integran estos tipos de arquitectura de redes y en la Secci´on (6.8) Resultados Comparativos de Predicciones a Mediano Plazo se presenta un analisis de los resultados obtenidos con diferentes modelos implementados en este cap´ıtulo. Todas las implementaciones se aplican para predicci´on de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en per´ıodos de Inundaci´on.
6.2.
Implementaci´ on en Matlab
En este cap´ıtulo se realiza un pron´ostico a siete d´ıas de las Alturas Hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, partiendo de los an´alisis realizados para el pron´ostico de tres d´ıas, descriptos en el Cap´ıtulo (5), se trabaja con los datos de alturas hidrom´etricas de la estaci´on de Corrientes y las estaciones r´ıo arriba de las localidades de Iguaz´ u, Posadas e Itat´ı, para los per´ıodos de Inundaci´on de los a˜ nos 1990, 1991-1992 y de 1997-1998, por ser las crecidas que se han presentado luego de la entrada en funcionamiento de la represa de Yacyret´a. Se aplicar´an diferentes modelos de redes neuronales en busca de mejorar el aprendizaje 133
del comportamiento del r´ıo Paran´a en per´ıodos de inundaci´on que permita hacer una predicci´on a siete d´ıas, la cual es necesaria para realizar con la antelaci´on suficientes las medidas preventivas, para la llegada del pico de una inundaci´on a la ciudad de Corrientes, siendo siete d´ıas los que tarda en llegar la onda de crecida desde la localidad de Puerto Iguaz´ u aproximadamente 650km r´ıo arriba, a la ciudad considerada en este trabajo. Las diferentes redes neuronales se implementan en Matlab, trabajando tanto con la Herramienta de redes neuronales - NNStart, como ralizando Programaci´on en Matlab, para el desarrollo de redes neuronales mas espec´ıficas.
6.2.1.
Procedimiento de Chequeo de las Redes Generadas
Para chequear las redes que se generan en esta etapa de investigaci´on se seguir´an los siguientes pasos: 1. Generar una red con la estructura que se chequea. 2. Iniciar el proceso de predicci´on: a) Se fija un d´ıa de partida. b) Se realiza la predicci´on a 7 d´ıas. c) Se avanza un d´ıa m´as desde el tomado como partida. d ) Se vuelve a repetir la predicci´on a 7 d´ıas. e) Se repiten los pasos c) y d), hasta hacer la predicci´on de 11 d´ıas consecutivos. 3. Repetir los puntos 1 y 2 hasta tener 10 redes chequeadas.
6.2.2.
Matlab - Herramienta de Redes Neuronales - NNStart
La Herramienta de redes neuronales de Matlab, NNStart, consiste en un entorno de trabajo con ventanas, que presentan diferentes opciones para la generaci´on de redes neuronales, reconocimiento de patrones, agrupaciones y series temporales din´amicas, ofrece enlaces a las listas de conjuntos de datos, que permite generar redes y entrenarlas, como se observa en la Figura (6.1). Al seleccionar la opci´on series temporales din´amicas se presenta la ventana de la Figura (6.2), donde se selecciona la estructura de la red neuronal que se generar´a, pudiendo optar por una de las siguientes: NARX NAR Entrada / Salida no lineal.
134
Figura 6.1: Matlab - Herramienta de Redes Neuronales - NNStart.
Figura 6.2: Matlab - Herramienta de Redes Neuronales - NNStart.
6.3.
Implementaciones con Redes Neuronales con Estructura NAR
En el an´alisis con redes neuronales de estructura NAR, las cuales son Redes Din´amicas recurrente con conexiones de realimentaci´on de la misma serie de datos, se implementa usando las alturas hidrom´etricas de la localidad de Corrientes, donde la informaci´on de salida vuelve a realimentar la red neuronal, realizando la predicci´on de las alturas en esta 135
localidad, con los datos de la misma estaci´on.
6.3.1.
An´ alisis de redes NAR con Matlab NNStart
Se implementa con la toolbox de Matlab NNStart, la cual con diferentes ventanas va permitiendo la configuraci´on y generaci´on de la red neuronal, como puede observarse en las ventanas de la Figura (6.3), en la ventana de la izquierda se indica el ingreso del nombre del archivo que contiene la serie de datos de alturas hidrom´etricas de la ciudad de Corrientes y en la ventana de la derecha se fijan los porcentajes de los datos que ser´an usados para entrenamiento, testeo y validaci´on.
Figura 6.3: Matlab-NNStart-NAR: Izq.:Ingreso archivo de datos de alturas de la Ciudad de Corrientes. Dcha.: Selecci´on de porcentaje de datos de Entremiento, Testeo y Validaci´on. En la Figura (6.4), en la imagen izquierda se presenta la configuraci´on de la red neuronal indic´andose la cantidad de neuronas en la capa oculta, en este caso se indican 10 neuronas y los retardos de tiempo que se usar´an para la realimentaci´on de la red, se fija en 6, en base a los resultados del an´alisis de las series temporales que se obtuvo en el Cap´ıtulo (4), lo que se observa en detalle en la F´ormula (4.2), estos par´ametros se han analizado y determinado los valores indicados, para las diferentes series que se procesan. Tambi´en se visualiza la estructura de la red que se genera con los par´ametros ingresados. En la Figura (6.4), imagen derecha se presenta la ventana con la opci´on de realizar entrenamiento o reentrenamiento, en la cual luego del entrenamiento se presentan los resultados y opciones de visualizarlos graficamente, lo que tambi´en se presenta con mas detalle en la Figura (6.5). En la ventana que se visualiza en la Figura (6.5), puede seguirse el proceso de ajuste de la red al visualizarse las iteraciones y los errores de ajustes que se est´an dando, tambi´en se presentan opciones que permiten visualizar graficamente los siguientes resultados: Rendimiento del Entrenamiento, ver Figura (6.6), Instancias del Entrenamiento, Histograma de los Errores de Entrenamiento, ver Figura (6.7), 136
Figura 6.4: Matlab-NNStart-NAR: Izq.: Determinaci´on de las neuronas de la capa oculta y el retardo a considerar. Dcha.: Opciones de Entrenamiento y resultados obtenidos.
Gr´aficos de Regresi´on, ver Figura (6.8), Gr´aficos de Resultados y Errores por tiempo de entrenamiento, ver Figura (6.9), Autocorrelaci´on de Error, ver Figura (6.10).
137
Figura 6.5: Red neuronal NAR: Visualizaci´on del Entrenamiento y Resultados.
138
Figura 6.6: Red neuronal NAR: Rendimiento del Entrenamiento.
Figura 6.7: Red neuronal NAR: Histograma de Errores de Entrenamiento.
139
Figura 6.8: Red neuronal NAR: Gr´aficos de Regresi´on.
Con esta herramienta de Matlab se analizan las series correspondientes a las dos u ´ltimas inundaciones que han superado los 8, 00m, correspondientes a las a˜ nos de 1991-1992 y de 1997-1998, se entrena la red con datos de una inundaci´on y la red generada se utiliza para predecir valores del pico m´aximo de inundaci´on de la otra crecida, haciendo verificaci´on cruzada, para lo cual se trabaja con los siguientes redes NAR y archivos: NARPIR: entrenada con datos de la Inundaci´ on de 1991-1992: • PICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente a los a˜ nos de inundaci´on de 1991-1992, con las cuales la red es entrenada. • PSICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente al pico de la inundaci´on de los meses de abril y mayo de 1998, con lo cual la red es probada una vez entrenada. NARSIR: entrenada con datos de la Inundaci´ on de 1997-1998: • SICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente a los a˜ nos de inundaci´on de 1997-1998, datos que se utilizar´an para el entrenamiento de la red. 140
Figura 6.9: Red neuronal NAR: Gr´aficos de Resultados y Errores por tiempo de entrenamiento.
Figura 6.10: Red neuronal NAR: Autocorrelaci´on de Error.
• PPICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente al pico de la inundaci´on del mes de junio de 1992, con los cuales la red es probada una vez entrenada. Resultados de Predicci´ on a 7 d´ıas con NARPIR Los resultados pueden observarse en la tabla de la Figura (6.11), la cual ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), donde se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de abril y mayo de 1998. 141
Se obtiene que en las 110 predicciones realizadas se tiene un error promedio de 0, 3690m, present´andose un error por exceso en 68 predicciones lo que representa el 61, 82 % de los casos y un error por defecto en 42 pron´osticos que significa un 38, 18 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error de mayor riesgo. Posteriormente se realizaron cinco pruebas con datos de la crecida de 1990 y el error promedio en valor absoluto se incremento a 0, 5476m, lo que indica que cada inundaci´on presenta caracter´ısticas diferentes. Resultados de Predicci´ on a 7 d´ıas con NARSIR Los resultados que se presentan en la tabla de la Figura (6.12), detallan los errores obtenidos al predecir a 7 d´ıas, durante 11 d´ıas consecutivos, en el per´ıodo de inundaci´on del mes de junio de 1992, con 10 redes diferentes, resultantes estas redes de entrenamientos distintos de la red NARSIR, como se indica en los pasos del Procedimiento de Chequeo enumerados en (6.2). Se presenta en las 110 predicciones realizadas un error promedio de 0, 5251m, un error por exceso en 29 predicciones, que representa el 26, 36 % de los casos y un error por defecto en 81 pron´osticos que significa un 73, 64 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo.
142
Figura 6.11: Red neuronal NARPIR: Errores de Predicci´on a 7 d´ıas. 143
Figura 6.12: Red neuronal NARSIR: Errores de Predicci´on a 7 d´ıas.
144
6.3.2.
An´ alisis de redes NAR con Programaci´ on en Matlab
En una segunda etapa del an´alisis con redes de estrutura NAR, se utiliza programaci´on en Matlab, lo que da mayor flexibilidad en la generaci´on y entrenamiento de la red neuronal, permitiendo entrenar la red con los datos de ambas inundaciones, 1991-1992 y 1997-1998, buscando mejorar el aprendizaje de la red sobre el comportamiento de r´ıo, posteriormente la red ser´a probada con un per´ıodo de crecida correspondiente a los meses de enero-febrero de 1990.
Concatenaci´ on de Archivos Previo al entrenamiento de la red las series de datos deben ser concatenadas, para salvar la discontinuidad al trabajar con series de datos correspondientes a per´ıodos de inundaci´on no continuos en el tiempo, al considerarse las inundaciones de los a˜ nos 1991-1992 y 1997-1998, los cuales se encuentran en archivos separados I-1991-1992 y I-1997-1998 respectivamente, que ser´an enlazados con la siguiente codificaci´on de Matlab, donde se indica el encadenamiento de los datos de alturas hidrom´etricas y sus pesos correspondientes, de ambos per´ıodos de inundaci´on:
%Carga los datos de las 2 inundaciones para entrenar NAR % (Inundaci´ on 1991-1992 Inundaci´ on 1997-1998) %Se unen las 2 series de las inundaciones % Archivos de Excel: I-1991-1992 y I-1997-1998 C1=[PICorrientes]; P1=[PIPesoCtes]; C2=[SICorrientes]; P2=[SIPesoCtes]; CP=tonndata(C1,false,false); CS=tonndata(C2,false,false); %CONCATENA LOS DATOS DE LAS DOS SERIES targetSeries = catsamples(CP,CS,’pad’); w1=con2seq(P1’-0.7); w2=con2seq(P2’-0.7); ew=catsamples(w1,w2,’pad’,0);
145
Configuraci´ on y Creaci´ on de la Red con Estructura NAR Se especifica en estas lineas de c´odigo la configuraci´on y creaci´on de la red nuronal con estructura NAR, se indica el retardo de retroalimentaci´on que tendr´an las alturas hidrom´etricas, que ser´a del d´ıa 1 al 6, la cantidad de neuronas de la capa oculta, que en este caso tendr´a 10 neuronas, se define que la red creada ser´a de estructura NAR y se establecen los porcentajes de datos que ser´an destinados a entrenamiento, testeo y validaci´on. Posteriormente se entrena la red, se testean los resultados y una vez terminado el entrenamiento se cierra el ciclo de retroalimentaci´on de la red.
% Create a Nonlinear Autoregressive Network feedbackDelays = 1:6; hiddenLayerSize = 10; net = narnet(feedbackDelays,hiddenLayerSize); % Preparaci´ on de los datos [inputs,inputStates,layerStates,targets] = preparets(net,{},{},targetSeries); % Divisi´ on de los datos para Entrenamiento, Validaci´ on\index{validaci´ on} net.divideParam.trainRatio = 80/100; net.divideParam.valRatio = 20/100; net.divideParam.testRatio = 0/100; % Entrenamiento de la Red [net,tr] = train(net,inputs,targets,inputStates,layerStates); % Testeo de la Red outputs = net(inputs,inputStates,layerStates); errors = gsubtract(targets,outputs); performance = perform(net,targets,outputs); % Cierre del ciclo de retroalimentaci´ on de la red NARIR = closeloop(net);
Resultados de Predicci´ on a 7 d´ıas con NARIR Los resultados que se presentan en la tabla de la Figura (6.13), han sido generados siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de enero y febrero de 1990. En las 110 predicciones realizadas se presenta un error promedio de 0, 5879m, que no presenta ning´ un error por exceso y que tiene un error por defecto en los 110 pron´osticos, lo que significa el 100, 00 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error con mayor coste, que indica que siempre estima por debajo del valor real del r´ıo. 146
y Testeo
6.3.3.
An´ alisis Comparativo de Redes NAR
En la tabla de la Figura (6.14), pueden verse los resultados comparativos de las redes de arquitectura NAR, NARPIR, NARSIR y NARIR, puede observarse que al comparar los resultados de los tres redes NAR, es notable que los mejores resultados son los obtenidos con las red NARPIR, que es la red entrenada con los datos de la inundaci´on de 1991-1992, que presenta un error promedio de 0, 3690m, presentando tambien el mayor porcentaje de errores por exceso de 61, 82 %, el cual es el error de menor coste, tambi´en es relevante que la red que ha sido entrenada con las dos inundaciones NARPIR, tienen los error es mas altos al presentar un error promedio de 0, 5879 % y tambi´en que el 100 % de las predicciones presentan errores por defectos que son los error es que tienen un coste mayor, al hacer pron´osticos que quedan por debajo de los valores que alcanza el hidrom´etro. En el gr´afico de la de la Figura (6.15), puede observarse una predicci´on con la red NARIR.
6.4.
Implementaciones con Redes Neuronales con Estructura NARX
Las redes neuronales de estructura NARX, son redes de din´amica recurrente con conexiones de realimentaci´on de las salidas de la misma serie de datos y de las entradas externas. Para su an´alisis se implementan usando las alturas hidrom´etricas de la localidad de Corrientes que es la estaci´on a predecir la altura hidrom´etrica y como entradas ex´ogenas se consideraran los datos de las estaciones r´ıo arriba de Iguaz´ u, Posadas e Itat´ı. En este tipo de redes la informaci´on de salida vuelve a realimentar la red neuronal, como las entradas externas y se analiza si al contar con los datos de la estaci´on, mas informaci´on de las estaciones anteriores en ubicaci´on en las m´argenes del r´ıo que la localidad a predecir, mejora la predicci´on de las alturas hidrom´etricas en la localidad de Corrientes.
6.4.1.
An´ alisis de redes NARX con Matlab NNStart
Se implementa con la toolbox de Matlab NNStart, la cual con diferentes ventanas va permitiendo la configuraci´on y generaci´on de la red neuronal, como puede observarse en las ventanas de la Figura (6.16), en la ventana de la izquierda se indica el ingreso del nombre del archivo que contiene la serie de datos de alturas hidrom´etricas de la cuidad de Corrientes (Targets) y el archivo que contiene la informaci´on de las estaciones de Iguaz´ u, Posadas e Itat´ı (Imputs). En la ventana de la derecha se fijan los porcentajes de datos que ser´an usados para entrenamiento, testeo y validaci´on. En la Figura (6.17), en la imagen de la derecha se presenta la configuraci´on de la red neuronal indic´andose la cantidad de neuronas en la capa oculta, en este caso se indican 10 neuronas y los retardos de tiempo que se usaran para la realimentaci´on de la red, el cual se fija en 6, en base a los resultados del an´alisis de las series temporales que se obtuvo en el Cap´ıtulo (4), estos par´ametros se han analizado y determinado los valores indicados, para las diferentes series que se procesan. Tambi´en se visualiza la estructura de la red que se genera con los par´ametros ingresados. Asimismo se presenta la opci´on de realizar entrenamiento o reentrenamiento, tambi´en en esta ventana se mostrar´an los resultados y se activan las opciones de visualizar graficamente los mismos. En la ventana que se visualiza en la Figura (6.18), puede seguirse el proceso de ajuste 147
de la red porque se visualizan las iteraciones y los errores de ajustes que se est´an dando, tambi´en se presentan opciones que permiten visualizar graficamente los siguientes resultados: Rendimiento del Entrenamiento, ver Figura (6.19), Instancias del Entrenamiento, Histograma de los Errores de Entrenamiento, ver Figura (6.20), Gr´aficos de Regresi´on, ver Figura (6.21), Gr´aficos de Resultados y Errores por tiempo de entrenamiento, ver Figura (6.22), Error de Autorregresi´on, ver Figura (6.23). Correlaci´on de Error y Entrada.
148
Figura 6.13: Red neuronal NARIR: Error de Predicci´on a 7 d´ıas 149
Figura 6.14: Errores de predicci´on comparados entre redes de estructura NAR.
Figura 6.15: Resultados de predicci´on con NARIR.
Figura 6.16: Matlab-NNStart-NARX:: Izq.:Ingreso archivo de datos de alturas de la Ciudad de Corrientes. Dcha.: Selecci´on de porcentaje de datos de Entremiento, Testeo y Validaci´on.
150
Figura 6.17: Matlab-NNStart: Izq.: Determinaci´on de las neuronas de la capa oculta y el retardo a considerar. Dcha.: Opciones de Entrenamiento y resultados obtenidos.
151
Figura 6.18: Red neuronal NARX: Visualizaci´on del Entrenamiento y los Resultados.
152
Figura 6.19: Red neuronal NARX: Rendimiento del Entrenamiento.
Figura 6.20: Red neuronal NARX: Histograma de los Errores de Entrenamiento.
153
Figura 6.21: Red neuronal NARX: Gr´aficos de Regresi´on.
Con las opciones que presenta esta herramienta de Matlab se analizan las series temporales correspondientes a las dos u ´ltimas inundaciones que han superado los 8, 00m, correspondientes a las a˜ nos de 1991-1992 y de 1997-1998, se entrena la red con datos de una inundaci´on con los datos correspondientes a la estaci´on de Corrientes y las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı. La red generada se utiliza para predecir valores del pico m´aximo de inundaci´on de la otra crecida, para la localidad de Corrientes, haciendo verificaci´on cruzada, trabaj´andose con los siguientes archivos: NARXPIR: entrenada con datos de la Inundaci´ on de 1991-1992: • PICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente a los a˜ nos de inundaci´on de 1991-1992, con el cual la red es entrenada. • PIOE : Archivo de alturas hidrom´etricas del r´ıo Paran´a en las localidades de Puerto Iguaz´ u, Posadas e Itat´ı, correspondiente a los a˜ nos de inundaci´on de 1991-1992, con el cual la red es entrenada. • PSICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente al pico de la inundaci´on meses de abril y mayo de 1998, con el cual la red es probada una vez entrenada. 154
Figura 6.22: Red neuronal NARX: Gr´aficos de Resultados y Errores por tiempo de entrenamiento.
Figura 6.23: Red neuronal NARX: Error de Autoregersi´on.
155
NARXSIR: entrenada con datos de la Inundaci´ on de 1997-1998: • SICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente a los a˜ nos de inundaci´on de 1997-1998, con el cual la red es entrenada. • SIOE : Archivo de alturas hidrom´etricas del r´ıo Paran´a en las localidades de Puerto Iguaz´ u, Posadas e Itat´ı, correspondiente a los a˜ nos de inundaci´on de 1997-1998, con los cuales la red es entrenada. • PPICtes: Archivo de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, correspondiente al pico de la inundaci´on mes de junio de 1992, con el cual la red es probada una vez entrenada.
Resultados de Predicci´ on a 7 d´ıas con NARXPIR Los resultados de la predicci´on a siete d´ıas con la red neuronal NARXPIR puede observarse en la tabla de la Figura (6.24), que ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de abril y mayo de 1998 con una antelaci´on de 7 d´ıas. En las 110 predicciones realizadas se tiene un error promedio de 0, 6950m, present´andose un error por exceso en 88 predicciones lo que representa el 80, 00 % de los casos y un error por defecto en 22 pron´osticos que significa un 20, 00 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo.
Resultados de Predicci´ on a 7 d´ıas con NARXSIR Los resultados de predicci´on a 7 d´ıas con la red neural NARXSIR, con los valores de la inundaci´on del mes de junio de 1992, con 10 redes diferentes, resultantes estas redes de entrenamientos distintos de la red NARXSIR, se presentan en la tabla de la Figura (6.25). Se observa que en las 110 predicciones realizadas se presenta un error promedio de 0, 4924m, un error por exceso en 11 predicciones, que representa el 10, 00 % de los casos y un error por defecto de 99 pron´osticos que significa un 90, 00 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo.
6.4.2.
An´ alisis de redes NARX con Programaci´ on en Matlab
En una segunda etapa del an´alisis con redes de estrutura NARX, se utiliza programaci´on en Matlab, para la generaci´on y entrenamiento de la red neuronal en manera manual, permitiendo entrenar la red con los datos de ambas inundaciones, 1991-1992 y 1997-1998, buscando con ello mejorar el aprendizaje sobre el comportamiento de r´ıo en per´ıodos cr´ıticos de inundaci´on, porteriormente la red ser´a probada con un per´ıodo de crecida correspondiente a los meses de enero-febrero de 1990. 156
Concatenaci´ on de Archivos Al trabajar con series de datos de las inundaciones de 1991-1992 y de 1997-1998, las series deben ser concatenadas, para salvar la discontinuidad de fechas y se encuentan en diferentes archivos, I-1991-1992 y I-1997-1998. Con la siguiente codificaci´on de Matlab, se indica el encadenamiento de los datos de las alturas hidrom´etricas de las estaciones de Corrientes que es la estaci´on a estimar y que corresponde a los targets de la red, como de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, que ser´an las entradas ex´ogenas de la red y sus pesos correspondientes, en ambos per´ıodos de inundaci´on:
%Carga los datos de las 2 inundaciones % para entrenar NARX %(Inundaci´ on 1991-1992 Inundaci´ on 1997-1998) %Se unen las 2 series de las inundaciones % Inundaci´ on 1991-1992 I11=[PIIguazu]; I12=[PIPosadas]; I13=[PIItati]; C1=[PICorrientes]; P1=[PIPesoCtes]; % Inundaci´ on 1997-1998 I21=[SIIguazu]; I22=[SIPosadas]; I23=[SIItati]; C2=[SICorrientes]; P2=[SIPesoCtes]; IP=tonndata([I11 I12 I13],false,false); IS=tonndata([I21 I22 I23],false,false); CP=tonndata(C1,false,false); CS=tonndata(C2,false,false); %CONCATENA LOS DATOS DE LAS DOS SERIES inputSeries=catsamples(IP,IS,’pad’); targetSeries = catsamples(CP,CS,’pad’); w1=con2seq(P1’-0.7); w2=con2seq(P2’-0.7); ew=catsamples(w1,w2,’pad’,0);
157
Configuraci´ on y Creaci´ on de la Red con Estructura NARX Se especifica es estas l´ıneas de c´odigo la generaci´on de la red neuronal con estructura NARX, se indica el retardo de retroalimentaci´on que tendran las alturas hidrom´etricas de la ciudad de Corrientes, que ser´a del d´ıa 1 al 6, el retardo que tendran las entradas externas que son los datos de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, la cual ser´a tambi´en del d´ıa 1 al 6, que la capa oculta tendra 10 neuronas y que la red creada sera de estructura NARX, se establecen adem´as los porcentajes de datos que ser´an destinado a entrenamiento, testeo y validaci´on, posteriosmente se entrena la red, se testean los resultados y una vez terminada la etapa de entrenamiento se cierra el ciclo de retroalimentaci´on de la red.
% Crea una red con estructura NARX con entradas externas inputDelays = 1:6; feedbackDelays = 1:6; hiddenLayerSize = 10; net = narxnet(inputDelays,feedbackDelays,hiddenLayerSize); % Prepara los datos para el proceso [inputs,inputStates,layerStates,targets] = preparets(net,inputSeries,{},targetSeries); % Division de datos para Entrenamiento, Validaci´ on y Testeo net.divideParam.trainRatio = 70/100; net.divideParam.valRatio = 15/100; net.divideParam.testRatio = 15/100; % Entrenamiento de la red [net,tr]=train(net,inputs,targets,inputStates,layerStates); % Testeo de la red outputs = net(inputs,inputStates,layerStates); errors = gsubtract(targets,outputs); performance = perform(net,targets,outputs) % Cierre para la retroalimentaci´ on de la Red NARXIR = closeloop(net);
Resultados de Predicci´ on a 7 d´ıas con NARXIR Los resultados de predicci´on a 7 d´ıas con NARXIR se presentan en la tabla de la Figura (6.26), la cual ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), donde se detallan los errores obtenidos al predecir la altura 158
hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de enero y febrero de 1990. Se detallan que en las 110 prediccioens realizadas se presenta un error promedio de 0, 4798m, que presenta un error por exceso en 77 predicci´on, lo que significa el 70, 00 % y un error por defecto en 33 pron´osticos que significa un 30, 00 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error con mayor coste.
6.4.3.
An´ alisis Comparativo de Redes NARX
En la tabla de la Figura (6.27), pueden observarse los resultados comparativos de las redes de arquitectura NARX NARXPIR, NARXSIR y NARXIR, puede observarse que al comparar los resultados de los tres redes NARX, donde la red NARXPIR, entrenada con los datos de la inundaci´on de 1991-1992, presenta el mayor error promedio con un error de 0, 6950m, presentando un porcentaje de errores por exceso del 80, 00 %, el cual es el error de menor coste y un porcentaje de error por defecto del 20, 00 %. La red NARXSIR entrenada con los datos de la inundaci´on de 1997-1998, presenta un error promedio de 0, 4924m, presentando un porcentaje de errores por exceso del 10, 00 % y un error por defecto del 90, 00 %. La red NARXIR entrenada con los datos de ambas inundaciones, presenta un error promedio de 0, 4798m, presentando un porcentaje de errores por exceso del 70, 00 %, y un error por defecto del 30, 00 %. Se puede apreciar que la red NARXIR, entrenada con informaci´on de dos inundaciones est´a dando mejores resultados en las predicciones, que las redes NARXPIR y NARXSIR, no s´olo por presentar el menor error promedio, sino porque presenta un porcentaje alto de errores por exceso y porcentaje bajo de error por defecto. En el gr´afico de la de la Figura (6.28), puede observarse una predicci´on con la red NARXIR.
6.5.
Red Neuronal con Estructura NARX Multicapa
Con las opciones que brinda la programaci´on de Matlab, se desarrolla una red neuronal con estructura NARX, con varias capas, lo que la diferencia de las redes generadas con la herramienta NNStart de Matlab, que tienen una sola capa oculta, se genera en este caso una red con cuatro capas ocultas, con la siguientes cantidad de neuronas en cada capa:
1. capa oculta con 16 neuronas 2. capa oculta con 8 neuronas 3. capa oculta con 5 neuronas 4. capa oculta con 3 neuronas. 159
6.5.1.
Configuraci´ on y Creaci´ on de la Red con estructura NARX Multicapa
La red NARX Multicapa se entrena con las alturas hidrom´etricas de las inundaciones de 1991-1992 y 1997-1998, por lo cual las ser´ıes de datos ser´an concatenadas, como se detalla en (6.4.2) y se entrena la red con los datos de ambas inundaciones porque los resultados obtenidos en (6.4.3), indican que la red entrenada de esta manera, predice con m´as precisi´on, posteriormente la red se prueba con el per´ıodo de crecida correspondiente a los meses de enero-febrero de 1990. La red que se genera tiene retroalimentaci´on tanto de la serie que predice, alturas hidrom´etricas en la ciudad de Corrientes, como de las entradas externas que corresponden a las alturas del r´ıo en las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, tendr´an todas las series un retardo del d´ıa 1 al 6. Tambi´en se especifican las funciones que se implementar´an en cada capa de la red y se indican los porcentajes de datos que ser´an destinado a entrenamiento, testeo y validaci´on. Posteriormente se entrena la red, se testean los resultados y una vez terminado el entrenamiento se cierra el ciclo de retroalimentaci´on de la red y se generan reportes por serie de datos, en este caso se generan los reportes para cada per´ıodo de inundaci´on utilizado en el entrenamiento. La definici´on de la red neuronal NARXMulti, con las caracter´ısticas que se detallaron pueden analizarse en la siguiente secci´on de c´odigo:
% Crea una red neuronal con retroalimentaci´ on con entrada externa % Retardo de las entradas externas % Alturas hidrom´ etricas de Pto. Iguaz´ u, Posadas e Itat´ ı % Retardo de las Serie que se predice inputDelays = 1:6; % Alturas hidrom´ etricas de Corrientes feedbackDelays = 1:6; % Crea la red con estructura NARX con 4 capas redRP = narxnet(inputDelays,feedbackDelays,[16 8 5 3]); % Define funciones para cada capa redRP.layers{1}.transferFcn=’logsig’; redRP.layers{2}.transferFcn=’logsig’; redRP.layers{3}.transferFcn=’logsig’; redRP.layers{4}.transferFcn=’logsig’; % Prepara los archivos para la red neuronal [inputs,inputStates,layerStates,targets] = preparets(redRP,inputSeries,{},targetSeries); % Divide los datos para Entrenamiento , Validaci´ on y Testeo 160
redRP.divideParam.trainRatio = 85/100; redRP.divideParam.valRatio = 15/100; redRP.divideParam.testRatio = 0/100; % Entrena la Red [redRP,tr]=train(redRP,inputs,targets,inputStates,layerStates); % Testea la Red outputs = redRP(inputs,inputStates,layerStates); performance = perform(redRP,targets,outputs); errors = gsubtract(targets,outputs); % Grafica los resultados del entrenamiento por cada serie salida1=getsamples(outputs,1); salida2=getsamples(outputs,2); target1=getsamples(targets,1); target2=getsamples(targets,2); plotresponse(target1,salida1) plotresponse(target2,salida2) % Cierra la red para generar la retropropagaci´ on NARXMultiCtes = closeloop(redRP);
En la ventana que se visualiza en la Figura (6.29), puede seguirse el proceso de ajuste de la red porque se visualizan las iteraciones y los errores de ajustes que se dan en cada iteraci´on, tambi´en se presentan opciones para visualizar graficamente los siguientes resultados: Rendimiento del Entrenamiento, ver Figura (6.30), Instancias del Entrenamiento, Histograma de los Errores de Entrenamiento, ver Figura (6.31), Gr´aficos de Regresi´on, ver Figura (6.32), Gr´aficos de Resultados y Errores por tiempo de entrenamiento, ver Figura (6.33), Error de Autorregresi´on, ver Figura (6.34), Correlaci´on de Error y Entrada.
161
Figura 6.24: Red neuronal NARXPIR: Error de Predicci´on a 7 d´ıas. 162
Figura 6.25: Red neuronal NARXSIR: Error de Predicci´on a 7 d´ıas. 163
Figura 6.26: Red neuronal NARXIR: Error de Predicci´on a 7 d´ıas 164
Figura 6.27: Errores de Predicci´on comparados entre redes de estructura NARX.
Figura 6.28: Resultados de predicci´on con la red NARXIR.
165
Figura 6.29: Red neuronal NARXMultiCtes: Evoluci´on del Entrenamiento y Resultados.
166
Figura 6.30: Red neuronal NARXMultiCtes: Rendimiento del Entrenamiento.
Figura 6.31: Red neuronal NARXMultiCtes: Histograma de los Errores de Entrenamiento.
167
Figura 6.32: Red neuronal NARXMultiCtes: Gr´aficos de Regresi´on.
168
Figura 6.33: Red neuronal NARXMultiCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento.
6.5.2.
Resultados de Predicci´ on a 7 d´ıas con NARXMultiCtes
Los resultados de predicci´on a 7 d´ıas con la red neuronal NARXMultiCtes se presentan en la tabla de la Figura (6.35), la cual ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), donde se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de enero y febrero de 1990, en la Figura (6.36), puede observarse el resultado de una de esas predicciones. Analizando las 110 predicciones realizadas se observa un error promedio de 0, 5839m, que presenta 34 predicciones con error por exceso que representan el 30, 91 % y que tiene un error por defecto en los 76 pron´osticos, lo que significa el 69, 09 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error con mayor coste.
6.6.
Combinaci´ on de Redes FTDNN, NAR y NARX Multicapa
La estructura de esta red neuronal, combina redes de diferentes arquitecturas, para realizar la predicci´on, combin´andolas de la siguiente manera: FTDNN-Redes neuronales con retardo de tiempo: Se utilizar´an para ingresar con retardos de tiempo las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı. NAR-Redes neuronales con retroalimentaci´on: Se usar´an para ingresar la informaci´on de la alturas hidrom´etricas de la localidad de Corrientes Capital. 169
Figura 6.34: Red neuronal NARXMultiCtes: Autocorrelaci´on de Error.
NARX Multicapa-Redes neuronales con retroalimentaci´on: Integrar´a la informaci´on de red FTDNN que corresponde a las alturas hidrom´etricas de las estaciones r´ıo arriba de Puerto Iguaz´ u, Posadas e Itat´ı con la informaci´on de la red NAR que proporciona datos de la localidad de Corrientes, luego integrando la informaci´on que le proporcionan ambas redes realizar´a la predicci´on de alturas para la ciudad de Corrientes.
El entrenamiento se realiza con los archivos de las inundaciones de 1991-1992 y de 1997-1998, para lo cual las series correspondientes a los per´ıodos de inundaci´on ser´an concatenamos para salvar la discontinuidad de la serie temporal, como ya se explic´o en las redes anteriores y para el chequeo de la red se utiliza la crecida de los meses de enero y febrero de 1990.
6.6.1.
Configuraci´ on y Creaci´ on de la Red integrando diferentes arquitecturas de redes
FTDNN-Redes neuronales con retardo de tiempos
Con las siguientes l´ıneas de c´odigo se genera la red con retardo de tiempos, que ser´a entrenada con las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas e Itat´ı, esta aporta la informaci´on de las estaciones que se encuentra r´ıo arriba, en territorio argentino. 170
Figura 6.35: Red neuronal NARXMultiCtes: Error de Predicci´on a 7 d´ıas
171
Figura 6.36: Red neuronal NARXMultiCtes: Resultados de Predicci´on.
%%% PRIMERA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % FTDNN-Red neuronal con retardo de tiempos % % Datos de Otras Estaciones con Red de Retardo de Tiempo % % Entrenada con: Alturas de Pto. Iguaz´ u, Posadas e Itat´ ı X = inputSeries; % Define los target, Alturas de Corrientes T = targetSeries; % Crea la Red con retardos de tiempos net = timedelaynet(2:8,5); % Prepara los datos [Xs,Xi,Ai,Ts] = preparets(net,X,T); % Entrena la Red net = train(net,Xs,Ts,Xi,Ai); view(net); Y = net(Xs,Xi,Ai); % Evalua la red perf = perform(net,Ts,Y); NRTOtEst= net; 172
En la Figura (6.37), puede observarse la estructura de la red con retardo de tiempo generada y en la Figura (6.38) los resultados luego de realizar su entrenamiento.
Figura 6.37: Red neuronal FTDNN: Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı.
NAR-Redes neuronales con retroalimentaci´ on El c´odigo siguiente genera una red neuronal con retroalimentaci´on con estructura NAR, que ser´a entrenada con las alturas hidrom´etricas de la localidad de Corrientes. %%% SEGUNDA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % NAR-Redes neuronales con retroalimentaci´ on % % Entrenada con: Alturas de Corrietnes % %% Create la NAR feedbackDelays = 1:3; hiddenLayerSize = 3; net = narnet(feedbackDelays,hiddenLayerSize); % Prepara los datos [inputs,inputStates,layerStates,targets] = preparets(net,{},{},targetSeries); % Divisi´ on de datos para entrenamiento, validaci´ on y testeo net.divideParam.trainRatio = 80/100; net.divideParam.valRatio = 20/100; net.divideParam.testRatio = 0/100; % Entrena la NAR [net,tr] = train(net,inputs,targets,inputStates,layerStates); % Testea la NAR outputs = net(inputs,inputStates,layerStates); errors = gsubtract(targets,outputs); performance = perform(net,targets,outputs); NARCtes=net; 173
Figura 6.38: Red neuronal FTDNN: Resultados del Entrenamiento.
En la Figura (6.39), puede observarse la estructura de la red con retardo de tiempo de estructura NAR generada y en la Figura (6.40) los resultados luego de realizar su entrenamiento. 174
Figura 6.39: Red neuronal NAR: Alturas Hidrom´etricas de Corrientes.
NARX Multicapa-Redes neuronales con retroalimentaci´ on El c´odigo siguiente genera una red neuronal con retroalimentaci´on y estructura NARX Multicapa, que ser´a entrenada con las salidas de las redes creadas en los pasos anteriores NRTOtEst, con la informaci´on de las demas estaciones y NARCtes, con los datos de la ciudad de Corrientes, localidad donde ser´a estimada la altura, por lo cual las capas de la nueva red tomaran como valores iniciales de los pesos, los datos de las salidas de las redes NRTOtEst y NARCtes, organiz´andose de la siguiente manera: Capa 1: toma los pesos de la red NRTOtEst, datos de las demas estaciones de Puerto Iguaz´ u, Posadas e Itat´ı. Capa 2: toma los pesos de la red NARCtes, informaci´on de la estaci´on de Corrientes. Luego de indicar por cada capa el origen de los datos, se preparan los datos para la red y se realiza el entrenamiento de la misma, lo cual se observa en la Figura (6.41).
%%% TERCERA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % NARX Multicapa-Redes neuronales con retroalimentaci´ on %% Integra: % NRTOtEst: Alturas Pto Iguaz´ u, Posadas e Itat´ ı % NARCtes: Alturas de Corrietnes inputDelays = 2:8; feedbackDelays = 1:3; redRP3 = narxnet(inputDelays,feedbackDelays,[5 3 1 3]); redRP3.inputConnect(1,2)=0; redRP3.inputConnect(2,2)=0; redRP3.inputConnect(2,1)=0; redRP3.inputConnect(2,2)=1; redRP3.layerConnect(3,1)=1; redRP3.layerConnect(3,2)=0; redRP3.layerConnect(2,1)=0; 175
Figura 6.40: Red neuronal NAR: Resultados del Entrenamiento.
176
redRP3.layerConnect(4,2)=1; redRP3.inputWeights{1,1}.delays=inputDelays; redRP3.inputWeights{2,2}.delays=feedbackDelays; %Prepara los archivos como los necesita NARX [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP3,inputSeries,{},targetSeries,ew); % Divisi´ on datos para entrenamiento, validaci´ on y testeo redRP3.divideParam.trainRatio = 90/100; redRP3.divideParam.valRatio = 10/100; redRP3.divideParam.testRatio = 0/100; % Se configura la estructura de la red redRP3=configure(redRP3,inputs,targets); % Capas 1 se toman de NRTOtEst y % Capas 2 se toman de NARCtes redRP3.IW{1,1}=NRTOtEst.IW{1,1}; redRP3.inputWeights{1,1}.learn=false; redRP3.LW{3,1}=NRTOtEst.LW{2,1}; redRP3.layerWeights{3,1}.learn=false; redRP3.IW{2,2}=NARCtes.IW{1,1}; redRP3.b{1}=NRTOtEst.b{1}; redRP3.biases{1}.learn=false; redRP3.b{3}=NRTOtEst.b{2}; redRP3.biases{3}.learn=false; redRP3.b{2}=NARCtes.b{1}; %redRP3.biases{2}.learn=false; % Se prepara los datos para la Red [inputs,inputStates,layerStates,targets] = preparets(redRP3,inputSeries,{},targetSeries); % Se entrena la Red [redRP3,tr] = train(redRP3,inputs,targets,inputStates,layerStates); Terminado el primer entrenamiento de la red, se realiza el cierre del lazo de retroalimentaci´on y se precede nuevamente a entrenar la red con lazo cerrado, este es un entrenamiento con mayor coste computacional y que demora mayor tiempo, el c´odigo correspondiente se detalla a continuaci´on.
% Cierre del lazo de retroalimentaci´ on DLNI = closeloop(redRP3);
177
Figura 6.41: Red neuronal NARX Multicapa: Red cuyas entradas son las salidas de las redes NRTOtEst y NARCtes, estructura y resultados de la primer etapa de entrenamiento.
178
% Preparaci´ on de los Archivos [inputs,inputStates,layerStates,targets] = preparets(DLNI,inputSeries,{},targetSeries); DLNI.divideParam.trainRatio = 80/100; DLNI.divideParam.valRatio = 20/100; DLNI.divideParam.testRatio = 0/100; % Entrenamiento de la Red con lazo de retroalimentaci´ on cerrado [redRP3,tr] = train(DLNI,inputs,targets,inputStates,layerStates); % Test de la Red outputs3 = redRP3(inputs,inputStates,layerStates); performance3 = perform(redRP3,targets,outputs3); errors3 = gsubtract(targets,outputs3); % Graficas con resultados del entrenamiento salida1=getsamples(outputs3,1); salida2=getsamples(outputs3,2); target1=getsamples(targets,1); target2=getsamples(targets,2); plotresponse(target1,salida1) plotresponse(target2,salida2) FtdnnNarNarxMCtes = redRP3;
En la ventana de la Figura (6.42), puede seguirse el proceso de este segundo ajuste de la red, porque se visualizan las iteraciones y los errores de ajustes que se est´an dando, tambi´en se presentan opciones que permiten visualizar graficamente los siguientes resultados: Rendimiento del Entrenamiento, ver Figura (6.43), Instancias del Entrenamiento, Histograma de los Errores de Entrenamiento, ver Figura (6.44), Gr´aficos de Regresi´on, ver Figura (6.45), Gr´aficos de Resultados y Errores por tiempo de entrenamiento, ver Figura (6.46), Error de Autorregresi´on, ver Figura (6.47), Correlaci´on de Error y Entrada.
179
Figura 6.42: Red neuronal FtdnnNarNarxMCtes: Red cuyas entradas son las salidas de las redes NRTOtEst y NARCtes, detalle de la estructura con lazo de retroalimentaci´on cerrado y los resultados de la segunda etapa de entrenamiento.
180
Figura 6.43: Red neuronal FtdnnNarNarxMCtes: Rendimiento del Entrenamiento.
Figura 6.44: Red neuronal FtdnnNarNarxMCtes: Histograma de los Errores de Entrenamiento.
181
Figura 6.45: Red neuronal FtdnnNarNarxMCtes: Gr´aficos de Regresi´on.
6.6.2.
Resultados de Predicci´ on a 7 d´ıas con FtdnnNarNarxMCtes
Los resultados de la predicci´on a 7 d´ıas con FtdnnNarNarxMCtes se presentan en la tabla de la Figura (6.56), la cual ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), donde se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de enero y febrero de 1990, en la Figura (6.49), puede observarse el resultado de una de esas predicciones. En las 110 predicciones realizadas se presenta un error promedio de 0, 5609m, que presenta 95 predicciones con error por exceso que representan el 86, 36 % y que tiene un error por defecto en los 15 pron´osticos, lo que significa el 13, 64 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error con mayor coste.
6.7.
Combinaci´ on de Redes NLP y NARX Multicapa
Buscando verificar la validez de los resultados publicados recientemente con Redes Profundas, se han aplicado a este caso. Se ha utilizado una inicializaci´on de la red mediante autocodificadores. As´ı, la primera capa se ajusta intentando reproducir las entradas, la 182
Figura 6.46: Red neuronal FtdnnNarNarxMCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento.
Figura 6.47: Red neuronal FtdnnNarNarxMCtes: Autocorrelaci´on de Error.
183
Figura 6.48: Red neuronal FtdnnNarNarxMCtes: Error de Predicci´on a 7 d´ıas
184
Figura 6.49: Red neuronal FtdnnNarNarxMCtes: Resultados de Predicci´on.
segunda capa intentando reproducir la primera, cuyos pesos se han congelado y lo mismo sucesivamente en las siguientes. Finalmente se a˜ naden las tres redes con estructura NARX Multicapa y se realiza un ajuste completo de la red, partiendo de los pesos obtenidos en los autocodificadores para las capas precedentes que son pasados a las capas de las redes NARX Multicapa. Esta red neuronal combina dos tipos de arquitecturas de redes, para realizar la predicci´on integr´andolas de la siguiente manera: NLP-Redes neuronales de aprendizaje profundo: Por las caracter´ısticas de estas redes de tener m´as capas que le permite aprender las relaciones subyacentes de la informaci´on. En una primera etapa se ingresar´an las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes, dejando que los autocodificadores procedan a establezcer los pesos iniciales que luego se pasar´an a las dem´as redes NARX Multicapa. NARX Multicapa-Redes neuronales con retroalimentaci´on: Se tendran tres redes con esta estructura de capas y de neuronas por capa: • redRP1 : Las entradas ser´an las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes, pero los pesos iniciales ser´an pasados por los autocodificadores. • redRP2 : Las entradas ser´an las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes, pero los pesos iniciales ser´an pasados por los autocodificadores. • redRP3 : Las entradas ser´an las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes y en su estructura toma 2 capas de redRP1 y las otras dos capas las toma de redRP2. 185
El entrenamiento se realiza con los archivos de las inundaciones de 1991-1992 y de 1997-1998, para lo cual las series correspondientes a los per´ıodos de inundaci´on ser´an concatenados para salvar la discontinuidad de la serie temporal, como ya se explic´o en las redes anteriores y para el chequeo de la red se utiliza la crecida de los meses de enero y febrero de 1990. La estrategia trabajada es construir una red en la que los valores iniciales son los del autocodificador, que son pasados a las siguientes redes que luego se reajusta. En el proceso de reajuste los valores pasados por los autocodificadores pueden permacer congelados o fijos si se especifica la opci´on false o podran ser modificados si se indica la opci´on true, como se detalla a continuaci´on. Opci´on false: Se congelan o fijan los valores pasados de los autocodificadores: redRP1.LW{2,1}=autocod.ae{2}.W{1}; redRP1.layerWeights{2,1}.learn=false; redRP1.b{2}=autocod.ae{2}.b{1}; redRP1.biases{2}.learn=false; Opci´on true: Se permiten modificar los valores pasados de los autocodificadores: redRP1.LW{2,1}=autocod.ae{2}.W{1}; redRP1.layerWeights{2,1}.learn=true; redRP1.b{2}=autocod.ae{2}.b{1}; redRP1.biases{2}.learn=true;
6.7.1.
Configuraci´ on y Creaci´ on de la Red integrando diferentes arquitecturas de redes
NLP-Redes neuronales de aprendizaje profundo Con las siguientes l´ıneas de c´odigo se genera la red NLP de aprendizaje profundo la cual tendr´a 4 capas, que ser´a entrenada con las alturas hidrom´etricas de las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes, con los mismos retardos que se utilizar´an en las redes con estructura NARX Multicapa, para poder hacer luego el traspaso de pesos, como se detalla en las primeras l´ıneas de c´odigo. La estructura de la red NLP ser´a de 4 capas , con las siguientes cantidades de neuronas por capa: 1. capa con 16 neuronas 2. capa con 8 neuronas 3. capa con 5 neuronas 4. capa con 3 neuronas.
186
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % PRIMERA RED (Red NLP) % %Ingreso de datos para la red Profunda datos=[CorrientesH1,CorrientesH2,CorrientesH3,CorrientesH4, CorrientesH5,CorrientesH6,PtoIguazuH1,PosadasH1,ItatiH1, PtoIguazuH2,PosadasH2,ItatiH2,PtoIguazuH3,PosadasH3, ItatiH3,PtoIguazuH4,PosadasH4,ItatiH4,PtoIguazuH5, PosadasH5,ItatiH5,PtoIguazuH6,PosadasH6,ItatiH6]; objet=[CorrientesH]; % Se Preparan los datos para la red NLP p=datos’; t=objet’; maxt=max(t); % PARA QUE LOS VALORES QUEDEN ENTRE 0 Y 1 maxp=max(p,[],2); minp=min(p,[],2); dp=maxp-minp; dmin=repmat(minp,1,1449); ddp=repmat(dp,1,1449); pesc=(p-dmin)./ddp; opc.batchsize=23; opc.numepochs=67; paj=pesc; % Se determinan las neuronas por capa autocod=saesetup([24 16 8 5 3]); autocod.ae{1}.learningRate=1; autocod.ae{2}.learningRate=1; autocod.ae{3}.learningRate=1; autocod.ae{4}.learningRate=1; % Se entrena la red NLP autocod=saetrain(autocod,paj’,opc);
187
NARX Multicapa-Redes Neuronales con Retroalimentaci´ on Se generan redes con la misma estructura, para que sean compatibles y poder integrarlas y cruzar las capas, por lo cual las redes redRP1, redRP2 y redRP3 tendran los mismos retardos que ser´an del d´ıa 1 al 6 y cuatro capas con las siguientes neuronas en cada una de ellas: 1. capa con 16 neunoras 2. capa con 8 neunoras 3. capa con 5 neunoras 4. capa con 3 neunoras. La tres redes con estructura NARX Multicapa se entrena con las alturas hidrom´etricas de las inundaciones de 1991-1992 y 1997-1998, estos archivos adem´as de las alturas hidrom´etricas diarias contienen el peso que se le ha asignado a cada altura, dando mayor peso a las mayores alturas. Las dos ser´ıes de datos ser´an concatenadas, como se detall´o en (6.4.2) y se entrena la red con los datos de ambas inundaciones porque los resultados obtenidos en (6.4.3), indican que la red entrenada de esta manera, predice con mas precisi´on, posteriormente la red se prueba con el per´ıodo de crecida correspondiente a los meses de enero-febrero de 1990. La redes redRP1 y redRP2 se crean con procesos similares, ambas redes son creadas con la estructura de redes NARX Multicapa y con un retardo de 6 d´ıas, tanto en los datos de la serie como en los entradas externas, luego se realiza un primer entrenamiento, se pasan los pesos de los autocodificadores, posteriormente se realiza un segundo entrenamiento con los pesos inicializados con los valores de los autocodificadores, luego se realiza un testeo del rendimiento de la red.
%%% SEGUNDA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % Crea primera red con estructura NARX Multicapa % con entradas externar % Especificaci´ on de los retardos inputDelays = 1:6; feedbackDelays = 1:6; % Crea la Red con estructura NARX Multicapa redRP1 = narxnet(inputDelays,feedbackDelays,[16 8 5 3]); redRP1.layers{1}.transferFcn=’logsig’; redRP1.layers{2}.transferFcn=’logsig’; redRP1.layers{3}.transferFcn=’logsig’; redRP1.layers{4}.transferFcn=’logsig’; 188
% Prepara los datos para la red NARX [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP1,inputSeries,{},targetSeries,ew); % Establece porcentaje de datos para entrenamiento, % validaci´ on y testeo redRP1.divideParam.trainRatio = 90/100; redRP1.divideParam.valRatio = 10/100; redRP1.divideParam.testRatio = 0/100; % Entrena la red para configurarla y luego asignar los pesos % correspondiente a los autocodificadores [redRP1,tr] = train(redRP1,inputs,targets,inputStates,layerStates,ew1); % Asigna los pesos de los autocodificadores RotrasEst=autocod.ae{1}.W{1}(:,7:24); RCtes=autocod.ae{1}.W{1}(:,1:6); redRP1.IW{1,1}=RotrasEst; redRP1.inputWeights{1,1}.learn=false; redRP1.IW{1,2}=RCtes; redRP1.inputWeights{1,2}.learn=false; redRP1.LW{2,1}=autocod.ae{2}.W{1}; redRP1.layerWeights{2,1}.learn=true; redRP1.LW{3,2}=autocod.ae{3}.W{1}; redRP1.layerWeights{3,2}.learn=true; redRP1.LW{4,3}=autocod.ae{4}.W{1}; redRP1.layerWeights{4,3}.learn=true; redRP1.b{1}=autocod.ae{1}.b{1}; redRP1.biases{1}.learn=false; redRP1.b{2}=autocod.ae{2}.b{1}; redRP1.biases{2}.learn=true; redRP1.b{3}=autocod.ae{3}.b{1}; redRP1.biases{3}.learn=true; redRP1.b{4}=autocod.ae{4}.b{1}; redRP1.biases{4}.learn=true; % Prepara los datos para el entrenamiento [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP1,inputSeries,{},targetSeries,ew); % Entrena la red iniciando con los pesos pasados de % los autocodificadores [redRP1,tr] = train(redRP1,inputs,targets,inputStates,layerStates,ew1); 189
% Test the Network outputs1 = redRP1(inputs,inputStates,layerStates); performance1 = perform(redRP1,targets,outputs1); errors1 = gsubtract(targets,outputs1);
%%% TERCERA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % Crea segunda red con estructura NARX Multicapa % con entradas externar % Especificaci´ on de los retardos inputDelays = 1:6; feedbackDelays = 1:6; % Crea la Red con estructura NARX Multicapa redRP2 = narxnet(inputDelays,feedbackDelays,[16 8 5 3]); redRP2.layers{1}.transferFcn=’logsig’; redRP2.layers{2}.transferFcn=’logsig’; redRP2.layers{3}.transferFcn=’logsig’; redRP2.layers{4}.transferFcn=’logsig’; % Prepara los datos para la red NARX [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP2,inputSeries,{},targetSeries,ew); % Establece porcentaje de datos para entrenamiento, % validacion y testeo redRP2.divideParam.trainRatio = 90/100; redRP2.divideParam.valRatio = 10/100; redRP2.divideParam.testRatio = 0/100; % Entrena la red para configurarla y luego asignar los pesos % correspondiente de los autocodificadores [redRP2,tr] = train(redRP1,inputs,targets,inputStates,layerStates,ew1); % Asigna los pesos de los autocodificadores RotrasEst=autocod.ae{1}.W{1}(:,7:24); RCtes=autocod.ae{1}.W{1}(:,1:6); redRP2.IW{1,1}=RotrasEst; redRP2.inputWeights{1,1}.learn=false; redRP2.IW{1,2}=RCtes; redRP2.inputWeights{1,2}.learn=false; 190
redRP2.LW{2,1}=autocod.ae{2}.W{1}; redRP2.layerWeights{2,1}.learn=true; redRP2.LW{3,2}=autocod.ae{3}.W{1}; redRP2.layerWeights{3,2}.learn=true; redRP2.LW{4,3}=autocod.ae{4}.W{1}; redRP2.layerWeights{4,3}.learn=true; redRP2.b{1}=autocod.ae{1}.b{1}; redRP2.biases{1}.learn=false; redRP2.b{2}=autocod.ae{2}.b{1}; redRP2.biases{2}.learn=true; redRP2.b{3}=autocod.ae{3}.b{1}; redRP2.biases{3}.learn=true; redRP2.b{4}=autocod.ae{4}.b{1}; redRP2.biases{4}.learn=true; % Prepara los datos para el entrenamiento [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP2,inputSeries,{},targetSeries,ew); % Entrena la red iniciando con los pesos pasados % de los los autocodificadores [redRP2,tr] = train(redRP2,inputs,targets,inputStates,layerStates,ew1); % Test the Network outputs2 = redRP2(inputs,inputStates,layerStates); performance2 = perform(redRP2,targets,outputs2); errors2 = gsubtract(targets,outputs2);
La red redRP3 se crea con la estructura de redes NARX Multicapa y con un retardo de 6 d´ıas, tanto en los datos de la serie como en los entradas externas, luego se realiza un primer entrenamiento y a continuaci´on los pesos de sus capas se importan de la siguiente manera: Capas 1 y 2 se toman de redRP1 Capas 3 y 4 se toman de redRP2 %%% CUARTA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % % Crea tercera red con estructura NARX Multicapa % con entradas externar
191
% Especificaci´ on de los retardos inputDelays = 1:6; feedbackDelays = 1:6; % Crea la Red con estructura
NARX Multicapa
redRP3 = narxnet(inputDelays,feedbackDelays,[16 8 5 3]); redRP3.layers{1}.transferFcn=’logsig’; redRP3.layers{2}.transferFcn=’logsig’; redRP3.layers{3}.transferFcn=’logsig’; redRP3.layers{4}.transferFcn=’logsig’; % Prepara los datos para la red [inputs,inputStates,layerStates,targets,ew1] = preparets(redRP3,inputSeries,{},targetSeries,ew); % Se fija porcentaje de datos para entrenamiento, validaci´ on y test redRP3.divideParam.trainRatio = 90/100; redRP3.divideParam.valRatio = 10/100; redRP3.divideParam.testRatio = 0/100; % Primer entrenamiento de inicializacion de la red [redRP3,tr] = train(redRP3,inputs,targets,inputStates,layerStates,ew1); % Capas\index{redes neuronales!capas} % Capas\index{redes neuronales!capas} redRP3.IW{1,1}=redRP1.IW{1,1}; redRP3.inputWeights{1,1}.learn=false; redRP3.IW{1,2}=redRP1.IW{1,2}; redRP3.inputWeights{1,2}.learn=false; redRP3.LW{2,1}=redRP1.LW{2,1}; redRP3.layerWeights{2,1}.learn=true; redRP3.LW{3,2}=redRP2.LW{3,2}; redRP3.layerWeights{3,2}.learn=true; redRP3.LW{4,3}=redRP2.LW{4,3}; redRP3.layerWeights{4,3}.learn=true; redRP3.b{1}=redRP1.b{1}; redRP3.biases{1}.learn=false; redRP3.b{2}=redRP1.b{2}; redRP3.biases{2}.learn=true; redRP3.b{3}=redRP2.b{3}; redRP3.biases{3}.learn=true; redRP3.b{4}=redRP2.b{4}; redRP3.biases{4}.learn=true; % Preparaci´ on de los archivos 192
1 y 2 se toman de redRP1 3 y 4 se toman de redRP2
[inputs,inputStates,layerStates,targets,ew1] = preparets(redRP3,inputSeries,{},targetSeries,ew); % Segundo entrenamiento de la red con los pesos inicializados [redRP3,tr] = train(redRP3,inputs,targets,inputStates,layerStates,ew1); % Test de la Red outputs3 = redRP3(inputs,inputStates,layerStates); performance3 = perform(redRP3,targets,outputs3); errors3 = gsubtract(targets,outputs3); % Graficos de resultados salida1=getsamples(outputs3,1); salida2=getsamples(outputs3,2); target1=getsamples(targets,1); target2=getsamples(targets,2); plotresponse(target1,salida1) plotresponse(target2,salida2) NlpNarxMCtes = closeloop(redRP3);
En la ventana de la Figura (6.50), puede seguirse el proceso de este segundo ajuste de la red, porque se visualizan las iteraciones y los errores de ajustes que se est´an dando, tambi´en se presentan opciones que permiten visualizar graficamente los siguientes resultados: Rendimiento del Entrenamiento, ver Figura (6.51), Instancias del Entrenamiento, Histograma de los Errores de Entrenamiento, ver Figura (6.52), Gr´aficos de Regresi´on, ver Figura (6.53), Gr´aficos de Resultados y Errores por tiempo de entrenamiento, ver Figura (6.54), Error de Autorregresi´on, ver Figura (6.55), Correlaci´on de Error y Entrada.
193
Figura 6.50: Red neuronal NlpNarxMCtes: Red resultante de la integraci´on de una red NLP y tres redes NARX Multicapa, visualizaci´on de estructura final y resultados del entrenamiento
194
Figura 6.51: Red neuronal NlpNarxMCtes: Rendimiento del Entrenamiento.
Figura 6.52: Red neuronal NlpNarxMCtes: Histograma de los Errores de Entrenamiento.
195
Figura 6.53: Red neuronal NlpNarxMCtes: Gr´aficos de Regresi´on.
196
Figura 6.54: Red neuronal NlpNarxMCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento.
6.7.2.
Resultados de Predicci´ on a 7 d´ıas con FtdnnNarNarxMCtes
Los resultados que se obtienen al realizar la predicci´on a 7 d´ıas con FtdnnNarNarxMCte se presentan en la tabla de la Figura (6.56), la cual ha sido generada siguiendo los pasos del Procedimiento de Chequeo enumerados en (6.2), donde se detallan los errores obtenidos al predecir la altura hidrom´etrica en la localidad de Corrientes en el per´ıodo de inundaci´on de los meses de enero y febrero de 1990, en la Figura (6.57), puede observarse el resultado de una de esas predicciones. Al analizar las 110 predicciones realizadas se presenta un error promedio de 0, 2218m, que presenta 65 predicciones con error por exceso que representan el 59, 09 % y que tiene un error por defecto en los 45 pron´osticos, lo que significa el 40, 91 %, este u ´ltimo tipo de error se indica en la tabla con valores en rojo, por ser el error con mayor coste.
6.8.
Resultados Comparativos de Predicciones a Mediano Plazo
En el cuadro compartivo de Predicciones a Mediano Plazo de la Figura (6.58), pueden observarse los errores en valor absoluto que se fueron obteniendo con las diferentes redes neuronales, que se fueron aplicando, puede observarse que al predecir a siete d´ıas las magnitudes de los errores son mayores que en la predicci´on a Corto Plazo que ser detallan en la secci´on (5.8), en el Cap´ıtulo (5. Puede observarse que en la predicci´on a 7 d´ıas, la red FtdnnNarNarxMCtes, que integra redes FTDNN NAR y NARX Multicapa, es la red presenta mayor pocentaje 197
Figura 6.55: Red neuronal NlpNarxMCtes: Autocorrelaci´on de Error.
errores por exceso con un porcentaje del 86, 36 %, siendo este el error de menor coste y la red NARIR: con estructua NAR con 1 capa oculta con 10 neuronas, es la que presenta el mayor pocentaje de error por defecto, al presentarlo en el 100, 00 % en las predicciones, siendo este el error de mayor coste, por estar siempre estimando por debajo de los errores reales del r´ıo. La red que presenta el menor error promedio en valor absoluto es la red NlpNarxMCtes que integra una red NLP y tres redes NARX Multicapa, presentando adem´as un error por exceso en el 59, 09 % de la predicciones y un error por defecto en el 40, 91 % de los casos.
198
Figura 6.56: Red neuronal NlpNarxMCtes: Error de Predicci´on a 7 d´ıas 199
Figura 6.57: Red neuronal NlpNarxMCtes: Resultados de Predicci´on.
Figura 6.58: Errores Comparativos de Predicci´on a 7 d´ıas con diferentes Redes Neuronales
200
Cap´ıtulo 7 An´ alisis de los Resultados Obtenidos 7.1.
Pulso 2
El software Pulso 2 fue dise˜ nando y desarrollado por Juan Jose Neiff Director del Centro de Ecolog´ıa Aplicada del Litoral CECOAL-CONICET, de la Universidad Nacional del Nordeste, Argentina y Matias Neiff desde 2003 hasta la fecha, con actualizaciones sucesivas disponible gratuitamente para uso acad´emico en (www.neiff.com.ar), es una herramienta novedosa y de mucha utilidad para el an´alisis de procesos fluviales recurrentes, que permite explorar algunas relaciones cuantitativas entre las caracter´ısticas ecol´ogicas de a´reas anegables e inundables, por ejemplo distribuci´on y abundancia de poblaciones y las diferencias en las fases de inundaci´on y de suelo seco en cada zona del paisaje. Pulso 2 estudia fen´omenos que se repiten seg´ un una funci´on sinusoidal a lo largo del tiempo, como puede ser el conjunto de fluctuaciones hidrom´etricas de un r´ıo, las lluvias en un per´ıodo y localidad determinada o los eventos de fuego en las sabanas. Se establece en la serie un valor de intensidad (valor de referencia), el cual define la presencia de determinado elemento del sistema o la ocurrencia de alg´ un proceso que queremos investigar en el sistema, como podr´ıa ser la ocurrencia de suelo inundado. As´ı, si se fija la cota de alerta de inundaci´on en 5m, los valores que se encuentran por encima de esta l´ınea virtual son tomados como positivos e indican la ocurrencia de la fase de inundaci´on y por debajo del nivel de referencia, los valores son tomados por el modelo como negativos y se˜ nalan la ausencia potencial del elemento o proceso investigado, como ser´ıa la inundaci´on. A partir de datos hidrom´etricos o de caudal, diarios, semanales o anuales, es posible conocer el n´ umero de pulsos, el n´ umero de fases de inundaci´on y de sequ´ıa, la estaci´on del a˜ no en que ocurren, la duraci´on y magnitud que alcanzaron y la regularidad del r´egimen. Siendo de gran utilidad para determinar las situaciones de riesgo que deben considerar las obras de defensa contra inundaciones de las ciudades, en base el an´alisis de serie de datos hidrom´etricos hist´oricos disponibles, [Neiff, 1999].
7.2.
Predicci´ on con Pulso 2
La versi´on Pulso 2, cuenta con un m´odulo de predicci´on denomidado Prisma, el cual esta desarrollado aplicando modelos de algoritmos gen´eticos para realizar predicci´on de alturas hidrom´etricas del r´ıo Paran´a, el cual es usado para comparar los resultados obte201
nidos en la presente tesis. En Pulso 2 se importa la serie completa de alturas hidrom´etricas en la localidad de Corrientes, desde 1989 hasta 2009, analizada durante el desarrollo de la presente tesis, en la Figura (7.1) puede observarse en rojo la gr´afica de las alturas del r´ıo, en verde el valor de alerta de inundaci´on a los 5m y en bordo la tendencia aproximada con algoritmos gen´eticos.
Figura 7.1: Pulso: alturas hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009. El programa detecta los Pulsos de crecida de las alturas hidrom´etricas en la localidad de Corrientes, del per´ıodo de tiempo que se ha ingresado dando informaci´on sobre cada pulso como puede observarse en la Tabla de la Figura (7.3) y grafica cada pulso como puede apreciarse, en la Figura (7.2). En la Figura (7.4), se observa la ventana Prisma, donde se presentan las opciones para realizar la predici´on de alturas hidrom´etricas con algoritmos gen´eticos y en la Figura (7.5) se visualiza la graficamente los resultantes de la predicci´on.
7.3.
Comparaci´ on de Resultados con Pulso 2
Se comparan en la tabla de la Figura (7.6), los errores obtenidos en la Predicci´on a Corto Plazo (a 3 d´ıas) y a Mediano Plazo ( a 7 d´ıas), que se han obtenidos en la presente tesis, con los errores de predicci´on del modelo de algoritmos gen´eticos Prima de Pulso 2. Puede observarse que tanto en la predicci´on a 3 d´ıas, como a 7 d´ıas, son menores los errores en las prediccion con redes neuronales desarrolladas en la tesis, tambien es relevante que estos modelos presentan mayores porcentajes de error por exceso, que es el error de menos coste, mientras que las predicciones con algoritmos gen´eticos presentan 202
Figura 7.2: Pulso: alturas hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009.
mayores porcentajes de errores por defecto, siendo estos u ´ltimos errores los de mayor coste en per´ıodos de inundaciones. Es oportuno mencionar que el programa Prisma 2, hace predicciones a corto y mediano plazo, siendo su principal objetivo y fortaleza realizar predicci´on a largo plazo de las tendencias de comportamiento de la serie analizada, en este caso en particular las alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, haciendo predicci´on con buenos resultados de los meses con probables crecidas o sequias.
203
Figura 7.3: Pulsos detectados en el per´ıodo de a˜ nos de 1989 a 2009. 204
Figura 7.4: Pulso - Prisma: Alturas Hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009.
Figura 7.5: Pulso: Alturas Hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009.
205
Figura 7.6: Comparaci´on de Errores de Predici´on.
206
Conclusiones El presente trabajo incorpora algunas innovaciones al utilizar Sistemas Inteligentes para el ajuste de Modelos Hidrol´ogicos y aplicarlos en la Predicci´on de las alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes, Argentina. La conclusi´on fundamental, cara a la gesti´on correcta de las emergencias de inundaci´on, es que estos modelos permiten una predicci´on con resultados aceptables y u ´tiles ya que 22 cm de precisi´on con 7 d´ıas de antelaci´on puede ser la diferencia entre tomar medidas adecuadas o sufrir cuantiosas p´erdidas. En el desarrollo del trabajo puede apreciarse que se comenz´o con un primer an´alisis con series temporales que se presentaron en el Cap´ıtulo (4); se obtenian errores significativos en los pron´osticos, pero permiti´o conocer la dependencia de la Altura del r´ıo a predecir respecto a los distintos datos, descartando las variables meteorol´ogicas y de caudales que no tenian incidencia directa en la altura del r´ıo. De ello tambi´en esta tesis ha permitido obtener otra conclusi´on, que la conducta del r´ıo Paran´a en su paso por Corrientes est´a dominada por su propia din´amica en ese tramo y s´olo en menor medida por la evoluci´on de tramos anteriores. En la Predicci´on a Corto Plazo los mejores resultados se obtuvieron con redes neuronales en las que se ha implementado la Funci´on de Penalizaci´on del Error que se propone, que se ha detallado en el Cap´ıtulo(5) en las Secciones (5.4), (5.6) y (5.7) y han sido entrenadas con archivos de varias inundaciones, obteni´endose en la predicci´on a tres d´ıas los siguientes valores, los cuales son u ´tiles en general y permiten mejorar los resultados obtenidos con los otros modelos por presentar un error en valor absoluto bajo y un porcentaje de errores por defecto del 20, 00 %: Error Promedio en Valor Absoluto de: 0, 12m Presenta Error por Exceso en el 80, 00 % de las predicciones Presenta Error por Defecto en el 20, 00 % de las predicciones.
207
En la Predicci´on a Mediano Plazo se analizaron estructuras de redes neuronales con diferentes arquitecturas y criterios de ajuste, obteni´endose los mejores resultados con una red profunda cuya inicializaci´on se hace en varias fases, tal y como se detalla en el Cap´ıtulo(6) en las Secciones (6.7) y (6.8), obteni´endose una predicci´on a siete d´ıas con los siguientes resultados: Error Promedio en Valor Absoluto de: 0, 22m Presenta Error por Exceso en el 59, 09 % de las predicciones Presenta Error por Defecto en el 40, 91 % de las predicciones. Con lo cual puede concluirse que al implementar esta inicializaci´on, hay un error promedio en valor absoluto aceptable, reduci´endolo en un 50, 00 % con respecto a otros modelos, presentando un error por defecto en el 40, 91 %, lo cual para el caso de predicci´on de alturas hidrom´etricas significa el error de mayor coste, como puede observarse en la tabla de la Figura (6.58), por lo cual podemos concluir que para esta aplicaci´on han dado buenos resultados pero podr´ıan ser mejorables. Al comenzar la memoria se presentaron los estudios recientes sobre el comportamiento del r´ıo, en la Secci´on (1.3.7), el estudio de Flamenco, [Flamenco, 2010], es un pron´ostico de crecida del r´ıo Paran´a basado en el estudio del fen´omeno del Ni˜ no, con lo cual puede predecir con buenos resultados los meses con probables crecidas. En este estudio se basan los pron´osticos de crecidas que actualmente se manejan en la regi´on, el pron´ostico publicado por el INTA elaborado por Flamenco, en marzo de 2010, da estimaciones medias de altura mensuales, estableciendo l´ımites inferiores y superiores con un intervalo de amplitud variando de 0,50 m a 1,00 m, [INTA and Flamenco, 2010], manifestando claramente en su art´ıculo, [Flamenco, 2010], que: No existen antecedentes de pron´ostico estacional para este r´ıo, y el mismo puede ser muy u ´til en complemento con modelos de alerta en el Corto Plazo. Teniendo presente lo mencionado por Wyffels, que el realizar una buena predicci´on del futuro permite que los gobiernos, puedan planificar sus inversiones, la producci´on y otras necesidades y que ello demanda de buena t´ecnicas de previsi´on que motiva a muchos investigadores, [Wyffels and Schrauwen, 2010], humildemente considero que el aporte de este trabajo es un primer paso, en una investigaci´on mayor para mejorar el pron´ostico del comportamiento del r´ıo Paran´a, en especial en per´ıodos de inundaciones, lo cual pueda beneficiar a la regi´on de la cuenca del r´ıo Paran´a, en Argentina.
208
Bibliograf´ıa
J. C. Abril. Modelos para el An´alisis de las Series de Tiempo. Ediciones Cooperativas, Argentina, 2004. C. Alberola L´opez. Probabilidad, Variables Aleatorias y Procesos Estoc´ asticos: una introduccion orientada a las telecomunicaciones. Valladolid: Universidad de Valladolid, Secretariado de Publicaciones, Espa˜ na, 2004. G. Anthes. Deep learning, comes of age. Communications of the ACM, june 2013. C. Ball. Meditando sobre el An´alisis T´ecnico y los Gr´afico Aleatorios. http://www.rankia.com/foros/bolsa/temas/559249-meditando-analisis-tecnico-graficoaleatorios?page=9, Consultado: 4 de febrero de 2013. P. y. P. D. y. L. H. Bengio, Y. y Lamblin. Greedy Layer-Wise Training of Deep Networks. Universite de Montreal Montreal, Quebec, Canada, Consultado: 8 de abril de 2013. V. T. Chow. Hidr´aulica de Canales Abiertos. McGraw-Hill, Colombia, 2004. J. L. Crespo. Redes Neuronales Artificiales para Ingenieros. Santander, Santander, Espa˜ na, 1996. S. Crone. Trainning Artificial Neural Networks for Time Series Prediction using Asymmetric Cost Functions. 2002a. S. Crone. Prediction of White Noise Time Series using Artificial Neural Networks and Asymmetric Cost Functions. 2002b. H. Demuth and M. Beale. Neural Network Toolbox, for use with Matlab. The MathWorrks.Inc., U.S., 1998. DesEnredando. Red de Estudios Sociales en Prevenci´on de Desastres en Am´erica Latina. http://www.desenredando.org/, Consultado: 4 de abril de 2010. DesInventar. Sistema de Inventario de Desastres. http://www.desinventar.org/, Consultado: 4 de abril de 2010. EFN-UNCOR. Propuesta para la Confecci´on de Planes de Emergencia por Rotura de Presas en la Provincia de C´ordoba. Aplicaci´on al Dique San Roque - Universidad de C´ordoba - Argentina. http://www.efn.uncor.edu/posgrado/rrhh/asignaturaspdf/Tesis/Labaque/4%20Tr %C3 %A1nsito %20de %20Crecidas.pdf, Consultado: 10 de febrero de 2013. 209
C. Europea. Investigaci´on Innovaci´on: Inundaciones-Estar alertados significa estar mejor. http://ec.europa.eu/research/leaflets/floods/page 94 es.html, Consultado: 5 de enero de 2013. L. Fausett. Fundamentals of Neural Networks: arquitectures, algorithms, and applications. Dehli: Pearson Education, 2006. R. Fiszelew, A. y Garc´ıa-Mart´ınez. Generaci´on Autom´atica de Redes Neuronales con Ajuste de Par´ametros Basado en Algoritmos Gen´eticos. Universidad de Buenos Aires, Buenos Aires, Argentina, Consultado: 25 de febrero de 2013. http://laboratorios.fi.uba.ar/lsi/R-ITBA-26-rrnn-ags.pdf. E. A. Flamenco. Modelo de Pron´ostico de Inundaciones en el R´ıo Paran´a en Corrientes, basado en el Fen´omeno ENSO - El Ni˜ no /Oscilaci´on del Sur, EVARSA-Evaluaci´on de Recursos H´ıdricos S.A. http://www.unesco.org.uy/phi/libros/enso/flamenco.html, Consultado: 6 de febrero de 2010. F. J. Gir´on Gonz´alez-Torre. Determinismo, Caos, Azar e Incertidumbre - Real Academia de Ciencias. http://www.rac.es/ficheros/doc/00327.pdf, Consultado: 1 de febrero de 2013. J.
M. Guti´errez. Introducci´on a las Redes Neuronales. sidad de Cantabria, Espa˜ na, Consultado: 23 de febrero http://personales.unican.es/gutierjm/docs/tut RedesNeuro.pdf.
Univerde 2013.
J. y. A. R. Guti´errez Serret, Ram´on M. y Lozano Pedroch. Los Modelos F´ısicos a Escala Reducida y la Simulaci´on de Maniobras de Buques. Herramientas para el Dise˜ no Portuario. Organizaci´ on de los Estados Americanos-Comisi´ on Interamericana de Puertos, Consultado: 9 de febrero de 2013. S. Haykin. Neural Networks. A Comprehensive Foundation. Prentice Hall-University of Michigan Press-Second Edition, Ann Arbor,USA, 1999. G. E. Hinton. Connectionist Learning Procedures. Artificial Intelligence, vol. 40, pp. 185-234, 1989. J. Holland. Adaptation in Natural and Artificial Systems. University of Michigan Press, Ann Arbor,USA, 1992. INTA. Instituto Nacional de Tecnolog´ıa Agropecuaria. http://www.inta.gov.ar/index.asp, Consultado: 4 de abril de 2010. INTA and E. A. Flamenco. Pron´ostico R´ıo Paran´a en http://www.inta.gov.ar/index.asp, Consultado: 6 de febrero de 2010.
Corrientes.
W. F. Laqui Vilca. Aplicaci´on del Modelo AcquaNet. Master’s thesis, Maestria en Recursos H´ıdricos-Universidad Nacional Agraria La Molina, Peru, http://usuarios.multimania.es/lcastillonavarro/Aplicacion %20labsid.pdf, junio 2007. E.
Mateos de Cabo, Ruth y Olmedo Fern´andez. Implicaciones del Caos Determinista en la Econom´ıa y la Gesti´on Empresarial, Universidad San Pablo-CEU -Universidad de Sevilla. http://www.encuentrosmultidisciplinares.org/Revistan %BA11/Ruth %20Mateos %20y %20Elena %20Olmedo.pdf, Consultado: 1 de febrero de 2013. 210
Matlab. Matlab Versi´on 7.11.0 R2010b. The MathWorks, 2010. L. Mediero Ordu˜ na. Pron´ostico Probabil´ıstico de Caudales de Avenida Mediante Redes Bayesianas Aplicadas sobre un Modelo Hidrol´ogico Distribuido. PhD thesis, Universidad Polit´ecnica de Madrid, Espa˜ na, 2007. J. J. Merelo Guerv´os. Inform´atica Evolutiva. Universidad de Granada, Espa˜ na, Consultado: 30 de marzo de 2013. http://geneura.ugr.es/ jmerelo/ie/intro.htm. Z. Michalewicz. Genetic Algorithms + Data Structures = Evolution Programs. SpringerVerlag, Berlin Heidelberg, Germany, 1992. J. J. Neiff. El r´egimen de pulsos en r´ıos y grandes humedales de Sudam´erica. In: Malv´arez AI (ed) T´opicos sobre humedales subtropicales y templados de Sudam´erica. Universidad de Buenos Aires, 1999. P. y. C. J. y. M. S. y. C. S. Ogallo, L. y Bessemoulin. Boletin - Adaptaci´on a la variabilidad del clima y al cambio clim´atico: el sistema de Foros sobre la evoluci´on probable del clima. Revista de la Organizaci´ on Meteorol´ogica Mundial, Consultado: 3 de enero de 2013. OMM. Organizaci´on Meteorol´ogica Mundial, Programa Mundial sobre el Clima - Servicios de Informaci´on y Predicci´on del Clima (SIPC). Consultahttp://www.wmo.int/pages/prog/wcp/wcasp/documents/wcasp sp.pdf, do: 22 de enero de 2013. E. Parliament. Directive 2007/60/EC on the assessment and management of flood risks. Official Journal of the European Union, october 2007. D. Pe˜ na S´anchez de Rivera. An´alisis de Series Temporales. Alianza Editorial, Espa˜ na, 2005. X. L. Pham, D.T. Neural Networs for Identi?cation, Prediction and Control. SpringerVerlag, London, Great Britain, 1995. H. Poincar´e. Science and Method. Cosimo Classics, Estados Unidos, 2009. K. R. Popper. The Logic of Scientific Discovery. Routledge, Gran Bretania, 2002. I. Prigogine. El Fin de las Certidumbres. Andres Bello-Quinta Edici´on, Chile, 1997. R. E. Sierra. Meteorologista argentino prevˆe El Ni˜ no para 2012-2013. http://www.vetagro.com.br/informativo le.php?idinfo=772, Consultado: 22 de enero de 2013. SMN. Servicio Meteorol´ogico Nacional, Subsecretar´ıa de Planeamiento, Ministerio de Defensa, Rep. Argentina. http://www.smn.gov.ar/, 2008 a 2013. J. S´anchez Fern´andez. Introducci´on a la Estad´ıstica Empresarial. Cap´ıtulo 4- Series Temporales. http://www.eumed.net/cursecon/libreria/2004/jsf/4.pdf, julio 2004. SNIH. Sistema Nacional de Informaci´on H´ıdrica de la Subsecretar´ıa de Recursos H´ıdricos, Secretar´ıa de Obras P´ ublicas, Ministerio de Planificacion Federal, Inversi´on P´ ublica y Servicios, Rep. Argentina. http://www.hidricosargentina.gov.ar/, 2008 a 2013. 211
M. R. Spiegel. Estad´ıstica - Serie de Compendios Schaum - Teor´ıa y Problemas. McGrawHill, Cali, Colombia, 1978. G. Tkacz and S. Hu. Forecasting GDP growth using Artificial Neural Networks. Working Paper 99-3. Bank of Canada. 1999. Tutoriales. Tutoriales Ingenieria Civil - Algunos Parametros de Forma y Dreanaje de la Cuenca Hidrogr´afica y su relaci´on con el Tiempo de Concentraci´on. http://ingenieriacivil.tutorialesaldia.com/algunos-parametros-de-forma-ydrenaje-de-la-cuenca-hidrografica-y-su-relacion-con-el-tiempo-de-concentracion/, Consultado: 19 de febrero de 2013. G. d. E. d. A. e. d. M. A. UDC. Modelizaci´on del Estuario Superior del R´ıo Oka. Reserva de la Biosfera de Urdaibai-Universidade da Coru˜ na. http://www.ingurumena.ejgv.euskadi.net/contenidos/plan programa proyecto /restauracion estuario oka/es doc/adjuntos/ANEJO4.pdf, julio 2011. UNICAN. Grupo de Emisarios Submarinos e Hidraulica Ambiental - Estudio de Recursos H´ıdricos - Anejo2. UNICAN, Santander, Espa˜ na, diciembre 2004. UNNE, N. I. Basterra, M. A. Valiente, and G. Glibota. Evaluaci´on del riesgo ambiental por inundaci´on con SIG del valle fluvial del R´ıo Paran´a pr´oximo a los n´ ucleos urbanos de Resistencia y Corrientes-Centro de Gesti´on Ambiental y Ecolog´ıa - CEGAE - Universidad Nacional del Nordeste. http://www.unne.edu.ar/, Consultado: 6 de febrero de 2010. J.
P. M. Vide. Modelos F´ısicos de R´ıos en lecho fijo y m´ovil Universidad Polit´ecnica de Catalu˜ na. http://www.imta.gob.mx/potamologia/images/docs/evento/JuanPedroMartinVide2. pdf, Consultado: 8 de febrero de 2013.
Wikipedia. Wikipedia. http://es.wikipedia.org/wiki/, 2013. F. Wyffels and B. Schrauwen. A comparative study of Reservoir Computing strategies for monthly time series prediction. Neurocomputing, march 2010. M. E. Zorrilla Pantale´on. Procesamiento Paralelo y Distribuido aplicado al Almacenamiento y Recuperaci´on de Informaci´on Documental. PhD thesis, Universidad de Cantabria, Espa˜ na, 2001.
212
´Indice de figuras 1.
Atardecer en el r´ıo Paran´a. . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.
Atardecer en el r´ıo Paran´a. . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
3.
Ubicaci´on de la Provincia de Corrientes en la Rep´ ublica Argentina. . . . . 10
4.
Imagen satelital de la regi´on mesopot´amica donde se ubica la provincia de Corrientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.
R´ıo Paran´a en la Costanera de Corrientes, Foto Izq.: con altura y caudal normal y Foto Drcha.: con altura y caudal en una gran inundaci´on. . . . . 11
1.1. Caracter´ısticas comparativas de los fen´omenos de El Ni˜ no y La Ni˜ na. . . . 18 1.2. Una cuenca de drenaje es la zona de tierra drenada por una corriente y sus afluentes. Las divisorias son los l´ımites que separan las cuencas de drenaje. Fuente: AGUSUP-21. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.3. Representaci´on esquem´atica del comportamiento hidrol´ogico de una cuenca. 22 1.4. Formas de Cuencas y Coeficiente de Compacidad asociados. . . . . . . . . 23 1.5. Mapa de la Cuenca del Plata, que comprende territorios pertenecientes a Argentina, Bolivia, Brasil y Uruguay y la totalidad del territorio de Paraguay. 24 1.6. Ubicaci´on de las Represas de Itaip´ u y de Yacyret´a, en el curso del r´ıo Paran´a. 26 1.7. Fuente: Oficina de asistencia al exterior en casos de desastres OFDA de los EE.UU./ Centro de Investigaciones sobre la epidemiolog´ıa de los desastres CRED; IFRC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.8. Valle fluvial R´ıo Paran´a aleda˜ no a Corrientes, Foto Izq.:imagen Landsat 5 TM del 04/05/1998. Altura R´ıo Paran´a en Puerto Corrientes = 8.38m. Fuente: www.conae.gov.ar. Foto Dcha.: imagen Landsat 5 TM del 02/09/2007. Altura R´ıo Paran´a en Puerto Corrientes = 2.63m. Fuente: www.inpe.br. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1. Ejemplo de Procesos Estoc´asticos: Temperaturas M´aximas y M´ınimas diarias de la ciudad de Corrientes en el a˜ no 1998. . . . . . . . . . . . . . . . . 34 2.2. Clasificaci´on de Procesos Estoc´asticos. . . . . . . . . . . . . . . . . . . . . 35 2.3. Procesos Estoc´asticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4. Ejemplo de Procesos Deterministas Ca´oticos: Comportamiento de Mercados. Fuente: [Ball, 2013]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 213
2.5. Modelo F´ısico del r´ıo Mero, (La Coru˜ na-Espa˜ na), con el objetivo de hidrodin´amica (flujo complejo) y altura de inundaci´on. Fuente: [Vide, 2013]. . . 39 2.6. Series Temporales: Gr´afica de la Evoluci´on del paro en Espa˜ na. Fuente: [S´anchez Fern´andez, 2004]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2.7. Series Temporales: Tabla de datos de la Evoluci´on del paro en Espa˜ na. Fuente: Servidor Web INE, en [S´anchez Fern´andez, 2004]. . . . . . . . . . 50 2.8. Series Temporales: Gr´afica de la Evoluci´on del paro en Espa˜ na conjuntamente con la Tendencia de la serie. Fuente: [S´anchez Fern´andez, 2004]. . . 51 2.9. Descripci´on de una neurona natural. . . . . . . . . . . . . . . . . . . . . . 54 2.10. Comparaci´on entre neurona natural y neurona artificial. . . . . . . . . . . . 55 2.11. La funci´on log´ıstica de 0 a 1. . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.12. La funci´on tangente hiperb´olica de −1 a 1. . . . . . . . . . . . . . . . . . . 56 2.13. Descripci´on de una Neurona Artificial. . . . . . . . . . . . . . . . . . . . . 57 2.14. Descripci´on de una Red Neuronal Artificial. . . . . . . . . . . . . . . . . . 58 2.15. Arquitecturas de redes neuronales artificiales. . . . . . . . . . . . . . . . . 58 2.16. Ejemplo de una red neuronal que realiza un diagnostico m´edico. . . . . . . 59 2.17. Conexiones hacia delante. . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.18. Conexiones laterales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.19. Conexiones hacia atr´as o recurrentes. . . . . . . . . . . . . . . . . . . . . . 61 2.20. Sobreajuste de Redes Neuronales. Fuente: [Guti´errez, 2013]. . . . . . . . . 63 2.21. Ilustraci´on de la regla de detenci´on temprana basada en la validaci´on cruzada. Fuente: [Fiszelew, 2013]. . . . . . . . . . . . . . . . . . . . . . . . . 64 2.22. Descripci´on de una red neuronal artificial multicapa. . . . . . . . . . . . . 69 2.23. Estructura del Perceptr´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 2.24. Capas de un Perceptr´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 2.25. Aprendizaje Hebbiano del Perceptr´on. . . . . . . . . . . . . . . . . . . . . 71 2.26. Red de Hopfield. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.27. Arquitectura de las Redes FTDNN, donde TDL son retardos asociados. . . 74 2.28. Red neuronal FTDNN: Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı. 74 2.29. Red neuronal NAR: Alturas Hidrom´etricas de Corrientes. . . . . . . . . . . 74 2.30. Red neuronal NARXIP: Serie Alturas Hidrom´etricas de Corrientes, siendo las entradas asociadas las Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2.31. Diagrama de las Redes NARX, donde TDL son retardos asociados a variables de entrada y otros asociados a la propia respuesta de la red. . . . . . . 76 2.32. Arquitectura de las Redes NARX, donde TDL son retardos asociados. . . . 76 2.33. Redes Profundas: Estructura con varias capas ocultas. . . . . . . . . . . . . 77 2.34. Redes Profundas: Autocodificador. . . . . . . . . . . . . . . . . . . . . . . 78 214
2.35. Cadena de ADN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 2.36. Descripci´on del Algoritmo Gen´etico. . . . . . . . . . . . . . . . . . . . . . . 81 2.37. Descripci´on de un Cruce en los Algoritmos Gen´eticos. . . . . . . . . . . . . 81 2.38. Detalle de Cromosona, Gen y Alelo. . . . . . . . . . . . . . . . . . . . . . . 82 2.39. Operaci´on de Cruce. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 2.40. Operaci´on de Mutaci´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 2.41. Diagrama del Algoritmo Gen´etico Simple o Can´onico. . . . . . . . . . . . . 84 3.1. Variaciones de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodo 1989-2008. . . . . . . . . . . . . . . . . . . . . . . . . 91 3.2. Comparacion de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en per´ıodos normales y de inundaciones. . . . . . . . . . . . . . 91 3.3. Comparaci´on de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en los per´ıodos de picos de inundaci´on. . . . . . . . . . . . . . . 92 3.4. Representaci´on esquem´atica de las fases de aguas altas y bajas en el r´ıo Paran´a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.5. Variaciones hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes desde enero de 1998 hasta enero de 2006, [Neiff, 1999]. . . . . . . . . . . . . . . 94 3.6. Representaci´on esquem´atica de un Pulso de Inundaci´on del r´ıo Paran´a, [Neiff, 1999]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 3.7. Alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodo 1989-2008 y l´ınea de tendencia aproximada por medias m´oviles de orden 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.8. Alturas hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes en el per´ıodo de Inundaci´on de 1991-1992 y l´ınea de tendencia aproximada por medias m´oviles de orden 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 3.9. Alturas hidrom´etricas del r´ıo Paran´a en el Puerto de Corrientes en el per´ıodo de Inundaci´on de 1991-1992 y l´ınea de tendencia aproximada por medias m´oviles de orden 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.10. Recurrencia de Inundaciones seg´ un Alturas Hidrom´etricas M´aximas. . . . . 97 3.11. Histograma mensual de alturas hidrom´etricas del r´ıo Paran´a en a localidad de Corrientes en el per´ıodos de 1989 a 2008. . . . . . . . . . . . . . . . . . 98 3.12. Histograma anual de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodos de 1989 a 2008. . . . . . . . . . . . . . . . . . 99 3.13. Frecuencias de alturas hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes en el per´ıodos de 1989 a 2008. . . . . . . . . . . . . . . . . . . . . 100 3.14. Alturas y Cuadales de per´ıodos de Inundaciones en la localidad de Corrientes.100 3.15. Cuadro Comparativo de Estad´ısticos de las Alturas Hidrom´etricas del r´ıo Paran´a en la localidad de Corrientes. . . . . . . . . . . . . . . . . . . . . . 101 215
4.1. FreeFore: Datos Meteorol´ogicos y Alturas Hidromm´etricas del r´ıo en la localidad de Corrientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.2. FreeFore: Errores del modelo generado, al pronosticar la Altura del r´ıo en Corrientes con 7 d´ıas de antelaci´on. . . . . . . . . . . . . . . . . . . . . . . 108 4.3. Herramienta de Identificaci´on de Sistemas de Matlab-Datos Meteorol´ogicos y Altura Hidrom´etricas del r´ıo en la localidad de Corrientes y el modelo Autorregresi´on seleccionado, que ser´a aplicado. . . . . . . . . . . . . . . . . 109 4.4. Errores de predicci´on de Altura del R´ıo: Gr´afico Izq.: a 3 d´ıas y Gr´afico Dcho.: a 5 d´ıas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.5. FreeFore: Datos de Alturas y Cuadales en las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes. . . . . . . . . . . . . . . . . . . . . . . . . . . 112 4.6. FreeFore: Errores del modelo generado, al pronosticar la Altura del r´ıo en Corrientes con 7 d´ıas de antelaci´on. . . . . . . . . . . . . . . . . . . . . . . 112 4.7. Herramienta de Identificaci´on de Sistemas de Matlab-Datos de Alturas y Cuadales en las estaciones de Puerto Iguaz´ u, Posadas, Itat´ı y Corrientes. . 114 4.8. Errores de predicci´on de Altura del R´ıo: Gr´afico Izq.: a 3 d´ıas y Gr´afico Dcho.: a 5 d´ıas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 5.1. Matlab-NNTool: Ventana de NNTool, con la RN y los datos usados en la generaci´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 5.2. Matlab-NNTool: Ventana de Creaci´on de la red neuronal, donde se indican datos y se configuran las funciones y la estructura de la red neuronal. . . . 119 5.3. Matlab-NNTool: Estructura de a Red Neuronal. . . . . . . . . . . . . . . . 120 5.4. Matlab-NNTool: Entrenamiento de la Red Neuronal, indicando los archivos de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 5.5. Matlab-NNTool: gr´aficas con los resultados del entrenamiento de la RN, funci´on de entrenamiento Trainbr. . . . . . . . . . . . . . . . . . . . . . . . 121 5.6. Resultados y errores al realizar pron´ostico a 3 d´ıas de Altura del r´ıo en Corrientes, con RNH643, entrenada con datos de Alturas Hidrom´etricas y RNHQ643, entrenada con datos de Alturas y Caudales del r´ıo. . . . . . . . 122 5.7. Tabla comparativa de la penalizaci´on de Errores con la Funci´on Cuadr´atica y la Funci´on de Penalizaci´on Propuesta. . . . . . . . . . . . . . . . . . . . 125 5.8. Gr´afico de la funci´on de Penalizaci´on, que penaliza los errrores cuando mayor es la altura del r´ıo. . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 5.9. Gr´afico de la funci´on Cuadr´atica. . . . . . . . . . . . . . . . . . . . . . . . 126 5.10. Errores obtenidos al implementar la RN con la Funci´on de Penalizaci´on propuesta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.11. Archivo con datos combinados de 2 per´ıodos de inundaciones. . . . . . . . 129 5.12. Errores obtenidos al implementar la RN con la Funci´on de Penalizaci´on propuesta y entrenada con Archivos Combinados. . . . . . . . . . . . . . . 130 5.13. Errores Comparativos de Predicci´on a 3 d´ıas en per´ıodos de Inundaci´on. . . 131 216
6.1. Matlab - Herramienta de Redes Neuronales - NNStart. . . . . . . . . . . . 135 6.2. Matlab - Herramienta de Redes Neuronales - NNStart. . . . . . . . . . . . 135 6.3. Matlab-NNStart-NAR: Izq.:Ingreso archivo de datos de alturas de la Ciudad de Corrientes. Dcha.: Selecci´on de porcentaje de datos de Entremiento, Testeo y Validaci´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 6.4. Matlab-NNStart-NAR: Izq.: Determinaci´on de las neuronas de la capa oculta y el retardo a considerar. Dcha.: Opciones de Entrenamiento y resultados obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 6.5. Red neuronal NAR: Visualizaci´on del Entrenamiento y Resultados. . . . . 138 6.6. Red neuronal NAR: Rendimiento del Entrenamiento. . . . . . . . . . . . . 139 6.7. Red neuronal NAR: Histograma de Errores de Entrenamiento. . . . . . . . 139 6.8. Red neuronal NAR: Gr´aficos de Regresi´on. . . . . . . . . . . . . . . . . . . 140 6.9. Red neuronal NAR: Gr´aficos de Resultados y Errores por tiempo de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 6.10. Red neuronal NAR: Autocorrelaci´on de Error. . . . . . . . . . . . . . . . . 141 6.11. Red neuronal NARPIR: Errores de Predicci´on a 7 d´ıas. . . . . . . . . . . . 143 6.12. Red neuronal NARSIR: Errores de Predicci´on a 7 d´ıas. . . . . . . . . . . . 144 6.13. Red neuronal NARIR: Error de Predicci´on a 7 d´ıas . . . . . . . . . . . . . 149 6.14. Errores de predicci´on comparados entre redes de estructura NAR. . . . . . 150 6.15. Resultados de predicci´on con NARIR. . . . . . . . . . . . . . . . . . . . . . 150 6.16. Matlab-NNStart-NARX:: Izq.:Ingreso archivo de datos de alturas de la Ciudad de Corrientes. Dcha.: Selecci´on de porcentaje de datos de Entremiento, Testeo y Validaci´on. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 6.17. Matlab-NNStart: Izq.: Determinaci´on de las neuronas de la capa oculta y el retardo a considerar. Dcha.: Opciones de Entrenamiento y resultados obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 6.18. Red neuronal NARX: Visualizaci´on del Entrenamiento y los Resultados. . . 152 6.19. Red neuronal NARX: Rendimiento del Entrenamiento. . . . . . . . . . . . 153 6.20. Red neuronal NARX: Histograma de los Errores de Entrenamiento. . . . . 153 6.21. Red neuronal NARX: Gr´aficos de Regresi´on. . . . . . . . . . . . . . . . . . 154 6.22. Red neuronal NARX: Gr´aficos de Resultados y Errores por tiempo de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 6.23. Red neuronal NARX: Error de Autoregersi´on. . . . . . . . . . . . . . . . . 155 6.24. Red neuronal NARXPIR: Error de Predicci´on a 7 d´ıas. . . . . . . . . . . . 162 6.25. Red neuronal NARXSIR: Error de Predicci´on a 7 d´ıas. . . . . . . . . . . . 163 6.26. Red neuronal NARXIR: Error de Predicci´on a 7 d´ıas . . . . . . . . . . . . 164 6.27. Errores de Predicci´on comparados entre redes de estructura NARX. . . . . 165 6.28. Resultados de predicci´on con la red NARXIR. . . . . . . . . . . . . . . . . 165 217
6.29. Red neuronal NARXMultiCtes: Evoluci´on del Entrenamiento y Resultados. 166 6.30. Red neuronal NARXMultiCtes: Rendimiento del Entrenamiento. . . . . . . 167 6.31. Red neuronal NARXMultiCtes: Histograma de los Errores de Entrenamiento.167 6.32. Red neuronal NARXMultiCtes: Gr´aficos de Regresi´on. . . . . . . . . . . . 168 6.33. Red neuronal NARXMultiCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.34. Red neuronal NARXMultiCtes: Autocorrelaci´on de Error.
. . . . . . . . . 170
6.35. Red neuronal NARXMultiCtes: Error de Predicci´on a 7 d´ıas . . . . . . . . 171 6.36. Red neuronal NARXMultiCtes: Resultados de Predicci´on. . . . . . . . . . 172 6.37. Red neuronal FTDNN: Alturas Hidrom´etricas Pto. Iaguaz´ u, Posadas e Itat´ı.173 6.38. Red neuronal FTDNN: Resultados del Entrenamiento. . . . . . . . . . . . 174 6.39. Red neuronal NAR: Alturas Hidrom´etricas de Corrientes. . . . . . . . . . . 175 6.40. Red neuronal NAR: Resultados del Entrenamiento. . . . . . . . . . . . . . 176 6.41. Red neuronal NARX Multicapa: Red cuyas entradas son las salidas de las redes NRTOtEst y NARCtes, estructura y resultados de la primer etapa de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 6.42. Red neuronal FtdnnNarNarxMCtes: Red cuyas entradas son las salidas de las redes NRTOtEst y NARCtes, detalle de la estructura con lazo de retroalimentaci´on cerrado y los resultados de la segunda etapa de entrenamiento.180 6.43. Red neuronal FtdnnNarNarxMCtes: Rendimiento del Entrenamiento. . . . 181 6.44. Red neuronal FtdnnNarNarxMCtes: Histograma de los Errores de Entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.45. Red neuronal FtdnnNarNarxMCtes: Gr´aficos de Regresi´on. . . . . . . . . . 182 6.46. Red neuronal FtdnnNarNarxMCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 6.47. Red neuronal FtdnnNarNarxMCtes: Autocorrelaci´on de Error. . . . . . . . 183 6.48. Red neuronal FtdnnNarNarxMCtes: Error de Predicci´on a 7 d´ıas . . . . . . 184 6.49. Red neuronal FtdnnNarNarxMCtes: Resultados de Predicci´on. . . . . . . . 185 6.50. Red neuronal NlpNarxMCtes: Red resultante de la integraci´on de una red NLP y tres redes NARX Multicapa, visualizaci´on de estructura final y resultados del entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . 194 6.51. Red neuronal NlpNarxMCtes: Rendimiento del Entrenamiento. . . . . . . . 195 6.52. Red neuronal NlpNarxMCtes: Histograma de los Errores de Entrenamiento. 195 6.53. Red neuronal NlpNarxMCtes: Gr´aficos de Regresi´on. . . . . . . . . . . . . 196 6.54. Red neuronal NlpNarxMCtes: Gr´aficos de Resultados y Errores por tiempo de entrenamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 6.55. Red neuronal NlpNarxMCtes: Autocorrelaci´on de Error. . . . . . . . . . . 198 6.56. Red neuronal NlpNarxMCtes: Error de Predicci´on a 7 d´ıas . . . . . . . . . 199 218
6.57. Red neuronal NlpNarxMCtes: Resultados de Predicci´on. . . . . . . . . . . 200 6.58. Errores Comparativos de Predicci´on a 7 d´ıas con diferentes Redes Neuronales200 7.1. Pulso: alturas hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7.2. Pulso: alturas hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 7.3. Pulsos detectados en el per´ıodo de a˜ nos de 1989 a 2009. . . . . . . . . . . . 204 7.4. Pulso - Prisma: Alturas Hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 7.5. Pulso: Alturas Hidrom´etricas de la localidad de Corrientes, per´ıodo de 1989 a 2009. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 7.6. Comparaci´on de Errores de Predici´on.
219
. . . . . . . . . . . . . . . . . . . . 206
220
´Indice alfab´ etico algoritmos evolutivos, 33, 80 algoritmos gen´eticos, 33, 65, 80, 81, 201, 202 altura hidrom´etrica media, 111 alturas hidrom´etricas, 31, 74, 86–88, 90, 95– 98, 105, 117, 133, 135, 136, 140, 141, 145–147, 154, 156–158, 160, 169, 170, 173, 185, 186, 188, 201–203, 207, 208 media, 111 aprendizaje, 133, 145, 156, 185, 186 aproximaci´on, 44, 65, 66, 68, 75 arquitecturas de red, 69, 185 aspectos hidrol´ogicos, 15
FreeFore, 106, 108, 109 funci´on de activaci´on, 55, 57, 61 funci´on de penalizaci´on, 117, 124, 126, 127, 130, 131, 207 inundaciones, 7, 9, 11, 12, 15, 17, 19, 26–30, 38, 39, 44, 52, 86, 87, 89, 90, 92, 93, 95, 96, 98–100, 111, 119, 129–131, 140, 145, 147, 154, 156, 157, 159, 160, 170, 186, 188, 201, 203, 207, 208
Matlab, 114, 115, 121, 122, 124, 125, 133, 134 GUI, 106 capas, 21 NNStart, 134, 136, 147, 159 caudal NNTool, 117, 128 medio, 111 meteorol´ogicas, 17, 19, 30, 106–111, 207 caudales, 9, 20, 21, 30, 40, 42, 43, 98, 99, modelos, 31, 33, 38, 39, 43–48, 52–55, 61, 105, 111, 113–116, 120, 121, 128 62, 67, 68, 73, 76, 85, 106, 109, 111, cuenca, 15, 19–25, 27, 33, 42, 43, 46, 47, 52, 114, 133, 201, 202 98, 99, 208 hidrol´ogicos, 12 del Paran´a, 23, 24, 28 ARIMA, 53 del Plata, 15, 20, 23, 24 f´ısicos, 33 hidrogr´afica, 15, 20, 21, 23 Hidrol´ogicos, 7 hidrol´ogicos, 17, 33, 43, 46, 122, 207 distribuci´on, 33, 34, 42–44, 53, 87–90, 201 redes neuronales, 133 series temporales, 31, 61, 105 entrenamiento, 60–64, 67, 68, 71, 72, 75, 118, 119, 122, 123, 126, 127, 129, 136, predicci´on, 15–19, 27, 29, 31, 36, 49, 73, 147, 148, 160 75, 105, 111, 117, 121, 131, 133–135, error, 53, 60–68, 71, 73, 78, 108, 110, 113, 147, 149, 150, 159, 164, 165, 169, 115–121, 123, 124, 130, 131, 136, 137, 170, 172, 184, 185, 197, 201, 202, 141, 142, 146–148, 156, 207, 208 207, 208 por defecto, 142, 146, 156, 159, 169, 182, corto plazo, 17, 31, 117, 197, 202, 207, 197, 198 208 por exceso, 142, 146, 156, 159, 169, 182, mediano plazo, 12, 18, 31, 131, 133, 202, 197, 198, 202 208 promedio, 130, 131, 142, 146, 147, 156, resultados, 31 159, 169, 182, 197, 198 predicciones estad´ısticos, 18, 86–90, 99 meteorol´ogicas, 15 estructuras, 28, 33, 44, 106, 117, 208 Prisma, 201, 202 frecuencia, 52, 79, 92, 93, 96–98 Procesos Deterministas Ca´oticos, 33, 37 221
Procesos Estoc´asticos, 33–35, 53 Pulso, 202 Pulso 2, 201, 202 r´ıo Paran´a, 7, 9, 11, 12, 15, 25, 28–31, 52, 73, 85–90, 93, 96, 98–100, 105, 106, 117, 122, 125, 128, 129, 131, 133, 134, 140, 141, 154, 156, 201, 207, 208 recurrencia, 28, 40, 85, 93, 96, 99 redes neuronales, 7, 31, 33, 54, 55, 58–61, 64, 65, 72, 76–78, 117–119, 121–124, 126, 131, 133–135, 147, 169, 170, 185, 197, 202, 207, 208 autocodificadores, 77, 78, 182, 185, 186, 188 capas, 58, 59, 61, 69, 75–78, 117, 121– 123, 159, 175, 185, 186, 188, 191 din´amicas, 33, 72, 135 est´aticas, 33, 68 FTDNN, 33, 75, 133, 169, 170, 197 modificadas, 7 NAR, 33, 73–75, 133–135, 140, 146, 147 NARX, 33, 75, 133, 147, 156, 158, 159 NARX Multicapa, 133, 160, 170, 175, 185, 186, 188, 191, 197, 198 neurona, 54, 55 NLP, 133, 185, 186, 198 perceptr´on, 16, 33, 58, 63, 67, 69, 71, 122 profundas, 76–78, 182 series temporales, 7, 31, 33, 48–50, 53, 61, 73, 105, 125, 134, 136, 147, 154, 207 Sistemas Inteligentes, 7, 12, 17, 207 tendencia, 49–52, 62, 85, 93–95, 202 testeo, 85, 129, 133, 136, 146, 147, 158, 160, 188 validaci´on, 29, 31, 63, 64, 85, 107, 109, 111, 114, 127, 129, 136, 146, 147, 158, 160
222
View more...
Comments