CAPITULO DE INGENIERÍA CIVIL – COLEGIO DE INGENIEROS CIVILES DE PERÚ CONSEJO DEPARTAMENTAL CAJAMARCA XVIII CONGRESO NACIONAL DE INGENIERÍA CIVIL CONIC 2011
ESTIMACIÓN DE CAUDALES DE DISEÑO CON LA DISTRIBUCIÓN DE DOBLE GUMBEL
M.Sc. Ing. Clara Marina Farías Zegada de Reyes, Ing. Claudia Palacios Santa Cruz Instituto de Hidráulica, Hidrología e Ingeniería Sanitaria de la Universidad de Piura, Av. Ramón Mugica 131, Urb. San Eduardo, Piura, Perú,
[email protected],
[email protected], 73-284520
CAJAMARCA - PERÚ
RESUMEN: Para determinar los caudales de diseño la modelación probabilística juega un papel importante, la elección de la distribución más adecuada es difícil ante diversas opciones disponibles. Durante años se han usado distribuciones probabilísticas de una sola población: Log-Normal, Gamma, Gumbel, Pearson, etc. Sin embargo, en México, donde se tiene presencia de crecidas debidas a dos mecanismos generadores: crecidas normales y las debidas a huracanes, éstas se modelan bajo la distribución Doble Gumbel, ajustando a cada grupo un modelo Gumbel individual. En Piura, ubicada en el noroeste peruano, las lluvias se presentan generalmente en el verano y son de poca intensidad, trayendo consigo un aumento no muy significativo del caudal del río Piura. Sin embargo, existen también años en que son originadas por el mundialmente conocido Fenómeno El Niño (FEN), las cuales significan un aumento excepcional en los caudales del río. Ya que la ocurrencia de lluvia y caudales en la región están regidos por dos mecanismos diferentes, como es el caso mexicano, se han estimado los caudales de diseño con mayor precisión utilizando la distribución Doble Gumbel y se ha comprobado que dicho modelo ajusta mejor a esta serie que los clásicos de una sola población. PALABRAS CLAVES: Caudal, probabilidades, Doble Gumbel
INDICE DE MATERIAS INTRODUCIÓN: ............................................................................................................................... 4 1
MARCO TEÓRICO: .................................................................................................................. 4 1.1
Distribución de Gumbel ..................................................................................................... 4
1.2
Distribución Doble Gumbel ............................................................................................... 6
1.2.1
Función de distribución Doble Gumbel ..................................................................... 6
1.2.2
Ajuste de parámetros .................................................................................................. 6
1.2.3
Bondad de ajuste ........................................................................................................ 7
1.2.4
Estimaciones con la distribución Doble Gumbel ....................................................... 7
2
ANÁLISIS DE LOS CAUDALES DEL RIO PIURA ............................................................... 8
3
RESULTADOS Y CONCLUSIONES ....................................................................................... 9
BIBLIOGRAFÍA.............................................................................................................................. 10
INTRODUCIÓN: La Hidrología aplicada a la Ingeniería Civil busca resolver principalmente dos interrogantes: de cuánta agua dispongo y de cuánta agua debo proteger a mi infraestructura. Para ello dispone de muestras de caudales y precipitaciones puntuales o regionales que analiza para llegar a las mejores estimaciones de valores de diseño. En este contexto, la modelación probabilística juega un papel importante, siendo que la elección de la distribución de probabilidad más adecuada es difícil ante las diversas opciones que se presentan.Durante muchos años las distribuciones probabilísticas que modelan una sola población han sido las más utilizadas, tales como Log-Normal, Gamma, Gumbel, Pearson, etc. Sin embargo, en regiones de México, donde se tiene presencia de crecidas debidas a dos tipos de mecanismos generadores, las crecidas normales y las debidas a huracanes, éstas se modelan bajo la distribución de Doble Gumbel y a cada grupo se le ajusta un modelo Gumbel propio. En la ciudad de Piura, ubicada en el noroeste peruano, las lluvias se presentan generalmente en el verano. Durante este periodo de tiempo hay lluvias de poca intensidad, las cuales traen consigo un aumento del caudal del río Piura, pero no muy significativo. Sin embargo, existen también años en que las lluvias son originadas por el Fenómeno El Niño (FEN), las cuales sí significan un aumento excepcional en los caudales del río del mismo nombre (Reyes, 2003). El FEN es un evento climático cíclico y de carácter mundial, que se manifiesta en la región Piura con fuertes precipitaciones debido a su situación geo-climática caracterizada por la presencia de la cordillera de los Andes relativamente baja en esta zona, que permite la presencia de nubes calientes amazónicas, mar caliente durante la primavera y el verano, mar frío durante el invierno-otoño. A este escenario se le asocia con lluvias de gran intensidad y destrucción de bienes e infraestructura. Ya que la ocurrencia de lluvia y caudales en la región Piura están regidos por dos mecanismos diferentes, como es el caso mexicano, se plantea estimar el caudal de diseño con mayor precisión utilizando la distribución Doble Gumbel.
1
MARCO TEÓRICO:
1.1
Distribución de Gumbel La distribución de valores extremos tipo I o de Gumbel busca representar la distribución de una variable aleatoria definida como la mayor de una serie de n variables aleatorias independientes e idénticamente distribuidas con una distribución de tipo exponencial a medida que n crece indefinidamente. La función de distribución acumulada o probabilidad de no excedencia de Gumbel viene dada mediante la expresión siguiente:
F ( x) e
e
x
............................................................................................................... (1)
Donde: x : Evento hidrológico a considerar, viene de los datos muestrales : Parámetro de posición de la función : Parámetro de escala de la función
Estos parámetros se pueden estimar conociendo que la media y la desviación estándar de la función son respectivamente: . ...................................................................................................................... (2)
6 ......................................................................................................................... (3)
Siendo la constante de Euler-Mascheroni ( ≈ 0.577216). De modo que si se tuviera una muestra de tamaño infinito se podrían estimar los parámetros de la función, α y β, a través de los estadígrafos de la muestra, con las siguientes expresiones: 6 sx ......................................................................................................................... (4)
x . ....................................................................................................................... (5) Donde x y son la media y la desviación estándar muestrales, respectivamente. Sin embargo, en la práctica se trabaja con muestras de tamaño finito, por tanto el valor de los parámetros debe modificarse. Gumbel obtuvo valores modificados minimizando la suma de cuadrados de los errores perpendiculares a la recta de ajuste de valores extremos. Las ecuaciones que obtuvo están en función del tamaño de la muestra y de los parámetros y son las siguientes (Varas y Bois, 1998): s x .............................................................................................................................. (6) sn
x yn . ...................................................................................................................... (7) Donde: : Valor esperado de la variable reducida ym : Desviación estándar de la variable reducida ym Estos estadígrafos pueden obtenerse de la variable reducida ordenando la muestra de manera decreciente y calculando para cada xi la correspondiente variable reducida ym con la siguiente expresión de Weibull: n 1 m ym ln ln n 1 ............................................................................................... (8) Donde: : Tamaño de la muestra : Número de orden Suele ser útil trabajar con tablas que entreguen el valor de yn y sn directamente en función del tamaño de la muestra n, ya que éstos no dependen de los valores xi de la muestra (Tabla 1 y Tabla 2). Tabla 1 - Valor esperado, yn, de la variable reducida, ym n 10 20
0 0,4952 0,5230
1 0,4996 0,5252
2 0,5035 0,5268
3 0,5070 0,5283
4 0,5100 0,5296
5 0,5128 0,5309
6 0,5157 0,5320
7 0,5181 0,5332
8 0,5202 0,5343
9 0,5220 0,5353
30 40 50 60 70 80 90 100
0,5362 0,5436 0,5485 0,5521 0,5548 0,5569 0,5586 0,5600
0,5371 0,5442 0,5489 0,5524 0,5550 0,5570 0,5587
0,5380 0,5448 0,5493 0,5527 0,5552 0,5572 0,5589
0,5388 0,5453 0,5497 0,5530 0,5555 0,5574 0,5591
0,5396 0,5458 0,5501 0,5533 0,5557 0,5576 0,5592
0,5402 0,5463 0,5504 0,5535 0,5559 0,5578 0,5593
0,5410 0,5468 0,5508 0,5538 0,5561 0,5580 0,5595
0,5418 0,5473 0,5511 0,5540 0,5563 0,5581 0,5596
0,5424 0,5477 0,5515 0,5543 0,5565 0,5583 0,5598
0,5430 0,5481 0,5518 0,5545 0,5567 0,5585 0,5599
8 1,0493 1,1047 1,1363 1,1574 1,1721 1,1834 1,1923 1,1994 1,2055
9 1,0565 1,1086 1,3880 1,1590 1,1734 1,1844 1,1930 1,2001 1,2060
Tabla 2- Desviación estándar, sn, de la variable reducida, ym n 10 20 30 40 50 60 70 80 90 100
1.2
0 0,9496 1,0628 1,1124 1,1413 1,1607 1,1747 1,1854 1,1938 1,2007 1,2065
1 0,9676 1,0696 1,1159 1,1430 1,1623 1,1759 1,1863 1,1945 1,2013
2 0,9833 1,0754 1,1193 1,1458 1,1638 1,1770 1,1873 1,1953 1,2020
3 0,9971 1,0811 1,2260 1,1480 1,1658 1,1782 1,1881 1,1959 1,2026
4 1,0095 1,0864 1,1255 1,1499 1,1667 1,1793 1,1890 1,1967 1,2032
5 1,0206 1,0915 1,1285 1,1519 1,1681 1,1803 1,1898 1,1973 1,2038
6 1,0316 1,0961 1,1313 1,1538 1,1696 1,1814 1,1906 1,1980 1,2044
7 1,0411 1,1004 1,1339 1,1557 1,1708 1,1824 1,1915 1,1987 1,2049
Distribución Doble Gumbel
Mientras que la función de distribución de Gumbel está pensada para una población, la distribución de Doble Gumbel permite modelar el comportamiento de dos poblaciones consideradas mutuamente excluyentes. Una función de distribución de probabilidad para dos poblaciones se puede plantear como sigue (Raynal y Raynal, 2004): ( )
(
) (
)
(
) ............................................................................ (9)
Donde: : Probabilidad de que la variable x pertenezca a la segunda población, que agrupa a elementos sucedidos en condiciones climatológicas ordinarias. 1.2.1 Función de distribución Doble Gumbel Con base en la ecuación (9), la probabilidad de excedencia de Gumbel de dos poblaciones se expresa mediante la ecuación siguiente: (
( )
(
)
)
(
)
.................................................................... (10)
Esta función de distribución cuenta con cinco parámetros, dos de cada población: 1 , 1 , 2 , 2 , mientras el quinto es la proporción de mezcla, p. 1.2.2 Ajuste de parámetros El ajuste más adecuado se realiza mediante un proceso de iteración hasta llegar a un juego de parámetros apropiados a la muestra disponible.
Se inicia con el análisis de la muestra de máximos anuales disponible para identificar aquellos años que se alejan de la “normalidad”, es decir que son muy diferentes al resto, que exceden cierto umbral y que por información histórica se conoce además que tuvieron presencia del fenómeno diferente, tal como FEN, huracán, etc. Con esa clasificación, la muestra de nt años quedará dividida en dos grupos, el primero de n1 años extraordinarios y el segundo de n2 años ordinarios o normales, definiendo preliminarmente el parámetro p como: n2 p ..................................................................................................................... (11) n1 n2 A continuación se trabaja por separado con los dos grupos definidos, ajustando los parámetros Gumbel de una sola población con las ecuaciones (6), (7) y (8) y las Tablas 1 y 2. Esto permitirá contar con los cuatros parámetros restantes. 1.2.3 Bondad de ajuste El ajuste realizado según el acápite anterior deberá ser evaluado mediante una prueba de bondad de ajuste. Estas pruebas evalúan el grado de concordancia entre la distribución de un conjunto de valores de la muestra y alguna distribución teórica específica. Determina si razonablemente puede pensarse que las mediciones muestrales analizadas provienen de una población que tiene dicha distribución teórica, mediante la comparación de las distribuciones de frecuencia acumulativa, teórica y observada. De uso frecuente son la prueba 2, la de Kolmogorov-Smirnov y la del error cuadrático estándar. La primera trabaja con valores agrupados, por lo que no es muy práctica; la segunda no requiere agrupar valores, se concentra en determinar el punto en el que estas dos distribuciones muestran la mayor divergencia, pero no evalúa las diferencias en su conjunto; mientras que la tercera es una mezcla de ambas pruebas, trabajando con los datos independientes y sumando las divergencias parciales entre las probabilidades de excedencia o distribuciones de frecuencias, teórica, Pteo, y empírica, Pemp. Para esta prueba de error cuadrático estándar se aplica la siguiente fórmula: ∑
(
√
)
(12)
Donde: : Número de parámetros de la distribución teórica, que en el caso de Doble Gumbel es 5. A continuación se deberá repetir el análisis anterior para diferentes valores del parámetro p, mayores y menores que el preliminar, con la finalidad de determinar aquél que arroja el mínimo error, E, y el conjunto definitivo de parámetros. 1.2.4 Estimaciones con la distribución Doble Gumbel Contando con la función de Doble Gumbel ajustada a la serie, se pueden hacer estimaciones de caudales máximos para diferentes períodos de retorno utilizando la expresión (10) y sabiendo que la probabilidad de no excedencia, F(x), y el período de retorno, Tr, están relacionados por la siguiente expresión: ( ) (13)
2
ANÁLISIS DE LOS CAUDALES DEL RIO PIURA
Se cuenta con los registros de los caudales máximos anuales del río Piura desde el año 1925 al 2008, conformando una muestra de 84 datos. Dentro de este periodo se han presentado lluvias debidas a los dos mecanismos descritos anteriormente: lluvias normales y lluvias por FEN, las cuales originan un crecimiento diferente del caudal en el río Piura. Por ello se han considerado dos poblaciones, la primera para los caudales durante el FEN y la segunda para los caudales durante las lluvias regulares, cada una con un número diferente de datos. El cálculo se inició con un p preliminar de 0,70, probando además con valores desde 0,88 hasta 0,50, obteniéndose el mejor valor del error E para p = 0,55 (Tabla 3); esto significa que, dada la muestra de 84 años utilizada, lo más probable es que ésta provenga de un universo con el 45% de los años dominados por eventos lluviosos asociados al FEN, mientras que el 55% de los años corresponde a años normales con características secas. Tabla 3 – Errores estándar E obtenidos para diferentes valores de p en los caudales del río Piura
p 0,88 0,80 0,74 0,70 0,60 0,55 0,52 0,50 E 0,423 0,225 0,172 0,158 0,131 0,113 0,124 0,145 Este ajuste corresponde a los siguientes parámetros: α1=988,8, β1=821,0; α2=63,7, β2=92,7; y p=0,55. Luego de ajustar la distribución, ésta se aplicó de forma inversa para estimar los caudales de diseño para diferentes periodos de retorno, según se describió en 1.2.4. Asimismo se ajustaron modelos de uso frecuente en Hidrología para una sola población, tales como Gamma, Exponencial, Gumbel, Log Normal 3, Pearson III, Log Pearson III, y se realizaron las pruebas de bondad de ajuste, obteniéndose con ellos errores mayores que con la distribución de Doble Gumbel (Tabla 4). Tabla 4 – Estimaciones de crecidas con diferentes modelos usados en Hidrología Tr Doble Gumbel 2 230 5 1.431 10 2.128 20 2.750 25 2.943 50 3.531 100 4.109 1.000 6.008 10.000 7.899 Error 0,222
LP III 353 1.188 1.830 2.394 2.555 2.986 3.321 3.905 4.044 0,288
Gamma 378 1.173 1.844 2.546 2.777 3.503 4.242 6.751 9.310 0,356
LN3 290 1.011 1.911 3.221 3.748 5.783 8.536 25.376 62.158 0,379
Exponencial Pearson III 432 474 1.267 1.306 1.899 1.903 2.531 2.492 2.734 2.681 3.366 3.268 3.998 3.857 6.096 5.836 8.195 7.867 0,513 0,608
Gumbel 566 1.429 2.001 2.549 2.723 3.259 3.791 5.548 7.302 0,749
3
RESULTADOS Y CONCLUSIONES
3.1.Análisis de Resutados Al aplicar a los datos las distribuciones clásicas de una sola población de mayor difusión para estimar los caudales de diseño, se obtuvo un error cuadrático estándar de 0,222 para Doble Gumbel y 0,288 para Log-Pearson III, como el mejor ajuste de las distribuciones de una sola población. Como se puede apreciar, si se utiliza el mejor ajuste a una sola población, el modelo de Log Pearson III daría estimaciones muy bajas afectando la seguridad de las obras. Si por el contrario se hubiera tomado directamente la clásica distribución Log-Normal 3, como aquella que casi siempre se logra ajustar las muestras hidrológicas, se tendrían valores de caudales mucho mayores que los hallados con la distribución Doble Gumbel y que los observados. Esto lleva a que al momento que se diseñen las estructuras se sobredimensionen, ya que en realidad estos caudales están muy por encima de lo que se espera. Este sobredimensionamiento genera una mayor inversión y en algunos casos impide la ejecución de proyectos por falta de presupuesto suficiente. Para tiempos de retorno mayores, como 10.000 años, se aprecia que la distribución Doble Gumbel también dará mejores resultados (Fig.1 y 2), por el lado de mayor seguridad para el diseño de obras de envergadura como aliviaderos de presas. 70,000 60,000
Caudal (m3/s)
50,000 40,000 LN3 DbGumb
30,000
LP III Empírica
20,000 10,000 1
10
100
1,000
10,000
Tr (años)
Figura 1 – Caudales estimados hasta 10.000 años con LN3, LPIII y Doble Gumbel 10,000 9,000 8,000
Caudal (m3/s)
7,000 6,000 LN3
5,000
DbGumb 4,000
LP III
3,000
Empírica
2,000 1,000 1
10
100
Tr (años)
Figura 2 – Detalle de caudales estimados hasta 100 años con LN3, LPIII y Doble Gumbel
3.2.Conclusiones Tradicionalmente la Hidrología Probabilística ha manejado la estimación de caudales de diseño bajo el enfoque de una sola población, con modelos de mucha difusión y aceptación, tales como Log Pearson III, Log Normal 2 y 3, etc. Existen regiones geográficas que por su naturaleza ven configurada su Hidrología por dos mecanismos de formación, tal es el caso de regiones donde se presentan huracanes y aquellas afectadas por el Fenómeno El Niño. El modelo Doble Gumbel permite manejar las muestras hidrometeorológicas dividiéndolas en dos grupos y modelar adecuadamente los caudales, evitando sobre estimar o subestimar los valores de diseño, lo que incide en la realización y en la economía de las obras proyectadas. Los caudales máximos anuales del río Piura, en la costa norte del Perú, se han logrado modelar probabilísticamente mediante Doble Gumbel, que se ajusta más que los modelos de una sola población. El modelo ajustado indica una presencia de años atípicos del 55% debida al FEN en la cuenca del río Piura.
BIBLIOGRAFÍA Raynal, J.A.; Raynal, M.E. (2004). “Cálculo de los límites de confianza de la Distribución de Probabilidad de valores extremos tipo I para dos poblaciones” Información tecnológica La Serena V.15 n°.1, pp. 87 – 94. Disponible en . accedido en 17 jun. 2011. doi: 10.4067/S071807642004000100014. Reyes, J. (2003). “Perú”, en Inundaçoes urbanas na América do Sul. Org. por Tucci, E. M.; Bertoni, J.C. Ed. Associaçao Brasileira de Recursos Hidricos, Porto Alegre, pp. 379 428. Varas, E. ; Bois, P. (1998). Hidrología Probabilística. Ediciones Universidad Católica de Chile, 156 p.