Metodos Numericos Chapra 5 Edicion
January 22, 2017 | Author: Mario Cruz | Category: N/A
Short Description
Download Metodos Numericos Chapra 5 Edicion...
Description
CAPÍTULO 12 Aplicaciones en la ingeniería: ecuaciones algebraicas lineales El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 9,10 y 11 para resolver sistemas de ecuaciones algebraicas lineales, en algunas aplicaciones de la ingeniería. Estas técnicas numéricas sistemáticas tienen significado práctico, ya que los ingenieros se enfrentan con mucha frecuencia a problemas que involucran sistemas de ecuaciones que son demasiado grandes para resolverse a mano. Los algoritmos numéricos en estas aplicaciones son de particular conveniencia para implementarse en computadoras personales. En la sección 12.1 se muestra cómo un balance de masa se puede emplear para modelar un sistema de reactores. En la sección 12.2 se le da especial énfasis al uso de la matriz inversa para determinar las interacciones complejas causa-efecto entre las fuerzas en los miembros de una estructura. La sección 12.3 es un ejemplo del uso de las leyes de Kirchhoff para calcular las corrientes y voltajes en un circuito con resistores. Por último, la sección 12.4 es una ilustración de cómo se puede emplear las ecuaciones lineales para determinar la configuración del estado uniforme de un sistema masa-resorte.
12.1
A N Á L I S I S E N E S T A D O ESTABLE DE U N S I S T E M A DE REACTORES (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Uno de los más importantes principios de organización en la ingeniería química es la conservación de la masa (recuerde la tabla 1.1). En términos cuantitativos, el principio se expresa como un balance de masa que toma en cuenta todas las fuentes y depósitos de un fluido que entra y sale de un volumen (véase figura 12.1). Sobre un periodo finito, esto se puede expresar como Acumulación = entradas — salidas
(12.1)
El balance de masa representa un ejercicio contable para la sustancia particular que habrá de modelarse. Para el tiempo en que se realiza el cálculo, si las entradas son mayores que las salidas, la masa de la sustancia dentro del volumen aumenta. Si las salidas son mayores que las entradas, la masa disminuye. Si las entradas son iguales a las salidas, la acumulación es cero y la masa permanece constante. Para esta condición estable, o en estado uniforme, la ecuación (12.1) se puede expresar como ünlriidiiN « SIILIDIM
(12.2)
330
APLICACIONES EN LA INGENIERÍA: ECUACIONES,ALGEBRAICAS LINEALES
Entrada
FIGURA
Salida
12.1
Una representación esquemática del balance de masa.
Empleo de la conservación de la masa para determinar concentraciones en estado estable de un sistema de reactores acoplados. Solución. Se puede usar el balance de masa para resolver problemas de la ingeniería al expresar las entradas y salidas en términos de variables y parámetros medibles. Por ejemplo, si se realiza un balance de masa para una sustancia conservativa (es decir, una que no aumenta o disminuye debido a las transformaciones químicas) en un reactor (véase figura 12.2), podríamos cuantificar la razón con la cual el flujo másico entra al reactor a través de dos tuberías de entrada, saliendo de éste a través de una tubería de salida. Se puede hacer esto al tomar el producto del caudal Q (en metros cúbicos por minuto) y la concentración c (en miligramos por metro cúbico) para cada tubería. Por ejemplo, para la tubería 1 en la figura 12.2, Q = 2 m /min y c — 25 mg/m ; por tanto, la razón con la cual fluye la masa hacia el reactor a través de la tubería 1 es Q c = (2 m /min)(25 mg/ m ) = 50 mg/min. Así, 50 mg de sustancias químicas fluyen cada minuto hacia el reactor a través de esta tubería. De forma similar, para la tubería 2 la razón de masa que entra se calcula como Q c = (1.5 m /min)(10 mg/m ) = 15 mg/min. Observe que la concentración a la salida del reactor a través de la tubería 3 no se especifica en la figura 12.2. Esto es porque ya se tiene suficiente información para calcularla con base en la conservación de la masa. Como el reactor se halla en estado uniforme, se aplica la ecuación (12.2) y las entradas se encuentran en balance con las salidas, como en 3
3
x
x
3
l
l
3
3
2
3
2
Q\c\ + Q2C2 = Q3C3
Sustituyendo los valores dados en esta ecuación se obtiene 5 0 + 15 = 3.5c
3
la cual se resuelve para c = 18.6 mg/m . De esta forma, hemos determinado la concentración en la tercera tubería. Sin embargo, el cálculo obtiene algo adicional. Como el reactor está bien mezclado (como lo representa el agitador en la figura 12.2), la concón Ilación será uniforme, u homogénea, en todo el tanque. Asimismo, la concentración 011 ln 3
3
tupiarla 3 Haría aer iiiénlitm 11 la (««nnentruci An en. tntin el reactor. Rn r.nnaaeuanala al
12.1
FIGURA 12.2 I lu UKICIDI en oslado
ANÁLISIS EN ESTADO ESTABLE DE U N SISTEMA DE REACTORES
«2m m /n l c-, = 25 mg m / y 3
3
0 = 35 . m m /n i c=?
i'.'.lulilo, completamente
3
3
MUi/i Jado, con dos tuberías do unliada y una de salida. Ii >;, llujos volumétricos están i ni metros cúbicos por
991
3
Q -1 5 . m m /n i c = 10 mg m / 3
3
2
2
minuto, y las II mconlraciones están en tuilijjiamos por metro
i ubico.
Oi5 =
0» c
01
=5 = 10
°1
3
0« = 2 Q ¿ , =2
Q=3 21
c
2
Q=1 4 2
c
4
044=11
Q, = 1 2
FIGURA 12.3 ' Un o reactores conectados i ii ii luberías.
3 1=1 Q=8 Q CQ = 2 0 3 0 3
balance de masa nos ha permitido calcular ambas: la concentración en el reactor y el caudal en el tubo de salida. Tal información es de gran utilidad para los ingenieros químicos y petroleros, quienes deben diseñar reactores que tengan mezclas de una concentración específica. Debido a que se usa álgebra simple para determinar la concentración para un solo reactor en la figura 12.2, esto podría no ser fácil de representar en una computadora para el cálculo de un balance de masa. En la figura 12.3 se muestra la disposición de un problema donde las computadoras no sólo son útiles, sino también prácticas. Debido a que hay cinco reactores interconectados o acoplados, se necesitan cinco ecuaciones de balance de masa para caracterizar el sistema. Para el reactor 1, la razón de flujo de masa que entra es Sí 10) 4-
Q\\c\
APLICACIONES ENJLA INGENIERÍA: E C U A C I O N E S ALGEBRAICAS LINEALES
y la razón de flujo de masa de salida es
Ya que el sistema se halla en estado uniforme, los flujos de entrada y salida deben ser iguales: 5(10) + Q3lC3 = Gl2Cl + Gl5Cl o, sustituyendo valores para el flujo, de la figura 12.3 6ci — c = 50 3
Ecuaciones similares se definen para los otros reactores: - 3 c i + 3c = 0 2
-c
2
+ 9 c = 160
-c
2
- 8c + l l c - 2c = 0
3
3
4
5
-3ci - c + 4c = 0 2
5
Se puede usar un método numérico para resolver estas cinco ecuaciones para las cinco incógnitas que son las concentraciones: { C } = L11.51 r
11.51
19.06
17.00
11.51J
Además, se puede calcular la matriz inversa como 0.16981 0.16981 0.01887 0.06003 0.16981
0.00629 0.33962* 0.03774 0.07461 0.08962
0.01887 0.01887 0.11321 0.08748 0.01887
0 0 0 0.09091 0
0 0 0 0.04545 0.25000
Cada uno de los elementos a y significa el cambio en la concentración del reactor i debido a un cambio unitario en la carga del reactor j . De esta forma, los ceros en la columna 4 indican que una carga en el reactor 4 no tendrá impacto sobre los reactores 1, 2, 3 y 5. Esto es consistente con la configuración del sistema (véase figura 12.3), la cual indica que el flujo de salida del reactor 4 no alimenta ningún otro reactor. En contraste, la.s cargas de cualquier otro de los tres reactores afectarán al sistema completo como es indicado por la ausencia de ceros en las primeras tres columnas. Tal información es de gran utilidad para los ingenieros que diseñan y manejan sistemas como ése.
12.2
A N Á L I S I S DE U N A E S T R U C T U R A ESTÁTICAMENTE DETERMINADA (INGENIERÍA CIVIL/AMBIENTAL) Un problema importante en la ingeniería estructural es determinar IIIN fuerzas y reacciones asociadas con una estructura estáticamente determinada, lin la l'i gura 12.4 se muestra un ejemplo de tal estructura.
Antecedentes.
12.2
PIOURA 1 2 . 5 I iii ii |M iiiius de fuerza de i utíipii libio para los nodos
ANÁLISIS DE U N A ESTRUCTURA ESTÁTICAMENTE
~2,v
DETERMINADA
30°
333
3,h
F 3
fin I un I (1,'ili'uctura
«Mr'illi nmnnte determinada.
Las fuerzas (F) representan, ya sea la tensión o la compresión de los elementos de la estructura. Las reacciones externas (H , V y V ) son fuerzas que caracterizan cómo interactúa la estructura con la superficie de soporte. El apoyo en el nodo 2 puede transmitir ambas fuerzas, horizontal y vertical a la superficie, mientras que el rodillo en el nodo 3 transmite sólo fuerzas verticales. Se observa que el efecto de la carga externa de 1 000 Ib se distribuye a lo largo de varios elementos de la estructura. 2
2
3
Solución. El tipo de estructura se puede describir como un sistema de dos ecuaciones algebraicas lineales. Los diagramas de cuerpo libre se muestran para cada nodo en la figura 12.5. La suma de las fuerzas en ambas direcciones, vertical y horizontal, deben ser cero en cada nodo, ya que el sistema está en reposo. Por tanto, para el nodo 1, EF„ = 0 = - f , eos 30° + F eos 60° + F , 3
ZF
y = 0 sen 30° -
F\
(12.3)
h
sen 60° +
F
(12.4)
x
334
APLICACIONES E N LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES
para el nodo 2, JF =
0 = F +F eos 30° + F
H
IF
2
{
+r H
2h
(12.5)
2
= 0 = F , sen 30° + F „ + V
K
2
(12.6)
eos 60° + F
3h
(12.7)
= 0 = F sen 60° + F „ + V
3
(12.8)
2>
para el nodo 3, ZF =0=
-F
H
IF
V
2
-F
3
3
3
d o n d e F es la fuerza horizontal externa que se aplica sobre el nodo i (donde la fuerza es positiva de izquierda a derecha) y F es la fuerza vertical externa que se aplica sobre el nodo / (donde la fuerza es positiva hacia arriba). Así, en este problema, la fuerza de 1 000 Ib hacia abajo en el nodo 1 corresponde a F¡ = — 1 000 libras. Para este caso, todas las otras F¡ y F¡ son cero. Observe que las direcciones de las fuerzas internas y las reacciones son desconocidas. La aplicación apropiada de las leyes de Newton requiere sólo de suposiciones consistentes con respecto a la dirección. Las soluciones son negativas si las direcciones se asumen de manera incorrecta. También observe que en este problema, las fuerzas en todos los elementos supuestamente están en tensión y actúan jalando los nodos adyacentes. Una solución negativa, por tanto, corresponde a compresión. Este problema se puede escribir como el siguiente sistema de seis ecuaciones con seis incógnitas: ih
iv
v
h
0.866 0.5 -0.866 -0.5 0 0
-0.5 0.866 0 0 0.5 -0.866
0 0 -1 0 0 0
F\ = - 5 0 0
F = 433
F
H =0
V = 250
V
í F} Fi
0 0 0 -1 0 0
2
F H
3
2
ivv
0 -1000 0 0 0 0
(12.9)
2 Advierta que, como se formuló en la ecuación (12.9),3 se requiere de pivoteo parcial para evitar la división entre cero de los elementos de la diagonal. Con el uso de una estrategia para el pivote, el sistema se puede resolver mediante cualquiera de las técnicas de eliminación que se analizaron en los capítulos 9 y 10. Sin embargo, como este problema es un caso ideal de estudio, para demostrar la utilidad de la matriz inversa se puede usar la descomposición LUpara calcular
2
2
2
3
-866
3
750
y la matriz inversa es
[A]"
1
=
0.866 0.25 -0.5 -1 -0.433 0.433
0.5 -0.433 0.866 0 -0.25 -0.75
0 0 0 -1 0 0
0 0 0 0 -1 0
JO 1 0 -1 0 0
0 0 0 0 -1
J
Ahora, observe que los vectores del lado derecho representan las fuerzas externas horizontal y vertical que se aplican sobre cada nodo, como en {F}
r
=
(/i,*
F,,„
F,
F,
2 h
F ,„
2 v
3
F ,J
(12.10)
3 t
Debido a que las fuerzas externas no tienen efecto sobre la descomposición L U, no se necesita implementar el método una y otra vez para estudiar el efecto de diferentes fuerzas externas sobre la estructura. Más que esto, todo lo que se ha hecho es ejecutar los pasos de sustitución hacia adelante y hacia atrás para cada vector del lado derecho con el fin de obtener de manera eficiente soluciones alternas. Por ejemplo, podríamos querer estudiar el efecto de fuerzas horizontales que se inducen por un viento que sopla de izquierda a derecha. Si la fuerza del viento se puede idealizar como dos fuerzas puntuales de 1 000 libras sobre los nodos 1 y 2 (véase figura 12.6a), el vector del lado derecho es {F}
T
= L-1000
0
1000
0
0
0J
el cual se puede usar para calcular Fi = - 8 6 6
F = 250
F = -500
H = -2000
V = -433
V = 433
2
2
2
3
3
Para un viento de la derecha (véase figura 12.66), F = — 1 000, F todas las demás fuerzas externas son cero, con esto, resulta que lh
Fj = - 8 6 6
F = -1250
F = 500
H = 2000
V = 433
V = -433
2
2
2
3 h
= — 1 000, y
3
3
Los resultados indican que los vientos tienen efectos muy notorios sobre la estructura. Ambos casos se muestran en la figura 12.6.
FIGURA 12.6 I >I>N rusos de prueba mostrando o) vientos desde la izquierda y
b) vientos desde la derecha.
336
APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES
Los elementos individuales de la matriz inversa tienen también utilidad directa en aclarar las interacciones estímulo-respuesta para la estructura. Cada elemento representa el cambio de una de las variables desconocidas a un cambio unitario de uno de los estímulos externos. Por ejemplo, el elemento a \ indica que la tercera incógnita (F ) cambiará a 0.866 debido a un cambio unitario del segundo estímulo externo (F, „). De esta forma, si la carga vertical en el primer nodo fuera aumentada en 1, F se podría aumentar en 0.866. El hecho de que los elementos sean 0 indica que ciertas incógnitas no son afectadas por algunos estímulos externos. Por ejemplo a\\ = 0 significa que F , no es afectado por los cambios en F . Esta habilidad de aislar interacciones tiene un número de aplicaciones en la ingeniería; éstas incluyen la identificación de aquellos componentes que son muy sensibles a estímulos externos y, como una consecuencia, la mayoría tiende a fallar. Además, se puede usar para determinar los componentes que son innecesarios (véase el problema 12.16). El procedimiento anterior resulta particularmente útil cuando se aplica a grandes estructuras complejas. En la práctica de la ingeniería, puede ser necesario resolver estructuras con cientos y aun miles de elementos estructurales. Las ecuaciones lineales proveen un enfoque poderoso para ganar cierta comprensión del comportamiento de estas estructuras. 3
3
3
2h
12.3
C O R R I E N T E S Y V O L T A J E S E N C I R C U I T O S DE R E S I S T O R E S ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. Un problema común dentro de la ingeniería eléctrica involucra la determinación de corrientes y voltajes en varios puntos en circuitos de resistores. Estos problemas se resuelven usando las leyes para corrientes y voltajes de Kirchhoff. La regla para la corriente (o nodo) establece que la suma algebraica de todas las corrientes que entran a un nodo debe ser cero (véase figura 12.7a), o E/ = 0
FIGURA 12.7 Representaciones esquemáticas de o) regla de las corrientes de Kirchhoff y b) ley de Ohm.
(12.11)
donde todas las corrientes que entran al nodo se consideran de signo positivo. La regla de la corriente es una aplicación del principio de la conservación de la carga (recuerde la tabla 1.1). La regla para el voltaje (o malla) especifica que la suma algebraica de las diferencias de potencial (es decir, cambios en el voltaje) en cualquier ciclo debe ser igual a cero. Para un circuito de resistores, esto se expresa como
'3
E § - Ei7? = 0
(12.12)
donde ¿j es la fem (fuerza electromotriz) de las fuentes de voltaje, y i? es la resistencia de cualquier resistor en la malla. Observe que el segundo término se deriva de la ley de Ohm (véase figura 12.76), la cual establece que la caída de voltaje a través de un resistor ideal es igual al producto de la corriente y la resistencia. La ley de Kirchhoff para el voltaje es una expresión de la conservación de la energía. Solución. La aplicación de estas reglas resulta en un sistema de ecuaciones algebraicas lineales, ya que son varios los ciclos o mallas que forman un circuito. Por ejemplo,
f?» 1011
1
~OV-\= 200 V
FIGURA 12.8 1 ln circuito de resistores que liuhiá de ser resuelto usando ecuaciones akjubraicas lineales simultáneas.
ñ=5a:
•ñ= ion — v W — ñ=15Q
ñ = 20í2
-O V é s=0V
considere el circuito mostrado en la figura 12.8. Las corrientes asociadas con este circuito son desconocidas tanto en magnitud como en dirección. Esto no presenta gran dificultad, ya que simplemente se supone una dirección para cada corriente. Si la solución resultante a partir de las leyes de Kirchhoff es negativa, entonces la dirección supuesta fue incorrecta. Por ejemplo, en la figura 12.9 se muestran las direcciones supuestas de las corrientes. Dadas estas suposiciones, la regla de la corriente de Kirchhoff se aplica a cada nodo para obtener í 12 + ' 5 2 + ( 3 2 — '65
-
¡43 -
i
'52 — '54 = '32 =
0 0
0 0
54 — ' 4 3 —
La aplicación de la regla del voltaje en cada una de las mallas da —'54-^54
—
-«65*65 "
'43*43
'32*32 + '52*52 =
—
'52*52 +
0
¿12*12 " 200 = 0
o, si se sustituyen las resistencias de la figura 12.8 y se pasan las constantes al lado derecho,
-15/54-5Í43 -
=0 -20/ - IO 5 /2 + 51 /2 = 200 10¿32
+
10/52
6 5
Portante, el problema se reduce a la resolución del siguiente conjunto de seis ecuaciones con seis corrientes como incógnitas:
FIGURA 12.9 (Corrientes supuestas.
338
APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES I
I
I
0 0 0 0 5
•-1 0 ü 10 -10
0 -1 0 -10 0
0 1 0 0 0 20
0 -1 0 1 -15 0
0 0 1 -1 -5 0
'54
0 0 0 0 0
'43
200
'52 '32 '65
Aunque no es práctico resolverlo a mano, este sistema se maneja de manera fácil mediante un método de eliminación. Si se procede de esta forma, la solución es ¿12 = 6.1538
¿52 = -4.6154
z
32
= - 1 . 5 3 85
/
i
¡
4 3
=-1.5385
65
=-6.1538
5 4
= -1.5385
Así, con una adecuada interpretación de signos en el resultado, las corrientes y voltajes en el circuito se muestran en la figura 12.10. Deberían ser evidentes las ventajas de usar algoritmos numéricos y computadoras para problemas de este tipo. 12.4
SISTEMAS MASA-RESORTE (INGENIERÍA MECÁNICA/AEROESPACIAL) Antecedentes. Los sistemas idealizados resorte-masa desempeñan un papel importante en la mecánica y otros problemas de la ingeniería. En la figura 12.11 se muestra un sistema de ese tipo. Después de liberar las masas, éstas son jaladas hacia abajo debido a la fuerza de la gravedad. Observe que el desplazamiento resultante en cada resorte de la figura 12.1 Ib, se mide a lo largo de las coordenadas con referencia a su posición inicial dada en la figura 12.1 la. Como se introdujo en el capítulo 1, la segunda ley de Newton se puede emplear en conjunto con un equilibrio de fuerzas para desarrollar un modelo matemático del sistema. Para cada masa, la segunda ley se puede expresar como dx 2
m—r
dt
2
=
(12.13)
r
D
Para simplificar el análisis se supondrá que todos los resortes son idénticos y que se comportan de acuerdo con la ley de Hooke. En la figura 12.12a se muestra un diagrama de cuerpo libre para la primera masa. La fuerza hacia arriba es únicamente una expresión directa de la ley de Hooke: Fn
FIGURA 12.10 la solución obtenida para h s con ionios y voltajes iiftundo un método de
=
(12.14)
kx\
V= 153.85
ÍZ = 169.23 M A A -
- M A -
Un ingeniero civil involucrado en la construcción, requiere •I 800, 5 810 y 5 690 m de arena, de grano fino y grueso, résped ivuinente, para un proyecto de construcción. La composición de estas canteras es 3
Arena %
vw: l'n I
l'n i
52 20 25
Grano fino % 30 50 20
FIGURA P 12.15
Grano grueso % 18 30 55
/,('nimios metros cúbicos se debe transportar desde cada cantera ptiiu cumplir con las necesidades del ingeniero? 11. Kl Realice el mismo cálculo que en la sección 12.2, peroahoin cambie el ángulo en el nodo 2 a 40° y en el nodo 3 a 50°, y la llici/ii en el nodo 1 es de 750 libras.
FIGURA P 1 2 . 1 2
4
1
°0
i
200
3
3
344
APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES
o sustituyendo los parámetros 225c, - 25c = 1400 3
X60° 6 0 ° X
/\
4
5
Se puede escribir balances en forma similar para los otros cuartos.
°
a) Resuelva para la concentración, en estado estable, de monóxido de carbono en cada cuarto. b) Determine qué porcentaje de monóxido de carbono en la sección de niños es a causa de i) los fumadores, ii) la parrilla y iii) el aire que entra por ventilación.
3500
FIGURA P 12.16
12.16 Resuelva para las fuerzas y reacciones de la estructura de lu figura P12.16. Determine la matriz inversa para el sistema. ¿Parece razonable la fuerza en elemento vertical a la mitad del elemento? ¿Por qué? 12.17 Como su nombre implica, la polución de aire entrante tiene que ver con la contaminación encerrada en espacios tales como casas, oficinas, áreas de trabajo, etcétera. Suponga que se diseña un sistema de ventilación para un restaurante como se muestra en la figura P12.17. El área de servicio del restaurante consiste en dos cuartos cuadrados y uno alargado. El cuarto 1 y el 3 tienen fuentes de monóxido de carbono, de los fumadores y una parrilla. Se puede escribir balances de masa en estado estable para cada cuarto. Por ejemplo, para la sección de fumadores (cuarto I), el balance se escribe como 0 = W'fu.nador + (carga)
FIGURA
QC a
fl
-
Q C, a
H
{
56
+E (C -C¡) Í3 (mezcla)
+ (entrada) — (salida) +
3
P12.17
Vista aérea de los cuartos en un restaurante. Las flechas en un sentido representan los flujos de aire volumétricos, mientras que las flechas en ambos sentidos representan la mezcla difusa. Las cargas debido al humo y la parrilla agregan masa de monóxido de carbono al sistema pero con entrada de aire Insignificante.
Ingeniería eléctrica 12.18 Realice el mismo cálculo que en la sección 12.3, pero ahora cambie la resistencia entre los nodos 3 y 4 a 25 Í2 y cambie V a60V 12.19 Lleve a cabo el mismo cálculo que en la sección 12.3, pero ahora para el circuito que se presenta en la figura P12.19. 12.20 Realice el mismo cálculo que en la sección 12.3, pero ahora para el circuito expuesto en la figura P 12.20. 12.21 Resuelva el circuito resistor de la figura 12.8, usando la eliminación de Gauss, si V = 180 V y R = 50 ohms. 12.22 Resuelva el circuito de la figura Pl 2.22 para las corrientes en cada alambre. Use el método de eliminación de Gauss con pivoteo. 12.23 Un ingeniero eléctrico supervisa la producción de tres tipos de componentes eléctricos. Tres clases de materiales (metal, plástico y hule) se requieren para la producción. Las cantidades necesarias para producir cada componente son
Q =100m /hrA
Q = 150m3/hri
Q = 50 m /hr b
3
c = 2 mg/m b
3
O, = 200 m /hr a
Carga por fumadores (T 000 mg/h'r)
3
25 m /hr 3
(Sección de niños)
^
- H -
3
c = 2 mg/m
3
d
c
1 (Sección de fumar) ~
25 m /hr 3
R-20U
2
vW
fl-10U
1
O V, = 150 volts
ñ=5í2 ñ=25Q
ñ=51i 1
" '
5
PIOURA P 1 2 . 1 9
—^ o e = v
0volts
Ingeniería mecánlen/aeroespiclal
12.24 Efectúe el mismo cálculo que en la sección 12.4, pero uhoru triplique el valor de las constantes del resorte. 12.25 Realice el mismo cálculo que en la sección 12.4, pero ahora agregue un tercer resorte entre las masas 1 y 2 y duplique k. 12.26 Efectúe el mismo cálculo que en la sección 12.4, pero ahora cambie las masas de 2, 3 y 2.5 kg a 15, 3 y 2 kg. 12.27 Los sistemas idealizados masa-resorte tienen numerosas aplicaciones en toda la ingeniería. La figura P12.27 muestra un arreglo de cuatro resortes en serie cuando se comprimen con una fuerza de 2 000 kg. En el equilibrio, se pueden desarrollar las ecuaciones de equilibrio de fuerzas, definiendo las interrelacioncs entre los resortes;
Metal, Plástico, Hue l, C o m p o - /om ponene t gc /omponene t gc /omponene t nente gc 15 17 19
0.25 0.33 0.42
Si IIIS cantidades totales son 2.12, 0.0434 y 0.164 kgpara el metal, plástico y hule, respectivamente, y están disponibles cada illa, ¿cuántos componentes se puede producir por día?
(x -x - x¡) =kkyxi kkk (x'4 (x ) = - x ) — k(x(x-JCI) -x ) 2 3
2 3
2
F = k4{X4 - x )
2
3
3
3
donde las k son las constantes del resorte. Si de k a ¿ son de 150, 50, 75 y 225 kg/s , respectivamente, calcule las x. {
2
PIOURA P 1 2 . 2 0
MOURA P 1 2 . 2 2
20 Q
15 £ 2 5Í2 V, - 1 1 0
2
3
A
V = 40 2
4
2
346
APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES
x
2
FIGURA P12.27
11.IH Tres bloques cslnn conectados por unit cnerda sin peso y ih'sciinsiiii sobre un plimo inclinado (véase figura IM2.28 x = |c - a x ) / a c
C] c
1
2
c
2
2
23
x, = (c, - a , x ,
3
2
3
22
-oi x )/a, 3
Sustitución Descomposición
LU
°21 °22
13~ °23
°32
°33.
"ai 1 .031
a
°12
"
=>
1
0
'21
1
. '31 '32
1
0 "
u
u
]2
u
1 3
0
0
u
2 2
u
2 3
u
3 3
u
.
.0
0
Sustitución hacia adelante Método de Gauss-Seidel
x', = ( q
-o X2 t 2
y! = ( c - a 7
2
2 1
xí
X3 = ( C 3 - ° 3 1 * 1
' -oi^'l/ai,! - G^xf ) / a 1
22
-a
3 2
x
2
Alta precisión Pivoteo parcial
hacia atrás
T Descomposición
3
Problemas: Mal condicionamiento Redondeo División entre cero Soluciones:
)/a J 3 3
Continúa iterativamente hasta -1
100% s ingenieros deben diseñar en forma continua dispositivos y productos que realicen t a r - ^ forma efectiva. Al hacer esto, ellos están restringidos por las limitaciones del m u n d o físico. Además, deben mantener costos bajos. Así, los ingenieros siempre se hallará J i confrontado problemas de optimización que equilibren el comportamiento y las l i m i t a c = - i ° - Algunos ejemplos comunes se listan en la tabla PT4.1. El siguiente ejem- 0 1
e
a s
e
n
nes
TABUBt PT4.1 • • • • • • • • • • • • • • • •
Algunos ejemplos comunes de optimización en la ingeniería.
G\s~&ño de un avión para un mínimo peso y máxima resistencia. Tro yectorias óptimas de vehículos espaciales, D ¡ » ñ o de estructuras en la ingeniería civil con un mínimo costo. D i s v - ñ o de proyectos de abastecimiento de agua, como en presas, para mitigar el daño por inundación m i e n t r a s se obtiene máxima potencia de generación. Pre^decír el comportamiento estructural al minimizar la energía potencial. E s t * " 9 ¡ de corte de materiales para un costo mínimo. D¡sv©ño de bombas y equipos de transferencia de calor para máxima eficiencia. Mca ¡ ' 1° potencia de salida de redes eléctricas y maquinaria mientras se minimiza el caloi generado. Rut o á s corta de un vendedor que visita varias ciudades durante un viaje de venias. Pie* neación óptima y calendarizada. A n * c i l ¡ ¡ s estadístico y modelado con un mínimo error. R e e J de tubería óptimas. Q ^ n t r p l de inventario. P í o neación del mantenimiento para minimizar costos. Mi n imízar tiempos de espera y ociosos. e
e
a , e
; <
a
m
2 a r
m
s
e s
D i s - e ñ o r sistemas de tratamiento de aguas para cumplii con «sláiiclmos do uilklud ilnl nijiici ci bu|ii costo-
PT4.1
355
MOTIVACIÓN
pío ha sido desarrollado para ayudarlo a obtener una visión de la forma on la que tule» problemas se podrían formular. EJEMPLO PT4.1
Optimización del costo de un paracaídas
] ! ] i
í i
Enunciado del problema. A través de este libro, hemos usado la caída de un paracaidista para ilustrar las áreas básicas de un problema de métodos numéricos. Usted puede haber notado que ninguno de estos ejemplos se concentró en lo que pasa después de que se abre el paracaídas. En este ejemplo examinaremos un caso donde el paracaídas se abre, y en el cual nos interesaremos en predecir la velocidad de impacto en el suelo. Usted es un ingeniero que trabaja para una compañía aérea que lleva abastecimientos a los refugiados en una zona de guerra. Los abastecimientos se dejarán caer a baja altitud (500 m), de tal forma que la caída no sea detectada y que los abastecimientos caigan tan cerca como sea posible del campo de refugiados. Los paracaídas abren en forma inmediata casi al salir del aeroplano. Para reducir el daño, la velocidad vertical de impacto debe ser menor que un valor crítico de v = 20 m/s. El paracaídas que se usa para la caída se ilustra en la figura PT4.2. El área transversal del paracaídas es el de una semiesfera, c
!
A = 2nr
(PT4.1)
2
La longitud de cada una de las 16 cuerdas que sostienen al paracaídas con la masa está relacionada con el radio del paracaídas por í = V2r
(PT4.2)
Usted sabe que la fuerza de arrastre en el paracaídas, es una función lineal de su área de sección transversal descrita por la siguiente fórmula !
c = kA
(PT4.3)
c
donde c = coeficiente de arrastre (kg/s) y k = constante de proporcionalidad parametrizando el efecto del área sobre el arrastre [kg/(s • m )]. c
2
F I G U R A PT4.2 Un paracaídas abierto.
356
OPTIMIZACIÓN
También, es posible dividir la carga total en tantos paquetes como quiera. Es decir, la masa de cada paquete individual se puede calcular como M, — n
m =
donde m = masa de cada paquete individual (kg), M — carga total que habrá de arrojarse (kg) y n = número total de paquetes. Por último, el costo de cada paracaídas está relacionado con el tamaño en una forma no lineal, t
Costo por paracaídas = c + c l + c A
(PT4.4)
2
0
x
2
donde c , c y c = coeficientes de costo. El término constante, c , es el valor base para los paracaídas. La relación no lineal se debe a que la manufactura de los paracaídas de ¡ gran tamaño es más complicada que la de los paracaídas pequeños, j Determine el tamaño (r) y el número de paracaídas («) que puedan obtenerse a un | mínimo costo, y que cumplan al mismo tiempo el requerimiento de tener una velocidad | de impacto suficientemente pequeña. 0
x
2
0
!
I | | | | |
Solución. El objetivo aquí es determinar la cantidad y tamaño de paracaídas que minimicen el costo del planeador. El problema está restringido, ya que los paquetes deben tener una velocidad de impacto menor al valor crítico. El costo se puede calcular al multiplicar el valor de un paracaídas individual [ecuación (PT4.4)] por el número de paracaídas («). Así, la función que usted quiere minimizar, la cual es llamada formalmente función objetivo, se escribe como Minimizar C = n(c + c i + c A ) 2
Q
x
2
(PT4.5)
¡ donde C = costo ($) y A y (, se calculan con las ecuaciones (PT4.1) y (PT4.2), respectij vamente. j Después, usted debe especificar las restricciones. Para este problema existen dos | restricciones. i Primera, la velocidad de impacto debe ser igual o menor que la velocidad crítica. \
\
v \
(PT4.7)
IAA | I | | |
donde n es un entero. En este punto, el problema de optimización se ha formulado. Como puede verse, es un problema restringido no lineal. Aunque el problema se ha formulado en forma amplia, algo más se debe tener en cuenta: ¿cómo se determina la velocidad de impacto vi Recuerde del capítulo 1 que la velocidad de un objeto en caída se puede calcular con _,.--«•/«>/) (1-10) L
)
=
PT4.1
MOTIVACIÓN
donde v = velocidad (m/s), g = aceleración de la gravedad (m/s ), m = masa (kg) y t = tiempo (s). 2
Aunque la ecuación (1.10) provee una relación entre v y r, se necesita conocer en cuánto tiempo cae la masa. Por tanto, es necesaria una relación entre la distancia de calda z y el tiempo de caída t. La distancia de caída se puede calcular de la velocidad en la ecuación (1.10) por integración
Jo c
(PT4.8)
Esta integral se puede evaluar para obtener gm
-{c/m)t
t
(PT4.9)
z 1
donde z = altura inicial (m). Esta función, como muestra la gráfica de la figura PT4.3, 0 provee una formac de predecir z conociendo t. Sin embargo, no se necesita z como una función de t para resolver este problema. En lugar de esto, se debe calcular el tiempo requerido por el paquete para recorrer en caída la distancia z . Así, se reconoce que se ha formulado la ecuación (PT4.9) como un problema de determinación de raíces. Esto es, se debe resolver para el tiempo al cual z se acerca a cero. 0
0
0 = z - — t c 0
gm-
(1
-(c/m)t
(PT4.10)
Una vez que se calcula el tiempo de impacto, se puede sustituir en la ecuación (1.10) con el fin de resolver para la velocidad de impacto.
358
OPTIMIZACIÓN
La especificación final del problema podría ser Minimizar C = n(c + c,€ + 0
cA) 2
2
(PT4.1 I)
sujeta a v < v
(PT4.12)
n > 1
(PT4.13)
c
donde 2nr
(PT4.14)
l = 4lr
(PT4.15)
c = kA
(PT4.16)
A =
2
c
Mi
m = — n t = raíz
c
(PT4.17) (PT4.18) (PT4.19)
Resolveremos este problema en el ejemplo 15.4 al final del capítulo 15. Por ahora, reconozca que se tiene uno de los elementos fundamentales de los otros problemas de optimización, que usted enfrentará en la práctica de la ingeniería. Estos son • • •
El problema involucrará una función objetivo que contiene su meta. Tendrá también un número de variables de diseño. Estas pueden ser números reales o enteros. En nuestro ejemplo, estas variables son r (real) y n (entero). El problema incluirá restricciones que reflejan las limitaciones bajo las cuales se trabaja.
Plantearíamos un punto más antes de proceder. Aunque la función objetivo y restricciones pueden, en forma superficial, parecer simples ecuaciones [por ejemplo, la ecuación (PT4.12)], de hecho son la "punta del iceberg". Es decir, pueden estar basadas en modelos y dependencias complejas. Por ejemplo, en nuestro caso, pueden involucrar otros métodos numéricos [ecuación (PT4.18)]. Esto significa que las relaciones funcionales que usted estará usando podrían de hecho representar cálculos grandes y complicados. Así, pueden ser en extremo valiosas las técnicas que pueden encontrar lu solución óptima, mientras se minimizan las funciones de evaluación.
PT4.2
PT4.2
BASES MATEMÁTICAS
BASES MATEMÁTICAS Existen infinidad de conceptos matemáticos y operaciones que son la base de lu optimización. Como creemos que para usted éstos serán más relevantes en contexto, se dejará el análisis de los prerrequisitos matemáticos hasta que se ocupen. Por ejemplo, se analizarán los importantes conceptos del gradiente de Hessians al inicio del capítulo 14 sobre la optimización de multivariables no restringidas. Mientras tanto, nos limitaremos a un tópico más general de cómo se clasifican los problemas de optimización. Un problema de programación matemática u optimización, se puede establecer en forma general como Determine x, el cual minimiza o maximiza/(x) sujeto a
d¡{x) - i — — A i v a t i t n * t a l a * p n m o húsauadcii J
(¡lucítotliw,
PT4.3
ORIENTACIÓN
361
búsquedas invariables y búsquedas de patrones, no requieren la evaluación de las derivadas de la función. Por otro lado, los métodos gradiente usan algunas veces la primera y otras la segunda derivada para encontrar el óptimo. El capítulo introduce el gradiente y el Hessian, los cuales son representaciones multidimensionales de la primera y segunda derivadas. El método de paso ascendente/descendente es entonces cubierto con algún detalle. A esto le siguen descripciones de algunos métodos avanzados: gradiente conjugado, el método de Newton, el método de Marquardt y los métodos cuasi-Newton. El capítulo 15 se dedica a la optimización restringida. La programación lineal se describe con detalle usando ambos: la representación gráfica y el método simplex. El análisis detallado de optimización restringida no lineal está fuera del alcance de este libro, pero se dará un repaso a los principales enfoques. Además, se ilustra cómo tales problemas, junto con los estudiados en los capítulos 13 y 14, se pueden obtener con las librerías y paquetes de software como Excel, Mathcad e IMSL. El capítulo 16 extiende los conceptos anteriores a problemas actuales de la ingeniería. Se utilizan aplicaciones de la ingeniería para ilustrar cómo se formulan los problemas de optimización y en qué forma se provee una visualización en la aplicación de las técnicas de solución en la práctica profesional. Se incluye un epílogo al final de la parte cuatro. Este contiene un repaso de los métodos analizados en los capítulos 13,14 y 15. Este repaso incluye una descripción de los elementos de juicio relacionados con el uso apropiado de cada técnica. Esta sección también provee referencias de algunos métodos numéricos que van más allá del alcance de este texto. PT4.3.2
M e t a s y objetivos
Objetivos de estudio. Después de haber analizado la parte cuatro, usted tendrá suficiente información para plantear con éxito una amplia variedad de problemas de la ingeniería relacionados con la optimización. En general, usted debería dominar las técnicas, haber aprendido a evaluar su confiabilidad y detectar métodos alternativos de análisis para un problema particular. Además, de estas metas generales, deberían ser asimilados los conceptos específicos dados en la tabla PT4.2 para un aprendizaje comprensivo del material de la parte cuatro. Objetivos computacionales. Usted debería ser capaz de escribir un subprograma que implemente una búsqueda simple unidimensional (como la búsqueda dorada o la interpolación cuadrática) y multidimensional (como el método de búsqueda aleatorio). Además, programas de librerías como el IMSL y los paquetes de software tales como Excel o Mathcad tienen una variedad de capacidades para la optimización. Usted puede usar esta parte del libro para familiarizarse con todas estas capacidades.
3Ó2
OPTIMIZACIÓN
15,2 Restricciones no lineales
FIGURA PT4.5 Esquema de la organización del material en la parte cuatro: Optimización.
PT4.3
ORIENTACIÓN
TABLA PT4.2
lis
Objetivos de estudio específicos para la parte cuatro.
1. Comprender por qué y dónde ocurre la optimización al resolver problemas de ingeniería. 2. Comprender los elementos principales del problema de optimización en general: función ob|elivo, variables de decisión y restricciones. 3. Ser capaz de distinguir entre la optimización lineal y no lineal, y entre problemas restringidos y no restringidos. 4. Poder definir la relación dorada y comprender cómo realiza una eficiente optimización unidimensional. 5. Localizar el óptimo de una función con una sola variable con la búsqueda de la sección dorada, interpolación cuadrática y el método de Newton. También, reconozca los elementos de juicio entre estos enfoques, con particular atención en los valores iniciales y en la convergencia. ó. Ser capaz de escribir un programa y resolverlo para el óptimo y la función multivariable usando búsqueda aleatoria. 7. Comprender las ideas detrás de los patrones de búsqueda, direcciones conjugadas y el método de Powell. 8. Poder definir y evaluar el gradiente y Hessian de una función multivariable, ambas en forma analítica y numérica. 9. Calcular a mano el óptimo de una función con dos variables, usando el método de paso ascendente/ descendente. 10. Comprender las ideas básicas detrás de los métodos del gradiente conjugado, de Newton, de Marquardt y de cuasi-Newton. En particular, comprender los elementos de juicio de los enfoques y reconocer cómo cada uno mejora sobre el paso ascendente/descendente. 11.
Ser capaz de reconocer y acondicionar un problema de programación lineal para representar aplicaciones de los problemas en ingeniería. 1 2. Poder resolver un problema de programación lineal bidimensional con ambos métodos: el gráfico y el simplex. 1 3. Comprender los cuatro posibles resultados de un problema de programación lineal. 14. Ser capaz de acondicionar y resolver problemas de optimización restringidos no lineales mediante un paquete de software.
CAPÍTULO 13 Optimización unidimensional no restringida Esta sección describirá las técnicas para encontrar el mínimo o máximo de una función de una sola variable,/(x). Una imagen útil en este sentido es la unidimensional "montaña rusa", como la función ilustrada en la figura 13.1. Recuerde de la parte dos, que la localización de una raíz fue complicada por el hecho de que varias raíces ocurren para una sola función. De manera similar, ambos, el óptimo local y el óptimo global, pueden ocurrir en optimización. Tales casos son llamados multimodal. En casi todos los ejemplos, estaremos interesados en encontrar el valor absoluto máximo o mínimo de una función. Así, debemos cuidar de no equivocarnos con un óptimo local en vez de un óptimo global. Distinguir un extremo global de un extremo local puede ser un problema difícil para el caso general. Existen tres formas usuales de enfocar este problema. Primero, la visualización en el comportamiento de funciones de bajas dimensiones puede algunas veces obtenerse en forma gráfica. Segundo, determinar la óptima con base en los valores iniciales, que varían muy ampliamente y quizá sean generados en forma aleatoria, y después seleccionar el más grande de éstos como global. Por último, cambiar el punto de inicio asociado con un óptimo local y ver si la rutina regresa a un mejor punto, o siempre regresa al mismo punto. Aunque todos estos planteamientos tienen su utilidad, el hecho es que en algunos problemas (usualmente los más grandes), quizá no hay una forma práctica de asegurar que se ha localizado un óptimo global. Sin embargo, aunque se
FIGURA 13.1 Una función que asintóticamente se aproxima a cero en más y menos °° y tiene dos puntos máximos y dos puntos mínimos en la vecindad del origen. Los dos puntos a la derecha son los óptimos locales, mientras que los dos de la izquierda son globales.
A
Máximo O*^" local
Máximo^R^l global / \
X
Mínimo \ global —
i
Mínimo
V
13.1
B U W S U E P A D E LA S E C C I Ó N DORAL7A
ilcberhi ser siempre sensible ul lema, se liene la fortuna de que hay numerosos problemas en la ingeniería donde se puede localizar el global óptimo en una forma no ambigua. Como en la localización de raíces, la optimización en una dimensión se puede dividir en métodos que usan intervalos y métodos abiertos. Como se describirá en la próxima sección, la búsqueda de sección dorada, es un ejemplo de un método de intervalo que depende de los valores iniciales y que contiene un solo óptimo. Este es seguido por un procedimiento de intervalo algo más sofisticado (la interpolación cuadrática). El método final descrito en este capítulo es un método abierto que se basa en la idea del cálculo de que se puede encontrar el mínimo o máximo al resolver f(x) = 0. Esto reduce el problema de optimización para encontrar la raíz d e / \ x ) mediante las técnicas de esa clase descritas en la parte dos. En seguida se mostrará una versión de este planteamiento (el método de Newton).
13.1
B Ú S Q U E D A DE LA SECCIÓN D O R A D A Al resolver para la raíz de sólo una ecuación no lineal, la meta fue la de encontrar la variable x que diera cero en la función f(x). La optimización de una sola variable tiene como meta encontrar el valor de x que generará un extremo, ya sea un máximo o un mínimo de f(x). La búsqueda de la sección dorada es una técnica simple, de búsqueda de una sola variable de propósito general. Es similar en esencia al enfoque de la bisección para localizar raíces (capítulo 5). Recuerde que la bisección depende del intervalo definido, especificado por un valor inicial inferior (x,) y un valor inicial superior (xj, que ajusta a una sola raíz. La presencia de una raíz entre estas fronteras se verifica al determinar que f(x¡) Y /(*«) tienen signos diferentes. La raíz se estima entonces como el punto medio de este intervalo, xi +
x
u
El paso final en una iteración por bisección involucró determinar el intervalo más pequeño. Esto se hizo al reemplazar cualquiera de las fronteras x¡ o x , que tuvieran un valor de la función con el mismo signo que f(x ). Un efecto útil de este procedimiento fue que el nuevo valor x , reemplazará a una de las fronteras anteriores. Ahora se puede desarrollar un procedimiento similar para localizar el óptimo de una función unidimensional. Por simplicidad, nos concentraremos sobre el problema de encontrar un máximo. Cuando se analice el algoritmo de cómputo, se describirán las pequeñas modificaciones necesarias para simular un mínimo. Como con el método de la bisección, se puede comenzar por definir un intervalo que contenga una sola respuesta. Es decir, el intervalo debería contener un solo máximo, y por esto es llamado unimodal. Podemos adoptar la misma nomenclatura que para la bisección, donde x¡ y x , definen los límites inferior y superior de ese intervalo. Sin embargo, en contraste con bisección, se necesita una nueva estrategia para encontrar un máximo dentro del intervalo. En vez de usar solamente dos valores función (los cuales son suficientes para detectar un cambio de signo, y por tanto un cero), se necesitarían tres valores función para detectar si ocurre un máximo. Así, se ha escogido un punto adicional dentro del intervalo. Después, se toma un cuarto punto. Entonces, lu pruebn u
r
r
u
OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA
f[x)k Primera iteración
FIGURA 13.2 El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada.
para el máximo podría aplicarse para discernir si el máximo ocurre dentro de los prime ros tres o en los últimos tres puntos. La clave para hacer eficiente este procedimiento es la mejor elección de los punlim intermedios. Como en la bisección, la meta es minimizar las funciones evaluación ni remplazar los valores anteriores con los nuevos. Esta meta se puede alcanzar al especificar que las siguientes dos condiciones se cumplan (véase figura 13.2):
lo = li +h
(13.1)
(I3.;>
La primera condición especifica que la suma de las dos sublongitudes € y £ debe m igual a la longitud original del intervalo. La segunda indica que el cociente o razón de IIIN longitudes debe ser igual. La ecuación (13.1) se puede sustituir en la (13.2), x
ÍI+Í2
2
(I-VI)
Si se toma el recíproco y R = € /€,, se llega a 2
(114)
o R + R2
1 =0
la cual se puede resolver para la raíz positiva
(I.U)
13.1
367
BÚSQUEDA DE LA SECCIÓN DORADA
Cuadro 13.1 La razón dorada y los números de Fibonacci lili muchas culturas, a ciertos números se les otorga cualidades. I'or ejemplo, en Occidente se suele decir "el 7 de la suerte" y "viernes 13". L o s antiguos griegos llamaron al siguiente número ln "razón dorada":
>A
I
: 0.61803.
razón fue empleada para un gran número de propósitos,
I'.NIII
Incluyendo el desarrollo del rectángulo como en la figura 13.3. I'NUIN
proporciones fueron consideradas por los griegos como
Místicamente agradables. Entre otras cosas, muchos de los templiiN siguieron esta forma. I ,a razón dorada se relaciona con importantes series maternal icns conocidas como los números de Fibonacci, los cuales •on 0. I , 1 , 2 , 3 , 5 , 8 , 1 3 , 2 1 , 3 4 , . . .
FIGURA 13.3
Así, cada número después de los dos primeros representa la
El Partenón de Atenas, Grecia, fue construido en el siglo v
mima de l o s dos precedentes. Esta secuencia detonó en muchas
antes de Cristo. Sus dimensiones frontales pueden casi
rtii'iiN diversas de la ciencia y la ingeniería. E n el contexto del
ajusfar en forma exacta dentro de un rectángulo dorado.
p í n t e n l e análisis, una interesante propiedad de la secuencia de I'IIMIIIIICCÍ
relaciona la razón de números consecutivos en la se-
Himieia; os decir, 0/1 = 0, 1/1 = 1, 1/2 = 0.5,2/3 = 0.667, 3/5 — ( l o , 1/H = 0.625, 8/13 = 0.615, y asi sucesivamente. ¡Como mi|iunenios, la razón de números consecutivos se aproxima a la l»*on dorada!
Este valor, el cual se conoce desde la antigüedad, es llamado la razón dorada (vea el cuadro 13.1). Ya que permite encontrar en forma eficiente el óptimo, es el elemento clave del método de la sección dorada que hemos desarrollado conceptualmente. Ahora derivemos un algoritmo para implementar este procedimiento en la computadora. Como se mencionó antes y se ilustra en la figura 13.4, el método comienza con dos valores iniciales, x¡ y x , que contienen un extremo local de f(x). u
interiores x
{
yx
Después, dos puntos
se escogen de acuerdo con la razón dorada,
2
d =—-—(x
u
- x¡)
x\ = xi + d x
2
= x„
-
d
La función HO evalúa en esto» dos puntos interiores. Dos resultados pueden ocurrir:
368
OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA
f(x)
Extremo (máximo)
Eliminar
>v
'
i
•i - l i 1 iw • • . t- -
f'f ,!• \ x¿<
d
x
u
a)
W /4
Xf
Xg
X] X
Antiguo x Antiguo x¡ 2
b) FIGURA 13.4 o) El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada, b) El segundo paso involucra definir un nuevo intervalo que incluya el óptimo.
1.
Si, como es el caso en la figura 13.4,/(x ) > f(x ), entonces el dominio de x a I» izquierda de x J de x¡ a x , se puede eliminar, ya que no contiene el máximo. Para este caso, x pasa a ser el nuevo x¡ para la siguiente vuelta. Si ha ocurrido q u e / ( x ) > f{x ), entonces el dominio de x a la derecha de x de x, a x podría ser eliminado. En este caso x pasa a ser el nuevo x para la siguiente iteración. f
2
2
2
2
2.
2
x
u
l5
t
u
Ahora, éste es el beneficio real del uso de la razón dorada. Debido a que los x, y .v originales se han escogido mediante la razón dorada, no se tiene que recalcular todos los valores de la función para la siguiente iteración. Por ejemplo, para el caso expuesto en la figura 13.4, el anterior X j pasa a ser el nuevo x . Esto significa que ya se tiene el valor para el nuevo/(x ), puesto que es el mismo valor de la función en el anterior x Para completar el algoritmo, ahora sólo se necesita determinar el nuevo x . listo NC realiza con la misma proporcionalidad que antes, ;
2
2
v
t
.vi = V5 --(.v1„ -.v/) xi -I
13.1
36*
BÚSQUEDA DG LA SECCIÓN DORADA
Un procedimiento similar podría usarse para el caso alterno donde el óptimo está en la izquierda del subintervalo. Como las iteraciones se repiten, el intervalo que contiene el extremo se reduce rápidamente. De hecho, en cada vuelta el intervalo se reduce por un factor de la razón dorada (aproximadamente el 61.8%). Esto significa que después de 10 vueltas, el intervalo se acorta a cerca de 0.618 o 0.008 o 0.8% de su longitud inicial. Después de 20 vueltas, se acerca al 0.0066%. Esta reducción no es tan buena como la que se alcanza con bisección, pero éste es un problema más difícil. 10
EJEMPLO 13.1
Búsqueda de la sección dorada
Enunciado del problema.
Use la búsqueda de la sección para encontrar el máximo de
x
1
f(x) — 2 sen* — 10 dentro del intervalo x¡ = 0 y x — 4. u
Solución.
Primero, se usa la razón dorada para crear los dos puntos anteriores 1 ( 4 - 0) = 2.472
V5-
xx = 0 + 2.472 = 2.472 x = 4 - 2.472 = 1.528 2
La función se puede evaluar en los puntos interiores f(x ) 2
=/(1.528) =
^
- 2 sen (1.528) = 1.765
/ ( * , ) = /(2.472) = 0.63 Debido a que f(x ) >/(*i), el máximo en el intervalo está definido por x¡, x y x . Así, para el nuevo intervalo, la frontera inferior permanece x = 0, y x, pasa a ser la frontera superior; esto es, x = 2.472. Además, el primer valor x pasa a ser el nuevo x¡; esto es, x, = 1.528. Además, no se tiene que recalcular/(x,) ya que se determinó en la ; iteración previa como/(l.528) = 1.765. Todo lo que falta es calcular la nueva razón dorada y x , 2
2
x
t
u
2
2
d =
1
(2.472 - 0) = 1.528
x = 4 - 1.528 = 0.944 2
La evaluación de la función en x es/(0.994) =1.531. Como este valor es menor que el valor de la función en x , el máximo está en el intervalo prescrito por x , x y x . i ül proceso se puede repetir, con los resultados tabulados en seguida: 2
(
2
{
u
370
OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA / 1
0
d
í(x )
'(*/)
x
0
'1.5279
1.7647
2.4721
0.6300
4.0000
-3.1136
1.7647
2.4721
0.6300
1.52/9
2.4721'
0.6300
0.9443
2
2
2.4/71
2
0
0
0.9443
1.5310
1.5279-
3
0.9443
1.5310
1.5279
1.7647
1.8885 - 1.5432
4
0.9443
1.5310
1.3050
1.7595
1.5279
1.7647
1.8885
1.5432
0.5836
5
1.3050
1.7595
1.5279
1,7647
1.6656
1.7136
1.8885
1.5432
0.360/
6
1.3050
1.7595
1.4427
1.7755
1.5279
1.7647
1.6656
1.7136
0.2229
7
1.3050
1.7595
1.3901
1.7742
1.4427
1.7755
1.5279
1.7647
0.1378
8
1.3901
1.7742
1.4427
1.7755
1.4752
1.7732
1.5279
1.7647
0.0851
Observe que el máximo actual está resaltado para cada iteración. Después de ocho iteraciones, el máximo ocurre en x = 1.4427 con un valor función de 1.7755. Así, el resultado es convergente sobre el valor verdadero de 1.7757 e n x = 1.4276.
Recuerde que por bisección (véase sección 5.2.1), se puede calcular un límite superior exacto en cada iteración. Usando un razonamiento similar, un límite superior para la búsqueda de la sección dorada se puede derivar como sigue. Una vez que se completa una iteración, el óptimo estará en uno de los dos intervalos. Si x es el valor de la función óptima, estará en el intervalo inferior (x¡, x , x,). Si x, es el valor de la función en el punto óptimo, estará en el intervalo superior (x , x x ). Debido a que los puntos interiores son simétricos, cualquier caso se puede usar para definir el error. Observando en el intervalo superior, si el valor verdadero estuviera en el extremo izquierdo, la máxima distancia de la estimada podría ser 2
2
2
A.v = xi - x 0
v
u
2
= x\ + R{x
u
- x¡) - x„ + R(x
u
= (x, - x „ ) +2R(x
u
= {IR -
- x¡)
-xi)
!)(*„-*,)
o 0.236 (x — x¡) Si el valor verdadero estuviera en el extremo derecho, la máxima distancia de la estimada podría ser u
Axft = x¡, - x\ = x„ - x¡ - R(x
u
- x¡)
= (1-/?)(*«-*/) o 0.382 (x — x¡). Por tanto, este caso podría representar el error máximo. Tal resultado puede entonces ser normalizado al valor óptimo para esa iteración, x para dar u
o p t
Sa = 0 - / 0
Xu ~ XI
100%
Esta estimación proporciona una base para terminar las iteraciones.
13.1
PIOURA 13.5
BÚSQUEDA DE LA SECCIÓN DORADA
FUNCTION Gold
(xíow.xhigh.maxit.es.fx)
xt — xlow; xu = xhigh ¡ter = 1 d = R*(xuxt) xí = xt + d; x2 = xu — d fí = f(x1) f2 = f(x2) IF fí > fZ THEN xopt xí fx=fí ELSE xopt = x2 fx= f2 END ¡F DO d = K*d IFfí>f2 THEN xt = x2 x2= x1 x1 xt+d f2= fí fí = f(x1) EL5E xu — xí
IF fí < f2 THEN
1
IFfí f2 THEN xopt = xí fx=fí EL5E xopt - x2 fx=f2 END IF IFxopt*0. THEN ea = (1.-R)*A8S((xu - xt)/xopt) END IF IF ea < es OK ¡ter > maxit EXlT END DO Gold — xopt END Gold «) Maximización
IFfí < f2 THEN
* 100.
b) Minlmlzaolón
OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA
372
En la figura 13.5a, se presenta el pseudocódigo del algoritmo de búsqueda de la sección dorada. En la figura 13.5b se listan las pequeñas modificaciones para convertir el algoritmo a minimización. En ambas versiones el valor x para el óptimo se regresa como el valor función (dorado). Además, el valor def(x) en el óptimo se regresa como la variable f(x). Usted se preguntará por qué hemos hecho énfasis en la reducción de las funciones evaluación de la búsqueda de la sección dorada. Por supuesto, para resolver una sola optimización, la velocidad ahorrada podría ser insignificante. Sin embargo, hay dos importantes contextos donde minimizar el número de evaluaciones de la función puede ser importante. Éstos son 1.
2.
13.2
Muchas evaluaciones. Existe casos donde el algoritmo de búsqueda de la sección dorada puede ser una parte de muchos más cálculos. En tales casos, ésta podría llamarse muchas veces. Por tanto, manteniendo las evaluaciones de la función a un mínimo podría dar grandes dividendos para esos casos. Tiempo consumido en la evaluación. Por razones pedagógicas, se usan funciones sim pies en la mayoría de nuestros ejemplos. Usted debería entender que una función puedeser muy compleja y consumir mucho tiempo en su evaluación. Por ejemplo, en una parte posterior de este libro, se describirá cómo se puede usar la optimización para estimar los parámetros de un modelo que consiste de un sistema de ecuaciones difercí íciales. Para tales casos, la "función" involucró tiempo consumido en la integración del modelo. Cualquier método que minimiza tales evaluaciones podría ser ventaj oso.
INTERPOLACIÓN CUADRÁTICA La interpolación cuadrática tiene la ventaja del hecho que un polinomio de segundo orden con frecuencia proporciona una buena aproximación a la forma de f(x) cercana a un óptimo (véase figura 13.6).
F I G U R A 13.6 Ilustración gráfica de la interpolación cuadrática.
13.2
373
INTERPOLACIÓN CUADRÁTICA
Así como existe sólo una línea recta para conectar dos puntos, hay únicamente una cuadrática o parábola para conectar tres puntos. De esta forma, si se tiene tres puntos que juntos contienen un óptimo, se puede ajustar una parábola a los puntos. Después se puede diferenciar e igualar el resultado a cero, y resolver para una estimación de la óptima x. Se puede demostrar que después de un manejo algebraico el resultado es /(¿o) ( x - xj) + f{x\) (x¡ - x ) + f(x ) 2
(x - x )
2
2
2
2 / ( x ) (xi - x ) + 2f(x¡) (x - x ) + 2f(x ) 0
2
2
0
2
(x - x{)
2
0
donde x , x y x son los valores que fijan el extremo, y x es el valor de x que corresponde al máximo valor del ajuste cuadrático a los valores iniciales. Q
.2
] i
ji i j | ;
¡
j
| | !
I *i j | \ I
2
3
Interpolación cuadrática
Enunciado del problema. de
Use la interpolación cuadrática para aproximar el máximo
x — 2
f(x) = 2 sen x -
con valores iniciales de x = 0, x = 1 y x — 4. 0
Solución.
x
2
El valor de la función en los tres valores se puede evaluar,
x = 0
/(x ) = 0
0
0
x = 1 / ( x i ) = 1.5829 .v = 4 f{x ) = - 3 . 1 1 3 6 y sustituyendo en la ecuación (13.7) se obtiene, x
2
| |
x
2
_
0 ( l - 4 ) + 1.5829 (4 - O ) + (-3.1136) (O - l ) 2
2
2
2
2
2
=
}
5 Q 5 5
~ 2(0) (1 - 4 ) +2(1.5829) ( 4 - 0 ) + 2(-3.1136) (0 - 1) ~
X i
la cual tiene un valor de la función d e / ( 1.5055) = 1.7691. Después, se puede emplear una estrategia similar a la de la búsqueda de la sección dorada para determinar cuál punto se descartará. Ya que el valor de la función para el nuevo punto es mayor que para el punto intermedio (x,) y el nuevo valor de x está a la derecha del punto intermedio, el valor de inicio inferior (x ) se descarta. Por tanto, para la próxima iteración, 0
jc = 1
/ ( x ) = 1.5829
x, = 1.5055
/ ( * , ) = 1.7691
x = 4
/U ) =-3.1136
0
2
0
2
la cual so sustituye en la ecuación (13.7) para obtener
374
OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA
1.5829 (1.5055' -4')
+ 1.7691 ( 4
_
(-3.1136) ( I '
I.505.V')
l) + 2 ( - 3 . H 3 6 ) ( l
- 1.5055)
¿
2(1.5829)(1.5055 - 4 ) + 2(1.7691)(4 • = 1.4903
la cual tiene un valor de la función de/(1.4903) = 1.7714. El proceso se puede repetir, con los resultados tabulados abajo: /
-«o
1
0.0000 1.0000 1.0000 1.0000 1.4256
2 3
4 5
x
*i 0.0000 1.5829 1.5829 1.5829
1.7757
1.0000 1.5055 1.4903 1.4256 1.4266
1.5829 1.7691 1.7714 1.7757 1.7757
2
4.0000 4.0000 1.5055 1.4903 1.4903
flx )
* 3
4* )
-3.1136 -3.1136 1.7691 1.7714 1.7714
1.5055 1.4903 1.4256 1.4266 1.4275
1.7691 1.7/M 1.775/ 1.7/.'./ 1.77'./
2
3
Así, dentro de las cinco iteraciones, el resultado es rápidamente convergente sobre i-l valor verdadero de 1.7757 e n x = 1.4276.
Deberíamos mencionar que así como en el método de la falsa posición, la interpcln ción cuadrática puede quedarse con sólo un extremo de intervalo convergiendo. Así, ln convergencia puede ser lenta. Como prueba de lo anterior, observe que en nuestro pío, 1.0000 fue un punto final para la mayoría de la iteraciones. Este método, así como otros que usan polinomiales de tercer orden, se puede formu lar en algoritmos que contienen pruebas de convergencia, cuidadosas estrategias de selección para los puntos que habrán de retenerse en cada iteración e intentos de minimi/.m la acumulación del error de redondeo. En particular, vea el método de Brent's en y cois. (1992).
ejein
Press
13.3
M É T O D O DE N E W T O N Recuerde que el método de Newton-Raphson del capítulo 6, es un método abierto que encuentra la raíz de x como una función tal que f(x) = 0. El método se resume como f(x¡)
x¡+\ = X¡
fU,)
Se puede usar un planteamiento similar abierto para encontrar un óptimo de / ( \ ) ul definir una nueva función, g(x) — f\x). Así, como el mismo valor óptimo x* satisface ambos / ' ( x * ) = g(x*)
= 0
se puede usar lo siguiente
x,¡ + 1
X:
-
(MH .)
T*.#-TW!B1WB«rüB NEWTON
17B
"
como una técnica pura encontrar el mínimo o máximo de f(x). Se deberiu observar c¡uo esta ecuación puede también derivarse al escribir una serie de Taylor de segundo orden para /'(x) e igualar la derivada de la serie a cero. El método de Newton es abierto y similar al de Newton-Raphson porque no requiere de valores iniciales que contengan el óptimo. Además, también comparte la desventaja de poder ser divergente. Por último, es una buena idea verificar que la segunda derivada tenga usualmente el signo correcto para confirmar que la técnica converge sobre el resultado deseado. EJEMPLO 1 3 . 3
Método de Newton
I
Enunciado del problema. f(x) = 2 senx
Use el método de Newton para encontrar el máximo de
10
con un valor inicial de x = 2.5. 0
)
Solución. f(x)
La primera y segunda derivadas de la función se puede evaluar como = 2 eos x — -2 senx
las cuales se sustituyen en la ecuación (13.8) para obtener _
2 eos x¡ — x / 5 —2 senx,- — 1/5
Al sustituir el valor inicial se obtiene x
5 -
2 eos 2 . 5 - 2 . 5 / 5
=
a
9
9
5
Q
8
- 2 sen 2.5 - 1/5 la cual tiene un valor de la función de 1.57859. La segunda iteración da x, = 0.995 -
2 eos 0.995 - 0.995/5 - 2 sen 0.995 - 1/5
= 1.46901
la cual tiene un valor de la función de 1.77385. El proceso se repite, con los resultados abajo tabulados: f(x) 2.5 0.99508 1.46901 1.42764 1,427.5.5
0.57194 1.57859 1.77385 1.77573 1.77573
-2.10229 0.88985 -0.09058 -0.00020 0.00000
-1.39694 -1.87761 -2.18965 -2.17954 -2.17952
376 Asi, dentro de las cuatro iteraciones, el resultado converge en forma rápida sobre el vulor verdadero.
Aunque el método de Newton trabaja bien en algunos casos, no es práctico en otros donde las derivadas no se pueden evaluar en forma conveniente. Para estos casos, se dispone de otros procedimientos que no involucran la evaluación de la derivada. Por ejemplo, un método de Newton, en versión como la secante, se puede desarrollar al usar aproximaciones por diferencia finita para las evaluaciones de la derivada. Una restricción mayor con respecto al procedimiento es que puede divergir con base en la naturaleza de la función y la calidad del valor inicial. Así, usualmente se emplea sólo cuando se está cerca del óptimo. Las técnicas híbridas que usan procedimientos con intervalos lejos del óptimo y los métodos abiertos cercanos al óptimo intentan explotar los puntos fuertes de ambos procedimientos. Esto concluye nuestro tratamiento de los métodos para encontrar el óptimo de funciones de una sola variable. Algunos ejemplos de ingeniería se presentan en el capítulo 16. Por otra parte, las técnicas descritas aquí son un importante elemento de algunos procedimientos para optimizar funciones multivariables, que se analizarán en el próximo capítulo.
PROBLEMAS 13.1 Dada la fórmula
13.5 Repita el problema 13.3, pero ahora use el método de Newton. Emplee un valor inicial de x = 2 y realice tres iteraciones. 13.6 Analice las ventajas y desventajas de la búsqueda de la sección dorada, interpolación cuadrática y el método de Newton para localizar un óptimo valor en una dimensión. 13.7 Emplee los siguientes métodos para determinar el máximo de 0
f(x) = x - 8x + 12 2
a) Determine en forma analítica el máximo y el valor correspondiente de x para esta función (use por ejemplo, diferenciación). b) Verifique que con la ecuación (13.7) se obtienen los mismos resultados con base en los valores iniciales x = 0,x = 2 y x = 6. 13.2 Dada la función 0
l
2
f(x) = 2..Y - 1 J5x
2
+ \Ax
3
- 0.25.V
4
a) Búsqueda de la sección dorada (x¡ = —2, x = 4, e = 1%). b) Interpolación cuadrática (x = 1.75, x, = 2, x = 2.25, iteraciones = 5). c) Método de Newton (x = 2.5, e = 1 %). 13.8 Considere la siguiente función: u
/(,v) = -l.5x
6
- 2 x + 12* 4
0
s
2
a) Grafique la función. /;) Use métodos analíticos para probar que la función es cóncava para todos los valores de x. >. En ambos casos, las segundas deri-
FIGURA 14.8 Un punto de silla (x = o y y = b) . Observe que al ser vista la curva a lo largo de las direcciones x y y, la función parece ir hacia un mínimo (la segunda derivada es positiva), mientras que al verse a lo largo del eje x = y, es cóncava hacia abajo (la segunda derivada es negativa).
,
f(x< y) t
388
OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES
vadas parciales son positivas. Sin embargo, si la función se observa a L O largo de lu Unen y = x, puede verse que ocurre un máximo en el mismo punto. Esta fo R M U es llamada do y, claramente, no ocurren ni un máximo ni un mínimo en el p u n t o . Ya sea que ocurra un máximo o un mínimo, esto involucra no s«ólo a las PARCIULCN con respecto ax y y, sino también a la segunda parcial con respecto a JC y y. Suponiendo que las derivadas parciales sean continuas en y cerca del punto que hah>rá de evaluarse, se puede calcular la siguiente cantidad:
silla \H\ =
A / 2
8x
(14.3)
dxdy
dy
2
2 K
Pueden ocurrir tres casos:
a^fdx > (Pfdx < 2
f(x, y) f(x, y)
•
Si | H | > 0 y
0, entonces
•
Si | H | > 0 y
•
Si | H | < 0, entonces f(x, y) tiene un punto de silla.
2
0, entonces
tiene un mínimo local.
tiene un máximo local.
df "1 " 9 / La cantidad | H | es igual al determinante de una matriz f o r m a d a con las scguiulim dxdy dx derivadas. H = (14.4) 2
2
2
1
df
9 /
_ dydx
dy
2
2
2
_
donde esta matriz se encuentra formalmente referida como el Hessia j% d e / Además proporciona un medio para discernir si una función mxiltidimensional ha alcanzado el óptimo; el Hessian tiene otros usos en optimización ( p o r ejemplo, para lu forma multidimensional del método de Newton). En particular, p e r n o t e búsquedas qiip incluyen curvatura de segundo orden para obtener resultados superio» res. Aproximaciones por diferencias finitas. Se debe mencionar que, j p a r a los casos don de son difíciles o inconvenientes de calcular en forma analítica, a m b o s , el gradiente y el determinante de Hessian, se pueden evaluar numéricamente. En la m_.ayoría de los castiN se emplea el procedimiento que se introdujo en la sección 6.3.3 p a j a el método de la secante modificado. Esto es, las variables independientes se pueder^ modificar ligera mente para generar las derivadas parciales requeridas. Por ejemplo, si se adopta el proco dimiento de diferencias centrales, éstas se pueden calcular como 9/
f(
=
x
+
Sx,y)-f(x-Sx,y)
dx
(I4..1)
2Sx
d¿
f(x,y+Sy)-f(x,y-Sy)
=
dy
(14,n)
2Sy
df 2
=
f(x + Sx, y) - 2f(x,
dx
(14.7)
2
d J!(dx dy) = d fl(dy dx). 2
' Observe que
y) - f(x - Sx, y)
Sx
2
2
rmvt
m c i w w w v w i m r
_ / ( ^ y + ¿y) - 2 / ( . v , y) - / ( . v , y • í)y
2
~
M
&y
2
(14.8)
a/ _ 2
3x3_y / ( x + 5x, y + Sy) - /(* + Sx, y - Sy) - f(x - Sx, y + Sy) + f(x - Sx, y -
Sy)
4SxSy
(14.9) donde S es un valor fraccional algo pequeño. Observe que los métodos empleados en paquetes de software comerciales también usan diferencias hacia adelante. Además, ellos son usualmente más complicados que las aproximaciones enlistadas en las ecuaciones (14.5) a la (14.9). Por ejemplo, la librería IMSL basa la perturbación en el épsilon de la máquina. Dennis y Schnabel (1996) proporcionan más detalles sobre el procedimiento. Sin importar cómo se implemente la aproximación, el punto importante es que se pueda tener la opción de evaluar el gradiente y/o el Hessian en forma analítica. Esto puede algunas veces ser una tarea ardua, pero el comportamiento del algoritmo puede ser lo bastante benéfico como para que el esfuerzo valga la pena. Las derivadas de forma cerrada serán exactas, pero lo más importante es que reduce las evaluaciones de la función. Este último punto tiene un impacto crítico en el tiempo de ejecución. Por otro lado, usted practicará con frecuencia la opción de calcular estas cantidades internamente mediante procedimientos numéricos. En muchos casos, el comportamiento será el adecuado y se evita la dificultad de numerosas diferenciaciones parciales. Tal podría ser el caso de los optimizadores usados en ciertas hojas de cálculo y paquetes de software matemático (por ejemplo, Excel). En tales casos, se podría no tener la opción de introducir un gradiente y un Hessian derivado en forma analítica. Sin embargo, para problemas de tamaño pequeño o moderado esto no es una gran desventaja. 14.2.2
M é t o d o de pasos ascendente
Una estrategia obvia para subir una colina podría ser determinar la pendiente máxima en la posición inicial y después comenzar a caminar en esa dirección. Pero claramente surge otro problema casi de inmediato. A menos que usted realmente tenga suerte y empiece sobre una cresta que apunta directamente a la cima, tan pronto como se mueva, su camino podría divergir en la dirección de pasos ascendente. Al darse cuenta de este hecho, usted podría adoptar la siguiente estrategia. Podría caminar una distancia corta a lo largo de la dirección gradiente. Luego podría detenerse, reevaluar el gradiente y caminar otra distancia corta. Mediante la repetición de este proceso podría llegar eventualmente al pico de la colina. Aunque tal estrategia parece ser superficialmente buena, no es muy práctica. En particular, la reevaluación continua del gradiente puede ser demandante en términos computacionales. Se prefiere un planteamiento que involucra moverse en un camino fijo a lo largo del gradiente inicial hasta que f(x, y) detenga los incrementos; es decir, pase a ser el nivel a lo largo de su dirección de viaje. Este punto de paro pasa a ser el punto inicial donde V/es reevaluada y se sigue una nueva dirección. El proceso se repite hasta que se alcance la cima. Este procedimiento es conocido como método de pasos aseen-
FIGURA 14.9 Representación gráfica del método de pasos ascendente.
dente} Es la más directa de las técnicas de búsqueda del gradiente. La idea básica detrito del procedimiento se describe en la figura 14.9. Comenzaremos en un punto inicial (x ,y ) etiquetado como " 0 " en la figura. En este punto, se determina la dirección de pasos ascendente; esto es, el gradiente. Entonces se busca a lo largo de la dirección del gradiente, h , hasta que se encuentra un máximo, el cual es etiquetado como " 1 " en la figura. El proceso entonces se repite. Así, el problema se puede dividir en dos partes: 1) determinar la "mejor" dirección para la búsqueda y 2) establecer "el mejor valor" a lo largo de esa dirección de búsqueda. Como se verá, la efectividad de varios algoritmos descritos en las siguientes páginas depende de qué tan hábil seamos en ambas partes. Por ahora, el método de pasos ascendente usa el método del gradiente como su el ce ción para la "mejor" dirección. Se ha mostrado ya cómo se evalúa el gradiente en el ejemplo 14.1. Ahora, antes de examinar cómo se lleva el algoritmo para localizar el máximo a lo largo de la dirección de pasos, se debe hacer una pausa para explorar el modo de trans formar una función de x y y en una función de h a lo largo de la dirección gradiente. Comenzando e n x y y , las coordenadas de cualquier punto en la dirección gradiente pueden expresarse como 0
0
0
0
x =x
0
+
0
—h dx f
d
(14.10)
,
(14.11)
y = yo + dy
2
Debido ii nuestro ónlasis sobre la maximización, se usurrt lii terniinolonla do /w.vuv u,. v) ,= 2.v + j 2
Construya y resuelva un sistema de ecuaciones algebraicas lineales que maximice/(*). Observe que esto se realiza al igualar a cero las derivadas parciales de/con respecto a x y y. 14.4 a) Empiece con un valor inicial de x — 1 y y = 1 y emplee dos aplicaciones del método de pasos ascendente a f(x, y) para el problema 14.3. b) Construya una gráfica con los resultados del inciso a) anterior mostrando la trayectoria de la búsqueda. Encuentre el valor mínimo de
2
P i n - 2 y y = 2 en la dirección de h = 3/ + 2j. H J l'nitientre el vector gradiente y la matriz Hessian para cada tilín do las siguientes funciones ,i) íi\,y) = 2xy + 3 ^ 2
/.) I\\.y,z)
= x +y 2
2
+ 2z
i
.•) /U.y) = m(x + 2xy + 3y ) 2
2
/(A,
l ' M Dada /(\,
Y) ^ 2xy
+
\.5y
-
1.25A- 2
y) = (x-
2)
2
+
(Y -
3)
2
empezando en x — 1 y y = 1, usando el método de pasos descendente con un criterio de paro de £ = 1 %.
2y
2
5
FIOURA P 1 4 . 9 lu
LII'IM]II(¡cla
de la malla. -5
-2
<
-1 \
-10
0
Menta»,
-15-20-25
2
X
OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES
39B
1 4 . 6 Realice nuil iteración del método de pasos ascendente para locali/ur el máximo de
,/lv, v) =
3.5.V + 2y + .x - x 2
4
-
2xy
-
y
2
mediante los valores iniciales x = 0, y = 0. Emplee el método de bisección para encontrar el tamaño de paso óptimo en la dirección de la búsqueda del gradiente. 1 4 . 7 Efectúe una iteración del método de pasos descendente del gradiente óptimo para localizar el mínimo de /(.v, y) = -Ix
+ \ .2x + 1 ly + 2 y - 2xy 2
2
con valores iniciales x = 0 y y = 0. 1 4 . 8 Desarrolle un subprograma usando un programa o lenguaje macro para implementar el método de búsqueda aleatoria.
Diseñe el subprograma do tal forma que esté expresamente di señado para localizar un máximo. Pruebe el programa con f(x,y) del problema 14.6. Use un rango de —2 a 2 para ambos xyy14.9 La búsqueda por malla es otro procedimiento de fuer/a bruta para optimización. La versión en dos dimensiones se des cribe en la figura P14.9. Las dimensiones de x y y se dividen en pequeños incrementos para crear una malla. La función se eva lúa entonces en cada nodo de la malla. Cuanto más densa sea la malla, es más probable localizar el óptimo. Desarrolle un subprograma por medio de un programa o lenguaje macro para implementar el método de búsqueda por malla. Diseñe el subprograma de tal forma que esté expresanien te diseñado para localizar un máximo. Pruebe su programa con el problema del ejemplo 14.1.
CAPITULO 15 Optimización restringida Este capítulo aborda problemas de optimización donde entran enjuego las restricciones. Primero, se analizarán problemas donde ambas, la función objetivo y las restricciones, son lineales. Para tales casos, se dispone de métodos especiales que aprovechan la linearidad de las funciones realzadas. Los llamados métodos de programación lineal y sus algoritmos resultantes, resuelven con gran eficiencia problemas muy grandes con miles de variables y restricciones. Dichos métodos se usan en un amplio rango de problemas en la ingeniería y la administración. Después, se retomará en forma breve un problema más general de optimización restringida no lineal. Finalmente, se proporcionará una revisión de cómo se puede emplear los paquetes de software y librerías para la optimización.
15.1
PROGRAMACIÓN
LINEAL
La programación lineal (o PL por simplicidad) es un procedimiento de optimización que trata de cumplir con un objetivo como el de maximizar las utilidades o minimizar el costo, en presencia de restricciones como lo son las fuentes limitadas. El término lineal denota que las funciones matemáticas que representan ambos, el objetivo y las restricciones, son lineales. El término programación no significa "programación en computadora", más bien denota "programar" o "fijar una agenda" (Revelle y cois. 1997). 15.1.1
Forma estándar
El problema básico de programación lineal consiste en dos partes principales: la función objetivo y un conjunto de restricciones. Para un problema de maximización, la función objetivo es por lo general expresada como Maximizar Z =
cx i
l
+ c¿x
+ • • • + c pc
2
t
n
(15.1)
donde c = pago por cada unidad de la y-ésima actividad que se lleva a cabo y Xj = magnitud de laj'-ésima actividad. Así, el valor de la función objetivo, Z, es el pago total debido al número total de actividades, n. Las restricciones se pueden representar en forma general como y
a; 1 * 1 +
a/2*2
-\
1" a x m
n
< b¡
(15.2)
donde a¡¡ = cantidad de z'-ésima fuente que se consume por cada unidad de /-ésima actividad y h¡ = cantidad de la /-ésima fuente que está disponible. Esto es, las fuentes Hon limitadas.
OPTIMIZACIÓN RESTRINGIDA El segundo tipo general de restricción especifica que todas las actividades deben tener un valor positivo. ,v, > 0
(I.VM
En el contexto actual, esto expresa la noción realística de que, para algunos problemas, la actividad negativa es físicamente imposible (por ejemplo, no se puede producir bienes negativos). Juntas, la función objetivo y las restricciones, especifican el problema de programo ción lineal. Estas indican que se trata de maximizar la amortización para un número do actividades bajo la restricción de que éstas utilizan cantidades finitas de fuentes. Anlos de mostrar cómo se puede obtener este resultado, se desarrollará un ejemplo. Inicializando el problema PL Enunciado del problema. Se desarrolla el siguiente problema del área de la ingeniet in química. Sin embargo, éste es relevante para todas las áreas de la ingeniería que (icnoii que ver con la producción de productos con fuentes limitadas. Suponga que una planta procesadora de gasolina recibe cada semana una canlidiul fija de materia prima para gasolina. Esta última se procesa en dos tipos de gasolina, do calidad regular y prémium. Estas clases de gasolina son de alta demanda; es decir, so tiene garantizada su venta y se obtiene diferentes utilidades para la compañía. Sin om bargo, su producción involucra ambas restricciones, tiempo y almacenaje en sitio. I'oi ejemplo, sólo una de las clases se puede producir a la vez, y las instalaciones csliin abiertas solamente 80 horas por semana. Además, existe un límite de almacenamiento para cada uno de los productos. Todos estos factores se enlistan abajo (observe que umi tonelada métrica, o ton, es igual a 1 000 kg):
Producto Recurso
Regular
Prémium
D i s p o n i b i l i d a d del r a c u r t s
Materia prima para la gasolina Tiempo de producción Almacenamiento
7 m /tone!ada 10 hr/tonelada 9 toneladas
11 m /tonelada 8 hr/tonelada 6 toneladas
Aprovechamiento
150/tonelada
175/tonelada
3
3
7 7 m /semannfal
—
I < A v
J.
17C.V-
2
13.1
PROGRAMACIÓN L1NIAI
o escribirlo como una función objetivo en programación lineal, Maximizar Z = 150*1
¡
2
Las restricciones se pueden desarrollar en una forma similar. Por ejemplo, el total de gasolina cruda utilizada se puede calcular como
1 | i
175x
Total de gasolina utilizada = 7x^ + 1 \x
2
Este total no puede exceder el abastecimiento disponible de 77 m /semana, así que la restricción se puede representar como 3
7x, + 1 lx < 77 2
Las restricciones restantes se pueden desarrollar en una forma similar, la formulación total resultante para la PL está dada por Maximizar Z = 150*! + 175x
2
(maximizar la ganancia)
Sujeta a 7x, + 1lx < 77 10x, + 8x < 80 X! < 9 x 0 2
2
2
2
(restricciones de materiales) (restricción de tiempo) (restricción de almacenaje "regular") (restricción de almacenaje "prémium") (restricciones positivas)
Observe que el conjunto de ecuaciones anterior constituye la formulación completa de PL. Las explicaciones en los paréntesis de la derecha se han incluido para clarificar el significado de cada ecuación.
15.1.2
Solución gráfica
Debido a que las soluciones gráficas están limitadas a dos y tres dimensiones, tienen utilidad práctica limitada. Sin embargo, son muy útiles para demostrar algunos conceptos básicos que resaltan las técnicas algebraicas generales usadas para resolver problemas con grandes dimensiones en la computadora. Para un problema en dos dimensiones, como el del ej emplo 15.1, la solución espacial se define como un plano conX] medida a lo largo de la abscisa y x , a lo largo de la ordenada. Como las restricciones son lineales, se pueden trazar sobre este plano como líneas rectas. Si el problema de PL se formula adecuadamente (es decir, si tiene una solución), estas líneas restrictivas delinearán una región, llamada el espacio de solución factible, englobando todas las posibles combinaciones dex, y x que obedecen las restricciones y, por tanto, representan soluciones factibles. La función objetivo para un valor particular de Z se puede trazar como otra línea recta y sobrepuesta en este espacio. El valor de Z puede entonces ser ajustado hasta que esté en el máximo valor, mientras todavía toca el espacio factible. Este valor de Zrepresenta la solución óptima. Los valores correspondientes dex y x , donde Z toca el espacio de solución factible, representan los valores óptimos pura las actividades. El siguiente ejemplo deberá ayudar a clarificar el procedimiento, 2
2
{
2
402
OPTIMIZACIÓN RESTRINGIDA EJEMPLO 15.2
Solución gráfica
Enunciado del problema. Desarrolle una solución gráfica para el problema de procesamiento de gasolina que se derivó antes en el ejemplo 15.1: Maximizar Z
150x, + 175x
2
Sujeta a + l l x < 77
(1)
10x, + 8x < 80
(2)
7JCI
2
2
< 9
(3)
x < 6
(4)
0
(5)
>0
(6)
x\ 2
xi xi
>
Se ha numerado las restricciones para identificarlas en la siguiente solución gráfica. Solución. Primero, se pueden trazar las restricciones sobre el espacio de solución. Por ejemplo, se puede formular la primera restricción como una línea al reemplazar la desigualdad por un signo de igual y resolver para x : 2
Xl
Así, como en la figura 15.1a, los valores posibles dex, y x que obedecen dicha restricción se hallan por debajo de esta línea (la dirección es designada en la gráfica por la pequeña flecha). Las otras restricciones se pueden evaluar en forma similar, como sobrepuestas sobre la figura 15.1a. Observe cómo éstas encierran una región donde todas se encuentran. Este es el espacio de solución factible (el área ABCDE en la gráfica). Además de definir el espacio factible, la figura 15.1a también proporciona un conocimiento adicional. En particular, se puede ver que la restricción 3 (almacenamiento de gasolina regular) es "redundante". Esto es, el espacio de solución factible no resulla afectado si fuese suprimida. Después, se puede agregar la función objetivo a la gráfica. Para hacer esto, se debe escoger un valor de Z. Por ejemplo, para Z = 0 la función objetivo es ahora 2
0 = 150xi + 175x o, resolviendo para x x
2
2
150 2
175
X l
Como se muestra en la figura 15.16, ésta representa una línea punteada interceptando el origen. Ahora, puesto que estamos interesados en maximizar Z, se puede aumentar osla » digamos 600, y la función objetivo es x¡
DOO
150
175
175
x\
FIGURA 15.1 ' » n ' m gráfica de un problema de programación lineal, a) Las restricciones definen un espacio de solución factible. M li i liilición objetivo se puede incrementar hasta que alcance el valor más alto que cumpla con todas las restricciones. < iiólii uniente, se mueve hacia arriba y a la derecha hasta que toca el espacio factible en un solo punto óptimo.
Así, incrementando el valor de la función objetivo, la línea se mueve lejos del origen. Como la línea todavía está dentro del espacio de solución, nuestro resultado es aún factible. Sin embargo, por la misma razón, todavía hay espacio para mejorarlo. Por tanto, Z se puede seguir aumentando hasta que un incremento adicional lleve la función objetivo más allá de la región factible. Como se muestra en la figura 15.1¿>, el valor máximo de Z corresponde a 1 400 aproximadamente. En este punto, x y x son casi igual a 4.9 y 3.9, en forma respectiva. Así, la solución gráfica indica que si se producen estas cantidades de gasolinas regular y prémium, se alcanzará una máxima utilidad de casi 1 400. {
2
Además de determinar los valores óptimos, el procedimiento gráfico proporciona conocimientos adicionales en el problema. Esto se puede apreciar al sustituir de nuevo las soluciones en las ecuaciones restrictivas. 7(4.9) + 11(3.9) = 77 10(4.9) + 8(3.9) = 80 4.9 < 9 3.9 < 6 En consecuencia, como queda también claro en la gráfica, producir la cantidad óptima de cada producto nos lleva directamente al punto donde se encuentran las restricciones de las fuentes (1) y del tiempo (2). Tales restricciones se dice que están enlazadas. Además, la gráfica también hace evidente que ninguna de las restricciones de almacena-
404
OPTIMIZACIÓN RESTRINGIDA
miento [(3) y (4)] actúan como una limitante. Tales restricciones se conocen como iu> enlazadas. Esto nos lleva a la conclusión práctica de que, para este caso, se puedo ¡ni mentar las utilidades, ya sea con un incremento en el abastecimiento de fuentes (la gasolina cruda) o en el tiempo de producción. Además, esto indica que el aumento 0
Advierta cómo se han formulado de igual modo las cuatro ecuaciones, de tal manera que las incógnitas están alineadas en las columnas. Se hizo así para resaltar que ahora se trata de un sistema de ecuaciones algebraicas lineales (recuerde la parte tres). En la siguiente sección se mostrará cómo se pueden usar estas ecuaciones para determinar los puntos extremo en forma algebraica. Solución algebraica. En contraste con la parte tres, donde se tenía ra ecuaciones con // incógnitas, nuestro sistema ejemplo [ecuaciones (15.4)] está subespecificado; esto es, tiene más incógnitas que ecuaciones. En términos generales, hay n variables estructuradas (es decir, las incógnitas originales), m excedentes o variables de holgura (una por restricción), y n + m variables totales (estructuradas más excedentes). Para el problema de la producción de gasolina se tienen 2 variables estructuradas, 4 variables de holgura y 6 variables totales. Así, el problema involucra resolver 4 ecuaciones con 6 incógnitas. La diferencia entre el número de incógnitas y el de ecuaciones (igual a 2 en nuestro problema) está directamente relacionada con la forma en que se puede distinguir un punto extremo factible. En forma específica, cada punto factible tiene 2 variables de las 6 que se igualaron a cero. Por ejemplo, los cinco puntos esquina del área ABCDE tienen los siguientes valores cero: Punto extremo
Variables cero
A B C D E
x,, x
2
S|, s
2
Sj,
4
s
X], S
4
Esta observación nos lleva a concluir que los puntos extremo se pueden determinni en la forma estándar al igualar las dos variables a cero. En nuestro ejemplo, esto reduce el problema a una forma soluble de 4 ecuaciones con 4 incógnitas. Por ejemplo, para el punto E, haciendo x, = S = 0 se reduce la forma estándar a 4
llx +Si
=77
2
8x
2
+ S
=80
2
+ S = 9 3
X2
=6
la cual se puede resolver para x = 6, S, = 11, S = 32 y S = 9. Junto con *| -- S 0, estos valores definen el punto E, 2
2
3
4
15.1
PROGRAMACIÓN LINEAL
Para generalizar, una solución básica para m ecuaciones lineales con n incógnitas so desarrolla al igualar n — m variables a cero, y resolviendo las tn ecuaciones para las m incógnitas restantes. Las variables cero son formalmente referidas como variables no básicas, mientras las m variables restantes son llamadas variables básicas. Si todas IUN variables básicas son no negativas, el resultado es llamado solución factible básica. VA óptimo será una de éstas. Ahora un procedimiento directo para determinar la solución óptima podría ser calcular todas las soluciones básicas, para determinar cuáles son factibles, y entre ellas, cuál tiene el valor de Z más grande. Pero éste no es un buen procedimiento por dos razones. Primero, para problemas de tamaños moderados, el procedimiento puede involucrar resolver una gran cantidad de ecuaciones. Para m ecuaciones con n incógnitas, se deben resolver
m\(n-m)\
m
ecuaciones simultáneas. ¡Por ejemplo, si hay 10 ecuaciones (m — 10) con 16 incógnitas (« = 16), se podría tener 8 008 [ = 16!/(10! 6!)] sistemas 10 X 10 de ecuaciones a resolver! Segundo, una porción significativa de éstas puede ser no factible. Por ejemplo, en el problema actual de los C\ — 15 puntos extremos, sólo 5 son factibles. Claramente, si se pudiese evitar resolver todos estos sistemas innecesarios, se podría desarrollar un algoritmo más eficiente. Un procedimiento como tal se describe a continuación. Implementación del método simplex. El método simplex evita las ineficiencias descritas en la sección anterior. Esto lo realiza al comenzar con una solución factible básica. Luego se mueve a través de una secuencia con las otras soluciones factibles básicas que sucesivamente mejoran el valor de la función objetivo. En forma eventual, se alcanza el valor óptimo y termina el método. Se ilustrará el procedimiento mediante el problema de procesamiento de la gasolina de los ejemplos 15.1 y 15.2. El primer paso es empezar en una solución factible básicu (es decir, en una esquina del punto extremo del espacio factible). Para casos como los nuestros, un punto de inicio obvio podría ser el A; esto es, x = x = 0. Las 6 ecuaciones originales con 4 incógnitas serían l
Si
2
= 77 S
= 80
2
S
=9
2
5 = 6 4
Así, los valores iniciales de las variables básicas son dados automáticamente como iguales a los lados derecho de las restricciones. Antes de proceder al siguiente paso, la información inicial se puede ahora resumir en un formato tabular conveniente llamado representación. Como se muestra en la tabla de la siguiente página, la representación proporciona un resumen conciso de la información clave que constituye el problema de programación lineal.
408
OPTIMIZACIÓN RESTRINGIDA Básica
Z
Z 5, S s 5
1 0 0 0 0
2
3
4
x
* 1
-150 7 10 1 0
s
Si
2
-175 11 8 0
0 1 0 0 0
1
s
2
0 0 1 0 0
3
0 0 0 1 0
s
Solución
4
0 0 0 0 1
Intercepción
0 77 80 9
1 1 íi 9
ó
Observe que para propósitos de la representación, la función objetivo se expresa como Z - 150*i - 175*2 - OS, - 0S - 0 S - 0S = 0 2
3
(15.5)
4
El siguiente paso implica moverse a una nueva solución factible básica que nos lleva a una mejora de la función objetivo. Esto se lleva a cabo al aumentar una variable actual no básica (en este punto, x, o x ) por arriba de cero para que Z aumente. Recuerde que, para el ejemplo actual, los puntos extremos deben tener 2 valores cero. Por tanto, una de las variables básicas actuales (S S , S o S ) deben también igualarse a cero. Para resumir este paso importante: una de las variables no básicas actuales debe hacerse básica (no cero). Esta variable se llama variable de entrada. En el proceso, una de las variables básicas actuales se hace no básica (cero). Esta variable se llama variable de salida. Ahora, desarrollaremos un procedimiento matemático para seleccionar las variables de entrada y salida. Debido a la convención de cómo se escribe la función objetivo [véase ecuación (15.5)], la variable de entrada puede ser cualquier variable en la función objetivo que tenga un coeficiente negativo (ya que esto hará a Z más grande). La variable con el valor negativo más grande se escoge de manera convencional porque nos lleva usualmente al incremento más grande en Z. Para nuestro caso, x podría ser la variable de entrada puesto que su coeficiente, —175, es más negativo que el coeficiente d e x , — 150. En este punto se puede consultar la solución gráfica por visualización. Se comienza en el punto A, como se muestra en la figura 15.3. Con base en su coeficiente, se debería escogerx para introducirlo. Sin embargo, para continuar con este breve ejemplo, seleccionamos x¡ puesto que se observa en la gráfica que nos llevará más rápido al máximo. Después, se debe escoger la variable de salida de entre las variables básicas actuales S2, S o S ). Se puede ver gráficamente que hay dos posibilidades. Moviéndonos al punto B se tendrá S igual a cero, mientras que al movernos al punto F tendremos .V, igual a cero. Sin embargo, por la gráfica también queda claro que F no es posible, ya que queda fuera del espacio de solución factible. Así, se decide mover de A a B. ¿Cómo se detecta el mismo resultado en forma matemática? Una forma es calcular los valores para los cuales las líneas de restricción interceptan el eje o línea que corresponde a la variable de salida (en nuestro caso, el eje x,). Se puede calcular este valor como la razón del lado derecho de la restricción (la columna "Solución" de la representación) al coeficiente correspondiente de x¡. Por ejemplo, para la primera variable de holgura restrictiva S , el resultado es 2
1(
2
3
4
2
(
2
3
4
2
x
Intercepción =
77 7
=11
Las intersecciones restantes se pueden calcular y enlistar como la úllima columna de la tabla. Como 8 es el entero positivo más pequeño, esto significa que la segunda linea
13,1
m
PROGRAMACIÓN L I N E A L
restringida se alcanzará primero en tanto x aumente. Por tanto, S debería ser la variable de entrada. En este punto, se ha movido al punto B (x = S = 0), y la nueva solución básica es ahora x
2
2
7 x i + Si
= 7 7
lOx,
= 80 + S
x,
2
= 9
3
S
4
=
6
La solución de este sistema de ecuaciones define en forma efectiva los valores de las variables básicas en el punto B: x, = 8, 5*, = 21, S = 1, S = 6. La tabla se puede usar para realizar los mismos cálculos al emplear el método de Gauss-Jordan. Recuerde que la estrategia básica detrás de Gauss-Jordan implica conver tir el elemento pivote a 1 Y después eliminar los coeficientes en la misma columna arriba Y abajo del elemento pivote (recuerde la sección 9.7) Para este ejemplo, el renglón pivote es S (la variable de entrada) Y el elemento pivote es 10 (el coeficiente de la variable de salida, X J ) . Al dividir el renglón ende 10 Y reemplazar S por x, se tiene 3
4
2
2
Básica Z
z
1 0 0 0 0
s,
s
3
x
* 1
-150 7 1
1 0
2
-175
11 0.8 0 1
Si 0 1 0 0 0
S
2
S
3
0 0 0.1
0 0 0
0 0
1 0
S
4
0 0 0 0 1
Solución 0 77 8 9
ñ
OPTIMIZACIÓN RESTRINGIDA
Después, los coeficientes x, en los otros renglones se pueden eliminar. Por ejemplo, |(M« el renglón de la función objetivo, el renglón pivote se multiplica por 150 y se IOMM »»l resultado del primer renglón para dar
Z
2
x
* 1
S
« I
S
2
S
3
Solución
4
1 -0
-150 -(-150)
-175 -1-120)
0 -0
0 -15)
0 0
0 0
1
0
-55
0
15
0
0
11
( 1 '.'< ii I|
:nn
1
Operaciones similares se pueden ejecutar en los renglones restantes para obtener la mirva tabla
Básica
Z
Z
1 0 0 0 0
S,
S
4
x
i
x
0 0 1 0 0
-55 5.4 0.8 -0.8 1
2
Si
S
0 1 0 0 0
15 -0.7 0.1 -0.1 0
S
3
0 0 0 1. 0
Solución
4
0 0 0 0 1
Intercepción
1 200 21 8 1 ó
:i.HH7 10 6 -1
y>
Así, la nueva tabla resume toda la información para el punto B. Esto incluye el hecho iln que el movimiento ha aumentado la función objetivo a Z = 1 200. Esta tabla se puede usar entonces para representar el próximo, y en este caso, el pum > final. Sólo una más de las variables, x , tiene un valor negativo en la función objetivo, y se escoge, por tanto, como la variable de salida. De acuerdo con los valores de la intei cepción (ahora calculados como la columna de solución sobre los coeficientes de la columna x ), la primera restricción tiene el valor positivo más pequeño y, por tanto, se selecciona a S, como la variable de entrada. Así, el método simplex mueve los puntos dr B a C e n la figura 15.3. Por último, la eliminación Gauss-Jordan se puede implemcnluí para resolver las ecuaciones simultáneas. El resultado es la tabla final, 2
2
Básica
1 0 0 0 0
Z X
2
*1
5
3
S
4
Z
* 1
0 0 1 0 0
x
2
0 1 0 0 0
S ,
10.1852 0.1852 -0.1481 0.1481 -0.1852
S
2
7.8704 -0.1296 0.2037 -0.2037 0.1296
S
S
3
0 0 0
1 0
4
0 0 0 0 1
Solución i 4 I : Í HHV
4 111 A HIIV '¿111
Se sabe que éste es el resultado final porque no quedan coeficientes negativos en el renglón de la función objetivo. La solución final se tabula como x¡ — 3.889 y x
}
4.889, los cuales dan una función objetivo máxima de Z = I 413.889. Además, como .V, v Si
OITÁN
todavía en la base, sabemos que la solución está limitudu por ln primer» y
15.2
OPTIMIZACIÓN RESTRINGIDA N O LINEAL Existe un número de procedimientos para el manejo de problemas de optimización no lineal en la presencia de restricciones. Dichos procedimientos se pueden dividir en forma general en directos e indirectos (Rao, 1996). Un procedimiento típico indirecto usa las muy conocidas funciones de penalización. Estas involucran colocar expresiones adicionales para hacer la función objetivo menos óptima en tanto la solución se aproxima n la restricción. Así, la solución será no aceptada por violar las restricciones. Aunque talos métodos pueden ser útiles en algunos problemas, pueden ser difíciles cuando el problema involucra muchas restricciones. El método de búsqueda del gradiente reducido generalizado, o GRG (por sus siglas en inglés), es uno de los más populares métodos directos (para detalles, véase Lasdon y cois., 1978; Lasdon y Smith, 1992). Este es, de hecho, el método no lineal usado en el Solver de Excel. Primero "reduce" el problema a uno de optimización no restringida. Esto lo hace al resolver un conjunto de ecuaciones no lineales para las variables básicas en términos do variables no básicas. Después, se resuelve el problema no restringido usando procedimientos similares a los descritos en el capítulo 14. Se escoge primero una dirección do búsqueda. La selección por default es un procedimiento cuasi-Newton (BFGS) que, como se describió en el capítulo 14, requiere el almacenamiento de una aproximación de la matriz Hessian. Este procedimiento se ejecuta muy bien en la mayoría de los casos. El procedimiento del gradiente conjugado está también disponible en Excel como una alternativa para problemas grandes. El Solver de Excel tiene la excelente característica que en forma automática cambia al método del gradiente conjugado dependiendo de la disponibilidad de almacenamiento. Una vez que se ha establecido la dirección de búsqueda, se lleva a cabo la búsqueda en una dimensión a lo largo de esa dirección mediante un procedimiento de tamaño de paso variable.
15.3
O P T I M I Z A C I Ó N C O N P A Q U E T E S DE S O F T W A R E Los paquetes de software y librerías tienen grandes capacidades para la optimización. En esta sección, se dará una introducción a algunos de los más útiles. 15.3.1
Momead
Mathcad contiene una función en modo numérico llamada Find, que se puede usar parn resolver hasta 50 ecuaciones algebraicas no lineales simultáneas con restricciones de desigualdad. El uso de esta función para aplicaciones no restringidas se describió en In parte dos. Si Find falla en la localización de una solución que satisface las ecuaciones y restricciones, regresa con un mensaje de error "no se encontró solución". Sin embargo, Mathcad contiene también una función similar llamada Minerr. Esta función da resultados de solución que minimizan los errores en las restricciones aun cuando no puedan encontrarse soluciones exactas. Esta función resuelve ecuaciones y acomoda varias restricciones mediante el método Lenenberg-Marquardt tomando de los algoritmos do dominio público M1NPACK, desarrollados y publicados por el Laboratorio Nacional Argonne.
OPTIMIZACIÓN RESTRINGIDA
Hagamos un ejemplo donde se utiliza Find para resolver un sistema de ecuaciones no lineales con restricciones que introducen los valores iniciales de x = I yy I mediante los símbolos definidos como se muestra en la figura 15.4. La instrucción (¡Ivon entonces le indica a Mathcad que se debe introducir un sistema de ecuaciones. Observe que para esta aplicación Mathcad requiere el uso de un signo de igual simbólico, teclea do como [Ctrl] = y > para separar los lados izquierdo y derecho de una ecuación. Ahora se calcula el vector que consiste de xval y yval usando Find(x, y) y los valores son mostrados con un signo igual. Una gráfica que muestra las ecuaciones y restricciones, así como la solución, se puede insertar en cualquier lugar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una retícula roja en esa localización. Entonces se usa la secuencia Insert/Graph/X-Y Plot en el menú para colocar un gráfico vacío sobre la hoja de cálculo con símbolos matemáticos para las expresiones que habrán de granearse y para los rau gos de los ejes x y y. Cuatro variables se trazan sobre el eje y como se muestra (las mitades inferior y superior de la ecuación para el círculo, la función lineal y un pailón cruzado que representa la restricción x > 2). Los rangos para estos casos son x para las mitades del círculo superior e inferior, ¿j para la línea y r¡ para la restricción. Mathcad realiza el resto para producir la gráfica. Una vez que se ha creado la gráfica, se puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de grá l'i ca, cambiar color, tipo y grueso de la línea de la función, y agregar títulos, etiquetas y otras características. La gráfica y los valores numéricos para xval y yval ilustran excelentemente la solución, así como la intersección del círculo y la línea en la región x>2. 15.3.2
Programación lineal en Excel
Existe una variedad de paquetes de software especialmente diseñados para implemcntai programación lineal. Sin embargo, como su disponibilidad es amplia, este análisis se
FIGURA 15.4 Pantalla de Mathcad de un problema de optimización restringida no lineal.
G ae» i:=ve -l vyau = :léI*: G r n x-teym -n 6e -iitty-2 a>2 D t r i m ó n n : y[va]l ()') xvaC lo -m 4 2 .4 l0 4 -).142136 a n rt1 e d2136emeyy> (i«2
FILE
EDIT
VIEW
INSERT
FORMAT
CONSTKAINED NONUNEAR
1 2
:=F nd i 1
MATH
SYMBOLICS WINDOW
OPTIMIZATION
HELP
15.3
OPTIMIZACIÓN C O N PAQUETES DE SOPTWARE
4tt
concentrará en la hoju tic cálculo lixcel. íisln involucra usar la opción Solver que nntoH NO empleó en el capítulo 7 para localizar raíces. La manera en la cual se usa Solver para programación lineal es similar a nuestras aplicaciones previas en el sentido de que los datos se introducen en las celdas de la hoja de cálculo. La estrategia básica es llegar a una celda que esté optimizada como una función de las variaciones de las otras celdas sobre la hoja de cálculo. El siguiente ejemplo ilustra cómo se puede realizar esto para el problema de procesamiento de lu gasolina.
Usando el Solver de Excel para un problema de programación lineal
Enunciado del problema. Utilice una hoja de cálculo en Excel para calcular los valores adecuados en el problema del procesamiento de la gasolina examinado en este capítulo. Solución. Una hoja de cálculo de Excel para calcular los valores pertinentes en el problema de procesamiento de gasolina es mostrado en la figura 15.5. Las celdas no ! sombreadas son las que contienen los datos numéricos y leyendas. Las celdas sombreadas involucran las cantidades que se calculan con base en las otras celdas. Reconozca que la { celda a ser maximizada es la D I 2 , la cual contiene la utilidad total. Las celdas que cambian son B4: C4, en las cuales se tiene las cantidades de la gasolina producida regular y prémium. ¡ Una vez que se crea la hoja de cálculo, se selecciona Solver del menú Tools (Herra| mientas). En esta etapa un recuadro de diálogo se mostrará, requiriendo de usted la infor-
FIGURA 15.5 Acondicionamiento de una hoja de cálculo en Excel para usar el Solver para la programación lineal.
5 6 7 9 10 11 12
A | B | C | P r o b l e m a p a r a el proe es. de g a s o l i n a Regular Producido Materia prima Tiempo Almacén, de regular Almacén, de prémium Aprov. por unidad Aprovechamiento
-
B4*B11
Prémium 0
7 10
1 1 8
150
,
D
E
Total
0
Disponib.
0 0 0 0
"
77
* -
80
"*
9
^
6
-
C4*C11
=
B6*B4+C6*C4
=
B7*B4+C7'C4
= B4 = C4
175
0
o
1 2 3 4
00
EJEMPLO 1 5 . 3
0
-
B12+C12
OPTIMIZACIÓN RESTRINGIDA
marión pertinente. Estas celdas pertinentes del recuadro de dialogo de Solver se llenaran como Ubique la celda dentro: Igual a
máx
9
D12
O mín
O igual a
0
Al cambiar celdas
B4-.G1 Sujeto a:
D60 }>0 Obtenga la solución a) Gráficamente. b) Mediante el método simplex. c) Con un paquete de software o librería apropiado (por ejeui pío, Excel, Mathcad o IMSL). 15.5 Use un paquete o librería de software (por ejemplo, líxiW, Mathcad o IMSL) para resolver el siguiente problema de opiitin zación no lineal restringido. Maximizar f(x, y)
Además, suponga que una nueva fuente de materia prima para la gasolina se ha descubierto, de tal forma que el total disponible se duplica a 154 m /por semana. a) Establezca el problema de programación lineal para maximizar la utilidad. b) Resuelva el problema de programación lineal con el método simplex. c) Solucione el problema con un paquete de software. d) Evalúe con cuál de las siguientes opciones se obtendrá la máxima utilidad: aumentar la materia prima, el almacenamiento o el tiempo de producción. 15.3 Considere el problema de programación lineal
l.\x+\.9y
- y
3
sujeto a
3
Minimizar f(x, y) = —x + y
x + y < 0.9 x >0 y > 0 15.Í Use un paquete o librería de software (por ejemplo, IÍXITI, Mathcad o IMSL) para resolver el siguiente problema de opluul zación no lineal restringido. Minimizar/(x:,}>) = I9x+ sujeto a
3
x + y > 0.95 x + 2y < 2 x > 0 2
sujeto a
x + 2.5}' < 15 x+y < 7 2x + y < 9 x>0 y > 0 Obtenga la solución a) Gráficamente. b) Por medio del método simplex. c) Mediante un paquete de software o librería apropiado (por ejemplo, Excel, Mathcad o IMSL). 15.4 Considere el problema de programación lineal: Maximizar/X*, .y) = 12* + lOy
\ly
2
y > 0 15.7 Considere el siguiente problema de optimización no IIIICBI restringido: Minimizar/(x,y) = (x - 2.5) + (y - 2 . 5 ) 2
2
sujeto a
x + 2y = 4 a) b)
Use un procedimiento gráfico para estimar la solución. Utilice un paquete o librería de software (por ejemplo, l'v ecl, Mathcad o IMSL) pura obtener una ONlinmuion mát
exacta.
,.
.,
Ift.ll
UNO
IUI'IHIIIIO
un pnquelc o librorln de solUvarc puní determinar el
./'(.v.r) ~ - 7 . r I I.2.V'' -1 1 ly I 2/
2\y
de
,/'(.v..)•)
2.»>> + \.5y -
\.25x 2
2y
1
lít.° Uliliee un paquete o librería de software para determinar el máximo de /(.,•,y) = 3.5x + 2y + x - x - 2xy - y 2
15.10 Dada la siguiente función,
4
2
use un paquete o librería de software puru determinar al mínimo a) Gráficamente. b) Numéricamente. c) Sustituya el resultado de b) en la función para determinar el mínimo f(x, y). d) Determine el Hessian y su determinante, y sustituya el resultado del inciso b) en la última para verificar que se lia detectado un mínimo.
CAPITULO 16 Aplicaciones en la ingeniería: optimización El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 13 al 15 para resolver problemas reales de la ingeniería que involucran optimización. Estos problemas son importantes, ya que a los ingenieros se les pide con frecuencia que den la "mejor" solución a un problema. Como muchos de estos casos involucran sistemas complejos e interacciones, los métodos numéricos y las computado ras son con frecuencia una necesidad para desarrollar soluciones óptimas. Las siguientes aplicaciones son típicas de aquellas que se encuentran en forma ruli nana durante los estudios superiores y de graduados. Además, ellas son representativas de problemas con los que se enfrentará el ingeniero profesionalmente. Los problemas son tomados de las áreas principales de la ingeniería: química/petrolera, eléctrica y me cánica/aeroespacial. La primera aplicación, tomada de la ingeniería química/petrolera, tiene que ver con el uso de la optimización restringida no lineal para el diseño óptimo de un tanque cilindrico. El Solver de Excel se usa para desarrollar la solución. Después, se utiliza la programación lineal para apreciar un problema de la ingenie ría civil/ambiental: minimizar el costo del tratamiento de aguas para cumplir con los objetivos de calidad del agua en un río. En este ejemplo, se introduce la noción de precios indefinidos y su uso para mostrar la sensibilidad de una solución por programación lineal. La tercera aplicación, tomada de la ingeniería eléctrica, involucra maximizar la potencia a través de un potenciómetro en un circuito eléctrico. La solución involucra optimización unidimensional no restringida. Además de resolver el problema, se ilustra cómo los lenguajes macro de Visual Basic dan acceso al algoritmo de búsqueda de la sección dorada dentro del contexto del ambiente Excel. Por último, la cuarta aplicación, tomada de la ingeniería mecánica/aeroespacial, involucra determinar los desplazamientos de la pierna al pedalear en una bicicleta do montaña al minimizar la ecuación bidimensional de energía potencial.
16.1
D I S E Ñ O DE U N T A N Q U E C O N EL M E N O R C O S T O (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Los ingenieros químicos y petroleros (así como otros especialistas tales como los ingenieros mecánicos y civiles) con frecuencia se enfrentan al problema general del diseño de recipientes que transportan líquidos y gases. .Suponga que so lo pide determinar las dimensiones de un pequeño tanque cilindrico para ol transporto de
16.1
DISEÑO DE U N T A N Q U E C O N EL M E N O R C O S T O
FIGURA 16.1 Parámetros para determinar las dimensiones óptimas de un tanque cilindrico.
desechos tóxicos que se van a trasladar en un camión. Su objetivo general será minimizar el costo del tanque. Sin embargo, además del costo, usted debe asegurar que mantenga la cantidad requerida de líquido y que no exceda las dimensiones de la caja del camión. Debido a que el tanque transportará desechos tóxicos, se requiere de un espesor especificado por ciertos reglamentos. Un esquema del tanque y de la caja se muestra en la figura 16.1. Como puede verso, el tanque consiste en un cilindro con dos placas soldadas en cada extremo. El costo del tanque involucra dos componentes: 1) gastos del material, el cual está basado en el peso, y 2) gastos de soldadura que se basan en la longitud necesaria para soldar. Observe que lo último involucra soldar ambas: la costura interior y la exterior en donde se conectan las placas con el cilindro. Los datos necesarios para el problema so resumen en la tabla 16.1. Solución. El objetivo aquí es construir un tanque a un mínimo costo. El costo está relacionado con las variables de diseño (longitud y diámetro), ya que ellas tienen efecto sobre la masa del tanque y las longitudes a soldar. Además, el problema es restringido yu que el tanque debe 1) ajustar a la caja del camión y 2) contener el volumen requerido de material. TABLA 16.1
Parámetros para determinar las dimensiones óptimas de un tanque cilindrico para transporte de desechos tóxicos.
Parámetro
Volumen requerido Espesor Densidad Longitud de la caja Ancho de la caja
Costo del material Costo por soldadura
Símbolo
i
p
^móx
Valor
0.8 3 8 000 2 1 4.5 20
Unida
das
rrr' cm kg/rrv m m
1
$Afj $/m
APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN El costo implica los valores del material del tanque y de soldarlo. Por lanío, la fluición objetivo se puede formular como una minimización (16.1)
donde C = costo ($), m = masa (kg), í = longitud a soldar (m), c y c = factores de costo para la masa ($/kg) y longitud de la soldadura ($/m), respectivamente. Después, se reformulará cómo la masa y longitud de la soldadura se relacionan con las dimensiones del tambor. Primero, la masa se puede calcular como el volumen del material por su densidad. El volumen del material usado para crear las paredes laterales (por ejemplo, el cilindro) se puede calcular como w
m
w
D ^cilindro
^
—
n
Para cada placa circular en los extremos, esto es
(d
aplaca = * ( —
\2
+t
Así, la masa se calcula con D
m = p\Ljí 2
+
D H
2?r| y + f | t
-
(16.2)
donde p = densidad (kg/m ). La longitud de soldadura para unir cada placa es igual a la circunferencia interior y exterior del cilindro. Para las dos placas, la longitud total de soldadura sería
**w — ^
2*|§+í)+2*f
= 4n(D
+1)
(16.3)
Dados los valores de D y L (recuerde que el espesor t está fijo por códigos), las ecuaeio nes (16.1), (16.2) y (16.3) proporcionan un medio para calcular el costo. También observe que cuando las ecuaciones (16.2) y (16.3) se sustituyen en la ecuación (16.1), ol resultado de la función objetivo es no lineal en las incógnitas. Después, se puede formular las restricciones. Primero, se debe calcular qué volu men puede ser introducido en el tanque terminado,
TTD
2
Este valor debe ser igual al volumen deseado. Así, una restricción es
JTD= LV„ 2
donde V e» el volumen deseado (m ). 3
ü
16.1
D I S E Ñ O DE U N T A N Q U E C O N EL M E N O R COSTO
49?
Las restricciones restantes tienen que ver con que el tanque ajusto a las dimensiones de la caja del camión, L 0.8). Una vez creada la hoja de cálculo, la selección Solver se escoge del menú T O O I N (Herramientas). En este punto aparecerá un recuadro de diálogo que le solicitará la información pertinente. Las celdas pertinentes del recuadro de diálogo Solver se pueden llenar como
Ubique la celda destino: Igual a O máx
0 mír
E16 O igual a
0
Por cambio de celdas E5:E6 Sujeto a las restricciones: E10ciluminación en Excel de ln polc-ncia máxima a través i lo un potenciómetro niiKJiíinle prueba y error.
7 8
9
V Rl R2 R3 Ra P|Ra)
80 8 12 10 16.44445
30.03003 =(B3*B6*B8/(B4'(B8+B5+B6)+B6*B8+B6*B5)) 2/B8 A
Resolveremos este problema en tres formas con la hoja de cálculo Excel. Primero, se emplea la prueba y error y la opción Solver. Después, se desarrollará un programa macro en Visual BASIC para realizar un análisis de sensibilidad. d) En la figura (16.10) se muestra una hoja de cálculo Excel para implementar la ecuación (16.11). Como se indica, la ecuación (16.11) se puede introducir en la celda B9. Entonces el valor de R (celda B8) puede ser variada en forma de prueba y error hasta que se tenga un residuo mínimo. Para este ejemplo, el resultado es una potencia de 30.03 W con un valor en el potenciómetro de R = 16.44 Q. Un planteamiento superior involucra usar la opción Solver del menú Tools de la hoja de cálculo. En este punto se desplegará un recuadro de diálogo requiriendo de usted la información pertinente. Las celdas pertinentes del recuadro de diálogo Solver se llenarán como a
a
Ubique la celda destino: Igual a 9
máx
O mín
Por cambio de celdas
B9 O igual a
0
B8
Cuando el botón OK es seleccionado, se despliega un recuadro de diálogo con un reporte sobre el éxito de la operación. Para el caso actual, Solver obtiene la misma solución correcta mostrada en la figura 16.10. b) Ahora, aunque el procedimiento anterior es excelente para una sola evaluación, no es conveniente para los casos donde se deben emplear múltiples optimizaciones. Tal podría ser el caso para la segunda parte de esta aplicación, donde estamos interesados en determinar en qué modo la potencia máxima varía para diferentes valores de voltaje. Está claro que el Solver podría llamar muchas veces los diferentes valores de los parámetros, pero esto será ineficiente. Una forma preferible sería involucrar el desarrollo de una función macro que llegue al óptimo. Tal función es enlistada en la figura 16.11. Observe la similitud tan cercana con el pseudocódigo de la búsqueda de la sección dorada que se presentó en la figura 13.5. Además, observe que una función se debe definir también para calcular la potencia de Acuerdo con In ecuación (16.11).
436
APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN Functlon GoldenCxlow, x h l g h , R l , R2, R3, V) maxlt - 50 : es - 0.01 : r - (5 0.5 - 1) / 2 x l - xlow : xu - x h l g h : 1 t e r - 1 d - r * (xu - x l ) x l - x l + d : x2 - xu - d f l - PowerCxl, R l . R2, R3, V) f 2 - Power(x2. R l , R2, R3, V) I f f l > f 2 Then xopt - x l : f x - f 1 Else xopt - x2 : f x - f 2 End I f Do d - r * d I f f l > f 2 Then x l - x2 : x2 - x l x l - xl + d : f2 - f l f l - PowerCxl. R l . R2, R3, V) Else xu - x l : x l - x2 x2 - xu - d : f l - f 2 f 2 - Power(x2, R l . R2, R3, V) End I f 1ter - i t e r + 1 I f f l > f 2 Then xopt - x l : f x - f l Else xopt - x2 : f x - f 2 End I f I f xopt O 0 then ea - ( 1 - r ) * AbsCCxu - x l ) / x o p t ) * 100 I f ea maxlt Then E x i t 0o Loop Gol den - xopt End Functlon A
Function PowerCRa, R l . R2, R3, V) Num - (V * R3 * Ra / CR1 * (Ra + R2 + R3) + R3 * Ra + R3 * R2)) Power - Num/Ra End Function
A
2
FIGURA 16.11 Macro para Excel escrito en Visual BASIC para determinar un mínimo con la búsqueda do la sección dorada.
En la figura 16.12 se muestra una hoja de cálculo Excel que utiliza este macro para evaluar la sensibilidad de la solución para el voltaje. Se tiene una columna de valores que cubre un rango de los voltajes (esto es, de 45 a 105 V). En la celda B9 se tiene una función de llamado del macro que referencia el valor adyacente de V (los 45 volts en A9).
LIE. *JF>'
1
' I f ' ' 1111111
llliilíliiim
w
TI'.
Llama a la macrofunclón hecha en V i s u a l B A S I C
M á x i m a t r a n s f • r a n c i a de potencia Rl 8 R2 12 R3 10 Rmín 0.1 Rmáx 100 V Ra ^ PiRal 45 1 6 . 4 4 4 4 4 9 . 5 0 1 6 8 9 6 0 16.44444 16.89189 75 16.44444 26.39358 90 16.44444 38.00676 105 1 6 . 4 4 4 4 4 5 1 . 7 3 1 4 2
Oro ($B$6,$B$7,$B$3,$B$4,$B$5,A9)
/
\
\
\
\
Cálculo de la potencia]
=(A9*$B$5*B9/($B$3*{B9+$B$4+$B$5)+$B$5*B9+$B$3*$B$4))*2/B9
FIGURA 16.12 I li >|u de cálculo de Excel para implementar un análisis de sensibilidad de la potencia máxima con variaciones de voltaje. I ski iijlina accesa el programa macro para la búsqueda de la sección dorada de la figura 16.1 1.
Además, se incluye también parámetros en la función argumento. Advierta que, mientras la referencia con Ves relativa, las referencias a los valores iniciales superior e inferior y las resistencias son absolutos (esto es, incluyendo el signo $). Esto se hizo de tal forma que cuando la fórmula se copie, las referencias absolutas queden fijas, mientras que la referencia relativa corresponde al voltaje en el mismo renglón. Una estrategia similar se usa para introducir la ecuación (16.11) en la celda C9. Cuando se copian las fórmulas hacia abajo, el resultado es como el mostrado en la figura 16.12. La potencia máxima se puede trazar para visualizar el impacto de las variaciones de voltaje. En la figura 16.13 se observa que la potencia aumenta con el voltaje. Los resultados para los valores correspondientes en el potenciómetro (R ) son más interesantes. La hoja de cálculo indica que para un mismo valor, 16.44 £2, se tiene una a
FIGURA 16.13 Resultados del análisis de sensibilidad para el efecto de las variaciones de voltaje sobre la máxima potencia.
438
APLICACIONES EN LA INGENIERÍA: O P T I M I Z A C I Ó N
potencia máxima. Tal resultado podría ser difícil de intuir basado en una inspección casual en la ecuación (16.11).
16.4
D I S E Ñ O DE U N A BICICLETA DE M O N T A Ñ A (INGENIERÍA MECÁNICA/AEROESPACIAl) Antecedentes. Por su trabajo en la industria de la construcción, los ingenieros civiles son más comúnmente asociados con el diseño estructural. Sin embargo, otras especial i dades de la ingeniería deben tratar también con el impacto de fuerzas sobre los dispositivos que ellos diseñan. En particular, los ingenieros mecánicos y aeroespaciales deben cumplir tanto con la respuesta estática como con la dinámica en una amplia clase de vehículos que van desde automóviles hasta vehículos espaciales. El interés reciente en bicicletas de competencia y recreativas ha significado que los ingenieros tengan que dirigir sus habilidades hacia el diseño y pruebas de bicicletas do montaña (véase figura 16.14a). Suponga que se le asigna la tarea de predecirlos desplazamientos horizontal y vertical de un sistema de frenos de una bicicleta como respucstn a una fuerza. Suponga que las fuerzas que usted debe analizar se pueden simplificar, como se ilustra en la figura 16.14&. A usted le interesa probar la respuesta de la mano cuando se ejerce una fuerza en cualquier número de direcciones designadas por el ángti loft Los parámetros para el problema son E = módulo de Young = 2 X 1 0 Pa, A área de sección transversal = 0.0001 m , w — ancho = 0.44 m, l = longitud = 0.56 m, y h = altura = 0.5 m. Se puede resolver los desplazamientos e n * y y al determinar ION valores que den una energía potencial mínima. Determine los desplazamientos para uun fuerza de 10 000 N y un rango de los 8 desde 0°(horizontal) hasta 90° (vertical). 11
2
Solución. Este problema se puede plantear al desarrollar la siguiente ecuación para ln energía potencial del sistema de frenado.
V{x,y)
=
1— J x + - ^ i - \ — )y 2
2
- Fx eos 6-Fy
sen 0
(16.1 ,'|
FIGURA 1 6 . 1 4 a) Una bicicleta de montaña junto con b) un diagrama de cuerpo libre para una patio 2/i. 16.4 La razón de crecimiento específico de una fermentación que produce un antibiótico es una función de la concentración de comida c, 2c ~~ 4 + 0.8c + c + 0.2c 8
2
FIGURA P 16.2 Un contenedor cónico con tapa.
3
FIGURA P l 6.3 Un contenedor cilindrico con tapas semiesféricas.
FIGURA P 16.1 Un contenedor cilindrico sin tapa. Abierto
Como se ilustra en la figura Pl 6.4, el crecimiento parte de cero u muy bajas concentraciones debido a la limitación de la coinidn También parte de cero en altas concentraciones debido a los clbc tos de toxicidad. Encuentre el valor de c para el cual el cree i miento es un máximo. 16.5 Una planta química produce tres productos principales on una semana. Cada uno de estos productos requiere una cieiln cantidad de materia prima química de diferentes tiempos do producción, y se obtiene diferentes ganancias. La información pertinente se resume en la tabla siguiente:
h
Materia prima química Tiempo de producción Nueva utilidad
Producto 1
Producto 2
Producto 3
5 kg/kg 0.05 hr/kg $30/kg
4 kg/kg 0.1 hr/kg $30kg
lOkg/kg 0.2 hi/kg $35/kcj"
Disponibilidad do f u e n t e *
3 000 k
II/MHIKIIUI
441
PROBLEMAS
c (mg/L)
FIGURA P16.4 !(i razón de crecimiento específico de una fermentación que nioduce un antibiótico contra la concentración de comida.
de producción. Determine qué cantidad de productos y desechos se deben crear para maximizar las utilidades. Ingeniería civil/ambiental
16.7 Un módulo de elemento finito de una viga en voladizo sujeta a carga y momentos (véase figura P16.7) se da para optimizarla. ()bserve que hay suficiente espacio en bodega de la planta para almacenar un total de 450 kg/ a la semana. a) Establezca un problema de programación lineal para maximizar las utilidades. />) Resuelva el problema de programación lineal con el método simplex. c) Resuelva el problema con un paquete de software. . Recientemente los ingenieros químicos se han involucrado on el área conocida como minimización de desechos. Esto comprende la operación de una planta química de un modo tal que los impactos sobre el ambiente sean minimizados. Suponga que IIIIII refinería desarrolla un producto, Zl, hecho de dos materias primas Xy Y. La producción de 1 tonelada métrica del producto involucra 1 tonelada de Xy 2.5 toneladas de Xy produce 1 toneliula de un líquido de desecho, W. Los ingenieros tienen que enl'rcntar esto con tres formas alternas para el manejo de los desechos: •
• •
f(x,y)
= 5x -5xy
2
donde x = desplazamiento en el extremo y y = momento en el extremo. Determine los valores de x y y que minimicen f(x, y). 16.8 Suponga que se le pide diseñar una columna para soportar una carga de compresión P, como se muestra en la figura P16.8a. La columna tiene una forma de sección transversal como la de un tubo de pared delgada, como la mostrada en la figura P16.86. Las variables de diseño son el diámetro medio del tubo, d, y el espesor de la pared, t. El costo del tubo se calcula con Costo = / ( / , d) = c W + c d x
2
FIGURA P l 6.8 a) Una columna que soporta una carga de compresión P. b) la columna tiene la forma de una sección transversal como la de un tubo de pared delgada.
Producir una tonelada de un producto secundario, Z2, al agregar una tonelada adicional de X por cada tonelada de W. Producir una tonelada de otro producto secundario, Z3, al agregar 1 tonelada de Y por cada tonelada de W. Tratar los desechos de tal forma que su descarga sea permisible.
I os productos dan utilidades de $2 500, -$50 y $200/toneladas pin II Zl, Z2, y Z3, respectivamente. Observe que al producir Z2 NO obtiene de hecho una pérdida. El costo del proceso de tratamiento es do $3(>0/tonclada. Además, la compañía tiene acceso a un limite do 7 500 y 10 000 toneladusdo Xy Y durante el poriodo
l.5y
+2.5y
2
a)
442
APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN
W ndlllp
donde c, -= 4 y c = 2 son factores de costo y W — peso del tubo, 2
donde p = densidad del material del tubo = 0.0025 kg/cm . La columna debe soportar la carga bajo esfuerzo de compresión y no pandearse. Por lo tanto, 3
donde o = concentración de oxígeno disimilo |nig/L, con centración saturada de oxigeno [mg/L], / = tiempo do IniviN ' hi = concentración BOD en el punto de mezclado 0 k = razón de descomposición de la demanda de oxigeno bioquímico (BOD, por sus iniciales en inglés) [d 1, k iii/ón de asentamiento de (BOD) [ d ] , k = razón de reatiaeión |il 1 y S = demanda de oxígeno sedimentado [mg/L/dj. Como se indica en la figura P16.9, la ecuación (l>Id.") pin duce un oxigeno "disuelto" que alcanza un nivel mínimo cillli n, o , en algún tiempo de travesía, t , debajo del punto de desairan Este punto es llamado "crítico", ya que representa la uhiciuií'in para flora y fauna que dependen del oxígeno, como el pe/., i|iits sería la más esforzada. Determine el tiempo de travesía crilii-u y la concentración dados los siguientes valores:
[d], L
x
|niu/l
d
1
x
_1
1
a
Esfuerzo real (o) < esfuerzo máximo de compresión
b
= 03, = 550 kg/cm
2
Esfuerzo real < esfuerzo de pandeo
c
El esfuerzo real está dado por
_
A jrdt
P
_
P
c
o= L k
Se puede demostrar que el esfuerzo de pandeo es
10 m g / L
s
JiEI H dt
k = 0 . 0 5 d~' s
2
donde E = módulo de elasticidad e / = segundo momento de área de la sección transversal. Se puede usar el cálculo para demostrar que
d= 0=
0.1 d"
k
a
1
= O.d (I
1
50 m g / L S = 1 mp/l./.l h
161.0 La distribución bidimensional de la concentración de mn taminantes en un canal se puede describir con c(x, y) = 7.9 + 0.13.t + 0.21y - 0.05x
2
- 0 . 0 1 6 y - 0.007x>' 2
l = \dt[d> + ?) áedyt d = dmodelo t = detStreeter-Phelps — Q=n -A R ' S '
Determine la localización exacta de la concentración pico dinln la función y con el conocimiento de que el pico cae dentro do lun fronteras - 1 0 < x < 10 y 0
Esfuerzo cortante = Kfiys ->o . Suponga que se toman n muestras y se calcula una media estimaday¡. Después se toman otras n muestras y se calcula otra, y . Se puede repetir este proceso hasta que se haya generado una muestra de medias: y , y , y-¡,. •., y , donde m es grande. Se puede entonces desarrollar un histograma de estas medias y determinar una "distribución de las medias", así como una "desviación estándar de las medias". Ahora surge la pregunta: ¿Esta nueva distribución de medias y su estadística se comportan en una forma predecible? 2
2
2
2
2
x
2
m
Existe un importante teorema conocido como el Teorema de Limite Central que responde en forma directa a esta pregunta. Se puede enunciar como Sea y\,y ,- • •, Y una muestra aleatoria de tamaño na partir de una distribución con una media \1 y varianza O . Entonces, para n grandes, y es aproximadamente normal con la media \iy la varianza C ln. Ademéis, para n grandes, la variable aleatoria (y — /i)/(o7 \/~ñ) es de manera aproximada la normal estándar. 2
n
2
2
Así, el teorema establece el resultado notable de que la distribución de las medias siempre será normalmente distribuida, ¡sin importar la distribución en uso de las variables aleatorias! Esto también da el resultado esperado, que dada una muestra lo suficientemente grande, la media de las medias debería converger sobre la media real de la población \i. Además, el teorema dice que en tanto se tenga tamaños de muestra más grandes, la varianza de las medias deberá aproximarse a cero. Esto tiene sentido, ya que si n es pequeña, las estimaciones individuales de la media deberían ser pobres, y la varianza de las medias, grandes. En tanto n aumente, la estimación de la media mejorará y, por tanto, se acortará su dispersión. El Teorema de Límite Central claramente define en forma exacta cómo este estrechamiento relaciona tanto a la varianza real como al tamaño de la muestra; por ejemplo, como a ln. Por último, el teorema establece el importante resultado que se ha dado en la ecuación (PT5.6). Como se muestra en esta sección, el resultado es la base para construir con seguridad intervalos para la media. 2
estimada s . Una alternativa más directa podrá ser una versión de la ecuación (PT5.6) basada en s , y
t =
^ ~ jí_
(PT5.8)
Sy/Vn
Aun cuando la muestra se tomó de una distribución normal, esta fracción no será normalmente distribuida, en particular cuando n sea pequeña. W. S. Gossett encontró que la variable aleatoria definida por la ecuación (PT5.8) maneja la tan conocida distribución estudiante — t o, en forma simple, la distribución t. Para este caso, L =
y -
~zt 2.„-\ al
U =
y +
~ta/2, , t
i
(PT5.9)
PT5.2 ANTECEDENTES MATEMÁTICOS
459
Normal
f(n-6)
F I G U R A PT5.4 Comparación de la distribución normal con la distribución f para n = 3 y n = ó. Observe cómo la distribución fes normalmente más plana.
donde -\ ^ variable aleatoria estándar de la distribución t para una probabilidad de a/2. Como fue el caso para z ^ , los valores están tabulados en libros de estadística, y también pueden calcularse mediante paquetes de software y librerías. Por ejemplo, si a = 0.05 y n = 20, _ = 2.086. La distribución t puede pensarse como una modificación de la distribución normal que toma en cuenta el hecho de que se tiene una estimación imperfecta de la desviación estándar. Cuando n es pequeña, tiende a ser más plana que la normal (véase la figura PT5.4). Por tanto, para pequeños números de mediciones, se obtienen intervalos de confianza más amplios y, por tanto, más conservativos. Conforme n se haga más grande, la distribución t converge sobre la normal. e s
a
n
n
EJEMPLO PT5.2
x
Intervalo de confianza sobre la media
\ Enunciado del problema. Determine la media y el intervalo de confianza correspon• diente al 9 5 % para los datos de la tabla PT5.1. Ejecute 3 estimaciones basándose en a) las primeras 8 mediciones b) las primeras 16 y c) las 24 mediciones. ;
Solución,
a) La media y la desviación estándar para los primeros 8 puntos es
52.72 y
347.4814 - (52.72) /8 2
= 6.59
- 1
La estadística / correcta se puede calcular como ^0.05/2,8-1 =
¿0.025,7
= 2.364623
la cual se puede usar para calcular el intervalo /. = 6.59 -
0.089921 -2.364623 = 6.5148
= 0.089921
460
AJUSTE DE CURVAS
y
n = 16
-M 6.50
6.55 6.60 Coeficiente de expansión térmica [x 1 0
- 6
n = 24
6.65 pulg/(pulg • °F)]
6.70
FIGURA PT5.5 Estimación de la media e intervalos de confianza al 9 5 % para diferentes números de tamaño muestra.
0 089921 U = 6.59 + — — — 2 . 3 6 4 6 2 3 = 6.6652
78
o 6.5148 < ii < 6.6652
Así, con base en las primeras ocho mediciones, concluimos que existe un 9 5 % de probabilidad de que la media real esté dentro del rango de 6.5148 a 6.6652. Los otros dos casos para b) con 16 puntos y c) con 24 puntos, se pueden calcular en una forma similar y los resultados se tabulan junto con el inciso á) como
« 8 16 24
9_ *y
6.5900 6.5794 6.6000
0.089921 0.095845 0.097133
a/2,n-\
t
2.364623 2.131451 2.068655
6.5148 6.5283 6.5590
*• U_
6.6652 6.6304 6.6410
Estos resultados, los cuales también se resumen en la figura P T 5 . 5 , indican la respuesta esperada de que el intervalo de confianza se hace más estrecho a medida que n aumenta. Así, cuantas más mediciones se tomen, nuestra estimación del valor real se hace mhn refinado.
Lo anterior es sólo un simple ejemplo de cómo se puede usar la estadística puní tomar decisiones con respecto a datos inciertos. Esos conceptos tendrán también rele vancia en nuestro análisis de modelos de regresión. Usted puede consultar cualquier libro básico de estadística (por ejemplo, Milton y Arnold, 1995) para obtener inlbrniii ción adicional sobre este tema.
IT5.3
PT5.3
ORIENTACIÓN
ORIENTACIÓN Antes de proceder a los métodos numéricos para el ajuste de curvas, alguna orientación podría ser de utilidad. Lo siguiente se intenta como una revisión del material analizado en la parte cinco. Además, se formularon algunos objetivos para ayudar a enfocar sus esfuerzos cuando estudie el material.
PT5.3.1
Alcance y presentación
La figura PT5.5 proporciona una revisión del material que se estudiará en la parte cinco. El capítulo 17 se dedica a la regresión por mínimos cuadrados. Se aprenderá primero cómo ajustar la "mejor" línea recta a través de un conjunto de datos inciertos. Esta técnica es llamada regresión lineal. Además de analizar cómo calcular la pendiente y la intercepción de esta línea recta, se presentarán también métodos visuales y cuantitativos para evaluar la validez de los resultados. Además de ajustar a una línea recta, se presentará también una técnica general para ajustar al "mejor" polinomio. Así, usted aprenderá a derivar una parabólica, cúbica o un polinomio de orden superior que ajuste en forma óptima datos inciertos. La regresión lineal es un subconjunto de este procedimiento más general, el cual es llamado regresión polinomio!. El siguiente tema que se analiza en el capítulo 17 es la regresión lineal múltiple. Está diseñada para el caso donde la variable dependiente^ es una función lineal de dos o más variables independientes x x ,..., x . Este procedimiento tiene especial utilidad para evaluar datos experimentales donde la variable de interés es dependiente de un número de diferentes factores. Después de la regresión múltiple, ilustramos cómo las regresiones polinomial y múltiple son ambas subconjuntos de un modelo general lineal de mínimos cuadrados. Entre otras cosas, esto nos permitirá introducir una representación de regresión de matriz concisa y analizar sus propiedades estadísticas generales. Por último, las últimas secciones del capítulo 17 se dedican a la regresión no lineal. Este procedimiento se designa para calcular un ajuste por mínimos cuadrados de una ecuación no lineal a datos. En el capítulo 18 se describe la técnica alterna para el ajuste de curvas llamada interpolación. Como se analizó antes, la interpolación se usa para estimar valores intermedios entre datos precisos. En el capítulo 18 se derivan los polinomios para este propósito. Se introduce el concepto básico de interpolación polinomial al usar líneas rectas y parábolas para conectar puntos. Luego, se desarrolla un procedimiento generalizado para el ajuste de un polinomio de orden n-ésimo. Se presentan dos formatos para expresar estos polinomios en forma de ecuación. El primero, llamado interpolación polinomial de Newton, es preferible cuando se desconoce el orden apropiado de los polinomios. El segundo, llamado interpolación polinomial de Lagrange, tiene ventajas cuando el orden apropiado se conoce de antemano. u
2
m
La última sección del capítulo 18 presenta una técnica alterna para un ajuste más preciso de datos. Ésta, llamada interpolación segmentaria, ajusta polinomios a datos pero en forma de trozos. Como tal, es particularmente muy adecuada para ajustar datos que son por lo general suaves pero que exhiben cambios locales abruptos.
AJUSTE DE CURVAS
462
17.1 Regresión lineal
PARTE 5 Ajuste de curvas
17.2 Regresión polinomial 17.3 Regresión múltiple
• f.it¡\
17.4 jMfnimos cuadrados) .Jineal generaL
CAPITULO 17 Regresión por mínimos cuadrados
18.1 Polinomial de Newton 20.3 Ingeniería •eléctrica iiír
20.2 Ingeniería civil 20.1 Ingeniería química
18.2 Polinomial ^de Lagrange_, CAPITULO 20 Aplicaciones en la ingeniería
CAPITULO 18 Interpolación
"Ta3~ Coeficientes ^polinomiales
j
18.4 Interpolación inversa 19.8 Librerías y paquetes
CAPITULO 19 Aproximación de Fourier
19.1 Sinusoidales 19.2 Serie de Fourier continua
19.7 Espectro de potencia :
St-i :
17.8 Regresión no lineal
19.6; Transformada jápida de Fourier/ 19.5 Transformada discreta de Fourier _
18 Segmentarias
18.5 Comentarios adicionales
~íai~ Frec. y dominio del tiempo 19.4 Transformada de Fourier
FIGURA PT5.6 Organización esquemática del material de la parte cinco: Ajuste de curvas.
El capítulo 19 tiene que ver con el procedimiento de la transformada de l'ourier puní el ajuste de curvas, donde funciones periódicas se ajustan a dalos. Nucslro énfasis on esta sección seré sobre la transformada rápida de Fourier. Al final de este capitulo se
4tt incluye también una revisión de algunos paquetes de software y librerías que se pueden usar para el ajuste de curvas; entre ellos se encuentran Mathcad, Excel, MATLAB e IMSL. El capítulo 20 se dedica a las aplicaciones de la ingeniería que ilustran la utilidad de los métodos numéricos en el contexto de problemas de ingeniería. Los ejemplos se toman de las cuatro áreas principales de la ingeniería: química, civil, eléctrica y mecánica. Además, algunas de las aplicaciones ilustran cómo se pueden aplicar los paquetes de software para resolver problemas de ingeniería. Por último, se incluye un epílogo al final de la parte cinco. Éste contiene un resumen de las fórmulas y conceptos importantes relacionados con el ajuste de curvas, así como un análisis de los elementos de juicio entre las técnicas y sugerencias para estudios en el futuro. PT5.3.2
M e t a s y objetivos
Objetivos de estudio. Después de completar la parte cinco, usted habrá depurado en gran forma su capacidad para ajustar curvas con los datos. En general, usted manejará las técnicas, habrá aprendido a asegurar la confiabilidad de sus resultados y será capaz de seleccionar el método (o métodos) para cualquier problema particular. Además, para esas metas generales, los conceptos específicos dados en la tabla PT5.3 deberán ser asimilados y manejados.
TABLA P T 5 . 3
Objetivos específicos de estudio para la parte cinco.
1. Comprender la diferencia fundamental entre regresión e interpolación, y que confundirlos puede provocar serios problemas. 2. Entender la deducción de la regresión lineal por mínimos cuadrados y ser capaz de asegurar la confiabilidad del ajuste mediante validaciones en forma gráfica y cuantitativa. 3. Saber cómo linearizar datos por transformación. 4. Entender situaciones donde son apropiadas las regresiones polinomiales, múltiples y no lineales. 5. Ser capaz de reconocer modelos lineales generales, entender la formulación de una matriz general para mínimos cuadrados lineales y saber cómo calcular los intervalos de confianza de los parámetros. 6. Entender que hay uno y sólo un polinomial de grado n o menor que pasa exactamente a través de n + 1 puntos. 7. Saber cómo derivar la interpolación polinomial de Newton en primer orden. 8. Entender la analogía entre el polinomial de Newton y la expansión de la serie de Taylor y cómo se relaciona el error de truncamiento. 9. Reconocer que las ecuaciones de Newton y Lagrange son simplemente formulaciones diferentes de la misma interpolación polinomial, y entender sus respectivas ventajas y desventajas. 10. Percatarse que por lo general se obtienen resultados más exactos si los datos usados para interpolación son más o menos centrados y cercanos del punto desconocido. 1 1. Darse cuenta que los datos de los puntos no tienen que estar igualmente espaciados en cualquier orden particular, ya sea para los polinomiales de Newton o de lagrange. 12. Saber por qué las fórmulas de interpolación con igual espaciamiento tienen utilidad. 13. Reconocer las capacidades y riesgos asociados con la extrapolación. 14. Entender por qué las funciones segmentadas tienen utilidad para datos con áreas locales de cambio abrupto. 15. Reconocer cómo se usan las series de Fourier para ajustar datos con funciones periódicas. 16. Entender la diferencia entre frecuencia y dominios del tiempo.
464
AJUSTE DE CURVAS
Objetivos de cómputo. Se le ha proporcionado el software y algoritmos de cómputo simples para implementar las técnicas analizadas en la parte cinco. Usted puede también tener acceso a los paquetes de software y librerías. Todo esto tiene utilidad como herramientas de aprendizaje. El software de Métodos Numéricos TOOLKIT incluye regresión polinomial. Los gráficos asociados con este software permiten visualizar fácilmente el problema y las operaciones matemáticas asociadas. Las gráficas son una parte esencial del aseguramiento de la validez de un ajuste por regresión. Éstas también proporcionan guías con respecto al uso correcto de la regresión polinomial y de los peligros potenciales de la extrapolación. El software es muy fácil de aplicar para resolver problemas prácticos y se puede usar para verificar los resultados de cualquier programa en computadora que usted mismo haya desarrollado. Además, se proporcionan los algoritmos en pseudocódigo para la mayoría de los otros métodos en la parte cinco. Esta información le permitirá expandir su software de librerías para incluir técnicas más allá de la regresión polinomial. Por ejemplo, usted puede encontrar útil, desde un punto de vista profesional, tener software para implementar la regresión lineal múltiple, la interpolación polinomial de Newton, la interpolación segmentaria cúbica y la transformada rápida de Fourier. Finalmente, una de las metas más importantes deberá ser manejar varios de los paquetes de software de utilidad general que están disponibles ampliamente. En particular, usted debería acostumbrar usar esas herramientas para implementar métodos numéricos para la solución de problemas en la ingeniería.
CAPITULO 17 Regresión por mínimos cuadrados Donde se asocian errores sustanciales con los datos, la interpolación polinomial es inapropiada y puede dar resultados insatisfactorios cuando se usa para predecir valores intermedios. Por ejemplo, en la figura 17.1a se muestran siete datos derivados experimentalmente que exhiben variabilidad significativa. Una inspección visual de dichos datos sugiere una posible relación entre y y x. Es decir, la tendencia general indica que los valores más altos de y son asociados con los valores más altos de x. Ahora, si una interpolación de sexto orden se ajusta a estos datos (figura 17.1¿»), pasará justo a través de todos los puntos. Sin embargo, a causa de la variabilidad en los datos, la curva oscila en forma amplia en el intervalo entre los puntos. En particular, los valores interpolados en x = 1.5 y JC = 6.5 parecen estar muy adelante del rango sugerido por los datos. Una estrategia más apropiada para tales casos es derivar una función aproximada que ajuste la forma de la tendencia general de los datos sin ajustar necesariamente con los puntos individuales. La figura 17.1c ilustra cómo se puede usar por lo general una línea recta para caracterizar la tendencia de los datos sin pasar a través de un punto en particular. Una manera para determinar la línea en la figura 17.1c es inspeccionar en forma visual los datos graneados y después trazar una "mejor" línea a través de los puntos. Aunque tales procedimientos por "vistazo" apelan al sentido común y son válidos para cálculos superficiales, resultan deficientes por ser arbitrarios. Es decir, a menos que los puntos definan una línea recta perfecta (en tal caso la interpolación podría ser apropiada), diferentes analistas podrían dibujar distintas líneas. Para hacer a un lado la subjetividad se debe concebir algunos criterisj^n el fin de establecer una base para el ajuste. Una forma de hacerlo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Una técnica para cumplir con tal objetivo se conoce como regresión por mínimos cuadrados, que se analizará en este capítulo.
17.1
REGRESIÓN LINEAL El ejemplo más simple de una aproximación por mínimos cuadrados es mediante el ajuste de un conjunto de pares de observaciones: (x ,y ), (x ,y ), • • •. (x„ ,y„) a una línea recta. La expresión matemática para esta última es l
V =
c/, y un intercepto de ln a (véase la figura 17.9c/). La ecuación (17.14) es linearizada al tomar su base logaritmo 10 para dar l
log y = b log x + log a 2
2
(17.16)
De este modo, una gráfica de log y contra log x dará una línea recta con una pendiente de b y un intercepto de log a (figura 17.9e). La ecuación (17.14) es linearizada al invertirla para dar 2
2
1 b - =
3
y
«3
1
1 + — a
X
(17.17)
3
De esta forma, una gráfica de 1/y contra l/x será lineal, con una pendiente de b-¡/a y un intercepto de l / a (véase la figura 17.9/). En sus contornos transformados, estos modelos se ajustan mediante regresión lineal para evaluar los coeficientes constantes. Podrían ser de nuevo convertidos en su estado original y usados para propósitos predictivos. El ejemplo 17.4 ilustra este procedimiento para la ecuación (17.13). Además, la sección 20.1 proporciona un ejemplo de ingeniería de la misma clase de cálculo. 3
3
EJEMPLO 17.4
Linearización de una ecuación de potencias
Enunciado del problema. Ajustar la ecuación (17.13) con los datos en la tabla 17.3 mediante transformaciones logarítmicas de los datos.
480
REGRESIÓN POR MÍNIMOS CUADRADOS Solución.
La figura 17. IOÍÜ es una gráfica de los datos originales en su estado no trans-
formado. La figura 17.10¿> muestra la gráfica de los datos transformados. Una regresión lineal de éstos mediante log dan el resultado l o g v = 1.75 log x - 0.300 TABLA 17.3
Datos que serán ajustados con la ecuación de potencias.
x
y
log x
1 2 3 4 5
0.5 1.7 3.4 5.7 8.4
0 0.301 0.477 0.602 0.699
log
y
-0.301 0.226 0.534 0.753 0.922
l FIGURA 1 7 . 1 0 | a) Gráfica de datos no transformados con la ecuación de potencias que ajusta los datos. ¡; b] Gráfica de datos transformados que se usan para determinar los coeficientes de la ecuación de potencias.
REGRESIÓN DE POLINOMIOS
17.2
i \
411
Así, el intercepto, log a , igual —0.300, y por tanto, al tomar el antilogaritmo, u¡ — 10 = 0.5. La pendiente es b = 1.75. En consecuencia, la ecuación de potencias es 2
_ 0 3
2
y • 0.5.v
l7S
Esta curva, como se gráfica en la figura 17.10a, indica un buen ajuste.
17.1.6
Comentarios generales s o b r e r e g r e s i ó n lineal
Antes de proceder con regresión curvilínea y lineal múltiple, debemos enfatizar la naturaleza introductoria del material anterior sobre regresión lineal. Nos hemos concentrado en la derivación simple y uso práctico de ecuaciones para ajustar datos. Debería estar consciente del hecho de que hay aspectos teóricos de regresión que son de importancia práctica, pero que van más allá del alcance de este libro. Por ejemplo, algunas suposiciones estadísticas que son inherentes en los procedimientos por mínimos cuadrados lineales son 1. 2. 3.
Cada x tiene un valor fijo; no es aleatorio y es conocido sin error. Los valores y son variables aleatorias independientes y todas tienen la misma varianza. Los valores de y para una x dada deben ser normalmente distribuidos.
Tales suposiciones son relevantes para la derivación adecuada y uso de regresión. Por ejemplo, la primera suposición significa que 1) los valores x deben estar libres de errores y 2) la regresión de y contra x no es la misma que la de x contra y (pruebe el problema 17.4 al final del capítulo). Usted debe consultar otras referencias tales como Draper y Smith (1981) para apreciar aspectos y matices de regresión que están más allá del alcance de este libro.
17.2
R E G R E S I Ó N DE P O L I N O M I O S En la sección 17.1 se desarrolló un procedimiento para obtener la ecuación de una línea recta por medio del criterio de mínimos cuadrados. Algunos datos de ingeniería, aunque exhiben un patrón marcado como el que se vio en la figura 17.8, está pobremente representado por una línea recta. Para esos casos, una curva podría ser más adecuada para el ajuste de los datos. Como se analizó en la sección anterior, un método para cumplir con este objetivo es usar transformaciones. Otras alternativas son ajustar polinomios con los datos mediante regresión de polinomios. El procedimiento de mínimos cuadrados se puede fácilmente extender al ajuste de datos con un polinomio de orden superior. Por ejemplo, suponga que ajustamos un polinomio de segundo orden o cuadrático: y = a
0
+ a\X
+ atx
1
+
e
Para este caso la suma de los cuadrados de los residuos es [compare con la ecuación (17.3)] S = ]T] (yi ~ «o - a\x¡ r
a xf) 2
(17.18)
482
REGRESIÓN POR MÍNIMOS CUADRADOS
Siguiendo el procedimiento de la sección anterior, tomamos la derivada de la ecuación (17.18) con respecto de cada uno de los coeficientes desconocidos del polinomio, como en
Estas ecuaciones se pueden igualar a cero y reordenar para desarrollar el siguiente conjunto de ecuaciones normal:
(17.19)
donde todas las sumatorias son de i = 1 hasta n. Observe que las tres ecuaciones anteriores son lineales y tienen tres incógnitas: a , a y a . Los coeficientes de las incógnitas se pueden evaluar de manera directa a partir de los datos observados. Para este caso, vemos que el problema de determinar un polinomio por mínimos cuadrados de segundo orden es equivalente a resolver un sistema de tres ecuaciones lineales simultáneas. Las técnicas para resolver tales ecuaciones fueron analizadas en la parte tres. El caso en dos dimensiones puede extenderse con facilidad a un polinomio de mésimo orden como Q
y = a + a\x + a x
2
0
2
H
hax
m
m
i
2
+ e
El análisis anterior se puede fácilmente extender a este caso más general. Así, podemos reconocer que la determinación de los coeficientes de un polinomio de /n-ésimo orden es equivalente a resolver un sistema de m + 1 ecuaciones lineales simultáneas. Para este caso, el error estándar se formula como
(17.20)
Esta cantidad es dividida entre n — (m + 1), ya que (m + 1) coeficientes obtenidos de los datos (a , a , , . . . , a ) se usaron para calcular S,.; así, hemos perdido m + 1 grados de libertad. Además del error estándar, un coeficiente de determinación puede ser calculado para una regresión de polinomios con la ecuación (17.10). 0
EJEMPLO 1 7 . 5
m
Regresión d e polinomios
Enunciado del problema. Ajustar a un polinomio de segundo orden los datos en IUN dos primeras columnas de la tabla 17.4.
17.2
REGRE5IOIN DE P O L I N O M I O S
TABLA 17.4
x
Cálculos para un análisis de error del ajuste cuadrático por mínimos cuadrados.
y,
¡
0 1 2 3 4 5
2.1 7.7 13.6 27.2 40.9 61.1
2
152.6
(y -y) ;
(y/-OO-OIX -o x?)
2
f
2
544.44 314.47 140.03 3.12 239.22 1 272.1 1
0.14332 1.00286 1.08158 0.80491 0.61951 0.09439
2513.39
3.74657
FIGURA 17.11 Ajuste de un polinomio de segundo orden.
Solución.
A partir de los datos dados,
X> = X>= í>2>?15
m = 2 n = 6 X = 2.5
4
152.6
= 585.6
55
= 2488.
225
y = 25.433
Por tanto, las ecuaciones lineales simultáneas son " 6 15 55
15 55 225
55 " 225 979
«0
0\ «2
979
•
=
•
152.6 585.6 2488.8
484
REGRESIÓN POR MÍNIMOS CUADRADOS
Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a = 2.47857, a, = 2.35929 y a = 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es 0
2
y = 2.47857 + 2.35929* + 1.86071*
2
El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)] 3.74657
= 1.12 6-3 El coeficiente de determinación es Sy/,
, 2 5 1 3 . 3 9 - 3.74657 r = = 0.99851 2513.39 y el coeficiente de correlación es r — 0.99925. Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11. 2
17.2.1
A l g o r i t m o p a r a r e g r e s i ó n de p o l i n o m i o s
Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes. Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.
FIGURA 17.12 Algoritmo para la implementación de polinomios y regresión lineal múltiple. P a s o 1 : Introduzca el orden del polinomio sujeto a ajuste, m. P a s o 2 : Integre el número de datos, n. P a s o 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible y termine el proceso. Si n S m + 1, continúe. P a s o 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumentada. P a s o 5 : Resuelva la matriz aumentada para los coeficientes a , d i , a , . . ., a , por medio de un método de eliminación. P a s o d i Imprima los coeficientes. 0
2
m
17.2
REGRESIÓN DE POLINOMIOS
4 1 9
DO i = 1, o r d í r + 1 PO j = 1, i
eum — 0 DOi = 1, n eum — eum + ¿£ END DO a¡j = eum ap — eum END DO eum = 0 D0£ = 1,n eum — eum + y • x£~ END DO
1
(
i, arder + 2
a
=
5
U
M
END DO
FIGURA 17.13 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.
Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cotí más aira precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinomios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas. EJEMPLO 17.6
Regresión de polinomios por medio de la computadora
Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos: X
y
2
4
5
6
6
7
9
1
6
2
3
7
8
8
1
5
0.5 7.5 3
7
Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta panI talla contiene espacios para la entrada y salida de información necesaria para ajustar los I datos con un polinomio de regresión por mínimos cuadrados de nj-ésimo orden, J El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir I hasta 100 pares de valores para X y Y. Después usted podría decidir graficar los datos
484
REGRESIÓN POR MÍNIMOS CUADRADOS
Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a = 2.47857, a = 2.35929 y a — 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es 0
x
2
y = 2.47857 + 2.35929x + 1.86071*
2
El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)] 3.74657
= 1.12 6-3 El coeficiente de determinación es , 2513.39 - 3.74657 r = = 0.99851 2513.39 y el coeficiente de correlación es r = 0.99925. Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11. 2
17.2.1
A l g o r i t m o para r e g r e s i ó n de p o l i n o m i o s
Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes. Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.
FIGURA 17.12 Algoritmo para la implementación de polinomios y regresión lineal múltiple. P a s o 1 : Introduzca el orden del polinomio sujeto a ajuste, m. P a s o 2 : Integre el número de datos, n. P a s o 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible y termine el proceso. Si n 5: m + 1, continúe. P a s o 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumenlada. P a s o 5 : Resuelva la matriz aumentada para los coeficientes o , ai, a , . . ., a,„, por medio do un método de eliminación. 0
PASO 6L
Imprjma los coeficientes.
7
17.2
483
REGRESIÓN DE POLINOMIOS
DO i = 1, order + 1 DOj = 1, i k=i + j - 2 eum = 0 DOt =\n eum = eum + >¿€ END DO a, • = eum ap = eum END DO eum = 0 D0€ = 1,n eum — eum + y • x ¿ ' END DO -
(
i. arder + 2= ™
a
5U
END DO FIGURA 17.13 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.
Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cor/ más alta precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinprriios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas. EJEMPLO 17.6
Regresión de polinomios por medio de la computadora
Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos: 2
4
5
6
6
7
9
1 0.5 7.5
Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta pantalla contiene espacios para la entrada y salida de información necesaria para ajustar los datos con un polinomio de regresión por mínimos cuadrados de m-ésimo orden. El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir hasta 100 pares de valores para X y Y. Después usted podría decidir granear los datos
486
RKMMIÓN POR
MÍNIMOS CUADRADOS
solos antas de realizar decisiones con respecto al orden del polinomio. Esto se hace mediante un procedimiento similar al descrito en el ejemplo 2.1. La inspección de los datos muestra dos picos y sugiere que un polinomio de al menos cuarto orden sería el adecuado. Para nuestro ejemplo, primero intentaremos un polinomio de quinto orden. Simplemente introduzca un valor de 5 para el orden del polinomio y grafique los parámetros en el cuadro Entrada de parámetros y haga clic en los botones de red Cale y Plot (en el proceso cambian los botones a un color negro) para producir la figura 17.14. La forma para determinar el mejor orden se puede explorar al examinar cómo el error estándar varía como una función del orden de regresión. Los resultados para varios órdenes de regresión en el ajuste se tabula en la siguiente página:
FIGURA 17.14 Pantalla del TOOLKIT de métodos numéricos para una regresión polinomial de quinto orden.
~ P^iwaete* :| OÍdet of Paíy í Plot Xmtn Delta X Plot Ymin Delta Y
'i
' 21 , 3 4 5 6 , 7 8 9 V. 10
3
2 4 5 6 6 7 9 1 .5 7.5
Valué h
0 1 0 1
+ liillli 6 2 3 7 8 8 1 5 3
JBÉBJ
I X- 3 Y « 2.304472
'CS3
;.>,;.«8SftÉ!£ * >, fiettift ,.. Standard Erior Coef of Deter Coir Coef Oth oider coef
Q 5 E 3 *'CHC3- i
;
¿J.:.
. . Wm...:, 1 000334 .3332087 .3660273 -6.573234
m«
i
XMjml
FIGURA 17.15 Gráfica de una regresión polinomial de octavo orden.
Ordet of Poly Plot Xmro Delta X Plot Ymin Delta Y
Vafc» 8 0 1 0 1
1 i
lwputXv*¥Vafoe* 1 i
2
í 3 1 4 í
5
Ü
7
1 6 8 9 10
x
2 4 5 6 6 7 9 1 .5 75
v
6 2 3 7 8 . 8 1 5 3 7
CafcYÍOT InputX ftewft Standatd Enot Coef of Detei Con Coef Oth order coef
Vafe» ' 1 154277 .9777941 .9888347 -1 057965
|£
17.3
487
REGRESIÓN LINEAL MÚLTIPLE Orden Error estándar
2.71
2
3
2.69
2.34
A
1.38
1.00
6
/
1.12
1.17
Observe que el error estándar cae de manera dramática del orden 3 al 4 y alcanza un mínimo para el polinomio de orden 5. Esto sugiere que no se ha ganado mucho al gastar en esfuerzo de cómputo para ejecutar la regresión más alta que la de quinto orden. La figura 17.15 muestra las gráficas para el caso de un octavo orden. Para este caso, los puntos extremo empiezan a ser un problema en una manera similar a la de la interpolación de orden superior (analizaremos este fenómeno con más detalle en el próximo capítulo). La figura 17.15 muestra que el polinomio de octavo orden produce valores de Y negativos para valores de X entre 8 y 9. Observe también en las figuras 17.14 y 17.15 que mientras las curvas de regresión siguen la tendencia de los datos, es altamente inapropiado extrapolar los valores Y más allá del rango de los datos para X. La interpolación se puede ejecutar al introducir un valor en la tabla para X en el Cale Y para una X introducida. Por ejemplo, en X = 3, Y = 2.304472 como calculada con el polinomio de quinto orden (véase la figura 17.14). Por último, demos un vistazo a la tabla de resultados en la parte derecha inferior. Los primeros tres resultados son resúmenes estadísticos de la regresión: error estándar, coeficiente de determinación y coeficiente de correlación. Observe cómo esos valores cambian para diferentes órdenes de regresión. La barra de despliegue sobre la tabla de resultados se usa para observar los coeficientes reales de la regresión de polinomios. De nuevo, esos valores cambian con diferentes órdenes.
REGRESIÓN LINEAL MÚLTIPLE Una extensión útil de la regresión lineal es el caso donde y es una función lineal de dos o más variables independientes. Por ejemplo, y podría ser una función lineal de x y x , como en l
2
y = c?o + «i 'i + 2X2 + e A
a
Tal ecuación es en particular útil cuando se ajustan datos experimentales donde la variable sujeta a estudio es a menudo una función de otras dos variables. Para este caso en dos dimensiones, ta "línea" de regresión pasa a ser un "plano" (véase la figura 17.16). Como en los casos anteriores, los "mejores" valores de los coeficientes son determinados al realizar la suma de los cuadrados de los residuos, (17.21) y diferenciando con respecto a cada uno de los coeficientes desconocidos,
488
REGRESIÓN POR MÍNIMOS CUADRADOS
FIGURA 17.16 Ilustración gráfica de regresión lineal múltiple donde yes una función lineal de x, y x . 2
dS
r
= -2 ^ x
(y, - í/ - i a ~ a
2
/
x
0
«2*2/)
3(3?
Los coeficientes dan la suma mínima de los cuadrados de los residuos y se obtienen al igual las derivadas parciales a cero y expresando el resultado en forma de matriz como Ex
T,xi¡x ¡
a ai
Ex
a
n
Ex,/ Ex 2 í
¡EJEMPLO 1 7 . 7
Ex ,. 2
Exi,-x
0
2/
2
2l
2
2
=
•
Ey,Exi,y,Sx y,'
(17.22)
2í
Regresión lineal múltiple
Enunciado del problema. 4x, — 3x :
Los siguientes datos se calcularon con la ecuación y = 5 +
2
x
l
0 2 2.5 1 4 7
2
X
y
0 1 2 3 6 2
5 10 9 0 3 27
Use regresión lineal múltiple para ajustar estos datos.
17.3
REGRESIÓN LINEAL MÚLTIPLE
Solución. Las sumatorias requeridas para desarrollar la ecuación (17.22) se calculan en la tabla 17.5. El resultado es 6 16.5 14
16.5 76.25 48
14 48 54
54 243.5 100
a
0
a\ a
• =
•
2
la cual se puede resolver mediante un método como el de eliminación de Gauss para ao = 5
ai = 4
a
2
= —3
que es consistente con la ecuación original a partir de la cual los datos se derivaron. TABLA 17.5
Cálculos requeridos para desarrollar las ecuaciones normal para el ejemplo 17.7.
y
5 10 9 0 3 27
1
2
X
X
*i
x,x
A
2
2
*iy
x y 2
0 2 2.5 1 4 7
0 1 2 3 6 2
0 4 6.25 1 16 49
0 i 4 9 36 4
0 2 5 3 24 14
0 20 22.5 0 12 189
0 10 18 0 18 54
16.5
14
76.25
54
48
243.5
100
54
El caso anterior en dos dimensiones se puede fácilmente extender a m dimensiones, como en y = an + a\X\ + a x 2
2
-|
Ya x m
m
+ e
donde el error estándar se formula como
~\¡n-(m
S y , X
+ l)
y el coeficiente de determinación se calcula como en la ecuación (17.10). En la figura 17.17 se enlista un algoritmo para preparar las ecuaciones normal. Aunque hay ciertos casos donde una variable está linealmente relacionada con otras dos o más variables, la regresión múltiple tiene utilidad adicional en la derivación de ecuaciones de potencias de la forma general y=a x x ---x " 1
0
1
2
2
m
Tales ecuaciones son extremadamente útiles cuando se ajustan datos experimentales. Para usar regresión lineal múltiple, la ecuación se transforma al tomar su logaritmo para obtener log y = log üo + a\ log x\ + a log xj-i 2
Ya
m
log x
m
REGRESIÓN POR MÍNIMOS CUADRADOS
DOI = 1, order + 1 DOj = 1, i eum — 0 DOÍ= 1,n eum = eum + x¡-^( • END DO a = eum a- — eum END DO eum — 0 DOl = \,n eum = eum + y • x¡_ END DO
XJ-K
u
s
e
¡,CRDER+2
A
=
5
U
1(
M
END DO
FIGURA 17.17 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión múltiple. Observe que además de guardar las variables independientes en X ] , x ¡, etcétera, los 1 se deben guardar en XQ • , para trabajar este algoritmo. 2
Esta transformación, es similar en esencia a la que se usó en la sección 17.1.5 y en el ejemplo 17.4 para ajustar a una ecuación por potencias cuandoy fue una función de una sola variable x. La sección 20.4 proporciona un ejemplo de tal aplicación para dos variables independientes. 17.4
FORMA GENERAL LINEAL POR M Í N I M O S CUADRADOS Hasta este punto nos hemos concentrado en la mecánica de obtención de ajustes por mínimos cuadrados para algunas funciones simples con datos. Antes de cambiar a regresión no lineal, hay varios puntos que nos gustaría analizar para enriquecer nuestra comprensión del material precedente. 17.4.1
Formulación general de u n a m a t r i z p a r a m í n i m o s cuadrados lineales
En páginas anteriores hemos introducido tres tipos de regresión: lineal simple, polinomial y lineal múltiple. De hecho, estas tres pertenecen al siguiente modelo general de mínimos cuadrados lineales: y
—
arjzo
+
a
\
z
\
+
a
1"
2 2 ^ z
mm
a
z
(17.23)
+ e
donde z , z , , . . . , z son las m + 1 funciones diferentes. Se puede ver con facilidad cómo la regresión lineal simple y múltiple encajan dentro de este modelo; es decir z — 1, z, jC|, z = x , • •., z„, = x . Además, la regresión de polinomios se incluye también si Iris ; m
0
()
2
2
m
son monomios simples como en z = x 0
ü
— I, z, = x, Z = x ,..., 2
2
Z
M
— x" . 1
Observe que la terminología "lineal" se refiere sólo a la dependencia del modelo sobre sus parámetros (es decir, las a). Como en el caso de regresión de polinomios, las mismas funciones pueden ser altamente no lineales. Por ejemplo, las z pueden ser sinusoidales, como en
a
y =
0 + a, eos
(coi) + a (coi) 2 sen
Tal formato es la base del análisis de Fourier descrito en el capítulo 19. Por otro lado, un modelo de apariencia simple como f(x) = a (1 -
e-"'*)
0
es ciertamente no lineal porque no puede ser manejado en el formato de la ecuación (17.23). Regresaremos a tales modelos al final de este capítulo. Mientras tanto, la ecuación (17.23) se puede expresar en notación matricial como (17.24)
{Y} = [Z]{A] + {E}
donde [2] es una matriz de los valores calculados de las funciones z en los valores medidos de las variables independientes, m 1
z
Z02
Zl2
m2
z
[Z] = Zrj«
z
l«
donde m es número de variables en el modelo y n es el número de datos. Como n>m + 1, usted debería reconocer que la mayoría de las veces [Z] no es una matriz cuadrada. El vector columna {Y} contiene los valores observados de la variable dependiente {Y}
T
= [yi
••• y„J
yi
El vector columna {A} contiene los coeficientes desconocidos {A}
T
— [a
0
a¡
•••
a \ m
y el vector columna {E} contiene los residuos [E}
T
= \_e\
e
•••
2
e„ \
Como se realizó a través de este capítulo, la suma de los cuadrados de los residuos para este modelo se pueden definir como
Sr = Y,\x-Y, ¡ A i = \ \ j=0 I n
/
m
\
2
a
z
Esta cantidad se puede minimizar al tomar su derivada parcial con respecto a cada uno de los coeficientes y fijar los resultados de la ecuación igual a cero. La salida de este proceso son las ecuaciones normal que se pueden expresar brevemente en forma de matriz como
492
REGRESIÓN POR MÍNIMOS CUADRADOS
[lZ] [Z]]{A} = {[Z] {Y}} r
T
Se puede demostrar que la ecuación (17.25) es, de hecho, equivalente a las ecuaciones normal desarrolladas antes para regresión lineal simple, polinomial y múltiple. Nuestra principal motivación para las anteriores ha sido ilustrar la unión entre los tres procedimientos y mostrar cómo se pueden expresar de manera simple en la misma notación matricial. También acondiciona la etapa para la siguiente sección donde asimilaremos algo de conocimiento en las estrategias preferidas para resolver la ecuación (17.25). La notación matricial tendrá también relevancia cuando veamos regresión no lineal en la última sección de este capítulo. 17.4.2
Técnicas de solución
En los análisis anteriores en este capítulo hemos encubierto el tema de las técnicas numéricas específicas para resolver las ecuaciones normales. Ahora que hemos establecido la unión entre los diversos modelos, podemos explorar esta cuestión con mayor detalle. Primero, debería quedar claro que Gauss-Seidel no puede usarse aquí debido a que las ecuaciones normal no son diagonalmente dominantes. De esta manera dejamos a un lado los métodos de eliminación. Para los actuales propósitos, podemos dividir esas técnicas en tres categorías: 1) métodos de descomposición LU, incluyendo eliminación de Gauss, 2) método de Cholesky y 3) procedimiento de inversión de matrices. Obviamente hay traslapes en esta clasificación. Por ejemplo, el método de Cholesky es, de hecho, una descomposición L U, y todos los procedimientos se pueden formular de tal forma que pueden generar la matriz inversa. Sin embargo, esta clasificación tiene su mérito en cada categoría y ofrece beneficios con respecto a la solución de las ecuaciones normales. Descomposición LU. Si usted está interesado sólo en aplicar un ajuste por mínimos cuadrados para el caso donde se conoce de antemano el modelo adecuado, cualquiera de los procedimientos de descomposición LU descritos en el capítulo 9 son perfectamente aceptables. De hecho, se puede también emplear la formulación de una descomposición no L t / d e eliminación de Gauss. Ésta es una tarea de programación relativamente directa para incorporar cualquiera de estos procedimientos en un algoritmo de mínimos cuadrados lineales. De hecho, si se ha seguido un enfoque modular, esto es casi trivial. Método d e Cholesky. El algoritmo de descomposición de Cholesky tiene varias ventajas con respecto a la solución del problema general de regresión lineal. Primero, está expresamente diseñado para resolver matrices simétricas como las ecuaciones normal. De este modo, es rápido y requiere menos espacio de almacenamiento para resolver tales sistemas. Segundo, es idealmente adecuado para casos donde el orden del modelo [es decir, el valor de m en la ecuación (17.23)] no es conocido de antemano (véase Ralston y Rabinowitz, 1978). Un caso sujeto a tratamiento sería la regresión de polinomios. Para este caso, podríamos saber a priori si un polinomio lineal cuadrático, cúbico o de orden superior es el "mejor" modelo para describir nuestros datos. Debido tanto a la forma en la cual las ecuaciones normales se construyen como a la manera en la que procede el algoritmo de Cholesky (véase figura 11.3), podemos desarrollar en forma sucesiva modelos de orden superior de un modo en extremo eficiente. En cada paso podríamos examinar la suma residual del error de los cuadrados (¡y una gráfica!) para examinar si la inclusión de términos de orden superior mejoran de manera significativa el ajuste.
(
493 i fA
F O R M A GENERAL LINEAL POR MÍNIMOS CUADRADOS
La situación análoga para regresión lineal múltiple ocurre cuando se agregan variubles independientes, una a la vez, al modelo. Suponga que la variable dependiente de interés es una función de un número de variables independientes: por ejemplo, temperatura, contenido de humedad, presión, etcétera. Podríamos primero realizar una regresión lineal con la temperatura y calcular un error residual. En seguida se podría incluir el contenido de humedad para realizar una regresión múltiple de dos variables y ver si la variable adicional resulta en una mejora al ajuste. El método de Cholesky hace eficiente el proceso, ya que la descomposición del modelo lineal podría solamente ser añadido al incorporar una nueva variable. Procedimiento d e la matriz inversa. De la ecuación (PT3.6), recuerde que la matriz inversa se puede emplear para resolver la ecuación (17.25), como en
{A} = [[Z] [Z]Y {[Z] {Y}} T
L
T
(17.2
Cada uno de los métodos de eliminación se puede usar para determinar la inversa y, así, pueden ser usados para implementar la ecuación (17.26). Sin embargo, como aprendimos en la parte tres, éste es un enfoque ineficiente para resolver un conjunto de ecuaciones simultáneas. Así, si estuviéramos justamente interesados en resolver los coefientes de regresión, es preferible utilizar la aproximación de descomposición LU sin inversión. No obstante desde una perspectiva estadística, hay un número de razones por las cuales podríamos estar interesados en obtener la inversa y examinar sus coeficientes. Esas razones se analizarán después.
17.4.3
Aspectos estadísticos de la teoría de m í n i m o s cuadrados
En la sección PT5.2.1, revisamos un número de estadística descriptiva que puede usarse para describir una muestra. Aquéllas incluyen la media aritmética, la desviación estándar y la varianza. Además de obtener una solución para los coeficientes de regresión, la formulación de la matriz de la ecuación (17.26) proporciona estimaciones de su estadística. Se puede demostrar (Draper y Smith, 1981) que la diagonal y los términos fuera de la diagonal de la matriz [[Z] [ Z ] ] dan, respectivamente, las varianzas y las covarianzas de las a. Si los elementos de la diagonal de [[Z] [Z]]~ son designados como z j , entonces T
_ 1
1
r
zj¡ 5 l
var (a - )
=
i i
1
l
2
(17-27)
y/x
y cov (a -i,a )=zr} s* i
j
ij
/x
( 1 7
2 g )
Estas estadísticas poseen un número de aplicaciones importantes. Para nuestros actuales propósitos, ilustraremos cómo se pueden usar para desarrollar intervalos de confianza para el intercepto y la pendiente.
ácxy y.
(x,y)
'Lacovarianza es una estadística que mide la dependencia de una variable con otra. A s i , cov (x,y) la dependencia
Por ejemplo, cov
0 podría
indicar queje y
y
indica
son totalmente indcpcnd
494
REGRESIÓN POR MÍNIMOS CUADRADOS
Mediante un enfoque similar al visto en la sección l'T'5.2.3, se puede demostrar que los límites inferior y superior del intercepto se pueden formular como (véase Milton y Arnold 1995 para más detalles) +
/ ( j C l )
~
/ ( X o )
(* - %>
(18-2)
que es una fórmula de interpolación lineal. La notación f(x) designa que es una interpolación de polinomios de primer orden. Observe que además de representar la FIGURA 18.2 Ilustración gráfica de interpolación lineal. Las áreas sombreadas indican los triángulos semejantes usados para obtener la fórmula de interpolación lineal [véase la ecuación! 1 8.2)]
AQ
X
X-\
X
rrvrcKruLACTurN pendiente de la línea que conecta los puntos, el término \f(x ) — f(x )]/(x — x ) es una aproximación por diferencia dividida finita de la primera derivada [recuerde la ecuación (4.17)]. En general, cuanto más pequeño sea el intervalo de datos, mejor será la aproximación. Esto se debe al hecho de que, en tanto el intervalo disminuya, una función continua se aproximará mejor por una línea recta. Esta característica se demuestra en el siguiente ejemplo. x
EJEMPLO 18.1
0
x
0
Interpolación lineal
Enunciado del problema. Estime el logaritmo natural de 2 mediante interpolación lineal. Primero, realice el cálculo por interpolación entre ln 1 = 0 y ln 6 = 1.791759. Después, repita el procedimiento, pero use un intervalo más pequeño de ln 1 a ln 4 (1.386294). Observe que el valor real de ln 2 es 0.6931472. Solución. Usaremos la ecuación (18.2) y una interpolación lineal para ln(2) de x = 1 a X] = 6 para dar 0
/,(2) = 0 +
1 791759 - 0 — 6—1
(2 - 1) = 0.3583519
que representa un error de e = 48.3%. Con el intervalo más pequeño de, x = 1 a x 4 se obtiene t
/ , ( 2 ) = 0
L +
3
8
6 4
0
x
=
^ - ° (2 - 1 ) = 0.4620981
Así, con el intervalo más corto se reduce el error relativo porcentual a e — 33.3%. Ambas interpolaciones se muestran en la figura 18.3, junto con la función real. t
FIGURA 18.3 Dos interpolaciones lineales para estimar ln 2. Observe cómo el intervalo más pequeño proporciona una mejor estimación.
f(x) = ln j f .
Estimaciones lineales l
i
l
i
l
í
18.1
DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN
18.1.2
505
Interpolación cuadrática
El error en el ejemplo 18.1 resulta de nuestra aproximación a una curva con una línea recta. Por consiguiente, una estrategia para mejorar la estimación es introducir alguna curvatura en la línea que conecta los puntos. Si ties^uiüo^dejas datos están disponibles, esto puede realizarse con un polinomio de segundo orden (también conocido como polinomio cuadrático o parábola). Una forma en particular conveniente para este propósito es fi(x)
= bo +bi(x-
x ) + b (x - x ){x 0
2
- x{)
0
(18.3)
Observe que aunque la ecuación (18.3) parecería diferir del polinomio general [véase ecuación (18.1)], las dos ecuaciones son equivalentes. Esto puede demostrarse al multiplicar los términos de la ecuación (18.3) para dar f (x)
= b + b\x - b]X + b x
2
2
0
0
2
+ b x x\ 2
Q
- b xx 2
0
-
b xx\ 2
o, agrupando términos, f (x)
= ao + a\x +
2
ax
2
2
donde ao
=
bo - b xo +
h X{)X\ 2
t
a\ = b\ — b xu — b x\ 2
2
a = b 2
2
Así, las ecuaciones (18.1) y (18.3) son formulaciones alternativas equivalentes del único polinomio de segundo orden que une los tres puntos. Un procedimiento simple puede usarse para determinar los valores de los coeficientes. Para Z> , la ecuación (18.3) conx — XQ puede ser usada para calcular 0
b = /(*o)
(18.4)
0
La ecuación (18.4) puede sustituirse en la (18.3), la cual puede evaluarse e n x = x para x
f^)-f(xo)
=
-
X\
XQ
Por último, las ecuaciones (18.4) y (18.5) se pueden sustituir en la (18.3), la cual puede evaluarse en x = x y resolver (después de algunas manipulaciones algebraicas) para 2
/ ( * i ) - / ( * o )
/(* )-/(*i) 2
,
f>2 =
xo -x\
xi - x
(18.6)
0
=
x
2
-
Xo
Note que, como fue el caso con la interpolación lineal, b todavía representa la pendiente de la línea que une los puntos x y x . Así, los primeros dos términos de la ecuación (18.3) son equivalentes a la interpolación lineal d e x a x , , como se especificó antes en la ecuación (18.2). El último término, b (x — x )(x — X j ) , introduce la curvatura de segundo orden en la fórmula. x
0
x
0
2
0
INTERPOLACIÓN
506
Antes de ilustrar cómo usar la ecuación (18.3), debemos examinar la forma del coeficiente b . Es muy similar a la aproximación por diferencias divididas finitas de la segunda derivada que se introdujo antes en la ecuación (4.24). Así, la ecuación (18.3) comienza a manifestar una estructura que es muy similar a la serie de expansión de Taylor. Esta observación será objeto de más exploración cuando relacionemos los polinomios de interpolación de Newton con la serie de Taylor en la sección 18.1.4. Pero primero, desarrollaremos un ejemplo que muestra cómo se usa la ecuación (18.3) para interpolar entre tres puntos. 2
Interpolación cuadrática
EJEMPLO 1 8 . 2
Enunciado del problema. Ajuste los tres puntos usados en el ejemplo 18.1 a un polinomio de segundo orden:
i j
xo = 1 =4
f(xo) - 0 /(xj) = 1.386294
x = 6
/(JC )
Xl
2
2
= 1.791759
Use el polinomio para evaluar ln 2. Solución.
Aplicando la ecuación (18.4) se obtiene
b = 0 0
La ecuación (18.5) da
|
¡í
FIGURA 18.4 Uso de interpolación cuadrática para estimar ln 2. Para comparación se incluye también la interpolación lineal de x = 1 a 4.
2
1
0
0
5
x
18.1
507
DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN
y con la ecuación (18.6) se obtiene 1.791759 - 1.386294
0.4620981 ^ = -0.0518731 6—1 Sustituyendo estos valores en la ecuación (18.3) se obtiene la fórmula cuadrática b =
6
-
4
2
= 0 + 0.462098l(x - 1) - 0.0518731 (x - ])(x - 4)
f (x) 2
que puede evaluarse en x — 2 para / (2) = 0.5658444 2
la cual representa un error relativo de e = 18.4%. Así, la curvatura introducida por la fórmula cuadrática (véase la figura 18.4) mejora la interpolación comparada con el resultado que se obtiene mediante líneas rectas en el ejemplo 18.1 y figura 18.3. t
18.1.3
F o r m a general de la interpolación de p o l i n o m i o s de N e w t o n
El análisis anterior puede ser generalizado para ajustar un polinomio de «-ésimo orden a n + 1 datos. El polinomio de «-ésimo orden es f„(x)
= b + bi(x - x ) + • • • + b„(x - x )(x -*,)•••(*0
0
0
x„-i)
(18.7)
Como se hizo antes con las interpolaciones lineales y cuadráticas, los puntos de los datos evaluaban los coeficientes b , b¡,..., b . Para un polinomio de «-ésimo orden se requiere n + 1 puntos: [ x , / ( x ) ] , [x^fix^],. .., [x ,f(x )]. Usamos estos datos y las siguientes ecuaciones para evaluar los coeficientes: 0
0
n
0
n
n
b = f(x )
(18.8)
b\=f[x x ]
(18.9)
Q
0
u
0
bi = f[x ,xi,
x„)
z
b
n
= f[x„,x„-i,
(18.10)
...,Il,A' ] 0
(18.11)
donde las evaluaciones de la función puestas entre paréntesis son diferencias divididas finitas. Por ejemplo, la primera diferencia dividida finita se representa por lo general como rr
f[xj,Xj]
T
/ ( • * / ' )
~
f( j) X
=
/ 1 0 n \
(18.12) X¡ -
Xj
La segunda diferencia dividida finita, la cual representa la diferencia de las dos primeras diferencias divididas, se expresa por lo general como
508
INTERPOLACIÓN
; 0
o
f(x )-
:f[x,, x ]-
\
f(x,)-
:f[x , x,]
f(x |-
: [x . x ]"
x
i
x
2
Tareero
|. x„]
0
0
x
2 3
Segundo
Primara
*/
|X|,
X,,
X,„
2
f
2
3
2
f[x h
*3
3
FIGURA 18.5 Ilustración gráfica de la naturaleza recursiva de las diferencias divididas finitas.
,
,
r
f \x¡ ,x,,x¡Á J
f[Xi,Xj]
f[.Xj,X ]
-
K
=
- -
x¡-x
1
(18.13)
k
,
>•••i
En forma similar, la n-ésima diferencia dividida finita es j. f[x„,X„-u...,X Xo]
fí ni x
=
r
U
-
n —\
x
-
-
X„
x
-
\ \ — /[x„_i, -
X „ _ 2 , . . . , XQ]
(.18.14)
— XQ
Estas diferencias pueden usarse para evaluar los coeficientes en las ecuaciones (18.8) hasta la (18.11), las cuales entonces se sustituirán en la ecuación (18.7) para obtener el polinomio de interpolación /«(*) = ñ o) x
+ -+
+ (x-
* y i * i » *o] + ( ~ x
0
x )(x - x^x^
x
0
u
(x - Xo)(x - x,) ... (x - x _ Y[x ,x _ ,...,x ] n
1
n
n
l
x] 0
(18.15)
0
que es conocido como polinomio de interpolación por diferencias divididas de Newton. Debe observarse que no es necesario que los datos utilizados en la ecuación (18.15) sean igualmente espaciados o que los valores de la abscisa deban estar en orden ascendente, como se ilustra en el siguiente ejemplo. También, observe cómo las ecuaciones (18.12) a (18.14) son recursivas (es decir, las diferencias de órdenes mayores se calculan al tomar diferencias de orden menor, véase la figura 18.5). Esta propiedad será aprovechada cuando desarrollemos un programa eficiente en la computadora dentro de la sección 18.1.5 para implementar el método. EJEMPLO 18.3
Interpolando polinomios mediante la diferencia dividida de Newton
Enunciado del problema. En el ejemplo 18.2, los datos e n x = \,x = 4 yx — 6 se utilizaron para estimar ln 2 con una parábola. Ahora, agregando un cuarto punto (x = 5; f(x ) = 1.609438], calcule el ln 2 con una interpolación del polinomio de Newton de tercer orden. 0
x
2
3
3
Solución.
El polinomio de tercer orden utilizando la ecuación (18.7) con n — 3, es
/ l ( . v ) = b{) + l>l(X - X ) + l> (.\ - .«o) (.V - .V|) | /0,(.\ T )
2
.loK.v • -.»| )(\
.v>)
(Wl\A\
1 5.1
UirCKCrNUA U l V I V I U r t u c
P I S Y T
I W I ^
FIGURA 18.6 Uso de la interpolación cúbica para estimar ln 2.
Las primeras diferencias divididas para el problema son [véase la ecuación (18.12)] 1.386294-0 f[X],X ]
=
f[x ,Xi]
=
f[X3,X ]
=
0
= 0.4620981
4-0
1.791759 - 1.386294 2
2
0.2027326
6-4 1.609438 - 1.386294 5-6
0.1823216
Las segundas diferencias divididas son [véase la ecuación (18.13)] 0.2027326-0.4620981 f[X2,Xi,X ] 0
f[XT,,X ,Xi
=
6- 1 0.1823216-0.2027326 5-4
2
= -0.05187311 = -0.02041100
La tercera diferencia dividida es [véase la ecuación (18.14) con n = 3] - 0 . 0 2 0 4 1 1 0 0 - (-0.05187311) 5 - 1
= 0.007865529
Los resultados para/[*,, x ],f[x , X^XQ] y f[x , x , x , x ] representan los coeficientes 6,, b y ¿> de la ecuación (18.7). Junto con b =f(x ) = 0.0, la ecuación (18.7) es 0
2
3
2
3
0
2
0
x
0
INTERPOLACIÓN
310
fr(x) = 0 + 0.4620981 (JI - 1) - 0.05187311 (x
I )(.v - 4)
+ 0.007865529(x - l ) ( x - 4)(x - 6) que puede usarse para e v a l u a r / ^ ) = 0.6287686, el cual representa un error relativo de e¡ = 9.3%. El polinomio cúbico completo se muestra en la figura 18.6.
18.1.4
E r r o r e s al i n t e r p o l a r p o l i n o m i o s de N e w t o n
Observe que la estructura de la ecuación (18.15) es similar a la serie de expansión de Taylor en el sentido de que se agrega términos en forma secuencial para capturar el comportamiento de alto orden de la función en turno. Estos términos son diferencias divididas finitas y, así, representan aproximaciones de las derivadas de orden mayor. Por consiguiente, como ocurrió con la serie de Taylor, si la verdadera función subyacente es un polinomio de w-ésimo orden, el polinomio sujeto a interpolación de n-ésimo con base en n + 1 puntos dará resultados exactos. También, como fue el caso con la serie de Taylor, puede obtenerse una formulación para el error de truncamiento. Recuerde de la ecuación (4.6) que el error de truncamiento para la serie de Taylor podría expresarse por lo general como f
(n+l)(t\
(n+
(4.6)
1)1
donde ¿j está en alguna parte en el intervalo x¡ a x , . Para una interpolación de n-ésimo orden, una relación análoga para el error es +1
R„
r" (£)(x - x +1)
0
) ( x - x ) • • • (x
(18.16)
-x„)
t
(n + 1)!
donde £ está en alguna parte en el intervalo que contiene la incógnita y los datos. Para esta fórmula que habrá de usarse, la función en turno debe ser conocida y < iferenciable. Por lo común éste no es el caso. Por fortuna, una formulación alternativa ei tá disponible y no requiere conocimiento previo de la función. Más bien, usa una diferí ncia dividida finita para aproximar la derivada (n + l)-ésima, R„ =
fíx,x„,x„^i
, X ](X
-
Q
X )(X
-
0
X\)
• • • (X -
X„)
(18.17)
donde f[x, x ,x ,..., x )] es la (n + 1 )-ésima diferencia dividida finita. D :bido a que la ecuación (18.17) contiene la incógnita/(x), no puede resolverse para el err >r. Sin embargo, si se dispone de un dato adicional f(x ), la ecuación (18.17) pue=y¡ END DO DO j = 1,n DO i = 0,n- j fdd = (fdd i ENDDO END DO xterm = 1 yint = fdd DO order = 1, n xterm = xterm * (x¡ - x yintZ = yint . + fdd fdd
¡¿
0
0¡0
older 1
END order END Newtlnt
fdd^x^-xj
M¡t
oreter
0iOrder
_,)
* xterm
18.1
DIFERENCIA DIVIDIDA DE N E W T O N PARA LA INTERPOLACIÓN
913
Todas las características anteriores pueden aprovecharse y ser incorporadas en un algoritmo general para implementar el polinomio de Newton (véase la figura 18.7). Observe que el algoritmo consiste en dos partes: el primero determina los coeficientes o partir de la ecuación (18.7); el segundo establece las predicciones y su error asociado. La utilidad de este algoritmo se demuestra en el ejemplo siguiente. EJEMPLO 18.5
Estimación del error para determinar el orden adecuado de interpolación
¡ ; j
i
Enunciadodel problema. Después de incorporar el error [véase la ecuación (18.18)], utilice el algoritmo de cómputo que se muestra en la figura 18.7 y la siguiente información para evaluar/(x) = Inxenx = 2:
f
x
0 4 ó 5 3 1.5 2.5 3.5
(x) = ln x
1 1.3862944 1.7917595 1.6094379 1.0986123 0.4054641 0.9162907 1.2527630
Solución. Los resultados al emplear el algoritmo de la figura 18.7 para obtener una solución se muestran en la figura 18.8. El error estimado, junto con el error real (con
|
FIGURA
18.8
L o s resultados de u n programa, con base en el ag lorm ti o de la figura 18.7, para evaluar n l 2. NUMBER OF P01NTS? 8 X( 0 ) ,
y(
0
) -
?
X(
1 ). X( 2 ) ,
y(
1
) -
? 4 , 1. 3 8 6 2 9 4 4
y(
2 ) -
?
X( 3 ) .
y(
3 ) -
?
5 , 1.6094379
X( 4 ) ,
y(
4
?
3 , 1 .0986123
X( 5 ) . X( 6 ) ,
y(
5 ) -
?
1.5 , 0 . 4 0 5 4 6 4 1 1
y(
6 ) -
? 2.5 .0.91629073
X( 7 ) ,
y(
7
?
) -
) -
INTERPOLATION AT X -
1,0 6 , 1.7917595
3.5 ,1.2527630 2
ORDER
F(X)
ERROR
0
0.000000
0.462098 0.103746
1
0.462098
2
0.565844
0.062924
3
0.628769
0.046953
4
0.675722
0.021792
5
0.697514
-0.003616
6
0.693898
-0.000459
7
0.693439
514
INTERPOLACIÓN
I ¡ \ ! \ \ \ ¡ i j j
base en el hecho de que ln 2 = 0.6931472), se ilustran en la figura 18.9. Observe que el error estimado y el real son similares y que su concordancia mejora en tanto se aumente el orden. A partir de estos resultados se puede concluir que la versión de quinto orden da una buena estimación y que los términos de orden superior no resaltan en forma significativa la predicción. Este ejercicio también ilustra la importancia de colocar el orden de los puntos. Por ejemplo, hasta la estimación del tercer orden, la razón de mejora es lenta debido a que los puntos que se agregaron (en x = 4, 6 y 5) están distantes y a un lado del punto de análisis en x = 2. La estimación de cuarto orden muestra algo de mejora ya que el nuevo punto en x — 3 está cercano a la incógnita. Sin embargo, la disminución más dramática en el error está asociada con la inclusión del término de quinto orden mediante los datos en x = 1.5. No sólo está este punto cercano a la incógnita, sino que también se halla en el lado opuesto de la mayoría de los otros puntos. En consecuencia, el error se reduce a casi un orden de magnitud. El significado de la posición y secuencia de los datos se puede también ilustrar al usar los mismos datos para obtener una estimación para el ln 2, pero considerando los
i j !
FIGURA 18.9 Porcentaje de errores relativos para la predicción de ln 2 como una función del orden de la interpolación polinomial.
Error i
FIGURA 18.13 Ilustración de la divergencia posible de una predicción extrapolada. La extrapolación se basa en el ajuste de una parábola a través de los primeros tres puntos conocidos.
tablas con argumentos igualmente espaciados. De hecho, una estructura computacional conocida como tabla de diferencias divididas fue desarrollada para facilitar la implementación de esas técnicas. (La figura 18.5 es un ejemplo de esa tabla.) Sin embargo, como las fórmulas son subconjuntos de esquemas de Newton y Lagrange compatibles con computadora y debido a las muchas funciones tabulares disponibles, como subrutinas de librerías, la necesidad para las versiones igualmente espaciadas ha disminuido. A pesar de esto, por su relevancia las hemos incluido en este tema en las últimas partes de este libro. En particular, son necesarias para obtener fórmulas de integración numérica que emplean de manera típica datos igualmente espaciados (véase el capítulo 21). Como las fórmulas de integración numérica tienen relevancia en la solución de ecuaciones diferenciales ordinarias, el material del cuadro 18.2 tiene también significado en la parte siete. Extrapolación es el proceso de estimar un valor de f(x) que se tiene fuera del rango de los puntos base conocidos, x , JC,, . . ., x (véase la figura 18.13). En una sección anterior, mencionamos que la interpolación más exacta es usualmente obtenida cuando las incógnitas están cerca del centro de los puntos base. Obviamente, esto no se cumple cuando las incógnitas se encuentran fuera del rango y, en consecuencia, el error en extrapolación puede ser muy grande. Como se ilustra en la figura 18.13, la naturaleza de extremos abiertos de la extrapolación representa un paso en la incógnita, ya que el proceso extiende la curva más allá de la región conocida. Como tal, la curva real podría con facilidad divergir de la predicción. Por tanto, se debe tener extremo cuidado al realizar ejercicios donde surja un caso que se deba extrapolar. 0
n
N IT E R P O L A C Ó IN INTERPOLACIÓN
SEGMENTARIA
-^n la sección anterior, se usó polinomios de w-ésimo orden para interpolar entre n + 1 ¿Jatos. Por ejemplo, para ocho puntos se puede derivar un perfecto polinomio de séptimo ¿>rden. Esta curva podría capturar todas las curvaturas (al menos hasta e incluso la séptica derivada) sugeridas por los puntos. Sin embargo, hay casos en los que estas funciones pueden llevar a resultados erróneos debido a errores de redondeo y puntos lejanos. Un
s
G If URA 181 .4
(Jna representación visual de una situación donde las segmentarias son interpolaciones polinomialesde orden superior. La función que habrá de ajustarse pasa por un incremento jubito en x = 0. Los incisos a) a c) indican que el cambio abrupto induce oscilaciones al ¡nterpolar polinomiales. En contraste, como las curvas se limitan a tercer orden con transiciones suaves, la segmentaria cúbica d) proporciona una aproximación mucho más ¿iceptable.
a) f(x),
b)
X
i 999 J—, »-
f(x)
J>
J
•
0 d)
x
18.6
.
', J 1
525
procedimiento alternativo es aplicar polinomios de orden inferior a subconjuntos de datos. Tales polinomios conectores son llamados funciones segmentarias. Por ejemplo, curvas de tercer orden empleadas para conectar cada par de datos son llamadas segmentarias cúbicas. Esas funciones se pueden construir de tal forma que las conexiones entre las ecuaciones cúbicas adyacentes resultan visualmente suaves. Sobre la superficie, podría parecer que la aproximación de tercer orden de las segmentarias sería inferior a la expresión de séptimo orden. UstecJ se preguntaría por qué una segmentaria podría ser siempre preferible. La figura 18.14 ilustra una situación donde una segmentaria se comporta mejor que una polinomial de orden superior. Este es el caso donde una función es por lo general suave pero conlleva un cambio abrupto en algún lugar a lo largo de la región de interés. El incremento de paso expuesto en la figura 18.14 es un ejemplo extremo de tal cambio y sirve para ilustrar este punto. De la figura 18.14a hasta la 18.14c se ilustra cómo un polinomio de orden superior tiende a formar una curva a través de oscilaciones bruscas en la vecindad con un cambio súbito. En contraste, la segmentaria también conecta los puntos, pero debido a sus cambios limitados de tercer orden, las oscilaciones se mantienen a un mínimo. Como tal, la segmentaria usualmente proporciona una aproximación superior del comportamiento de las funciones que tienen cambios locales y abruptos. El concepto de la segmentaria se origina de la técnica de dibujo con una cinta delgada y flexible (llamada curvígrafo) para dibujar curvas suaves a través de un conjunto de puntos. El proceso se expone en la figura 18.15 para una serie de cinco pasadores (datos). En esta técnica, el dibujante coloca un papel sobre una mesa de madera y golpea los clavos o pasadores en el papel (y la mesa) en la ubicación de los datos. Una curva suave resulta al entrelazar la cinta entre los pasadores. De aquí que se haya adoptado el nombre de "segmentaria cúbica" para los polinomios de este tipo. En esta sección, se usarán primero funciones lineales simples para introducir algunos conceptos básicos y problemas asociados con la interpolación segmentaria. Entonces obtendremos un algoritmo para el ajuste de datos con segmentarias cuadráticas. Por último, presentamos material sobre la segmentaria cúbica, la cual es la versión más común y útil en la práctica de la ingeniería.
¡í
\i
INTERPOLACIÓN SEGMENTARIA
FIGURA 18.15 La técnica de dibujo.al usar una segmentaria para dibujar curvas suaves a través de una serie de puntos. Observe cómo en los puntos extremo, la segmentaria trata de enderezarse. Esto es conocido como uña segmentaria "natural".
526
INTERPOLACIÓN
18.6.1
S e g m e n t a r i a s lineales
La conexión más simple entre dos puntos es por medio de una línea recta. Las segmentarias de primer orden para un grupo de datos ordenados pueden definirse como un conjunto de funciones lineales, f(x)
= f(xo)
+m (x 0
/ ( x ) = / ( x i ) +nn(x
-
x ) 0
- xi)
f(x) = / ( x „ - j ) + m„-\(x
- x„_i)
xo < x '< xi Xi £ x <
Xi
x„_i < x < x„
donde m¡ es la pendiente de la línea recta que conecta los puntos: /(*/ + !) -
f(x¡)
x¡+i — x¡
(18.27)
Estas ecuaciones se pueden usar para evaluar la función en cualquier punto entre x y x para localizar primero el intervalo dentro del cual está el punto. Después se usa la ecuación adecuada para determinar el valor de la función dentro del intervalo. El método es obviamente idéntico al de la interpolación lineal. 0
n
EJEMPLO 1 8 . 8
Segmentarias de primer orden
Enunciado del problema. Ajuste los datos de la tabla 18.1 con segmentarias de primer orden. Evalúe la función e n x = 5. Solución. Se puede usar los datos para determinar las pendientes entre puntos. Por ejemplo, para el intervalo x = 4.5 a x = 7 la pendiente se puede calcular mediante la ecuación (18.27): 2.5 - 1 7-4.5
= 0.60
Las pendientes para los otros intervalos se pueden calcular y las segmentarias resultantes de primer orden se grafican en la figura 18.16a. El valor e n x = 5 es 1.3. TABLA 18.1 Datos para ser ajustados con funciones segmentarias. f(x)
3.0 4.5 7.0 9.0
2.5 1.0 2.5 0.5
Una inspección visual a la figura 18.16a indica que la principal desventaja de las segmentarias de primer orden es que no son suaves. En esencia, en los puntos donde dos segmentarias se encuentran (llamado nodo), la pendiente cambia de forma abrupta. En términos formales, la primera derivada de la función es discontinua en esos puntos. Esta deficiencia se resuelve al usar segmentarias polinomiales de orden superior que aseguren suavidad en los nodos al igualar derivadas en esos puntos, como se analiza en la siguiente sección. 18.6.2
S e g m e n t a r i a s cuadráticas
Para asegurar que las derivadas m-ésimas son continuas en los nodos, se debe usar una segmentaria de al menos m + 1 orden. A menudo se usan con más frecuencia en la práctica los polinomios de tercer orden o segmentarias cúbicas para asegurar derivadas
FIGURA 18.16 Ajuste segmentario de un conjunto de cuatro puntos, a) Segmentaria lineal, b) segmentaria cuadrática y c] segmentaria cúbica, se gráfica también con una interpolación polinomial cúbica.
Segmentaria de primer orden
10
x
Segmentaria de segundo orden
0
I
1
1
|
L
J
L
b) Segmentaría cúbica
\
'
Interpolación cúbica
o
f
528
INTERPOLACIÓN
continuas de primer y segundo orden. Aunque las derivadas de tercer orden y mayor© podrían ser discontinuas cuando se usa segmentarias cúbicas, usualmente no puede detectarse en forma visual y en consecuencia son ignoradas. Debido a que la obtención de segmentarias cúbicas está algo involucrada, la hem* escogido en una sección subsecuente. Hemos decidido primero ilustrar el cor.cípto e j interpolación segmentaria mediante polinomios de segundo orden. Esas "segmentáis j cuadráticas" tienen primeras derivadas continuas en los nodos. Aunque las segmentaras cuadráticas no aseguran segundas derivadas iguales en los nodos, «'"•en muy b¡en pía | demostrar el procedimiento general en el desarrollo de segmentarias de o. jen ¡superior. El objetivo de las segmentarias cuadráticas es derivar un polinomio de segundo orden para cada intervalo entre datos. El polinomio para cada intervalo se puede representar de manera general como
f,(x) = cnx + bix + ci 2
(18.28)
La figura 18.17 ha sido incluida para ayudar a clarificar la notación. Para n + 1 datos (i = 0, 1, 2 n) existen n intervalos y, en consecuencia, 3n constantes desconocidas (las a,byc) por evaluar. Por tanto, se requieren 3« ecuaciones o condiciones para evaluar las incógnitas. Éstas son: 1.
Los valores de la función de polinomios adyacentes deben ser iguales a los nodos interiores. Esta condición se puede representar como a¡- x}_ x
+
x
+ c,-i = /(*,_!)
(18-29)
a¡xf_ + b¡x¡-[ + c¡ = /(*,•_ i)
(18.30)
l
para / = 2 a n. Como sólo se usa nodos interiores, las ecuaciones (18.29) y (18.30) proporcionan cada una n — 1 condiciones del total de 2n — 2.
FIGURA 18.17 Notación usada para derivar segmentarias cuadráticas. Observe que hay n intervalos y n + 1 datos. El ejemplo mostrado es para n = 3.
a,)?
•«
+ bfX+
c-
Intervalo 1
_j
•
Intervalo 2
*
1
,
•
Intervalo 3
1
1
*0
*1
*2
*3
;= 0
/=1
1-2
/=3
*
18.6*
2.
INTERPOLACIÓN SEGMENTARIA
1 9 9
Las primera y última funciones deben pasar a través de los puntos extremo. Es agrega dos ecuaciones adicionales: a\xl + bix
0
a„x
+ c\ = f(x )
+ b x„ +c„-
2
n
(18.31)
0
n
f(x )
(18.32)
n
para un total de 2n — 2 + 2 = 2n condiciones. 3.
Las primeras derivadas en los nodos interiores deben ser iguales. La primera derivada de la ecuación 18.28 es f\x)
= 2ax + b
Por tanto, la condición se puede representar de manera general como 2a¡-\x,-\
4.
+ b¡-[ =
2a¡Xi-\
+ b¡
(18.33)
para i = 2 a n. Esto proporciona otras n — 1 condiciones para un total de 2n + n — 1 = 3« — 1. Como se tiene 3n incógnitas, se tiene una condición corta. A menos que tengamos alguna información adicional con respecto a las funciones o sus derivadas, debemos tomar una selección arbitraria para calcular de manera exitosa las constantes. Aunque hay un número de elecciones diferentes que se pueden tomar, seleccionamos la siguiente: Suponga que en el primer punto la segunda derivada es cero. Como la segunda derivada de la ecuación 18.28 es 2a¡, esta condición se puede expresar matemáticamente como «i = 0
(18.34)
La interpretación visual de esta condición es que los dos primeros puntos se conectarán con una línea recta. EJEMPLO 1 8 . 9
j ! \
Segmentarias cuadráticas
Enunciado del problema. Ajustar por medio de segmentarias cuadráticas los mismos datos que se usaron en el ejemplo 18.8 (véase tabla 18.1). Use los resultados para calcular el valor enx = 5.
| Solución. Para este problema, se tienen 4 datos con n — 3 intervalos. Por tanto, 3(3) = \ 9 incógnitas por ser determinadas. Las ecuaciones (18.29) y (18.30) dan 2(3) — 2 = 4 i condiciones: 1
2 0 . 2 5 a i + 4 . 5 & 1 + c i = 1.0
I
20.25(32 + 4.5Í7 + c = 1.0 2
2
j
49a +
7/7 + c = 2.5
J
49a +
7fo + c = 2.5
2
3
2
3
2
3
Evaluando a las funciones primera y última en los valores inicial y final se agregan 2 ecuaciones mes [véase ecuación (18.31)]:
530
INTERPOLACIÓN
9a! +3b> + c i = 2.5 y [véase ecuación (18.32)] 81a + 9 ¿ > + c = 0.5 3
3
3
La continuidad de las derivadas crea un adicional de 3 — 1 = 2 [véase ecuación (18.33)]: + b\ = 9a 4- b
9Ú[
2
14a + 2
¿>2
2
= 14a + 3
¿>3
Por último, la ecuación (18.34) especifica que a — 0. Como esta ecuación especifica a¡ de manera exacta, el problema se reduce a la resolución de ocho ecuaciones simultáneas. Estas condiciones se pueden expresar en forma matricial como x
4.5 0 0 0 3 0 1 0
1 0 0 0 1 0 0 0
0 0 20.25 4.5 7 49 0 0 0 0 0 0 -9 -1 14 1
0 0 0 7 0 9 0 -1
0 0 1 0 1 0 49 0 0 0 0 81 0 0 0 -14
0" 0 0 1 0 1 0 0
C\
a b
2
2
C
2
a C
3
'3
1 1 2.5 2.5 2.5 0.5 0 0
Esas ecuaciones se pueden resolver mediante las técnicas de la parte tres, con los resultados: «i=0
b\ = — 1
c\ = 5.5
a = 0.64
b =-6.76
c = 18.46
a =-1.6
¿3=24.6
£- = - 9 1 . 3
2
2
3
2
3
las cuales pueden sustituirse en las ecuaciones cuadráticas originales para desarrollar la siguiente relación para cada intervalo: /,(.v) = —jr + 5.5 f (x)
3.0A
+
A
A
^ \
i
+
A .
.A,
A
F(2) F(6)
+
>A
i
A
*r
w° 'i m) /\rX y/ m// Ur f(7)Y \m¡ mf rA
A
TA
. X X+
\
F(0) F(4)
+
+ .A^
A
TA
F(5)
A ,
A
A.
A
+
F(3) F(7)
1
19.6
TRANSFORMADA RÁPIDA DE FOURIER
Algoritmo de cómputo. Es una proposición relativamente directa expresar la figura 19.16 como un algoritmo. Como fue el caso para el algoritmo de la TDF de la figura 19.12, se usará la identidad de Euler, e
± m
= eos a ± i sen a
para permitir implementar al algoritmo en lenguajes que no acomoden en forma explícita variables complejas. Una inspección cercana a la figura 19.16 indica que su diagrama computacional molecular fundamental es la conocida en forma extensa como red mariposa, ilustrada en la figura 19.17a. El pseudocódigo para implementar una de esas moléculas se muestra en la figura 19.176. El pseudocódigo para la TRF se enlista en la figura 19.18. La primera parte consiste, en esencia, en tres ciclos anidados para implementar el cuerpo computacional de la figura 19.16. Observe que los datos reales valuados se guardan originalmente en el arreglo x. También observe que el ciclo exterior pasa a través de las M etapas [recuerde la ecuación (19.31)] del diagrama de flujo. Después de que esta primera parte se ejecuta, la TDF habrá sido calculada pero en desorden (véase el lado derecho de la figura 19.16). Esos coeficientes de Fourier pueden ser ordenados por un procedimiento llamado de fragmento inverso. Si los subíndices del 0 al 7 se expresan en forma binaria, se puede obtener el orden correcto al invertir esos fragmentos (véase figura 19.19). La segunda parte del algoritmo implementa este procedimiento. 19.6.2
A l g o r i t m o de Cooley-Tukey
La figura 19.20 muestra una red de flujo para implementar el algoritmo de CooleyTukey. Para este caso, la muestra se divide inicialmente en puntos impares y pares numerados, y los resultados finales están en el orden correcto. Este procedimiento es llamado una ordenación en tiempo. Es la inversa del algoritmo de Sande-Tukey descrito en la sección anterior. Aunque las dos clases de métodos difieren en organización, ambos exhiben las AHog N operaciones que son la fortaleza del procedimiento de la TRF. 2
FIGURA 19.17 o| Una red mariposa que representa el cálculo fundamental de la figura 19.16. b) Pseudocódigo para implementar a).
#
ftP)
temporal = real (0) + real (1) real(1) - real (0)-real (1) real (0) = temporal temporal = imaginario (0) + imaginario (1) imaginario (1) = imaginarlo (0) - imaginario (1) Imaginario (0) - temporal
b)
562
APROXIMACIÓN DE FOURIER
m = LOÚ(N) / L0G(2) N2 = N D0k = 1,m N1 = N2 N2 = N2/2 angle = 0 arg = 2n IN1 DO} = 0,N2-1 c = coe(angle) e = sin(atigle) DO i =j,NN1 kk = i+ N2 xt = x(¡) - x(kk) x(i) = x(¡) + x(kk)
J=0 DO ¡ = 0, N-2 IF (i < j) THEN xt = Xj
Xj X¡=
x,.
= xt
yt=yj yj=y, y,=yt
END IF
í,
k = N/2 DO IF(k>j + 1)EXIT j=j-k k = k/2 END DO
y =yO)-y(kk) t
5
x(kk) =xt *c-yt *s y(kk) =yt * c + xt * END DO angle = Q +1) * arg END DO END DO
J=J END DO D0i = 0,N-1 x(¡) = x(¡) / N y(¡)=y(¡)/N END DO +
k
FIGURA 19.18
Pseudocódigo para implementar una decimación en la frecuencia para la TRF. Observe que el pseudocódigo está compuesto por dos partes: a) la misma TRF y b) una rutina de fragmentos inversa para no desordenar los coeficientes resultantes de Fourier.
FIGURA 19.19
Ilustración del proceso de fragmentos inversa. Desorden (Decimal)
F|0| F(4) F(2) F(6| F(l) F(5) F|3) F|7)
Orden de fragmentos invertida (Binario)
Ordenado (Binario)
=>
F[000| F(100) F(010) F(UO) F(OOl) F|101) F(011) F|lll)
=>
F(000) F(001) F|010) F(011) F( 100) F|101) F(110| F|lll)
Resultado final (Decimal)
=>
F|0) F|l) F|2) F(3) F(4) F(5) F|6) F|7)
197 .
MI
EL ESPECTRO DE P O T E N C I A
^¡*i§i|i)iita^lj^i).
f^»>>Oit)i|i^M |j li •¡H i),
FIGURA 19.20 Diagrama de flujo de una TRF con decimación en el tiempo para una TDF de 8 puntos.
19.7
EL E S P E C T R O DE POTENCIA La TRF tiene muchas aplicaciones en ingeniería, que van desde análisis vibratorio do estructuras y mecanismos hasta el procesamiento de señales. Como se describió antes, la amplitud y el espectro de fase proporcionan un medio para discernir la estructura fundamental de señales aleatorias aparentes. De manera similar, un análisis útil llamado espectro de potencia se puede desarrollar a partir de la transformada de Fourier. Como su nombre lo implica, el espectro de potencia se deriva del análisis de la potencia de salida de sistemas eléctricos. En términos matemáticos, la potencia de una señal periódica en el dominio del tiempo se puede definir como f
1
1
T/2
J-T/2
Ahora, otra forma de buscar en esta información es expresándola en el dominio de la frecuencia al calcular la potencia asociada con cada una de las componentes de la frecuencia. Esta información se puede entonces desplegar como un espectro de potencia, una gráfica de la potencia contra la frecuencia. Si la serie de Fourier para f(t) es oo
f(t)
=
Fne '
(19.38)
ikü>0
se cumple la siguiente relación (véase Gabel y Roberts 1987 para más detalles):
(193 .9)
564
APROXIMACIÓN DE FOURIER
De esta forma, la potencia en f(t) se puede determinar al sumar los cuadrados de los coeficientes de Fourier; es decir, las potencias asociadas con las componentes de frecuencia individual. Ahora, recuerde que en esta representación, la armónica real simple consiste en ambos componentes de la frecuencia en 0 También sabemos que los coeficientes positivo y negativo son iguales. Por tanto, la potencia la ¿-ésima armónica real de /(Oes
±ka> .
enf^t),
p =2\F \
(19.40)
2
k
k
El espectro de potencia es la gráfica de p como una función de la frecuencia ¿fi%. Dedicaremos la sección 20.3 a una aplicación de la ingeniería que involucra la TRF y el espectro de potencia generado por medio de paquetes de software. k
Información adicional. Lo anterior ha sido una breve introducción a la aproximación de Fourier y a la TRF. Información adicional sobre la primera se puede encontrar en Van Valkenburg (1974), Chirlian (1969), y Hayt y Kemmerly (1986). Referencias sobre la TRF son incluidas en Davis y Rabinowitz (1975); Cooley, Lewis y Welch (1977), y Brigham (1974). Buenas introducciones a ambos asuntos se pueden encontrar en Ramírez (1985), Oppenheim y Schafer (1975), Gabel y Roberts (1987).
19.8
AJUSTE DE CURVAS CON LIBRERÍAS Y
PAQUETES
Las librerías y paquetes de software tienen grandes capacidades para el ajuste de curvas. En esta sección daremos una muestra de las más usuales. 19.8.1
Excel
En el presente contexto, la aplicación más útil de Excel es para el análisis de regresión y, con menos extensión, para la interpolación polinomial. Además de algunas funciones predeterminadas (véase la tabla 19.1), existen dos formas principales en las cuales esta capacidad se puede implementar: el comando Trendline y el Paquete de Herramientas para el Análisis de Datos.
TABLA 19.1
Funciones prefabricadas de Excel que relacionan los ajustes por regresión de los datos.
Función
Descripción
FORECAST GROVVTH INTERCEPT UNEST LOGEST SLOPE TREND
Regresa un valor ¡unto con una tendencia lineal Regresa valores ¡unto con una tendencia exponencial Regresa el intercepto de la línea de regresión lineal Regresa los parámetros de una tendencia lineal Regresa los parámetros de una tendencia exponencial Regresa la pendiente de la línea de regresión lineal Regresa un valor ¡unto con una tendencia lineal
19.8
565
AJUSTE DE CURVAS CON LIBRERÍAS V P A Q U E T E S
El comando Trendline (menú insert). Este comando permite un número de diferentes modelos de tendencia que se pueden agregar a la gráfica. Esos modelos incluyen ajustes lineales, polinomiales, logarítmicos, exponenciales, de potencia y de promedio de movimiento. El siguiente ejemplo ilustra cómo se llama al comando Trendline.
EJEMPLO 1 9 . 3
Usando el comando Trendline de Excel
Enunciado del problema. Usted habrá notado que varios ajustes disponibles en Trendline fueron analizados anteriormente en el capítulo 17 (por ejemplo, lineal, polinomial, exponencial y potencia). Una capacidad adicional es la del modelo logarítmico y =a
0
+ ai logx
Ajuste los siguientes datos con este modelo usando el comando de Excel Trendline: X
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
y
0.53
0.69
1.5
1.5
2
2.06
2.28
2.23
2.73
2.42
2.79
Solución. Para ejecutar el comando Trendline, se debe crear una gráfica que relaciona una serie de variables dependientes e independientes. Para el caso actual, se usa la guía de gráficas de Excel Wizard (Asistente) para crear una gráfica XY con los datos. Después, se selecciona la gráfica (haciendo doble clic en ésta) y la serie (al posicionar el cursor sobre uno de los valores y con un solo clic). Los comandos Insert y Trendline son entonces ejecutados con la ayuda del ratón o por la siguiente secuencia de teclas / Insert Trendline En este punto, se abre un cuadro de diálogo con dos tabuladores: el Options (Opciones) y el Type (Tipo). El tabulador Options proporciona formas para configurar el ajuste. Lo más importante en este contexto es desplegar tanto la ecuación como el valor del coeficiente de determinación (r ) sobre la gráfica. La primera elección en el tabulador Type es para especificar el tipo de línea. Para el caso actual, se selecciona Logarithmic. El ajuste resultante junto con r se despliega en la figura 19.21. 2
2
FIGURA 19.21 Ajuste de un modelo logarítmico con los datos del ejemplo 19.3.
y3
r
2
0
0
2
4
566
APROXIMACIÓN DE FOURIER
I I I I
El comando Trendline proporciona una manera fácil para ajustar un número de modelos para datos que se usan de manera común. Además, su inclusión en la opción Polinomial significa que también se puede usar para interpolación polinomial. Sin embargo, debido a su contenido estadístico, está limitado a r , y esto significa que no permite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias. 2
El paquete de herramientas para el análisis de datos.
Este paquete de Excel, tam-
bién incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general y = az 0
+ a\Z\ + a z
0
2
2
H
\-a z m
m
+e
(17.23)
donde z , z ,..., z son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel. 0
EJEMPLO 19.4
x
m
Usando el paquete de herramientas para el análisis de datos de Excel
Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:
S, R, U,
0.0002
0.0002
0.0005
0.0005
0.001
0.001
0.2
0.5
0.2
0.5
0.2
0.5
0.25
0.5
0.4
0.75
0.5
1
m/m m
m/s
Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma
U =aS R a,ayp a
p
donde son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo. Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23),
U = a+a S+p R log
log
log
Se puede desarrollar una hoja de cálculo en Excel con los datos originales junto con sus respectivos logaritmos, como en la siguiente tabla:
566
APROXIMACIÓN DE FOURIER
El comando Trendline proporciona una manera fácil para ajustar un número de modelos para datos que se usan de manera común. Además, su inclusión en la opción Polinomial significa que también se puede usar para interpolación polinomial. Sin emI bargo, debido a su contenido estadístico, está limitado a r , y esto significa que no per•' mite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias. 2
El paquete de herramientas para el análisis de datos.
Este paquete de Excel, tam-
bién incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general y — ao^o + a\Z\ + a z 2
2
H
\-a z,„+e
'
m
(17.23)
donde z , z ,..., z son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel. 0
EJEMPLO 19.4
,
x
m
Usando el paquete de herramientas para el análisis de datos de Excel
Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:
S, R, U,
0.0002
m/m m
0.0002
0.0005
0.2
0.5
0.2
0.25
0.5
0.4
0.0005
0.001
0.001
0.5
0.2
0.5
0.75
0.5
1
m/s
Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma U
=aS"R
p
a,oyp
donde son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo. Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23), U = log a + tr log S + p log R
Se puede desarrollar una hoja de cálculo en Excel con los dalos originales junio con sus respectivos logaritmos, como en la siguiente tabla:
mjvoi
r,a
A
¿
0.0002 0.0002
4
0.0005 0.0005
5 6 7
B
Rh
S 3
c wc W K W O
'
U 0.2 0.5 0.2 0.5 0.2
0.001 0.001
W T N UBKBRIAS T W 5 J U E T E 5
0.5
1
1
B
P
loq(U| lofl(Rh) -0.69897 -0.60206 - 3 . 6 9 & V 1 -0.30103 -0.30103 -3.3010§ -0.69897 -0.39794 -3.30103' , -3.30103 -0.12494 -3 \-0.69897 -0.30103
lofl(S| 0.25 0.5 0.4 0.75 0.5 1
-3
^.30103
0
= log(A2)
Como se muestra, una forma eficiente para generar los logaritmos es tecleando la fórmula para calcular el primer log(S). Después se puede copiar esta fórmula a la derecha y hacia abajo para generar los otros logaritmos. Debido a su estado como una "incluida", en la versión de Excel disponible en el tiempo de la edición en inglés de este libro, el paquete de herramientas para el análisis de datos debe algunas veces cargarse en Excel. Para hacer esto, simplemente use el ratón o la secuencia de teclas /Tools Add-Ins Después seleccione Analysis Toolpack y OK. Si el add-in ha sido satisfactorio, la selección Data Analysis se incluirá en el menú Tools. Después de seleccionar Data Analysis en el menú Tools, un menú de Data Analysis aparecerá en pantalla conteniendo un gran número de rutinas orientadas estadísticamente. Seleccione Regression y aparecerá un cuadro de diálogo que esperará se le proporcione información sobre la regresión. Después de estar seguros que se ha seleccionado la instrucción por default New Worksheet Ply, llene en F2:F7 para el rango y y D2:E7 para el rango x y seleccione OK. Así se creará la siguiente hoja de cálculo:
B A RESUMEN DE RESULTADOS
1
2 3 4 5 6
10 11 13 •t)
•LI RH 10 !l il
D
E
F
G
Estadística de regresión
Múltiple R R cuadrada A¡. de R cuadrada Error estándar Observaciones
7
& 0
C
0.998353 0.996708 0.994513 0.015559 6
ANOVA Regresión Residual Total
IflIdU'Bplo X Variable 1
dt ss 2 3 5
0.219867 0.000726 0.220593
MS 0.109933 0.000242
F Siqniticanáa
454.1106
0.0001889
Coehs. Error estdr. Valor Inf. PSup. al al
0.433137
0.075932 0.022189
Sfadf 20.0501 19.5203
0.0002712 0.0002937
1.2808009
1.7641028
0.3625211 0.503752195% Ó.83456W
95%
APROXIMACIÓN DE FOURIER
De esta manera, el ajuste resultante es log U = 1.522 + 0.433 log S + 0.733 log R o al tomar el antilog, U =
333S R 0A33
0133
Observe que se han generado intervalos de confianza al 9 5 % para los coeficientes. Así, hay un 9 5 % de probabilidad de que la pendiente real del exponente esté entre 0.363 y 0.504, y el coeficiente real del radio hidráulico esté entre 0.631 y 0.835. De esta forma, el ajuste no contradice los exponentes teóricos.
Finalmente, se debe observar que se puede usar la herramienta Solver de Excel para ejecutar una regresión no lineal al minimizar de manera directa la suma de los cuadrados de los residuos entre la predicción modelo no lineal y los datos. Dedicaremos un ejemplo en la sección 20.1 para ver cómo se puede hacer esto. 19.8.2
Mathcad
Mathcad puede ejecutar una amplia variedad de tareas estadísticas, ajuste de curvas y corrección de datos. Dichas tareas incluyen trabajos relativamente simples, como trazo de histogramas y cálculo de resúmenes estadísticos de población tales como la media, mediana, varianza, desviaciones estándar y coeficientes de correlación. Además, Mathcad puede predecir valores intermedios al conectar los puntos de datos conocidos ya sea con líneas rectas (interpolación lineal) mediante I i n t e r p o con secciones de polinomiales cúbicos (interpolación segmentaria cúbica) por medio de cspline, pspline, o lspline. Estas funciones segmentarias le permiten intentar diferentes maneras que tienen que ver con interpolación en los puntos extremos de los datos. La función lspline genera una curva segmentada que es una línea recta al final de los puntos. La función pspline genera una curva segmentada que es una parábola en los puntos extremos. La función cspline genera una curva segmentada que es cúbica en los puntos extremo. La función i n t e r p usa el resultado del ajuste de curvas y regresa un valor y interpolado, dado un x valor. Además, usted puede ejecutar interpolación segmentaria cúbica en dos dimensiones al pasar una superficie a través de una malla de puntos. Mathcad contiene un número de funciones para ejecutar regresiones. Las funciones slope e intercept regresan la pendiente e intercepto del ajuste lineal por regresión de mínimos cuadrados. La función regress se usa para una regresión polinomial de n-ésimo orden de un conjunto completo de datos. La función loess ejecuta una regresión polinomial localizada de «-ésimo orden sobre un espacio de datos que usted puede especificar. La función i n t e r p también se puede usar para regresar valores intermedios de y a partir de un ajuste por regresión para un punto dado x. Las funciones regress y loess pueden también ejecutar regresión polinomial multivariable. Mathcad también proporciona la función l i n f i t que se usa para modelar datos con una combinación de funciones arbitrarias. Finalmente, la función genfit está disponible para casos donde los coeficientes del modelo aparecen en forma arbitraria. En este caso, las ecuaciones no lineales más difíciles se deben resolver por iteración.
19.8
AJUSTE D E CURVAS C O N LIBRERÍAS V
ROQUETES
Pongamos un ejemplo que muestre cómo se puede usar Muthcnd para ejecutar unu interpolación segmentaria en dos dimensiones (véase la figura 19.22). Los datos a ajustar son
z
y
0 1 2 3 4 5
1
2
0.14100 0.16700 -0.00302 -O.22500 0.17500 0.12600
-0.13900 -0.76400 -0.33400 0.46700 0.36800 0.76100
0 0.17500 0.93500 0.64900 -0.55300 -0.97900 -0.70700
x
3 -0.51400 -0.98600 -0.65900 0.73600 0.81400 0.30200
4 -0.29000 -0.30800 -0.00678 0.10600 0.39000 0.30300
5 0.32700 0.82600 0.23900 -0.09200 -0.78200 -0.16400
Observe que los números a lo largo de la parte superior y en el lado izquierdo son las coordenadas x y y de los valores z que se encuentran en el interior de la matriz. El primer paso es pasar los datos a Mathcad. Para hacer esto se pueden crear dos archivos de datos llamados MATSPLIN.PRN y MATXY.PRN. Los primeros dos activan las líneas en la figura 19.22 mediante el comando R E A D - P R N para leer los datos de esos archivos. El archivo MATSPLIN.PRN es un archivo simple de texto que contiene los valores de la función (z) a ser interpolada en varios puntos x y y sobre una rejilla rectangular. LAS dimensiones de la rejilla están definidas por los datos en el archivo de texto MATXY.PRN. Los elementos de este archivo son pares de valores x y y que caracterizan los elementos de la diagonal de la región. El símbolo definición se usa para asignar los datos de los archivos de datos a las variables Mz y Mxy. Después, el símbolo definición y la función ESPLIN se usan para definir la matriz S. Ésta es una matriz que contiene valores de la segunda derivada y otros resultados numéricos en varias localizaciones de la rejilla. Esta
FIGURA 19.22 Segmentaria 2D con Mathcad. File Edlt Vlew Insert Format SJath Symbolics yjlndow S«IP 2D
SPLTNE
Enter theroatrixspecifying a surface: Mz :=READPRN("matsplin.prn") Mxy :=READPRN("matxy.pm") Compute spline coefficients: S :=* cspüne(Mxy,Mz)
fit(x,y) :=
inteipjs,Mxy,Mz,jx|j
Sample interpolated valúes: fltí2.5,3.9) = 0,046
370
APROXIMACIÓN DE FOURIER
matriz, junto con Mz y Mxy, son usadas por la función interp para regresar los valores de z como la variable de ajuste (x, y) con base en la interpolación segmentaria cúbica con los valores de entrada de x y y. Mathcad designa esta secuencia de operaciones, de tal manera que la interpolación de polinomiales no tengan que ser recalculados cada vez que se requiera la interpolación con diferentes valores de x y y. Considerando estas operaciones, usted puede interpolar en cualquier ubicación mediante el ajuste (x, y), como el mostrado con x = 2.5 y y = 3.9. Usted puede también construir una gráfica de la superficie interpolada como la mostrada en la figura 19.22. Como otro ejemplo para demostrar algunas capacidades para el ajuste de curvas mediante Mathcad, usamos la función fft para el análisis de Fourier como el mostrado en la figura 19.23. La primera línea usa el símbolo definición para crear i como un rango variable. Después x¡ es formulado mediante la función Mathcad r n d para impartir una componente aleatoria a la señal sinusoidal. La gráfica de la señal se puede colocar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una línea roja cruzada en esa ubicación. Después use del menú la secuencia Insert/Graph/X-Y Plot para reservar una gráfica en blanco sobre la hoja de cálculo con lugares para las expresiones a graficarse y para los rangos de los ejes x y y. Simplemente teclee x¡ en el lugar reservado sobre el eje y y 0 y 80 para el rango en el eje x. Mathcad realiza todo el resto para producir la gráfica mostrada en la figura 19.23. Una vez que se ha creado la gráfica, usted puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de gráfica, cambiar el color, tipo, ancho de línea del trazo de la función y agregar títulos, leyendas y otras características. Después c es definida como fft(x). Esta función regresa la transformada de Fourier de x. El resultado es un vector, c, de coeficientes complejos que representan los valores en el dominio de la frecuencia. Se construye una gráfica de la magnitud de c¡ como antes.
FIGURA 1 9 . 2 3 TRF con Mathcad. Mathcad file Edil ylew ¡nsert Formal Malh gymbollcs Wlndow tjelp FAST FOURIER TRANSFORM Define a real signal in time:
Signal
19.8
A J U S T E DE C U R V A S CON L I B R E R Í A S Y R O Q U E T E S
19.8.3
MATLAB
Como se resume en la tabla 19.2, MATLAB tiene una variedad de funciones preconstruidus que abarcan las capacidades totales descritas en esta parte del libro. El siguiente ejemplo ilustra cómo usar algunas de ellas.
TABLA 19.2
EJEMPLO 1 9 . 5
¡ | ¡ !
Algunas funciones de MATLAB para implementar interpolación, regresión, segmentarias y TRF.
Función
Descripción
polyfit interp 1 interp 2 spline fft
Ajuste polinomial a datos Interpolación 1-D (tabla 1-D) Interpolación 2-D (tabla 2-D| Interpolación segmentaria cúbica de datos Transformada de Fourier discreta
Uso de MATLAB para el ajuste de curvas
Enunciado del problema. Explore cómo se puede emplear MATLAB para ajustar curvas con los datos. Para hacer esto, use la función seno para generar valores igualmente espaciados f(x) de 0 a 10. Emplee un tamaño de paso de 1 de tal forma que la caracterización resultante de la onda seno sea dispersa (véase la figura 19.24). Después, ajústela con a) interpolación lineal, b) polinomial de quinto orden y c) una segmentaria cúbica. Solución.
a) Los valores de las variables independientes y dependientes se pueden introducir en los vectores por >> >>
x=0:10; y=sin(x);
FIGURA 19.24 Once puntos muestreados de una sinusoidal.
572
APROXIMACIÓN DE FOURIER
Un nuevo vector más finamente espaciado con valores de la variable independiente se puede generar y guardar en el vector xi, >>
xi=0:.25:10;
La función MATLAB i n t e r p l puede entonces ser usada para generar valores de la variable dependiente yi para todos los valores xi mediante interpolación lineal. Tanto los valores originales (x, y) como los valores interpolados linealmente se pueden graficar juntos, como se muestra en la gráfica siguiente: >> >>
y i = i n t e r p 1 ( x , y , x i ) ; plotCx,y,'o
1
, x i , y i )
0
b)
2
4
6
8
10
Ahora, la función polyfit de MATLAB se puede usar para generar los coeficientes de un ajuste polinomial de quinto orden de los datos originales dispersos, >>
p=poLyfit(x,y,5)
P= 0.0008
-0.0290
0.3542
-1.6854
2.5860
-0.0915
donde el vector p cumple con los coeficientes polinomiales. Estos se pueden a su vez usar para generar un nuevo conjunto de valores yi, los cuales pueden de nuevo ser graneados junto con las muestras originales dispersas, >>
yi
>>
p l o t ( x , y ,
=
potyvaL(p,xi); 1
o ' , x i , y i )
r ,9 fm\jo i c ve
O tN L B IR E R A ÍS Y R A Q U T IS I
Asi, el polinomial eiiplura la tendencia general de los dalos, pero deja lucia la mayoría de los puntos. c) Finalmente, la función spline de MATLAB puede ser usada para «justar umi segmentaria cúbica de los datos dispersos originales en la forma de un nuevo conjunto de valores yi, los cuales se pueden nuevamente graficar junto con la muestra original dispersa,
>> yi=spline(x,y,xi); >> pLot(x,y, ' o ,xi,yi) 1
0
2
4
6
8
10
Debería observarse que MATLAB también tiene excelentes capacidades para realizar el análisis de Fourier. Se dedica la sección 20.3 a un ejemplo de cómo se puede hacer esto. 19.8.4
IMSL
IMSL tiene numerosas rutinas para el ajuste de curvas que abarca todas las capacidades a cubrir en este libro, y, por tanto, se mostrará algunas. Una muestra se presenta en la tabla 19.3. En el actual análisis, nos concentraremos en la rutina RCURV Esta rutina ajusta los datos a un polinomial por mínimos cuadrados. RCURV se implementa con la siguiente declaración C ALL:
C A L L R C U R V (NOBS, X D A T A , Y D A T A , N D E G , B, S S P O L Y , S T A donde NOBS = Número de observaciones. (Input) XDATA = Vector de longitud NOBS que contiene los valores x. (Entrada) YDATA = Vector de longitud NOBS que contiene los valores y. (Entrada) NDEG = Grado del polinomial. (Entrada) B = Vector de longitud NDEG + 1 que contiene los coeficientes. SSPOLY = Vector de longitud NDEG + 1 que contiene las sumas secuenciales de los cuadrados. (Salida) SSPOLY (1) contiene la suma de los cuadrados debidos a la media. Para i = 1,2,..., NDEG, SSPOLY(i + 1) contiene la suma de los cuadrados debido a las x' ajustadas a la media, x, x y x' '. 2
574
APROXIMACIÓN DE FOURIER TABLA 19.3
Rutinas IMSL para ajuste de curvas.
Categoría
• Interpolación
segmentaria cúbica
Rutinas
Descripción
CSIEZ
Fácil de usar rutina segmentaria cúbica
CSINT
No-un-nudo
CSDEC
Deriva condiciones finales
CSVAL
Evaluación
CSDER
Evaluación de la derivada
• Evaluación segmentaria cúbica e integración
• Interpolación segmentaria
CS1GD
Evaluación sobre una rejilla
CSITG
Integración
RUÑE
Polinomio lineal
RCURV
Polinomio general
FNLSQ
Funciones generales
B
• Polinomio en fragmentos • Rutinas de interpolación cuadrática polinominal para datos cuadriculados
• Interpolación de datos dispersados • Aproximación de mínimos cuadrados
« Segmentaria cúbica suavizada
• Aproximación
racional ponderada Ponderada racional
de Chebyshev
Chebyshev aproximación
• TRF
real trigonométrica
• TRF exponencial compleja
• Seno real y coseno para las TRF • Cuarto real del seno y coseno paro las TRF.
• TRF en dos y tres dimensiones complejas • Convoluciones y correlaciones Transformada de Laplace
FFTRF
Transformar hacia adelante
FFTRB
Transformar hacia atrás o inversa
FFTRI
Inicialización de la rutina para FFTR
FFTCF
Transformar hacia adelante
FFTCB
Transformar hacia atrás o inversa
FFTCI
Inicialización de la rutina para FFTC
m
AJUSTE DE CURVAS C O N LIBRERÍAS Y P A Q U E T E S
• T.Q
STAT = Vector de longitud 10 que contiene la estadística descrita en la tabla 19.4. (Salida) donde 1 = Media de x 2 = Media de y 3 — Varianza muestra de x 4 = Varianza muestra de y 5 = R-cuadrada (en porcentaje) 6 = Grados de libertad para la regresión 7 = Suma de cuadrados de la regresión 8 = Grados de libertad para el error 9 = Suma de cuadrados del error 10 = Número de datos (x, y) conteniendo NaN (no un número) como un valor x o y. EJEMPLO 19.ó
I
Uso de IMSL para regresión polinomial
Enunciado del problema. Use RCURV para determinar la polinomial cúbica que proporciona un ajuste por mínimos cuadrados de los siguientes datos X
0.05
0.12
0.15
0.30
0.45
0.70
0.84
y
0.957
0.851
0.832
0.720
0.583
0.378
0.295
1.05 0.156
Solución. Un ejemplo de un programa principal en Fortran 90 y de la función RCURV para resolver este problema se puede escribir como Fitpoly use msimsl PROGRAM
I M P L I C I T
NONE
INTEGER::ndeg.nobs,i,j PARAMETER (ndeg-3, n o b s - 8 ) R E A L : : b ( n d e g + l ) , s s p o l y ( n d e g + l ) , s t a t ( 1 0 ) , x ( n o b s ) , y ( n o b s ) , ycalc(nobs) DATA
x / 0 . 0 5 . 0 . 1 2 , 0 . 1 5 . 0 . 3 0 . 0 . 4 5 , 0 . 7 0 , 0 . 8 4 , 1 . 0 5 /
DATA
y / 0 . 9 5 7 , 0 . 8 5 1 , 0 . 8 3 2 , 0 . 7 2 0 , 0 . 5 8 3 , 0 . 3 7 8 . 0 . 2 9 5 , 0 . 1 5 6 /
RCURV(nobs,x,y.ndeg,B,sspo1y,stat) * , ' F i t t e d polynomlal i s ' DO i - l . n d e g + 1 PRINT ' ( 1 X . " X " . I I , " TERM: ".FS^)'.
CALL
PRINT
A
END
1-1,
b(1)
DO
PRINT
*
PRINT
' ( I X ,
PRINT
*
PRINT
* ,
" R
' N O .
A
2 :
" , F 5 . 2 , " % " ) ' , s t a t ( 5 )
X
Y
YCALC'
D O i = l.nobs ycalc=0. D O j = l,ndeg+l ycalc(i)-ycalc(1)+b(j)*x(i)**(j-l) END
DO
PRINT END END
DO
'(1X,I8,3(5X,F8.4))\
i , x ( 1 ) . y ( 1 ) , ycalcd)
576
APROXIMACIÓN DE FOURIER
|
i
Un ejemplo de correr es
\
F i t t e d polynomial i s
]
X 0 TERM:
.9909
'
X 1 TERM:
-1.0312
A
A
?
X 2 TERM:
.2785
X 3 TERM:
-.0513
A
A
R 2: A
9 9 NO. .81%
Y
YCALC
1
.0500
X
.9570
.9401
2
.1200
.8510
.8711
3
.1500
.8320
.8423
4
.3000
.7200
.7053
5
.4500
.5830
.5786
6
.7000
.3780
.3880
7
.8400
.2950
.2908
8
1.0500
.1560
.1558
PROBLEMAS 19.1 El pH en un reactor varía en forma sinusoidal durante el transcurso de un día. Use la regresión por mínimos cuadrados para ajustar con la ecuación (19.11) los siguientes datos. Use su ajuste para determinar la media, amplitud y tiempo del pH máximo. Tiempo, hr
0
2
7.3
PH
4
5
7 8.5
12
15
20
22
24
7 7.1 6.4 7.4 7.2 8.9 8.8 8.9 7.9
7
19.2 La radiación solar en Georgetown, Carolina del Sur, ha sido tabulada como Tiempo, mo Radiación, W / m
2
J
F
M
A
M
J
J
A
S
O
N
D
122
—
188
230
267
270
252
—
196
160
138
120
Suponiendo que cada mes es de 30 días, ajuste a un sinusoide estos datos. Use la ecuación resultante para predecir la radiación que habrá durante la mitad de agosto. 19.3 Los valores promedio de una función se pueden determinar por
_ ¡¿mdx fix) = Use esta relación para verificar los resultados de la ecuación (19.13). 19.4 Use una serie de Fourier continua para aproximar la onda de dentado de sierra mostrada en la figura P19.4. Grafique los primeros tres términos junto con la sumatoria.
FIGURA P l 9.4 Una onda diente de sierra.
1 9 . 1 4
1
\
U S E
EL C O M A N D O T R E N D L I N E D E E X C E L
CIÓN EXPONENCIAL
A
3 . 5
7
-1
5 . 5
3 . 9
6
7 . 5
1 0
1 2 . 5
1 5
1 7 . 5
2 0
3 . 6
3 . 1
2 . 8
2 . 6
2 . 4
2 . 3
2 . 3
Grafique y contra x junto con la ecuación exponencial y r . 19.15 Use el paquete de herramientas para el análisis de datos de Excel para desarrollar una regresión polinomial de cuarto orden, con los siguientes datos que contienen la concentración de oxigeno disuelto en agua fresca contra temperatura a nivel del mar.
f
1
2
FIGURA P 19.5 JTIO
onda triangular.
0
O,
I SUM(D5..D12)
582
APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS
Después se utiliza el Solver de Excel para minimizar la celda D14 al ajustar las celdas B1:B2. El resultado, como el mostrado en la figura 20.4, da un estimado de k ^ = 1.23 y K = 22.14, con una S = 0.001302. De esta forma, aunque, como se esperaba, la regresión no lineal da un ajuste ligeramente mejor, los resultados son casi idénticos. En otras aplicaciones, esto puede no ser cierto (o la función puede no ser compatible con linearización) y la regresión no lineal podría representar la única opción factible para obtener un ajuste por mínimos cuadrados. m
x
r
20.2
U S O DE S E G M E N T A R I A S P A R A E S T I M A R LA T R A N S F E R E N C I A DE CALOR (INGENIERÍA CIVIL/AMBIENTAL) Antecedentes. Los lagos en la zona templada pueden dividirse en estratos térmicos durante el verano. Como se ilustra en la figura 20.5, cerca de la superficie, el agua es tibia y liviana, y en el fondo es más fría y densa. Tal estratificación divide efectivamente el lago de manera vertical en dos capas: el epilimnion y el hipolimnion separados por un plano conocido como el thermocline. La estratificación térmica tiene gran importancia para los ingenieros ambientales que estudian la contaminación de tales sistemas. En particular, la thermocline disminuye en gran medida el mezclado entre las dos capas. Como resultado, la descomposición de materia orgánica puede acarrear reducción de oxígeno en el fondo aislado de las aguas. La ubicación de la thermocline se puede definir como el punto de inflexión de la curva temperatura-profundidad; es decir, el punto en el cual (PT/dx = 0. Es también el punto en el cual el valor absoluto de la primera derivada o gradiente es un máximo. Use segmentarias cúbicas para determinar la profundidad de la thermocline para el lago Piarte (véase la tabla 20.2). También use las segmentarias para determinar el valor del gradiente en la thermocline. 2
FIGURA 20.5 Temperatura contra profundidad durante el verano para el Lago Platte en Michigan.
7TC) 0
oI I
10
20
I I I II I I I i
30
II I Epilimnion
10
Thermocline
S N
20
30
Hypolimnion
20.3
ANÁLISIS DE FOURIER
TABLA 20.2
T,°C z, 22.8
0
983
Temperatura contra profundidad durante el verano para el Lago Piarte en Michigan. 22.8
22.8
20.6
13.9
11.7
11.1
11.1
2.3
4.9
9.1
13.7
18.3
22.9
27.2
m
Solución. Los datos se analizan con un programa que fue desarrollado con base en el pseudocódigo de la figura 18.8. Los resultados se despliegan en la tabla 20.3 y se enlistan las predicciones de la segmentaria junto con la primera y segunda derivada en intervalos de 1 m hacia abajo a través de la columna de agua. Los resultados se grafican en la figura 20.6. Observe cómo la thermocline está claramente localizada a la profundidad donde el gradiente es el más grande (es decir, el valor absoluto de la derivada es la más grande) y la segunda derivada es cero. La profundidad es 11.35 m y el gradiente en este punto es — 1.61°C/m.
20.3
A N Á L I S I S DE F O U R I E R ( I N G E N I E R Í A ELÉCTRICA) Antecedentes. El análisis de Fourier se usa en muchas áreas de la ingeniería. Sin embargo, se emplea de manera extensa en aplicaciones de la ingeniería eléctrica tales como en el procesamiento de señales. En 1848, Rudolph Wolf diseñó un método para cuantificar la actividad solar al contar el número de puntos individuales y grupos de puntos sobre la superficie del Sol. Calculó una cantidad que ahora se conoce como el número de puntos solares de Wolf, al sumar 10 veces el número de grupos más el conteo total de puntos individuales. En la figura 20.7 se tiene registros de este número desde 1770. Con base en los primeros datos históricos, Wolf determinó que la longitud del ciclo es de 11.1 años.
TABLA 2 0 . 3
Resultados del programa segmentario basado en el pseudocódigo de la figura 1 8.1 8.
dldad (m) 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
T(C) 22.8000 22.7907 22.7944 22.8203 22.8374 22.7909 22.6229 22.2665 21.6531 20.7144 19.4118 17.8691 16.2646 14.7766 13.5825
dT/dz - 0115 - 0050 0146 0305 - 0055 - 0966 - 2508 - 4735 - 7646 -1 1242 -1 4524 -1 6034 1 5759 1 3702 - 9981
d2T/dz2 .0000 .0130 .0261 -.0085 -.0635 -.1199 -.1884 -.2569 -.3254 -.3939 -.2402 -.0618 .1166 .2950 .3923
profundidad (m) 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28.
T(C) 12 7652 12 2483 11 9400 11 7484 11 5876 11 4316 11 2905 11 1745 11 0938 11 0543 11 0480 11 0646 11 0936 11 1000
dT/dz -.6518 -.3973 -.2346 -.1638 -.1599 -.1502 -.1303 -.1001 -.0596 -.0212 .0069 .0245 .0318 .0000
d2T/dz2 .3004 .2086 .1167 .0248 .0045 .0148 .0251 .0354 .0436 .0332 .0229 .0125 .0021 .0000
584
APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS
T, °C 0
0
dT/dz
d*T/dz*
10 20_ - 2 . 0 -1.0 0.0 - 0 . 5 0.0 I I I I I I I I I IYI U IIII IMIIM I I I I I 1 I II
0.5 II
4 8 Thermocline
12
FIGURA 2 0 . 6 Gráficas de a) temperatura, b) gradiente y c) segunda derivada contra profundidad (m) generadas con el programa segmentarlo cúbico. La thermocllne se localiza en el punto de inflexión de la curva temperatura-profundidad.
16 20 24 28 a)
b)
c)
Use un análisis de Fourier para confirmar este resultado mediante la aplicación de una TRF a los datos de la figura 20.3. Determine con toda precisión el periodo al desarrollar una gráfica de potencia contra periodo. Solución. Los datos para los años y el número de puntos solares se bajaron de la web y se guardaron en un archivo de tabulador delimitado: sunspotdat. El archivo se puede cargar en MATLAB y a la información del año y número se le asignaron vectores con el mismo nombre, 1
» »
load s u n s p o t . d a t year-sunspot(:,1);number-sunspot(:,2);
FIGURA 2 0 . 7 Gráfica del número de puntos solares de Wolf contra año.
1700
1800
1900
2000
En el TIEMPO en que se IMPRIMÓ la EDICIÓN en INGLII DE EITE LIBRO EL HTLM ERA HNP',//WWW,NGDC,NOU,GOV/ /ITP/SOLAR/SSN/NN,HTML. ...... .....1
20.4
ANÁLISIS DE DATOS EXPERIMENTALES
Después, se aplica una TRF a los números de puntos solares »
y-fft(number):
Después de obtener la primera armónica, se determina la longitud de la TRF («) y luego se calcula la potencia y frecuencia, » » » >> »
y(l)-[ ] ; n=length(y); power=abs(y(l:n/2)). 2; nyquist=l/2; freq=(l:n/2)/(n/2)*nyquist: A
En este punto, el espectro de potencia es una gráfica de potencia contra frecuencia. Sin embargo, ya que el periodo es más significativo en el contexto actual, se puede determinar el periodo y una gráfica potencia-periodo, >> p e r i o d = l . / f r e q >> plot(period,power):
El resultado, como el mostrado en la figura 20.8, indica un pico a los casi 11 años. El valor exacto se puede calcular con >> index=-f ind(power==max(power)); >> period(index) ansI O . 9259
20.4
ANÁLISIS DE DATOS EXPERIMENTALES (INGENIERÍA MECÁNICA/AEROESPACIAL) Antecedentes. Las variables de diseño en la ingeniería son a menudo dependientes de varias variables independientes. Con frecuencia esta dependencia funcional es mejor
FIGURA 20.8 I .'.poctro de potencia para li I.'I números de puntos i i i h i e s de Wolf.
-
) Ajuste a una línea recta los datos usando regresión lineal. Sobreponga esta línea en su gráfica.
2
000
0
20 000
40 000
60000
80
9.8100
9.7487
9.6879
9.6278
9.5682
Calcule g para y = 55 000 m.
E P Í L O G O : PARTE C I N C O PT5.4
E L E M E N T O S DE JUICIO La tabla PT5.4 proporciona un resumen de los elementos de juicio involucrados en el ajuste de curvas. Las técnicas se dividieron en dos grandes categorías, según sea la incertidumbre de los datos. Para mediciones imprecisas se usa regresión para desarrollar una "mejor" curva que ajuste la tendencia global de los datos sin que necesariamente pase a través de cualquier punto individual. Para mediciones precisas se usa interpolación para desarrollar una curva que pasa justo a través de cada uno de los puntos. Todos los métodos de regresión se designan para ajustar funciones que minimicen la suma de los cuadrados de los residuos entre los datos y la función. Tales métodos son denominados regresión por mínimos cuadrados. La regresión lineal por mínimos cuadrados se usa para casos en los que una variable dependiente y otra independiente se relacionan una con la otra en forma lineal. Para situaciones donde una variable dependiente y una independiente exhiben una relación curvilínea, hay varias opciones disponibles. En algunos casos, se usan transformaciones para linearizar la relación. En estos ejemplos, puede aplicarse la regresión lineal a las variables transformadas con el fin de determinar la mejor línea recta. De manera alterna, la regresión polinomial puede emplearse para ajustar una curva directamente con los datos. La regresión lineal múltiple se utiliza cuando una variable dependiente es una función lineal de dos o más variables independientes. Se puede aplicar también transformaciones logarítmicas a este tipo de regresión para algunos casos en los que la dependencia múltiple es curvilínea.
TABLA PT5.4
Comparación de las características de métodos alternos para el ajuste de curvas. N ú m . de p u n t o s que a j u s t a n en f o r m a exacta
Método
Errar asociado con d a l o s
A j u s t e con los datos individuales
Regresión Regresión lineal Regresión polinomial
Grande Grande
Aproximada Aproximada
Regresión lineal múltiple Regresión no lineal Interpolación Polinomios por diferencia dividida de Newlon Polinomios de Lagrange
Grande Grande
Aproximada Aproximada
0 0
Moderado Difícil
Pequeña
Exacta
n+ 1
Fácil
Usualmente elegido para análisis exploratorios
Pequeña
Exacta
n+ 1
Fácil
Usualmente preferido cuando se conoce ol orden
Segmentarlas cúblcat
Pequeña
Exacta
Ajuste por secciones
Moderado
E s f u e r z o de programación
Fácil Moderado
Comentarios
El error de redondeo se vuelve pronunciado para versiones de orden superior
Primera y segunda derivada laual en nodoi
PT5.5
RELACIONES IMPORTANTES Y FÓRMULAS
La regresión polinomial y lineal múltiple (observe que la regresión lineal simple es un elemento de ambas) pertenece a una clase más general de modelos de mínimos cuadrados lineales. Son clasificadas así porque son lineales con respecto a sus coeficientes. Estos modelos son típicamente implementados mediante sistemas algebraicos lineales que algunas veces están mal condicionados. Sin embargo, en muchas aplicaciones de ingeniería (esto es, para ajustes de orden inferior), esto no es así. Para casos donde sea un problema se cuenta con procedimientos alternos. Por ejemplo, se dispone de una técnica llamada polinomiales ortogonales para realizar regresión de polinomios (véase la sección PT5.6). Las ecuaciones que no son lineales con respecto a sus coeficientes son llamadas no lineales. Se dispone de técnicas de regresión especiales para ajustar tales ecuaciones. Estos son métodos aproximados que empiezan con un parámetro inicial estimado y después iterativamente regresan al punto inicial con valores que minimizan la suma de los cuadrados. La interpolación polinomial está diseñada para ajustar al único polinomio de nésimo orden que pasa justo a través de n + 1 puntos precisos. Este polinomio se presenta en dos formatos alternos. La interpolación polinomial por diferencias divididas de Newton es ideal para aquellos casos donde el orden adecuado del polinomio se desconoce. El polinomio de Newton es apropiado para tales situaciones, ya que se programa en forma fácil en un formato que sirve para comparar resultados de diferentes órdenes. Además, un error estimado se puede simplemente incorporar en la técnica. Así, usted puede comparar y escoger de los resultados al usar varios polinomios de diferente orden. La interpolación de polinomios de Lagrange es una formulación alternativa que es conveniente cuando el orden se conoce de antemano. Para esas situaciones, la versión de Lagrange es algo más simple de programar y no requiere el cálculo y almacenamiento de diferencias divididas finitas. Otro procedimiento para ajustar curvas es la interpolación segmentaria. Esta técnica ajusta un polinomio de bajo orden para cada intervalo entre los datos. El ajuste se hace de manera suave al igualar las derivadas de los polinomios adyacentes con el mismo valor en sus puntos de conexión. La segmentaria cúbica es la versión más común. Las segmentarias son de gran utilidad cuando se ajustan datos que por lo general son suaves, pero que exhiben áreas locales de cambio abrupto. Tales datos tienden a inducir oscilaciones desordenadas cuando se interpolan polinomios de orden superior. Las segmentarias cúbicas son menos propensas a esas oscilaciones debido a que están limitadas a variaciones de tercer orden. El último método que se estudia en esta parte del libro es la aproximación de Fourier. Esta área trata del uso de funciones trigonométricas para aproximar formas de onda. En contraste con las otras técnicas, el mayor énfasis de este procedimiento es no ajustar los datos a una curva. En lugar de esto, el ajuste de la curva se emplea para analizar la frecuencia característica de la señal. En particular, se dispone de una transformada rápida de Fourier para modificar en forma eficiente una función a partir del dominio del tiempo y de la frecuencia para poner en claro su estructura armónica en cuestión. PT5.5
RELACIONES IMPORTANTES Y
FÓRMULAS
La tabla PT5.5 resume información importante que se presentó en la parte cinco. Esta tabla se puede consultar para tener un rápido acceso a relaciones y fórmulas.
596
EPÍLOGO: PARTE CINCO
TABLA PT5.5
Resumen de información importante presentada en la parte cuatro.
Método
Formulación
Regresión lineal
y=a
Interpretación gráfica
+ a,x
0
s.
i,
n S xy, - £ x, X y, n £ x - px ] °o = Y - ° i x y=o + o x+.+ a x (Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales) donde a, =
l
0
V »-Vn- 2 ~ S, - 5, S, S, ' V n - (m + s, - s s, s,
a
2
Regresión polinomial
Errores
(
]
m
2
m
y*
r/
r
Regresión lineal múltiple
y = a + a,x, +•••+ a„xm Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales 0
i • •• x
Interpolación polinomial por diferencias divididas de Newton Interpolación polinomial de Lagrange
f \x) = b + b, 2
donde b = f(xg)
0
0
b(x 2
*o)(*
x
i)
R
b = f[x , x,, x ]
0
2
f(x) = f(x)x - x, \/ x - X 0 2. * 0 < i - xAi x— /x— x + f(x ) | < X/\X 2
x
0
x
R = 2
XQ
0
b X j
2
3
2
0
(x - x)(x - x),(x - x)6 0
2
0
\
2
Una cúbica: 2 oye + + c¡x + d, se ajusta a cada intervalo entre nodos. Primera y segunda derivadas son ¡guales en cada nodo 3
0
^ 2 = I* - x)(x - x),(x - x)f[x, x, X,, x]
x
2 2
2
/? = (x - x)(x - x(,|x - x)f[x, x, X, x]
0
0
Segmentarias cúbicas
s, - s s, ](x - x(,|x - x)6 = \x - x
2
2
[m + f
(x - x ) +
_
0
2
n 2
y
t
a
v
ix + c x+cr
b 3
+
2
1
1
• nodo
+C x j + c¡2 * Noa t:P 'or sm i pc ild iad, se m u e a rs tn las verso ines de s e g u n d o orden. a
2 x
3
+
¿2
X
2
2
3
2
0
PT5.6
PT5.6
M É T O D O S AVANZADOS Y REFERENCIAS ADICIONALES
597
MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES Aunque la regresión polinomial con ecuaciones normales es adecuada para muchas aplicaciones de la ingeniería, hay problemas en contexto donde su sensibilidad a los errores de redondeo pueden representar una seria limitación. Un procedimiento alternativo basado en polinomios ortogonales puede disminuir esos efectos. Debería observarse que de este procedimiento no se obtiene una ecuación de mejor ajuste; en vez de ello, da predicciones individuales para ciertos valores de la variable independiente. Se puede consultar a Shampine y Alien (1973) y Guest (1961) sobre información acerca de polinomios ortogonales. Mientras que la técnica de polinomios ortogonales es útil para desarrollar una regresión polinomial, no representa una solución al problema de inestabilidad para el modelo de regresión lineal general [véase ecuación (17.23)]. Un procedimiento alternativo con base en la descomposición de un solo valor, llamado método SVD, está disponible para dicho propósito. También se puede encontrar información sobre este procedimiento en Forsythe y cois. (1977), Lawson y Hanson (1974), y Press y cois. (1992). Además del algoritmo de Gauss-Newton, existe una variedad de métodos de optimización que se pueden usar de manera directa con el fin de desarrollar un ajuste por mínimos cuadrados para una ecuación no lineal. Esas técnicas de regresión no lineal incluyen los métodos de paso descendente y de Marquardt (recuerde la parte cuatro). Se puede encontrar información general sobre regresión en Draper y Smith (1981). Todos los métodos de la parte cinco se expresaron en términos de ajuste de curvas con los datos. Además, usted quizá desee ajustar una curva con otra. El objetivo principal de tal aproximación funcional es la representación de una función complicada por una versión simple que sea más fácil de manejar. Una manera de hacer esto es usar la función complicada para generar una tabla de valores. Después, las técnicas analizadas en esta parte del libro pueden usarse para ajustar polinomios a estos valores discretos. Un procedimiento alternativo se basa en el principio minimax (véase la figura 17.2c). Este principio especifica que los coeficientes de la aproximación polinomial deben ser elegidos de tal forma que la máxima discrepancia sea lo más pequeña posible. Así, aunque la aproximación pueda no ser tan buena como la dada por la serie de Taylor en el punto base, es por lo general mejor a través de todo el rango del ajuste. La economización Chebyshev es un ejemplo de un procedimiento para una aproximación funcional con base en tal estrategia (Ralston y Rabinowitz, 1978; Gerald y Wheatley, 1984; y Carnahan, Luther y Wilkes, 1969). Un área importante en el ajuste de curvas es la combinación de regresiones segmentarias con mínimos cuadrados. Así, una segmentaria cúbica se genera de tal forma que no intercepte cada punto, sino que minimice la suma de los cuadrados de los residuos entre los datos y las curvas segmentarias. El procedimiento involucra el uso de las tan conocidas segmentarias B como funciones base; son nombradas así debido a su uso como función base, y también por su característica forma de campana. Tales curvas son consistentes con un procedimiento segmentario en que su valor y su primera y segunda derivadas podrían tener continuidad en sus extremos. De esta forma se asegura la continuidad de f(x) y sus derivadas inferiores en los nodos. Wold (1974), Prenter (1974), y Cheney y Kincaid (1994) presentan un análisis de este procedimiento.
598
EPÍLOGO: PARTE CINCO
En resumen, con lo anterior se intenta proporcionarle caminos para la exploración más profunda sobre el tema, todas la referencias anteriores proporcionan descripciones de las técnicas básicas tratadas en la parte cinco. Le recomendamos consultar esas fuentes alternas para ampliar su comprensión de los métodos numéricos para el ajuste de curvas.
ii
DIFERENCIACIÓN E INTEGRACIÓN PT6.1
NUMÉRICA
MOTIVACIÓN El cálculo es la matemática del cambio. Como los ingenieros deben tratar en forma continua con sistemas y procesos que cambian, el cálculo es una herramienta esencial en nuestra profesión. El corazón del cálculo está relacionado con los conceptos matemáticos de diferenciación e integración. De acuerdo con la definición del diccionario, diferenciar significa "marcar por diferencias; distinguir; [ . . . ] percibir la diferencia en o entre". En el contexto de las matemáticas, la derivada, que sirve como vehículo fundamental para la diferenciación, representa la razón de cambio de una variable dependiente con respecto a una independiente. Como se ilustra en la figura PT6.1, la definición matemática de la derivada empieza con una aproximación por diferencias: A> Ax
=
f{x, + Ax) - /(*,-) Ax
(PT6.1)
donde y y f(x) son representaciones alternativas de la variable dependiente y x es la variable independiente. Si se permite que Ax se aproxime a cero, como ocurre al moverse de la figura PTó.lo a la PTó.lc, la diferencia es ahora una derivada
FIGURA
PT6.1
La definición gráfica de una derivada: debido a que Axse aproxima a cero en ir de a) a c), la aproximación por diferencias se convierte en una derivada.
602
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
dy_
=
dx
H
M
A.V-»O
/(*,-
+
Ax) -
f(x¡)
Ax
donde dyldx [que se puede designar también como y'of\x¡)] es la primera derivada de y con respecto a x evaluada en x¡. Como se observa en la ilustración visual de la figura PTó.lc, la derivada es la pendiente de la tangente a la curva enx,. En cálculo, el proceso inverso de la diferenciación es la integración. De acuerdo con la definición del diccionario, integrar significa "llevar junto, como partes, en un todo; unir; indicar la cantidad t o t a l . . . " . Matemáticamente, la integración se representa por (PT6.2) que se tiene para la integral de la funciónf(x) con respecto a la variable independiente x, evaluada entre los límites x = a a x = b. La función f(x) en la ecuación (PT6.2) es llamada integrando. Como lo sugiere la definición del diccionario, el "significado" de la ecuación (PT6.2) es el valor total, o sumatoria de f(x)dx sobre el rango x = a a b. De hecho, el símbolo / es ahora una letra S estilizada que intenta representar la conexión cercana entre integración y sumatoria. La figura PT6.2 representa una manifestación gráfica del concepto. Para funciones que están por arriba del eje x, la integral se expresa por la ecuación (PT6.2) que corresponde al área bajo la curva de f(x) entre x — a y b. 1
1
Debería observarse que el proceso representado por la ecuación ( P T 6 . 2 ) y la figura P T 6 . 2 es llamado
integración definida. Hay otro tipo que se denomina integración indefinida en la cual los límites a y b no están especificados. Como se analizará en la parte siete, la integración indefinida trata con la determinación de una función de la cual se da su derivada.
F I G U R A PT6.2 Representación gráfica de la integral de í(x] entre los límites x = o a b. La integral es equivalente al área bajo la curva.
'W4
Pro.l
MOTIVACIÓN
éos
Como se dijo antes, la "selección o discriminación" de la diferenciación y el "llevar junto" de la integración se vinculan en forma estrecha con procesos que, de hecho, están inversamente relacionados (véase la figura PT6.3). Por ejemplo, si se tiene una función dada y (í) que especifica la posición de un obj eto como función del tiempo, la diferenciación proporciona un medio para determinar su velocidad, como en (véase figura PT6.3a). v(t) =
d —y(t) at
De manera inversa, si se tiene la velocidad como función del tiempo, la integración se usará para determinar su posición (véase figura PT6.36), y(t) =
f
Jo
v(t) dt
De esta manera, podemos generalizar que la evaluación de la integral
" /cb
=Ja I
1 f(x) dx es equivalente a resolver la ecuación diferencial
— = /(*)
dx y (b) dada la condición inicial y (a) = 0. para una
604
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
Debido a esta relación cercana, optamos por dedicar esta parte del libro a ambos procesos. Entre otras cosas, esto proporcionará la oportunidad de resaltar sus similitudes y diferencias desde una perspectiva numérica. Además, nuestro análisis tendrá relevancia en las siguientes partes del libro, donde se tratarán ecuaciones diferenciales.
\/Í.PT6.1.1
Métodos s i n computadora p a r a diferenciación e integración
La función que será diferenciada o integrada estará usualmente en una de las siguientes tres formas: 1. 2. 3.
Una función simple continua tal como una polinomio, una exponencial o una función trigonométrica. Una función continua complicada que es difícil o imposible de diferenciar o integrar de manera directa. Una función tabulada donde los valores de x y f(x) están dados en un número de puntos discretos, como es frecuente el caso en datos experimentales o de campo.
En el primer caso, la derivada o integral de una simple función se puede evaluar en forma analítica mediante cálculo. Para el segundo caso, las soluciones analíticas son a menudo imprácticas y algunas veces imposibles de obtener. En estos ejemplos, así como en el tercer caso de datos discretos, se debe emplear métodos aproximados. Un método sin computadora para determinar las derivadas a partir de datos es conocido como diferenciación gráfica por áreas iguales. En este método los datos (x, y) se tabulan y, para cada intervalo, se emplea una diferencia dividida simple Ay/Ax para estimar la pendiente. Después, esos valores se grafican como una curva de pasos contra x (véase figura PT6.4). Luego se dibuja una curva suave que intenta aproximar el área bajo
FIGURA
PT6.4
Diferenciación por áreas iguales, o) Se usan las diferencias divididas centradas para estimar la derivada para cada X intervalo entre los datos, b) Las 0 estimaciones de la derivada se 3 representan en forma de gráfica de barras. Se superpone 6 una curva suave sobre esta 9 gráfica para aproximar el área bajo la gráfica de barras. Esto 15 se lleva a cabo al dibujar la 18 curva de tal forma que áreas ¡guales positivas y negativas estén equilibradas, c) Se pue(lo entonces leer los valores de de la curva suave,
dy/dx.
y 0 200 350 470 650 720
dy/dx
Ay/Ax
76.50
66.7
57.50
50
45.00
40
36.25
30 23.3
0
3
6
9
12
15
18
15
25.00
18
21.50
x
C)
PT8.1
MUIITAUUIN
la curva de pasos. Es decir, se dibuja así para equilibrar las áreas negativas y positivas. Las razones para valores dados de x pueden entonces leerse en la curva. En el mismo contexto, se emplearon procedimientos visualmente orientados para integrar los datos tabulados y las funciones complicadas antes de la llegada de la computadora. Un procedimiento simple intuitivo es graficar la función sobre una cuadrícula (véase figura PT6.5) y contar el número de cuadros que aproximen el área. Este número multiplicado por el área de cada cuadro proporciona una burda estimación del área total bajo la curva. Dicha estimación se puede refinar, a expensas de un esfuerzo adicional, al usar una cuadrícula más fina. Otro procedimiento de sentido común es dividir el área en segmentos verticales, o barras, con una altura igual al valor de la función en el punto medio de cada barra (véase figura PT6.6). El área de los rectángulos puede entonces calcularse al sumar el área total estimada. En este procedimiento se supone que el valor en el punto medio proporcionu una aproximación válida de la altura promedio de la función para cada barra. Como para el método de cuadrícula, es posible hacer estimaciones más refinadas al usar más (y más delgadas) barras para aproximar la integral. Aunque un procedimiento así de simple tiene utilidad para estimaciones rápidas, so dispone de técnicas numéricas alternativas para el mismo propósito. No es de sorprender que el más simple de estos métodos sea similar, en esencia, a las técnicas sin computadora. Para diferenciación, las técnicas numéricas fundamentales usan diferencias divididas finitas para estimar derivadas. Para datos con error, un procedimiento alterno es ajustar los datos a una curva suave con una técnica como la de regresión por mínimos cuadrados y después diferenciar esta curva para obtener estimaciones de la derivada. En el mismo sentido, se dispone de integración numérica o métodos de cuadratura para obtener integrales. Esos métodos, que de hecho son más fáciles de implementar que
606
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
con el procedimiento de cuadrícula, son similares en esencia al método por barras. Es decir, las alturas de la función se multiplican por el ancho de las barras y se suman para estimar la integral. Sin embargo, con elecciones inteligentes de factores ponderados, la estimación resultante se puede hacer más exacta que para el "método de barras" simple. Como en el método de barras simple, las técnicas numéricas de integración y diferenciación utilizan datos en puntos discretos. Como la información ya está tabulada en tal forma, es naturalmente compatible con muchos de los procedimientos numéricos. Aunque las funciones continuas no están originalmente en forma discreta, es a menudo una proposición simple usar las ecuaciones dadas para generar una tabla de valores. Como se ilustra en la figura PT6.7, esta tabla se puede entonces evaluar con un método numérico. PT6.1.2
Diferenciación numérica e integración en ingeniería
La diferenciación e integración de una función tiene tantas aplicaciones en la ingeniería que usted requeriría estudiar cálculo diferencial e integral en su primer año en la universidad. Muchos ejemplos específicos de tales aplicaciones se podrían dar en todos los campos de la ingeniería. La diferenciación es algo común en ingeniería debido a que mucho de nuestro trabajo involucra caracterizar los cambios de las variables tanto en tiempo como en espacio. De hecho, muchas de las leyes y otras generalizaciones que figuran de manera prominente en nuestro trabajo se basan en predecibles en las cuales el cambio mismo se manifiesta en el mundo físico. El ejemplo principal es la segunda ley de Newton, que no está dirigida en términos de la posición de un objeto, sino en su cambio de posición con respecto al tiempo. Además de tales ejemplos temporales, numerosas leyes que gobiernan el comportamiento espacial de las variables se expresan en términos de derivadas. Entro las más comunes figuran las leyes que involucran potenciales o gradientes. Por ejemplo, la ley de
PT6.1
607
MOTIVACIÓN
/ * 2 + c o s ( 1 +> / V1 + 0.5 ser •'O 2
X
FIGURA
M
0.25
2.599
0.75
2.414
1.25
1.945
1.75
1.993
PT6.7
Aplicación de un método de integración numérico: a| Una función continua complicada, b) Tabla de valores discretos de f[x) generados a partir de la función, c) Uso de un método numérico (el método do barras) para estimar la Integral con base en los puntos discretos. Para una función tabulada, los datos están ya en forma tabular b); por tanto, el paso a) es innecesario.
Fourier para la conducción de calor cuantifica la observación de que el calor fluye de regiones de alta a baja temperatura. Para el caso de una dimensión, ésta se puede expresar matemáticamente como Flujo de calor = —k'
dT dx
Así, la derivada proporciona una medida de la intensidad del cambio de la temperatura, o gradiente, que promueve la transferencia de calor. Leyes similares proporcionan modelos de trabajo en muchas áreas de la ingeniería, entre ellos el modelado de dinámica de fluidos, transferencia de masa, cinética de reacción química y flujo electromagnético. La habilidad para estimar de manera exacta las derivadas es una faceta importante de nuestra capacidad para trabajar de manera efectiva en estas áreas. Así como las estimaciones exactas de las derivadas son importantes en ingeniería, también el cálculo do integrales es valioso. Varios ejemplos se relacionan direclnmonle
608
FIGURA
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
PT6.8
Ejemplos de cómo se usa la integración para evaluar aplicaciones en áreas de la ingeniería, a) Un topógrafo podría necesitar saber el área de un campo limitado por una corriente en forma de curvas y dos caminos, b) Un ingeniero abastecedor de aguas quizá requiera saber el área de sección transversal de un río. c) Un ingeniero en estructuras tal vez necesite determinar la fuerza neta ejercida por un viento no uniforme soplando contra un lado de un rascacielos.
con la idea de la integral como el área bajo la curva. La figura PT6.8 ilustra algunos casos donde la integración se usa para este propósito. Otras aplicaciones comunes relacionan la analogía entre integración y sumatoria. Por ejemplo, una aplicación común es determinar la media de funciones continuas. En la parte cinco se abordaron los conceptos de la media de n datos discretos [recuerde la ecuación PT6.1]: i¡
y¡
£
Media = — —
(PT6.3)
n
donde y¡ son las mediciones individuales. La determinación de la media de puntos discretos se ilustra en la figura PT6.9a. En contraste, suponga que y es una función continua de una variable independiente x, como se ilustra en la figura PT6.9a. Para este caso existe un número infinito de valores entre ay b. Así como con la ecuación (PT6.3) que se aplica para determinar la media, usted podría interesarse en calcular la media o promedio de la función continua y = f(x) para el intervalo de a a b. La integración se usa para este propósito, como lo especifica la fórmula
í
Media = ^ -
f(x) b - a
dx (PT6.4)
PTÓ.1
609
MOTIVACIÓN
2
3
4 a)
Media
JImiu nnm iu l u11o In dse a lil hH i) d lcreo tlsymedai HOURA P T 6 . 9
|t)
(-MIIIIIUII ) *
Esta fórmula tiene cientos de aplicaciones en ingeniería. Por ejemplo, se usa para calcular el centro de gravedad de objetos irregulares en la ingeniería mecánica y civil y para determinar la raíz media cuadrática en ingeniería eléctrica. Las integrales son empleadas también por ingenieros para evaluar la suma o cantidad total de una variable física dada. La integral se evalúa sobre una línea, un área o un volumen. Por ejemplo, la masa total química contenida en un reactor está dada como el producto de la concentración de químicos en el volumen del reactor, o Masa = concentración X volumen donde la concentración tiene unidades de masa por unidad de volumen. Sin embargo, suponga que la concentración varía de un lugar a otro dentro del reactor. En este caso, es necesario sumar los productos de concentraciones locales c y los volúmenes del elemento correspondiente AV¡: i
n
Masa =
c¡ AV¡
;=i donde n es el número de volúmenes discretos. Para el caso continuo, donde c(x, y, z) es una función conocida yx,yyz son las variables independientes que designan la posición en las coordenadas cartesianas, la integración se usará para el mismo propósito: Masa == / / / c(x, y , z) dx dy dz
610
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
-///
Masa =
c(V)dV
la cual es conocida como una integral de volumen. Observe la fuerte analogía entre sumatoria e integración. Ejemplos similares podrán darse en otros campos de la ingeniería. Por ejemplo, la razón total de transferencia de energía a través de un plano donde el flujo (en calorías por centímetro cuadrado por segundo) es una función de la posición, está dada por Transferencia de calor = / / flujo dA
la cual es referida como una integral de área, donde A = área. De manera similar, para el caso en una dimensión, la masa total de una barra con densidad variable y que tiene un área de sección transversal constante, está dada por m = A
I
Jo
p(x) dx
donde m = masa total (kg), L = longitud de la barra (m), p(x) = densidad conocida (kg/ m ) como una función de la longitud x (m) y A = área de sección transversal de la barra (m ). Por último, las integrales se usan para evaluar diferenciales o razón de ecuaciones. Suponga que la velocidad de una partícula es una función continua conocida del tiempo v(t), 3
2
— = v(t) dx La distancia total y recorrida por esta partícula en un tiempo t está dada por (véase figura PT6.36) y = í v(t)dt Jo
(PT6.5)
Éstas son sólo algunas aplicaciones de diferenciación e integración que usted podría enfrentar en forma regular en el desarrollo de su profesión. Cuando las funciones sujetas a análisis son simples, usted normalmente escogerá evaluarlas desde un contexto analítico. Por ejemplo, en el problema del paracaidista en caída, determinamos la solución para la velocidad como una función del tiempo [véase ecuación (1.10)]. Esta relación podría sustituirse en la ecuación (PT6.5), la cual se integraría con facilidad para determinar la distancia a la que caerá el paracaidista en un tiempo t. Para este caso, la integral es simple de evaluar. Sin embargo, es difícil, o imposible, cuando la función es complicada, como típicamente sucede en el caso de ejemplos más realistas. Además, la función en turno es a menudo desconocida y definida sólo por mediciones en puntos discretos. Para ambos cesoí, usted debe tener la habilidad pera obtener valores aproximados para las
PT8.Z ArNTBCBODNTíBTVWMTnvwnwa
W I
I
derivadas e integrales mediante técnicas numéricas. Algunas de estas técnicas se analizarán en esta parte del libro.
PT6.2
ANTECEDENTES MATEMÁTICOS En el nivel medio superior o durante su primer año en el nivel superior, se le dará una introducción de cálculo diferencial e integral. Ahí usted aprenderá las técnicas para obtener derivadas exactas o analíticas e integrales. Cuando diferenciamos una función en forma analítica, generamos una segunda función que se usa para calcular la derivada para diferentes valores de la variable independiente. Se dispone de reglas generales para este propósito. Por ejemplo, en el caso del monomio y = x" se aplica la siguiente regla simple (n dy dx
=
0)
nx ~ n
l
que es la expresión de la regla más general para y = u donde u = una función de x. Para esta ecuación, la derivada se calcula realizando dy — = nu dx
du — dx
Otras dos fórmulas se aplican a los productos o cocientes de funciones. Por ejemplo, si el producto de dos funciones de x(u y v) se representa comoy = uv, entonces la derivada puede calcularse como dy
dv
du
dx
dx
dx
Para la división, y = w/u, la derivada se calcularía como du dy dx
dv
dx
dx v
2
Otras fórmulas útiles se resumen en la tabla PT6.1. Se dispone de fórmulas similares para integración definida, en las cuales se busca determinar una integral entre límites específicos, como en
Ja
/ = f
f(x) dx
De acuerdo con el teorema fundamental evalúa como
(PT6.6) del cálculo integral, la ecuación (PT6.6) se
612
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN TABLA PT6.1
Algunas derivadas de uso común. d — sen x = eos x dx
d — cot x = -esc dx
d — eos x = -sen x dx
d — sec x = sec x tan x dx
D
d —
, tan x = sec 2 x
dx
í
x
esc x = -esc x cot x
dx
d . 1 — In x = — dx x dx
2
d , 1 — log x = dx x In a 0
e* = é
— a* = a* In a dx
" f(x) dx = F(x)\"
a
donde F(x) = integral de f(x); es decir, cualquier función tal que F'(x) = f(x). La nomenclatura del lado derecho es para F(x)\
= F(b)-F(a)
b a
(PT6.7)
Un ejemplo de una integral definida es /•0.8
/ = / Jo
(0.2 + 25* - 200x + 675x - 900x + 400x ) dx 2
3
4
(PT6.8)
5
Para este caso, la función es un polinomio simple que se puede integrar de manera analítica al evaluar cada término de acuerdo con la regla
í
n+\
b
x
x" dx
(PT6.9)
n + 1
donde n no puede ser igual a — 1. Si se aplica esta regla a cada término en la ecuación (PT6.8) se obtiene , / = 0.2x + 12.5x
2
200 , , , 400 x + 168.75x - 180x + — x 3
4
5
0.8
(PT6.10)
la cual se evalúa de acuerdo con la ecuación (PT6.7) como / = 1.6405333. Este valor es igual al área bajo el polinomio original [véase ecuación (PT6.8)] entre x = 0 y 0.8. La integración anterior depende del conocimiento de la regla expresada con la ecuación (PT6.9). Otras funciones siguen diferentes reglas. Estas "reglas" son sólo ejemplos de antidiferenciación; es decir, encontrar F(x) de tal forma que F'(x) = f(x). En consecuencia, la integración analítica depende del conocimiento anterior a la respuesta. Tal conocimiento se adquiere con entrenamiento y experiencia. Muchas de las reglas se resumen en manuales y tablas de integrales. Enlistamos algunas de las más comunes en la tabla PT6.2. Sin embargo, muchas funciones de importancia práctica ion demasiado
PT6.3
613
ORIENTACIÓN
TABLA PT6.2
Algunas integrales simples que se usan en la parte seis. En esta tabla las letras a y b son constantes y deberían no confundirse con los limites de integración analizados en el texto.
Ju dv = uv- jv du \u"du = ——+C
n*-l
fa dx = — — + C a > 0, a * 1 bino x af
1
/ — = Inixl+ C
x*0
í sen [ax + b) dx = a- - eos [ax + 6) + C
1
J
í eos [ax + b) dx =a - sen (ax + b) + C j Inixl ax = x Inixl - x + C
complicadas para ser contenidas en tales tablas. Una razón por la que las técnicas en esta parte del libro son tan valiosas, es porque proporcionan un medio para evaluar relaciones como la ecuación (PT6.8) sin conocimiento de las reglas.
j
PT6.3
ORIENTACIÓN Antes de proceder con los métodos numéricos para integración, podría ser de utilidad alguna orientación adicional. Lo siguiente pretende ser una revisión del material analizado en la parte seis. Además, formulamos algunos objetivos que ayudarán a enfocar su esfuerzo cuando estudie el material. PT6.3.1
Alcance y antecedentes
La figura PT6.10 proporciona una revisión de la parte seis. El capítulo 21 se dedica al más común de los procedimientos para integración numérica (las fórmulas de NewtonCotes). Esas relaciones se basan en el reemplazo de una función complicada o datos tabulados con un simple polinomio que es fácil de integrar. Tres de las fórmulas de Newlon-C'otcH con un U N O más extendido se analizan con detalle: lu regla trapezoidal, la
614
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN
FIGURA P T 6 . 1 0 Organización esquemática del material en la parte seis: Diferenciación numérica e integración.
regla 1/3 de Simpson, y la regla 3/8 de Simpson. Todas ellas están diseñadas para casos en los que los datos a integrarse están espaciados de manera uniforme. Además, incluimos un análisis de integración numérica de datos espaciados de manera no uniforme. Este tema es muy importante, ya que las aplicaciones en el mundo real tienen que ver con datos espaciados de esta forma.
FT6.3
ORIENTACIÓN
611
Todo el material anterior se relaciona con la integración cerrada; es decir, cuando los valores de la función en los extremos de los límites de integración son conocidos. Al final del capítulo 21 presentamos fórmulas de integración abierta; es decir, donde los límites de integración se extienden más allá del rango de los datos conocidos. Aunque dichas fórmulas no se usan de manera común para la integración definida, las fórmulas de integración abierta, se presentan aquí debido a que se utilizan mucho en la parte siete para la solución de ecuaciones diferenciales ordinarias. Las formulaciones vistas en el capítulo 21 pueden emplearse para analizar tanto los datos tabulados como las ecuaciones. El capítulo 22 trata con dos técnicas que están expresamente diseñadas para integrar ecuaciones y funciones: integración de Romberg y cuadratura de Gauss. Se proporciona algoritmos de cómputo para ambos métodos. Además, se analizan los métodos para evaluar integrales impropias. En el capítulo 23 se presenta información adicional sobre diferenciación numérica como suplemento del material introductorio del capítulo 4. Los temas incluyen fórmulas por diferencias finitas de alta exactitud, extrapolación de Richardson y la diferenciación de datos espaciados de manera no uniforme. Se analiza el efecto de los errores de redondeo para la diferenciación numérica así como para integración. Por último, se concluye el capítulo con una descripción de la aplicación de diferentes paquetes de software y librerías para integración y diferenciación. El capítulo 24 demuestra cómo se puede aplicar los métodos para la resolución de problemas. Como en las otras partes del libro, las aplicaciones se toman de todos los campos de la ingeniería. Una sección de repaso, o epílogo, se incluye al final de la parte seis. Esta revisión incluye un análisis de los elementos de juicio que son relevantes para la implementación en la práctica de la ingeniería. Además, se resumen fórmulas importantes. Por último, se presenta una breve revisión de los métodos avanzados y referencias alternativas que facilitarán sus estudios adicionales de la diferenciación e integración numérica.
FT6.3.2 Metas y objetivos Objetivos d e estudio. Después de terminar la parte seis, usted será capaz de resolver muchos problemas de integración y diferenciación numérica y apreciará su aplicación para solución de problemas en ingeniería. También deberá esforzarse para manejar las diferentes técnicas y asegurar su confiabilidad. Usted deberá entender que los elementos de juicio involucrados en la selección del "mejor" método (o métodos) para cualquier problema en particular. Además de estos objetivos generales, debería asimilarse y manejarse los conceptos específicos que se enlistan en la tabla PT6.3. Objetivos computacionales. Se le proporcionó ya el software y algoritmos de cómputo simple para ímplementar las técnicas analizadas en la parte seis. Todo esto tiene utilidad como herramientas de aprendizaje. Se le proporcionó para su PC el software TOOLKIT de métodos numéricos que es de uso amigable. Emplea la regla trapezoidal para evaluar la integral de funciones continuas o datos tabulados. Las gráficas obtenidas con este software le permitirán visualizar con facilidad su problema y las operaciones matemáticas asociadas, como el área entre la curva y el eje x. El software es fácil de usar para resolver muchos problemas prácticos
616
DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN TABLA P T 6 . 3
Objetivos de estudio específicos para la parte seis.
1. Entender la derivación de las fórmulas de Newton-Cotes; saber cómo derivar la regla trapezoidal y cómo acondicionar la derivación de ambas reglas de Simpson; reconocer que las reglas trapezoidal y de Simpson 1/3 y 3 / 8 representan las áreas de los polinomios de primer, segundo y tercer orden, respectivamente. 2. Conocer las fórmulas y ecuaciones de error para a) la regla trapezoidal, b) la regla trapezoidal de aplicación múltiple, c) regla de Simpson 1/3, d) regla de Simpson 3 / 8 , y e). regla de Simpson de aplicación múltiple. Ser capaz de escoger la "mejor" de estas fórmulas para cualquier problema de contexto particular. 3. Reconocer que la regla de Simpson 1 / 3 es exacta de cuarto orden, aun cuando está basada en sólo tres puntos; darse cuenta de que todas las fórmulas de Newton-Cotes de segmentos pares y puntos nones tienen exactitud resaltada similar. 4. Saber cómo evaluar la integral y derivada de datos desigualmente espaciados. 5. Reconocer la diferencia entre las fórmulas de integración abierta y cerrada. 6. Entender la base teórica de extrapolación Richardson y cómo se aplica en el algoritmo de integración Romberg para diferenciación numérica. 7. Entender la diferencia fundamental entre las fórmulas de Newton-Cotes y cuadratura de Gauss. 8. Reconocer por qué la integración de Romberg y la cuadratura de Gauss tienen utilidad cuando se integran ecuaciones (como opuestas a datos tabulares o discretos). 9. Saber cómo se emplean la fórmulas de integración abierta para evaluar integrales impropias. 10. Entender la aplicación de fórmulas por diferenciación numérica de alta exactitud. 1 1. Saber cómo diferenciar datos desigualmente espaciados. 1 2. Reconocer los diferentes efectos del error de datos en el proceso de integración y diferenciación numérica.
y se puede también usar para verificar los resultados de cualquiera de los programas de computadora que usted haya desarrollado. Además, se proporcionan los algoritmos para la mayoría de los otros métodos de la parte cinco. Esta información le permitirá aumentar su librería de software al incluir técnicas más allá de la regla trapezoidal. Por ejemplo, usted podría encontrarlo útil, desde un punto de vista profesional, al tener el software para implementar integración y diferenciación numérica para datos espaciados de manera no uniforme. También podría desarrollar su propio software para las reglas de Simpson, integración de Romberg y cuadratura de Gauss, los cuales son más eficientes y exactos que la regla trapezoidal. Por último, una de las metas más importantes debería ser manejar varios paquetes de software de uso general que están ampliamente disponibles. En particular, usted debería habituarse a usar estas herramientas para implementar métodos numéricos en la solución de problemas de ingeniería.
CAPÍTULO 2 1 K\ Fórmulas de integración de Newton-Cotes i£ Lasfórmulas de integración de Newton-Cotes son los esquemas de integración numérica más comunes. Se basan en la estrategia de reemplazar una función complicada o datos tabulados con una función aproximada que sea fácil de integrar: pb
1=
pb
f(x)dx
=
Ja Ja
f (x)dx
(21.1)
n
donde fn(x) — polinomio de la forma f„(x)
-
a
0
+a\X
H
ha„_iA'"
_ i
+
a„x"
donde n es el orden del polinomio. Por ejemplo, en la figura 21.1a, se usa un polinomio de primer orden (una línea recta) como una aproximación. En la figura 21.1 b, se emplea una parábola para el mismo propósito. La integral se puede también aproximar mediante una serie de polinomios aplicada por pedazos a la función o datos sobre segmentos de longitud constante. Por ejemplo, en la figura 21.2, se usan tres segmentos de línea recta para aproximar la integral. Pueden utilizarse polinomios de orden superior para los mismos propósitos. Con este anteceden-
FIGURA
21.1
|ci aproximación de una InMjiol como el área bajo o) una sola línea recta y /i) una sola parábola.
618
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
te, reconocemos que el "método de barras" en la figura P T 6 . 6 emplea una serie de polinomios de orden cero (es decir, constantes) para aproximar la integral. Se dispone de formas cerradas y abiertas de fórmulas de Newton-Cotes. Las formas cerradas son aquellas donde los datos al inicio y final de los límites de integración son conocidos (véase figura 21.3a). Las formas abiertas tienen límites de integración que se extienden más allá del rango de los datos (véase figura 21.3¿>). En este sentido, son similares a las de extrapolación, como se analizó en la sección 18.5. Las formas abiertas de Newton-Cotes no se usan por lo general para integración definida. Sin embargo, se utilizan para evaluar integrales impropias y la solución de ecuaciones diferenciales ordi-
FIGURA 21.2 La aproximación de una integral como el área bajo tres segmentos de línea
FIGURA 21.3 La diferencia entre fórmulas de integración a) cerrada y b) abierta.
f(x)n
21.1 IA ntirins. Esto capítulo tnfktliM las formas cerradas. Sin embargo, se introduce de manera breve el material sobre fórmulas abiertas de Newton-Cotes al final del capítulo.
21.1
LA REGLA TRAPEZOIDAL La regla trapezoidal es la primera de las fórmulas de integración cerrada de NewtonCotes. Corresponde al caso donde el polinomio en la ecuación (21.1) es de primer orden:
pb rb I =
f(x)dx
=
h(x)dx
Ja Ja
fi(x) = f(a) + — - ( x - a) Recuerde del capítulo 18bque - auna línea recta se representa como [véase ecuación (18.2)] (21.2) El área bajo esta línea recta es un estimado de la integral de f(x) entre los límites a y b\ r b
-I.
r
i
m+
/(*) - /(«) -(x — a) dx b-a
El resultado de la integración (véase el cuadro 21.1 para detalles) es 1
=
{
b
-
a
)
m ± m _
(21.3)
la cual se denomina regla trapezoidal.
Cuadro 21.1
O b t e n c i ó n de la regla t r a p e z o i d a l
AlllM de ln Integración, ia ecuación (21.2) se puede expresar T'LLLLLLL
Este resultado se evalúa para dar f(b) - f(a) (b - a ) bf(a) af(b) I = — + (b-a) b—a 2 b—a 2
2
i
, , , A|RUPTNÜ()
, , f\tt)-" f
/'(/') /(«) h a
, „ ,
af(b)-af(a) o—a
los últimos dos términos se obtiene W-fta) •b-a
bf(a)-af(a)-af{b)+af(a)
~x +
Ahora, como b — a = (b — a)(b + a), 2
2
/ = íñb) - f{a)]
-^-
b
+ bf(a) - af(b)
b-a Si se multiplica y agrupa términos se tiene
, , , ni') - ña) /lid, x + b-a
bf(a)-af(b) b-a
/
=
(
6
_
A
)
M ± M
2 que OH la fórmula para la regla trapezoidal.
IM tiiiil puedo Inlegrarso entre x = a y x = b pura obtener IV» m
- f{a) x
" h • "u~
bf(a)
2
2
-«/(/»
b-a
'*
/u
620
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
Geométricamente, la regla trapezoidal es equivalente a aproximar el área del trapezoide bajo la línea recta que conecta f(á) y f(b) en la figura 21.4. Recuerde de geometría que la fórmula para calcular el área de un trapezoide es la altura por el promedio de las bases (véase figura 21.5a). En nuestro caso, el concepto es el mismo, pero el trapezoide está sobre su lado (véase figura 21.5¿). Por tanto, la integral se representa como / = ancho x altura promedio
FIGURA
(21.4)
21.4
Ilustración gráfica de la regla trapezoidal.
FIGURA
21.5
a) La fórmula para calcular el área de un trapezoide: altura por el promedio de las bases. b) Para la regla trapezoidal, el concepto es el mismo pero ahora el trapezoide está sobre su lado.
o I as (b — a) x altura promedio
(21.5)
donde, para la regla trapezoidal, la altura promedio es el promedio de los valores de la función en los puntos extremo, o \f(a) + f(b)]/2. Todas las fórmulas cerradas de Newton-Cotes pueden expresarse en el formato general de la ecuación (21.5). De hecho, sólo difieren con respecto a la formulación de la altura promedio. 21.1.1
E R R O R
D E
LA
R E G I A
T R A P E Z O I D A L
Cuando empleamos la integral bajo un segmento de línea recta para aproximar la integral bajo una curva, obviamente podemos incurrir en un error que puede ser sustancial (véase figura 21.6). Una estimación para el error de truncamiento local de una sola aplicación de la regla trapezoidal es (véase cuadro 21.2) £ = - ^ / " ( © ( 6 - « ) (
(21.6)
3
donde ¿¡ está en algún lugar en el intervalo de a a b. La ecuación (21.6) indica que si la función sujeta a integración es lineal, la regla trapezoidal será exacta. De otra manera, para funciones con derivadas de segundo orden y superior (es decir, con curvatura), puede ocurrir algún error.
FIGURA
21.6
Ilustración gráfica del uso de una sola aplicación de la regla trapezoidal para aproximar la integral de f[x) = 0.2 + 2 5 x - 200x + Ó75* - W O x + AOOx de x = 0 a 0.8. 2
3
4
5
622
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES Cuadro 2 1 . 2
O b t e n c i ó n y e r r o r estimado de la regla t r a p e z o i d a l
Si se asume que para una h pequeña, el término/"^) es aproxi madamente constante, esta ecuación se puede integrar:
Una manera alternativa para la obtención de la regla trapezoida es integrando la interpolación polinomial hacia adelante de Newton-Gregory. Recuerde que para la versión de primer orden con término de error, la integral podría ser (véase cuadro 18.2)
a
fl
Ja
fia) + Afia)a
+ —^-aia
- l)h
2
dx (B21.2.1)
y
Para simplificar el análisis, considere que como a = (x — a)lh,
e v a
i
u a r
C
-
f l
~4~
omo
/ =h
dx = hda
f(a) +
rm
2
Afia)
Como Af(a) = /(6) — fia), el resultado podría escribirse como
I = h f^+W-J-fxW
Debido a que h — b — a (para un segmento de la regla trapezoidal), los límites de integración a y b corresponden a 0 y 1, respectivamente. Por tanto, la ecuación (B21.2.1) se expresaría como / =h
(o?
2
I = h «/( ) + y A / ( ) +
) + Afia)a
E J E M P L O 21.1
+ ^-^aia
- \)h
2
2
12
Regla trapezoidal Error de truncamiento Así, el primer término es la regla trapezoidal y el segundo es un;i aproximación para el error.
da
Aplicación simple de la regla trapezoidal Enunciado del problema. fix)
Use la ecuación (21.3) para integrar numéricamente
= 0.2 + 25x - 2Q0x if 675x 2
3
- 900.v + 400x 4
5
desde a — 0 a b = 0.8. Recuerde de PT6.2 que el valor exacto de la integral se puedo determinar en forma analítica y es 1.640533. Solución.
Los valores de la función
/(O) = 0.2 /(0.8) = 0.232 pueden sustituirse en la ecuación (21.3) para dar 0.2 + 0.232
= 0.1728
la cual representa un error de £, = 1.640533 - 0 . 1 7 2 8 = 1.467733 que corresponde a un error relativo porcentual de e, = 89.5%. La razón para C N I C gratule error os evidente de lu gráfica e n la figura 21.6. Observe quo el áreu bajo 1» Uncu rccln no t o m a e n cuenta u n a p o r c i ó n jtjgtffllcativa de le integral que e i t á p o r arriba de la linea.
sU ti Bcoinaep »roxm a a a l !, i(unccatú c ó i n óin
lin se requiere una gunda derivada de le la función original paru dur f'ix)
podríamos no conocer previumcnle el vulor reul. Por lunlo, del error estimado. Para obtener dicha estimación, lti «esobre el intervalo podría calcularse al diferenciar dos veces
= - 4 0 0 + 4 050* - 10 800x + 8 OOOx 2
3
El valor promedio de la segunda derivada se puede calcular mediante la ecuación (PT6.4): 0.8
( - 4 0 0 + 4 050JC - 10 800x + 8 000x ) dx 2
I
que podría sustituirse en la ecuación (21.6) para obtener
I \ | ) j
3
=-^(-60)(0.8)
= 2.56
3
la cual es del mismo orden de magnitud y signo que el error real. Sin embargo, existe una discrepancia, ya que, de hecho, para un intervalo de este tamaño el promedio de la segunda derivada no es necesariamente una aproximación exacta Así, indicamos que el error es aproximado mediante la notación E , más exacto que usar E .
de/"((0 =
gm c
(1 _ -(clm),}
(E21.3.1)
e donde v = velocidad (m/s), g — constante gravitacional de 9.8 m/s , m — masa del paracaidista igual a 68.1 kg y c = coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista como una función del tiempo, como se describió en el ejemplo 1.1. Suponga que desea saber qué tan lejos ha caído el paracaidista después de cierto tiempo t. Esta distancia está dada por [véase ecuación (PT6.5)] 2
Jo
(t)dt
donde d es la distancia en metros. Sustituyendo en la ecuación (E21.3.1),
d
=
f (i _ - ' ') c Jo (c m)
e
dt
Use el software de métodos numéricos TOOLKIT, y su propio software, para determinar esta integral con la regla trapezoidal de aplicación múltiple mediante diferentes números de segmentos. Observe que al desarrollar la integración en forma analítica y sustituir los valores de parámetros conocidos se obtiene un valor exacto de d — 289.43515 m. Solución. Presione el botón de la función Intégrate en el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 21.10. Esta pantalla contiene la información de entrada y salida necesaria para integrar una función analítica o datos tabulares. Primero, puede hacer clic en la tabla de función de entrada e introducir la función, v(t) =
9.8(68.1) 12.5
H
(1
v
—i
,-(12.5/68.1)1)
Después haga clic en el bloque de entrada de parámetros e introduzca los valores para los límites de integración inferior y superior de 0 a 10. Luego, introduzca el valor 10 para el número de segmentos junto con las dimensiones de la gráfica, como en la figura 21.10.
Rnnilr*
Ww*
Integial < Seg Width
'
FIGURA
Help
I :>«-.•-)
:
.J3ü»..j
m*:":
2887491 1
.!£«!!=._• I •'' una ecuación cúbica ( | i i ( ! conecta cuatro puntos.
b)
Si a y b se designan como x y x , yf { ) representada por un polinomio de Lagrange de segundo orden [véase ecuación (18.23)], la integral se transforma en x
0
f*2 Ixo
2
(x-x\)(x-x )
I
(x-x )(x-x ) ftxo) + - x) (x¡ - x )(xi - x ) -f{xi)
2
0
(x - L xi)(x 0
0
(x -x )(x 0
0
-f(x ) - X\)'
[x -x )(x 2
2
- X\)
0
2
2
e s
2
2
2
dx
Después de la integración y manejo algebraico, resulta la siguiente fórmula: / =
|[/(Jfo) + 4/(A,)
+
f(x )] 2
(21.14)
donde, para este caso, h = (b — á)l2. Esta ecuación es conocida como regla de Simpson 1/3. Es la segunda fórmula de integración cerrada de Newton-Cotes. La especificación "1/3" surge del hecho de que h está dividida entre 3 en la ecuación (21.14). Una obtención alternativa se muestra en el cuadro 21.3 donde el polinomio de Newton-Gregory se integra para obtener la misma fórmula. La regla de Simpson 1/3 se expresa también con el uso del formato de la ecuación (21.5):
p-a)
/(*o)+ * / ( * , ) + M )
Iss(
Ancho
(
2
U
5
Altura promedio
donde a — x , b — x y x = punto a la mitad del camino entre a y b, que está dado por (b + a)/2. Observe que, de acuerdo con la ecuación (21.15), el punto medio está ponderado por dos tercios y los dos puntos extremos por un sexto. Se puede mostrar que una aplicación de un solo segmento de la regla de Simpson 1/5 tiwie un error de truncamiento de (véase cuadro 21.3) 0
2
x
)
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
632
Obtención y estimación del error de la regla de Simpson 1 / 3
Cuadro 2 1 . 3
Como se hizo en el cuadro 21.2 para la regla trapezoidal, la regla de Simpson 1/3 se puede obtener al integrar hacia adelante el polinomio de interpolación de Newton-Gregory (véase cuadro 18.2):
en J.xa a(a a(a —
/ = h «/(* - a) 180« 4
7(4)
J
es el promedio de la cuarta derivada para el intervalo.
(21.19)
Veriión d« la rugía cim ülmpiun I /J do aplicación múltiplo Uno lu ecuación (21.18) con n — 4 para estimur la inte-
Enunciado dol problema. gral de
/'(.v) = 0.2 + 25,v - 2()().v -1- 675A- - 9 0 0 A + 4 0 0 * 2
1
4
5
desde a = 0 hasta b = 0.8. Recuerde que la integral exacta es 1.640533. Solución,
n = 4 (h = 0.2):
/(0) = 0.2
/(0.2) = 1.288
/(0.4) = 2.456
/(0.6) = 3.464
/(0.8) = 0.232 A partir de la ecuación (21.18),
/ = (J.O
0.2 + 4(1.288 + 3.464) + 2(2.456) + 0.232 12
E, = 1.640533 - 1.623467 = 0.017067
= 1.oZj4o/
s, = 1.04%
El error estimado [véase ecuación (21.19)] es E = — ^ - r ( - 2 400) = 0.017067 180(4) ' a
4
El ejemplo anterior ilustra que la versión de la regla de Simpson 1/3 de aplicación múltiple da resultados precisos. Por esta razón, se considera superior a la regla trapezoidal para la mayoría de las aplicaciones. Sin embargo, como se mencionó antes, está limitada a casos en los que los valores son igualmente espaciados. Además, está limitada a situaciones donde hay un número par de segmentos y un número non de puntos. En consecuencia, como se analizará en la siguiente sección, la fórmula de segmentos nones y puntos pares conocida como regla de Simpson 3/8 se usa en conjunto con la regla 1/3 para permitir la evaluación de ambos números de segmentos pares y nones. 21.2.3
Regla de S i m p s o n 3 / 8
En una manera similar a la derivación de la regla trapezoidal y de Simpson 1/3, un polinomio de Lagrange de tercer orden se puede ajustar a cuatro puntos e integrarse: nb
rb
/ f(x)dx = / h(x)dx I Ja Ja3/(.V|) + 3/(a) + /(*.= )]
para obtener
-
H
|./'(*,.) +
2
636
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
donde h — (b — «)/3. Esta ecuación se llama regla de Simpson 3/8 debido a que h se multiplica por 3/8. Esta es la tercera fórmula de integración cerrada de Newton-Cotes. La regla 3/8 se puede expresar también en la forma de la ecuación (21.5): Issjb-a)
m
Ancho
+
3 / ( X l )
+
3
/
f
e
)
+
m
(21.20)
Altura promedio
Así, los dos puntos interiores tienen pesos de tres octavos, mientras los puntos extremos pesan un octavo. La regla de Simpson 3/8 tiene un error de
'
80
J
o, ya que h — (b — a)/3, E
Jtz^tji^
(21.21)
6 480
Como el denominador de la ecuación (21.21) es mayor que el de la ecuación (21.16), la regla 3/8 es algo más exacta que la de 1/3.
FIGURA
21.13
Ilustración de cómo se puede usar en conjunto las reglas de Simpson de 1/3 y 3 / 8 para manejar aplicaciones múltiples con números nones de intervalos.
/|x) A
La regla do Nlmpaun 1/1 en o moñudo ol método de preferencia, ya que alcanza exactitud de tercer orden con I T C N puntos más que los cuatro puntos requeridos pora la versión de 3/8. .Sin embargo, lu rogln de 3/8 tiene utilidad cuando el número de segmentos es impar. Como ilustración, en el ejemplo 21.5 usamos la regla de Simpson para integrar la función para cuatro segmentos. Suponga que usted desea una estimación para cinco segmentos. Una opción podría ser usar una versión de aplicación múltiple de la regla trapezoidal como se hizo en los ejemplos 21.2 y 21.3. Esto puede no ser recomendable, sin embargo, debido al gran error de truncamiento asociado con este método. Una alternativa podría ser aplicar la regla de Simpson 1/3 a los dos primeros segmentos y la regla de Simpson 3/8 a los últimos tres (véase figura 21.13). De esta forma, podríamos obtener un estimado con una precisión de tercer orden a través de todo el intervalo. EJEMPLO 2 1 . 6
Regla de Simpson 3 / 8 Enunciado del problema.
a) Use la regla de Simpson 3/8 para integrar \ ! I |
f(x) = 0.2 + 25x - 200x + 675x - 900x + 400x 2
3
4
5
desde a = 0 hasta b — 0.8. b) Úsela en conjunto con la regla de Simpson 1/3 a fin de integrar la misma función para cinco segmentos. Solución.
|
a) Una sola aplicación de la regla de Simpson 3/8 requiere de cuatro puntos igualmente espaciados: /(O) = 0.2
/(0.2667) = 1.432724
/(0.5333) = 3.487177
/(0.8) = 0.232
Usando la ecuación (21.20) / - 0 S °' ^+ - 8 ? 1 7 7 ) + 0.232 ' 8 E, = 1.640533 - 1.519170 = 0.1213630 e, = 7.4% 2
+
3
4 3 2 7 2 4
3
4
=
'
(0.8) " = -Tlérí6 4 8 )0
?
5
E
| |
2400
= 0-1213630
b) Los datos necesarios para la aplicación de cinco segmentos (h — 0.16) es /(0) = 0.2
/(0.16) = 1.296919
./(0.32) = 1.743393
./Í0.48) = 3.186015
,/t0.64) - 3.181929
./{().«())
0.232
La Integral para los dos prlmeroi segmentos se obtiene usando la regla de Slmpion
1/3!
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
/ y. 0.32
0.2 + 4 ( 1 . 2 % 9 1 9 ) + 1.743393 — = 0.3803237 6
Para los últimos tres segmentos, la regla 3/8 se puede usar para obtener / = 0.48
1.743393 + 3(3.186015 + 3.181929) + 0.232 = 1.264754 8
La integral total se calcula al sumar los dos resultados: / = 0.3803237 + 1.264753 = 1.645077 E, = 1.640533 - 1.645077 = -0.00454383
21.2.4
e, = - 0 . 2 8 %
A l g o r i t m o s de cómputo p a r a las reglas de S i m p s o n
En la figura 21.14 se bosqueja el pseudocódigo para diferentes formas de reglas de Simpson. Observe que todas se hallan diseñadas para datos que están en forma tabulada. Un programa general debería tener la capacidad de evaluar funciones conocidas así como ecuaciones. En el siguiente capítulo ilustraremos cómo se puede manejar esas ecuaciones. Observe que el programa de la figura 21.14¿¡f está acondicionado para usar números de segmentos pares o nones. Para el caso de pares, la regla de Simpson 1/3 se aplica a cada par de segmentos y los resultados se suman para calcular la integral total. En los nones, se aplica la regla de Simpson 3/8 a los tres últimos segmentos y la regla 1/3 a los segmentos previos.
21.2.5
F ó r m u l a s cerradas de Newton-Cotes de o r d e n s u p e r i o r
Como se observó antes, la regla trapezoidal y ambas reglas de Simpson son miembros de una familia de ecuaciones de integración conocidas como fórmulas de integración cerrada de Newton-Cotes. Algunas de las fórmulas se resumen en la tabla 21.2, junto con su estimación del error de truncamiento. Observe que, como en el caso de las reglas de Simpson 1/3 y 3/8, las fórmulas de cinco y seis puntos tienen el mismo orden de error. Esta característica general se cumple para fórmulas de puntos mayores y nos lleva al resultado de que las fórmulas de segmentos pares y puntos nones (por ejemplo, la regla 1/3 y la regla de Boole) usualmente son los métodos de preferencia. Sin embargo, se debe resaltar que, en la práctica de la ingeniería, las fórmulas de orden superior (que son mayores de cuatro puntos) son usadas muy rara vez. Las reglas de Simpson bastan para la mayoría de las aplicaciones. La precisión se puede mejorar al usar la versión de aplicación múltiple. Además, cuando la función es conocida y se requiere de alta precisión, los métodos como la integración de Rombcrg o la cuadratura de O K U I I , descritos en el capitulo 22, OfitMB ajternativas viables y atractivas.
21.2
rüNCTION 5lmp13 = 2'h* (f0+4*fí+f2) END Slmp13
5lmp13 /6
b) FUNCTION 5¡mp3& = 3*h* (f0+3*(fí+f2)+f3) FND 5imp33
(h. fO,
Simp33 / 3
fí,fZ)
(h, fO,
1*1di•»
FUNCTION 5lmplnt(a, b. n, f) h = (b-a)/n IFn = 1 THEN eum = Trap(h, f„_,, f j EL5E fí,f2, f3) m = n odd = n/2-INT(n/2) IF oda > O AND n > 1 THEN
eum = sum+Slmp33(h,f _ ,f _2,f _ ,f ) ri
3
r
n
1
tl
m =n- 3 END IF IFm>1 THEN
t VNCTION 5imp13m (h, n, f) eum = f(0) P0l = 1,n-2,2 eum = eum + 4 * f¡ + 2 * f END DO fium = eum + 4 * f„_, + f iMmp13m = h * eum 13 FNI>Slmp13m
eum = eum + 5¡mp13m(h, m, f) END IF END IF
M
5lmplnt = eum END Simplnt
n
M i\H lu K Ícódg io lfi o
FIGURA 21.T4
para las reglas de Simpson. a) Regla de Simpson 1 / 3 de aplicación simple, b) regla de Simpson 3 / 8 do ación simple, c) regla de Simpson 1/3 de aplicación múltiple, y d) regla de Simpson de aplicación múltiple para números de segmentos nones y pares. Observe que para todos los casos n debe ser > 1 .
i iniojs
TABLA 21.2
Fórmulas de integración cerrada de Newton-Cotes. Las fórmulas se presentan en el formato de la ecuación (21.5) de manera que el peso de los datos para estimar la altura promedio es aparente. El tamaño de paso está dado por h = (b - a)/n.
Segmentos
(")
Puntos
1
2
Regla trapezoidal
(b-
2
3
Regla de Simpson 1/3
(b-
ú
4
Regla de Simpson 3 / 8
A .'i
Nombre
5 6
o)f(Xo|+f(x,| a) [bn\ n\ BouhI \b i i H)i{x ) i f|x ) n
2 4f(x )
+
1
-(1/12)^)
-\]/90)h fW 5
+ f(x ) 7
6 flxol + A F L X . l + S f N + flx,!
0)
(b-
Regla de
Error de t r u n c a m i e n t o
Fórmula
-|3/80)/i-VI' l(í) 1
8
7f(x ) + 32f(x,| + 12í(x | + 3 2 r > ) + 7f(x ) 0
2
0)
3
4
90
19f(x ) ü
ASflxJ
2
288
.')0/(x
:f I
V
' W
(2/5/1
VW())h
640
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
21.3
INTEGRACIÓN CON SEGMENTOS DESIGUALES Hasta este punto, todas las fórmulas para integración numérica se han basado en datos igualmente espaciados. En la práctica, existen muchas situaciones donde esta suposición no se cumple y debemos tratar con segmentos de tamaño desigual. Por ejemplo, los datos derivados experimentalmente son a menudo de este tipo. Para esos casos, un método es aplicar la regla trapezoidal a cada segmento y sumar los resultados: .
U
/ ( * 0 )
+
,
/ ( S I )
u
~ + " 2
l=hi
+
/fe)
,
,
'
2
H
/ ( * „ - L )
u
"
+ / ( * „ )
2
(21.22)
donde h¡ = ancho del segmento /. Observe que éste fue el mismo procedimiento que se usó en la regla trapezoidal de aplicación múltiple. La única diferencia entre las ecuaciones (21.8) y (21.22) es que las h en la primera son constantes. En consecuencia, la ecuación (21.8) podría simplificarse al agrupar términos para obtener la ecuación (21.9). Aunque esta simplificación no puede aplicarse a la ecuación (21.22), es posible desarrollar de manera fácil un programa en computadora para acomodar los segmentos de tamaño desigual. Antes de describir ese algoritmo, ilustraremos en el siguiente ejemplo cómo se puede aplicar la ecuación (21.22) para evaluar una integral. EJEMPLO 21.7
Regla trapezoidal con segmentos desiguales
| Enunciado del problema. La información en la tabla 21.3 fue generada mediante el | mismo polinomio empleado en el ejemplo 21.1. Use la ecuación (21.22) para determinar i la integral para estos datos. Recuerde que la respuesta correcta es 1.640533.
i ?
í
Solución.
\ |
Si se aplica la ecuación (21.22) a los datos de la tabla 21.3 se obtiene
7=0.12
1
1.309729 + 0.2
+ 0.10
1.305241 + 1.309729 0.232 + . . . + 0.10 n
= 0.090584 + 0.130749 + • • • + 0.12975 = 1.594801
1
Datos para f(x) = 0 . 2 + 25x - 2 0 Ü X + la cual representa un error relativo absoluto de £, = 2.8% 675X - 900X + 4 0porcentual 0 X , con valores
TABLA 21.3
2
3
4
5
de x desigualmente espaciados. X
"""""""'"ÍLX)'"*"
X
0.0
0 . 2 0 0 0 0 0
0.44
2 . 8 4 2 9 8 5
0 . 1 2
1.309729
0.54
3 . 5 0 7 2 9 7
0.22
1.305241
0.64
3 . 1 8 1 9 2 9
0.32
1.743393
0.70
2 . 3 6 3 0 0 0
0.36
2 . 0 7 4 9 0 3
0.80
0 . 2 3 2 0 0 0
0 . 4 0
2 . 4 5 6 0 0 0
+ 2.363
FIGURA
21.15
Uso de la regla trapezoidal para determinar la integral de datos desigualmente espaciado», Observe cómo los segmentos achurados podrían evaluarse con la regla de'Simpson para obtener mayor precisión.
Los datos del ejemplo 21.7 se ilustran en la figura 21.15. Observe que alguno* segmentos adyacentes son de igual anchura y, en consecuencia, pudieron haberse evaluado mediante las reglas de Simpson. Esto usualmente nos lleva a resultados más precisos, como lo ilustra el siguiente ejemplo.
Inclusión de las reglas de Simpson en la evaluación de datos no uniformes Enunciado del problema. Vuelva a calcular la integral con los datos de la tabla 21.3, pero ahora use las reglas de Simpson para aquellos segmentos donde son apropiados. Solución.
El primer segmento se evalúa con la regla trapezoidal:
„ 1.309729 + 0.2 / = 0.12 •— = 0.09058376 Debido a que los dos siguientes segmentos que van de x = 0.12 a 0.32 son de igual longitud, su integral se puede calcular con la regla de Simpson 1/3: , 1.743393 + 4(1.305241) + 1.309729 / = 0.2—: — = 0.2758029 Los siguientes tres segmentos también son iguales y, por tanto, pueden evaluarse con la regla de 3/ft para dar / = 0.2726863. De manera similar, la regla 1/3 se puede aplicar a
642
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
los dos segmentos desde x = 0.44 hasta 0.64 para obtener I = 0.6684701. Finalmente, los dos últimos segmentos, los cuales son de longitud desigual, se pueden evaluar con la regla trapezoidal para dar valores de 0.1663479 y 0.1297500, respectivamente. El área de esos segmentos individuales se suma para dar una integral total de 1.603641. Esto representa un error e = 2.2%, el cual es superior al resultado que se obtuvo mediante la regla trapezoidal del ejemplo 21.7. t
Programa de cómputo para datos espaciados de manera desigual.
Programar la
ecuación (21.22) es una proposición bastante simple. El algoritmo se lista en la figura 21.16a.
FIGURA
21.16
Pseudocódigo para integrar datos desigualmente espaciados, a) Regla trapezoidal y b) Combinación de reglas de Simpson y trapezoidal. o) FUNCTION Trapun (x, y, n) LOCAL I, eum eum = O DO i=1,n eum = eum + (x¡ - x )*(y END DO Trapun = eum END Trapun H
H
b)
FUNCTION Uneven (n, x, f) h=x -x k=1 eum = O. DO J = 1,n 1
+ y¡)/2
0
hf = x -Xj j+1
IF A35 (h - hf) < .OOOOOI THEN IFk = 3 THEN eum = eum + 5imp13 (h, fj_ fj_ f^) k = k-1 EL5E k = k+1 END IF EL5E IFk = 1 THEN eum = eum + Trap (7% FJ_, FP EL5E IFk = 2 THEN eum = eum + 6\mp13 (h, fj_ f-) EL5E eum = eum + Simp33 (h, fj_ ENDIF k=1 END IF END IF h = hf END DO 3
2
2
2
Univon - eum
UFE:
LMm*»n. ....
fj)
IERTA
21,4
TABLA 2 1 . 4
Fórmulas de integración abierta da Newton Cotos. Las fórmulas se presentan en «I formato de la ecuación (21.5) de manera quo el peso de los datos para estimar la altura promedio sea aparente. El tamaño de paso está dado por h - (b - a)/n.
tegmentos (n)
Puntos
Nombre Método del punto medie
Error de t r u n c a m i e n t o
Fórmula
[b-a]
f(x,|
(l/3]/> f"(íl 3
|b-o) fa
_
[3/4}h fU) 3
2 2f|x,)-í|x | ?
2f(x,|
+
3
|95/144)f) fl >|§) 5
24 llf| )-14f|x ) X l
2
+
26f|x3)-14f|x ) 4
4
(41/140)//f (£) |6,
20
Sin embargo, como se demostró en el ejemplo 21.8, el procedimiento es resaltado ai se implementan las reglas de Simpson cuando sea posible. Por esta razón desarrollamoa un segundo algoritmo que incorpora esta capacidad. Como se ilustra en la figura 21.16b, el algoritmo verifica la longitud de los segmentos adyacentes. Si dos segmentos consecutivos son de igual longitud, se aplica la regla de Simpson 1/3. Si tres son iguales, se una la regla 3/8. Cuando los segmentos adyacentes son de longitud desigual, se implementn la regla trapezoidal. Así, no sólo permite la evaluación de segmentos de datos desiguales, sino que al usar la información igualmente espaciada, se reduce a las reglas de Simpson. Como tal, representa un algoritmo básico para todo propósito en la determinación de la integral de datos tabulados.
21.4
F Ó R M U L A S DE I N T E G R A C I Ó N A B I E R T A Recuerde de la figura 21 3b que las fórmulas de integración abierta tienen límites que se extienden más allá del rango de los datos. La tabla 21.4 resume las fórmulas de integración abierta de Newton-Cotes. Las fórmulas se expresan en la forma de la ecuación (21.5) para que los factores ponderados sean evidentes. Como con las versiones cerradas, pares sucesivos de las fórmulas tienen el mismo orden de error. Las fórmulas de segmentos pares y puntos nones son por lo común los métodos de preferencia, ya que requieren menos puntos para alcanzar la misma precisión que con las fórmulas de segmentos nones y puntos pares. 1 ,UN fórmulas abiertas no se usan a menudo para integración definida. Sin embargo, como NO analiza en el capítulo 22, tienen utilidad para analizar integrales impropios. Adetnáa, tienen In relevancia de nuestro análisis de métodos multipnsos para la solución de eotiflolonen diferenciales ordinarias en el capitulo 26.
FÓRMULAS DE INTEGRACIÓN DE NEWTON-COTES
644 PROBLEMAS
21.1 Use medios analíticos para evaluar a) j* b)
J
c) J
(1 -
4
e- )dx x
de la regla trapezoidal, b) la regla de Simpson 1/3, c) regla de Simpson 3/8, d) regla de Boole, e) método de punto medio,/) fórmula de integración abierta con 3 segmentos/2 puntos y g) fórmula de integración abierta con 4 segmentos/3 puntos.
(1 - x - A¿ + x ) dx
Jo
5
15
(8 + 4senx)
4
i
Límite de precisión
10-5
< D .
2
. -
Regla de Simpson 1/3 Límite de precisión
10-6
I
I , I . I ,1 16
LU 22.2.1
I , ,,l 64
32
I
I, I
I
I
I
I
256 1 024 4 096 16 384 128 512 2 048 8 192 Segmentos
Extrapolación de Richardson
Recuerde que en la sección 10.3.3 usamos un refinamiento iterativo para mejorar la solución de un conjunto de ecuaciones lineales simultáneas. Las técnicas de corrección de errores se hallan también disponibles para mejorar los resultados de integración numérica sobre la base de las mismas estimaciones de la integral. Esos métodos usan dos estimaciones de una integral para calcular una tercera más exacta, y se les conoce por lo general como extrapolación de Richardson. El error estimado y asociado con una aplicación múltiple de la regla trapezoidal puede representarse de manera general como / = /(/;) + E(h) donde / = valor exacto de la integral, I{h) — aproximación de una aplicación de n segmentos de la regla trapezoidal con un tamaño de paso h = (b — a)ln, y E(h) — error de truncamiento. Si hacemos dos estimaciones por separado mediante tamaños de paso de h\ Y 2 Y tienen valores exactos del error, n
(22.1)
N IT O IU fC O lN D E ROMBERO
22.2
Ahora recuerde que el error de la aplicación múltiple de la regla trapezoidal puede representarse de manera aproximada por la ecuación (21.13) [con n = (b — d)lh\. E = -^V/"
(22.2)
Si en ésta se supone q u e / " es constante sin importar el tamaño de paso, la ecuación 22.2 se puede usar para determinar que la razón de los dos errores será —— = 4
(22.3)
Este cálculo tiene un importante efecto en la remoción del t é r m i n o / " de la operación. Al hacer esto, hemos hecho posible utilizar la información contenida en la ecuación (22.2) sin un conocimiento previo de la segunda derivada de la función. Para realizarlo, arreglemos de nuevo la ecuación (22.3) para tener
\h
2
la cual se puede sustituir en la ecuación (22.1):
I(hi) + E(h )(j±j = ¡(h ) + E(h ) 2
2
2
que puede resolverse para E(h ) = 2
l(.hú-I(h ) \-(h /h ) 2
2
{
2
Así, desarrollamos un estimado del error de truncamiento en términos de las estimaciones de la integral y de sus tamaños de paso. Dicha estimación puede entonces ser sustituida en / = I(h ) + 2
E(h ) 2
para dar una estimación mejorada de la integral:
^^'pQR^-^
.
1
( 2 2 A )
Sp puede demostrar (Ralston y Rabinowitz, 1978) que el error de dicha estimación es 0(h 4). Así, cambiamos las estimaciones de la regla trapezoidal de 0(h 2) para obtener una nueva estimación de 0(h A). Para el caso especial donde el intervalo es la mitad (h = A,/2), esta ecuación es ahora 2
/
Sé I(h ) 2
+ ^-¡[Wi)
-
/(Ai)] 7.;,']/, yj /
T |
)
' '
o, agrupando términos, /
SÉ
4
--/(//í)
-/(1 A|) 3
,; i ;
1
/'
1
(22.5)
650
INTEGRACIÓN DE ECUACIONES EJEMPLO 2 2 . 1
Correcciones de error de la regla trapezoidal
| Enunciado del problema. En el capítulo anterior (ejemplo 21.1 y tabla 21.1) usamos ¡ una variedad de métodos de integración numérica para evaluar la integral de f(x) = 0.2 | + 25x - 200x + 675x - 900x + 400x desde a = 0 hasta b = 0.8. Por ejemplo, i aplicaciones simples y múltiples de la regla trapezoidal dan los siguientes resultados: 2
3
h
Segmentos 1 2 4
| ¡
0.8 0.4 0.2
s
Integral
e„%
0.1728 1.0688 1.4848
89.5 34.9 9.5
Use esta información junto con la ecuación (22.5) para calcular la estimación mejorada de la integral.
| Solución. |
4
Las estimaciones de uno y dos segmentos se pueden combinar para dar
/ = -(1.0688) - ^(0.1728) = 1.367467
| El error de la integral mejorada es E, = 1.640533 - 1.367467 = 0.273067 (£, = 16.6%), j el cual es superior a las estimaciones sobre las cuales se basa. j De la misma manera, las estimaciones para dos y cuatro segmentos se pueden com| binar para obtener | ¡ '4 1 í !
/ = - ( 1 . 4 8 4 8 ) - - ( 1 . 0 6 8 8 ) = 1.623467 que representa un error deE = 1.640533 - 1.623467 = 0.017067 (e = 1.0%). t
t
La ecuación (22.4) proporciona una forma de combinar dos aplicaciones de la regla trapezoidal con un error 0(h ) para calcular una tercera estimación con un error de 0(h ). Este procedimiento es un subconjunto de un método más general para combinar integrales y obtener estimaciones mejoradas. Como ilustración, en el ejemplo 22.1, calculamos dos integrales mejoradas de 0(h ) sobre la base de tres estimaciones de la regla trapezoidal. Esos dos cálculos mejorados pueden, a su vez, combinarse para obtener aun un mejor valor con 0(h ). Para el caso especial donde las estimaciones del trapezoide original están basadas sobre sucesivas mitades de tamaño de paso, la ecuación usada para la exactitud de 0(h ) es 2
4
4
6
6
/ ^ —/,„ - — /, 15 "' 15
v
(22.6) '
donde I e I¡ son las estimaciones mayor y menor, respectivamente. De manera similar, dos resultados 0(h ) pueden combinarse para calcular una integral que es 0(h ) por medio de m
6
s
(22.7)
22.2 EJEMPLO 2 2 . 2
Corrección de error de orden luperior para estimaciones de la integral
J Enunciado del problema, lin el ejemplo 22.1 usamos la extrapolación de Richardson ¡ para calcular dos estimaciones de la integral de 0(h ). Utilice la ecuación (22.6) para | combinar esas estimaciones y calcular una integral con 0(h ). 4
6
] !
Solución. Las dos estimaciones de la integral de 0(h ) obtenidas en el ejemplo 22.1 fueron 1.367467 y 1.623467. Estos valores pueden sustituirse en la ecuación (22.6) para
1
obtener
4
i |
I
| l
/ = ( 1 . 6 2 3 4 6 7 ) - ^ ( 1 . 3 6 7 4 6 7 ) = 1.640533 que es una respuesta correcta con las siete cifras significativas que se han utilizado en este ejemplo. 2 2 . 2 . 2 El a l g o r i t m o de integración de R o m b e r g Observe que los coeficientes en cada una de las ecuaciones de extrapolación [ecuaciones (22.5), (22.6) y (22.7)] aumentan hasta 1. De esta manera, éstos representan los factores ponderados que, al aumentar la exactitud, dan un peso relativamente mayor sobre la estimación de la integral superior. Estas formulaciones se pueden expresar en una forma general que se ajusta muy bien para la implementación en computadora:
y+l,jfc-l
(22.8)
7
•i lk-
donde I , . ! = las integrales más y menos exactas, respectivamente; e Ij = la &I integral mejorada. El subíndice k significa el nivel de la integración, donde k = 1 corresponde a la regla trapezoidal original, k = 2 corresponde a 0(h ), k = 3 a 0(h ), y así en forma sucesiva. El subíndice j se usa para distinguir entre las estimaciones más (f + 1) y menos (/') exactas. Por ejemplo, para k = 2 yj = 1, la ecuación (22.8) se convierte en J+l k
I 1,2
k
4
6
4/ ,i - / 1,1 2
la cual es equivalente a la ecuación (22.5). La forma general representada por la ecuación (22.8) es atribuida a Romberg, y su aplicación sistemática para evaluar integrales se denomina integración de Romberg. La figura 22.3 es una ilustración gráfica de la secuencia de la estimación de la integral generada con este procedimiento. Cada matriz corresponde a una sola iteración. La primera celumna contiene las evaluaciones de la regla trapezoidal que están designadas por fp, donde j — 1 es para una aplicución de un solo segmento (el tamaño de paso es b — a), j = 2 es para una aplicación con dos segmentos [el tamaño de paso es (b — a)/2],j = 3 es para una aplicación de cuatro tegmentos [el tamaño de paso es (b — a)/4], y asi sucesivamente. Las otras columnas di la matriz son generadas de manera sistemática mediante la ecuación (22.8) para obtener OBda ve/, mejores estimaciones do la integral.
652
INTEGRACIÓN DE ECUACIONES
a)
FIGURA 22.3 Ilustración gráfica de la secuencia de las estimaciones de la integración que se generó con la integración de Romberg.
0(h*)
0.1728001.068800-
0(n«)
.367467
b)
0.172800 1.068800 • 1.484800 •
.367467 .623467 -
.640533
c)
0.172800 1.068800 1.484800 • 1.600800 •
.367467 .623467 • .639467 •
.640533: 1.640533-
.640533
Por ejemplo, la primera iteración (véase figura 22.3a) involucra calcular estimaciones con la regla trapezoidal para uno y dos segmentos ( / [ , e I ). La ecuación (22.8) se A usa entonces para calcular el elemento J, = 1.367467, el cual tiene un error de Ahora, debemos verificar para establecer si este resultado es conveniente para nuestras necesidades. Como en los otros métodos aproximados en este libro, se requiere una terminación, o criterio de paro, para asegurar la exactitud de los resultados. Un método que puede emplearse para el propósito actual es [véase ecuación (3.5)]
0(h ).
21
2
-
Iu - i
100%
(22.9)
FIGURA 22.4 Pseudocódigo para la integración de Romberg que usa la versión de segmentos de igual tamaño de la regla trapezoidal a partir de la figura 2 2 . 1 .
FUNCTION Rhomberq (a, b, maxit, es) LOCAL 1(10,10) n = 1 • /,_, = TrapEq(n, a, b) iter = O DO Iter = iter + 1 n = 2*"" W u = TrapEq(n, a, b) D0k = 2, iter + 1 j = 2 + iter - k +
END DO ea = A35((l - í J / l ,) * 100 IF (Iter £ maxit OR ea .|
Al{x, M/(x, ,] |
,1 + 6/lx, ,)
4/(x,
o[h)
,| I /(*, „|
/i" ;MM\, ,| | I lí|x, „]
y/{«, .,|
Ü[h)
668
DlFIMNCIACIÓN NUMÉRICA l'rlmoui dorlvada
p( .) x
fc'rror
+ 8f(x, i) - 8f(x,-]| + f|x,-_ )
=
+
2
0 ( f ) 4 )
12/) Segunda derivada p'( j = ^k+i) - 2f(x,-) + f|x,_i) Xj
f»i .1 _ - ^ , Mx,-|-
0
) + 16f|x, ) - 30f|x,| + 16f(x _]) - f|x,- |
+ 2
+1
f
]
2
h
2
^ j 2
, ,
n |
4
2
Tercera derivada p"( ) x¡
f(x¡+2) - 2f(x¡+]| + 2f(x,- | - f(x,_ |
=
l
2fi p„
2
0
- f j x , ) + 8f|x, ) - 1 3f|x, ) + 1 3f(x,_)) - 8f[x,-- ) + f(x,-- )
(Xi) =
+ 3
^ ) 2
3
+2
+1
2
3
0 ( / i 4 )
Cuarta derivada p" nn los pequeños M I L >i• • •. I M I los datos por Mitiillu do la diferenciación iiiiiin''ik_u: a) datos sin error, /'| |I I i lifeienciación IIIIIIN''iii
a resultante, c) datos
un I> liíir cados ligeramente, i /) li I dilerenciación irv.iilianio manifestando un IIUINI'riln IIII
en la variabilidad.
mitraste, la operación
I M V I ' I M I
de integración
| I M ivióndose de d) a c) al li ii
> = sen x en 23.3 Use aproximaciones por diferencias centradas para estimar = rc/4 usando un valor de Estimo la prímoru cl errory relativo segunda derivadas de y =2 c en x — I pura h ~A 0.1.
x
2
4
h — Jtí\2.
porcentual e, pura cada aproximación.
0{h ) y ü(h ) v
UmpM l ambaí fórmulas
para
sus estimacion
y x x = TtIA
1,1.41 Isc la extrapolación de Riehardson puní
1.2 3 7 O N I I I I I H I ' lu primera Ivailn de = sen en mediante el uso tic luniaftos 1.807 0.7468 0.6522 0.1684 0.03192 paNo de //, = 7t/3 y h = TI/6. Emplee diferencias centradas do x fi(/i ) para las estimaciones iniciales. donde = Compare sus resultados con las deriv 1,1.ñ Repita ol problema 23.4, pero ahora para la primera derivaverdaderas. DA ti» In x on x = 4 usando h = 2 y /i = 1. 4 para determinar la primera deri- 2 3 . 1 2 Recuerde que para el problema del paracaidista en caldu, 1.1.A límplec la ecuación (23.9) la velocidad está dada por V A D A ilo — 7x — lOx — 8 en JC = 0 con base en los VALORES .r = 1 2. Compare este resultado con l 2 9.8) 68.1) _ , ,, (P23.12A) AL valor verdadero y con una estimación obtenida usando aproxi12.5 ' maciones por diferencias centradas con base en h = 1. 11.7 Pruebe que para datos igualmente espaciados, la ecuación ( ) t')) so reduce a la ecuación (4.22) en x = x¡. y la distancia recorrida se puede obtener por I ' . H ( alcule las aproximaciones por diferencias centradas de pri(P23.12A) mer orden de 0(h ) para cada una de las siguientes funciones en d(t)= {l e m)dt t¿--> 3 In ubicación especificada y para el tamaño de paso especifico: Use Mathcad para integrar la ecuación desde O a l O . e n * = 0.5, 0.2 eos b) Integre en forma analítica la ecuación (P23.126) con la con= tan en = 3, = 0.1 dición inicial d = 0 en t = 0. Evalúe el resultado en / = 10 en = 1, 0.1 para confirmar a). ,)> = e* + x e n * = 1, 0.25 Use Mathcad para diferenciar la ecuación en / » Í 1 . > I ,os siguientes datos se reunieron para la distancia recorri10. da contra el tiempo para un cohete: d) Evalúe la ecuación (P23.12a) en / = 10 para confirmare). 0 2 3 4 5 2 3 . 1 3 La distribución normal se define como
f(x) 5e~ x.
2
)
y= 3x —0.5,x = yx = y
2
3
()
(
(
( 1 2
/ 6 8
(l^fJo _x + 4x-l5 enxh= = 0, h = a) 0.5 x x x h I»yy= = (x/3) y sen (0.5 íx)lx x hh== V) c) 4
(P23.12a)
(P23.12b)
(
0
2
8
18 3 2 5 0
/(*) =
I Isc diferenciación numérica para estimar la velocidad del cohelo y la aceleración para cada tiempo. 1.1.10 Desarrolle un subprograma de uso amigable con el fin de api ¡car un algoritmo de Romberg para estimar la derivada de una Función dada. 1 \. 11 Desarrolle un subprograma de uso amigable para obtener la estimación de la primera derivada para datos espaciados desigualmente. Pruébelo con los siguientes datos
1
~x /2 ¿
1 a l y a) Use Mathcad para integrar esta función desde x = desde —2 a 2. b) Emplee Mathcad para determinar el punto de inflexión do esta función. Como la función es simétrica, limite su análisis para la x positiva. 2 3 . 1 4 Use la función quad de MATLAB para integrar la ecuu-
(P23.12a) desde t = 0 a 10. 2 3 . 1 5 Los siguientes datos se generaron a partir de lación distribución normal: X
f(x)
-2
-1.5
-1
-0.5
0
0.5
1
0.053991
0.129518
0.241971
0.352065
0.398942
0.352065
0.241971
1.5
2
0.12951 3 0.053991
a) Use MATLAB para integrar estos datos desde x = — 1 a 1 y desde —2 a 2. b) Emplee MATLAB para estimar los puntos de inflexión de esos datos. 2 3 . 1 6 Use IMSL para integrar la distribución normal (véase cl problema 23.13) d e s d e * = - I a 1 , desde - 2 a 2 y desde - 3 a 3.
t»
CAPITULO 2 4 A p l i c a c i o n e s e n la i n g e n i e r í a : integración numérica y diferenciación El propósito del presente capítulo es aplicar los métodos de integración y diferenciación numérica, expuestos en la parte seis, a problemas prácticos de la ingeniería. Se mencionarán dos de las situaciones de ocurrencia más frecuente. En el caso de los métodos de integración, se puede expresar la función sujeta a estudio en forma analítica pero es muy complicada para que esté lista a evaluarse mediante los métodos de cálculo. Se aplican los métodos numéricos a situaciones de este tipo por medio de la expresión analítica con el fin de generar una tabla de argumentos y valores de función. En el segundo caso, la función que habrá de evaluarse se halla inherentemente en forma tabular. Este tipo de función a menudo representa una serie de mediciones, observaciones o alguna otra información empírica. Los datos para cualquiera de los casos son compatibles directamente con diferentes esquemas analizados en esta parte del libro. La sección 24.1, que trata con cálculos de calor en la ingeniería química, involucra ecuaciones. En esta aplicación, una función analítica se integra en forma numérica con el fin de determinar el calor requerido para aumentar la temperatura de un material. Las secciones 24.2 y 24.3 también involucran funciones que están disponibles en forma de ecuación. La sección 24.2, la cual se toma de la ingeniería civil, usa integración numérica para determinar la fuerza total del viento que actúa sobre el mástil de un bote de carreras. La sección 24.3 determina la raíz media cuadrática de la corriente para un circuito eléctrico. Este ejemplo se usa para demostrar la utilidad de la integración de Romberg y la cuadratura de Gauss. La sección 24.4 se concentra en el análisis de información tabular para determinar el trabajo necesario para mover un bloque. Aunque esta aplicación tiene una conexión directa con la ingeniería mecánica, se relaciona con todas las otras áreas de la ingeniería. Entre otras cosas, usamos este ejemplo para ilustrar la integración de datos espaciados desigualmente.
24.1
INTEGRACIÓN PARA DETERMINAR LA CANTIDAD TOTAL DE CALOR (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Se emplean cálculos de calor en forma rutinaria en la ingeniería química y petrolera así como en muchos otros campos de la ingeniería. Esta aplicación proporciona un simple pero útil ejemplo de tales cálculos. La determinación de la cantidad de calor requerido para elevar la temperatura de un material es un problema con el que tratamos frecuentemente. La característica necesaria
' 24J ^1|^^^^•pp^íC^r^MIW^^ LA'CWTIDID'TOTAL DE CALOR para llevar l cabo este cálculo es la capacidad calorífica c, lisie parámetro representa la cantidad de calor requerida para aumentar una unidad de temperatura a una masu unitaria. Si c es constante sobro el rango de temperaturas sujetas a examen, el calor requerido AH (en calorías) se puede calcular por AH=mcAT
-
(24.1)
donde c tiene unidades de cal/(g • °C), m = masa (g) y AT = cambio en temperatura (°C). Por ejemplo, la cantidad de calor necesario para aumentar a 20 gramos de agua desde 5 a 10°C es igual a
AH = 20(1)(10- 5) = 100 cal donde la capacidad calorífica del agua es aproximadamente 1 cal/(g • °C). Tal cálculo es propicio cuando AT es pequeño. Sin embargo, para grandes cambios de temperatura, la capacidad calorífica no es constante y, de hecho, varía en función de la temperatura. Por ejemplo, la capacidad calorífica de un material no se podría aumentar con la temperatura de acuerdo con una relación como c(T) = 0 . 1 3 2 +
1.56 x 10" r 4
+
2.64 x 10~ r
7 2
(24.2)
En este ejemplo se le pide calcular el calor necesario para elevar 1 000 gramos de este material desde - 1 0 0 a 200°C. Solución. c(T):
La ecuación
(PT6.4) proporciona una forma para calcular el valor promedio
c(T) dT c(T) =
-\
-r~
J
¡2
—i
(24.3)
I
la cual se puede sustituir en la ecuación (24.1) para dar AH — m f
c(T) dT
(24.4)
donde AT = T — r . Ahora como, para el caso actual, c(7), es una cuadrática simple, AH puede determinarse de manera analítica. La ecuación (24.2) se sustituye en la ecuación (24.4) y el resultado se integra para dar un valor exacto de AH = 42 732 cal. Es útil e instructivo comparar este resultado con los métodos numéricos expuestos en el capítulo 21. Para realizarlo, es necesario generar una tabla de valores de c para varios valores de T: 2
t
T,°C -100 -50 0 50 100 1.')()
200
c, cal/(g 0 . 1 1 9 0•4°C) 0.12486 0.13200 0.14046 0.15024 0.16134 0.17376
APLICACIONES EN LA INGENIERÍA: INTEGRACIÓN NUMÉRICA Y DIFERENCIACIÓN
682
Estos puntos se usan en conjunto con la regla de Simpson 1/3 con seis segmentos para calcular una estimación de la integral de 42 732. Tal resultado puede sustituirse en la ecuación (24.4) para obtener un valor de AH = 42 732 cal, el cual concuerda exactamente con la solución analítica. Esta exacta concordancia podría ocurrir sin importar cuántos segmentos se usaron. Esto se espera debido a que c es una función cuadrática y la regla de Simpson es exacta para polinomios de tercer orden o menores (véase la sección 21.2.1). Los resultados que se obtuvieron con la regla trapezoidal se listan en la tabla 24.1. Se observa que la regla trapezoidal es también capaz de estimar el calor total en forma exacta. Sin embargo, un pequeño paso (< 10°C) se requiere para una exactitud de cinco cifras. Este ejemplo es una buena ilustración del porqué la regla de Simpson es muy popular. Es fácil realizarla con una calculadora o, mejor aún, con una computadora. Además, es por lo común lo suficientemente exacto para tamaños de paso relativamente grandes y es exacto para polinomios de tercer orden o menores. 24.2
F U E R Z A EFECTIVA S O B R E EL M Á S T I L DE U N B O T E DE CARRERAS (INGENIERÍA CIVIL/AMBIENTAL) Antecedentes. En la figura 24.1a se muestra una sección transversal de un bote de carreras. Las fuerzas del viento (/), ejercidas por pie de mástil de los botes varían como una función de la distancia por arriba de la cubierta del bote (z), como se muestra en la figura 24.16. Calcule la fuerza de tensión T e n el cable izquierdo que soporta el mástil; además, se supone que el cable derecho que soporta el mástil está por completo flojo y que el mástil une la cubierta de modo que transmite fuerzas horizontales y verticales pero no momentos. Suponga que el mástil permanece vertical. Solución. Para proceder con este problema, se requiere que la fuerza distribuida / se convierta en una fuerza equivalente total F y se calcule su localización d por arriba de la cubierta (véase la figura 24.2). Este cálculo se complica por el hecho de que la fuerza ejercida por pie de mástil varía con la distancia por arriba de la cubierta. La fuerza total ejercida sobre el mástil se puede expresar como la integral de una función continua:
=c {^y
f
2oo
TABLA 24.1
2:/io
(24 5)
Resultados con el uso de la regla trapezoidal con diferentes tamaños de paso. AH
T a m a ñ o de p a s o , °C 300 150 100 50 25 10 5 1 0.05
-
dz
96 43 42 42 42 42 42 42 42
048 029 864 765 740 733.3 732.3 732.01 /:)2,00003
e,[%) 125 0.7 0.3 0.07 0.018 Q
C O CO CL E
CO
s (O O. SO
Q.
£
55
55
o
CU D
CU
PROBLEMAS lli||«IILURIA
química/petrolera
14.1 Kcalice el mismo cálculo que en la sección 24.1, pero ahora Míenle la cantidad de calor requerido para elevar la temperatura ili< I .*)()() gramos del material desde —150 a 50°C. Use la regla lio Simpson para sus cálculos, con valores de incremento de Tde 1
(25.6)
25.1
MÉTODO DE EULER
719
donde 0(h" ) especifica que el error de funcionamiento local es proporcional al tamaño de paso elevado a la potencia (« + l)-ésima. Al comparar las ecuaciones (25.2) y (25.6), puede verse que el método de Euler corresponde a la serie de Taylor hasta e incluyendo el término f(x¡, y¡)h. Además, la comparación indica que ocurre un error de truncamiento porque aproximamos la solución verdadera mediante un número finito de términos de la serie de Taylor. De esta forma truncamos, o dejamos fuera, una parte de la solución verdadera. Por ejemplo, el error de truncamiento en el método de Euler es atribuible a los términos remanentes en la serie de expansión de Taylor que no se incluyeron en la ecuación (25.2). Al restar la ecuación (25.2) de la (25.6) se tiene 1
1
+
(25.7)
0(h ) n+l
donde E = error de truncamiento local verdadero. Para h lo suficientemente pequeña, los errores en los términos de la ecuación (25.7) disminuyen con frecuencia en tanto aumenta el orden (recuerde el ejemplo 4.2 y el análisis que lo acompaña), y el resultado a menudo es representado como t
(25.8)
2!
E = a
O(lr)
(25.9)
donde E = error de truncamiento local aproximado. a
EJEMPLO 2 5 . 2
Estimación de la serie de Taylor por el método del error de Euler
\ Enunciando del problema. Use la ecuación (25.7) para estimar el error del paso inicial del ejemplo 25.1. Úsela también para determinar el error debido a cada uno de los términos de orden superior de la serie de expansión de Taylor. Solución. Debido a que tratamos con un polinomio, podemos usar la serie de Taylor para obtener estimaciones exactas en el método de Euler. La ecuación (25.7) se puede escribir como
f'ixi, yi)_
E,
3!
h2+ /"(*,-, y,-)4!
ft3
+
/
( 3 )
(*My,)
/ 7
4
(E25.2.1)
donde f'(x¡, y¡) — primera derivada de la ecuación diferencial (que es, la segunda derivada de la solución). Para el presente caso, ésta es /"(.v.. y.) = -6x
2
yf"(x¡,
+ 2Ax - 20
(E25.2.2)
y¡) es lu segunda derivada de la EDO
f"iM,y,)
* - 12v + 24
(E25.2.3)
MÉTODOS DE RUNGE-KUTTA
y/* (x,-, y¡) es la tercera derivada de la EDO 3)
/ >(x -,y,0 = - 1 2 (3
(IÍ25.2.4)
(
Podemos omitir términos adicionales (esto es, derivadas de cuarto y superiores) de la ecuación (E25.2.1), ya que para este caso en particular son igual a cero. Se debería observar que para otras funciones (por ejemplo, funciones trascendentales como sinusoides o exponenciales) esto podría no necesariamente ser cierto, y los términos de orden superior podrían tener valores diferentes a cero. Sin embargo, para el presente caso, las ecuaciones (E25.2.1) a la (E25.2.4) definen por completo el error de truncamiento para una sola aplicación del método de Euler. Por ejemplo, el error de truncamiento del término de segundo orden se puede calcular como - 6 ( 0 . 0 ) + 24(0.0) - 20 E,,2 = — - — ^ — (0.5) = - 2 . 5 2
7 2
(E25.2.5)
Para el término de tercer orden: £,, =
- 1 2 ( 0 . 0 ) + 24
3
o
(0.5) = 0.5 J
y para el término de cuarto orden: E,
4
=
— 12 (0.5) = - 0 . 0 3 1 2 5 24 4
Estos tres resultados pueden ser agregados para obtener el error de truncamiento total: E, = E,, + £ , 3 + E f
2
tA
= - 2 . 5 + 0.5 - 0.03125 = -2.03125
el cual es exactamente el error en que se incurría en el paso inicial del ejemplo 25.1, Observe como E > E > E el cual soporta la aproximación representada por In ecuación (25.8). t2
t3
t¥
Como se ilustra en el ejemplo 25.2, la serie de Taylor proporciona un medio para cuantificar el error en el método de Euler. Sin embargo, existen limitaciones asociadas con su uso para este propósito: 1.
La serie de Taylor proporciona sólo un estimado del error de truncamiento local; en decir, el error creado durante un solo paso del método. No proporciona una medida del error propagado y, por tanto, del error de truncamiento global. En la tabla 25.1 incluimos los errores de truncamiento global y local para el ejemplo 25.1. El error local se calculó para cada tamaño de tiempo con la ecuación (25.2), pero mediante el uso del valor verdadero de y¡ (la segunda columna de la tabla) para calcular y¡ , , en lugar del valor aproximado (la tercera columna), como se hizo en el método ele Euler. Como se esperaba, el error de truncamiento local absoluto promedio (25%) es menor que el error global promedio (90%). La única razón que tendríamos puní hacer estos cálculos do error a&tetoi, en que conocemos el valor verdadero a priorl,
2.
Éito no podrí«aer ol caso en un problema real. En consecuencia, como lo nnalizaromoa dtapuói, usted debe aplicar con frecuencia técnicas tales como ol método de Euler usando varios tamaños de paso diferentes para obtener una estimación indirecta de los errores involucrados. Como se mencionó antes, en problemas reales con frecuencia tratamos con funciones que son más complicadas que los polinomios simples. En consecuencia, las derivadas necesarias para evaluar la expansión de la serie de Taylor podrían no siempre ser fáciles de obtener.
Aunque estas limitaciones impiden el análisis de error exacto para la mayoría de los problemas prácticos, la serie de Taylor proporciona todavía un conocimiento valioso en el comportamiento del método de Euler. De acuerdo con la ecuación (25.9), vemos que el error local es proporcional al cuadrado del tamaño de paso y a la primera derivada de la ecuación diferencial. Se puede también demostrar que el error de truncamiento global es 0(h); es decir, es proporcional al tamaño de paso (Carnahan y cois., 1969). Estas observaciones nos llevan a las siguientes conclusiones útiles: 1. 2.
Se puede reducir el error al disminuir el tamaño de paso. El método proporcionará predicciones libres de error si la función en turno (es decir, la solución de la ecuación diferencial) es lineal, debido a que para una línea recta, la segunda derivada podría ser cero.
Esta última conclusión tiene sentido intuitivo, ya que el método de Euler usa segmento» de línea recta para aproximar la solución. De ahí que se haga referencia al método de Euler como uno de primer orden. Debería también observarse que este patrón general se cumple para métodos do orden superior de un paso, que se describen en las siguientes páginas. Es decir, un método de M-ésimo orden dará resultados perfectos si la solución en turno es un polinomio de n-ésimo orden. Además, el error de truncamiento local será 0(h" ) y el error global 0(h"). +1
EJEMPLO 2 5 . 3
Efecto del tamaño de paso reducido sobre el método de Euler
Enunciadodel problema. ño de paso de 0.25.
\ i í j i j |
Repita el cálculo del ejemplo 25.1, pero ahora use un tama-
Solución. El cálculo se repite, y los resultados se compilan en la figura 25.4a. Al volver el tamaño de paso a la mitad se reduce el valor absoluto del error global promedio al 4 0 % y el valor absoluto del error local al 6.4%. Esto es equiparable a los errores global y local del ejemplo 25.1 de 90% y 24.8%. Así, como se esperaba, el error local disminuye a un cuarto y el error global a la mitad. Observe también cómo el error local cambia de signo para valores intermedios a lo largo del rango. Esto se debe principalmente a que la primera derivada de la ecuación diferencial es una parábola que cambia de signo [recuerde la ecuación (E25.2.2) y vea la figura 25.46]. Como el error local es proporcional a esta función, el efecto neto de la oscilación en el signo es para mantener el error global de un crecimiento continuo en tanto so ejecuta ol cálculo. Así, desde x = 0 hasta x — 1.25, todos los errores locales son negativo» y, en consecuencia, el error global aumenta sobre este intervalo. En la sección
722
MÉTODOS DE
RUNGE-KUTTA
«J'i< " ¡
1
. . ' .:"
:
i vi "i.! •
\
FIGURA 25.4
¡
a)
j
TAMAÑOS D E PASO D E 0 . 5
J
Y E S T I M A D O P A R A EL C A S O D O N D E EL T A M A Ñ O D E P A S O E S 0 . 5 .
\
SE BASA
C O M P A R A C I Ó N D E D O S S O L U C I O N E S N U M É R I C A S C O N EL M É T O D O D E EULER M E D I A N T E EL U S O D E
E N LA E C U A C I Ó N
Y 0 . 2 5 .
b)
C O M P A R A C I Ó N D E L ERROR D E T R U N C A M I E N T O LOCAL
VERDADERO
O B S E R V E Q U E EL ERROR " E S T I M A D O "
(E25.2.5).
j \ !
i j
intermedia del rango, los errores locales positivos comienzan a reducir el error global. Cerca del extremo, se invierte el proceso y de nuevo aumenta el error global. Si el error local cambia en forma continua el signo sobre el intervalo de cálculo, el efecto neto será con frecuencia reducir el error global. Sin embargo, donde los errores locales son del mismo signo, la solución numérica puede divergir cada vez más de la solución verdadera en tanto se ejecuta el cálculo. Tales resultados se conocen como inestables. El efecto de reducciones adicionales en el tamaño de paso sobre el error de truncamiento global del método de Euler se ilustra en la figura 25.5. Esta gráfica muestra cl errar relativo porcentual en x • 5 tono UM función del tamaño de paso para el problo-
5
1
, Pieos . , 50 ,. 500
5 000
0.1
0.001
0.01
Tamaño de paso
FIGURA 2 5 . 5 Efecto del tamaño de paso sobre el error de truncamiento global del método de Euler paia la integral de y' = -2x + 1 2X - 20x + 8.5. La gráfica muestra el error global relativo porcentual absoluto en x = 5 como una función del tamaño de paso. 3
2
ma que estamos examinando en los ejemplos 25.1 al 25.3. Observe que aun cuando h so reduzca a 0.001, el error todavía excede 0.1 %. Como este tamaño de paso corresponde a 5 000 pasos para ejecutar desde x = 0 hasta x — 5, la gráfica sugiere una técnica do primer orden como el método de Euler que demanda gran esfuerzo computacional para obtener otros niveles de error aceptables. Más adelante en este capítulo, presentamos técnicas de orden superior que dan mucha mayor exactitud con el mismo esfuerzo computacional. Sin embargo, debería observarse que, a pesar de su ineficiencia, la simplicidad del método de Euler lo hace una opción extremadamente atractiva para muchos problemas de ingeniería. Ya que es muy fácil de programar, la técnica es en particular útil para análisis rápidos. En la próxima sección se desarrolla un algoritmo de cómputo para el método de Euler. 25.1.2
A l g o r i t m o p a r a el método de Euler
Los algoritmos para las técnicas de un paso como el método de Euler, son en extremo simples de programar. Como se especificó en el inicio de este capítulo, todos los métodos de un paso tienen la forma general Nuevo valor = viejo valor + pendiente x tamaño de peso La única forma en la que difieren los métodos es en el cálculo de la pendiente.
(25.10)
MÉTODOS DE RUNGE-KUTTA Suponga que usted quiere realizar el cálculo simple expuesto en la tabla 25.1. Esto es, a usted le gustaría usar el método de Euler para integrar / = -2x + \2x - 20x + 8.5, con la condición inicial de que y = 1 enx = 0. A usted le gustaría integrarla hasta x = 4 usando un tamaño de paso de 0.5, y que desplegara todos los resultados. Un pseudocódigo simple para realizar lo anterior podría ser como el que está escrito en la figura 25.6. Aunque este programa "hará el trabajo" de duplicar los resultados de la tabla 25.1, no está muy bien diseñado. Primero, y el más importante, no es muy modular. Aunque esto no es muy importante para un programa así de pequeño, podría ser crítico si deseamos modificar y mejorar el algoritmo. Además, existen varios factores relacionados con la forma en que establecemos las iteraciones. Por ejemplo, suponga que el tamaño de paso se habrá de volver muy pequeño para obtener mayor exactitud. En tales casos, debido a que cada valor calculado se despliega, el número de variables de salida podría ser muy grande. Además, el algoritmo está imposibilitado sobre la suposición de que el intervalo de cálculo es uniformemente divisible entre el tamaño de paso. Por último, la acumulación de x en la línea x = x + dx puede estar sujeta a cuantización de errores de la clase analizada en la sección 3.4.1. Por ejemplo, si dx fuera cambiada a 0.01 y se usara la representación estándar IEEE de punto flotante (cerca de siete cifras significativas), el resultado al final del cálculo podría ser 3.999997 en lugar de 4. ¡Para dx = 0.001, podría ser 3.999892! 2
FIGURA
25.6
Pseudocódigo paro una versión "muda" del método de Euler.
'set ¡ntegratíon range x¡ = O xf = 4 'initialize variables
X = XÍ
y =i
'eet step eize and determine 'number of calculation steps dx. = 0.5 nc (xf-xi)/dx 'output initial condition PRINT x, y 'loop to impiement Euler's method 'and dieplay reeulte DO i =1,nc dydx = -2X + 12X - 20x + 3.5 y = y + dydx • dx x = x + dx PRINT x, y END OQ . 3
2
2
1. Esto 20x + hasta x os. Un o en la IA 25.1, ^.unque deseamos las pequeilado se joritmo temente x + dx 4.1. Por le punto >dría ser
• I • • • I H H • fl I H H • •
m
fl S fl H
En la figura 25,7 NO despliega un algoritmo mucho más modular que evilu esas dificultades. 1(1 nluorilnio no da la salida A todos los valores calculados. En lugar do esto, el usuario especifica un intervalo de salida, xout, que indica el intervalo en el cual los resultados calculados se guardan en arreglos, xp y yp . Estos valores se guardan en arreglos de tal modo que se tenga salida en diferentes formas una vez que termine el cálculo (por ejemplo, impresión, gráficas, escritura en un archivo). El programa principal toma grandes tamaños de paso y llama A una rutina denominada Integrator que hace los tamaños de cálculo más pequeños. Observe que los ciclos controlan ambas salidas de paso, grandes y pequeños, en condiciones lógicas. Así, los intervalos no tienen que ser uniformemente divisibles entre los tamaños de paso, La rutina Integrator llama después A la rutina Euler que toma un solo tamaño de paso con el método de Euler. La rutina Euler llama A la rutina Derívate que calcula el valor de la derivada. Mientras que tal modularización podría parecer que sobrepasa al caso actual, facilitara en gran medida la modificación del programa en las últimas secciones. Por ejemplo, aunque el programa de la figura 25.7 está diseñado específicamente para implementar el método de Euler, el módulo de Euler es la única parte en que el método es específico, Así, todo lo que se requiere para aplicar este algoritmo con otros métodos de un paso es modificar esta rutina.
FIGURA
m
25.7
Pseudocódigo para una versión modular "mejorada" del método de Euler.
a) Programa principal o "manejado!*" b) Rutina para tomar un paso de salida
Assign valúes for y = initial valué dependent variable xi = initial valué independent variable xf = final valué independent variable dx = caiculation step size xout = output interval
x = xi m=0
5U3 Integrator (x, y, h, xend) DO IF (xend - x < h) THEN h = xend - x CALL Euler (x, y, h, ynew) y = ynew IF (x > xend) EXIT END DO END SUB
cj Método de Euler para una sola EDO
DO xend = x + xout IF (xend > xf) THEN xend = xf h = dx CALL Integrator (x, y, h, xend) m = m+ 1 xp = x m
yp =y m
3U3 Euler (x, y, h, ynew) CALL Derivs(x, y, dydx) ynew = y + dydx * h x =x +h END S U B
d] Rutina para determinar la derivada 5U3 Derive (x, y, dydx) dydx = ... END SUB
ENP DO KF.5ULTS DISFLAY END IF (x £ xf) EXIT
726
MÉTODOS DE RUNGÉ-KUTTA
Rtoi vl tindo al
EJEMPLO 2 5 . 4
E D O con
computadora
Enunciado del problema. Se puede desarrollar un programa de cómputo a partir del pseudocódigo de la figura 25.7. Podemos usar este software para resolver otro problema asociado dv con la caída c del paracaidista. Usted recordará de la parte uno que nuestro mo— = g v (E25.4.1) delo matemático para la velocidad se basó en la segunda ley de Newton en la forma dt m Esta ecuación diferencial se resolvió tanto de manera analítica (ejemplo 1.1) como numérica con el método de Euler (ejemplo 1.2). Esas soluciones fueron para el caso en el g = 9.8, c = 12.5, m = 68.1 y v = 0 en t = 0. El objetivo del presente ejemplo es repetir esos cálculos numéricos mediante un modelo más complicado para la velocidad con base en una descripción matemática más completa de la fuerza de arrastre causada por la resistencia del viento. Este modelo lo proporciona dv dt
= g
(E25.4.2)
v + a m
donde g,myc son las mismas que en la ecuación (E25.4.1), y a, b y i» son constantes empíricas, las cuales para este caso son igual a 8.3, 2.2 y 46, respectivamente. Observe que este modelo tiene mayor capacidad para ajustar con exactitud mediciones empíricas de fuerzas de arrastre contra velocidad que el modelo lineal simple del ejemplo 1.1. Sin embargo, este aumento en la flexibilidad se gana a expensas de evaluar tres coeficientes en lugar de uno. Además, el modelo matemático resultante es más difícil de resolver en forma analítica. En este caso, el método de Euler proporciona una alternativa conveniente para obtener una solución numérica aproximada. m4x
|
FIGURA
j j
Resultados gráficos para la solución de la EDO no lineal [véase ecuación (E25.4.2)]. Observe que la gráfica también muestra la solución para el modelo lineal [véase ecuación (E25.4.1)] para propósitos comparativos.
25.8
Lineal
No lineal
23.] MftftPCM EULER Solución. Los resultados para ambos modelos, lineal y no lineal, se despliegan en la figura 25H . con un tamaño de paso de integración de 0.1 s. La gráfica de esta figura muestra también un traslape de la solución del modelo lineal para propósitos de comparación. Los resultados de las dos simulaciones indican en qué medida el aumento de la complejidad de la formulación en la fuerza de arrastre afecta la velocidad del paracaidista. En este caso, la velocidad terminal disminuye debido a la resistencia causada por los términos de orden superior en la ecuación (E25.4.2). Podría probarse en forma similar modelos alternativos. La combinación de una solución generada con la computadora hace de esto una tarea fácil y eficiente. Tales beneficios deberían permitirle dedicar más tiempo para considerar alternativas creativas y aspectos holísticos del problema en lugar de los tediosos cálculos a mano.
25.1.3
Métodos p a r a la serie de T a y l o r de o r d e n s u p e r i o r
Una manera para reducir el error del método de Euler podría ser la inclusión de términos de orden superior en la expansión de la serie de Taylor para su solución. Por ejemplo, con la inclusión del término de segundo orden en la ecuación (25.6) se obtiene f'(xi,yi) y¡+i = y, + f(xi,y¡)h
+
J
^
y
7
h
(25.11)
2
con un error de truncamiento local de 6 Aunque la incorporación de términos de orden superior es lo suficientemente simple para implementarse en los polinomios, su inclusión no es tan trivial cuando la EDO es más complicada. En particular, las EDO que son una función tanto de la variable dependiente como de la independiente, requieren diferenciación por la regla de la cadena. Por ejemplo, la primera derivada de f(x, y) es df(x,y) / < * . * >
=
-
£
-
,
df(x,y)dy
+
- 1 7 - *
La segunda derivada es d[df/dx
+ {df/dy)(dy/dx)] dx
t
d[df/dx
+
(df/dy){dy/dx)]dy dy
f'Xxi.Vi) Las derivadas de orden superior se hacen mucho más complicadas.
dx
En consecuencia, como se describe en las siguientes secciones, se han desarrollado métodos alternativos de un paso, Esos esquemas son comparables en desempeño con los procedimientos de la serio de Taylor de orden superior, pero requieren sólo del cálculo de las primeras derivadas.
MÉTODOS DE RUNGE-KUTTA
728
25.2
M E J O R A S DEL M É T O D O DE EULER Una fuente fundamental de error en el método de Euler es que la derivada al inicio del intervalo supuestamente se aplica a través de todo el intervalo. Se dispone de dos simples modificaciones para evitar este defecto. Como se demostrará en la sección 25.3, de hecho ambas modificaciones pertenecen a una clase mayor de técnicas de solución llamadas métodos de Runge-Kutta. Sin embargo, como éstos poseen una interpretación gráfica muy directa, los presentaremos primero para su derivación formal como métodos Runge-Kutta. 25.2.1
Método de H e u n
Un método para mejorar la estimación de la pendiente involucra la determinación de dos derivadas para el intervalo (una en el punto inicial y otra en el final). Las dos derivadas se promedian después con el fin de obtener una estimación mejorada de la pendiente para todo el intervalo. Este procedimiento, conocido como el método de Heun, se ilustra en forma gráfica en la figura 25.9.
FIGURA
25.9
Ilustración gráfica del método de Heun. o) Predictor y b) corrector.
mmm¡
zarRecuerdo que en el método PBL M É T O D O - P E B U E W de Euler, la pendiente al inicio de un intervalo y¡ = f(x¡, y,)
(25.12)
se usa para extrapolar linealmente a y ¡ . + l
y?+i=yi
+ f(xi,yi)h
(25.13)
Para el método estándar de Euler deberemos parar aquí. Sin embargo, Heun l a y ; calculada en la ecuación (25.13) no es la respuesta final, ción intermedia. Es por esto que la distinguimos con un superíndice (25.13) es llamada ecuaciónpredictor. Mejora una estimación de y cálculo de una estimación de la pendiente al final del intervalo: + 1
i+l
y'
¡+1
en el método de sino una predicO. La ecuación que permite el
=f(x ,y? ) i+í
(25.14)
+l
Así, las dos pendientes [véase ecuaciones (25.12) y (25.14)] pueden combinarse con el fin de obtener una pendiente promedio para el intervalo: -, y
=
y'¡ + y¡ i +
=
/ f e , y , ) + /(x, ,y,Q ) + 1
2
f l
2
Esta pendiente promedio se utiliza después para extrapolar linealmente desde y¡ hasta y usando el método de Euler: ¡+l
, / ( * ; , y , ) + /(*,+), y ° y ¿ + i = y; + 2
+ 1
), h
la cual es conocida como ecuación corrector. El método de Heun es un procedimiento predictor-corrector. Todos los métodos multipaso que se analizarán más tarde en el capítulo 26 son de este tipo. El método de Heun es el único método predictor-corrector de un solo paso que se describe en este libro. Como se desarrolló antes, se puede expresar en forma concisa como Predictor (figura 25.9a):
y°
= y, + f(
Corrector (figura 25.96):
y
= y, + - "
i+}
f( X
l+l
y,)h
X¡>
y,)
(25.15)
+
^
View more...
Comments