Análisis_Numérico Benalcázar
Short Description
Libro Analisis numeroico...
Description
Serie de Matemática Universitaria
ANÁLISIS NUMÉRICO Hernán Benalcázar Gómez
Análisis Numérico Hernán Benalcázar Gómez Quito, noviembre del 2007
Dedicatoria A mi esposa y a mi hijo. A mis padres, siempre presentes apoyándome en todos mis proyectos.
i
ii
Introducción El análisis numérico es una parte de la matemática y tiene su crecimiento a partir de la década de los cuarenta del siglo pasado, crecimiento que va junto con el de los computadores. Se desarrolla en base a las necesidades de resolver problemas complejos que surgen en las ingenierías, las ciencias físicas, químicas, biológicas, la economía y ciencias sociales, en la industria. En la actualidad, el análisis numérico es parte de la malla curricular de la mayor parte de las carreras de ingeniería y de ciencias fundamentales, y se constituye en la base para la generación de métodos de simulación asistido por computadora ampliamente utilizados en el sector industrial, y últimamente en el ambiental y climático. Los países desarrolados son los que han dado mayor importancia al análisis numérico y a la simulación numérica; en nuestro país es muy poco lo que se hace en matemática y particularmente en análisis numérico. Este libro es una introducción al análisis numérico. Está destinado a los estudiantes de segundo o tercer años de la carreras de ingeniería y en especial de informática, computación grá…ca, de diseño industrial, mecánica, electrónica, química y muy particularmente a los estudiantes de ingeniería matemática de las Escuelas de Ciencias, a los estudiantes de las maestrías en docencia matemática, estadística y optimización, entre otras, a matemáticos e ingenieros interesados en aplicaciones del análisis matemático, del álgebra lineal y de las ecuaciones diferenciales ordinarias. Está basado en las notas que el autor ha impartido en cursos de pregrado y posgrado en varias Universidades y Escuelas Politécnicas del Ecuador. Los requisitos para el estudio de este libro son los cursos de análisis matemático I y II, de álgebra lineal, como los que se dictan en las Escuelas de Ciencias. Más exactamente se requiere del conocimiento de resultados fundamentales del cálculo diferencial e integral de funciones en una y en varias variables, de las sucesiones y series numéricas, de las sucesiones y series de funciones, de algunos tipos de ecuaciones diferenciales ordinarias de primer orden, y del lado del álgebra lineal, se requiere de conocimientos básicos de los espacios vectoriales, las aplicaciones lineales y matrices, de los sistemas de ecuaciones lineales, de diagonalización de matrices. El texto contiene once capítulos y un apéndice, cada uno de ellos está dividido en secciones y subsecciones. Al inicio de cada capítulo se presenta el resumen del mismo. Contiene ejemplos y ejercicios resueltos algunos de ellos originales, y una gran cantidad de ejecicios propuestos, una parte de ellos originales, lo que enriquece el material que se ofrece al estudiante. Los resultados numéricos que se presentan en cada uno de los capítulos, en unos casos se han obtenido simplemente con una calculadora de bolsillo, y en otros donde el caso lo amerita, se han elaborado programas en Fortran 77 que han sido corridos en una máquina Pentium V. Más aún, todos los algoritmos propuestos han sido debidamente veri…cados. Además, en algunos temas y ejercicios se forza al estudiante a que realice sus propios programas y se vuelva un productor de software, más no un consumidor. Al …nal del capítulo se muestra una amplia bibliografía que van de textos muy elementales a textos muy avanzados y que pueden ser útiles sobre todo para los estudiantes de maestrías que preparan tesis de graduación, como también para que el estudiante de pregrado pueda disponer de otros enfoques que ofrecen muchos libros importantes de análisis numérico que se han publicado. El primer capítulo está destinado a introducir el lenguaje del análisis numérico y a iniciar en el cálculo aproximado. Se comienza con los elementos del cálculo numérico y de los algoritmos. A continuación se muestran algunos ejemplos de algoritmos y de resolución numérica de problemas elementales. Se iii
iv consideran los sistemas de numeración que permiten explicar la representación en punto …jo y en punto ‡otante. Se estudian los tipos de errores, particularmente los de redondeo, de aproximación (truncamiento y discretización) y la propagación de los mismos. Se introducen las nociones de condicionamiento, estabilidad numérica. En el segundo capítulo se tratan tres tipos de problemas: la interpolación polinomial, la derivación y la integración numéricas. Todos estos son tratados en el ámbito de los espacios duales, es decir como formas lineales de…nidas en apropiados espacios vectoriales. Se trata el problema de la existencia del polinomio de interpolación de Lagrange, el error de interpolación. A continuación se estudia la aproximación numérica de derivadas de primero y segundo orden así como de derivadas parciales. Luego, se pasa al estudio de métodos numéricos de integración de funciones de una sola variable, y la aplicación de estos al cálculo de integrales dobles. El capítulo tres está destinado al cálculo aproximado de series de funciones. Para el efecto, se inicia con una revisión de resultados de las series numéricas y de funciones. Se presta mayor atención a las series de potencias y particularmente a las series de Taylor y su aproximación numérica. Se elaboran algoritmos de las funciones trascendentes más importantes como son las trigonométricas, logaritmo y exponencial, los mismos que son las bases de los algoritmos utilizados en calculadoras de bolsillo y los implementados en los lenguajes de programación como por ejemplo C, C++, Fortran, Delphi, etc. Posteriormente se trata la integración de funciones representadas como series de potencias y se dan aplicaciones. La aproximación de series de Fourier se trata en el capítulo noveno. En el capítulo cuarto se da respuesta a una pregunta simple: ¿cómo se elaboran las tablas de las funciones de distribución de probabilidades? Se consideran las funciones de probabilidad discretas y continuas. Dentro de las discretas se tratan la binomial y de Poisson. De las continuas se consideran las funciones de distribución tipos gama y beta, normal i cuadrada; t de Student, de Snedekor. Se elaboran algoritmos de cada una de ellas que pueden ser implementados fácilmente en los programas de simulación. Es importante precisar que en muchos textos, sobre todo de métodos de perturbación, se aborda la función error y su aproximación mediante métodos asimptóticos; esta función es muy similar a la función de distribución normal, igualmente se tratan las funciones gama y beta de Euler. En esos textos, para estas funciones no se dan algoritmos completos de aproximación. De las otras funciones continuas de distribución arriba citadas, se ha encontrado escasamente algunos resultados, por lo que el material que aquí se presenta no se ha hallado, al menos en los libros citados en la bibliografía. El capítulo quinto está destinado al cálculo aproximado de raíces de ecuaciones. Se inicia con la aplicación del teorema de Bolzano a la búsqueda del cambio de signo así como el método de bisección. A continuación, basado en el teorema de Banach del punto …jo se construyen aplicaciones contractivas que están relacionadas con las ecuaciones propuestas y desarrollan algunos métodos de aproximación clásicos. Se trata la convergencia de estos métodos así como dos métodos de aceleración de la convergencia. Se concluye con el estudio de las raíces de polinomios. Los sistemas de ecuaciones lineales son el objeto del capítulo sexto. Se presentan algunos ejemplos que originan sistemas de ecuaciones lineales, posteriormente se trata los problemas con sistemas de ecuaciones lineales. Para la selección del método numérico es importante tener un conocimiento preciso de las características de la matriz del sistema, es por esto que se presta atención al estudio de algunos tipos de matrices. Luego se focaliza el trabajo en los métodos clásicos de resolución de sistemas de ecuaciones lineales como son: eliminación gaussiana, factorización LU de Crout, factorización LT L de Choleski. Estos métodos se adaptan particularmente a las matrices tridiagonales. Se concluye con la resolución en norma mínima de sistemas de ecuaciones lineales que tienen una in…nidad de soluciones. En el capítulo séptimo se tratan métodos iterativos de resolución de sistemas de ecuaciones lineales y no lineales. Se consideran primero los sistemas de ecuaciones no lineales. Para el efecto, se revisan algunos resultados de la diferencial de Fréchet y se vuelve a considerar el teorema de Banach del punto …jo, a continuación se trata el método de Newton. Posteriormente, se tratan los métodos de resolución de sistemas de ecuaciones lineales, a saber: el método de Jacobi, Gauss-Seidel y SOR. El capítulo octavo está destinado al cálculo de los valores y vectores propios. Se inicia con la revisión de algunos resultados fundamentales. Luego se considera la aplicación de los valores y vectores propios
v a las cónicas. Por simplicidad, se considera el cálculo de los valores y vectores propios de matrices reales de 3 3: Se considera el método de la potencia para el cálculo del mayor valor propio de una matriz diagonalizable. Los problemas de mínimos cuadrados se abordan en el capítulo noveno. Se inicia con la resolución de sistemas de ecuaciones lineales en mínimos cuadrados. A continuación se trata el método de Householder que constituye uno de los métodos más importantes para la resolución de sistemas de ecuaciones lineales en mínimos cuadrados así como para el cálculo de vectores propios. Posteriormente se …ja la atención en los problemas de ajuste de datos para varios tipos de problemas. Se concluye con los problemas de mínimos cuadrados continuos, particularmente la aproximación numérica de series de Fourier. En el capítulo décimo se da una breve introducción hacia la teoría de los splines. Básicamente se abordan los splines cúbicos de interpolación y los B-Splines. Los métodos numéricos para calcular soluciones aproximadas de ecuaciones diferenciales ordinarias tienen lugar en el capítulo décimo primero. Se abordan dos clases de problemas: los de Cauchy de valor inicial y los de valores en la frontera. Para la primera clase de problemas se consideran los métodos de Euler explícitos e implícitos, el método implícito de Crank-Nicolson, todos estos se hallan en la mayor parte de los textos citados en la bibliografía, que no es el caso del método de Petrov-Galerkin que aquí es tratado. Este método se aplica fundamentalmente a problemas de valores en la frontera y se encuentra en textos muy especializados. Se pre…rió incluir el método de Petrov-Galerkin y no los ampliamente conocidos métodos de Runge-Kutta, pués estos se los encuentra en la mayor parte de libros de ecuaciones diferenciales y análisis numérico. En la segunda clase de problemas se consideran ecuaciones diferenciales de segundo orden con condiciones de frontera de Dirichlet homogéneas y no homgéneas, de Neumann homogéneas y no homogéneas, y mixtas. Todos estos problemas se aproximan con el método de diferencias …nitas. Se concluye con la resolución numérica de un problema no lineal. Se ha suministrado un apéndice que contiene básicamente una breve revisión de los resultados más importantes de los espacios vectoriales y algunos ejemplos, y, una revisión de los espacios normados y de los espacios con producto interior. Al escribir este libro se buscó un equilibrio entre abstracción, practicidad, popularidad, simplicidad, novedad, actualidad de métodos de cálculo, lo que condujo a no incluir algunos temas que se consideró muy complejos y surgieron algunas preguntas: ¿por qué no se trató tal o cual tema? ¿por qué unos temas tuvieron mayor atención que otros posiblemente más importantes? ¿Cómo juzgar que temas son trascendentales para un público tan variado? La nueva versión de este libro está ya preparada, se dará mayor atención a temas, que en un principio se consideró muy complejos pero que luego se vió la necesidad de tratarlos, como los siguientes: resolución de sistemas de ecuaciones lineales con los métodos Minres y Gmres, problemas no lineales de ajuste de datos dependientes de varios parámetros, método de integración de Gauss, método de Householder para el cálculo de valores y vectores propios, ampliación de la teoría de splines, resultados de existencia de ecuaciones diferenciales ordinarias y convergencia de los métodos propuestos así como los muy populares métodos de Runge-Kutta. Todos estos temas tendrán también una ampliación de ejemplos. Mucho agradeceré se me comunique de posibles errores tipográ…cos y deslices, que por cierto son infaltables a pesar del esfuerzo en controlarlos y eliminarlos. Mi agradecimiento al señor Darwin Polivio Narváez Vicente que muy responsablemente colaboró y mostró mucha capacidad y profesionalismo en el levantamiento del texto.
. Hernán Benalcázar Gómez Profesor de la Escuela de Ciencias
vi
Índice general 1. Cálculo aproximado, algoritmos, errores
1
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2. Cálculo numérico. Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3. Ejemplos de algoritmos y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.3.1. Operaciones elementales con vectores y matrices. Aplicaciones . . . . . . . . . . . .
5
1.3.2. Cálculo con funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.4. Sistemas de Numeración.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
1.4.1. Conversión de binario a decimal y viceversa. . . . . . . . . . . . . . . . . . . . . . .
26
1.4.2. Conversión de decimal a cualquier base y viceversa . . . . . . . . . . . . . . . . . .
30
1.5. Representación en punto ‡otante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
1.6. Tipos de Errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
1.7. Errores de redondeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
1.8. Aritmética de punto ‡otante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
1.9. Condicionamiento de funciones reales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
1.9.1. Condicionamiento de funciones reales de una sola variable. . . . . . . . . . . . . . .
43
1.9.2. Condicionamiento de funciones reales en varias variables . . . . . . . . . . . . . . .
46
1.10. Propagación de los errores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
1.11. Estabilidad numérica. Convergencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
1.12. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
1.13. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
2. Interpolación polinomial, derivación e integración numérica
77
2.1. Espacios duales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
2.2. Interpolación polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
2.3. Operadores de diferencias …nitas y derivación numérica . . . . . . . . . . . . . . . . . . . .
92
2.3.1. Aproximación de derivadas de funciones reales como formas lineales . . . . . . . .
97
2.3.2. Aproximación numérica de derivadas parciales primeras, segundas y laplaciano . .
98
2.4. Integración numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 vii
viii
ÍNDICE GENERAL 2.4.1. Fórmula de Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
2.5. Regla de los trapecios generalizada. Estimación del error . . . . . . . . . . . . . . . . . . . 104 2.6. Regla de Simpson generalizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 2.7. Estimación del error en la regla de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . 110 2.8. Integrales dobles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 2.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 2.10. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 3. Aproximación de series de funciones. Aplicaciones.
131
3.1. Resultados fundamentales de series numéricas convergentes. . . . . . . . . . . . . . . . . . 131 3.1.1. Series numéricas convergentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 3.1.2. Criterios de convergencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 3.1.3. Cálculo aproximado de series numéricas. . . . . . . . . . . . . . . . . . . . . . . . . 138 3.2. Sucesiones y series de funciones. Convergencia puntual y uniforme. . . . . . . . . . . . . . 140 3.2.1. Sucesiones de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 3.2.2. Series de funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 3.3. Series de potencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 3.3.1. Series de potencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 3.3.2. Series de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 3.4. Aproximación numérica de series de potencias. . . . . . . . . . . . . . . . . . . . . . . . . 158 3.5. Aproximación de las funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . 163 3.6. Aproximación de exp(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 3.7. Aproximación de ln(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 3.8. Integración de funciones de clase C 1 (R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 3.9. Función error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 3.10. Aproximación numérica de una integral elíptica . . . . . . . . . . . . . . . . . . . . . . . . 180 3.11. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 3.12. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 4. Aproximación de algunas funciones de distribución de probabilidad.
189
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 4.2. La distribución de probabilidad binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 4.3. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 4.4. Función gama de Euler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 4.4.1. De…nición de
(p) para p < 0 y no entero . . . . . . . . . . . . . . . . . . . . . . . 197
ÍNDICE GENERAL
ix
4.5. Aproximación numérica de (p): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 4.6. Distribución de probabilidad de tipo gama . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 4.7. Función beta. Aproximación de la función beta B(p; q), p > 0, q > 0: . . . . . . . . . . . 206 4.8. Distribución beta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 4.9. Distribución normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 4.10. Distribución i- cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 4.11. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 4.12. Distribución F (de Snedekor) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 4.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 4.14. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 5. Resolución Numérica de Ecuaciones no Lineales
237
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 5.2. Separación de las raíces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 5.3. Método de bisección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 5.4. Desarrollo de métodos iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 5.4.1. Método de punto …jo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 5.4.2. Método de punto …jo modi…cado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 5.4.3. Método de Newton-Raphson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 5.4.4. Método de Newton modi…cado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 5.4.5. Método de las secantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 5.4.6. Método regula-falsi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 5.5. Convergencia. Convergencia acelerada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 5.6. Raíces de multiplicidad
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
5.7. Raíces reales de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 5.7.1. Fronteras superior e inferior de las raíces de la ecuación P (x) = 0 . . . . . . . . . 308 5.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 5.9. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 6. Resolución numérica de sistemas de ecuaciones lineales
319
6.1. Problemas que conducen a la resolución de sistemas de ecuaciones lineales. . . . . . . . . . 319 6.1.1. Problemas de mínimos cuadrados discreto. . . . . . . . . . . . . . . . . . . . . . . . 320 6.1.2. Aproximación de un problema de valores de frontera. . . . . . . . . . . . . . . . . . 321 6.1.3. Trazado de una curva suave a partir de observaciones experimentales. . . . . . . . 322 6.2. Problemas con sistemas de ecuaciones lineales. . . . . . . . . . . . . . . . . . . . . . . . . 325
x
ÍNDICE GENERAL 6.3. Algunos tipos de matrices importantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 6.3.1. Matrices simétricas de…nidas positivas. . . . . . . . . . . . . . . . . . . . . . . . . . 329 6.3.2. Matrices monótonas y diagonalmente dominantes. . . . . . . . . . . . . . . . . . . 331 6.3.3. Matsrices normales y ortogonales.
. . . . . . . . . . . . . . . . . . . . . . . . . . . 334
6.4. Métodos directos de resolución de sistemas de ecuaciones lineales. . . . . . . . . . . . . . . 338 6.4.1. Sistemas de ecuaciones lineales triangulares superiores e inferiores. . . . . . . . . . 339 6.5. Operaciones elementales con matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 6.6. Método de eliminación gaussiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 6.6.1. Eliminación gaussiana sin pivoting. . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 6.6.2. Eliminación gaussiana con pivoting. . . . . . . . . . . . . . . . . . . . . . . . . . . 354 6.6.3. Cálculo de la matriz inversa A
1
y del determinante de la matriz A. . . . . . . . . 363
6.7. Método de Choleski. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 6.8. Método de Crout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 6.9. Sistemas de ecuaciones lineales con matrices tridiagonales. . . . . . . . . . . . . . . . . . . 377 6.10. Resolución de un sistema de ecuaciones lineales en norma mínima. . . . . . . . . . . . . . 390 6.11. Condicionamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 6.12. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 6.13. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 7. Métodos iterativos
405
7.1. Diferencial de Fréchet. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405 7.2. Aplicaciones contractivas y lipschisianas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410 7.3. Resolución numérica de sistemas de ecuaciones no lineales . . . . . . . . . . . . . . . . . . 413 7.4. Métodos iterativos de resolución de sistemas de ecuaciones lineales . . . . . . . . . . . . . 418 7.4.1. Métodos de Jacobi y Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 7.4.2. Método SOR (Successive Over-Relaxation) . . . . . . . . . . . . . . . . . . . . . . 421 7.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 7.6. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 8. Valores y Vectores Propios
433
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 8.2. Formas cuadráticas y ecuaciones cuadráticas en R2 : . . . . . . . . . . . . . . . . . . . . . . 436 8.3. Valores y vectores propios de matrices de 3
3 . . . . . . . . . . . . . . . . . . . . . . . . 446
8.4. Método de las Potencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 8.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 8.6. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
ÍNDICE GENERAL
xi
9. Mínimos Cuadrados
457
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457 9.2. Soluciones de sistemas de ecuaciones lineales en mínimos cuadrados. . . . . . . . . . . . . 460 9.3. Método de Householder y mínimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . 464 9.3.1. Número de operaciones elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 9.4. Ajuste de datos polinomial
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478
9.4.1. Ajuste de datos con polinomios de grado 1. . . . . . . . . . . . . . . . . . . . . . . 479 9.4.2. Ajuste polinomial con polinomios de grado 2. . . . . . . . . . . . . . . . . . . . . . 482 9.5. Ajuste de datos con funciones a…nes de n variables . . . . . . . . . . . . . . . . . . . . . . 485 9.6. Ajuste de datos con funciones dependientes de un parámetro . . . . . . . . . . . . . . . . 491 9.7. Mínimos cuadrados continuos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495 9.8. Aproximación numérica de series de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . 495 9.8.1. Preliminares
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495
9.8.2. Aproximación numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502 9.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 9.10. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 10.Splines
509
10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 10.2. Espacio de funciones splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 10.3. Interpolación mediante splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511 10.3.1. Splines cúbicas de interpolación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 10.3.2. Interpolación con condiciones de frontera de Hermite . . . . . . . . . . . . . . . . . 516 10.3.3. Interpolación con condiciones de frontera naturales . . . . . . . . . . . . . . . . . . 517 10.3.4. Interpolación con condiciones de frontera periódicas . . . . . . . . . . . . . . . . . 518 10.4. Splines cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 10.5. B - Splines
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521
10.5.1. Interpolaciones mediante B-splines cúbicas
. . . . . . . . . . . . . . . . . . . . . . 524
10.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 10.7. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 11.Métodos numéricos de resolución de ecuaciones diferenciales ordinarias
527
11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527 11.2. El método
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
11.3. Método de Petrov-Galerkin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
xii
ÍNDICE GENERAL 11.4. Método de diferencias …nitas para problemas de valores en la frontera 1d. . . . . . . . . . 542 11.4.1. Aspectos informáticos del método de diferencias …nitas . . . . . . . . . . . . . . . . 544 11.4.2. Consistencia, estabilidad, convergencia . . . . . . . . . . . . . . . . . . . . . . . . . 545 11.4.3. Orden de convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552 11.4.4. Método de diferencias …nitas en mallas no uniformes . . . . . . . . . . . . . . . . . 555 11.5. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560 11.6. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573
12.Apendice
575
12.1. Espacios vectoriales reales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575 12.1.1. De…nición de espacio vectorial. Ejemplos. . . . . . . . . . . . . . . . . . . . . . . . 575 12.1.2. Subespacios vectoriales. Ejemplos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 581 12.2. De…nición de espacio normado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 12.3. Ejemplos de espacios normados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 12.3.1. Normas en Rn : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 12.3.2. Normas geométricas de matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590 12.3.3. Normas en el espacio de funciones continuas C ([a; b]) : . . . . . . . . . . . . . . . . 594 12.4. Espacios con producto interno. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 596 12.4.1. Ortogonalidad o perpendicularidad. . . . . . . . . . . . . . . . . . . . . . . . . . . 601 12.5. Lecturas complementarias y bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603
Capítulo 1
Cálculo aproximado, algoritmos, errores Resumen En este capítulo se realiza un tour corto en los métodos numéricos. Se inicia con la presentación de una metodología para el análisis de problemas y las soluciones aproximadas, la elaboración de algoritmos y algunas nociones de la complejidad de los mismos. A continuación se presentan ejemplos de algoritmos simples así como de algunos problemas elementales que se presentan en el ámbito del álgebra lineal y del análisis matemático, y, métodos simples de resolución numérica. Se hace un corto análisis de los tipos de errores. El uso de instrumentos de cálculo como son las calculadoras de bosillo y los computadores motivan el estudio de la representación en punto ‡otante, los errores de redondeo y la aritmética en punto ‡otante, temática que a su vez requiere del análisis de los sistemas de numeración. Luego se realiza un estudio del condicionamiento de funciones de una y varias variables que está relacionado con la ampli…cación de los errores de redondeo. Particular atención se pone en las operaciones aritméticas, lo que permite establecer una jerarquía en las mismas e identi…car que operaciones son las peligrosas y bajo que condiciones y cuales no son peligrosas, lo que constituye una ayuda extremadamente grande cuando se elaboran los algoritmos de cálculo. Mediante algunos ejemplos se analiza el problema de la propagación de los errores así como el de la estabilidad numérica.
1.1.
Introducción
Uno de los objetivos importantes del Análisis Numérico es la elaboración de métodos, procedimientos de cálculo y construcción de algoritmos que con la utilización de instrumentos de cálculo como las calculadoras de bolsillo o de instrumentos de cálculo mucho más complejos como los computadores, que requieren de la elaboración de programas computacionales, permitan calcular soluciones exactas o aproximadas de una diversidad de problemas matemáticos de modo que con cualesquiera de estos instrumentos, se deba tener un control sobre los errores cometidos en los cálculos y que los resultados …nales sean de calidad. Por otro lado, los procedimientos de cálculo, los algoritmos numéricos deben ser, en lo posible, los más simples, concisos, de aplicabilidad a una amplia variedad de situaciones. El costo numérico de cada procedimiento o algoritmo y su programa computacional que se construya debe ser, en lo posible, el más pequeño. La calidad de la solución de un problema dado depende de muchos factores, entre ellos, de los datos de entrada que se requieren para la ejecución del algoritmo, procedimiento o programa computacional construido, así como de los instrumentos de cálculo utilizados, del lenguaje de programación y de la versión del mismo. Es claro que la calidad de la solución depende fuertemente del método numérico empleado y este a su vez depende de dos componentes importantes: el condicionamiento y la estabilidad; y, para problemas cuyas soluciones se aproximan mediante sucesiones, dependen a más de todos los componentes anteriores, de la convergencia. 1
2
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
En este capítulo se tratan algunos elementos de los algoritmos y características de los programas computacionales, los tipos de errores comunes en análisis numérico. Se revisa brevemente los sistemas de numeración entre los que se destacan el binario y el decimal, la representación en punto …jo y punto ‡otante, los errores de redondeo y la aritmética en punto ‡otante. Se introducen las nociones elementales de condicionamiento, estabilidad numérica y convergencia que son muy importantes en la construcción de algoritmos, procedimientos de cálculo y de la elaboración de programas computacionales, y que constituyen las bases que deben tenerse siempre presentes para el desarrollo de software en el cálculo cientí…co.
1.2.
Cálculo numérico. Algoritmos
Suponemos que un problema (P ) ha sido planteado y que requiere de su resolución. Tres situaciones se presentan: la primera en la que la solución del problema (P ) podemos encontrarlo directamente y no se requiere del cálculo numérico. La segunda en la que la solución del problema (P ) podemos encontrarlo directamente y se requiere de la implementación de un procedimiento de cálculo para aproximar la solución encontrada. La tercera en la que no es posible encontrar directamente la solución y se requiere de un método numérico para aproximar la solución. Son estas dos últimas situaciones que nos interesan. Más aún, en la resolución numérica de un problema matemático (P ) se establece la siguiente metodología. 1. Estudio de la existencia de solución del problema (P ): 2. Construcción de un método numérico que aproxime la solución del problema (P ): 3. Elaboración del respectivo algoritmo o procedimiento de cálculo. 4. Elaboración de un programa o código numérico para el cálculo de la solución aproximada de (P ): 5. Realización de pruebas para validar el algoritmo o procedimiento de cálculo y el programa computacional. Desde el punto de vista práctico, esto es, problemas que surgen en las ciencias y en la industria, la metodología presentada se extiende con la calibración de la solución y luego viene la implementación de la solución. En este curso daremos énfasis fundamentalmente a los puntos 1), 2), 3) y 5) de la metodología precedente. El punto 4) no lo abordaremos y dejamos al estudiante que elija el lenguaje de programación que le interese para la elaboración de sus propios programas computacionales con los que debe realizar pruebas para veri…car resultados mediante la implementación del algoritmo así como veri…car la correcta elaboración del programa computacional; o en su defecto, seleccione el paquete de programas de tipo comercial (Matlab, Matemática, etc.) en el que provea la solución del problema planteado con el algoritmo propuesto. Es un error gravísimo el modi…car el problema planteado (P ) a uno (Pb) cuya solución está implementado en el paquete de programas computacionales. Por otro lado, es también importante el uso de ciertas herramientas informáticas que ayuden a presentar de mejor manera los resultados y permita comprender mejor las soluciones, por ejemplo gra…cadores para presentar grá…cas de curvas 2d, 3d, super…cies, ‡ujos, generación de mallas estructuradas y no estructuradas, etc. El estudio de la existencia de una solución o soluciones del problema (P ) es muy importante. Pués en él se deben conocer con precisión las hipótesis con las cuales nuestro problema tiene solución, y bajo que condiciones el problema (P ) puede no tener solución. En muchos casos, en el estudio de existencia de soluciones se construye el método que conduce a encontrar la solución de (P ): Si el problema no tiene solución, carece de sentido el intentar elaborar un método numérico de solución. Debido a que los cálculos que se realizan son con números que tienen un número …nito de cifras decimales, estos afectan los resultados, por lo que el control de los errores en los cálculos es fundamental, es decir, debemos conocer la precisión con la que obtenemos la solución numérica del problema (P ). Este es uno
1.2. CÁLCULO NUMÉRICO. ALGORITMOS
3
de los problemas centrales del análisis numérico y que están ligados con las nociones de consistencia y la estabilidad numérica. En el caso en que la solución de (P ) se calcula como límite de una sucesión de soluciones de problemas (P n) más sencillos a resolver, otro de los problemas centrales del análisis numérico es probar o demostrar que las soluciones de esos problemas más sencillos converge a la solución del problema (P ), es decir se debe probar la convergencia del método numérico propuesto. La consistencia, estabilidad y convergencia se discutirán más adelante. Tanto en el estudio de existencia de soluciones como en la elaboración del método numérico se identi…can los datos que se requieren para resolver el problema. Una parte de estos datos los conocemos como datos de entrada. Una vez establecido el método numérico, se pasa enseguida a la elaboración o construcción del algoritmo. En la de…nición siguiente se establece la noción de algoritmo en su versión la más simple De…nición 1 Se llama algoritmo a una sucesión …nita de operaciones elementales, que organizada como pasos o procedimientos, se describen en forma lógica como calcular la solución de un problema (P ) de modo e…caz con datos de entrada dados. Un algoritmo contiene los siguientes elementos: 1. Datos de entrada: que consisten en valores o datos de partida, los cuales son asignados antes de arrancar la ejecución del algoritmo. Estos datos permiten inicializar el algoritmo para su ejecución. Es necesario veri…car la lectura correcta de todos los datos de entrada. Los datos de entrada dependen obviamente del problema propuesto. Estos pueden ser datos que pertenecen a distintos conjuntos numéricos (enteros, reales, complejos), pueden ser funciones reales como las trigonométricas (seno, coseno, tangente y sus inversas), las funciones exponencial, logarítmica, las funciones hiperbólicas, polinomios, etc, pueden ser datos vectoriales como son los elementos de Rn ; pueden ser matrices, etc. 2. Algoritmo o procedimiento: constituye la secuencia de todos los pasos o procedimientos de cálculo que se deben ejecutar. Estos deben ser claros, precisos, lógicos. No se deben tener ambigüedades en la descripción de esos pasos o procedimientos. Debe considerarse todas las situaciones posibles que se presenten. La ejecución del algoritmo o procedimiento concluye siempre con un número …nito de pasos. 3. Datos de salida: son una o más cantidades que tiene una relación estrecha con los datos de entrada. Estos resultados están de…nidos de manera única por los pasos del procedimiento o algoritmo. La escritura de un algoritmo contiene los datos de entrada, los datos de salida, y a continuación el procedimiento o la descripción del método a utilizar que constituye el algoritmo propiamente dicho que generalmente se lo expresa en pseodocódigo de modo que facilite la escritura de un programa computacional en cualquier lenguaje de programación. Más adelante se proponen muchos algoritmos que permiten aclarar todas estas ideas. En el siguiente esquema se muestra la secuencia de estos tres bloques:
Lectura de datos de entrada
!
Ejecución del Algoritmo o procedimiento
!
Escritura de resultados : o datos de salida
En la práctica estos tres bloques no son su…cientes para escribir un programa computacional. Un análisis más detallado de estos tres bloques proponemos en el diagrama siguiente:
4
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
Lectura de datos de entrada
!
!
Ejecución del algoritmo
Validación de datos de entrada
!
!
Preparación de datos de entrada
Preparación de datos de salida
!
!
Escritura : de resultados
En lo posible se busca construir algoritmos que tengan las características siguientes: 1. Aplicabilidad general: el algoritmo debe funcionar para una clase de problemas lo más amplia posible, donde las soluciones de un problema especí…co de la clase resulten solamente por cambios en los datos de entrada. 2. Simplicidad: Un algoritmo o procedimiento tiene que ser, en lo posible, simple de programar. 3. Con…abilidad y seguridad: el algoritmo no debe ser numéricamente costoso. En lo posible, se debe reducir el número de operaciones elementales a ejecutar. Esto evita que se ampli…quen los errores de redondeo, dando resultados más precisos, y por otro lado, reducen los tiempos de máquina. Se debe reducir, en lo posible, el número de variables a utilizar. Igualmente, se debe reducir en lo posible el número de subrutinas o bucles a utilizar, así como la repetición de ciertos cálculos. Se deben efectuar tests o pruebas con datos de entrada los más variados a …n de asegurarse que el algoritmo está correctamente elaborado y que los resultados son correctos o muy aceptables. Se buscará, en lo posible, ejemplos que se conozcan las soluciones exactas para compararse con las soluciones numéricas. En el estudio de un método numérico y consecuentemente de un algoritmo es importante, siempre que sea posible, determinar el número de operaciones elementales que se realizan para obtener la solución numérica del problema, el número de comparaciones, son menos importantes las reasignaciones . Entenderemos como operaciones elementales a las operaciones aritméticas como la suma, resta, multiplicación, división, raíz n-ésima. Las comparaciones están vinculadas con las relaciones de orden menor que ; menor o igual que ; mayor o igual que . Prestaremos mayor atención a la determinación del número de operaciones elementales que se requieren para calcular la solución numérica mediante un método o procedimiento está relacionado con la complejidad del algoritmo que análizamos a continuación. Complejidad de algoritmos. Si para un problema (P ) se conocen varios métodos y por lo tanto se pueden proporcionar varios algoritmos, es importante analizar la denominada complejidad del algoritmo. Esta tiene que ver con dos componentes importantes: uno del punto de vista volumen de memoria necesario del instrumento o equipo utilizado para el cálculo, y otro del punto de vista tiempo de máquina que a su vez está relacionado con el número de operaciones elementales (siempre que haya sido posible obtener) que se requieren para calcular la solución. Si se disponen de dos métodos, ¿cómo juzgar que método es mejor? ¿bajo que circunstancias un método es mejor que otro?. Para poder dar respuesta a estas interrograntes debemos estudiar la complejidad de cada algoritmo, esto es, determinar cuánto de memoria se requiere en la ejecución de cada método, el tiempo de máquina requerido para el cálculo de la solución con cada método. Cuando un problema (P ) puede ser resuelto mediante dos métodos generados por sucesiones de (1) (2) problemas más simples que los notamos (Pn ) y (Pn ); el estudio de la convergencia de cada método es importante, esto nos proporcionará un dato que está relacionado con el orden de convergencia, ¿cuál método es mejor?. Para responder a esta interrogante, debemos considerar otro elemento que es la exactitud de la solución numérica que a su vez está relacionada con el orden de convergencia. Desde este punto de vista, el método generado que tenga un orden de convergencia más alto será mejor que el otro, lo que da respuesta a la interrogante.
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
1.3.
5
Ejemplos de algoritmos y problemas
La metodología arriba propuesta la aplicaremos a algunos ejemplos que proponemos a continuación. Más aún, esta sección está dividida en dos partes: la primera en la que presentamos ejemplos simples de operaciones elementales con vectores y matrices, y luego dos aplicaciones del producto escalar en R2 , y la segunda que está destinada a problemas del análisis matemático como cálculo de valores de funciones polinomiales, funciones con discontinuidad evitable, derivación e integración numérica.
1.3.1.
Operaciones elementales con vectores y matrices. Aplicaciones
1. Suma de vectores y producto de escalares por vectores de Rn : Sean 2 R; ! x = (x1 ; : : : ; xn ) ; ! y = (y1 ; : : : ; yn ) 2 Rn : La suma de ! x con ! y se nota ! x +! y y se de…ne como ! x +! y = (x1 ; : : : ; xn ) + (y1 ; : : : ; yn ) = (x1 + y1 ; : : : ; xn + yn ) : El producto del escalar con el vector ! x se nota ! x de…nido como ! x =
(x1 ; : : : ; xn ) = ( x1 ; : : : ; xn ) :
Ponemos ! z =! x +! y y! w = ! x : A continuación presentamos un algoritmo en el que se calcula ! ! ! ! ! z = x + y y w = x: Algoritmo Datos de entrada: n 2 Z+ ; ! x = (x1 ; : : : ; xn ) ; ! y = (y1 ; : : : ; yn ) : Datos de salida: ! z; ! w: 1. i = 1; : : : ; n zi = xi + yi wi = xi Fin bucle i. 2. Imprimir ! z; ! w: 3. Fin. Note que los datos son la talla n de los vectores ! x e! y así como sus coordenadas. Observe que las operaciones elementales que intervienen en el cálculo de ! z son adiciones y en el cálculo de ! w son productos. Se realizan 2n operaciones elementales, y, el proceso de cálculo concluye en exactamente n pasos. No contabilizamos la presentación de resultados y el …n. La notación i = 1; : : : ; n signi…ca que para i = 1 se realizan los cálculos de z1 = x1 + y1 y de w1 = x1 ; a continuación k = 2 y se realizan los cálculos z2 = x2 + y2 y de w2 = x2 : Se continua con este proceso hasta k = n con lo que se hacen los cálculos zn = xn + yn y de wn = xn : 2. Producto escalar en Rn : ! ! Sean x = (x1 ; :::; xn ); y = (y1 ; :::; yn ) dos vectores de Rn . El producto escalar de ! x con ! y se nota ! ! ! ! ! ! T con x y o también x y (cuando los vectores x e y se escriben como vectores columna) y se de…ne como sigue: n X ! ! ! T ! x y = x y = xi yi : i=1
En el apéndice se resumen algunos resultados de los espacios vectoriales con producto interior.
Para el cálculo de este producto escalar se requiere de la siguiente información: n 2 Z+ y de los componentes o coordenadas de los vectores ! x; ! y , con lo que el producto escalar que se le denota con p puede calcularse usando el algoritmo que se propone a continuación. Algoritmo Datos de entrada: n 2 Z+ ; ~x = (x1 ;
; xn ); ~y = (y1 ;
; yn ):
6
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Datos de salida: p 1. p = 0: 2. k = 1; : : : ; n p = p + xk
yk :
Fin bucle k. 3. Imprimir resultdo p: 4. Fin. Para n = 4, ! x = (1; 0; 1; 2) ; ! y = (5; 2; 2; 3), la aplicación del algoritmo da como resultado p = 1. Observe que las operaciones elementales que intervienen en el cálculo de p son adiciones y productos, se realizan 2n operaciones elementales, y, el proceso de cálculo de p concluye en exactamente n pasos. La notación k = 1; : : : ; n signi…ca que para k = 1 se realiza el cálculo de p + x1 y1 que se asigna a p; a continuación k = 2 y se realiza el cálculo p + x2 y2 cuyo resultado se asigna nuevamente a p: Se continua con este proceso hasta k = n con lo que se hace el cálculo p + xn yn que se asigna a p: La escritura p = p + xk yk no es una ecuación, en realidad se trata de una asignación del resultado p + xk yk a la variable p: Este tipo de notación será utilizada únicamente en la escritura de los algoritmos. 3. Norma euclídea en Rn : !
Sea x = (x1 ;
; xn ) 2 Rn . La norma euclídea en Rn se nota con k k2 y se de…ne como: k! x k2 =
n X i=1
x2i
!1=2
:
En el apéndice se resumen algunos resultados de los espacios normados. !
Para el cálculo de k x k2 se requiere de la siguiente información: n 2 Z+ , las coordenadas xi , ! i = 1; : : : ; n, del vector ! x . El siguiente algoritmo permite calcular k x k2 que se le nota con Nx : Algoritmo !
Datos de entrada: n 2 Z+ ; x = (x1 ;
; xn ).
Datos de salida: Nx 1. Nx = 0: 2. i = 1; : : : ; n Nx = Nx + xi xi Fin bucle i: p 3. Nx = Nx : 4. Imprimir resultado Nx : 5. Fin. p p La escritura Nx = Nx , en realidad signi…ca que el cálculo de Nx se asigna a Nx : Esta notación se utilizará únicamente en la escritura de algoritmos. p Sean n = 4; ! x = 3; 2; 3; 3 . La aplicación del algoritmo precedente da como resultado Nx = 5.
Las operaciones elementales que intervienen en el cálculo de Nx son adiciones, productos y una raíz cuadrada, en un total de 2n + 1 operaciones elementales. El proceso de cálculo de Nx concluye luego de n + 1 pasos.
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS 4. Suma de matrices reales de m
7
n:
Se nota con Mm n [R] el espacio vectorial de matrices de m n con valores en R. En algunos libros este espacio vectorial se nota como Rmn . A una matriz A 2 Mm n [R] se le nota A = (aij )m n y si m = n; es decir A es una matriz cuadrada, se escribirá A = (aij ) : Sea A = (aij )m
n;
B = (bij )m
A + B = (aij )m
n
n:
La suma de las matrices A y B está de…nida como
+ (bij )m
n
= (aij + bij )m
A esta matriz suma lo denotamos con C = (cij )m las matrices A y B se muestra a continuación.
n;
n
2
6 =4
a11 + b11
a1n + b1n .. .
am1 + bm1
amn + bmn
3 7 5
esto es, C = A + B: El algoritmo para sumar
Algoritmo Datos de entrada: m; n 2 Z+ ; A = (aij )m Datos de salida: C = (cij )m
n;
B = (bij )m
n:
n:
1. i = 1; : : : ; m j = 1; : : : ; n cij = aij + bij Fin bucle j: Fin bucle i: 2. Imprimr C = (cij )m
n:
3. Fin. El cálculo de la matriz C requiere de m n adiciones. Note que el índice i es utilizado para indicar las …las, el índice j es utilizado para indicar las columnas. El algoritmo muestra que la matriz C se construye …la a …la, esto es, primera …la, a continuación segunda …la, así sucesivamente. Se deja como ejercicio elaborar un algoritmo de cálculo de C por columnas. 5. Producto de matrices. Sean A = (aij )m n ; B = (bjk )n p matrices reales. El producto de la matriz A con B se nota AB y es la matriz C = (cik )m p de…nida como sigue: Cik =
n X
aij bjk = ai1 b1k +
+ ain bnk , i = 1; : : : ; m;
k = 1; : : : ; p:
j=1
Como se puede apreciar, el elemento cik es el resultado de las sumas de los productos de los elementos de la …la i de la matriz A con los correspondientes de la columna k de la matriz B: Un algoritmo para calcular C = AB se muestra a continuación. Algoritmo 1. i = 1; : : : ; m k = 1; : : : ; p s = 0: j = 1; : : : ; n s = s + aij Fin bucle j: cik = s Fin bucle k: Fin bucle i:
bjk
8
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 2. Imprimir C = (cik )m
p:
3. Fin. Este algoritmo concluye en un número …nito de pasos, exactamente en m p (n + 2) pasos. Las operaciones elementales que se realizan son sumas y productos. Adicionalmente se hacen 2m p asignaciones. Note que la escritura s = s + aij bjk no es una ecuación, se trata de una asignación pués el producto aij bjk se suma a s y este resultado se almacena en s. 6. Intercambio de dos …las de una matriz. Sea A = (aij )m n 2 Mm n [R] : La matriz B = (bij )m n obtenida al intercambiar la …la i con la …la j con i < j se de…ne como B = Ei!j A; donde Ei!j = (epq )m m se obtiene de la matriz identidad I = (Ili )m m al intercambiar la …la i con la …la j; por lo tanto Ei!j = (epq )m m está de…nida como sigue: 0; si k 6= j 0; si k 6= j eik = ejk = k = 1; : : : ; m; 1; si k = j; 1; si k = i; y para p = 1; : : : ; m con p 6= i; j;
epk =
0; 1;
si p 6= k; si p = k
k = 1; : : : ; m:
Un algoritmo que realiza el producto Ei!j A se muestra a continuación. Algoritmo Datos de entrada; m; n 2 Z+ ; i; j 2 Z+ ; A = (aij )m
Datos de salida: B = (bpr )m
n:
n:
1. Si m = 1 continuar en 5). 2. p = 1; : : : ; m si p 6= i y p 6= j r = 1; : : : ; n bpr = apr Fin bucle r: Fin bucle p: 3. r = 1; : : : ; n c = air bir = ajr bjr = c Fin bucle r: 4. Imprimir B = (bpr )m 5. Imprimir mensaje: m
n:
Continuar en 6).
2:
6. Fin. La ejecución de este algoritmo implica la realización de asignaciones y de comparaciones, así el número de comparaciones es 2m+1 y el número de asignaciones n (m + 1) : Obviamente el algoritmo concluye en un número …nito de pasos. Note que se requiere de la siguiente información: talla de la matriz A, esto es, los enteros positivos m; n, los m n coe…cientes aij de A; la …la i, la …la j. Esta última información implica que m 2: Si m = 1 no se realiza intercambio de …las. 7. Producto de una matriz por un vector. Sean A = (aij )m n 2 Mm n [R] ; ! x = (x1 ; 2 Pn 3 a x 1j j j=1 6 7 .. A! x =4 5: Pn . j=1 amj xj
!
; xn ) 2 Rn . El producto A x se de…ne como sigue:
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
9
Para elaborar un algoritmo de cálculo del producto de la matriz A por el vector ! x , esto es, A! x + se requiere de la siguiente información: talla de la matriz A, o sea m; n 2 Z , de sus componentes aij ; i = 1; : : : ; m; j = 1; : : : ; n, y de los componentes o coordenadas xi ; i = 1; : : : ; n del vector ! x . Con esta información el producto A! x puede calcularse con el algoritmo que se propone a continuación. Algoritmo Datos de entrada: m; n 2 Z+ ; A = (aij )m
! x = (x1;
n;
; xn ):
Datos de salida: ~z = A~x: 1. c = 0: 2. i = 1; : : : ; m j = 1; : : : ; n c = c + aij
xj
Fin bucle j: zi = c c = 0: Fin bucle i: 3. Imprimir resultado ! z = (z1 ;
; zm ):
4. Fin. Note que el algoritmo concluye luego de m
n pasos en los que intervienen productos y adiciones.
8. Vectores colineales. Angulo entre vectores y base ortogonal de R2 : Sean ! u 1 = (a1 ; b1 ) ; ! u 2 = (a2 ; b2 ) dos elementos no nulos de R2 : Se considera el siguiente problema: determinar si los vectores ! u 1; ! u 2 no son colineales, en tal caso calcular el ángulo que forman dichos vectores y construir una base ortogonal. Elaborar un algoritmo numérico. Analicemos la existencia de soluciones. Consideramos en el plano el sistema de coordenadas rectangulares y sean ! u 1 = (a1 ; b1 ) ; ! u2 = ! ! (a2 ; b2 ) dos vectores no nulos. Se sabe que u 1 y u 2 son colineales si y solo si sus coordenadas satisfacen la relación a1 b2 a2 b1 = 0: Por lo tanto, ! u1 y ! u 2 no son colineales si y solo si d = a1 b2 a2 b1 6= 0: El producto escalar de los vectores ! u 1; ! u 2 se nota con ! u1 ! u 2 y está de…nido como ! u1 ! u2 = ! ! 2 a a + b b : La longitud o norma de un vector u = (a; b) 2 R se nota k u k y se de…ne como 1 2
1 2
1 k! u k = (! u ! u )2 =
p
a2 + b2 :
Además, la medida del ángulo que forman los vectores ! u 1; ! u 2 es el número real como ! u1 ! u2 cos ( ) = ! k u 1 k k! u 2k y de esta relación = arc cos
! u1 ! u2 ! k u k k! u k 1
2 [0; ] de…nido
:
2
Recordemos que dos vectores ! u; ! v de R2 son ortogonales o perpendiculares si y solo si ! u ! v = 0: ! ! En tal caso escribimos u ? v : En la …gura de la izquierda se muestran los vectores no nulos y no colineales ! u 1; ! u 2 y el ángulo que forman dichos vectores. En la …gura de la derecha se muestran los vectores ! u ; ! u ; la 1
2
10
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES proyección ortogonal de ! u 2 sobre ! u 1 y el vector ! c ortogonal a ! u 1 ; esto es c ? ! u 1:
Figura 1
Figura 2
Ponemos ! v1=! u 1 : Para construir una base ortogonal f! v 1; ! v 2 g consideramos las dos condiciones siguientes: ! u1+! c =! u 2; hallar 2 R y ! c 2 R2 tales que ! ! u1 ? c : ! Calculemos : Multiplicando escalarmente por u la primera igualdad, se tiene 1
( ! u1+! c) ! u1 =! u2 ! u1 y como el producto escalar es distributivo respecto de la adición de vectores, resulta ! u1 ! u1+! c ! u1 =! u2 ! u 1: Tomando en consideración que ! u1 ?! c que a su vez es equivalente a ! u1 ! c = 0; se sigue que ! u1 ! u1 =! u2 ! u 1: 2 Puesto que k! u 1k = ! u1 ! u 1 y como el producto escalar es conmutativo, esto es, ! u2 ! u1 =! u1 ! u2 ! ! u1 u2 resulta = ! 2 : El número real se llama coe…ciente de Fourier. ku k 1
Una vez calculado ! c :
pasamos a determinar el vector ! c : De la igualdad ! u1+! c =! u 2 se obtiene ! c =! u2
! u1 =! u2
! u1 ! u 2! 2 u 1: k! u k 1
De…nimos ! v2 =! c : Así ! v1 ?! v 2 : En la …gura siguiente se muestran los vectores ! v 1; ! v 2 tales ! ! que v ? v : 1
2
Figura 3 Con todos estos elementos estamos en condiciones de elaborar un algoritmo numérico que permita identi…car si dos vectores no nulos son o no colineales. En caso de no ser colineales, calcular el ángulo que forman y obtener una base ortogonal f! v 1; ! v 2g : Algoritmo
Datos de entrada: ! u 1 = (a1 ; b1 ) ; ! u 2 = (a2 ; b2 )
Datos de salida: Mensaje “vectores colineales”, ; ! v 1; ! v 2:
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
11
1. Veri…car a1 6= 0 o b1 6= 0; y, a2 6= 0 o b2 6= 0: Caso contrario ! u 1; ! u 2 son nulos. Continuar en 10) 2. Calcular d = a1 b2
a2 b1 :
3. Si d = 0; continuar en 9). 4. Calcular p = a1 a2 + b1 b2 ; n1 = a21 + b21 n2 = a22 + b22
1 2 1 2
; ;
p n1 n2
= arc cos
:
5. Poner ! v 1 = (a1 ; b1 ) : p 6. Calcular = 2 ; n1 x = a2
a1 ;
y = b2
b1 :
7. Poner ! v 2 = (x; y) : 8. Imprimir: ángulo ; vectores ortogonales ! v 1; ! v 2 : Continuar en 11). 9. Imprimir: ! u 1; ! u 2 vectores colineales. Continuar en 11). 10. Imprimir: ! u ; ! u vectores nulos. 1
2
11. Fin. El número total de operaciones elementales que se realizan en la ejecución de este algoritmo son 22 operaciones, comparaciones 5, asignaciones 4, una evaluación de la función arco coseno. Note que el punto 4) del algoritmo se ejecuta cuando d 6= 0: p Veri…quemos el algoritmo con los siguientes datos ! u = (3; 1) ; ! u = 2; 5 : 1
2
p Claramente los vectores ! u 1; ! u 2 son no nulos. Pasemos a calcular d. Tenemos d = 3 5 ( 2) 1 = p 2 + 3 5 y d 6= 0 con lo que se continua con el cálculo de p; n1 ; n2 y : Tenemos p = 3 n1 =
( 2) + 1 2
3 +1
= arc cos
2
1 2
=
p
5=
6+
p
p
5; 2
p
2
1 2
10; n2 = ( 2) + 5 = 3; ! p 6+ 5 3;763932023 p ' arc cos ' 1;978773429: 9;48683298 3 10
Ponemos ! v 1 = (3; 1) : Calculemos el coe…ciente de Fourier ; y, x e y : p p 6+ 5 = = ' 0;3763932023; 10 n21 x = a2 a1 ' 2 ( 0;3763932023) p y = b2 b1 ' 5 ( 0;3763932023)
3=
0;870820393;
1 = 2;61246118:
El vector ! v 2 está de…nido como ! v 2 = ( 0;870820393; 2;61246118) : El símbolo ' se utiliza para indicar un valor aproximado.
12
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES En la …gura siguiente se muestran los vectores ! u 1; ! u 2 y los vectores ortogonales ! v 1; ! v 2:
Figura 4
9. En este ejemplo se trata el método de eliminación gaussiana para sistemas de ecuaciones lineales de 3 3: Comencemos observando que los sistemas de tres ecuaciones con tres incógitas más simples de resolver son los sistemas de ecuaciones denominados diagonales, los denominados triangulares superiores y triangulares inferiores que en ese orden se presentan a continuación: 8 8 8 = d1 = d1 < a1 x < a1 x + b1 y + c1 z = d1 < a1 x a2 x + b2 y = d2 b2 y + c2 z = d2 ; b2 y = d2 ; : : : a3 x + b3 y + c3 z = d3 ; c3 z = d3 c3 z = d3
donde ai ; bi ; ci 2 R para i = 1; 2; 3; no todos nulos, di 2 R para i = 1; 2; 3; donde x; y; z 2 R son las incógnitas del sistema que queremos resolver. Los números reales a1 ; b2 ; c3 que …guran en la diagonal de cada uno de los sistemas precedentes se los denomina elementos o coe…cientes de la diagonal del sistema de ecuaciones lineales.
En el caso de un sistema de ecuaciones lineales diagonal, la solución es única si y solo si los coe…cientes de la diagonal del sistema son no nulos, es decir a1 6= 0; b2 6= 0; c3 6= 0 en cuyo caso la d1 d2 d3 d1 d2 d3 solución es x = ; y = ; z = que lo expresamos como ; ; : a1 b2 c3 a1 b2 c3 Los sistemas de ecuaciones lineales triangulares superiores e inferiores tienen una única solución si y solo si los elementos de la diagonal del sistema son no nulos, esto es, a1 6= 0; b2 6= 0; c3 6= 0: Ejemplos
1. El sistema de ecuaciones lineales diagonal de…nido como (x; y; z) 2
R3
tal que
8 < 2x :
= 11 3y =0 5z = 5;
0 5 11 11 ;y= = 0; z = = 1, que lo escribimos ( ; 0; 1): 2 5 5 2 2. Considerar el sistema de ecuaciones lineales de…nido como sigue: (x; y; z) 2 R3 tal que 8 < x + 2y + 3z = 11 y 2z = 0 Este es un sistema de ecuaciones lineales triangular superior. Para hallar : 5z = 5: la solución de este sistema, comenzamos por la última ecuación, de la que obtenemos la incógnita z : z = 55 = 1: De la segunda ecuación, se obtiene la incógnita y : y = 2z = 2 ( 1) = 2; y de la primera ecuación, obtenemos x : x = 11 2y 3z = 11 2 2 3 ( 1) = 10: La solución es x = 10; y = 2; z = 1 que escribimos ( 10; 2; 1): 8 =4 < 2x 3 3x + 4y = 18 3. Considerar el sistema de ecuaciones lineales de…nido por (x; y; z) 2 R tal que : 3x + 4y + z = 11: Este es un sistema de ecuaciones lineales triangular inferior, cuya solución encontramos resolviendo de la primera a la tercera ecuación. De la primera ecuación obtenemos x = 42 = 2: De la segunda ecuación: y = 14 (18 3x) = 41 (18 3 2) = 3; y de la tercera ecuación: z = 11 + 3x 4y = 11 + 3 2 4 3 = 5: Así, x = 2; y = 3; z = 5 es la solución que la escribimos (2; 3; 5): tiene como solución x =
Pasemos a describir el método de eliminación gaussiana (será tratado con mayor profundidad en el capítulo 6). Para el efecto explicamos mediante tres ejemplos. La idea fundamental en el método
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
13
de eliminación gaussiana es transformar el sistema de ecuaciones lineales dado en un sistema de ecuaciones lineales triangular superior, que como hemos visto, esta clase de sistemas son los más simples de resolver. Ejemplos
8 <
x + 2y + 3z = 7 2x y 2z = 0 : 3x 2y + 5z = 25: El procedimiento de la eliminación gaussiana lo dividimos en tres etapas. Las dos primeras que conducen a transformar el sistema de ecuaciones en uno triangular superior; y, la tercera etapa que consiste en resolver el sistema de ecuaciones triangular superior. 1. Resolver el sistema de ecuaciones lineales siguiente: (x; y; z) 2 R3 tal que
a) Primera etapa. Mantenemos …ja la primera ecuación. Se trata de eliminar la incógnita x de la segunda y tercera ecuaciones. Eliminemos x de la segunda ecuación. Para el efecto multiplicamos por k = 2 (k se obtiene como el coe…ciente de x de la segunda ecuación, dividido para el coe…ciente de x de la primera ecuación cambiado de signo) a la primera ecuación y le sumamos el resultado a la segunda ecuación. 8 < x + 2y + 3z = 7 5y 8z = 14 Eliminemos x de la tercera ecuación. Para ello multiplicamos Obtenemos : 3x 2y + 5z = 25: por k = 3 (k se obtiene como el coe…ciente de x de la tercera ecuación, dividido para el coe…ciente de x de la primera ecuación8 cambiado de signo) a la primera ecuación y le sumamos el resultado a < x + 2y + 3z = 7 5y 8z = 14 la tercera ecuación, resulta : 8y 4z = 4:
b) Segunda etapa. Mantenemos …ja la primera y segunda ecuaciones y eliminamos y en la tercera 8 ecuación. Multipliquemos por k1 = = 85 a la segunda ecuación y el resultado le sumamos a 5 8 > x + 2y + 3z = 7 > > > < 5y 8z = 14 la tercera. k1 se obtiene como > > 132 44 > > z= : : 5 5 Note que k1 se obtiene como el cociente cambiado de signo del coe…ciente de y de la tercera ecuación dividido para el coe…ciente de y de la segunda ecuación, siempre que este no sea nulo.
c) Tercera etapa: Resolvemos el sistema de ecuaciones triangular superior. Comenzamos con la 14 8z terera ecuación, obtenemos z: z = 132 = 44 = 3: De la segunda ecuacion obtenemos y: y = 5 14 8 3 = 2; y de la primera ecuación obtenemos x = 7 2y 3z = 7 2 ( 2) 3 3 = 2: La 5 solución es x = 2; y = 2; z = 3, que escibimos (2; 2; 3): 3 2. 8 Considerar el sistema de ecuaciones lineales siguiente: (x; y; z) 2 R tal que = 2 < 2x + y 3x + 4y + z = 2 Apliquemos el método de eliminación gaussiana. Mantengamos …ja a la : 3x + 4y + z = 4: primera ecuación, y procedamos a la eliminación de la incógnita x en la segunda y tercera ecua3 ciones. Multipliquemos a la primera ecuación por k = (coe…ciente de x de la segunda ecuación, 2 dividido para el coe…ciente8de x de la primera ecuación cambiado de signo), el resultado sumamos > 2x + y = 2 > > > < 5 y+z =1 a la segunda. Obtenemos 2 > > > > : 3x + 4y + z = 4:
3 3 = (k1 se obtiene dividiendo el coe…ciente de x de la tercera ecuación para el 2 2 coe…ciente de x de la primera ecuación, cambiado de signo). Multiplicando a la primera ecuación Sea k1 =
14
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 8 > 2x + y > > > < 5
=
2
y + z = 1 Para obtener 2 11 y + z = 1: 2 un sistema de ecuaciones triangular superior, mantenemos …jas la primera y segunda ecuaciones del sistema precedente, eliminemos la incógnita y de la tercera ecuación. 11 2 = 11 (k se obtiene dividiendo el coe…ciente de y de la tercera ecuación para el Sea k2 = 2 5 5 2 coe…ciente de y de la segunda ecuación, cambiado de signo): Multiplicamos a la segunda ecuación 8 > 2x + y = 2 > > > > 5 < y+z =1 por k2 ; el resultado sumamos a la tercera, resulta con lo que hemos obtenido 2 > > > 6 6 > > z= ; : 5 5 un sistema de ecuaciones triangular superior. Determinemos su solución. De la tercera ecuación, obtenemos z = 1: De la segunda ecuación, se obtiene y : y = 25 (1 z) = 25 (1 1) = 0: De la primera ecuación se deduce x: x = 12 ( 2 y) = 12 ( 2 0) = 1: La solución del sistema de ecuaciones lineales propuesto es ( 1; 0; 1): por k1 ; el resultado sumamos a la tercera ecuación. Tenemos
> > > > :
3. Hallar8la solución si existe, del sistema de ecuaciones lineales que se propone: (x; y; z) 2 R3 > y+z = 2 > > < tal que 2x + y z = 6 Para obtener (siempre que sea posible) un sistema triangular > > > : 5x + y + 6z = 10: superior, la primera acción que debemos realizar es intercambiar las ecuaciones del modo siguiente: 8 < 5x + y + 6z = 10 2x + y z = 6 Mantengamos …ja la primera ecuación de este último sistema de ecuaciones : y+z = 2 lineales. Eliminemos x de la segunda ecuación. Para ello multiplicamos 8la primera ecuación > 5x + y + 6z = 10 > > < 2 2 7 7 = y el resultado sumamos a la segunda. Obtenemos por k = y + z = 10 > 5 5 5 5 > > : y + z = 2: Manteniendo …jas las dos primeras ecuaciones, eliminemos y de la tercera ecuación. Multipliquemos 8 > 5x + y + 6z = 10 > > > > 7 7 < 1 5 y + z = 10 que por k1 = = a la segunda ecuación y sumemos con la tercera: 5 5 7 > 7 > > 64 > > 5 ; 0= : 7 muestra que la tercera igualdad es contradictoria, es decir que el sistema de ecuaciones propuesto no tiene solución.
1.3.2.
Cálculo con funciones
Un polinomio P de grado
n con coe…cientes reales lo denotamos como sigue: P (x) = a0 + a1 x +
+ an xn =
n X
ak xk
k=0
donde ak 2 R
con k = 0; 1;
; n son los coe…cientes y an 6= 0.
x 2 R,
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
15
En orden de complejidad, los más simples son los polinomios constantes P (x) = c x 2 R, con c 2 R …jo. A continuación, los polinomios de grado 1 tienen la forma P (x) = a + bx; con a; b; x 2 R, a; b …jos y b 6= 0: Los polinomios de grado 2 se escriben como P (x) = a + bx + cx2 con a; b; c; x 2 R, a; b; c …jos y c 6= 0: Los polinomios de grado tres se escriben como P (x) = a + bx + cx2 + dx3 con a; b; c; d; x 2 R, a; b; c; d …jos y d 6= 0: Los polinomios son las funciones reales más simples de calcularse en un asignado dato x 2 R. Es claro que los más simples son los polinomios constantes y de grado 1, y realizar cálculos con esta clase de polinomios no presenta di…cultad alguna. Nos interesamos en los polinomios de grado 2 que presentan alguna di…cultad con los cálculos pués a medida que el grado del polinomio es más grande, el número de operaciones elementales se incrementa y los resultados pueden no ser su…cientemente exactos: 1. Esquema de Hörner. Con frecuencia requerimos realizar evaluaciones de polinomios de modo que el número total de operaciones elementales a realizar sea el más pequeño posible y que el resultado sea el más exacto posible. Por razones que veremos más adelante y que están relacionadas con el condicionamiento, debemos evitar el cálculo directo de las potencias de x; de los factoriales, sumas y restas alternadas. n X n Consideremos el polinomio P (x) = a0 + a1 x + + an x = ak xk x 2 R, donde ak 2 R con k=0
k = 0; 1; ; n son los coe…cientes y an 6= 0. Nos interesamos primeramente en el cálculo de P (x) en un asignado x 2 R, de modo que se evite el cálculo directo de las potencias de x y el número de operaciones elementales sea el más pequeño posible. Esto se logra si se escribe P (x) en la forma siguiente: P (x) = a0 + x a1 + .. .
+ an xn
1
= a0 + x(a1 + x(a2 + x(a3 +
+ x(an
1
+ xan )
))):
A esta forma de calcular P (x) se conoce con el nombre de esquema de Hörner. Utilizando esta escritura, podemos elaborar un algoritmo para calcular P (x) en un punto dado x 2 R. Note que el proceso de cálculo de P (x) inicia en el término del paréntesis interior an 1 + xan y continua sucesivamente al exterior, que hace el proceso de cálculo sea muy práctico en su aplicación. El número de operaciones elementales (sumas y productos) que se requiere para calcular P (x) es a lo más 2n: Note que si x 2 R, el cálculo de x2 = x x signi…ca una operación elemental, el cálculo 3 2 de x = x x signi…ca dos operaciones elementales, entonces para el cálculo del polinomio P (x) = a + bx + cx2 se requieren de 5 operaciones (sumas y productos), mientras que si se escribe en la forma P (x) = a + x(b + cx) se requieren únicamente de 4 operaciones (sumas y productos). Para el cálculo del polinomio P (x) = a + bx + cx2 + dx3 se requieren de 9 operaciones y con el esquema de Hörner se requieren de 6 operaciones y mejora la exactitud del resultado. Para elaborar un algoritmo que permita calcular P (x) requerimos de la siguiente información: grado del polinomio n 2 Z+ , coe…ecientes a0 ; a1 ; : : : ; an 2 R y del dato x 2 R. Con estos elementos proponemos el siguiente algoritmo que se conoce con el nombre de esquema de Hörner. Algoritmo Datos de entrada: n 2 Z+ ; a0 ; a1 ; : : : ; an ; x 2 R: Datos de salida: x, P (x): 1. b = an 2. k = 0; 1; : : : ; n j=n z = aj b=z
1
k 1
+ xb
16
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Fin bucle k: 3. Imprimir x; b = P (x) : 4. Fin. Note que el cálculo de P (x) concluye en un número …nito de pasos. Veri…quemos el algoritmo propuesto. Para el efecto, consideramos el siguiente polinomio que a su vez lo escribimos usando el esquema de Hörner: 0;25x2
P (x) = 0;5 + 0;3x
2;56x3 + 3x4 = 0;5 + x(0;3 + x( 0;25 + x( 2;56 + 3x))) x 2 R.
Calculemos P (x) en los puntos x = 0; 0;5 y
0;5: Utilizando la escritura de P (x); tenemos
P (0:) = 0;5 + 0:(0;3 + 0:( 0;25 + 0:( 2;56 + 3
0:))) = 0;5;
P (0;5) = 0;5 + 0;5(0;3 + 0;5( 0;25 + 0;5( 2;56 + 3 P ( 0;5) = 0;5
0;5(0;3
0;5( 0;25
0;5( 2;56
2. Consideremos la función E de R+ en R de…nida como E(x) =
n X k=0
donde a 2 R+ …jo.
0;5))) = 0;455;
3
0;5))) = 0;795:
xk (k + 1)(k + 2)(k + a)
x 2 R+ ;
Dado x 2 R, para calcular E (x), primeramente debemos expresar en forma explícita el sumatorio y luego escribirle en forma del esquema de Hörner como a continuación se muestra: E(x) =
1
1 2
a
+
x2 + 4 (2 + a)
x + 3 (1 + a) 3
2 xn + (n + 1)(n + 2)(n + a) 1 1 = +x +x 2a 2 3(1 + a) x + (n + 1)(n + 2)(n + a)
3
1 + 4(2 + a)
+x
+
xn 1 + n(n + 1)(n 1 + a)
1 n(n + 1)(n
1 + a)
+
:
Note que en la última igualdad se evitan los cálculos directos de las potencias xk ; k = 2; : : : ; n, lo que reduce el número de operaciones elementales, facilita la escritura de un algoritmo para su cálculo. 1 Ponemos ak = ; k = 0; 1; 2; :::; n. En el cálculo de ak intervienen 3 adiciones, (k + 1)(k + 2)(k + a) 3 productos y una división. Algoritmo Datos de entrada: n; a; x: Datos de salida: x; E(x): 1 1. y = : (n + 1)(n + 2)(n + a) 2. k = 1; :::; n j=n y=
k 1 + y x: (k + 1)(k + 2)(k + a)
Fin bucle k: 3. Imprimir resultado y = E (x) : 4. Fin. Observe que el cálculo de E (x) concluye en un número …nito de pasos.
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS 3. Para cada n 2 Z+ con n
17
3 impar, se considera la función 'n de…nida como sigue: k n X ( 1)k x 2 'n (x) = k!3k
x
0:
k=0
Se trata de calcular 'n (x) de modo que el número de operaciones elementales sea el más pequeño posible y elaborar un algoritmo de cálculo que permita calcular 'n (xk ) k = 0; 1; : : : ; m en puntos xk igualmente espaciados en el intervalo [0; 100] : Sigamos la metodología utilizada para resolver problemas. Primeramente debemos constatar que se tienen soluciones. En efecto, la función 'n está bien de…nida para todo x 0: Además, de la de…nición de 'n (x) se tiene 1
3
x2 x + 1! 3 2! 32
'n (x) = 1
x2 3!
33
+
( 1)n 1 (n 1)! 3n
+
1
+
( 1)n n x2 : n! 3n
Más adelante veremos que la resta de números positivos muy próximos entre sí es una operación peligrosa pués los errores de redondeo son ampli…cados, más aún, la realización de sumas y restas alternadas es muy peligrosa ya que los errores de redondeo provocan grandes errores en los datos de salida. Vemos que en el cálculo de 'n (x) debemos realizar este tipo de operaciones, además, se k deben calcular los factoriales k! k = 1; 2; : : : ; n; las potencias 3k ; x 2 : n 1 Puesto que n es impar, n 1 es par y en consecuencia p = es un entero positivo, asociamos 2 todos los términos positivos y todos los términos negativos. Cada grupo contiene exactamente p + 1 términos. Así " 1 # n 1 3 n x x2 x 2 x2 x2 'n (x) = 1 + + + + + + 2! 32 (n 1)! 3n 1 1! 3 3! 33 n! 3n p X
=
k=0 p X
=
k=0
p X
xk (2k)! 32k 1 x (2k)! 9
k=0
1
xk+ 2 (2k + 1)! 32k+1
p X p x 1 x 3 (2k + 1)! 9
k
k
x
0:
k=0
De…nimos 1 (x) =
p X k=0
En forma explícita, 1 (x) = 1 +
x 1 (2k)! 9
1 (x)
x
k
0;
2 (x) =
p X k=0
1 x (2k + 1)! 9
k
x
0:
se escribe como sigue:
+
x2
2! 9 4! 92 1x 1 x = 1+ 1+ 29 3 49
Procediendo en forma similar con 2 (x)
x
+
+ 1+
2 (x) ;
xp 1 [2 (p 1)]! 9p 1 + (2p 3) (2p
1
xp (2p)! 9p x 1+ 2) 9 (2p +
1 x 1) (2p) 9
:
obtenemos
1 1x 1 x2 1 xp 1 1 xp + + + + + 1! 3! 9 5! 92 (2p 1)! 9p 1 (2p + 1)! 9p 1x 1 x 1 x 1 x = 1+ 1+ 1+ + 1+ 3! 9 4 59 (2p 2) (2p 1) 9 (2p) (2p + 1) 9
=
Si ponemos y =
x ; 9
1 (x)
y 2 y 2 (x) = 1 + 6 1 (x)
= 1+
y 1+ 1+
2 (x)
se escriben como
y 3
4 6
4
:
5
1+
+
1+
+
(2p (2p
y 3) (2p 6 2) (2p
2) 1)
y 1) (2p) 6 1+ (2p) (2p + 1) 1+
(2p
; :
18
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES La escritura de 1 y 2 es una variante del esquema de Hörner que evita el cálculo directo de los factoriales k! k = 1; 2; : : : ; n; de las potencias xk y 3k : De esta manera reduce signi…cativamente el número de operaciones elementales y permite elaborar un algritmo numérico en forma muy simple. Además, p x 'n (x) = 1 (x) x 0; 2 (x) 3 el cálculo de 'n (x) implica una sola resta y no sumas y restas como originalmente se tenía en el x cálculo de 'n (x) : Note también que los cocientes que tanto en 1 (x) como en 2 (x) se realizan, se 9 x evitan con el cálculo de y = : El número de operaciones elementales que se realizan para calcular 9 (6p) = 6 (n 1) ; y el cálculo de 'n (x) requiere de a lo más 1 (x) y 2 (x) son a lo más de 2 6 (n 1) + 5 = 6n 1 operaciones elementales. n Si se debe calcular 'n (x) en la forma original se deben realizar a lo más 1+ (1 + 3n) operaciones 2 elementales. p k ( x) Observe que el cálculo de k = 3; : : : ; n requiere de 3k 2 operaciones elementales k! 3k pués (k 1)!k = k! corresponde cada una operación elemental. Análogamente ak 1 a = ak es una operación elemental. Para n = 7 se requieren 77 operaciones elementales, mientras que con la forma simpli…cada se requieren a lo más 41 operaciones elementales. Para n = 15; en la forma original se requieren aproximadamente 345 operaciones elementales, mientras que en la forma simpli…cada requieren aproximadamente 89 operaciones elementales. Cuando n es grande se presenta otras di…cultades de cálculo de n!; 3n ; xn ; por ejemplo 15! ' 1;30767436 1012 ; 515 ' 3;051757812 1010 : Finalmente, como se debe calcular 'n (xk ) en puntos igualmente espaciados xk de [0; 100] ; se de…ne 100 h= y xk = kh k = 0; 1; : : : ; m: m Con todos estos resultados se propone el siguiente algoritmo de cálculo de 'n (xk ) k = 0; 1; : : : ; m; y, n 2 Z+ con n 3 impar. Algoritmo Datos de entrada: m; n 2 Z+ ; xk k = 0; 1; : : : ; m: Datos de salida: xk ; 'n (xk )
k = 0; 1; : : : ; m:
1. Veri…car n 3 impar. Caso contrario continuar en 6). 100 2. h = : m 3. Para x = 0; poner 'n (0) = 1: 4. Para k = 1; : : : ; m b = 1: c = 1: xk = kh xk y= 9 j = 0; 1; : : : ; p i=p
1
j;
1 1) (2i) 1 c=1+ (2i) (2i + 1) Fin de bucle j. b=1+
(2i
y
b;
y
b;
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS 'n (xk ) = b
19
p
xk c: 3
Fin de bucle k. 5. Imprimir xk ; 'n (xk )
k = 0; 1; : : : ; m:
6. Mensaje: Error de lectura de n: 7. Fin. Para n = 3; la función '3 (x) está de…nida como p x x '3 (x) = 1 + 1! 3 2! 32
p 3 ( x) 3! 33
x
0:
Calculemos '3 (10) : Tenemos '3 (10) = 1 = 1
p 3 10 10 10 + 2 1! 3 2! 3 3! 33 1;054092553 + 0;555555556 p
0;1952023247 = 0;3062606775:
Para esta cálculo se requieren de 15 operaciones elementales. Note las molestias en la realización 10 ' 1;111111111: de los cálculos en '3 (x) : Apliquemos el algoritmo. Ponemos y = 9 p y 10 y '3 (x) = 1 + 1+ ; 2 3 p 6 10 '3 (10) = 1;555555556 1;185185185 = 0;306260678: 3 Se requieren de 9 operaciones lementales. Para n = 7; '7 (x) está de…nido como p x x '7 (x) = 1 + 1! 3 2! 32
p 3 ( x) x2 + 3! 33 4! 34
p 5 ( x) x3 + 5! 35 6! 36
p 7 ( x) 7! 37
que se escribe como p
y y y '7 (x) = 1 + 1+ 1+ 2 12 30 donde y =
x y y y 1+ 1+ 1+ 3 6 20 42
10 x : Para x = 10; y = ' 1;111111111; y aplicando el algoritmo, obtenemos 9 9 '7 (x) = 1;608901082
1;260426345 = 0;348474737:
En el siguiente capítulo se tratan las series de potencias, las mismas que se aproximan con sumas …nitas, las que a su vez se escriben siguiendo un procedimiento similar al discutido en el ejemplo que acabamos de presentar. p k 1 ( 1)k x 2 P x ) = x 0, y la función 'n es la suma parcial del Note que ' (x) = exp( 3 k!3k k=0 desarrollo en serie de potencias de ': Para x = 10, los valores que hemos calculado 'n (10) son aproximaciones de '(10) : p 10 '(10) = exp( ) ' 0;3485085369: 3 4. Este es un ejemplo de una función que posee una discontinuidad evitable. Se de…ne la función real ' como sigue: ' (x) = calcular ' (x) para x 2 ]0; 1[ :
1 + x4
1 3
1 x4
x4
1 3
0 < jxj
1: Se desea
Suponemos que con una calculadora de bolsillo (calculadora hipotética) se tiene 10 100 ' 0 pero 10 99 6' 0: Entonces, para 0 < jxj 10 25 se tiene 0 < x4 10 100 ' 0 y no podemos calcular
20
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES ' (x) : Para resolver este inconveniente, aplicamos el binomio de Newton con exponente racional que se de…ne a continuación: (1 + a)r = 1 + ra +
r (r 1) 2 r (r a + 2!
donde r 2 Q con r 6= 0; jaj < 1: Apliquemos el binomio de Newton a 1 + x4 1 3
1 + x4
1 1 4 3 = 1+ x + 3 1 1 1 3 3 +
1 3
y 1
x4
1) (r 3! 1 3
2)
a3 +
;
para 0 < jxj < 1; tenemos
1 1 1 1 1 1 2 3 3 3 3 x8 + x12 2! 3! 1 1 1 1 1 2 3 1 3 3 3 3 3 x16 + 4!
1 3
2
3
1 3
4 x20
5!
+
1
1 3
x4
1 = 1 + x4 3 1 4 = 1 x 3
1 8 x + 9 1 8 x 9
Entonces
5 12 x 81 5 12 x 81
1 3
1 + x4
10 16 x + 243 10 16 x 243 1 3
1 + x4
22 20 x + 729 22 20 x + 729
; :
10 44 16 2 x + = x4 + x8 + 3 81 729
;
de donde 1 + x4
1 3
1
x4
1 3
2 10 44 16 = + x8 + x + 0 < jxj < 1: x4 3 81 729 En esta nueva formulación de la función '; vemos que se ha eliminado el inconveniente de cálculo que arriba señalamos. En realidad se tiene una discontinuidad evitable en x = 0: Tenemos ' (x) =
2 2 l m '(x) = ; luego ' (x) ' si 0 < jxj 10 25 3 3 25 2 10 2 ; 0 < jxj8 10 100 ' 0; y ' (x) se aproxima como ' (x) ' : 3 25 16 200 100 < jxj 10 4 ; se tiene 10 < jxj 10 ' 0; luego ' (x) se aproxima x!0
Más aún, si 0 < jxj 25
Para x tal que 10 2 2 10 como ' (x) ' + x8 : 3 81 25 100 Si 10 4 < jxj 10 24 ' 6;812920691 ' (x) ' 100 24
Para x tal que 10 ' (x) '
< jxj
10
5;
entonces ' (x) se aproxima como
2 10 8 44 16 2 10 44 8 + x + x = + x8 ( + x ): 3 81 729 3 81 729 100 32
10
se tiene 10
400 3
< jxj32
2 10 8 44 16 718 24 2 + x + x + x = + x8 3 81 729 19683 3
10
100
10 + x8 81
' 0; en cuyo caso 44 718 8 + x 729 19683
:
Así sucesivamente. Para x tal que 10
1
< jxj
1 + (0;1)2 ' (0;1) =
1 3
1
(0;1)4
1 3
4
(0;1) 1 + (0;2)2
' (0;2) =
1; calculamos ' (x) con la expresión que se de…nió originalmente. Así,
1 3
1 4
(0;1)
(0;2)4
'
1;000033332 0;9999666656 ' 0;6666664; (0;1)4
'
1;000533049 0;999466382 ' 0;666666875: (0;2)4
1 3
2 10 Note que si se utiliza el desarrollo de ' (x) = + x8 + 3 81 que es mucho más exacto que el precedente:
; se obtiene ' (0;2) ' 0;6666669827
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
21
5. En este ejemplo se trata un método de derivación numérica. Sea f una función real derivable en el intervalo ]a; b[ ; x0 2 ]a; b[ : La derivada de f en x0 se nota df f 0 (x0 ) o también (x0 ) y se de…ne como dx f (x0 + h) :f (x0 ) ; h
f 0 (x0 ) = l m
h!0
f (x0 + h) :f (x0 ) h 6= 0; se llama cociente incremental. h Admitiremos que la función f es derivable en algún intervalo abierto ]a; b[ de R y nos proponemos calcular numéricamente f 0 (x0 ) : Sea h 2 R con h 6= 0 su…cientemente pequeño. De la de…nición de f 0 (x0 ) surge inmediatamente la idea de aproximar f 0 (x0 ) mediante el cociente incremental, esto es,
siempre que el límite exista. El cociente
f 0 (x0 ) '
f (x0 + h) :f (x0 ) : h
En la …gura siguiente se muestra la grá…ca de una función f de…nida en ]a; b[ y la recta secante que une los puntos (x0 ; f (x0 )) y (x0 + h; f (x0 + h)) en los casos h < 0 y h > 0:
Figura 5
Figura 6
Ponemos y0 = f (x0 ) ; y1 = f (x0 + h) y y00 una aproximación de f 0 (x0 ) de…nida como y00 =
y1
y0 h
;
y00 la denominaremos derivada numérica de f 0 (x0 ) : Supongamos que f posee derivada segunda en ]a; b[ : El polinomio de Taylor con resto de f está de…nido como h2 f (x0 + h) = f (x0 ) + hf 0 (x0 ) + f 00 ( ) ; 2! con h 6= 0 y entre x0 y x0 + h; entonces f 0 (x0 ) =
f (x0 + h) h
f (x0 )
h 00 f ( ): 2!
La aproximación de f 0 (x0 ) se escribe como y00 =
y1
y0 h
+ 0 (h) :
Con frecuencia y0 = f (x0 ) ; y1 = f (x0 + h) no se calculan exactamente, consideraremos y0 ; y1 aproximaciones de f (x0 ) y f (x0 + h) respectivamente. Ejemplo
22
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Consideremos la función real de…nida como f (x) = x4 x 2 R: Claramente f es derivable. Calculemos numéricamente f 0 (1;5) : Ponemos x0 = 1;5: En la tabla siguiente se muestran valores y1 y 0 de h; x0 + h; y0 = f (x0 ) ; y1 = f (x0 + h) ; f 0 (x0 ) ' y00 = : h
h
x0 + h
y0
y1
0;1 0;005 0;00005 0;05 0;0005 0;000005
1;4 1;495 1;499995 1;55 1;5005 1;500005
5;0625 5;0625 5;0625 5;0625 5;0625 5;0625
3;8416 4;995336751 5;0624325 5;77200625 5;069253376 5;0625675
f 0 (x0 ) ' y00 =
y1
12;209 13;4326498 13;5 14;190125 13;506752 13;5
y0 h
:
El valor exacto de f 0 (1;5) es 13;5: En base a la de…nición de derivada numérica así como al proceso de cálculo seguido en el ejemplo, se propone como ejercicio elaborar el algoritmo correspondiente. En un capítulo más adelante se verán otros métodos numéricos de cálculo de f 0 (x0 ) y de derivadas de orden superior. Igualmente, se tratará el cálculo aproximado de derivadas parciales.
6. En este ejemplo se considera un método de integración aproximada. Sean a; b 2 R con a < b; u una función real continua de…nida en [a; b]. Se considera el siguiente problema: hallar I (u) =
Z
b
u (x) dx:
a
Como es conocido, la integral de…nida de una función continua está bien de…nida. Para el cálculo de I (u) se consideran dos casos: el primero en el que podemos encontrar una función primitiva F de u, esto es, una función F tal que F 0 (x) = u (x) 8x 2 [a; b] y en consecuencia I (u) = F (b) F (a) : En el segundo caso, no podemos encontrar una función primitiva de u; con lo que el cálculo de I (u) debemos realizarlo en forma aproximada. Para el efecto, elegimos el método conocido como la regla del rectángulo que describimos a continuación. Sean m 2 Z+ y
(m) = fx0 = a; x1 ; : : : ; xm = bg una partición de [a; b] ; esto es, xi 1 < xi i = b a 1; : : : ; m: Ponemos hi = xi xi 1 i = 0; 1; : : : ; m; y b h=maxfhi j i = 1; : : : ; mg: Si se elige h = m y xi = ih i = 0; 1; : : : ; m; (m) se dice partición uniforme. Se tiene hi = h y b h = h: En general estas particiones son las más comunes. Se de…ne la función real vn sobre [a; b] como sigue vm (x) = u (ti ) x 2 [xi vm (b) = u (b) ;
donde ti = xi de u.
1+
1 ; xi [ ;
1 hi es el punto medio del intervalo [xi 2
i = 1; : : : ; m;
1 ; xi ] :
La función vm se le llama interpolante
En la …gura siguiente se muestra la grá…ca de una función u de…nida en [a; b] ; la partición
(m)
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
23
de [a; b] con m = 5 y la función interpolante vm de u:
Figura 7
Entonces I (vm ) =
Z
b
vm (x) dx =
a
=
m X
m Z X i=1
hi u xi
i=1
1
xi
xi
vm (x) dx = 1
1 + hi : 2
m Z X i=1
xi
xi
u xi 1
1
1 + hi dx 2
La aproximación I (vm ) de I (u) se llama regla del rectángulo. Note que el problema de cálculo de la m P 1 integral I (u) se le ha tansformado en uno más sencillo que es calcular I (vm ) = hi u xi 1 + hi 2 i=1
Puesto que la función u se ha discretizado según la partición (m) de [a; b] ; se tiene un conjunto de puntos u (a) ; u (ti ) i = 1; : : : ; m; u (b) ; en el cálculo de I (u) se comete un error de discretización. En análisis numérico interesa mucho estimar el error de discretización en el cálculo numérico de integrales de…nidas y particularmente del método de la regla del rectángulo, esto es, estimar jI (u) I (vm )j y probar que I(vm ) ! I (a) ; en un cápitulo posterior se tratarán todos estos m!1 problemas. Algoritmo Datos de entrada: a; b 2 R; m 2 Z+ ; función u:
Datos de salida: I (vm ) ; mensaje.
1. Veri…car a < b: Caso contrario, continuar en 8). b a 2. Calcular h = : m 3. j = 0; 1; : : : ; m xj = a + jh Fin de bucle j. 4. S = 0: 5. j = 1; : : : ; m tj = xj
1
+ 0;5h
S = S + u (tj ) Fin de bucle j: 6. I (vm ) = hS: 7. Imprimir I (vm ) : Continuar en 9).
24
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 8. Mensaje: a < b: 9. Fin. Como aplicación de la regla del rectángulo consideramos la función u de…nida como u (x) = x3 x 2 1 [1; 2] y m = 10: Se considera la partición uniforme. Se de…ne h = = 0;1; la partición (10) del 10 intervalo [1; 2] está de…nida como (10) = f1; 1;1; 1;2; : : : ; 1;9; 1g : Entonces I (v10 ) =
10 X
hi u (ti ) =
i=1
10 X
hi u xi
i=1
= 0;1 [u (1;05) + u (1;15) + El valor exacto es I (u) =
Z
2
u (x) dx =
1
Note que jI (u)
Z
2
1
1 + hi 2
=
10 X
hu (xi
1
+ 0;05)
i=1
+ u (1;95)] = 3;74625:
x3 dx =
1
1 4 x 4
2
= 1
15 = 3;75: 4
I (v10 )j = 0;00375:
7. Ecuaciones diferenciales Sean T > 0; f una función real de…nida en [0; T ] R: Suponemos que f es continua, más aún, se supone que f satisface la condición de Lipschitz que se indica a continuación 9M > 0 tal que jf (t; y1 )
f (t; y2 )j
M jy1
y2 j
8y1 ; y2 2 R y t 2 [0; T ] :
Se considera el problema de Cauchy de valor inicial siguiente: hallar u 2 C 1 ([0; T ]) solución de
u0 (t) = f (t; u (t)) t 2 ]0; T [ ; u (0) = u0 :
Por la hipótesis impuesta sobre f; se sabe que dicho problema tiene solución única. En la generalidad de los casos, la función u no puede determinarse explícitamente, esta viene representada como una integral de una función que no puede integrarse con funciones elementales lo que di…culta el cálculo numérico de u (t) t 2 [0; T ] : Frente a estos dos hechos, la idea es aproximar la solución de la ecuación diferencial en forma numérica. Sean m 2 Z+ ; (m) = ft0 = 0; t1 ; : : : ; tm = T g una partición de [0; T ] donde tj 1 < tj j = b 1; : : : ; m: Ponemos hj = tj 1 tj j = 1; : : : ; m y h = max hj : Si se elige una partición uniforme, j=1;:::;m
T se tiene tj = jh j = 0; 1; : : : ; m con h = : m u (t + h) u (t) se sigue que para h su…cientemente pequeño y no De la de…nición de u0 (t) = l m h!0 h nulo, u (t + h) u (t) u0 (t) ' t 2 ]0; T [ ; h y como u0 (t) = f (t; u (t)) entonces u (t + h) h
u (t)
' f (t; u (t)) t 2 ]0; T [ ;
luego u (t + h) ' u (t) + hf (t; u (t)) ; y en t = tj ; se obtiene u (tj+1 ) ' u (tj ) + hf (tj ; u (tj )) j = 0; 1; : : : ; m
1:
Denotamos con uj un aproximación de u (tj ) j = 0; 1; : : : ; m: Consideramos una partición uniforme de [0; T ] : Se de…ne u0 dado, uj+1 = uj + hf (tj ; uj ) j = 0; 1; : : : ; m:
1.3. EJEMPLOS DE ALGORITMOS Y PROBLEMAS
25
que se conoce como esquema numérico de Euler explícito, lo que a su vez da lugar al siguiente algoritmo. Algoritmo Datos de entrada: m; función f (t; u (t)) ; u0 ; T: Datos de salida: tj ; uj ; j = 0; 1; : : : ; m: T 1. Poner h = : m 2. (m) = ftj = jh j j = 0; 1; : : : ; mg : 3. Para j = 0; 1; : : : ; m
1
uj+1 = uj + hf (tj ; uj ) Fin de bucle j: 4. Imprimir resultados: tj ; uj j = 0; 1; : : : ; m: 5. Fin. u0 (t) = u (t) + t t 2 ]0; 0;5[ ; u (0) = 0: Tenemos f (t; u (t)) = u (t) + t: En este caso la solución u (t) se determina mediante el conocido método de separación de variables, se obtiene u (t) = (t + 1) + et t 2 [0; 0;5] : 0;5 Sean m = 5; h = = 0;1 y (5) = f0; 0;1; : : : ; 0;5g una partición de [0; 0;5] ; u0 = 0: Los 5 resultados del método de Euler explícito se muestran a continuación. Apliquemos el método de Euler explícito al siguiente ejemplo:
u1 = u0 + h (u0 + t0 ) = 0 + 0;1 (0 + 0) = 0; u2 = u1 + h (u1 + t1 ) = 0 + 0;1 (0 + 0;1) = 0;01; u3 = u2 + h (u2 + t2 ) = 0;01 + 0;1 (0;01 + 0;2) = 0;031; u4 = u3 + h (u3 + t3 ) = 0;03 + 0;1 (0;031 + 0;3) = 0;0641; u5 = u4 + h (u4 + t4 ) = 0;0641 + 0;1 (0;0641 + 0;4) = 0;11051: En la …gura siguiente se muestra la grá…ca de la solución u (t) con línea continua y la aproximada se muestra con sobre la partición de [0; 0;5] :
Figura 8 En la tabla siguiente se muestran los valores exactos de u; los calculados uj sobre la partición así como ju (tj ) uj j : j 0 1 2 3 4 5
tj 0 0;1 0;2 0;3 0;4 0;5
u (tj ) 0 0;005170918 0;021402758 0;049858808 0;091824698 0;148721271
uj 0 0 0;01 0;031 0;0641 0;11051
ju (tj ) uj j 0 0;005170918 0;011402758 : 0;018858808 0;027724698 0;038211271
(5)
26
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Note como se incrementa el error. Esta clase de problemas se abordarán en el último capítulo, donde se hará un análisis de la convergencia de los métodos y en particular de este método de Euler explícito.
1.4.
Sistemas de Numeración.
Entre los sistemas de numeración más usados tenemos el sistema decimal o de base 10 cuyas cifras decimales son los enteros comprendidos entre 0 y 9. El número 10 es llamado base de dicho sistema. Sea M 2 Z+ , para indicar su representación decimal escribimos M = mn mn 1 : : : mo ; donde mi 2 f0; 1; 2; : : : ; 9g 8i = 0; 1; : : : ; n. A la representación decimal de M le asociamos el polinomio n P mk xk x 2 R, donde los coe…cientes mk k = 0; ; n son las cifras decimales del número P (x) = k=0
entero positivo M: Entonces M = P (10) =
n P
mk
10k : Así por ejemplo si M = 2165, el polinomio
k=0
asociado a M está de…nido como P (x) = 5 + 6x + x2 + 2x3 P (10) = 5
100 + 6
101 + 1
x 2 R. En x = 10 se tiene
102 + 2
103 = 2165 = M:
Otro de los sistemas de numeración más utilizados es el binario o de base 2, cuyas cifras binarias son los dígitos 0 y 1: En este sistema, un número entero positivo A lo representaremos como A = (an an 1 : : : a0 )2 ; donde ai 2 f0; 1g i = 0; : : : ; n: ¿Cuál es la representación de este número A en el sistema decimal? A continuación abordamos el problema de la conversión entre estos dos sistemas de numeración. Es claro que el número entero 0 se representa como 0 en el sistema decimal y como (0)2 en el sistema binario.
1.4.1.
Conversión de binario a decimal y viceversa.
Conversión de binario a decimal. Sea A = (an an 1 : : : aP 0 )2 un número binario. Para convertir el número A al sistema decimal le asociamos el polinomio P (x) = nk=0 ak xk , donde ak 2 f0; 1g k = 0; : : : ; n son las cifras binarias del número A; y evaluamos P (2) usando el esquema de Hörner. Así A = P (2) en el sistema de numeración decimal. Ejemplo Sea M = (1101101)2 . Determinemos M en base 10. Para el efecto, asociamos a M el polinomio P (x) = 1 + x2 + x3 + x5 + x6 x 2 R: Utilizando el esquema de Hörner, se tiene que P (2) = 109, por lo tanto (1101101)2 = 109: Conversión de decimal a binario. Sea M 2 Z+ en base 10. Supongamos que M tiene laPsiguiente representación en binario M = n k (an an 1 : : : a2 a1 a0 )2 cuyo polinomio asociado es P (x) = k=0 an x y evaluado en x = 2 se expresa como sigue: n X P (2) = an 2k = a0 + a1 2 + a2 22 + + an 2n : k=0
Sea u 2 Z. Recordemos que un número entero u se dice par si y solo si existe j 2 Z tal que u = 2j; y u se dice impar si y solo si existe j 2 Z tal que u = 2j + 1: Para determinar las cifras binarias a0; a1 ; : : : ; an , procedemos como sigue: a1 es par, entonces M impar , a0 = 1; y, M par , a0 = 0:
2 + a2 + 22 + : : : an
2n
1.4. SISTEMAS DE NUMERACIÓN.
27
Determinada la cifra a0 , pasamos a determinar la cifra a1 . De…nimos M1 = an 2n 1 : Luego, M1 impar , a1 = 1; y, M1 par , a1 = 0: De manera análoga a la precedente, de…nimos M2 = M2 impar , a2 = 1;
M1 a1 2
= a2 + a3
M a0 2
= a1 + a2
2 + : : : + an
2n
2;
2 + ::: +
entonces
y, M2 par , a2 = 0:
Continuando con este proceso n veces obtenemos las cifras binarias ak ; k = 0; 1; : : : ; n. P Para determinar n, observamos que si para todo k; an = 1, entonces nk=0 2k = 2n+1 1 < 2n+1 ; y si para k = 0; 1; : : : ; n 1; ak = 0 y an = 1, entonces P (2) = 2n . Por lo tanto n 2 N debe veri…car la desigualdad 2n M < 2n+1 : Dado un número entero positivo en el sistema numérico decimal, el procedimiento descrito precedentemente permite obtener las cifras binarias de dicho número. El algoritmo de conversión de decimal a binario es el siguiente: Algoritmo Dato de entrada: M: Dato de salida: (an an
1 : : : a0 )2 :
1. Determinar n tal que 2n
M < 2n+1 :
2. M0 = M . 3. i = 0; 1; : : : ; n ai = Mi+1 =
0; 1;
1 si Mi es par, si Mi es impar.
Mi
ai 2
Fin de bucle i. 4. an = Mn . 5. Imprimir número binario (an an
1 : : : a0 )2 :
6. Fin. Ejemplos 1. Sea M = 2412. Apliquemos el algoritmo precedente. Determinemos el número de cifras requeridas en la representación binaria. Tenemos la desigualdad 211 = 2048 < M < 212 = 4096, se sigue que n = 11: En la siguiente tabla se ilustran los resultados de la aplicación del algoritmo de conversión de decimal a binario del número 2412: i 0 1 2 3 4 5 6 7 8 9 10 11 Mi 2412 1206 603 301 150 75 37 18 9 4 2 1 ai 0 0 1 1 0 1 1 0 1 0 0 1 Por lo tanto 2412 = (100101101100)2 : 2. Sea M = 729: Se tiene que n = 9 y la aplicación del algoritmo nos da 729 = (1011011001)2 : Caso fraccionario. Consideramos ahora el caso de la conversión de decimal a binario para números racionales.
28
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
De…nición 2 i. La serie
1 X
ak 2
k
k=1
ii. La fracción binaria se dice …nita si 9n0 2 Z+ tal que 8n binaria se dice in…nita. Observación: la serie
P1
k
k=1 ak 2
1 X
ak 2
1 X
k
P1
k=1 ak 2
k
1 X
k
ak 2
k=1
n0 , an = 0. De otro modo, la fracción
k
es convergente, pués ak 2
k=1
Sea S =
8k 2 Z+ :
se llama fracción binaria, donde ak 2 f0; 1g
2
2
k,
k
= 1:
8k 2 Z+ , y
k=1
una fracción binaria. En el sistema binario escribimos S = (0:a1 a2 a3 : : :)2 :
Ejemplo
El número (0;00111 : : :)2 es una fracción binaria in…nita y representa a 0;25, mientras que el número (0;01)2 es una fracción binaria …nita y también representa a 0;25. Este último es consecuencia del redondeo del primero, que se tratará más adelante. Dada una fracción binaria …nita (0:a1 a2 a3 : : : an )2 , asociamos a la misma el polinomio P (x) =
n P
ak xk
k=1
x 2 R: Para determinar el valor del número binario en el sistema decimal, calculamos el valor de P (0;5) usando el esquema de Hörner. Por tanto (0:a1 a2 : : : an )2 = P (0;5) en el sistema decimal. Ejemplos 1. Si (0;01101)2 ; entonces P (x) = x2 (1 + x(1 + x2 )), de donde P (0;5) = (0;5)2 (1 + 0;5(1 + (0;5)2 )) = 0;40625:
2. Sea b = (0;101101)2 : El polinomio asociado al número b es P (x) = x+x3 +x4 +x6 x 2 R: Entonces b = P (0;5) = 0;703125: Veamos el problema recíproco, es decir la conversión de una fracción decimal a binario. Primeramente, se debe tener presente que, en general, un número real no admite una representación binaria …nita. Por ejemplo, un número real que admite una representación decimal in…nita seguramente su representación binaria no es …nita. Además, si un número real tiene representación decimal …nita no siempre admite representación binaria …nita, así los números 0;1 y 0;01 no admiten representación binaria …nita pero si periódica. Sea b 2 R tal que 0 < b < 1: Fijado n 2 Z+ , determinemos las n primeras cifras binarias de b, esto es, determinamos la fracción binaria …nita (0:a1 a2 : : : an )2 que lo notamos b1 = (0:a1 a2 : : : an )2 : Tenemos b1 = a1
2
2b1 = a1 + a2 Entonces a2
2
1
+ a3
2
2
1
+ a2 2
+ : : : + an
1
2
2
+ a3 2
n+1
a1 = 0 , 2b < 1;
+ a3 2
2
2
3
+ : : : + an
+ : : : + an
2
2
n+1
n
;
()
< 1; luego y, a1 = 1 , 2b
1:
Determinada la cifra binaria a1 pasamos a determinar la cifra binaria a2 : Se de…ne b2 = 2(2b1
a1 ) = a2 + a3
2
2
+ : : : + an
2
n+2
:
1.4. SISTEMAS DE NUMERACIÓN.
29
Razonando como en la parte previa, tenemos a2 = 0 , b2 < 1;
y, a2 = 1 , b2
1:
En la k-ésima etapa, tenemos bk = ak + ak+1 2
1
+ : : : + an 2
n+k
;
de donde ak = 0 , bk < 1;
y, ak = 1 , bk
1:
Tenemos el siguiente algoritmo de conversión de decimal a binario. Algoritmo Datos de entrada: b; n: Datos de salida: (0.a1 a2 : : : an )2 : 1. b1 = b: 2. k = 1; : : : ; n ak =
1
1; 0;
bk+1 = 2bk 3. an =
1; 0;
si 2bk 1; si 2bk < 1: ak
si 2bn 1; si 2bn < 1:
4. Imprimir la fracción binaria (0.a1 a2 : : : an )2 : 5. Fin. Ejemplos 1 1. Sean b = . Determinemos las primeros cinco cifras binarias de b: Tenemos n = 5: En la tabla 3 siguiente se ilustran los resultados de la aplicación del algoritmo precedente.Tenemos, i bi 2bi ai
1
2
3
4
5
1 3 2 3 0
2 3 4 3 1
1 3 2 3 0
2 3 4 3 1
1 3 2 3 0:
Las cinco primeras cifras binarias de b son: (0: 0 1 0 1 0)2 : La fracción binaria …nita (0: 0 1 0 1 0)2 es una aproximación de b: 2. En la tabla siguiente se muestran los resultados de la aplicación del algoritmo de conversión de decimal a binario para b = 0;1 con 10 cifras binarias: i 1 2 3 4 5 6 7 8 9 10 bi 0;1 0;2 0;4 0;8 0;6 0;2 0;4 0;8 0;6 0;2 2bi 0;2 0;4 0;8 1;6 1;2 0;4 0;8 1;6 1;2 0;4 ai 0 0 0 1 1 0 0 1 1 0: Obtenemos ~b = (0;0001100110)2 aproximación de b con 10 cifras binarias.
30
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
Observación. Supongamos que b =
1 P
ak 2
y eb = (0:a1 : : : an )2 : Sea 0 < T ol < 1 su…cientemente
k,
k=1
pequeño. Determinemos n tal que b
n eb < T ol: Sea xn = P ak 2
k:
Entonces
k=1
b
xn =
1 X
ak 2
k
2
n
< T ol:
k=n+1
Basta elegir n como el más pequeño número entero positivo tal que 2 n < T ol: Para tal n resulta que n P ak 2 k : A esta fracción binaria …nita la la fracción binaria …nita eb = (0:a1 : : : an )2 en decimal es xn = k=1
denominaremos aproximación de b con una precisión T ol: Ejemplo
1 Sean b = (0;001111 : : :)2 ; eb = (0;01)2 ; T ol = 10 5 : Entonces b eb = n < T ol = 10 2 y consecuentemente 19 X 1 1 eb = = 0;25: ak 2 k = 4 219
5:
Se tiene n = 19
k=1
Note que b = (0;001111 : : :)2 =
1 X
2
k
k=3
=
1 = 0;25; y eb = (0;00111 : : : 1)2 ' (0;01)2 = 0;25: 4
El algoritmo de conversión de decimal a binario para el caso entero puede ser utilizado para determinar las n primeras cifras binarias de un número real b 2]0; 1[: En efecto, sea b 2 R+ con 0 < b < 1: Supongamos 1 P que b = ak 2 k una fracción binaria. Para n 2 Z+ buscamos una aproximación binaria …nita de la k=1
forma eb = (0:a1 a2 : : : an )2 : Entonces
de donde
eb = P
1 2
=
n X
ak 2
k
= a1
2
1
+ : : : + an
2
n
;
k=1
2neb = an + an
2n
1
2n 1 + : : : + an 1 2 + an + an+1 2 ~b + an+1 2 1 + an+2 2 2 + : : : ;
1
1
2 + : : : a1
:
Puesto que 2n b, en general, no es un entero y como 2n b = a1 = 2
n
+ an+2
2
2
+ :::
entonces M = [2n b] = 2neb; donde [ ] denota la función mayor entero menor o igual que x y para números reales positivos coincide con la parte entera de dicho número: Resulta que M = (a1 a2 : : : an )2 cuyas cifras binarias pueden ser determinadas por aplicación del algoritmo de conversión de decimal a binario para M 2 Z+ ya descrito anteriormente.
1.4.2.
Conversión de decimal a cualquier base y viceversa
Sea N 2 Z+ con N > 1. En el sistema de numeración de base N , los dígitos de dicho sistema son 0; 1; : : : ; N 1 si N 10, y si N > 10 los dígitos de dicho sistema son 0; 1; : : : ; 9 y para las N 10 cifras sucesivas se utilizan otros símbolos, por ejemplo las letras A; B; C; : : : en ese orden. Sistema Binario Octal Decimal Hexadecimal
Base 2 8 10 16
Dígitos 0; 1 0; 1; : : : ; 7 0; 1; : : : ; 9 0; 1; : : : ; 9; A; B; : : : ; F .
1.4. SISTEMAS DE NUMERACIÓN.
31
Sea M 2 Z+ , al número M lo representamos en base N de la manera siguiente: M = (mn mn 1 : : : m0 )N ; f0; 1; : : : ; N 1g, si N 10, donde mk 2 A este número entero positivo M representado en el f0; 1; : : : 9; A; B; : : :g, si N > 10: n P sistema de numeración de base N le asociamos el polinomio real P (x) = mk xk x 2 R: Entonces M k=0
en el sistema de numeración decimal se determina mediante la evaluación del polinomio P (x) en x = N; esto es, M = P (N ) en base 10.
Ejemplos 1. Sea M = (7347)8 : El polinomio asociado a M se escribe como: P (x) = 7 + 4x + 3x2 + 7x3 = 7 + x(4 + x(3 + 7x)) x 2 R: Luego P (8) = 7 + 8(4 + 8(3 + 7
8)) = 3815 en base 10. Así (7347)8 = 3815:
2. Sea M = (3AF )16 . El polinomio asociado es P (x) = F + Ax + 3x2 cuyo valor en x = 16 es P (16) = F + A
16 + 3
162 = 943:
Tenemos (3AF )16 = 943: Para elaborar un algoritmo de conversión de base 10 a base N, debemos primeramente revisar el algoritmo de la división de Euclides y las clases residuales. El algoritmo de la división de Euclides se establece en los siguientes términos: dados a; b 2 Z+ , existen c; r 2 N tales que 0 r < b, y a = bc + r: El número natural c se llama cociente y r se llama residuo. Por ejemplo, si a = 23, b = 5, entonces 23 = 4 5 + 3; donde c = 4 y r = 3. Por otro lado, la congruencia módulo m se de…ne como a continuación se indica: dados m 2 Z+ , a; b 2 Z, se dice que a y b son congruentes módulo m que se escribe a b mod(m) si y solo si existe c 2 Z tal que a b = cm: Es inmediato veri…car que la relación de congruencia módulo m es una relación de equivalencia y que dicha relación de…ne una partición de Z en clases residuales notadas como [0]; [1]; ; [m 1] tales que [j] = fcm + j j c 2 Zg,
[i] \ [j] = ; para i 6= j, i; j = 0; : : : ; m m [1 Z = [j] :
1;
j=0
El procedimiento descrito para obtener las cifras binarias de un número en base 10 equivale a aplicar el algoritmo de la división de Euclides: a = 2c + r; donde c 2 N y r 2 f0; 1g. Este procedimiento puede extenderse de modo similar a otras bases. En efecto, sea M 2 Z+ expresado en el sistema decimal, N 2 Z+ con N > 1 la nueva base. Por el algoritmo de la división de Euclides, se tiene que M = cN + r; donde r 2 N tal que 0 r < N: Las clases residuales módulo N son: [0]; [1]; : : : ; [N 1]. El algoritmo de conversión de base 10 a base N se describe a continuación. Algoritmo Datos de entrada: M; N Dato de salida: (an an
1 : : : a0 )N :
1. Determinar n tal que N n 2. M0 = M . 3. i = 0; 1; : : : ; n
1
M < N n+1 :
32
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES ai = r
si Mi 2 [r];
Mi+1 =
Mi ai N
Fin de bucle i. 4. an = Mn . 5. Imprimir M = (an an
1 : : : a0 )N :
6. Fin. Ejemplo 1. Sean M = 35, N = 3. Se veri…ca inmediatamente que 33 35 < 34 ; luego n = 3 y consecuentemente M tiene cuatro cifras en base 3. Ponemos M = (a3 a2 a1 a0 )3 . Debemos determinar las cifras a0 ; a1 ; a2 ; a3 2 f0; 1; 2; g: En la siguiente tabla se muestran los resultados de la aplicación del algoritmo de conversión de decimal a base 3. M0 = M = 35 2 [2], a0 = 2; M2 =
M1
a1 3
= 3 2 [0];
M0
M1 =
a2 = 0;
a0 3
M3 =
= 11 2 [2], a1 = 2;
M2
a2 3
= 1 = a3 :
Luego 35 = (1022)3 : Relación del número de cifras entre dos sistemas de numeración La relación del número de cifras para la representación de un número en dos bases distintas lo podemos determinar de la siguiente manera. Sean a; b 2 R+ con a 6= 1; b 6= 1 dos bases distintas y M 2 Z+ expresado en base 10. Supongamos que M se representa con respecto de estas dos bases como M = (an an 1 ; : : : a0 )a ; y M = (bm bm 1 : : : b0 )b : Entonces m; n 2 N satisfacen las siguientes desigualdades: an
M < an+1 ;
bm
M < bm+1 ;
y en consecuencia
De la relación logb (M ) = logb (a)
n
loga (M ) < n + 1;
m
logb (M ) < m + 1:
loga (M )), se sigue que m loga (M )
logb (a) <
m
logb (a)
loga (M ) < m + 1; de donde
m+1 : loga (M )
Tomando en consideración que n < loga (M ) < n + 1; se obtiene la siguiente desigualdad m m < n+1 loga (M )
logb (a) <
m+1 loga (M )
m+1 : n
1 sea despreciable, se deduce que n m logb (a) ' () nlogb (a) ' m; n
Para M su…cientemente grande de modo que
es decir que M en el sistema de numeración de base a requiere de aproximadamente nlogb (a) cifras en el sistema de numeración de base b: m Para b = 2 y a = 10 se tiene que ' 3, de donde m ' 3n: La representación binaria requiere n aproximadamente cerca de 3 veces del número de cifras necesarias en la representación decimal. Para m b = 2 y a = 16; se tiene = 4: n
1.5. REPRESENTACIÓN EN PUNTO FLOTANTE.
1.5.
33
Representación en punto ‡otante.
La representación en punto ‡otante normalizada de un número real no nulo x en el sistema decimal 1 (comúnmente conocida como notación cientí…ca) se expresa como x = a 10p ; donde a 2 [ 10 ; 1[; p 2 Z. El número a se denomina mantisa de x y el exponente p se denomina característica de x: Este tipo de escritura de los números reales se utiliza en algunos instrumentos de cálculo como por ejemplo las calculadoras de bolsillo, los computadores portátiles. Más precisamente, un número de máquina d 6= 0 en una calculadora o en un computador es un número real que tiene su representación en punto ‡otante normalizada de la forma: d = sign(d) a 10p ; donde sign(d) denota el signo de d, a = 0:d1 dm con di 2 f0; 1; ; 9g, i = 1; ; m, d1 6= 0; y el exponente p, por ejemplo para ciertos tipos de calculadoras de bosillo, pertenece al conjunto f 100; 99; ; 98, 99g: Si b = 0, entonces di = 0; i = 1; ; m: La condición d1 6= 0 asegura que a aplicación numérica, el número de cifras decimales m es, en general, …jo.
10
1:
Además, para una
Ejemplos 1685 = 561;6666 : : : se escribe en punto ‡otante normalizado 0;5616666 : : : 103 3 y como número de máquina en punto ‡otante (por ejemplo para una calculadora de bolsillo) 0;5616666667 103 :
1. El número x =
2. El número x = 0;0000000001 como número en punto ‡otante normalizado (y como número de máquina) se escribe como 0;1 10 10 . Fijado el número de cifras decimales m, debe notarse que la mantisa más pequeña es a = 0;1 y no a = 0;0 01 y la mantisa más grande es a = 0;9 9. En el sistema binario, la representación de números reales es análoga. Un número real x 6= 0 tiene una representación binaria normalizada que se escribe como sigue: x = sign(x)
2p ;
a
donde a 2 [ 12 ; 1[ y p 2 Z. El número a se expresa como una serie binaria como un entero en binario, esto es: jpj = (pn pn
1 : : : p0 )2
=
n X
P1
i=1 ai 2
i
y jpj se escribe
p i 2i :
i=0
Ejemplos
1. x =
2.
1685 = 3
0;001 =
1685 3 29 2 1000
2 9
=
10
210 =
0;512
2
1685 3072
210 :
9:
Una cifra binaria se denomina bit. Si el número de bits asignados para almacenar el número es …jo, un número de máquina tiene una forma de punto ‡otante binaria normalizada b = sign(b) a 2p ; que 8 < un bit para el signo de b; r bits para el exponente jpj; puede almacenar exactamente usando los siguientes grupos de bits: : m bits para la mantisa a:
34
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
Es decir que un número de máquina b en punto ‡otante binario normalizado requiere para su representación de m + r + 1 bits, a condición de que dicho número de bits sea …jo. Además, a = (0: b1 : : : bm )2 ; jpj = (pr
bi 2 f0; 1g; i = 1; : : : ; m; b1 6= 0;
1 : : : p0 )2 ;
pj 2 f0; 1g; j = 0; 1; : : : ; r
1:
1 2
La mantisa más pequeña es a = (0;10 : : : 0)2 = y la más grande es a = (0;11 : : : 1)2 = 1 exponente se tiene que 0 jpj 2r 1:
2
m:
Para el
En consecuencia, el número más grande a representarse en punto ‡otante binario normalizado es (1 2r :
y el número positivo más pequeño es 2
b = (0:b1 : : : bm )2 donde q
0. Como 0
q
2r
m
2
22
)
r
1
Este último se obtiene del modo siguiente: q
2
1, entonces
(0;10 : : : 0) =
1 2
q
2
q 1
=2
;
2r + 1; y en consecuencia b
q
2
q 1
=2
2r :
Así, un número de máquina en punto ‡otante binario normalizado satisface la desigualdad: 2r
2
jbj
1
2
m
22
r
1
:
Además, el conjunto de números de máquina es …nito. Por ejemplo,si se tiene m = 24; r = 7: Entonces 0 10
38
'2
2
p jbj
127 y 22 22
7
1
r
1
= 2127 ' 1038 , de modo que
' 1038 :
En la actualidad se tiene los siguientes tipos de representación de números reales: simple precisión, doble precisión y doble precisión extendida. El estudiante debe conocer cuantos bits se requieren para la mantisa y cuantos para el exponente. Por ejemplo para ciertos tipos de máquinas se tiene 1 bit para el signo, para doble precisión se tienen 23 bits para la mantisa y 8 bits para el exponente, para doble precisión extendida se tienen 47 bits para la mantisa y 16 bits para el exponente. Si se dispone de 64 bits para representar un número en doble precisión extendida, estos se dispone de la manera siguiente: 47 bits para la mantisa, 1 bit para el signo y 16 bits para el exponente. Observación. 1. En una calculadora de bolsillo, el número de bits para representar la mantisa así como su equivalente en base 10 es, generalmente …jo. En un computador se tiene alguna ‡exibilidad para almacenar mantisas de diferentes tallas. Además, la aritmética que utilizan puede ser binaria (base 2), octal (base 8), hexadecimal (base 16). 2. En las calculadoras se almacena el exponente p con un corrimiento de 100, de tal manera que el exponente corrido E + 100 es un entero no negativo entre 0 y 199. De este modo se evita utilizar un bit para el signo del exponente. Así por ejemplo: x=
1685 = 0;5616666667 3
103 ;
p + 100 = 103:
En binario, el exponente corrido de r bits tiene una representación de la forma 0
p + p0 = (br
1 : : : b0 )2 =
r 1 X
bi 2i
2r
1:
i=0
El corrimiento p0 se le toma como 2r 2r
1
p
2r
1,
en cuyo caso 1
p0 = 2r
1
2r
1
= 2r
1
1:
1.6. TIPOS DE ERRORES
35
Los enteros m (para la mantisa), p0 y r son …jos. 1 j 101100110 : : : 0 j 0000110 , donde m = 24; r = 7, indica Por ejemplo, el grupo de bits: que el número es negativo (primer bit 1), la mantisa a = (0;101100110 : : : 0)2 = 0;69922; p + p0 = (0000110)2 = 6: Puesto que p0 = 2r 1 = 27 1 = 64, entonces p = 6 p0 = 58; x = 0;69922 2 58 : Note que para r = 7; 64 p 63: Para el grupo de bits 0 j 101100110 : : : 0 j 1000010 se tiene: mantisa a = (0;101100110 : : : 0)2 = 0;69922, exponente con corrimiento: p + p0 = (1000010)2 = 66, p0 = 64 entonces p = 66 p0 = 2. Luego x = 0;69922 22 = 2;57688:
1.6.
Tipos de Errores
En la sección 3 hemos visto algunos ejemplos de cálculo de soluciones numéricas de problemas relativamente sencillos que surgen en los ámbitos del álgebra lineal, el análisis matemático, las ecuaciones diferenciales en los que se evidencian los resultados aproximados obtenidos en instrumentos de cálculo como son las calculadoras de bolsillo y los computadores. Con cualquiera de estos instrumentos, los resultados mostrados están sujetos a errores. En el análisis numérico, uno de los problemas fundamentales es el estudio o análisis del error cometido en cada uno de los métodos de aproximación que se proponen. Interesa establecer la exactitud y precisión en el cálculo de la solución de un problema (P ), la minimización de los errores cometidos en el cálculo de la solución aproximada de (P ). Se distinguen varios tipos de errores que limitan la exactitud. Estos pueden clasi…carse en tres grupos: errores en los datos de entrada o errores inherentes; errores de redondeo y errores de aproximación.
1. Errores en los datos de entrada o errores inherentes. Se deben a esquematizaciones hechas para la reducción de términos matemáticos de cierto modelo. Pueden deberse también a errores debidos en las medidas experimentales de una magnitud física o a observaciones de cualquier otra índole (de tipo económico, social, etc.). Pueden tener también su origen como resultados de un cálculo realizado previamente. Nótese que estos errores aparecen antes de iniciar el cálculo de un cierto problema (P ). En el estudio que nosotros haremos no nos ocuparemos de este tipo de errores. 2. Errores de redondeo. Estos errores son debidos a la necesidad de trabajar con números de máquina. Dependen casi exclusivamente del instrumento de cálculo a disposición. La evaluación rigurosa es, a menudo, muy complicada. Para el cálculo de la solución de ciertos problemas que consideraremos más adelante, los errores de redondeo tienen una in‡uencia enorme que puede arruinar los resultados. Por tanto es de mucha importancia el poder controlarlos. A continuación presentamos tres números reales y sus aproximaciones con 8, 16, 24, 32 cifras luego del punto decimal, las mismas que han sido obtenidas con el programa de Matemática. El símbolo ' se utilizará en lo sucesivo para indicar aproximación. Tenemos, 805 111 805 111 805 111
' 7;25225225;
805 ' 7;252252252522522525; 111
' 7;252252252522522525225225; ' 7;25225225252252252522522525225225; ' 3;14159265;
' 3;1415926535897932;
' 3;141592653589793238462643;
' 3;14159265358979323846264338327950;
36
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES p p
p
2 ' 1;41421356;
p
2 ' 1;4142135623730950;
2 ' 1;414213562373095048801689;
2 ' 1;41421356237309504880168872420970:
805 Note que el número es un número racional, su representación decimal es in…nita y periódica. 111 Basta conocer el primer período de su representación decimal y con esta puede escribirse el número con el número de cifras que se desee. Al representar los números reales como aproximaciones con un número determinado de cifras decimales, se comete un error de redondeo que trataremos más adelante. 3. Errores de aproximación. Este tipo de errores se dividen en dos grupos: los errores de truncamiento y los errores de discretización. a) Errores de truncamiento. Consideremos los siguientes ejemplos. 1 P 1. Sean (an ) una sucesión numérica real y an una serie que suponemos convergente. Denotamos con S su suma, esto es, S =
1 P
n=0
an : Con frecuencia, el cálculo exacto de S es muy difícil de obtener,
n=0
por lo que se recurre al cálculo aproximado. La idea es aproximar la suma S a través de un número m P …nito m de términos, digamos Sm = an : Este procedimiento produce un error denominado n=0
de truncamiento. La determinación del número de términos necesarios para la aproximación de la solución S es importante, pués evita la ejecución de cálculos que no mejoran la precisión de la solución, y, disminuyen los costos numéricos. 1 P 2. Sean (fn ) una sucesión de funciones de…nidas en un intervalo [a; b] de R y fn una serie de n=0
funciones que suponemos converge uniformemente en el intervalo [a; b]: Se de…ne la función f como 1 P sigue: f (x) = fn (x) x 2 [a; b]. Nos interesamos en trazar la grá…ca de la función f: En la n=0
generalidad de situaciones resulta complicado, y en ocasiones imposible, el cálculo de cada f (x): Una forma de resolver este problema es aproximar cada f (x) con una suma …nita de términos de 1 P la serie fn (x), la misma que se elige apropiadamente en función de la precisión que deseamos n=0
obtener. Este proceso de aproximación provoca un error denominado de truncamiento. Por otro lado, dado el volumen de cálculo a realizar es conveniente elaborar un algoritmo numérico para calcular cada f (x): Cuando la serie converge rápidamente este es el camino a seguir. Lastimosamente, en ocasiones, el solo hecho de limitar a un número …nito de términos no basta sobre todo en el caso de series que convergen lentamente, esto conduce a proponer otro tipo de problema que consiste en la búsqueda de un método para acelerar la convergencia de la serie, una vez logrado esto, se pasa a calcular los valores aproximados de f (x): En un capítulo posterior se estudian esta clase de problemas. b) Errores de discretización. Consideremos los siguientes ejemplos.
1) Sea v una función real continua en el intervalo cerrado [a; b]: Queremos calcular v(x) con x 2 [a; b]; lastimosamente la función v no es conocida en todo el intervalo [a; b] sino en un conjunto …nito de m + 1 puntos de una partición (m) = fx0 = a; x1 ; ; xm = bg de [a; b]; donde xi 1 < xi 2 i = 1; ; m; digamos S = f(xi ; v(xi )) 2 R j i = 0; 1; ; mg. Este problema (P ) se presenta con mucha frecuencia y se le conoce como problema de interpolación. La idea es aproximar v(x) mediante vh (x) de una función vh de…nida en [a; b] que sea mucho más simple de calcular de modo i=m P que vh (xi ) = v(xi ) i = 0; 1; ; m; esto conduce a construir la función vh como vh = v(xi )'i ; i=0
donde f'0 ; ; 'm g es un conjunto de funciones que se construyen apropiadamente. La función vh así de…nida se conoce con el nombre de función interpolante de v. Este proceso produce un error denominado de discretización. En un capítulo posterior se estudia este tipo de problemas. En la …gura siguiente se muestra la grá…ca de una función continua v de…nida en el intervalo [0; a] con a > 0; y la de una función interpolante vh (segmentos de recta) de v: Se muestran también los
1.6. TIPOS DE ERRORES
37
puntos de la partición de (m) de [0; a] :
Figura 9
2) Sea L > 0: Se considera el siguiente problema: hallar una función u 2 C 2 ([0; L]) solución de
u00 (x) + u(x) = f (x) si x 2]0; L[; u(0) = 0; u(L) = 0;
donde f 2 C( [0; L]); con C k ([0; L]) el espacio de funciones que poseen derivada continua en el intervalo [0; L]; k = 0; 1; ; y se pone C([0; L]) = C 0 ([0; L]). Este problema es parte de la familia de los denominados problemas unidimensionales de valores en la frontera. Con la hipótesis sobre f; se demuestra que este problema tiene solución única u 2 C 2 ([0; L]). Para ciertos tipos de funciones f se puede encontrar soluciones explícitas que no se representan como integrales, para otros tipos de funciones f las soluciones se expresan como integrales de las que no pueden calcularse sus primitivas o que resultan difíciles de calcularse. Por otro lado, se tiene interés en calcular numéricamente la solución u(x) x 2 [0; L]: Todos estos argumentos nos conducen a resolver el problema de valores en la frontera en forma numérica, es decir, proceder a discretizar dicho problema. Para el efecto, sea m 2 Z+ ; (m) = fx0 = 0; x1 ; ; xm = Lg una partición de [0; L]; donde xj 1 < xj j = 1; ; m: Ponemos hj = xj xj 1 j = 1; ; m; h = maxfhj j i = 1; ; mg: En el caso de una partición L uniforme, se de…ne h = y xj = jh j = 0; 1; ; m: Consideremos una partición uniforme. Se m denota con uj a una aproximación de u(xj ) j = 0; 1; ; m: En el capítulo 2 mostraremos que u00 (x) se aproxima mediante el cociente denominado diferencias …nitas centrales de segundo orden que se indica a continuación: u00 (xj ) '
u(xj+1 )
2u(xj ) + u(xj h2
1)
j = 1;
;m
1:
Con esta aproximación, el problema propuesto de valores en la frontera se aproxima como 8 u(xj+1 ) 2u(xj ) + u(xj 1 ) < + u(xj ) ' f (xj ) j = 1; ; m 1; h2 : u(x ) = 0; u(xm ) = 0; 0 por lo que el problema discreto es el siguiente:
hallar ! u = (u1 ; ; um 1 ) 2 Rm 1 solución del sistema de ecuaciones lineales ( u 2uj + uj 1 j+1 + uj = f (xj ) j = 1; ; m 1; h2 u0 = 0; um = 0: Este proceso de discretización del problema de valores en la frontera, produce un error denominado error de discretización.
38
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES La estimación de los errores de discretización es fundamental en el Análisis Numérico. Exacto, inexacto, precisión, imprecisión. En el lenguaje corriente, los términos exactitud y precisión se usan indistintamente como sinónimos. En el contexto del análisis numérico es importante establecer la diferencia que existe entre estos dos téminos. El témino exactitud se re…ere a que tan cercano está un valor calculado o medido con el verdadero valor; mientras que el término inexacto se de…ne como una desviación del verdadero valor. También se considerará como exacto aquel resultado o método riguroso, conforme a la lógica. El término precisión se re…ere a que tan cercano está un valor individual calculado o medido con cualquier otro; mientras que el término imprecisión se re…ere a una magnitud que se aleja una de otra. Se comprenderá como precisión aquello que no deja incertidumbre, determinado rigurosamente. p Por ejemplo, con 9 cifras luego del punto decimal, 3 se calcula como 1;732050808. En este caso p hablamos de una exactitud de 10 9 : Cuando 3 se aproxima como 1;7320, 1;7320508, 1;732050808 hablamos de una precisión de 4; 7; 9 cifras luego del punto decimal. R2 p 2 p Si I = xdx = ( 2)3 ' 1;88562; hablamos en este caso del cálculo de I con una exactitud de 3 0 p p p p p 10 5 ; y aplicando la regla del rectángulo siguiente: I5 = 0;4( 0;2 + 0;6 + 1;0 + 1;4 + 1;8), resulta I5 ' 1;898667; hablamos en este caso de un cálculo de I5 con una precisión de 10 6 ; y un cálculo aproximado de I con una precisión de 10 2 : Con error de cálculo entenderemos tanto la inexactitud como la imprecisión. Tenemos Verdadero valor = Valor aproximado + error, donde el error puede deberse a los errores de redondeo, de aproximación (truncamiento, discretización) o ambos. De manera general, al verdadero valor lo conoceremos como solución exacta y al valor aproximado lo denominaremos solución numérica o también solución aproximada. De estas observaciones tenemos que los métodos numéricos deben ser su…cientemente exactos y precisos.
1.7.
Errores de redondeo
Hemos visto que los números de máquina en punto ‡otante satisfacen la desigualdad: 2
2r
jbj
1
1 2m
22
r
1
;
donde r; m son enteros positivos. Además, todo número de máquina se escribe en la forma b = (0:a1 :::am )2
2(ar ar
1 :::a0 )2
:
Sea A el conjunto de tales números. Se sigue que el conjunto de números de máquina es …nito. El problema que se presenta es el siguiente: ¿cómo aproximar un número x 2 = A por un número y 2 A? Consideremos lo tres casos siguientes:
1. x >
2. 2
2r
1 2m
1
x
3. 0 < x < 2
22
1 2r :
r
1 2m
1:
22
r
1:
1.7. ERRORES DE REDONDEO
39 1 2m
22
La métrica usual d en R está de…nida como d(x; y) = jx
yj
2r ;
Comenzaremos con el caso 2): Sea M = 2
1
r
1
R. Se tiene que A
M:
8x; y 2 R:
Sea x 2 M , como A es un conjunto cerrado, 9e x 2 A tal que d(x; A) = d(x; x e) = jx distancia del punto x al conjunto A se de…ne como d(x; A) = m n jx yj : Resulta que y2A
x ej = d(x; A)
jx
jx
yj
x ej ; donde la
8y 2 A:
Por tanto la aproximación de cualquier número x 2 (M n A) por un número notado como rd(x) 2 A debe satisfacer la siguiente condición: jx
rd(x)j
jx
yj
8y 2 A:
El número rd(x) aproximación de x se lo obtiene por redondeo y se denomina redondeado de x. Ejemplo Supongamos que nuestro conjunto A está constituido por números reales de la forma 0:a1 a2 a3 a4 10p ; donde ai 2 f0; 1; ; 9g; p 2 Z y a1 6= 0. Note que la mantisa de los elementos del conjunto A únicamente tienen 4 dígitos, que escribiremos t = 4: Entonces rd(0;14285 100 ) = 0;1429 100 ; pués j 0;14285
100
0;1429
100 j= 0;5000
10
4
j 0;14285
100
yj
8y 2 A:
De manera similar se obtienen los siguientes resultados rd(0;8423
100 ) = 0;8423
100 ;
rd(3;14159
100 ) = 0;3142
101 ;
rd(0;142842
102 ) = 0;1428
102 :
En general, para encontrar rd(x) con t dígitos, se procede del modo siguiente: el número jxj 2 (M n A) es 1 representado en forma normalizada: jxj = a 10b , de modo que jaj 1. Sea a = 0: 1 2 : : : t t+1 : : : 10 la representación decimal de a, donde 0 9 8i = 1; 2; : : : ; 1 6= 0. De…nimos i 0:
a ~=
Como 1
9 entonces jaj
1
rd(x) = sign(x)
0;
1 2:::
1 2:::
0:
t
si 0 t; + 10 t ; si 5
4;
t+1
9:
t+1
1 = 0;1. Se pone sign(x) = 10
1
10b :
a ~
De…nición 3 El error de redondeo de x se de…ne como x se llama error absoluto. El error relativo de x se de…ne mediante la relación: "x =
rd(x) x
x
rd(x): El número no negativo jx
x 6= 0:
En algunos textos, el error de redondeo se le denomina error inherente. Se tiene la siguiente mayoración del error relativo "x : j"x j =
rd(x) x 5
Luego j"x j
1; si x < 0; 1; si x > 0;
eps = 5
10 t .
x
=
10 (t+1) jaj
(sign(x)~ a10b sign(x)a;10b j~ a aj = b jaj jsign(x)a 10 j 5
10
(t+1)+1
=5
10
t
= eps:
rd(x)j
y
40
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
De…nición 4 El número eps = 5
t
10
se llama precisión de máquina .
Se tiene que si rd(x) x
x
= "x ) rd(x) = x(1 + "x ), con j"x j
eps:
El número rd(x) 2 A tiene la propiedad: jx
rd(x)j
jx
yj
8y 2 A:
En el sistema binario, rd(x) está de…nido de modo análogo. Comenzamos con la escritura de x en la forma. jxj = a 2b ; donde a = 0: 1 2 : : : t t+1 : : : ; i 2 f0; 1g; i = 1; 2; : : : ; y 1 = 1. Se tiene 1 1>a : Se de…ne 2 0: 1 : : : t ; si t+1 = 0; a ~= 0: 1 : : : t + 2 t ; si t+1 = 1: Entonces rd(x) = sign(x)
e a
2b ; y
eps = 2 t . Resulta que rd(x) = x(1 + "x ) con j"x j
j"x j
eps.
Ahora analizamos los casos 1) y 3). Puesto que un número …nito de números b son útiles para expresar los exponentes en aritmética de punto ‡otante, hay desgraciadamente números x 2 = A tales que rd(x) 2 = A. Así, si t = 4 y b = 2, consideramos los siguientes ejemplos:
1. rd(0;31794
10110 ) = 0;3179
2. rd(0;99997
1099 ) = 0;1
3. rd(0;012345 4. rd(0;54321
10 10
10110 2 = A:
10100 2 = A:
99 )
= 0;1235
10
100
2 = A:
115 )
= 0;5432
10
115
2 = A:
En los ejemplos 1) y 2), el exponente positivo es demasiado grande para almacenarlo en la memoria del computador, en estas condiciones se dice que el exponente está excedido de la capacidad de representación de exponentes en el computador, este caso se lo conoce como exponente en over‡ow. En el ejemplo 2) existe un over‡ow solo después de redondear. Situación análoga a la descrita precedentemente se presenta con los ejemplos 3) y 4); en tales casos se dice exponentes en under‡ow. En caso de under‡ow u over‡ow, pueden ser controlados, si por ejemplo se escribe: rd(0;012345 rd(0;54321 rd(0;31794
99
) = 0;0123
110
) = 0 2 A;
10 10 10
110
) = 0;3179
10
99
1015
2 A; 1095 :
Note que los números 0;3179 1015 , y 1095 pertenecen al conjunto A pero 0;3179 1015 1095 2 = A. Para estos casos no se satisface la relación rd(x) = x(1 + ") j"j eps: En los computadores digitales estos números x que no pertenecen al conjunto M son tratados como irregularidades o errores en los datos. En el caso de under‡ow, rd(x) puede ser indicado por 0 o se produce una detención en la ejecución del programa. En el caso de over‡ow, rd(x) es indicado como un error en x y la inmediata detención del programa en ejecución. Para evitar estos problemas es necesario incorporar en los programas contraseñas especiales o reescalar los datos de modo apropiado, lo que se traduce en elaborar programas especiales. Por lo dicho precedentemente y por abuso de lenguaje, podemos decir que existe una función rd : R ! A de…nida por rd(x) = x(1 + ") j"j eps.
1.8. ARITMÉTICA DE PUNTO FLOTANTE
1.8.
41
Aritmética de punto ‡otante
Operaciones aritméticas Hemos denotamos con A el conjunto de números de máquina. Sean x; y 2 A, en general, x + y, x y; x y; x=y y 6= 0; no son números de máquina. De…nimos las operaciones aritméticas ; ; ; llamadas operaciones de punto ‡otante, como sigue: x
y = rd(x + y);
x
y = rd(x
x
y = rd(x
x
y = rd(x=y)
y);
y); y 6= 0:
De la de…nición de la función rd, resulta que
con j"i j
eps
x
y = (x + y)(1 + "1 );
x
y = (x
x
y = (x
x
y = (x=y)(1 + "4 );
y)(1 + "3 );
y)(1 + "2 );
i = 1; 2; 3; 4:
Las operaciones en punto ‡otante pueden no ser asociativas o distributivas, así : si a; b; c 2 A; en general, a
(b
c) 6= (a
b)
c;
a
(b
c) 6= a
b
a
c:
Comprobemos con un ejemplo. Sean t = 5 el número de cifras de la mantisa; a = 0;21345 10 2 ; b = 0;33456 102 ; c = 0;33341 102 : Con estos datos, veri…quemos que a (b c) 6= (a b) c: Tenemos b
102
c = rd(0;33456
102 ) = rd(0;00115
0;33341
102 ) = 0;115
100 ;
luego a
(b
c) = rd(0;21345
Calculemos (a
b)
a
2
10
100 ) = rd(0;11714
+ 0;115
c: Para ello calculamos primeramente a
b = rd(0;21345
10
2
100 ) = 0;11714
b: Tenemos
102 ) = rd(0;33458
+ 0;33456
100 ;
102 ) = 0;33458
102 ;
a continuación (a
b)
c = rd(0;33458
102
102 ) = rd(0;00117
0;33341
El valor exacto es a + b + c = 0;1171345: Note que a Con la misma información veri…quemos que a Tenemos b c = 0;115 100 a
(b
c) = rd(0;21345
10
= rd(0;2454675 Pasemos a calcular a a a
b
a
10
10 2
Con estos resultados calculemos a a
b
a
2
10
c) se aproxima mejor a a + b + c:
c) 6= a
b
a
c: Calculemos el lado izquierdo.
100 ) = rd(0;02454675
0;115 3
100 ;
) = 0;24547
10
3
10
2
)
;
c: Entonces
b = rd(0;21345
c = rd( 0;21345
(b
(b
102 ) = 0;117
c = rd(0;71412
Claramente a (b c) = 0;24547 0;0002454675 = 0; 2454675 10 3 :
2
0;33456
0;33341 b 10
a
102 ) =
rd(0;0711663645
100 ) =
10
0;71167
1
; 1
10
;
c:
1
10
102 ) = rd(0;071411832) = 0;71412
0;71167 3
6= a
10 b
a
1
) = rd(0;00245 c = 0;245
10 10
3:
1
) = 0;245
10
3
;
Valor exacto a(b + c) =
42
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
Expresiones aritméticas y funciones. Sea E una expresión aritmética. En punto ‡otante la evaluación de E se nota con f l(E). Sea E una función real de…nida en un subconjunto I de R. El valor E(x) en x 2 I en punto ‡otante se nota con E (x) y se de…ne por E (x) = f l(E(x)): Ejemplos 1. Sean a; b; c 2 R:
a) Si E = a + (b + c), entonces f l(E) = a
b) Si E = (ab)c; f l(E) = (a
b)
c) Si E = a(b + c); f l(E) = a
(b
c):
c:
(b
c):
2. Sean a = 0;18 102 ;b = 0;3596 100 ;c = 0;1 101 ;t = 4 el número de cifras de la mantisa; calculemos a E = + c en punto ‡otante. De la de…nición de punto ‡otante de E; tenemos b f l(E) = rd([0;18 = rd(0;5006
102 102
100 ]
0;3596 0;1
0;1
101 ) = 0;5106
101 ) = rd(0;50055611
102
0;1
101 )
102 :
3. Sea E(x) = sen(x) x 2 R: Entonces E (x) = f l(sen(x)) que lo notaremos sen (x): Para t = 5; y x = ,se tiene sen( ) = 0;5; mientras que rd( ) = 0;5236 100 y en consecuencia 6 6 6 sen (0;5236 100 ) = 0;5: En el capítulo 3 se propone un algoritmo de cálculo de sen(x) x 2 R. 4. Sea E(x) = ex x 2 R. Entonces E (x) = f l(ex ) que lo notaremos ex . Si x = 0;5 y t = 5, entonces e0;5 = 1;648721171 : : : ; e0;5 = 0;16487 101 : En el capítulo 3 se propone un algoritmo de cálculo de ex x 2 R. p p p p 5. f l( x) = x ; x 0: Para t = 5; x = 0;14567; x = 0;381667395 : : : ; x = 0;38167 100 : Más p adelante se muestra un algoritmo de cálculo de x x > 0: Observación. Sean a; b 2 R. Las operaciones aritméticas en punto ‡otante se expresan de la manera siguiente. a
b = rd(rd(a) + rd(b));
a
b = rd(rd(a)
rd(b));
a
b = rd(rd(a) rd(b));
a
b = rd(rd(a)=rd(b))
rd(b) 6= 0:
Por abuso de lenguaje, a las operaciones en punto ‡otante las notaremos del mismo que las operaciones aritméticas habituales con números reales.
1.9.
Condicionamiento de funciones reales.
La calidad de la solución numérica de un problema (P ) depende fuertemente del método numérico empleado y este a su vez depende de dos componentes importantes: el condicionamiento y la estabilidad; y, para problemas cuyas soluciones se aproximan mediante sucesiones, dependen a más de los componentes anteriores, de la convergencia. En esta sección se introduce la noción de condicionamiento que es muy importantes en la construcción de algoritmos, procedimientos de cálculo y de la elaboración de programas computacionales, y que constituyen las bases que deben tenerse siempre presentes para el desarrollo de software en el cálculo cientí…co. Trataremos primeramente el condicionamiento de funciones reales de una sola variable, a continuación trataremos el condicionamiento de funciones reales en varias variables.
1.9. CONDICIONAMIENTO DE FUNCIONES REALES.
1.9.1.
43
Condicionamiento de funciones reales de una sola variable.
Sea ' : [a; b] ! R una función derivable en ]a; b[. Ponemos y = '(x) x 2 [a; b]. Investiguemos como el error absoluto 4x de x in‡uye en el cálculo de y, donde 4x = x e xyx e = rd(x): Se pone ye = '(e x): Nos interesa determinar la in‡uencia de los errores (redondeo, truncamiento) del dato de entrada x; esto es, de x en el dato de salida y = '(x); es decir en ye = '(e x) y como medir esa in‡uencia. Supongamos que la función ' es al menos dos veces derivable en ]a; b[ y que j '00 j es acotada en ]a; b[: 1 Por el desarrollo de Taylor, se tiene '(e x) = '(x) + '0 (x)(e x x) + (e x x)2 '00 ( ) con entre x y x e; y 2 1 (e x x)2 = (4x)2 < eps; lo que implica que (e x x)2 j '00 ( ) j' 0: 2 De…nición 5 El error relativo de y se de…ne mediante la relación "y = donde ye = '(e x).
ye
y y
y 6= 0;
Usando el desarrollo de Taylor en primera aproximación, tenemos
Luego,
4y = ye
y = '(e x)
'(x) = '0 (x)(~ x
"y =
ye
y y
=
x) = x '0 (x)
y x'0 (x) = "x ; y '(x)
x e
x x
= x'0 (x)"x
x 6= 0:
'(x) 6= 0:
1 Note que si '00 (x) existe, el término ( x)2 '00 (x) se redondea por 0 debido a que ( x)2 se redondea 2 por 0. De…nición 6 El número real c(x) =
x'0 (x) con '(x) 6= 0 se llama número de condicionamiento de '(x)
la función ' en el punto x: El número de condicionamiento c(x) indica cuán grande es el error relativo de y ante variaciones del dato de entrada x. Cuando j c(x) j> 1 el error relativo "y se ampli…ca y cuando j c(x) j 1 el error relativo "y se contrae. De…nición 7 Diremos que y = '(x) está bien condicionado si jc(x)j diremos que y = '(x) está mal condicionado.
1: En el caso contrario,
Ejemplos 1. Consideremos la función f de…nida por f (x) = ex x 2 R. Es conocido que la función f es derivable, y f 0 (x) = ex 8x 2 R. El número de condicionamiento de esta función está de…nido como xf 0 (x) xex c(x) = = x = x 8x 2 R: Luego f (x) e jc(x)j
1 , jxj
1 , x 2 [ 1; 1] :
Por lo tanto y = ex está bien condicionado si y solo si x 2 [ 1; 1] ; en el caso contrario la función f está mal condicionada. x
De…nimos g(x) = e n
n
x 2 R. Entonces c(x) =
xg 0 (x) g(x)
=
h x x n(e n )n
x
x 1e n
(e n )n
1 n
i
= x:
44
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES x
La utilización de g(x) = (e n )n = ex con n 2 Z+ ; x2 R es más ventajoso del punto de vista de la elaboración de un algoritmo que permita evaluar ex : 2. Sea n 2 Z+ y f la función dada por f (x) = xn c(x) =
x 2 R: Para x 6= 0, tenemos
xf 0 (x) x(nxn = f (x) xn
1)
= n:
Luego y = xn está bien condicionado si y solo si n = 1: Para n > 1; la función f está mál condicionada, esto signi…ca que la potencia xn está mal condicionada cuando n > 1. Es por esta razón que se evita el cálculo directo de las potencias. Anteriormente vimos algunos ejemplos de cálculos con polinomios en los que se evitan los cálculos directos de las potencias, de esta manera se mejora el condicionamiento con lo que se logra mejorar los resultados. 1
3. Considerar la función f de…nida por f (x) = x n con n 2 Z+ ; x > 0: El número de condicionamiento está de…nido como 1 x n1 x n 1 xf 0 (x) 1 c(x) = = = : n f (x) x n Resulta que y = x1=n está bien condicionado 8x 2 R+ ;
n 2 Z+ :
4. Sea f (x) = sen (x) x 2 R. El número de condicionamiento de esta función está de…nido como x cos(x) sen(x)
c(x) =
x 6= k ; k 2 Z.
Para el análisis del número de condicionamiento c(x) lo dividimos en dos partes. cos(x) a) Puesto que c(x) = : Entonces sen(x) x l m cos(x)
l m c(x) =
x!0
x!0
lm
x!0
sen(x) x
=
1 = 1; 1
que muestra que en x = 0 se tiene una discontinuidad evitable. Además, l m x cos(x)
l m c(x) =
x! 2
b) Por otro lado, si escribamos c(x) = jc(x)j De…nimos g(x) =
x! 2
l m sen(x)
= 0:
x! 2
x : Tenemos tan(x)
1 , jxj
jtan(x)j
x + tan(x): Resulta que g 0 (x) =
x2
i
h i h ; 0 [ 0; : 2 2
1 + sec2 (x): Entonces
g 0 (x) = 0 , cos2 (x) = 1 , x = 2k ; k 2 Z: i h i h Además g 00 (x) = 2 sec2 (x) tan(x): Luego, g 00 (x) > 0 si x 2 0; ; y g 00 (x) < 0 si x 2 ;0 : 2 2 i h Adicionalmente, g es creciente en 0; ; luego g(x) > g(0) = 0 con lo cual tan(x) > x: 2 En conclusión i h i h jc(x)j 1 , x 2 ; 0 [ 0; : 2 2 ( i h 1; si x = 0; i h i h Sea e c(x) = Entonces je c(x)j 1 8x 2 ; ; es decir que c(x); si x 2 ; 0 [ 0; : 2 2 2 2 i h : Esta propiedad será utilizada para aproximar sen(x) está bien condicionado en el intervalo ; 2 2 sen(x) mediante la serie de Taylor que se verá en el capítulo posterior.
1.9. CONDICIONAMIENTO DE FUNCIONES REALES.
45
5. Sea ' : R+ ! R función dada por '(x) = y x , donde y > 0 es …jo. Entonces x
c(x) =
ex ln(y)
ex
ln(y)
ln(y) = x ln(y):
Luego jc(x)j
1 , jxj
1 1 1 ,x2 ; jln(y)j jln(y)j jln(y)j
con y > 0; y 6= 1:
6. Sea ' : R+ ! R la función de…nida por '(x) = xy con y 2 R+ …jo. Se tiene c(x) =
x ey ln(x)
ey ln(x)
y = y: x
La función ' está bien condicionada si jyj 1: Note que si y 2 N; c(x) = y fue obtenido anteriormente: p p 7. Se desea calcular f = ( 2 1)6 . Se da una aproximación de 2 ' 1;414 y seis algoritmos para su cálculo p f1 = ( 2 f3 = (3 f5 =
1 f2 = p ; ( 2 + 1)6 1 p ; f4 = (3 + 2 2)3 p f6 = 99 70 2:
1)6 ; p 2 2)3 ;
1 p ; 99 + 70 2
¿Qué algoritmo está bien condicionado? Para responder a esta pregunta, primeramente vamos a cálcular los números de condicionamiento asociados con los p algoritmos propuestos. Para el efecto denotamos con "x el error relativo al dato de entrada x = 2. 1)6 , entonces
a) Sea f1 la función dada por f1 (x) = (x f10 (x) = 6(x
1)5 ;
f1 (1;414) = (1;414
1)6 = 0;005;
luego j"f1 j = b) Sea f2 (x) =
x 1;414 f10 (x)"x = f1 (x) 0;005
1 : Entonces f20 (x) = (x + 1)6 j"f2 j =
6
(0;414)5 j"x j = 20;636 j"x j :
6 : Resulta f2 (1;414) = 0;005 y (x + 1)7
x 1;414 f20 (x)"x f2 (x) 0;005
6 (1;414 + 1)7
c) Consideramos la función f3 de…nida como f3 (x) = (3 Tenemos f3 (1;414) = 0;005; y j"f3 j =
1;414 ( 6(3 0;005
j"x j = 3;552 j"x j :
2x)3 : Entonces f30 (x) =
1 =) f40 (x) = (3 + 2x)3
f4 (1;414) = 0;005; y 1;414 0;005
6 (3 + 2
2x)2 :
1;414)2 ) j"x j = 50;198 j"x j :
2
d ) Tal como en los casos precedentes, sea f4 (x) =
j"f4 j =
6(3
1;414)4
j"x j = 1;471 j"x j :
6 : Se tiene (3 + 2x)4
46
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES e) Sea f5 (x) =
1 =) f50 (x) = 99 + 70x
70 : Entonces (99 + 70x)2
1;414 0;005
j"f5 j =
70 j"x j = 0;5 j"x j : (99 + 70 1;414)2 70x =) f60 (x) =
f ) De la de…nición del algoritmo f6; se sigue que f6 (x) = 99 Resultaf6 (1;414) = 0;020; 1;414 0;020
j"f6 j =
70:
( 70) j"x j = 4949;0 j"x j :
Comparando los números de condicionamiento de cada una de las funciones, observamos que f5 tiene el más pequeño número de condicionamiento, esto es, f5 está bien condicionado, mientras que f6 tiene el más grande número de condicionamiento, es decir que f6 está mál condicionado y de p 6 hecho es el peor algoritmo que se puede utilizar para calcular el valor aproximado de ( 2 1) : En p p 1 p : conclusión, el mejor algoritmo para el cálculo de ( 2 1)6 con 2 ' 1;414 es f5 = 99 + 70 2
1.9.2.
Condicionamiento de funciones reales en varias variables Rn un abierto y ! ' una función de
en Rm que suponemos en todo punto de 3 2 diferenciable x) '1 (! ! 7 6 la función ' se denomina campo vectorial. Ponemos ~y = ~'(~x) = 4 ... 5 ~xT = (x1 : : : ; xn ) 2 ' (! x)
Sean
; ,
m
donde '1 ;
; 'm son campos escalares diferenciables en
:
Para ~xT = (x1 : : : ; xn ) 2 ; ponemos x ei = rd(xi ) i = 1; : : : ; n; y de…nimos x eT = (e x1 ; : : : ; x en ); ! ! T T T x =x e x . El error relativo de xi está de…nido mediante la relación: " xi =
x ~i
xi
xi
2
3 '1 (e x) 6 7 ! Se de…ne ye = ! ' (e x) = 4 ... 5 ; y, 4 y = ye 'm (~ x)
xi 6= 0;
i = 1; : : : ; n:
2
3 2 3 ye1 y1 4y1 6 7 6 .. 7 ! y = 4 ... 5=4 . 5: yem ym 4yn
yi i = 1; : : : ; m: Usando el desarrollo de Taylor en primera yi aproximación, eliminando los desarrollos de orden superior, tenemos
Determinemos el error relativo "yi =
yi = yei
yi = 'i (~ x)
Para ~xT = (x1 : : : ; xn ) 2
tal que xj 6= 0;
x ej
y en consecuencia
yi =
'i (~x) = r'i (~x): ~x =
n X j=1
xj =
(e xj
x ej
xj xj
n X
(e xj
j=1
xj )
@'i (! x) : @xj
j = 1; : : : ; n; se tiene la siguiente relación xj = xj "xj
xj 6= 0;
j = 1; : : : ; n;
n x) @'i (! x ) X @'i (! xj ) = xj "xj @xj @xj
i = 1; : : : ; m:
j=1
Luego, para yi 6= 0 i = 1; : : : ; m; se tiene n n n X X xj @'i (! xj @'i (! yi 1 X @'i (! x) x) x) " yi = = " xj = " xj = " xj xj ! yi yi @xj yi @xj 'i ( x ) @xj j=1
j=1
j=1
i = 1; : : : ; m:
1.9. CONDICIONAMIENTO DE FUNCIONES REALES.
47
Observamos que cada "yi depende de los factores de ampli…cación j = 1; : : : ; n;
xj @'i (! x) ' i (! x ) @xj
De…nición 8 El conjunto de números reales fCij (! x ) j i = 1; : : : ; m; está de…nido como !
Cij ( x ) =
xj @'i (! x) con 'i (! x ) 6= 0; ! 'i ( x ) @xj
de "xj ,
i = 1; : : : ; m;
j = 1; : : : ; ng; donde Cij (! x)
i = 1; : : : ; m;
j = 1; : : : ; n;
se llaman números de condicionamiento de la función ! ' en ! x 2 : La matriz C(! x ) = (Cij (! x ))m n se llama matriz de condicionamiento de ! ' en ! x 2 . En el caso en que m = 1, esto es, ' es un campo escalar, la matriz de condicionamiento de ' en ! x 2 ! se identi…ca con el vector …la C( x ) de…nido como C(! x) =
xi @ ' ! xn @' ! ( x ); : : : ; ! (x) ; ! '( x ) @xi '( x ) @xn
al que lo denominaremos vector de condicionamiento de ' en ! x 2 . De…nimos
3 6 6 " y1 6 6 .. 7 6 ! = = "! 6 4 5 . y 6 6 " yn 4 2
2
2
3
n X j=1
.. . n X j=1
xj @'1 ! ( x )"xj ! '1 ( x ) @xj xj @'m (! x) "xj @xj x) 'm (!
" x1 6 .. 7 ! ! = C(! donde " ! =4 . : x )! "! 5 : Así, " ! x x y "xn
3
7 7 7 7 ; x )! "! 7 = C(! x 7 7 5
! De…nición 9 Se dice que ! y =! ' (! x ) está bien condicionado en ! x 2 si y solo si j Cij ( x ) j 1 8i = 1; : : : ; m; j = 1; : : : ; n. En el caso contrario, se dice que ! y =! ' (! x ) está mal condicionado en ! x 2 :
Para determinar el condicionamiento de un campo vectorial diferenciable ! ' en ! x 2 se deben estudiar ! todos los números de condicionamiento Cij ( x ) i = 1; : : : ; m; j = 1; : : : ; n. Hacemos notar que solo en pocos casos es posible determinar ! x tal que j Cij (! x ) j 1. En la generalidad de los casos, es muy ! difícil y casi imposible determinar x tal que j Cij (! x ) j 1; por lo que se recurre a otros procedimientos para estimar el condicionamiento. Así, en algunos casos el número de condicionamiento C se de…ne por la desigualdad (cociente de Raileygh-Ritz): k! ' (e x) ! ' (! x) k ! ! k '(x) k
C
kx e ! x k ! k x k
! ' (! x ) 6= 0;
! x 6= 0;
donde C > 0 es el número de condicionamiento. Ejemplos
1. Sea ' la función de R2 en R de…nida como '(x; y) = x + y (x; y) 2 R2 : Supongamos que para (x; y) 2 R2 se tiene z = '(x; y) 6= 0: Determinemos el error relativo de z. Este está dado como sigue: x @' y @' x y "z = (x; y) "x + (x; y) "y = "x + "y : '(x; y) @x '(x; y) @y x+y x+y
48
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES x Los números de condicionamiento de ' en (x; y) 2 R2 están de…nidos como Cx = ; x+y y Cy = , y el vector de condicionamiento de ' en (x; y) 2 R2 está de…nido como C(x; y) = x+y x y : ; x+y x+y Analicemos los números de condicionamiento Cx y Cy : x > 0; x < 0; condicionado. a) Si
y > 0; o entonces j Cx (x; y) j< 1; y < 0;
j Cy (x; y) j< 1: Luego z = '(x; y) está bien
b) Si x > 0 e y < 0 tal que x 6= y, entonces al menos uno de los números jCx j o jCy j es mayor que 1; en cuyo caso z = '(x; y) está mal condicionado. En conclusión, la suma de dos números positivos (respectivamente negativos) está bien condicionada, mientras que la suma de dos números uno positivo y otro negativo está mal condicionada, esto equivale a decir que si x; y son números reales positivos, la resta x y está mal condicionada y consecuentemente la resta de dos números positivos es una operación peligrosa fundamentalmente si x 6= y; x ' y: El resultado que acabamos de obtener se puede extender a sumas de tres o más números reales. Así, sean x1 ; ; xm 2 R y z = x1 + + xm : Entonces z está bien condicionado si y solo si xi > 0 8i = 1; ; m (respectivamente xi < 0 8i = 1; ; m); en el caso contrario tenemos que z está mal condicionado, más áun, las sumas y restas alternadas de números reales positivos está mal condicionada, por lo que este tipo de cálculos son peligrosos ya que ampli…can los errores. Para aclarar más estas ideas, sean x1 ; ; x2m 2 R+ y z = x1 x2 + x3 x4 + + x2m 1 x2m : Esta suma está mal condicionada, ¿cómo mejorar el resultado? Ecribimos z en la siguiente forma z = x1 + x3 +
+ x2n
x2
1
x4
x2m = x1 + x3 +
+ x2n
1
(x2 + x4 +
+ x2m )
La sumas z1 = x1 + x3 + + x2n 1 ; z2 = x2 + x4 + + x2m están bien condicionadas, luego z = z1 z2 con lo que se mejora el resultado. Más adelante se exhiben ejemplos. 2. Sea ' la función de R2 en R de…nida como '(x; y) = xy (x; y) 2 R2 : Supongamos que para (x; y) 2 R2 se tiene z = '(x; y) 6= 0; esto es x 6= 0; y 6= 0; entonces, C(x; y) =
x @' y @' (x; y); (x; y) '(x; y) @x '(x; y) @y
=
x y y; x xy xy
= (1; 1):
Se tiene que Cx (x; y) = 1; Cy (x; y) = 1; por lo que el producto de dos números reales no nulos está bien condicionado y por tanto el producto de dos números no es una operación peligrosa. 3. Sean p; q 2 R tales que p2 raíces reales son x1 =
1 2
p+
p
4q
p2
0. Consideramos la ecuación: x 2 R tal que x2 + px + q = 0 cuyas 4q ;
x2 =
1 2
p
p p2
4q ; donde p2
4q
0:
Estas raíces dependen de p y q; lo que nos permite de…nir las funciones reales ', como 8 p > < '(p; q) = 1 p + p2 4q ; 2 (p; q) 2 R2 tal que p2 4q 0: p 1 > 2 : (p; q) = p+ p 4q ; 2 La función ' está asociada a la raíz x1 mientras que la función está asociada a la raíz x2 : Estudiemos el condicionamiento de la primera raíz, esto es, el condicionamiento de la función '. Tenemos 8 p > @' p + p2 4q > > p (p; q) = ; < @p 2 p2 4q (p; q) 2 R2 tal que p2 4q > 0: 1 > @' > > (p; q) = p ; : @q p2 4q
1.10. PROPAGACIÓN DE LOS ERRORES.
49
Luego
p p + p2 4q p "p + p "q : p2 4q 2 p2 4q 8 p > p ; > < Cp (p; q) = p2 4q p Los números de condicionamiento de ' están de…nidos como p + p2 4q siempre > > ; : Cq (p; q) = p 2 2 p 4q que (p; q) 2 R2 tal que p2 4q > 0: Analicemos cada uno de estos números de condicionamiento. Si q < 0; se tiene p p p + p2 4q p p < 1; < 1; p2 4q 2 p2 4q p @' q @' "' = "p + "q = '(p; q) @p '(p; q) @q
p
con lo cual x1 = '(p; q) está bien condicionado. Si q > 0 tal que p2 +4q > 0; ' está mal condicionado. El número de condicionamiento j Cp (p; q) j es mucho más grande aún en la situación siguiente: (p; q) 2 R2 tal que q > 0, p2 ' 4q de modo que p2 + 4q > 0: Esto nos muestra que no es conveniente calcular x1 con la fórmula arriba propuesta, sino con la que se obtiene del modo siguiente: 1 x1 = 2
p+
p
p2
1 4q = 2
p+
p
p2 p
4q p
p p2
p
p2
4q
2q p p + p2
=
4q
4q
:
Veamos un ejemplo numérico de esta situación. Consideremos la ecuación x 2 R solución de p 1 62;10 + (62;10)2 4 = 0;1610723 10 1 : Efectuemos x2 + 62;10x + 1 = 0: Entonces x1 = 2 el cálculo de x1 con 4 cifras decimales en aritmética de punto ‡otante, se tiene p x ~1 = f l(x1 ) = 0;5 100 0;6210 102 + (0;6210 102 ) 0;4 101 = 0;5
100 ( 0;6210
102 + 0;6206
102 ) =
0;2
10
2
:
Utilicemos ahora la nueva escritura de x1 : Obtenemos e t1 = f l(x1 ) =
0;2 0;6210
101 0;1 101 = 102 + 0;6207 102
0;2 101 = 0;1242 103
0;1610
101 :
Se observa que e t1 es una mejor aproximación de x1 :
Nota. Tomando en consideración el valor absoluto de los números de condicionamiento, de los ejemplos se establece la jerarquía de las operaciones siguientes: la radicación de números reales positivos, la suma de números reales positivos (respectivamente suma de números reales negativos) son consideradas operaciones no peligrosas. A continuación se tiene el producto y cociente de números reales. La potenciación está bien condicionada si el exponente es igual a 1, por este motivo el esquema de Hörner evita el cálculo directo de las potencias. La suma de números reales de signos opuestos es una operación peligrosa ya que al menos un número de condicionamiento es mayor que 1 lo que ampli…ca los errores. Por esta razón debe evitarse sumas sucesivas con números reales de signos opuestos. De preferencia deben escribirse los algoritmos de modo que se tengan sumas de números positivos y reducir como sea posible las sumas de números con signos opuestos. Igualmente, debe evitarse el cálculo directo de las potencias con exponentes mayores que 1.
1.10.
Propagación de los errores.
Ejemplos 1. Sean a; b; c; 2 R, y E = a + b + c. Se tiene E = a + (b + c) = (a + b) + c = (a + c) + b; y por tanto se disponen de tres algoritmos para evaluar E.
50
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Primer algoritmo. Tenemos E = a + (b + c); que puede verse como la composición de funciones siguiente: 2
3 2 3 a a 0 4 1 4 b 5 '! 5 '! a + (b + c); c b+c x y+z
donde '0 : R3 ! R2 es la función de…nida por '0 (x; y; z) =
; y '1 : R2 ! R es la función
dada por '1 (u; v) = u + v. Luego E = ('1 '0 )(a; b; c) = '1 ('0 (a; b; c)) = '1 (a; b + c) = a + (b + c): Segundo algoritmo. En este caso E = (a + b) + c; que puede expresarse como el resultado de la siguiente composición de funciones: 2 3 2 3 a a+b 0 4 1 4 b 5 '! 5 '! (a + b) + c; c c x+y ; '1 : R2 ! R es la función z de…nida por '1 (u; v) = u + v. Se tiene E = (a + b) + c = ('1 '0 )(a; b; c):
donde '0 : R3 ! R2 es la función de…nida por '0 (x; y; z) = De manera análoga se formula el tercer algoritmo.
e = f l((a + b) + c): Según Consideremos el segundo algoritmo, esto es E = (a + b) + c: Pongamos E las operaciones elementales en punto ‡otante, tenemos: = f l(a + b) = (a + b)(1 + "1 ); e = f l( + c) = ( + c)(1 + "2 ) = [(a + b)(1 + "1 ) + c](1 + "2 ) E = a + b + c + (a + b)"1 + (a + b + c)"2 + (a + b)"1 "2
= E + (a + b)"1 + y "2 + (a + b)"1 "2 :
Luego, "E = Puesto que j"1 j
e E
E E
eps; j"2 j
= "2 +
a+b (1 + "2 )"1 a+b+c
si E = (a + b) + c 6= 0:
eps, se tiene que "1 "2 ' 0; entonces "E = "2 +
a+b "1 : a+b+c
Para el primer y tercer algoritmos, procediendo en forma similar al segundo, se obtienen respectivamente los resultados siguientes: e "E = e "2 +
b+c ~"1 ; a+b+c
b "E = b "2 +
a+c b "1 : a+b+c
Si a; b; c son positivos o todos negativos, los 3 algoritmos están bien condicionados. Mientras que si, por ejemplo, a < 0, y, b; c son positivos, la evaluación de y dependerá del algoritmo. Sean a = 0;33341 102 ; b = 0;21345 de precisión, tenemos a+b a+b+c b+c a+b+c a+c a+b+c
=
10
2;
c = 0;33456
102 : Calculando con 5 cifras decimales
0;33341 102 + 0;21345 10 2 0;33341 102 + 0;21345 10 2 + 0;33456
= 285;63; = 0;982:
102
=
284;6;
1.10. PROPAGACIÓN DE LOS ERRORES.
51
El algoritmo a elegir es (a + c) + b. Observe los resultados siguientes: (a + b) + c = 0;117;
(b + c) + a = 0;117;
; (a + c) + b = 0;11713:
Valor exacto E = a + b + c = 0;1171345: 2. De manera más general, sean a1 ; : : : ; an 2 R
y E=
n X
ai .
i=1
El algoritmo (no e…ciente) para la evaluación de E es el siguiente: Algoritmo Datos de entrada: n; a1 ;
; an :
Datos de salida: E: 1. E = a1 : 2. Para k = 2; : : : ; n E = E + ak : Fin de bucle k 3. Fin. Como en cada paso del bucle del algoritmo, se suma un dato, este procedimiento se formula usando funciones como sigue: 2 3 2 3 2 3 a1 a1 + a2 a1 + a2 + a3 6 a2 7 ' 6 7 ' 6 7 a3 a4 'n 2 6 7 1 6 7 2 6 7 ! 6 .. 7 ! 6 7 !6 7 ! .. .. 4 . 5 4 5 4 5 . . an
an
an
a1 + a2 + + an an donde '1 ; '2 ; :::; 'n
1
'2 : R .. .
n 1
!R
: R2 ! R;
1
1
!
n X
ai ;
i=1
se denominan funciones elementales de…nidas como sigue:
' 1 : Rn ! R n
'n
'n
1
1
;
n 2
'1 (a1 ; : : : ; an ) = (a1 + a2 ; a3 : : : ; an ); ;
'n
'2 (x1 ; : : : ; xn 1 (u; v)
1)
= (x1 + x2 + x3 ; : : : ; xn
1 );
= u + v:
Entonces E =
'n
= 'n .. .
1 1
'n 'n
= 'n 1 'n n X = ai :
2 2
2 (a1
'2 '1 (a1 ; : : : ; an ) = 'n '2 (a1 + a2 ; a3; : : : ; an ) = 'n + a2 +
+ an
2 ; an 1 ; an )
'n
1 1
= 'n
'2 ('1 (a1 ; : : : ; an ))
2
'n 1 (a1
2
+ a2 +
'3 (a1 + a2 + a3 ; a4; : : : ; an ) + an
1 ; an )
i=1
3. Sean a; b 2 R. Supongamos que debemos calcular E = a2 b2 = (a + b) (a b) : Sabemos que a2 b2 = (a + b) (a b) ; por lo tanto E puede calcularse de dos maneras: E = a2 b2 y E = (a + b) (a b) : Podemos describir estos dos procesos de cálculo mediante funciones reales apropiadas que describan cada operación elemental que se realiza. Primer procedimiento: el cálculo de E = a2 b2 podemos realizarlo mediante la siguiente secuencia de funciones: a '0 a2 '1 2 ! !a b2 ; b b2
52
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES donde '0 es la función de R2 en sí mismo de…nida como '0 (a; b) = a2 ; b2 (a; b) 2 R2 ; '1 es la 2 2 función de R en R de…nida por '1 (u; v) = u v (u; v) 2 R : Entonces, por la composición de funciones, tenemos E = ('1 '0 ) (a; b) = '1 (a2 ; b2 ) = a2
b2
8(a; b) 2 R2 .
Segundo procedimiento: el cálculo de E = (a + b) (a b) se ejecuta mediante la aplicación de las siguientes funciones a '0 a + b '1 ! ! (a + b)(a b); b a b con '0 la función de R2 en R2 de…nida como '0 (a; b) = (a + b; a b) (a; b) 2 R2 ; '1 función de R2 en R de…nida '1 (x; y) = x y 8(x; y) 2 R2 : Mediante la composición de funciones se veri…ca inmediatamente que E = ('1 o 'o )(a; b) 8(a; b) 2 R2 . Observación. Supongamos en calcular y1 ; : : : ; ym a partir de datos de entrada 3 2 consiste 2 que3un problema y1 x1 ! 7 7 6 6 ' : D ! Rm tal x1 ; : : : ; xn : Ponemos x = 4 ... 5 ; ~y = 4 ... 5 : Supongamos que existe una función ! ym
xn
que
2
3 '1 (! x) 6 7 ! y =! ' (! x ) = 4 ... 5 ! ' (x)
! x 2 D;
m
donde D
Rn ,
'j : D ! R;
j = 1; : : : ; m.
En cada etapa del cálculo hay un conjunto de números a operarse a partir de datos de entrada xi ; i = 1; : : : n y cada operación corresponde a la transformación del nuevo conjunto a operarse. Escribamos secuencialmente el conjunto de datos a operarse como un vector. 2 (i) 3 x1 6 .. 7 ! (i) n x =4 . 5 2 R i; (i)
xni
y asociamos la operación elemental con una función: ! ' (i) : Di ! Rni+1 ;
Di
Rni ;
de modo que ! x (i+1) = ~'(i) ~x(i) ; donde ! x (i+1) es el resultado de la transformación del conjunto operado y la función '(i) está de…nida de modo único salvo permutaciones en las operaciones ! x (i) y ! x (i+1) . Dado un algoritmo para el cálculo de ! y = ! ' (! x ), la secuencia de operaciones elementales de la descomposición de ! ' en una secuencia de funciones elementales: ! ' (i)
:
Di ! Di+1
!
' = ' ~ (r)
D0 = D;
i = 0; 1; : : : r;
!(r 1)
~ (0) ; '
'
Dr+1
Rni ;
Di
Rnr+1 = Rm ;
que caracterizan al algoritmo. Así ! y = ! ' (! x) = ! ' (r) ! ' (r = ! ' (r) ! ' (r
1)
! x (r
1)
1)
! ' (0) (! x) =! ' (r) ! ' (r
1)
=! ' (r) (xr ):
Para mejor comprensión observe los ejemplos 1), 2) y 3) de esta sección.
! ' (1) ! ' (0) (! x)
1.11. ESTABILIDAD NUMÉRICA. CONVERGENCIA.
1.11.
53
Estabilidad numérica. Convergencia.
Sean D Rn y ! ' : D ! Rm una función. Ponemos ! y = ! ' (! x) cómputo de ~y = '(~x), digamos ! y =! 'r
1
! 'r
! x 2 D: Dado un algoritmo de
! '2 ! ' 1 (! x );
2
en aritmética de punto ‡otante, errores en los datos de entrada y errores de redondeo en los resultados intermedios perturbarán los mismos y en consecuencia afectarán en el resultado …nal. ! ! Sea " 2 Rn y x " = ~x + ~" el dato de entrada perturbado. Sea ! y"= ! ' r 1 'r 2 '2 ! ' 1 (! x " ): ! ! ! ! ! ! Interesa comparar los resultados obtenidos y = ' ( x ); y y " = ' r 1 'r 2 '2 ' 1 (! x " ); es decir, como los errores de redondeo, de truncamiento afectan en el resultado …nal mediante la ejecución de la secuencia indicada ! ' r 1 'r 2 '2 ! ' 1:
De…nición 10 De manera general, diremos que un algoritmo es estable numéricamente con respecto de otro si pequeñas variaciones en los datos de entrada producen pequeñas variaciones en los datos de salida. Un algoritmo será inestable si pequeñas variaciones en los datos de entrada producen grandes variaciones en los datos de salida. En Análisis Numérico, el estudio de la estabilidad numérica tiene mucha importancia, pués para construir un algoritmo, entre uno de los requerimientos a veri…car es el de la estabilidad numérica. Si este requisito no es veri…cado no puede aceptarse al algoritmo como buen algoritmo y puede ser desechado. De…nición 11 Sea V un espacio normado provisto de la norma k k : Supongamos que la solución S de un problema (P ) propuesto en V se aproxima mediante un algoritmo que genera a Sn aproximación de S; n = 1; 2; : : : ; en el sentido siguiente: 8" > 0; 9n0 2 Z+ tal que 8n
n0 =)k Sn
S k< ";
en tal caso diremos que el algoritmo es convergente. Dado un problema (P ) y propuesto un algoritmo de solución, este debe ser bien condicionado y numéricamente estable. Si además el algoritmo genera una sucesión (Sn ), debe veri…carse que la sucesión (Sn ) converge a S. Por lo tanto, la elaboración de un algoritmo implica el estudio del condicionamiento, estabilidad numérica y convergencia. Notemos que un resultado importante del análisis numérico es el siguiente: si un algoritmo está bien condicionado y es numéricamente estable entonces el algoritmo es convergente. Usaremos la notación: condicionamiento + estabilidad =) convergencia. (1)
(2)
Cuando hay dos o más formas o métodos de construcción de sucesiones (Sn ), (Sn ) que convergen a S; es importante estudiar no solo la convergencia sino el orden de convergencia de cada método, con lo que se puede precisar las bondades y las limitaciones de cada uno de ellos. Ejemplos
1. Sea fai j i = 1; : : : ; 10000g un conjunto de números reales tales que a1 = 1; a2 = y para i = 11; : : : ; 10000; j ai j' 6 máquina eps = 5
10
4
10
3.
Sea S =
10000 P i=1
a2i : Calcular S con una precisión de
y que se adapte a la estabilidad numérica.
Consideremos dos algoritmos para la evaluación de S:
1 1 ; : : : ; a10 = 2 10
54
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES i = 2; : : : ; 10000 Como para i = 11; : : : ; 10000; S = S + a2i : siendo eps = 5 10 4 resulta que a2i ' 0; con lo cual
Primer algoritmo. Ponemos S = 1; y para jai j ' 6
10
3,
entonces a2i ' 0;36 10000 X
4
10
a2i = 1 +
i=1
1 1 + : : : + 2 = 1;5498 = S1 : 2 2 10
Segundo algoritmo. Sea jbi j = 100 jai j ' 6 10 1 , entonces b2i ' 0;36 10o > eps; i = 11; : : : ; 10000. Ponemos 10000 X 1 1 S2 = 1 + 2 + : : : + 2 + 10 4 (100ai )2 : 2 10 i=11
Ahora bien,
10000 X i=11
Luego
(100ai )2 ' 10000
S2 = 1 +
0;36
1 1 + : : : + 2 + 10 2 2 10
4
10o = 0;36
10000 X i=11
104 :
(100ai )2 ' 1;9098:
El primer algoritmo es numéricamente inestable, el segundo algoritmo es numéricamente estable. La razón de la inestabilidad numérica del primer algoritmo se encuentra en el cálculo de a2i que está mal condicionado, pués ai "a2 = 2 2ai "ai = 2"ai ; i ai donde "ai es el error relativo de ai : Así, el número de condicionamiento de cada a2i es mayor que 1 lo cual ampli…ca el error relativo y lo vuelve inestable para ai muy pequeño. Determinemos el error relativo en porcentaje para cada algoritmo. Se tiene S=
10000 X i=1
a2i ' 1;9094:
Para el primer algoritmo j"1 j =
S1
S
j1;5498 1;9094j 1;9094
100 =
S
100 = 18; 8 %:
Para el segundo algoritmo j"2 j =
S2
S S
100 =
j1;9098 1;9094j = 0;00019 %: 1;9094
Se observa claramente que el segundo algoritmo es mejor que el primero. 2. Se de…ne la función real ' como ' (x) =
senh (x) x 6= 0: Se desea calcular valores de ' (x) : x 1 no se presenta ninguna di…cultad en el cálculo de ' (x) : 2
Primeramente, para x 2 R tal que jxj Obviamente, senh (x) senh (x) = lm = 1: lm x!1 x! 1 x x
1 1 ; 0 [ 0; : Con el uso de una calculadora de 2 2 bolsillo, se tienen los siguientes resultados: para x = 10 100 ; senh 10 100 = 0; luego Nos interesamos en calcular ' (x) para x 2
' 10
100
=
senh 10 100 = 0; 10 100
1.11. ESTABILIDAD NUMÉRICA. CONVERGENCIA.
55
lo que es falso. Para x 2
0;
1 2
su…cientemente pequeño, podemos suponer x < eps; ¿cómo calcular ' (x) si
senh (x) = 1: Para responder a la pregunta, recurrimos a x la de…nición de la función seno hiperbólico y por el polinomio de Taylor con resto (véase el apéndice) se tiene para x 2 R senh (x) ' 0 y x ' 0? Sabemos que l m
x!1
senh (x) =
1 x e 2
e
x
=x+
x3 x5 + + 3! 5!
+
x2n+1 + E2n+1 (x) ; (2n + 1)!
con Em (x) el error de aproximación del polinomio de Taylor de…nido como Em (x) =
x
1 1 e2 + e 2
0
1 2
si x 2 0;
Por lo tanto, para x 2 0;
c 0, 9m0 2 Z+ tal que 8m
o bien
1 X
k=m0 +1
1 < ": k!(n + k + 1)
m0 )
1 X k=0
1 k!(n + k + 1)
m X k=0
1 < "; k!(n + k + 1)
60
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES Sea (ak ) una sucesión de números positivos tal que 1 k!(n + k + 1) 0 entonces nfo= 0; a < 0 entonces inf o = 1: Algoritmo 2 Datos de entrada: a; n; m: Datos de salida: S = a1=n : Si n par, hacer indi = 0; 1. Si n impar, hacer indi = 1: Si a > 0; hacer inf o = 0; 2. Si a < 0; hacer inf o = 1: 3. Si indi = 0 e inf o = 1; Imprimir, “Error”. Continuar en 11: 4. Si indi = 1 e inf o = 1: Hacer c = a: Continuar en 6: 5. Poner c = a: 6. Determinar j 2 N el más pequeño tal que b = 10 jn c < 1: 7. Poner x = 1: 8. Para k = 1; : : : ; m b 1 (n 1)x + n 1 xk = n x x = xk : Fin bucle k 9. Si indi = 1 e inf o = 1: Hacer x = xk : Poner S = 10j x: 10. Imprimir resultados: S: 11. Fin.
64
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 7. Ejemplo de un método numérico impracticable. a1 b1 a2 b2 a1 x + b1 y = c1 ; es invertible. Consideramos el sistema de ecuaciones lineales: (x; y) 2 R2 tal que a2 x + b2 y = c2 : Puesto que A es invertible, este sistema de ecuaciones tiene solución única (x; y) 2 R2 : Calculemos esta solución. Para el efecto se disponen de dos métodos. El primero es el conocido método de Cramer cuya solución se calculan como se muestra a continuación
Sean a1 ; a2 ; b1 ; b2 ; c1 ; c2 2 R: Supongamos que a1 ; a2 ; b1 ; b2 son no nulos y la matriz A =
x=
c1 b1 c2 b2 a1 b1 a2 b2
;
y=
a1 c1 a2 c2 a1 b1 a2 b2
;
a b a b = ad bc denota el determinante de la matriz real . El segundo c d c d método que consideramos es el de eliminación gaussiana que se indica a continuación: se cala2 cula k = ; y se obtiene el sistema de ecuaciones lineales triangular superior siguiente: a1 8 c2 + kc1 > < ; y= a1 x + b1 y = c1 b2 + kb1 cuya solución se calcula como sigue: Con1 (b2 + kb1 ) y = c2 + kc1 ; > : x= (c1 b1 y) : a1 tabilicemos el número de operaciones que se realizan con cada método. Con el método de Cramer, c1 b1 el cálculo del determinante = c1 b2 c2 b1 implica tres operaciones elementales. Como se c2 b2 deben calcular tres determinantes y dos cocientes, resultan 11 operaciones elementales. Con el método de eliminación gaussiana se tienen las siguientes operaciones elementales: en el cálculo de k se realiza un cociente, el cálculo de y implica 5 operaciones elementales y el de x implica 3 operaciones elementales. En total se requieren de 9 operaciones elementales. donde
A juzgar por el número de operaciones elementales, el método de eliminación gaussiana realiza 2 operaciones elementales menos que en el de Cramer. A más de esta razón, el método de eliminación gaussiana es mucho más estable numéricamente. En conclusión, para resolver numéricamente un sistema lineal de dos ecuaciones con dos incógnitas, se debe aplicar el método de eliminación gaussiana. En lo sucesivo consideraremos sistemas de ecuaciones lineales Ab x = bb; donde A = (aij ) 2 Mn ! A 6= 0 y b 2 Rn .
n [R]
con
Llamamos método directo de resolución del sistema de ecuaciones lineales, un método que conduce a la solución del problema al cabo de un número …nito de pasos, o bien en un número …nito de operaciones aritméticas (suma, resta, multiplicación y división) que es función de la dimensión del sistema. Para cada método directo estudiado, se debe estimar: i) El número de operaciones elementales necesarias en la ejecución del algoritmo, es decir que se debe determinar una función Noper : Z+ ! R que a cada n 2 Z+ asocie Noper (n). ii) Precisión del método. Esta precisión depende sobre todo del condicionamiento de la matriz y de la estabilidad del método, es decir que pequeños errores en los datos de entrada provocan pequeños errores en los datos de salida, o lo que es lo mismo, es insensible a la propagación de errores de redondeo. Supongamos que para resolver el sistema de ecuaciones lineales utilizamos la regla de Cramer: xi =
i
det(A)
i = 1; : : : ; n;
1.11. ESTABILIDAD NUMÉRICA. CONVERGENCIA.
65
! donde i es el determinante de la matriz obtenida al reemplazar la columna i-ésima de A por b , det(A) 6= 0. Estimemos el número de operaciones elementales que se requieren para el cálculo de un determinante de una matriz C de n n: Para el efecto, determinemos el número de operaciones elementales que se requieren para calcular determinantes de orden 2 y 3: Para calcular el determinante de una matriz C de 2 productos : 2 = 2!
1;
2 se efectúan las siguientes operaciones: adiciones : 1 = 2!
1;
luego Noper (2) = 3 operaciones elementales. Si C es una matriz real de 3 det(C) = C11
C22 C23 c32 C33
C12
C21 C23 C31 C32
3, C = (Cij )3x3 , entonces
C21 C22 C31 C32
+ C13
;
y el número de operaciones elementales se obtiene del modo siguiente: el cálculo de cada determinante de 2 2 requiere de 3 operaciones elementales, de la descomposición precedente, se obtiene multiplicaciones : 9 = 3
2 + 3;
sumas : 5 = 3
1 + 2;
con lo que Noper (3) = 14 operaciones elementales. En general, si C es una matriz de n
n, se tiene
multiplicaciones :
j n X1 Y
(n + 1
k);
sumas : n!
1:
j=1 k=1
El número de operaciones elementales aplicando el método de Cramer es: multiplicaciones : (n + 1)
j n X1 Y
(n + 1
k);
j=1 k=1
sumas : (n + 1)(n!
1);
divisiones : n; con lo cual N oper(n) = n + (n + 1)(n!
1) + (n + 1)
j n X1 Y
j=1 k=1
(n + 1
k) = (n + 1)! + (n + 1)
j n X1 Y
(n + 1
k):
j=1 k=1
Así, N oper(5) = 330 operaciones elementales, N oper(6)=1961 operaciones elementales. Note el tiempo que se requeriría para resolver un sistema de ecuaciones lineales de 5 5 usando una calculadora de bosillo: aproximadamente medio minuto por operación implica aproximadamente 165 minutos el tiempo requerido para resolver dicho sistema de ecuaciones, ¿cuánto tarda usted en resolver un tal sistema? Si despreciamos los n 2 términos del sumatorio, tenemos N = 2(n + 1)! y para n = 20, se obtiene N ' 1;021818893 1020 < N oper(20) que muestra que este método es impracticable. Con otros métodos, un sistema de ecuaciones lineales de 5 5 y con el uso de una calculadora de bolsillo y con el tiempo estimado de medio minuto por operación, se requerirá aproximadamente una hora; un sistema de ecuaciones lineales de 20 20 y con el uso de los computadores actuales requerirá de fracciones de segundo. Por otra parte, las operaciones sumas y restas alternadas incrementan los errores de redondeo, que a su vez deterioran la calidad de la solución. Más aún, cuando n es demasiado grande, a causa de los errores de redondeo, puede provocarse un over‡ow lo que a su vez provocará una detención en la ejecución del programa. Por estas razones, el cálculo del determinante mediante este procedimiento de…nitivamente es impracticable, pués es mal condicionado e inestable numéricamente. Consecuentenemente, para el cálculo del determinante de una matriz debe aplicarse otros métodos y algoritmos que son relativamente económicos y fáciles de programarse e implementarse en un PC.
66
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
En conclusión, si se utiliza la regla de Cramer para hallar la solución del sistema de ecuaciones lineales ! A! x = b ; del punto de vista numérico es impracticable. ! Si A es una matriz invertible, la solución del sistema de ecuaciones lineales A! x = b tiene una única solución ! ! x = A 1 b; donde A
1
=
1 D t det(A) (A )
y AD = [( 1)i+j menor (aij )] i = 1; :::; n; j = 1; :::; n.
El cálculo de la matriz AD implica el cálculo de n2 determinantes de matrices de (n 1) (n 1). ! Adicionamos a esto el cálculo de det(A) y a continuación el producto de A 1 por b . Mediante un razonamiento similar al precedente se puede mostrar que el número de operaciones elementales N oper(n) es muy grande, con lo cual este método es igualmente impracticable. Más aún, si se toma en consideración los errores de redondeo, estos pueden ser muy grandes lo que conducirá a resultados completamente distorsionados. En de…nitiva, se trata de un método mal condicionado e inestable numéricamente, por lo tanto inutilizable del punto de vista numérico. Más adelante se tratan métodos directos de resolución de sistemas de ecuaciones que son fáciles de aplicarse con un número de operaciones N oper(n) muy razonable:
1.12.
Ejercicios
1. Sean T un triángulo cuyos vértices son ! u 1 = (x1 ; y1 ) ; ! u 2 = (x2 ; y2 ) ; ! u 3 = (x3 ; y3 ) 2 R2 que ! suponemos son no colineales y distintos, y, un punto dado x = (a; b) 2 R2 : Se considera el siguiente problema: determinar si (a; b) 2 T o (a; b) 2 = T: Fundamentar matemáticamente la solución del problema y elaborar un algoritmo numérico. Determine el número de operaciones elementales, asignaciones, comparciones. Realice comprobaciones de su algoritmo. 2. Se considera un triángulo T cuyos vértices son ! u 1 (x1 ; y1 ) ; ! u 2 = (x2 ; y2 ) ; ! u 3 = (x3 ; y3 ) 2 R2 : ! ! ! Suponemos que u 1 ; u 2 ; u 3 son distintos y no colineales. Elaborar un algoritmo que permita calcular su perímetro y su área. Recuerde que si ! x;! y 2 R2 ; la métrica ecuclídea d está de…nida 1 como d (! x;! y ) = k! x ! y k y k! xk= ! x T! x 2 : Determine el número de operaciones elementales. Realice comprobaciones de su algoritmo.
3. Sean ! u 1 = (x1 ; y1 ) ; ! u 2 = (x2 ; y2 ) ; ! u 2 = (x3 ; y3 ) 2 R2 los vértices de un triángulo T . Supongamos ! ! ! que u 1 ; u 2 ; u 3 son distintos y no colineales. Elaborar un algoritmo que permita calcular los ángulos interiores del triángulo T y determinar si T es un triángulo rectángulo, isósceles o escaleno. Calcule el número de operaciones elementales y de comprobaciones. 4. Se consideran ! u 1 = (x1 ; y1 ) ; ! u 2 = (x2 ; y2 ) ; ! u 3 = (x3 ; y3 ) ; ! u 4 = (x4 ; y4 ) puntos de R2 dados. Suponemos que dichos puntos son distintos y al menos tres de ellos no son colineales. Elabore un algoritmo que permita identi…car si el cuadrilátero es un paralelogramo y en este caso identi…car si es un rectángulo. Además, se debe calcular el área de dicho cuadrilátero. Determine el número de operaciones elementales, asignaciones y comprobaciones. Realice pruebas para veri…car su algoritmo. 5. Sean a; b; c; d 2 R y A = 1 ad
bc
d c
b a
a b c d
una matriz invertible. Obviamente ad
bc 6= 0 y A
1
=
:
p r 1 p p r 0 r p = ; = ; o sea q s 0 q q s 1 s q a b x 1 r es la solución del sistema de ecuaciones = y es la solución del sistema c d y 0 s a b x 0 = de determinan las columnas de A 1 : Elabore un algoritmo que resuelva los c d y 1 dos sistemas de ecuaciones lineales de modo que el número de opreaciones elementales sea el más pequeño posible y escriba A 1 : Compruebe con las siguientes matrices: Ponemos A
1
=
p r q s
: Note que
1.12. EJERCICIOS 2 0 0 5
a)
67
: b)
3 0
2 8
1 2 5 2
: c)
6. Sean A; B; C matrices reales de 2 para calcular la matriz D: a) D = A (B + C) : b) D = AB
p 1 p p2 5 3 2 5
: d)
:
2: En cada item se de…ne una matriz D; elabore un algoritmo C: c) D = (A
B) C + I con I la matriz identidad.
A) C: e) D = B I + A + A2 + A3 + A4 C: f ) D = B I
d) D = C (B
A + A2
A3 + A4 C:
Compruebe cada algoritmo con las siguientes matrices: A=
2 3 1 4
;
B=
1 0 0 2
;
3 5 2 1
C=
:
7. a) Sea A una matriz real no nula de m m: Se de…ne A un algoritmo que permita calcular An :
= A y An+1 = An A para n 2 N: Elabore
1
2
6 1 b) Veri…que su algoritmo con n = 3 y la matriz siguiente A = 4 1 3 2 3 1 0 1 2 6 7 3 7 1 c) Si A = 6 4 2 0 5 ; aplique su algoritmo y calcule A : 2 1 1 3
3 1 2 7 5: 1
8. Aplique el método de eliminación gaussiana con pivoting parcial para hallar, si existe, la solución de cada uno de los sistemas de ecuaciones lineales que se proponen. En caso de calcular la solución, compruebe. De no ser posible, indique si el sistema de ecuaciones tiene in…nitas soluciones o ninguna solución. 8 8 8 > > > 3x + y z = 5 x + 2y + 3z = 2 4x + y z = 5 > > > > > > < < < a) b) c) x + 2y =8 x+y+z = 1 8x + 2z = 6 > > > > > > > > > : y 2z = 5: : 2x + 3y : x+y = 3: = 1: d)
8 > > > <
0;2x + 0;3y + 0;4z = 0;9
0;1x + 0;1y + 0;2z = 0;2 > > > : 1;1x + 0;2y 2z = 0;7:
8 > 0;3x + 0;2y + 0;5z = 1 > > < g) 0;1x 0;1y =0 > > > : 0;2x + 1;1y + 0;3z = 1;1: 8 1 1 1 > > x + y + z = 11 > > > 2 3 6 > > < 1 1 x + y + z = 21 k) j) 6 2 > > > > 1 1 37 > > > : x + 3y + 4z = 2 :
e)
h)
8 > > > < > > > :
8 > > > < > > > :
y + 2z =
0;2x + 1;1y + 0;3z = 1;2 0;3x
y
2z =
x + 2y + 3z = 2
1;1x + 0;5y + 1;6z = 2;2 x
2y
3z =
8 1 1 9 > > x + y + z = 27 > > > 4 5 20 > > < 1 1 9 x + y + z = 27 5 4 20 > > > > 1 3 > > > : x + 2 y + 2 z = 90:
8 p p p > 2x + 3y + z = 5 + 6 > > < p p p p l) x + 2y + 3z = 4 2 + 6 > > p p p p > : x + 3y + 2z = 3 2 + 2 3:
1
2:
1:
8 > 2x + 3y 2z = 66 > > < f) y + 4z = 90 > > > : y + 5z = 45:
8 > 50x + 20y + 8z = 20;6 > > < i) 30x + 15y + 16z = 15;2 > > > : 25x + 32y + 40z = 21;9:
8 > 0;8x + 1;5y + 2;3z = 2;4 > > < m) 1;2x + 0;8y + 2z = 3;6 > > > : 1;2x 0;4y + 0;8z = 3;0:
68
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 9. Sean a; b; c 2 R con a 6= 0: Se considera la ecuación: hallar x 2 R tal que ax4 + bx + c = 0: Elaborar un algoritmo que permita identi…car la existencia de raíces reales y como calcularlas. Veri…que su algortimo en los siguientes casos: a) t4
9t2 + 20 = 0: b) 3t4 + 7t2
40 = 0: c) 2t4 + 9t2 + 4 = 0:
10. En cada item se de…ne una función u y una partición uniforme (m) del intervalo [a; b] que se Rb indica y m = 10: Calcule I (u) = a u (x) dx y una aproximación I (vm ) de I (u) calculada con la regla del rectángulo. Compare los resultados. 3x + 2 x 2 [ 1; 2] : c) u (x) = 2x2 + 5 x 2 [ 1; 2] : 1 d) u (x) = x3 x2 + 1 x 2 [0; 1] : e) u (x) = x 2 [0; 1] : f ) u (x) = e x x 2 [0; 4] 1+x i h : h) u (x) = cos2 (x) x 2 [0; ] : i) u (x) = ln(x) x 2 [1; e] : g) u (x) = sen(x) x 2 0; 2 p j) u (x) = 1 + x2 x 2 [0; 2] : a) u (x) = x x 2 [0; 10] : b) u (x) =
11. En cada item se de…ne una función real ': Elabore un algoritmo de cálculo de ' (x) de modo que el número de operaciones elementales sea el más pequeño posible, contabilice dicho número. 1 1 1 1 1 a) ' (x) = 10 x > 1: x2 6x4 10x6 14x8 18x10 3 5 7 9 11 b) ' (x) = 1 + p + + x 0: 3 5 2 1 + x 1 + x (1 + x) 2 (1 + x) (1 + x) 2 p 4 9 14 19 24 c) ' (x) = x > 3: 1 + 3 + 5 + 7 + 9 (x2 3) 2 5 (x2 3) 2 9 (x2 3) 2 14 (x2 3) 2 19 (x2 3) 2 1
16 256 8 2 4 x d) ' (x) = 2 + x4 + x6 + x 2 R: 3 9 81 i h 1 1 1 1 : sen2 (x) + sen3 (x) sen4 (x) x 2 ; e) ' (x) = 1 + sen(x) 2 4 8 16 2 2 1 2 3 4 5 f ) ' (x) = + cos2 (x) sen(x) cos3 (x) sen2 (x)+ cos4 (x) sen3 (x) cos5 (x) sen4 (x) x 2 R: 3 9 16 21 26 x2
12. Para n 2 Z+ con 3
n
19; se de…ne n X ( 1)k k+ 1 fn (x) = x 2 (2k + 1)! k=0
2
x 2 0;
:
a) Para cada n impar, elabore un algoritmo para calcular valores aproximados de fn (x) de modo que el número de operaciones elementales sea el más pequeño posible y se eviten sumas y restas alternadas. b) Para n = 19; x =
2
y una aproximación de ' 3;1415926536; se tiene f19 = 0;5: 6 6 Aplique el algoritmo desarrollado en la parte a) precedente y calcule fn (x) para n; x y la aproximación de que se indica, obtendrá una aproximación de 0;5 i) n = 5; iii) n = 9;
' 3;1415; x =
2
6
' 3;14159265; x =
: ii) n = 7; 2
6
' 3;141593; x =
: vi) n = 11;
2
6
:
' 3;141593; x =
2
6
:
13. La función real g se de…ne sobre [0; 10] como sigue: g (x) =
15 X ( 1)k k+2 x k!10k k=0
x 2 [0; 10]
a) Elabore un algoritmo para calcular valores aproximados de g (x) de modo que se eviten los cálculos directos de k!; 10k ; xk+2 y sumas y restas alternadas; y, en lo posible que el número de operaciones elementales sea el más pequeño posible.
1.12. EJERCICIOS
69
b) Contabilice el número de operaciones elementales de su algoritmo. c) Aplique su algoritmo para calcular g (1) y compruebe que obtendrá una aproximación de 0;904837418: d) Aplique su algoritmo para calcular g (10) y obtendrá una aproximación de 36;78794412: 14. Considerar la función h de…nida como 5 X
k
x2 x2 x4 x8 x16 x32 = x + h (x) = + + + + 2 8!53 16!512 24!527 32!548 40!575 (8k)!53k k=0 2
2
a) Con la calculadora de bolsillo calcule (8k)!; 53k ; (8k)!53k y
x 2 R:
1 para k = 0; 1; : : : ; 5 y (8k)!53k2
analice las di…cultades de cálculo y los resultados que obtiene. b) Utilice el desarrollo de h (x) para calcular h (20) y explique las di…cultades de cálculo que se presentan. 1 1 x 8 x 8 c) Sean x 2 R y u (x) = : Note que u (x) = = 25 32 53 25 25 32 53 25 x x x 1 25 25 25 : 125 25 26 32 Calcule u (20) : d) A partir de la escritura de h (x) siguiente: h (x) = x +
x2 8!53
1+
1+
1 9 1
25
x 5 54
16 32
55
x 52
8
2
1+
1+
1 17 1
17
24 24
53
x 53
53 x 5
4
16
y de la observación en la parte c) precedente, exprese h (x) en forma más conveniente y calcule h (20) : Explique las di…cultades o bondades de cálculo con la nueva escritura de h: 15. Elaborar un logaritmo que permita calcular los valores de Pm (x); Qm (x) x 2 [ 1; 1]; si m
Pm (x) = 1 +
(m!)2 X ( 1)k (2m)! (m k=1
m
Qm (x) = x +
(m!)2 X ( 1)k (2m + 1)! (m k=1
(2m + 2k)! x2k k)!(m + k)!(2k)!
m = 0; 1; 2; : : : ;
x 2 [ 1; 1];
(2m + 2k + 1)! x2k+1 k)!(m + k)!(2k + 1)!
x 2 [ 1; 1];
Los polinomios Pm y Qm son conocidos como polinomios de Legendre. 16. Se de…ne v (x) =
15 1 P 1 k 2 k=0 k! (x + 1)
x 2 [0; 10] :
a) Utilice directamente la escritura de v (x) para calcular v (3) y determine el número de operaciones elementales que realiza. Indique las posibles di…cultades de cálculo de v (3) : b) Elabore un algoritmo para calcular valores aproximados de v (3) de modo que el número de operaciónes elementales sea el más pequeño posible y contabilice el total de dichas operaciones elementales en el cálculo de v (x) x 2 [0; 10] : Compare su resultado con el siguiente: v (3) ' 1;105170918: c) Aplique su algoritmo y calcule v (10) y compruebe su resultado con v (10) ' 1;009950167: 17. Considere la función
de…nida como 15
(x) =
1 X ( 1)k xk 2 (2k + 1)!4k k=0
x
0:
70
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 2
a) Utilice sin modi…caciones (x) y calcule
3
' 0;477464829: ¿Qué di…cultades de cálculo
se presentan? b) Elabore un algoritmo que facilite el cálculo de 2
elementales que se realizan. Calcule
y compare con el valor dado en i) precedente.
3
18. Se da la función f de…nida como f (x) =
(x) y contabilice el número de operaciones
11 x2k P x 2 [0; 2] : k=0 (2k)!
1 y compare con f (0;5) ' 1;127625966: Contabilice el número de operaciones 2 elementales que realiza. a) Calcule f
b) Mejore aún la escritura de f (x) siguiente: f (x) = 1 +
y calcule f
1 2
x2 2
1+
x2 3
4
1+
x2 5
1+
6
+
x2 19
20
1+
x2 21
22
: Contabilice el número de operaciones elementales que realiza.
x2k x 0: Mediante la elaboración de un algoritmo que facilite k=0 (2k + 1)! 1 1 el cálculo de g (x) ; Calcule g y compare con g ' 1;042190611: ¿Cuántas operaciones se 2 2 requieren para calcular g (x) con y sin el algoritmo?
19. Dada la función g (x) =
15 P
20. Aplique el esquema de Hörner para calcular p (x) en x que se indica. a) p (x) = x8 + x7 + x5 + x3 + x2 + x + 1; b) p (x) = 5
x2
+
7x4
2x5 ;
x=
x = 2: 3:
0;2x + 0; 5x2 + 3;25x3 + 2;5x4 ;
c) p (x) = 0;5 d) p (x) = 3
+
10x3
2;2x +
1;1x3
2;8x4
+
5;6x5 ;
x = 0;8:
x = 1;5:
21. Considere la función u de…nida como u (x) = x2 x 2 [0; 2] : En cada literal se da el número de puntos m de una partición uniforme (m 1) de [0; 2] : Trace la grá…ca de u y de su interpolante m R2 P 1 vm utilizada en la regla del rectángulo. Calcule I (u) = 0 x2 dx e I (vm ) = hu xj 1 + jh : 2 j=1 a) m = 2: b) m = 5: c) m = 9: d) m = 11:
Compare los resultados. Para el efecto, calcule jI (u)
I (vm )j y concluya. h i 22. Se de…ne la función f de…nida como f (x) = sen(x) x 2 ; y ' 3;1415926536: Se de…ne n o 2 h2 i una partición uniforme (m) = + ih j i = 0; 1; : : : ; m de ; con m 2 Z+ que en cada 2 2 2 literal se de…ne. Trace la grá…ca de f y la de su interpolante fm utilizada en la regla del rectángulo. m R P i Calcular I (f ) = 2 sen (x) dx; I (fm ) = + h : hf 2 2 2 i=1 a) m = 3: b) m = 5: c) m = 7: d) m = 9:
Para cada m dado en a), b), c), d) calcule jI (f ) 23. Se de…ne la función g como g (x) = ex R2 a) Calcule I (g) = 1 g (x) dx:
I (fm )j y concluya.
ln(x) x 2 [1; 2] :
b) Se de…ne una partición (m) = f1 + ih j i = 0; 1; : : : ; mg con m 2 Z+ que se da en cada caso. Aplique la regla del rectángulo para aproximar I (g) ; para m = 3; m = 6; m = 9; m = 12:
c) Calcule jI (g)
I (gm )j con I (gm ) calculado en la parte b) precedente. Concluya.
1.12. EJERCICIOS
71
24. Considere la función real f de…nida como f (x) = ex x 2 R: Se sabe que f 0 ( 1) = e 1 : Calcule aproximaciones y00 de la derivada f 0 (1) para cada h que se indica y calcule jf 0 ( 1) y00 j : Analice los resultados. a) h =
0;05: b) h =
0;0005: c) h =
0;000005: d) h = 0;005: e) h = 0;00005:
f ) h = 0;0000005: p
x x 2 R: Calcule 1 + x2 aproximaciones de la derivada u0 (0) = 0 para cada h que se indica y estime ju0 (0) u00 j :
25. Se de…ne la función u como u (x) =
a) h =
0;02: b) h =
1 + x2
0;0002: c) h =
x 2 R: Tenemos u0 (x) = p
0;00002: d) h = 0;002: e) h = 0;00002:
f ) h = 0;0000002: 26. Considere aproximaciones v 0 (x) = sen (3x) x 2 R: Se sabe que v 0 (x) = 3 cos (3x) x 2 R: Calcule = 0 con ' 3;1416926536; para cada h que se indica. aproximaciones v00 de la derivada v 0 6 a) h = 0;04: b) h = 0;0004: c) h = 0;000004: d) h = 0;004: e) h = 0;00004: f ) h = 0;0000004: 27. En cada item se de…ne una función v y se dan un punto x0 y varios valores de h: Calcule aproximaciones v00 de la derivada v 0 (x0 ) y estime jv 0 (x0 ) v00 j : a) v (x) = 2x2
3 x 2 R; x0 =
b) v (x) =
1 x> 1+x
c) v (x) =
cos(x2 )
e) v (x) = 1 + 2x2
1; x0 = 0; h =
x 2 R; x0 =
d) v (x) = ln (1 + 2x) 0;0000015: 1 3
1; h =
x >
r
2
0;003; h = 0;05; h =
; h=
0;00005; h = 0;0005; h = 0;000005:
0;001; h =
1 ; x0 = 0; h = 2
x 2 R; x0 = 2; h =
0;0003; h = 0;00003; h = 0;000003:
0;0001; h = 0;00001; h = 0;0000001:
0;015; h =
0;025; h =
0;000015; h = 0;00015; h =
0;00025; h = 0;000025; h = 0;0000025:
(
y 0 (x) + 2y (x) = ex 0 < x < 1; es y (x) = 28. La solución del problema de valor inicial siguiente: 1 y (0) = ; 3 1 x e : Para m = 10 y una partición uniforme del intervalo [0; 1] ; aplique el método de Euler explícito 3 y calcule aproximaciones yj j = 1; : : : ; 10 de y (xj ) : Trace la grá…ca de la función y (x) y represente los puntos (xj ; yj ) j = 0; 1; : : : ; 10: Calcule jy (xj ) yj j j = 0; 1; : : : ; 10 y dé una solución. 8 <
2 y x jxj < 1; 29. La solución del problema de valor inicial es y (x) = 2 1 x2 : y (0) = 1; p 1 x2 jxj < 1: Para m = 8 y una partición uniforme del intervalo [0; 0;9] ; aplique el método de Euler explícito y calcule aproximaciones yj j = 0; 1; : : : ; 8 de y (xj ) : Trace las grá…cas de la fución y (x) y de los valores calculados (xj ; yj ) j = 0; 1; : : : ; 8: Calcule jy (xj ) yj j j = 0; 1; : : : ; 8 y compare los resultados. 8 y (x) < 0 y (x) = 1 1 < x < 3; 30. Considere el problema de valor inicial cuya solución es y (x) = x : y (1) = 2: x (2 ln(x)) x > 0: Para m = 10 y una partición uniforme del intervalo [1; 3] ; aplique el método de Euler explícito y calcule aproximaciones yj j = 0; 1; : : : ; 10 de y(xj ) : Trace las grá…cas de la función y (x) x 2 [1; 3] y de los valores calculados (xj ; yj ) j = 0; 1; : : : ; 10: Calcule jy (xj ) yj j j = 0; 1; : : : ; 10 y compare los resultados. y 0 (x) =
72
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 8 <
x2 + y 2 (x) 1 < x < 1;5; 31. Considere el problema de valor inicial la solución es y (x) = 3xy (x) : y (1) = 2; p x2 + 3x x > 0: Para m = 5 y una partición uniforme del intervalo [1; 1;5] ; proceda como en el ejercicio precedente. y 0 (x) =
32. Representar en base 10 los siguientes números: a) (4746)8
b) (7412;352)8
c) (AB98:C31)16
g) (0;1110111110111011111 : : :)2
d) (100;001)3
e) (1;4142)5
f ) (111;0101)2
h) (235;3333 : : :)6 :
33. En cada caso, representar los siguientes números en base 10 a la base b que se indica con 8 cifras de precisión para la parte fraccionaria. p p 27 a) 3;14159; b = 2: b) 2;718281; b = 4: c) 2; b = 8: d) 5; b = 5: e) ; b = 3: 7 f ) 1726;00011; b = 2: g) 135;26 b = 4: h) 135;42; b = 8: 34. Sean a; b 2 N tales que a 6= b; 1 < a 10; 1 < b 10. Elaborar algoritmos que permitan convertir números positivos en base a a base b y recíprocamente; y, obtener su equivalente en base 10. Sugerencia: considérese M = (an : : : a0 ; a 1 : : : a m )a y M = (bp : : : b0 ; b 1 : : : b q )b , donde ai ; a j 2 f0; 1; : : : ; a 1g, i = 0; 1; : : : ; n, j = 1; : : : ; m; bk ; b l 2 f0; 1; : : : ; b 1g, k = 0; 1; : : : ; p; l = 1; : : : ; q: 35. Sean a; b; c 2 R+ :
a) Considerar las expresiones u = (a b)c y v = ac bc con a b. Demostrar que u presenta un error relativo menor que v. Veri…que con a = 0;6392; b = 0;6375 y c = 0;9364:
b) Considerar la matriz A =
a b . Estudie el condicionamiento de det(A): c a
1 c) Si a = p ; b = 1; c = 31 , a1 = rd(a); b1 = rd(b); c1 = rd(c); estudie la existencia de soluciones 3 ax + by = 1 a1 x + b1 y = 1 de los sistemas de ecuaciones y c1 x + a1 y = 0: cx + ay = 0 1 1 7 ; b= y c= . Si a; b; c se redondean con 8 cifras decimales, estudie 1500 701 22500 la existencia de soluciones de los sistemas de ecuaciones del literal c). d) Sean a =
e) De b), c) y d), ¿qué conclusiones puede obtener? 36. Determinar el número de operaciones elementales para calcular det(A) si este se calcula usando el método de menores y cofactores cuando A es una matriz de 3 3; de 4 4 y de 5 5: Generalice los resultados. 37. Determinar el número de operaciones elementales que se requieren para calcular AD la matriz adjunta de A cuando A es una matriz de 3 3; de 4 4 y de 5 5: 38. Usando la aritmética de punto ‡otante con 3 dígitos, evaluar f (x) = x4 x = 4;71:
x3 + 6x2
3x + 0;145 en
a) Aplicar el esquema de Hörner para calcular f (4;71): b) Determinar el valor exacto de f (4;71) y, en cada caso, calcular el error relativo. c) Calcular con 3 cifras de precisión f ( 0;101) directamente y con el esquema de Hörner: Calcular el error relativo. d) Calcular con 3 cifras de precisión f ( 0;10001) directamente y con el esquema de Hörner: Calcular el error relativo. 39. Sea f la función real de…nida por f (x) = 2 +
3 x x2 1
jxj = 6 1:
a) Calcular f con 2 y 3 cifras en aritmética de punto ‡otante en x = 0;85; x = 0;95; x = 0;99: x x 1 b) Puesto que f (x) = + , calcule f (x) para los puntos x del literal a). x 1 x+1
1.12. EJERCICIOS
73
c) Calcule el valor exacto de f (x) para los puntos x dados en a). d) Calcule el error relativo de f (x) para los resultados de a) y b). 1 + x ex x 6= 0: x2 a) Calcular l mx!0 f (x): b) Calcular f (0;5
40. Sea f (x) =
10
10 ):
c) Hallar un algoritmo para aproximar f (x) con jxj 2]0; 10 y x = 0;1 10 5 :
5 ];
y aplique en los puntos x = 0;5 10
41. Sean x > 1 y n 2 N. Construya algoritmos que permitan aproximar a) 1 < x < 10 y 20 < n < 50: b) x
5
xn en los siguientes casos: n!
10 y n > 50:
42. Hallar l mx!0 f (x) para las funciones f que se dan a continuación. En cada caso elabore algoritmos que se adapten a la estabilidad numérica en un entorno de cero. p p 1 a) f (x) = x2 + 1 1: b) f (x) = x2 + 1 x: c) f (x) = x + sen(x): d) f (x) = 1: x+1 e) f (x) = 1 h) f (x) =
ex
cos(x): f ) f (x) =
e
ex e x ecos(x) ; x = 6 0: g) f (x) = ; x 6= k ; k 2 Z: x2 sen(x)
esen(x) 1 ; x 6= 0: i) f (x) = 3 x
cos(x) ex ; x 6= 0: j) f (x) = x
(1 + x) ; x 6= 0: x2
43. Determinar los números de condicionamiento de las funciones siguientes: h i ; : c) f (x) = ln(x) a) f (x) = cos(x) x 2 R. b) f (x) = tan(x) x 2 2 2 1 R x t2 d) f (x) = 0;5 + p e dt x 0: 2 0
x > 0:
e) En los incisos a), b) y c) determinar el más grande subconjunto de R en el que f está bien condicionado. f ) Pruebe que la función del inciso d) está bien condicionada para todo x
44. Sea ' : R3 ! R la función de…nida por '(x; y; z) = a) Pruebe que "' = "x + "y
xy z
0:
con z 6= 0:
"z ;donde "x ; "y ; "z son los errores relativos de x; y; z respectivamente.
b) Determine el error acumulado. 45. Si '(x; y) = xy
x; y 2 R+ y "x = "y , pruebe que el error relativo de ' viene dado por "' = "x + (y ln(x))"y :
¿Qué número de condicionamiento in‡uye en el cálculo de '?: 46. Sea A = (a1 ; : : : ; an ) 2 Rn , donde ai ; P i = 1; : : : ; n son números de máquina. Sea F : Rn ! R la función de…nida por F (x1 ; : : : ; xn ) = ni=1 ai xi : Si j"xi j eps, i = 1; : : : ; n, pruebe que el error relativo de F (x1 ; : : : ; xn ) veri…ca j"F j
eps si
ai > 0; ai < 0;
xi > 0; xi < 0;
47. Sea F : Rn ! R la función de…nida por F (a1 ; : : : ; an ) =
i = 1; : : : n:
1 n
n P
ai : Supongamos que ai > 0
i=1 F (a1 ; : : : ; an )
8i = 1; : : : ; n. Proponer un algoritmo de cálculo de z = y estudiar la propagación de los errores. Si el error en cada operación es "i = ", ¿cuál es el error acumulado?.
74
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES 2
3 '1 (a1 ; : : : ; an ) 6 7 48. Sean (a1 ; : : : ; an ) 2 Rn y ~z = ~'(a1 ; : : : an ), donde ~'(a1 ; : : : an ) = 4 ... 5 ; con 'n (a1 ; : : : ;n ) 'i : Rn ! R, i = 1; : : : ; n funciones de clase C 1 : Supóngase que 'i (a1 ; : : : an ) 6= 0; i = 1; : : : ; n. Muestre que los números de condicionamiento de 'i viene dados por Ci =
aj @'i (a1 ; : : : ; an ); i; j = 1; : : : ; n: 'i (a1 ; : : : ; an ) @xj
49. Considerar la ecuación x2 + 2px q = 0, donde p > 0; q > 0 y p >> q: Sea x = raíz de la ecuación. Calcule "x y demuestre que
p+
p
p2 + q una
x 3eps: x Nota: La notación p >> q signi…ca q es muy pequeño comparado con p o que p es muy grande comparado con q. p 50. Se desea calcular E(x) = 1 + x 1 para x = 0;0009 y x = 0;001 con 4 cifras decimales. eps
"x =
a) Calcule E(x) en dichos puntos: b) Utilizando E(x), construya otra expresión que se adapte a la estabilidad numérica y aplique para los puntos dados x. Compare los resultados. 0;002x + y = 0;2 Utilice el método de eliminación x + y = 1:
51. Considerar el sistema de ecuaciones lineales gaussiana para determinar:
a) La solución exacta del sistema. b) La solución aproximada con 5 cifras decimales. c) Intercambie la primera ecuación con la segunda y proceda como en los incisos a) y b). Compare los resultados. x + 500y = 100 Usando la d) El sistema de ecuaciones propuesto es equivalente al siguiente: x + y = 1: aritmética de punto ‡otante con 5 dígitos de precisión, resuelva el sistema de ecuaciones y compare con los resultados precedentes. 52. Sean a; b 2 R+ , m; n 2 N tales que 0 F (m) =
m
m X
n k
k=0
donde
n k
=
a) Pruebe que
n: Se desea calcular ak bn
k
m = 0; 1; : : : ; n;
n! : k!(n k)! n m+1
=
n m m+1
n m
m = 0;1: : : : ; n
1:
m P n ak bn k . Entonces F (m) = '(k): Elabore un algoritmo que se adpate a la k k=0 estabilidad numérica y aplique para a = 0;1; b = 0;5; m = 4; n = 10:
b) Sea '(k) =
R1 xn dx; n = 0; 1; 2; : : : 0 x+5 1 a) Muestre que I(n) + 5I(n 1) = : n b) Considerar el algoritmo: I(n) = n1 n = 1; 2; : : : ; 25:
53. Sea I(n) =
c) Muestre que l mn!1 I(n) = 0:
5I(n
1)
n = 1; 2; : : : ; 25: Calcule I(0) e I(n) para
8 1 > < I(n) = ; 5n d) Considere el siguiente algoritmo: Calcule I(n) 1 1 > : I(n 1) = I(n) ; n = 25; 24; : : : ; 1: 5 n e I(n 1); n = 25; : : : ; 1: Compare con los resultados anteriores.
1.13. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA 54. Sea I(n) =
R1 0
x
n+4 2
ex dx n = n 2
a) Muestre que I(n) = e
4; 3; 2; : : : + 2 I(n
2)
n=
2; 1; 0; : : : :
b) Calcule I( 4): c) Use el cambio de variable x = t2 y muestre que I( 3) = e R1 2 Taylor de e 2 R para aproximar 0 et dt y muestre que Z
0
1
75
2
et dt = 1 +
1 11 + + 3 2! 5
R1 o
2
et dt: Utilice el polinomio de
1 1 + Ek+1 ; k! 2k + 1
1 1 < 10 6 : k! 2k + 1 d) Utilizando el algoritmo dado en a), elabore un programa para calcular I(n) n = 4; 3; 2; : : : ; 25: 8 2e > ; I(n) = > > > n+4 < 2e I(n 1) = ; e) Note que l m I(n) = 0. Establezca el siguiente algoritmo n!1 > n +3 > > > : I(n 2) = 2(e I(n) : n+4 f ) Elabore un programa para el cálculo de I(n) n = 25; 24; : : : ; 2: Compare con los resultados dados en d). donde Ek+1 es el error cometido y k es tal que
g) Para " = 10
6;
I(n) = 2
deduzca el siguiente algoritmo 1 1 1 1 + + + + 0!(n + 6) 1!(n + 8) 2!(n + 10) 3!(n + 12)
Elabore un programa para el cálculo de I(n); n = otros algoritmos. ¿Qué concluye?.
+
1 : 8!(n + 22)
4; 3; : : : ; 25: Compare los resultados con los
h) ¿Por qué no es práctico utilizar la regla de los trapecios para cada n?.
1.13.
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 2. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 3. R. M. Barbolla, M. García, J. Margalef, E. Outerelo, J. L. Pinilla. J. M. Sánchez, Introducción al Análisis Real, Editorial Alambra Universidad, Madrid, 1981. 4. G. Birkho¤, S. Maclane, Algebra Moderna, Cuarta Edición, Editorial Vicens-Vives, Barcelona. 1974. 5. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 6. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 7. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 8. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 9. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980.
76
CAPÍTULO 1. CÁLCULO APROXIMADO, ALGORITMOS, ERRORES
10. Francis G. Florey, Fundamentos de Algebra Lineal y Aplicaciones, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1980. 11. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, Pitagora Editrice Bologna, 1983. 12. Waltson Fulks, Cálculo Avanzado, Editorial Limusa, México, 1973. 13. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 14. Gene H. Golub, Charles F. Van Loan, Matrix Computations, Second Edition, The Johns Hopkins University Press, Baltimore, 1989. 15. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991. 16. Nicholas J. Higham, Accuracy and Stability of Numerical Algorithms, Editorial Society for Industrial and Applied Mathematics, Philadelphia, 1996. 17. Kenneth Ho¤man, Ray Kunze, Algebra Lineal, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1987. 18. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 19. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 20. Rodolfo Luthe, Antonio Olivera, Fernando Schutz, Métodos Numéricos, Editorial Limusa, México, 1986. 21. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 22. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 23. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 24. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 25. A. A. Samarski, Introducción a los Métodos Numéricos, Editorial Mir, Moscú, 1986. 26. Michelle Schatzman, Analyse Numérique, Inter Editions, París, 1991. 27. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 28. Michael Spivak, Calculus, Segunda Edición, Editorial Reverté, Barcelona, 1996. 29. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 30. E. A. Volkov, Métodos Numéricos, Editorial Mir, Moscú, 1990.
Capítulo 2
Interpolación polinomial, derivación e integración numérica Resumen En este capítulo nos interesamos en tres temas importantes: la interpolación polinomial, la derivación e integración numéricas. Estos temas los abordamos como formas lineales de…nidas en apropiados espacios vectoriales reales, es decir, en el ámbito de los espacios duales. Es por esto que iniciamos el estudio de este capítulo con los espacios duales. A continuación posicionamos el problema de la interpolación polinomial y tratamos la existencia del polinomio interpolante de Lagrange, obtenemos una estimación del error de interpolación así como algunos tipos de polinomios de interpolación de Lagrange más usados. Mediante la aplicación de los polinomios de Taylor con error, obtenemos procedimientos de cálculo aproximado de las derivadas primera y segunda de funciones reales, procedimiento que se generaliza al cálculo numérico de derivadas de orden superior. Introducimos los operadores en diferencias …nitas y luego se construyen fórmulas de aproximación de derivadas de funciones reales como formas lineales. Estos resultados se extienden para el cálculo de las derivadas parciales primeras, segundas y el laplaciano de funciones reales en dos variables. Posteriormente, tratamos la integración numérica de funciones reales en la que nos limitados a obtener fórmulas de integración numérica conocidas como regla del punto medio, regla de los trapecios y regla de Simpson así como sus generalizaciones y la estimación del error. Estos resultados son aplicados al cálculo numérico de integrales dobles sobre dominios de los tipos I y II, es decir como integrales reiteradas.
2.1.
Espacios duales
Los problemas de interpolación polinomial, derivación e integración numérica serán tratados como formas lineales de…nidas en apropiados espacios funcionales. Para ello comenzamos precisamente con los espacios duales y muy particularmente los espacios vectoriales reales de dimensión …nita y sus duales que también son de dimensión …nita. Asumimos que el lector tiene algún conocimiento sobre las aplicaciones lineales. En el anexo se resumen algunos resultados importantes, y al …nal del capítulo se citan algunos textos de álgebra lineal en los que se podrá consultar estos tópicos. De…nición 1 Sea V un espacio vectorial. Toda aplicación lineal f de V en R se llama funcional lineal sobre V o también forma lineal en V . De la de…nición se tiene que f es un funcional lineal en V si y solo si satisface las dos condiciones siguientes: i) f es una función de V en R. ii) f es lineal, esto es, para todo
2 R, x; y 2 V , se tiene f (x + y) = f (x) + f (y); 77
f ( x) = f (x):
78CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA La propiedad ii) de la linealidad de f se escribe en una sola, así: si ; 2 R; x; y 2 V; f es lineal si y solo si f ( x + y) = f (x) + f (y) y esta a su vez es equivalente a f ( x + y) = f (x) + f (y) : El conjunto de todos los funcionales lineales en V se designa con V . Con las operaciones habituales de adición de funciones \ + " siguiente: 8f; g 2 V ; (f + g) (x) = f (x) + g (x)
8x 2 V;
y el producto de escalares por funciones \ " : 8 2 R;
8f 2 V ,
(
f ) (x) = f (x)
8x 2 V;
el conjunto V es un espacio vectorial real denominado espacio dual de V: Ejemplos 1. Sean V = R2 y T la función de R2 en R de…nida como T (x; y) = 2x + y (x; y) 2 R2 : Entonces T es una forma lineal en R2 ; esto es, T 2 R2 : Efectivamente, sean ; 2 R; (x1 ; y1 ) ; (x2 ; y2 ) 2 R2 ; entonces (x1 ; y1 ) + (x2 ; y2 ) = ( x1 + x2 ; y1 + y2 ) y de la de…nición de la función T se sigue que T ( (x1 ; y1 ) +
(x2 ; y2 )) = T ( x1 + x2 ; y1 + y2 ) = 2 ( x1 + x2 ) + ( y1 + y2 ) =
(2x1 + y1 ) +
(2x2 + y2 ) = T (x1 ; y1 ) + T (x2 ; y2 ) :
2. Sean V = C ([a; b]) el espacio de funciones reales continuas en el intervalo cerrado [a; b] : Se de…ne Rb u 2 C ([a; b]) : Entonces I es un la función I de C ([a; b]) en R como sigue: I (u) = a u (x) dx funcional lineal sobre C ([a; b]) : Pués de las propiedades de la integral de Riemann siguientes: Z
a
b
(u (x) + v (x)) dx = Z b u (x) dx = a
Z
b
u (x) dx +
a
Z
Z
b
v (x) dx
a
b
u (x) dx
u; v 2 C ([a; b]) ;
2 R; u 2 C ([a; b]) ;
a
se deduce la linealidad de I: 3. Sean V = C 1 (]a; b[) el espacio de funciones que poseen derivada continua en el intervalo abierto ]a; b[ ; x0 2 ]a; b[ : Se de…ne el funcional F sobre C 1 (]a; b[) como a continuación se indica: F (u) =
du (x0 ) dx
u 2 C 1 (]a; b[) :
Por las propiedades de la derivada siguientes: d du dv (u + v) (x0 ) = (x0 ) + (x0 ) dx dx dx d ( u) (x0 ) = dx
du (x0 ) dx
u; v 2 C 1 (]a; b[) ;
2 R; u 2 C 1 (]a; b[) :
Se deduce que F es un funcional lineal sobre C 1 (]a; b[) : Teorema 1 Si V es un espacio vectorial real de dimensión n, entonces dim V = n = dim V: Demostración. Para el efecto, construiremos un conjunto de funcionales lineales ff1 ; : : : ; fn g sobre V y mostraremos que tal conjunto es una base de V . i) Existencia de funcionales lineales sobre V .
2.1. ESPACIOS DUALES
79
Sea Bv = fv1 ; : : : ; vn g una base ordenada de V y x 2 V . Existen Para cada i = 1; : : : ; n, se de…ne fi de V en R como sigue: ! n X = fi (x) = fi k vk
x=
n X
k vk ;
y=
k=1
n X
1; : : : ;
k vk ;
n
2 R tales que x =
n P
k vk :
k=1
x2V,
i
k=1
entonces fi 2 V . En efecto, sean x; y 2 V , existen
1; : : : ;
n,
1; : : : ;
x+y =
k=1
n X
(
n
2 R tales que
+
k
k ) vk ;
k=1
de la de…nición de la función fi se sigue : fi (x + y) = fi
n X
(
k
+
k ) vk
k=1
!
=
+
i
i
n X
= fi
k=1
= fi (x) + fi (y) : Sea
2 R, entonces
n X
x=
k vk
=
k=1
luego fi ( x) = fi
n X
k vk
k=1
Así, fi 2 V
i = 1; : : : ; n.
!
k vk
n X
!
+ fi
n X
k vk
k=1
!
k vk ;
k=1
=
i
n X
= f
k vk
k=1
!
= f (x) :
ii) Denotamos con B = ff1 ; : : : ; fn g. Probemos que el conjunto B es una base de V . Para ello mostramos que B genera a V y es linealmente independiente. a) Mostramos que B genera a V . Como B V se sigue que el subespacio generado por B , que n P está contenido en V , esto es, L (B ) V : se denota con L (B ) = i fi j i 2 R; i = 1; : : : ; n i=1
Probemos que V
L (B ). Sea f 2 V
y x 2 V . Existen
Entonces
n X
f (x) = f
k vk
k=1
y de la de…nición de fi , se tiene fi (x) = fi
n X
k vk
k=1
luego f (x) =
n X
!
!
=
=
n X
1; : : : ;
kf
n
2 R tales que x =
n P
k vk .
k=1
(vk ) ;
k=1
i
i = 1;
; n;
f (vk ) fk (x) :
k=1
Ponemos
k
= f (vk ). Resulta f (x) =
n X k=1
k fk
(x)
8x 2 V;
que muestra que f es combinación lineal de los elementos de B . Así, f 2 L (B ), o sea V conclusión, V = L (B ). b) Probemos que B es linealmente independiente. Sean 1 ; : : : ; lineal nula 1 f1 + + n fn = 0: Note que 1 f1 (x) + +
L (B ) : En
2 R y consideremos la combinación f n n es un funcional lineal sobre V .
n
80CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Entonces,
1 f1 (x)
tiene fi (vj ) =
+ + n fn (x) = 0 8x 2 V: Por la de…nición del funcional fi , para x = vj se 1, si i = j; entonces para x = v1 , obtenemos 0, si i 6= j; 0=
1 f1 (v1 )
+
+
n fn (v1 )
=
1,
0=
1 f1 (v2 )
+
+
n fn (v2 )
=
2;
+
n fn (vn )
=
n:
para x = v2 , se deduce así sucesivamente, para x = vn se obtiene 0=
1 f1 (vn )
+
+
+
=0)
Consecuentemente, 1 f1
n fn
i
= 0 i = 1; : : : ; n;
que prueba que el conjunto B es linealmente independiente. De i) y ii) se tiene B es una base de V , por lo tanto dim V = n. 1, si i = j; Note 0, si i 6= j: además que si f 2 V , Bv = fv1 ; : : : ; vn g es una base de V y B = ff1 ; : : : ; fn g la base dual de Bv . En la parte ii) a) precedente se obtuvo para f 2 V la representación siguiente: El conjunto B = ff1 ; : : : ; fn g se le llama base dual de V : Observe que fi (vj ) =
f (x) =
n X
f (vk ) fk (x)
8x 2 V;
k=1
que lo denominamos representación de f con respecto de las bases Bv y B . Escribiremos f=
n X k=1
f (vk ) fi
8f 2 V .
Esta representación de f la utilizaremos en las aplicaciones a los problemas de interpolación polinomial, derivación e integración numérica. Representación matricial Sean B = ff1 ; : : : ; fn g una base ordenada de V y f 2 V . Existen
1; : : : ;
n
2 R tales que f =
n P
i fi .
i=1
La matriz de f asociada a la base B viene dada por [f ]B = ( 1 ; : : : ; n ) 2 M1 n [R] : En particular, si B es la base dual de la base Bv = fv1 ; : : : ; vn g de V , se tiene [f ]B = (f (v1 ) ; : : : ; f (vn )) : Ejemplo Si V = Rn y Bv = f! e1 ; : : : ; ! en g la base canónica de Rn , f 2 (Rn ) ,entonces [f ]B = (f (! e1 ) ; : : : ; f (! en )) y la función f se escribe como sigue: f (! x ) = f (x1 ; : : : ; xn ) =
n X
f (! ei ) xi .
i=1
Además, el espacio V es isomorfo a M1 n [R], pués la función de V en M1 n [R] de…nida por (f ) = [f ]B 8f 2 V con B = ff1 ; : : : ; fn g una base ordenada de V , es lineal biyectiva, es decir que se trata de un isomor…smo. Espacio Bidual Sea V un espacio vectorial de dimensión …nita n sobre R, V el espacio dual de V . Sea x 2 V …jo y h una función de V en R de…nida como sigue: h (g) = g (x) 8g 2 V : Se veri…ca que h es lineal. Efectivamente, sean g1 ; g2 2 V y 2 R. Se tiene h (g1 + g2 ) = (g1 + g2 ) (x) = g1 (x) + g2 (x) = h (g1 ) + h (g2 ) ; h (ag1 ) = ( g1 ) (x) = g1 (x) = h (g1 ) :
2.1. ESPACIOS DUALES
81
Resulta que h es un funcional lineal de…nido en V , o sea h 2 (V ) . Escribimos V
en vez de (V ) y lo denominamos espacio bidual de V .
En el siguiente teorema se establece que si dim V = n, los espacios V y V
son isomorfos.
Teorema 2 Sea V un espacio vectorial de dimensión …nita n sobre el cuerpo R; V el espacio bidual de V . La aplicación ' de V en V de…nida por ' (x) = h con h (g) = g (x) 8g 2 V ; 8x 2 V es un isomor…smo. Demostración. Debemos mostrar que ' es lineal y biyectiva. i) Probemos que ' es lineal. Sean x; y 2 V; h1 ; h2 2 V
tales que h1 (g) = g (x), h2 (g) = g (y)
8g 2 V : Entonces
(h1 + h2 ) (g) = h1 (g) + h2 (g) = g (x) + g (y) = g (x + y) : Además, de la de…nición de la función ' se tiene ' (x) = h1 ,
' (y) = h2 ,
h3 (g) = g (x + y) = (h1 + h2 ) (g)
' (x + y) = h3 con
8g 2 V ;
luego ' (x + y) = h1 + h2 = ' (x) + ' (y) : Sea
2 K; de la de…nición de la función h1 y de ' se tiene h1 ( g) =
g (x) = h1 (g)
8g 2 V ;
' ( x) =
h1 = ' (x) 8x 2 V:
ii) Mostremos que ' es biyectiva. Comencemos con la inyectividad de ': Sea Bv = fv1 ; : : : ; vn g una base ordenada de V y B = ff1 ; : : : ; fn g la base dual de V . Probemos que ker (') = f0g.. Sea x 2 ker ('). Entonces ' (x) = 0. Supongamos que x 6= 0. Existen 1 ; : : : ; n 2 R tales que n P x = de…nido por h (g) = g (x) i vi y como x 6= 0, existe algún j tal que j 6= 0. Sea h 2 V i=1
8g 2 V . En particular, para g = fj se tiene h (fj ) = fj (x) = fj
n X i=1
i vi
!
=
n X
i fj
(vi ) =
i=1
Así, x 6= 0 ) h 6= 0 o sea h = 0 ) x = 0, de donde 0 = g (0) = h (g)
j
6= 0:
8g 2 V ; por lo tanto
0 = ' (x) ) x = 0; y en consecuencia ' es inyectiva. Probemos que ' es sobreyectiva: De la relación entre las dimensiones del núcleo y la imagen o recorrido de una aplicación lineal en espacios de dimensión …nita, se tiene dim (ker (')) + dim (Rec (')) = n; y como ker(') = f0g; se sigue que dim (Rec (')) = n y siendo Rec (') V se sigue que V consecuentemente ' es biyectiva. De i) , ii) y iii) se concluye que ' es un isomor…smo.
= Rec (').
82CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA
2.2.
Interpolación polinomial
En el capítulo primero ya se trataron dos problemas de interpolación polinomial, el primero mediante funciones interpolantes constantes a trozos y el segundo mediante funciones interpolantes que son funciones a…nes a trozos. En esta sección, ampliamos lo dicho, más aún, nuestra primera tarea será demostrar la existencia de la función interpolante, luego construir de manera general los polinomios de interpolación de Lagrange y se concluye con el estudio del error. Para ello aplicaremos los resultados previos de los espacios duales. Existencia del polinomio interpolante de Lagrange. Sean a, b 2 R con a < b y f una función de…nida en [a; b] en R. Suponemos que el valor numérico de f es únicamente conocido en n + 1 puntos distintos xi 2 [a; b] i = 0; : : : ; n; y sean yi = f (xi ) ; i = 0; : : : ; n tales valores. Suponemos que a = x0 < x1 < : : : < xn = b: Esta información se recoge en el conjunto S = (xi ; yi ) 2 R2 j i = 0; : : : ; n denominado conjunto de puntos base. La interpolación en un método de aproximación que permite construir una función ' de [a; b] en R tal que ' (xi ) = f (xi ) = yi i = 0; 1; : : : ; n; y para todo x 2 [a; b], ' (x) es un valor aproximado de f (x) llamado valor interpolado de f (x). La función ' se llama interpolante de f . Más aún, si " (x) denota el error cometido en la interpolación, se tiene f (x) = ' (x) + " (x) x 2 [a; b] ; la función " de…nida sobre [a; b] se llama error de interpolación. Designamos con C ([a; b]) el espacio de las funciones reales continuas en [a; b]. Este espacio, como ya se ha señalado anteriormente, es de dimensión in…nita. Sea V = Kn [R] el espacio de polinomios de grado n. Se designa con = fa = x0 ; x1 ; : : : ; xn = bg con xi 1 < xi i = 1; : : : ; n una partición de [a; b]. Consideremos el problema siguiente: dado f 2 C ([a; b]) ; hallar un polinomio P 2 Kn [R] tal que P (xi ) = f (xi )
i = 0; 1; : : : ; n:
Denotamos con Bv = fv0 ; v1 ; : : : ; vn g la base canónica de Kn [R], donde v0 (x) = 1; : : : ; vn (x) = xn x 2 R. De…nimos n + 1 funcionales fi sobre Kn [R] como sigue: fi (P ) = P (xi )
i = 0; : : : ; n, P 2 Kn [R] :
Entonces cada funcional fi es lineal sobre Kn [R]. Mas aún, ff0 ; : : : ; fn g es una base del espacio dual (Kn [R]) . Mostremos que ff0 ; : : : ; fn g es linealmente independiente. Sean
0; : : : ;
n
2 R y supongamos que 0 f0 (P )
0 f0
+ ::: +
+ ::: +
n fn
n fn (P )
= 0; esto es
=0
8P 2 Kn [R] ;
en particular para los elementos de la base B se Kn [R], obtenemos el siguiente sistema de ecuaciones: 0 f0 (v0 )
+
+
n fn (v0 )
0 f0 (v1 )
+
+
n fn (v1 )
0 f0 (vn )
+
+
n fn (vn )
= 0 ()
0
+
= 0 () .. .
0 x0
= 0 ()
n 0 x0
+
n
+
+
+
+
= 0; n xn
n n xn
= 0;
= 0;
2.2. INTERPOLACIÓN POLINOMIAL
83
que en forma matricial se expresa como sigue 3 2 3 32 2 0 1 1 0 7 7 6 7 6 6 x0 x n 76 1 7 6 0 7 6 6 .. .. 7 6 .. 7 = 6 .. 7 : 4 . . 54 . 5 4 . 5 n 0 x0 xnn n 3 2 1 1 6 x0 xn 7 7 6 La matriz A = 6 . .. 7 se le conoce como matriz de Gram. Como a = x0 ; x1 ; : : : ; xn = b son . 4 . . 5
xn0 xnn puntos distintos del intervalo [a; b]; las columnas de la matriz A son linealmente independientes por lo tanto el rango de la matriz A es n + 1, con lo que el sistema de ecuaciones: ! ! 2 Rn tal que A = 0; ! ! con A la matriz de Gram, tiene una única solución = 0 . Consecuentemente 0 f0
+ ::: +
n fn
=0)
i
= 0 i = 0; 1; : : : ; n;
que prueba que el conjunto ff0 ; : : : ; fn g es linealmente independiente y siendo dim Kn [R] = dim (Kn [R]) = n + 1; resulta que ff0 ; : : : ; fn g es una base de Kn [R]. Determinemos una base B = fP0 ; : : : ; Pn g de Kn [R] tal que B sea la base dual de B: Esta debe satisfacer 1, si i = j; y por la de…nición de cada fi , se tiene fi (Pj ) = Pj (xi ) ; de donde la condición fi (Pj ) = 0, si i 6= j; 1, si i = j; Pj (xi ) = que se conoce como condición de interpolación. 0, si i 6= j; Se de…nen los polinomios P0 ; P1 ; : : : ; Pn de Kn [R] como sigue: (x (x0 (x P1 (x) = (x1 .. . (x Pn (x) = (xn P0 (x) =
x1 ) (x x1 ) (x0 x0 ) (x x0 ) (x1 x0 ) (x0 x0 ) (xn
x2 ) : : : (x xn ) x2 ) : : : (x0 xn ) x2 ) : : : (x xn ) x2 ) : : : (x1 xn )
x 2 R, x 2 R,
x1 ) : : : (x xn 1 ) x1 ) : : : (xn xn 1 )
x 2 R.
Note que en el polinomio P0 no …gura en el numerador el término x x0 , en P1 no …gura el término x x1 , así sucesivamente, en Pn no …gura el término x xn . Además, P0 (x0 ) = 1; P0 (xj ) = 0 P1 (x1 ) = 1; P1 (xj ) = 0 .. .
si j = 1; : : : ; n; si j = 0; 2; : : : ; n;
Pn (xn ) = 1; Pn (xj ) = 0 si j = 0; : : : ; n
1:
Los polinomios P0 ; P1 ; : : : ; Pn son linealmente independientes, por lo tanto forman una base de Kn [R]. Estos polinomios se llaman polinomios de interpolación de Lagrange. Dado P 2 Kn [R], existen n P
k Pk
0; : : : ;
n
2 R tales que P =
n P
k=0
(x) ; particularmente para x = xj ; j = 0; : : : ; n,
k=0
P (xj ) =
n X k=0
k Pk
(xj ) =
j;
k Pk ;
y para todo x 2 R, P (x) =
84CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA de donde
n X
P (x) =
P (xk ) Pk (x) :
k=0
Sea f 2 C ([a; b]). En el problema de la interpolación polinomial, buscamos un polinomio P 2 Kn [R] tal que P (xj ) = f (xj ) j = 0; : : : ; n: De…nimos Pb (xi ) =
n X
f (xk ) Pk (x)
k=0
x 2 R.
Se tiene Pb (xi ) = f (xi ) i = 0; : : : ; n; es decir Pb es el polinomio interpolante de f . De…nición 2 El operador de interpolación de Lagrange :
donde
se de…ne como sigue:
C ([a; b]) ! Kn [R] f ! (f ) ;
n P (f ) = Pb = f (xj ) Pj : j=0
x) 8P 2 Kn [R]. Para cada Sea x b 2 [a; b] y F 2 (Kn [R]) el funcional de…nido por F (P ) = P (b f 2 C ([a; b]) ; de la composición de funciones, se tiene el siguiente resultado: 0 1 n n n X X X (F ) (f ) = F ( (f )) = F Pb = F @ f (xj ) P A = f (xj ) F (Pj ) = f (xj ) Pj (b x) : j=0
Así, G = F
j=0
j=0
es un funcional lineal sobre C ([a; b]). Escribiremos G (f ) =
n X
f (xj ) Pj (b x)
j=0
al valor interpolado de f en el punto arbitrario x b 2 [a; b] :
Este método de interpolación se conoce como interpolación polinomial de Lagrange.
Nota: En la práctica los polinomios de interpolación de Lagrange no son muy utilizados cuando el número de puntos base (xi ; yi ) i = 0; : : : ; n es grande (más aún cuando los xi son muy cercanos entre sí) ya que el grado del polinomio interpolante de Lagrange Pb es igualmente grande dando lugar a la presencia de oscilaciones que afectan los resultados. Los polinomios de interpolación de Lagrange más utilizados son de grados n = 1; 2; 3 y 4. En la …gura siguiente se muestra la grá…ca de una función f defnida en [a; b] (línea continua), que suponemos es no negativa; y, la de un polinomio de interpolación de Lagrange construida sobre una partición (m) de [a; b] (línea cortada).
Figura 11
2.2. INTERPOLACIÓN POLINOMIAL
85
Note que en el punto x b 2 [a; b[ ; f (b x) > 0 mientras que p (b x) < 0: Las fuertes oscilaciones de la función p conduce a resultados falsos.
Sean n 2 Z+ ; (n) = fx0 = a; x1 ; : : : ; xn = bg una partición de [a; b] : Se denota con hj = xj xj 1 b a j = 1; : : : ; n; b h = max fhj j j = 1; : : : ; ng : Cuando (n) es la partición uniforme se tiene h = ; n xj = jh j = 0; 1; : : : ; n; b h = h: Se de…ne la función ! en [a; b] como sigue: ! (x) =
n Q
(x
xj )
x 2 [a; b] : Claramente ! es un polinomio
j=0
de grado n + 1, y ! (xi ) = 0 i = 0; 1; : : : ; n: Error de interpolación
Teorema 3 Sean n 2 Z+ ; f 2 C n+1 ([a; b]) ; (n) = fx0 = a; x1 ; : : : ; xn = bg una partición de [a; b] : Entonces, para cada x b 2 [a; b] ; existe 2 [a; b] tal que f (b x)
p (b x) =
n f (n+1) ( ) Y (b x (n + 1)!
xj ) ;
j=0
donde p es el polinomio de interpolación de Lagrange. Demostración. Sea p el polinomio de interpolación de Lagrange. Se tiene p (xj ) = f (xj ) j = 0; 1; : : : ; n: Además, el grado del polinomio p es n. Sea x b 2 [a; b] un punto dado.
i) Si x b = xj para algún j, esto es, x b es un punto de la partición caso f (b x) p (b x) = 0:
(n) entonces p (xj ) = f (xj ) y en este
ii) Supongamos que x b 6= xj 8j = 0; 1; : : : ; n: Determinemos una constante k tal que la función como (x) = f (x) p (x) k! (x) x 2 [a; b] ; se anule para x = x b; es decir, (b x) = 0:
de…nida
Para los puntos de la partición se tiene (xj ) = f (xj ) p (xj ) k! (xj ) = 0 j = 0; 1; : : : ; n; es decir que la función tiene a cada xj como raíz y como se busca k de modo que (b x) = 0; entonces tiene a 0 n + 2 raíces en el intervalo [a; b] : Por el teorema de Rolle, la derivada tiene n + 1 raíces en el intervalo [a; b] ; la derivada segunda 00 tiene n raíces en el intervalo [a; b] ; así sucesivamente, (n+1) tiene una raíz en el intervalo [a; b] y sea tal raíz, esto es, (n+1) ( ) = 0: Por otro lado, para cada x 2 [a; b] se tiene 0
(x) = f 0 (x)
p0 (x)
00
(x) = f 00 (x) .. .
p00 (x)
(n+1)
(x) = f (n+1) (x)
k! 0 (x) ; k! 00 (x) ;
p(n+1) (x)
k! (n+1) (x) :
Como p es un polinomio de interpolación de grado n, entonces p(n+1) (x) = 0: Además, ! es un polinomio de grado n + 1; luego ! (n+1) (x) = (n + 1)!: Por lo tanto, (n+1)
(x) = f (n+1) (x)
En particular, para x =
se tiene
(n+1)
0= de donde k =
f (n+1) ( ) y la (n + 1)!
k! (n+1) (x) = f (n+1) (x)
k (n + 1)!
( ) = 0 y en consecuencia
(n+1)
( ) = f (n+1) ( )
k (n + 1)!
queda de…nida como sigue:
(x) = f (x)
p (x)
f (n+1) ( ) ! (x) (n + 1)!
x 2 [a; b] :
x 2 [a; b] :
86CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Puesto que la constante k se elige de modo que (b x) = 0; resulta 0 = (b x) = f (b x)
de donde f (b x)
p (b x) =
f (n+1) ( ) ! (b x) (n + 1)!
p (b x)
f (n+1) ( ) ! (b x) : (n + 1)!
El resultado dado en el teorema se conoce como fórmula de error de interpolación de Lagrange, que lo notamos (b x) : Así, f (n+1) ( ) (b x) = f (b x) p (b x) = ! (b x) ; (n + 1)! donde
2 [a; b] y ! (b x) =
n Q
(b x
xj ) :
j=0
Ejemplos de polinomios de interpolación de Lagrange 1. Interpolante constante a trozos. . En este caso, K0 [R] es el espacio constituido por todas las Para n = 0 se considera = a+b 2 funciones constantes en todo R, esto es, P 2 K0 [R] , P (x) = c
8x 2 R,
para alguna constante c 2 R.
La base de K0 [R] está constituida por B = fv0 g con v0 (x) = 1 8x 2 R y la base dual B de B es B = ff0 g con f0 (P ) = P (x) 8P 2 K0 [R].
Para x b 2 [a; b] y f 2 C ([a; b]), de la de…nición del valor interpolado de f en x b 2 [a; b] se tiene G (f ) = f
a+b 2
P0 (b x) = f
a+b 2
:
El polinomio interpolante de f es la función p de…nida en [a; b] como p (x) = f
a+b 2
x 2 [a; b] :
En la …gura siguiente se muestran las grá…cas de la función f y de su interpolante lagrangeana p:
Figura 12 Sea m 2 Z+ y (m) = fx0 = a; x1 ; : : : ; xm = bg con xi 1 < xi i = 1; : : : ; m una partición de [a; b] : Se pone hi = xi xi 1 la longitud del intervalo [xi 1 ; xi ] i = 1; : : : ; m; y, b h = max fhi j i = 1; : : : ; mg : Sea f una función continua en [a; b] : La función interpolante p de f está de…nida como 8 m < p (x) = P f (t ) (x) x 2 [a; b[ ; i
:
i=1
p (b) = f (tm ) ;
i
2.2. INTERPOLACIÓN POLINOMIAL donde
i
87
es la función indicatriz del intervalo [xi
1 ; xi [
de…nida como
i (x)
=
0; si x 2 = [xi 1; si x 2 [xi
1 ; xi [ ; 1 ; xi [ ;
1 + hi el punto medio del intervalo [xi 1 ; xi ] i = 1; : : : ; m: 2 En la …gura siguiente se muestra la grá…ca de la función f y de su interpolante p, con m = 5
i = 1; : : : ; m; ti = xi
1
Figura 13
De la fórmula del error de interpolación de Lagrange, sea f 2 C 1 ([a; b]) y la partición del intervalo a+b [a; b] se reduce al solo punto medio de [a; b] ; se tiene la siguiente estimación del error para 2 x b 2 [a; b] ; a+b (b x) = f (b x) p (b x) = f 0 ( ) x b 2 para algún
2 [a; b] :
Sean m 2 Z+ ; (m) una partición del intervalo [a; b] ; aplicando el resultado precedente a x b 2 [xj 1 ; xj ] j = 1; : : : ; m se tiene "j (b x) = f (b x)
f (tj ) = f 0
j
(b x
tj )
con j 2 [xj 1 ; xj ] : Luego, si f 2 C 1 ([a; b]) ; existe M > 0 tal que j f 0 (x) j consecuencia j f (b x) f (tj ) j j f 0 j jj x b tj j M h ! 0 :
M
8x 2 [a; b] y en
h !0
Ejemplo
Supongamos que f es la función de…nida como f (x) = 1 + ex x 2 [0; 2] ; m = 10 y (10) la 2 partición uniforme de [0; 2] ; esto es, h = = 0;2 y j = jh = 0;2j j = 0; 1; : : : ; 10; hj = h = 0;2 10 j = 1; : : : ; 10: La función interpolante de f está de…nida como
1 + hj = xj 2 Para x = 0;85 se tiene
donde tj = xj
1
8 10 < p (x) = P f (tj ) j=1 : p (2) = f (t10 ) ; 1
j
(x) x 2 [0; 2[ ;
+ 0;1 j = 1; : : : ; 10:
p (0;85) =
10 X
f (tj )
j
(0;85) = 1 + e0;9 ;
j=1
pués 0;85 2 [0;8; 1[ para i = 5; ti = xi
1
+ 0;5 = 0;9; f (0;9) = 1 + e0;9 :
88CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA 2. Interpolantes a…nes a trozos. Para n = 1, se tiene = fa = x0 ; x1 = bg. Entonces, los polinomios de interpolación de Lagrange son P0 , P1 2 K1 [R] de…nidos como sigue: P0 (x) =
x x0
x1 x1
x 2 R,
P1 (x) =
x x1
x0 x0
x 2 R.
En la …gura siguiente se muestran las grá…cas de los polinomios P0 , P1 :
Figura 14
Para f 2 C ([a; b]) ; por la de…nición del valor interpolado de f en x b 2 [a; b] se tiene G (f ) =
1 X
f (xk ) Pk (x) = f (a) P0 (x) + f (b) P1 (x) = f (a) +
k=0
f (b) b
f (a) (x a
a)
x 2 [a; b] ;
es el valor interpolado de f en el punto x. Note que el polinomio interpolante de f está dado por (f ) = p (x) =
n X
f (xk ) Pk (x) = f (a) +
k=0
f (b) b
f (a) (x a
a)
x 2 [a; b] ;
que representa la ecuación del segmento de recta que une los puntos (x0 ; f (x0 )) y (x1 ; f (x1 )). En la …gura siguiente se muestra las grá…cas de f y del polinomio interpolante p:
Figura 15
Para x b 2 [a; b] ; el error de interpolación " (b x) está de…nido como " (b x) = f (b x)
donde
p (b x) =
f 00 ( ) (b x 2!
a) (b x
2 [a; b] es elegido apropiadamente.
b) ;
Sean m 2 Z+ y (m) = fx0 = a; x1 ; : : : ; xm = bg con xi 1 < xi i = 1; : : : ; m; una partición de [a; b] ; se pone hj = xj xj 1 y b h = Max fhj j j = 1; : : : ; mg : Apliquemos los resultados precedentes a cada subintervalo [xi 1 ; xi ] i = 1; : : : ; m: Tenemos que la función interpolante vh de f en el intervalo [a; b] está de…nida como v (x) =
m X i=0
f (xi ) 'i (x)
x 2 [a; b] ;
2.2. INTERPOLACIÓN POLINOMIAL
89
y las funciones '0 ; '1 ; : : : ; 'm están de…nidas como sigue:
'0 (x) =
8 <
x
x1
; x 2 [a; x1 ] ; h : 0; x 21 [a; b] 8 [a; x ] ; 1
8 < x
xm 1 ; x 2 [xm 1 ; b] ; 'm (x) = hm : 0; x 2 [a; b] 8 [x m 1 ; b] :
8 x xi 1 > > ; x 2 [xi 1 ; xi ] ; > < hi x xi 1 'i (x) = ; x 2 ]xi ; xi+1 ] > > hi 1 > : 0; x 2 [a; b] 8 [xi 1 ; xi ]
i = 1; : : : ; m
1;
En las …guras siguientes se muestran las grá…cas de '0 ; '1 ; '5 ; donde la partición de [a; b] está constituida por (5) = fx0 = a; x1 ; x2 ; x3 ; x4 ; x5 = bg :
Figura 16
Figura 17
Figura 18
0; si i 6= j y0 1; si i = j; similares a la función '1 :
Note que 'i (xj ) =
'i (x)
1
x 2 [a; b] : Las funciones '2 ; : : : ; 'm
1
son
A las funciones '0 ; : : : ; 'm se les denomina funciones techo. En la …gura siguiente se muestra la grá…ca de una función continua v de…nida en el intervalo [0; a] con a > 0; y la de una función interpolante vh (segmentos de recta) de v: Se muestran también los
90CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA puntos de la partición de (m) de [0; a] :
Figura 19
El error de interpolación se estima a partir de la fórmula " (b x) = f (b x) donde x b 2 [xj
1 ; xj ]
y
j
2 [xj
1 ; xj ]
jf (b x)
p (b x) =
f 00
j
(b x
2!
xj
x 1 ) (b
xj ) ;
elegido apropiadamente. Además,
p (b x)j
h2j 00 f 2
j
M 2 h ! 0; h !0 2
donde M = Max jf 00 (x)j : x2[a;b]
3. Interpolantes cuadráticos a trozos. Para n = 2, una partición del intervalo [a; b] es = fa = x0 ; x1 ; x2 = bg. Los polinomios de interpolación de Lagrange '0 , '1 , '2 2 K2 [R] están de…nidos como a continuación se indican: '0 (x) = '1 (x) = '2 (x) =
(x (a (x (x1 (x (b
x1 ) (x b) x1 ) (a b) a) (x b) a) (x1 b) a) (x x1 ) a) (b x1 )
x 2 R, x 2 R, x 2 R.
En la …gura siguiente se muestra las grá…cas de las funciones '0 ; '1 ; '2 restringidas al intervalo [a; b]:
Figura 20 Sea f 2 C ([a; b]) : El polinomio interpolante de f está dado por (f ) = p (x) =
2 X k=0
f (xk ) 'k (x) = f (a) '0 (x) + f (x1 ) '1 (x) + f (b) '2 (x)
x 2 R.
2.2. INTERPOLACIÓN POLINOMIAL
91
En la …gura siguiente se muestra la grá…ca de una función f y de su interpolante p:
Figura 21
Para x b 2 [a; b] y f 2 C ([a; b]), el valor interpolado de f está de…nido como sigue: G (f ) = p (b x) = fa '0 (b x) + f (x1 ) '1 (b x) + f (b) '2 (b x) .
Sea f 2 C 3 ([a; b]) : El error de interpolación se de…ne como " (b x) = f (b x) donde
p (b x) =
f 000 ( ) (b x !
a) (b x
x1 ) (b x
b) ;
2 [a; b] :
Sean n 2 Z+ y (n) = fa = x0 ; x1 ; : : : ; xn = bg una partición de [a; b] : Se pone hj = xj xj 1 b a j = 1; : : : ; n y b h = Max fhj j j = 1; : : : ; ng : En el caso de una partición uniforme, se tiene h = ; n xj = jh j = 0; 1; : : : ; n y b h = h: La función interpolante v de f está de…nida como v (x) =
n X
f (xi )
i (x)
i=0
x 2 [a; b] ;
i = 0; 1; : : : ; n son funciones que se obtienen de '0 ; '1 ; '2 aplicadas a cada intervalo 1; si i = j; A continuación se [xi 1 ; xi+1 ] y que satisfacen las condiciones de interpolación i (xj ) = 0; si i 6= j: muestran las grá…cas de las tres primeras funciones 0 ; 1 ; 2 :
donde
i
Figura 22
Figura 23
92CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA
Figura 24 Note que
0;
1;
2
están de…nidas en [x0 ; x2 ] como sigue: 8 < (x x1 ) (x x2 ) ; x 2 [x ; x ] ; 0 2 (x0 x1 ) (x0 x2 ) 0 (x) = : 0; en otro caso, 8 < (x x0 ) (x x2 ) ; si x 2 [x ; x ] ; 0 2 (x1 x0 ) (x1 x2 ) (x) = 1 : 0; en otro caso, 8 (x x0 ) (x x1 ) > > ; si x 2 [x0 ; x2 ] ; > > > < (x2 x0 ) (x2 x1 ) (x x3 ) (x x4 ) 2 (x) = ; si x 2 ]x2 ; x4 [ ; > > (x2 x3 ) (x2 x4 ) > > > : 0; en otro caso.
Si f 2 C 3 ([a; b]) ; M = Max fjf 000 (x)j j x 2 [a; b]g y x b 2 [a; b] ; entonces se tiene la siguiente estimación del error: f 000 j "j = f (b x) v (b x) = (b x xj 1 ) (b x xj ) (b x xj+1 ) 3! donde x b 2 [xj 1 ; xj+1 ] j = 1; : : : ; n 1; y, en consecuencia jf (b x)
2.3.
v (b x)j
M b3 h !0: h !0 6
Operadores de diferencias …nitas y derivación numérica
Denotamos con C ([a; b]) es espacio de funciones reales continuas en [a; b]. Para m 2 Z+ , denotamos con C m ([a; b]) es espacio de las funciones reales tales que la derivada m-ésima es continua en [a; b] : Sea f 2 C 2 ([a; b]) ; h 2 R con h 6= 0 tal que 8x 2 ]a; b[, x + h 2 [a; b]. En general, h es su…cientemente pequeño. Las derivadas f 0 y f 00 en x 2 ]a; b[ se de…nen como f (x + h) h!0 h
f 0 (x) = l m
f (x)
;
f 0 (x + h) h!0 h
f 00 (x) = l m
f 0 (x)
:
Para h 6= 0 su…cientemente pequeño, las derivadas f 0 (x) y f 00 (x) se aproximan mediante los siguientes cocientes: f (x + h) f (x) f 0 (x + h) f 0 (x) f 0 (x) ' ; y f 00 (x) ' ; h h más aún, f 0 (x) y f 00 (x) se esciben como f 0 (x) = con jw1 (x; h)j
f (x + h) h
f (x)
! 0; jw2 (x; h)j
h !0
+ w1 (x; h);
f 00 (x) =
f 0 (x + h) h
f 0 (x)
+ w2 (x; h) ;
! 0: Es claro que cuando los residuos w1 (x; h); w2 (x; h) son
h!0
su…cientemente pequeños para h su…cientemente pequeño, las dedivadas las podemos aproximar mediante los cocientes incrementales. Los numeradores de estos cocientes dan lugar a las denominadas diferencias …nitas y por lo tanto a los operadores en diferencias …nitas que a continuación se de…nen.
2.3. OPERADORES DE DIFERENCIAS FINITAS Y DERIVACIÓN NUMÉRICA
93
1. El operador de diferencia …nita hacia adelante se nota y se de…ne como sigue: f (x) = f (x + h)
f (x) :
2. El operador de diferencia …nita hacia atrás se nota y se de…ne como a continuación se indica: rf (x) = f (x)
f (x
h) :
3. Operador de diferencia …nita central de primer orden se nota y se de…ne del modo siguiente: f (x) = f
x+
h 2
f
x
h 2
:
Aproximación de f 0 (x) : En el capítulo primero se propuso un método de cálculo de la derivada primera f 0 (x) x 2]a; b[: En esta parte, ampliamos dicho procedimiento de cálculo que incluye el error de aproximación. Además, veremos otros métodos similares de aproximación. Supongamos que f 2 C 3 ([a; b]): Por el desarrollo de Taylor, para h > 0 se tiene; h2 00 f (x) + 2! h2 hf 0 (x) + f 00 (x) + 2!
f (x + h) = f (x) + hf 0 (x) + f (x
h) = f (x)
h3 000 f ( 1) 3! h3 000 f ( 2) 3!
con
1
2 [x; x + h] ;
con
2
2 [x
h; x] ;
entonces, f (x) h rf (x) h @f (x) 2h
= = =
f (x + h) f (x) h h2 = f 0 (x) + f 00 (x) + f 000 ( 1 ) ; h 2! 3! 2 f (x) f (x h) h h = f 0 (x) f 00 (x) + f 000 ( 2 ) ; h 2! 3! 2 f (x + h) f (x h) h = f 0 (x) + f 000 ( 1 ) + f 000 ( 2 ) : 2h 3!
Por hipótesis, f 0 ; f 00 ; f 000 son acotadas en el intervalo [a; b]; luego existen M1 > 0, M2 > 0; M3 > 0 tales que j f 0 (x) j M1; j f 00 (x) j M2; j f 000 (x) j M3 8x 2 [a; b]; y M = maxfM1 ,M2 ; M3 g; entonces f (x) h rf (x) h @f (x) 2h
f 0 (x) f 0 (x) f 0 (x)
f (x + h) f (x) h M f 0 (x) j=j f 00 (x) j h ! 0; h 2! 2 h7 !0 f (x) f (x h) h M = j f 0 (x) j=j f 00 (x) j h ! 0; h 2! 2 h7 !0 f (x + h) f (x h) h2 000 = j f 0 (x) j=j f ( 1 ) + f 000 ( 2 ) j 2h 3! = j
M 2 h 3
! 0:
h7 !0
Se observa que las diferencias …nitas centrales aproximan mejor la derivada f 0 (x) ; es decir que para h M 2 M su…cientemente pequeño y no nulo, el término h va a cero más rápidamente que h cuando h 7 ! 0: 3 2 Sea f 2 C 2 ([a; b]) ; x0 2 ]a; b[ y h 6= 0: Con frecuencia se presenta el problema de calcular f 0 (x0 ) ; con f una función en la que resulta difícil calcular la derivada o que únicamente se conocen los puntos (x0 ; y0 ) ; (x0 + h; y1 ) y se requiere aproximar f 0 (x0 ) : En este último caso se asume que y0 = f (x0 ) ; y1 = f (x0 + h) : Se de…ne una aproximación de f 0 (x0 ) como el cociente y00 =
y1
y0 h
;
94CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA y se denomina derivada numérica mediante una diferencia …nita progresiva. Se tiene la siguiente estimación f 0 (x0 ) Si y0 = f (x0 ) ; y1 = f (x0
M h ! 0: 2 h!0
y00
h) ; se de…ne una aproximación f 0 (x0 ) como el cociente y00 =
y0
y1 h
;
y se denomina derivada numérica mediante una diferencia …nita regresiva. Tenemos la siguiente estimación f 0 (x0 )
M h ! 0: 2 h!0
y00
h) ; y1 = f (x0 + h) ; se de…ne y00 como
Si y0 = f (x0
y00 =
y1
y0 h
;
y se denomina derivada numérica mediante una diferencia …nita central. Se tiene f 0 (x0 )
y00
M 2 h ! 0: h!0 3
Ejemplo Con el propósito de comparar las derivadas numéricas con la derivada de una función, asumimos que f es conocida. p Sea f (x) = exp (sen x) x > 0 y x0 = 2: Entonces p p cos x f (x) = p exp sen x 2 x 0
y en consecuencia
f 0 (2)
x > 0;
p p cos 2 = p exp sen 2 ' 0;148048539: 2 2
En la tabla siguiente se muestran aproximaciones de f 0 (2) con diferencias …nitas progresivas (cálculos realizados con una calculadora de bolsillo) h
x0 + h
y0 = f (x0 )
y1 = f (x0 + h)
0;001 0;000001 0;001 0;000001
1;999 1;999999 2;001 2;000001
2;68522882 2;68522882 2;68522882 2;68522882
2;685080592 2;685228672 2;685376689 2;685228968
y0 h 0;148228 0;148000 0;147869 0;148
y00 =
y1
jf 0 (2)
y00 j
1;79461 10 4;8539 10 1;79539 10 4;8539 10
4 5 4 5
Note que a medida que jhj se aproxima a cero, y00 se aproxima a f 0 (2) y el error jf 0 (2) y00 j es cada vez más pequeño; sin embargo, con una calculadora de bolsillo, para h su…cientemente pequeño y no nulo, se obtienen resultados como los siguientes: si h = 0;00000001; x0 + h = 2;00000001; y1 = f (x0 + h) = 2;685228822; luego y1 y 0 2;685228822 2;68522882 y00 = = = 0;2; h 0;00000001 que está muy alejado de f 0 (2) : Esto se debe a que y0 ; y1 son valores aproximados con 9 cifras de precisión que es lo que se obtiene de la calculadora. Para mejorar los resultados se deben calcular en al menos doble precisión, o sea con al menos 16 cifras de precisión que es lo que se obtiene en un computador personal Pentium I o más avanzados.
2.3. OPERADORES DE DIFERENCIAS FINITAS Y DERIVACIÓN NUMÉRICA
95
En la tabla siguiente se muestran aproximaciones de f 0 (2) mediante el uso de diferencias …nitas centrales: Los cálculos son realizados con una calculadora de bolsillo. h
x0
0;001 0;0001 0;00001 0;000001
h
1;999 1;9999 1;99999 1;999999
x0 + h
y0 = f (x0 + h)
y1 = f (x0 + h)
2;001 2;0001 2;00001 2;000001
2;685080592 2;685214014 2;68522734 2;685228672
2;685376689 2;685243623 2;685230301 2;685228968
y00 =
y1
y0
jf 0 (2)
2h 0;1480485 0;148045 0;14805 0;148
y00 j
5;39 10 8 3;539 10 6 1;461 10 6 4;8539 10 5
Note que cuando h es muy pequeño, debido a los errores de redondeo y la representación en un punto …jo, f (x0 + h) f (x0 h) sea el error tiende a aumentar ¿cuál es el valor de h a elegir para que f 0 (x0 ) h muy aceptable? Con una calculadora de bosillo, obtener h para que la aproximación sea su…cientemente buena (óptima) no es del todo evidente y depende de cada función f: En un computador personal se deben realizar los cáculos en al menos doble precisión y j h j6= 0 su…cientemente pequeño. Aproximación de f 00 (x) : Los operadores de diferencias …nitas de orden superior se de…nen por recurrencia en el sentido de la composición de operadores: k+1 0
donde
= r0 =
0
k
=
rk+1 = rk
;
k+1
r;
=
k
k 2 N,
= I operador identidad.
Además, podemos construir operadores mixtos como los siguientes: r; r ; ; r; : : : ; que se escriben simplemente como r; r ; ; r; : : : : De manera general, si m; n 2 N, se de…ne m n = m ( n ) que se escribirá m n . De manera similar para las otras combinaciones. Veamos algunos operadores de segundo orden. Se tiene los siguientes resultados. 2
1. Diferencia …nita progresiva de segundo orden 2
f (x) =
( f (x)) =
= f (x + 2h)
(f (x + h)
=
: Para toda f 2 C([a; b]); se tiene
f (x)) = f (x + 2h)
f (x + h)
(f (x + h)
f (x))
2f (x + h) + f (x) ;
obviamente, se supone que h > 0 y x 2 ]a; b[ son tales que x + 2h; x + h 2 [a; b] : 2. Diferencia …nita regresiva de segundo orden r2 = r r: Para toda f 2 C([a; b]); se tiene r2 f (x) = r (rf (x)) = r (f (x) = f (x)
f (x + h)) = f (x)
f (x + h)
(f (x + h)
f (x + 2h))
2f (x + h) + f (x + 2h) ;
con x; x + 2h; x + h 2 [a; b] ; h > 0: 3. Diferencia …nita central de segundo orden 2
f (x) =
( f (x)) =
= f (x + h) donde x; x + h; x
h 2 2f (x) + f (x f
x+
2
f
=
: Para toda f 2 C([a; b]); se tiene
x
h 2
= f (x + h)
f (x)
(f (x)
f (x
h))
h) ;
h 2 [a; b] ; h > 0:
4. Operadores mixtos de diferencias …nitas de segundo orden: r = r ; r= r; :Para toda f 2 C([a; b]); se tienen las siguientes diferencias …nitas de segundo orden: r f (x) = r ( f (x)) = r (f (x + h) = f (x + h)
rf (x) =
2f (x) + f (x
(f (x)
= f (x + h)
f (x
f (x)) = f (x + h) h) =
2
(f (x)
f (x
f (x) ;
h)) = f (x + h)
2f (x) + f (x
f (x)
h) =
f (x) 2
f (x) ;
(f (x)
f (x
h))
= h))
;
96CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA f (x) =
(f (x + h)
= f donde x; x +
3h 2 ;x
x+
+ h2 ; x
3h 2 h 2
f (x)) = f 2f
x+
x+ h 2
3h 2
+f
f
x+
h 2
;
x
h 2
f
h 2
x+
f
x
h 2
:
2 [a; b] :
Se tiene 2 = r = r a la que se le denomina diferencia …nita central del segundo orden. Como ejercicio se proponen obtener otras diferencias …nitas de segundo orden. De la de…nición de derivada segunda de una función f en un punto x 2]a; b[; se sigue que la derivada segunda f 00 (x) se aproxima como sigue: f 00 (x) '
f 0 (x + h) h
f 0 (x) 2
f 00 (x) '
;
f 00 (x) '
f (x) = h2
2f
(x)
h2
;
rf (x) r f (x) = : 2 h h2
Supongamos que f 2 C 4 ([0; L]). Se tiene
2 rf (x) f (x) r f (x) f (x + h) 2f (x) + f (x = = = 2 2 h h h h2 con 1 2 [x; x + h] ; 2 2 [x h; x] ; consecuentemente
j
f (x + h)
2f (x) + f (x h2
h)
f 00 (x) j=
r2 f (x) ; h2
f 00 (x) '
h)
= f 00 (x) +
h2 iv f ( 1 ) + f iv ( 2 ) ; 4!
h2 j f iv ( 1 ) + f iv ( 2 ) j 4!
M 2 h 12
! 0:
h7 !0
Ejemplo p Sea f la función real de…nida como f (x) = exp (sen x) x > 0: Entonces, la derivada segunda de f está de…nida como " p 2 p p p # p 1 cos x x sen x + cos x p f 00 (x) = exp sen x x > 0; 3 4 x x2 luego
2 p !2 2 1 cos 00 p f (2) = 4 4 2
p
3 p p 2 sen 2 + cos 2 5 2
3 2
p exp sen 2 '
0;3603967624:
Aproximemos la derivada segunda mediante la aplicación de diferencias …nitas centrales de segundo orden, esto es f (2 + h) 2f (2) + f (2 h) f 00 (2) ' h 6= 0; h y h su…cientemente pequeño. Para realizar los cálculos usamos una calculadora de bolsillo. Sea h = 0;02: Tenemos f (2;02) = 2;688117974; f (2) = 2;68522882; f (1;98) = 2;682195506: Luego 2f (2) + f (2 + h) = 0;3604: h2 Para h = 0;0001; se tiene f (2;0001) = 2;685243623; f (2) = 2;68522882; f (1;999) = 2;685214014: Entonces f (2;0001) 2f (2) + f (1;9999) f 0 (2) ' = 0;3: (0;0001)2 Debido a la representación en punto …jo y a causa de los errores de redondeo se obtiene este resultado que es una aproximación no satisfactoria. Nuevamente, la pregunta es, ¿cómo elegir h 6= 0 que nos rinda una buena aproximación de f 00 (2)? Consideremos h = 0;005: Entonces f 0 (2) '
f 0 (2) '
f (2;005)
f (2 + h)
2;685964562 2f (2) + f (1;995) = 2 (0;005)
2
2;68522882 + 2;684484068 = (0;005)2
0;3604;
resultado que obtuvimos anteriormente. La explicación de este hecho es que en una calculadora de bosillo se utliza la representación en punto …jo, y por otro lado, los errores de redondeo y de truncamiento afectan el resultado.
2.3. OPERADORES DE DIFERENCIAS FINITAS Y DERIVACIÓN NUMÉRICA
2.3.1.
97
Aproximación de derivadas de funciones reales como formas lineales
Sea x b 2 [a; b] y f 2 C m ([a; b]). Se nota Dm f = un funcional lineal en C m ([a; b]).
dm f dxm
(b x) la derivada m-ésima de f en x b. Entonces Dm es
Sean n 2 Z+ con n m, y (n) = fa = x0 ; x1 ; : : : ; xn = bg una partición de [a; b] : Se pone hj = xj xj 1 b a j = 1; : : : ; n y b h = max fhj j j = 1; : : : ; ng : En el caso de una partición uniforme, se tiene h = ; n xj = jh j = 0; 1; : : : ; n y b h = h: El operador de interpolación de Lagrange de f está de…nido como (f ) =
n X
f (xk ) Pk
k=0
m y sea Dnum = Dm
: Entonces, para todo f 2 C m ([a; b]) se tiene ! n n n X X X d m Pk m m ) (f ) = D ( (f )) = D f (xk ) Pk = (b x) : f (xk ) Dm Pk = f (xk ) dxm
m Dnum (f ) = (Dm
k=0
m Dnum
k=0
C m ([a; b]).
Así, es un funcional lineal sobre derivada m-ésima de f en el punto x b 2 [a; b].
k=0
Este funcional es la aproximación numérica de la
= fa = x0 ; x1 = bg, x b 2 [a; b] y
Sean n = m = 1, entonces
P0 (x) =
P1 (x) =
x a x b
dP 1 b ) (x) = ; b dx b a dP 1 a ) (x) = ; a dx b a
luego 1 Dnum (f )
=
1 X
f (xk )
k=0
dPk (b x) = f (a) dx
1 b
+ f (b)
a
Observamos que la derivada de f en x = x b se aproxima como tratado.
f (b) b
1 b
a
=
f (b) b
f (a) . a
f (a) , cociente incremental arriba a
Sean n = 2, (2) = x0 = a; x1 = a+b 2 ; x2 = b una partición uniforme de [a; b]; entonces h = f 2 C 2 ([a; b]) : Para m = 1, se tiene 1 Dnum (f ) =
2 X
f (xk )
k=0
En particular, para x b=
dP0 dx
a+b 2
dPk dP0 (b x) = f (a) (b x) + f dx dx
a+b 2
b a 2 .
Sea
dP1 dP2 (b x) + f (b) (b x) . dx dx
se tiene
a+b 2
=
1 ; h
dP1 dx
a+b 2
1 Dnum (f ) =
f (b)
dP2 dx
= 0;
a+b 2
=
1 ; h
f (a)
; h que es la aproximación de la derivada mediante una diferencia …nita central de primer orden. Escribiremos f (b x) =
f (b)
f (a) h
.
Para m = 2, obtenemos 2 Dnum (f ) = f (a)
1 h2
f
a+b 2
f (a) 2 1 + f (b) 2 = 2 h h
2f
a+b 2 h2
+ f (b)
2
=
f
h2
;
que corresponde a la aproximación de la derivada segunda mediante una diferencia …nita central de segundo orden. Mediante este proceso podemos construir otras formas lineales que son aproximaciones de las derivadas de una función real.
98CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA
2.3.2.
Aproximación numérica de derivadas parciales primeras, segundas y laplaciano
Sean R2 abierto, (a; b) 2 ; h; k 2 R no nulos tales que (a + h; b) ; (a; b + k) ; (a + h; b + k) 2 : Sea f una función real continua en : En un punto arbitrario (x; y) de notamos z = f (x; y) ; a x lo denominamos primera variable, a y lo llamamos segunda variable de la función f: Se de…ne la derivada parcial de f respecto de x en el punto (a; b) que se nota f (a + h; b) @f (a; b) = l m h!0 @x h
@f (a; b) y se de…ne como @x
f (a; b)
siempre que el límite exista. De manera similar, la derivada parcial de f respecto de y en el punto (a; b) @f se nota (a; b) y se de…ne como @y @f f (a; b + k) (a; b) = l m k!0 @y k
f (a; b)
siempre que el límite exista. Note que …jado (a; b) 2 ; se de…ne la función u como u (x) = f (x; b) con (x; b) 2 en x = a está de…nida como u (a + h) h!0 h
u (a)
u0 (a) = l m
Así, si u (x) = f (x; b) donde (x; b) 2 En forma análoga, …jado (a; b) 2 v 0 (y) = l m
k!0
f (a + h; b) h!0 h
f (a; b)
= lm
con b …jo, se tiene u0 (a) =
=
y la derivada de u
@f (a; b) : @x
@f (a; b) : @x
se de…ne la función v como v (y) = f (a; y) con (a; y) 2 : Luego
v (b + k) k
Así, si v (y) = f (a; y) donde (a; y) 2
v (b)
= lm
k!0
f (a; b + k) k
f (a; b)
con a …jo, entonces v 0 (b) =
=
@f (a; b) : @y
@f (a; b) : @y
Supongamos f 2 C 3 ( ) y h; k 2 R no nulos tales que (a + h; b) ; (a h; b) ; (a; b + k) ; (a; b k) 2 : De estas dos observaciones y tomando en consideración los métodos de aproximación de la derivada de una @f función real en un punto, se tienen los siguientes resultados que permiten aproximar (a; b) : @x f (a; b) h rf (a; b) h f (a; b) h
= = =
f (a + h; b) f (a; b) @f h @2f = (a; b) + ( h @x 2 @x2 f (a h; b) f (a; b) @f h @2f = (a; b) + h @x 2 @x2 f (a + h; b) f (a h; b) @f h2 = (a; b) + 2h @x 3!
1 ; b) ;
( 2 ; b) ; @3f @3f ( ; b) + ( ; b) ; 1 @x3 @x3 2
donde 1 se encuentra entre a y a + h; 2 se encuentra en a y a h; que corresponde a la aplicación de diferencias …nitas progresivas, regresivas y centrales, respectivamente. Resultados similares obtenidos para aproximar f (a; b + k) f (a; b) k f (a; b k) f (a; b) k f (a; b + k) f (a; b k) k con
1
entre b y b + k;
2
entre b y b
k:
@f (a; b) que lo presentamos en la siguiente forma @y
@f (a; b) = @y @f (a; b) = @y @f (a; b) = @y
k @2f (a; 1 ) ; 2 @y 2 k @2f (a; 2 ) ; 2 @y 2 k2 @ 3 f @3f (a; ) + (a; 1 3! @y 3 @y 3
2)
;
2.3. OPERADORES DE DIFERENCIAS FINITAS Y DERIVACIÓN NUMÉRICA
99
i) Para h 6= 0 su…cientemente pequeño, ponemos z0 = f (a; b) ; z1 = f (a + h; b) : El cociente
es una aproximación de
z1 fex (a; b) =
h
@f (a; b) mediante una diferencia …nita prograsiva. @x
ii) Si z0 = f (a; b) ; z1 = f (a
es una aproximación de
z0
h; b) con h 6= 0 su…cientemente pequeño, el cociente z1
fex (a; b) =
z0 h
@f (a; b) mediante una diferencia …nita regresiva. @y
iii) Si h 6= 0 su…cientemente pequeño, z1 = f (a + h; b) ; z2 = f (a
es una aproximación de
z1 fex (a; b) =
h; b) ; el cociente
z2 h
@f (a; b) mediante una diferencia …nita central. @x
@f @f (a; b) ; (a; b) se @x @y aproximan con el uso de diferencias …nitas centrales. A menos que se diga lo contrario supondremos que las derivadas parciales son aproximadas mediante el uso de las diferencias …nitas centrales. Obviamente las diferencias …nitas centrales son las más utilizadas, por lo tanto
Ejemplo Considérese la función f de…nida como f (x; y) = x3 y 4 sen2 (xy) @f (x; y) = @x = @f (x; y) = @y = Aproximemos
(x; y) 2 R2 : Se tiene
3x2 y 4 sen2 (xy) + x3 y 4 [2y sen (xy) cos (xy)] (3 sen (xy) + 2xy cos (xy)) x2 y 4 sen (xy)
(x; y) 2 R2 ;
4x3 y 3 sen2 (xy) + x3 y 4 (2x sen (xy) cos (xy)) (4 sen (xy) + 2xy cos (xy)) x3 y 3 sen (xy)
(x; y) 2 R2 :
@f @f (2; 3) y (2; 3) mediante diferencias …nitas centrales. @x @y
Primeramente, calculemos
@f @f (2; 3) y (2; 3) : Tenemos @x @y
@f (2; 3) = (3 sen (6) + 12 cos (6)) @x @f (2; 3) = (4 sen (6) + 12 cos (6)) @y Calculemos aproximaciones de
4
81 sen (6) =
967;2107771;
8
27 sen (6) =
627;9434139:
@f (2; 3) mediante diferencias …nitas centrales, esto es, calculemos @x f (2 + h; 3) fex (2; 3) =
f (2 2h
h; 3)
;
para h = 0;002; h = 0;00015; h = 0;000001: Para h = 0;002; se tiene
f (2;002; 3) f (1;999; 3) 48;67057704 52;53621459 fex (2; 3) = = = 2 0;002 0;004
967;1593875:
100CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Para este valor de h; se tiene la siguiente estimación del error: @f (2; 3) @x
fex (2; 3) = j 967;2107771
Para h = 0;00015 se tiene
( 967;1593875)j = 0;0513896:
50;44631203 50;7364752 f (2;00015; 3) f (1;99985; 3) = = fex (2; 3) = 2 0;00015 0;0003
967;2105667;
con lo que el error de aproximación es @f (2; 3) @x
fex (2; 3) = j 967;2107771
( 967;2105667)j = 0;0002104 = 2;104
10
4
:
Para h = 0;000001; se tiene
50;59034995 50;59243632 f (2;000001; 3) f (1;99999; 3) = = fex (2; 3) = 2 0;000001 0;000002
1043;185;
en consecuencia, se tiene la siguiente estimación del error @f (2; 3) @x
fex (2; 3) = j 967;2107771
( 1043;185)j = 75;9742229:
Notamos que para este valor de h; el error ha aumentado signi…cativamente. Esto se debe a los errores de redondeo y de truncamiento en el cálculo de f (2 + h; 3) y de f (2 h; 3) ; operaciones que se realizan en punto …jo con una precisión " = 10 9 : Si se trabaja con doble precisión mejoran los resultados. No incluimos estos resultados y proponemos que los comprueben. Pasemos ahora al cálculo aproximado de
Para k = 0;05 se tiene
@f (2; 3) con diferencias …nitas centrales, esto es @y
f (2; 3 + k) fey (2; 3) =
f (2; 3 2k
k)
k 6= 0:
22;97245043 84;69051462 f (2; 3;05) f (2; 2;95) = = fey (2; 3) = 2 0;05 0;1
617;1806419;
y el error de aproximación @f (2; 3) @y
fey (2; 3) = j 627;9434139
( 617;1806419)j = 10;762772:
Se constata que esta aproximación no es aceptable. Calculemos con k = 0;0015: Tenemos
49;65232798 51;53612921 f (2; 3;0015) f (2; 2;9885) fey (2; 3) = = = 2 0;0015 0;003
627;9337433;
y el error de aproximación @f (2; 3) @y
fey (2; 3) = j 627;9434139
( 627;9337433)j = 9;6706
10
3
;
con lo que se muestra que esta es una aproximación aceptable. Sea k = 0;00011: Entonces f (2; 3;00011) f (2; 2;99989) 50;52225955 50;66040683 fey (2; 3) = = = 2 0;00011 0;00022
627;9421818;
2.3. OPERADORES DE DIFERENCIAS FINITAS Y DERIVACIÓN NUMÉRICA
101
y el error de aproximación @f (2; 3) @y
fey (2; 3) = j 627;9434139
( 627;9421818)j = 1;2321
10
3
;
lo que muestra que es una mejor aproximación que la anterior. @2f @2f @2f (a; b) ; (a; b) pueden ser aproximadas siguiendo la (a; b) ; 2 @x @x@y @y 2 misma metodología empleada para el cálculo aproximado de las derivadas segundas de funciones reales @2f de una sola variable. Así, para h 6= 0; (a; b) puede aproximarse con diferencias …nitas centrales, esto @x2 es, @2f f (a + h; b) 2f (a; b) + f (a h; b) (a; b) ' fexx (a; b) = h 6= 0; 2 @x 2h h su…cientemente pequeño. Las derivadas parciales segundas
De manera similar, tenemos f (a; b + k) @2f (a; b) ' feyy (a; b) = @y 2
2f (a; b) + f (a; b + k) 2k
k 6= 0;
k su…cientemente pequeño.
Sea f 2 C 2 ( ) y (a; b) 2 : El laplaciano de f en el punto (a; b) 2 4f (a; b) =
se denota 4f (a; b) y se de…ne como
@2f @2f (a; b) + (a; b) ; @x2 @y 2
el mismo que puede ser aproximado como sigue: e (a; b) = f (a + h; b) 4f
2f (a; b) + f (a 2h
h; b)
+
f (a; b + k)
2f (a; b) + f (a; b + k) 2k
con h 6= 0; k 6= 0 su…cientemente pequeño. Ejemplo Sea f la función de…nida como f (x; y) = ln x2 + y 2 @2f y 2 x2 (x; y) = 2 @x2 (x2 + y 2 )2 @2f x2 y 2 (x; y) = 2 @y 2 (x2 + y 2 )2
(x; y) 2 R2 con (x; y) 6= (0; 0) : Se tiene (x; y) 2 R2 ; (x; y) 6= (0; 0) ; (x; y) 2 R2 ; (x; y) 6= (0; 0) ;
luego 4f (x; y) =
@ 2 f (x; y) @ 2 f (x; y) + =0 @x2 @y 2
Las funciones f tales que 4f (x; y) = 0 8 (x; y) 2
(x; y) 2 R2 ; (x; y) 6= (0; 0) :
se llaman funciones armónicas.
e (1; 2) aproximación de 4f (1; 2) : Calculemos valores aproximados de 4f
Sea h = 0;002; k = 0;0015: Entonces fexx (1; 2) =
=
feyy (1; 2) =
=
f (1;002; 2)
2f (1; 2) + f (0;998; 2) 2h 1;610238392 2 1;609437912 1;608638393 = 0;00024; 0;004 f (1; 2;0015) 2f (1; 2) + f (1; 1;9985) 0;003 1;610637642 3;218875825 + 1;608237642 = 1;80333 10 0;003
4
;
102CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA luego
e (1; 2) = fexx (1; 2) + feyy (1; 2) = 0;00024 4f
1;80333
4
10
= 5;966667
10
5
;
es una aproximación 4f (1; 2) = 0: Para h = k = 0;00012; tenemos fexx (1; 2) =
feyy (1; 2) =
con lo que
2f (1; 2) + f (0;99988; 2) 3;15 10 9 = = 0;000013125; 2 0;00012 0;00024 f (1; 2 + k) 2f (1; 2) + f (1; 2 k) 3;3 10 9 = = 0;00001375; 2 0;00012 0;00024
f (1;00012; 2)
e (1; 2) = fexx (1; 2) + feyy (1; 2) = 6;25 4f
10
7
;
e (1; 2) precedente. Así, 4f (1; 2) ' 4f e (1; 2) = 6;25 que es una mejor aproximación de 4f
2.4.
10
7:
Integración numérica
Según la Historia de la Matemática, fue el Cálculo Integral el que primero se desarrolló. Obviamente las primeras funciones que se integraron sobre un intervalo [a; b] fueron las polinomiales: Estas son en realidad las más simples de integrarse. Otras funciones sencillas de integrarse son las funciones trigonométricas seno y coseno. Pronto aparecieron otra clase R b de funciones continuas f que no se integran mediante funciones elementales, el cálculo de I(f ) = a f (x) dx resulta imposible (en algunos casos es posible mediante la integración de funciones de variable compleja), por lo que dicha integral tendrá que ser aproximada numéricamente. Con este propósito, consideramos un problema más sencillo que es el cálculo de la integral de…nida de un polinomio interpolante de la función f: Más aún, en esta sección tratamos la fórmula de Newton-Cotes y de esta se desprenden la regla del rectángulo o conocida también como fórmula del punto medio, la regla del trapecio o fórmula del trapecio, la regla de Simpson que son las más utilizadas. Obtenemos estimaciones de errores para cada una de estos métodos y luego se generalizan a particiones regulares del intervalo [a; b] en consideración, lo que da lugar a las reglas generalizadas del rectángulo Rn (f ), del trapecio Tn (f ) y de Simpson Sn (f ). Estas son aplicadas al cálculo de integrales dobles sobre regiones en las que las integrales pueden calcularse como integrales reiteradas, a tales regiones se los denomina del tipo I o II . La integración de funciones que se representan como series de potencias se estudian en el siguiente capítulo.
2.4.1.
Fórmula de Newton-Cotes Rb
Se de…ne el funcional I sobre C ([a; b]) como sigue: I (f ) = funcional lineal en C ([a; b]). El operador de interpolación de Lagrange lineal, y G (f ) = (I Así,
G (f ) =
k=0
f (x) dx
8f 2 C ([a; b]) : Entonces I es
es lineal. Se de…ne el operador G = I
: entonces G es
!
8f 2 C ([a; b]) :
) (f ) = I ( (f )) = I Pb = I n X
a
f (xk ) I (Pk ) =
n X k=0
n X
f (xk ) Pk
k=0
f (xk )
Z
a
=
n X
f (xk ) I (Pk )
k=0
b
Pk (x) dx 8f 2 C ([a; b]) ;
que se conoce como la fórmula de Newton-Cotes. De esta fórmula se desprenden algunos resultados que tratamos a continuación.
2.4. INTEGRACIÓN NUMÉRICA
103
Fórmula del rectángulo Para n = 0, = a+b , una partición del intervalo [a; b] construida únicamente por el punto medio. El 2 polinomio interpolante está de…nido como P0 (x) = 1 8x 2 [a; b] ; entonces G (f ) = f
Z
a+b 2
b
dx = (b
a+b 2
a) f
a
que se conoce como fórmula del rectángulo para aproximar I (f ) = Fórmula de los trapecios
;
Rb
f (x) dx.
a
Para n = 1, = fa = x0 ; x1 = bg una partición del intervalo [a; b] : Una interpolante de la función f está de…nida como v (x) = f (a) P0 (x) + f (b) P1 (x) x 2 [a; b] ; donde P0 ; P1 están de…nidos como x b x a P0 (x) = , P1 (x) = x 2 R: a b b a Resulta I (P0 ) =
Z
b
P0 (x) dx =
I (P1 ) =
b
a
a
Z
Z
b
P1 (x) dx =
a
Z
b
a
x a x b
b b a dx = ; b 2 a b a dx = : a 2
Consecuentemente G (f ) =
1 X
f (xk ) I (Pk ) = f (a)
b
a 2
k=0
+ f (b)
b
a 2
=
b
a 2
(f (a) + f (b)) :
Así, G (f ) =
b
a
(f (a) + f (b)) ;
2
que se conoce con el nombre de fórmula de los trapecios para aproximar I (f ) = Regla de Simpson Para n = 2 y
a+b 2 ; x2
= a = x0 ; x1 =
a
f (x) dx.
b a 2 ;
es una partición de [a; b] : Una interpolante a+b de f está de…nida como v (x) = f (a) P0 (x) + f P1 (x) + f (b) P2 (x) x 2 [a; b] donde P0 ; 2 P1 ; P2 son los polinomios de interpolación de Lagrange. Tenemos G (f ) =
2 X
=b ;h=
Rb
f (xk ) I (Pk ) = f (a) I (P0 ) + f
k=0
con I (P0 ) =
Z
b
P0 (x) dx =
a
I (P1 ) =
Z
P1 (x) dx =
a
I (Pn ) =
b
a
b
Z
Z
Z
b
a
b
P2 (x) dx =
a
Z
a
b
a+b 2
I (P1 ) + f (b) I (P2 ) ;
(x (x0
h x1 ) (x x2 ) dx = ; x1 ) (x0 x2 ) 3
(x (x1
x0 ) (x x1 ) h dx = 4 ; x0 ) (x1 x2 ) 3
(x (x2
x0 ) (x x1 ) h dx = : x0 ) (x2 x1 ) 3
Luego, G (f ) =
h 3
f (a) + 4f
a+b 2
+ f (b) ;
que se conoce como la regla de Simpson para aproximar I (f ) =
Rb a
f (x) dx:
104CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA
2.5.
Regla de los trapecios generalizada. Estimación del error
Sea f 2 C([a; b]) y consideremos como problema (P ) el cálculo de la integral I(f ) = Sean n 2 Z+ y
Rb a
f (x)dx:
(n) = fa = x0 ; x1 ; : : : ; xn = bg una partición de [a; b] : Se pone hj = xj
xj 1 b a j = 1; : : : ; n y b h = max fhj j j = 1; : : : ; ng : Suponemos que existe 1 tal que hj n b a j = 1; : : : ; n: En el caso de una partición uniforme, se tiene h = ; xj = jh j = 0; 1; : : : ; n, n b h = h y = 1: El polinomio de interpolación de la función f en el j-ésimo subintervalo [xj afín denotada gj y de…nida como sigue: gj (x) = f (xj
1)
+
f (xj )
f (xj
1)
hj
(x
xj
1)
x 2 [xj
1 ; xj ]
1 ; xj [;
de [a; b] es la función
j = 1; : : : ; n;
La función interpolante g sobre [a; b] está de…nida como g (x) =
n X
f (xj ) 'j (x)
x 2 [a; b] ;
j=0
donde 'j j = 1; : : : ; n; son las funciones techo antes de…nidas en los interpolantes a…nes a trozos. Note que g(xi ) = f (xi ) i = 0; 1; : : : ; n: En la …gura siguiente se muestra la discretización de [a; b], la grá…ca de la función f y de la de su interpolante g.
Figura 25
Como problema (P~n ) consideramos el siguiente: I(g) = tiene I(g) =
n Z X j=1
=
n X
xj
gj (x)dx =
xj
1
f (xj
n Z X j=1
1)
+
f (xj )
j=1
=
n 1
a
xj
xj
f (xj
1)
+
g(x)dx: De la de…nición de la función g, se
f (xj )
f (xj h
1
f (xj 2h
X h (f (a) + f (b)) + h f (xj ): 2 j=1
Rb
1)
1)
(x
xj
1)
hX = [f (xj 2
1)
dx
n
(x
x xj 1 )2 xjj
1
j=1
+ f (xj )]
2.5. REGLA DE LOS TRAPECIOS GENERALIZADA. ESTIMACIÓN DEL ERROR
105
La aproximación que hemos construido se conoce con el nombre de regla de los trapecios generalizada. Escribiremos n X1 h Tn (f ) = (f (a) + f (b)) + h f (xj ); 2 j=1
Así, I(f ) =
Z
a
n 1
b
f (x)dx ' Tn (f ) =
X h (f (a) + f (b)) + h f (xj ): 2 j=1
Esta aproximación se completa con una estimación del error entre I(f ) y Tn (f ) que tratamos a continuación. Se prueba inmediatamente que el funcional Tn de C([a; b]) en R de…nido como n 1
X h Tn (f ) = (f (a) + f (b)) + h f (xj ) 2 j=1
8f 2 C([a; b]);
es lineal, es decir que Tn es un elemento del espacio dual de C([a; b]): De la fórmula de los trapecios generalizada para una partición uniforme se observa que para su aplicación se requiere disponer de la siguiente información: extremos del intervalo [a; b] en el que la función f está de…nida y la propia función f; número de puntos de la partición (n) : Con esta información se tiene el siguiente algoritmo de aproximación de una integral de…nida mediante la regla de los trapecios generalizada. Algoritmo Datos de entrada: n 2 Z+ ; a; b 2 R; función f: Datos de salida: n; Tn (f ) ; mensaje. 1. Veri…car a < b: Caso contrario continuar en 7). 2. Hacer h =
b
a n
:
3. S = 0: 4. Para j = 1; : : : ; n
1
S = S + f (a + jh) ; Fin de bucle j: 5. Tn (f ) =
h (f (a) + f (b)) + hS:: 2
6. Imprimir n; Tn (f ) : Continuar en 8). 7. Mensaje: a < b: 8. Fin. Ejemplo Sea f la función real de…nida como f (x) = x2 ex x 2 [0; 2] : Calculemos I (f ) = y aproximemos a I (f ) mediante la regla de los trapecios generalizada Tn (f ) :
R2 0
f (x) dx =
R2 0
x2 ex dx
Primeramente calculamos el valor exacto de la integral I(f ): Aplicando el método de integración por partes, tenemos I (f ) =
Z
0
2
x2 ex dx = x2 ex
2 (xex
ex )
2 0
= 2 e2
1 ' 12;7781122:
106CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA En la tabla siguiente se muestra la aplicación del algoritmo precedente, esto es, la regla de los trapecios generalizada para una partición uniforme del intervalo [0; 2] : n 10 20 40 80 160 320 640 1280
Tn (f ) 12;9748064291 12;8273508376 12;7904259325 12;7811908863 12;7788818859 12;7783046208 12;7781603037 12;7781242243
Error=j I (f ) Tn (f ) j 1;966942312 10 1 4;9238639741 10 2 1;2313734634 10 2 3;0786884382 10 2 : 7;6968803500 10 4 1;9242300412 10 4 4;8105813249 10 5 1;2026457201 10 5
Estimación del error de integración con la fórmula de los trapecios Primeramente estableceremos una estimación del error de integración con la fórmula de los trapecios y a continuación usaremos este resultado para obtener una etimación del error de integración con la fórmula de los trapecios generalizada. Rb Sea f 2 C 2 ([a; b]) : Consideremos el problema I (f ) = a f (x) dx: Esta integral se aproxima con la denominada regla de los trapecios T (f ) de…nida como Z
T (f ) =
b
P (x) dx =
b
a 2
a
(f (a)
f (b)) ;
donde P (x) = f (a) '0 (x) + f (b) '1 (x) x 2 [a; b] es el polinomio de interpolación de f; '0 ; '1 son los polinomios de interpolación de Lagrange antes de…nidos (véase interpolación de Lagrange). El error de interpolación polinomial de Lagrange está de…ndo como " (x) = f (x)
P (x) =
f 00 ( ) (x 2!
a) (x
b) x 2 [a; b] ;
2 [a; b] : El error de integración con la regla de los tapecios se nota "f y se de…ne como "f = I (f ) T (f ) : Nos interesamos en obtener una estimación del error "f y en una mayoración de j "f j : De la de…nición de I (f ) y T (f ) se sigue que "f = I (f )
T (f ) =
Z
b
(f (x)
P (x)) dx =
a
Z
a
b
f 00 ( ) (x 2!
a) (x
b) dx:
Sean m = m n jf 00 (x)j ; M = max jf 00 (x)j : Entonces x2[a;b]
x2[a;b]
f 00 ( )
m de donde m j(x 2
a) (x
M
jf 00 ( )j j(x 2
b)j
8 2 [a; b] ;
a) (x
b)j dx
M j(x 2
a) (x
b)j
e integrando sobre [a; b] ; resulta m 2
Z
a
b
j(x
a) (x
Puesto que ! (x) = (x
b)j dx
Z
a
a) (x Z
a
b)
b
jf 00 ( )j j(x 2!
a) (x
M 2
b)j dx
Z
b
a
j(x
0 8x 2 [a; b] ; entonces
b
! (x) dx =
Z
a
b
(x
a) (x
b) dx =
a)3
(b 6
;
a) (x
b)j dx:
2.5. REGLA DE LOS TRAPECIOS GENERALIZADA. ESTIMACIÓN DEL ERROR con lo que la desigualdad precedente se expresa como Z b 00 m jf ( )j (b a)3 j(x a) (x 12 2 a y de esta a su vez se obtiene la siguiente: Z b 00 12 jf ( )j m j(x 3 2 (b a) a
b)j dx
a) (x
M (b 12
b)j dx
a)3 ;
M:
Por el teorema del valor intermedio (véase en Calculus I de Apostol, página 177), existe Z b 00 jf ( )j 12 00 f ( ) = j(x a) (x b)j dx 3 2 (b a) a con lo cual
Z
b
a
Consecuentemente j"f j = jI (f )
T (f )j =
Z
b
a
(b
En conclusión, j"f j
2 [a; b] ; y como jf 00 ( )j
jf 00 ( )j j(x 2
f 00 ( ) (x 2
a) (x
a) (x
b)j dx =
b) dx
Z
b
a
(b
107
2 [a; b] tal que
a)3 00 f ( ) : 12
jf 00 ( )j j(x 2
a) (x
b)j dx
(b
a)3 00 f ( ) : 12
a)3 00 jf ( )j para algún 2 [a; b] : En la práctica resulta difícil obtener 12 M M se sigue que j"f j (b a)3 : 12
Obtengamos una estimación del error para la fórmula de los trapecios generalizada. Sea n 2 Z+ y
(n) = fx0 = a; x1 ; : : : ; xn = bg una partición del intervalo [a; b] con xi 1 < xi ; b a hi = xi xi 1 i = 1; : : : ; n; b h = max hi : Suponemos que existe 1 tal que hi i = 1; : : : ; n: i=1;:::;n n A las particiones que satisfacen esta propiedad se les conoce como particiones regulares. En el caso de b a una partición uniforme se tiene h = hi = i = 1; 2; : : : ; n; = 1: n La fórmula de los trapecios generalizada está de…nida como n 1
Tn (f ) =
X h (f (a) + f (b)) + h f (xk ) : 2 k=1
Note que el polinomio de interpolación de f de grado 1 en el k-ésimo subintervalo [xk de…nido como f (xk ) f (xk 1 ) Pk (x) = f (xk 1 ) + (x xk 1 ) x 2 [xk 1 ; xk ] ; hk consecuentemente n Z xk n X X1 h Tn (f ) = Pk (x) dx = (f (a) + f (b)) + h f (xk ) : 2 xk 1 k=1
1 ; xk ]
de [a; b] está
k=1
El error de integración con la fórmula de los trapecios generalizada se nota "f y se de…ne como "f = I (f ) Tn (f ) : Apliquemos el error de integración con la regla de los trapecios a cada intervalo [xk 1 ; xk ] k = 1; : : : ; n: Resulta n Z xk n Z xk n Z xk X X X "f = I (f ) Tn (f ) = f (x) dx Pk (x) dx = [f (x) Pk (x)] dx =
n Z X k=1
xk
xk
f 00 (
1
2
k)
k=1
xk
(x
xk
1
k=1
1 ) (x
xk ) dx;
xk
1
k=1
xk
1
108CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA y
k
2 [xk
1 ; xk ]
k = 1; : : : ; n:
De la estimación del error de integración con la regla de los trapecios antes obtenida, resulta j"f j = jI (f ) n Z X
Tn (f )j = xk 1
b
a n
jf 00 (
k )j
3 1)
f 00 (
1
xk k) =
n X h3
M
f 00 (
k
k=1
f 00 ( k ) (x 2 1 ) (x
12
b
k)
xk
1 ) (x
xk ) dx
xk )j dx
n X h3
k
k=1
k = 1; 2; : : : ; n; entonces h3k j"f j
Además, m
j f 00 ( k ) j j(x 2 xk 12
k=1
xk
xk
k=1
k=1 xk n X (xk
Puesto que hk
n Z X
12
f 00 (
k)
b
hk b h2
n n
:
a b2 h ; luego
ab h2 X 00 f ( n 12
k)
:
k=1
k = 1; : : : ; n; de donde n
1 X 00 f ( n
m
k)
M;
k=1
y por el teorema del valor intermedio, existe
j"f j pués hk
b
a n
b
2 [a; b] tal que jf 00 ( )j =
n
ab h2 X 00 f ( n 12
k)
(b a) b 2 00 h f ( ) 12
=
k=1
b
k = 1; 2; : : : ; n; b h = max hk
En el caso de una partición uniforme se tiene j"f j
b
a
n
k=1;:::;n
n 1 P jf 00 ( n k=1
k )j ;
con lo cual
(b a) b 2 M h ! 0; h!0 12
!0:
n !1
=1yb h = h: entonces a
12
M h2 ! 0: h!0
En cualquiera de los casos, el método de integración aproximado de los trapecios generalizado es convergente, esto es Tn (f ) ! I (f ) : n!1
2.6.
Regla de Simpson generalizada
Sean f 2 C ([a; b]) ; n 2 Z+ con n > 1 y (n) = fx0 = a; x1 ; : : : ; xn = bg una partición del intervalo [a; b] ; esto es xi 1 < xi i = 1; : : : ; n; hi = xi xi 1 ; i = 1; : : : ; n; b h = max fhi j i = 1; : : : ; ng : En el caso de b a una partición uniforme, se de…ne h = y xj = a + jh j = 0; 1; : : : ; n; entonces b h = h: Suponemos n b a que existe 1 tal que hi i = 1; : : : ; n: A las particiones que satisfacen esta propiedad, n como ya hemos dicho anteriormente, se les conoce como particiones regulares. En el caso de la partición uniforme se tiene = 1: Consideramos el k-ésimo intervalo [xk 1 ; xk ] k = 1; 2; : : : ; n y aplicamos la regla de Simpson a este intervalo. Tenemos hk xk 1 + xk Ik = f (xk 1 ) + 4f + f (xk ) : 6 3
2.6. REGLA DE SIMPSON GENERALIZADA
109
Luego Sn (f ) =
n X
Ik =
k=1
n X hk k=1
6
f (xk
1)
+ 4f
xk
+ xk 2
1
+ f (xk ) ;
se llama fórmula de Simpson generalizada. Se prueba inmediatamente que …jados n 2 Z+ con n > 1 y (n) una partición regular del intervalo [a; b]; n h P xk 1 + xk k el funcional Sn de C ([a; b]) en R de…nido como Sn (f ) = f (xk 1 ) + 4f + f (xk ) 2 k=1 6 es lineal. En el caso de una partición uniforme, se tiene Sn (f ) =
n X
Ik =
k=1
=
n X h k=1
n
hX [f (xk 6
6
f (xk
1)
h h (f (a) + f (b)) + 6 3
xk n
1 ) + f (xk )] +
k=1
=
+ 4f
4h X f 6
+ xk 2
1
xk
k=1
n
2 X f (xk ) + h f 3 k=1
+ xk 2
1
k=1
n X1
+ f (xk )
xk
+ xk 2
1
:
De la fórmula de Simpson generalizada para una partición uniforme se observa que para su aplicación se requieren de los siguientes datos: número de puntos de la partición (n) ; extremos del intervalo [a; b] en el que la función f está de…nida y la propia función f . Con esta información se tiene el siguiente algoritmo de aproximación de una integral de…nida mediante el método de Simpson con la fórmula generalizada. Algoritmo Datos de entrada: n 2 Z+ ; a; b 2 R; función f: Datos de salida: n; Sn (f ) ; mensaje. 1. Veri…car a < b: Caso contrario continuar en 9) 2. Hacer h =
b
a n
:
3. S1 = 0: 4. S2 = 0: 5. Para j = 1; : : : ; n
1
S1 = S1 + f (a + jh) ; S 2 = S2 + f
a+ j
1 2
h :
Fin de bucle j: 6. S2 = S2 + f 7. Sn (f ) =
a+ n
1 2
h :
h h 2h (f (a) + f (b)) + S1 + S2 : 6 3 3
8. Imprimir n; Sn (f ) : Continuar en 10). 9. Mensaje: a < b: 10. Fin. Ejemplo
110CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Sea f la función real de…nida como f (x) = x2 ex x 2 [0; 2] : Calculemos I (f ) = y aproximemos a I (f ) mediante la fórmula de Simpson generalizada Sn (f ).
Z
2
f (x) dx =
0
Z
2
x2 ex dx
0
Aplicando el método de integración por partes, tenemos I (f ) =
Z
2
x2 ex dx = x2 ex
2 (xex
ex )
0
2 0
= 2 e2
1 ' 12;7781122:
Esta integral ya fue calculada en la sección precedente y fue aproximada con la regla de los trapecios generalizada. En la tabla siguiente se muestra la aplicación del algoritmo precedente, esto es, la fórmula de Simpson generalizada para una partición uniforme del intervalo [0; 2] : n 10 20 40 80 160
Sn (f ) 12;7781989738 12;7781176308 12;7781125376 12;7781122191 12;7781121992
Error :j I (f ) Sn (f ) j 8;677590441 10 5 5;4329327987 10 6 : 3;3970602331 10 7 2;123393727516 10 8 1;3271588273 10 9
Comparando estos resultados con los obtenidos con la fórmula de los trapecios generalizada podemos constatar que con la regla de Simpson generalizada se tiene una convergencia cuadrática mientras que con la de los trapecios generalizada se tiene únicamente una convergencia del tipo lineal. Obviamente que con la fórmula de Simpson generalizada se realizan n evaluaciones adicionales de la función f que las que se realizan en la de los trapecios generalizada.
2.7.
Estimación del error en la regla de Simpson
Supongamos f 2 C 4 ([a; b]) : Ponemos I (f ) = Simpson G (f ) arriba de…nida como G (f ) =
b
a
Rb a
f (x) dx: Para aproximar I (f ) aplicamos la regla de
f (a) + 4f
6
b+a 2
+ f (b) ;
y denotamos con "f el error de aproximación cometido entre la solución exacta I (f ) y su valor aproximado G (f ) ; esto es, "f = I (f ) G (f ) : Determinemos "f : i) Recordemos que si f (x) es un polinomio de grado 2; entonces f (x) se escribe como a+b 2
f (x) = f (a) '0 (x) + f
'1 (x) + f (b) '2 (x)
x 2 [a; b] ;
donde '0 ; '1 ; '2 son los polinomios de interpolación de Lagrange antes de…nidos (véase la sección Rb interpolación polonomial). Resulta que I (f ) = a f (x) dx = G (f ) ; y "f =
Z
b
f (x) dx
G (f ) = 0:
a
ii) Mostremos que si f es un polinomio de grado 3, también se tiene "f = 0: En efecto, de la fórmula del error de interpolación de Lagrange tenemos " (x) = f (x) y
2 ]a; b[ :
P (x) =
f 000 ( ) (x 3!
a) x
a+b 2
(x
b)
x 2 [a; b]
2.7. ESTIMACIÓN DEL ERROR EN LA REGLA DE SIMPSON Sea t =
x
a h
con h =
b
a 2
111
; entonces " (x) = h2 t (t
1) (t
2)
f 000 ( ) : 3!
Puesto que f es un polinomio de grado 3, f 000 (x) es una constante, sea f 000 (x) = c Z
b
" (x) dx =
a
=
Z
(f (x)
a h2 c
3!
Z
P (x)) dx =
2
h2 t (t
1) (t
2)
0
2
t (t
h2 c 2) dt = 3!
1) (t
0
Por lo tanto "f = I (f )
Z
b
G (f ) =
Z
Z
b
f (x) dx
a
Z
P (x) dx =
a
c dt 3! 2
1 4 t 4
b
8x 2 [a; b] : Resulta
3
t +t
2
= 0: 0
b
" (x) dx = 0:
a
iii) Sea f 2 C 4 ([a; b]) cualquiera. El resultado que acabamos de obtener en la parte ii) muestra que la fórmula de cuadratura dada por la regla de Simpson es exacta para polinomios de grado 3; por lo que podemos construir un polinomio de interpolación de grado 3 que mejore la precisión de I (f ) : Busquemos un polinomio P de grado 3 que veri…que las siguientes condiciones: P (a) = f (a) ;
a+b 2
P
a+b 2
=f
;
a+b 2
P0
P (b) = f (b) ;
Sea Q el polinomio de interpolación de f que pasa por los puntos (a; f (a)) ;
= f0
a+b 2
a+b ;f 2
: a+b 2
;
(b; f (b)) ; es decir que a+b 2
Q (x) = f (a) '0 (x) + f
'1 (x) + f (b) '2 (x)
x 2 [a; b] ;
donde '0 ; '1 ; '2 son lo plinomios de interpolación de Lagrange. Se de…ne P (x) = Q (x) + ! (x) x 2 [a; b] ; donde 2 R se debe determinar por la condición a + b a + b a+b P0 = f0 ; y ! es la función de…nida como ! (x) = (x a) x (x b) 2 2 2 x 2 [a; b] : De la de…nición de P , es claro que P (a) = f (a) ;
a+b 2
P
a+b 2
=f
;
P (b) = f (b) :
Derivando la función P; se tiene P 0 (x) = Q0 (x) + ! 0 (x) con ! 0 (x) = (x
a+b 2
a) x
+ (x
a) (x
a+b 2
b) + x
Entonces ! P0 Puesto que
a+b 2
0
a+b 2 = Q0
2 R es tal que P 0
= a+b 2
a+b 2 f0
a+b 2
a+b 2
a
+ !0
= f0
a+b 2 a+b 2
a+b 2
= Q0
b
= Q0
; entonces
a+b 2
4
(b
=
a)2
(b 4
a+b 2
4
(x
b) :
; (b
a)2 :
2 R satisface la igualdad a)2 ;
112CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA lo que a su vez permite elegir
a+b 2 (b
f0 =
como sigue:
4
a) 4 (b
Se veri…ca inmediatamente que P 0
Q0
2
a)
a+b 2
4
=
2
entonces P 0 (x) = Q0 (x) +
a+b 2
Q0
(b
a)
a+b 2
= f0
a+b 2
f0
a+b 2
a+b 2
Q0
2
f0
! (x)
a+b 2
;
x 2 [a; b] :
:
Determinemos el error de interpolación " (x) para este polinomio de interpolación, esto es " (x) = f (x) P (x) x 2 [a; b] : Con este propósito de…nimos la función siguiente: (t) = u (x) [f (t) donde x 2 [a; b] es …jo y u (t) = (t Puesto que P (a) = f (a) ;
P (t)]
= f
P (x)]
t 2 [a; b] ;
2
a+b 2
a) t a+b 2
P
u (t) [f (x) (t
b) :
a+b 2
;
P (b) = f (b) ; se veri…ca inmediatamente
a+b = (b) = (x) = 0: Así, la función tiene cuatro raíces en el intervalo [a; b] : 2 Por el teorema de Rolle (véase en Calculus I de Apostol, página 224), 0 (t) tiene cuatro raíces, pués en a+b t= también se anula; 00 (t) tiene tres raíces, 000 (t) tiene dos raíces, iv (t) tiene una raíz y sea 2 2 [a; b] tal que iv ( ) = 0: Puesto que que
(a) =
iv
(t) = u (x) f iv (t)
P iv (t)
uiv (t) [f (x)
P (x)] t 2 [a; b] :
De la de…nición del polinomio P se tiene P iv (t) = 0; de la de…nición del polinomio u; uiv (t) = 4!: Entonces iv
(t) = u (x) f iv (t) 0 =
iv
4! (f (x) iv
( ) = u (x) f ( )
P (x)) ; 4! (f (x)
P (x)) ;
de donde
f iv ( ) u (x) x 2 [a; b] : 4! Calculemos el error de integración def usando la fórmula de cuadratura dada por la regla de Simpson: " (x) = f (x)
P (x) =
"f = I (f )
G (f ) :
Como f 2 C 4 ([a; b]) ; sea M = max f iv (x) ; m = m n f iv (x) : Entonces x2[a;b]
"f =
x2[a;b]
Z
b
" (x) dx =
a
Además, m
f iv ( )
M y
Z
a
b
f iv ( ) u (x) dx: 4!
depende de x; en consecuencia f iv ( ) ju (x)j 4!
u (x) m 4!
M ju (x)j 4!
e integrando sobre el intervalo [a; b] se obtiene la siguiente desigualdad m 4!
Z
a
b
ju (x)j dx
Z
a
b
f iv ( ) ju (x) dxj 4!
M 4!
Z
a
b
ju (x)j dx:
2.7. ESTIMACIÓN DEL ERROR EN LA REGLA DE SIMPSON Rb
Para calcular
a
x
u (x) dx realizamos el siguiente cambio de variable: t =
u (x) = (x
Luego
Z
u (x) dx = h
4
a
Z
2
2t
t4
h
u (x) x 2 [a; b] con lo que
Resulta que Z
b
a
Z
b
a
a 2
: Tenemos
2)
4 5 h ; 15
2t dt =
0
m 4 5 h 4! 15 h5 m 90
b
t 2 [0; 2] :
4t3 + 5t2
0 8x 2 [a; b] ; entonces ju (x)j =
con h =
1)2 (t
b) = h4 t (t
(x
4t3 + 5t2
b
a
2
a+b 2
a) x
= h 4 t4
y siendo u (x)
113
f iv ( ) ju (x) dxj 4! 1 iv f ( ) u (x) dx 4!
M 4 5 h ; 4! 15 h5 M ; 90
1 iv f ( ) u (x) dx 4!
M:
Rb a
ju (x)j dx =
4 5 h : 15
y de esta desigualdad se obtiene la siguiente: 90 h5
m
Z
b
a
Aplicando el teorema del valor intermedio, existe 90 f ( ) = 5 h iv
2 [a; b] tal que
Z
b
a
1 iv f ( ) u (x) dx; 4!
de donde j"f j = jI (f ) Puesto que h =
b
a 2
G (f )j =
Z
b
a
1 iv f ( ) u (x) dx 4!
Z
b
a
1 iv h5 iv f ( ) u (x) dx = f ( ) : 4! 90
; entonces j"f j
(b a)5 iv f ( ) 2880
M (b 2880
a)5 :
Aplicamos este resultado para estimar el error en la aproximación de I (f ) mediante la fórmula de Simpson generalizada, que se trata a continuación. Error de aproximación con la fórmula de Simpson generalizada Sean n 2 Z+ ; (n) una partición del intervalo [a; b] con xk b h = max hk : Entonces, para cada k = 1; : : : ; n se tiene
1
< xk
k = 1; : : : ; n; hk =
1 (xk 2
xk
1) ;
k=1;:::;n
(xk
(k)
"f con
k
2 [xk
1 ; xk ] ;
Mk =
max
x2[xk
1 ;xk ]
xk 1 )5 iv f ( 2880
k)
Mk (xk 2880
xk
5 1) ;
f iv (x) :
Además, "f = I (f )
Sn (f ) =
n Z X k=1
xk
xk
f (x) dx 1
n Z X k=1
xk
xk
Gk (f ) dx = 1
n Z X k=1
xk
xk
(f (x) 1
G (x)) dx =
n X k=1
(k)
"f ;
114CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA xk
xk 1 f (xk 1 ) + 4f 6 aplicada a cada intervalo [xk 1 ; xk ] ; y donde Gk (f ) =
(k)
"f
=
Z
xk
+ xk 3
1
xk
(f (x)
xk
(xk
G (f )) dx
1
+ f (xk )
k = 1; : : : ; n; es la regla de Simpson
xk 1 )5 iv f ( 2880
Mk (xk 2880
k)
xk
5 1) :
Entonces j"f j = jI (f )
Sn (f )j
Puesto que m
f iv (
n X
n X (xk
(k)
"f
k=1
k)
k=1
M
xk )5 iv f ( 2880 1
k) =
n X h5
f iv (
k
k=1
90
k)
n b h5 X iv f ( 90
k)
:
k=1
k = 1; : : : ; n; se sigue que n X
nm
f iv (
nM
k)
k=1
y por el teorema del valor intermedio, existe
2 [a; b] tal que
n
1 X iv f ( n
k)
= f iv ( ) ;
k=1
luego
n b h5 X iv f ( 90
k)
=
k=1
Así,
n b 5 iv h f ( ) 90
n b5 h M: 90
n b5 n b 5 iv h f ( ) h M: 90 90 b a se tiene la siguiente estimación del error de En el caso de una partición uniforme, b h = h = 2n integración: j"f j
j"f j
n 5 iv n b a iv b a 4 iv h f ( ) = h4 h f ( ) f ( ) = 90 90 2n 2n
(b
a) M 4 h ; 180
y de esta estimación resulta j"f j =
Z
f (x) dx
Sn (f )
(b
a
o lo que es lo mismo l m Sn (f ) = n!1
b
Z
a) M 4 h ! 0: h!0 180
b
f (x) dx; que muestra que el método de integración mediante la
a
fórmula de Simpson generalizada es convergente. En el caso de la estimación j"f j =
Z
a
b
f (x) dx
Sn (f )
n b5 h M; 90
con b h = max hk ; se requiere de una hipótesis suplementaria sobre cada hk ; esto es, la partición del k=1;:::;n
intervalo [a; b] debe ser regular, es decir que existe 1 tal que hk b a b h y en consecuencia 2n Z b b a b4 j"f j = f (x) dx Sn (f ) h M 190 a que prueba la convergencia del método de integración numérica.
b
a
2n
! 0;
n!1
k = 1;
; n ; entonces
2.8. INTEGRALES DOBLES
2.8. Sea
115
Integrales dobles un subconjunto cerrado y acotado de R2 y f 2 C( ). Se desea calcular I(f ) =
RR
f (x; y)dxdy:
En el caso de dominios sencillos como un disco o un rectángulo y funciones f aparentemente simples, el cálculo de I(f ) puede resultar muy di…cultoso y en muchas situaciones imposible, más aún, para dominios muy generales y funciones que no se integran mediante funciones elementales, el cálculo de I(f ) resulta imposible, por lo que dicha integral tendrá que ser aproximada numéricamente. Con este propósito, consideramos las regiones o dominios de los tipos I y II que se indican a continuación. 1. Sea [a; b] un intervalo cerrado de R: Se dice que = (x; y) 2 R2 j '1 (x)
es una región o dominio del tipo I si y
'2 (x); x 2 [a; b] ;
donde '1 ; '2 son funciones continuas en [a; b] tales que '1 región del tipo I:
'2 : En la …gura siguiente se muestra una
Figura 26
2. Sea [c; d] un intervalo cerrado de R: Se dice que = (x; y) 2 R2 j donde región
1 (y)
es un dominio o región del tipo II si x
1;
2 son funciones continuas en [c; d] tales que del tipo II:
2 (y); 1
2:
y 2 [c; d] ; En la …gura siguiente se muestra una
Figura 27
Los dominios muy complejos pueden descomponerse en forma apropiada en subdominios que correspondan a uno de estos tipos precisados, por lo que el cálculo aproximado de I(f ) se reduce al cálculo de la integral doble de la función f sobre cada subdominio de la descomposición de que se haya establecido. Por otro lado, para dominios como un rectángulo o regiones del plano del tipo I o II puede aplicarse la regla de los trapecios generalizada, la regla de Simpson generalizada. Nos limitamos a la aplicación de la regla de los trapecios para regiones del tipo I. Para regiones del tipo II se procede en forma muy similar. Igualmente la aplicación de la regla de Simpson generalizada se aplica en forma muy parecida a la de los trapecios generalizada. Sea
2 R2 una región del tipo I; esto es, = (x; y) 2 R2 j '1 (x)
y
'2 (x)
x 2 [a; b] ;
116CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA donde '1 ; '2 son funciones continuas en [a; b] tales que '1 (x) '2 (x) 8x 2 [a; b] : RR Sea f 2 C ( ) e I (f ) = f (x; y) dxdy: esta integral lo expresamos como una integral reiterada siguiente: I (f ) =
Z
b
a
De…nimos g (x) =
Z
Z
!
y='2 (x)
f (x; y) dy dx:
y='1 (x)
y='2 (x)
f (x; y) dy
x 2 [a; b] : Entonces I (f ) =
y='1 (x)
Rb a
g (x) dx: Apliquemos la fórmula
de los trapecios generalizada con una partición uniforme del intervalo [a; b] : Para el efecto, sea n 2 Z+ : b a Ponemos h = ; xj = a + h j = 0; 1; : : : ; n: La regla de los trapecios generalizada para aproximar n R b la integral I (f ) = a g (x) dx se escribe como sigue: n 1
X h Tn (g) = (g (a) + g (b)) + h g (xj ) : 2 j=1
Además, de la de…nición de la función g se tiene Z
g (a) =
'2 (a)
f (a; y) dy;
'1 (a)
Z
g (xj ) =
'2 (xj )
f (xj ; y) dy
j = 1; : : : ; n
1;
'1 (xj )
Z
g (b) =
'2 (b)
f (b; y) dy:
'1 (b)
Todas estas integrales las expresaremos en la forma Ij (f ) =
Z
'2 (xj )
f (xj ; y) dy
j = 0; 1; : : : ; n;
'1 (xj )
las mismas que a su vez pueden ser aproximadas con la regla de los trapecios generalizada como se muestra a continuación. Sea m 2 Z+ : Se deine hj = (j) Tm (f )
hj = 2
1 (' (xj ) m 2
'1 (xj )) y yk = '1 (xj ) + khj
f (xj ; '1 (xj )) + f (xj ; '2 (xj )) + hj
m X1
k = 0; 1; : : : ; m: Entonces !
f (xj ; yk )
k=1
j = 0; 1; : : : ; n;
(j)
en consecuencia. Ij (f ) ' Tm (f ) ; y n 1
Tn (g) '
X h (0) (n) (j) Tm (f ) + Tm (f ) + h Tm (f ) : 2
I (f ) '
X h (0) (n) (j) Tm (f ) + Tm (f ) + h Tm (f ) : 2
j=1
Así, n 1 j=1
nP1 h (0) (n) (j) Tm (f ) + Tm (f ) + h Tm (f ) que es la formulación de la regla de los 2 j=1 trapecios generalizada para regiones del tipo I: Esta es una forma lineal en C ( ) :
Ponemos Tmn (f ) =
Mediante un procedimiento similar se establece la formulación de la regla de los trapecios generalizada para regiones del tipo II; la misma que se propone como ejercicio.
2.8. INTEGRALES DOBLES
117
Para elaborar el algoritmo para el cálculo aproximado de una integral doble de una función sobre una región del tipo I con la regla de los trapecios generalizada requiere de la siguiente información: intervalo [a; b] y en consecuencia los extremos a y b de dicho intervalo, las funciones continuas '1 ; '2 en [a; b] de modo que '1 (x) '2 (x) x 2 [a; b] ; la función continua a integrar f de…nida en ; el número de puntos n de la partición uniforme del intervalo [a; b] que lo llamaremos partición horizontal, el número de puntos m de la partición del intervalo ['1 (xj ) ; '2 (xj )] j = 0; 1; : : : ; n a la que lo llamaremos particiones verticales. Algoritmo Datos de entrada: m; n 2 Z+ ; a; b 2 R; funciones '1 ; '2 ; f: Datos de salida: Tmn (f ) ; mensaje. 1. Veri…car a < b; caso contrario continuar en 7). 2. h =
b
a n
:
3. S = 0: 4. Para j = 0; : : : ; n xj = a + jh hj =
1 m
('2 (xj )
'1 (xj ))
S1 = 0 Para k = 1; : : : ; m
1
yk = '1 (xj ) + khj S1 = S1 + f (xj ; yk ) Fin de bucle k: S1 = hjS1 + 21 hj (f (xj ; '1 (xj )) + f (xj ; '2 (xj ))) Si j = 0;
z1 = S1 :
Si j = n;
z2 = S 1 :
Si 0 < j < n; S = S + S1 Fin de bucle j: 5. S = 21 h (z1 + z2 ) + hS: 6. Imprimir Tmn (f ) = S: Continuar en 8). 7. Mensaje: a < b: 8. Fin. Ejemplos R1 R1 1. Consideremos el problema (P ) siguiente: I = 0 0 yexy dx dy: Notemos que I podemos calcularlo exactamente. Pués Z 1 Z 1 Z 1 Z 1 1 xy xy 1 I= ye dx dy = e j0 dy = (ey 1)dy = ey y = e 2 ' 0;718281828: 0
0
0
0
0
118CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Apliquemos la regla de los trapecios generalizada para aproximar I. Para el efecto, sean m = 1 5; hx = m = 0;2; xj = jhx ; j = 0; 1; : : : ; 5; n = 5; hy = n1 = 0;2; yk = khy ; k = 0; 1; : : : ; 5; y R1 R1 de…nimos la función g como sigue: g(y) = 0 yexy dx: Se tiene I = 0 g(y)dy y utilizando la fórmula de los trapecios generalizada, resulta I(g) =
Z
0
1
g(y)dy '
hy (g(0) + g(1)) + hy (g (0;2) + g (0;4) + g (0;6) + g (0;8) : 2
Calculemos g(yk ) para k = 0; 1; : : : ; 5; y aproximemos usando la regla de los trapecios generalizada. Tenemos los siguientes resultados: g(0) = 0;
g(0;2) =
Z
1
0
g(0;4) =
Z
0;2e0;2x dx ' 0;1 0;2 1 + 2 e0;04 + e0;08 + e0;12 + e0;16 + e0;2
1
0
g(0;6) =
Z
1
0
g(0;8) =
Z
1
0
g(1) =
Z
0
1
' 0;2214322787;
0;4e0;4x dx ' 0;1 0;4 1 + 2 e0;08 + e0;16 + e0;24 + e0;32 + e0;4
' 0;492086976;
0;6e0;6x dx ' 0;1 0;6 1 + 2 e0;12 + e0;24 + e0;36 + e0;48 + e0;6
' 0;8231051064;
0;8e0;8x dx ' 0;1 0;8 1 + 2 e0;16 + e0;32 + e0;48 + e0;64 + e0;8
' 1;228154301;
ex dx ' 0;1 1 + 2 e0;2 + e0;4 + e0;6 + e0;8 + e ' 1;72400562:
Luego, utilizando la fórmula de los trapecios generalizada, resulta I ' 0;1(g(0) + g(1)) + 0;2[g(0;2) + g(0;4) + g(0;6) + g(0;8)] ' 0;7253562942: En la tabla siguiente se muestran los resultados de la aplicación del algoritmo para diferentes valores de m = n, y la estimación del error. n 5 10 20 40 80 160 320 640 1280 2560
m 5 10 20 40 80 160 320 640 1280 2560
Tmn (f ) 7;2535629421 7;2003851477 7;1872025130 7;1839138732 7;1830921525 7;1828867497 7;1828354008 7;1828225636 7;1828193543 7;1828185520
10 10 10 10 10 10 10 10 10 10
1 1 1 1 1 1 1 1 1 1
Error: jI (f ) T mn (f )j 7;074465748 10 3 1;7566863064 10 3 4;3842284012 10 4 1;0955886528 10 4 2;7386787759 10 5 : 6;8465138930 10 6 1;7116170327 10 6 4;2790354282 10 7 1;0697584074 10 7 2;6743957271 10 8
R 2 R x2 2. Calculemos la integral doble I = 1 x x2 + xy + y 2 dxdy: Para el efecto, primeramente identi…camos el tipo de región sobre la que tenemos que integrar la función f de…nida como 2 2 f (x; y) = x + xy + y : Tenemos = (x; y) 2 R2 j x y x2 x 2 [1; 2] que corresponde a una región del tipo I: Ponemos '1 (x) = x; '2 (x) = x2 x 2 [1; 2] : En la …gura siguiente se muestra el
2.8. INTEGRALES DOBLES dominio
119
:
Figura 28 Calculemos I exactamente. Tenemos Z
I =
1
Z
=
2 Z x2
2
(x + xy + y )dxdy =
x
2
1 1 x y + xy 2 + y 3 2 3
2
1 1 x4 + x5 + x6 2 3 1 I = 10;62261904 : : : =
Z
2
x2
dx =
Z
Z
2
1
x
x2
2
!
2
(x + xy + y )dy dx
x
1
2
1
Z
2
11 3 x dx = 6
1 1 x4 + x5 + x6 2 3 1 5 1 1 x + x6 + x7 5 12 21
x3
1 3 x 2 11 4 x 24
1 3 x dx 3 2
= 1
8923 ; 840
R2 x 2 [1; 2]. Entonces I = 1 g(x)dx: Apliquemos el método 2 1 de los trapecios generalizada con m = 5: Sea hx = = 0;2; xj = 1 + jhx = 1 + 0;2j para 5 j = 0; 1; 2; 3; 4; 5: Luego Sea g(x) =
R x2 x
(x2 + xy + y 2 )dy
5 hx X [g(xj I' 2
1)
+ g(xj )] =
j=1
hx (g(1) + g(2)) + hx (g(1;2) + g(1;4) + g(1;6) + g(1;8)); 2
donde Z
g(1) =
1
2
(x + y + y )dy = 0;
1
Z
g(1;4) =
1;41
1;2
1;96
2
(1;96 + 1;4y + y )dy;
1;4 Z 3;24
g(1;8) =
g(1;2) =
Z
2
(3;24 + 1;8y + y )dy;
1;8
g(1;6) = g(2) =
Z
Z
(1;44 + 1;2y + y 2 )dy; 2;56
(2;56 + 1;6y + y 2 )dy;
1;6 4
(4 + 2y + y 2 )dy:
2
Apliquemos nuevamente el método de los trapecios para aproximar g(xj ); j = 1; : : : ; 5: Sea n = 5; hj =
g(xj ) ' =
x2j
xj 5
y yx = xj + khj ; k = 0; 1; : : : ; 5, luego
5 hj X [f (xj ; yx 2
1)
+ f (xj ; yx )]
k=1
hj [f (xj ; y0 ) + f (xj ; y5 )] + hj [f (xj ; y1 ) + f (xj ; y2 ) + f (xj ; y3 ) + f (xj ; yy )] ; 2
donde f (xj ; y) = x2j + xj y + y 2 = x2j + y(xj + y):
120CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA Para j = 1, h1 = 0;048; yx = 1;2 + kh1 k = 0; ; 5; los puntos yx de la partición vertical son yx = 1;2; 1;248; 1;296; 1;344; 1;392; 1;44: La función f en el punto (1;2; y) está de…nida como: f (1;2; y) = 1;44 + y(1;2 + y); luego para y = yx = 1;2; 1;248; 1;296; 1;344; 1;392; 1;44; se obtienen los siguientes resultados: f (1;2; 1;2) = 4;32;
f (1;2, 1;248) = 4;495104;
f (1;2; 1;344) = 4;859136;
f (1;2, 1;296) = 4;674816;
f (1;2; 1;392) = 5;048064;
f (1;2; 1;44) = 5;2416;
y por la regla de los trapecios generalizada y la de…nición de g(1;2), resulta g(1;2) ' 0;021
9;5116 + 0;048
19;07712 = 1;14518016:
1;4 = 0;112; yx = 1;4 + kh2 k = 0; ; 5; los puntos yx de la 5 partición vertical son yx = 1;4; 1;512; 1;624; 1;736; 1;848; 1;96. La función f en el punto (1;4; y) está de…nida como: f (1;4, y) = 1;96 + y(1;4 + y); Para j = 2; x2 = 1;4; h2 =
1;96
y en consecuencia para y = yx = 1;4; 1;512; 1;624; 1;736; 1;848; 1;96, se tiene f (1;4; 1;4) = 5;88;
f (1;4; 1;512) = 6;362944;
f (1;4; 1;736) = 7;404056;
f (1;4; 1;624) = 6;870976;
f (1;4; 1;848) = 7;962304;
f (1;4; 1;96) = 8;5456;
por la regla de los trapecios generalizada y la de…nición de g(1;4), resulta g(1;4) ' 0;056 2;56
14;4256 + 0;112
28;60032 = 4;01106944:
1;6
= 0;192; yx = 1;6 + kh3 k = 0; ; 5; los puntos de la 5 partición vertical son yx = 1;6; 1;792; 1;984; 2;176; 2;368; 2;56: La función f en el punto (1;6; y) está de…nida como: f (1;6; y) = 2;56 + y(1;6 + y); Para j = 3; x3 = 1;6; h3 =
y para y = yx = 1;6; 1;792; 1;984; 2;176; 2;368; 2;56; se obtienen los siguientes resultados f (1;6; 1;6) = 7;68;
f (1;6; 1;792) = 8;638464;
f (1;6; 2;176) = 10;776576;
f (1;6; 1;984) = 9;679656;
f (1;6; 2368) = 11;956224;
f (1;6; 2;56) = 13;2096:
Por la regla de los trapecios generalizada y la de…nición de g(1;6), se obtiene g(1;6) ' 0;096
20;8896 + 0;192
41;04192 = 9;88545024:
3;24 1;8 Procediendo como en los casos enteriores, para j = 4; x4 = 1;8; h4 = = 0;288; los puntos 5 de la partición vertical son: yx = 1;8; 2;088; 2;376; 2;664; 2;952; 3;24: La función f en el punto (1;8; y) está dada como: f (1;8; y) = 3;24 + y(1;8 + y); f (1;8; 1;8) = 9;72;
f (1;8; 2;088) = 11;358144;
f (1;8; 2;664) = 15;132096; g(1;8) ' 0;144
f (1;8; 2;952) = 17;267904; 29;2896 + 0;288
Finalmente, para j = 5; x5 = 2; h5 = (1;2; y) está dada como:
f (1;8; 2;376) = 13;162176;
4
2 5
f (1;8; 3;24) = 19;5696;
56;92032 = 20;61075456:
= 0;4; yx = 2; 2;4; 2;8; 3;2; 3;6; 4; y f en el punto
f (2; y) = 4 + y(2 + y);
2.9. EJERCICIOS
121
entonces f (2; 2) = 12;
f (2; 2;4) = 14;56;
f (2; 3;2) = 20;64;
f (2; 3;6) = 24;16;
f (2; 2;8) = 17;44; f (2; 4) = 28;
y en consecuencia, por la regla de los trapecios generalizada y la de…nición de g(2) resulta. g(2) ' 0;2
40 + 0;4 76;8 = 38;72: R 2 R x2 El valor aproximado de la integral doble I = 1 x x2 + xy + y 2 dxdy mediante la aplicación de la regla de los trapecios generalizada Tmn (f ) a la región del tipo I con m = n; es: Tmn (f ) = 0;1
38;72 + 0;2
35;6524544 = 11;00249088:
Este ejemplo pone de mani…esto dos aspectos: el volumen de cálculos a ejecutar y la precisión del cálculo. El primero conduce a la elaboración de un programa computacional y el segundo a una discretización más …na que permita mejorar la precisión. Este segundo punto se lo alcanza con la ejecución del programa computacional para discretizaciones más …nas que a la mano son muy largas de ejecutarse. En la tabla siguiente se muestran los resultados de la aplicación del algoritmo. n 5 10 20 40 80 160 320 640
m 5 10 20 40 80 160 320 640
Tmn (f ) 11;0024908800 10;7176023425 10;6463657751 10;6285557851 10;6241032355 10;6229900948 10;6227118094 10;6226422381
Error=jI (f ) T mn (f )j 3;7987183238 10 1 9;4983294881 10 2 2;3746727449 10 2 5;9367374871 10 3 1;4841878349 10 3 3;7104717497 10 4 3;2761807254 10 5 2;3190452660 10 5
Nota: Parecería razonable que con particiones horizontales y verticales muy …nas, esto es, que tengan un gran número de puntos y que a su vez sean regulares, se podría aproximar tanto como se quiera la integral de una función continua. Lastimosamente, debido a los errores de redondeo, errores de truncameiento y de aproximación que intervienen en el cálculo de una integral doble, esto no es del todo cierto, pués para particiones con un número elevado de puntos, todos estos tipos de errores intervienen y deterioran los resultados. Por lo tanto, no es recomendable calcular aproximaciones de integrales con particiones regulares que tengan un gran número de puntos. Por este motivo que buscan otros métodos de aproximación que combinen con los métodos estudiados. Uno de estos métodos recomendables es la integración adaptativa que tiene muchas versiones. En la bibliografía se citan algunos textos en los que puede encontrar estos tópicos.
2.9.
Ejercicios
1. Sea T : R3 ! R la aplicación lineal de…nida por T (x; y; z) = ax + by + cz a; b; c 2 R distintos entre sí y no todos nulos.
(x,y,z)2 R3 ; donde
a) Determine ker (T ) para las distintas posibilidades de a; b; c e interprete geométricamente el resultado. b) Determine [T ]B ; donde B es la base canónica de R3 : c) Probar que todas las aplicaciones lineales de R3 en R son de la forma T (x; y; z) = ax + by + cz: d) Generalizar a) y b) a Rn :
2. Sea f 2 (Rn ) no nulo.
a) Pruebe que 0 < dim(ker (f )) < n. b) Sea Bn = f! e1 ; : : : ; ! en g la base canónica de Rn , halle [f ]Bn . ! ! ! n c) Sea B = f! v1 ; : : : ; v! v2 = ! e1 + ! e2 ; : : : ; v! n g la base de R de…nida como sigue: v1 = e1 ; n = ! ! e + : : : + e : Halle una base dual de B. 1
n
122CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA 3. Para los datos S que en cada item se propone, hallar el polinomio de interpolación de Lagrange Ph (x) y calcular el valor interpolado Ph (b x) de una función f en el punto x b que se indica. a) S = f(0;1; 5) ; (0;2; 8)g , x b = 0;16. b) S = f(0:; 2) ; (0;015; 4;1)g , x b = 0;0016.
c) S = f( 1;1; 0;25) ; ( 1;02; 2;8)g , x b=
1;08. d) S = f(2;1; 5;5) ; (2;25; 3.8)g , x b = 2;19.
4. Para los datos S que en cada item se propone, hallar el polinomio de interpolación de Lagrange Ph (x) y calcular el valor interpolado Ph (b x) de una función f en el punto x b que se indica.
a) S = f(1; 4) ; (1;2; 5) ; (1;5; 6;5)g ; x b = 1;4. b) S = f( 1;1; 3;5) ; ( 0;8; 4.5) ; ( 0;5; 3;5)g ; x b = 0;94. c) S = f(0;1; 1.4) ; (0;22; 2.5) ; (0;25; 1;56)g ; x b = 0;145.
d) S = f(1;8;
4;5)g ; x b = 1;995.
4;2) ; (2;2; -3.5) ; (2;5;
5. Considerar la función f de…nida en cada item. Calcule f 0 (x0 ) para el punto x0 que se indica. Calcule aproximaciones de f 0 (x0 ) mediante diferencias …nitas centrales de primer orden para cada h que se f (x0 + h) f (x0 h) indica, esto es y00 = . Estime el error jf 0 (x0 ) y00 j : 2h a) f (x) = 2x2 5x + 1 x 2 R; x0 = 2; h = 0;0025; h = 0;000025; h = 0;003; h = 0;00003: b) f (x) = c) f (x) =
1
(x2 p
+ 1)3
x4
16
x 2 R; x0 = 0; h =
0;002; h =
jxj > 4; x0 = 5; h =
0;0002; h = 0;0032; h = 0;000032:
0;0001; h =
0;00001; h = 0;00011; h = 0;000011:
1 3
d) f (x) = sen x3 + 2 x 2 R; x0 = 2 ; h = 0;004; h = 0;0004; h = 0;00041; 3 h = 0;00001: 2 p e) f (x) = cos2 x+1 x > 1; x0 = 1; h = 0;0011; h = 0;00011; h = 0;0002; 2 h = 0;00002: Sugerencia: aproxime con 9 cifras de precisión. x2
f ) f (x) = ln 16
jxj < 4; x0 = 1; h =
0;004; h =
0;0004; h = 0;0005; h = 0;00002:
g) f (x) = 2 ln(x) + 3 ln2 (x) + 4 ln3 (x) x > 0; x0 = e; h = h = 0;00001: Sugerencia: aproxime e con 9 cifras de precisión.
0;01; h =
0;0001; h = 0;001;
6. Considerar el polinomio P de segundo grado de…nido como p (x) = x2 + x + x 2 R; ; ; 2 R con 6= 0; y, el polinomio de interpolación de Lagrange de Ph de…nido como a+b Ph (x) = p (a) '0 (x)+p '1 (x)+p (b) '2 (x) x 2 [a; b] ; donde '0 ; '1 ; '2 son los polinomios 2 de interpolación de Lagrange de segundo grado de…nidos en [a; b] : Se prueba que P (x) = Ph (x) 8x 2 [a; b] : En cada item se da un polinomio p de segundo grado y se restringe al intervalo [a; b] que se indica. Hallar Ph y probar que p (x) = Ph (x) 8x 2 [a; b] : a) p (x) = x2
1 x 2 [ 1; 1] : b) p (x) = 2x2 + 5 x 2 [0; 2] : c) p (x) =
d) p (x) = 5x2 x 2 [0; 3] : e) p (x) =
3x2 + 4x x 2 [1; 10] :
x2 + x + 1 x 2 [ 1; 2] :
f ) p (x) = 5x2 + 7x
1 x 2 [2; 4] :
7. En cada item se de…ne una función u: Calcular u00 (x0 ) en el punto x0 que se indica. Aproximar u00 (x0 ) mediante el uso de diferencias …nitas centrales de segundo orden para cada h > 0 que se da. a) u (x) =
x3 + x2
1 x 2 R; x0 = 1; h = 0;01; h = 0;001; h = 0;0001:
b) u (x) = sen4 (x) x 2 R; x0 =
; h = 0;002; h = 0;0002; h = 0;00002: p c) u (x) = x2 exp x2 + 3 x 2 R; x0 = 3; h = 0;0025; h = 0;0002; h = 0;00001: p p d) u (x) = x3 x2 2 x 2 R; x0 = 2; h = 0;005; h = 0;0025; h = 0;00005: p p e) u (x) = ln x + 1 + x2 x 2 R; x0 = 8; h = 0;03; h = 0;003; h = 0;00003: f ) u (x) = cos
x2
6
x 2 R; x0 =
1 ; h = 0;001; h = 0;0001; h = 0;00001: 2
2.9. EJERCICIOS
123
8. En cada item se dan los valores f (a + h) y f (a h) de una cierta función f en x = a y h 6= 0: Calcular el valor aproximado de la derivada f 0 (a) : a) f (1;005) = 2;8117482; f (0;9995) = 3;114231: b) f (5;00012) =
1;252231; f (4;99988) = 0;00123112:
c) f ( 1;11231) = 587;22314; f ( 1;11211) = 495;231427: d) f ( 11;32145) = 10;369725; f (11;32111) = 42;223583: 9. En cada literal se dan los valores f (a + h) ; f (a) ; f (a h) de una cierta función f y h 6= 0: Calcular el valor aproximado de la derivada segunda f 00 (a) mediante diferencias …nitas centrales. a) f (0;0022) = 3;852224; f (0) = 1;8211253; f ( 0;0022) = 2;852536: b) f (1;3561) = 8;923824; f (1;355) = 15;162234; f (1;3490) = 25;8542321: c) f ( 10;4583) = 0;312112; f ( 10;4572) = 4;852011; f ( 10;4561) = 3;2581423: d) f (20;34823) =
13;4585252; f (20;348) =
10. Sea f una función real continua en [a; b] ; h = uniforme de [a; b] :
32;4525321; f (20;34777) = b
a 3
y
3
52;85343211:
= fa + jh j j = 0; 1; 2; 3g una partición
a) Escriba los polinomios de interpolación de Lagrange '0 ; '1 ; '2 ; '3 de…nidos en [a; b] : b) Sea x 2 [a; b] : Escribir el polinomio interpolante Ph (x) de f en [a; b] :
c) Suponga f 2 C 4 ([a; b]) : Escriba el error de interpolación de Lagrange.
d) Sea f la función de…nida como f (x) = x3 x 2 [0; 3] : Aplique el resultado obtenido en b) y halle Ph (x) : Calcule f (1;5) y Ph (1;5) y veri…que que f (1;5) = Ph (1;5) : Demuestre que f (x) = Ph (x) 8x 2 [0; 3] :
e) Sea f la función de…nida como f (x) = ex x 2 [ 1; 2] : Aplique el resultado de la parte b) y halle Ph (x) : Calcule f ( 0;5) y Ph ( 0;5) así como f (0;5) y Ph (0;5) :
11. En cada literal se de…ne una función real w en dos variables. Calcular las derivadas parciales @w @w @w (a; b) ; (a; b) en el punto (a; b) 2 R2 que se indica. Calcular valores aproximados de (a; b) @x @y @x @w y (a; b) mediante el uso de diferencias …nitas centrales para cada h 6= 0; k 6= 0 que se dan. @y a) w (x; y) = 2x2 xy y 2 h = 0;0001 y k = 0;0002:
(x; y) 2 R2 ; a = 1; b = 1; h = 0;02 y k = 0;01; h = 0;002 y k = 0;001;
1 (x; y) 2 R2 con y 6= 1 + xy h = k = 0;0002; h = 0;00005; k = 0;0002: b) w (x; y) = x3
10xy 2 +
1 ; a = x
1; b =
1; h = k = 0;01;
; h = 0;003 y k = 0;002; h = 0;0003 y c) w (x; y) = x cos(y) + y cos(x) (x; y) 2 R2 ; a = ; b = 6 3 k = 0;0002; h = 0;00005 y k = 0;00004: p p d) w (x; y) = ln 1 + x2 + y 2 (x; y) 2 R2 ; a = 2; b = 3; h = k = 0;02; h = k = 0;003; h = k = 0;0004; h = k = 0;00005: 1 e) w (x; y) = 2 (x; y) 2 R2 con x 6= 0; y 6= 0; a = 1; b = 1; h = k = 0;003; h = k = 0;0004; x + y2 h = k = 0;00002: f ) w (x; y) = x ln (1 + y) + y ln (1 + x) (x; y) 2 R2 tal que x > 1 1 1 h = k = 0;02; h = k = 0;001; h = k = 0;0001: 2 3 4
1; y >
1; a = b = 2;
12. Supóngase que f posee derivadas de todos los órdenes en un entorno del punto x = a: Se desea calcular valores aproximados yea000 de f 000 (a) : Escriba en forma explícita cada uno de los cocientes que se indican y determine el error de aproximación, donde h 6= 0 su…cientemente pequeño. a) yea000 =
42 f (a) : b) yea000 = 3 h 1
3
f (a) r 4f (a) r4 f (a) : c) yea000 = : d) yea000 = : 3 3 3 2h 3h 4h
124CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA 4 f (a) ; donde i 2 R con i 6= 0 escogido en cada caso apropiadamente, 3 5h i = 1; 2; 3; 4; 5. El polinomio de Taylor de grado 3 con error está de…nido como f (a + k) = k2 k3 k4 f (a) + kf 0 (a) + f 00 (a) + f 000 (a) + f iv ( ) con entre a y a + k con k 6= 0: 2! 3! 4!
e) yea000 =
x4 4 v 000 (2) mediante los siguientes cocientes:
13. Sea v la función de…nida como v (x) =
1 3 1 2 x + x x 2 [0; 4] : Calcule valores aproximados de 3 2
3 4 v (2) 42 v (2) v (2) r rv (2) r4 v (2) 4r2 v (2) : b) : c) : d) . e) : f ) ; 3 3 3 3 3 3 1h 2h 3h 4h 5h 6h donde h 6= 0 y i 2 R con i 6= 0 escogido apropiadamente i = 1; : : : ; 6 . p 14. Considerar la función real u de…nida com u (x; y) = x2 + y 2 (x; y) 2 R2 :
a)
a) Hallar las derivadas parciales
@u @u @2u (x; y) ; (x; y) ; (x; y) ; el laplaciano 4u (x; y) = @x @y @x@y
@2u @2u (x; y) + (x; y) con (x; y) 2 R2 tal que x 6= 0; y 6= 0: @x2 @y 2 @u @u @2u b) Calcular aproximaciones de (a; b) ; (a; b) ; y 4u (a; b) mediante diferencias …nitas @y @x@y p p @x 2; 2 así como en (4; 3) ; con h 6= 0; k = 6 0 pequeños que usted elige y centrales en el punto compare los resultados con los valores exactos. 15. En cada item se de…ne una función que posee derivadas parciales segundas en todo punto (a; b) 2 R2 : e (a; b) del laplaciano 4u (a; b) en el punto (a; b) y h 6= 0; k 6= 0 que Calcule valores aproximados 4u se indican. Calcule el error de aproximación, esto es, 4u (a; b) e u (a; b) : a) f (x; y) = x3 y 4
x2 y 2 + y 3
(x; y) 2 R2 ; a =
1; b = 1; h = k = 0;0015 y h = k = 0;00025: 1 b) f (x; y) = sen ( x) sen ( y) (x; y) 2 R2 ; a = b = ; h = k = 0;001 y h = k = 0;00012: 2 c) f (x; y) = xexy + yex (x; y) 2 R2 ; a = 0; b = 1; h = k = 0; 002 y h = k = 0;00011: 1 d) f (x; y) = (x; y) 2 R2 ; a = 10; b = 20; h = 0;001; k = 0;002; y, h = 0;00025 y 1 + x2 + y 2 k = 0;00012:
16. Sea v una función que posee derivadas parciales de todos los órdenes en un entorno de (a; b) 2 R2 : @2v (a; b) mediante cocientes de diferencias …nitas que Se desea calcular valores aproximados de @x@y se indican a continuación, donde h 6= 0; k 6= 0 su…cientemente pequeños, y, i 6= 0 escogidos apropiadamente, i = 1; 2; 3; 4; 5. 2 rv (a; b) 4rv (a; b) v (a; b) 4 v (a; b) r2 v (a; b) : b) : c) : d) : e) : 1 hk 2 hk 3 hk 4 hk 5 hk Estime en cada caso el error de aproximación y analice los resultados. Rb 17. En cada item se de…ne una función real continua f en [a; b] : Calcular I (f ) = a f (x) dx: Calcular valores aproximados de I (f ) con la regla del rectángulo Rn (f ) con particiones uniformes (n) con n = 4 y luego con n = 8: Calcular jI (f ) Rn (f )j : p 2x a) f (x) = x2 x 2 [0; 4] : b) f (x) = 2 x 2 [ 1; 2] : c) f (x) = x x 2 [1; 9] : x +1 d) f (x) = xex x 2 [ 2; 2] : e) f (x) = x ln(x) x 2 [1; e] : f ) f (x) = arctan(x) x 2 [0; 1] : Rb 18. Con cada función f que se de…ne en cada item, calcular I (f ) = a f (x) dx y calcular valores aproximados de dicha integral con la regla de los trapecios Tn (f ) con particiones uniformes (n) con n = 5 y luego con n = 10: Calcular el error jI (f ) Tn (f )j : p 1 a) f (x) = x2 1 x 2 [ 1; 3] : b) f (x) = x 2 [0; 2] : c) f (x) = 2x + 1 x 2 [0; 4] : x+1 2 x d) f (x) = 2xe x 2 [0; 2] : e) f (x) = x ln(x)+x2 x 2 [1; e] : f ) f (x) = x arctan(x) x 2 [0; 1] :
a)
2.9. EJERCICIOS
125
Rb 19. Con cada función f que se de…ne en cada item, calcular I (f ) = a f (x) dx: Aplicar la regla de Simpson Sn (f ) para calcular aproximaciones de I (f ) con particiones uniformes (n) con n = 4; y n = 8: Calcule el error jI (f ) Sn (f )j : a) f (x) = x2 +1 x 2 [ 1; 1] : b) f (x) = x3 x 2 [ 1; 1] : c) f (x) = 3x3 +2x2 x+1 x 2 [0; 1] : 1
d) f (x) = (x + 1) 3
x 2 [0; 7] : e) f (x) = x sen(x) x 2 [0; ] : f ) f (x) = x cos2 (x) x 2 [0; ] :
20. Sea f 2 C 2 ([a; b]) ; n 2 Z+ ;
(n) = fx0 = a; x1 ; : : : ; xn = bg una partición de [a; b] ; hi = xi xi 1 b a i = 1; : : : ; n: Se supone que (n) es regular, esto es, existe 1 talq ue hi i = 1; : : : ; n: n n Rb P xk 1 + hk hk f : Se de…ne I (f ) = a f (x) dx y Rn (f ) = 2 k=1 a) Demuestre que Rn (f ) es una forma lineal sobre C ([a; b]) que se conoce como regla de los rectángulos generalizada. h (b a) b) Demuestre que existe 2 [a; b] tal que jI (f ) Rn (f )j (b a) jf 0 ( )j M h; con 2 2 0 M = max jf (x)j : x2[a;b]
21. El área del círculo C = (x; y) 2 R2 j x2 + y 2 4 es a (C) = 4 (círculo de centro (0; 0) y radio p R2p r = 2): Se de…ne f (x) = 4 x2 x 2 [0; 2] ; calcule I (f ) = 4 0 4 x2 dx y veri…que que a(C) = I(f ): a) Aplique la regla del rectángulo generalizado para calcular aproximaciones de a (C) con particiones (n) uniformes con n = 5 y n = 10: Calcule el error ja (C) Rn (f )j :
b) Aplique la regla de los trapecios generalizada Tn (f ) para calcular aproximaciones de a (C) con particiones (n) uniformes con n = 5 y n = 10: Calcule ja (C) Tn (f )j : c) Aplique la regla de Simpson generalizada Sn (f ) con particiones n = 8: Calcule jSn (f ) I (f )j :
(n) uniformes con n = 4 y
Compare los resultados de a), b) y c).
R1 1 1 x 2 ; 1 e I (f ) = 1 f (x) dx: Calcule I (f ) : 4 x2 4 Aplique la regla del rectángulo Rn (f ); de los trapecios Tn (f ), de Simpson Sn (f ) generalizadas para calcular aproximaciones de I (f ) con particiones (n) regulares que en cada item se indican. Calcule el error con cada método y cada partición.
22. Sea f la función real de…nida como f (x) =
a)
1 (5)
= fx0 = 0;25; x1 = 0;3; x2 = 0;4; x3 = 0;6; x4 = 0;8; x5 = 1g :
b)
2 (5)
c)
1 (10)
= fx0 = 0;25; x1 = 0;4; x2 = 0;55; x3 = 0;7; x4 = 0;85; x5 = 1g :
= fx0 = 0;25; x2 = 0;28; x3 = 0;32; x4 = 0;36; x5 = 0;4; x6 = 0;5; x7 = 0;6; x8 = 0;7;
x9 = 0;85; x10 = 1g : d)
2 (10)
= fxj = 0;25 + 0;075j j j = 0; 1; : : : ; 10g :
e) Compare los resultados obtenidos con la regla del rectángulo generalizada en a) y b), luego en c) y d); concluya. Proceda en forma similar con la regla de los trapecios generalizada en a) y b) luego en c) y d). Concluya f ) Compare los resultados obtenidos con la regla de Simpson generalizada en a) y b); luego en c) y d). Compare estos con los anteriores y concluya. 23. Considere la función u de…nida como u (x) = exp( 10x2 ) x 2 [ 2; 2] : a) Trace la grá…ca de la función u.
b) R 2 Aplique la regla de los trapecios generalizada para calcular valores aproximados de I (u) = 2 u (x) dx con cada una de las particiones 1 (6) ; 2 (8) ; 3 (10) siguientes: 1 (6)
= fx0 =
2 (8)
=
x0 =
2; x1 =
1; x2 =
0;5; x3 = 0; x4 = 0;5; x5 = 1; x6 = 2g ;
2; x1 = 1; x2 = 0;5; x3 = 0;25; x4 = 0; x5 = 0;25; x6 = 0;5; x7 = 1; x8 = 10
;
126CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA 2; x1 = 1; x2 = 0;6; x3 = 0;3; x4 = 0;1; x5 = 0; : x6 = 0;1; x7 = 0;3; x8 = 0;6; x9 = 1; x10 = 2 R2 c) Calcule valores aproximados de I (u) = 2 u (x) dx con particiones uniformes 6; 8; 10: Compare con los resultados obtenidos en la parte b) precedente. 3 (10)
=
x0 =
24. Sean f; g 2 C ([a; b]) : Supongamos que f (x)
(n) y n =
g (x) 8x 2 [a; b] ;
= (x; y) 2 R2 j f (x)
y
g (x) x 2 [a; b] :
Rb El área de la región está de…nida como a ( ) = a [g (x) f (x)] dx: En cada item se dan las funciones continuas f; g en [a; b] : Represente grá…camente la región , calcule a ( ) y calcule aproximaciones de a ( ) con la regla de Simpson generalizada con una partición uniforme (n) con n = 5: Compare los resultados obtenidos. a) f (x) = 0; g (x) = x x 2 [0; 4] : b) f (x) =
1; g (x) = x2 x 2 [0; 4] :
x2 + 1; g (x) = x3 + 1 x 2 [0; 3] : d) f (x) = x2 4; g (x) = x2 + x + 1 x 2 [0; 4] : h i e) f (x) = x ; g (x) = cos(x) x 2 ; : f ) f (x) = x2 ; g (x) = ex x 2 [0; 2] : 2 2 2 c) f (x) =
25. En cada literal se de…ne una función f que es impar en el intervalo [ a; a] con a > 0 que se indica. Demuestre que I (f ) = 0 y aplique la regla del rectángulo, trapecios y Simpson generalizadas para calcular aproximaciones de I (f ) con particiones uniformes (n) con n = 5 y n = 6: Analice los resultados. h i p a) f (x) = x3 x 2 [ 2; 2] : b) f (x) = sen(x) x 2 : c) f (x) = x 1 x2 x 2 [ 1; 1] : ; 2 2 2 3 d) f (x) = x cos ( x) x 2 [ 1; 1] ; e) f (x) = 2 sen ( x) cos2 ( x) x 2 [ 1; 1] : 26. Sean f 2 C ([a; b]) ; (n) una partición regular del intervalo [a; b] : Elabore un algoritmo para Rb aproximar I (f ) = a f (x) dx con la regla del rectángulo generalizada. 27. Sea R2RRuna región del tipo II; f 2 C ( ) : Elabore un algoritmo para calcular aproximaciones de I (f ) = f (x; y) dxdy con la regla de los trapecios generalizada.
28. a) Sea R2 una región de tipo I; f 2 C ( ) : Elabore un algoritmo para calcular aproximaciones RR de I (f ) = f (x; y) dxdy con la regla de Simpson generalizada.
2 región de tipo II; f 2 C ( ) : Elabore un algoritmo para calcular b) Suponga ahora RRR aproximaciones de I (f ) = f (x; y) dxdy con la regla de Simpson generalizada.
29. En cada item se de…ne una función continua f sobre = [a; b] [c; d] que se indica. Calcule I (f ) = Rb Rd a c f (x; y) dy dx: Aplique la regla de los trapecios generalizada para calcular aproximaciones de I (f ) con n = m = 5: Estime el error a) f (x; y) = xy (x; y) 2 [0; 2] : b) f (x; y) = x3 y + xy 4 (x; y) 2 [0; 1] [0; 1] : p p p c) f (x; y) = 10 xy (x; y) 2 [0; 1] [0; 1] : d) f (x; y) = x + y (x; y) 2 [0; 4] [0; 4] : y 4 p e) f (x; y) = (x; y) 2 [0; 4] [0; 2] : f ) f (x; y) = (x; y) 2 [1; 4] [1; 4] : 1 + xy 1+ x Rb Rd 30. Calcular I (f ) = a c f (x; y) dy dx para cada función f 2 C ( ) que se de…ne sobre = [a; b] [c; d] : Aplique la regla de Simpson generalizada para calcular aproximaciones de I (f ) con m = n = 5: Estime el error. (x; y) 2 [ 1; 1] [0; 1] : b) f (x; y) = xey + yex (x; y) 2 [0; 1] [0; 1] : h i 1 c) f (x; y) = sen (x + y) (x; y) 2 0; : d) f (x; y) = (x + y) 3 (x; y) 2 [0; 4] : 2 p p x p e) f (x; y) = 2 x 3 y (x; y) 2 [0; 1] [1; 4] : f ) f (x; y) = p (x; y) 2 [0; 4] [1; 4] : y
a) f (x; y) = x2 + xy
2.9. EJERCICIOS
127
Rd Rb 31. En cada item se de…ne una función u sobre = [a; b] [c; d] : Calcule I (f ) = c a u (x; y) dx dy: Calcule aproximaciones de I (u) con m; n que se indican; y, estime el error jI (u) :Tmn (u)j : a) u (x; y) = x2 + y 2 (x; y) 2 [0; 1] p b) u (x; y) = x + y (x; y) 2 [0; 2]
c) u (x; y) = yexy d) u (x; y) = x4
(x; y) 2 [0; 1] (x; y) 2
[0; 1] ; m = n = 5: [1; 4] ; m = n = 6:
[ 1; 0] ; m = n = 5:
1 ;2 2
[ 1; 1] ; m = n = 8:
De modo análogo, calcule aproximaciones de I (u) usando la regla de Simpson generalizada Smn (u) con m = n = 4; y, estime el error jI (u) Smn (u)j : 32. Sean V = C ([a; b]) el espacio vectorial real de funciones continuas en [a; b], n 2 Z+ , y de…nido sobre C ([a; b]) que en cada item se de…ne. Pruebe que es lineal. a)
(f ) =
h 2
(f (a) + f (b)) + h
(f ) =
donde h =
h 3
f (xj ) (fórmula de los trapecios generalizada), donde h =
j=1
y xj = a + jh b)
nP1
j = 0; 1; : : : ; n.
(f (a) + f (b)) + 23 h
b a 2n ,
xj = a + jh
el funcional
nP1 j=1
f (x2j ) + 34 h
j = 0; 1; : : : ; 2n
n P
f (x2j
1)
b a n
(fórmula de Simpson generalizada),
j=1
33. Aplique la regla de los trapecios generalizada para aproximar las siguientes integrales con una discretización de 10 puntos igualmente espaciados: R2 R 0;5 R2 x R2 R1p R1 a) 0 xdx: b) 0 x1=4 dx: c) 0 xe x dx: d) 0 sen(x2 )dx: e) 1 lnxx dx: f ) 1 ex dx:
Para los literales a), b) y c) halle el valor exacto de la integral y compare con el valor aproximado. RR 34. En cada item se de…ne una función f sobre una región : Calclular I (f ) = f (x; y) dxdy: Aplicar la regla de los trapecios generalizada Tmn (f ) para calcular una aproximación de I (f ) con m = n = 4: n o p 1 x2 ; 0 x 1 : a) f (x; y) = x; y (x; y) 2 = (x; y) 2 R2 j 1 x y
b) f (x; y) = (x
y)2
c) f (x; y) = sen (x + y) d) f (x; y) =
x y
= (x; y) 2 R2 j x2 n (x; y) 2 = (x; y) 2 R2 j
(x; y) 2
(x; y) 2
=
(x; y) 2 R2 j
1 x
y
y
`4
1
y
x2 ; x 2 [ 1; 1] : o ; x 2 [0; 2] 2
1 + x; x 2 [1; 2] :
35. En cada item se de…ne una función w sobre una región : Calcular I (w) =
RR
w (x; y) dxdy: Aplicar
la regla de Simpson generaliza Smn (w) para calcular una aproximación de I (w) con m = n = 4: 1 a) w (x; y) = (x + y)2 (x; y) 2 = (x; y) 2 R2 j 1 + y x 1 + y 2 ; y 2 [1; 2] : 6 y b) w (x; y) = (x; y) 2 = (x; y) 2 R2 j y 1 x 1 y 2 ; y 2 [0; 1] : x+4 4 c) w (x; y) = (x; y) 2 = (x; y) 2 R2 j x2 + y 2 1; ; escoja apropiadamente 1 + x2 + y 2 región del tipo I y proceda con el cálculo. Asimismo, escoja otra región de 2 del tipo 1 II y proceda con el cálculo. Compare los resultados. h io n d) w (x; y) = cos2 (x y) (x; y) 2 = (x; y) 2 R2 j x y x; y 2 0; : 2 2 e) w (x; y) = x4 + y 4 (x; y) 2 = (x; y) 2 R2 j 1 x2 + y 2 4; : Escoja apropiadamente del tipo I y calcule Smn (w) : De manera similar, escoja 2 del tipo II y calcule 1 Smn (w) : Compare los resultados.
128CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA R1
36. Considerar la integral impropia I = a) Demuestre que I =
p 4
b) Muestre que
0
x2 e
x2 dx;
y sea I1 =
' 0;4431134628: I2 =
Z
1
x2 e
x2
dx =
1
1 2
Z
0
1
R1 0
x2 e
x2 dx:
1
e t dt: t5=2
c) Aplique la fórmula de los trapecios con n = 4 para aproximar I1 ; I2 consecuentemente I (tome en cuenta la singularidad en I2 ). Compare el resultado con a). d) Repita la parte b) con n = 10: Compare el resultado con a) y c). R1 Rx 37. Considerar la integral doble I = 0 x3 (x2 + y)dy dx:
5 a) Muestre que I = : 28 Rx 2 b) Sean g(x) = x3 (x + y)dy; x 2 [0; 1]; h = 0;2 y xk = kh; k = 0; 1; : : : ; 5. Calcule g(xk ) y aproxime g(xk ) usando la regla de los trapecios con m = 5: R1 c) Aplique la regla de los trapecios para aproximar I = 0 g(x)dx y compare con a).
38. Sea I =
R 2 R x3 1
x2
(x2 + y 2 )dxdy:
a) Calcule I:
b) Aplique la regla de los trapecios para aproximar I con m = n = 5: R1 R1 2 2 39. Sea I = 1 1 ex +y dxdy: 2 R1 2 a) Pruebe que I = 4 0 ex dx :
b) Utilice la fórmula de los trapecios para aproximar el valor de I con n = 10; y luego con n = 20:
c) Utilice la serie de Taylor de e y aproxime I mediante una suma …nita Sn de modo que jI
Sn j < 10
5
;
donde n es el más pequeño número entero positivo que satisface dicha condición. De los resultados de b) y c) ¿qué algoritmo es más costoso numéricamente?. 40. Considerar la integral I = a) Calcular I:
R2 R2 0
y
0
p
1 + xdx dy:
R2 yp 1 + xdx, y 2 [0; 2]. Aplique la regla de los trapecios para aproximar I con b) Sean g(y) = 0 particiones de 6 puntos igualmente espaciados.
41. Considerar la integral I =
R4 R 0
y 4 2 p
4 y
(xy)3 dx dy:
a) Calcule I: b) Aproxime I con particiones de 5 puntos igualmente espaciados.
2.10.
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 3. Tom M. Apostol, Calculus, Volumen 2, Segunda Edición, Editorial Reverté, Barcelona, 1975. 4. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 5. R. M. Barbolla, M. García, J. Margalef, E. Outerelo, J. L. Pinilla. J. M. Sánchez, Introducción al Análisis Real, Editorial Alambra Universidad, Madrid, 1981.
2.10. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
129
6. Richard H. Bartels, John C. Beatty, Brian A. Barsky, An Introduction to Splines for use in Computer Graphics and Geometric Medeling, Editorial Morgan Kaufmann Publishers, Inc., San Mateo, California, 1987. 7. Jérõme Bastien, Jean-Noël Martin, Introduction à l’Analyse Numérique, Editorial Dunod, París, 2003. 8. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 9. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 10. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 11. Elaine Cohen, Richard F. Riesenfeld, Gershon Elber, Geometric Modeling with Splines, Editorial A. K. Peters, Natick, Massachusetts, 2001. 12. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 13. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 14. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 15. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 16. Stephen H. Friedberg, Arnold J. Insel, Lawrence E. Spence, Algebra Lineal, Editorial Publicaciones Cultural, S. A., México, 1982. 17. Waltson Fulks, Cálculo Avanzado, Editorial Limusa, México, 1973. 18. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 19. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991. 20. Kenneth Ho¤man, Ray Kunze, Algebra Lineal, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1987. 21. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 22. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 23. Rodolfo Luthe, Antonio Olivera, Fernando Schutz, Métodos Numéricos, Editorial Limusa, México, 1986. 24. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 25. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 26. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 27. S. Nikolski, Fórmulas de Cuadratura, Editorial Mir, Moscú, 1990.
130CAPÍTULO 2. INTERPOLACIÓN POLINOMIAL, DERIVACIÓN E INTEGRACIÓN NUMÉRICA 28. Ben Noble, James W. Daniel, Algebra Lineal Aplicada, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1989. 29. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 30. A. A. Samarski, Introducción a los Métodos Numéricos, Editorial Mir, Moscú, 1986. 31. Michelle Schatzman, Analyse Numérique, Inter Editions, París, 1991. 32. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 33. Michael Spivak, Calculus, Segunda Edición, Editorial Reverté, Barcelona, 1996. 34. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 35. Gilbert Strang, Algebra Lineal y sus Aplicaciones, Editorial Fondo Educativo Interamericano, México, 1982. 36. E. A. Volkov, Métodos Numéricos, Editorial Mir, Moscú, 1990.
Capítulo 3
Aproximación de series de funciones. Aplicaciones. Resumen Muchos problemas en matemáticas conducen a soluciones expresadas mediante series convergentes de funciones, particularmente interesan las series de potencias, que suponemos convergen uniformemente en un cierto intervalo cerrado [a; b] de R. Las series de Fourier se tratarán en el capítulo de mínimos cuadrados. En muy pocos casos se conocen resultados exactos y en la generalidad de los mismos se conocen resultados de convergencia puntual y uniforme. Tanto en el caso de conocer la función suma como en el que se desconoce, interesa calcular valores aproximados de dichas sumas, las mismas que deben ser aproximadas numéricamente. Este capítulo se inicia con la aproximación de series numéricas. A continuación se tratan las series de potencias a las que se dan mayor atención. Particular interés se da al cálculo aproximado de algunas funciones usuales representadas como series de potencias como son sen(x), cos(x), arcsen(x), ln(x), exp(x). Se presentan algunas aplicaciones de las series de potencias como en el caso de la función error, las integrales elípticas. Se pone mucho énfasis en la aplicación de resultados de la consistencia y la estabilidad numérica que nos permitan elaborar algoritmos simples de cálculo.
3.1.
Resultados fundamentales de series numéricas convergentes.
Esta sección está destinada a introducir algunos conceptos básicos sobre las series numéricas reales así como presentar algunos resultados importantes sobre los criterios de convergencia. Estos resultados serán de gran utilidad en el cálculo aproximado de series numéricas y series de funciones, y particularmente en las series de potencias y las series de Fourier. El lector que está familiarizado con las series numéricas puede pasar inmediatamente a los métodos de cálculo, aquel que no está familiarizado tendrá la ocasión de tratar este tema en forma resumida. Al …nal del capítulo se dan algunas observaciones, comentarios y se sugiere una bibliografía especializada para estudios más profundos.
3.1.1.
Series numéricas convergentes.
Sea (an ) una sucesión numérica. A menos que se indique lo contrario, suponemos que las sucesiones 1 P numéricas (an ) están de…nidas en todo n 2 N. La suma a0 + a1 + a2 + ::: + an + ; que se escribe an y que se lee suma desde n = 0 hasta in…nito de an , se llama serie numérica. En la serie
1 P
n=0
n=0
an , an se
llama término general. En el caso de que la sucesión numérica (an ) está de…nida para todo n 2 Z+ con 1 P n n0 1; la suma an0 + an0 +1 + an0 +2 + ; se escribirá an : n=n0
131
132
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
Sea n 2 N. Se de…ne Sn = n P
la suma parcial Sn =
n P
1 P
ak y se denomina suma parcial de la serie
an : También se escribirá a
n=0
k=0
ak . La sucesión (Sn ) se llama sucesión de sumas parciales de la serie
1 P
an :
n=0
k=0 1 P
De…nición 1 i) Se dice que la serie
an es convergente si y solo si la sucesión de sumas parciales
n=0
(Sn ) es convergente, es decir que existe S 2 R tal que l m Sn = S. Escribimos n!1
1 P
an = S y diremos
n=0
que S es la suma de la serie. 1 P an es divergente si y solo si la sucesión de sumas parciales (Sn ) es divergente. ii) Diremos que n=0
Se veri…ca inmediatamente que si
1 P
an converge, entonces l m an = 0. El recíproco, en general, no es n!1
n=0
cierto como se muestra más adelante con el ejemplo de la serie armónica. Ejemplos
1. Sea
1 P
n=1
1 n(n+1) :
n 2 Z+ y Sn =
Observemos primeramente que n P
k=1
S1 = 1
1 k(k+1)
esto es,
n!1 1 P
n=1
n!1
1 n(n+1)
=
1 n
1 n+1
8n 2 Z+ . En consecuencia; si
denota la suma parcial, se tiene
1 ; 2
Resulta l m Sn = l m
1 n(n+1)
S2 =
1 1
1 n+1
1
1 1 + 2 2
2. Sea x 2 R, x 6= 0. Consideramos la serie xk
1 n+1
; Sn = 1 1 P
n=1
1 n!1 n(n+1)
se de…ne la suma parcial Sn =
1 ; 3
= 1, con lo cual la serie
= 1: Note que l m
n P
1 =1 3
1 n(n+1)
n 2 Z+ :
es convergente y converge a 1,
= 0, o sea el término general de la serie es convergente.
1 P
n=0
xn . Esta serie se llama serie geométrica. Para n 2 N
= 1 + x + ::: + xn . Multipliquemos a Sn por x. Tenemos
k=0
xSn =
n X
xk+1 = x + x2 + ::: + xn+1 ;
k=0
luego (x
Sn = x + x2 + ::: + xn+1
1) Sn = xSn
(1 + x + ::: + xn ) = xn+1
1:
de donde xn+1 1 1 = x 1 1 x = n + 1 si x = 1:
Sn = Sn
xn+1 1 x
si x 6= 1;
Puesto que l m xn+1 = 0 si y solo si jxj < 1, se sigue que n!1
l m Sn = l m
n!1
y en consecuencia pués la sucesión
1 P
xn =
n=0 (Sn ) es
1 1 x
n!1
si
1 1
jxj < 1;
x
xn+1 1 x
x 6= 0: Si jxj
divergente y l m Sn no existe. n!1
=
1 1
x
;
1, la serie
1 P
n=0
xn es divergente,
3.1. RESULTADOS FUNDAMENTALES DE SERIES NUMÉRICAS CONVERGENTES. 1 P
3. La serie
1 n
n=1
133
es divergente. Esta serie se llama serie armónica. Para cada n 2 Z+ se de…ne la
suma parcial Sn =
n P
k=1
1 k.
Observe las siguientes sumas parciales:
1 S2 = 1 + ; 2 1 1 1 1 1 1 2 S22 = 1 + + + > 1 + + + = 1 + ; 2 3 4 2 4 4 2 1 1 1 1 1 1 1 3 1 1 S23 = 1 + + + ::: + > 1 + + + + + + = 1 + ; 2 3 8 2 2 8 8 8 8 2 1 1 1 1 1 4 1 1 >1+ + + + >1+ ; S24 = 1 + + + ::: + 2 3 16 2 2 2 2 2 .. . 1 n 1 S2n = 1 + + ::: + n > 1 + : 2 2 2 n!1
1 n!1 n
que l m
De…nición 2 Sea
n 2
= 1; que muestra que la serie armónica es divergente. Note 1 P 1 = 0, o sea el término general de la serie es convergente pero la serie k diverge.
Luego, l m S2n
lm 1+
n!1
k=1
1 P
an una serie numérica.
n=0
i. Se dice que
1 P
an converge absolutamente si la serie
n=0
ii. Se dice que
1 P
1 P
n=0
an converge condicionalmente si
1 P
jan j converge. 1 P
an converge pero
n=0
n=0
n=0
1. De la de…nición de convergencia absoluta se deduce que la serie converge. En efecto, sean Sn =
n P
k=0
Sen =
n P jak j : Como ak y Sen =
1 P
jan j diverge.
jan j converge, entonces
n=0
1 P
an
n=0
k=1
n X k=0
jak j
n X k=0
jak j + jan+1 j = Sen+1 ;
1 P la sucesión Sen es creciente. Además, por hipótesis la serie jak j es convergente, entonces l m Sen
existe y sea Se =
1 P
k=0
Sen
jak j. Así,
Sup Sen : Puesto que
n2Z+
luego Sup jSn j n2Z+
n!1
k=0
jSn j =
e o sea S;
1 P
es creciente y acotada superiormente, y Se = l mn!1 Sn =
n X
n X
ak
k=0
ak
k=0
k=0
jak j = Sen
Se
8n 2 Z+ ,
1 e es decir que P ak converge. S, k=0
Ejemplos 1. La serie
1 P
n=1
( 1)n n
1
converge, pero
1 P
n=1
1 n
diverge, entonces
Más adelante, en las series de potencias se demuestra que
1 P
( 1)n n
n=1 1 P ( 1)n n n=1
1
1
converge condicionalmente.
= ln 2:
134
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
2. La serie
1 P
k=0
( 1)k k!
1 P
converge absolutamente. En efecto, la serie 1 P
2;71828182::: base de los logaritmos naturales. Luego cada n 2 Z+ ; se tiene j
Pn
k=0
P j . nk=0
( 1)k k!
k=0
k=0 1 k! :
De la de…nición de serie convergente, se sigue que si
Además, 1 P
( 1)k k!
P1
k=0
1 k!
converge al número e '
converge absolutamente pués para ( 1)k k!
1:
=e
an es convergente y (Sn ) denota la sucesión de
n=0
sumas parciales de dicha serie, l m Sn = S si y solo si se veri…ca la condición n!1
8" > 0; 9n0 2 Z+ Tomando en consideración que Sn =
n P
tal que 8n
n0 ) jSn
ak , n = 0; 1; ::: , y S = 1 X
Sn =
k=0
Luego,
1 P
ak , entonces
k=0
k=0
S
1 P
Sj < ":
ak
n X
ak =
k=0
1 X
ak :
k=n+1
ak es convergente si y solo si se veri…ca la siguiente condición:
k=0
8" > 0; 9n0 2 Z+
tal que 8n
n0 )
1 X
ak < ":
k=n+1
Se denota con Sc al conjunto de todas las series convergentes. Sean
1 P
n=0
an ;
1 P
n=0
bn 2 Sc , y
2 R. Se
de…ne la adición de series convergentes y el producto de escalares por series convergentes como sigue: Adición:
1 P
n=0
an +
1 P
bn =
n=0
Producto por escalares:
1 P
(an + bn ) ;
n=0 1 P
an =
n=0
1 P
an :
n=0
Se demuestra fácilmente las dos implicaciones siguientes: 1 X
an ;
n=0
y
1 X
n=0
2 R,
b n 2 Sc )
1 X
n=0
1 X
n=0
an 2 Sc )
(an + bn ) 2 Sc ;
1 X
n=0
an 2 Sc ;
es decir que el conjunto Sc con las operaciones de adición y producto por escalares de series convergentes, es un espacio vectorial denominado espacio de series convergentes.
3.1.2.
Criterios de convergencia.
Dada una serie numérica
1 P
an , se debe determinar si esta es o no convergente. Para el efecto, es preciso
n=0
familiarizarse con algumos resultados fundamentales que nos permitan decidir si la serie es convergente, divergente o simplemente con un determinado criterio no es posible decidir la convergencia o divergencia y que se requiere de un análisis más …no para deducir la convergencia o divergencia de una serie dada. En esta parte enunciamos sin demostración algunos criterios de convergencia más utilizados y se da un ejemplo en el que se aplique el teorema. Al …nal del capítulo se cita una amplia bibliografía en la que puede encontrarse las demostraciones de los resultados que damos a continuación ( Calculus de Apostol, Volumen 1, Cálculo Avanzado de Fulks, Calculus de Spivak, y otros).
3.1. RESULTADOS FUNDAMENTALES DE SERIES NUMÉRICAS CONVERGENTES. Teorema 1 (criterio de Leibniz) Sea (an ) una sucesión numérica decreciente tal que l m an = 0: Entonces, la serie n!1
135
1 P
( 1)n an
n=0
converge. Ejemplo 1 P
La serie
n=0
( 1)n n!3n
es convergente, pués la sucesión (an ) cuyo término general está de…nido como an = 1 n n!1 n!3
= 0: Por el criterio de Leibniz,
es decreciente y se tiene l m an = l m n!1
inmediatamente que
1 P
n=0
( 1)n n!3n
1 3
converge absolutamente y e
=
1 P
n=0
1 P
n=0 ( 1)n n!3n :
( 1)n n!3n
1 n!3n
converge. Se muestra
Teorema 2 (criterio de Cauchy) 1 1 P P Sea an una serie numérica. Entonces, an converge si y solo si 8" > 0; 9n0 2 Z+ tal que n=0
n=0
8m; n 2 Z+ con m > n > n0 ) jan+1 + an+2 + ::: + am j < ": Ejemplo 1 P
La serie
n=0
se tiene
1 k!
es convergente. En efecto, de la de…nición del factorial de k; esto es k! = 1 1
1 = k! 1
de donde para m; n 2 m+n X
k=n+1
1 k!
=
2 Z+
:::
m+n X
1
2n
1 1
1 2
1 3
1 0; 8x 2 A; 9n0 2 Z+ tal que 8n
n0 ) jfn (x)
f (x)j < ":
Si la sucesión de funciones (fn ) converge a la función f en el conjunto A; escribiremos l m fn = f o de n!1
forma equivalente l m fn (x) = f (x) x 2 A: n!1
Si para algún x 2 A,
l m fn (x) no existe, diremos que la sucesión (fn (x)) diverge y que la sucesión
n!1
(fn ) no es convergente en el conjunto A.
En el estudio de sucesiones de funciones, la primera tarea es el análisis de la convergencia puntual. Más adelante veremos la convergencia uniforme y daremos más atención a este tipo de convergencia. En la convergencia puntual, el elemento n0 2 Z+ depende de ", y de cada punto x 2 A. En este tipo de convergencia no es posible hallar un n0 2 Z+ dependiente únicamente de " > 0. Convergencia uniforme. De…nición 5 Sea (fn ) una sucesión de funciones reales de…nidas en A; f 2 F (A): Se dice que (fn ) converge uniformemente a f si y solo si se cumple la siguiente condición: 8" > 0; 9n0 2 Z+ tal que 8x 2 A; 8n 2 Z+ ; n
n0 ) jfn (x)
f (x)j < ":
Escribiremos l m fn = f uniformemente o también fn ! f uniformemente. n!1
n!1
Es preciso establecer la diferencia que existe entre la convergencia puntual y la convergencia uniforme. En la convergencia uniforme, el elemento n0 de Z+ depende de ", en general del conjunto A y no de x 2 A,
142
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
el número n0 2 Z+ es global para todo x 2 A, mientras que en la convergencia puntual n0 2 Z+ depende de " y de cada x 2 A; y, no es posible hallar un n0 2 Z+ global para todos los elementos del conjunto A. La convergencia uniforme implica la convergencia puntual, pero el recíproco, en general, no es cierto. Teorema 7 Sea (fn ) una sucesión de funciones de…nidas en el conjunto A que converge puntualmente a la función f de…nida en A. Para cada n 2 Z+ se de…ne Mn = sup jfn (x)
f (x)j :
x2A
Entonces, (fn ) converge uniformemente a f si y solo si (Mn ) converge a 0: Del criterio establecido en el teorema precedente, se sigue que (fn ) no converge uniformemente a f si y solo si l m Mn 6= 0: n!1
En el siguiente teorema se establece el criterio de Cauchy para la convergencia uniforme. Teorema 8 Sean A R con A 6= ;; (fn ) una sucesión de funciones de…nidas en A. Enconces (fn ) converge uniformemente en A a alguna función f si y solo si para " > 0, existe n0 2 Z+ tal que 8x 2 A jfm (x)
si m; n 2 Z+
fn (x)j < "
con m; n
n0 :
Teorema 9 Sean A R, con A 6= ;; (fn ) y (gn ) sucesiones de funciones reales de…nidas en A; f; g 2 F (A) y 2 R: Si l m fn = f y l m gn = g uniformemente, entonces n!1
n!1
i) (fn + gn ) converge uniformemente a f + g: ii) ( fn ) converge uniformement a f: iii) (j fn j) converge uniformemente a j f j : iv) Si existen M1 > 0; M2 > 0 tales que sup sup j fn (x) j
M1 ; sup sup j gn (x) j
n2Z+ x2A
M2 ; entonces
n2Z+ x2A
(fn gn ) converge uniformement a f g: v) Si existe M > 0 tal que a
1 f:
nf
n2Z+
nf j fn (x) j
x2A
M y f 6= 0 ; entonces ( f1n ) converge uniformemente
Convergencia uniforme y continuidad. Sean A R; A 6= ;; (fn ) una sucesión de funciones reales de…nidas en A que converge a una función f de…nida en A, esto es l mn!1 fn (x) = f (x) x 2 A: Adicionalmente, suponemos que cada función fn es continua en todo punto x 2 A; la pregunta que surge es: ¿la función límite f hereda la continuidad de la sucesión (fn )? Sea x; x0 2 A: Si fuese f continua, se tendría l mx!x0 f (x) = f (x0 ) ; que en términos del límite de la sucesión de funciones (fn ) la igualdad precedente se expresaría como l m l m fn (x) = l m l m fn (x) :
x!x0 n!1
n!1 x!x0
Lastimosamente esta igualdad no siempre se cumple. Para responder a la pregunta, examinemos la sucesión de funciones (fn ) de…nida como fn (x) = exp( nx2 ) x 2 R; n = 1; 2; : : : : Para x = 0; fn (0) = 1 consecuentemente
l m fn (0) = 1; y para x 6= 0;
n!1
n!1
nx2
= 0:
1; si x = 0; : Esta función no es continua en x = 0: 0; si x 6= 0:
La función límite f está de…nida como f (x) = Cada función fn es continua en todo R: Resulta
l m l m fn (x) = l m l m e
n!1 x!0
l m fn (x) = l m e
n!1
n!1 x!0
nx2
= l m 1 = 1; n!1
3.2. SUCESIONES Y SERIES DE FUNCIONES. CONVERGENCIA PUNTUAL Y UNIFORME. 143 mientras que si x 6= 0;
nx2
l m l m fn (x) = l m l m e
x!0 n!1
x!0 n!1
= l m 0 = 0: x!0
Claramente l m l m fn (x) 6= l m l m fn (x) : Este y otros ejemplos muestran que si la sucesión de n!1 n!0
n!0 n!1
funciones continuas (fn ) converge puntualmente a una función f , en general, f no hereda la continuidad de cada función fn : En el siguiente teorema se da una condición para que la función límite f sea continua. Teorema 10 Sean A R con A 6= ; y (fn ) una sucesión de funciones continuas en todo punto x 2 A: Si (fn ) converge uniformemente a una función límite f de…nida en A, entonces f es continua en todo punto x 2 A: Este resultado se sintetiza en el siguiente esquema: (
fn continua en A; n = 1; 2; : : : ; fn ! f uniformemente, n!1
)
Convergencia uniforme e integración.
8 <
f continua en A; : l m l m fn (x) = f (x0 ): n!1 x !x0
Sea [a; b] un intervalo cerrado de R: Se considera una sucesión de funciones reales (fn ) de…nida en [a; b] que converge a una función f de…nida en el mismo intervalo [a; b] : Supongamos que se tiene la convergencia puntual, esto es l m fn (x) = f (x) x 2 [a; b] : n!1
Adicionalmente, supongamos que cada función fn es integrable en [a; b] ; ¿es la función límite f integrable Rb Rb en [a; b]? ¿se veri…ca l m a fn (x) dx = a f (x) dx? En de…nitiva, se desea saber las condiciones que se n!1 deben veri…car para que se cumpla la igualdad siguiente: Z b Z b lm fn (x) dx = l m fn (x) dx; n!1 a
n!1
a
es decir que podamos intercambiar el símbolo de integral con el del límite, o también que una sucesión convergente se pueda integrar término a término. La convergencia de (fn ) a f así como la integrabilidad de cada función fn no garantiza, en general, que se veri…que la igualdad anterior, como se puede comprobar con el siguiente ejemplo. ( n; si x 2 n1 ; n2 ; n = 1; 2; : : : :Cada Sea (fn ) la sucesión de funciones de…nida como fn (x) = 0; si x 2 [0; 2] 8 n1 ; n2 función fn es integrable en [0; 2] (fn es una función escalonada), y, Z
0
Luego l m n!1 tiene
R2 0
2
fn (x) dx =
Z
1 n
fn (x) dx +
0
Z
2 n 1 n
fn (x) dx = 1: Por otro lado, fn (x) Z
0
fn (x) dx + ! 0
l m fn (x) dx =
n!1
Tenemos para este ejemplo se tiene l mn!1
R2 0
Z
2 2 n
fn (x) dx =
Z
2 n
ndx = 1:
1 n
x 2 [0; 2] : Se pone f (x) = 0
n!1
2
Z
x 2 [0; 2] ; y se
2
f (x) dx = 0:
0
R2
fn (x) dx 6=
0
(l mn!1 fn (x)) dx:
Antes de enunciar el teorema relativo a la convergencia uniforme y la integración revisamos las condiciones que veri…can las funciones integrables en [a; b] : Sea u una función acotada en [a; b] : Se dice que u es integrable (Riemann integrable) en [a; b] si y solo si I (u) = Sup ' u
Z
a
b
' (x) dx = Inf u
Z
a
b
(x) dx = I (u) ;
144
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
donde ' y
son funciones escalonadas en [a; b] tales que '
u
:
Los números reales I (u) y I (u) se llaman integrales inferior y superior, respectivamente. Se veri…ca, además que para toda función acotada u de…nida en [a; b] ; Z b Z b (x) dx; ' (x) dx I (u) I (u) a
a
donde ';
son funciones escalonadas de…nidas en [a; b] tales que '
u
:
Los siguientes enunciados son equivalentes: i) u es integrable en [a; b] : ii) Para todo " > 0; existen dos funciones escalonadas ; ' de…nidas en [a; b] tales que ' Rb ') dx < ": a (
u
y
Teorema 11 Sea (fn ) una sucesión real de funciones integrables en [a; b] : Supongamos que (fn ) converge uniformemente a una función f de…nida en [a; b] : Entonces, i) f es integrable en [a; b] : ii) l m
Rb
n!1 a
fn (x) dx =
Rb a
l m fn (x) dx:
n!1
El resultado del teorema se sintetiza en el siguiente esquema: 8 ( < f integrable en [a; b] ; fn integrable en [a; b] ; n = 1; 2; : : : ; Rb Rb ) : fn ! f uniformemente, l m a fn = a f: n!1
n!1
En este esquema puede verse que la convergencia uniforme es una condición su…ciente para que f sea integrable en [a; b] : Teorema 12 Sea (fn ) una sucesión de funciones continuas en [a; b] que converge uniformemente a f . Entonces Z b Z b lm fn (x) dx = f (x) dx: n!1 a
a
Convergencia uniforme y derivación. Sea A R; A abierto A 6= ;; (fn ) una sucesión de funciones reales de…nidas en A que converge puntualmente a una función f de…nida en A, esto es l mn!1 fn (x) = f (x) x 2 A: Supongamos que cada función es derivable en todo punto x 2 A, ¿la función límite f es derivable en x 2 A? De ser así, tendríamos dfn df (x) = l m (x) x 2 A; n!1 dx dx o sea d dfn l m fn (x) = l m (x) x 2 A; n!1 n!1 dx dx es decir que la sucesión (fn ) puede derivarse término a término. Lamentablemente esta igualdad no siempre se cumple como se ilustra en el ejemplo siguiente. Sea (fn ) la sucesión de funciones reales de…nidas como fn (x) = p1n sen (nx) x 2 R; n = 1; 2; : : : :Cada p dfn función fn es derivable y (x) = n cos (nx) x 2 R; n = 1; 2; : : : : Para x = 2k k 2 Z; se tiene dx 1 fn (2k ) = p sen (2nk ) = 0, n
p p dfn (2k ) = n cos (2kn ) = n ! 1: n!1 dx
3.2. SUCESIONES Y SERIES DE FUNCIONES. CONVERGENCIA PUNTUAL Y UNIFORME. 145 p1 n
p1 jsen (nx)j ! 0 8x 2 R; se pone f (x) = 0 x 2 R y se tiene que fn ! f n n!1 n!1 df df uniformemente. Además (x) = 0 y en particular (2k ) = 0 8k 2 Z: Resulta, para todo k 2 Z; dx dx
Puesto que
0=
df d (2k ) = dx dx
l m fn (2k ) 6= l m
n!1
n!1
dfn (2k ) = 1: dx
Es este ejemplo se muestra que inclusive la convergencia uniforme de la sucesión (fn ) no basta, debemos dfn : En el siguiente teorema se proponen las condiciones bajo las tener algo más sobre la sucesión dx cuales se puede derivar término a término. Teorema 13 Sean A
R; A 6= ; un conjunto abierto, (fn ) una sucesión real de funciones derivables dfn en cada punto x 2 A y tales que (x) < 1; n = 1; 2; : : : : Supongamos que (fn (x0 )) converge dx para algún punto x0 2 A y que la sucesión (fn ) converge uniformemente a una función g. Entonces, i) Existe una función real f de…nida en A tal que fn ii) Para cada x 2 A;
df (x) = g (x) : dx
Este resultado se sintetiza en el siguiente esquema: 8 dfn > > > < j dx (x) j< 1 8x 2 A; n = 1; 2; : : : ; x0 2 A; (fn (x0 )) convergente, > > > : dfn ! g uniformemente, dx n!1
3.2.2.
! f uniformemente.
n!1
)
8 < fn :
! f uniformemente;
n !1
df (x) = g(x) 8x 2 A: dx
Series de funciones.
Sea (fn ) una sucesión de funciones de…nidas en un subconjunto no vacío A de R. La suma llama serie de funciones. Para n 2 N, se de…ne
Sn =
n P
fk
,y,
Sn (x) =
k=1
n P
k=1
fk (x)
1 P
fk se
k=1
x 2 A: La
función fn se llama término general de la serie y Sn se denomina suma parcial de la misma. Además, Sn es una función de…nida en el conjunto A, y (Sn ) es una sucesión de funciones de…nida sobre A. Para cada x 2 A; (Sn (x)) es una sucesión numérica. Si l m Sn (x) existe, denotamos al mismo con S (x), n!1 1 P esto es, l m Sn (x) = S (x) x 2 A; y decimos la serie numérica fk (x) tiene como suma S (x). n!1 1 P
Escribimos
k=1
fk k=1 1 P
l m Sn (x) =
n!1
(x) = S (x) x 2 A. Se de…ne una función real S en todos los puntos x 2 A en los que
fk (x) existe mediante la relación:
k=1
S (x) = l m Sn (x) = n!1
y diremos que
1 P
1 X k=1
fk (x) ;
x 2 A;
fk converge puntualmente a S. Se tiene Dom (S)
A:
k=1
Note que el estudio de la serie de funciones
1 P
fk se le ha conducido al estudio de la sucesión de
k=1
funciones (Sn ) : La primera tarea es analizar su convergencia puntual, a continuación se debe estudiar la convergencia uniforme así como sus consecuencias, esto es, la convergencia uniforme y continuidad, convergencia uniforme e integración, convergencia uniforme y derivabilidad de dicha serie de funciones.
146
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
La convergencia uniforme de la serie y la continuidad tiene que ver con la cuestión relativa al intercambio entre el símbolo de sumatorio con el de límite: lm
x!a
1 X
fk (x) =
k=1
1 X k=1
l m fk (x) =
x!a
1 X
fk (a)
k=1
a 2 A;
resultado que.no siempre es verdadero. La convergencia uniforme de la serie y la integración está relacionada con el intercambio entre el símbolo de sumatorio con el de integración: Zb a
1 X
!
fk (x) dx =
k=1
1 Z X k=1 a
b
fk (x) dx a; b 2 A tales que a < b;
intercambio que no siempre es posible. La convergencia uniforme de la serie y la derivabilidad está relacionada, tal como en los casos anteriores, con el intercambio del símbolo de derivación con el de sumatorio: ! 1 1 X d X dfk fk (x) = (x) x 2 A; dx dx k=1
k=1
este resultado no siempre es verdadero. ¿Cuáles son las condiciones suplementarias a la convergencia uniforme que debemos imponer al término general fk de la serie de funciones para que cada una de las cuestiones citadas siempre sea posible? Estas cuestiones las abordaremos en esta sección. A continuación proponemos algunos resultados de convergencia puntual y uniforme de series de funciones. Teorema 14 Sean A
i)
1 P
R; A 6= ;; y,
1 P
fn una serie de funciones de…nidas en A. Entonces
n=1
fn converge si y solo si se satisface la siguiente condición:
n=1
8" > 0; 8x 2 A; ii)
1 P
9p 2 Z+ tal que 8m 2 Z+ ;
jfp+1 (x) +
+ fp+m (x)j < ":
fn converge uniformemente si y solo si satisface la siguiente condición:
n=1
8" > 0; 9 p 2 Z+ tal que 8x 2 A; 8m 2 Z+ ;
jfp+1 (x) +
+ fp+m (x)j < ":
En el siguiente teorema se propone la conocida prueba de Weierstrass de la convergencia uniforme de series de funciones. Teorema 15 Sea A R con A 6= ; y (un ) una sucesión de funciones reales de…nidas en A. Supongamos que existe Mn > 0 tal que jun (x)j Mn 8x 2 A; n = 1; 2; : : :. Si la serie numérica 1 1 P P Mn converge, entonces la serie un converge uniformemente en A: n=1
n=1
Ejemplos
1 P
1 k x x 2 R: Mostremos que esta serie es convergente. 2 sen 2 k=1 (k + 1) Para ello apliquemos el criterio de Weierstrass. Tenemos
1. Consideremos la serie
1 sen (k + 1)2
k x 2
1 8x 2 R; k = 1; 2; : : : (k + 1)2
la prueba de Weierstrass se sigue que las serie
1 P
1 2 sen k=1 (k + 1)
1 P
1 2 es convergente, por n=1 (n + 1) k x converge uniformemente en 2
Aplicando el criterio de la integral se prueba que la serie numérica
3.2. SUCESIONES Y SERIES DE FUNCIONES. CONVERGENCIA PUNTUAL Y UNIFORME. 147 todo R, lo que de…ne una función S en todo R dada como S (x) = 1 P
2. La serie geométrica
k=0
1 1
jxj < 1:
x
1 X
1 2 sen (k + 1) k=1
k x 2
x 2 R.
xk converge si y solo si jxj < 1, en cuyo caso escribimos
Sea 0 < a < 1: Para todo x 2 [ a; a]
xk
] 1; 1[ se tiene
1 P
ak k = 0; 1; : : : ;
por la prueba de Weierstrass resulta que la sucesión (Sn ) de…nida como Sn (x) =
k=0 1 P
1 P
xk =
k=0
ak =
1 1
a
;
xk converge
k=0
uniformemente a S (x) =
1 X
xk =
k=0
La serie esto es,
1 P
k=0 1 P
xk =
Teorema 16 Sea
1 P
n=1 1 P
n=1
ii) Si 1 P
1 P
n=1
n=1
x 2 [ a; a] :
x
xk x 2 ] 1; 1[ no converge uniformemente, únicamente se tiene convergencia puntual;
k=0
i) Si
1 1
1 1
x
jxj < 1:
fn una serie de funciones sobre un subconjunto A de R con A 6= ;:
jfn j converge, entonces
1 P
fn converge, y,
1 P
fn
n=1
n=1
jfn j converge uniformemente, entonces
jfn j :
1 P
1 P
n=1
jfn j :
fn converge uniformemente, y,
n=1
1 P
fn
n=1
Ejemplo Consideremos la serie
1 ( 1)k x2k P k=0 (2k + 5)!
x 2 R. Probemos que converge uniformemente sobre cada intervalo
[ r; r] con r > 0: En efecto, para cada x 2 R, la serie el criterio del cociente, para x 6= 0 se tiene jxj2(k+1) (2 (k + 1) + 5)!
(2k + 5)! jxj2k
1 ( 1)k x2k 1 P P x2k = converge, pués por k=0 (2k + 5)! k=0 (2k + 5)!
=
x2 (2k + 6) (2k + 7)
! 0:
k!1
x2k r2k 8x 2 [ r; r] ; k = 0; 1; : : :.El criterio del cociente (2k + 5)! (2k + 5)! 1 1 P P r2k x2k muestra que la serie converge. Por la prueba de Weierstrass, la serie converge. k=0 (2k + 5)! k=0 (2k + 5)! Mostremos que la convergencia es uniforme. Sea " > 0: Por el criterio de Cauchy,
Sea r > 0. Entonces
9p 2 Z+ tal que 8m 2 Z+ )
p+m X
k=p+1
r2k < "; (2k + 5)!
de donde p+m X
k=p+1
( 1)k x2k (2k + 5)!
p+m X
k=p+1
jxj2k (2k + 5)!
p+m X
k=p+1
r2k 0; sin embargo no será de utilidad para explicar algunas di…cultades que se presenta. Supongamos que deseamos calcular el valor aproximado de ln (1;5) con una precisión " = 10 Tenemos x = 0;5: Luego 1 1 X ( 1)k ln (1;5) = ln (1 + 0;5) = : 2 (k + 1) 2k k=0
Sabemos que
1 P
1 1 1 = 1: Ponemos ak = ; bk = : Entonces k k (k + 1) (k + 1) 2 k=1 k (k + 1) ck =
luego existe m 2 Z+ tal que
ak k (k + 1) k = = k k bk (k + 1) 2 2
ak < " si k bk
m:
! 0;
k!1
10 :
3.5. APROXIMACIÓN DE LAS FUNCIONES TRIGONOMÉTRICAS ak < " = 10 bk S40 j < " = 10 10 :
Para m = 40 se tiene jln (1;5)
10
si k
163
40: Se de…ne S40 =
40 ( 1)k 1 P y 2 k=0 (k + 1) 2k
1 ( 1)k (0;8)k+1 P ; y aplicando el mismo criterio de comparación, se k+1 k=0 ak (0;8)k+1 1 tiene que < " = 10 10 si k 125; donde ak = y bk = k = 1; 2; : : : : Se bk k+1 k (k + 1) 125 P ( 1)k (0;8)k+1 de…ne S125 = y jln (1;8) S125 j < " = 10 10 : k + 1 k=0
Si x = 0;8; se tiene ln (1;8) =
Cuando x < 1 se aproxima a 1; observamos que el número de términos crece enormemente, lo que por una parte di…culta la determinación del número adecuado de términos, por otra parte, se deben calcular sumas con un número muy grande de términos. Estos elementos di…cultan la elaboración de un algoritmo de cálculo de ln (1 + x) :
3.5.
Aproximación de las funciones trigonométricas
Cuando utilizamos un instrumento de cálculo tal como una calculadora de bolsillo o un computador, podemos obtener inmediatamente valores de las funciones trigonométricas seno, coseno, tangente; pero de esto, la pregunta que nos hacemos es ¿cómo con estos instrumentos se calculan valores de estas funciones trigonométricas?, ¿qué método se utiliza para garantizar la precisión de cálculo requerido? Esta sección está destinada a analizar el uso de la serie de Taylor de sen(x) que nos permitan calcular aproximaciones de esta y de las funciones trigonométricas coseno y tangente. Aproximación de sen(x) La serie de Taylor de sen(x) x 2 R, viene dada por sen(x) =
1 P
k=0
( 1)k x2k+1 (2k+1)! :
Esta serie es absolutamente
convergente para todo x 2 R, además, es rápidamente convergente. Por otro lado, el número de x cos(x) x 6= 0; y se probó en el capítulo 1 condicionamiento de sen(x) está de…nido por c(x) = sen(x) h i que jc(x)j 1 si x 2]0; 2 ], con lo que la serie de Taylor será utilizada para aproximar sen(x) x 2 0; , 2 mediante una suma …nita SN (x): Determinemos el número entero positivo N , el más pequeño posible, tal que si > 0; j sen x SN (x)j < 8x 2 0; 2 : Para el efecto, primeramente establecemos la siguiente mayoración: 2k+1 1 1 1 h i X X X ( 1)k x2k+1 x2k+1 2 x 2 0; ; (2k + 1)! (2k + 1)! (2k + 1)! 2 k=0
k=0
k=0
y la convergencia de la última serie es absoluta. A continuación aplicamos el criterio del cociente, ponemos 2k+1 1 P 2 1 ak = k =; 1; y consideramos una serie numérica convergente de suma 1, elegimos = 1; 2k (2k + 1)! k=1 1 ak ponemos bk = k k =; 1; y consideramos la sucesión ; esto es bk 2 2k+1
2k 2 ak = bk (2k + 1)!
!0:
k !1
ak De la convergencia se sigue que si = 10 10 , se veri…ca que < 10 10 8k 9: Para = 10 32 se bk ak veri…ca que < 10 32 8k 20: Para …jar las ideas, elegimos = 10 12 y el correspondiente N es bk N = 11: Luego S11 (x) =
11 5 X ( 1)k x2k+1 X x4k+1 = (2k + 1)! (4k + 1)! k=0
k=0
5 X x4k+3 = P1 (x) (4k + 3)! k=0
P2 (x);
164
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
donde 5 X x4k+1 x4 P1 (x) = =x 1+ (4k + 1)! 5!
x4
1+
6
k=0
x4
1+
7
8
9
1+
x4 10
11
12
13
x4
1+
14 15 16 17 18 19 20 21 4 4 x x4 x4 x4 x 1+ 1+ 1+ 1+ = x 1+ 120 3024 17160 57120 143640 5 X x4k+3 x3 P2 (x) = = (4k + 3)! 3!
1+
k=0
1+ x3
=
x4 12 13 14 15
1+
6
x4
1+
840
1+ x4 7920
x4 4
5
6
1+
7
x4 16
17
1+
18
x4 32760
19 1+
x4 9 10
8 1+
x4 93024
;
11 x4
20
21 22 x4 1+ 212520
23 :
Con esta información podemos construir un algoritmo para el cálculo aproximado de sen(x) x 2 0; 2 con una precisión = 10 12 . Requerimos adicionalmente aproximaciones de . Consideramos las siguientes: con 12 cifras de precisión ' 3;14159265359 por exceso y por defecto ' 3;141592653589; y con 32 cifras de precisión ' 3;14159265358979323846264338327950: Algoritmo Dato de entrada: x: Datos de salida: x; sen(x): 1. y1 = x2 x; 2. y = y1 x 3. a1 = x 1 + 4. a2 =
y 120
y1 1+ 6
5. S11 (x) = a1
1+
y 840
y 3024
1+
y 7920
1+
y 17160
1+
y 32760
1+
y 57120
1+
y 93024
1+
y 143640
1+
y 212520
: :
a2 :
6. Imprimir x; S11 (x): 7. Fin
h i Para el cálculo de un solo valor de sen(x) con x 2 0; se requieren de 36 operaciones elementales y 2 h i de 5 asignaciones. En los ejercicios se propone elaborar un algoritmo de cálculo de sen(x) x 2 0; y 2 32 = 10 con el número de términos N = 21. Al algoritmo descrito precedentemente los denominaremos como algoritmo de aproximación o también h i método de aproximación de sen(x) con x 2 0; : Lo notaremos sen (x) 2 i h Para x 2 R8 0; , consideramos los tres casos siguientes: i) x 2] 2 ; ]; ii) x > ; iii) x < 0: Para 2 calcular sen(x) aplicaremos las propiedades de la función sen(x) de modo que el algoritmo que acabamos de proponer se aplique con ligeras modi…caciones. a) Puesto que sen(
x) = sen(x)
8x 2 R; en particular para x 2] ; ] se sigue que x 2]0; ], lo 2 2 que nos permite aproximar sen(x) mediante la suma S11 ( x) x 2] ; ], utilizando el algoritmo 2 arriba descrito.
3.5. APROXIMACIÓN DE LAS FUNCIONES TRIGONOMÉTRICAS b) Si x >
entonces y = x
165
x n 2 [0; ], donde n = [ ] y [ ] denota la función mayor entero
x
. Luego
sen(y); si n impar, sen(y); si n par.
sen(x) = sen(y + n ) = sen(y) cos(n ) + sen(n ) cos(y) =
Así, para x > ; sen(x) se aproxima utilizando el algoritmo y la parte a) precedente con y = x n ; y sen(x) = sen(y) si n es impar, sen(x) = sen(y) si n es par. c) Si x < 0; como la función seno es impar, esto es, sen(x) = sen( x) 8x 2 R, basta cambiar x por x y utilizar el algoritmo y los resultados de las partes a) y b) precedentes. Se propone al lector la elaboración completa del algoritmo que permite aproximar sen(x) x 2 R: Al algoritmo descrito precedentemente así como los resultados obtenidos en a), b) y c) los denominaremos como algoritmo o método de aproximación de sen(x) x 2 R: Ejemplos 1. Tomando en consideración pi = 3;1415926536 aproximación de ; calcular una aproximación de con una precisión " = 10 4 : Para el efecto aplicamos el algoritmo. Ponemos x = ' sen 10 10 pi = 0;3141592654; y = x4 ' 0;009740909109: Luego, 10 y y y y y a1 = x 1 + 1+ 1+ 1+ 1+ 120 3024 17160 57120 143640 = 0;3141847673; y y y y y x3 1+ 1+ 1+ 1+ 1+ a2 = 6 780 7920 32760 93024 212520 = 0;005167772705; de donde S11
= a1
10
El valor de sen
10
a2 ' 0;3090169946:
obtenido en una calculadora de bolsillo es sen
10
' 0;3090169944:
2. Calculemos sen (10) : Para el efecto apliquemos los resultados arriba obtenidos. Ponemos xh = 10: i Se tiene x > entonces x = 3 + 10 3 : Ponemos a = 10 3 ' 0;57522220393 2 0; : 2 Luego, sen (10) = sen (3 + a) = sen (3 ) cos (a) + sen (a) cos (3 ) = sen (a) : Calculemos una aproximación de sen (a) con una precisión " = 10 10 : Sea y = a4 ' 0;1094818355 y a3 ' 0;1903296953: Entonces
y y y y y 1+ 1+ 1+ 1+ 120 3024 17160 57120 143640 = 0;5757468615; a3 y y y y y = 1+ 1+ 1+ 1+ 1+ 6 840 7920 32760 93024 212520 = 0;03172575038;
a1 = a 1 +
a2
sen (a) = a1 Así, sen (10) =
sen (a) '
a2 = 0;5440211111: 0;5440211111:
El valor sen (10) obtenido en una calculadora de bolsillo es sen (10) '
0;5440211109:
Aproximación de cos(x) Para aproximar cos(x) x 2 R; utilizamos la siguiente relación: cos(x) = sen el método de aproximación de sen(x) a condición de cambiar x por 2 correspondiente.
2
x
8x 2 R y aplicamos
x: Se propone elaborar el algoritmo
166
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
Ejemplo p
3 Es conocido que cos = ' 0;8660254038: Apliquemos el algoritmo de cálculo de sen (a) con 6 2 h i = ' 1;047197551: Entonces a 2 0; para calcular una aproximación de cos : Sea a = 2 6 2 6 3 y = a4 ' 1;20258137; a3 = 1;148380617: Luego y y y y y a1 = x 1 + 1+ 1+ 1+ 1+ 120 3024 17160 57120 143640 ' 1;057696227; a3 y y y y y a2 = 1+ 1+ 1+ 1+ 1+ 6 840 7920 32760 93024 212520 ' 0;1916708232; sen (a) ' a1
a2 = 1;057696227
0;1916708232 = 0;8660254038:
p
3 = sen (a) ' 0;8660254038 que es la aproximación obtenida de : En una 6 2 calculadora de bolsillo se obtiene el siguiente valor cos = 0;8660254038: 6
En consecuencia cos
Aproximación de tan(x) De la de…nición de la función tangente, se tiene tan(x) =
sen(x) cos(x)
x 2 R8f
2
+ k j k 2 Zg;
luego los valores de tan(x) x 2 R8f 2 + k j k 2 Zg pueden aproximarse utilizando esta relación y los métodos de aproximación de sen(x) y cos(x) arriba tratados: Ejemplos p
3 : Apliquemos el algoritmo de cálculo de sen (x) para aproximar 6 3 sen 6 : sen y cos y así aproximar tan = 6 6 6 cos 6 Consideremos ' 3;141592653; x = 0;5235987755; x3 ' 0;1435475771; y = x4 ' 0;0751613356: Aplicando el algoritmo de cálculo para aproximar sen (x) ; tenemos =
1. Es conocido que tan
y y y y y 1+ 1+ 1+ 1+ 120 3024 17160 57120 143640 ' 0;5239267369; y y y y y x3 = 1+ 1+ 1+ 1+ 1+ 6 840 7920 32760 93024 212520 ' 0;02392673695:
a1 = x 1 +
a2
En consecuencia sen
6
' a1
a2 = 0;5239267369
0;02392673695 = 0;5:
Con la misma precisión, calculamos una aproximación de cos
: Ponemos x = = ' 6 2 6 3 1;047197551; ' 1;148380617; = 1;20258137: Aplicando nuevamente los desarrollos a1 ; a2 precedentes, se obtiene a1 = 1;057696227; a2 = 0;1916708232: Luego x3
x4
cos
6
= sen
' a1
6
a2 = 0;8660254038:
Por lo tanto, sen tan
6
= cos
6 6
'
0;5 ' 0;577350269: 0;8660254038
3.5. APROXIMACIÓN DE LAS FUNCIONES TRIGONOMÉTRICAS Valor obtenido en una calculadora de bolsillo tan 2. Para 0 < " < 10 a cero.
2;
tan
167
= 0;5773502692:
6
" se puede hacer tan grande como se quiera conforme " se aproxima
2
h h sen (x) para x 2 0; ; con el algoritmo de cálculo de sen (x) ; es crítico cos (x) 2 ": Veamos esta situación con el siguiente ejemplo: aproximar tan (89;9995 ) :
Si aproximamos tan (x) = para x =
2 En radianes 89;9995 = 1;5707876 rad: Ponemos x = 1;5707876; entonces x3 ' 3;875719987; y = x4 ' 6;087932897: Calculemos sen (89;9995 ) = sen (1;5707876) con el algoritmo arriba desarrollado. Tenemos y y y y y 1+ 1+ 1+ 1+ 120 3024 17160 57120 143640 ' 1;650628503; x3 y y y y y = 1+ 1+ 1+ 1+ 1+ 6 840 7920 32760 93024 212520 ' 0;6506385023;
a1 = x 1 +
a2
luego sen (1;5707876) ' a1
a2 = 1;000000000:
Calculemos cos (89;9995 ) = cos (1;5707876) : Para el efecto, ponemos x = x3
16 ;
x4
2
21
1;5707876 '
0;000008727: Se obtiene ' 6;646529367 10 ' 5;800426178 10 y aplicando el algoritmo de cálculo de sen (x) se obtiene: a1 ' 0;000008727; a2 ' 1;107754895 10 16 : Luego cos (1;5707876) ' 0;000008727 y en consecuencia tan (1;5707876) =
sen (1;5707876) 1;0 ' ' 114586;9142: cos (1;5707876) 0;000008727
El valor obtenido en una calculadora de bolsillo es tan (1;5707876) = 114589;7256: Esta pequeña diferencia se debe a que hemos operado con una precisión de 10 9 mientras que en la calculadora, internamente se opera con una precisión de 10 12 : Con la versión de Fortran 77, se obtiene en doble precisión el siguiente valor: tan (1;5707876) = 113924;073226171: Aproximación de arcsen(y): Recordemos que la función f de
h
;
i
en [ 1; 1] de…nida como y = f (x) = sen(x)
2 2 es biyectiva y su función inversa g está de…nida como x = g (y) = arcsen (y) h i (g f ) (x) = x x 2 ; : Además, f y g son derivables, luego 2 2 i h ; 1 = (g f )0 (x) = g 0 (y) f 0 (x) x 2 2 2 de donde g 0 (y) =
1
f 0 (x)
con y = f (x) : Se tiene f 0 (x) = cos(x) =
luego
p 1
sen2 (x) =
1
(arcsen (y))0 = g 0 (y) = p
1
e integrando, resulta
arcsen (y) =
Z
0
y
p
dt 1 t2
y2
p
1
y2;
y 2 ] 1; 1[ ;
y 2 ] 1; 1[ :
x2
h
;
i
2 2 y 2 [ 1; 1] : Se tiene
168
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
Por el binomio de Newton:
1
1 2
t2
1 2
= 1+
1 2
1 2
t2 +
2
t2
1 2
1 2
1 +
2! 2 t 1 3 4 1 3 5 6 = 1+ + t + t + 2 2! 22 3! 23 1 X 1 3 (2k 1) 2k t t 2 ] 1; 1[ : = 1+ k k!2
1 2
1 3!
2 t2
3
+
k=1
Luego, por el teorema de la convergencia uniforme y la integración, se tiene ! Z y 1 X 1 3 (2k 1) 2k t dt arcsen (y) = 1+ k!2k 0 k=1
= y+
1 X 1 k=1
3 (2k k!2k (2k + 1)
1)
y 2k+1
y 2 ] 1; 1[ :
1 P 1 ; se obtiene m = 25 y en mediante el criterio de comparación con la serie k=1 k (k + 1) " p # 2 consecuencia jarcsen (y) S25 (y)j < " = 10 10 si y 2 0; ; donde 2
Para " = 10
10 ;
S25 (y) = y 1 +
25 X 1 k=1
#p
3 (2k k k!2 (2k + 1)
1)
y 2k
!
:
" 2 ; 1 ; para aproximar arcsen (y) se requiere de un número mayor de términos. Esto podemos Si y 2 2 controlarlo del modo siguiente. Sea x = arcsen (y) ; entonces r y = sen (x) = cos x = 1 sen2 x 2 2 de donde 1 Como y 2
sen2
#p
x = y 2 con lo que x =
2
" 2 ; 1 se sigue que 1 2
Ponemos v = 1
y2
1 2
y2
y jarcsen (v)
1 2
2 0;
17 X 1 k=1
con v =
p
Ejemplo
1
y2
y2
y 1+
25 1 P
k=1
2
#p
v 1+
k=1
"
2 ;1 : 2
10
1 2
:
con
3 (2k k k!2 (2k + 1)
3 (2k k k!2 (2k + 1)
17 1 P
y2
1 : 2
S17 (v)j < " = 10
S17 (v) = v 1 + Se de…ne S" como sigue: 8 > > > < S" = > > > :
2
arcsen 1
1)
3 (2k k k!2 (2k + 1)
v
2k
!
:
"
p # 2 si y 2 0; 2
y 2k 1)
1)
v 2k
si v 2 0;
1 2
3.6. APROXIMACIÓN DE EXP(X) Sabemos que arcsen
1 2
=
6
169
' 0;5235987756:
Apliquemos los resultados obtenidos precedentemente. Ponemos y = 0;5 y " = 10 ! 25 X 1 3 (2k 1) 2k S" = y 1 + y k!2k (2k + 1) k=1 y2
1 3y 2 + 2 3 y = 0;5235987755: = y 1+
1 5y 2 + 5 6
1 7y 2 + 7 8
1 + 9
+
47y 2 48
10 :
Entonces
1 49y 2 + 49 50 51
Aproximación de arc cos(x) Se propone como ejercicio Aproximación de arctan(y) Sea x = arctan(y). Entonces y = tan(x) =
i h sen(x) ; x2 ; ; cos(x) 2 2
y y por lo tanto x = arcsen p y 2 de donde sen(x) = p 2 1+y 1+y y aproxima utilizando el algoritmo de arcsen(z); con z = p : 1 + y2
: Consecuentemente, arctan(y) se
Nota: Se recomienda al lector elaborar un programa computacional que permita aproximar las funciones trigonométricas utilizando los algoritmos descritos y comparar los resultados con los proporcionados con los de las calculadoras de bolsillo.
3.6.
Aproximación de exp(x)
Sea x 2 R, en el primer capítulo se mostró que el número de condicionamiento de exp(x) es c(x) = x, por lo tanto exp(x) está bien condicionado si jxj 1: Por otro lado, en un entorno de x = 0, exp(x) se 1 k P x representa mediante el siguiente desarrollo en serie de potencias exp(x) = x 2 R: Esta serie es k! k=0
absolutamente convergente para todo x 2 R (radio de convergencia r = +1): Para x 2 [0; 1], de…nimos Sn (x) = posible tal que j exp(x)
n P
k=0
xk k!
n = 1; 2; : : : : Sea
> 0: Determinemos n 2 N el más pequeño
Sn (x)j < ; 8x 2 [0; 1]; es decir que 1 X xk k!
k=n+1
1 X 1 < k!
P1
k=n+1
xk < : Se tiene k!
8x 2 [0; 1]:
k=n+1
1 Para determinar n 2 N aplicamos el criterio del cociente. Ponemos ak = k = 0; 1; k! 1 1 P 1 serie convergente con 1 < p < 2: Ponemos bk = p k = 0; 1; ; luego p k k=1 k ak kp 1 = bk (k 1)!
; y elegimos la
! 0:
k!1
Particularmente, para p = 2; el criterio para determinar n es el siguiente: n 2 N el más pequeño posible tal que (n n1)! < : Para = 10 10 se obtiene n = 16; para = 10 20 se obtiene n = 24; para = 10 32 se obtiene n = 32:
170 Para
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES. > 0 dado, Sn (x) =
n xk P aproxima a ex con una precisión k! k=0
para todo x 2 [0; 1].
Con el propósito de obtener un algoritmo numéricamente estable, escribimos Sn (x) en una forma anidada: Sn (x) = 1 + x 1 +
x 2
1+
x n
1
1+
x n
;
cuyo algoritmo es el siguiente: Algoritmo Datos de entrada; n; x: Datos de salida : x; exp(x): 1. b = 1: 2. k = 0; : : : ; n b=1+
1 b x n k
Fin de bucle k. 3. Imprimir exp(x) = b: 4. Fin. Para cada x 2 [0; 1], la aproximación de exp(x) dado en el algoritmo requiere de 4 n operaciones elementales y n asignaciones. 1 1 , entonces para x 2 [ 1; 0[; exp(x) se aproxima mediante y Sn ( x) exp( x) Sn ( x) se calcula usando el algoritmo precedente. Puesto que exp(x) =
Para x 2 R tal que jxj > 1; exp(x) está mal condicionado. Dado > 0, si determinamos n tal jxjn que < , resulta que tal n aumenta considerablemente según jxj, lo que hace que Sn (x) sea (n 1)! numéricamente costoso y por otro lado, el algoritmo es inestable numéricamente. El remedio a este problema consiste en hacer y = x [x], donde [ ] denota la función mayor entero menor o igual que x. Resulta y 2]0; 1[, y exp(x) = exp(y) exp([x]): Aproximamos exp(y) mediante Sn (y) si y > 0 y Sn1(y) si 1 P 1 y < 0: Como el número e base de los logaritmos naturales está dado como la serie e = k! ; se aplica el k=0
algoritmo precedente con x = 1 y luego exp([x]) se evalúa como una potencia entera. Para = 10 10 ; se k=16 P 1 tiene S16 (1) = = 2;7182818284. k=0 k! 8 < Sn (y) exp([x]); si x > 1; 1 Así, exp(x) se aproxima como Se recomienda al lector elaborar el ; si x < 1: : Sn ( y) exp( [x]) algoritmo completo para aproximar exp(x) así como su respectivo programa computacional. Ejemplos 1. Aplique el algoritmo para calcular una aproximación de exp (0;4) con una precisión " = 10 tiene 0 < x < 1 y en consecuencia S16 (x) =
16 X xk k=0
k!
=1+x 1+
10 :
x x x x 1+ 1 + ::: + 1+ ::: 2 3 15 16
en particular para x = 0;4; se obtiene S16 (x) = 1 + 0;4 1 +
0;4 2
1+
0;4 3
1 + ::: +
0;4 15
1+
0;4 16
:::
= 1;491824698 : : :
Se
3.7. APROXIMACIÓN DE LN(X)
171
El valor de exp (0;4) obtenido en doble precisión es exp (0;4) ' 1;491824706533238 y en una calculadora de bolsillo exp (0;4) ' 1;491824698: 2. Calculemos el valor aproximado de exp (22;4) : Tenemos x = 22;4 > 1; en consecuencia x = (x [x]) + [x] = y + [x] con y = x [x] 2 [0; 1] : Resulta [22;4] = 22: Luego exp (22;4) = exp (0;4) exp (22) : En el ejemplo 1) previo se calculó el valor aproximado de exp (0;4) : Queda por calcular exp (22) : Primeramente exp (1) = 2;7182818284: Luego exp (22) = (2;7182818284)22 = 3584912833 = 3;584912833
109 ;
de donde exp (22;4) = exp (0;4) exp (22) ' 1;491824698 = 5;348061504
3;584912833
109
109 :
El valor de exp (22;4) obtenido en una calculadora de bolsillo es exp (22;4) ' 5;348061523 109 ; y en doble precisión exp (22;4) ' 5;34805948262739 109 : Note que exp (22) ' 3;584912846131592 109 : Debido a que en la calculadora de bolsillo se representan los números en punto …jo, donde se produce mayor error es en el cálculo de exp (22) ' (2;7182818284)22 : 3. Calculemos el valor aproximado de exp ( 0;9) : Puesto que exp ( 0;9) =
1 ; calculamos el exp (0;9)
valor aproximado de exp (0;9) : Aplicando el algoritmo, tenemos S16 (x) =
16 X (0;9)k
k!
k=0
= 1 + 0;9 1 +
de donde S16 (0;9) =
0;9 2
1+
0;9 15
1+
0;9 16
:::
= 2;459603112;
1 1 = = 0;4065696598: S16 (0;9) 2;459603112
El valor obtenido en una calculadora de bolsillo es exp ( 0;9) ' 0;4065696597:
3.7.
Aproximación de ln(x)
Antes de abordar el problema de la aproximación numérica de ln (a) con a > 0; recordemos algunas propiedades de la función logaritmo. 1. Sean a; b 2 R+ ; ln (ab) = ln (a) + ln (b) : 2. Si a 2 R+ ; ln
1 a
=
ln (a) :
1 = n ln (a) : an a a Por otro lado, sea a > e y n 2 Z+ tal que 1 < e; donde a = en ; luego n e en h ai a = ln en + ln n = n + ln (x) ; ln (a) = ln en n e e a con x = n 2 [1; e] : e 3. Si n 2 Z+ ; a 2 R+ ; ln (an ) = n ln (a) y ln
Si a < 1 y n 2 Z tal que 1
ae
n
< e; entonces a = en
ln (a) = n + ln ae con x = ae Ejemplos
n
2 [1; e] :
n
(ae
n) ;
de donde
= n + ln (x) ;
172
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES. 20;11 20;11 con x = ' 1;001217945 2 [1; e] : 3 e e3
1. a = 20;11 = e3
145;41 145;41 con x = ' 2;663277051 2 [1; e] : 4 e e4
2. a = 145;41 = e4 3. a = 6;81
10
3
=e
5
e5
6;81
10
3
; donde x = e5
6;81
10
3
' 1;010693613 2 [1; e] :
1 De las dos últimas relaciones, si a > 0 basta determinar n 2 Z+ tal que x = aen 2 [1; e] si a < ; e a x = n 2 [1; e] si a > e: En cualquiera de los casos, queda calcular ln (x) : Para el efecto, utilizamos el e siguiente desarrollo en series de potencias: 1+x 1 x
ln
Sea a > 0: Ponemos a =
= 2x
1 X x2k si jxj < 1: 2k + 1 k=0
1+x a 1 ; entonces x = y en consecuencia 1 x a+1 ln (a) = 2
1
a 1X 1 a+1 2k + 1 k=0
2k
a 1 a+1
: m P
Con …nes prácticos elegimos " = 10
10 :
2k
a 1 a+1
1 2k +1 k=0
Para a = 1; obviamente ln (1) = 0: Para a 2 [1; e] ; sea m 2 Z+ y Sm (a) =
:
Determinemos m 2 Z+ el más pequeño posible tal que
ln (a)
2
a 1 Sm (a) < " = 10 a+1
10
;
lo que conduce a determinar m 2 Z+ tal que m X k=0
1 2k + 1
a 1 a+1
1 X
2k
Sm (a)
=
<
k=m+1 1 X k=m+1
1 2k + 1
a 1 a+1
1 X
2k
1 1 < " = 10 2k + 1 4k
k=m+1 10
1 2k + 1
e 1 e+1
2k
:
1 P
1 1 1 ak 1 = 1: Ponemos ak = ; bk = k = 1; 2; : : : ; Ck = = k 2k + 1 4 k (k + 1) bk k=1 k (k + 1) k (k + 1) ak ! 0; luego, existe m 2 Z+ tal que Ck = < " si k m: Para k = 15 obtenemos bk (2k + 1) 4k k !1 15 16 19 20 C15 = ' 7;21 10 9 ; para k = 19; C19 = ' 3;545 10 11 : Elegimos m = 19 y 15 31 4 39 419 de…nimos 19 2 (a 1) X 1 a 1 2 '19 (a) = a 2 [1; e] : a+1 2k + 1 a + 1 La serie
k=0
e+1 a 1 e 1 a 1 entonces 0 < de donde 0 < Note que si 1 < a 2 a+1 e+3 a+1 1 1 1 tal caso, ponemos ak = ; bk = k = 1; 2; : : : ; luego 2k + 1 10k k (k + 1) Ck = y existe m 2 Z+ tal que Ck =
ak k (k + 1) = bk (2k + 1) 10k
ak < " = 10 bk
10
si k
m:
! 0;
k!1
2
e 1 e+1
2
< 0;1: En
3.7. APROXIMACIÓN DE LN(X) Para m = 11; se tiene C11 =
173
11 12 ' 5;74 23 1011
10
11 :
11
2 (a 1) X 1 '11 (a) = a+1 2k + 1 k=0
Así,
Sea b1 =
8 11 > 1 2 (a 1) P > > < '11 (a) = a + 1 k=0 2k + 1 19 > 2 (a 1) P 1 > > : '19 (a) = a + 1 k=0 2k + 1
De…nimos
a 1 a+1 a 1 a+1 a 1 a+1
2k
a 2 1; 2k
e+1 : 2
e+1 ; 2 e+1 a2 ;e : 2
a 2 1; 2k
a 1 y b = b21 : Entonces a+1 '11 (a) = 2b1
11 X k=0
b b2 1 bk = 2b1 1 + + + 2k + 1 3 5
= 2b1 1 + b
1 +b 3
1 + 5
+b
+
b10 b11 + 21 23
1 b + 21 23
:
En forma similar se escribe '19 (a) : Un algoritmo para el cálculo de ln (a) con a 2 [1; e] con una precisión " = 10
10
se propone a continuación
Algoritmo Datos de entrada: a 2 ]1; e[ : Datos de salida: ln (a) : 1. Si 1
1+e ; asignar n = 11: 2
a
1+e < a < e; asignar n = 19: 2 a 1 3. b1 = : a+1 2. 2i
4. b = b21 : 5. y =
1 : 2n + 1
6. Para j = 1; : : : ; n k=n y=
j
1 +b 2k + 1
y
Fin bucle j: 7. y = 2
b1
y:
8. Imprimir ln (a) = y: 9. Fin. Ejemplos 1. Calculemos ln (2) : Para el efecto, aplicamos el algoritmo descrito. Ponemos a = 2; b1 = 1 b = b21 = : Entonces 9 ln (2) ' '19 (2) =
2 3
1+b
1 +b 3
1 + 5
+b
1 b + 37 39
a 1 1 = ; a+1 3
= 0;6931471806:
174
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES. En una calculadora de bolsillo, ln (2) = 0;6931471806:
2. Calculemos ln (535;2) : Tenemos
535;2 535;2 ' 1;326628165 2 [1; e] ; luego 535;2 = e6 6 ; de donde 6 e e
ln (535;2) = 6 + ln Sea a = 1;326628165 entonces b1 = '11 (a) = 2b1 1 + b
535;2 = 6 + ln 1;326628165: e6
a 1 = 0;1403869213; b = b21 = 0;01970848767; luego a+1
1 +b 3
1 + 5
1 b + 21 23
+b
= 0;2826405088:
En consecuencia ln (535;2) = 6 + 0;2826405088 = 6;2826405088: En una calculadora de bolsillo, ln (535;2) = 6;282640509: 3. Apliquemos el algoritmo y los resultados precedentes para calcular ln (0;01234) : Sea n 2 Z+ tal que 0;01234 en 2 [1; e] : Para n = 5 se tiene x = 0;01234 e5 ' 1;831418383 2 [1; e] : Luego a = 0;01234 = e
5
e5 ' e
0;01234
5
1;831419383;
x 1 = 0;2936402433; x+1 b = b21 = 0;08622459249: Aplicando el algoritmo obtenemos ln(x) = 0;6050907394; con lo que y ln (0;01234) =
5 + ln(1;83141838): Tenemos x = 1;831418383; b1 =
ln (0;01234) =
5 + 0;605090739 =
En una calculadora de bolsillo ln (0;01234) =
3.8.
4;394909261:
4;394909261:
Integración de funciones de clase C 1 (R)
Se denota con C 1 (R) al espacio vectorial de las funciones reales que poseen derivadas de todos los órdenes 1 X 1 ak xk continuas en todo R. Supongamos que f 2 C (R) se representa mediante una serie de potencias k=0 Z a y se desea calcular I(f ) = f (x)dx; con a > 0: 0
El polinomio de Taylor de f en un entorno de cero viene dado como P (x) =
m X f (k) (0) k=0
f (x) = P (x) + Em (x); donde Em (x) es el error de aproximación en x. Resulta que I(f ) =
Z
a
f (x)dx =
0
=
Z m X f (k) (0) k=0
m X f (k) (0) k+1 a + (k + 1)! k=0
Además f (x) =
1 X f (k) (0) k=0
k!
xk ,
entonces I(f ) =
k! Z a
a
k
x dx +
0
Z
a
Em (x)dx
0
Em (x)dx;
m = 1; 2; 3; : : : ; :
0
1 X f (k) (0)
k+1 : (k+1)! a
Sea
k=0
Im (f ) =
m X f (k) (0) k+1 a (k + 1)! k=0
m = 1; 2; : : : ; :
k!
xk : Entonces
3.8. INTEGRACIÓN DE FUNCIONES DE CLASE C 1 (R)
175
Cada Im (f ) es una aproximación de I(f > 0 la precisión con la que se Z a) por truncamiento. Sea aproxima Im (f ) y m 2 Z+ tal que Em (x)dx < , entonces I(f ) puede ser aproximado por 0 Z a m X f (k) (0) k+1 Im (f ) = a con una precisión > 0: La condición Em (x)dx < permite controlar (k + 1)! 0 k=0 el error de truncamiento. Ejemplos Rx 2) x 2 [0; 2 ]; pp < 3: Construyamos un 1. Sea f la función real de…nida por: f (x) = 0 sen(t tp dt algoritmo para calcular los valores aproximados de f (x) y apliquemos a f 6 para p = 1: Para 1 P 2k+1 el efecto apliquemos el desarrollo de Taylor de sen( ); tenemos sen( ) = ( 1)k (2k+1)! ; y para k=0 P k t4k+2 : Entonces ( 1) = t2 se tiene sen(t2 ) = 1 k=0 (2k+1)! ! Z x Z x 1 4k+2 X sen(t2 ) t dt f (x) = dt = t p ( 1)k tp (2k + 1)! 0 0 k=0 ! Z x 1 k t4k+2 X ( 1) = t p+2 dt + t p dt (2k + 1)! 0 k=1 Z x Z x 1 X ( 1)k t4k+2 dt: t p+2 dt + t p = (2k + 1)! 0 0 k=1
Calculemos el primer término de la última igualdad, tenemos Z x x x t p+3 = t p+2 dt = p+3 0 3 0 de donde
p+3
p
;
t4k+2 t 2 0; 2 (2k + 1)! k=0 ; podemos entonces intercambiar el símbolo de sumatoria con
p + 3 > 0 con lo cual p < 3: Por otra parte, la serie
converge uniformemente sobre 0; el de integral, se tiene
2
1
x3 p X ( 1)k f (x) = + 3 p (2k + 1)! k+1
Z
x
t4k+2
p
dt =
0
Observe que si k = 0, se debe tener 3 convergente para x > 0:
1 X k=0
1 P
( 1)k
( 1)k (2k + 1)!(4k + 3
p > 0 que implica p < 3: Si p
p)
x4k+3
p
:
3; la integral no es
La representación de la función f en serie de potencias no puede ser usada para calcular f (x) en el computador. Necesitamos aproximarle con una suma …nita: fm (x) =
m X k=0
( 1)k x4k+3 p (2k + 1)!(4k + 3 p)
h i x 2 0; : 2
6
Para = 10 se muestra que j f (x) fm (x)j < 8x 2 [0; 2 ] y m 7: Para m = 7; de…nimos f7 (x) = x3 p (p1 (x) p2 (x)) x 2 [0; 2 ] ; donde p1 (x) y p2 (x) son los polinomios obtenidos de fm con los índices pares e impares, respectivamente. Luego x8 ; 3 p 11 p 6 7 8 9 19 p 10 11 12 13(27 p) x8 1 x8 4 8 p2 (x) = x3! 7 1 p + 4 5x 6 7 151 p + + : 8 9 10 11 23 p 12 13 14 15(31 p) p Apliquemos este algoritmo para aproximar f 6 para p = 1: Primeramente, notemos que para p = 1; Z x Z x sen t2 1 f (x) = dt = t sen t2 dt = (1 cos x2 ): 1 t 2 0 0 p1 (x) =
1
+
x8 5!
1
+
x8
1
+
176
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES. En consecuencia: f
r
=
6
1 1 2
cos
' 0;0669873:
6
p Apliquemos el algoritmo. Tomemos en consideración que x = 6 ' 0;7236012; luego r r p1 ' 0;2500522; p2 ' 0;00571183; 6 6 entonces f7
3.9.
r
6
=
r
r
4
p1
6
p2
6
r
' 0;0669873:
6
Función error
De…nición 7 La función error se nota err y se de…ne como sigue: 8 < [0; 1[ ! R 2 Rx err : x 7 ! err (x) = p 0 e :
t2 dt:
Rx 2 0; no puede calcularse con funciones elementales por lo que se Se sabe que la integral 0 e t dt x debe recurrir a la aproximación numérica de la misma. p Por otro lado se demuestra (véase en el siguiente R 1 t2 capítulo la función gama de Euler) que 0 e dt = con lo que 2 err (x)
! 1:
x!1
Además, se prueba que la función real u de…nida como x p 2 at
u (x; t) = err donde a > 0 constante, x
2 =p
Z
x p 2 at e
v2
dv;
0
0; t > 0; es solución de la ecuación en derivadas parciales del tipo parabólico:
@u @2u (x; t) a 2 (x; t) = 0 x > 0; t > 0: @t @x Esta ecuación aparece en los problemas de transferencia de calor tales como los de conducción inestable; en mecánica de ‡uidos en los problemas de capa límite térmica, la ecuación de Navier-Stokes para corrientes laminares no estacionarias donde la presión es constante en todo el campo; en los problemas de difusión de contaminantes en el aire así como en los problemas de …ltración de contaminantes en el suelo. Es por esto que dedicamos esta sección a la aproximación numérica de la función error. Sea " > 0: Con …nes prácticos elegimos " = 10 10 : Determinemos r > 0 tal que Z 1 Z x 2 2 2 t2 p e dt p e t dt < " si x > r; 0
es decir
0
2 p
Z
1
e
t2
dt < " si x > r:
x
Apliquemos el criterio de comparación para integrales impropias (este criterio es muy similar al de R 1 dt 2 comparación de series numéricas). Sea f (t) = p exp t2 t 0: Puesto que 1 2 = 1; elegimos t 1 f (t) t 1: Tenemos, g (t) = 2 t 1; y de…nimos h (t) = t g (t) h (t) =
f (t) 2 = p t2 exp g (t)
t2
! 0;
t!1
3.9. FUNCIÓN ERROR
177
f (t) < " si t g (t) Z 1 Z f (f ) dt < "
luego, existe r > 0 tal que
x
De la condición h (t) = 2 p
1
g (t) dt
"
x
10
6;
Z
1
g (t) dt = " si x
t2 < " = 10
10
determinemos r > 1: Para t = 4 se tiene
2 para t = 5; se tiene p
(5;5)2 exp ( 30;25) ' 2;49
2 R1 Elegimos r = 5;5: Tenemos p x e
r:
1
f (t) 2 = p t2 exp g (t)
16 exp ( 16) ' 2;032
2 resulta p
r y de esta desigualdad se sigue que
10 t2 dt
12
Z
2 1= p 2 Ra de donde err (a) = p 0 e
1
e
0
t2 dt
t2 dt
2 R p a1 e
=1
con una precisión " = 10
Z
2 dt = p
t2
10 ;
para t = 5;5
r = 5;5: Así, la aproximación de la función
error se reduce al intervalo [0; 5;5] : Note que para t = 6 se tiene h (6) ' 9;42 h (8) ' 1;16 10 26 ; t = 10 se tiene h (10) ' 4;2 10 42 : 2 R1 Adicionalmente, para a > 1 calculemos p a e
10
10 :
< " = 10
< " si x
25 exp ( 25) ' 3;92
a
t2
e
Z
dt +
1
t2
e
10
10 :
15 ;
t = 8 se tiene
Tenemos
dt ;
a
0
t2 dt:
Apliquemos el método de integración por partes Z
1
e
t2
Z
dt =
a
1
a
2
e 2t
=
t2
e 2t
=
2
e t 2t
=
e 2t
=
a 1
2
e t 4t3
a 1 a
t2
e + 4t3
1
a
a
2
e t dt 2t2
t2
2te dt 4t3 1 Z t2
e 4t3 +
t2
e t 2t
a
a 1
Z
1
2
2te t dt = 2t 1 Z 1 t2
+ a 1
3 4
Z
1
a 2
3e t 8t5
a
3e t dt 4t4
a
a
1
2
1
!
2
2te t dt 2t5 1 Z 2 15 x e t dt: 8 a t6 a
Continuando con este procedimiento n veces, obtenemos Z
1
2
e
t2
dt =
a
e t 2t
1 a
n
( 1)
2
e t + 2 3 2 t
1
1
1
a
3
(2n
3 e 23 t5
t2
1) e
t2
( 1)n
"n (a) =
1
2
e t t2k
1
= lm a
3
5 e 4 2 t7
a 1
+ "n (a) ; a
3
(2n + 1) 2n
Como para k = 1; 2; : : : ; n
1
+
2n t2n con
1
1
2 t!1 t2k et
Z
1
a
1 a2k ea2
=
2
e t dt: t2n
1 a2k ea2
;
t2
1
+ a
+
178
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
entonces Z 1 2 e a 2 e t dt = 2a a
1 1 3 + 2 4 2a2 2 a
1
1
3 5 + 23 a6
Estimemos j"n (a)j : Tenemos j"n (a)j = =
1
3
Z
(2n + 1) 2n
1
a
3
(2n + 1) 2n
e a De…nimos n (a) = 2a
2
1
1
2
e t dt t2n 2n+1
t
a2
e
+
( 1)n+1
2n + 1
1 1 3 + 2 4 2 2a 2 a
1
3 5 + 3 2 a6
1
1
3 5 2n a2n
3
(2n + 1) 2n
1
=
a
+
e
1)
Z
dt t2n
a2
a
1 3 2n (2n
( 1)n+1
!
(2n
1
+"n (a)
(2n + 1) : 1) a2n+1 ea2 1
3 5 2n a2n
(2n
1)
!
:
Puesto que: err (a) = 1 = 1
Z
2 p
1
e
t2
2 p [
dt = 1
a
2 p
n (a)
2 p "n (a)
n (a)
+ " (a)]
a > 1:
Determinemos un apropiado n 2 Z+ y a > 1 tal que j"n (a)j < " = 10
10 :
Lo hacemos por tanteo.
Para a = 3; tenemos 1 3 5 7 ' 1;48 10 7 ; 23 5 37 e9 1 3 5 7 9 11 ' 1;443 10 26 11 313 e9 1 3 19 ' 3;6 10 10 : 10 21 2 19 3 e9
j"3 (3)j j"6 (3)j j"10 (3)j
9
;
Como vemos, para a = 3 no se logra la precisión deseada. Elegimos a = 3;5: Entonces 1
j"6 (3;5)j
3
5 7 9 11 13 ' 7;77 11 (3;5)13 e12;25
26
10
11
:
Note qie si a = 4; 1
j"6 (4)j
5 26
10
Se prueba que j"6 (a)j < " = 10 'r siguiente:
3
para a
7 11
9 11 413 e16
13
' 3;22
10
13
:
3;5: Los resultados anteriores nos permiten de…nir la función
8 2 R 2 > p 0x e t dt; si 0 x 3;5; > > < 2 'r (x) = 1 p 6 (x) ; si 3;5 < x 6; > > > : 1; si x > 6:
Rx 2 Nos queda aproximar 0 e t dt x 2 [0; 3;5] : Para el efecto, utilizamos el desarrollo de Taylor de exp ( ) : k 1 ( 1)k 1 P P Tenemos exp ( ) = ; haciendo = t2 se obtiene exp t2 = t2k : Aplicando el teorema k! k! k=0 k=0 de la convergencia uniforme y la integración, se tiene Z
0
x
e
t2
dt =
Z
= t
1 xX
0 k=0 1 X k=0
1
X ( 1)k ( 1)k 2k t dt = k! k! k=0
k
( 1) t2k : k! (2k + 1)
Z
0
x
1 X ( 1)k t2k+1 t dt = k! (2k + 1) 2k
k=0
3.9. FUNCIÓN ERROR Sera m 2 Z+ y Sm (x) =
179 1 ( 1)k t2k P x 2 [0; 3;5] : k=0 k! (2k + 1)
Para obtener un algoritmo de cálculo de err (x) x 2 [0; 3;5] ; con la precisión …jada " = 10 determinemos m 2 Z+ el más pequeño posible tal que 1 X ( 1)k x2k k! (2k + 1)
Sm (x)
k=0
1 X
k=m+1
10 ;
x2k < ": k! (2k + 1)
Es claro que si x 2 [0; 1] se requiere menos términos que si x 2 [3; 3;5] : Por esta razón consideramos los intervalos [0; 1] ; ]1; 2] ; ]2; 3] ; ]3; 3;5] : Apliquemos el criterio de comparación. Para a 2 [0; 3;5] ; ponemos ak = bk =
1 P 1 ak 1 que como es conocido = 1: De…nimos Ck = k (k + 1) bk k=1 k (k + 1)
Ck = luego existe m 2 Z+ tal que 1 X
ak < " si k bk
k=m+1
k (k + 1) 2k a k! (2k + 1)
a2k y elegimos k! (2k + 1)
k = 1; 2; : : : ; entonces
! 0;
k!1
m; y de esta relación se obtiene
( 1)k x2k k! (2k + 1)
1 X
k=m+1
x2k < " si x k! (2k + 1)
El más pequeño m 2 Z+ (no óptimo) se obtiene de la desigualdad
a:
k (k + 1) 2k a < " = 10 k! (2k + 1)
10 :
Para a = 1; se obtiene m = 15; para a = 2 resulta m = 27; para a = 3 se tiene m = 43 y para a = 3;5 es m = 55: Con todos estos resultados, de…nimos la función ' como sigue: 8 15 ( 1)k 2x P > > p x2k ; si x 2 [0; 1] ; > > > k! (2k + 1) k=0 > > > 27 > 2x P ( 1)k > > p x2k ; si x 2 ]1; 2] ; > > > k! (2k + 1) k=0 > > > 43 < 2x P ( 1)k p x2k ; si x 2 ]2; 3] ; ' (x) = k! (2k + 1) k=0 > > > 2x P 55 > ( 1)k > > p x2k ; si x 2 ]3; 3;5] ; > > > k=0 k! (2k + 1) > > > 2x > > 1 p 6 (x) ; si x 2 ]3;5; 6] ; > > > : 1; si x > 6:
Esta función ' aproxima a la función error con una precisión " = 10 k'
errk1 = max j' (x) x2[0;1[
10 ;
tenemos
err (x)j < ";
donde k k1 denota la norma de Chebyshev (véase en el apéndice los espacios normados). m 1 Sea m 2 Z+ impar. Se pone n = : Para escribir un algoritmo simple de cálculo asociamos los 2 términos con signo positivo y aquellos con signo negativo. Tenemos m X k=0
p
X ( 1)k x4k x2k = k! (2k + 1) (2k)! (4k + 1) k=0
p X k=0
x2(2k+1) (2k + 1)! (4k + 3)
180
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
y de…nimos
1;
1 (x)
2;
3
como sigue:
=
p X k=0
= 1+ +
2 (x) =
x4k x4 x8 x12 =1+ + + + (2k)! (4k + 1) 2! 5 4! 9 6! 13 x4 2
(2p
1 1 x4 x4 + + 5 3 4 9 5 6 x4 1) (2p) (4p + 1)
1 + 9
+
(2p
+
x4 3) (2p
x4p (2p)! (4p + 1) 1
2)
4p
3
+
;
x4k+2 y se escribe en forma similar a k=0 (2k + 1)! (4k + 1) p P
1 (x) :
Finalmente,
3 (x)
= 1
2 p
= 1
e x 1 p 1+ 4 x x
6 (x) 2
3 1 + 4 4 x
105 10395 + 16 64x4
1 2x2
1+
1 x4
15 945 + 4 16x4
:
Ejemplo En la tabla siguiente se dan algunos valores aproximados de err(x) para los valores x que se indican calculados con la función ' (x) con una precisión " = 10 3 x err(x)
3.10.
0;2 0;223
0;4 0;428
0;6 0;604
0;8 0;742
1;0 0;843
1;2 0;910
1;5 0;966
2;0 : 0;995
Aproximación numérica de una integral elíptica
En esta sección consideramos la aproximación numérica de una clase de integrales elípticas, más exactamente la aproximación numérica de la integral elíptica incompleta de segunda especie que es a su vez conocida como forma de Legendre para la integral elíptica de segunda especie. Esta integral se de…ne como sigue: Z p 2 E(k) = 1 k 2 sen2 (t)dt para 0 k 1; 0
y se presenta en el cálculo de la longitud de un arco de la elipse, también aparece en la solución de algunas ecuaciones diferenciales ordinarias. El interés de la aproximación numérica de esta clase de integrales es la de proporcionar de una metodología que puede ser implementada para la aproximación numérica de otros tipos de integrales elípticas, que como se ha dicho aparecen en algunas aplicaciones. Cabe señalar que la integral elíptica incompleta de segunda especie no puede calcularse mediante funciones elementales cuando k 2]0; 1[. p La función real g de…nida sobre [0; ] [0; 1] como g(k; t) = 1 k 2 sen2 (t) t 2 [0; ]; k 2 [0; 1]; 2 2 R2 es continua, y la integral 0 g(k; t)dt es dependiente del parámetro k 2 [0; 1]. Por el teorema de la continuidad de integrales dependientes de un parámetro, resulta que la función E de…nida sobre [0; 1] R como E(k) = 02 g(k; t)dt es continua sobre [0; 1]:
Nos interesamos en el cálculo de E(k) cuando k 2]0; 1[: Para el efecto, representaremos E(k) como una serie de potencias. Primeramente utilizaremos la serie binómica y el teorema de la convergencia uniforme y la integración. La serie de potencias será utilizada para elaborar un algoritmo para aproximar E(k) con una precisión = 10 6 de modo que se adapte a la estabilidad numérica, y, …nalmente aplicaremos el algoritmo para aproximar E(0;5).
3.10. APROXIMACIÓN NUMÉRICA DE UNA INTEGRAL ELÍPTICA Para jxj < 1 y
2 Q8Z, la serie binómica está de…nida como la serie: (1
y para
181
x) = 1
x+
(
1) 2!
(
x2
1)( 3!
2)
x3 +
;
= 21 , se tiene 1
(1
x) 2
= 1 = 1
1 x+ 2 1 x 2
1 11 1 11 x2 2! 2 2 3! 2 2 1 1 2 1 1 3 x3 + x 2! 22 3! 23
3 2
x3 +
Esta serie es absolutamente convergente para todo x 2] 1; 1[; por lo que se aplica el teorema de la convergencia uniforme y la integración: Haciendo x = k 2 sen2 (t), se deduce que Z
E(k) =
2
0
Z
=
2
p
1 2 1 1 3 1 1 2 3 k 2 sen2 (t) k 2 sen2 (t) + k sen2 (t) 2 2 2! 2 3! 23 Z Z Z 1 k4 2 11 3 6 2 1 2 2 2 4 sen (t)dt sen (t)dt k sen6 (t)dt + k 2 3 2 2! 2 3! 2 0 0 0 1
0
= Sea I(j) =
R
I(j) =
2
0
k 2 sen2 (t)dt
1
2
:
sen2j (t)dt, j = 1; 2; : : :. Apliquemos el método de integración por partes. Tenemos
Z
2
2j
sen (t)dt =
0
=
dt
Z
2
sen(t) sen2j
0
cos(t) sen2j
= (2j
1)
Z
2
1
(t)j02 + (2j
(sen2j
2
(t)) (1
1)
1
Z
(t)dt
2
sen2j
0
1) [I(j
(t) cos2 (t)dt "Z
sen2 (t))dt = (2j
0
= (2j
2
2
1)
sen2j
2
Z
(t)dt
0
1)
2
#
sen2j (t)dt
0
I(j)] ;
y de este resultado obtenemos la siguiente fórmula de recursividad I(j) =
2j 1 I(j 2j
1) j = 1; 2; : : :
Utilizando esta fórmula de recursividad, se obienen los siguientes resultados: Z 2 1 1 3 1 3 I(0) = dt = ; I(1) = I(0) = ; I(2) = I(1) = 2 ; 2 2 2 2 4 2 1 22 0 5 1 3 5 1 3 5 (2j 1) I(3) = I(2) = 3 ; ; I(j) = : j 6 2 1 2 32 2 j! 2 Remplazando cada uno de estos resultados en la representación de E(k); obtenemos la serie de potencias E(k) = = =
=
1 2 k 2 2 1 2 k 1 2 22 " k2 1 2 22 2 1 X 41 2 j=1
1
1 k4 2! 22
1 3 1 1 3 2 22 2 2! 2 3! 23 1 1 3 4 1 3 1 3 5 6 k k ::: 2 2 2! 2 2 23 3! 23 3! # 1 3 2 k4 1 3 5 2 k6 ::: 2 4 3 2 3 6 5 3 2 2j 1 3 : : : (2j 1) k 5: 2 4 : : : 2j 2j 1
k6
1
3 23
5 3! 2
182
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
En conclusión, la integral elíptica incompleta de segunda especie se representa como la siguiente serie de potencias: 2 3 1 2 2j X k 1 3 : : : (2j 1) 5 k 2]0; 1[: E(k) = 41 2 2 4 : : : 2j 2j 1 j=1
Para " > 0; determinemos si es posible, el más pequeño número de términos n tal que j E(k) En (k) j< ": Para el efecto aplicamos el criterio de comparación de series. Sean aj (k) = 1 P 1 3 : : : (2j 1) 2 k 2j 1 1 , bj = : Se tiene que = 1 y para 0 < k < 1, 2 4 : : : 2j 2j 1 j(j + 1) j(j + 1) j=1 aj (k) j(j + 1) = bj 2j 1 luego, 8 > 0, 9n 2 N tal que
aj (k) < bj 1 X
2
(1
aj (k)
n X
2
k 2j
! 0;
j !1
n > 1, de donde 1 X
aj (k) =
j=1
aj (k) < :
j=n+1
Sn (k)), con n X
Sn (k) =
3 : : : (2j 1) 2 4 : : : 2j
si j
j=1
Sea En (k) =
1
1
j=2
2
3 : : : (2j 1) 2 4 : : : 2j 1 2
3 4
2
=
k2 + 22 k2 + 22
1 2
3 4
2
=
(2n 3)k 2(n 1)
2
1 2
3 4
5 6
2
1 + 3
5k 6
2
1 + 5
k4 + 3 k4
1 2n
k 2j 2j 1
3
+
k6 + 5
2n 1 k 2n
+
7k 8 2
2
1 2n
1
1
3 2 4
1 + + 7 ! !!! :::
(2n 1) 2n
2
k 2n 2n 1
:
La escritura de Sn(k) evita el cálculo directo de los coe…cientes del sumatorio así como el cálculo directo de las potencias y con esto se reduce signi…cativamente el número de operaciones elementales a realizar. Por otro lado facilita la elaboración de un algoritmo numérico, como el que se propone a continuación. Algoritmo Datos de entrada: k; n Datos de salida: En (k): 1. Poner b =
1 2n
2. j = 1; : : : ; n
1 2
m=n+1 b=
:
j
1 +b 2m 3
2m 1 k 2m
Fin de bucle j. k2 3. Sn (k) = + 4 4. En (k) =
2
(1
3k 2 8
2
Sn (k)) :
b:
2
3.11. EJERCICIOS
183
5. Imprimir En (k): 6. Fin. Apliquemos el procedimiento arriba descrito para aproximar E(0;5) con una precisión " = 10 1 efecto, ponemos k = , entonces 2 1 2
aj bj Por lo tanto, S10 1 2
S10
=
1 2
j(j + 1) 2j 1
=
1
3 2 4
1 < 10 22j
6
si j
Para el
10:
se expresa como sigue:
1 9 + 16 1024
1 + 3
2
11 24
1 + 11
2
5 12 2
13 28
1 + 5
7 16
2
1 + 7
1 + 13
15 32
2
1 + 15
Realizando estos cálculos elementales, se obtiene S10 1 2
E10
3.11.
2
(2j 1) 2j
6:
=
1 16
1
2
1 2
1 16
=
2
9 20
1 + 9 2
17 36
1 + 17
19 40
2
1 19
!!!!!!!!
:
+ 0;003284541926 y el consecuencia
0;003284541926
= 1;46746221:
Ejercicios
1. Determinar el radio de convergencia de cada una de las series que se proponen en cada item. 1 1 X X 1 xn 1 xn+1 1 1 P P P P xn xn n 2 xn : n : b) : c) : d) : e) n f ) a) (n+1)(n+2) x : n 2n n n n (n 1) n=1 n=1 n=1 n=0 g)
n=1 1 X
n=0
1 n (n!)3n x :
h)
1 P
n=0
n=0
xn
2n + 1
:
i)
1 P
xn
n=0
n!2n
:
j)
n=0
3n
n=0
1 1 X X ( 1)n x2n ( 1)n+1 n : n) m) (n+1)2n x : o) (n n=0 (2n!)(3n + 1) 1 P
nxn
1 P
1)n xn
1 P
( : n=0 (n + 1)(n + 2)(2n + 3)
:
k)
1 3n 1)(n 2)2n x :
p)
n=3
1 X
n=2
2. Determinar el radio de convergencia de las siguientes series de potencias: 1 1 x2k P P x2k+1 a) senh (x) = : b) cosh (x) = : k=0 (2k + 1)! k=0 (2k)! c) (1 + x) =
k=0
1; 2; : : : : d)
1 1
x
1 P
=
1 P
k
xk ;
2 R (serie binómica),
xk : e) ln(1 + x) =
k=0
1 ( 1)k P xk+1 : k=0 k + 1
x3 x5 x7 + + 3 5 7 Utilice d) para obtener e) y f).
f ) arctan (x) = x
( 1)n 1 2n x 2n 1
n 2n 3 (n 1) x :
1
k
=
(
1) : : : ( k!
k + 1)
k=
+
Sean m 2 Z+ y Sm (x) una suma …nita con m términos de cada serie. Escriba un algoritmo para calcular Sm (x) de modo que se adapte a la estabilidad numérica, x 2 I, donde I es el más grande subconjunto de R en el que la serie converge absolutamente. 1 1 X X 1 tk P ( 1)2k+1 t2k+1 ( 1)k t2k , sen (t) = , cos (t) = , t 2 R. Aplique (2k + 1)! (2k)! k=0 k! k=0 k=0 el teorema de la convergencia uniforme y la integración para expresar las siguientes integrales en series de potencias, x > 0.
3. Se sabe que et =
184
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES. Para cada función f que se de…ne a continuación, calcular una aproximación fe(x) de f (x) para el punto x que se precisa de modo que f (x) fe(x) < 10 5 y el número de operaciones elementales que se requiere en el cálculo de fe(x) sea el más pequeño posible (evite el cálculo directo de los factoriales y las potencias). Rx 2 a) f (x) = 0 e t dt; x = 0;2:
Rx
p sen t2 dt; x = 6 : Z x t p Rx e 1 c) f (x) = 0 cos t dt; x = : d) f (x) = ; x = 0;1: 9 t 0 Z xp Z x p 1 cos (t) t sen( t) dt; x = 0;1: f ) f (x) = dt; x = 0;3: e) f (x) = 3 t2 t2 0 0 Z x p p 3 2 g) f (x) = t(e t e t + e 5t )dt; x = 0;2: b) f (x) =
0
0
4. Aproximar, en cada caso, la integral con una precisión de 10 8 : 1 R R R1 1 P 1 22n 1 2 a) 02 cos x 4 dx: b) 0 t 3 e t dt: c) 0 sen2 t1=2 dt; sen2 ( ) = ( 1)n+1 (2n)! n=1 1 R R =2 dx dx : e) 02 : d) 0 q (1 + x4 )1=4 1 12 sen2 (x) 5. Considerar la integral I(p) =
R1 0
p dx
donde p
1+px4
2n ;
2 R.
0:
a) Utilice el binomio de Newton con exponente fraccionario para representar I(p) como una serie de potencias de p: b) Determine para que valores de p
0 la serie de potencias es absolutamente convergente.
c) Para p 0;2, determine el número más pequeño de términos que se requieren para aproximar I(p) con una precisión de 10 4 y aproxime I(0;4): 6. Utilice la serie
1
=
1 P
1 k=0 Rp permita aproximar I(p) = 0
7. Sea
k;
j j < 1, para elaborar un algoritmo numéricamente estable que
dx 1+x4
0
p
2 R+ . La función de Bessel de orden f (x) = jxj
1+
1 X
n=1
1 2;
con una precisión " = 10
10 :
se de…ne mediante la serie ( 1)n x2n 22n n!(1 + )(2 + )
(n + )
!
:
a) Estudie la convergencia de la serie. b) Elabore un algoritmo que permita aproximar f (x) con una precisión " > 0: 8. Sean a 0, p 2 Q. El binomio de Newton con exponente fraccionario se expresa mediante el siguiente desarrollo en serie de potencias: (1 + a)p = 1 + pa +
p (p 1) 2 p (p a + 2!
1) (p 3!
2)
a3 +
Aplique este desarrollo para calcular un valor aproximado fe(x) de f (x) que se de…ne en cada caso, de modo que f (x) fe(x) < 10 4 y el número de operaciones elementales para el cálculo de fe(x) sea el más pequeño posible. Z x Z x dt dt q a) f (x) = x = 0;1: b) f (x) = x = 0;5: 1 0 0 1 14 t4 3 1 + 12 t4 Z x Z x 3 2 1 4 4 c) f (x) = 1 4t dt x = 0;2: d) f (x) = 1 + 15 t3 3 dt x = 0;3: 0
0
3.11. EJERCICIOS e) f (x) = x = 0;5: g) f (x) =
Z
185
x
1+
0;5t2
1 3
dt
0
Z
x
1+
t3
1 3
dt
x
x 2 [0; 1]; x = 0;5: 0; x = 0;2:
h) f (x) =
x
1 + 12 t3
0
Z
x
1
0;2t2
1 2
dt
2 3
dt
x 2 [0; 1];
x 2 [0; 1[; x = 0;3:
0
0
9. Sea " = 10
f ) f (x) =
Z
5:
Aplique el algoritmo para la aproximación de la integral elíptica incompleta de 1 segunda especie en el punto k = y k = 0;6: 3
10. Aplique el algoritmo de cálculo de sen (x) en los siguientes casos y una preccisión " = 10
9:
20 2 : d) sen : e) sen (125) : 4 3 3 Compare con los resultados obtenidos directamente de una calculadora de bolsillo h i 11. Para x 2 0; se ha propuesto un algoritmo de cálculo de sen (x) : Elabore un algoritmo de cálculo 2 i i de sen (x) x 2 R que incluya los siguientes casos: x 2 ; ; x > y x < 0: 2 a) sen ( 15;2) :
b) sen
:
c) sen
12. Aplique el algoritmo de cálculo de exp (x) con una precisión de " = 10 a) exp (0;2) :
b) exp (2;5) :
c) exp (25;2) :
d) exp ( 0;3) :
9;
en los siguientes casos:
e) exp ( 5;2) :
Compare con los resultados obtenidos directamente de una calculadora de bolsillo. 13. Sean a > 1 y n 2 Z+ : Elabore un algoritmo de cálculo de y = an y veri…que en los siguientes casos. p a) a = 3;14159265 y n = 4: b) a = 2;71828184 y n = 9: c) a = 2 ' 1;414213562 y n = 10: i h 14. Sea f la función real de…nida como f (x) = tan(x) x 2 ; : El cálculo de f (k) (0) para 2 2 k = 0; 1; : : : ; 11 da lugar al siguiente desarrollo de Taylor. 2 2 16 5 272 7 7936 9 353792 11 x + x + x + x + x + 3! 5! 7! 9! 11! 2 17 7 62 9 1382 11 1 x + x + x + = x + x3 + x5 + 3 15 315 2835 155925
f (x) = x +
h i Para x 2 0; elabore unalgoritmo de cálculo de tan (x) usando el desarrollo precedente y calcule 10 los siguientes valores: a) tan (0;1) : b) tan : c) tan 18 10 bolsillo. Estime el error de aproximación. Calcule tan 6 de bolsillo.
y compare con los obtenidos en una calculadora de
con el polinomio de grado 11 y compare con el valor obtenido en una calculadora
15. La integral elíptica incompleta de primera especie se de…ne como F (p) =
R
2
p
1
d 1 p2 sen2 ( ) p 2 [0; 1[: Esta integral no se calcula con funciones elementales, por lo que se le representa mediante una serie de potencias. 0
a) Estudie la continuidad de la función F sobre el intervalo [0; 1[: b) Represente F (p) p 2]0; 1[, mediante serie de potencias.
c) Sea " = 10 5 : Construya un algoritmo para la aproximación de la integral elíptica incompleta de primera especie de modo que el número de operaciones elementales sea el más pequeño posible 1 y k = 0;6: y aplique dichoa algoritmo en los puntos k = 4 Rx 1 16. Se considera la función real h de…nida como h(p; x) = 0 0; x 2 [0; 1]: 1 dt; donde p (1 + p4 t4 ) 3 Estudie la función h. Utilice la serie binómica para representar la función h como una serie de potencias. Para " = 10 4 ; elabore un algoritmo para la aproximación de h(p; x) de modo el número
186
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
de operaciones elemenetales sea el más pequeño entero posible. Aplique el algoritmo para calcular valores aproximados de h(0;5; 0;2); h(0;5; 0;5); y, h(1; 0;2); h(1; 1): Rx 17. Considerar la integral I = 0 f (t)dt, x > 0, donde f es la función representada en serie de potencias que en cada caso se de…ne. Calcule In aproximación de I para el valor de x que se da de modo que jI In j < 10 4 . P P1 ( 1)k t2k+1 tk a) f (t) = 1 , x = 1. b) f (t) = , x = 2: k=0 k=0 k!(3k + 5) (k + 1)k2k P P ( 1)k tk t2k c) f (t) = 1 , x = 3: d) f (t) = 1 , x = 2: k=0 k=0 (2k)! (2k + 1)(k + 1)5k
18. En el siguiente ejercicio
a) Utilice la serie de Taylor de sen (x) ; x 2 R, para aproximar la integral I = mediante sumas …nitas con 5; 7; 9; 11 términos. b) Aplique el método de los trapecios para aproximar I con n = 5; 7; 9; 11:
R1 0
x1=2 sen(x)dx;
c) Aplique el método de Euler explícito (véase el capítulo 1) para aproximar u(1) solución de la u0 (t) = t1=2 sen(t); t 2]0; 1[; ecución diferencial con n = 5; 7; 9; 11: Compare los resultados de u(0) = 0; a), b) precedentes con c). R1 19. Proceda de manera análoga al ejercicio precedente para aproximar la integral I = 0 cos(x1=2 )dx: R1 20. Considere la integral I(p) = 0 x p ex dx; p > 1: a) Pruebe que I(p) < 1; 8p > 1:
b) Utilice la serie de Taylor de ex y elabore un algoritmo para aproximar I(p) con una precisión = 10 6 : c) Aplique el algoritmo para aproximar I(1;1); I(1;5): ¿Cuántas operaciones elementales se requieren?. 21. La solución en serie de potencias de x de la ecuación de Airy: y 00 = xy; x 2 R; viene dada por " # 1 X x3n y(x) = a0 1 + (3n)(3n 1)(3n 3)(3n 4) 3 2 n=1 " # 1 X x3n+1 +a1 x + ; (3n + 1)(3n)(3n 2)(3n 3) 4 3 n=1
donde a0 ; a1 son constantes reales.
a) Elaborar un algoritmo que permite aproximar y(x); x 2 [0; 1]:
b) Si a0 = a1 = 1, bosqueje la grá…ca de la solución y(x) en puntos igualmente espaciados (tómese por ejemplo xk = kh; con h = 0;2; k = 0; 1; : : : ; 5). 22. La ecuación diferencial de Bessel de orden es la ecuación: x2 y 00 + xy 0 + (x2 de Bessel de orden cero de primera clase se representa por J0 (x) =
1 X ( 1)m (m!)2
m=0
x 2
2m
2
)y = 0: La función
:
La función de Bessel de orden cero de segunda clase se representa por K0 (x) =
1 X ( 1)m (m!)2
m=1
1+
1 + 2
+
1 m
x 2
2m
+ (ln(x)) J0 (x):
Se demuestra que estas dos funciones son soluciones de la ecuación de Bessel. a) Elaborar un algoritmo que permita aproximar J0 (x) y K0 (x); x 2]0; 2]:
b) Bosquejar las grá…cas de J0 (x) y K0 (x); x 2]0; 2] en puntos igualmente espaciados xk = 0;2k k = 1; : : : ; 10:
3.12. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
187
23. Se prueba que la solución de la ecuación en derivadas parciales: @2u @x2
1 @u = 0 sobre ]0; T [ ]0; L[; c2 @t u(0; t) = u(L; t) = 0; 8t 2 [0; T ];
u(x; 0) =
x; si 0 < x < L2 ; x L x; si L2
L;
donde c > 0; T > 0; L > 0; x es la variable espacial, t es la variable temporal y u es la temperatura; viene dada por 1 X 2 kx u(x; t) = ak e k t sen( ) (x; t) 2 [0; T ] [0; L]; L k=1 8 > 0; si k es par, > > > 4L < ck ; si k = 1; 5; 9; : : : 2 k2 donde k = ; k = 1; 2 : : :, y ak está de…nido por ak = > L > > 4L > : , si k = 3; 7; 11; : : : 2 k2 L a) Sean m; n 2 N; h = m ; xi = ih; i = 0; 1; : : : ; m; I = Tn ; tj = Tj ; j = 0; 1; : : : ; n: Elabore un algoritmo para aproximar la solución de u(xi ; tj ); j = 0; 1; : : : ; n; i = 0; 1; : : : ; m: b) Supóngase que c = L = 1; T = 2; m = 10; n = 4. Trace las grá…cas de las soluciones aproximadas a cada instante tj con 3; 4 y 5 términos de la serie. 24. En cada uno de los items siguientes se da una función f de…nida sobre un intervalo [a; b] que se Rb indica y n 2 Z+ . Represente I (f ) = a f (x) dx como serie de potencias y aproxime dicha integral con el número de términos que se da, ¿qué precisión logra? p 2 a) f (x) = ex x 2 [0; 1], n = 5. b) f (x) = 1 + x4 x 2 [ 1; 1], n = 4. ex ln x c) f (x) = x 2 [1; 2], n = 5. d) f (x) = x 2 [1; 4], n = 5. x x
3.12.
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 3. Tom M. Apostol, Calculus, Volumen 2, Segunda Edición, Editorial Reverté, Barcelona, 1975. 4. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 5. R. M. Barbolla, M. García, J. Margalef, E. Outerelo, J. L. Pinilla. J. M. Sánchez, Introducción al Análisis Real, Editorial Alambra Universidad, Madrid, 1981. 6. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México, 2002. 7. Alan W. Bush, Perturbation Methods for Engineers and Scientists, CRC Press, Boca Raton, 1992. 8. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 9. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 10. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977.
188
CAPÍTULO 3. APROXIMACIÓN DE SERIES DE FUNCIONES. APLICACIONES.
11. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 12. C. H. Edwards, Jr., David E. Penney, Ecuaciones Diferenciales Elementales y Problemas con Condiciones en la Frontera, Tercera Edición, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1993. 13. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 14. Waltson Fulks, Cálculo Avanzado, Editorial Limusa, México, 1973. 15. Wilfred Kaplan, Donald J. Lewis, Cálculo y Algebra Lineal, Volumen I, Primera Reimpresión, Editorial Limusa, México, 1978. 16. E. J. Hinch, Perturbation Methods, Cambridge University Press, Cambridge, 1991. 17. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 18. R. Kent Nagle, Edward B. Sa¤, Arthur David Snider, Ecuaciones Diferenciales y Problemas con Valores en la Frontera, Tercera Edición, Editorial Pearson Educación, México, 2001. 19. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 20. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 21. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 22. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 23. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 24. Bhimsen K. Shivamoggi, Perturbation Methods for Di¤erential Equations, Editorial Birkh½auser, Boston, 2003. 25. Michael Spivak, Calculus, Segunda Edición, Editorial Reverté, Barcelona, 1996. 26. Ferdinand Verhulst, Methods and Applications of Singular Perturbations: Boundary Layers and Multiple Timescale Dynamics, Editorial Springer, New York, 2005.
Capítulo 4
Aproximación de algunas funciones de distribución de probabilidad. Resumen La pregunta simple que nos hacemos cuando estudiamos estadística y probabilidades es ¿cómo se elaboran las tablas de datos de algunas de las funciones de distribución estadística? Este capítulo da respuesta a esta interrogante. Se abordan las principales funciones de distribución discretas: la binomial, de Poisson y se establecen criterios basados en el condicionamiento y la estabilidad para elaborar algoritmos de cálculo de estas funciones y de otras discretas. Las principales funciones de distribución continuas como son: las del tipo gama, del tipo beta, la normal, i cuadrada, t de Student, distribución F se aproximan mediante el uso de las series de potencias, del análisis asimptótico en unos casos, y en otros, cuando es posible calcular directamente las integrales, como polinomios. En todos los casos, se aplican los criterios de condicionamiento y de estabilidad numérica. Se debe precisar que en la mayoría de textos de estadística citados en la bibliografía, es muy limitado el tratamiento de los problemas de aproximación numérica de las funciones de distribución estadística. En la mayor parte de libros de métodos perturbación se trata la función error, y fue esta función la que motivó emprender la tarea de construir métodos de aproximación de las funciones de distribución estadística mencionados así como de las funciones gama y beta de Euler. Otras funciones de distribución estadística como la log normal pueden aproximarse fácilmente siguiendo los citerios establecidos con las otras funciones.
4.1.
Introducción
El propósito fundamental de este capítulo es el de construir métodos y elaborar algoritmos de cálculo de las principales funciones de distribución en estadística para que puedan incorporarse en los programas de simulación numérica. Las funciones que tratamos son: 1. Discretas: las distribuciones binomial y de Poisson. 2. Continuas: la función gama de Euler y la distribución gama, la función beta y la distribución beta, la distribución normal, i-cuadrada, t de Student, F de Snedekor. Estas funciones de distribución estadística se presentan en muchos problemas tales como estimación de parámetros, intervalos de con…anza, pruebas de hipótesis, control de calidad, análisis de la varianza, análisis de regresión y correlación lineal y multilineal, en la teoría de colas tales como las líneas de espera, en problemas de econometría, análisis multivariante, en problemas de optimización, etc. Por otro lado, en la mayoría de textos de probabilidades y estadística, vienen tabulados valores de las funciones de distribución estadística arriba citados, que sin duda alguna, constituye de una gran ayuda, no obstante tienen la desventaja de ser muy limitados y en la automatización de la información, por lo 189
190CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. general, no se disponen a la mano. Por estas razones, es importante contar con algoritmos numéricos para elaborar programas computacionales para calcular valores de las mencionadas funciones de distribución para datos de entrada los más amplios posibles y que superen largamente a los datos proporcionados en las tablas. Los temas del análisis matemático tales como los métodos de integración por partes y sustitución, las integrales impropias, sucesiones y series numéricas, criterios de convergencia, las sucesiones y series de funciones y la convergencia uniforme e integración y particularmente las series de potencias así como su aproximación numérica tratados en el capítulo anterior, son aplicados a los tipos de funciones de distribución estadística arriba citadas. Además se aplican los resultados de condicionamiento y la estabilidad numérica tratados en el primer capítulo, lo que permite elaborar algoritmos simples de cálculo con la precisión que se desee. Por cuestiones prácticas se ha seleccionado como precisión = 10 10 y la exactitud de cálculos del orden de 10 10 ; aún cuando la metodología establecida se adapta fácilmente para > 0 arbitrario. La metodología que se implementa puede adaptarse en forma inmediata a la aproximación de otras funciones de distribución estadística tanto discretas como continuas. Al …nal del capítulo se provee de una amplia bibliografía.
4.2.
La distribución de probabilidad binomial
De…nición 1 Una variable aleatoria X tiene una distribución binomial o distribución de Bernoulli basada en n pruebas, con probabilidad de éxito p, si su función de densidad está de…nida mediante 8 0; si k 2 Z f0; 1; : : : ; ng ; < n f (k) = pk q n k ; si k = 0; 1; : : : ; n; : k
donde p 2 [0; 1] ; q 2= 1
py
n k
denota el coe…ciente binomial de…nido por
n k
=
n! : k!(n k)!
De la de…nición de los coe…cientes binomiales se deduce que n k+1
=
n k k+1
n k
;
consecuentemente f (k + 1) = con r = pq ;
n k+1
pk+1 q n
(k+1)
=
n k k+1
n k
p k n p q q
k
=
n k rf (k); k+1
p 6= 1:
Esta última relación nos permite elaborar un algoritmo para calcular F (k); con 0 Algoritmo Datos de entrada: p; k; n: Datos de salida: x; F (k): 1. q = 1 p: p 2. r = : q 3. S1 = q n : 4. S = S1 : 5. k = 0; 1; : : : ; x
1
k
n; k 2 Z:
4.2. LA DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL S1 =
191
n x rS1 x+1
S = S + S1 Fin de bucle k. 6. F (x) = S: 7. Fin. Este algoritmo presenta algunos inconvenientes por lo que debe tomarse en consideración otras alternativas en base a las propiedades de la función de distribución se se verán a continuación. Sea r =
p q
con p 6= 1: De la de…nición de la función F se establece la siguiente escritura anidada: k X
F (k) =
n j
j=0
j n j
p q
=q
n
n X
n j
j=0
= q n 1 + nr 1 +
n
1 2
r 1+
rj
n
2 3
r 1+
+
n
k k
2 1
r
1+
n
k k
1
:::
Por otro lado, para cada k = 0; 1; : : : ; n se tiene 1 = (p + q)n =
k X j=0
n j
pj q n
j
=
k X j=0
n j
pj q n
j
+
n X
j=k+1
n j
pj q n
j
;
que permite obtener una forma alternativa de cálculo de F (k) : n X
F (k) = 1
j=k+1
pk+1 q n
= 1
n j k 1
j n j
p q
=1
nX k 1 j=0
nX k 1 j=0
n j+k+1
n j+k+1
pj+k+1 q n
j k 1
rj :
Cuando k es aproximadamente n2 se utiliza la primera forma anidada de cálculo de F (k), y si n2 < k n se utiliza su forma alternativa de cálculo de F (k): Si n2 < k n, la primera forma de cálculo de F (k) n contiene más términos que la segunda lo que incrementa los costos numéricos y si 0 k 2 ; la forma n alternativa contiene más términos que la primera. Además, si n es grande, q está mal condicionado, mientras que q n k 1 es mucho mejor que q n : Para la primera forma de cálculo de F (k) se propone el algoritmo que se da a continuación. Se propone como ejercicio escribir F (k) en forma anidada así como elaborar el respectivo algoritmo numérico. Algoritmo Datos de entrada: p; k; n: Datos de salida: x; F (k): 1. q = 1 p: p 2. r = : q 3. S = 1: 4. j = 1; : : : ; k i=k+1 S =1+
j n
k i
j
rS
192CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Fin de bucle i. Fin de bucle j. 5. S = q n S: 6. Fin. n n , y < k n, se propone como ejercicio la 2 2 elaboración completa del algoritmo de cálculo de F (k) así como su respectivo programa computacional. Los resultados compárelos con los provistos en tablas de textos de estadística. Tomando en consideración las condiciones 0
4.3.
k
Distribución de Poisson
De…nición 2 Una variable aleatoria X tiene una distribución binomial o distribución de Poisson de media > 0 si su función de densidad está de…nida por k
f (k) = e
k 2 Z+ :
;
k!
La función de distribución está de…nida mediante F ( ; m) =
m X
m X
f (k) = e
k!
k=0
k=0
donde
k
; m 2 Z+ ;
> 0 es …jo.
Puesto que lm
m!1
entonces 8" > 0; 9n 2 Z+ tal que 1 X k=0
m X
k
k!
k=0
m X k=0
k
k!
=
k=m+1
Por otro lado, 1=e
n X k=0
de donde
k
k!
+
1 X
k=0
1 X
k
k!
=
1 X
k
k=n+1
k!
F ( ; n) = 1
!
k
k!
=e ,
k
k!
=e
0 para > 0 y 0 m n, determinemos una condición sobre el parámetro ; n y ". Para el efecto, apliquemos el criterio de comparación de series numéricas. k
Sean ak =
k!
, bk =
P 1 . Entonces 1 k=1 bk = 1, y k(k + 1) ak k+1 = bk (k 1)!
Luego, existe n tal que
k+1 (k 1)!
k
< " si k
k
! 0:
k!1
n: Para k su…cientemente grande, se puede considerar la
desigualdad. k
k!
< " si k
n;
4.3. DISTRIBUCIÓN DE POISSON
193
y tomando logaritmos en la misma, tenemos k X
k ln( )
k X
ln(j) < ln(") ()
j=1
ln (j)
k ln ( ) >
ln (") :
j=1
La determinación de n mediante esta última expresión resulta ser numéricamente costosa. Con el propósito de obtener una expresión práctica de cálculo del más pequeño entero positivo n que satisfaga la desigualdad precedente, utilizamos la desigualdad: k X
Z
ln (j)
k
ln (t) dt = k ln (k)
k + 1;
1
j=1
donde la integral se calcula utilizando el método de integración por partes. Entonces k ln (k)
k+1
k ln ( ) >
ln (")
y de esta desigualdad se obtiene la siguiente: k ln donde e = 2;71828182 : : : =
k e
>
1
ln(");
1 1 P es la base de los logaritmos naturales. Sea k=0 k!
n = m n k 2 Z+ j k ln
k e
>
1
ln " ;
donde > 0 y 0 < " < 1 son …jos. n m n, el cálculo de F ( ; m) se vuelve numéricamente costoso. Para disminuir el costo numérico, Si 2 utilizamos las siguiente relación: ! m n 1 k k k X X X 1=e + + k! k! k! k=0
y como e
1 P
k=n+1
1
e
n X
k=m+1
k=m+1
k=n+1
k
k!
< ", despreciando este último término, F ( ; m) se aproxima mediante
k
k!
m+1
=1
e
(m + 1)!
1+
m+2
1+
m+3
1+
+
n
1
1+
n
:
k > 22;1 : Por ejemplo para e 2 ]0; 1] es n = 14; para = 10 es n = 45 y para = 30 se tiene n = 102: Esta información nos permite de…nir la función F~ ( ; m) para las distintas alternativas como a continuación se indica: 8 k m P < e , 0 m 14; m 2 N; 0 < 1: F~ ( ; m) = k=0 k! : 1, si m > 14: 8 k m > n > e P > , si 0 m ; > > 2 < k=0 k! k n P F~ ( ; m) = n > 1 e , si < m n; > 1: > > 2 > k=m+1 k! > : 1, si m > n: Con …nes prácticos " = 10
10 ,
ln(") w 23;1, y n = m n k 2 Z+ jk ln
Se tiene que F~ ( ; m) es una aproximación de F ( ; m) con una precisión ":
194CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Para > 1 y m grande, los términos m+1 y (m + 1)! son muy grandes lo que puede causar problemas al momento de su cálculo en el computador. Par evitar etas molestias, se calcula como sigue: 0 1 m+1 m+1 X = exp @(m + 1) ln( ) ln(j)A ; (m + 1)! j=1
que mejora la estabilidad numérica. Además, para evitar el cálculo directo de los factoriales y de las potencias escribimos en forma anidada como a continuación se indica m X k=0
n X
k=m+1
k
k!
k
k!
=1+
1
1+
2
1+
+
m
1
1+
;
m
m+1
=
(m + 1)!
1+
m+2
1+
1+
m+3
+
n
1+
1
n
que mejoran la estabilidad numérica. En las aplicaciones prácticas de la distribución de Poisson tal como en la teoría de colas, el valor de está en el intervalo ]0; 30] : 10
En resumen F ( ; m) se aproxima numéricamente con una precisión " = 10 continuación 1, entonces 8 < : e 1+ 1+ F~ ( ; m) = 1 2 : 1, si m > 14:
por F~ ( ; m) de…nidos a
1. Si 0 <
1+
> 1, entonces 8 > > 1+ 1+ e 1+ > > 1 2 > > > m+1 > < 1+ 1 ~ F ( ; m) = (m + 1)! m+2 > > > n > > si < m n; > > 2 > : 1, si m > n:
+
m
1
1+
, si 0
m
m
14;
2. Si
donde n = m n k 2
k e
Z+ jk ln
+ 1+
> 22;1 ;
m
1
1+
m+3
,
m
1+
+
m+1
(m + 1)!
"
1 n
1
si 0 1+
n ; 2
m
;
n
= exp (m + 1) ln( )
m+1 P
#
ln(j) :
j=1
Ejercicio Se propone la elaboración del algoritmo respectivo de cálculo de F~ ( ; m) y su programa computacional. Compare los resultados con los proporcionados en las tablas de textos de estadística y probabilidades.
4.4.
Función gama de Euler.
De…nición 3 La función gama de Euler se de…ne como sigue: :
R+ ! R + R1 p 7 ! (p) = 0 tp
1 e t dt:
Las propiedades mas importantes de la función gama se enuncian en el siguiente teorema.
4.4. FUNCIÓN GAMA DE EULER.
195
Teorema 1 i. La integral ii.
R1 0
(1) = 1 y
tp
1 e t dt
1 2
p
=
converge para todo p 2 R+ y diverge para todo p
0:
:
iii. Para todo p 2 R+ ;
(p + 1) = p (p). En particular, si p = n 2 Z+ ;
iv. Para todo n 2 N;
n+
1 2
=
(2n
1)(2n
3)
1p
:::
2n
v. Sea p 2 R+ N. Entonces (p) = (p 1)(p 2) el mayor entero menor menor o igual que p.
(p
(n + 1) = n!:
:
n) (p
n); donde n = [p] y [p] denota
vi. La función gama es continua sobre R+ . Además, ( )
! +1
y
!0+
(p)
! +1:
p!+1
Demostración. i) Sea p 2 R+ : Entonces
Z
(p) = Ponemos I1 = Si p
R1 0
tp
1 e t dt;
1, la función t ! tp
R1
I2 =
1 e t de
1
1
t
p 1
t
e dt +
0
Z
1
tp
1
e t dt:
1
tp
1 e t dt:
[0; 1] en R es continua, con lo cual I1 existe.
Sea 0 < p < 1: Puesto que Z
1
t
p 1
dt = l m
Z
1
r!0 r
0
tp
1
se sigue que para 0 < r < 1; 0<
1 dt = l m tp r!0 p
Z
1
tp
1
r
Luego. I1 =
Z
1
t
p 1
Z
t
e dt = l m
1
r!0 r
0
En consecuencia, I1 existe para todo p 2
= r
1 l m (1 p r!0
tp
1 rp ) = ; p
e t dt < 1:
p 1
t
e dt
lme
r
r!0
R+ :
Mostremos la existencia de I2 . Puesto que
lm
t
1
Z
r
1
tp
1
1 dt = : p
R1 dx = 1; resulta 2 1 x 1e t
1 t2
t!1
= l m tp+1 e
t
t!1
= 0;
que es una consecuencia de la aplicación de la regla de L’Hópital. Por el criterio del cociente para integrales impropias, se deduce que I2 existe. Por lo tanto, (p) =
R1
tp
1 e t dt
está bien de…nida para todo p > 0:
0
Si p = 0, de la desigualdad e R1 1 1 0 t dt = ln t 0 = +1: Si p < 0, la integral I1 =
R1 0
tp
1t 1
1 e t dt
t
1e t
t
1
1 0
= +1;
8t 2]0; 1[; se sigue que I1 = +1, pués
diverge. Pués Z
0
1
dt = ln t t
196CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. por el criterio del cociente: para integrales impropias, se tiene 1 t lm t!0 tp 1 e
p +t
= l mt
t
e
t!0
= 0;
y de este resultado se obtiene la conclusión. ii) Para p = 1; se tiene
Z
(1) =
1
e t dt = 1:
0
Sea p = 21 . Mostremos primeramente que Z
2
I =
1
t2
e
R1
t2
1e
Z
dt
1
1
dt = x2
e
p
dt
: En efecto, sea I = Z
=
1
Z
1 1
1
e
(t2 +x2 )
R1
1e
t2 dt.
dtdx:
1
Sea r > 0 y B(0; r) el disco cerrado de centro 0 y radio r. Utilizando coordenadas polares: ; donde 0 ZZ
e
2 ; 0 (t2 +x2 )
dtdx =
Z
2
Z
r
e
2
d d =
0
Z
Z
2
d
0
luego I2 = l m
r!1
ZZ
(t2 +x2 )
e
r
2
e
1 e 2
d =2
0
dtdx = l m
r!1
(1
e
r
2
r
= (1 0
)= ;
B(0;r)
con lo que I =
p
:
Pasemos a probar que
t = cos ; x = sen ;
r, se tiene,
0
B(o;r)
Entonces
1 2
=
p
. Por de…nición de la función gama, se tiene 1 2
Z
=
1
1 2
t
e t dt:
0
Efectuando la sustitución t = x2 en la integral inde…nida precedente, resulta 1 2
=2
Z
1
e
x2
dx =
0
Z
1
e
x2
dx =
p
:
1
iii) Sea p 2 R+ . De la de…nición de la función gama, se tiene (p + 1) =
Z
1
tp e t dt:
0
Utilizando el método de integración por partes: u = tp ; dv = e t dt, se sigue que (p + 1) =
p
t e
t 1 0
+p
Z
1
tp
1
e t dt;
0
y mediante la aplicación de la regal de L’Hôpital para evaluar l m tp e t!1
(p + 1) = p (p): Si p = n 2 Z+ , por inducción se prueba que (n + 1) = n!:
t
= 0, se obtiene
e
r
);
4.4. FUNCIÓN GAMA DE EULER.
197
iv) Sea n 2 N: Entonces, por la propiedad iii), se deduce que n+
1 2
=
1 2
n
=
n
=
n
1 2 1 2
1 2
+1
=
n
n
3 2
+1
n
3 2
n
3 2
1 2
n
3 2
n
.. . = Por la propiedad ii),
1 2
=
p
1 2
n
1 2
1 2
:
, entonces n+
1 2
=
(2n
1)(2n
1p
3) 2n
:
v) Sea p 2 R+ 8N. Denotemos con n el mayor entero menor o igual que p, entonces p la propiedad iii) se deduce (p) =
((p
1) + 1) = (p
1) (p
1) = (p
n) (p
n):
1)(p
2) (p
n 2]0; 1[. Utilizando 2)
.. . = (p
1)(p
2)
(p
vi) La demostración de la continuidad de la función requiere de argumentos que están fuera del alcance de estas notas. (véase el Análisis Matemático de Apostol, el Cálculo Avanzado de Fulks). Para
> 0, por la propiedad iii) se tiene (1 + ) =
y por la continuidad de
!0+
4.4.1.
! +1, se sigue que (n)
n!1
De…nición de
;
se sigue que lm
Como n!
(1 + )
( ) =) ( ) =
(1 + )
( )= lm
!0+
= +1:
! +1:
n!1
(p) para p < 0 y no entero
Puesto que (p + 1) = p (p), entonces (p) =
Si
(p + 1) ; p > 0: p
1 < p < 0, entonces 0 < p + 1 < 1, por lo tanto
(p) = De…nido (p) para p 2]
(p + 1) está bien de…nido, en cuyo caso de…nimos p
(p + 1) ; 1 < p < 0: p
1; 0[, podemos de…nir (p) para p 2] (p) =
(p + 2) ; p(p + 1)
2; 1[ del modo siguiente:
198CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. pues si
2 0. Con …nes prácticos = 10 10 con lo que (p) será aproximado con 10 cifras decimales de " precisión. Para el efecto, aproximemos f (a) y g(a) con una precisión que precisaremos más adelante. 2 Aproximemos primeramente g(a): Integrando por partes k + 1 veces, obtenemos g(a) =
ap (p
1
e
a
+ (p
1)(p
2)
1)ap (p
2
e
a
+ (p
p (k+1)
k)a
1)(p e
a
2)ap
+ (p
1)
3
e
a
+
(p
+ (k + 1))
Z
a
1
tp
(k+2)
e t dt:
4.5. APROXIMACIÓN NUMÉRICA DE (P ):
199
Sean k (a)
a p 1
= e
1+
a
(a) = (p
1)(p
p
1 a
+
+
2) : : : (p
(p
(k + 1))
1)(p Z
1
tp
2) ak
(p
k)
(k+2)
e t dt:
;
a
Entonces g(a) =
k (a)
+ (a). Determinemos a y k tales que j (a)j < , luego 2 jg(a)
k (a)j
= j (a)j < : 2
Puesto que
j (a)j = j(p 0
1)(p
(k + 1))j
1
p)A
(j
j=1
e
p)ak+1
(k + 1
@
t
e dt
k! ak
! 0, la sucesión
k!1
p
k+1 Y j=1
(j
1
p)A e
a
Z
1
tp
(k+2)
dt
a
:
(k + 1)! k! = a k+1 : (k + 1)ea ak+1 e a
j (a)j ak k!
t
p (k+2)
0
a
Cuando p ! 0, se tiene
Como
1
a
k+1 Y
= @
2) : : : (p
Z
no converge a 0; más aún dicha sucesión es divergente, pero si k 2 N
es …jo, k!
! 0:
ea ak+1 a!1 Notemos que 1 k! = k a a
k k < 1 si a a
1;
en cuyo caso, de la igualdad k!
1 k! ; aea ak
=
ea ak+1 obtenemos las dos relaciones siguientes: 1 < 10 aea 1 ' 5;12 12e12 k = 12; luego j (a)j < : Así 2 Para a = 12; tenemos
7
10
jg(a) Escribamos
k (a)
k (a)
y
10
y
k! ' 10 ak
12! ' 5;37 1212
1 (a)j
<
2
10
si a
5
5;
con lo que
k! < si a 2 ea ak+1
12.
de modo que sea numéricamente estable = e
a p 1
= e
a p 1
+
a
a
(1
+
(1
1+ 1
p
1 a
1
p
+ +
+ (1
(p
p)(2 p) a2 p) +
a p)(3 p)(4 a4 p)(2 p) : : : (k p) : ak
p)(2
1)(p
2) : : : (p k) ak (1 p)(2 p)(3 p) + a3 (1 p)(2 p) : : : (k 1 ak 1
p)
+
12 y
200CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Sean es
1 (a),
2 (a)
las sumas de los términos positivos y de los negativos, respectivamente de
1 (a)
= 1+ = 1+
(1
p)(2 p) (1 p)(2 p)(3 p)(4 p) (1 p)(2 p) : : : (k + + + a2 a4 ak (3 p)(4 p) p)(2 p) 1+ a2 a2 (k 3 p)(k 2 p) (k 1 p)(k p) + 1+ ::: ; 2 a a2
(1
1+
2 (a)
1
=
p a
1
=
k (a),
+
p
(1
1+
p)(3
p)
a3
1+
a
p)(2
+
(2 (k
+
+
(1
p)(2
p)(3 p) (4 p)(5 p) 1+ 2 a a2 3 p)(k 4 p) (k 2 1+ a2
p) : : : (k ak 1
1
p)(k a2
p)
1
esto
p)
p)
:
Para k = 12, el número de términos de k (a) dentro del corchete es 13 y el número de términos positivos es 7 y de los negativos es 6, es decir que 1 (a) tiene 7 términos y 2 (a) tiene 6 términos. La escritura anidada de 1 (a) y 2 (a) asegura la estabilidad numérica y además es fácil de programar. Luego k (a)
t
Aproximemos f (a): Puesto que e Z
f (a) =
a
t
p 1
t
=
a p 1
a
( 1 (a)
2 (a)) :
1 ( 1)k tk P , se sigue que k! k=0
e dt =
0
=e
Z
a
t
p 1
0
1 X ( 1)k tk k! k=0
1 X ( 1)k k+p a : = k!(k + p)
!
dt =
Z 1 X ( 1)k a p+k t k! 0
1
dt
k=0
k=0
m ( 1)k ak+p P tales que k=0 k!(k + p) jf (a) fm (a)j < 2 : Para el efecto, aplicamos el criterio de comparación para series reales. Ponemos 1 P ak+p 1 , bk = . Entonces ak = bk = 1, y k!(k + p) k(k + 1) k=1
La última serie converge absolutamente (demuestre). Sean m 2 N y fm (a) =
ak k(k + 1)ak+p (k + 1)ak+1 = < < : bk k!(k + p) k! 2 Para a = 12, se prueba que para todo k
55 se tiene
con lo cual m = 56 y
(k + 1)ak+1 ak < es decir que < si k k! 2 bk 2
56 X ( 1)k ak+p fm (a) = : k!(k + p) k=0
Para elaborar un algoritmo numéricamente estable, escribamos fm (a) de la manera siguiente: fm (a) = ap
m X ( 1)k ak 1 = ap +a k!(k + p) p k=0
a5 + 5!
a 6(6 + p)
1 5+p
+
a 2!(2 + p) +
am 1 (m 1)!
1 1+p
+
a3 3!
a m(m + p)
a 4(4 + p) m
1 1+p
1 3+p :
+
56,
4.5. APROXIMACIÓN NUMÉRICA DE (P ): Ponemos ck =
a 2k(2k + p)
201
1 m ; k = 1; 2; : : : ; . Entonces 2k 1 + p 2 1 a3 a5 am 1 + c1 a + c2 + c3 + + c m2 p 3! 5! (m 1)! 2 2 1 a a c2 + = ap + a c1 + c3 + + p 2 3 4 5 a2 a2 c m2 1 + cm (m 4)(m 3) (m 2)(m 1) 2
fm (a) = ap
Por lo tanto (p) se aproxima mediante a (p)
donde fm (a);
1 (a); 2 (a)
a (p)
de…nido por
= fm (a) + e
a p 1
a
de…nidos precedentemente y
El algoritmo para calcular
a (p),
:
( 1 (a) +
= 10
10
0 < p < 1, con una precisión
2 (a));
para el cual m = 56; a = 12: = 10
10
es el siguiente:
Algoritmo Dato de entrada: p: Dato de salida: p;
a (p):
1. Leer p y veri…car que p 2]0; 1[: 2. Hacer m = 56; a = 12: 3. Calcular fm (a): 4. Para k = 12; calcular 5. Calcular
a (p)
1 (a)
= fm (a) + e
y
2 (a):
a ap 1 (
1 (a)
2 (a)):
6. Fin. Nota: para el cálculo de fm (a) se debe elaborar un algoritmo tipo esquema de Hörner. De manera similar 1 (a) y 2 (a) requieren de la elaboración de los respectivos algoritmos para su cálculo. Se propone como ejercicio la elaboración de algoritmos para el cálculo de fm (a), 1 (a) y 2 (a) utilizando su escritura anidada de modo que se eviten los cálculos directos de los factoriales y de las potencias. En la siguiente sección necesitaremos nuevamente la escritura anidada de fm (a); 1 (a) y 2 (a) para aproximar la función de distribución gama. De las propiedades de la función gama, de la de…nición de (p) para p 2 R Z , así como de la aproximación de (p) mediante a (p); 0 < p < 1, se presenta el siguiente algoritmo de cálculo de (p): Algoritmo Dato de entrada: p: Dato de salida: p; (p): 1. Si p 2 Z+ ;
(p) = (p
1)!: p
n Q 1 2. Si p = n + ; (p) = n (2j 2 2 j=1
3. Si 0 < p < 1;
(p) =
1):
a (p):
4. Si p > 1; n = [p]; (p) = (p
n)
n Q
(p
j):
j=1
([ ] denota la función mayor entero menor o igual que, p 2 R+
N, p
n 2]0; 1[, (p
n) '
a (p
n)):
202CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. 5. Si p < 0; p 2 = Z , (p) =
(p + n) n Q
(p + j
; 1)
j=1
(donde n = j[p]
1j, p + n 2]0; 1[, (p + n) '
a (p
+ n)):
Nota: para la elaboración de un programa computacional, el siguiente indicador indi es de utilidad: indi = 1; si p es un entero positivo. 1 indi = 2; si p es un real positivo de la forma n + ; n 2 N: 2 indi = 3; si p es un real tal que p 2]0; 1[: indi = 4; si p es un real tal que p > 1; p 2 = N: indi = 5; si p es un real negativo tal que p 2 =Z :
4.6.
Distribución de probabilidad de tipo gama
De…nición 4 Una variable aleatori X tiene una distribución del tipo gama si su función de densidad está de…nida por 8 0; si t 0; > < t f (t) = p 1 > : t p e ; si t 2 ]0; 1[ ; (p) donde p; 2 R+ y denota la función gama. La función de distribución de probabilidad del tipo gama está de…nida por F (x) =
1 p (p)
Z
x
t
tp
1
e
dt; x
0:
0
Cuando p = 1, la distribución gama coincide con la distribución exponencial: x
F (x) = 1
e
x
0:
n Para p = , n 2 Z+ y = 2, la distribución gama coincide con la distribución 2 con n grados de 2 libertad. Esta distribución se estudiará más adelante. 1 Cuando p = n 2 Z+ y = con > 0, la distribución gama se conoce con el nombre de distribución n de Erlang de parámetros (n; ). Cuando p = m + 1, m 2 N y = 1, la distribución gama se llama distribución exponencial potencial. Utilizando el cambio de variable v = F (x) =
t
1 p (p)
, se tiene
Z
x
p 1
(v )
e
0
v
dv =
1 (p)
lo que nos conduce a estudiar la función Fp de…nida por Z x 1 Fp (x) = tp 1 e t dt, x (p) 0
Z
x
vp
1
e
v
dv;
0
0;
que se conoce con el nombre de distribución gama. Aproximación de Fp (x);
x; p 2]0; 1[.
Para escribir un algoritmo de aproximación de Fp (x), consideramos los tres casos siguientes:
4.6. DISTRIBUCIÓN DE PROBABILIDAD DE TIPO GAMA
203
1. p 2 Z+ ; 2. 0 < p < 1, 3. p > 1, p 2 = Z+ : Caso 1. Si p es un entero positivo, entonces (p) = (p 1)! y de la de…nición de la función Fp (x), se sigue que Z x 1 Fp (x) = tp 1 e x dx x 0: (p 1)! 0 Para p = 1 se tiene que F1 (x) = 1 Si p > 1, integrando por partes p Fp (x) =
1 (p (p
= 1
1)! 1)(p e
x
xp
1
x,
e
x
0:
1 veces, se tiene
e
x
1) xp
(p
2) : : :
2e
1+x+
x2 + 2!
x
+ (p
2
x
e
1)(p
(p
1) (p
2) : : :
1
(p
xp 2 xp 1 + (p 2)! (p 1)!
+
2) xp
3
e
1)(p
=1
e
x
x
2) p 1 k X x k=0
k!
1
e
x
:
Así, Fp (x) = 1
e
x
p 1 k X x k=0
xk e x!1 k!
Note que, por la regla de L’Hôpital, l m
x
lm e
k!
x
0:
= 0; luego x
x!1
p 1 k X x k=0
k!
= 0;
Para " = 10 10 , determinemos una condición sobre x y p tal que Fp (x) sea calculado con una precisión ". Esta condición es xp 1 e x 10 10 , de donde x (p 1) ln(x) 10 ln(10): Para p = 1, de…nimos 1 e x ; si x 10 ln(10); 1; si x > 10 ln(10):
F (1; x) = Para p > 1, de…nimos 8 > < 1 exp F (p; x) = > : 1; si x
xk , si x k=0 k! 1) ln(x) > 10 ln(10): pP1
x + ln (p
(p
1) ln(x)
10 ln(10);
pP1 xk xk se redondee por 0. Además k=0 k! k=0 k! tiene que escribirse de forma anidada para evitar el cálculo directo de las potencias y de los factoriales..
En esta última escritura de F (p; x) se evita que el término e
x
pP1
Caso 2.- Supongamos ahora que 0 < p < 1: Recordemos que si 0 < p < 1, (p) se aproxima mediante
donde m = 56 y a = 12, fm (a),
a (p)
= fm (a) + e
1 (a)
y
2 (a)
a p 1
a
( 1 (a)
2 (a));
están de…nidos en la sección precedente.
La escritura anidada de fm (a), 1 (a) y 2 (a) serán utilizados para aproximar Fp (x) del modo siguiente: si 0 x 12; entonces Fp (x) se aproxima mediante Fm (x) =
fm (x) : a (p)
204CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Si x > 12, entonces Fp (x) se aproxima mediante fm (x) + (a) a (p)
Fm (x) = donde (t) = e t tp
1(
1 (t)
2 (t)),
(x)
;
t 2 [12; 1[:
Por otro lado, como (p) converge para todo p > 0; en particular para 0 < p < 1 se sigue que dado " > 0, existe R > 0 tal que para todo x R, se tiene Z
1
tp
1
Z
e t dt
10
tp
1
e t dt =
R1
se deduce que
tp
1 e t dt
Z
1
tp
1
e t dt < ":
x
0
0
Para " = 10
x
< 10
10
R
si R w 24: En consecuencia,
8 fm (x) > > , si 0 x 12; > > > < a (p) fm (x) + (12) (x) Fm (x) = , si 12 < x > > > a (p) > > : 1, si x > 24:
24;
Para completar el algoritmo debe tomarse en cuenta lo siguiente: para cada x 2 [0; 12], fm (x) debe calcularse con m = 56 que se obtuvo cuando x = 12, pero para 0 < x < 12 se requerirán menos términos para lograr la misma precisión. En la tabla siguiente se ilustran algunos subintervalos de [0; 12] con sus respectivos valores de m: x m
1 16
2 21
3 25
4 29
5 33
6 37
7 40
8 43
9 47
10 50
11 53
12 : 56
Para simpli…car la selección de m para x 2 [0; 12], la siguiente relación puede ser útil: j = 1; : : : ; 12; x = j; m = 16 + 4(j
Si x = j entonces m = 16 + 4 (j
1):
1) para j = 1; 2; : : : ; 12:
Caso 3.- Consideremos ahora el caso p > 1, p 2 = Z+ : Sea q = p n con n = [p] el mayor entero menor o igual que p, entonces q 2]0; 1[. Utilizando el método de integración por partes n 1 veces, tenemos
Fp (x) =
Además, (p) = (q)
1 (p)
Z
(p
1)(p
(p
j):
n Q
x
tq
0
1
0
e t dt @
n Y
j=1
2)xp
3
e
x
(p
1
j)A
(p
xp
1
e
x
1)(p
2)
j) =
1 (q)
(p
1)xp
(p
(n
2
1)xp
j=1
Sean
Fq (x) =
1 (p)
Z
0
x
t
q 1
t
e dt
n Y
j=1
(p
Z
0
x
tq
1
e
e t dt;
x
n
e
x
):
4.6. DISTRIBUCIÓN DE PROBABILIDAD DE TIPO GAMA 1 (p)
xp
p n
x
Q(x) = +x
e
1
e
n Y1 j=1
=
=
xq
x
(p
+ (p 1)xp 1
2
e
x
+ (p
205 2)xp
1)(p
x
1+
x
e
+
j)A
x x2 + + q q + 1 (q + 1)(q + 2) xn 2 xn 1 + + (q + n 2) (q + 1) (q + n 1) (q + 1) xq x x x x 1+ 1+ 1+ + e q q+1 q+2 q+n e
3
2
1+
x q+n
:
1
entonces Fp (x) = Fq (x) + Q(x), x El algoritmo para evaluar Fq (x) con q 2]0; 1[, x el algoritmo para evaluar Q(x):
0:
0, está descrito en la parte 2) precedente. Describimos
Algoritmo Datos de entrada: n; q; x: Datos de salida: Q(x): 1. b = 1: 2 k = 1; ;n 1 6 J = n k 2. 6 4 bx b=1+ q+j Fin de bucle k.
3. Q(x) =
xq e q
x
:
4. Fin. En resumen, para p > 0 y x siguiente.
0, Fp (x) se calcula (aproxima) con una precisión " = 10
Si p 2 Z+ ; Si p = 1, F (1; x) =
1 e x , si x 10 ln(10); 1, si x > 10 ln(10);
8 > < 1 exp Si p > 1, F (p; x) = > : 1; si x
xk , si x (p k=0 k! 1) ln(x) > 10 ln(10):
x + ln (p
pP1
8 fm (x) > > , si 0 x 12; > > > < a (p) fm (x) + (12) (x) Si 0 < p < 1, Fm (x) = , si 12 < x > > > a (p) > > : 1; si x > 24:
Si p > 1, p 2 = Z+ , Fp (x) = Fq (x) + Q(x):
1) ln(x)
24;
10 ln(10);
10
del modo
206CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD.
4.7.
Función beta. Aproximación de la función beta B(p; q), q > 0:
p > 0,
De…nición 5 Sean p; q 2 R+ : La función beta denotada B(p; q) se de…ne por B(p; q) =
Z
1
tp
1
t)q
(1
1
dt:
0
Algunas propiedades fundamentales de la función beta se proponen en el teorema siguiente. Teorema 2 i) La función beta B(p; q) está bien de…nida si p > 0; q > 0 y diverge en cualquier otro caso. Además, la función beta es continua sobre R+ R+ : ii) Para todo p; q 2 R+ ; B(p; q) = B(q; p): iii) Para todo p; q 2 R+ ; B(p; q) = 2
Z
2
sin2p
1
( ) cos2q
1
( )d ;
0
(p) (q) : (p + q)
B(p; q) = iv) Para todo r > 0; B B
r+1 1 ; 2 2 1 r+1 ; 2 2
En particular, si r = n 2 Z+ ; se tiene 2
Z
2
sinn ( )d = 2
0
v) Para todo p 2 ]0; 1[ ;
Z
0
2
= 2
Z
2
senr ( )d ;
2
cosr ( )d :
0
= 2
Z
0
8 1 > > <
3 : : : (n 1) ; si n es par, 2 4 ::: n 2 cosn ( )d = 2 4 : : : (n 1) > > : ; si n es impar. 1 3 ::: n
B(p; 1
p) = (p) (1
p) =
sen( p)
:
Demostración. i) Sean p; q 2 R+ . Si p 1, q B(p; q) está bien de…nida.
1, la función t 7! tp
t)q
1 (1
1
de [0; 1] en R es continua, por lo tanto
Supongamos que 0 < p < 1, 0 < q < 1. La función t ! tp 1 (1 t)q 1 de ]0; 1[ en R es discontinua en 0 y 1. R 1=2 R1 Sean I1 = 0 tp 1 (1 t)q 1 dt, I2 = 1=2 tp 1 (1 t)q 1 dt, entonces B(p; q) = I1 + I2 . Mostremos la existencia de I1 y I2 . Se tiene que Z 1 Z 1 2 2 1 p 1 q 1 I1 = t (1 t) dt tp 1 dt = p ; 2 p 0 0 Z 1 Z 1 1 I2 = tp 1 (1 t)q 1 dt (1 t)q 1 dt = q ; 1 1 2 q 2
2
4.7. FUNCIÓN BETA. APROXIMACIÓN DE LA FUNCIÓN BETA B(P; Q), P > 0, Q > 0: que prueba que I1 e I2 existen. En consecuencia B(p; q) está bien de…nida si p > 0, q > 0. Para probar que B(p; q) diverge en cualquier otro caso, admitamos que p I1 =
Z
1 2
t
1
t)q
(1
1
Z
dt
0
1 2
0
ii) Sean p; q 2 R+ y x = 1
q 1
1 2
1
t
Z
1
dt =
2q 1
1 2
0yq
0. Entonces
dt 1 1=2 = q 1 ln j0 = +1: t 2
0
t, t 2]0; 1[. Entonces B(p; q) =
Z
1
x)p
(1
1 q 1
x
dx = B(q; p):
0
iii) Sean p; q 2 R+ y t = sen2 ( ), Z
B(p; q) =
1
tp
1
2]0; 2 [. Entonces t)q
(1
1
Z
dt =
0
= 2
2
(sen2 ( ))p
1
(1
sen2 ( ))q
x2p
1
1
2 sen( ) cos( )d
0
Z
2
sen2p
1
( ) cos2q
1
Z
p 1
( )d :
0
Sea t = x2 ; x 2]0; 1[: Entonces (p) =
1
t
t
e dt = 2
0
(q) = 2
Z
1
x2
e
dx;
0
Z
1
x2q
1
x2
e
dx:
0
Luego (p) (q) = 4
Z
1
2p 1
x
x2
e
Z
dx
0
1
y
2q 1 y 2
e dy
=4
0
(p) (q) = 4
0
x = % cos '; % y = % sen ';
Utilizando coordenadas polares: Z
2
0
= 4
Z
Z
1
%2p
cos2p
1 2q 1
%
1
cos2p
1
(') sen2q
1
= 2
1
v p+q
1
e
v
Z
dv
e
(x2 +y 2 )
(') sen2q ! Z
1
2
(') %
1
%2(p+q)
%d%d' 1
e
%2
2
cos2p
1
(') sen2q
1
(')d'
d%
!
(p + q)B(p; q):
r+1 1 ; 2 2
=2
Z
2
r+1 2 ,
2( r+1 1 2 )
sen
q = 21 , se tiene
( ) cos
2( 21 ) 1
( )d = 2
0
B Z
0
2
r
Z
0
Además
de donde
y
0
iv) Sea r > 0. Por la propiedad iii), haciendo p = B
1 2q 1
0
0
=
x2p
0
(')d'
0
Z
1Z 1
0; ' 2]0; 2 [, se deduce que
0
2
Z
r+1 1 ; 2 2
sen ( )d =
= r+1 2
2
r+1 2 r+2 2 1 2
r+2 2
=
1 2
p 2
; r+1 2 r+2 2
:
2
senr ( )d ;
dxdy:
207
208CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Si r = n 2 Z+ , utilizando las propiedades de la función gama se obtiene la conclusión. R =2 R =2 Mediante la sustitución = ', ' 2 [0; =2] se obtiene 0 senr ( )d = 0 cosr ( )d . 2 R =2 p 1 Note que B( 12 ; 12 ) = 2 12 y B 12 ; 12 = 2 0 d = . Luego : 2 = v) Sea p 2]0; 1[. Entonces, para todo n 2 Z+ , se tiene Z
B(p; n + 1) =
1
tp
1
(1
t)n dt =
(p) (n + 1) : (n + p + 1)
dx 1 = p n n
Z
0
x n
Por otro lado, si t =
entonces
B(p; n + 1) =
Z
n
x n
0
Luego
Z
n
xp
p 1
1
1
0
x n
1
x n
n
n
dx =
n
xp
1
xp
1
e
x
dx =
0
= con lo cual l m
n!1
El límite
R1 0
xp
Z
1
xp
0
1
lm
n!1
1 e x dx
= lm
Rn
n!1 0
xp
1
1
x n dx n
=e
x
x n dx = l m n!1 n p n n! ; (n + p + 1)
np (p) (n + 1) = (p) l m n!1 n!1 (n + p + 1) = 1:
x n n
1
lm
np n! (n+p+1)
n
dx;
np (p) (n + 1) : (n + p + 1) n!1
Z
x n
0
Utilizando el binomio de Newton, no es difícil demostrar que l m 1 (p) =
1
1
Z
n
xp
1
x 2 R, entonces 1
0
1) : : : p (p), se sigue que
np n! n!1 (n + p)(n + p 1)
1= lm de donde
np n! n!1 (n + p)(n + p
(p) = l m
p (p)
1) : : : p
;
;
que es la de…nición de Gauss de la función gama. Por otra parte, (1
p) = l m
n!1
(n + 1
n1 p n! p)(n p) : : : (1
p)
;
luego (p) (p
1) =
n(n!)2 p2 )((n 1)2
lm
(n + 1 p)(n2 n = lm lm n!1 n + 1 p n!1 p(1 = =
n!1
p(1
1
lm
n!1
p
n Q
j=1
p2 22
p2 ) 1
1
p2 j2
:
p2 )
(1
p2 )p
(1
p2 n2
1 p2 22
p2 ) 1
1
lm
n!1
n
dx
es consecuencia del teorema de convergencia de
Tannery para integrales de Riemann (véase el Análisis de Apostol, página 365). Como (n + p + 1) = (n + p)(n + p
x n
1
p2 n2
4.7. FUNCIÓN BETA. APROXIMACIÓN DE LA FUNCIÓN BETA B(P; Q), P > 0, Q > 0:
209
La función f de…nida por f (x) = sen( x) x 2 R se anula en x = k 2 Z, es decir que el conjunto de todas las raíces de la ecuación f (x) = 0 es Z. La función real g de…nida por g(x) = x
1 Y
x j
1
j=1
x j
1+
=x
1 Y
x2 i2
1
j=1
x 2 R;
es tal que g(x) = 0 si y solo si x = j 2 Z; esto es, las funciones f y g tienen el mismo conjunto de ceros. Con estos argumentos se demuestra que 1 Y
sen( x) = x
x2 j2
1
j=1
;
que es la representación factorial de Weierstrass de sen( x): Por lo tanto (p) (p
1
1) = l m
n!1
n Q
p
=
p2 j2
1
j=1
sen( p)
:
Aproximación de la función beta B(p; q), p > 0, q > 0 Sean p; q 2 R+ : 1. Si p; q 2 Z+ , de las propiedades establecidas para las funciones gama y beta, se tiene (p 1)!(q 1)! (p) (q) = : (p + q) (p + q 1)!
B(p; q) =
2. Si p; q son tales que p + q = 1, de la propiedad v) de la función beta, obtenemos B(p; 1
p) = (p) (1
p) =
sen( p)
3. Si 0 < p < 1, 0 < q < 1, y p + q 6= 1, entonces B(p; q) =
Z
1
tp
1
t)q
(1
1
dt =
0
Sea x = 1
t
t2
1 2; 1
Z
1 2
tp
1
t)q
(1
1
dt +
0
:
Z
1
tp
1
(1
t)q
1
dt:
1 2
, resulta que Z
1
t
p 1
(1
q 1
t)
dt =
1 2
consecuentemente B(p; q) =
Z
1 2
xq
1
(1
x)p
1
dx;
0
Z
1 2
t
p 1
(1
q 1
t)
dt +
0
Z
1 2
tq
1
(1
t)p
1
dt:
0
Sea g(t) = (1 t) 1 , donde 0 < < 1, t 2] de Taylor en un entorno de cero. Tenemos
1; 1[. Representemos la función g mediante una serie
g(0) = 1; g 0 (0) = 1 00
;
g (0) = (1 )(2 ) .. . k Y (k) g (0) = (j ), 8k 2 Z+ : j=1
210CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Entonces
1 X g (k) (0)
g(t) = 1 +
k
t =1+
k!
k=1
1 X (1
)(2
) k!
k=1
(k
)
tk :
Esta serie es absolutamente convergente para todo t 2] 1; 1[ y converge uniformemente sobre todo conjunto [ a; a], 0 < a < 1 (demuestre!). Sean Z 1=2 A1 (p; q) = tp 1 (1 t)q 1 dt; 0
Z
A2 (p; q) =
1=2
tq
1
t)p
(1
1
dt;
0
es decir que B(p; q) = A1 (p; q) + A2 (p; q): Para
= q, obtenemos Z 1=2 A1 (p; q) = tp
1
t)q
(1
1
dt =
0
=
Z
1=2
t
= =
p 1
dt +
=
1 X (1
q)(2
k=1
1=2
+ 0
1 + p2p 1 2p
1=2
tp
1
1 X (1
1+
0
0
tp p
Z
1 X (1
k=1 1 X
(1
k=1
q)(2
1
q) : : : (k k!
q)
Z
1=2
tp+k
1
p)
!
tk
!
dt
dt
1=2 0
q)
q)
!
:
De manera similar obtenemos 1 A2 (p; q) = q 2
q)
0
q) tp+k p+k
q) : : : (k k!
q)(2 q) : : : (k k!(k + p)2k
k=1
q) : : : (k k!
k=1
q)(2 q) : : : (k k!(k + p)2p+k
1 X (1 + p
q)(2
1
1 X (1 + q k=1
p)(2 p) : : : (k k!(k + q)2k
:
Para construir un algoritmo bien condicionado y numéricamente estable, aproximemos A1 (p; q) y A2 (p; q) mediante sumas …nitas con m + 1 términos 1 (p; q) y 2 (p; q) respectivamente tales que si " > 0; jA1 (p; q)
1 (p; q)j
<
jA2 (p; q)
2 (p; q)j
<
Sea 1 1 (p; q) = p 2
m
1 X (1 + p k=1
10 :Apliquemos
Con …nes prácticos " = 10 1 P 1 Como k(k+1) = 1, entonces si
" ; 2 " : 2
q)(2 q) (k k!(k + p)2k
q)
!
:
el criterio del cociente.
k=1
ak =
(1
q)(2 q) (k k!(k + p)2k
(1
q)(2
q)
;
bk =
1 ; k(k + 1)
se sigue que ak bk
= =
q) (k q)k(k + 1) k!k(k + 1) < k!(k + p)2k k!k2k
1 k+1 < 10 k 2 2
10
si k
41:
4.7. FUNCIÓN BETA. APROXIMACIÓN DE LA FUNCIÓN BETA B(P; Q), P > 0, Q > 0:
211
Si escogemos m = 41, tenemos 41
1 X (1 + p
1 1 (p; q) = p 2
q)(2 q) (k k!(k + p)2k
k=1
q)
!
;
que en forma anidada se escribe 1 (p; q)
1 1 1 1 q + + p 2 p 2 1+p 1 40 q + 40 2 40 + p 40
=
2 2
1 3 + 2+p 3
q 2
1 + 3+p
q 2
41 q 2 (41 + p)
Cambiando p por q, se obtiene una escritura anidada de
+
:
2 (p; q):
Se propone como ejercicio elaborar un algoritmo que permita calcular
1 (p; q)
y
2 (p; q):
Finalmente B(p; q) se aproxima mediante 1 (p; q) + 2 (p; q) con una precisión " = 10 10 : (p) (q) Nota: Puesto que B(p; q) = . Si para aproximar B(p; q) se utiliza el algoritmo para (p + q) aproximar (p); (q) y (p+q), resulta que este es numéricamente más costoso que la aproximación mediante 1 (p; q) + 2 (p; q). Además este último es muy simple de programar. 4. Supongamos que al menos uno de los dos parámetros p; q es mayor o igual que 1, además p; q 2 = Z+ . Sean m = [p], n = [q] donde [ ] denota la función mayor entero menor o igual que y r = m + n, entonces p m, q n 2]0; 1[: Luego
((p (p) (q) = (p + q) m n Q Q (p j) (q
B(p; q) =
j=1 m+n Q
=
1)
(p n) (p m)) ((q 1) (q (p + q 1) (p + q r) (p + q
k)
(p
k=1
(p + q
i)
n) (q r)
n) (q m) ; (p + q r)
i=1
donde
p + q = (p p+q
r = (p
n) + n + (q n) + (q
m) + m = (p
n) + (q
m) + r;
m);
consecuentemente B(p
m; q
(p m) (q n) = (p + q n m)
n) =
y
B(p; q) =
m Q
(p
!
n Q
j)
j=1 m+n Q
(q
m) (q n) ; (p + q r)
k)
k=1
(p + q
(p
B(p
m; q
n);
i)
i=1
con B(p
m, q
n) que se aproxima mediante
1 (p
m; q
En resumen, 1. Si p; q 2 Z+ , B(p; q) =
(p 1)!(q 1)! : (p + q 1)!
n) +
2 (p
m; q
n) :
n))
212CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. 2. Si p; q 2 R+ tales que p + q = 1;
B(p; 1
p) =
sen( p)
:
3. Si 0 < p < 1, 0 < q < 1, tales que p + q 6= 1; entonces B(p; q) ' 4. Si p
1oq
1 y p; q 2 = Z+ , entonces ! m n Q Q (p j) (q j=1
B(p; q) '
1 (p; q)
(p + q
2 (p; q):
k)
k=1
m+n Q
+
( 1 (p
m; q
n) +
2 (p
m; q
n));
i)
i=1
y m = [p], n = [q]:
4.8.
Distribución beta.
De…nición 6 Se dice que una variable aleatoria X tiene una distribución de probabilidad beta con parámetros p y q si y solo si la función de densidad de X está de…nida mediante: 8 p 1 < t (1 p)q 1 ; t 2 [0; 1] ; f (t) = B(p; q) : 0; si t 2 R8 [0; 1] ; donde p; q 2 R+ y B(p; q) denota la función beta en p y q: La función de distribución beta está de…nida por Z x 1 F (p; q; x) = tp 1 (1 p)q B(p; q) 0
1
dt; x 2 [0; 1] :
Proposición 3 Para todo x 2 [0; 1] ; se tiene F (p; q; x) = 1 Demostración. Puesto que 1 B(p; q)
1= se sigue que para todo x 2 [0; 1], 1 =
1 B(p; q)
Z
x
t
p 1
1
1 B(p; q)
tp
1
(1
x):
t)q
1
dt;
0
q 1
(1
0
= F (p; q; x) +
Z
F (q; p; 1
t) Z
dt +
Z
1
tp
1
(1
t)q
1
dt
x
1
tp
1
(1
t)q
1
dt:
x
Utilizando el cambio de variable u = 1 F (p; q; x) = 1 = 1
t, se deduce que Z 0 1 (1 u)p 1 uq 1 ( du) B(p; q) 1 x Z 1 x 1 uq 1 (1 u)p 1 du = 1 B(q; p) 0
F (q; p; 1
x):
4.8. DISTRIBUCIÓN BETA.
213
Proposición 4 Sea p; q 2 ]0; 1[ …jos, f (x) = P1 ; P2 tales que
Rx 0
tp
t)q
1 (1
1 dt;
jf (x)
P1 j < "
si x 2 0;
jf (x)
P2 j < "
si x 2
x 2 [0; 1] ; " > 0: Existen dos funciones 1 ; 2
1 ;1 : 2
Demostración. En la sección precedente se mostró que la serie de Taylor de la función g(t) = (1 t 2 [0; x[ y 0 < < 1 está dada por g(t) = 1 +
1 X (1
)(2
) k!
k=1
(k
)
tk ;
la cual es uniformemente convergente sobre 0; 21 . Entonces, para x 2 0; 12 se tiene f (x) =
Z
x
t
p 1
q 1
(1
t)
dt =
=
p
x
t
p 1
1+
0
0
xp
Z
+
1 X (1 k=1
1 X (1
q)
q)
k!
k=1
q) (k q) p+k t : k! (k + p)
(k
t
k
!
Ahora bien, para todo x 2 0; 12 se tiene 1 X (1
q) (k q) p+k x k!(k + p)
k=1
La serie
1 P
k=1
1 k2k
es convergente. Sean ak =
1 , k2k
bk =
1 1 X k! 1 1 X 1 = p : k!k 2p+k 2 k2k k=1
1 k(k+1)
k+1 ak = bk 2k
Luego, existe m 2 Z+ tal que
ak bk
< " si k
k=1
entonces
1 P
k=1
1 k(k+1)
= 1, y
! 0;
k!1
m, con lo cual 1 1 1 X < ": p 2 k 2k k=m+1
De…nimos
m
xp X (1 q) (k q) k+p P1 (x) = + x p k!(k + p) k=1
entonces jf (x)
P1 (x)j =
1 X (1
k=m+1
q) (k q) k+p x k! (k + p)
si x 2 0;
1 1 X 1 < ": 2p k 2k
Aplicando la proposición precedente, de…nimos P2 (x) = 1
P1 (x), si x 2
1 ;1 , 2
entonces jf (x)
P2 (x)j < ",
8x 2
1 , 2
1 ;1 : 2
k=m+1
dt
t)
1,
214CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. 1. Sean p; q 2 ]0; 1[ : En el caso en que p; q 2 ]0; 1[, la proposición precedente es utilizada para construir un algoritmo numéricamente estable. De…nimos ! m xp 1 X (1 q) (k q) k 1 P1 (p; q; x) = + x x 2 0; ; B(p; q) p k! (k + p) 2 k=1
donde m es tal que jf (x)
P1 (x)j < " si x 2 0; 12 , y P1 (x) de…nida en la proposición precedente P2 (p; q; x) = 1
P1 (q; p; 1
1 ;1 : 2
x), x 2
Sea x 2 0; 12 . A medida que x se aproxima a 12 , P1 (x) requiere de un número mayor de términos para alcanzar la precisión requerida. Sea " = 10 10 y dividamos al intervalo 0; 12 en cinco subintervalos de igual longitud [xj 1 ; xj ], donde xj = 0;1j, j = 1; 2; 3; 4; 5: Entonces mj = 12 + 7(j es tal que
1 P
k=mj +1
xkj k
< ", j = 1;
1), j = 1;
; 5:
5:
Como es habitual, P1 (p; q; x) se escribe en forma anidada. Se propone como ejercicio la elaboración de un algoritmo para calcular P1 (p; q; x) y P2 (p; q; x). El algoritmo para el cálculo de B(p; q) está descrito en la sección precedente. 2. Sean p; q 2 ]1; 1] : Sean k = [q] 1 y r = q (k + 1) 2 [0; 1[, donde [ ] denota la función mayor entero menor o igual que. Integrando por partes k veces, tenemos Z Z x q 1 x p tp (1 t)q 1 jx0 + t (1 t)q 2 dt tp 1 (1 t)q 1 dt = p p 0 0 Z (q 1) xp+1 q 2 x p+1 xp q 1 q 2 (1 x) + (1 x) + t (1 t)q 3 dt = p p p+1 p+1 0 xp (q 1) p+1 (q 1)(q 2) p+2 = (1 x)q 1 + x (1 x)q 2 + x (1 x)q 3 p p(p + 1) p(p + 1)(p + 2) (q 1)(q 2) (q (k 1)) p+k 1 + + x (1 x)q k p(p + 1)(p + 2) (p + k 1) Z (q 1)(q 2) (q k) x p+k 1 + t (1 t)q (k+1) dt: p(p + 1) (p + k 1) 0 Identi…camos dos casos: q = k + 1 2 Z+ , p > 1; y, q > 1; q 2 = Z+ , p > 1:
Consideremos el primer caso: q = k + 1 2 Z+ , p > 1. Entonces Z x q 1 p+1 (q 1)(q 2) p+2 xp tp+1 (1 t)q 1 dt = (1 x)q 1 + x (1 x)q 2 + x (1 p p(p + 1) p(p + 1)(p + 2) 0 (q 1)(q 2) (q (k 1)) p+k 1 + + x (1 x)q k p(p + 1) (p + k 1) (q 1)(q 2) (q k) xp+k + : p(p + 1)) (p + k 1) p + k
Por otro lado, B(p; q) =
(p) (k + 1) k! (p) = (p + k + 1) (p + k)(p + k 1)
p (p)
=
k! (p + k)(p + k
1)
p
:
x)q
3
4.8. DISTRIBUCIÓN BETA.
215
Luego 1 B(p; q)
F (p; q; x) =
Z
x
tp
1
t)q
(1
1
dt
0
p + k p+k 1 (p + k)(p + k 1) p+k 2 x (1 x) + x (1 x)2 + 1! 2! (p + 1)(p + 2) (p + k) p x (1 x)k k! (p + k) p+k 1 p+k 2 = xp+k 1 + y 1+ y 1+ y 1+ + 1 2 3 p+1 p+2 y 1+ y ; k 1 k
= xp+k +
donde y =
1 x x ,
+
x > 0:
Note que este último desarrollo es válido cualesquiera que sea p > 0 y q = k + 1 un entero mayor que 1. Para q = 2, p > 1, se tiene F (p; 2; x) = xp+1 (1 + (p + 1)y): Para q = 3, p > 1; F (p; 3; x) = xp+2 (1 + (p + 2) y(1 + donde y =
1
p+1 y)); 2
x
, 0 < x 1: x En el caso en que q > 0 y p = k + 1 un entero mayor que 1 se utiliza la relación F (p; q; x) = 1 y F (q; p; 1 por 1 x:
F (q; p; 1
x)
x) se calcula mediante el algoritmo arriba descrito a condición de cambiar p por q y x
Consideremos ahora el segundo caso: q > 1, q 2 = Z+ : De…nimos xp p
P3 (p; q; x) =
+ xp (1 p
=
q 1 x (q 1)(q 2) x2 (1 x)q 1 + (1 p+11 x (p + 1)(p + 2) (1 x)2 xk 1 (q 1)(q 2) (q k + 1) + (1 x)q 1 (p + 1)(p + 2) (p + k 1) (1 x)k 1
(1
x)q
x)q
1
1
(q 1)(q 2) (p + 1)(p + 2)
x 1 x,
q 1 x (q 1)(q 2) + p + 1 1 x (p + 1)(p + 2) ! k 1 (q k + 1) x (p + k 1) 1 x
0
2
x
1+
xp q 2 q 1 (1 x)q 1 1 + y 1+ y 1+ p p+1 p+2 q k+2 q k+1 y 1+ y ; p+k 2 p+k 1
=
donde y =
+
1
x
+
+
x < 1, y:
(q 1)(q P4 (p; q; x) = p(p + 1) entonces F (p; q; x) =
2) (q k) (p + k 1)
Z
x
tp+k
1
(1
t)q
0
1 (P3 (p; q; x) + P4 (p; q; x)) : B(p; q)
(k+1)
dt;
+
x)q
1
216CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Rx Para x 2 0; 12 , la integral 0 tp+k 1 (1 i) y si x 2 12 ; 1 se utiliza la relación F (p; q; x) = 1
F (p; q; 1
y a continuación P4 (q; p; 1
t)q
(k+1) dt
se calcula utilizando el algoritmo descrito en
1 (P3 (q; p; 1 B(p; q)
x) = 1
x) + P4 (q; p; 1
x)) ;
x) se calcula en la parte precedente.
3. Finalmente, si p = 1 tenemos F (1; q; x) = 1
x)q , x 2 [0; 1] :
(1
Si q = 1; F (p; 1; x) = xp , x 2 [0; 1]: Se propone como ejercicio la elaboración de un algoritmo completo que permite calcular (aproximar) valores de la distribución beta para p > 0; q > 0 y x 2 [0; 1]:
4.9.
Distribución normal.
De…nición 7 Una variable aleatoria X tiene una distribución de probabilidad normal de media y varianza > 0 si su función densidad está dada por f (t) = p
1 2
2
La función de distribución está de…nida por Z x 1 N ( ; ; x) = f (t)dt = p 2 1 Utilizando el cambio de variable z =
t
)2
(t
exp
2
Z
t 2 R.
2
2
2R
x
)2
(t
exp
2
1
2
dt x 2 R.
, se tiene
N( ; ;
x
1 )= p 2
Z
x
e
t2 2
dt:
1
En lo que sigue consideraremos la función ' de…nida por Z x t2 1 '(x) = p e 2 dt 2 1
x 2 R:
que corresponde a N (0; 1; x): p R1 R1 p t2 2 Se probó que 1 e t dt = y utilizando el cambio de variable t = 2x se prueba que 1 e 2 dt = p t2 2 . Por otro lado, si f (t) = e 2 t 2 R, se tiene que f ( t) = f (t) 8t 2 R, es decir que f es una función par. En consecuencia Z x t2 1 '(x) = 0;5 + p e 2 dt: 2 0 Utilizando la serie de potencias de e : e =
1 X k=0
k
k!
2 R,
que converge absolutamente para todo 2 R y es uniformemente convergente sobre todo intervalo cerrado 2 y acotado de R y haciendo = t2 , tenemos e
t2 2
=
1 X ( 1)k t2k , k! 2k k=0
4.9. DISTRIBUCIÓN NORMAL.
217
luego 1 '(x) = 0;5 + p 2 1 = 0;5 + p 2
Z
1 X ( 1)k 2k t k! 2k
x
0
k=0
1 X k=0
1)k
(
k! 2k (2k + 1)
!
Zx 1 1 X ( 1)k dt = 0;5 + p t2k dt k k! 2 2 k=0 0
x2k+1 :
La última serie de potencias es absolutamente convergente para todo x 2 R: Para aproximar '(x) mediante una suma …nita, se debe tomar en cuenta que el número de términos depende de x. Más adelante volveremos a tratar esta serie. Sea " > 0. Con el propósito de elaborar un algoritmo numéricamente estable y económico, determinemos r > 1 tal que Z 1 Z x t2 t2 1 1 2 p e e 2 dt < " si x r; dt p 2 0 2 0 es decir que Z 1 t2 1 p e 2 dt < " si x r: 2 x R1 Apliquemos el criterio de comparación para integrales impropias. Como 1 dt = 1 y haciendo g(t) = t12 , t2 se tiene t2 f (t) =p ! 0; t2 g(t) 2 e 2 t!1 luego, existe r > 1 tal que t2 p Para " = 10
10 ,
< " si t
t2
esta última desigualdad se veri…ca para r = 8, es decir que f (t) < 10 g(t)
en consecuencia
Para todo a; x 2 ] 8; 8[, tenemos 1 '(x) = 0;5 + p 2 Además, para todo x 2 ] 8; 8[, Z 8 Z x t2 1 1= p e e 2 dt + 2 x 1 p1 2
R1
e
Z
1 p 2
De…nimos
y como
r:
2 e2
t2 2
dt < 10
10 ,
1
10
t2 2
e
si t
8;
dt < 10
10
:
8
8 8; < 0, si x '(x), si 8 < x < 8; 'r (x) = : 1, si x 8: Z
a
e
t2 2
Z
dt +
dt +
t2 2
e
dt
a
0
t2 2
x
Z
1
t2 2
e
dt
8
1 = '(a) + p 2
1 ' '(x) + p 2
Z
8
e
x
despreciando este último término, resulta que
8
1 1 = 'r (x) + p 2
de donde 'r (x) = 1
1 p 2
Z
x
8
e
Z
8
e
t2 2
dt;
x
t2 2
dt
si x 2 ] 8; 8[ .
Z
x
e
t2 2
dt:
a
t2 2
1 dt + p 2
Z
8
1
e
t2 2
dt;
218CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Para calcular Tenemos Z
x
e
Rx
t2 2
e
a
t2 2 dt
=
a
10 ,
dt con una precisión " = 10
Z
x
t
a
dt =
a
Z
t
x
t2 x 2
3
t3
Z
x
Continuando con este procedimiento k veces, obtenemos Z x t2 e 2 dt = 1 (t)jxa +
t2
x
te 2 dt t3
a
a t2 2
dtA = e
t4
Z
t
1
t2 2
e
t2 x 2
e
dt =
t2
a
a
t2 2
e
a
a
@ e
t
t2 x 2
e
0
t2 x 2
e
=
t2 2
te
utilicemos el método de integración por partes.
x
1 1 + 3 t t
+3
Z
x
a
a
t2 2
e
dt:
t4
2 (x);
a
donde 1 (t)
=
t2 2
e
1+
t
1 t2
1
3 t4
2 (x)
+
k+1
= ( 1)
1
3 t6
1
5
3
+ ( 1)k+1
+
5
1
j 2 (x)j
a2 2
e
[1
3
1
3
5
(2k + 1) 2k + 1
1
<
3
5
t
(2k+2)
con lo cual
p1 2
10 .
< 10 Z 8 1 p e 2 x R8 x
e
t2 2
1 (x)
1 (x)
=
e
a2 2
1 a2k+1
1 x2k+1
a2
10
:
10 .
1 =p 2
8 1 (t)jx
+
dt se aproxima mediante
p1 2
1 (x)
1 = p ( 1 (8) 2
2 (x)
'r (x) ' 1
Escribamos
dt
En consecuencia
t2 2 dt
se aproxima mediante 1 +
x
;
t2
e 2 dt : t2k+2
(2k + 1) e 2 < " = 10 2k + 1 a2k+1
Para a = 4;7 y k = 10 se tiene j 2 (x)j < 10 1 (8)
(2k + 1)]
1)
a
=
Por otro lado,
5
Z
(2k
x
a
Entonces, para x > a > 0, tenemos la siguiente estimación:
5 t2k
Z
(2k + 1)
3
p1 2
1 (x)
1 p 2
Z
1 (x)
+
2 (x)) ;
con una precisión " = 10
8
e
10 ,
y
t2 2 dt
x
para x 2 [4;7, 8[.
en forma anidada de modo que se adapte a la estabilidad numérica. Tenemos e
t2 2
x 1+
1 x2
1+ 1
3 x4
cuyo algoritmo es el siguiente: Algoritmo Datos de entrada: x 2 [4;7, 8[ :
3
5
1+
x4 1+
5
7 x4
7
9
1+
x4 1+
9
11 x4
11
13 x4
1+
1+
13
15 x4
11
17 x4
1+
17
19 x4
;
4.9. DISTRIBUCIÓN NORMAL.
219
Datos de salida: x 2 [4;7, 8[ : 1. y = x4 : 2. b1 = 1: 3. b2 = 1: 2 j = 1; : : : ; 4 6 k=6 j 6 4. 6 b1 = 1 + (4k 4 b2 = 1 + (4k
1)(4k 3) b1 y 3)(4k 5) b2 y
Fin de bucle j.
6.
1 (x) =
e
7. Imprimir
x2 2
b2 x2
x
3b1 y
1 =
e
x2 2
x
1+
b2 x2
3b1 y
:
1 (x):
8. Fin: Por lo tanto '(x) se aproxima mediante la función (x) de…nida a continuación: 8 0; si x 8; > > > > 1 > p (x), si x 2 ] 8; 4;7[ ; > > 2 1 > > m > > 1 P ( 1)k x2k+1 > > , si x 2 [ 4;7; 0] ; < 0;5 p2 k! 2k (2k+1) k=0 (x) = m P > ( 1)k x2k+1 > > 0;5 + p12 , si x 2 ]0; 4;7] ; > k! 2k (2k+1) > > k=0 > > > > 1 + p12 1 (x), si x 2 ]4;7; 8[ ; > > > : 1; si x 8:
Queda por determinar m tal que para todo x 2 [ 4;7, 4;7] se veri…que 1 X ( 1)k x2k+1 k! 2k (2k + 1) k=0
m X ( 1)k x2k+1 < = 10 k! 2k (2k + 1)
10
:
k=0
En la siguiente tabla se muestran los valores de mj para xj = 1; 2; 3; 4; 4;7: xj mj Sean m1 =
mj 2
1
1 11
2 23
3 31
4 43
4;7 55
y
Smj
=
mJ X ( 1)k x2k+1 k! 2k (2k + 1) k=0
=
m1 X k=0
x (2k)! (4k + 1)
= S1 (x)
x2 2
2k
m1 X k=0
x (2k + 1)!(4k + 3)
x2 2
2k+1
S2 (x) x 2 [ 4;7; 4;7] :
La escritura anidada de S1 (x) y S2 (x) garantizan la estabilidad numérica. Se propone como ejercicio elaborar un algoritmo completo para calcular (x) (valores aproximados de '(x)). Así mismo, elabore un programa computacional y los resultados numéricos compare con los datos provistos en las tablas de la distribución normal proporcionados en los libros de probabilidad y estadística.
220CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD.
4.10.
Distribución i- cuadrada
De…nición 8 Una variable aleatoria X que tiene una función de distribución de probabilidad de…nida por n t 1 1 f (t) = n t > 0; n = 1; 2; 3; : : : ; t2 e 2 n 22 2 se dice que tiene una distribución i-cuadrada con n grados de libertad. La función de distribución -cuadrada está de…nida mediante F (n; x) =
Z
1 n
n 2
22
x n 2
t 2
1
t
e
dt
x
0; n = 1; 2; : : : :
0
La distribución i-cuadrada es un caso particular de la distribución tipo gama (véase la distribución tipo gama) cuando p = n1 y = 12 . Esta función es muy importante en estadística y probabilidades. Utilizando el cambio de variable t = 2u, obtenemos 1
F (n; x) = Dados n 2 Z+ y x
n 2
Z
x 2
n
u2
1
u
e
du:
0
0, para calcular o aproximar F (n; x) consideramos cuatro casos. 2
1. Si n = 1, utilizando el cambio de variable t = u2 , tenemos Z x p Z 2 1 1 t 2 t e dt = 2 F (1; x) = 1 0
2
p
La integral
Rx
e
t2 2
p
x
e
t2 2
dt:
0
dt no puede calcularse mediante funciones elementales, lo que nos conduce a
0
aproximarla numéricamente. En la sección relativa a la distribución normal se dió una técnica de aproximación de dicha integral que la escribimos inmediatamente a continaución. 8 0, si x 0; > > q > m 1 > > 2 P ( 1)k xk+ 2 > < , si x 2 ]0; 22] , k k! 2 2k 1 k=0 F~ (1; x) = q > > > 1 + 2 1 (x), si x 2 ]22; 64[ ; > > > : 1, si x 64;
donde 1
p
x
x
=
e 2 p x
1 x 1+
1+ 1
3 x2
3
5 x2
1+
1+
5
7 x2
7
5 x2
1+
9
11
1+
13
1+
x2
11 x2
1+
13
15 x2
15
17 x2
1+
17
19
;
x2
Además, 1 m1 m X X p ( 1)k xk+ 2 x2k = x k! 2k 2k + 1 (2k)! 22k (4k + 3)
k=0
k=0
x
m1 X k=0
x2k (2k + 1)!22k+1 (4k + 3)
!
;
y cada sumatorio se escribe en forma anidada, donde m1 = m+1 2 con m impar y para x 2 [xj j = 1; : : : ; 5, m y xj están dados en la siguiente tabla (x0 = 0): xj m
2 11
4 21
9 31
16 43
22 : 55
1 ; xj ],
4.10. DISTRIBUCIÓN I- CUADRADA
221
2. Si n = 2, entonces 1 (1)
F (2; x) =
Sean n > 2. Integrando por partes k veces e
F (n; x) =
x 2
n 2
n 2 n 2
n 2
x 2 n 2
1
x 2
n 2
2
e t dt = 1
e
x 2
,x
0:
0
R
x 2
n
1
t2
0
e t dt, obtenemos
1
x 2
n 2
2
k
x 2
n 2
(k+1)
n 2
2
n 2
1
n 2
1
Z
Z
(k + 1)
n 2
x 2
n 2
n
t2
n 2
1
x 2
2
n 2
3
+
(k+2)
e t dt:
0
3. Si n = 2k + 4, x = 0; 1; 2; : : :. Entonces n 2
Z
x 2
t
n 2
(k+2)
2k + 4 2
= Z
t
e dt =
0
x 2
= (k + 1)!,
e t dt = 1
x 2
e
;
0
y reemplazando en la desarrollo precedente de F (n; k), tenemos F (2k + 4; x) = 1 = 1
e
x 2
e
x 2
x 1 (k + 1)! 2
1+
k+1 X 1 x j! 2
j
k+1
x k+1 (k + 1)! 2
+
k
+
k(k + 1) x (k + 1)! 2
k 1
:
j=0
Así, si n = 2k + 4, k = 0; 1; 2; : : : ; F (2k + 4; x) = 1
e
k+1 X 1 x j! 2
x 2
j
x
0:
j=0
Por otro lado, 1 =
Z
1 n 2
1
t
n 2
1 t
e dt =
0
1 (k + 2)
= F (2k + 4; x) + = 1
x 2
e
k+1 X 1 x j! 2
j
j=0
de donde
Z
1
t
k+1
+
Z
1 n 2 Z 1
x 2
1
e t dt +
0
Z
1
t
n 2
1
x 2
tk+1 e t dt
x 2
1 (k + 1)!
t
e dt = (k + 1)! e
Z
1
tk+1 e t dt;
x 2
x 2
x 2
Así por ejemplo
t
n 2
k+1 X 1 x j! 2
j
x
0:
j=0
Z
1
t3 e t dt = 2 e
1
1
3 X 1 4e 1 = : j! 3 j=0
4. Supongamos que n = 2k + 3, k = 0; 1; 2; : : :. Entonces n = 2
k+
3 2
=
(2k + 1)(2k 1) 2k+1
1p
;
e t dt
!
+
+
x 2
222CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. n 2
n 2
1
n 2
2
(k + 1
=
n 2
Z
x 2
n
(k+2)
t2
e t dt =
0
Z
x 2
1 2
k+
1 2
k
1 2 3 2 p
k+ p Z 1 t t 2 e dt = 2
x
1 =p ;
t2 2
dt:
n 2
2
e
0
0
Esta última integral se aproxima como en la parte 1). En consecuencia, F (2k + 3; x) =
r Z 2
p
x
e
t2 2
x 2
e
dt
n 2
0
=
x n2 2 r Z 2
3 p
n 2
+
x
e
t2 2
dt
n 2
1
1 2
1 2
x k 32 + n 2 2 r Z px r t2 2 x x e 2 dt = e 2 2 0 k+
1 2
k+
k
k
1 2
x 2
n 2
=
r
p
Zx 2 e
t2 2
r
dt
0
2k 1
3
k 2
x e 2
p 1)
(2k
+
n 2
k+
+
+
1 2
x 2
n 2
1 2
3 2
x 22 p + 2 1 1 3
x 2
+
1
23 3
x 2
1 2
!
+ !
p 5
x 2
2k+1 p (2k + 1)
3
2
x 2
+ k
Ponemos x 22 x + 1 32 1 3 5 2 x 2k + 1 3 (2k 1) 2 x x x = 1+ 1+ 1+ 1+ 3 5 7 2
(x) = 1 +
Resulta que
p Z 2
F (2k + 3; x) =
p
x
e
2
+
+
F (1; x) =
r Z 2
p
x
e
t2 2
dt
1
3
1
x 1) 2
(2k
k 1
k
+
t2 2
x 2k
1+
1
dt
r
x
0;
0
En resumen,
2k
2x
e
x 2
x 2k + 1
(x); x
:
0:
0
F (2; x) = 1 F (2k + 4; x) = 1
F (2k + 3; x) =
e
x 2
x 2
e
r Z 2
0
donde la integral
R px 0
e
t2 2
x k+1 X j=0
p
x
e
0; 1 x j! 2 t2 2
dt
j
r
x 2x
dt se aproxima como en 1).
0; k = 0; 1; 2; : : : ;
e
x 2
(x); x
2
+
k 1
1 2 n 2
2 p + k 1
1 2
k
x 2
n 2
n 2
1
(k+1)
3 2
k+
k
n 2
+
1 2 n 2
k
k
1 2
k+
+
n 2
x 2
k
1 2
x 2
1
+
x 2
k+ 12
k+
x 2
1 n 2
x 2
n 2
0
n + 2
2
1
x 2
e
n 2
x 2
0; k = 0; 1; 2; : : : ;
+
:
4.11. DISTRIBUCIÓN T DE STUDENT
4.11.
223
Distribución t de Student
De…nición 9 Una variable aleatoria T se dice que tiene una distribución de probabilidad t de Student con n grados de libertad si su función densidad está de…nida por n+1 2 f (x) = p n n 2
1 n+1 2
t2
1+
;
t
0:
n
La función de distribución t de Student está de…nida mediante: n+1 Z 2 F (n; k) = p n n 2
x
n+1 2
t2 1+ n
dt;
x 2 R.
dt 1 1 = + arctan(x), 2 1+t 2
x 2 R,
1
Cuando n = 1, tenemos 1
F (1; x) =
Z
x 1
que es conocida con el nombre de distribución de Cauchy. Sean n 2 Z+ y h(n; t) = 1 +
t2 n
n+1 2
, t 2 R. Entonces h( t) = h(t) 8t 2 R; luego
y si x < 0;
Rx
h(n; t)dt =
0
Rx
n 2
n
x
h(n; t)dt, x 2 R,
0
h(n; t)dt; se sigue que
0
F (n; x) =
Por otro lado, 1 = 0;5 + p
8 > > > > > > 0;5 > > <
!
p
> > > > > > 0;5 + > > : n+1 2
n
n 2
p
Z
F (n; x) = 1 10 ).
n+1 R x 2 si x < 0; n 0 h(n; t)dt; n 2! n+1 Rx 2 n 0 h(n; t)dt, si x > 0: n 2 x
h(n; t)dt +
p
Z
1
h(n; t)dt
x
0
de donde
Sea " > 0 (" = 10
Z
n+1 2
F (n; x) = 0;5 + p
n+1 2
n
n 2
Z
x
1
8x 2 R,
h(n; t)dt 8x 2 R.
Ponemos G(n; x) =
Z
x
0
h(n; t)dt x 2 R, n = 2; 3; : : : :
En lo que sigue, nos ocuparemos de aproximar G(n; x) con una precisión ". Para n 2 Z+ …jo, n > 1, p n+1 y n n2 se calculan con una precisión ": 2 Para obtener una relación que ligue x con n de modo que Z 1 h(n; t)dt < 10 x
10
;
224CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. aplicamosRel criterio de comparación para integrales impropias. Para el efecto, sea g(t) = 1 Entonces 1 g(t)dt = 1; y
n+1 2
t2 n
! 0;
si t
x, n > 1:
Por ejemplo para n = 11, esta última relación se veri…ca si t n = 140 obtenemos t 8: Dado n 2 Z+ con n > 1, notamos con
(
x ^n = M in t > 0 j t el término
R1 x ^n
40. Para n = 40 se tiene t
n+1 2
t2 1+ n
2
10
< 10
)
12; para
;
h(n; t)dt será despreciado, pués por el criterio del cociente se tiene Z
1
10
h(n; t)dt < 10
Z
1
x ^n
x ^n
consecuentemente F (n; x) se aproxima por 1 si x
dt t2
10
10
Z
1
dt = 10 t2
1
10
;
x ^n .
La aproximación de G(n; x) se limitará al intervalo ]0; x ^n [. Sea u = arctan( ptn ) entonces tan(u) =
pt y n
para t = x, notaremos yn (x) = arctan( pxn ). Entonces
x sen(yn (x)) tan(yn (x)) = p = ; cos(yn (x)) n de donde p
sen (yn (x)) =
x , n + x2 1=2
n n + x2
cos(yn (x)) =
:
Además Z
G(n; x) =
x
h(n; t)dt =
0
p
=
Z
p
yn (x)
n
Z
yn (x)
n sec2 (u)du
(1 +
0
cos(t) cosn
2
tan2 (u))
(t)dt
n
n+1 2
=
p
n
Z
yn (x)
cosn
1
(u)du
0
2:
0
Integrando por partes, tenemos G(n:x) =
p
n sen(yn (x)) cosn
1
(yn (x)) + (n
2)
Z
yn (x)
cosn
3
(t)(1
0
=
p
n sen(yn (x)) cosn
2
(yn (x)) + (n
2)
Z
yn (x)
cosn
3
(t)dt
0
donde G(n; k) =
p
n
(sen(yn (x)) cosn n 1
2 (y
1.
n > 1;
t!1
10 ,
< 10
t
n+1 2
t2 h(n; t) = t2 1 + g(t) n
luego existe x > 1 tal que t2 1 +
1 , t2
n (x))
n + n
2 1
Z
yn (x)
cosn
3
cos2 (t))dt
!
(n !
2)G(n; k)
n
3:
Esta fórmula recursiva será utilizada para obtener una expresión general de F (n; x) n
3:
0
(t)dt
!
4.11. DISTRIBUCIÓN T DE STUDENT
225
Para n = 2 tenemos p Z G(2; x) = 2
y2 (x)
p
cos(u)du =
2 sen(y2 (x)) =
p
0
F (2; x) = 0;5 + p
3 2
2
(1)
p
2p
2p
x ; 2 + x2
x x 1 = 0;5 + p x 2 2 2 + x2 2+x
0:
Puesto que Z
yn (x)
cos
n 3
0
sen(yn (x)) cosn (t)dt = n 3
4 (y
n (x))
n + n
Z
4 3
yn (x)
cosn
5
(t)dt;
0
entonces G(n; x) =
p
cosn
2 (y
n 2 n (x)) + n 1 (n 1)(n p Z n(n 2)(n 4) yn (x) cosn 5 (t)dt: + (n 1)(n 3) 0 n sen(yn (x))
3)
cosn
4
(yn (x)) +
Continuando con este procedimiento k veces, tenemos G(n; x) =
p
n sen(yn (x))
+ (n (n1)(n2)(n3)(n4)
cosn
2 (y
n 5)
cosn
1 6
p
n(n 2)(n 4) + (n 1)(n 3)
n (x))
n 2 (n 1)(n 3)
+
(yn (x)) +
+
(n 2k) (n 2k + 1)
cosn
4
(yn (x))+
(n 2)(n 4) (n 1)(n 3)
yZ n (x)
cosn
(n 2k+2) (n 2k+1)
2k 1
cosn
2k
(yn (x))
(t)dt:
0
Consideramos dos casos: n par y n impar. 1. Supongamos que n es impar; esto es, n = 2k + 1, k = 1; 2; 3; : : :. Entonces n Z
2k
1 = 0;
yn (x)
dt = yn (x);
0
p
n(n 2)(n 4) (n 1)(n 3)
G(n; x) =
p n p
n 2 n+1 2
(n 2k) = (n 2k + 1)
yn (x) +
p
p
n sen(yn (x))
n(2k 1)(2k 2k(2k 2) cosn
2 (y
n
(n 2)(n 4) cosn 6 (yn (x)) + (n 1)(n 3)(n 5) (n 2)(n 4) (n 2k + 2) cosn (n 1)(n 3) (n 2k + 1)
+
3)
n (x))
1
1 2
+
p n =p
n 2 (n 1)(n
3)
n 2 n+1 2
cosn
4
;
(yn (x))+
+ 2k
(yn (x))
Para n = 2k + 1, se tiene la siguiente expresión para el cálculo de F (2k + 1; x) k = 1; 2; : : : : F (2k + 1; x) = 0;5 +
1
x arctan( p ) + p n
n+1 2 n 2
sen(yn (x))
cosn
2 (y
n
n (x))
1
n 2 (n 2)(n 4) cosn 4 (yn (x)) + cosn 6 (yn (x)) + + (n 1)(n 3) (n 3)(n 5) (n 2)(n 4) 3 (n 2)(n 4) 1 cos3 (yn (x)) + cos(yn (x)) : (n 1)(n 3) 4 (n 1)(n 3) 2
+
226CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Reemplazando sen(yn (x)) = 2k+1 2j 2
p x , n+x2
y tomando en cuenta que
n 2j 2
=
j + 12 , j = 1; 2; : : : ; k, se tiene
=k
F (2k + 1; x) = 0;5 +
1
(n (n n . n+x2
n+1 2 n 2
x arctan( p ) + p n
n 2 + (n 1)(n
Sea z =
1=2
n n+x2
cos(yn (x)) =
2)(n 1)(n
3)
k
n n + x2
4) 3)
3 2
3 2
+
(n (n
2)(n 1)(n
1 2
k
n n + x2
+ n n + x2
(n 2)(n 4) + (n 1)(n 3)(n 5)
n n + x2
3 4
1 n+1
x p n + x2
4) 3)
5 2
k
+
+ !
1=2
n n + x2
1 2
:
Entonces
F (2k + 1; x) = 0;5 +
1
n+1 2 n 2
x arctan( p ) + p n
p
nx n + x2
zk 1 2k 1 + zk 2k 2k(2k 2)
(2k 1)(2k 3) k 3 (2k 1)(2k z + + 2k(2k 2)(2k u) 2k(2k 2) (2k 1)(2k 3) 1 + 2k(2k 2) 2 p 1 x n x 2 2 = 0;5 + arctan( p ) + 1+ z+ 2 n+x 3 3 n 2 4 2(k 2) k 2 2 4 z + 1 3 5 (2k 3) 1 3 5 +
Por ejemplo, para x
0 se tiene: z =
n , n+x2
3)
3 4
2
+
z
4 2 2 4 6 3 z + z + 5 1 3 5 7 2(k 1) k 1 z : (2k 1)
+
y
p 3 x x F (3; x) = 0;5 + arctan( p ) + ; 3 + x2 3 p 5 x 1 x 2 F (5; x) = 0;5 + arctan( p ) + 1+ z ; 2 5+x 3 5 p x 2 4 1 7 x 1+ z 1+ z ; F (7; x) = 0;5 + arctan( p ) + 2 7+x 3 5 7 p 1 x 9 x 2 4 6 F (9; x) = 0;5 + arctan( p ) + 1+ z 1+ z 1+ z 2 9 + x 3 5 7 9 así sucesivamente. 1
;
2. Supongamos que n = 2k + 2, k = 0; 1; 2; : : :. Entonces n 2k 1 = 1; Z yn (x) Z yn (x) n 2k 1 cos (t)dt = cos(t)dt = sen(yn (x)); 0
0
y como
p
n(n 2)(n 4) (n 1)(n 3)
p (n 2k) 2k(2k 2) = n (n 2k + 1) (2k + 1)(2k 1)
2 3
=
p
n
n 2 n+1 2
;
se obtiene G(n; x) =
p
n
n 2 n+1 2
sen(yn (x)) +
p
n sen(yn (x))
(n 2)(n 4) cosn 6 (yn (x)) + (n 1)(n 3)(n 5) (n 2)(n 4) (n 2k + 2) cosn (n 1)(n 3) (n 2k + 1)
cosn
2 (y
n
+
n (x))
1
+ 2k
(yn (x)) :
+
(n
n 2 1)(n
3)
cosn
4
(yn (x))
4.11. DISTRIBUCIÓN T DE STUDENT
227
Resulta que F (2k + 2; x) = 0;5 + p = 0;5 +
n+1 2 n 2
G(n; x) n+1 2 n 2
1 sen(yn (x)) + p 2
cosn
4
(n (n
2)(n 1)(n
n
n (x))
1
x F (2k + 2; x) = 0;5 + p 2 n + x2 + (2k (2k
+
(2k
k 1
n n + x2 4 3
+
2k(2k 2) (2k + 1)(2k 1)(2k
n n + x2
3)(2k 5) (k 2)! 2k
3 1
1)(2k 3) k! 2k
1
k
+
3)
n n + x2
k 2
+
+
;
1 n 3 1+ + 2 n + x2 23
5)(2k 7) (k 2)! 2k
3)
+
n n + x2
1 2k + 1
n 2 (n 1)(n
+
(n 2)(n 4) cosn 6 (yn (x)) + (n 1)(n 3)(n 5) 4) (n 2k + 2) cosn 2k (yn (x)) ; 3) (n 2k + 1)
2k (2k + 1)(2k 1) 2k(2k 2) (2k + 1)(2k 1)
n , n+x2
2 (y
(yn (x)) +
k + 32 x x p F (2k + 2; x) = 0;5 + p +p 2 (k + 1) n + x2 2 n+x
Haciendo z =
cosn
sen(yn (x))
3
2
n n + x2 1
2
n n + x2
k n n + x2 ! k n : n + x2
1
5 + 3
3 24
n n + x2
3
k 2
+
1
+
tenemos 1 x z 3 5 3 3 p z + + 1 + + 3 z2 + 2 2 n+x 2 2 3 24 (2k 5)(2k 7) 3 1 k 2 (2k 3)(2k 5) z + k 2 (k 2)! 2 (k 1)! 2k (2k 1)(2k 3) 1 k + z k k! 2
F (2k + 2; x) = 0;5 +
3
1
1
Por ejemplo, F (4; x) = 0;5 +
x 1 p 2 4 + x2
1+
1 4 2 4 + x2
F (6; x) = 0;5 +
1 x p 2 6 + x2
1+
1 6 3 + 3 2 26+x 2
1 x p 2 6 + x2 1 x F (8; x) = 0;5 + p 2 8 + x2 = 0;5 +
En resumen F (1; x) =
1 2
+
1
arctan(x), x 2 R,
1 6 2 6 + x2 1 8 1+ 2 8 + x2 1+
x 1 p 2 4 + x2 ! 2 6 6 + x2
= 0;5 +
3 6 4 6 + x2 3 8 1+ 4 8 + x2
1+
2 4 + x2
1+
1+
5 8 2 8 + x2
:
zk
1
+
228CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. F (2; x) = 0;5 +
1p x 2 2+x2 ,
x
0:
n 0, z = n+x 2; p 2 x n x 2 4 2 2 4 6 3 1 p 1+ z+ )+ z + z + F (2k + 1; x) = 0;5 + arctan( n + x2 3 3 5 1 3 5 7 n 2 4 2(k 2) k 2 2 4 2(k 1) k 1 z + z 1 3 5 (2k 3) 1 3 (2k 1)
Para n = 2k + 1, k = 1; 2; 3; : : : y x
Para n = 2k + 2, k = 1; 2; 3; : : : ; x
0, z =
+
n , n+x2
1 x 5 3 1 3 p 1 + z + 3 z2 + z3 + + 2 2 n+x 2 2 3 2 23 (2k 3)(2k 5) 3 1 k 1 (2k 1)(2k 3) z + (k 1)! 2k 1 k! 2k
F (2k + 2; x) = 0;5 +
Además x 2 ] x ^n ; x ^n [, donde n 2 Z+ y (
x ^n = m n t > 0jt
F (n; x) se aproxima por 0 si x
n+1 2
t2 1+ n
2
10
< 10
x ^n y se aproxima por 1 si x
)
1
zk
;
x ^n .
Por otro lado, para x 2 ] x ^n ; xn [, F (n; x) se escribe en forma anidada.
Se recomienda al lector elaborar un algoritmo para el cálculo de F (n; x) así como su respectivo programa computacional. Los resultados del programa deben compararse con las tablas de la distribución t de Student proporcionados en los libros de probabilidad y estadística.
4.12.
Distribución F (de Snedekor)
De…nición 10 Sean Y; Z variables aleatorias independientes que tienen distribuciones con m y n grados de libertad, respectivamente. La variable aleatoria y m X= z n tiene una distribución F de…nida por m 2
F (m; n; x) = m n
Para m = 1, se tiene
n+1 Z x 2 t m n 0 2 2
n 2
n
n2 F (1; n; x) = p
n+1 2 n 2
Z
x
t
1 2
1 2
m+n 2 dt
(n + mt)
(n + t)
n+1 2
dt
x
x
0:
0
Efectuando el cambio de variable t = u2 , se obtiene 2 F (1; n; x) = p
n+1 2 n n2
Z
0
p
x
u2 1+ n
que tiene la forma de la distribución t de Student. La función Z px n+1 p u2 2 G(n; x) = p (1 + ) n n n 0 2
n+1 2
n+1 2
du;
du
x
0;
0:
-cuadrada
4.12. DISTRIBUCIÓN F (DE SNEDEKOR)
229
se aproxima utilizando el algoritmo de aproximación de la distribución t de Student. Luego p F (1; n; x) = 2 G(n; x) x 0, n = 1; 2; : Si m = 2, tenemos 2 F (2; n; x) = n
Z
n+2 2 n 2
x
n+2 2
2 1+ t n
0
dt = 1
Sean m; n 2 Z+ con m > 2. Entonces m 2 mt n ,
Utilizando el cambio de variables u = F (m; n; x) =
m 2
t
0, n = 1; 2;
:
m+n 2
mt 1+ n
1
0
Z
m+n 2 m 2
m+n 2
=
n 2
x
x
dt:
tenemos
m 2
m n
Z
m+n 2
m 2
m F (m; n; x) = n
n 2
2x 1+ n
n 2
m 2
Para m; n 2 Z+ tal que m > 2, de…nimos I(m; n; ) =
Z
n 2 mx n
mx n
0
m
t2
1
m 2
nu m
1
m+n 2
(1 + t)
(1 + u)
m+n 2
dt
0:
x
n du m
0
Z
m
t2
1
m+n 2
(1 + t)
dt
0;
0
y mediante el método de integración por partes, obtenemos m 2
I(m; n; ) =
1
(1 + )
m 2+n 2
+
m 2+n 2
m 1 2 m 2+n 2
I(m
2; n; x):
Esta fórmula recursiva la aplicaremos sucesivamente para obtener una expresión que nos permita describir un algoritmo de cálculo de F (m; n; ). Así, I(m I(m
m 2 2
2; n; ) =
1
(1 + )
m 4+n 2
m 4+n 2 m 4 2
4; n; ) =
1
(1 + )
m 2 1 2 m 4+n 2 m 4 1 2 m 6+n 2
+
m 6+n 2
+
m 6+n 2
I(m
4; n; );
I(m
6; n; ):
Entonces m 2
I(m; n; ) =
1
m 2+n 2
(1 + )
m 2 m 2+n 2
m 2+n 2 m 1 m2 2 1 2 m 2+n m 4+n m 6+n 2 2 2 m 2 m 4 m 1 1 1 2 2 2 m 4+n m 6+n m 2+n 2 2 2
1
m 2 2
m 4+n 2
m 4 2
1
(1 + )
I(m
1
m 6+n 2
(1 + )
m 4+n 2
+
6; n; ):
Continuando con este procedimiento k veces, obtenemos I(m; n; ) =
m 2
1
(1 + )
m 2+n 2 m 1 2 m 2+n m 2 m 1 m2 2 2 m 2+n m 2 m 1 m2 2 2 m 2+n m 2
m 2+n 2
m 2 2 4+n 2
1 4+n 2
1 4+n 2
m 2 m 2+n 2
1 m 6+n 2
1 m 4+n 2
m 4 2
1
m 2 2
(1 + )
m 2k+4 2 m 2k+n 2 m 2k+2 2 m 2k+n 2
1 1
1
(1 + )
m 4+n 2
m 6+n 2
m 2k+2 2
I(m
1
(1 + )
2k; n; ):
m 2k+n 2
+
230CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. 1. Si
m 2k 2
1 = 0, entonces m = 2k + 2, k = 1; 2; 3; : : : ;
I(m
2k; n; ) = I(2; n; ) =
Z
(1 + t)
m 2k+n 2
dt =
n+2 +1 2
(1 + t) n+2 2
n+2 2
(1 + t)
dt
0
0
=
Z
=
+1
0
1 n 2
1
n 2
(1 + )
:
Además m+2 2 m 2
=
n 2
n 2
=
n 2
+k+1
k!
n 2 n 2
+k
n 2
=
n 2
+k
n 2
+k 1 k!
n 2
+k 1 n k! 2
n 2
;
y para j = 1; 2; : : : ; k; m 2
1
= m 2 m 2+n 2
(
(
)(
n 2
m 2j+2+n 2
k(k +k 1
n 2
+k
m 2j+4 2
1
m 4+n 2
m 2+n 2
=
m 2 2
1) n 2
(k +k
1 m 2j+n 2
j + 2) j+2
n 2
+k
j+1
k! (k
j + 3)!
1 m2 2 m 4+n 2
)(
1)
)
n 2
n 2
+k
m 2j+4 1 2 m 2j+2+n m 2j+n 2 2
(
(
+k
)
)(
)
n 2
1 = =
+k
( n2 +k)( n2 +k
n 2
j+2
k(k 1) 1)
+k
j+1
:
(k j+2) j+2)( n +k j+1) 2
( n2 +k
k! (k j+3)!( n +k)( n +k 1) 2 2
( n2 +k
j+2)( n +k j+1) 2
:
Por lo tanto, si m = 2k + 2, k = 0; 1; 2; : : :, tomando en cuenta el desarrollo de I(m; n; ) y el cálculo de los coe…cientes, obtenemos m+n 2
F (m; n; ) =
m 2
= 1
I(m; n; ) =
n 2 n 2
(1 + )
n 2
+k
n 2
+k 1 k!
I(m; n; )
n(n + 2) 2 n(n + 2)(n + 4) 3 y + y + 2! 3! (n + 2(k 1)) k y ;
1 + ny +
n(n + 2) k!
mx yy= : n 2(1 + ) En conclusión, si m = 2k + 2, k = 0; 1; 2; : : :, n = 1; 2; 3; : : :, donde
n 2
+
=
F (2k + 2; n; ) = 1
(1 + )
n 2
=
mx n ,
n+2(k 2) y k 1
n+2 2 y
1+
+
1 + ny 1 +
n+2 2 y
1+
1 + ny 1 +
x
0, y =
2(1+ ) ,
n+2(k 1) y k
Ejemplos 1. Si m = 10, n = 5, x = 4;74, se tiene F (m; n; ) = 1
(1 + )
n 2
n+4 3 y
= 9;48, y = 0;4522900763; F (10, 5, 9;48) = 0;950104214: 2. Si n = 32 y x = 2;14, obtenemos F (10, 32, 0;66875) = 0;9497430676:
1+
n+6 4 y
;
entonces :
4.12. DISTRIBUCIÓN F (DE SNEDEKOR)
231
2. Si m = 2k + 1, k = 1; 2; : : :, entonces
I(m
2k; n; x) =
Z
t
m 2k 2
1
m 2k+n 2
(1 + t)
dt =
0
p
Z
1 2
t
n+1 2
(1 + t)
0
Zn
2 dt = p n
n+1 2
t2 1+ n
dt:
0
En la sección precedente se describió un procedimiento de cálculo de la función de distribución t de Student: n+1 Z x n+1 2 t2 2 T (n; x) = p 1+ dt x 2 R, n = 1; 2; : : : . n n n 2 1 Rx
n+1 2
t2 n
Dicho procedimiento se centró en calcular 0 1 + dt x 0. Esos resultados serán utilizados para calcular valores de F (2k + 1; n; x) con k = 0; 1; 2; : : :, n = 1; 2; : : :, x 0. Para el efecto, de…nimos n+1 2
F1 (n; ) = 2 p
n 2
n
Si n = 2k + 1, k = 0; 1; 2; : : :,
Z
0 n n+
0, z =
arctan( p ) + n n+ 2 2 4 2(k 2) k z 1 3 5 (2k 3)
F1 (n; ) =
2
p 2 n
2
n+1 2
t2 1+ n
0, n = 1; 2; : : : .
, entonces 1+
2
dt
+
2 1 2
3 4
1
z+
3
2
4
2
z2 +
4
1 3 5 1 3 2(k 1) k 1 z : (2k 1)
6 5
7
z3 +
+
Si n = 2k + 2, k = 0; 1; 2; : : :, p
F1 (n; ) =
n+ 1 3 (k
1 1+ z+ 2 2
2
(2k 1)! 2k 1
3)
3 1
zk
1
22 +
z2 +
1
3 2
3
3
5 1
23
(2k
z3 +
1)
k! 22
+
zk :
Volvamos al cálculo de F (2k + 1; n; x). Comencemos con el análisis del término que contiene I(m 2k; n; x). Tenemos m+n1 2 m n 2 2
=
2 p
n+1 2 n n2
m 2
p
Zmx
1 m2 2 1 m 2+n m 4+n 2 2 t2 1+ n
m 2k+2 2 m 2k+n 2
n+1 2
dt = F1 (n;
p
p
1
2 p n
Zmx
t2 1+ n
n+1 2
dt
0
mx):
0
Luego m+n 2
F (2k + 1; n; ) =
m 2
p I(m; n; ) = G(m; n; ) + F1 (n; mx);
n 2
donde G(m; n; ) =
m 2
m+n 2 m 2
n 2
m 1 m2 2 2 m 2+n m 4+n 2 2 m m 2 1 1 2 2 m 2+n m 4+n 2 2
1
(1 + )
m 2+n 2
m 2
m 2+n 2
1 m 6+n 2
m 2 2
1
m 2+n 2 m 4 2
1
(1 + )
m 2k+4 2 m 2k+n 2
1
1
(1 + )
m 4+n 2
m 4+n 2
m 6+n 2
m 2k+2 2
1
(1 + )
m 2k+n 2
!
:
232CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. Teniendo presente que m = 2k + 1, k = 1; 2; : : :, G(m; n; ) se escribe en la forma siguiente: 1 2
G(m; n; ) =
(1 + )
m+n 2
n+1 2
m n 2 2 k+2 )
1 k 2 (1 + 2 n+2k 1 n+2k 3 2 2 1 3 k 2 k 2 n+2k 1 n+2k 3 2 2
k
Sea y =
1+
k 1 (1
+
+ )
k+1
+
n+2k 1 2 1 k 2 k 32 (1 + ) k+3 n+2k 1 n+2k 3 n+2k 5 2 2 2
3 2 n+1 2
!
+
+
+
+
:
, la expresión anterior se escribe como p
G(m; n; ) =
y(1 + )
m+n 2
n 2
m 2
1 2 n+2k 3 n+2k 1 2 2 1 k 2 k 23 n+2k 1 n+2k 3 2 2
k
yk
1 n 2
yk
n+2k 1 2
k
2
n+2k 1 2 ! 3 2 : n+1 2
1
+
1 k 32 2 n+2k 3 n+2k 5 2 2
yk
3
Para obtener una forma práctica de cálculo de G(m; n; ) debemos expresaar de modo conveniente todos los coe…cientes. Para el efecto, obervemos que m+n 2 m 2
1 n 2
n+2k 1 2
m+n 2
k n 2
m 2
m+2k 1 2
m+n 2
k n 2
m 2
n+2k 1 2 m n 2 2
=
n+2k 1 2
1 2 m+2k 3 2 1 k 2 n+2k 3 2
=
n+1 2 3 3 2 2
n+2k 3 2 k 21 n+2k 3 2 2k 1 n 2 2
=
3 2 n 2k 5 2
;
n+2k 5 2 k 32
=
n+2k 5 2 n 2k 3 2 2
=
n+1 2 n 2
=
n+1 2 3 3 2 2 n+2k 7 2 k 25
n+1 2 n 2
,
n+1 2 3 3 2 2
n+1 2 n 2
.. . m+n 2 m 2
k n 2
1 2
n+2k 1 2
3 2 n+2k 3 2
3 2 n+1 2
k
=
n+1 2 n 2
3 2
n+1 2 n 2
2 =p
:
Por lo tanto, G(m; n; ) =
n+1 2 n 2
2 p
n + 2k 7 2k 5
p
y 1+
1+
n 2
1+
n+1 y
1+
n+3 y (1 + 5
n + 2k 5 n + 2k 3 y 1+ y 2k 3 2k 1
que es una expresión muy fácil de programar. Debemos notar que si n = 2j, j = 1; 2; : : :, entonces n+1 1p j 21 j 23 j 2 2 = = n (j 1)! j 2
1 2
1
j j
3 2
1p ; 2
2
y si n = 2j + 1, j = 0; 1; 2; : : :, entonces n+1 2 n 2
= =
(j + 1) = (j + 21 ) j j j 1 1 j 2 j 32
j! 1 2
1p 2
3 2
j 1 1 2
1 p :
+
,
4.13. EJERCICIOS
233
Ejemplo Si m = 9, n = 15, x = 2;59. Se tiene k = 4, j = 7, p 1 2 15 F1 (n; ) = arctan( p ) + 2 15 + 15 8z 10z 12z 1+ 1+ 1+ 9 11 13
2
1+
2z 3
1+
4z 5
1+
6z 7
;
p donde = mx, z = n+n 2 . Entonces = 4;828043082, z = 0;3915426782, x = y = 1+ = 0;608457322, F1 (n; ) = 0;9997786188: G(m; n; ) = =
2 p p y
(8) 15 2
(1 + )
15 2
1+
16y 3
1+
18y 5
1+
mx n
20y 7
0;04961972164:
F (9; 15; 2;59) = G(m; n; ) + F1 (n; ) = 0;9501588972:
4.13.
Ejercicios
1. Aplique la función gama de Euler para calcular las integrales siguientes R1 e t R 1 e t2 R1 R 1 1=2 t4 R1 3 a) 0 1=4 dt: b) 0 t e dt: c) 0 dt: d) 0 t2 e t dt: e) 0 t e 1=3 t t R 1 m ax1=n R 1 3 t1=3 dx, donde a 2 R+ , m; n 2 Z+ : dt: g) 0 x e f) 0 t e R1 n h) 0 x1=m e ax dx, donde a 2 R+ ; m; n 2 Z + :
2. Sea p 2 R+ . Demuestre que (p) =
R1 0
ln
p 1
1 x
dt:
3. Utilice el resultado del ejercicio 2) para calcular las siguientes integrales. R1 R1 R1 R1 dx dx : b) 0 : c) 0 (ln(x))2 dx: d) 0 (ln(x))6 dx: a) 0 1=3 1=4 1 1 ln( ) ln( ) x x R1 R1 dx e) 0 (ln(x))2k dx, donde k 2 Z+ : f ) 0 , donde m 2 Z+ : 1=m 1 ln( ) x R1 4. Sean ; p 2 R+ . Demuestre que (p) = p 0 tp 1 e t dt: 5. Calcular las integrales siguientes R1 R1 R1 a) 0 x1=2 (ln(x))3 dx: b) 0 x1=3 (ln(x))4 dx: c) 0 x2 (ln(x))1=5 dx: R1 d) 0 xp (ln(x))m dx; donde p 2 R+ ; m 2 Z+ : 6. Sea p 2 R+ . Demostrar que
d (p) = dp
Z
1
tp
1
e t (ln(t))dt:
0
1 7. Calcular los términos de la sucesión ( ( n + )), donde n 2 Z+ : 2 8. Sea g : [1; 2] ! R la función de…nida por g(p) = 2[(2
p
)p( 3 + p) + 4;5
2
p
]:
p
t dt:
= 1;554,
234CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. a) La función g es una interpolante de (p) con p 2 [1; 2]. Calcule g(1); g(1;5), g(2) y compare con 1 (1), y (2): 2 b) Utilizando la función g bosqueje la grá…ca de (p), p 2 [1; 2]:
c) Tomando en cuenta que
(p) ! 1, p!0
(p)
! 1; y de la información proporcionada en a) y
p!1
b), bosqueje la grá…ca de (p), p 2 R+ :
d) Bosqueje la grá…ca de (p) para p 2 R 8 Z : 9. Aplique las propiedades de la función beta para calcular las integrales siguientes. a)
R2
sen2 ( ) cos3 ( )d .
b)
0
e)
R
2
0
sen5 ( ) cos4 ( ) d .
R
f)
sen( ) cos5 ( )d .
2
0
R
2
0
d)
sen9 ( ) cos( ) d .
g)
2
0
R
sen4 ( ) cos( ) d . 2
0
sen10 ( ) d .
h)
x para demostrar que 1+x
10. Sean p; q 2 R+ . Utilizar la transformación t = B(p; q) =
R
Z
1
0
R
2
0
cos9 ( ) d :
xp 1 dx: (1 + x)p+q
11. Sean p; q 2 R+ :
2
2
a) Demostrar que el área de la región S limitada por la curva de ecuación x p + y q = 1, x y 0 y los ejes coordenados viene dada por: pq a(S) = 2(p + q)
p 2
q 2 p+q 2
=
0;
pq p q B , : 2(p + q) 2 2
b) Calcule a(S) para p; q en los casos siguientes: p = q = 1; p = q = 2, p = q = 3 (arco de asteroide). 12. Calcule las integrales siguientes en términos de la función beta y luego en términos de la función gama. Ra R1 R1 R1 a) 0 x7 (1 x)8 dx. b) 0 x1=2 (1 x)4 dx. c) 0 x3 (1 x)1=2 dx. d) 0 x2 (a x)5 dx, a > 0. 1 Ra Ra e) 0 xm (a x)n dx, a > 0, m; n 2 Z+ . f ) 0 xm (an xn ) 2 dx, donde a > 0, m; n 2 Z+ . g)
R2 0
x1=2 dx : (4 x2 )1=5
13. Calcular las integrales siguientes en términos de la función gama. 1 R1p R1 R1 a) 0 1 x6 dx. b) 0 (1 x4 )1=5 dx. c) 0 (1 x8 ) 3 dx. R1 R1 d) 0 (1 x2k )1=n dx, k; n 2 Z+ , n 2. e) 0 (1 xm ) 1=n dx, m; n 2 Z+ , n > 1:
14. En muchos casos se requieren valores de la distribución normal con una precisión " = 10 3 . Establezca las modi…caciones necesarias para generar un algoritmo que permita calcular valores de dicha función de distribución con " = 10 3 :
15. Se requieren calcular valores de la distribución gama con una precisión " = 10 3 . Establezca las modi…caciones necesarias para generar un algoritmo que permita calcular valores de dicha función de distribución con " = 10 3 : Calcule algunos de ellos y veri…que sus resultados con los dados en los textos de Estadística y Probabilidades. 16. Se desea calcular valores de la distribución -cuadrada con una precisión " = 10 3 . Establezca las modi…caciones necesarias para generar un algoritmo que permita calcular valores de dicha función de distribución con " = 10 3 : Calcule algunos de ellos y veri…que sus resultados con los dados en los textos de Estadística y Probabilidades.
4.14. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
235
17. Establezca las modi…caciones necesarias para generar un algoritmo que permita calcular valores de la función de distribución t de Student con " = 10 3 : Calcule algunos de ellos y veri…que sus resultados con los dados en los textos de Estadística y Probabilidades. 18. Establezca las modi…caciones necesarias para generar un algoritmo que permita calcular valores de la función de distribución F de Snedekor con " = 10 3 : Calcule algunos de ellos y veri…que sus resultados con los dados en los textos de Estadística y Probabilidades.
4.14.
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 3. Tom M. Apostol, Calculus, Volumen 2, Segunda Edición, Editorial Reverté, Barcelona, 1975. 4. R. M. Barbolla, M. García, J. Margalef, E. Outerelo, J. L. Pinilla. J. M. Sánchez, Introducción al Análisis Real, Editorial Alambra Universidad, Madrid, 1981. 5. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 6. Alan W. Bush, Perturbation Methods for Engineers and Scientists, CRC Press, Boca Raton, 1992. 7. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 8. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 9. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 10. John E. Freund, Ronald E. Walpole, Estadística Matemática con Aplicaciones, Cuarta Edición, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1990. 11. Waltson Fulks, Cálculo Avanzado, Editorial Limusa, México, 1973. 12. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 13. Nicholas J. Higham, Accuracy and Stability of Numerical Algorithms, Editorial Society for Industrial and Applied Mathematics, Philadelphia, 1996. 14. E. J. Hinch, Perturbation Methods, Cambridge University Press, Cambridge, 1991. 15. William W. Hines, Douglas C. Montgomery, Probabilidad y Estadística para Ingeniería y Administración, Compañía Editorial Continental, México, 1986. 16. Erwin Kreyszig, Introducción a la Estadística Matemática, Editorial Limusa, México, 1981. 17. L. Lebart, A. Morineau, J.-P. Fénelon, Tratamiento Estadístico de Datos, Editorial Marcombo Boixareu Editores, Barcelona, 1985. 18. Thomas M. Little, F. Jackson Hills, Métodos Estadísticos para la Investigación en la Agricultura, Editorial Trillas, México, 2002. 19. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995.
236CAPÍTULO 4. APROXIMACIÓN DE ALGUNAS FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD. 20. William Mendenhall, Dennis D. Wackerly, Richard L. Schea¤er, Estadística Matemática con Aplicaciones, Segunda Edición, Grupo Editorial Iberoamérica, México, 1994. 21. Paul L. Meyer, Probabilidad y Aplicaciones Estadísticas, Editorial Fondo Educativo Interamericano, México, 1973. 22. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 23. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 24. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 25. J. W. Schmidt, R. E, Taylor, Análisis y Simulación de Sistemas Industriales, Editorial Trillas, México, 1979. 26. Stephen P. Shao, Estadística para Economistas y Admistradores de Empresas, Editorial Herrero Hermanos, México, 1967. 27. Bhimsen K. Shivamoggi, Perturbation Methods for Di¤erential Equations, Editorial Birkh½auser, Boston, 2003. 28. Fausto I. Toranzos, Estadística, Editorial Kapelusz, Buenos Aires, 1962.
Capítulo 5
Resolución Numérica de Ecuaciones no Lineales Resumen En este capítulo se tratan problemas primeramente de existencia de soluciones de ecuaciones no lineales en una sola variable. El punto de partida lo constituye el teorema de Bolzano con el que se genera el algoritmo de separación de las raíces y el método de bisección. A continuación se trata el teorema de Banach del punto …jo que asegura la existencia del punto …jo de aplicaciones contractivas de…nidas en intervalos cerrados y acotados de R, lo que conduce a su vez a construir aplicaciones contractivas en intervalos cerrados y acotados donde están localizada (aislada) una sola raíz de la ecuación f (x) = 0: De este modo se generan algunos métodos iterativos que permiten calcular en forma aproximada la o las raíces de dicha ecuación. Entre los métodos más importantes citamos el de punto …jo, punto …jo modi…cado, Newton Raphson, Newton modi…cado, secantes, regula-falsi. Por otro lado, interesa conocer la rapidez con la que se aproxima la solución y comparar los diferentes métodos. Con esta información se plantean métodos de aceleración de la convergencia, básicamente se desarrollan dos: el método 2 de Aitken y el método de Ste¤ensen. Se consideran métodos para determinar las raíces de multiplicidad. Se concluye con el estudio de las ecuaciones algebraicas, es decir ecuaciones con funciones polinomiales o lo que es lo mismo el cálculo de las raíces de polinomios. Damos prioridad a los polinomios con coe…cientes reales y nos centramos en el cálculo de las raíces reales; para el efecto, la primera tarea es localizar las raíces para en una segunda etapa proceder al cálculo de las mismas.
5.1.
Introducción
En la actualidad se pone mucha atención el problema de la contaminación ambiental, particularmente del agua, pués en el futuro se debe proteger mucho más a este recurso. A continuación describimos brevemente un modelo matemático de control de la calidad del agua propuesto por Streeter y Phelps (1925) ampliamente utilizado (véase G. Kiely, volumen II, R. Banks) Los microorganismos que requieren de oxígeno para su crecimiento se llama aeróbicos y aquellos que no lo requieren se llaman anaeróbicos. En el caso de los microorganismos aeróbicos, el oxígeno debe estar disponible en forma de oxígeno libre disuelto. Los microorganismos que pueden crecer en presencia de oxígeno se llaman aeróbicos obligados. Cuando un nutriente entra en una corriente de agua, los microorganismos aeróbicos consumen el oxígeno disuelto al efectuar la descomposición del nutriente, de este modo, el nutriente ejerce una demanda sobre la disponibilidad de oxígeno disuelto. Los nutrientes disueltos causan contaminación cuando entran en una corriente de agua en cantidades su…cientes para destruir la capacidad de autopuri…cación de esta; esto es, si los nutrientes disueltos entran al agua con una tasa tal que el oxígeno disuelto se gaste más rápidamente de lo que puede reponer, el agua se desoxigena. En estas condiciones, ningún aeróbico obligado (desde los microorganismos hasta los 237
238
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
peces) podrá sobrevivir y los contaminantes orgánicos se acumularán en el agua dando lugar a los procesos anaeróbicos que producirán sustancias malolientes de los contaminantes y el agua quedará contaminada. Uno de los parámetros de calidad del agua y aguas residuales es la demanda bioquímica de oxígeno (DBO) que se de…ne (Gerard Kiely, Vol.II, página 413) como la cantidad de oxígeno que necesitan los organismos vivientes (aeróbicos) en la fase de estabilización de la materia orgánica de las aguas y aguas residuales. La DBO es una medida de su poder para causar contaminación y se produce cuando la demanda de oxígeno (DO) sobrepasa a la cantidad de oxígeno disponible. La prueba de DBO estima el oxígeno gastado en la descomposición biológica de una muestra residual y es un simulación de laboratorio del proceso microbiano de autopuri…cación. Es importante el conocimiento preciso de la concentración de oxígeno disuelto en el agua para la prueba de DBO que es útil como indicador del estado de contaminación de una corriente de agua. La prueba DBO consiste en el proceso de laboratorio siguiente. En una muestra de los residuos se diluye una mezcla con una población mixta adecuada de microorganismos. Se mide la concentración de oxígeno disuelto DO al instante t = 0. Esta mezcla se incuba a una temperatura …ja (T = 20o C) y luego de cierto tiempo (t = 5 días, t = 15 días, t = 21 días) se mide nuevamente la concentración de oxígeno disuelto DO (t). El cambio DO (0) DO (t) mide la cantidad de oxígeno no utiizado en ese tiempo por los microorganismos al procesar nutrientes de la muestra de agua residual. Los más usuales son DBO5 para t = 5 días, DBO15 para t = 15 días, DBO21 para t = 21 días. La primera prueba de este género fue propuesta en 1913. El modelo más sencillo se establece en los términos siguientes: la taza de descomposición de materia orgánica es proporcional a la cantidad de materia orgánica disponible, esto es, dL = dt
k1 L;
donde L es la demanda bioquímica de oxígeno remanente en desoxigenación de DBO en días 1 .
mg l ,
k1 > 0 es el coe…ciente de velocidad de
Al instante t = 0, la DBO inical del e‡uente en el punto de vertido a un curso de agua se le nota L0 . Se tiene dL = k1 L t 2 ]0; T ] ; dt L (0) = L0 ; cuya solución es L (t) = L0 e
k1 t
t
0:
El modelo de Streeter y Phelps establece que dDO = k1 L1 dt
k2 DO = k1 L0 e
k1 t
k2 DO;
con DO el dé…cit de oxígeno disuelto, k2 > 0 es la velocidad de reaireación atmosférica medida en día
1:
La solución de la ecuación diferencial precedente es DO (t) =
k1 L0 e k2 k1
k1 t
e
k2 t
k2 t
+ d0 e
t
donde d0 es el dé…cit de oxígeno disuelto en t = 0. La función DO (t) oxígeno disuelto saturado en cualquier instante. Supóngase d0 = 0;7
mg L ;
k1 = 0;25 día 9;2 = 0;7e
1,
t
0 representa el dé…cit de
mg L0 = 25 mg L , t = 4 días y DO (4) = 9;2 L , se tiene
4k2
+
0;25 25 e k2 0;25
4 0;25
e
4k2
y de esta, se obtiene la siguiente ecuación: 9;2 = 0;7e
0;
4k2
+
6;25 e k2 0;25
1
e
4k2
;
;
5.1. INTRODUCCIÓN
239
para la que no existe una fórmula que permita calcular k2 , consecuentemente se debe recurrir a métodos numéricos iterativos para calcular una solución aproximada, siempre que esta exista. Esta clase de problemas son muy comunes en aplicaciones de la matemática. Posición del problema Sean I R con I 6= ; un conjunto cerrado y f una función real de I en R. Consideramos el problema siguiente hallar x b 2 I; si existe, tal que f (b x) = 0:
Más precisamente, asignada la función f de…nida en I y en consecuencia la ecuación f (x) = 0, se trata de estudiar si dicha ecuación tiene o no solución en I, esto es, estudiar si existe al menos un x b 2 I tal que f (b x) = 0; y en el caso en que exista solución, interesa como calcular x b o como aproximar x b; mediante una sucesión (xn ) I tal que xn ! x b y f (xn ) ! f (b x) = 0: n!1
n!1
De…nición 1 Asignada la ecuación f (x) = 0; un elemento x b 2 I tal que f (b x) = 0 se denomina cero de f o raíz de la ecuación f (x) = 0.
Para un número limitado de funciones reales pueden darse métodos directos de resolución de la ecuación f (x) = 0. Así por ejemplo. 1. Sean a; b 2 R con a 6= 0 y f la función real de…nida por f (x) = ax + b f (x) = 0 , ax + b = 0 , x = x b=
b a
es la raíz de f (x) = 0 o cero de f ya que f
2. Sean a; b; c 2 R con a 6= 0 y f (x) = ax2 + bx + c
b a
x 2 R. Entonces
b ; a
= 0.
x 2 R. La ecuación
f (x) = 0 , ax2 + bx + c = 0; tiene solución en R si y solo si d = b2 4ac 0; en cuyo caso las raíces de la ecuación vienen dadas como: p p b b2 4ac b + b2 4ac x1 = , x2 = : 2a 2a Si d = b2 otra.
4ac < 0, la ecuación ax2 + bx + c = 0 tiene dos raíces complejas, una conjugada de la
3. Sea f la función real de…nida por f (x) = f (x) = 0 , sen x =
1 2
+ sen x. Entonces,
n o 1 ,x2 + 2k j k 2 Z [ 2 6
5 + 2k j k 2 Z : 6
4. Las siguientes son ecuaciones que igualmente se resuelven fácilmente en el conjunto R: 2x = log3 (x) = 243:
1 64 ,
Para las ecuaciones como las que a continuación se indican, no es posible determinar un método directo que permita calcular las raíces exactas, únicamente es posible resolverlas de manera aproximada y es éste el objetivo de este capítulo. 1. x
cos(x) = 0
2. arctan(x) =
x 2 R.
1 1+x2
x 2 R.
240
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
3. x4 + 5x3 4. 4
x2
x2 + 1 = 0 e
x 2 R.
3x
= 0 x 2 R. R1 2 5. Sean n 2 Z+ , c = n1 0 e t dt. Ponemos x0 = 0 y de…nimos gj (x) = c
Z
x
xj
e 1
t2
dt
x 2 [xj
1 ; 1] ;
j = 1; : : : ; n. gj (x) = 0, j = 1; : : : ; n:
Nota: Sea P un polinomio de grado 3, esto es P (x) = a + bx + cx2 + dx3 x 2 R con a; b; c; d 2 R. Mediante transformaciones adecuadas, la ecuación P (x) = 0 puede resolverse directamente mediante las denominadas fórmulas de Cardano. De manera similar, si P (x) = a + bx + cx2 + dx3 + ex4 x 2 R es un polinomio de grado 4 con coe…cientes en R, mediante el método de Euler pueden calcularse directamente las raíces (reales o complejas) de la ecuación P (x) = 0 (véase H. Hall y Knight, Kurosh, Kostrikin). Para polinomios de grado n 5 no existen métodos directos de cálculo de las raíces de la ecuación P (x) = 0 con la excepción de casos muy particulares como por ejemplo los que se citan a continuación: P (x) = x5
32, P (x) = x x2 + 1
x2
1 , P (x) = (x
1)5 .
Las raíces reales de polinomios de grado 3 o 4 con coe…cientes reales serán aproximadas mediante sucesiones.
5.2.
Separación de las raíces.
En lo sucesivo supondremos que f es una función real de…nida en un subconjunto I de R y en consecuencia tendremos asignada la ecuación f (x) = 0 en el conjunto I. La primera tarea para el estudio de la ecuación f (x) = 0 es la existencia de soluciones. Para el efecto consideramos dos procedimientos: el método grá…co y el algoritmo de búsqueda del cambio de signo. De…nición 2 Una raíz x b 2 I de la ecuación f (x) = 0 se dice separada en un intervalo [a; b] este intervalo contiene únicamente a la raíz x b:
I si
i. Método grá…co a) Si la función f puede ser gra…cada sin di…cultad, la separación de las raíces se obtiene observando los intervalos en los cuales la grá…ca de f corta al eje x. Por lo general este procedimiento es limitado ya que la construcción de la grá…ca conduce al estudio de la función f , estudio que puede resultar mas complicado que resolver la ecuación. En efecto, si f es derivable en I, para determinar los subconjuntos de I en los que f es creciente, decreciente, se deben resolver las inecuaciones f 0 (x) > 0, f 0 (x) < 0 y la ecuación f 0 (x) = 0 que pueden ser más complejas que la ecuación f (x) = 0. Si f 00 existe en I, se deben determinar los subconjuntos de I en los que f es cóncava, convexa y determinar los puntos de in‡exión de f , lo que conduce a calcular f 00 y resolver las inecuaciones f 00 (x) > 0, f 00 (x) < 0 y la ecuación f 00 (x) = 0 que pueden resultar más difíciles que la ecuación f (x) = 0: Más adelante se exhiben ejemplos con estas características. Por otro lado, las imprecisiones en el trazado de la grá…ca pueden conducir a falsas interpretaciones. b) Si la ecuación f (x) = 0 puede escribirse como g (x) h (x) = 0, donde g; h son funciones de…nidas en el conjunto I cuyas grá…cas pueden trazarse fácilmente, entonces la ecuación f (x) = 0 se transforma en determinar los puntos x 2 I tales que g (x) = h (x). Las raíces de f se separan observando los intervalos en los cuales sus correspondientes grá…cas se cortan. Este procedimiento es también limitado.
5.2. SEPARACIÓN DE LAS RAÍCES.
241
Ejemplos 1. Considerar la ecuación: x 2 R tal que x cos(x) = 0. Se tiene cos(x) = x. Ponemos g (x) = cos(x), h (x) = x x 2 R. En la …gura siguiente se muestran las grá…cas de estas dos funciones. h Sei observa que dichas grá…cas se cortan en un punto. La ecuación propuesta tiene una raíz x b 2 0; : 2
Figura 31
2. La ecuación
x2 + 1
tan(x) = 0 puede escribirse en la forma tan(x) =
Sean g (x) = x2 + 1, h (x) = tan(x) cuya abscisa x b 2 [0; 1] :
x2
2; 2
x2 + 1.
. Las grá…cas de g y h se cortan en un punto
Figura 32
En el dibujo se observa que otra raíz está localizada en el intervalo 2 ; , ¿es justa esta aseveración? De ser así, ¿existen otras raíces para x > 2 ? De acuerdo al grá…co no podemos dar respuesta inmediata. Requerimos de un análisis más …no para determinar, si existe o no, otras raíces de dicha ecuación. 3. Considerar la ecuación en R siguiente: x3 Entonces f 0 (x) = 3x2 12: Luego,
12x
f 0 (x) > 0 , 3 (x + 12) (x 0
f (x)
0 , x 2 [ 2; 2] :
1 = 0. Ponemos f (x) = x3 2) > 0 , x 2 ] 1; 2[ [ ]2; 1[ ;
12x
1
x 2 R.
242
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 33
En x = tiene
2 se tiene un máximo local y en x = 2 se tiene un mínimo local. Además, f 00 (x) = 6x. Se f 00 (x) > 0 , x > 0;
f 00 (x) < 0 , x < 0
En x = 0 se tiene un punto de in‡exión. La grá…ca de f siguiente muestra que tiene tres ceros x b1 ; x b2 ; x b3 localizados en los intervalos [ 4; 3], [ 1; 0], [3; 4] : Observe que la grá…ca presenta imprecisiones.
Figura 34
ii. Algoritmo de búsqueda del cambio de signo Teorema 1 (de Bolzano) Sea f una función de [a; b] en R continua en [a; b]. Si f (a) f (b) < 0, existe x b 2 [a; b] tal que f (b x) = 0:
El teorema de Bolzano a…rma que si la función continua f es tal que f (a) y f (b) tiene signos opuestos, la ecuación f (x) = 0 tiene al menos una raíz x b 2 [a; b]. Además, este teorema garantiza la existencia de al menos una raíz de la ecuación f (x) = 0. En la práctica se tienen funciones continuas en las que f (a) f (b) > 0 y sin embargo la ecuación f (x) = 0 tiene solución en [a; b] como lo prueba el siguiente ejemplo: f (x) = x2 1 x 2 [ 2; 2] : Se tiene f ( 2) = f (2) = 3
5.2. SEPARACIÓN DE LAS RAÍCES.
243
En las grá…cas que se muestran a continuación se presentan los dos casos.
Figura 35
Figura 36 El algoritmo de búsqueda del cambio de signo se basa en el teorema de Bolzano y tiene dos propósitos: determinar la existencia de soluciones de la ecuación f (x) = 0 y separar las mismas. Describimos a continuación dicho algoritmo. Sean n 2 Z+ y h =
b a n ;
h se denomina paso.
1. Calculamos f (a) : Si f (a) = 0 entonces a es una raíz de f y continuar en el punto 2). 2. Calculamos f (a + h) : Si f (a) 6= 0 y f (a) f (a + h) = 0 entonces a + h es una raíz de f . Continuar en el punto 3).
Si f (a) f (a + h) < 0 entonces existe x b 2 ]a; a + h[ tal que f (b x) = 0, es decir que f tiene un cero en el intervalo ]a; a + h[. Continuar en 3).
Si f (a) f (a + h) > 0 entonces f no tiene ceros en el intervalo [a; a + h] o el paso h es demasiado grande. Continuar en 3). 3. Calculamos f (a + 2h). Entonces, Si f (a + 2h) = 0 ) a + 2h es una raíz de f (x) = 0: Si f (a + h) f (a + 2h) < 0 ) 9b x 2 ]a + h; a + 2h[ tal que f (b x) = 0: Si f (a + h) f (a + 2h) > 0, no tiene raíces reales en [a + h; a + 2h], o h es demasiado grande. Este procedimiento continua hasta llegar al extremo b del intervalo [a; b]. Una vez localizada una raíz en un cierto subintervalo [xj 1 ; xj ] con xj = a + jh, j =; : : : ; n, conviene asegurarse que no hay otras raíces. Para ello, se elige un entero n1 > n y se repite el procedimiento
244
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
anterior con el nuevo paso h1 = sido localizada ninguna raíz.
b a n1 .
Igualmente se repite el procedimiento en el caso en que no haya
En la …gura siguiente se ilustra esta situación: f (x3 ) f (x4 ) < 0 con lo que existe al menos una raíz x b1 2 [x3 ; x4 ] : Situación similar se presenta en los otros intervalos.
Figura 37
Observe en la grá…ca que para el paso h seleccionado se han separado las tres raíces, cosa que no sucede para la grá…ca de la función f siguiente.
Figura 38
Al seleccionar un paso h1 =
h 2
se detectan raíces x b1 ; x b2 2 [x1 ; x2 ].
Debemos notar que si f tiene una raíz de multiplicidad par, el cambio de signo no es detectado ya que si x b es una raíz de multiplicidad par y x b 2 ]xj ; xj+1 [ se tiene f (xj ) f (xj+1 ) > 0. Este tipo de problemas serán abordados en la sección 5. De lo dicho precedentemente, se desprende el siguiente algoritmo de búsqueda del cambio de signo. Algoritmo Datos de entrada: a; b extremos del intervalo [a; b], función f . Datos de salida: xi; xd extremos del intervalos [xi; xd], mensajes. 1. Leer n y hacer h =
b a n :
2. xi = a: 3. xi > b, …n del procedimiento. Continuar en 8). 4. f (xi) = 0; Mensaje: “xi es raíz de f (x) = 0”. xd = xi + h:
5.3. MÉTODO DE BISECCIÓN
245
5. xd > b; Mensaje: “f no tiene raíces reales en [a; b] o f tiene raíces de multiplicidad par o h es demasiado grande”. 6. f (xd) = 0; Mensaje: “xd es raíz de f ”. xi = xd + h. Continuar en 3). 7. f (xi)
f (xd) < 0; Mensaje: “f tiene una raíz en [xi; xd]”:
xi = xd. Continuar en 5). 8. Fin.
Ejemplo Sea f la función de…nida por f (x) = x3
x
1 x 2 R. Hallar el cambio de f en el intervalo [ 2; 2] :
Sea n = 10. Entonces h = b na = 0;4, xk = 2+kh k = 0; 1 : : : ; 10: Escribimos f (x) = 1+x 1 + x2 . En la tabla siguiente se muestran los resultados de la aplicación del algoritmo de búsqueda del cambio de signo. k xi xd yi = f (xi) yd = f (xd) Signo(yi yd) 0 2 1;6 7 3;496 + 1 1;6 1;2 3;496 1;528 + 2 1;2 0;8 1;528 0;712 + 3 0;8 0;4 0;712 0;664 + 4 0;4 0 0;664 1;0 + 5 0 0;4 1;0 1;336 + 6 0;4 0;8 1;336 1;288 + 7 0;8 1;2 1;288 0;472 + 8 1;2 1;6 0;472 1;492 9 1;6 2 1;492 5 + El algoritmo de la búsqueda del cambio de signo muestra que f tiene una raíz real localizada en el intervalo [1;2; 1;6]. El estudio de la función f muestra que la ecuación f (x) = 0 tiene una única raíz localizada en el intervalo antes precisado.
5.3.
Método de bisección
Sea f una función real, continua en [a; b] y consideramos la ecuación f (x) = 0. Supongamos que el algoritmo de búsqueda del cambio de signo muestra que existe una raíz x b 2 [ ; ]. Más aún, suponemos que dicha raíz ha sido separada en dicho intervalo. Entre los métodos más usados para el cálculo aproximado de x b es el conocido método de bisección. Su aplicación radica en dos hechos importantes: el algoritmo es siempre convergente y porque es fácilmente programable. No obstante, el método tiene la desventaja de requerir un número bastante grande de iteraciones para aproximar x b con una precisión " …jada.
Describimos el método de bisección. Sea c1 =
+ 2
el punto medio del intervalo [ ; ]. Ponemos x0 = ; y0 = .
Si f (c1 ) = 0 entonces c1 es una raíz de f (x) = 0. Si f (c1 ) 6= 0, consideramos los intervalos [ 1 ; c1 ] ; [c1 ; ] y controlamos si f ( ) f (c1 ) < 0 o f (c1 ) f ( ) < 0: En la …gura siguiente se muestra la grá…ca de una función f que tiene una raíz localizada en el intervalo
246
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
[ ; ]:
Figura 39 Supongamos que se veri…ca f (c1 ) f ( ) < 0 (véase las grá…cas de la función f y la posición de x b2[ ; ] raíz de la ecuación f (x) = 0), lo que signi…ca que la raíz x b pertence al intervalo [ ; c1 ]. A este intervalo lo notamos [x1 ; y1 ], donde x1 = ; y1 = c1 :
1 Sea c2 = x1 +y el punto medio del intervalo [x1 ; y1 ] : Si f (c2 ) = 0 entonces c2 es una raíz de la ecuación 2 f (x) = 0: Si f (c2 ) 6= 0, nuevamente consideramos los intervalos [x1 ; c2 ] y [c2 ; y1 ] y controlamos el signo de f (x1 ) f (c2 ). Con referencia de la posición x b 2 [ ; ], se tiene f (x1 ) f (c2 ) > 0 lo que signi…ca que x b 2 [c2 ; y1 ]. Notamos a este intervalo [x2 ; y2 ] con x2 = c2 ; y2 = y1 . 2 Sea c3 = x2 +y el punto medio del intervalo [x2 ; y2 ] : Calculamos f (c3 ) = 0. En el caso contrario, 2 controlamos el signo de f (x2 ) f (x3 ). Observamos en la grá…ca que f (x2 ) f (c3 ) < 0 que implica x b 2 [x2 ; c3 ]. Ponemos x3 = x2 ; y3 = c3 :
En la grá…ca que se muestra a continuación se visualizan los puntos del intervalo [ ; ] que se obtienen mediante este procedimiento:
Figura 40
Este proceso repetimos n veces. Así, obtenemos el intervalo [xn ; yn ], donde f (xn ) f (yn ) < 0. Como cada subintervalo [xn ; yn ] de [ ; ] n = 0; 1; : : : se divide en dos subintervalos de igual longitud, la longitud del intervalo [xn ; yn ] es yn
xn =
2n
:
Por otro lado los extremos izquierdos de los intervalos [xn ; yn ] con n = 1; 2; : : :, forman una sucesión monótona creciente, o sea xn xn+1 y como xn < ; la sucesión (xn ) es acotada. Consecuentemente (xn ) es creciente y acotada, por lo tanto convergente. Sea x = l m xn: n !1
Los extemos derechos de los intervalos [xn ; yn ] forman una sucesión yn decreciente: yn+1 yn n = 1; 2; : : : ; y < yn ; con lo cual (yn ) es acotada. Así (yn ) es decreciente y acotada que implica (yn ) convergente. Sea y = l m yn : Como l m n !1
2n
n!1
0= lm
n!1
2n
= 0; se sigue que = l m (yn n!1
xn ) :
Luego 0 = l m (yn n!1
de donde x = y:
xn ) = l m yn n!1
l m xn = y
n!1
x;
5.3. MÉTODO DE BISECCIÓN
247
Por hipótesis f es continua en [ ; ] ; entonces las sucesiones (f (xn )) y (f (yn )) son convergentes. Entonces f (x) = f
l m xn = l m f (xn ) = f (y) :
n!1
n!1
Además, xn < x b < yn x =
n = 1; 2; : : : ; x b
l m xn
n!1
l m yn = y;
n!1
y como x = y; entonces x b = x = y y f (x) = f (b x) = 0: Así, xn yn
! x b y f (xn )
n!1
! x b y f (yn )
n!1
! f (b x) = 0;
n!1
! f (b x) = 0;
n!1
que prueba que el método de bisección es convergente.
Teorema 2 Sea f una función real, continua en [a; b]. Supongamos que f (a) f (b) < 0: Entonces, el método de bisección genera una sucesión (cn ) que converge a x b raíz de la ecuación f (x) = 0 y tal que b
x bj
jcn
a
2n
Demostración. Para cada n 2 Z+ ; tenemos yn n = 1; 2; ; se sigue que 0
1 (yn 2
x bj
jcn
Luego 0
l m jcn
n!1
n = 1; 2;
xn =
xn )
x bj
b
a 2n
b a 2n+1 lm
n!1
b
:
yx b 2 [xn ; yn ] : Puesto que cn = n = 1; 2; a
2n
xn + yn 2
:
= 0;
de donde l m cn = x b; consecuentemente 0 = f (b x) = l mn!1 f (cn ) : Sea " > 0: Del teorema precedente n!1 se tiene b a jcn x bj n = 1; 2; : : : ; 2n b a b a = 0; existe N0 2 Z+ tal que 8n N0 =) < ": En particular, para n = N0 se y como l m n!1 2n 2n b a tiene N0 < ": Luego 2 b a jcN0 x bj < ": 2N 0 Para elaborar el algoritmo del método de bisección, queda determinar el número máximo de iteraciones Nmax : Para " = 10 t con t 2 Z+ (por ejemplo 10 4 ; 10 6 ; 10 8 , ), se tiene b2N0a < 10 t : Como la función logaritmo natural es creciente, tomando logaritmos en ambos lados de esta desigualdad, resulta ln
b a 2N0
< ln 10
t
() ln (b
a)
No ln (2) < ln 10
t
() N0 >
ln (b
a) 10t : ln 2
El número máximo de iteraciones Nmax elegimos como como sigue: " # ln (b a) 10t Nmax = + 1; ln 2 donde [ ] denota la función mayor entero menor o igual que. Así, jCNmax
x bj < 10 t :
Debe considerarse el hecho siguiente: puede veri…carse que jcn x bj < " pero jf (cn )j > " para n < Nmax . En este caso el proceso debe continuar hasta lograr, en lo posible, jf (cn )j " para n Nmax . Esto corresponde al denominado control vertical de la raíz.
248
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Separada la raíz x b de la ecuación f (x) = 0 mediante el algoritmo de búsqueda del cambio de signo; esto es, dado [a; b] intervalo en el que está localizada la única raíz x b de f (x) = 0 y dado " = 10 t la precisión con la que x b será aproximada, el método de bisección se resume en el siguiente algoritmo. Algoritmo
Datos de Entrada: a; b extremos del intervalo [a; b] ; función f , " = 10 t : Datos de Salida: x b, n, Nmax :
1. Calcular Nmax =
"
ln (b
a) 10t ln 2
#
+ 1:
2. Poner yi = f (a) : 3. Para n = 1; : : : ; Nmax : 4. c =
a+b : 2
5. y = f (c) : 6. Si y = 0; continuar en 10): 7. Si
b
a 2
< " y jyj < "; continuar en 10).
8. Si yi y > 0; entonces a = c; yI = y: 9. Si yi y < 0; entonces b = c: 10. Imprimir x b = c raíz de f (x) = 0; iteración n; Nmax : 11. Fin.
Nota: Si x b ha sido separada utilizando el método de búsqueda del cambio de signo, x b 2 [xi; xd] [a; b] : Previo al punto 1). del algoritmo de bisección de x = xd: Una vez calculado x b, no …nalizar el programa, se designa xi = x y continua la ejecución del programa en la parte correspondiente a la búsqueda del cambio de signo en el resto del intervalo [a; b] : Note además que
Nmax =
"
ln (xd
xi) 10t ln 2
#
+ 1:
Ejemplos
1. Consideremos la ecuación: x 2 R tal que ex precisión " = 10 2 :
x2 = 0: Aproximemos la raíz de la misma con una
Ponemos g (x) = ex ; h (x) = x2 x 2 R: En la …gura siguiente se muestran las grá…cas de las funciones g y h. Además, tales grá…cas se cortan en el punto de abscisa x b 2 [ 1; 0] que muestra que
5.3. MÉTODO DE BISECCIÓN
249
la ecuación dada tiene una solución separada en el intervalo [ 1; 0].
Figura 41 Para " = 10
2
y xi =
1; xd = 0; se tiene " ln (xd xi) Nmax = ln(2)
#
102
+1=
ln(102 ) + 1 = 6: ln(2)
En la tabla siguiente se recogen los datos de la aplicación del algoritmo del método de bisección, donde f es la función real de…nida como f (x) = ex x2 x 2 R: n 1 2 3 4 5 6
a 1: 1: 0;75 0;75 0;75 0;71875
b 0: 0;5 0;5 0;625 0;6875 0;6575
c 0;5 0;75 0;625 0;6875 0;71875 0;703125
f (a) = yi 0;632 0;632 0;901 0;901 0;901 0;029
La raíz aproximada de x b con una precisión " = 10 n = 6, se tiene jf (c6 )j < ".
2. Aproximemos las raíces de la ecuación 2 ln (x + 4)
2
f (c) = y 0;357 0;901 0;145 0;302 0;0292 6;51 10 4
y Nmax = 6 es c =
signo(yi y) +
+ 0;703125. Note que para
x2 = 0 con una precisión " = 10
3:
Sean f (x) = 2 ln (x + 4) x2 ; g (x) = 2 ln (x + 4) y h (x) = x2 . El ,método grá…co muestra que la ecuación f (x) = 0 tiene dos raíces separadas en los intervalos [ 2; 1] y [1; 2]. Sean x b1 2 [ 2; 1] ; x b2 2 [1; 2] las raíces de la ecuación f (x) = 0: En la …gura siguiente se muestran las grá…cas de las funciones g y h así como los puntos de corte de las mismas cuyas abscisas son las raíces de la ecuación f (x) = 0:
Figura 42
250
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES Aproximemos x b1 2 [ 2; 1] utilizando el método de bisección con una precisión " = 10 xi = 2; xd = 1; ln ((xd xi) ") Nmax = + 1 = 9: ln(2)
3.
Se tiene
En la tabla se muestran los resultados de la aplicación del algoritmo del método de bisección. n 1 2 3 4 5 6 7 8 9 Raíz x b1 '
5.4. Sean E
a 2: 1;5 1;5 1;5 1;4375 1;40625 1;390625 1;390625 1;38671875
b 1: 1: 1;25 1;375 1;375 1;375 1;375 1;3828125 1;3828125
c = a+b 2 1;5 1;25 1;375 1;4375 1;40625 1;390625 1;3828125 1;38671875 1;384765625
yi = f (a) 2;614 0;417 0;417 0;417 0;184 0;0713 0;0156 0;0156 0;001776
y = f (c) 0;417 0;461 0;0395 0;184 0;071 0;0156 0;0123 0;001776 0;00513
sign(yi y) +
+ + + +
1;385; f ( 1;385) = 0;0043. Note que jf (c9 )j > ":
Desarrollo de métodos iterativos R con E 6= ; y f una función real de…nida en E. Consideramos el problema (P) siguiente: hallar x b 2 E, si existe, tal que f (b x) = 0:
Suponemos que el problema (P) tiene al menos una solución x b 2 E y que no existe un método directo de cálculo de x b por lo que debemos recurrir a los métodos aproximados. Estos métodos, en la generalidad, son iterativos y tienen la forma siguiente.
Se comienza con x0 2 E. Las aproximaciones sucesivas xn , n = 1; 2; : : : de x b se logra mediante una función e en E e tal que xn+1 = (xn ) n = 0; 1; 2; : : : , donde E e e 6= ;. De este modo se iterativa de E E, E e Algunas cuestiones surgen de esta construcción: ¿es (xn ) convergente construye una sucesión (xn ) E. a la raíz x b de f (x) = 0? ¿qué condiciones ha de veri…acar la función de iteración para que (xn ) sea e ¿cómo construir una función de iteración de convergente a la raíz x b? ¿cómo seleccionar el conjunto E? modo que la sucesión (xn ) converja a x b raíz de f (x) = 0? En la mayoría de casos la función de iteración
aparece por la propia formulación del problema.
Esta sección está destinada a la construcción de funciones de iteración ligadas a métodos numéricos de resolución de ecuaciones no lineales muy conocidos en la literatura. Para ello introduciremos las denominadas funciones o aplicaciones contractivas y un teorema muy importante en análisis, a saber, el teorema de Banach del punto …jo. De…nición 3 Sean E R, E 6= ; y T de E en E una función. Se dice que T es una aplicación contractiva en E si y solo si satisface la siguiente propiedad: 9k;
0
k < 1 tal que jT (x)
T (y)j
k jx
yj
8x; y 2 E.
La constante k de la de…nición precedente es independiente de x e y. Como consecuencia inmediata de la de…nición se tiene que toda aplicación contractiva es uniformemente continua. El recíproco, en general, no es cierto. Sea T una aplicación contractiva y " > 0. De la de…nición se sigue que existe k, 0 8x; y 2 E, jT (x) T (y)j k jx yj < ":
k < 1 tal que
5.4. DESARROLLO DE MÉTODOS ITERATIVOS Elegimos
=
251
" (k 6= 0). Entonces k jx
Observe que
yj <
) jT (x)
T (y)j < ":
> 0 es independiente de x e y. Además, si k = 0 se deduce que T es constante en E.
Por otro lado, si T es contractiva se tiene jT (x)
T (y)j
k jx
yj
8x; y 2 E.
ya que 0 k < 1, esto es, jT (x) T (y)j k jx yj 8x; y 2 E, pero puede suceder esto último sin ser contractiva se verá en un ejemplo propuesto más adelante. Ejemplos 1. Sea E = [1; 0] y T : E ! E la función de…nida por T (x) = 41 x2 : Entonces T es contractiva. En efecto, sean x; y 2 E; entonces jT (x) Como x; y 2 [1; 0], 0
T (y)j = x+y
1 2 x 4
1 2 1 y = j(x + y) (x 4 4
y)j jx + yj jx
yj .
2, luego
jT (x)
T (y)j =
1 jx + yj jx 4
yj
1 jx 2
yj :
La constante k = 12 , T es constractiva. 2. Sean E = R, a 2 R y T la función real de…nida por T (x) = ax x 2 R. Entonces, para todo x; y 2 R se tiene jT (x) T (y)j = jax ayj = jaj jx yj : La función T será contractiva si y solo si jaj < 1: 3. Sean E = [0; 1[ y G la función de E en E de…nida por G (x) = contractiva. Efectivamente, para todo x; y 2 [0; 1[ se tiene jG (x) Como x
G (y)j = p
p
1 + x2 ; y
1 + x2 p
p 1 + y2 = p
x2 1+
1 + y 2 , se sigue que p jG (x)
G (y)j
Si y = 0, se tiene jG (x)
G (0)j =
jx
x2
+
y2 p
1+
y2
=p
x+y p 1 + x2 + 1 + y 2 yj
x p jx 1 + 1 + x2
p
1 + x2 : La función G no es
x+y p jx 1 + x2 + 1 + y 2
yj :
1: Luego,
8x; y 2 [0; 1[ : 0j
8x; y 2 [0; 1[ :
x p ! 1; luego 0 < k (x) < 1 . Resulta k (x) ! 0; k (x) x!+1 1 + 1 + x2 x!0+ 8x 2 [0; 1[, con lo cual jG (x) G (y)j = k (x) jx 0j : De la última igualdad, observamos que no es posible encontrar una constante k con 0 < k < 1 independiente de x. Este ejemplo pone de mani…esto que se veri…ca la desigualdad jG (x) G (y)j jx yj 8x; y 2 [0; 1[, sin ser G contractiva.
Ponemos k (x) =
De…nición 4 Sean E R; E 6= ; y T de E en E una función. Un punto x b 2 E se dice un punto …jo de T si veri…ca la condición T (b x) = x b:
Ejemplos
252
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
1. Sean E = [1; 2] y T de E en E la aplicación de…nida por T (x) = p x = 2 es un punto …jo de T . Pués T
p
2 =
1 2
p
2 2+ p 2
=
p
1 2
x+
2 x
x 2 [1; 2] : El punto
2:
Note que para todo x 2 [1; 2], T (x) 2 [1; 2] : 2. Sea f : [0; 1] ! [0; 1] una función continua en [0; 1]. Existe x b 2 [0; 1] tal que f (b x) = x b: Efectivamente, sea g la función real de…nida por g (x) = x f (x) x 2 [0; 1]. Resulta que g es continua. i. Si x = 0, g (0) =
f (0) :
Si f (0) = 0, resulta que x b = 0 es un punto …jo de f .
Supongamos f (0) 6= 0. Como f (0) 2 [0; 1], se tiene g (0) = ii. Si x = 1, g (1) = 1
f (0) < 0:
f (1) :
Si f (1) = 1, es x b = 1 un punto …jo de f .
Supongamos f (1) 6= 1. Puesto que f (1) 2 [0; 1] se tiene g (1) > 0. Luego, g (0) g (1) < 0 y por el teorema de Bolzano, existe x b 2 [0; 1] tal que 0 = g (b x) = x b f (b x) ; de donde f (b x) = x b, esto es, x b es un punto …jo de f .
El resultado de este ejemplo tiene la siguiente interpretación geométrica. Consideremos las grá…cas de las funciones f y de la identidad I en [0; 1]. Un punto …jo de f es la abscisa del punto de intersección de la grá…ca de f y de la función identidad I en el intervalo[0; 1]. En los grá…cos siguientes se muestran tres situaciones.
Figura 43
Figura 44
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
253
Figura 45
Teorema 3 (De Banach del punto …jo) Sean E R con R 6= ; y E cerrado, T de E en E una aplicación contractiva en E. Entonces, existe un único x b 2 E tal que T (b x) = x b.
Demostración. La demostración de este teorema la dividimos en dos partes. La primera que corresponde a la existencia del punto …jo x b de T y la segunda a la unicidad. i) Existencia. Por hipótesis T es contractiva, entonces existe k, 0 jT (x)
T (y)j
Sea x0 2 E. De…nimos la sucesión (xn )
k jx
yj
k < 1 tal que
8x; y 2 E.
(1)
E como sigue
x1 = T (x0 ) x2 = T (x1 ) .. . xn+1 = T (xn ) ;
n = 0; 1; : : :
Mostremos que la sucesión (xn ) es una sucesión de Cauchy en E. Sean m; n 2 Z+ con m > n y sea p 2 Z+ tal que = n + p. Entonces, por la desigualdad triangular, se tiene jxn xm j = jxn xn+p j jxn xn+1 j + jxn+1 xn 2 j + + jxn+p 1 xn+p j : (2) Por la de…nición de (xn ) y por (1) se tiene jxn
xn+1 j = jT (xn 2
k jxn .. . k n jx0
1)
T (xn )j xn
2
1j
k jxn
1
xn j = k jT (xn
2)
T (xn
1 )j
x1 j :
Luego, jxn
xn+1 j
k n jx0
x1 j
8n 2 Z+ :
(3)
Aplicando (3) en (2), resulta jxn
xm j
k n jx0
x1 j + k n+1 jx0 k n jx0
Sea Sp (k) = 1 + k + (1
x1 j +
+ k n+p jx0
x1 j 1 + k +
x1 j = k n jx0
+ k p + k p+1 +
x1 j (1 + k +
+ kp )
:
(4)
+ k p . Entonces
k) Sp (k) = Sp (k)
kSp (k) = 1 + k +
kp
k + k2 +
+ k p+1 = 1
k p+1 :
254
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
de donde Sp (k) = Como 0
1
k p+1 1 = 1 k 1 k
k p+1 : 1 k
k < 1, l m k p+1 = 0. Luego p!1
p!1
1
p!1
con lo cual
k p+1 1 k
1
l m Sp (k) = l m
k
1 X
=
1
k p = l m Sp (k) = p!1
p=0
p 1
1
lm
k
p!1
1 1
k
1
k
=
1 1
k
;
:
(5)
Remplazando (5) en (4), se obtiene jxn
k n jx0
xm j
x1 j
1 X
kp =
p=0
kn 1
k
Puesto que l m k n = 0 se sigue que 8" > 0, 9n0 2 Z+ tal que 8n n!1
kn < De (6) y (7) resulta jxn
kn
xm j
1
k
1 jx0
jx0
jx0
x1 j :
(6)
n0
k " x1 j x1 j < "
(7)
si m; n
n0 ;
es decir que (xn ) es una sucesión de Cauchy en E y por hipótesis E es cerrado, entonces la sucesión (xn ) tiene límite en E; esto es, existe x b 2 E tal que l m xn = x b: n!1
Puesto que T es contractiva, T es uniformemente continua y por lo tanto continua. Luego l m T (xn ) = T
n!1
l m xn = T (b x) :
n!1
Además, xn+1 = T (xn ) y l mn!1 xn+1 = x b, resulta que
T (b x) = l m T (xn ) = l m xn+1 = x b: n!1
n!1
Así, T (b x) = x b o sea x b 2 E es un punto …jo de T .
ii) Unicidad Probemos que x b 2 E tal que T (b x) = x b es único. Para el efecto, supongamos que existe y 2 E tal que T (y) = y. Mostremos que y = x b: Como T es contractiva, se tiene
jb x
yj = jT (b x)
T (y)j
k jb x
yj ;
de donde jb x yj (1 k) 0; y siendo 0 k < 1, entonces 1 k > 0 y en consecuencia jb x el valor absoluto es no negativo, la única posibilidad es jb x yj = 0 , y = x b:
yj
0. Como
Observaciones
1. El teorema de Banach del punto …jo asegura la existencia de un único punto …jo x b 2 E e la plicación contractiva T de…nida en el conjunto cerrado E de R.
2. Note que la métrica usual d de R está de…nida por d (x; y) =j x y j 8x; y 2 R, admás (R; d) es un espacio métrico completo, esto es, toda sucesión de Cauchy en R es convergente en R. Como E R, E 6= ;, el par (E; d) es un espacio métrico y siendo E cerrado, se prueba que toda sucesión de Cauchy en E es convergente en E, con lo cual (E; d) es un espacio métrico completo.
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
255
El conjunto E = ]0; 1] R no es cerrado. La sucesión (xn ) E con xn = n1 n = 1; 2; : : :, es una sucesión de Cauchy en E que no es convergente en E, pues l m xn = 0 2 = E. Luego (E; d) es un n!1 espacio métrico que no es completo. En los textos de Análisis, el teorema de Banach del punto …jo se enuncia como sigue: Sea (E; d) un espacio métrico completo y T de E en E una aplicación contractiva. Entonces, existe un único x b 2 E tal que T (b x) = x b: El enunciado y la prueba del teorema de Banach del punto …jo que hemos dado está particularizado a subconjuntos cerrados E de R (E 6= ;) provistos de la métrica usual de R. La demostración del teorema de Banach del punto …jo para espacios métricos completos muy generales (E; d) es muy similar a la aquí propuesta con la salvedad que los valores absolutos jx yj = d (x; y) x; y 2 R se remplazan simplemente por d (x; y) con d la métrica en el conjunto E. 3. En la demostración del teorema de Banach del punto …jo se muestra una manera de calcular el punto …jol x b 2 E. Pues se parte de un punto arbitrario x0 2 E y se construye la sucesión (xn ) E tal que xn+1 = T (xn ) n = 0; 1; : : :. Entonces x b = l m xn es el punto …jo de T . De este hecho se n!1
desprende que podemos aproximar el funto …jo x b con una precisión " > 0:
4. La construcción de la sucesión (xn ) tiene la siguiente interpretación geométrica. Sea E R, E 6= ; y E cerrado, T de E en E una aplicación contractiva en E e I la aplicación identidad en E. Por el teorema de Banach del punto …jo, las grá…cas de las funciones T e I se cortan en el punto (b x; T (b x)) = (b x; I (b x)). La abscisa x b 2 E es el punto …jo de T . En las dos …guras que se muestran a continuación se exhiben los puntos xn de la sucesión (xn ) con xn+1 = T (xn ), n = 0; 1; : : :. Se parte de x0 2 E. Se calcula x1 = T (x0 ) ; se proyecta T (x0 ) sobre la recta y = x, como x1 = I (x1 ) se obtiene en el eje X el punto x1 . Nuevamente se calcula x2 = T (x1 ) y se proyecta T (x1 ) sobre la recta y = x, se obtiene en el eje x el punto x2 = I (x2 ). El proceso continua. En la grá…ca que se muestra a continuación se tiene una sucesión creciente que converge a x b
Figura 46
En la grá…ca siguiente se muestran puntos de una sucesión que oscila entorno al punto …jo x b:
256
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 47
En la grá…ca siguiente se muestra una función T que no es contractiva en E y una sucesión (xn ) que, en general, no es convergente.
Figura 48
Ejemplos
1. Sean E = [1; 2] y T de E en E la aplicación de…nida por T (x) = 21 x + x2 x 2 [1; 2] : Entonces, p p b = 2 mediante xn ; T es contractiva en E. Además x b = 2 es el punto …jo de T . Aproximamos x n = 0; 1; : : :, con xn+1 = T (xn ) : Sea x0 = 2 2 E. Entonces
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
1 2 1 T (x1 ) = x2 = 2 1 T (x2 ) = x3 = 2 1 T (x3 ) = x4 = 2 .. .
2 x0 2 x1 + x1 2 x2 + x2 2 x3 + x3
T (x0 ) = x1 =
x0 +
257
1 2 1 = 2 =
2+
2 2
1;5 +
= 1;5; 2 1;5
= 1;4166667;
= 1;414215686; = 1;414213562;
Observamos que 1;414213 : : : es una aproximación de
p
2.
2. Sea E = [0; 1]. La aplicación T de [0; 1] en [0; 1] de…nida por T (x) = cos(x) es contractiva en [0; 1]. Por tanto, existe x b 2 [0; 1] tal que x b = T (b x) = cos(b x); de donde x b cos(b x) = 0: El punto x b 2 [0; 1] solución de la ecuación x cos(x) = 0: 1
3. Sea E = [0; 1[ y T (x) = (x + 1) 3
x 2 [0; 1[. Resulta que T es contractiva en [0; 1[. Luego, 1
b3 existe x b 2 [0; 1[ tal que x b = T (b x) = (b x + 1) 3 ; de donde x de la ecuación x3 x 1 = 0.
x b
1 = 0: El punto …jo x b es solución
Sea f (x) = x3 x 1 x 2 [0; 1[. La grá…ca de f muestra que la ecuación f (x) = 0 tiene una sola raíz x b 2 [0; 1[.Más aún dicha raíz está separada en [1; 2] : Determinemos el valor aproximado de x b: En la tabla siguiente se muestran algunos valores de la sucesión (xn ) con x0 = 1 y xn+1 = T (xn ), n = 0; 1; : : : x T (x)
1 1;2599
1;2599 1;3123
Con n = 7 iteraciones se tiene jxn raíz x b de f (x) = 0, f (x7 ) ' 0:
5.4.1.
1;3123 1;3224
x bj < 5
1;3224 1;3243
10
4.
1;3243 1;3246
1;3246 1;3247
1;3247 : 1;3247
Luego x7 ' 1;3242 es una aproximación de la
Método de punto …jo
Sean I R, con I 6= ; y f una función real de…nida en I. Consideramos la ecuación f (x) = 0. Supongamos que este problema tiene almenos una solución x b 2 I, y que esta ha sido separada en el intervalo [a; b] I. Si f (x) = x T (x) x 2 [a; b]. Entonces f (x) = 0 , T (x) = x: Además, si T es contractiva en [a; b], existe x b 2 [a; b] tal que T (b x) = x b o bien f (b x) = x b T (b x) = 0, es decir que x b es la raíz de la ecuación f (x) = 0: La di…cultad radica en la selección de la función T y del intervalo [a; b] en el que está localizada la raíz x b de f (x) = 0 de modo que la imagen directa T ([a; b]) = [a; b] y T contractiva en [a; b].
Supuesto que la función T de [a; b] en [a; b] es contractiva. El método de iteración de punto …jo se basa en la construcción de la sucesión (xn ) siguiente: elegimos x0 2 [a; b] y de…nimos xn+1 = T (xn ) n = 0; 1; : : : : El algoritmo del método de punto …jo es el siguiente: Algoritmo
Datos de entrada: Nmax número máximo de iteraciones, " > 0 la precisión, T función de [a; b] en [a; b] : Datos de salida: iteración n, valor aproximado xn de x b. 1. Leer x0 2 [a; b] y poner x = x0 : 2. Para n = 0; : : : ; Nmax ; 3. Calcular y = T (x) :
258
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
4. Si jx
yj < ". Continuar en 6).
5. x = y: 6. Si n < Nmax , imprimir “raíz aproximada y de x b en n iteraciones con una precisión " > 0”. Continuar en 8). 7. Imprimir “raíz aproximada y de x b en Nmax iteraciones con precisión " > 0”. 8. Fin.
Ejemplos 1. Encontrar todos los valores de x 2 R tales que sin(x) = x2
1:
x2
De…nimos f (x) = 1 sin(x) y sean '1 (x) = sin(x); '2 (x) = x2 1 x 2 R: En la …gura siguiente se muestran las grá…cas de las funciones '1 y '2 que se cortan en dos puntos: El método grá…co muestra que f tiene dos raíces localizadas en los intervalos [ 1; 0] y [1; 2] :
Figura 49 p 2 2 = 1 + sin(x): Luego x = De la igualdad sin(x) = x 1 se sigue que x 1 + sin(x): De…nimos p T (x) = 1 + sin(x) x 2 [1; 2] : La aplicación T es contractiva (véase el teorema que se enuncia a continuación), y para x0 2 [1; 2] dado; se de…ne xn+1 = T (xn ) n = 0; 1; : : : :En las dos tablas siguientes se muestran los resultados de la aplicación del algoritmo de punto …jo para dos puntos iniciales distintos en [1; 2] :
a).
n 0 1 2 3 4 5
xn 1 1.3570 1.4061 1.4094 1.4096 1.4096
b).
n 0 1 2 3 4
2
xn ' 1;5708 1.4142 1.4199 1.4096 1.4096
Raíz aproximada x e2 = 1;4096 de x b2 : p Pongamos T1 (x) = 1 + sin(x) x 2 [ 1; 0] : La aplicación T es contractiva en [ 1; 0]. Para x0 = 0;5, en 20 iteraciones se tiene x e1 = 0;6367:
2. Encontrar el menor valor x 2 R+ para el cual tan2 (x) = 2x + 1:
Sean f (x) = 2x + 1 tan2 (x) y '1 (x) = tan2 (x); '2 (x) = 2x + 1 para x 2 R+ . El método grá…co muestra que la menor raíz positiva de la ecuación f (x) = 0 está localizada en el intervalo 4 ; 2 : Notemos además que '1 (1) ' 2;43; '2 (1) = 3 y '1 (1;2) ' 6;62; '2 (1;2) = 3;4; luego x b 2 [1; 1;2] : Elegir una función que sea contractiva resulta difícil.
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
259
Teorema 4 Sea T de [a; b] en [a; b] una función derivable en [a; b] : Si jT 0 (x)j k < 1 8x 2 [a; b] ; entonces T es contractiva en [a; b]. Consecuentemente, existe x b 2 [a; b] tal que T (b x) = x b:
Demostración. Sean x1 ; x2 2 [a; b] con x1 < x2 : Entonces jT (x1 )
T (x2 )j = T 0 (x) (x1
donde x [a; b] : Así, existe k; 0
x2 ) = T 0 (x) jx1
x2 j
k jx1
x2 j ;
k < 1 tal que
jT (x1 )
T (x2 )j
k jx1
x2 j
8x1 ; x2 2 [a; b] ;
que prueba que T es contractiva. Por el teorema de Banach del punto …jo, existe 8b x 2 [a; b] tal que T (b x) = x b:
Ejemplo
Sea T (x) =
p
1 + sin(x) x 2 [ 1; 0] : Entonces T 0 (x) =
p
Se deduce que 0< Luego k = p 2 1
cos ( 1) 2
1 sin (1)
cos(x) 2
cos(x)
x 2 [ 1; 0] :
1 + sin(x)
T (x)
2
< 1:
p
cos(x) 1
sin (1)
p 2 1
1 sin (1)
:
Nota: El método de punto …jo es muy limitado en las aplicaciones por la di…cultad de seleccionar una aplicación contractiva, sin embargo ofrece una metodología para construir aplicaciones contractivas como se verá ás adelante.
5.4.2.
Método de punto …jo modi…cado
De…nición 5 Sean E R con E 6= 0 y f una función real de…nida en E. Se dice que f es Lipschisiana o que satisface la condición de Lipschitz si y solo si 9k > 0 tal que jf (x) f (y)j k jx yj 8x; y 2 E: La constante k se llama constante de Lipschitz. Ejemplos 1. Sea f la función real de…nida por f (x) = jxj : Se tiene que f es lipschisiana. En efecto,para x; y 2 R, jf (x)
f (y)j = jjxj
jyjj
jx
yj :
La constante de Lipschitz es k = 1: p 2. La función f de [0; 1[ en [0; 1[ de…nida por f (x) = 1 + x2 es lipschisiana. Esta función se trató anteriormente, se probó que f no es contractiva y que jf (x)
f (y)j
jx
yj
8x; y 2 [0; 1[ ;
que prueba que f es lipschisiana. Teorema 5 Sean c; r 2 R con r > 0 y g uan función real de…nida en [c con constante 0 k < 1 tal que jg (c) cj (1 k) r; entonces i) Para todo x 2 [c
r; c + r] ; g (x) 2 [c
ii) g tiene un único punto …jo x b 2 [c
r; c + r] :
r; c + r] :
r; c + r] : Si g es lipschisiana
260
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Demostración. Por hipótesis g es lipschisiana con constante 0 jg (x) Además, jg (c) jg (x)
cj
(1
g (y)j
k jx
yj
k < 1. Entonces
8x; y 2 [c
k) r y por la desigualdad triangular, se tiene para x 2 [c
cj = jg (x)
g (c) + g (c)
kr + (1
cj
jg (x)
k) r = r:
g (c)j + jg (c)
Así, jg (x) cj r 8x 2 [c r; c + r] que implica g (x) 2 [c directa g ([c r; c + r]) = [c r; c + r] : Sea ge : [c
r; c + r] ! [c
cj
k jx
r; c + r] ; cj + (1
k) r
r; c + r] : En otros términos, la imagen
r; c + r] la función de…nida por ge (x) = g (x)
Entonces ge es contractiva en [c je g (x)
r; c + r] :
8x 2 [c
r; c + r] :
r; c + r]. Pues existe k; 0
ge (y)j = jg (x)
g (y)j
k jx
k < 1 tal que yj
8x; y 2 [c
r; c + r] :
Por otro lado, [c r; c + r] es un conjunto cerrado. Por el teorema de Banach del punto …jo, existe un único x b 2 [c r; c + r] tal que ge (b x) = x b = g (b x) ; es decir que x b es el único punto …jo de g: Sean I
R con I 6= ; y f una función real de…nida en I. Consideramos el problema (P) siguiente: hallar x b 2 I, si existe, tal que f (b x) = 0:
(P)
Supongamos que el problema (P) tiene solución, esto es, existe al menos un x b 2 I tal que f (b x) = 0 y que dicha raíz ha sido separada; o sea existe [a; b] I en el que x b es la sola raíz de la ecuación f (x) = 0:
Como se ha dicho anteriormente, el problema radica en construir una función T que sea contractiva en [a; b] tal que el punto …jo x b de T es la raíz x b de f (x) = 0 y recíprocamente. El siguiente teorema muestra como construir tal función T utilizando f: Teorema 6 Sea f una función real continua en [a; b] tal que f (a) f (b) < 0 y sea x b 2 [a; b] el único número real tal que f (b x) = 0: Además, suponemos que 0 <
=
=
nf
x;y2[a;b] x6=y
sup x;y2[a;b] x6=y
f (x) x
f (x) x
f (y) ; y
f (y) ; y
< :
Entonces, existe una función T de…nida en [a; b] tal que T es lipschisiana con constante 0 T (b x) = x b:
k < ; si x De…nimos m b = 1 f (x) > : ; si x
x 6= y:
f (x) x
f (y) y
1
i. Si m b > 0 entonces m b =
de donde 0
1
m b
1
f (x) x
f (y) y
k < 1 8x; y 2 [a; b] con x 6= y: f (x) f (y) x y
nf
x;y2[a;b] x6=y
261
implica que los cocientes
f (x) x
f (y) < 0 8x; y 2 [a; b] con x 6= y; y f (y) > 0 8x; y 2 [a; b] con x = 6 y: y
: Se tiene, 8x; y 2 [a; b] con x 6= y; 1 f (x) =) m b m b x
=
f (y) y
1;
f (y) 8x; y 2 [a; b] con x 6= y: y
Además, 8x; y 2 [a; b] con x 6= y; f (x) x
f (x) f (y) = y x
0
m b
con lo cual 1 1
ii. Si m b < 0 entonces m b =
f (x) x
f (y) =) m b y
f (y) y
f (x) x
f (y) ; y
= k < 1:
: Para todo x; y 2 [a; b] con x 6= y; se tiene
f (x) x
f (y) y
=
de donde 0 como
m b =1
1
m b
f (x) x
f (y) = y
1
m b
f (x) x
1 f (x) =) m b m b x
f (x) x
f (y) y
f (y) y
1;
f (y) : y
8x; y 2 [a; b] con x 6= y;
se sigue que m b
consecuentemente
0
1
De i) y ii) se concluye que 1 con lo cual
m b
f (x) x
f (x) x
f (y) y
f (x) x
f (y) y
m b
m b
f (y) y jT (x)
que prueba que T (x) = x
1
T (y)j
8x; y 2 [a; b] con x 6= y; 1+m b =1
= k < 1:
= k < 1 8x; y 2 [a; b] con x 6= y; k jx
yj
8x; y 2 [a; b] ;
mf b (x) x 2 [a; b] es lipschisiana con constante 0
Interpretación Geométrica
k < 1:
f (y) conservan y
262
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Sea f una función real continua en [a; b] tal que f (a) f (b) < 0 y sea x b 2 [a; b] la única raíz de la ecuación f (x) = 0: Sea aún =
sup x;y2[a;b] x6=y
8 > <
1
f (x) x
f (y) ; y
f (x) f (y) < 0 8x; y 2 [a; b] con x 6= y; x y m b = > : 1 ; si f (x) f (y) > 0 8x; y 2 [a; b] con x 6= y: x y T (x) = x mf b (x) x 2 [a; b] : ; si
Por el teorema precedente, T es lipschisiana de constante 0
k < 1 y T (b x) = x b; f (b x) = 0:
Sea x0 2 [a; b] y xn+1 = T (xn ) n = 0; 1; : : : : La interpretación geométrica del método iterativo x0 2 [a; b] xn+1 = T (xn ) n = 0; 1; : : : es la siguiente: se trata de aproximar la raíz x b de la ecuación f (x) = 0 mediante la sucesión de puntos de intersección de las rectas de ecuación y=
x
xn + f (xn ) n = 0; 1; : : : m b
con el eje X. Así la recta L1 que pasa por (x0 ; f (x0 )) y tiene pendiente y Entonces, y = 0 () x = x0
f (x0 ) =
1 (x m b
mf b (x0 ) : Ponemos x1 = x0
La recta L2 que pasa por (x1 ; f (x1 )) y que tiene pendiente y con lo cual y = 0 () x = x1
f (x1 ) =
1 (x m b
mf b (x1 ) : Ponemos x2 = x1
x0 ) :
1 con x0 2 [a; b] viene dada por m b
mf b (x0 ) :
1 es m b x1 ) ;
mf b (x1 ) :
Continuando con este proceso obtenemos una sucesión (xn ) que converge a la raíz x b de f (x) = 0:
En el grá…co que se muestra continuación se ilustra este procedimiento.
Figura 50
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
263
Algoritmo x0 2 [a; b] aproximación inicial, se llama método iterativo de punto …jo xn+1 = T (xn ) n = 0; 1; : modi…cado. El problema principal de este método es calcular la constante m. b
El proceso iterativo
Supongamos que la función continua f cambia de signo en el intervalo [a; b], esto es, f (a) f (b) < 0 y que la longitud b a del intervalo [a; b] sea su…cientemente pequeña para que la aplicación T (x) = x mf (x) sea contractiva en [a; b] con m 2 R. En estas condiciones elegimos m como sigue b f (b)
m= con lo cual
b f (b)
T (x) = x
a f (a)
a f (x) f (a)
x 2 [a; b] .
El método iterativo de punto …jo modi…cado queda en la forma ( x0 2 [a; b] aproximación inicial, xn+1 = xn f (b)b fa (a) f (xn ) n = 0; 1; 2;
:
Estimemos el número máximo de iteraciones que se requieren para aproximar x b con una precisión " = 10 t con t 2 Z+ (por ejemplo " = 10 2 ; 10 5 ; 10 6 : : :). En la demostración del teorema de Banach del punto …jo se dedujo la desigualdad jxn
kn
xm j
1
jx0
k
m; n 2 Z+ ; 0 < k < 1:
x1 j
Dejando …jo n y considerando que x b = l m xm , se tiene por la continuidad de la función valor absoluto m!1
l m jxn
m!1
jxn
xm j
x bj
Puesto que x0; x1 2 [a; b] ; jx0
kn
lm
m!1 kn
1
k
x1 j
1
k
jx0
b
jx0
n!1
x bj
b 1
desigualdad, obtenemos
1
k
jx0
x1 j ,
b 1
a n; k k
a n b k = k 1
a l m k n = 0; k n!1 b a n n0 ) k < ": 1 k
entonces para " = 10 t , 9n0 2 Z+ tal que 8n b 1
m!1
kn
a, se sigue que
y como
Para n = n0 podemos asumir que
lm
x1 j :
jxn lm
x1 j , xn
a n0 k k
". Tomando logaritmos en ambos miembros de esta última
n0 ln (k)
ln
" (1 k) b a
;
y como 0 < k < 1, ln (k) < 0. Luego ln n0
"(1 k) b a
ln (k)
:
El número máximo de iteraciones Nmax elegimos como sigue: " ("(1 k)) # ln b a Nmax = + 1; ln (k)
264
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
con [ ] la función mayor entero menor o igual que. x bj < " = 10
Así, jxn
t
n = 1; 2; : : : ; Nmax :
Por el teorema 5, la constante k = 1
resulta difícil de estimar.
Algoritmo Datos de entrada: a; b extremos de [a; b], función f , " = 10 t , Nmax : Datos de salida: Valor aproximado x e de x b, n número de iteraciones. 1. Leer x0 2 [a; b] y poner x = x0 : 2. Calcular m =
b a f (b) f (a) :
3. Para n = 0; : : : ; Nmax : 4. Calcular y = x 5. Si jx
mf (x) :
yj < ". Continuar en 7).
6. x = y: 7. Si n < Nmax , imprimir “raíz aproximada x e = y en n iteraciones”. Continuar en 9). 8. Imprimir “raíz aproximada x e = y en Nmax iteraciones”.
9. Fin.
Ejemplos 1. Calcular el valor aproximado de Sea f (x) =
x4
p 4
2 con 6 cifras decimales de precisión.
2 con x > 0. Entonces f (x) = 0 , x4
p 4
2=0)x=
p 4
2:
La función f tiene a 2 como raíz localizada en el intervalo [1; 1;5]. Además, f (1) = f (1;5) = 5;0625 y f (1) f (1;5) < 0. Tenemos a = 1; b = 1;5. Luego m=
b f (b)
a 1;5 = f (a) f (1;5)
1;
1 = 0;1231: f (1)
El esquema numérico es el siguiente: x0 2 [1; 1;5] aproximació inicial, xn+1 = xn 0;1231f (xn ) n = 0; 1;
:
Tomando x0 = 1, en la tabla de la izquierda se muestran los resultados de la aplicación del esquema numérico. En la tabla de la derecha se muestra la aplicación del mismo esquema numérico pero con otra aproximación inicial x0 = 1;3: n 0 1 2 3 4 .. . 10 11 12
xn 1;0 1;1231 1;173446 1;186241 1;188688 .. .
n 0 1 2 3 4 5 6 7
xn 1;3 1;194614 1;190106 1;189367 . 1;189233 1;189212 1;18907 1;189207
1;189207102 1;189207113 1;189207115; p El valor aproximado de 4 2 con una precisión de 6 cifras decimales es 1;189207. Valor obtenido en una calculadora de bolsillo x e = 1;18927115 : : :
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
265
2. Encontrar todas las raíces reales de la ecuación x3 + 2;1x2 + 32;17x x3
2;1x2
Solución: pongamos f (x) = + Hörner. Se tiene f (x) =
+ 32;17x
23;205 = 0:
23;205 y escribamos f utilizando el esquema de
23;205 + x ( 32;17 + x (2;1 + x)) :
Busquemos las raíces en el intervalo [ 10; 10] (en la sección 6 se precisará como determinar los intervalos en los que están localizadas las raíces reales de polinomios). Sea n = 50, entonces h = 20 50 = 0;4: Aplicamos el algoritmo de búsqueda de cambio de signo. Tenemos x 10 9;6 .. .
f (x) 491;5 405;6 .. .
7;2 6;8 6;4 6;0 .. .
55;9 21;8 6;555 29;4 .. .
x 1;2 0;8 0;4 0 .. .
f (x) 16;7 3;4 10;1 23;205 .. .
x 4;4 4;8 5;2 5;6 .. .
f (x) 38;9 18;6 6;9 38;1 .. .
10
865;1
La ecuación f (x) = 0 tiene 3 raíces localizadas (separadas) en los intervalos [6;8; 6;4], [ 0;8; 0;4], [4;8; 5;2]. Observación: La constante m b está de…nida por (véase teorema 5) ( 1 , si f (x)x yf (y) < 0 8x; y 2 [a; b] con x 6= y; m b = 1 , si f (x)x fy (y) > 0 8x; y 2 [a; b] con x 6= y: con
= Sup
x;y2[a;b] x6=y
f (x) f (y) x y
es equivalente a la siguiente selección
sign m b =
f (x0 ) f (y 0 ) x0 y 0
Sup x;y2[a;b] x6=y
f (x) f (y) x y
donde x0 ; y 0 2 [a; b] con x0 6= y 0 los puntos en los que
;
f (x) f (y) x y
x 6= y, alcanza el valor extremo.
Si la función f es derivable en cada subintervalo en el que está separada cada raíz de f (x) = 0, se sigue que f (x1 ) f (x2 ) = f 0 (x) (x1 x2 ) con x entre x1 y x2 ; de donde
f (x1 ) x1
f (x2 ) = f 0 (x) , x1 6= x2 : x2
Resulta que si f 0 (x) 6= 0 8x 2 [a; b] ; m b =
sign (f 0 (x)) ; Sup jf 0 (x)j
x2[a;b]
con x 2 [a; b] en el que jf 0 (x)j alcanza el valor extremo. Entonces, la aplicación contractiva T está de…nida por T (x) = x mf b (x) x 2 [a; b] :
Calculemos las raíces de f (x) = 0 utilizando m b el estimado con f 0 (x). Tenemos f 0 (x) = 3x2 + 4;2x
32;17 =
32;17 + x (4;2 + 3x) :
266
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES i. Cálculo de x b1 2 [6;3; 6;4] : Se tiene f 0 ( 6;8) = 79;99, f 0 ( 6;4) = 63;83. Luego
f 0 (x) = 79;99;
Sup
x2[ 6;8; 6;4]
con lo cual m c1 =
1 79;99
' 0;013, T (x) = x
0;013f (x) x 2 [6;3; 6;4] :
x0 2 [ 6;8; 6;4] punto inicial, En la tabla siguiente se muestran los xn+1 = T (xn ) n = 0; 1; : resultados de la aplicación del esquema numérico precedente:
Esquema numérico:
xn 6;8 6;517 6;502 6;500 : : : 6;50003 6;500000
n 0 1 2 3 4 5
La solución en el intervalo [6;3; 6;4] es: x b1 =
ii. Cálculo de x b2 2 [ 0;8; 0;4] : Se tiene f 0 ( 0;8) = 33;61; f 0 ( 0;4) =
6;5:
33;37,
Sup x2[ 0;8; 0;4]
jf 0 (x)j, m c2 =
1 33;61
'
0;03 y
T (x) = x + 0;03f (x) x 2 [ 0;8; 0;4] : En la tabla siguiente se muestran los resultados de la aplicación del algoritmo de punto …jo modi…cado: xn 0;8 0;699 0;700008 0;699999 : : : 0;7
n 0 1 2 3 4
La solución en el intervalo [ 0;8; 0;4] es x b2 =
0;7:
iii. Cálculo de x b3 2 [4;8; 5;2] : Estimemos la constante m b 3 . Obtenemos f 0 (4;8) = 57;11; f 0 (50;2) = 70;79; luego m c3 =
1
Sup x2[4;8;5;2]
m c3 ' 0;0141;
T (x) = x
jf 0 (x)j
0;0141f (x)
=
1 ; 7079
x 2 [4;8; 5;2] :
El esquema numérico es el siguiente:
x0 = 4;8; xn+1 = T (xn ) n = 1; 2;
;
En la tabla que se muestra a continuación se resumen los resultados obtenidos en la ejecución del algoritmo precedente. xn n 0 4;8 1 5;063 2 5;098 3 5;0998 4 5;0999 5 5;09999 6 5;09999 7 5;1
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
267
La solución es x b3 = 5;1:
Calculemos ahora las raíces x b1 ; x b2 ; x b3 pero esta vez utilizamos m b dado por m b =
b f (b)
a : f (a)
0;4 i. m c1 = f ( 6;4)0;4f ( 6;8) = 6;555+21;8 = 0;0141: Note la diferencia entre este valor m b 1 y el calculado con la derivada (m b 1 0;013). Se tiene T (x) = x 0;0141f (x). En la tabla siguiente se muestran los términos de la sucesión (xn ); con xn+1 = T (xn ) n = 0; 1; ; con x0 dado:
n 0 1 2 3 4 5 6 Raíz x b1 =
6;5:
ii. Para el cálculo de x b2 , obtenemos m c2 =
xn 6;8 6;493 6;4996 6;4999 6;49999 6;499999 6;5
0;4 = f ( 0;4) f ( 0;8)
0;0296, T (x) = x + 0;0296f (x)
x 2 [ 0;8; 0;4] :
Procediendo como en el caso precedente, tenemos los siguientes resultados: n 0 1 2 3
xn 0;8 0;7000 : : : 0;7000019 0;7
Raíz x b2 = 0;7:
iii. Cálculo de x b3 : Se tiene m c3 = f (5;2)0;4f (4;8) = 0;0157 T (x) = x 0;0157f (x) Como en los casos precedentes, se obtienen los siguientes resultados: n 0 1 2 3 4 5 6
x 2 [4;8; 5;2] :
xn 4;8 5;093 5;1004 5;09997 5;100001 5;099999 : : : 5;1
x b3 = 5;1:
3. Encontrar el menor x b 2 R+ tal que tan2 (b x) = 2b x + 1:
Solución: sean f (x) = 2x + 1 tan2 (x), '1 (x) = tan2 (x), '2 (x) = 2x + 1. El método grá…co muestra que la menor raíz positiva de f (x) = 0 está localizada en el intervalo 4 ; 2 (véase grá…co adjunto).
268
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 51 Más aún, '1 (1;2) ' 6;62, '2 (1;2) ' 3;4. Luego x b 2 [1; 1;2] ;
f (1) ' 0;57; f (1;2) ' 3;22; b a m b = ' 0;0528; f (b) f (a)
y la función contractiva está dada por
T (x) = x + 0;0528f (x)
x 2 [1; 1;2] :
Con x0 = 1, la sucesión (xn ) con xn+1 = T (xn ) n = 0; 1; : : : converge a x b. Con n = 30 iteraciones 3 x b ' 1;05486 con una precisión " = 10 :
5.4.3. Sea I
Método de Newton-Raphson
R, I 6= ; y f una función real de…nida en I. Consideramos el problema (P) siguiente: hallar x b 2 I; si existe, talque f (b x) = 0:
(P)
Suponemos nuevamente que el problema (P) tiene solución; es decir, existe al menos un x b 2 I tal que f (b x) = 0 y que x b ha sido separada, o sea, existe [a; b] I en el que x b es la única raíz de f (x) = 0 allí localizada. El método iterativo de punto …jo presenta los siguientes inconvenientes: i) A partir de f , elegir una función contractiva T: ii) Supuesto que se ha seleccionado una aplicación contractiva T y dado x0 2 [a; b], la sucesión (xn ) de…nida por xn+1 = T (xn ), n = 0; 1; : : : converge muy lentamente. En el método de punto …jo modi…cado, la construcción de la aplicación contractiva T es relativamente sencilla si la longitud del intervalo [a; b] en el que está localizada la raíz es muy pequeña. En tal caso, si f (a) f (b) < 0; b a f (x) x 2 [a; b] T (x) = x f (b) f (a) es contractiva. La constante m =
b a f (b) f (a)
no es la óptima.
La sucesión (xn ) puede converger lentamente para x0 2 [a; b] dado y xn+1 = T (xn ) n = 0; 1; : : : : Note que no se requiere que f sea derivable. Para acelerar la convergencia se utilizará este método en el denominado método se Ste¤ensen que será abordado en una sección posterior de este capítulo.
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
269
En el caso en que la función f sea derivable en [a; b], uno de los métodos más utilizados para aproximar la solución x b de la ecuación f (x) = 0 el método de Newton del que nos ocuparemos en esta sección. En la demostración del teorema 5 se propuso la búsqueda de una constante m tal que 1
m
f (x) x
Se ha supuesto que los cocientes
f (y) y
f (x) x
m b dada por
k < 1 8x; y 2 [a; b] con x 6= y:
f (y) x; y 2 [a; b] con x 6= y conservan el signo de la constante y m b =
jf 0 (x)j
sign (f 0 (x)) ; Sup jf 0 (x)j
x2[a;b]
alcanza el valor extremo (véase ejemplo 2 de la sección 4.2). Si en vez de con x 2 [a; b] en el que buscar una constante global m b en [a; b], se busca m que dependa de cada punto x 2 [a; b], esto es, para cada par de puntos x1 ; x2 2 [a; b] con x1 < x2 ; f (x1 )
f (x2 ) = f 0 (x) (x1 x2 ) con x 2 [x1 ; x2 ] ; f (x1 ) f (x2 ) f 0 (x) = ; x1 x2
se busca m que dependa de x 2 [a; b] y que satisfaga la condición 1
m (x)
f (x1 ) x1
f (x2 ) x2
k < 1 x 2 [a; b] ;
se tiene igualmente una aplicación contractiva. Si se pone m = T (x) = x
1 f 0 (x)
f (x)
1 f 0 (x)
; con f 0 (x) 6= 0; entonces
x 2 [a; b]
es contractiva en [a; b] : La función T es la función de iteración del método de Newton siguiente: 8 < x0 2 [a; b] dado; f (xn ) n = 0; 1; : : : : xn+1 = T (xn ) = xn f 0 (xn )
Interpretación geométrica
Sea x0 2 [a; b]. La ecuación de la recta tangente a la grá…ca de f en el punto (x0 ; f (x0 )) es L (x) = f 0 (x0 ) (x
x0 ) + f (x0 ) :
La recta L corta al eje X en el punto (x1 ; 0), esto es L (x) = 0 () f 0 (x0 ) (x
x0 ) + f (x0 ) = 0 () x = x0
Pongamos x1 = x: Notemos que x1 es un valor aproximado de x b.
f (x0 ) : f 0 (x0 )
La ecuación de la recta tangente a la grá…ica de f que pasa por el punto (x1 ; f (x1 )) es L1 (x) = f 0 (x1 ) (x
x1 ) + f (x1 ) ;
que corta al eje X en (x2 ; 0), en cuyop caso L1 (x) = 0, de donde x = x1
f (x1 ) : f 0 (x1 )
270
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Sea x2 = x. Entonces x2 es un valor aproximado de x b. Continuando con este procedimiento n veces, tenemos
f (xn ) n = 0; 1; : : : ; f 0 (xn )
xn+1 = xn
donde xn+1 es un valor aproximado de la raíz x b de f (x) = 0.
De esta construcción podemos de…nir la función de iteración del método de Newton siguiente
T (x) = x
f (x) x 2 [a; b] ; f 0 (x) 6= 0: f 0 (x)
En la …gura que se muestra a continuación se exhibe el procedimiento que acabamos de describir.
Figura 52
Otra forma de obtener la función de iteración del método de Newton es la siguiente. El desarrollo de Taylor en un entorno de x b raíz de la ecuación f (x) = 0; está dado por 0 = f (x) + f 0 (x) (x x b) de donde
Ponemos
x b=x
T (x) = x
f (x) f 0 (x)
f (x) f 0 (x)
f 0 (x) 6= 0, x 2 [a; b] :
f 0 (x) 6= 0, x 2 [a; b] ;
y se tiene la función de iteración del método de Newton. Observación Supongamos que f tenga dos raíces x b1 ; x b2 en el intervalo [a; b] y que f posea derivada segunda continua en ]a; b[ : Sea [b x1 r; x b1 + r] un entorno cerrado de x b1 y x0 2 [b x1 r; x b1 + r] tal que f 00 (x0 ) = 0, es decir (x0 ; f (x0 )) es un punto de in‡exión de f . Entonces, el método de Newton, en general, no converge a x b1 sino a x b2 o
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
271
bien diverge. Véase la …gura siguiente:
Figura 53
Supongamos que f 00 (b x) = 0, es decir que (b x; f (b x)) = (b x; 0) es un punto de in‡exión de f y que x b es la sola raíz localizada en [a; b] : Sea x0 2 [a; b]. La sucesión (xn ) con xn+1 = xn
f (xn ) f 00 (xn )
n = 0; 1; : : : puede ser divergente.
Figura 54
Estos dos problemas ponen de mani…esto que el método de Newton-Raphson, en general, no converge a x b:
Establezcamos las condiciones que la función f y el punto inicial x0 han de veri…car para que el método de Newton-Raphson sea convergente. Teorema 7 Supongamos que f 2 C 2 ([a; b]) tal que f 0 (x) 6= 0, f 00 (x) 6= 0 8x 2 [a; b] : Si x0 2 [a; b] es una aproximación inicial de x b tal que f (x0 ) f 00 (x0 ) > 0, entonces la sucesión (xn ) generada por la función de iteración T converge a x b: El punto x0 se denomina extremo de Fourier.
Demostración. Notemos que x b 2 [a; b] es la única raíz de f (x) = 0 allí localizada. Se tiene f (a) f (b) < 0: Sin pérdida de generalidad podemos suponer que f (a) < 0 y f (b) > 0; y que f 0 (x) > 0; f 00 (x) > 0
272
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
8x 2 [a; b]; esto es, f es estrictamente creciente y convexa.
Figura 55 Sea x0 2 [a; b] y supongamos que f (x0 ) f 00 (x0 ) > 0. Como f 00 (x0 ) > 0, se sigue que f (x0 ) > 0 y par todo nZ+ , xn > x b y f (xn ) > 0. Probemos por inducción. i) x0 > x b: Puesto que f (b x) = 0 y f es estrictamente creciente, se tiene f (x0 )
con lo cual x0 > x b:
f (b x) = f (x0 ) > 0;
0. Probemos que xn+1 > x b y f (xn+1 ) > 0: Como f 2 C 2 ([a; b]).
ii) Supongamos que xn > x b para n Por el desarrollo de Taylor, se tiene
0 = f (b x) = f (xn ) + f 0 (xn ) (b x
Puesto que f 00 (xn ) > 0, entonces debemos tener
1 00 x 2! f (xn ) (b
xn ) +
1 00 f (xn ) (b x 2!
xn )2 :
xn )2 > 0: Para que la igualdad precedente tenga lugar;
f (xn ) + f 0 (xn ) (b x
xn ) < 0:
Además, por hipótesis f 0 (xn ) > 0. Luego
y multiplicando por
f (xn ) +x b f 0 (xn )
1, obtenemos
xn < 0;
f (xn ) + xn f 0 (xn )
x b > 0:
Entonces
xn+1 = T (xn ) = xn xn+1 de donde xn+1
x b = xn
f (xn ) f 0 (xn )
f (xn ) ; f 0 (xn ) x b > 0;
x b > 0 que implica xn+1 > x b: Por ser f creciente, f (xn+1 )
f (b x) = f (xn+1 ) > 0:
Mostremos que (xn ) converge a x b: Para ello probemos que (xn ) es una sucesión decreciente y acotada. f (x) Como T (x) = x f 0 (x) x 2 [a; b], f 0 (x) > 0, resulta que T es derivable en [a; b] pués f 2 C 2 ([a; b]). Por el teorema del valor medio, tenemos T (xn )
T (b x) = T 0 (tn ) (xn
x b) con x b < tn < xn :
Como xn > x b, xn+1 > x b y por de…nición de (xn ), se tiene T (xn )
T (b x) = xn+1
x b > 0;
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
273
luego T 0 (xn ) (xn Además, f (xn ) > 0, f 0 (xn ) > 0,
f (xn ) f 0 (xn )
x b) > 0 ) T 0 (xn ) > 0 ya que xn > x b:
> 0, y
f (xn ) f (xn ) ) 0 = xn 0 f (xn ) f (xn )
T (xn ) = xn
T (xn ) > 0;
de donde xn
xn+1 > 0 ) xn > xn+1 ;
pues xn+1 = T (xn ) : Así, (xn ) 2 c [a; b] y (xn ) decreciente. Luego (xn ) es convergente. Para completar la prueba, mostremos que l m xn = x b. n!1
Como xn+1 < xn se sigue que xn+1
x b < xn
0<
Pero xn+1
x b. Luego
xn+1 x b < 1: xn x b
x b = T (xn ) T (b x) = T 0 (tn ) (xn xn+1 x b 0 resulta que f (x0 ) > 0 y f 00 (x0 ) > 0 o f (x0 ) < 0 y f 00 (x0 ) < 0: i. Si f (x0 ) y f 00 (x0 ) > 0, f es convexa. Por hipótesis del teorema 6, f 0 (x) 6= 0 8x 2 [a; b], f 0 mantiene el mismo signo en [a; b] dando como resultado que f es estarictamente decreciente en [a; b] o f es estrictamente creciente en [a; b]. En las dos …guras que se muestran a continuación se presentan estas dos situaciones
Figura 56
274
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 57
ii. Si f (x0 ) < 0 y f 00 (x0 ) < 0. Resulta que f es cóncava, estrictamente creciente o estrictamente decreciente.
Figura 58
Figura 59
2. Si f (x0 ) f 00 (x0 ) < 0 entonces f (x0 ) > 0 y f 00 (x0 ) < 0 o f (x0 ) < 0 y f 00 (x0 ) > 0: Supongamos f (x0 ) > 0 y f 00 (x0 ) < 0. Entonces f es convexa. Puede suceder que x1 = T (x0 ) 2 =
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
275
[a; b] :
Figura 60
Figura 61
Teorema 8 Supongamos que f 2 C 2 ([a; b]) y x b 2 [a; b] la única raíz de la ecuación f (x) = 0 allí localizada. Si f 0 (b x) 6= 0, existe r > 0 tal que la sucesión (xn ) generada por el método de Newton converge a x b para todo x0 2 [b x r; x b + r] aproximación inicial de x b: f (x) f 0 (x)
Demostración. Mostremos que la función de iteración T (x) = x [b x r; x b + r] para algún r > 0 y constante 0 < k < 1.
x 2 [a; b] es lipschisiana en
Por hipótesis f 2 C 2 ([a; b]) entonces f 0 es continua en [a; b] : Además f 0 (b x) 6= 0. Existe 0 f (x) 6= 0 para x 2 [b x ;x b + ] [a; b]. De…nimos T (x) = x
f (x) f 0 (x)
x 2 [b x
;x b+ ]:
Como f y f 0 son continuas en [a; b], entonces T es continua en [b x T 0 (x) = 1 Resulta T 2 C 1 ([b x
> 0 tal que
f (x) f 00 (x) [f 0 (x)]2 f (x) f 00 (x) = (f 0 (x))2 (f 0 (x))2
;x b + ]. Por otra parte,
8x 2 [b x
;x b + ]) : Puesto que f (b x) = 0 entonces T 0 (x) =
;x b+ ]:
f (b x) f 00 (b x) = 0. Luego 2 (f 0 (b x))
l m T 0 (x) = T 0 (x) = 0:
x!b x
Sea " > 0, existe r > 0 tal que 8x 2 [b x para 0 < " < 1, existe r > 0 tal que r <
;x b + ] con jx y
T 0 (x) < " < 1 8x 2 [b x y por el teorema del valor medio T (x)
T (b x) = T 0 (t) (x
x bj < r ) jT 0 (x) r; x b + r] ;
x b) con t entre x y x b:
T 0 (b x)j < ": En particular
276
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Entonces jT (x)
T (b x)j = jT (x)
Luego x bj < r , x b
jT (x)
x bj = T 0 (t) jx
x bj < " jx
x bj
r < T (x) < x b + r 8x 2 [b x
"r < r:
r; x b + r] :
jT 0 (x)j
Resulta que la imagen directa T ([b x r; x b + r]) = [b x r; x b + r] y " < 1 8x 2 [b x muesta que T es contractiva. Por el teorema de Banach del punto …jo, para todo x0 2 [b x sucesión (xn ) con xn+1 = T (xn ) n = 0; 1; : : : converge a x b: Ejemplos
1. Sean a > 0, n 2 Z+ . Calculemos
p n
a:
Sea f de [0; 1[ en R la función de…nida por f (x) = xn i) Si 0 < a < 1 entonces f (0) = a < 0, f (1) = 1 x b 2 [0; 1] tal que f (b x) = 0, esto es,
Además, f 0 (x) = nxn
1,
r; x b + r] que r; x b + r], la
f (b x) = 0 , x bn 1) xn
f 00 (x) = n (n
2.
a x 2 [0; 1[ :
a > 0. Por el teorema de Bolzano, existe
a=0)x b=
p n
a:
Se tiene
f 0 (x) > 0, f 00 (x) > 0 8x 2 ]0; 1[ : La función de iteración del método de Newton está de…nida por T (x) = x
f (x) =x f 0 (x)
xn a nxn xn + a 1h = = (1 nxn 1 nxn 1 n
n) x +
a i
xn
1
x 2 [0; 1] :
Sea x0 = 1, x0 es el extremo de Fourier, pues f (x0 ) f 00 (x0 ) > 0: La sucesión (xm ) generada por la 1 función de iteración T es convergente a a n : ii) Si a = 1. Se tiene x b = 1:
iii) Si a > 1, entonces f (1) = 1 a < 0, f (a) = an a > 0. Por el teorema de Bolzano, existe x b 2 [1; a] tal que f (b x) = 0. La función de iteración está de…nida por 1h a i T (x) = (n 1) x + n 1 x 2 [1; a] : n x Para valores de a > 1 su…cientemente grandes, resulta difícil elegir x0 2 [1; a] de modo que la sucesión (xm ) generada por la función de iteración T converja rápidamente.
Sean a > 1 y j 2 Z+ el mas pequeño entero tal que 10 nj a < 1: Ponemos b = 10 nj a y de…nimos 1 1 1 g (t) = tn b. Por i). existe b t 2 [0; 1] tal que g b t = 0 , b t = b n = 10 nj a n = 10 j a n 1 de donde a n = 10j b t. En estas condiciones, con t0 = 1, la sucesión (tm ) de…nida por tm+1 = 1 b 1 1) tm + n 1 t: m = 0; 1; : : : converge a b t y en consecuencia a n = 10j l m tm = 10j b n (n m!1 tm Nota: Un hecho importante del análisis matemático es probar que todo número real es límite de una sucesión de números racionales. Para a 2 Q+ que no sea potencia n-ésima de c 2 Q+ , la función de iteración h a i T (x) = n1 (n 1) x + n 1 x > 0 proporciona una forma de construir sucesiones de números x 1 racionales que convergen a a n 2 = Q+ . Así por ejemplo i. Para a = 2; n = 2; x0 = 2 y xm+1 =
1 2
ii. Para a = 2; n = 5; x0 = 3 y xm+1 = iii. Para a = 5; n = 3; x0 = 3 y xm+1 =
xm +
1 5 1 3
2 xm
. La sucesión (xm ) converge a
p
p 2 , (xm ) converge a 5 2 2 = Q+ : 4 xm p 5 2xm + 2 , (xm ) converge a 3 5 2 = Q+ : xm
4xm +
22 = Q+ :
5.4. DESARROLLO DE MÉTODOS ITERATIVOS 2. Encontrar las raíces de la ecuación e Ponemos f (x) = e
x 4
(2
x)
x 4
(2
277
x)
1 = 0:
1. Entonces
f (x) = 0 , e
x 4
(2
x)
1=0,e
x 4
=
1 2
x
x 6= 0:
El método grá…co muestra que la ecuación f (x) = 0 tiene única raíz localizada en el intervalo [0; 1] ; como se puede observar en la …gura siguiente.
Figura 62
Puesto que f (x) = e f 0 (x) =
x 4
(2 x) 1; 1 x e 4 (6 x) ; 4
x 1 e 4 (10 x) : 16 00 Sea x0 = 0. Entonces f (0) f (0) > 0 con lo cual x0 es el extremo de Fourier. La función de iteración del método de Newton está dada por
f 00 (x) =
T (x) = x
4 2 x e f (x) = x + f 0 (x) 6 x
x 4
x 2 [0; 1] :
Luego, el esquema numérico es xn+1 = T (xn ) n = 0; 1; : : : : En la tabla siguiente se muestran los resultados de la aplicación del método de Newton: n 0 1 2 3 4 5
xn 0 0;666667 0;780646 0;783594 0;783596 0;783596
Sea x0 = 1. Se tiene f (1) f 00 (1) < 0; x0 no es el extremo de Fourier, sin embargo el método converge. A continuación se muestran los resultados de la aplicación del método de Newton: n 0 1 2 3 4
xn 1 0;772779 0;783570 0;783596 0;783596
278
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES Si equivocadamente se elige el punto x0 = 8 2 = [0; 1], se tiene T (x0 ) = 34;778; T (x1 ) = 869;153, T (x2 ) = 1;079 1032 , T (x3 ) over‡ow. Así (xn ) diverge.
3. Hallar las raíces de la ecuación ex (x 2;4055) + 3 = 0. Como en los ejemplos anteriores de…nimos la función real f como sigue: f (x) = ex (x 2;4055) + 3. Entonces f 0 (x) = ex (x 1;4055) ; f 00 (x) = ex (x 0;4055) : El estudio de la función f muestra que la ecuación f (x) = 0 tiene dos raíces ubicadas en los intervalos [0; 1] y [1; 3] como se puede observar en la …gura que se muestra a continuación.
Figura 63 Además,f es convexa si x > 0;4055, cóncava si x < 0;4055: La función de iteración del método de Newton está de…nida por f (x) ex (x 2;4055) + 3 = x f 0 (x) ex (x 1;4055) 2;4055 + x ( 2;4055 + x) 3e x x 6= 1;4055: x 1;4055
(x) = x =
Calculemos los valores aproximados de las raíces x b1 ; x b2 de la ecuación f (x) = 0. Para ello vamos a elegir un punto x0 que sea, en unos casos, el extremo de Fourier, y en otros que no lo sea.
i. Sea x0 = 0. Entonces f (0) f 00 (0) < 0. El punto x0 no es el extremo de Fourier, sin embargo el método converge. A continuación se muestran los resultados del método de Newton: n 0 1 2 3 4 5
xn 0 0;422981 0;405428 0;405430 0;405430 0;405430:
Valor aproximado de x b1 : 0;405430 (precisión " = 10
ii. Sea x0 = 1;3. Se tiene f (1;3) f 00 (1;3) < 0 resultados son los siguientes. n 0 1 2 3 4
6 ).
con lo cual x0 no es el extremo de Fourier. Los xn 1;3 1;428954 1;636376 2;437981 2;152753:
Valor aproximado de x b2 con una precisión " = 10
6
: 2;152753:
5.4. DESARROLLO DE MÉTODOS ITERATIVOS Si en i) se elige x0 = sino a x b2 :
279
2 para aproximar x b1 , la sucesión (xn ) no converge a x b1
1;5 o x0 =
iii. Sea x0 = 1;4. Se tiene f (x0 ) f 00 (x0 ) < 0. Con este punto inicial la sucesión (xn ) es divergente. n 0 1 2 3 Situación análoga si se toma x0 =
xn 1;4 46;911 1;4659 1019 Overf low:
1;3:
iv. Para x0 = 2;4, f (x0 ) f 00 (x0 ) > 0, o sea x0 es el extremo de Fourier. Se tiene n 0 1 2 3 4 5 Para " = 10
5.4.4.
6
xn 2;4 2;131871 2;018683 1;999645 1;999148 1;999148:
el valor aproximado de x b3 es 1;999148:
Método de Newton modi…cado
El método de Newton-Raphson requiere que en cada paso se evalúe f 0 (x) que en muchos casos puede resultar laborioso. Sea x0 un punto inicial para el que f 0 (x) 6= 0 y sea (x) = x
=
1 f 0 (x0 )
: La función de iteración
de…nida por
f (x) se denomina método de Newton modi…cado.
Hemos supuesto que una función f tiene un cero x b separado en [a; b] y que f 0 existe en [a; b] : La sucesión (xn ) generada por el método de Newton modi…cado esta de…nida por x0 2 [a; b] aproximación inicial, xn+1 = (xn ) = xn f (xn ) n = 0; 1; : : : Si x0 es el extremo de Fourier, la sucesión (xn ) generada por xn+1 = sola raíz x b de f (x) = 0:
(xn )
n = 0; 1; : : :, converge a la
Ejemplo
Hallar las raíces reales de la ecuación x3 sin(x) f (x) = x3 sin(x) 1 = 0 x 2 [0; ]. Entonces f (x) = 0 , x3 sin x
1 = 0 en el intervalo [0; ] : Para el efecto, sea
1 = 0 , sin x =
1 x 6= 0 x3
El método grá…co muestra dos raíces de f (x) = 0 ubicadas en los intervalos 1;
2
y [3; ] :
280
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 64 Note que f (1) =
1;158; f
2
= 1;8757; f (3) = 1;81; f ( ) =
1: Además,
f 0 (x) = x2 (3 sin x + x cos x) ; f 00 (x) = x Sea x0 =
2
x2 sin x + 6x cos x
6
:
' 1;5708. Entonces f (x0 ) f 00 (x0 ) > 0, x0 es el extremo de Fourier. Ponemos =
La función de iteración tiene
1
1 ' 0;1351: 7;4022
=
f 0 (x0 )
del método de Newton modi…cado está dada por x0 = 2 ; (xn ) n = 0; 1;
xn+1 =
Para el cálculo de la segunda raíz elegimos x0 = . Entonces f 0 ( ) = 1
0;1351f (x) : Se
:
En 18 iteraciones se logra x b1 = 1;278283055: =
(x) = x
3;
resulta
1
=
' 0;03225; 3 ) (x) = x + 0;03225f (x) : f0 (
Par n = 10 se tiene x b2 = 3;072589665:
5.4.5.
Método de las secantes
Sea f 2 C ([a; b]) tal que f (a) f (b) < 0. Por el teorema de Bolzano, existe x b 2 [a; b] tal que f (b x) = 0. Supongamos que x b es la única raíz allí localizada. Para evitar el problema de la evaluación de la derivada en el método de Newton, podemos obtener una variable de éste. Por de…nición f 0 (xn
1)
=
Con esta aproximación de la derivada f 0 (xn xn = xn
lm
x!xn 1 ),
1
f (xn 1 ) xn 1
f (xn xn 2
:
el método de Newton se expresa en la siguiente forma: 1
1
2)
f (xn 1 ) f (xn xn 1 xn 2
2)
f (xn
1)
5.4. DESARROLLO DE MÉTODOS ITERATIVOS o bien xn = xn
xn 1 f (xn 1 )
1
281
xn 2 f (xn
2)
f (xn
1)
n = 2; 3; : : :
(*)
La aproximación de la raíz x b de la ecuación f (x) = 0 utilizando la fórmula (*) se llama método de las secantes. Interpretación geométrica
Sean x0 ; x1 2 [a; b] tales que f (x0 ) f (x1 ) < 0. La ecuación de la recta que pasa por los puntos (x0 ; f (x0 )), (x1 ; f (x1 )) viene dada por L1 (x)
f (x1 ) =
f (x1 ) x1
Luego, L1 (x) = 0 , x = x1
f (x0 ) (x x0
x1 f (x1 )
x1 ) :
x0 f (x1 ) : f (x0 )
Sea x2 = x. La ecuación de la recta que pasa por (x1 ; f (x1 )), (x2 ; f (x2 )) está de…nida por L1 (x)
f (x2 ) =
f (x2 ) x2
f (x1 ) (x x1
L2 (x) = 0 , x = x2
x2 ) ;
x2 f (x2 )
x1 f (x2 ) : f (x1 )
Sea x3 = x. Continuando con este procedimiento, obtenemos xn+1 = xn
xn xn 1 f (xn ) f (xn ) f (xn 1 )
n = 1; 2;
En la grá…ca siguiente se muestra el procedimiento previamente descrito.
Figura 65
Ejemplo Hallar la raíz positiva de la ecuación esin(x) Sea f (x) = esin(x)
2 . 1+x2
2 1+x2
= 0:
Entonces f 0 (c) = esin(x) cos(x) +
4x (1 + x2 )2
:
:
282
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Este es un ejemplo de una función f cuyo estudio de f conduce a resolver las inecuaciones f 0 (x) > 0; f 0 (x) < 0 y a la ecuación f 0 (x) = 0 más complicadas que la ecuación f (x) = 0: Puesto que 2 2 = 0 , esin(x) = : 1 + x2 1 + x2
f (x) = 0 , esin(x) Sean '1 (x) = esin(x) , '2 (x) = de '1 y '2 :
2 : 1+x2
En la …gura que se muestra a continuación se exhiben las grá…cas
Figura 66
La búsqueda del cambio de signo con un paso h = 0;2 en el intervalo [0; 1[ muestra que f (x) = 0 tiene una sola raíz en [0; 1[ ubicada en el intervalo [0;4; 0;6] : x f (x)
0 1
0;2 0;7
0;4 0;25
0;6 0;29
Ponemos x0 = 0;4; x1 = 0;6, y0 = f (0;4) = 0;24802; y1 = f (0;6) = 0;28823: En la tabla siguiente se muestran los resultados de la aplicación del método de las secantes: n 0 1 2 3 4 5 Valor aproximado de x b con una precisión " = 10
xn 0;4 0;6 0;49250 0;49435 0;49438 0;49438: 5
: 0;49438:
Algoritmo
Datos de entrada: aproximaciones iniciales x0 ; x1 2 [a; b], " = 10 t , Nmax número máximo de iteraciones, función f . Datos de salida: x b, n número de iteraciones.
1. y0 = f (x0 ) : 2. y1 = f (x1 ) :
3. n = 2; : : : ; Nmax : 4. x = x1 5. Si jx
x1 y1
x0 y0 : y0
x1 j < ", continuar en 7).
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
283
6. x0 = x1 : y0 = y 1 : x1 = x: y1 = f (x) : 7. Si n < Nmax , imprimir x; n. Continuar en 9). 8. Si n = Nmax , imprmir x; f (x) : 9. Fin.
5.4.6.
Método regula-falsi
Sean I
R con I 6= ; y f una función real de…nida en I. Consideramos el problema (P) siguiente: hallar x b 2 I, si existe tal que f (b x) = 0:
Supongamos que (P) tiene solución y que mediante la aplicación del algoritmo de búsqueda del cambio de signo se ha separado una única raíz x b 2 [a; b] I: El método de las secantes no puede ser escrito en la forma x0 2 [a; b] aproximación inicial, xn+1 = ' (xn ) , n = 0; 1; : : : ; donde ' es una función de iteración sobre [a; b] : El método regula-falsi es una combinación del método de las secantes y un análogo al método de bisección. Se le conoce también como método de las cuerdas o de la falsa posición. Sean an ; xn 2 [a; b] tales que f (xn ) f (an ) < 0 n = 0; 1; : : :, donde an ; xn son determinados en cada paso de modo que solo en uno de los intervalos [xn ; an ] o [an ; xn ] está localizada la única raíz x b de f (x) = 0:
Para de…nir an+1 ; xn+1 consideramos la ecuación de la recta que pasa por los puntos (xn ; f (xn )) y (an; f (an )) : f (xn ) f (an ) L (x) = f (xn ) + (x xn ) : xn an Luego xn an f (xn ) : L (x) = 0 () x = xn f (xn ) f (an ) Sea un = x: Puesto que f (xn ) f (an ) < 0 entonces f (xn ) f (an ) 6= 0 con lo cual xn an un = f (xn ) ; f (xn ) f (an ) esta bien de…nido. Se tiene an < un < xn o xn < un < an . En las …guras que se muestran a continuación se presentan estos dos casos.
Figura 67
284
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Figura 68
Supongamos que se tenga an < un < xn : se tienen las tres situaciones siguientes. i) Si f (un ) = 0 entonces x b = un es la raíz buscada y el procedimiento concluye.
ii) Si f (un ) f (xn ) < 0 entonces an+1 = un ; xn+1 = xn :
iii) Si f (un ) f (xn ) > 0 entonces an+1 = an ; xn+1 = un : El procedimiento que acabamos de describir tampoco puede expresarse en la forma: x0 2 [a; b] aproximación inicial, xn+1 = ' (xn ) n = 0; 1; : : : ; donde ' es una función de iteración de…nida en [a; b]. Sin embargo, si x0 2 [a; b] es el extremo de Fourier, esto es, supuesto que f 00 (x0 ) existe, f (x0 ) f 00 (x0 ) > 0; se de…ne ' (x) = x
x f (x)
x0 f (x) f (x0 )
x 2 [a; b] con f (x) f (x0 ) < 0;
con lo cual ' es una función de iteración de…nida en un subconjunto E de [a; b] en el que puede hacerse ' una aplicación contractiva, resultando que la sucesión (xn ) generada por x0 2 [a; b] extremo de Fourier, xn+1 = ' (xn ) n = 1; 2; : : : ; con x1 2 [a; b] tal que f (x1 ) f (x0 ) < 0, converge a x b raíz de f (x) = 0:
Note que si x0 es el extremo de Fourier, se tiene f (x0 ) f 00 (x0 ) > 0: En el primer caso se tiene que f es convexa y en el segundo f es cóncava. Supongamos que x0 < x1 (f (x0 ) f (x1 ) < 0) : Si f es convexa se tiene f (u1 ) < 0; luego x b 2 [x0 ; u1 ] y a2 = x0 ; x2 = u1 : Si f es cóncava, se tiene f (u1 ) > 0; luego x b 2 [x0 ; u1 ] y a2 = x0 ; x2 = u1 :
En la …gura de la izquierda se muestra el primer caso (f es convexa) y en la de la derecha se muestra el
5.4. DESARROLLO DE MÉTODOS ITERATIVOS
285
caso en que f es cóncava.
Figura 69
Figura 70
Algoritmo Datos de Entrada: a; b extremos del intervalo [a; b] ; precisión " > 0; función f , número máximo de iteraciones Nmax : Datos de Salida: n número de iteraciones, x e aproximación de x b; f (e x) : 1. x0 = a: 2.. x1 = b: 3. Para n = 2; : : : ; Nmax : 4. u = x1 5. ju
x1 f (x1 )
x0 f (x1 ) == f (x0 ) f (x1 ) < 0: f (x0 )
x1 j < " continuar en 9).
6. f (u) = 0 continuar en 9). 7. f (x0 ) f (u) < 0 entonces x1 = u: Continuar en 4). 8. f (x0 ) f (u) > 0 entonces x0 = u; x1 = b: Continuar en 4).
286
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
9. Si n < Nmax ; x e = u: Continuar en 11).
10. “b x = u en n iteraciones”. Continuar en 11). 11. Fin. Ejemplos
1. Hallar las raíces reales de la ecuación x3
3x2 + 2x
6 = 0:
Sea f (x) = x3 3x2 + 2x 6 = 0: Con un paso h = 0;5; el algoritmo de búsqueda de cambio de signo, muestra que la ecuación f (x) = 0 tiene una sola raíz localizada en el intervalo [2;5; 3;5] : Sean x0 = 2; 5; x1 = 3; 5: Entonces f (2;5) = 4;125; f (3;5) = 7;125: Los resultados de la aplicación del algoritmo precedente se muestran en la tabla siguiente: n 2 3 4 5 6 7 8 9
xn 2;86667 3;09889 2;99272 2;99962 3;00607 2;99999 2;99999 3;0:
2. Encontrar las dos mas pequeñas raíces positivas de la ecuación x2 jsin(x)j
4 = 0:
Ponemos f (x) = x2 jsin(x)j 4 = 0 x 2 [0; 1[ : Para h = 0;2, el algoritmo de búsqueda de cambio de signo muestra la existencia de una raíz localizada en el intervalo [3;2; 3;6] y otra en [6;2; 6;4]. En la tabla de la izquierda se muestran los resultados de la aproximación de x b1 2 [3;2; 3;6] y a la derecha, de x b2 2 [6;2; 6;4] : x0 = 3;4; x1 = 3;5 n 2 3 4 5 6 7 8
5.5.
xn 3;47522 3;52215 3;47846 3;47851 3;47856 3;47851 3;47851
x0 = 6;2; x1 = 6;4 xn n 2 6;30204 3 6;35202 4 6;37650 5 6;38849 6 6;38155 7 6;38156 8 6;38157 9 6;38156
Convergencia. Convergencia acelerada
En esta sección estudiamos el orden de convergencia de los métodos que hemos tratado previamente, es decir que determinaremos la rapidez con la que la sucesión (xn ) generada por el método numérico utilizado converge a la raíz x b de la ecuación f (x) = 0. Sea I R, I 6= ;, f una función real de…nida en I. Suponemos que existe una única raíz x b 2 [a; b] de f (x) = 0:
I
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
287
De…nición 6 Sea (xn ) una sucesión que converge a x b raíz de la ecuación f (x) = 0: i. Ponemos %n = xn
x b n = 0; 1; : : : ; %n se llama error de la n-ésima iteración.
%n+1 b de orden p = c; entonces (xn ) se dice convergente a x n!1 j%n j p, con un error asimptótico constante c:
ii. Si existen p > 0; c > 0 tales que l m
iii. Un método numérico se dice convergente de orden p si la sucesión (xn ) generada por tal método converge a la raíz x b es de orden p:
Para p = 1; (xn ) se dice convergente a x b de orden 1 o que el método converge linealmente. Para p = 2; (xn ) se dice convergente a x b de orden 2 o que el método converge cuadráticamente. Supongamos que la sucesión (xn ) es generada por una función de iteración ' 2 C p+1 ([a; b]) para p 2 Z+ , esto es, (xn ) está generada por el siguiente esquema numérico: x0 2 [a; b] aproximación inicial, xn+1 = ' (xn ) n = 0; 1; : : : : Para determinar el orden de convergencia podemos utilizar el polinomio de Taylor con resto entorno a la raíz x b 2 [a; b] : Sea xn 2 [a; b] n = 0; 1; : : : Supongamos que '(k) (b x) = 0 para k = 1; 2; : : : ; p Entonces p X '(k) (b x) ' (xn ) = (xn x b)k + Ep (xn ; x b) ; k!
1 pero '(p) (b x) 6= 0:
k=0
con Ep (xn ; x b) ! 0: n!1
Puesto que ' (b x) = x b; ' (xn ) = xn+1
n = 0; 1; : : : ; y '(k) (b x) = 0 para k = 1; : : : ; p
xn+1 = ' (b x) +
de donde
'(p) (b x) (xn p!
1; se tiene
x b)p + Ep (xn ; x b) ;
xn+1 x b '(p) (b x) 1 = + Ep (xn ; x b) : p (xn x b) p! (xn x b)p
De la formula integral del error Ep (xn ; x b) y de la forma de Lagrange del resto, se tiene Z xn 1 1 Ep (xn ; x b) = (xn t)p '(p+1) (t) dt = '(p+1) (cn ) (xn x b)p+1 ; p! xb (p + 1)! para cn en el intervalo cerrado que une xn con x b; l m cn = x b: Resulta que n!1
%n+1 '(p) (b x) xn x b (p+1) = + ' (cn ) : p p! (p + 1)! %n
Tomando en cuenta que l m xn = x b y de la continuidad de '(p+1) ; se sigue que n!1
%n+1 '(p) (b x) 1 = + l m (xn p n!1 %n p! (p + 1)! n!1 lm
x b) '(p+1)
l m cn =
n!1
'(p) (b x) : p!
Así, si ' 2 C p+1 ([a; b]) ; la sucesión (xn ) generada por ' convergente a x b es de orden p:
Si ' 2 C p ([a; b]) y si se supone que Ep (x; x b) = 0 jx
x bjp+1 ; esto es, Ep (x; x b) ! 0; se tiene
%n+1 '(p) (b x) = + 0 (jxn p p! %n
x!b x
x bj) ;
288
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
con lo cual
%n+1 '(p) (b x) : p = n!1 %n p! lm
Nota: Existen muchas sucesiones (xn ) que son generadas por esquemas numéricos que no se expresan mediante funciones de iteración ': Un ejemplo de esta clase de sucesiones son las que provienen del método de las secantes. A continuación estudiamos el orden de convergencia de los métodos numéricos que hemos tratado. 1. Método del punto …jo En este método y en los que siguen, suponemos que x b 2 [a; b] es la única raíz de la ecuación f (x) = 0: Supóngase que ' 2 C 1 ([a; b]) y (xn ) la sucesión de…nida por k < 1 tal que j'0 (x)j
Supongamos además que existe k; 0
x b = ' (xn )
%n+1 = xn+1 con cn entre xn y x b. Luego
x0 2 [a; b] aproximación inicial, xn+1 = ' (xn ) n = 0; 1; : : : : k 8x 2 [a; b] : Entonces
' (b x) = '0 (cn ) (xn
x b) = '0 (cn ) %n ;
%n+1 = '0 (cn ) : %n
Como ' (xn ) ! ' (b x) = x b, se tiene l m '0 (cn ) = '0 (b x). Resulta n!1
lm
n!1
%n+1 = l m '0 (cn ) = '0 (b x) : n!1 %n
Si '0 (b x) 6= 0, el método de punto …jo converge linealmente.
Si '0 (b x) = 0, se puede tener un orden de convergencia más elevado. Así, si ' 2 C 2 ([a; b]) tal que '00 (b x) 6= 0, entonces ' (x) = ' (b x) + '0 (b x) (x con cx entre x y x b.
x b) +
1 00 ' (cx ) (x 2!
Para x = xn , se tiene ' (xn ) = xn+1 , ' (b x) = x b, '0 (b x) = 0, luego xn+1 = x b + '0 (b x) (xn
%n+1 %n
=
1 00 ' (cn ) ; 2!
con lo cual
x b) +
x b)2
1 00 ' (cn ) (xn 2!
x 2 [a; b] ;
x b)2 ;
%n+1 1 = '00 (b x) : n!1 %n 2! lm
En este caso el método numérico converge cuadráticamente. 2. Método de punto …jo modi…cado En este método la función de iteración ' está de…nida por ' (x) = x mf b (x) f 2 C ([a; b]) ; donde m b está de…nido por ( 1 , si f (x)x fy (y) < 0 8x; y 2 [a; b] ; x 6= y; m b = 1 , si f (x)x yf (y) 8x; y 2 [a; b] ; x 6= y; =
Sup
x;y2[a;b] x6=y
f (x) x
f (y) : y
x 2 [a; b] con
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
289
' es contractiva, y el esquema numérico está dado por x0 2 [a; b] aproximación inicial, xn+1 = ' (xn ) n = 0; 1; : : : Se tiene xn+1
x b = ' (xn )
m b [f (xn )
%n+1 = %n
mf b (xn )
' (b x) = xn
f (b x)]
(b x
n = 1; 2; : : :
Supongamos xn 6= x b n = 0; 1; : : :, entonces %n+1 %n %n+1 %n
donde 0 <
=
Inf
x;y2[a;b] x6=y
= 1 =
f (x) f (y) x y
1
mf b (b x)) = xn
f (xn ) f (b x) f (xn ) =1 m b %n xn f (xn ) f (b x) 1 < 1; m b xn x b
m b
x b
m b (f (xn )
f (b x)) ;
f (b x) x b
: En consecuencia,
lm
n!1
%n+1 =1 %n
;
con lo cual el método de punto …jo modi…cado es de orden 1, o sea la sucesión (xn ) converge a x b linealmente.
3. Método de Newton-Raphson
Supongamos que f 2 C 3 ([a; b]). La función de iteración del método de Newton-Raphson está dada por f (x) ; f 0 (x) 6= 0 x 2 [a; b] : ' (x) = x f 0 (x) Entonces (f 0 (x))2 f (x) f 00 (x) f (x) f 00 (x) '0 (x) = 1 = x 2 [a; b] : [f 0 (x)]2 [f 0 (x)]2 Para x = x b, se tiene f (b x) = 0 y
'0 (b x) =
f (b x) f 00 (b x) = 0: 2 [f 0 (b x)]
Calculemos la derivada segunda de ' (esta existe ya que f 2 C 3 ), obtenemos '00 (x) = Para x = x b, resulta '00 (b x) =
Luego,
f (x) f 0 (x) f 000 (x) + [f 0 (x)]2 f 00 (x) [f 0 (x)]4
f (b x) f 0 (b x) f 000 (b x) + [f 0 (b x)]2 f 00 (b x) 4 0 [f (b x)] %n+1 f 00 (b x) = ; 0 n!1 %n [f (b x)]2 lm
2f (x) [f 00 (x)]2
2f (b x) [f 00 (b x)]2
f 0 (b x) 6= 0;
=
x 2 [a; b] :
f 00 (b x) 6= 0: 0 [f (b x)]2
f 00 (b x) 6= 0:
El método de Newton es de segundo orden. Si f 2 C 2 ([a; b]) y f 00 (b x) 6= 0, se prueba que %n+1 = xn+1 con cn entre xn y x b. Resulta
x b=
1 f 00 (cn ) (xn 2 f 0 (xn )
%n+1 1 f 00 (cn ) = ; %2n 2 f 0 (xn )
x b)2 =
1 f 00 (cn ) 2 % ; 2 f 0 (cn ) n
n = 1; 2; : : :
290
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
4. Método de la secantes Sean f 2 C 2 ([a; b]) ; x0 ; x1 2 [a; b] tales que f (x0 ) f (x1 ) < 0. En el método de las secantes se construye una sucesión (xn ) de…nida por xn f (xn )
xn+1 = xn
xn 1 f (xn
1)
f (xn )
Supongamos que para todo n; xn 6= x b. Entonces xn+1
De…nimos
x b = xn
xn f (xn )
x b
xn 1 f (xn
f (xn ) xn
L (x) = f (xn ) + Se tiene, L (xn ) = f (xn ) y L (xn
1)
1)
f (xn ) = (xn
= f (xn
f (xn xn 1
1)
n = 2; 3; : : :
xn f (xn ) xn x b f (xn )
x b) 1 (x
xn 1 f (xn
1)
:
(1)
xn ) x 2 [a; b] :
1 ),
es decir que L es un interpolante de f . Luego, h i f (x) = L (x) + " (x) x 2 e a; eb ;
con e a = m nfxn 1 ; xn g, eb = maxfxn 1 ; xn g y " (x) el error de interpolación en x (error de interpolación polinomial de Lagrange). Para x = x b, se tiene Se prueba que " (x) =
1 2
(x
xn
f (x) = f (xn ) + y para x = x b, se tiene
0 = f (b x) = f (xn ) +
de donde
Además,
0 = f (b x) = L (b x) + " (b x) : h i xn ) f 00 ( ) x 2 e a; eb 1 ) (x f (xn ) xn
f (xn ) xn xn x b f (xn ) 1.
1)
(x
f (xn ) f (xn 1 ) (b x xn xn 1 xn 1 f (xn
f (xn )
con tn entre xn y xn
f (xn xn 1
1=
1)
f (xn
1)
xn ) +
xn ) +
h i 2 e a; eb . Así,
1 (x 2
1 (b x 2
1 xn 2 f (xn )
xn
xn
xn 1 f (xn
= f 0 (tn ) (xn
xn
1) f
x 1 ) (b
1)
x b=
consecuentemente
1 (xn 2
%n+1 =
x b) (xn
1 % % 2 n n
1
x b)
1
1) ;
f 00 ( ) ; f 0 (tn )
f 00 ( ) : f 0 (tn )
Por hipótesis f 2 C 2 ([a; b]), entonces 0<
f 00 ( ) 1 f 00 ( xb) 1 = lm 2 n!1 f 0 (tn ) 2 f 0 (b x)
c;
se sigue que %n+1
c j%n j %n
1
:
Sea En = c j%n j. Multplicando por c en la desigualdad precedente, resulta En+1
En En
1
n = 2; 3; : : :
( );
xn ) f 00 ( ) ;
f 00 ( ) :
Luego xn+1
00
(2)
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
291
Supongamos que E0
;
E1
con 0 <
E1 E0
2
E2 E1
2
E3 E2
3
2
E5
E4 E3 .. .
5
3
Ek
ak
E2 E3 E4
< 1. Luego
; 3
=
;
=
5
;
=
8
;
;
donde (ak ) es la sucesión de Fibonacci de…nida por a0 = a1 = 1;
ak+1 = ak + ak
k
1
1:
(3)
La ecuación (3) es una ecuación en diferencias homogénea de segundo orden, ak+1 cuya ecuación característica es
2
1
ak
1
c1
1
1
p1 5 2
c1
+ c2
k 1 1
k = 1; 2; : : :
+ c2
k 1 2
2;
2 1
c1
+ c2
c2
p k 1+ 5 2
=
1
ak
Ek y como j
1j
=
1
5
2
2 ; : : : :Como 2
p 5 p 2 5 p
1
5
k
2
p
p1 5
=
k 2
1 p 5
k 1
k 2
=
5 que es conocida como la fórmula de Binet. Consecuentemente
p
(4)
c + c2 = p1; + c2 1+2 5 = 1;
p 1+ 5 c1 = p ; 2 5 ak = c1
=0
1 = 0 y cuya solución es p p 5 1+ 5 1 ; : = 2 = 2 2
Las soluciones de (4) son: c1 + c2 ; c1 1 + c2 2 = a2 , se tiene ( de donde
ak
;
< 1, se sigue que 1 p 5
de donde Ek
k 1
k = 2; 3; : : : 1 p 5
k 2
k = 2; 3; : : :
Si lm
n!1
%n+1 jxn+1 x bj = c; p =c, lm n!1 jxn x bj j%n jp
se sigue que para " > 0, e c=c+" y %n+1
En+1 con lo cual p =
p 1+ 5 2
' 1;618:
e c j%n jp = e c j%n j %n e cEnp = e cEn En
El método de las secantes es de orden p ' 1;618:
1
1
c
; 1 p 5
2
k 2
;
p
k 1
5
;
c1 + c2 = a1 y
292
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES El método de las secantes es uno de los métodos de interpolación para calcular las raíces de ecuaciones. En cada paso del método de las secantes requiera la evaluación adicional de la función f . Dos pasos del método de las secantes es algo más costoso que un paso del método de Newton. Además, dos pasos del método de las secantes conducen a un método de orden p ' 1;618 : : : que hace que converja localmente mas rápidamente que el método de Newton. La ventaja de este método radica en que no requiere del cálculo de la derivada de la función f , pero requiere, como se ha dicho, de una evaluación adecional de la función f en cada paso.
5. Método regula-falsi Este método es también uno de los métodos de interpolación para calcular las raíces de la ecuación f (x) = 0. En el siguiente teorema se considera una variante de este método. Teorema 9 Sean f 2 C 2 ([a; b]) y x b 2 [a; b] la única raíz de la ecuación f (x) = 0. Supongamos que x1 < y tales que f (x1 ) ; f (y) > 0 y f 00 (x) 0 8x 2 [a; b]. Entonces i. La sucesión (xn ) generada por la función de iteración ' de…nida por y f (y)
' (x) = x
x f (x) f (x)
x 2 [x1 ; y[
converge a x b: ii. (xn ) converge linealmente.
Demostración.
i. La ecuación de la recta L que pasa por (x1 ; f (x1 )) ; (y; f (y)) esta dada por L (x) = f (x1 ) +
f (y) y
f (x1 ) (x x1
x1 )
x 2 [x1 ; y] :
Se tiene L (x1 ) = f (x1 ) ; L (y) = f (y) con lo cual L es una interpolante de f , más exactamente, tal como en el caso del método de las secantes, L es un caso particular de polinomio de interpolación de Lagrange (L es un polinomio de grado 1). De la fórmula de interpolación con error f (x) = L (x)+" (x) x 2 [x1 ; y] ; con " (x) el error de interpolación en el punto x, de…nimos F (x) = f (x)
L (x) + k (x
x1 ) (x
y)
x 2 [x1 ; y] ;
donde k es una constante a determinarse por la condición f (x) = 0 para x 2 [x1 ; y] : Puesto queL (x1 ) = f (x1 ) ; L (y) = f (y), se sigue que F (x1 ) = F (y) = F (x) = 0, entonces F tiene tres raíces en [x1 ; y]. Además F es derivable, y F 0 (x) = f 0 (x) Por el teorema de Rolle, existen
1; 2
L0 (x) + k (2x
x1
2 [x1 ; y] tales que
1
y)
<
2
x 2 [x1 ; y] : y
F 0 ( 1 ) = F 0 ( 2 ) = 0: Por otro lado, F 00 (x) = f 00 (x) y como L00 (x) = 0, se tiene
L00 (x) + 2k
F 00 (x) = f 00 (x) + 2k
Nuevamente, por el teorema de Rolle, existe
2 [ 1;
2]
x 2 [x1 ; y]
x 2 [x1 ; y] : tal que
F 00 ( ) = 0; entonces 0 = F 00 ( ) = f 00 ( ) + 2k ) k =
f 00 ( ) : 2
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
293
Consecuentemente F (x) = f (x)
1 (x 2
L (x)
y) f 00 ( )
x1 ) (x
x 2 [x1 ; y]
y para x = x 2 [x1 ; y] se tiene 0 = F (x) = f (x) f (x) Por hipótesis f 00 ( )
0;
x1
x
L (x) 1 (x 2
L (x) =
y)x
x1
1 (x 2
1 (x 2 x1 ) (x
0; x
y
y) f 00 ( ) : 0, entonces
y) f 00 ( )
x1 ) (x
y) f 00 ( ) ;
x) (x
0;
y de esta desigualdad se deduce que f (x)
L (x)
0 , f (x)
L (x) :
En particular, si L (u1 ) = 0 (La recta L corta al eje X, véase la …gura) entonces u1 = x1
y f (y)
x1 f (x1 ) f (x1 )
y por la desigualdad previa f (u1 )
L (u1 ) = 0 ) f (u1 )
0:
Figura 71 Si f (u1 ) = 0, u1 es la raíz x b de la ecuación f (x) = 0 y el proceso concluye. Supongamos f (u1 ) < 0. Como por hipótesis f (y) > 0, f (u1 ) f (y) < 0, consecuentemente x b 2 [u1 ; y]. Ponemos x2 = u1 : El proceso anterior se repite con el intervalo [x2 ; y]. De este modo se construye una sucesión (xn ) creciente y acotada por y. Luego (xn ) es convegente a b c, eso es, b c = l m xn = Sup xn : n!1
n2Z+
Por hipótesis f es continua en [a; b] y por construcción de (xn ), xn n = 1; 2; : : :. Entonces f (b c) = f l m xn = l m f (xn ) 0: n!1
n!1
b c; n = 1; 2; : : :, f (xn ) < 0;
Si f (b c) < 0 y como f (y) > 0; f (b c) f (y) < 0 luego x b 2 [b c; y] con b c 0 tal que lm
n!1
%n+1 jxn+1 x bj = c > 0; p = lm n!1 j%n j jxn x bjp
o sea la sucesión (xn ) generada por el método iterativo converge a x b de orden p, con una constante de error asimptótico c > 0. Método Iteración de punto …jo modi…cado Newton - Raphson para raíces simples Newton modi…cado Secantes Regula - falsi
Orden 1 2 : 1 1;618 1
Sean I R, I 6= ; y f una funicón real de…nida en I. Suponemos que existe una única raíz x b de f (x) = 0 localizada en un intervalo [a; b] I: Supongamos que para el cálculo aproximado de x b se utilizan dos métodos iterativos cuyas sucesiones generadas por dichos métodos son (xn ) y (tn ) respectivamente. Pongamos %n = xn x b; En = tn x b n = 1; 2; : : : los errores cometidos en cada iteración por cada algoritmo. Para simpli…car, supongamos que el primer método es de primer orden y el segundo método es de segundo orden. Entonces lm
n!1
con 0 < c1 < 1:
%n+1 jEn+1 j = c1 ; l m = c2 > 0; 2 n!1 En %n
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
295
Para n su…cientemente grande, %n+1 ' c1 =) %n+1 ' c1 j%n j ; %n jEn+1 j ' c2 =) jEn+1 j ' c2 jEn j2 : En2 Para el primer método, se tiene j%n j ' c1 %n
1
' c21 %n
' : : : ' cn1 j%0 j ;
2
(1)
y para el segundo, obtenemos jEn j ' c2 jEn
2 1j
' c2 c2 En2
= c72 jEn
8 2j
' : : : ' c22
2 2
n
1
= c32 jEn n
4 2j
' c32 c2 jEn
2 2j
4
(2)
jE0 j2 :
Con la …nalidad de comparar la rapidez de convergencia de estos métodos, supongamos que 0 < < 1 con = jx0 x bj ; = j%0 j ; = jE0 j y sea " = 5 10 m con m 2 Z+ la precisión con la que es aproximada x b para los dos métodos. Determinemos el número mínimo de iteraciones para el cual la raíz x b es aproximada con la precisión ": Para el primer método, tenemos:
j%n j ' cn1 j%0 j = cn1
5
10
m
;
de donde cn1 n ln c1 n
5
10
m
5
) cn1
ln 5 m ln 10 ln ln 5 + m ln 10 + ln ln c1
Sea N0 =
"
ln
5
10
=
ln
m
;
+ m ln 10 : ln c1
5
# + m ln 10 + 1: ln c1
(3)
Para el segundo método, de (2) se sigue que jEn j ' c22
n
1
n
jE0 j2 = c22
n
1 2n
5
10
m
;
de donde (c2 )2
n
n
2 ln (c2 )
5
10
ln (5c2 )
m
;
(4) m ln 10:
Al menor número entero positivo n que veri…ca (4) designémosle con N1 ; es decir que N1 es tal que 2N1 ln (c2 ) Exhibamos mediante un ejemplo que N1 < N0 : Ejemplo Considerar la ecuación
x + ln2 (x) = 0:
ln (5c2 )
m ln 10:
296
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Sea f (x) = x + ln2 (x) x > 0; y " = 5 10 8 : La ecuación f (x) = 0 tiene una raíz localizada en el intervalo [0;4; 0;5] : Aproximemos x b con los métodos regula falsi y Newton-Raphson. Se tiene los siguientes resultados: Método regula-falsi n xn 0 0;4 1 0;6 2 0;5129111 3 0;49794886 .. .. . . 11 12 Tenemos
Método de Newton-Raphson n 0 1 2 3 4
0;4948664 0;4948664
= j%0 j = jE0 j = j0;4
tn 0;4 0;4787588 0;4943978 0;4948660 0;4948664
0;4948664j ' 0;1:
Para el método regula falsi, c1 =
jx3 jx2
Entonces N0 =
"
ln
x bj j0;4979486 = x bj j0;5129111 2
#
+ m ln 10 +1=4 ln c1
5
ln
0;1 5
0;4948664j ' 0;17: 0;4948664j
+ 8 ln 10
ln 0;17
3
5 + 1 = [12;60341292] + 1 = 13:
Esto signi…ca que a partir de N0 = 13 se logra la precisión deseada. Si en el método regula - falsi se considera un número máximo de iteraciones Nmax tal que Nmax < N0 ; no se logrará la precisión deseada. Debemos tener Nmax N0 para lograr la precisión requerida. Para el método de Newton - Raphson, tenemos ' (x) = x con lo cual c2 = l m
n!1
Entonces 2n ln (c2 ) n
2 ln (1;4723
0;1)
1;915759289
[ 2 + 3 ln x b] ln x b 2; x b( x b + 2 ln x b)
f (x) 1 ) '00 (b x) = 0 f (x) 2
2
n
n ln 2 n
jxn+1 x bj 1 00 x) ' 1;4723: 2 = 2 ' (b jxn x bj ln (5c2 ) ln (5
m ln 10;
1;4723)
8 ln 10;
16;42441703; 16;42441703 = ln 8;573319792; ln 1;915759289 ln (8;573319792) ' 3;099: ln 2
Se tiene N1 = 4: La precisión deseada se logra a partir de N1 = 4, o lo que es lo mismo jxn para n 4: Si Nmax denota el número máximo de iteraciones. Para Nmax
N1 :
x bj
5 10
8
El método de Newton modi…cado es un algoritmo de primer orden. Para N0 = 13 se logra la precisión deseada. Sea x0 = 0;4: La función de iteración ' del método de Newton modi…cado etá de…nida por ' (x) = x
1 f 0 (x0 )
f (x)
x 2 [0;4; 0;5] :
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA Como f (x) =
x + ln2 (x) ) f 0 (x) =
1+
f 0 (0;4) =
2 x
297
ln(x); entonces
1+
2 ln(0;4) = 0;4
5;58145366;
' (x) = x + 0;1792f (x) = x + 0;1792
x + ln2 (x) :
En la tabla siguiente se muestran los resultados de la aplicación de este método.
Se tiene f (x13 ) = 0;000000047
5
8
10
n 0 1 2 3 4 5 6 .. .
xn 0;4 0;478774296 0;49018866 0;493437619 0;494424147 0;497289704 0;494823648 .. .
11 12 13
0;494866289 0;4948663754 0;4948664023
= ":
Convergencia acelerada Sean I R, I 6= ; y f una función real de…nida en I. Suponemos que existe una raíz x b de f (x) = 0 separada en el intervalo [a; b] I y sea (xn ) una sucesión convergente a x b: Los métodos de aceleración de la convergencia transforman la sucesión (xn ) en sucesiones (tn ) que convergen mas rapidamente que [xn ] : En general , los métodos de aceleración de la convergencia utilizan métodos de orden 1 en los que intervienen únicamente la función f y no su derivada. Los más conocidos son 2 de Aitken y el método de Ste¤ensen. Método
2
de Aitken
Sea (xn ) una sucesión que converge a x b raíz de la ecuación f (x) = 0: Suponemos que (xn ) converge linealmente. Entonces existe 0 < c < 1 tal que lm
n!1
xn+1 x b = c; xn x b
y sea En = xn x b para n = 1; 2; : : : : Se tiene xn+1 determinados utilizando las ecuaciones
xn+1 x b = c (xn x b) ; xn+2 x b = c (xn+1 x b) ;
cuyas soluciones son c =
(xn+1 xn )2 xn+2 2xn+1 + xn
tn = xn El método de que (xn ) :
2
x b) : Entonces c y x b pueden ser
xn+2 xn+1 ; xn+1 xn
x b = xn
De…nimos
x b = c (xn
con
xn+2
(xn+1 xn )2 . xn+2 2xn+1 + xn
2xn+1 + xn 6= 0:
(1)
de Aitken se basa en la suposición de que la sucesión (tn ) converge más rápidamente
298
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES 8n 2 Z+ : Supongamos que existen
Teorema 10 Sea (xn ) una sucesión convergente a x b y xn 6= x b una constante k; 0 < k < 1 y una sucesión [ n ] tales que xn+1
lm
n!1
x b = (k + = 0:
n
Entonces (tn ) dada por (1) etá bien de…nida y l m
n!1
xn+2
tn xn
x b: Entonces En+1 = (k +
Demostración. Sea En = xn
2xn+1 + xn = xn+2 = (k +
x b) ;
n ) (xn
x b
2 (xn+1
n+1 ) En+1
x b = 0: x b
n ) En :
x b)
Luego
xn
2 (k +
n ) En
x b = En+2
2En+1 + En
+ En
= (k + n + 1) (k + n ) En 2 (k + n ) En + En h i = En (k 1)2 + ( n + n+1 ) k + n ( n+1 2) ;
además xn+1 Puesto que xn+2
x b
xn = xn+1
2xn+1 + xn 6= 0; En = xn (
n
+
x b) = En+1
(xn
n+1 ) k
En = En [k
1+
n] :
x b 6= 0; 0 < k < 1 y por hipótesis l m +
n ( n+1
n!1
n
= 0; Entonces
2) ! 0; n!1
de donde para n su…cientemente grande (xn+1 xn )2 En2 (k = xn+2 2xn+1 + xn En (k con
n
=(
n
+
n+1 ) k
+ (
1+
2 n)
1)2 +
= En
n
(k 1) + (k 1)2 +
2 n n
! 0;
n!1
2) ! 0:
n+1
n!1
Por lo tanto l m tn = l m
n!1
n!1
xn
(xn+1 xn )2 xn+2 2xn+1 + xn
!
= l m xn n!1
La sucesión (tn ) es convergente a x b. Así, (tn ) está bien de…nida.
(xn+1 xn )2 =x b: n!1 xn+2 2xn+1 + xn lm
Por otro lado
tn
x b = xn
x b
= En
1
(xn+1 xn )2 = En xn+2 2xn+1 + xn ! (k 1 + n )2 ; (k 1)2 + n
En2 (k En (k
1+
2 n)
1)2 +
n
de donde tn xn tn n!1 xn lm
Sea " > 0. Puesto que l m
n!1
tn xn
x b x b x b x b
=
tn x b =1 En
= 1
(k n!1 (k lm
(k (k
1 + n )2 ; 1)2 + n
1 + n )2 =1 1)2 + n
x b = 0; existe n0 2 Z+ tal que 8n x b
(k (k
1)2 = 0: 1)2
n0 ) jtn
x bj < jxn
La última desigualdad muestra que la sucesión (tn ) converge mas rapidamente que [xn ] :
x bj ":
5.5. CONVERGENCIA. CONVERGENCIA ACELERADA
299
Ejemplo Hallar x 2 R tal que ex
0;5x + 1 = 0: Pongamos f (x) = ex f (x) = 0 () ex =
0;5x + 1: Entonces
0;5x
1:
El método grá…co muestra que la ecuación f (x) = 0 tiene una única raíz x b localizada o separada en el intervalo [ 2;5; 2;0] : Aproximemos la raíz x b con el método de punto …jo modi…cado y luego aceleramos la convergencia con el método de 2 de Aitken. La función de iteración del método de punto …jo modi…cado está de…nida por ' (x) = x donde m =
b a f (b) f (a)
=
2+2;5 f ( 2) f ( 2;5)
' (x) = x
mf (x)
x 2 [ 2;5; 2;0] ;
= 1;6488; 1;6488 (1 + 0;5x + ex )
x 2 [ 2;5; 2;0] :
La tabla que se muestran a continuación se exhiben los resultado de la aplicación del método de punto …jo modi…cado. n xn 0 2;0 1 2;223140815 2;217696668 2 3 2;217715177 4 2;217715105 2;217715106 5 6 2;21771506 A continuación se muestran los términos de (tn ) con el método de x1 )2 = x3 2x2 x1 (x3 x2 )2 = x4 2x3 x2 (x4 x3 )2 = x5 2x4 x3 (x2
t1 = x1 t2 = x2 t3 = x3 Valor aproximado de x b:
2
de Aitken.
2;217715144; 2;217715105; 2;217715106:
2;217715106:
Método de Ste¤ensen En el método de 2 de Aitken, para inicializar el proceso se requieren de x1 ; x2 ; x3 : Con esta información se calcula t1 : A continuación se calcula x4 y con los precedentes x2 ; x3 se calcula t2 ; luego se calcula x5 y con este se obtiene t3 , así sucesivamente. El método de Ste¤ensen toma ventaja de la construcción de la sucesión (tn ) cuando la sucesión (xn ) está generada por una función de iteración ': El método de Ste¤ensen es recomendado para métodos de orden 1. Pongamos yn = ' (xn ) ; zn = ' (yn ) : Se tiene tn = xn
(xn+1 xn )2 = xn xn+2 2xn+1 + xn
(yn zn
xn )2 = xn 2yn + xn
(' (xn ) xn )2 n = 0; 1; : : : (1) ' (' (xn )) 2' (xn ) + xn
La sucesión (tn ) construida mediante el esquema (1) se conoce como método de Ste¤ensen. El esquema nuérico dado por (1) conduce a una nueva función de iteración (x) = x
de…nida
(' (x) x)2 x' (' (x)) '2 (x) = x 2 [a; b] ; ' (' (x)) 2' (x) + x ' (' (x)) 2' (x) + x
300
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
donde x b 2 [a; b] es la raíz de la ecuación f (x) = 0: El esquema numérico (1) se escribe entonces
x0 2 [a; b] aproxiamación inicial, xn+1 = (xn ) n = 0; 1; : : : : Las funciones de iteración ' y el siguiente teorema.
, por lo general, tienen el mismo punto …jo, más precisamente, tenemos
Teorema 11 Sea x b 2 [a; b]. Entonces '0 (b x) 6= 1 ) (b x) = x b:
(b x) = x b ) ' (b x) = x b: Recíprocamente, si ' (b x) = x b y
Demostración. Por la de…nción de la función de iteración (x) = x
; se tiene
(' (x) x)2 x 2 [a; b] ; ' (' (x)) 2' (x) + x
de donde [ (x)
x] [' (' (x))
(b x) = x b se tiene
Entonces, si
[ (b x)
2' (x) + x] = (' (x)
x b] [' (' (b x)) 0 = (' (b x)
x)2 x 2 [a; b] :
2' (b x) + x b] = (' (b x)
x b)2 ) ' (b x) = x b:
x b)2
Recíprocamente, supongamos que ' (b x) = x b y '0 (b x) 6= 1: Entonces
(' (x) x)2 (' (x) x)2 =x b lm ' (' (x)) 2' (x) + x 2' (x) + x x!b x x!b x x!b x ' (' (x)) 2 (' (x) x) ('0 (x) 1) 2 (' (b x) x b) ('0 (b x) 1) = x b lm 0 =x b 2'0 (x) + 1 '0 (' (b x)) '0 (b x) 2'0 (b x) + 1 x!b x ' (' (x)) '0 (x) = x b:
(b x) =
lm
(x) = l m x
ya que ' (b x) = x b:
Note que
'0 (' (b x)) '0 (b x)
2'0 (b x) + 1 = '0 (b x) '0 (b x)
y por hipótesis '0 (b x) 6= 1; ('0 (b x)
2'0 (b x) + 1 = '0 (b x)
1
2
;
1)2 6= 0:
Algoritmo Datos de Entrada: a; b extremos del intervalo [a; b] : precisión " > 0; Nmax número máximo de iteraciones, función f: Datos de Salida: x b raíz, y = f (b x) ; n número de iteraciones. 1. Leer x0 2 [a; b] y poner x = x0 : 2. Para n = 1; : : : ; Nmax 3. y1 = ' (x) : 4. y2 = ' (y1 ) : 5. t = x
(y1 y2
x0 )2 : 2y1 + x
6. Si jt
xj < ": Continuar en 8).
7. Si jt
xj > "; x = t: Continuar en 3).
5.6. RAÍCES DE MULTIPLICIDAD
301
8. Si n < Nmax ; imprimir x b = t; y = f (t) : Continuar en 10). 9. Si n > Nmax ; imprimir x b = t; y = f (t) : 10. Fin.
Ejemplo Sea f (x) = sin(x) cosh
x p 1+ x
1: Hallar los ceros de f para x 2 [0; 10] :
La aplicación del agoritmo de búsqueda del cambio de signo en [0; 10] con un paso h = 0;4 muestra que f tiene cuatro ceros localizados en los intervalos [0;8; 1;2] ; [2; 2;4] ; [6;4; 6;8] ; [9;2; 9;6] : Calculemos las dos primeras raíces con el método regula-falsi (método de orden 1). En la tabla de la izquierda se muestran los resultados de la aplicación de este método para la aproximación de x b1 2 [0;8; 1;2] raíz de f (x) = 0 y en la de la derecha para x b2 2 [2; 2;4] : n 1 2 3 4 5 6 7 8
xn 0;8 1;0838480 1;0698168 1;0564792 1;0681479 1;0681382 1;0681286 1;0681382
8 < Apliquemos el método de Ste¤ensen: :
n 1 2 3 4 5
xn 2;4 2;39602478 2;397285172 2;397287862 2;397287868
(' (x) x)2 ; ' (' (x)) 2' (x) + x (tn ) n = 1; 2; : : : :
(x) = x tn+1 =
Cálculo de x b1 2 [0;8; 1;2] : Se tienen los siguientes resultados de la plicación del método de Ste¤ensen: t1 = 0;8;
t2 = t1
(' (t1 ) t1 )2 = 0;8 ' (' (t1 )) 2' (t1 ) + t1
t3 =
(t2 ) = 1;068137133;
t4 =
(t3 ) = 1;068138455;
t5 =
(t4 ) = 1;068138463:
(' (0;8) 0;8)2 = 1;0678892; ' (' (0;8)) 2' (0;8) + 0;8
Cálculo de x b2 2 [2; 2;4] : t1 = 2;
y = 2;4;
t2 =
(t1 ) = 2;397289196;
t3 =
(t2 ) = 2;397287868:
Nota: Para método de orden 1, el método de Ste¤ensen es de orden 2.
5.6. Sean I
Raíces de multiplicidad R con I 6= ; y f una función real de…nida en I. Consideramos el problema (P) siguiente: hallar x b 2 I; si existe, solución de f (x) = 0:
(P)
302
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
De…nición 7 Se dice que x b 2 I es una raíz de multiplicidad m 2 de la ecuación f (x) = 0 si existe una función g de…nida en I tal que f (x) = (x x b)m g (x) x 2 I; con g (b x) 6= 0:
Ejemplos
1. Sea f la función de…nida por f (x) = x (x 2)2 x 2 R. Entonces x b = 2 es una raíz de multiplicidad 2. Note que g (x) = x y g (2) = 2: Además x b = 0 es una raíz real simple de f (x) = 0: 2. Sea f la función real dada por f (x) = x2 + 5 (x + 1)3 x 2 R. Entonces x b= real de multiplicidad 3. Se tiene g (x) = x2 + 5 con g ( 1) = 6:
1 es la única raíz
La aplicación del algoritmo de búsqueda de cambio de signo, en general, no da resultados positivos si la ecuación f (x) = 0 tiene raíces de multiplicidad m 2: En el ejemplo 1), la aplicación de este algoritmo no separa la raíz x b = 2; mientras que en el ejemplo 2), si lo separa pero no detecta que sea de multiplicidad 3. En el ejemplo 1). La raíz x b = 2 es de multiplicidad m = 2 (par). y en el ejemplo 2) la raíz x b= multiplicidad m = 3 (impar). Supongamos que x b es una raíz de multiplicidad m función g de…nida en I tal que f (x) = (x
Si f 2 C 2 ([a; b]) ; donde x b 2 [a; b] f 0 (x) = m (x
x b)m
1
I ym
g (x) + (x
Se tiene f 0 (b x) = 0: Ponemos
1 es de
2 de la ecuación f (x) = 0: Entonces, existe una
x b)m g (x)
x 2 I; g (b x) 6= 0:
2; entonces
x b)m g 0 (x) = (x
v (x) = mg (x) + (x Resulta v (b x) = mg (b x) 6= 0:
x b)m
x b) g 0 (x)
1
mg (x) + (x
x b) g 0 (x)
x 2 [a; b] :
x 2 [a; b] :
Puesto que f 2 C 2 ([a; b]) ; entonces las funciones g y v son continuas en [a; b] y como g (b x) 6= 0; v (b x) 6= 0; existe r > 0 tal que g (x) 6= 0; v (x) 6= 0 8x 2 [b x r; x b + r] [a; b] : De…nimos
f (x) (x x b)m g (x) = f 0 (x) (x x b)m 1 (mg (x) + (x x b) g 0 (x)) g (x) = (x x b) x 2 [b x r; x b + r] n fb xg; v (x)
u (x) =
con
g(x) v(x)
6= 0 8x 2 [b x
r; x b + r] :
Como l m u (x) = 0; la función u tiene una discontinuidad evitable. De…nimos x!b x
u e (x) =
0; si x = x b; u (x) si x 2 [b x
r; x b + r] n fb xg:
Entonces, u e (b x) = 0 = f (b x) ; es decir que u e (x) = 0 tiene la misma raíz que f (x) en el entorno [b x r; x b + r] : La raíz x b es una raíz simple de u e (b x) = 0: El método deNewton-Raphson es efectivo para raíces simples. Podemos aplicar este método a la función u: La función de iteración ' está dada por ' (x) = x
u (x) u0 (x)
x 2 [b x
r; x b + r] n fb xg:
5.6. RAÍCES DE MULTIPLICIDAD Como u (x) =
303
f (x) ; se sigue que f 0 (x) u0 (x) =
con lo cual ' (x) = x
u (x) =x u0 (x)
(f 0 (x))2 + f (x) f 00 (x) ; (f 0 (x))2
f (x) f 0 (x) x 2 [b x [f 0 (x)]2 f (x) f 00 (x)
r; x b + r] n fb xg:
El esquema numérico para la aproximación de la raíz x b es el siguiente:
x0 2 [b x r; x b + r] n fb xg aproximación inicial, xn+1 = ' (xn ) n = 0; 1; : : :
Por otro lado, supongamos que 8x 2 [a; b], g (x) > 0 y f 0 (x) 6= 0 8x 2 [a; b] n fb xg: De…nimos 1
x 2 [a; b] :
w (x) = (f (x)) m Como f (x) = (x i. Si m es par, (x
x b)m g (x) x 2 [a; b] con g (b x) 6= 0; se tiene x b)m
0 8x 2 [a; b] y siendo g (x) > 0; resulta que f (x) 1
1
1
x b)m g (x)] m = jx
w (x) = (f (x)) m = [(x
ii. Si m es impar,
1
x b) (g (x)) m
w (x) = (x
x bj (g (x)) m
0 8x 2 [a; b] : Luego x 2 [a; b] :
x 2 [a; b] :
De i) y ii) se sigue que w (b x) = 0; esto es, la función w tiene x b como cero simple en [a; b] : Apliquemos el método de Newton. La función de iteración está de…nida por (x) = x
u (x) =x u0 (x)
1
(f (x)) m
1 m
[f (x)]
1 m
1
f 0 (x)
El método de Newton para ceros de multiplicidad m (x) = x
m
f (x) f 0 (x)
El esquema numérico es el siguiente:
=x
m
f (x) f 0 (x)
x 2 [a; b] n fb xg:
2 con m dado, se expresa como
x 2 [a; b] ; x 6= x b:
x0 2 [a; b] n fb xg aproximación inicial, xn+1 = (xn ) n = 0; 1; : : : : Nota: Se pueden implementar fácilmente los otros métodos que han sido estudiados anteriormente. Ejemplos 1. Hallar las raíces reales positivas de la ecuación: x4
8;6x3
35;51x2 + 464;4x
998;46 = 0:
La búsqueda del cambio de signo en el intervalo [0; 1[ muestra que la función f asociada a la ecuación dada tiene una raíz en el intervalo [7; 8] y posiblemente una raíz de multiplicidad en un entorno de x = 4 (se presume por la observación de los valores de f (x) en un entorno de x = 4). Por otro lado, el estudio de la función f muestra que la ecuación f (x) = 0 tiene una raíz en el intervalo ] 1; 0] : Ponemos f (x) = x4 8;6x3 35;51x2 + 464;4x f (x) u (x) = f 0 (x) 6= 0: f 0 (x)
998;46;
304
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES Entonces f (4) 3;44 = < 0; 0 f (4) 23;52 f (5) 14;23 = > 0: 0 f (5) 35;7
u (4) = u (5) =
La función u tiene una raíz en el intervalo [4; 5], esta raíz de la ecuación f (x) = 0: De este modo con…rmamos que f (x) = 0 tiene una raíz de multiplicidad 2. Nota: La búsqueda del cambio de signo se aplicó a la función u en el intervalo [0; 7] : Para la aproximación de la raíz x b 2 [4; 5] se utilizan las dos funciones de iteración ' y
:
f (x) f 0 (x) se tiene [f 0 (x)]2 f (x) f 00 (x)
i. Con la función de iteración ' (x) = x
n 0 1 2 3
xn 4 4;3081 4;3081 4;3000
La raíz x b = 4;3 de f (x) = 0 es de multiplicidad m = 2:
ii. Como m = 2; con la función de iteración
(x) = x
2
f (x) ; f 0 (x)
se tiene n 0 1 2 3 4
xn 4 4;29082 4;29998 4;29998 4;3000
iii. Con x0 = 7; la raíz simple localizada en el intervalo [7; 8] ; se aproxima con el método de Newton. Con 5 iteraciones se tiene x b1 = 7;34847:
2. Hallar las raíces de la ecuación: x2 x 2 R.
2xe
x
+e
2x
= 0: Sea f (x) = x2
2xe
x
+e
2x
= (x
ex )2
Entonces, f (x) = 0 () (x
ex )2 = 0 () x
ex = 0 () x = e
x
:
La ecuación f (x) = 0 tiene una raíz en el intervalo [0; 1] : Calculemos f 0 (x) : Se tiene f 0 (x) = 2 (x ex ) (1 + e x ) : De…nimos f (x) f 0 (x) 6= 0: u (x) = 0 f (x) Con la ayuda de la función u; separamos la raíz de la ecuación f (x) = 0: Tenemos u (0) < 0; u (1) > 0; luego existe x b 2 ]0; 1[ tal que f (b x) = 0: Para la aproximación de x b utilizamos el método de Newton. i. Sea ' (x) = x
u (x) =x u0 (x)
f (x) f 0 (x) : [f 0 (x)]2 f (x) f 00 (x)
5.6. RAÍCES DE MULTIPLICIDAD
305
En la tabla siguiente se muestran los resultados de la aplicación del esquema numérico: x0 2 [0; 1] xn+1 = ' (xn ) n = 0; 1; : : : n xn 0 0 1 0;666667 2 0;568769 3 0;567144 4 0;567144 x b ' 0;567144 con una precisión " = 10
6:
ii. Sea
(x) = x
2
f (x) : f 0 (x)
Los resultados de la aplicación del esquema numérico x0 2 [0; 1] xn+1 = (xn )
n = 0; 1; : : :
se muestran a continuación. n 0 1 2 3 4
xn 0;0 0;5 0;566311 0;567143 0;567143
Valor aproximado de x b con una precisión " = 10
6
: 0;567143:
Teorema 12
i) Si f 2 C 1 ([a; b]) y si la ecuación f (x) = 0 tiene un cero simple x b 2 [a; b], entonces f 0 (b x) 6= 0:
ii) Si f 2 C m ([a; b]) para m entonces f (m) (b x) 6= 0:
2 y si la ecuación f (x) = 0 tiene un cero de multiplicidad m,
Demostración. i) Si la ecuación f (x) = 0 tiene una raíz simple en x = x b, entones f (b x) = 0 y existe una función g tal que f (x) = (x x b) g (x) con g (b x) 6= 0: Por hipótesis f 2 C 1 ([a; b]), entonces g 2 C 1 ([a; b]) y f 0 (x) = (x de donde
x b) g 0 (x) + g (x) ;
f 0 (x) = g (b x) 6= 0:
ii) Sean m 2 y f 2 C m ([a; b]). Si la ecuación f (x) = 0 tiene una raíz de multiplicidad m, existe una función g 2 C m ([a; b]) tal que f (x) = (x Resulta que f m (x) =
m X k=0
x b)m g (x) con g (b x) 6= 0: (k) (m (x) [(x k )g
x b)m ](m
k)
;
306
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
de donde (m k )=
m! k!(m k)! ,
Observe que si m
x b)m ](m
[(x
2, g (x) =
k)
denota la derivada de (x
f (m) (b x) = m!g (b x) 6= 0:
f (x) (x x b)m
x b)m de orden m
k. Entonces
x 6= x b, y
l m g (x) = g (b x) :
x!b x
Ejemplo 1 2 2x
Considere la función f de…nida por f (x) = ex raíz de multiplicidad 3 en x = 0. Sea g (x) =
1 2 2x x3
ex
x
x
1: Entonces, la ecuación f (x) = 0 tiene una
1
x 6= 0.
Aplicando la regla de L’Hôpital, obtenemos l m g (x) = l m
x!0
ex
x!0
1 2 2x x3
x
1
= lm
ex
x!0
ex 1 ex 1 = lm = : x!0 6x x!0 6 6
x 3x2
1
x
1
= lm
Además, f (x) = (x
0)3
ex
1 2 2x x3
= x3 g (x) :
Se tiene f 000 (x) =
3 X
3 k
g (k) (x) x3 (3
k) = 6g (x) + 18xg 0 (x) + 9x2 g 00 (x) + x3 g 000 (x) ;
k=0
1 f (0) = 6g (0) = 3!g (0) = 3! = 1: 6 000
Nota: El método de Newton para ceros de multiplicidad m lm
n!1
5.7.
xn+1 x b =c xn x b
2 es de orden 1; o sea
con 0 < c < 1:
Raíces reales de polinomios
Sean n 2 N, ak 2 R k = 0; 1; : : : ; n con an 6= 0. Una función real P de forma P (x) = a0 + a1 x +
n
+ an x =
n X k=0
ak xk
x 2 R,
se llama polinomio de grado n con coe…cientes reales ak : El polinomio nulo P0 de…nido por P0 (x) = 0 8x 2 R no se le asigna grado alguno. En lo sucesivo consideraremos polinomios reales de grado n 1 con coe…cientes en R y diremos simplemente P polinomio de grado n sobrentendiéndose que n 1 y sus coe…cientes son reales. De…nición 8 Sea P un polinomio de grado n. La ecuación P (x) = 0 , a0 + a1 x + se llama ecuación algebraica.
+ an xn = 0;
5.7. RAÍCES REALES DE POLINOMIOS
307
Teorema 13 (teorema fundamental del álgebra) Sea P un polinomio de grado n. Entones, la ecuación P (x) = 0 tiene exactamente n raíces reales o complejas incluidas las de multiplicidad. Demostración. La demostración de este teorema está fuera del alcance de estas notas, se encuentra en, por ejemplo, Churchill, páginas 145-146. Ejemplos 1. Sean x1 ; : : : ; xn 2 R con xi 6= xj ; i; j = 1; : : : ; n. El polinomio P (x) = exactamente n raíces reales.
Qn
j=1 (x
xj ) tiene
2
2. El polinomio P (x) = (x + 5) (x 2)3 x2 + 1 tiene ocho raíces: x b1 = 5 es una raíz real simple, x b2 = 2 es una raíz real de multiplicidad 2 y x b3 = i; x c4 = i son raíces complejas de multiplicidad 2. Sea P un polinomio de grado n. Si la ecuación P (x) = 0 tiene una raíz compleja z1 , existe z2 2 C tal que z2 = z1 raíz de la ecuación P (x) = 0, donde z1 denota el número complejo conjugado de z1 : En el estudio de una ecuación algebraica dada P (x) = 0 interesa los siguientes aspectos: i. Determinar los intervalos en los que se encuentran localizadas loa raíces reales positivas y las raíces reales negativas. ii. El número de raíces reales simples y de multiplicidad y como calcularlas. iii. Los discos en los cuales se localizan las raíces complejas. iv. El número de raíces complejas simples y de multiplicidad y como calcularlas. En esta sección daremos especial atención a los aspectos i) y ii) Los aspectos iii) y iv) no serán abordados. Supongamos que P (x) =
n P
ak xk y an > 0. Sea x > 0. Entonces
k=0
P (x) = xn Si n es par, resulta que P (x)
a1 a0 + + xn xn 1
+ an :
! 1 Si n es impar, se tiene P (x)
jxj!+1
!
x! 1
1; P (x)
! 1: Por lo
x!+1
tanto, si n es impar, la ecuación P (x) = 0 tiene al menos una raíz real. En la siguiente tabla se muestra el número de raíces reales y complejas según el grado del polinomio P . grad (P ) 1 2 3 4 5 6 7 .. .
Número de raíces reales 1 0; 2 1; 3 0; 2; 4 1; 3; 5 0; 2; 4; 6 1; 3; 5; 7
Número de raíces complejas 0 2; 0 2; 0 4; 2; 0 4; 2; 0 6; 4; 2; 0 6; 4; 2; 0
Supongamos que P (x) = xn + an 1 xn 1 + + a0 , grad (P ) 2 y P (x) = 0 tiene 1 ; : : : ; n 2 raíces reales. Entonces n 1 y n son raíces complejas con n 1 = n : Pongamos n = a + ib. Entonces x
n 1
(x
n)
= x2
n 1
+
n
x+
n 1 n;
308
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
resulta que n 1
+
= 2Re (
n
n 1
2
= j
n
nj
n)
= 2a; 2
= a + b2 ;
con lo cual x
(x
n 1
n)
= x2 + 2ax + a2 + b2 ;
y en consecuencia P (x) = x2
2ax + a2 + b2
n Y2
x
j
:
j=1
Si grad (P ) 4 y P tiene cuatro raíces complejas simples, el razonamiento anterior muestra que P puede escribirse en la forma P (x) = x2
2ax + a2 + b2
con z1 = a + ib; z2 = e a1 + ieb1 ; grad (Q) = n
5.7.1.
2e a1 x + e a21 + eb21 Q (x) ;
x2
4 y P (z1 ) = P (z2 ) = 0:
Fronteras superior e inferior de las raíces de la ecuación P (x) = 0
Sea P un polinomio de grado n. Como P está de…nido en todo R, necesitamos, en términos de los coe…cientes de P , seleccionar los intervalos en los que se debe aplicar el algoritmo de búsqueda del cambio de signo. A continuación se establecen criterios para seleccionar tales intervalos. Teorema 14 Sea P (x) =
n P
k=0
y0 1
se tiene
k=0;:::;n 1
n
jan x j > k Demostración. Sea A = n X1 k=0
Max
k=0;:::;n 1
k
ak x
n X1
ak xk :
k=0
jak j. Entonces, para jxj = 6 1, se tiene
n X1 k=0
k
jak j jxj
A
n X1 k=0
jxjk = A
jxjn jxj
1 jxjn 1. Si k 2 R es tal que jan j (jxj A
0 ak xk jxj 1
jan xjn > k
k=0
n X1 k=0
ak xk
si jxj > 1:
5.7. RAÍCES REALES DE POLINOMIOS
Teorema 15 Sea P (x) =
n P
309
ak xk un polinomio de grado n y A =
k=0
Max
k=0;:::;n 1
jak j :
Si x bi ; i = 1; : : : ; n, son las raíces (reales o complejas) de la ecuación P (x) = 0, entonces jb xi j < 1 + jaAn j i = 1; : : : ; n: Demostración. Por el teorema anterior, si k = 1 entonces n X1
n
jan x j >
ak xk
jan j(jxj 1) A
1 para jxj > 1, y en consecuencia
si jxj > 1:
k=0
Luego n X1
jan xn j
ak xk
n X1
jan xn j
k=0
k=0
jak j jxjk
an xk
A
k=0
n
jxj 1 > jan j jxjn = jan j jxj A jxj 1 A = jxjn jan j : jxj 1 n
Sea x 2 C tal que jxj > 1 y jxjn jan j jP (x)j Más aún jan j jxjA 1 jb xi j < R i = 1; : : : ; n:
n
jan x j
0 ) jxj
A jxj 1 n X1 k=0
1+
A jxj 1
0 ) jan j
ak xk > jxjn jan j
A jan j :
n X1
jxjk
jxjn A jxj 1
0: Resulta que
A jxj 1
Así, jP (x)j > 0 si jxj
Denotamos con B (0; R) el disco cerrado de centro 0 y radio R = 1 +
0
1+
jxj > 1: A jan j
= R: Consecuentemente,
A jan j :
Para jxj > R se tiene jP (x)j > 0 con lo que en el exterior de B (0; R) no se encuentra localizada ninguna raíz de P (x) = 0. Todas las raíces de la ecuación P (x) = 0 están localizadas en B (0; R), esto es, x bi 2 B (0; R) i = 1; : : : ; n:
Ejemplos
1. Consideremos el polinomio P (x) = 8x8
x6 + 16x4 + x3
5x2 + 3x + 1:
Sea A = Max jak j = Maxf1; 3; 5; 1; 16; 1g = 16. Entonces k=0;n 1
R=1+
A 16 =1+ = 3: an 8
Todas las raíces de la ecuación P (x) = 0 se localizan en el disco cerrado B (0; 3): 2. Todas las raíces de la ecuación 2x5 B (0; R) con
x4
R=1+
3x3 + x Max jan j
k=0;4
jan j
3 = 0 están localizadas en el disco cerrado
=1+
3 5 = : 2 2
310
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Teorema 16 Sea P (x) =
n P
k=0
ak xk un polinomio de grado n con a0 6= 0 y x bi i = 1; : : : ; n las raíces
de la ecuación P (x) = 0. Entonces x bi >
ja0 j = r; ja0 j + Max jak j k=1;:::;n
n P
Demostración. Puesto que P (x) = Q (y) = a0 yn + a1 y n
1
Max jak j
k=1;:::;n
ja0 j
1 4
= 1 4
se tiene y n P
jxj < Consecuentemente, jb xi j > r =
ak xk
n
para x 6= 0: Sea y =
1 Q (y) ) Q (y) = y n P yn
1 4
1 x
x 6= 0 y
:
> 0; entonces Max jak j
1 >1+ jxj de donde
n P
k=0
+ an : Resulta P
Para jyj > 1 +
ak xk = xn
k=0
+
i = 1; : : : ; n:
k=1;:::;n
ja0 j
ja0 j Max jak j k=1;:::;n
ja0 j ja0 j+ Max jak j :
ja0 j
) P (x) > 0;
) P (x) > 0:
k=1;:::;n
Conclusión: si x bi ; i = 1; : : : ; n son las raíces reales o complejas de la ecuación algebraica P (x) = 0, entonces x bi 2 B (0; R) B (0; r), con Max
R=1+
k=0;:::;n 1
jak j
jan j
;
y r=
ja0 j ; ja0 j + Max jak j k=1;:::;n
a0 6= 0;
R es la frontera superior y r es la frontera inferior en las que están localizadas todas las raíces: r < jb xi j < R
i = 1; : : : ; n:
En particular, las raíces reales se encuentran localizadas en los intervalos [ R; r] y [r; R] : Las raíces positivas de P (x) = 0 pertenecen a [r; R] y las negativas a [ R; r] : En el siguiente teorema se establece una mejor estimación de la frontera superior de las raíces reales. Teorema 17 (de Lagrange) n P Sea P (x) = ak xk un polinomio de grado n. Supongamos que an > 0 y k < n el mayor de los índices k=0
para los que ak < 0: Entonces, la frontera superior de las raíces positivas de la ecuación P (x) = 0 es q el número real R = 1 + k aBn , donde B = Max fjak j j ak < 0g :
Demostración. Sea x > 1 y Q (x) el polinomio que se obtiene de P al sustituir todos los coe…cientes no negativos an 1 ; : : : ak+1 por cero y cada uno de los coe…cientes restantes ak ; : : : ; a0 se sustituyen por B, donde B = Maxfjak j j ak < 0g: Como P (x) = a0 + a1 x + Q (x) = an xn =
+ an xn , entonces Bxk
xk+1 an xn x 1
Bxk k 1
(x
B = an xn
1
1)
B >
xk+1 x 1
xk+1 1 xk+1 > an xn B x 1 x 1 h i an (x 1)k B x 6= 1: B
5.7. RAÍCES REALES DE POLINOMIOS 1)k
Para x > 1 tal que an (x Luego, x bi < 1 +
1 k
B an
B
311
0)x
1 k
B an
1+
con x bi > 0:
Si todos los coe…cientes de P son positivos, para x tiene raíces reales positivas.
se tiene P (x) > Q (x)
0:
0, P (x) > 0, es decir que la ecuación P (x) = 0 no
Ejemplos 1. Sea P (x) = 8x8
x6 + 16x4 + x3
5x2 + 3x + 1:
Observamos que el mayor de los índices k < 8 para los que ak < 0 es k = 6. Además, los índices para los que ak < 0 son 6 y 2. Entonces b = Maxfjak j j ak < 0g = Maxf1; 5g = 5: Resulta que Q (x) = 8x8 R = 1+
5 x6 + x5 + B a8
+1 ;
1 6
1 6
=1+
5 8
x3
10x2
2. Considerar el polinomio P (x) = 3x6 + 2x5 + 8x4
' 1;925: 60:
Los coe…cientes negativos son a3 = 1, a2 = 10, a0 = 60; el mayor de lo índices de estos coe…cientes es k = 3: Además B = Maxfjak j j ak < 0g = Maxf1; 10; 60g = 60: Luego Q (x) = 3x6
60 x3 + x2 + 1 B a6
R = 1+ Si R0 = 1 +
Max jak j
k=0;:::;5
ja6 j
=1+
60 3
1 3
1
1 3 =1+ ' 3;72: 60
= 21: Claramente R < R0 :
Observación Sean 0 < r < R las fronteras inferior y superior respectivamente de las raíces positivas de la ecuación P (x) = 0. El algoritmo de búsqueda del cambio de signo se aplica en el intervalo [r; R] y para las negativas, el algoritmo se lo aplica en el intervalo [ R; r] : Ejemplo Hallemos todas las raíces de la ecuación 3x4 Sea P (x) = 3x4
5;4x3 + 3;11x2
9x
5;4x3 + 3;11x2
9x
3;15 = 0:
3;15: Determinemos un conjunto en el que están localizadas todas 1 k
las raíces reales y complejas. Como R = 1 + aBn , donde an > 0; k el mayor de los índices para los que ak < 0, B = Maxfjak j j ak < 0g: Se tiene a4 = 3; k = 3 pues a3 = 5;4; a1 = 9; a0 = 3;15; B = 9. Luego 1 9 3 R=1+ ' 2;44225: 3 1
Todas las raíces reales o complejas están localizadas en le disco cerrado B (0; 2;5) (2;5 > 1+3 3 ' 2;44225). La aplicación del algoritmo de búsqueda del cambio de signo con un paso h = 0;5 muestra que P (x) = 0 tiene dos raíces reales localizadas en los intervalos [ 0;5; 0] y [2;0; 2;5]. Note que r =
ja0 j ja0 j+ Max jak j k=1;:::;n
=
3;15 3;15+9
' 0;25926: En el intervalo [ r; r] no existen raíces de P (x) = 0:
Además, si u (x) = PP0(x) (x) , la aplicación del algritmo de búsqueda del cambio de signo muestra que u no tiene raíces reales múltiples. Consecuentemente, la ecuación propuesta tiene dos raíces reales y dos raíces complejas una conjugada de la otra.
312
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
i. Cálculo de x bi 2 [ 0;5; 0;25] con una precisión " = 10 ' (x) = x
P (x) P 0 (x)
4:
Apliquemos el método de Newton:
x 2 [ 0;5; 0;25] :
Escribamos P (x) y P 0 (x) usando el esquema de Hörner: P (x) =
3;15 + x ( 9 + x (3;11 + x ( 5;4 + 3x))) ;
0
P (x) = 12x3
16;2x2 + 6;22x
El esquema numérico es el siguiente: 10
9=
9 + x (6;22 + x ( 16;2 + 12x)) :
x0 2 [ 0;5; 0;25] aproximación inicial, con jxn+1 xn+1 = ' (xn ) n = 0; 1; : : : ;
xn j <
4:
Sea x0 =
0;5; entonces x1 = x2 = x3 = x4 = x5 =
Se tiene jx5
8;63 P ( 0;5) = 0;5 = 0;01133; 0 P ( 0;5) 17;66 P ( 0;01133) 3;04767 0;01133 = 0;01133 = 0 P ( 0;01133) 9;07254 P (x2 ) 0;61996 x2 = 0;34725 = 0;30172; P 0 (x2 ) 13;61574 0;02172 P (x3 ) = 0;30172 = 0;300002; x3 0 P (x3 ) 12;68007 0;3
x4 j < 10
0;5
4:
La raíz negativa de P (x) = 0 es x b1 =
0;34725;
0;3:
Mediante un procedimiento análogo, con una aproximación inicial x0 = 2 y cuatro iteraciones se calcula la raíz x b2 = 2;1
Se tiene P (x) = (x + 0;3) (x 2;1) Q (x) con Q (x) = ax2 +bx+c: Se veri…ca fácilmente que Q (x) = p p 15 15 2 2 3x +5. Así P (x) = (x + 0;3) (x 2;1) 3x + 5 : Las raíces complejas son x b3 = 3 i; x b4 = 3 i:
5.8.
Ejercicios
1. Para las ecuaciones que en cada item se propone, separar las raíces utilizando el método grá…co y el algoritmo de búsqueda del cambio de signo. Aplique el método de bisección para aproximar la o las raíces, si existen, con una precisión " = 10 2 : a) x2 + 2x e) ex + 2
x
3 = 0: b) x3 x 1 = 0: c) x 3 x = 0: d) ex x2 4x + 2 = 0: 1 =0 x > 0: f ) ejxj+1 sin(x) = 0: g) cos(x) + x2 + 2 = 0: x
2. Aplicar los métodos de punto …jo modi…cado, Newton modi…cado y regula. falsi para aproximar p 3 2 con una precisión " = 10 3 . Para los tres métodos elija p el mismo punto inicial x0 : Compare el número de iteraciones que se requieren para aproximar 3 2 con la precisión ": 3. Sea a 2 Q tal que 0 < a < 1 y a no es potencia cuarta de ningún número racional.
a) Construya las funciones de iteración de los métodos: punto …jo modi…cado, Newton - Raphson, p Newton modi…cado y regula - falsi para aproximar 4 a: b) Para cada función de iteración ' del inciso a., sea x0 = 1 y xn+1 = ' (xn ) n = 0; 1; : : : : ¿Es p (xn ) convergente a 4 a?
4. En cada inciso, determine un intervalo [a; b] en el cual la función de iteración dada tenga un punto …jo. Estime el número Nmax de iteraciones necesarias para obtener una precisión del punto …jo de 10 4 :
5.8. EJERCICIOS a)
(x) =
e)
(x) =
313
p
3 x2 3 e :
x 2
b)
+ x1 : f )
(x) = 5
x:
(x) =
c)
(x) = x3 + 1
1 3
1 3
2
ex + x2 : d)
(x) =
5 x2
+ 2:
:
Escriba la ecuación para la cual la raíz es punto …jo de
:
5. Sean a; b 2 R, n 2 Z+ ; n 2: Demostrar que la ecuación xn + ax + b = 0 tiene a lo más dos raíces rales si n es par y tres raíces reales si n es impar. Si n es par, ¿qué condiciones han de veri…car a y b para que la ecuación xn + ax + b = 0 tenga dos raíces reales? Si n es impar, ¿qué condiciones han de veri…car a y b para que la ecuación xn + ax + b = 0 tenga tres raíces reales? 6. Sean a; b 2 R, n 2 Z+ con n
3: Estudiar la ecuación xn + ax2 + b = 0:
7. Encontrar todas las raíces de la ecuación e0;2x y de las secantes. La precisión " = 10 3 :
2
5x 2 = 0: Aplique los métodos de Newton-Raphson
8. Hallar la mas pequeña raíz positiva de la ecuación 2 ex cos(x) = 0 con una precisión " = 10 7 ; aplicando los métodos de Ste¤ensen, donde ' es la función de iteración del método de Newton modi…cado; y, el algoritmo que se describe a continuación: y = xn xn+1 = y
f (xn ) f 0 (xn ) f (y) n = 0; 1; 2; : : : f 0 (xn )
9. Hallar la más grande raíz negativa de la ecuación e x sin(x) 1 = 0: Aplique los métodos de las secantes y de Ste¤ensen donde la función de iteración ' viene dada por el método de regula-falsi. (precisión " = 10 6 ). Escriba en cada caso el algoritmo correspondiente. 10. Escriba un algoritmo que permita aproximar la raíz x b 2 [a; b] de f (x) = 0 de tal manera que cada aproximación de x b se obtenga intercambiando el método de bisección y de Newton modi…cado, así sucesivamente. 11. Encontrar todas las raíces reales de la ecuación x3 0;6x2 18;63x + 34;992 = 0: ¿Existe alguna raíz de multiplicidad? Aplique el métodod de Newton - Raphson para determinar la raíz simple si esta existe y/o un método para determinar raíces de multiplicidad. p 12. Dar un método localmente convergente para determinar el punto …jo x b = 5 2 de (x) = x5 + x 2:
13. Sea " = 10 5 . Para la ecuación que se da en cada inciso aplicar el método que se propone para aproximar la o las raíces de la misma con la precisión ": Escriba el respectivo algoritmo. Nota: si la ecuación tiene una in…nidad de raíces, calcule todas aquellas que están localizadas en el intervalo [ 3; 6] : a) x
e
x
b) ex + 2 c)
ex
x2
= 0; método de punto …jo. x
+ 2 cos(x)
+ 3x
6 = 0; método de punto …jo modi…cado.
2 = 0; método de Newton - Raphson.
d) x2 + 10 cos(x) = 0; método de Newton modi…cado. ex = 0; método de las secantes.
e) 4 cos(x) f ) ln x2 + 1 g) x3 h)
3;23x2
ex sin(x)
e0;4x cos ( x) = 0, método de regula - falsi. 5;54x + 9;84 = 0, método de punto …jo modi…cado.
+ 0;5x = 0; método de las secantes.
14. Calcular las cuatro primeras raíces positivas de la ecuación tan (x)
2x = 0:
314
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
15. Calcular todas las raíces reales de las ecuaciones que se dan a continuación. Analice el caso de posibles raíces de multiplicidad. a) x4
7;223x3 + 13;447x2
c) x4
2;2x3
10;223 = 0: b) 5x3 + 4;5x2
0;672x
5;03x2 + 6;864x + 9;7344 = 0: d) 4x3
22;8x3
34;8x + 25;2 = 0:
34;2x
64;8 = 0:
16. Aplique el método de Ste¤ensen para calcular las raíces de las ecuaciones: a) e0;5x
2
2x2
1)2
3 = 0: b) (x
log 2x2 + 3 = 0:
17. Sea I R con I 6= ; y f una función real de…nida en I: Supongamos que existe x b 2 [a; b] que f (b x) = 0 y que f 2 C 2 ([a; b]) : Se de…ne la sucesión (xn ) como sigue:
I tal
8 > < x0 2 [a; b] ;f (x ) y = xn f 0 (xnn ) ; f 0 (xn ) 6= 0 > f (y) : x n+1 = y f 0 (xn ) n = 0; 1; : : :
a) Dé una interpretación geométrica de este esquema numérico.
b) Si (xn ) es convergente, pruebe que (xn ) converge a x b al menos cúbicamente.
c) Escriba el algoritmo correspondiente y aplique a las dos ecuaciones que se proponen a continuación. i) 2ex
x
5 = 0:
ii) cos(x)
x2 + 1 = 0
x2[
; ]:
18. Sean I R con I 6= ;; f de I en R una función de…nida en I y x b 2 I la única raíz de la ecuación f (x) = 0: Se de…ne la función de iteración ' de I en R como ' (x) = x f (x) x 2 I: Sea x0 2 I y (xn ) la sucesión que se de…ne a continuación: yn = ' (xn ) zn = ' (yn ) xn+1 = xn
(yn zn
xn )2 n = 0; 1; : : : 2yn + xn
a) Muestre que xn+1 = xn
[f (xn )]2 n = 0; 1; : : : f (xn ) f (xn f (xn ))
Este esquema numérico se conoce como método casi Newton. b) Dé una interpretación geométrica del esquema numérico. c) Probar que [xn ] converge a x b cuadráticamente.
d) Sea a 2 R. La ecuación x2 + 1 (x a) = 0 () x3 ax2 + x a = 0 tiene a x b = a como la única raíz real de la ecuación f (x) = 0; donde f (x) = x3 ax2 + x a: Sea a = 1;3521 y x0 = 1: Muestre que la sucesión (xn ) generada por el esquema numérico dado en a) converge a x b = 1;3521: q p p p a + a + a + : : :: Sea ' de R+ en R la función de…nida por ' (x) = a + x, x0 = 0; a: Se de…ne (xn ) como sigue: xn+1 = ' (xn ) n = 0; 1; : : :
19. Sea a > 0 y x b= x>
a) Pruebe que l m xn = x b y que x b= n!1
b) Sea " = 10
2; a
p 1+ 1+4a : 2
= 2: Aproxime x b con una precisión ":
20. Sea a > 0: Se desea calcular x b = a1 sin usar la división. Para el efecto se de…ne la función f (x) = para x > 0: Utilice el método de Newton para construir una sucesión (xn ) convergente a x b:
1 x
a
5.8. EJERCICIOS
315
21. Considerar el método de Newton de dos pasos siguiente 8 x0 2 [a; b] ; > > > > f (xn ) < yn = xn f 0 (xn ) > > f (yn ) > > n = 0; 1; : : : : xn+1 = yn f 0 (xn ) a) Encuentre una función de iteración b) Si (xn ) converge a x b muestre que
lm
n!1
(yn
c) Pruebe que la convergencia es cúbica:
sobre [a; b] tal que xn+1 =
xn x b x b) (xn
x b)
jxn+1 x bj 1 = 3 n!1 jx 2 x bj n lm
=
(xn ) n = 0; 1;
:
f 00 (b x) : 0 f (b x)
2
f 00 (b x) 0 f (b x)
:
22. En cada inciso se de…ne una función f . considere la ecuación f (x) = 0: Aplique los métodos de aproximación de raíces de multiplicidad para calcular la raíz de f (x) = 0: a) f (x) = x2
2xe
x
+e
2x :
b) f (x) = sin2 [ (3x + 2)] sin [ (3x + 2)] p p c) f (x) = x3 3 2x2 + 6x 2 2: 1 23. Sean " = 10 6 ; p = 0;8 y ' (x) = 0;5 + p 2
1 x2 Zx
e
t2 2 dt;
6; 4
x
:
0; la función de distribución normal.
0
Construya un método que permita aproximar x b > 0 tal que ' (b x) = 0;8 con una precisión ": [Sugerencia: aplique la serie de Taylor de e y adecuadas sumas …nitas de una serie de potencias].
@f 24. Sea f una función real dependiente de un parámetro c. Escribiremos t = f (x; c) : Suponga que @c es continua.
Se dispone de un conjunto de datos experimentales S = (xi ; yi ) 2 R2 j i = 1; : : : ; n y se asume que cada yi = f (xi ; c) + ri (c) ; donde ri (c) denota el error en la observación yi ; i = 1; : : : ; n: En el método de mínimos cuadrados se considera el problema siguiente: mn c2R
Se de…ne E (c) =
n P
i=1
ri2 (c) =
n P
(yi
n X
ri2 (c) :
i=1
f (xi ; c))2 :
i=1
a) Elaborar un algoritmo para aproximar b c 2 R tal que E (b c) = m nc2R E (c) : b) Se considera la siguiente información experimental:
S = f(1; 1;35) ; (1;5; 0;498) ; (2; 0;183) ; (2;2; 0;123)g Aplique el método de mínimos cuadrados para calcular la constante b c > 0 tal que f (t) = 10e c) Se considera el siguiente conjunto de datos
b ct :
S = f(0;26; 5) ; (0;785; 5) ; (0;5; 8;7) ; (1;05; 8;7)g Aplique el método de mínimos cuadrados para calcular la constante b c tal que f (t) = 10 sin (ct) :
316
5.9.
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 3. Tom M. Apostol, Calculus, Volumen 2, Segunda Edición, Editorial Reverté, Barcelona, 1975. 4. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 5. Robert B. Banks, Growth and Di¤usion Phenomena, Mathematical Frameworks and Applications, Editorial Springer-Verlag, Berlín, 1994. 6. R. M. Barbolla, M. García, J. Margalef, E. Outerelo, J. L. Pinilla. J. M. Sánchez, Introducción al Análisis Real, Editorial Alambra Universidad, Madrid, 1981. 7. G. Birkho¤, S. Maclane, Algebra Moderna, Cuarta Edición, Editorial Vicens-Vives, Barcelona. 1974. 8. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 9. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 10. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 11. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial McGraw-Hill, México, 1981. 12. Ruel V. Churchill, James Ward Brown, Variable Compleja y Aplicaciones, Cuarta Edición, Editorial McGraw-Hill, Madrid, 1986. 13. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 14. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 15. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 16. Waltson Fulks, Cálculo Avanzado, Editorial Limusa, México, 1973. 17. A. Kurosh, Cours D’Algèbre Supérieure, Editions Mir, Moscou, 1973. 18. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 19. H. Hall, S.R. Knight, Algebra Superior, Unión Tipográ…ca Editorial Hispano-Americana, México, 1977. 20. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991. 21. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 22. Gerard Kiely , Ingeniería Ambiental, Volumen II, Editorial McGraw-Hill, Madrid, 1999. 23. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994.
5.9. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
317
24. A. Kurosh, Cours D’Algèbre Supérieure, Editions Mir, Moscou, 1973. 25. A. I. Kostrikin, Introducción al Algebra, Editorial Mir, Moscú, 1978. 26. Peter Linz, Theoretical Numerical Analysis, Editorial Dover Publications, Inc., New York, 2001. 27. Rodolfo Luthe, Antonio Olivera, Fernando Schutz, Métodos Numéricos, Editorial Limusa, México, 1986. 28. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 29. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 30. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 31. J. M. Ortega, W. C. Rheinbolodt, Iterative Solution of Nonlinear Equatios in Several Variables, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 2000. 32. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 33. A. A. Samarski, Introducción a los Métodos Numéricos, Editorial Mir, Moscú, 1986. 34. Michelle Schatzman, Analyse Numérique, Inter Editions, París, 1991. 35. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 36. M. Sibony, J. Cl. Mardon, Analyse Numérique I, Systèmes Linéaires et non Linéaires, Editorial Hermann, París, 1984. 37. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 38. E. A. Volkov, Métodos Numéricos, Editorial Mir, Moscú, 1990.
318
CAPÍTULO 5. RESOLUCIÓN NUMÉRICA DE ECUACIONES NO LINEALES
Capítulo 6
Resolución numérica de sistemas de ecuaciones lineales Resumen El objetivo de este capítulo es presentar algunos métodos numéricos muy conocidos y prácticos para encontrar soluciones de sistemas de ecuaciones lineales. Primeramente se presentan algunos ejemplos donde surgen los sistemas de ecuaciones lineales. A continuación se examinan tres tipos de problemas con sistemas de ecuaciones lineales: sistemas de ecuaciones que poseen solución única, sistemas de ecuaciones que poseen in…nitas soluciones, sistemas de ecuaciones que no tienen solución. Para el estudio de la existencia de soluciones de sistemas de ecuaciones lineales y el método numérico a elegir es importante el reconocimiento del tipo de matriz de dicho sistema, por lo que tratamos algunos tipos de matrices. Pasamos luego a la resolución numérica de los sistemas de ecuaciones lineales. Consideramos los sistemas más simples a resolver como son los triangulares superiores y los inferiores. A continuación tratamos el método de eliminación gaussiana y la implementación del pivoting parcial y total. Se consideran métodos para el cálculo del determinante de una matriz y el cálculo de la matriz inversa. Se trata el método de factorización LU de Crout. Cuando las matrices son simétricas, de…nida positivas se implementa el método de factorización LT L de Choleski. Se dan aplicaciones a las matrices tridiagonales y a los sistemas de ecuaciones que tienen una in…nidad de soluciones. Se concluye este capítulo con un análisis del condicionamiento de una matriz. Las soluciones en mínimos cuadrados de sistemas de ecuaciones, que en general, no tienen solución serán tratados en el capítulo de mínimos cuadrados. Para la aproximación de soluciones de grandes sistemas de ecuaciones lineales que poseen solución única cuya matriz del sistema tiene estructura de matriz en banda, se utilizan métodos iterativos. Algunos de estos métodos se tratan en el capítulo de métodos iterativos. Al …nal del capítulo se precisa una amplia bibliografía sobre todos estos temas.
6.1.
Problemas que conducen a la resolución de sistemas de ecuaciones lineales.
La resolución numérica de sistemas de ecuaciones lineales surgen en modelos matemáticos de la mayor parte de las ciencias tales como la física, la química, la biología, la economía, la psicología, la medicina, las diferentes ramas de la ingeniería, en los problemas ambientales, en estadística, en optimización y muy particularmente en investigación de operaciones y en el cálculo cientí…co. Es por esto que se deben disponer de algoritmos numéricos y de programas computacionales listos a ser implementados en una variedad de situaciones. A continuación presentamos algunos problemas clásicos que conducen a la resolución de sistemas de ecuaciones lineales. 319
320
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
6.1.1.
Problemas de mínimos cuadrados discreto.
Supongamos que se dispone de un conjunto de n pares de datos experimentales S = f(xi ; yi ) 2 R2 j i = 1; :::; ng: Se desea encontrar un polinomio P de grado 3: P (x) = a + bx + cx2 + dx3
x 2 R;
(1)
de modo que P se ajuste de la mejor manera al conjunto de datos S. El polinomio P queda perfectamente bien de…nido si se conocen todos sus coe…cientes a, b, c, d. Estos coe…cientes son calculados mediante el denominado método de mínimos cuadrados discreto que describimos a continuación. Denotemos con ri el residuo en cada medición, esto es, yi = P (xi ) + ri = a + bxi + cx2i + dx3i + ri ; En forma matricial, el conjunto de ecuaciones precedente, se 2 3 3 2 1 x1 x21 x31 2 y1 6 . .. 7 7 6 .. 6 6 . 7 7=6 76 6 5 6 .. 4 .. 7 4 4 . . 5 yn 2 1 xn xn x3n
i = 1; :::; n:
escribe como 2 3 3 r1 a 6 .. 7 6 7 b 7 7 + 6 . 7: . 7 c 5 6 4 .. 5 d rn
(3)
El residuo en cada medición depende de los coe…cientes a, b, c, d del polinomio P . De…nimos los vectores ! ! !! X , Y , r ( x ) como sigue: 2 2 3 3 2 3 y1 r1 (! x) a 6 .. 7 6 7 .. 7 6 . 7 6 7 ! 6 ! b . ! ! 7 7; 7 X =6 Y =6 r (x)=6 6 .. 7 ; 6 7 4 c 5; .. 4 5 4 . 5 . d ! rn ( x ) yn 2 3 1 x1 x21 x31 6 .. .. 7 6 . . 7 7 y la matriz A siguiente: A = 6 6 .. .. 7 : El sistema de ecuaciones (3) se transforma en el 4 . . 5 1 xn x2n x3n siguiente ! ! Y = AX + ! r (! x ); de donde
! r (! x) =! y
A! x:
(4)
El problema de hallar el ”mejor polinomio” que se ajusta al conjunto de datos S se expresa como sigue: b 2 R4 ; si existe, talque k! hallar x bT = (b a; bb; b c; d) r (b x)k2 = ! Min k! r (b x)k2 ; (5) x 2R4
o de modo equivalente
k! y
Ab xk2 = ! Min k! y x
2R4
Ab xk2 :
(6)
Este problema se conoce como método de mínimos cuadrados y se demostrará que conduce a resolver el sistema de ecuaciones AT A! x = AT ! y; (7) donde AT denota la matriz transpuesta de A. Otros problemas semejantes al descrito se presentan en la aproximación en mínimos cuadrados continuos, en regresión lineal y multilineal, ajuste de datos, entre otros. La formulación algebraica del método de mínimos cuadrados fue publicada por vez primera por Legendre en 1805.
6.1. PROBLEMAS QUE CONDUCEN A LA RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES.321
6.1.2.
Aproximación de un problema de valores de frontera.
Sea L > 0. Se denota con C 2 ([0; L]) el conjunto de funciones que poseen derivadas segundas continuas en [0; L]. Consideramos el problema siguiente: dadas dos funciones f , q continuas en [0; L], hallar una función u 2 C 2 ([0; L]) solución de u00 (x) + q(x)u(x) = f (x) x 2 ]0; L[ ; u(0) = u(L) = 0:
(8)
Supondremos que la función q satisface la condición q(x)
0
8x 2 [0; L[ :
Se demuestra que este problema tiene solución única. Desafortunadamente su solución exacta puede determinarse en muy pocos casos, lo que conduce a calcularla de manera aproximada. Para el efecto, aplicamos el método de diferencias …nitas que describimos brevemente a continuación. Este problema se encuentra en muchas aplicaciones en ingeniería, por ejemplo, en la ‡exión de una viga …ja en los extremos y sujeta a una carga f (x), x 2 [0; L[, en problemas de transferencia de calor y de masa, en problemas de contaminación ambiental. Sea n 2 Z+ . Dividimos el intervalo [0; L[ en n subintervalos de longitud h = Ln . Ponemos xk = kh, k = 0; 1; :::; n. El conjunto de puntos fx0 = 0; x1 ; :::; xn = Lg se llaman nodos de discretización. Sea uk una aproximación de u(xk ) que escribimos uk ' u(xk ), k = 0; 1; :::; n. Entonces, para x = 0, se tiene 0 = u(0) = u0 , y para x = L, 0 = u(L) = un . El polinomio de Taylor con error permite escribir los desarrollos siguientes: h2 00 u (xk ) + o(h3 ); 2! h2 hu0 (xk ) + u00 (xk ) + o(h3 ): 2!
u(xk+1 ) = u(xk + h) = u(xk ) + hu0 (xk ) + u(xk
1)
= u(xk
h) = u(xk )
Sumando miembro a miembro obtenemos u(xk+1 ) + u(xk de donde
1)
= 2u(xk ) + h2 u00 (xk ) + o(h3 );
2u(xk ) + u(xk 1 ) + o(h); h2 y en consecuencia, la derivada segunda u00 (xk ) se aproxima mediante el cociente u00 (xk ) =
u(xk+1 )
uk+1
2uk + uk h2
1
;
k = 1; :::; n
1
que se denomina diferencia …nita central de segundo orden (véase el capítulo 2). La ecuación diferencial en cada punto xk , k = 1; :::; n
1 se escribe
u00 (xk ) + q(xk )u(xk ) = f (xk ) u0 = un = 0;
k = 1; :::; n
1;
(9)
y al remplazar la derivada segunda por la diferencia …nita central de segundo orden, la ecuación diferencial precedente se aproxima como uk+1 2uk +uk h2
o lo que es lo mismo
8 > > > > > > < > > > > > > :
1
+ q(xk )uk = f (xk ) u0 = un = 0:
u2 2u1 h2 uk+1 2uk +uk h2 2un
1 +un 1 h2
1
k = 1; :::; n
+q(x1 )u1
= .. .
f (x1 );
+q(x2 )u2
= .. .
f (x2 );
+q(xn
1 )un 1
= f (xn
1 );
1;
(10)
322
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
pués para k = 1 se ha considerado u0 = 0 y para k = n 1 se tiene un = 0, que en forma matricial se escribe 2 32 3 2 3 2 + h2 q(x1 ) 1 0 0 f (x1 ) u1 6 76 1 2 + h2 q(x2 ) 1 0 6 f (x2 ) 7 6 7 6 u2 7 6 7 6 76 . 7 . . 1 6 .. .. .. 7 7 .. .. . 76 . 7 = 6 . . . . 7: . 76 . 7 6 6 7 h2 6 6 7 .. . .. 4 5 4 un 2 5 4 f (xn 2 ) 5 . 1 f (xn 1 ) un 1 0 1 2 + h2 q(xn 1 )
De…nimos la matriz A como 2 6 6 6 A=6 6 6 4
2 + h2 q(x1 ) 1 2 1 2 + h q(x2 ) .. .. . . .. . 0
y los vectores ! u T = (u1 ; :::; un
1 ),
0 1 .. .
..
.
..
.
1
!T b = (h2 f (x1 ); :::; h2 f (xn
0 0 .. . 1 2+
1 ))
h2 q(xn 1 )
2 Rn
1:
3
7 7 7 7; 7 7 5
La matriz A es tridiagonal, simétrica, de…nida positiva. El sistema de ecuaciones (10) se escribe entonces ! A! u = b:
(11)
A continuación se indican otros problemas que se discretizan mediante el método de diferencias …nitas, elementos …nitos, volúmenes …nitos. 1. Resolución numérica de ecuaciones en derivadas parciales como la ecuación de Laplace que modela los ‡ujos saturados incompresibles, la ecuación de conducción del calor y la ecuación de propagación de ondas. 2. Resolución numérica de ecuaciones integrales como las que provienen de la representación de soluciones de ecuaciones en derivadas parciales mediante funciones o núcleos de Green.
6.1.3.
Trazado de una curva suave a partir de observaciones experimentales.
Supóngase que se dispone de un conjunto de n pares de datos experimentales de R2 siguiente: S = (xi ; yi ) 2 R2 j i = 1; :::; n ; tales que a = x1 < x2 < :::: < xn = b. El trazado de una curva suave que pase por todos los puntos de S, es un problema de interpolación que consiste en hallar una función f de [a; b] en R que posee una cierta regularidad tal que f (xi ) = yi ;
i = 1; :::; n;
de modo que dado x 2 [a; b] podamos calcular f (x) : La construcción de la función f permite trazar una curva suave que pasa por todos ellos. Una estrategia es hallar un polinomio f cuya grá…ca para por todos los puntos del conjunto S. Este problema se conoce como interpolación polinomial. Lastimosamente, cuando el número de puntos es grande se presentan oscilaciones lo que provoca muchas imprecisiones en los cálculos. Otra estrategia es utiliza tipos especiales de funciones denominada splines. Las grá…cas de estas funciones no necesariamente pasan por todos los puntos, es decir que, en general, no se interpolan. Esta clase de problemas se presentam fundamentalmente en computación grá…ca, diseño geométrico asistido por computadora, en la robótica, etc.
6.1. PROBLEMAS QUE CONDUCEN A LA RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES.323 Un spline cúbico ajusta una curva suave (de clase C 2 ([a; b])) al conjunto de puntos S. Para …jar las ideas, se consideran los splines cúbicos con condiciones de frontera naturales que a continuación se de…nen. Denotamos con P3 al espacio vectorial de polinomios de grado 3: Dado el conjunto S, se busca una función f de al menos clase C 2 ([a; b]) que cumpla con las siguientes condiciones: i) f
[xi
1; xi
]
2 P3 que se le denota Si , i = 1; :::; n
ii) Si (xi ) = Yi
1:
i = 1; :::; n:
iii) Si+1 (xi+1 ) = Si (xi+1 ) ; 0
i = 1; :::; n
1:
0 iv) Si+1 (xi+1 ) = Si (xi+1 ) ;
i = 1; :::; n
1:
00 (x 00 v) Si+1 i+1 ) = Si (xi+1 )
i = 1; :::; n
1:
vi) S 00 (a) = S 00 (b) = 0: Para la construcción de la función f consecuentemente de Si que es un polinomio de grado subintervalo [xi 1 ; xi ] ; i = 1; :::; n ponemos hi = xi+1 xi , i = 1; :::; n 1, y Si (x) = ai + bi (x
xi ) + ci (x
xi )2 + di (x
xi )3
i = 1; :::; n
3 en cada
1:
Notemos que las condiciones iii), ii), v) establecen la continuidad de la función f , f 0 y f 00 en todo [a; b] : De ii) se deduce yi = Si (xi ) = ai ;
i = 1; :::; n
1:
(1)
Se de…ne an = f (xn ) = yn : Por iii), se tiene Si+1 (xi+1 ) = ai+1 ; Si (xi+1 ) = ai + bi hi + ci h2i + di h3i ; de donde ai+1 = ai + bi hi + ci h2i + di h3i ;
i = 1; :::; n
1:
(2)
0 Las derivadas Si0 (x) y Si+1 (x) están de…nidas como sigue:
Si0 (x) = bi + 2ci (x
xi ) + 3di (x
0 Si+1 (x) = bi+1 + 2ci+1 (x
xi )2 ; xi+1 )2 ;
xi+1 ) + 3di+1 (x
y por la condición iv) tenemos 0 Si+1 (xi+1 ) = bi+1 ;
Si0 (xi+1 ) = bi + 2ci hi + 3di h2i
i = 1; :::; n
1;
0 con lo cual Si+1 (xi+1 ) = Si0 (xi+1 ) implica
bi+1 = bi + 2ci hi + 3di h2i
i = 1; :::; n
1:
Se de…ne bn = f 0 (xn ) : 00 (x) están de…nidas como sigue: Las derivadas Si00 (x) y Si+1
Si00 (x) = 2ci + 6di (x 00 Si+1 (x)
xi ) ;
= 2ci+1 + 6di+1 (x
xi+1 ) :
Entonces, 00 Si+1 (xi+1 ) = 2ci+1 ;
Si00 (xi+1 ) = 2ci + 6di hi ;
(3)
324
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
y de la condición v) obtenemos 2ci+1 = 2ci + 6di hi ; o bien ci+1 = ci + 3di hi i = 1; :::; n de donde di =
ci+1 ci 3hi
1:
i = 1; :::; n
(4)
1:
(5)
Remplazando di en (2), obtenemos ai+1 = ai + bi hi + ci h2i +
ci+1 ci 3 1 hi = ai + bi hi + ci h2i + (2ci + ci+1 ) h2i ; 3hi 3
ai+1 = ai + bi hi +
1 (2ci + ci+1 ) h2i i = 1; :::; n 3
1:
(6)
Remplazando di en (3) bi+1 = bi + 2ci di + 3
ci+1 ci 2 hi = bi + 2ci hi + (ci+1 3hi
bi+1 = bi + hi (ci+1 + ci )
i = 1; :::; n
ci ) hi :
1:
(7)
Por otro lado, de (6) bi =
ai+1 ai hi
ci+1 + 2ci hi i = 1; :::; n 3
1:
(8)
i = 2; :::; n;
(9)
y disminuyendo en 1 el índice de la igualdad precedente, se obtiene bi
1
=
ai
ai hi
1
1
ci + 2ci 3
1
hi
1
y en (7) bi = bi
1
+ hi
1 (ci
+ ci
1) ;
i = 2; :::; n:
(10)
Remplazando (8) y (9) en (10), se deduce
de donde
ai+1 ai hi
ci+1 + 2ci ai ai hi = 3 hi 1
ai+1 ai hi
ai
ai hi
1
=
1
1
ci+1 + 2ci hi 3
ci + 2ci 3
1
ci + 2ci 3
1
hi
1
+ hi
1 (ci
hi
1
+ (ci + ci
+ ci
1) ;
1 ) hi 1 :
Puesto que 3 (ai+1 hi
3
ai ) =
(ai ai 1 ) = ci+1 + 2ci (ci + 2ci hi 1 = ci 1 hi 1 + 2 (hi 1 + hi ) ci + ci+1 hi :
1 ) hi
+ 3 (ci + ci
1 ) hi 1
De (1) se tiene 3 (yi+1 hi
yi )
3 hi
(yi
yi
1)
= ci
1 hi 1
+ 2 (hi
1
+ hi ) ci + ci+1 hi
i = 2; :::; n
1;
1
que a su vez puede escribirse como 2
3 ci 1 3 (hi 1 ; 2 (hi 1 + hi ) ; hi ) 4 ci 5 = (yi+1 hi ci+1
yi )
Por otro lado, se tiene
1 cn = f 00 (xn ) = 0; 2
3 hi
(yi 1
yi
1)
i = 2; :::; n
1:
6.2. PROBLEMAS CON SISTEMAS DE ECUACIONES LINEALES.
325
y 0 = f 00 (x1 ) = S100 (x1 ) = 2c1 ; de donde c1 = 0: Se de…nen ! c T = (c1 ; :::; cn ) 2 Rn con c1 = cn = 0; la matriz A siguiente: 2 1 0 0 0 6 h1 2 (h1 + h2 ) h 0 2 6 6 0 h 2 (h + h 3 ) h3 0 2 2 6 6 .. .. . . .. .. . A=6 6 . 6 .. . . 6 . . hn 2 6 4 0 hn 2 2 (hn 2 + hn 0 0 0 ! y el vector b T 2 Rn :
2
6 ! 6 b =6 6 4
3 hn
1
(yn
(y3 yn
3 h1
y2 ) 1)
3 hn
(y2 2
(yn
y1 ) 1
1)
hn 1
1
7 7 7 7 7 7; 7 7 7 7 5
3
0 3 h2
3
0 0 0 .. . .. .
yn
0
7 7 7: 7 2) 5
En consecuencia, se obtiene el siguiente sistema de ecuaciones lineales ! A! c = b: Una vez calculado ! c , de (5) se obtiene d1 ; :::; dn
1
y de (8) se obtiene b1 ; :::; bn
1:
Problemas de optimización. Mencionamos brevemente otros problemas que requieren de la resolución numérica de sistemas de ecuaciones lineales en la resolución de problemas de optimización como en: programación lineal, programación cuadrática, programación dinámica, control optimal, optimización de funciones convexas con o sin restricciones, problemas de grafos y redes, y de manera más general en el análisis combinatorio.
6.2.
Problemas con sistemas de ecuaciones lineales.
Un sistema de ecuaciones lineales es un conjunto de ecuaciones de la forma 8 > < a11 x1 + ::: + a1n xn = b1 .. . > : a1 x1 + ::: + amn xn = bm;
donde x1 ; :::; xn son las incógnitas cuyos valores queremos determinar, y aij son constantes reales conocidas. Pongamos 2 3 2 3 2 a11 a1n b1 ! 6 . 7 6 7 6 A = 4 ... b = 4 .. 5 ; ! x =4 5; am1 amn bm entonces A es una matriz de m n, esto es, A 2 Mm ! (12) se expresa en forma matricial como A! x = b:
n [R];
(12)
i = 1; :::; n, bi , i = 1; :::; m 3 x1 .. 7 ; . 5 xn
! b 2 Rm y ! x 2Rn . El sistema de ecuaciones
En lo sucesivo consideraremos el problema (P) siguiente: hallar, si existe, ! x 2 Rn solución del sistema de ecuaciones lineales ! A! x = b:
326
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Consideremos tres clases de problemas. Problema I Suponemos que m < n, es decir que tenemos más incógnitas que ecuaciones. Esta clase de sistemas de ecuaciones poseen in…nitas soluciones o ninguna solución. Cuando el sistema de ecuaciones lineales tiene in…nitas soluciones, se dice que el sistema es sobredeterminado. Si el rango de la matriz A es m, esto es, R(A) = m, el sistema de ecuaciones posee in…nitas soluciones y en tal caso consideramos el problema siguiente denominado solución del sistema de ecuaciones lineales en norma mínima: kb xk2 = ! Minn k! x k2 ;
(13)
x 2R ! A! x= b
! esto es, entre todas las soluciones ! x 2 Rn del sistema de ecuaciones A! x = b , seleccionamos una que posea norma mínima que lo notamos con x b. Ejemplos
1. La ecuación x + y + z + w = 1 posee in…nitas soluciones. Esta ecuación se escribe en forma matricial como 2 3 x 6 y 7 7 (1; 1; 1; 1) 6 4 z 5 = 1: w Note que la matriz A = (1; 1; 1; 1) es un vector …la y su rango es R(A) = 1, b = 1. La solución en norma mínima es x b = ( 14 ; 41 ; 14 ; 41 ).
3x 2y + 5z = 2 2. El sistema de ecuaciones lineales con (x; y; z) 2 R3 , tiene in…nitas soluciones. 8x + y 3z = 3 ! La matriz A, los vectores b y ! x son 2 3 x ! 2 3 2 5 ! 4 ; x = y 5: ; b = A= 3 8 1 3 z El rango de la matriz A es 2. x 2y + 3z = 1 con (x; y; z) 2 R3 ; no tiene solución. Pués 4x + 8y 12z = 0 4 a la primera ecuación, obtenemos el sistema de ecuaciones siguiente:
3. El sistema de ecuaciones lineales si multiplicamos por 4x + 8y 4x + 8y
12z = 4 que es un sistema contradictorio. 12z = 0;
Problema II Supongamos que m > n. En este caso, el sistema de ecuaciones lineales tiene más ecuaciones que incógnitas. Esta clase de ecuaciones tienen, por lo general, solución única o ninguna solución. ! Denotemos con Aj la j-ésima columna de la matriz A. Si el vector b pertenece el espacio generado por las columnas de A: 8 9 n < = X ! b 2 A j 2 R; j = 1; :::; n ; j j i : ; j=1
entonces, el sistema de ecuaciones lineales posee una única solución ! x T = (x1 ; :::; xn ) 2 Rn .
6.2. PROBLEMAS CON SISTEMAS DE ECUACIONES LINEALES. ! Si b 2 =
(
n P
j Aj
j=1
j
j
2 R;
327
)
j = 1; :::; n , el sistema de ecuaciones lineales no tiene solución. En este
caso, consideraremos el problema siguiente: hallar x b 2 Rn tal que kAb x
! 2 bk =! Min kA! x x
! 2 bk :
2Rn
(14)
Este problema se conoce como solución en mínimos cuadrados. ! Note que no se pretende resolver el sistema de ecuaciones A! x = b , de hecho este sistema no tiene solución. En realidad planteamos un problema de mínimos cuadrados análogo al presentado en la sección ! precedente. En efecto, como el sistema de ecuaciones A! x = b no tiene solución, de…nimos el residuo ! r (! x ) 2 Rm como ! ! r (! x ) = A(! x) b; ! x 2 Rn : El problema de mínimos cuadrados consiste en determinar en vector x b 2 Rn que minimice k! r (! x )k2 ! cuando x recorre todo Rn , o sea k! r (b x)k2 = Min k! r (! x )k2 : ! x 2Rn
Este problema se abordará con más detalle en el capítulo de mínimos cuadrados. Ejemplo
Considérese los datos de la tabla siguiente:
x 0 1 2 3 4
y 1 1.5 2 2.5 3
z 5 10.9 17.1 23 30
Con estos datos se desea encontrar una
función real f de la forma z = f (x; y) = a + bx + cy Se establece el sistema de ecuaciones lineales 8 a > > > > < a + a + > > a + > > : a +
siguiente: + c = 5 b + 1;5 = 10;9 2b + 2c = 17;1 3b + 2;5c = 23 4b + 3c = 30:
Este sistema de ecuaciones no tiene solución. Poniendo 3 2 2 1 0 1 6 1 1 1;5 7 6 7 ! 6 6 6 7 A = 6 1 2 2 7; b = 6 6 4 4 1 3 2;5 5 1 4 3 el residuo es con lo cual
Problema III
x; y 2 R:
5 10;5 17;1 23 30
3
2 3 7 a 7 ! 7; x = 4 b 5; 7 5 c
! r (! x) =! r (a; b; c) = A! x k! r (b a; bb; b c)k2 =
Min
(a;b;c)2R3
! b;
k! r (a; b; c)k2 :
Cosideramos sistemas de ecuaciones lineales que tienen igual número de ecuaciones que incógnitas, esto es, m = n. Encontramos tres clases de sistemas: aquellos que tienen solución única denominados sistemas de ecuaciones lineales consistente. Aquellos sistemas que tienen in…nitas soluciones denominados sobredeterminados y aquellos que no tienen solución llamados inconsistentes.
328
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Denotamos con TA la aplicación lineal asociada a la matriz A, esto es: TA :
Rn ! Rn ! x ! TA (! x ) = A! x:
El núcleo de TA se de…ne como el conjunto ker(TA ) = f! x 2 Rn j TA (! x ) = 0g = f! x 2 R n j A! x = 0g: El rango de TA R(TA ) = fTA (! x)j! x 2 Rn g = fA! x j! x 2 Rn g: El resultado fundamental del álgebra lineal que caracteriza a las aplicaciones lineales en espacios de dimensión …nita es la relación que se establece entre las dimensiones del núcleo y del rango que están ligadas por la siguiente fórmula: dim ker(TA ) + dim R(TA ) = n: ! Entonces, el sistema de ecuaciones A! x = b tiene solución única si y solo si una de las propiedades siguientes se veri…ca:
i) ker(TA ) = f0g: ii) R(TA ) = Rn : iii) A es una matriz invertible. iv) det(A) 6= 0: La propiedad i) signi…ca que TA es inyectiva. La propiedad ii) muestra que TA es sobreyectiva. La propiedad iii) signi…ca que TA es biyectiva y TA 1 = TA 1 . Además, en el caso en que una de estas propiedades se veri…que, las columnas de la matriz A son linealmente independientes. De manera similar, las …las de la matriz A son linealmente independientes. ! A la solución única del sistema de ecuaciones A! x = b lo notamos con ! x =A la matriz inversa de A.
1! b,
donde A
1
denota
Si el sistema de ecuaciones no tiene solución, abordaremos el problema de mínimos cuadrados siguiente: hallar x b 2 Rn tal que k Ab x
bb k2 = Min k Ab x ! x 2Rn
bb k2 :
Si el sistema de ecuaciones lineales tiene in…nitas soluciones, trataremos el problema de norma mínima siguiente: hallar x b 2 Rn tal que k x b k2 = ! Minn k x b k2 : x 2R Ab x=b b
En este capítulo nos ocuparemos de la resolución numérica de estos tres problemas. Particularmente, para los sistemas cuadrados de ecuaciones lineales utilizaremos los métodos directos. Los métodos iterativos y las soluciones en mínimos cuadrados se tratarán más adelante en capítulos separados. Observación: Si A es una matriz de n n invertible, cuando notamos a la solución del sistema de ecuaciones ! ! A! x = b con ! x = A 1 b , donde A 1 denota la matriz inversa de A, lo único que queremos indicar es que nuestro sistema de ecuaciones tiene solución única. Esto no quiere decir que debemos calcular la la matriz inversa A 1 para hallar su solución ! x . Del punto de vista numérico esto no se hace, es por ello que se buscan métodos para resolver el sistema de ecuaciones que evitan el cálculo de la matriz inversa A 1:
6.3. ALGUNOS TIPOS DE MATRICES IMPORTANTES.
6.3.
329
Algunos tipos de matrices importantes.
En esta sección tratamos principalmente los siguientes tipos de matrices: simétricas de…nidas positivas, monótonas, estrictamente diagonalmente dominantes, normales, y ortogonales. Las relaciones de orden y < en el espacio de matrices Mn A = (aij ) ; B = (bij ) dos matrices de Mn n [R] : Escribiremos A
B , aij
n [R]
se de…nen a continuación. Sean
bij i; j = 1; :::; n;
A < B , aij < bij i; j = 1; :::; n: De acuerdo a las relaciones de orden
y < de…nidas en Mn
A
0 , aij
n [R],
escribiremos
0 i; j = 1; :::; n;
A > 0 , aij > 0 i; j = 1; :::; n: En forma similar se de…nen las relaciones de orden (y1 ; :::; nyn ) son dos elementos de Rn , escribiremos
; y < en Rn , esto, es, si ! x T = (x1 ; :::; xn ) ; ! yT =
! ! x y , xi yi i = 1; :::; n; ! ! x < y , xi < yi i = 1; :::; n; ! x 0 , xi 0 i = 1; :::; n; ! x > 0 , x > 0 i = 1; :::; n: i
El producto escalar en Rn de dos vectores columna ! x T = (x1 ; :::; xn ) ; ! y T = (y1 ; :::; yn ) s denota h! x;! y i; ! ! ! ! T o también x y o x y y se de…ne como h! x;! yi=! x T! y =! x ! y =
n X
xi yi :
i=1
La norma asociada al producto escalar h ; i se nota k k y se de…ne como k! xk= ! x T! x
1 2
=
n X
!1 2
x2i
i=1
8! x 2 Rn ;
con ! x T = (x1 ; :::; xn ) :
6.3.1.
Matrices simétricas de…nidas positivas.
Sea A = (aij ) 2 Mn de A.
n [R]
una matriz simétrica, esto es, A = AT , donde AT denota la matriz transpuesta
De…nición 1 Consideramos la forma cuadrática q de Rn en R de…nida por q (! x) = ! x T A! x ! n 8x 2R : i) Se dice que la forma cuadrática q es de…nida positiva si q (! x)>0 ii) Se dice que la forma cuadrática q es semi-de…nida positiva si q (! x) iii) Se dice que q es de…nida negativa si
8! x 2 Rn ;
0 8! x 2 Rn :
q es de…nida positiva.
iv) Se dice que q es semi-de…nida negativa si
! x 6= 0:
q es semi-de…nida positiva.
330
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
De…nición 2 i) Diremos que A es de…nida positiva si la forma cuadrática q es de…nida positiva. ii) Diremos que A es semi-de…nida positiva si la forma cuadrática q es semi-de…nida positiva. iii) Diremos que A es de…nida negativa (semi-de…nida negativa) si la forma cuadrática q es de…nida negativa (resp. semi-de…nida negativa). Ejemplos
1. Sean
1 ; :::;
n
2 R y A = (aij ) 2 Mn
n [R]
aii = aij
la matriz de…nida como i;
= 0;
i = 1; :::; n; i:j = 1; :::; n; i 6= j:
La matriz A se llama matriz diagonal y se le denota como A = diag ( 1 ; :::; simétrica. Además, A es de…nida positiva si y solo si i > 0; i = 1; :::; n:
n) :
Se tiene que A es
2. Sea A = (aij ) 2 Mn n [R] una matrtiz no singular. Las matrices B = AT A y C = AAT son T T simétricas, de…nidas positivas. En efecto, B es simétrica. Pués, B T = AT A = AT AT y T
como AT = A, se sigue que B T = AT A = B: Además, como A no es singular, se tiene ! ! A x = 0 , x = 0: Luego, para ! x 2 Rn con ! x 6= 0; T 2 ! x T B! x =! x T AT ! x = (A! x ) A! x = kA! x k > 0;
que prueba que B es de…nida positiva. Así, B es simétrica, de…nida positiva. En forma similar se muestra que C es simétrica, de…nida positiva.
Consecuencias Sea A = (aij ) 2 Mn
n [R] :
1. Si A es simétrica, de…nida positiva, A es no singular. 2. Si A es simétrica, de…nida positiva, entonces la función h ; i de Rn en R de…nida por hA! x;! xi=! x T A! x 8! x 2 Rn ; es un producto escalar en Rn y la norma asociada a este producto se nota k! x kA = ! x T A! x
1 2
8! x 2 Rn :
6.3. ALGUNOS TIPOS DE MATRICES IMPORTANTES. Teorema 1 Sea A = (aij ) 2 Mn
n [R].
331
Las siguiente proposiciones son equivalentes.
i) A es simétrica, de…nida positiva. ii) Para toda matriz B 2 Mn
n [R]
no singular, B T AB es simétrica de…nida positiva.
iii) Todos los valores propios de A son positivos. 1
iv) A
es simétrica, de…nida positiva.
v) aii > 0
i = 1; :::; n:
vi) det (A) > 0 y det (Ak ) > 0; k = 1; :::; n, donde Ak es la matriz de k k primeras …las y columnas de A: vii) Se de…ne A0 = I; Am+1 = Am A y A positiva, para todo m 2 Z.
m
= A
1 m
k obtenida de A con las
para m 2 N. Se tiene Am simétrica, de…nida
viii) Existe una matriz triangular inferior L no singular tal que A = LLT : Demostración. Son resultados conocidos del álgebra lineal. Las demostraciones y más detalles sobre este tema puede encontrar en los textos de Algebra Lineal citados en la bibliografía.
6.3.2.
Matrices monótonas y diagonalmente dominantes.
De…nición 3 Sea A = (aij ) 2 Mn ! x 0: Ejemplo 2
2 Sea A = 4 1 0
Se dice que A es monótona si para ! x 2 Rn ; A! x
n [R].
3 0 1 5y! x T = (x1 ; x2 ; x3 ) 2 R3 : Entonces, 2 2 32 3 2 3 2 1 0 x1 2x1 x2 1 5 4 x2 5 = 4 x1 + 2x2 x3 5 A! x =4 1 2 0 1 2 x3 x2 + 2x3
1 2 1
es decir
8 x2 < 2x1 x1 +2x2 x3 : x2 +2x3
0 =)
0
0 0 0
Multiplicando por 2 a la primera desigualdad y sumando con la segunda, obtenemos 3x1 x3 0 ( ): De manera similar, multiplicando por 2 a la tercera desugaldad y sumando con la segunda, obtenemos x1 + 3x3 0 ( ): Multiplicando por 3 a (**) y sumando (*) deducimos 8x3 0 ) x3 0: De (*), se tiene 3x1 x3 0 ) x1 0: Como
x1 + 2x2
Luego, A! x
x3
0)! x
0 ) 2x2
x1 + x3
0 ) x2
0:
0, es decir A es monótona.
Teorema 2 Sea A 2 Mn
n [R].
Entonces, A es monótona si y solo si A
Demostración. Supongamos que A supongamos A! x 0. Entonces,
1
0:
0. Mostremos que A es monótona. En efecto, sea ! x 2 Rn y
1
A
1
(A! x)
de donde A
1
A ! x
A
1
0 = 0;
0,! x
0:
332
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Así,
A! x
0)! x
0:
Recíprocamente, supongamos que A es monótona, probemos que A es invertible y que A Sea ! x 2 Rn tal que A! x = 0. Por ser A monótona, se tiene ! x
1
0:
0:
Por otro lado, A ( ! x) = 0 ) ! x 0o! x 0: Consecuentemente, A! x =0)! x = 0, es decir que ker (TA ) = f0g, donde TA es la aplicación lineal de Rn en Rn de…nida por TA (! x ) = A! x , que prueba que A es invertible. Ponemos A 1 = [B1 ; :::; Bn ] con Bj la j-ésima columna de A 1 y sea ! e T1 ; :::; ! e Tn n R : Puesto que AA 1 ! ej =! e j 0 ) A 1! e j 0 j = 1; :::; n; pero A 1 ! e =B 0. Luego A 1 0: j
la base canónica de
j
De…nición 4 Sea A = (aij ) 2 Mn
n [R] :
i) Se dice que A es estrictamente diagonalmente dominante si y solo si jaii j > 1; :::; n: ii) Se dice que A es diagonalmente dominante si y solo si jaii j
Pn
j=1 jaij j ; j6=i
Pn
j=1 jaij j ; j6=i
i=
i = 1; :::; n:
Ejemplos
1. La siguiente es una matriz 2
6 6 6 2. La matriz A = 6 6 6 4
2 1 .. . .. . 0
1 2 .. .
2
4 6 2 estrictamente diagonalmente dominante: A = 6 4 3 0 3 0 0 1 0 7 7 .. 7 .. .. . . . 7 7es diagonalmente dominante. 7 .. .. . . 1 5 1 2
1 5 2 1
1 1 7 4
3 0 1 7 7: 1 5 6
3. Sean k > 0; k = 1; :::; m; hi > 0; i = 1; :::; n + 1; A = (aij ) ; B = (bij ) las matrices que se de…nen a continuación: 8 8 1 ; i = 1; :::; n; aii = h1i + hi+1 > > bii = h3i + hi+1 > > 3 ; i = 1; :::; n; > > < < 1 h i aii 1 = hi ; i = 2; :::; n; bi;i 1 = 6 ; i = 2; :::; n; 1 > > a = ; i = 1; :::; n 1; bii+1 = hi+1 ; i = 1; :::; n 1; ii+1 > > hi+1 > > : : b = 0 6 si ji jj > 1: aij = 0 si ji jj > 1; ij
Las matrices A y B son tridiagonales con A diagonalmente dominante y B estrictamente diagonalmente dominante. Las matrices B + 2k A k = 1; :::; m; son estrictamente diagonalmente dominantes. Esta clase de matrices surgen en la discretización de ecuaciones en derivadas parciales del tipo parabólico siguiente: @u @ 2 u = f: @t @x2
Teorema 3 Sea A = (aij ) 2 Mn
n [R] :
i) Si A es estrictamente diagonalmente dominante, A es no singular. ii) Si A es estrictamente diagonalmente dominante y simétrica con aii > 0 i = 1; :::; n; A es de…nida positiva.
6.3. ALGUNOS TIPOS DE MATRICES IMPORTANTES.
333
Demostración. i) Supongamos que A es singular, entonces ker (TA ) = f0g donde TA es la aplicación ! lineal de…nida por TA (! x ) = A! x ; 8! x 2 Rn : Sea ! x T = (x1 ; :::; xn ) 2 ker (TA ) con ! x 6= 0 y k 2 f1; :::; ng tal que jxk j = Max jxi j. Se tiene xk 6= 0 y como ! x 2 ker (TA ) ; TA (! x ) = A! x = 0 y en i=1;:::;n
consecuencia la k-ésima ecuación se escribe ak1 x1 + ::: + akk
1 xk
+ akk xk + akk+1 xk+1 + ::: + akn xn = 0;
de donde
n X
akk xk =
akj xj;
j=1 j6=k
y de esta igualdad, tomando el valor absoluto, se tiene jakk j jxk j = jakk xk j =j
n X j=1 j6=k
X
ak xj j
j=1 j6=k
jakj j jxj j ;
y de esta desigualdad se obtiene la siguiente: jakk j
Puesto que jxj j
jxk j
j = 1; :::; n;
jxj j jxk j
n X j=1 j6=k
jakj j
jxj j : jxk j Pn
1. Luego jakk j
es estrictamente diagonalmente dominante, esto es, jakk j >
n P
j=1 j6=k
j=1 j6=k
jakj j ; que contradice la hipótesis A
jakj j
k = 1; :::; n:
ii) Se propone como ejercicio. Teorema 4 Sea A = (aij ) 2 Mn n [R]. Supóngase que aii > 0 i = 1; :::; n; aij 0 para i; j = 1; :::; n; i 6= j; y, A es estrictamente diagonalmente dominante, entonces A es monótona. Demostración. Sea D la matriz diagonal de…nida por D = diag (a11 ; :::; ann ) : Puesto que aii > 0; i = 1; :::; n; D es invertible y 1 1 D 1 = diag ; :::; : a11 ann Se de…ne B = I
D
1A
= (bij ). Entonces bii = 0 i = 1; :::; n; aij 0 i; j = 1; :::; n; i 6= j: bij = aii
Como A es estrictamente diagonalmente dominante, A es invertible. De la igualdad B = I D sigue que A = D (I B) o bien D 1 A = I B que muesta que I B es invertible. Además, A
1
= (I
B)
1
D
1
:
Por otro lado, A es estrictamente diagonalmente dominante, entonces aii >
n X j=1 j6=i
jaij j =
de donde 1>
X j=1 j6=i
n X
aij i = 1; :::; n;
j=1 j6=i
n
X aij = bij; aii j=1 j6=i
1A
se
334
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
que muestra que la matriz I
B es estrictamente diagonalmente dominante.
Sea m 2 Z+ , no es difícil probar que l m (I
Se de…ne Sm =
m P
1
B)
m!1
B m+1 = 0:
B k . Entonces
k=0
Sm
BSm = I Sm = (I
Luego
1 X
B)
1
bk = l m Sm = (I
1
A
= (I
B)
1
l m (I
m!1
1
B m+1
B) Sm = I
B m+1 = (I
I
B)
m!1
k=0
Así,
B m+1 () (I
D
1
=
1 X
B)
1
B)
Bk D
1
(I
B)
B m+1 = (I
1
1
B m+1 :
B)
1
:
0:
k=0
6.3.3.
Matsrices normales y ortogonales.
De…nición 5 Sea Q = (qij ) 2 Mn
n [R] :
i) Se dice que Q es una matriz normal si QQT = QT Q: ii) Se dice que Q es una matriz ortogonal si QQT = QT Q = I: Ejemplos 1. Toda matriz simétrica A es una matriz normal. En efecto, como A = AT se sigue que A2 = AA = AAT = AT A: 2. Sea A 2 Mn
n [R]
y Q = AT A. Entonces Q es una matriz normal. Pués QT = AT A
T
= AT AT
T
= AT A = Q;
que muestra que Q es una matriz simétrica. En consecuencia, Q es una matriz normal. Note que Q 2 Mn n [R] : De manera similar, la matriz Q = AAT es simétrica luego Q es una matriz normal. Note que Q 2 Mm m [R] : 3. Sea
2 R y Q( ) =
cos( ) sen( )
sen( ) cos( )
: Entonces
Q ( )T =
cos( ) sen( ) sen( ) cos( )
:
Como sen2 ( ) + cos2 ( ) = 1, resulta Q ( ) = Q ( )T = =
cos( ) sen( )
sen( ) cos( )
cos( ) sen( ) sen( ) cos( )
cos2 ( ) + sen2 ( ) sen2 (
)+
cos2 (
)
=
1 0 0 1
:
Así, Q ( ) Q ( )T = I: De manera similar se obtiene Q ( )T Q ( ) = I. Por lo tanto Q ( ) es una matriz ortogonal. La matriz Q ( ) se llama matriz de rotación.
6.3. ALGUNOS TIPOS DE MATRICES IMPORTANTES.
335
4. Toda matriz de permutación P es una matriz ortogonal. pues P T = P
1
o bien P P T = P T P = I:
5. Toda matriz ortogonal es una pero el recíproco, en general, no es cierto. Para ello 2 matriz normal, 3 1 1 1 considérese la matriz A = 4 2 2 0 5 y Q = AT A: Resulta que Q es una matriz simétrica, por 3 3 1 lo tanto Q es una matriz normal. Además 2 32 3 2 3 1 2 3 1 1 1 14 14 2 Q = AT A = 4 1 2 3 5 4 2 2 0 5 = 4 14 14 2 5 ; 1 0 1 3 3 1 2 2 2 2 32 3 2 3 14 14 2 14 14 2 396 396 60 QQT = 4 14 14 2 5 4 14 14 2 5 = 4 396 396 396 5 6= I: 2 2 2 2 2 2 60 396 12 6. Matriz de Householder. Sea ! u 2 Rn tal que k! u k = 1. La matriz 2! u! uT
H=I
es ortogonal. Esta matriz H se conoce como matriz de Householder, quien la propuso en 1958. Mostremos que H es ortogonal. En efecto, HH T
=
I
=
I
2! u! uT 2! u! uT
I I
Puesto que I ! u! uT =! u! u T;
T 2! u! u T = I 2! u! uT 2! u! u T = I 2I ! u! uT
T
2 ! u! uT 2 ! u! uT I +4 ! u! uT
IT
! u! uT :
! u! ut I =! u! u T, y 2 1 = k! uk =! u T! u;
entonces HH T = I
4! u! u T I + 4! u ! u T! u ! uT =I
4! u! u T + 4! u! u T = I:
Además, la matriz H es simétrica. Pués, HT = I
2! u! uT
T
=I
2! u! u T = H:
En consecuencia, H 2 = H T H = HH T = I: La matriz de Householder H es vital para el desarrollo del método de factorización QR de Householder que se utiliza en la resolución de sistemas de ecuaciones lineales (véase el capítulo de mínimos cuadrado, método de Householder) y el cálculo de valores y vectores propios (véase el capítulo de valores y vectores propios). En la descomposición de Householder, Q es una matriz ortogonal que se construye con la matrices H y R es una matriz triangular superior. Más adelante se verá esta factorización. Observación. De la de…nición de matriz ortogonal se desprende inmediatamente que si Q es tal matriz, Q es invertible y que Q 1 = QT : Como consecuencia de este último resultado, se deduce que la matriz de Householder es invertible, y, H 1 = H T = H: Teorema 5 Sea Q 2 Mn
n [R].
Entonces Q es normal si y solo si QT ! x = kQ! xk
8! x 2 Rn :
336
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Demostración. Supongamos que Q es normal. Entonces QQT = QT Q: Luego, para todo ! x 2 Rn ; QT ! x
2
= QT ! x
T
QT ! x =! x T QT
T
T 2 QT ! x =! x T QQT ! x =! x QT Q! x = (Q! x ) Q! x = kQ! xk :
Tomando en cuenta que la norma es no negativa, se sigue que xk QT ! x = kQ! Recíprocamente, supongamos que QT ! x = kQ! xk QT ! x Así, ! x T QQT
2
8! x 2 Rn : 8! x 2 Rn . Se tiene
T 2 T kQ! x k , QT ! x QT ! x = (Q! x ) Q! x ,! x T QQT ! x =! x T QT Q! x ! ! T T T , x QQ Q Q x = 0:
=
QT Q ! x =0
8! x 2 Rn , de donde QQT
QT Q = 0 , QQT = QT Q:
Teorema 6 Sean Q1 ; Q2 dos matrices ortogonales. Entonces Q1 Q2 es una matriz ortogonal. Demostración. Si Q1 ; Q2 son matrices ortogonales, se tiene Q1 QT1
= QT1 Q1 = I;
Q2 QT2
= QT2 Q2 = I:
Luego, (Q1 Q2 )T Q1 Q2 = QT2 QT1 Q1 Q2 = QT2 QT1 Q1 Q2 = QT2 IQ2 = QT2 Q2 = I: De manera similar se prueba que Q1 Q2 (Q1 Q2 )T = I: Por lo tanto Q1 Q2 es una matriz ortogonal. Nota: Si Q1 ; Q2 son matrices normales, en general, Q1 Q2 no es una matriz normal. Exhibimos dos ejemplos, uno en el que el resultado es verdadero y otro en el que el resultado es falso. 3 1
1. Consideremos Q1 ; Q2 las matrices Q1 = Q1 QT1
=
Q1 QT1
=
3 1
1 3
;
3 1 1 3
1 3
3 1
3 1 1 3
2 1
10 0 0 10
=
1 3
1 2
Q2 =
: Entonces
= 10I;
= 10I:
Luego, QT1 Q1 = Q1 QT1 , es decir, Q1 es una matriz normal. De modo similar, tenemos Q2 QT2 =
1 2
2 1
1 2 2 1
=
5 0 0 5
= 5I = QT2 Q2 ;
que muestra que Q2 es normal. Ahora, 3 1
Q1 Q2 =
1 3
1 2
2 1
=
1 7
7 1
;
y 1 7 7 1
(Q1 Q2 )T Q1 Q2 = (Q1 Q2 ) (Q1 Q2 )T
=
1 7
Resulta que Q1 Q2 es una matriz normal.
7 1
1 7
7 1
=
50 0 0 50
= 50I;
1 7 7 1
=
50 0 0 50
= 50I:
6.3. ALGUNOS TIPOS DE MATRICES IMPORTANTES. 1 1 1 1
2. Sean Q1 =
;
1 1 1 1
=
QT1 Q1 =
1 1
Q2 QT2
0 0 0 1
1 1 1 1
Sea A = Q1 Q2 =
0 0 . Entonces 0 1
Q2 = Q1 QT1
337
=
0 0 0 1
=
1 1
1 1
1 1
=
2 0 0 2
= 2I;
1 1 1 1
=
2 0 0 2
= 2I;
0 0 0 1
=
0 0 0 1
= QT2 Q2 :
0 1 . Luego 0 1
=
0 1 0 1
0 0 1 1
=
1 1 1 1
;
AT A =
0 0 1 1
0 1 0 1
=
0 0 0 2
:
AAT
Claramente AAT 6= AT A. El producto de dos matrices normales, no es en general, una matriz normal como acabamos de comprobar. Teorema 7 Sea Q 2 Mn
n [R].
Las tres proposiciones siguientes son equivalentes:
i) QT Q = I; T ii) (Q! x ) Q! y =! x T! y
iii) kQ! x k = k! xk
8! x;! y 2 Rn ;
8! x 2 Rn :
Demostración. i) ) ii.) Supongamos que QT Q = I sean ! x;! y 2 Rn . Entonces T (Q! x ) Q! y =! x T QT Q! y =! x T I! y =! x T! y: T ii) ) iii.) Sean ! x;! y 2 Rn . Si (Q! x ) Q! y =! x T! y , en particular para ! x =! y , se tiene 2 T 2 kQ! x k = (Q! x ) Q! x =! x T! x = k! xk ;
de donde
kQ! x k = k! xk
iii) ) i.) Si kQ! x k = k! xk 2 kQ! xk
8! x 2 Rn , se sigue que:
8! x 2 Rn :
2 T k! x k , (Q! x ) Q! x =! x T! x ,! x T QT Q! x =! x T I! x ! ! ! T T n , x Q Q I x = 0 8x 2R ;
=
de donde QT Q = I: Teorema 8 Sea Q 2 Mn siguientes:
n [R].
Entonces, Q es ortogonal si y solo si se satisfacen las dos condiciones
i) Q es invertible. ii) kQ! x k = k! xk
8! x 2 Rn :
Demostración. Supongamos que Q es ortogonal. Entonces QT Q = QQT = I; de donde QT = Q es, Q es una matriz invertible.
1,
esto
338
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Sea ! x 2 Rn . Entonces 2 T 2 kQ! x k = (Q! x ) Q! x =! x T QT Q! x =! x T I! x =! x T! x = k! xk ;
con lo cual
kQ! x k = k! xk
8! x 2 Rn :
Así, si Q es ortogonal, se tiene i) ) ii): Recíprocamente, supongamos que se satisfacen i) y ii). Mostremos que Q es ortogonal. Por i) se tiene que Q es invertible y por ii) kQ! x k = k! xk 8! x 2 Rn : Por el teorema precedente se deduce que QT Q = I que implica QT = Q QQT = QQ
1
1.
Luego
= I = QT Q;
es decir que Q es una matriz ortogonal.
6.4.
Métodos directos de resolución de sistemas de ecuaciones lineales.
! En lo sucesivo consideraremos sistemas de ecuaciones lineales A! x = b ; donde A = (aij ) 2 Mn n [R] con ! A 6= 0 y b 2 Rn . Como ya se indicó en el capítulo 1, llamamos método directo de resolución del sistema de ecuaciones lineales, un método que conduce a la solución del problema al cabo de un número …nito de pasos, o bien en un número …nito de operaciones aritméticas elementales (suma, resta, multiplicación , división y raíz cuadrada) que es función de la dimensión n del sistema. En cada método directo, se debe estimar: el número de operaciones elementales necesarias en la ejecución del algoritmo, y, la exactitud y precisión del método. i) El número de operaciones elementales necesarias en la ejecución del algoritmo es una función que depende de la dimensión n de la matriz cuadrada A; a esta función se le denota N oper: Z+ ! R que a cada n 2 Z+ asocia N oper (n) que expresa el número total de operaciones elementales. ii) La exactitud y precisión del método dependen sobre todo del condicionamiento de la matriz y de la estabilidad del método, es decir que pequeños errores en los datos de entrada provocan pequeños errores en los datos de salida, o lo que es lo mismo, es insensible a la propagación de errores de redondeo. En el apéndice se muestra el número de condicionamineto. Para cada método estudiado se debe elaborar un algoritmo numérico, en lo posible, el más óptimo. En este capítulo se tratarán los métodos clásicos de resolución de sistemas de ecuaciones lineales siguientes: 1.- Método de eliminación gaussiana simple, con pivoting parcial y con pivoting total. 2.- Método de facturación LU. 3.- Método de Choleski. El método de Householder será estudiado en el capítulo de mínimos cuadrados, sin embargo, en este capítulo introducimos algunos resultados acerca de las matrices ortogonales. Por otro lado, utilizando el método de eliminación gaussiana se propone un algoritmo de cálculo de la matriz inversa de A y otro para el cálculo del determinante de A. Adicionalmente, par matrices ! ! A = (aij ) 2 Mm n [R] no nulas, b 2 Rm , se consideran sistemas de ecuaciones A! x = b ; y se buscan soluciones en mínimos cuadrados si el sistema de ecuaciones no tiene solución; y, en norma mínima si el sistema de ecuaciones posee in…nitas soluciones.
6.4. MÉTODOS DIRECTOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES. 339 La idea general de los métodos directos de resolución de sistemas de ecuaciones lineales es la factorización de la matriz A 2 Mn n [R] en la forma LR, donde L es una matriz elegida apropiadamente, R una matriz triangular superior. Además, L y R son matrices invertibles. Entonces ! ! A! x = b , LR! x = b: ! Sea ! y = R! x , entonces L! y = b . Así, ( ! ! L! y = b; ! Ax = b , (15) R! x =! y; ! que muestra que si la matriz A se factora en la forma LR, la resolución del sistema de ecuaciones A! x = b es equivalente a los siguientes: ! L! y = b (16) y a continuación
R! x =! y
(17)
Además, como L, R son invertibles, se tiene
y Luego ! x =R
1!
y =R
1
L
1!
b
! y =L
1!
! x =R
1!
= R
b
y:
1
L
1
! b = (LR)
1!
b =A
1!
b;
es decir que la solución ! x del par de sistemas de ecuaciones (16) y (17) es la solución del sistema de ! ! ecuaciones A x = b y recíprocamente. Por otro lado, los sistemas de ecuaciones 16) y 17) son muy sencillos de resolver. Más aún, comenzaremos nuestro estudio de solución de sistemas de ecuaciones lineales de los tipos (16) y (17) denominados triangulares inferiores y superiores, respectivamente. A continuación se describen los métodos de factorización de matrices A en la forma LR.
6.4.1.
Sistemas de ecuaciones lineales triangulares superiores e inferiores.
De…nición 6 Sean A = (aij ) 2 Mn
n [R],
!T b = (b1 ; : : : ; bn ) 2 Rn .
i) Se dice que A es una matriz triangular superior si y solo si los coe…cientes de A satisfacen la siguiente condición: aij = 0 para i > j, i = 2; :::n, j = 1; :::n: (18) ! ii) Si A es una matriz triangular superior, se dice que el sistema de ecuaciones lineales A! x = b es triangular superior. iii) Se dice que A es una matriz triangular inferior si y solo si los coe…ecientes de A satisfacen la condición siguiente: aij = 0 para j > i, i = 1; :::; n, j = 2; :::n: (19) ! iv) Si A es una matriz triangular inferior, el sistema de ecuaciones lineales A! x = b se llama sistema triangular inferior. Ejemplos 2
3 6 0 1. La matriz A siguiente es triangular superior. A = 6 4 0 0
5 2 0 0
0 1 3 0
3 1 0 7 7: 2 5 4
340
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
8 2x+ 3y+ 5z w = 1 > > < y z+ w = 2 2. El siguiente es un sistema de ecuaciones triangular superior: 3z w = 1 > > : 5w = 20: 3 2 2 3 5 1 6 0 1 1 1 7 7 que es triangular Note que la matriz A del sistema de ecuaciones es A = 6 4 0 0 3 1 5 0 0 0 5 superior. 8 4x = 2 > > < 3x 2y = 1 3. El siguiente es un sistema de ecuaciones lineales triangular inferior: x +2y +3z = 0 > > : x 2y 2z w = 2 2 3 4 0 0 0 6 3 7 2 0 0 7 que es triangular Observe que la matriz A del sistema de ecuaciones es A = 6 4 1 2 3 0 5 1 2 2 1 inferior. Resolución numérica. ! Sean A = (aij ) 2 Mn n [R] una matriz triangular superior, b 2 Rn . Consideramos el sistema de ecuaciones lineales triangular superior: ! A! x = b; o en forma explícita
8 > < a11 x1 +
+ a1n xn
= .. .
> :
b1
ann xn = bn : ! Los valores xi , i = 1; :::; n, de la solución x = (x1 ; :::xn ), siempre que esta exista, se obtienen mediante el procedimiento de “vuelta atrás”, siguiente: xn = xn 1 = .. . xj
=
bn
1
an
1 ajj
bj
=
1 a11
1;n 1
n P
b1
n P
ann 6= 0; an 1;n 1 6= 0;
;
ajk xk
k=j+1
.. . x1
bn ann an 1n xn
!
;
a1k xk ;
ajj 6= 0;
a11 6= 0:
k=2
Del cálculo de x1 ; :::; xn ; se deduce que el sistema de ecuaciones lineales triangular superior tiene solución única si y solo si aii 6= 0, i = 1; :::; n. Para la resolución de este sistema de ecuaciones se requieren ejecutar los números siguientes de operaciones elementales: Productos : 0 + 1 + ::: + n Adiciones : 0 + 1 + ::: + n
n (n 1) ; 2 n (n 1) 1= ; 2
1=
Divisiones : n: ! El número total de operaciones para el cálculo de ! x solución de A! x = b es N oper (n) = n +
n (n 1) n (n 1) + = n2 : 2 2
6.4. MÉTODOS DIRECTOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES. 341 Ejemplo
Resolver el sistema de ecuaciones “vuelta atrás”, tenemos u = z = y = x =
8 > > <
3x +2y 0;5y
> > :
z +u = +z u = 4z +u = 2u =
1 3 0 1:
Aplicando el procedimiento de
1 = 0;5; 2 0 1 0;5 = 0;125; 4 3 0;125 ( 1) 0;5 = 6;75; 0;5 1 2 6;75 ( 1) 0;125 0;5 = 4;625: 3
La solución es ! x T = (4;625; 6;75; 0;125; 0;5) : Algoritmo El procedimiento de “vuelta atrás” descrito precedentemente permite elaborar el siguiente algoritmo: ! Datos de entrada: n 2 Z+ , A = (aij ) 2 Mn n [R], b T = (b1 ; :::; bn ) 2 Rn :
Datos de salida: ! x T = (x1 ; :::; xn ) 2 Rn , Mensaje: “Matriz A singular”. 1. Si ann 6= 0, xn =
bnn ann :
Caso contrario, imprimir mensaje. Continuar en 4). 2. Para j = n
1; :::; 1
Si ajj 6= 0:; S = 0: k = j + 1, n S = S + ajk xk xj =
(bj S) aj
Fin de bucle k. Caso contrario, imprimir mensaje. Continuar en 4) Fin de bucle j. 3. Imprimir ! x T = (x1 ; :::; xn ) : Continuar en 5). 4. Mensaje: matriz singular. 5. Fin. Tratamos continuación los sistemas de ecuaciones lineales triangulares inferiores. ! Sean A = (aij ) 2 Mn n [R] una matriz triangular inferior, b T = (b1 ; :::; bn ) 2 Rn . Consideremos el ! sistema de ecuaciones triangular inferior A! x = b ; o escrito en forma explícita 8 = b1 ; > < a11 x1 .. . > : an1 x1 +::: + ann xn = bn ;
342
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
cuya solución ! x T = (x1 ; :::; xn ), siempre que esta exista, puede calcularse con el procedimiento siguiente: 8 1 , a11 6= 0; x1 = ab11 > > > < ! jP1 > 1 > > bj ajk xk , ajj 6= 0; j = 2; :::; n: : xj = ajj k=1
Algoritmo
Datos de entrada: n 2 Z+ , A = (aij ) 2 Mn
n [R],
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de salida: ! x T = (x1 ; :::; xn ) 2 Rn , Mensaje: “Matriz A singular”. 1. Si a11 6= 0, x1 =
b1 a11
Caso contrario, imprimir mensaje. Continuar en 5). 2. Para j = 2; :::; n Si ajj 6= 0:; S = 0: k = 1; :::; j
1
S = S + ajk xk xj =
(bj S) ajj
Fin de bucle k. Caso contrario, imprimir mensaje. Continuar en 5). Fin de bucle j. 4. Imprimir ! x T = (x1 ; :::; xn ) : Continuar en 6). 5. Mensaje: matriz singular. 6. Fin. El número de operaciones elementales, para hallar la solución de un sistema de ecuaciones triangular inferior es: N oper (n) = n2 : Debe notarse que si A es una matriz triangular superior o inferior singular, el sistema de ecuaciones ! A! x = b puede tener in…nitas soluciones o ninguna solución. Se propone como ejercicio el estudio de estas dos situaciones y la implementación correspondiente en los algoritmos descritos precedentemente. Nota: Si A = (aij ) 2 Mn n [R] es una matriz triangular superior, los elementos de la diagonal principal ! de A; ajj , j = 1; :::; n, se llaman pivotes de la matriz triangular, y si b 2 Rn , ajj se llaman pivotes del ! sistema de ecuaciones A! x = b. Consecuencias El cálculo del determinante de una matriz A 2 Mn teorema. Teorema 9 Sea A = (aij ) 2 Mn
n [R]
n [R]
triangular superior se establece en el siguiente
una matriz triangular superior. Entonces, det (A) =
Demostración. Procedemos por inducción. Si n = 1, A = (a11 ) y en consecuencia det (A) = a11 .
Qn
j=1 aij :
6.4. MÉTODOS DIRECTOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES. 343 La hipótesis inductiva establece que si A = (aij ) 2 M(n Probemos que es cierto para n
1) (n 1) [R],
entonces det (A) =
nQ1
ajj :
j=1
1. Sea A = (aij ) 2 Mn
n [R]
una matriz triangular superior.
Desarrollamos el determinante de A por elementos de la primera columna. Se tiene det (A) = a11 A11 + ::: + an1 An1 ; donde Ai1 , i = 1; :::; n, es el cofactor de ai1 , i = 1; :::; n: Puesto que A es triagular superior, a21 = ::: = an1 = 0, y a11 A11 = a11 ( 1)2 det (An 1 ) = a11 det (An 1 ) ; donde det (An
1)
es el determinante de la matriz obtenida de A al eliminar la primera …la y la primera n Q columna. Por la hipótesis inductiva, det (An 1 ) = ajj . Luego j=2
det (An
1 ) = a11
n Y
ajj =
j=2
n Y
ajj :
j=1
Un resultado similar se obtiene cuando A = (aij ) 2 Mn n Q det (A) = ajj :
n [R]
es una triangular inferior. Se tiene
j=1
En el siguiente teorema se establece un método para el cálculo de la matriz inversa de una matriz triangular superior invertible. Teorema 10 Sea A = (aij ) 2 Mn n [R] una matriz triangular superior invertible. Entonces, la j-ésima columna de A 1 es solución del sistema de ecuaciones lineales A! x =! ej ; donde f! e1 ; :::; ! en g es la base canónica de Rn , y ! ej T = (0; :::; 1; :::; 0). Además, A 1 es triangular superior. Demostración. Sea A h i = (aij ) 2 Mn n [R] una matriz triangular superior invertible. Pongamos ( 1) ( 1) ( 1) 1 A = A1 ; :::; An , donde Aj denota la j-ésima columna de A 1 . Sea ! x la solución del sistema de ecuaciones lineales A! x =! ej , Multiplicando por A
1,
se tiene 1
A y tomando en cuenta que AA
1
=A
j = 1; :::; n:
A! x =A
1! ej ;
1A
= I, se sigue que i ( 1) ( ! x = A1 ; :::; A(n 1) ! ej = Aj h
1)
:
Mostremos que A 1 es triangular superior. ! ! Sean b 2 Rn y ! x la solución del sistema de ecuaciones lineales A! x = b : Entonces 8 bn > xn = > > > ann > < .. . ! > > n P > 1 > > b1 a1j xj : x1 = a11 j=2 ! En particular, si b = ! ej
! j = 1; :::; n, se tiene: para j = 1, b T (1; 0; :::; 0), x2 = 0; :::; xn = 0, x1 = 2 1 3 ( 1)
A1
a11
6 7 = 4 ... 5 : 0
b1 a11
344
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Continuando con este procedimiento, para j = n se tiene 8 1 > ; xn = > > > ann > < .. . ! > > n P > 1 > > 0 a1j xj ; : x1 = a 11 j=2 ( 1)
con lo cual An
A
1
3 x1 7 6 = 4 ... 5 de donde A xn 2
es triangular superior.
1
2
6 6 6 =6 6 6 4
1 a11
0 .. . 0
1 a12 a11 a22 1 a22
.. . 0
..
.
1 a11
3 a1j xj 7 a=2 7 .. 7 7 que muestra que . 7 7 .. 5 . n P
1 ann
Un resultado similar se establece para matrices triangulares inferiores invertibles, esto es, si A = (aij ) 2 Mn n [R] es triangular inferior invertible, A 1 es triangular inferior y cada columna de A 1 es solución del sistema de ecuaciones A! x =! ej , j = 1; :::; n. Si se toma en consideración que cada columna de A 1 es solución de sistema de ecuaciones triangular superior A! x =! ej , el número de operaciones elementales para calcular ! x es n2 . Luego, para calcular A 1 se requieren de n3 operaciones elementales, esto es, N oper (n) = n3 : El procedimiento descrito en el teorema precedente para el cálculo de A 1 es práctico pero no óptimo. Si se observa la matriz A 1 , es claro que se puede elaborar un algoritmo óptimo y reducir el número de operaciones elementales. Un algoritmo de cálculo de A 1 , no óptimo, basado el el teorema precedente, es el siguiente: Algoritmo Datos de entrada: n 2 Z+ ; A = (aij ) 2 Mn
n [R] :
Datos de salida: Mensaje 1: “A no es triangular superior”. Mensaje 2: “A no es invertible”, B = A (bij ) : 1. Para i = 2; :::; n; Para j = 1; :::; n Si i > j y jaij j > 0, imprimir mensaje 1, continuar en 5) .
Fin de bucle j. Fin de bucle i.
2. Para i = 1; :::; n Si jaii j
0, imprimir mensaje 2, continuar en 5).
Fin de bucle i. 3. Para j = 1; :::; n Resolver el sistema de ecuaciones A! x =! ej : Para i = 1; :::; n; bij = xi Fin de bucle i.
1
=
6.5. OPERACIONES ELEMENTALES CON MATRICES.
345
Fin de bucle j. 4. Imprimir A
1
= B:
5. Fin Ejercicios 1. Mejorar el algoritmo precedente en en punto 3. 2. Elaborar un algoritmo, el mejor posible, para calcular A
6.5.
1.
Estimar N oper (n) :
Operaciones elementales con matrices.
La matriz identidad I = (epq ) 2 Mn Sea A = (aij ) 2 Mn
n [R]
n [R]
está de…nida como epq =
1, si p = q, p; q = 1; :::; n; 0, si p = 6 q:
una matriz no nula.
i) Intercambio de dos …las de A Sea Fi;j = (fpq ) 2 Mn
n [R]
la matriz obtenida de I al intercambiar la …la i con la …la j, i < j, esto es,
1, si p = q, p; q = 1; :::; n, p 6= i; j o p = j, q = i; o p = i; q = j: 0, en otro caso.
fpq =
La matriz Ai;j que se obtiene de A al intercambiar la …la i con la …la j de la matriz A esta de…nida como Ai;:j = Fi;j A: Ejemplo 2
2 6 1 Sean A = 6 4 0 1 A2;3
3 3 1 2
5 4 0 3
3 2 8 1 0 7 6 2 7 0 0 y F2;3 = 6 4 0 1 1 5 4 0 0 2
1 6 0 = F2;3 A = 6 4 0 0
0 0 1 0
0 1 0 0
0 1 0 0
32 2 0 7 6 0 76 1 0 54 0 1 1
3 0 0 7 7 : Entonces 0 5 1 3 3 1 2
5 4 0 3
3 2 2 8 6 7 2 7 6 0 = 1 5 4 1 1 4
3 1 3 2
5 0 4 3
3 8 1 7 7: 2 5 4
Observe que la tercera …la de A ha remplazado a la segunda …la de A y esta ha ocupado la tercera …la. Note que la matriz Fi;j es no singular y det (Fi;j ) = 1: ii) Intercambio de dos columnas de A: Sea Ci;j = (Cpq ) 2 Mn cpq =
n [R]
la matriz de…nida como
1, si p = q, p; q = 1; :::; n, o p = i, q = j; o p = j; q = i: 0, en otro caso.
La matriz Bij que se obtiene de A al intercambiar la columna i con la j de la matriz A está de…nida como: Bi;j = ACi;j , i < j: Ejemplo
346
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES 2
2 6 3 Sean A = 6 4 5 3
4 6 10 6
B1;4 = AC1;4
6 8 9 12 15 20 9 12 2 2 6 3 =6 4 5 3
3
7 7 y C14 5 4 6 10 6
6 9 15 9
2
0 6 0 =6 4 0 1
0 1 0 0 32
0 0 1 0
0 8 6 0 12 7 76 20 5 4 0 1 12
3 1 0 7 7. Entonces 0 5 0 3 2 8 0 0 1 6 12 1 0 0 7 7=6 0 1 0 5 4 20 12 0 0 0
4 6 10 0
6 9 15 9
3 2 3 7 7: 5 5 3
Observe que la matriz B1;4 se obtiene al intercambiar la primera con la cuarta columna de A. La matriz Ci;j es no singular y det (Ci;j ) = 1: iii) Producto de una constante Sean 1
p
n;
por una …la o columna de A:
2 R. Se de…ne Cp = (cij ) 2 Mn n [R] la matriz de…nida como 8 ; si i = j = p; < 1; si i = j; i; j = 1; :::; n; i 6= p; j 6= p; cij = : 0; en otro caso.
El producto de la constante por la …la p de A se de…ne como Ap = Cp A; o sea 2 32 3 2 1 0 0 a11 a1n a11 6 .. . . .. 7 6 .. .. 7 6 .. 6 6 . 6 . . 7 . 7 6 76 . 7 6 . 7 6 6 7 0 7 6 ap1 apn 7 = 6 Ap = 6 0 6 ap1 6 .. 7 6 7 . . . . . . . .. 5 4 .. .. 5 6 4 . 4 .. 0 0 1 an1 ann an1 El producto de la constante Cp es invertible.
por la columna p de A se de…ne como Bp = ACp : Para
3 a1n .. 7 . 7 7 apn 7 7: .. 7 . 5 ann
6= 0, la matriz
Ejemplo 2
3 2 1 6 3 Sean A = 4 5 7 7 5, C = 4 8 9 10 2 1 A2 = 4 0 0
3 1 0 0 0 20 0 5. Entonces 0 0 1 32 3 2 3 0 0 1 6 3 1 2 3 20 0 5 4 5 7 7 5 = 4 100 120 140 5 : 0 1 8 9 10 8 9 10
Note que la segunda …la de A2 se obtiene al multiplicar la constante = 20 con la segunda …la de A. 2 32 3 2 3 1 6 3 1 0 0 1 40 3 B2 = 4 5 7 7 5 4 0 20 0 5 = 4 5 120 7 5 : 8 9 10 0 0 1 8 180 10 Observe que la segunda columna de B2 se obtiene al multiplicar la constante de la seguna columna de A. iv) Producto de Sean 1
y
i
j
n;
por la …la i y suma del resultado con la …la j de A: 2 R. Se de…nen Ki;j = (kpq ) 2 Mn n [R] como sigue 8 < 1; si p = q; p; q = 1; :::; n; a; si p = i; q = j; kpq = : 0, en otro caso, ei;j = Ki;j A: A
= 20 con los elementos
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
347
ei;j se obtiene al multiplicar la …la i de A por La matriz A
y el resultado se suma con la …la j de A.
Ejemplo
2
2 6 5 Sean A = 6 4 3 1 e1;3 A
8 10 6 1 2
1 0 0 6 0 1 0 = K1;3 A = 6 4 0 1 0 0 0
32 2 0 6 5 0 7 76 0 54 3 1 1
8 10 6 1
0 1 0 0 1 15 9 0
0 0 1 0
3 0 0 7 7 : Entonces 0 5 1
3 2 2 8 2 6 5 10 20 7 7=6 12 5 4 2 + 3 8 + 6 0 1
3 1 2 15 20 7 7: + 9 2 + 12 5 0 1
e1;3 es el resultado de multiplicar la primera …la de A por …la de A
Note que la tercera con la tercera …la. 2 1 0 6 0 1 Sea K2;4 = 6 4 0 0 0 e2;4 A
3 2 2 1 6 0 20 7 7, K1;3 = 6 4 12 5 1 0
1 15 9 0
0 0 1 0
2
3 0 0 7 7. Entonces 0 5 1
32 1 0 0 0 2 6 0 1 0 0 76 5 76 = K2;4 A = 6 4 0 0 1 0 54 3 0 0 1 1
8 10 6 1
1 15 9 0
3 2 2 6 20 7 7=6 5 4 12 1 5
2 5 3 + 1 10
8 1 10 15 6 9 + 1 15
e2;4 es el resultado de multiplicar la segunda …la de A por Observe que la cuarta …la de A sumar con la cuarta …la de A.
6.6.
y luego sumar
3 2 7 20 7: 5 12 20 + 1 y este resultado
Método de eliminación gaussiana.
Sean A = (aij ) Mn
n [R]
! no nula, b T = (b1 ; :::; bn ) 2 Rn . Consideramos el sistema de ecuaciones lineales ! A! x = b:
(1)
e = (e La matriz ampliada A aij ) se de…ne como e 2 Mn Claramente A escribe
aij , si i = 1; ::; n j = 1; :::; n; (2) bi , si i = 1; :::; n; j = n + 1: h !i e e n [R]. Esta matriz A se le representa como A = A j b , que en forma explícita se e aij =
2
a11 6 e = 4 .. A . an1
e0 = A: e y ponemos A
a1n .. .
ann
3 b1 .. 7 ; . 5 bn
(3)
En la resolución de los sistemas de ecuaciones lineales solo los elementos de la matriz A y los componentes ! del vector b intervienen. La idea general del método del eliminación gaussiana es la siguiente: partiendo e0 , construir en n 1 etapas una matriz A en 1 de la forma de la matriz ampliada A 2
(n 1)
a11 6 .. 4 .
0
(n 1)
..
.
a1n .. .
(n 1)
ann
(n 1)
b1
.. .
(n 1)
bn
3 7 5
348
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
que es equivalente al sistema de ecuaciones lineales triangular superior 8 (n > < a11
1)
(n 1)
x1 + ::: +a1n
> :
(n 1)
xn = b1 .. .
(n 1) ann xn
(4)
(n 1) bn
=
que como se ha dicho, es muy sencillo de resolverlo. Comenzamos con el método de eliminación gaussiana sin pivoting que se explica a continuación. Debemos enfatizar en esta parte que no estamos muy interesados en la precisión de la solución y lo que queremos es describir los elementos que intervienen en el algoritmo de la eliminación gaussiana.
6.6.1.
Eliminación gaussiana sin pivoting.
Con el propósito de presentar las ideas fundamentales del método de eliminación gaussiana, consideramos primeramente en ejemplo. 2 3 2 3 1 5 1 0 3 h i 6 2 2 0 0 7 ! 6 2 7 e= Aj! 7; b = 6 7 : Formamos la matriz ampliada A Sean A = 6 b , esto es, 4 2 1 4 1 5 1 4 5 3 6 2 7 7 2
1 6 2 e=6 A 4 2 3 e en n Para transformar la matriz A
5 2 1 6
1 0 1 2
3 3 2 7 7: 1 5 7
0 0 4 7
1 etapas (en este caso 3 etapas) en una matriz de la forma 2
(3)
(3)
a11 6 .. 4 .
..
.
0
(3)
a14 .. .
b1 .. .
(3)
b4
a44
(3)
3 7 5
utilizamos las operaciones elementales con matrices, y particularmente, la de multiplicar a una …la por una constante y el resultado sumar a otra …la. Etapa 1 Si a11 6= 0, se de…ne ki1 =
ai1 , i = 2; 3; 4, a11 2 1 0 6 k21 1 K1 = 6 4 k31 0 k41 0
y K1 es la matriz siguiente: 0 0 1 0
3 2 0 1 6 2 0 7 7=6 0 5 4 2 1 3
0 1 0 0
0 0 1 0
3 0 0 7 7: 0 5 1
Resulta que K1 es una matriz triangular inferior invertible. Ponemos h i h !i e = K1 A e0 = K1 A j ! A b = K1 A j K1 b :
Entonces
2
1 6 2 e1 = 6 A 4 2 3
0 1 0 0
0 0 1 0
32 0 1 7 6 0 76 2 0 54 2 1 3
5 2 1 6
1 0 1 2
0 0 4 7
3 2 3 1 7 6 2 7 6 0 = 1 5 4 0 7 0
5 8 11 9
1 2 3 5
0 0 4 7
3 3 8 7 7: 7 5 16
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA. h
e1 lo notamos Esta matriz A ! ! A1 = K 1 A y b = K 1 b :
349
h i ! i (1) e = A1 j ! A1 j b 1 o también aij , esto es, A b1 =
(1)
aij
; donde
e1 = K1 A e se hagan ceros los Note que la construcción de la matriz K1 conduce a que en la matriz A elementos de la primera columna bajo el primer elemento de la diagonal de A. Etapa 2
(1)
ai2
(1)
Si a22 6= 0, se de…ne ki2 = 2
1 0 6 0 1 Se de…ne K1 = 6 4 0 k34 0 k42
(1) a22
3 2 1 0 7 6 0 7 6 0 = 0 5 4 0 1 0
0 0 1 0
Se de…ne
(1)
, i = 3; 4. En nuestro caso particular a22 = 0 1
0 0 1 0
11 8 9 8
8.
3 0 0 7 7 : La matriz K2 es triangular inferior invertible. 0 5 1
h i h ! i e2 = K2 A e1 = K2 A1 j ! A b 1 = K 2 A1 j K 2 b 1 :
Entonces 2
1 6 0 e2 = 6 A 4 0 0
0 1 11 8 9 8
0 0 1 0
32 1 0 6 0 0 7 76 0 54 0 0 1
5 8 11 9
1 2 3 5
3 2 3 1 6 0 8 7 7=6 7 5 4 0 16 0
0 0 4 7
5 8 0 0
1 0 2 0 1 4 4 11 7 4
h i ! ! (2) e2 = A2 j ! Ponemos A b 2 = aij ; donde A2 = K2 A1 ; b 1 = K1 b 1 :
3 3 8 7 7: 4 5 7
e2 = K2 A e1 conserve los Observe que la construcción de la matriz K2 hace que la matriz aumentada A ceros de la primera columna bajo el elemento de la diagonal y se hagan ceros los elementos de la segunda columna bajo el elemento de la diagonal de la matriz A1 : Etapa 3 (2)
ai3
(2)
Si a33 6= 0, se de…ne ki3 = 2
1 6 0 Sea K3 = 6 4 0 0
Luego
0 0 1 0 0 1 0 k43
2
(2) a33
(2)
, i = 4. En nuestro caso a33 =
3 2 0 1 6 0 0 7 7=6 0 5 4 0 1 0
0 0 1 0 0 1 0 11
1 4.
3 0 0 7 7 : La matriz K3 es triangular inferior invertible. Ponemos 0 5 1
h i h ! i e3 = K2 A e2 = K3 A2 j ! A b 2 = K 3 A2 j K 3 b 2 :
1 0 0 6 0 1 0 e3 = 6 A 4 0 0 1 0 0 11 h i e3 = A3 j ! Ponemos A b 3 ; es
32 0 1 6 0 0 7 76 0 54 0 0 1
5 8 0 0
1 0 2 0 1 4 4 11 7 4
3 2 3 1 6 0 8 7 7=6 4 5 4 0 7 0
5 8 0 0
1 2 1 4
0
0 0 4 51
3 3 8 7 7: 4 5 51
! ! decir que A3 = K3 A2 y b 3 = K3 b 2 que se indican a continuación: 2
1 6 0 A3 = 6 4 0 0
5 8 0 0
1 2 1 4
0
3 0 0 7 7; 4 5 51
2
3 3 6 8 7 ! 7 b3=6 4 4 5: 51
350
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
La matriz A3 es triangular superior que lo notamos R. Entonces R = A3 = K3 A2 = K3 K2 A1 = K3 K2 K1 A; ! ! ! ! b 3 = K3 b 2 = K3 K2 b 1 = K3 K2 K1 b : Puesto que K1 ; K2; K3 son matrices triangulares inferiores invertibles, el producto K3 K2 K1 es una matriz triangular invertible. Ponemos E = K3 K2 K1 . Entonces E 1 es una matriz triangular inferior, y ! ! ! ! R = EA; b 3 = E b de donde A = E 1 R; b = E 1 b 3 : Consecuentemente, ! ! ! A! x = b , E 1 R! x = E 1 b 3 () R! x = b 3; ! ! es decir que la solución ! x 2 R4 de A! x = b es la solución de R! x = b 3 y recíprocamente. Además, es ! sistema de ecuaciones R! x = b 3 es triangular superior que en forma explícita se escribe: 8 5x3 = 3 > > x1 +5x2 < 8x2 +2x3 = 8 1 x +4x 4 > 4 = > 4 3 : 51x4 = 51;
cuya solución es ! x T = (2; 1; 0; 1) :
Conclusión: Si en cada etapa del proceso de eliminación gaussiana, no existe intercambio de …las o (1) (2) (3) columnas, y los elementos pivotes a11 ; a22 ; a33 ; a44 son no nulos, la matriz A se factora en la forma LR, donde L = E 1 es triangular inferior, R triangular superior. Además, el sistema de ecuaciones lineales ! ! A! x = b es equivalente al triangular superior R! x = b 3: Generalicemos las ideas expuestas en el ejemplo. Etapa 1 (0)
Supongamos que a11 6= 0. Ponemos a11 = a11 . Se de…nen ai1 ; a11
ki1 =
i = 2; :::; n;
y sea K1 la matriz siguiente: 2
6 6 K1 = 6 4
1 .. .
0 1 .. .
an1 a11
0
a21 a11
..
.
1
e1 = K1 A: e Entonces De…nimos A esto es
0 0 .. .
3
2
7 6 7 6 7=6 5 4
1 k21 .. .
0 1 .. .
..
kn1 0
.
0 0 .. . 1
3
7 7 7: 5
h i h !i h ! i e1 = K1 A e = K1 A j ! A b = K 1 A j K 1 b = A1 j b 1 ; 2
6 e1 = 6 A 6 4
2
6 6 = 6 4
1 k21 .. .
0 1 .. .
kn1 0
..
.
0 0 .. . 1
32 76 76 76 54
a11 a21 .. .
a1n a2n .. .
b1 b2 .. .
an1
ann
bn
3 7 7 7 5
a11 0 .. .
a12 k21 a12 + a22 .. .
a1n k21 a1n + a2n .. .
b1 k21 b1 + b2 .. .
0
kn1 a12 + an1
kn1 a1n + ann
kn1 b1 + bn
3
7 7 7: 5
e1 = K1 A e al obtener en esta última ceros bajo el Note el efecto de la construcción de la matriz K1 en A elemento de la diagonal en la primera columna.
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
351
Etapa 2 e2 = a(1) y supongamos que a(1) 6= 0. Se de…ne Ponemos A 22 ij (1)
ai2
ki2 =
2
6 6 6 y sea K2 = 6 6 4
1 0 0 1 0 k32 .. .. . . 0 kn2
0 0 1 .. .
..
0 0 0 .. .
.
0
1
i = 3; :::; n;
(1)
a22
3
7 7 7 e1 : Entonces e12 = K2 A 7 : De…nimos A 7 5
h i h ! i h ! i e2 = K2 A e1 = K2 A1 j ! A b 1 = K 2 A1 j K 2 b 1 = A2 j b 2 ; e2 A
2
6 6 6 = 6 6 4 2
6 6 6 = 6 6 6 4
1 0 0 1 0 k32 .. .. . . 0 kn2 (1)
0 0 1 .. .
a12 (1) a22 0 .. .
0
.
0 (1)
a11 0 0 .. .
..
3 2 (1) a11 6 76 0 76 76 0 76 76 . 5 4 .. 1 0
0
(1)
(1)
a13 (1) a23 (1) (1) k32 a23 + a33 .. . (1) kn2 a23
+
(1)
a12 a13 (1) (1) a22 a23 (1) (1) a21 a33 .. .. . . (1) (1) an2 an3
0 0 0 .. .
(1)
..
.
.
(1) an3
(1)
(1)
bn
(1)
a1n (1) a2n (1) (1) k32 a2n + a3n .. . (1)
b1 (1) b2 (1) b3 .. .
ann
(1)
..
(1)
a1n (1) a2n (1) a3n .. .
3 7 7 7 7 7 7 5
b1 (1) b2 (1) (1) k32 b2 + b3 .. .
(1)
(1)
kn2 a2n + ann
(1)
kn2 b2 + bn
3
7 7 7 7: 7 7 5
e2 = a(2) : Ponemos A ij
Etapa j-ésima
(j 1)
Supongamos ajj
6= 0
j = 1; :::; n
1. Se de…ne 2
1 6 .. 6 . 6 6 0 6 Kj = 6 . 6 .. 6 6 .. 4 . 0
(j 1)
kij =
ej = Kj A ej yA
1:
aij
i = j + 1; :::; n;
(j 1)
ajj
Entonces ej = Kj A ej A
1
h = K j Aj
ej tiene la forma siguiente: donde A 2 (j) (j) a11 a12 6 . 6 .. 6 6 6 0 e Aj = 6 6 .. 6 . 6 6 .. 4 . 0
1
! j bj
1
i
h = K j Aj
(j)
0 .. .
1
0
kj+1;j .. .
1 .. .
kn;j
0
! j Kj b j
1
(j)
a1j .. .
(j)
1
0 .. .
a1n .. . (j)
ajj
ajj+1
0 .. .
aj+1;j+1
0
an;j+1
(j)
(j)
(j)
i
h ! i = Aj j b j ; (j)
b1 .. .
(j)
ajn
bj
(j)
bj+1 .. .
aj+1;n .. . (j)
an;n
3 0 .. 7 . 7 7 0 7 7 7; 0 7 7 .. 7 . 5 1
(j)
(1)
bn
3
7 7 7 7 7 7: 7 7 7 7 5
352
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Etapa n-1
Para j = n
(n 1) 1;n 1
1, si an
en A
donde
1
6= 0, se de…ne kn;n
e
1 An 2
= Kn
en A La matriz An
1
6 6 =6 6 4
= Kn
(n 2) 1 ; (n 2) an 1;n 1
ann
=
1 An 2
j Kn
(n 1)
1
! bn
Kn
2
(n 1)
a11 .. . .. . 0
a1n .. . .. . (n ann
1)
i
1
h
6 6 6 =6 6 6 4
= An (n 1)
b1
.. . .. .
(n 1)
bn
es triangular superior, lo notaremos con R.
(n 1)
Suponemos ann
1
2
h
1
2
0 .. . .. . 1 kn;n
! j bn
1
1
i
1
0 .. . .. . 0 1
3
7 7 7 7; 7 7 5
;
3
7 7 7: 7 5
6= 0. Se tiene ! bn
R = An 1
= Kn
= K n 1 An 2 = = Kn ! = K n 1 Kn 2 1 bn 2 =
1
1 Kn 2
! K1 b :
K1 A;
Las matrices K1 ; :::; Kn 1 son triangulares invertibles. Luego, el producto Kn inferior invertible que lo notamos E. Entonces, E 1 es triangular inferior, y R = EA; de donde A = E
1 .. . .. . 0 0
1 R,
! b =E
1! b
n 1:
! bn
Notando L = E
1
1 Kn 2
K1 es triangular
! =Eb;
1,
(j 1)
se tiene A = LR;
! ! b =Lbn
1:
(0)
Así, si todos los elementos pivotes ajj 6= 0; j = 1; :::; n 1 con a11 = a11 , la matriz A se factora en la forma LR, con L una matriz triangular inferior invertible, R matriz triangular superior invertible. Luego, ! ! ! A! x = b , LR! x = L b n 1 , R! x = b n 1; ! ! es decir que la solución ! x de A! x = b es solución de R! x = b n 1 y recíprocamente. ! El sistema de ecuaciones R! x = b es triangular superior que en forma explícita se escribe: 8 (n 1) (n 1) (n 1) + a1n xn = b1 > < a11 x1 + .. . > : (n 1) (n 1) ann xn = bn ; cuya solución se calcula mediante el algoritmo de resolución de sistemas de ecuaciones triangulares superiores. Algoritmo de la eliminación gaussiana sin pivoting El procedimiento descrito precedentemente para transformar la matriz A en una triangular superior R y ! ! el vector b en b n 1 se recoge en el siguiente algoritmo denominado algoritmo de eliminación gaussiana ! sin pivoting para la resolución del sistema de ecuaciones A! x = b: Algoritmo Datos de Entrada: n 2 Z+ ;
A = (aij ) 2 Mn
n [R] ;
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de Salida: Mensaje 1: “Error: matriz nula”. Mensaje 2: “Pivote nulo”. Solución ! x T = (x1 ; :::; xn ) 2 n R :
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
353
1. S = 0: 2. Para i = 1; :::; n Para j = 1; :::; n Si jaij j
Veri…cación de no nulidad de la matriz A:
0;
S =S+j Fin de bucle j. Fin de bucle i. 3. Si S = n2 , imprimir mensaje 1: “Error: matriz nula”. Continuar en 9). 4. Para i = 1; :::; n
Matriz ampliada.
ai;n+1 = bi : Fin de bucle i. 5. Para j = 1; :::; n
1
Si ajj 6= 0 entonces
Transformación en un sistema triangular superior.
Para i = j + 1; :::; n aij kij = ajj Para r = j + 1; :::; n + 1 air = kij ajr + air Fin de bucle r. Fin de bucle i Caso contrario, continuar en 8). Fin de bucle j. ! 6. Resolver el sistema triangular superior R! x = bn
1:
7. Escribir ! x . Continuar en 9). 8. Escribir mensaje 2: “Pivote nulo”. 9. Fin. Número de operaciones elementales. En la primera etapa se ejecutan las siguientes operaciones elementales: divisiones : n
1;
adiciones : n
(n
1) ;
productos : n
(n
1) :
2)
(n
En la segunda etapa se realizan las siguientes operaciones elementales: divisiones : n
2;
adiciones : (n
2)
(n;2) ;
productos : (n
2) :
En la j-ésima etapa, se tiene divisiones : n
j;
adiciones : (n
j) (n
j + 1) ;
productos : (n
En la última etapa se ejecutan las siguientes operaciones elementales: divisiones : 1;
adiciones : 2;
productos : 2:
j) (n
j + 1) :
354
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Total de operaciones elementales: divisiones :
1 + 2 + ::: + n
adiciones :
2 + ::: + n (n
1= 1) =
(n
1) 2
n X1
;
(n
j) (n
j + 1) ;
(n
j) (n
j + 1) :
j=1
productos :
2 + ::: + n (n
1) =
n X1 j=1
Se tiene n X1
(n
j) (n
j + 1) =
j=1
n X1
n2 + n
(2n + 1) j + j 2
j=1
n2 + n (n
= =
n (n
1)
(2n + 1)
n (n 1) 1 + (n 2 6
1) n (2n
1)
1) (n + 1) : 3
La resolución del sistema de ecuaciones triangular superior involucra n2 operaciones elementales. Consecuentemente, el número total de operaciones elementales que se requieren para resolver el sistema de ecuaciones lineales con el método de eliminación gaussiana se denota con N oper (n) dado por: N oper (n) =
n (n 1) n (n +2 2
1) (n + 1) n + n2 = 4n2 + 9n 3 6
7 :
Así, para n = 3, N oper (3) = 28, N oper (4) = 62, N oper (5) = 115:
6.6.2.
Eliminación gaussiana con pivoting. (j 1)
En el método de eliminación gaussiana sin pivoting descrito precedentemente, si el elemento ajj nulo, el proceso se detiene
j = 1; :::; n
1, con
(0) a11
es
= a11 . Una mejora al algoritmo es buscar en los
(j 1)
elementos de la columna aij , i = j + 1; :::; n, aquel elemento no nulo y efectuar el intercambio de la …la i-ésima con la …la j-ésima, i > j. En la práctica se muestra que este intercambio no basta pués no mejora la precisión de la solución. Para mejorar la precisión de la solución es preciso introducir la estrategia del pivoting parcial y total. Pivoting parcial ! Sean A = (aij ) 2 Mn n [R] con A 6= 0; con b T = (b1 ; :::; bn ) 2h Rn ; yi consideramos el sistema de ! e= Aj! e0 = A. e ecuaciones lineales A! x = b : Construimos la matriz ampliada A b y ponemos A Etapa 1
Sea r el entero positivo tal que 1
r
n y jar1 j = Max jai1 j : i=1;:::;n
Si ar1 = 0 entonces ai1 = 0; i = 1; :::; n, con loque la matriz A es singular. El proceso de eliminación gaussiana concluye. e0 . Este proceso se realiza Si jar1 j > 0, intercambiamos las …las i = 1 con la …la i = r de la matriz A mediante la operación elemental entre matrices que notamos e0 = (bij ) ; B0 = F1;r A
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
355
donde F1r es la matriz obtenida de la matriz identidad al intercambiar la …la2 i = 1 1 6 k21 6 i1 continuación de…nimos ki1 = bb11 i = 2; :::; n; la matriz K1 siguiente:K1 = 6 . 4 .. kn1
e1 = K1 B0 = a(1) : A ij
Etapa 2 Sea r el entero positivo tal que 2 (1)
(1)
r
con la …la i3= r. A 0 0 1 0 7 7 .. .. 7 ; y . . 5 0 1
(1)
n y ar2 = Max ai2 : i=2;:::;n
(1)
Si ar2 = 0 entonces ai2 = 0 i = 2; :::; n, con lo que la matriz A es singular. El proceso de eliminación gaussiana concluye. (1) e1 . Para el efecto, de…nimos Si ar2 > 0, intercambiamos las …las 1 = 2 con la …la i = r de la matriz A
e1 = b(1) ; B1 = F2;r A ij
donde F2;1 es la matriz obtenida de la matriz identidad2 al intercambiar la …la 3 2 con la …la r, y a 1 0 0 0 6 0 1 0 0 7 6 7 (1) bi2 6 0 k32 1 0 7 continuación de…nimos ki2 = (1) i = 3; :::; n; K2 = 6 7 ; y sea b22 6 .. .. .. . . .. 7 4 . . . 5 . . 0 kn2 0 1 e2 = K2 B1 = a(2) : A ij
Este proceso continua hasta la etapa j = n
1:
Etapa n-1 Sea r es entero positivo tal que n (n 2) 1
Si ar;n
kn;n
1
=
r
(n 2) 1
n y ar;n
= Max
i=n 1;n
(n 2) 1
ai;n
:
= 0, la matriz A es singular. El procesos de eliminación gaussiana concluye.
(n 2) 1
Si ar;n
1
> 0, intercambiamos la …la i = n 1 con 2 1 0 0 6 .. . . . .. 6 . . 0 6 (n 2) bn;n 1 6 .. . . . . . . 0 bn 1;n 1 ; Kn 1 = 6 6 . 6 .. .. .. 4 0 . . 1 . 0 kn;n 1 1 en A
Resulta en A
1
= Kn
Cada matriz Ki i = 1; :::; n Ponemos E = Kn
e
1 Bn 2
1
= Kn
= Kn
1 Bn 2
e
2 Fn 1;n An 2
en A
(n 1)
=
= Kn
= Fn
e
1;n An 2
:
2 Fn 1;n
e K1 F1;r A:
1; r 2 fi; :::; ng ; son invertibles.
Entonces 1
2
7 7 7 7 7 ; y sea 7 7 5
= aij
1 y cada Fi;r ; i = 1; :::; n
1 Fn 1;n :::K1 F1;r .
r, de…nimos Bn 3
h i h !i e=E Aj! = EA b = EA j E b
=
(n 1)
bij
;
356
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
en yA
1
Luego,
h = An
Así, A = E
1
i 1 ; donde An
! j bn
1
es una matriz triangular superior que se le nota R: (
1 R:
1
Note que E
An ! bn
1 1
= EA ! =Eb:
es una matriz triangular inferior.
(n 1)
Si an;n 6= 0, la matriz R = An 1 es invertible y en consecuencia A es invertible. Adicionalmente, A se factora en la forma LR, donde L = E 1 , y, ! A! x = b , An El sistema de ecuaciones lineales An sido descrito anteriormente.
1
! ! x = bn
1
1
! ! x = bn
1:
es triangular superior, cuyo método de resolución ha
Para la elaboración del algoritmo de eliminación gaussiana con pivoting parcial debemos tener en cuenta, ej 1 ; j = 1; :::; n 1: en cada etapa, el proceso de intercambio de la …la i con la …la r de la matria A Antes de proponer el algoritmo, exhibimos un ejemplo que muestre el proceso descrito en el método de eliminación gaussiana con pivoting parcial. Ejemplo 2
1 6 2 Sean A = 6 4 2 3 ! ! Ax = b .
5 2 1 6
1 0 1 2
3 0 0 7 7; 4 5 7
3 3 6 2 7 ! 7 b = 6 4 1 5 ; y consideremos el sistema de ecuaciones lineales 7 2
La solución de este ejemplo fue determinada 2 1 6 2 e está dada por A e=6 matriz ampliada A 4 2 3
con el 5 1 2 0 1 1 6 2
Etapa 1
Selección del 2 3 6 2 B1 = 6 4 2 1
método de3 eliminación gaussiana sin pivoting. La 3 0 2 7 0 7: 1 5 4 7 7
pivoting: 3 = ja41 j = Max jai;1 j ; r = 4: Intercambio de las …las 1 3 i=1;2;3;4 2 6 2 7 7 1 6 2 2 0 0 2 7 7 : Se de…nen las matrices siguientes: K1 = 6 23 4 1 1 4 1 5 3 1 5 1 0 3 3 2
6 e1 = K1 B1 = 6 A 4
1 2 3
2 3 1 3
0 1 0 0
0 0 1 0
32 0 3 6 2 0 7 76 0 54 2 1 1
6 2 1 5
2 0 1 1
7 0 4 0
3 2 7 3 6 0 2 7 7=6 1 5 4 0 3 0
6 2 5 3
2 1 3
4 3 5 3
e Se tiene con la 4 de A. 3 0 0 0 1 0 0 7 7; 0 1 0 5 0 0 1 7
7
14 3 26 3 7 3
8 3 11 3 16 3
3
7 7: 5
Etapa 2 Selección del pivoting: 5 = 2 3 6 2 7 7 26 1 11 6 0 5 3 3 3 6 4 14 8 4 0 2 3 3 3 5 7 16 0 3 3 3 3
(1)
(1)
e1 . Se tiene r = 5: Intercambio de las …las 2 con 3 de A 2 3 1 0 0 0 7 6 0 1 0 0 7 7 : Se de…nen K2 = 6 7 5 4 0 2 1 0 5; 5 3 0 5 0 1
a32 = Max ai;2 ; i=3;4 3
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
2
1 6 0 e2 = K2 B2 = 6 A 4 0 0
0 1 2 5
0 0 1 0
3 5
32 0 3 6 0 0 7 76 0 54 0 1 0
6 5 2 3
357
2
7
7
1 3
26 3 14 3 7 3
11 3 8 3 16 3
4 3 5 3
3
2
3 7 6 0 7=6 5 4 0 0
6 5 0 0
2
7
7
1 3
26 3 6 5 113 15
11 3 6 5 113 15
6 5 28 15
3
7 7: 5
Etapa 3 Selección del pivoting. 2 3 6 6 0 5 Tenemos B3 = 6 4 0 0 0 0 2 3 1 0 0 0 6 0 1 0 0 7 6 7; y 4 0 0 1 0 5 9 0 0 14 1 2 1 0 6 0 1 e3 = K3 B3 = 6 A 4 0 0 0 0
28 5
(2)
= a43 2
7
1 3 28 15 6 5
26 3 113 15 6 5
0 0 1 9 14
(2)
e2 . = Max ai3 ; r = 4: Intercambiamos las …las 3 y 4 de A i=4 3 7 11 7 3 e 7 113 5 : Se de…nen las matrices K3 y A3 como sigue: K3 = 15 6 5
32 3 6 0 7 6 0 76 0 5 0 54 0 0 1 0 0
2
7
7
1 3 28 15 6 5
26 3 113 15 6 5
11 3 113 15 6 5
e3 se establece el sistema de ecuaciones De la matriz ampliada A 8 3x1 +6x2 +2x3 +7x4 > > < 5x2 + 31 x3 + 26 3 x4 28 113 x > > 15 3 15 x4 : 51x4
3
2
3 7 6 0 7=6 5 4 0 0
6 5 0 0
2
7
7
1 3 28 15
26 3 113 15
11 3 113 15
0
51
51
3
7 7: 5
lineales triangular superior siguiente: = = = =
7 11 3 113 15
51:
cuya solución es ! x T = (2; 1; 0; 1) :
Algoritmo de eliminación gaussiana con pivoting parcial Algoritmo Datos de entrada: n 2 Z+ ; A = (aij ) Mn
n [R] ;
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de salida: Mensaje 1: “Error: matriz nula”. Mensaje 2: “Matriz singular”. Solución ! xT = (x1 ; :::; xn ) Rn :
1. S = 0: 2. Para i = 1; :::; n
Veri…cación de no nulidad de la matriz A.
Para j = 1; :::; n Si jaij j
0;
S =S+j Fin de bucle j. Fin de bucle i. 3. Si S = n2 . Continuar en 8). 4. Para i = 1; :::; n ai;n+1 = bi
Matriz ampliada.
358
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES Fin de bucle i.
5. Para j = 1; :::; n
1
r=j Para i = j + 1; :::; n
Selección del pivoting parcial en la etapa j, y de la
…la r. Si jaij j > jaij j ; r=i Fin de bucle i. Para p = j; :::; n + 1
Intercambio de la …la j con la …la r.
t = ajp ajp = arp arp = t Fin de bucle p. Si jajj j
0; Continuar en 9).
Si jajj j > 0, entonces Para i = j + 1; :::; n kij =
Transformación del sistema en un triangular superior
aij ajj
Para p = j + 1; :::; n + 1 aip = kij ajp + air Fin de bucle p Fin de bucle i. Fin de bucle j. ! 6. Resolver el sistema triangular superior R! x = bn
1:
7. Escribir ! x T = (x1 ; :::; xn ). Continuar en 10). 8. imprimir mensaje 1. Continuar en 10). 9. Imprimir mensaje 2. 10. Fin. Pivoting total. Sean A = (aij ) 2 Mn lineales
n [R]
! con A 6= 0 y b T = (b1 ; :::; bn ) Rn : Consideramos el sistema de ecuaciones ! A! x = b:
Etapa 1 Sean r; s 2 Z+ tales que 1
r
n; 1
s
n; jars j = Max jaij j : i=1;:::;n j=1;:::;n
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
359
Si ars = 0, la matriz A es nula y el proceso concluye. Supongamos que ars 6= 0. Intercambiamos las …las 1 con r y luego las columnas 1 con s. Este proceso se realiza mediante la operación entre matrices que notamos B0 = F1;r AC1;s = (bij ) ; donde F1;r es la matriz obtenida de la matriz identidad al intercambiar la …la 1 con la …la r, y C1;s es la matriz que se obtiene de la matriz identidad al intercambiar la columna 1 con la columna s. Nótese que el intercambio de columnas provoca un intercambio de las incógnitas x1 con xs . A continuación se procede como en el caso del pivoting parcial.
Se de…nen ki1 =
bi1 b11
2
6 6 i = 2; :::; n (b11 es el elemento ars ), K1 = 6 4 (1)
A1 = K1 B0 = aij ! ! b 1 = K1 F1;r b :
1 k21 .. .
0 1 .. .
0 0 .. .
kn1 0
1
3
7 7 7; y 5
;
e Debe observarse que no se está utilizando la matriz ampliada A:
Etapa 2
Sean r; s 2 Z+ tales que 2
r
n; 2
s
(1)
n;
(1)
ars = Max aij : i=2;:::;n j=2;:::;n
(1)
Si ars = 0, la matriz A es singular. Concluir el proceso. (1)
Si ars 6= 0, intercambiamos la …la 2 con la …la r, y la columna 2 con la columna s de A1 , o sea (1)
B1 = F2;1 A1 C2;s = bij
;
donde F2;r es la matriz obtenida de la matriz identidad al intercambiar la …la 2 con la …la r; y, C2;s es la matriz obtenida también de la identidad al intercambiar la columna 2 con la s. Note que este último intercambio provoca el intercambio de las incógnitas x2 con xs . ! ! Se de…nen A2 = K2 B1 , y, b 2 = K2 F2r b 1 ;donde 2 3 1 0 0 0 6 0 1 0 0 7 (1) 6 7 bij 6 0 k32 1 0 7 K2 = 6 con k = i = 3; :::; n: 7 i2 (1) 6 .. .. .. . . .. 7 b 22 4 . . . 5 . . 0 kn2 0 1 Continuando con este proceso hasta la etapa n Bn con Fn
1;n ;
Cn
Se de…nen An
1
2
= Fn
1, se obtiene
1;n An 2 Cn 1;n
(n 2)
= bij
;
matrices con similares signi…cados que en las etapas 1 y 2. ! ! = Kn 1 Bn 2 ; y , b n 1 = Kn 1 Fn 1;n b n 2 ; donde 1;n
Kn
2
1
1 6 .. 6 . 6 =6 0 6 4 0
..
.
0 .. . 1 bn;n
1 (n 2) bn 1;n 1
3 0 .. 7 . 7 7 0 7; 7 5 1
360
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES (n 2) 1;n 1
siempre que bn La matriz An
1
6= 0.
es triangular superior. Se tiene An
1
= Kn .. .
1 Bn 1
= Kn
1 Fn 1;n An 2 Cn 1;n
= Kn
1 Fn 1;n
K2 B1 C2;s
= Kn
1 Fn 1;n
K1 F1;r AC1;s
Cn
1;n
Cn
1;n :
Ponemos E = Kn
1 Fn 1;n
C = C1;s
Cn
K1 F1;r ;
1;n ;
entonces An
1
= EAC:
Las matrices E y C son invertibles. Resulta que AC = E Poniendo L = E
1;
R = An
1,
1
An
1:
se tiene la siguiente factorización AC = LR:
Por otro lado, ! bn
1
= Kn
1 Fn 1;n
! bn
2
=
= Kn
1 Fn 1;n
! ! K1 F1;r b = E b :
Además, ! A! x = b () E
1
RC
1!
x =E
1! bn 1
() RC
! x = bn
1!
1
() ! x = CR
1!
bn
1:
! ! Sea ! y = R 1 b n 1 , entonces R! y = b n 1 . En el método de eliminación gaussiana con pivoting total, ! se resuelve primeramente el sistema de ecuaciones lineales triangular superior R! y = b n 1 y luego ! x = C! y , pués se deben recuperar las variable originales. Ejemplo Consideremos nuevamente el ejemplo propuesto en el método de eliminación gaussiana con pivoting parcial. 2 3 2 3 1 5 1 0 3 6 2 2 0 0 7 ! 6 2 7 7; b = 6 7 Sean A = 6 4 2 1 4 1 5 1 4 5 3 6 2 7 7 Etapa 1
Selección del pivoting total. Observemos que 7 = ja44 j = Intercambiamos la …la 1 con la 4 y luego 2 7 6 6 0 2 B0 = 6 4 4 1 0 5
la columna 1 con la 4 3 2 2 3 6 0 2 7 7 ; C1;4 = 6 4 1 2 5 1 1
Max jaij j. Tenemos r = 4; s = 4.
i=1;:::;4 j=1;:::;4
en la matriz A. Resulta 3 0 0 0 1 0 1 0 0 7 7: 0 0 1 0 5 1 0 0 0
! ! ! Denotamos con d al vector que se obtiene de b al intercambiar la …la 1 con la 4, esto es, d T = (7; 2; 1; 3) :
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA. 2
1 6 0 Se de…nen K1 = 6 4 4 7 0
0 1 0 0
0 0 1 0
3 0 0 7 7; y 0 5 1
32 0 7 6 7 6 0 76 0 2 0 54 4 1 1 0 5 2 1 0 0 ! ! 6 0 1 0 b 1 = K1 d = 6 4 4 0 1 7 0 0 0 2
1 6 0 A1 = K1 B0 = 6 4 4 7 0
0 1 0 0
0 0 1 0
361
2 0 1 1 0 0 0 1
3 2 3 7 6 2 7 6 2 7 6 0 2 0 = 15 17 2 5 4 0 7 7 0 5 1 1 3 3 2 32 7 7 76 2 7 6 2 7 7 7 6 76 54 1 5 = 4 5 5: 3 3
3 2 26 7
1
3
7 7; 5
Etapa 2 Seleccionamos el pivoting. Tenemos (1)
(1)
S = a4;2 = Max aij ; r = 4; s = 2: i=2;3;4 j=2;3;4
Intercambiamos la …la 2 con la 4 de A1 . Como s = 2 y j = 2, no se requiere de intercambio de columnas, en este caso se tiene la matriz identidad. ! Igualmente, intercambiamos la …la 2 con la 4 de b 1 . Tenemos 2 3 2 3 7 6 2 3 7 6 0 6 3 7 5 1 1 7 7; ! 6 7 B1 = 6 d = 1 17 15 26 4 0 5 4 5 5 ; C2;2 = I: 7 7 7 0 2 0 2 2 3 2 1 0 0 0 6 0 1 0 0 7 7 Sean K2 = 6 4 0 17 1 0 5 ; 35 2 0 5 0 1 2 32 3 2 3 1 0 0 0 7 6 2 3 7 6 2 3 6 0 1 0 0 76 0 6 5 1 1 7 1 1 7 76 7 6 0 5 7 A = K2 B1 = 6 15 26 5 = 4 113 5 ; 17 92 4 0 17 1 0 5 4 0 0 0 35 7 7 7 35 35 2 2 8 0 0 2 0 2 0 0 5 0 1 5 5 2
1 6 0 ! ! b 2 = K2 d 1 = 6 4 0 0
0 1 17 35 2 5
0 0 1 0
32 7 0 6 3 0 7 76 0 54 5 1 2
3
2
7 6 7=6 5 4
3 7 3 7 7 226 5 :
35 16 5
Etapa 3 Seleccionamos el pivoting. Tenemos 113 (2) (2) = a3;4 = Max aij ; r = 3; s = 4: i=3;4 35 j=3;4
Intercambiamos la columna 2 7 6 0 B2 = 6 4 0 0
3 con la 4. 6 5 0 0
3 1 113 35 8 5
3 2 ! 1 7 7 ! d 2 = b 2; 92 5 ; 35 2 5
C3;4
2
1 6 0 =6 4 0 0
0 1 0 0
0 0 0 1
3 0 0 7 7: 1 5 0
362
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES 2
1 6 0 De…nimos K3 = 6 4 0 0
0 1 0 0
0 0 1 56 113
2
1 6 0 A3 = K3 B2 = 6 4 0 0
3 0 0 7 7; 0 5 1 0 1 0 0
0 0 1 56 113
32 7 6 0 6 0 5 0 7 76 0 54 0 0 1 0 0 2
1 6 0 ! ! b 3 = K3 d 2 = 6 4 0 0
0 1 0 0
0 0 1 56 113
3 1 113 35 8 5
32 0 6 0 7 76 5 0 4 1
3 2 2 7 6 6 0 5 1 7 7 6 92 5 = 4 0 0 35 2 0 0 5 3 2 7 6 3 7 7 6 226 5 = 4
35 16 5
8 7y1 +6y2 > > < 5y2 El sistema de ecuaciones triangular superior es: > > :
3 1 113 35
0
3 2 1 7 7 92 5 ; 35 102 113
3 7 3 7 7 226 5 : 35 0
+3y3 +y3 113 35 y3
solución es ! y T = (1; 1; 2; 0).
+2y4 y4 92 35 y4 102 113 y4
= = = =
7 3 226 35
cuya
0;
Como C = C1;4 IC3;4 , se sigue que ! x = C! y = C1;4 IC3;4 ! y 32 2 1 0 0 0 1 6 0 1 0 0 76 0 76 = 6 4 0 0 1 0 54 0 0 1 0 0 0
0 1 0 0
0 0 1 0
32 1 0 0 6 0 1 0 7 76 0 54 0 0 0 0 1
0 0 0 1
32 1 0 6 1 0 7 76 1 54 2 0 0
3 2 7 6 1 7 7 7=6 5 4 0 5: 1 3
2
Se de…ne el vector V = (S1 ; S2 ; :::; Sn 1 ), donde Sj 2 f1; :::; ng ; j = 1; :::; n 1. El componente S1 signi…ca que, en la primera etapa, se intercambian la columna 1 con la S1 ; el componente S2 signi…ca que, en la segunda etapa, se intercambian las columnas 2 con la S2 , así sucesivamente. Si en la etapa j, Sj = j no hay intercambio. En el ejemplo tenemos V = (4; 2; 4). Se han realizado los siguientes intercambios: primera etapa :
la columna 1 con la 4:
segunda etapa :
permanece invariante: j = 2; S2 = 2.
tercera etapa :
la columna 3 con la 4.
Para recuperar las variables originales hacemos referencia a los componentes de V y de la solución Y . 2 3 1 6 1 7 7 Ponemos ! y3 = ! y = 6 4 2 5. Como el tercer componente de V es 4, se realizó el intercambio de la 0 2 3 1 6 1 7 7 columna 3 con la 4, en ! y realizamos este intercambio, tenemos ! y2=6 4 0 5. El segundo componente 2 de V es 2, no hay intercambio, ponemos ! y1 = ! y 2 . El primer componente de V es 4, se 2 realizó 3 el 2 6 1 7 7 intercambio de la columna 1 con la 4, en ! y 1 se realiza este intercambio, tenemos ! x = 6 4 0 5. la 1 solución. Ejercicio
6.6. MÉTODO DE ELIMINACIÓN GAUSSIANA.
363
Elaborar un algoritmo para la resolución numérica de un sistema de ecuaciones lineales mediante el método de eliminación gaussiana con pivoting total. Observación Sean A = (aij ) 2 Mn lineales:
n [R]
! con A 6= 0; b T = (b1 ; :::; Bn ) 2 Rn : Se considera el sistema de ecuaciones ! A! x = b:
Supongamos que en la k-ésima etapa de la 2 (k) (k) a11 a1k 6 . .. 6 .. . 6 6 (k) A=6 0 akk 6 .. 6 .. . 4 . (k) 0 an;k
eliminación gaussiana con pivoting total (parcial), se tiene 2 (k) 3 (k) (k) 3 a1k+1 a1;n b 6 1. 7 .. .. 7 6 .. 7 . . 7 7 6 7 ! 6 (k) 7 (k) (k) 7 ; b = akk+1 ak;n 7 6 bk 7 : k 7 6 . 7 .. .. 7 6 . 7 . . 5 4 . 5 (k) (k) (k) bn ank+1 ann
Para realizar la nueva etapa, debemos seleccionar el pivoting: (k)
a(k) rs = Max aij ; con i=k;:::;n j=k;:::;n
(k)
k
r
n; k
s
n:
(k)
Si ars = 0, entonces aij = 0, i = k; :::; n; j = k; :::; n, con lo cual la matriz A es singular; y, el sistema de ecuaciones tiene in…nitas soluciones o ninguna solución. ! (k) (k) i) El sistema de ecuaciones A! x = b no tiene solución si en la k-ésima etapa ars = 0 = Max aij y i=k;:::;n j=k;:::;n
(k)
si algún bi
6= 0 para algún i = k:; ; ; n.
! (k) ii) El sistema de ecuaciones A! x = b tiene in…nitas soluciones si en la k-ésima etapa ars = 0 = (k) (k) Max aij y bi = 0 par todo i = k; :::; n. i=k;:::;n j=k;:::;n
En este análisis no se ha considerado los errores de redondeo. Se deja como ejercicio la elaboración de un algoritmo para la resolución numérica de un sistema de ecuaciones lineales mediante el método de eliminación gaussiana con pivoting parcial o total, y que en el caso de ser la matriz A singular, permita identi…car si el sistema tiene in…nitas soluciones o ninguna solución.
6.6.3.
Cálculo de la matriz inversa A
1
y del determinante de la matriz A.
Cálculo de la matriz inversa. Sea A = (aij ) 2 Mn n [R] con A 6= 0. El método de eliminación gaussiana con pivoting parcial o total puede ser utilizado para calcular la matriz inversa A 1 de A, siempre que A 1 exista. Sean ! e T1 ; :::; ! e Tn la base canónica de Rn y Bj la j-ésima columna de A 1 . La matriz identidad se nota I. Puesto que AA 1 = A 1 A = I; entonces AA 1 ! e j = I! ej = ! e j ; y A 1! e j = Bj ; j = 1; :::; n; se sigue que ABj = ! e j ; j = 1; :::; n; es decir que Bj es la solución del sistema de ecuaciones lineales A! x =! e j ; j = 1; :::; n: Ejemplo 2
3 1 2 3 Sea A = 4 1 3 2 5. Hallemos A 1 : Para el efecto, apliquemos el método de eliminación gaussiana al 1 0 1 sistema de ecuaciones A! x =! e j ; j = 1; 2; 3; con ! e T1 = (1; 0; 0) ; ! e T2 = (0; 1; 0) ; ! e T3 = (0; 0; 1) :
364
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Cálculo de la primera columna de A 1 : se 2 1 4 1 1
considera 32 2 3 3 2 54 0 1
el sistema 3 2 x1 x2 5 = 4 x3
de ecuaciones 3 1 0 5 0
que es equivalente, vía eliminación gaussiana, al siguiente 2 32 3 2 3 1 2 3 x1 1 4 0 1 1 5 4 x2 5 = 4 1 5 ; 0 0 6 x3 3 cuya solución es B1T =
1 2;
1 1 2; 2
:
Cálculo de la segunda columna de A 2
1
: se considera el sistema de ecuaciones 32 3 2 3 1 2 3 x1 0 4 1 3 2 5 4 x2 5 = 4 1 5 ; 1 0 1 x3 0
que mediante el método de eliminación 2 1 4 0 0 cuya solución es B2T =
1 2 3; 3;
1 3
gaussiana, se obtiene 32 3 2 3 2 3 x1 0 1 1 5 4 x2 5 = 4 1 5 ; 0 6 x3 2
:
Cálculo de la tercera columna de A
1.
Esta es solución del sistema de ecuaciones lineales 32 2 3 2 3 x1 1 2 3 0 4 1 3 2 5 4 x2 5 = 4 0 5 ; 1 0 1 1 x3
y procediendo en forma similar a los precedentes, obtenemos 2 32 3 2 3 1 2 3 x1 0 4 0 1 1 5 4 x2 5 = 4 0 5 ; 0 0 6 x3 1 cuya solución es B3T =
5 1 1 6; 6; 6
:
Luego A
1
2
= [B1 ; B2 ; B3 ] = 4
1 2 1 2
1 2
2 3
1 3 1 3
1 6 1 6
5 6
3
5:
Observe que la parte común de los sistemas triangulares superiores que se obtienen para el cálculo de las respectivas columnas B1 ; B2 ; B3 : Cálculo de det (A) : Sea A = (aij ) 2 Mn n [R] con A 6= 0. El método de eliminación gaussiana con pivoting parcial o total permite calcular el determinante de la matriz A. Si aplicamos el método de eliminación gaussiana con Bj = Fj;Sj Aj 1 ; j = 1; :::; n; pivoting parcial a la matariz A, obtenemos donde A0 = A y Fj ; Sj es Aj = Kj Bj ; la matriz obtenida de la identidad al intercambiar la …la j con la sj 2 fj; :::; ng. Si sj = j, no existe intercambio de …las, en tal caso Fj;sj = I matriz identidad. Denotamos con m el número de intercambios de …las, es decir, m es el número de matrices Fj;sj 6= I:
6.7. MÉTODO DE CHOLESKI.
365 2
1 6 .. 6 . 6 6 0 6 Por otro lado, Kj es la matriz de…nida como Kj = 6 . 6 .. 6 6 .. 4 . 0 (j) bjj
6= 0;
0 .. .
0 .. .
1
0
kj+1;j .. .
1 .. .
kn;j
0
3 0 .. 7 . 7 7 0 7 7 7 con Ki;j = 0 7 7 .. 7 . 5 1
i = j + 1; :::; n:
(n 1)
Se tiene que An
1
1;
1; det Fj;Sj =
j = 1; :::; n
= aij
es triangular superior. Luego det (An 1; si Fj;Sj = I; 1; si Fj;Sj 6= I:
An
1
= Kn
1
Fn
1;Sn
1
1)
=
Como :::
K1 F1;S1 A;
:::
det (K1 )
Qn
(n 1) ; i=1 aii
(j)
bij
(j)
;
bjj
det (Kj ) =
se sigue que det (An
1)
= det (Kn
1)
det Fn
= det Fn
1;Sn
1
:::
1;Sn
1
det (F1;S1 ) det (A)
det (F1;S1 ) det (A)
m
= ( 1) det (A) ; de donde det (A) = ( 1)m det (An
m 1 ) = ( 1)
n Y
(n 1)
aii
:
i=1
Si utilizamos el método de eliminación gaussiana con pivoting total, se tiene An
1
= Kn
1 Fn 1;n :::K1 F1;r AC1;S1 :::Cn 1;n ;
(n 1)
donde An 1 = aij es una matriz triangular superior, Ki y Fj;sj son matrices del tipo descrito en el pivoting parcial y Cj;Sj = I, es decir que no existe intercambio de columnas. Denotamos con m1 el número de intercambio de …las, esto es, el número de matrices Fj;Sj 6= I; y m2 el número de intercambios de columnas, es decir que m2 es el número de matrices Cj;Sj 6= I. Entonces det (A) = ( 1)m1 +m2
n Y
(n 1)
ajj
:
j=1
6.7.
Método de Choleski.
Sea A = (aij ) 2 Mn problema siguiente:
n [R]
! una matriz simétrica, de…nida positiva, b T = (b1 ; :::; bn ) 2 Rn . Se considera el ! hallar ! x 2 Rn solución de A! x = b:
Por ser la matriz A simétrica, de…nida positiva, A es no singular y en consecuencia (1) admite una única solución x b 2 Rn . Por otra parte, existe una matriz L = (lij ) 2 Mn n [R] triangular inferior tal que A = LLT : ( ! L! y = b; El sistema de ecuaciones (1) es equivalente a los siguientes: LT ! x =! y: ! Primeramente se resuelve el sistema L! y = b . Calculado el vector ! y , se resuelve a continuación el sistema de ecuaciones LT ! x =! y , que permite calcular ! x 2 Rn solución de (1) :
366
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Describamos el algoritmo de factorización de la matriz A en la forma LLT . Como A = LLT = (aij ), se sigue de la de…nición de producto de dos matrices que aij =
n X
t lik lkj ; i:j = 1; :::; n;
k=1
t donde LT = lij
t = l , i; j = 1; :::; n: y lij ji
La igualdad (4) así como la de…nición de la matriz triangular inferior L = (lij ) serán utilizados sucesivamente par construir cada columna de la matriz L. Primera columna: j = 1: Se tiene ai1 =
n X
n X
t lik lk1 =
k=1
lik l1k = li1 l11 ;
i = 1; :::; n;
k=1
ya que l1k = 0 para k = 2; :::; n. Así, ai1 = li1 l11 ; 2 ) l Para i = 1; se tiene a11 = l11 11 = positiva).
Para i = 2; :::; n; se tieneli1 =
p
i = 1; :::; n: p
a11 (l11 =
a11 no es posible porque A es simétrica, de…nida
ai1 l11
Segunda columna: j = 2: Tenemos ai2 =
n X
t lik lk2
n X
=
lik l2k = li1 l21 + li2 l22 ;
i = 2; :::; n;
k=1
k=1
pués l2k = 0 para k = 3; :::; n: Los elementos li1 ; i = 1; :::; n son calculados en la etapa precedente. Debemos calcular li2 ; i = 2; :::; n: p 2 + l2 ) l 2 y para i = 3; :::; n; se obtiene l = ai2 li1 l21 : Para i = 2, se tiene a22 = l21 = a22 l21 22 i2 22 l22 j-ésima columna: 1 < j
n:
Supongamos conocidas las j
1 columnas de L. La j-ésima columna de L se determina como sigue: aij =
n X
t lik lkj =
k=1
j X
lik ljk ;
i = j; :::; n:
k=1
Note que lij+1 = 0; :::; lin = 0: Para i = j, ajj =
j X
ljk ljk =
k=1
de donde
ljj y para i = j + 1; :::; n, se tiene
j 1 X k=1
v u u = tajj
aij =
2 2 ljk + ljj
j 1 X
j 1 X
2 ljk
(9)
k=1
lik ljk + lij ljj
k=1
con lo cual lij =
aij
Pj
1 k=1 lik ljk
ljj
(10)
6.7. MÉTODO DE CHOLESKI. Note que ajj >
jP1
k=1
367 p
2 , luego l > 0. Además l ljk jj jj
ajj para j = 1; :::; n:
Hacemos notar que en la práctica, dada una matriz simétrica A, el algoritmo de Choleski permite identi…car si A es de…nida positiva o no por lo que en cada etapa del algoritmo de Choleski se veri…ca si ajj
j 1 X
2 ljk > 0;
k=1
y en consecuencia ljj > 0, j = 1; :::; n: En el procedimiento de factorización de A en la forma LLT descrito, no se consideran los errores de redondeo. Por otro lado, en el algoritmo se asume que la matriz A es simétrica. En realidad, la primera tarea es veri…car que la matriz A sea simétrica. Con todos estos elementos se establece el siguiente algoritmo de factorización de Choleski. Algoritmo de factorizacion LLT Algoritmo Datos de entrada: n 2 Z+ ;
A = (aij ) 2 Mn
n [R] ;
Datos de salida: Mensaje 1: “La matriz no es simétrica”. Mensaje 2: “La matriz A no es de…nida positiva”. Matriz L = (lij ) 1. Veri…car que la matriz A es simétrica. 2. Si a11 > 0, entonces p l11 = a11 ; caso contrario, continuar en 6). 3. Para i = 2; :::; n ai1 li1 = l11 Fin de bucle i 4. Para j = 2; :::; n S=0 Para k = 1; :::; j S = S + ljk Si ajj ljj
1 ljk
S > 0 entonces p = ajj S;
Caso contrario, continuar en 6). Fin de bucle k. Para i = j + 1; :::; n S=0 Para k = 1; :::; j S = S + lik
1 ljk
368
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES lij =
(aij S) ljj
Fin de bucle k Fin de bucle i. Fin de bucle j. 5. Escribir L = (lij ). Continuar en 7). 6. Escribir mensaje 2: “La matriz no es de…nida positiva”. 7. Fin. Observación: Para j = n, se tiene ain =
n X1
t t lik lkn + lin lkn =
k=1
ann =
lik lkk + lin lnn ;
k=1
y para i = n; n X1
n X1
2 lkk
+
2 lnn
k=1
) lnn
Para j = n, el bucle i = n + 1; :::; n no se realiza.
v u u = tann
n X1
2 : lnk
k=1
Ejercicio Elaborar un algoritmo para veri…car si una matriz A = (aij ) 2 Mn imprimir mensaje “La matriz A no es simétrica”. Concluir.
n [R]
es no simétrica. Si A 6= AT ,
! Para la resolución numérica de un sistema de ecuaciones lineales A! x = b mediante el método de Choleski, se propone el siguiente algoritmo en el que se supone se realiza la factorización LLT descrito en el algoritmo precedente. Algoritmo del método de Choleski Algoritmo Datos de entrada: n 2 Z+ ;
A = (aij ) 2 Mn
n [R] ;
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de salida: Mensaje: “A no es simétrica, de…nida positiva”. Solución ! x T = (x1 ; :::; xn ) : 1. Aplicar el algoritmo de la factorización LLT . Si A no es simétrica, de…nida positiva, continuar en 5). ! 2. Resolver el sistema de ecuaciones L! y = b: 3. Resolver el sistema de ecuaciones LT ! x =! y: 4. Escribir la solución ! x T = (x1 ; :::; xn ). Continuar en 6). 5. Escribir mensaje: “A no es simétrica, de…nida positiva”. 6. Fin. Ejemplo 2
1 6 ! 1 Hallar la solución del sistema de ecuaciones A! x = b , donde A = 6 4 2 3
1 2 4 1
3 2 2 3 3 7 6 4 1 7 ! 6 2 ; b =4 9 2 5 3 2 14 11
3
7 7: 5
6.7. MÉTODO DE CHOLESKI.
369
Apliquemos el método de Choleski. Observamos primeramente que la matriz A es simétrica, esto es A = AT : Pasemos al algoritmo de factorización de Choleski. Etapa 1 (j = 1) : Tenemos los siguientes resultados p p l11 = a11 = 1 = 1; Para i = 2; 3; 4 : li1 =
ai1 ; l11
a21 1 = = 1; l11 1 2 a31 = = 2; l11 1 3 a41 = = 3: l11 1
l21 = l31 = l41 = Etapa 2 (j = 2) q l22 a22
p
2 = l21
2
1 = 1;
Para i = 3; 4 : li;2 = l32 = l42 =
a32
l31 l21
a42
l22 l41 l21 l22
ai2
li1 l21
l22 4 2 = 1 1 3 = 1
;
1 1
= 2; =
2:
( 2)
2
Etapa 3 (j = 3) l33 =
q a33
Para i = 4 : l43 = Etapa 4 (j = 4) l44
a43
q = a44
2 l31
li3 =
2 = l32
ai3
l41 l31 l33
2 l41
9
4
4 = 1;
li1 l31 li2 l32 ; l33 2 3 2 l42 l32 =
2 l42
2
p
1 6 1 En consecuencia L y LT son las matrices L = 6 4 2 3 T inmediatamente que A = LL :
2 = l43
0 1 2 2
p 0 0 1 0
14
9
3 0 0 7 7; 0 5 1
! Pasamos a la resolución de los sistemas de ecuaciones L! y = b y 8 y1 > > < ! y1 +y2 El sistema de ecuaciones L! y = b es el siguiente: 2y +2y2 > > : 1 3y1 2y2 ! y T = (3; 1; 1; 0) : 8 x1 +x2 > > < x2 El sistema de ecuaciones LT ! x =! y es el siguiente: > > : es ! x T = (4; 1; 1; 0) :
1
4
= 0:
0 = 1: 2
2 2 1 0
3 3 2 7 7 : Se veri…ca 0 5 1
=3 =2 =3 = 11;
cuya solución es
1 6 0 LT = 6 4 0 0
1 1 0 0
LT ! x =! y:
+y3 +y4
+2x3 +3x4 +2x3 2x4 x3 x4
= = = =
3 1 cuya solución 1 0;
370
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Número de operaciones elementales. Asumimos que la raíz cuadrada de un número real no negativo es una operación elemental. Con esta suposición, determinemos el número de operaciones elementales (adiciones, productos, divisiones, raíces cuadradas) necesarias para la construcción de la matriz triangular inferior L = (lij ). Tenemos j = 1; raíz cuadrada: 1; divisiones: n 1; productos: 0; adiciones: 0; j = 2;
j=n
raíz cuadrada :
1;
divisiones :
n
productos :
1+n
2=n
1;
adiciones :
1+n
2=n
1;
2;
1; raíz cuadrada :
1;
divisiones :
1;
productos :
n
2+n
2 = 2 (n
2) ;
adiciones :
n
2+n
2 = 2 (n
2) ;
j = n; raíz cuadrada :
1;
productos :
n
1;
adiciones :
n
1:
Luego, en todas las etapas se realizan las siguientes operaciones elementales:
raíces cuadradas :
n
divisiones :
n
1+n
2 + ::: + 1 =
n X1
(n
j) =
j=1
productos :
adiciones :
0+n
0+n
1 + ::: + 2 (n
1 + ::: + 2 (n
2) + m
2) + n
1=
1=
n (n 1) ; 2
n X
(n
j + 1) (j
1) =
n n2 6
1
(n
j + 1) (j
1) =
n n2 6
1
j=1 n X j=1
Total de operaciones elementales requeridas para la factorización de la matriz A: n n2 6
1
n n2 6
1
n (n 1) n = 2n2 + 3n + 1 : 2 6 ! Para la resolución de los sistemas de ecuaciones lineales L! y = b y LT ! x = ! y se requieren de 2n2 operaciones elementales. Entonces N =n+
+
N oper (n) = 2n2 +
+
n n 2n2 + 3n + 1 = 2n2 + 15n + 1 : 6 6
Así, para n = 4; N oper (4) = 62; para n = 5; N oper (5) = 105: Para n 5, el número de operacione elementales requerido para resolver un sistema de ecuaciones lineales con el método de Choleski es inferior al utilizado en el método de eliminación gaussiana N oper (n) = n6 4n2 + 9n 7 :
6.8. MÉTODO DE CROUT.
371
Cálculo del determinante Si A = (aij ) 2 Mn n [R] es una matriz simétrica, de…nida positiva, existe una matriz L = (lij ) triangular inferior tal que A = LLT : Entonces, el determinante de L denotado det (L) se calcula como el producto de los elementos de la diagonal, esto es, det (L) =
n Y
lii :
i=1
Por otro lado, det (A) = det LLT = det (L) det LT = [det (L)]2 de modo que n Y
det (A) =
i=1
lii
!2
=
n Y
2 lii :
i=1
El número de operaciones elementales que se requieren para la factorización de la matriz A es: N=
n 2n2 + 3n + 1 ; 6
el número de operaciones elementales para el cálculo de
n Q
i=1
2 es n2 productos. Luego, el número de lii
operaciones elementales requeridas para el cálculo de det (A) es N oper (n) =
6.8.
n n 2n2 + 3n + 1 + n2 = 2n2 + 9n + 1 : 6 6
Método de Crout.
! Sean A = (aij ) 2 Mn n [R] no nula, b T = (b1 ; :::; bn ) 2 Rn : Consideramos el problema siguiente: hallar ! x 2 Rn , si existe, solución de ! A! x = b: (1) En el método de factorización de Crout se buscan, si existen, dos matrices L = (lij ) ; U = (uij ) se Mn n [R] tales que lij
= 0 si j > i;
uij
= 0 si i > j; i = 2; :::; n; j = 1; :::; n;
uii = 1;
i = 1; :::; n; j = 2; :::; n;
i = 1; :::; n
y A = LU:
(2)
En de…nitiva, la matriz L es triangular inferior, la matriz U es triangular superior y cuyos elementos de la diagonal son todos 1. De la factorización de A, es sistema de ecuaciones (1) es equivalente a los siguientes: ( ! ! ! L! y = b; ! ! A x = b , LU x = b , U! x =! y: ! ! El primero L! y = b es un sistema triangular inferior, y el segundo U ! x = b es un sistema triangular superior. Por lo tanto, queda describir un algoritmo para determinar las matrices L y U: De la de…nición de producto de matrices, se tiene aij =
n X k=1
lik ukj
i = 1; :::; n; j = 1; :::; n:
(3)
372
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Etapa 1 (j = 1) : De la de…nición de las matrices L y U , se tiene ai1 =
n X
lik uk1 = li1 u11 = li1 i = 1; :::; n:
k=1
Así, li1 = ai1 ; Para i = 1; a1j =
n X
i = 1; :::; n:
(4)
l1k ukj = l11 u1j ;
k=1
de donde u1j =
a1j ; l11
l11 6= 0;
j = 2; :::; n:
(5)
Etapa 2 (j = 2)
ai2 =
n X
lik uk2 = li1 u12 + li2 u22 = li1 u12 + li2 ;
k=1
de donde
li2 = ai2
li1 u12 i = 2; :::; n:
Para i = 2; a2j
=
n X
l2k ukj = l21 u1j + l22 u2j
k=1
u2j
=
a2j + l1 u1j l22
si l22 6= 0; j = 3; :::; n:
Note que en la primera etapa se construye la primera columna de L y luego la primera …la de U . En la segunda etapa se construye la segunda columna de L y a continuación la segunda …la de U . Continuando con este procedimiento, para 1 j n …jo, aij = ssnk=1 lik ukj = li1 u1j + li2 u2j + ::: + lij uii =
j 1 X
lik ukj + lij
k=1
de donde lij = aij
j 1 X
lik ukj i = j; :::; n:
(6)
k=1
Para 1
i
n
1 …jo, se tiene aij
= ssk = 1n lik ukj = li1 u1j + li2 u2j + ::: + lii uij ; aij
uij
=
jP1
k=1
ljj
lik ukj ;
ljj 6= 0;
j = i + 1; :::; n:
Antes de proceder a la descripción del algoritmo de factorización de A mediante el método de Crout, consideremos un ejemplo. Ejemplo ! ! ! Hallar la solución del 2 sistema de ecuaciones lineales A x = b , con A la matriz y b el vector que se dan 3 2 3 0 2 2 0 2 0 6 1 7 6 0 7 0 1 2 0 6 7 7 !6 7 1 4 2 7 a continuación. A = 6 b 6 6 1 2 7; 6 0 7 : Apliquemos el método de Crout.Para 4 2 5 4 3 0 1 1 2 5 0 1 1 0 1 1 ello, comencemos con el pricedimiento de factorización LU descrito precedentemene.
6.8. MÉTODO DE CROUT.
373
Etapa 1 (j = 1) : En esta etapa se determinan los elementos de la primera columna de A : l1i = ai1
i = j; :::; n
l11 = a11 = 2; l21 = a21 = 1; l31 = a31 =
1;
l41 = a41 = 2; l51 = a51 = 0: Inmediatamente, se pasa a la construcción de los elementos de la primera …la de U : a1k l11 6= 0; u1k = ; k = j + 1; :::; n l11 Resulta, a12 l11 a13 l11 a14 l11 a15 l11
u12 = u13 = u14 = u15 = Etapa 2 (j = 2) : Se tiene li2 = ai2 L. Resulta,
li1 u12 ;
2 = 1; 2 0 = = 0; 2 2 = = 1; 2 0 = = 0: 2 =
i = j; :::; n, con lo que se construye la segunda columna de
l22 = a22
l21 u12 = 0
1
( 1) = 1;
l32 = a32
l31 u12 = 2
( 1)
l42 = a42
l41 u12 =
3
2
( 1) =
1;
l52 = a52
l51 u12 =
1
0
( 1) =
1:
( 1) = 1;
Se pasa inmediantemente a la obtención de los elementos de la segunda …la de U . Para k = j + 1; :::; n o sea k = 3; 4; 5; ajk lj1 u1k ujk = : ljj Luego, u23 = u24 = u25 =
a23 a24 a25
21
u13
=
1
l22 l21 u14 2 = l22 0 l21 u15 = l22
1 0 = 1; 1 1 1 = 1; 1 1 0 = 0: 1
Etapa 3 (j = 3) : Se construye la tercera columna de L. Se tiene li3 = ai3
li1 u13
li2 u23 ;
i = j; :::; n;
es decir que l33 = a33
l31 u13
l32 u23 = 1
( 1)
0
1
( 1) = 2;
l43 = a43
l41 u13
l42 u23 = 0
2
0
( 1) ( 1) =
l53 = a53
l51 u13
l52 u23 = 1
0
0
( 1) ( 1) = 0:
Construimos la tercera …la dae U . Tenemos ljj 6= 0, y ujk =
ajk
lj1 u1k ljj
lj2 u2k
k = j + 1; :::; n;
1;
374
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
con lo cual a34
u34 =
l31 u14 l33 l31 u15 l33
a35
u35 =
l32 u24 l32 u25
=
4
( 1)
1
2 ( 1) 0 2
2
=
1
1 1
= 2; 0
=
1:
Etapa 4 (j = 4) : Se construye la cuarta columna de L. li4 = ai4
li1 u14
li2 u24
li3 u34 ;
i = j; :::; n;
l44 = a44
l41 u14
l42 u24
l43 u34 = 1
2
1
( 1)
1
( 1)
2 = 2;
l54 = a54
l51 u14
l52 u24
l53 u34 = 0
0
1
( 1)
1
0
2 = 1:
( 1)
( 1)
Inmediatamente se construye la cuarta …la de U: a4k u4k = u45 =
jP1
l4r urk
r=1
l44 a45 l41 u15
;
k = j + 1; :::; n;
l42 u25 l44
l43 u35
=
1
2
0
( 1)
0 2
= 0:
Etapa 5 (j = 5) : Note que n = 5, o sea j = n: En esta etapa se construye únicamente el elemento lnn : Se tiene j 1 X li5 = ai5 lir ur5 i = j; :::; n; r=1
como j = n = 5;
i = 5. Entonces
l55 = a55 = Obtenemos
2
6 6 L=6 6 4
2 1 1 2 0
1 0 1 1 1 1
l51 u15 0 0 0 2 1 0
0 0 0 0 2 1
l52 u25 ( 1) 0 0 0 0 1
3
7 7 7; 7 5
l53 u35 0
0
l54 u45 ( 1)
2
6 6 U =6 6 4
1 0 0 0 0
1 1 1 0 0 0
0= 0 1 1 0 0
1 1 2 1 0
1: 0 0 1 0 1
3
7 7 7: 7 5
! ! El sistema de ecuaciones A! x = b es equivalente a los dos siguientes: L! y = b y U! x =! y: ! Comencemos con la resolución del sistema triangular inferior L! y = b . Tenemos 8 2y1 =0 > > > > y +y =0 < 1 2 y1 +y2 +2y3 =0 > > 2y y y 2y = 2 > 1 2 3 4 > : y2 +y4 y5 = 1; cuya solución es ! y T = (0; 0; 0; 1; 2) :
Concluimos con la resolución numérica del sisteam de ecuaciones triangular superior U ! x =! y siguiente: 8 x1 x2 +x4 = 0 > > > > x x +x = 0 < 2 3 4 x3 +2x4 x5 = 0 > > x = 1 > 4 > : x5 = 2:
6.8. MÉTODO DE CROUT.
375
La solución es ! x T = (2; 1; 0; 1; 2) : Algoritmo de factorización LU Algoritmo Datos de entrada: n 2 Z+ ; A = (aij ) 2 Mn
n [R] :
Datos de salida: L; U: 1. Para i = 1; :::; n li1 = ai1 : Fin de bucle i. 2. Si l11 6= 0; Para k = 2; :::; n u1k =
a1k l11
Fin de bucle k. Caso contrario, continuar en 5): 3. Para j = 2; :::; n Para i = j; :::; n S=0 Para k = 1; :::; j S = S + lik lij = aij
1 ukj
S
Fin de bucle k. Si ljj 6= 0; Para k = j + 1; :::; n S=0 Para i = 1; :::; j
1
S = S + lki ujk =
uij
ajk S ljj
Fin de bucle i. Fin de bucle k. Caso contrario, continuar en 5) Fin de bucle j. 4. Imprimir L:U . Continuar en 6). 5. Imprimir mensaje: “Matriz singular o no se factora en la forma LU ” 6. Fin.
376
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Una vez que se ha procedido a la factoración de la matriz A en la forma LU; se pasa inmediatamente a la resolución del sistema de ecuaciones lineales que se recoje en el algoritmo de Crout. Algoritmo de Crout Algoritmo Datos de entrada: n 2 Z+ ; A = (aij ) 2 Mn
n [R] ;
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de salida: Mensaje : “Matriz singular”. Solución ! x T = (x1 ; :::; xn ) : 1. Aplicar el algoritmo de factorización LU: Si A es singular, continuar en 5). ! 2. Resolver el sistema de ecuaciones L! y = b: 3. Resolver el sistema de ecuaciones U ! x =! y: 4. Escribir la solución ! x T = (x1 ; :::; xn ) : Continuar en 6). 5. Escribir mensaje: “A es singular o no se factora en la forma LU ”. 6. Fin. Observaciones
1. Si A = (aij ) 2 Mn
n [R]
se factora en la forma LU , esta es única.
En efecto, supongamos que A admite otra factorización L1 U1 , donde L1 es triangular inferior, U triangular superior Si A es no singular entonces L; L1 ; U; U1 son no singulares, y LU = L1 U1 , L1 1 L = U1 U
1
:
Como U y U1 son triangulares superiores, U1 U 1 es triangular superior que posee unos en la diagonal. Por otro lado L; L1 son triangulares inferiores, L1 1 L es triangular inferior. Para que se tenga la igualdad L1 1 L = U1 U 1 debe ser U1 U 1 = I, de donde U1 = U , y L1 1 L = I implica L = L1 . Así, la factorización es única. 2. La matriz A =
0 1 1 0
no se factora en la forma LU: La matriz A es claramente no singular.
Supongamos que A = LU con L =
A = LU =
l11 0 l21 l22
l11 0 l21 l22
; U=
1 u12 0 1
=
1 u12 0 1
: Entonces
l11 l11 u12 l21 l21 u12 + l22
0 1 1 0
=
Luego, l11 = 0; 1 = l11 u12 = 0
u12 = 0 que es absurdo.
3. Si una matriz singular A se factora en la forma LU , esta no es única. Por ejemplo A =
1 0 1 0
=
B =
0 1 0 1
=
1
0 0
=
1
0 3
0 0 1
8 2 R,
8 2 R,
6= 0:
6= 0;
:
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES.
6.9.
377
Sistemas de ecuaciones lineales con matrices tridiagonales.
De…nición 7 Sea A = (aij ) 2 Mn
n [R]
tal que A 6= 0. Se dice que A es tridiagonal si
aij = 0 para
ji
jj > 1;
i; j = 1; :::; n:
Como hemos visto, essta clase de matrices se presentaron en la discretización de problemas de valores de frontera 1d, en la construcción de splines de interpolación. Además, aparecen en la discretización mediante diferencias …nitas y elementos …nitos de muchos problemas del tipo 8 @u @ @u @u < @t @x p @x + v @x + qu = f; + Condición inicial, : + Condiciones de frontera,
donde f; p; q; v son funciones dadas que cumplen cierta regularidad en [0; L]
[0; T ] ; con L > 0; T > 0:
! Sean A = (aij ) 2 Mn n [R] con A 6= 0 y A tridiagonal, b T = (b1 ; :::; bn ) 2 Rn . Se considera el sistema de ! ecuaciones lineales A! x = b: De la de…nición de matriz tridiagonal, la matriz A tiene la forma 2 a11 a12 0 0 6 a21 a22 a23 0 6 6 .. .. . . . .. .. .. . A=6 6 . 6 .. . . .. .. 4 . an 1;n 0 ann 1 ann
3 7 7 7 7 7 7 5
! y el sistema de ecuaciones lineales A! x = b ; en forma explícita se escribe: 8 a11 x1 +a12 x2 = b1 > > > > a x +a x +a x = b2 > 22 2 23 3 > < 21 1 .. . > > .. > > . > > : ann 1 xn 1 +ann xn = bn :
Esta clase de problemas involucra el almacenamiento adecuado de los datos y una simpli…cación del ! algoritmo de resolución del sistema de ecuaciones A! x = b: Comenzamos con el almacenamiento de los datos.
Para almacenar los elementos aij ; i; j = 1; :::; n de A se requieren n2 espacios de memoria, que para n grande, n2 puede ser muy signi…cativo. Por ejemplo para n = 1000, n2 = 1;000;000. Es claro que en la actualidad una cifra como esta es muy modesta frente a la capacidad de almacenamiento de datos que poseen los modernos equipos de computación. Sin embargo, por grande que sea esta capacidad de almacenamiento, es preciso tratar de optimizar el espacio de memoria utilizado. Con este propósito, para almacenar los datos de una matriz tridiagonal, únicamente se requieren de aquellos elementos aij para los que ji jj 1; i; j = 1; :::; n, y no todos los n2 elementos de la matriz A: Se de…ne la matriz B = (bik ) 2 Mn
3 [R]
del modo siguiente:
b11 = bn3 = 0; bi1 = aii
1;
bi2 = aii ; bi3 = aii+1 ;
i = 2; :::; n; i = 1; :::; n; i = 1; :::; n
1;
378
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
es decir que la matriz B es de la forma 2
0 a21 a32
a11 a22 a33 .. .
6 6 6 6 B=6 6 6 4 an 1;n 2 an 1;n ann 1 ann
3
a12 a23 a34 1
an
1;n
0
7 7 7 7 7: 7 7 5
Observamos que los elementos de la diagonal principal de A está localizados en la segunda columna de B. Los elementos de la diagonal superior adyacente a la principal de A están localizados en la tercera columna de B, los elementos de la diagonal inferior adyacente a la principal de A están localizados en la primera columna de B. Note que la matriz B requiere de 3n espacios de memoria. Por ejemplo para n = 1000, solo se requieren de 3000 espacios de memoria. Adicionalmente, el tiempo de máquina y la precisión de la solución, son dos situaciones importantes a considerar. En cuanto se re…ere a la precisión de la solución, posponemos el análisis correspondiente. ! En lo que se re…ere al tiempo de máquina utilizado en la resolución del sistema de ecuaciones A! x = b , se buscan algoritmos cuyos tiempos de máquina, sean en lo posible, los más pequeños. Se logra este objetivo utilizando la hipótesis A es una matriz tridiagonal y elaborando algoritmos que eviten realizar cálculos innecesarios con elementos aij = 0 para ji jj > 1, i; j = 1; :::; n. El arreglo de elementos de A en la matriz B conduce al propósito antes precisado. Para esta clase de matrices tridiagonales y con hipótesis suplementarias sobre la matriz A, proponemos tres algoritmos de resolución numérica de los sistemas de ecuaciones lineales. Eliminación gaussiana sin pivoting. Supongamos que A = (aij ) 2 Mn n [R] es una matriz tridiagonal y estrictamente diagonalmente ! ! dominante; b T = (b1 ; :::; bn ) 2 Rn . Consideramos el sistema de ecuaciones lineales A! x = b: Con la hipótesis A es estrictamente diagonalmente dominante, debemos mostrar que las matrices (1) (n 1) A1 = aij ; :::; An 1 = aij correspondientes a cada etapa de la eliminación gaussiana, son estrictamente diagonalmente dominantes. Etapa 1. Como A es estrictamente diagonalmente dominante, se tiene ja11 j > ja12 j ; a21 Resulta ja11 j > 0. Sean k21 = ,y a11 (1)
a22 = k21 a12 + a22 =
1. Como ja11 j > ja12 j se sigue que
a21 a12 + a22 = a11
a21
a12 + a22 : a11
a12 < 1. Luego a21 aa12 < ja21 j : Entonces 11 a11
ja22 j > ja21 j + ja23 j > a21
a12 + ja22 j a11
de donde ja22 j Utilizando la desigualdad jjxj (1)
jyjj
a22 = a22
jx a21
a21
a12 > ja23 j : a11
yj ; 8x; y 2 R. Se tiene a12 a11
ja22 j
a21
a12 > ja23 j : a11
ja22 j > ja21 j + ja23 j :
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES.
379
Así, (1)
(1)
a22 > a23 = ja23 j : Como las otras …las de la matriz A quedan inalteradas, se tiene jaii j > jaii
1j
+ jaii+1 j ;
(1)
i = 3; :::; n:
(1)
(1)
(1)
Se pone aij = aij para i = 1; 3; :::; n; j = 1; :::; n; a23 = a23 ; a2j = 0; j = 1; 4; :::; n; y A1 = aij Consecuentemente, A1 =
(1) aij
.
es estrictamente diagonalmente dominante. (1)
Etapa 2. Como
(1) a22
a32
6= 0. Se de…ne k32 =
(1)
;y
a22
(1) (1) a23 (1) a22
(1)
(2)
(1)
(1)
a33 = k32 a23 + a33 =
(1)
Puesto que a22 (2)
(1)
> a23
a32
(1)
a32
(1)
+ a33 :
y razonando en forma similar a la realizada en la etapa 1, se muestra que
(2)
(2)
a33 > a34 : Denotamos con A2 = aij
, donde
(2)
= aij
(1)
(2)
= 0; a34 = a34 ; a3j = 0; j = 4; :::; n:
aij
i = 1; :::; n; i 6= 3; j = 1; :::; n;
(2)
a32
(1)
(2)
Continuando con este proceso llegamos a la etapa n Etapa n
(1)
a + a33 = (1) 23 a22
1 siguiente.
1: Se tiene (n 2) 1;n 1
(n 2) 1;n
an
> an
Se de…ne kn:n
1
= jan
1;n j
0:
(n 2) 1 ; (n 2) an 1;n 1
ann
=
y a(n nn Mostremos que
(n 1) ann
6= 0: Como
1)
= kn;n
(n 2) an 1;n 1
>
(n 2) 1 an 1;n
(n 2) an 1;n
(n 2) (n 2) an 1;n an;n 1 (n 2) an 1;n 1
+ a(n nn
se sigue
(n 2) 1
< ann
2)
:
(n 2) 1;n (n 2) an 1;n 1
an
< a(n nn
2)
0:
! En términos de los elementos de la matriz B y el vector b , el procedimiento de eliminación gaussiana ! para la resolución del sistema de ecuaciones A! x = b se escribe en los siguientes términos. Etapa 1. Se pone c =
b21 . Luego b22 = cb13 + b22 ; b2 = cb1 + b2 : b12
Etapa 2. Se pone c=
b31 ; b22
b32 = cb23 + b32 ;
b3 = cb2 + b3 :
380
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Continuando con este procedimiento, en la etapa n Etapa n
1, se tiene
1
1. c=
bn1 bn
;
bn2 = cbn
1;3
+ bn2;
bn = cbn
1
+ bn :
1;2
La resolución del sistema de ecuaciones se describe en el siguiente procedimiento: xn = y para i = n
bn ; bn2
1; :::; 1; xi =
(bi
bi3 xi+1 ) : bi;2
! Se establece el siguiente algoritmo de resolución del sistema de ecuaciones lineales A! x = b . Se asume que la matriz A es tridiagonal con lo que los elementos de A son almacenados en la matriz B. Algoritmo Datos de entrada: n 2 Z+ ;
B = (bij ) 2 Mn
3 [R] ;
!T b = (b1 ; :::; bn ) 2 Rn :
Datos de salida: Mensaje: “A no es estrictamente diagonalmente dominante”, solución ! x T = (x1 ; :::; xn ) : 1. Para i = 1; :::; n; Si jbi2 j
jbi1 j + jbi3 j, continuar en 6).
Fin de bucle i. 2. Para j = 1; :::; n c=
1
bj+1;1 bj2
bj+1;2 = c bj+1 = c
Proceso de eliminación gaussiana bj3 + bj+1;2
bj + bj+1
Fin de bucle j. 3. xn =
bn bn2
4. Para j = n xj =
Resolución del sistema triangular superior 1; :::; 1 (bj
bj;3 xj+1 ) bj2
Fin de bucle j. 5. Imprimir ! x T = (x1 ; :::; xn ). Continuar en 7). 6. Imprimir mensaje: “A no es estrictamente diagonalmente dominante”. 7. Fin. Nota: Se puede probar que el número total de operaciones elementales en la resolución del sistema de ! ecuaciones A! x = b es N oper(c) (n) = 8n 7: Ejemplos
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES. 2
6 6 1. Sean A = 6 6 4
5 2 0 0 0
1 4 1 0 0
0 1 3 2 0
0 0 1 5 3
0 0 0 2 4
3
7 7 7; 7 5
2
6 ! 6 b =6 6 4
11 8 0 1 5
381
3
7 7 7 : Consideramos el sistema de ecuaciones lineales 7 5
! A! x = b que en forma explícita se escribe 8 5x1 x2 > > > > < 2x1 +4x2 +x3 x2 +3x3 +x4 > > 2x3 +5x4 +2x5 > > : 3x4 +4x5
= = = = =
11 8 0 1 5:
Apliquemos el algoritmo precedente. Primeramente, la matriz A es tridiagonal, consecuentemente los elementos de A son dispuestos en la siguiente matriz: 2 3 0 5 1 6 2 4 1 7 6 7 7 B=6 6 1 3 1 7: 4 2 5 2 5 3 4 0
1. Observamos que la matriz A es estrictamente diagonalmente dominante, lo que equivale a observar que en cada …la de B se satisface la condición jbj2 j > jbj1 j + jbj3 j ;
j = 1; 2; 3; 4; 5:
2. Pasemos al proceso de eliminación gaussiana descrito en el punto 2) del algoritmo precedente. Para j = 1; 2; 3; 4. Se tiene j = 1, b21 2 2 c = = = ; b12 5 5 2 18 b22 = c b13 + b22 = ( 1) + 4 = ; 5 5 2 18 b 2 = c b1 + b 2 = 11 + ( 8) = ; 5 5 j = 2; 1 5 b31 = 18 = ; c = b22 18 5 49 5 b3;2 = c b23 + b32 = 1+3= ; 18 18 5 18 b3 = c b2 + b3 = + 0 = 1; 18 5 j = 3; b41 2 36 c = = 49 = ; b32 49 18 36 109 b42 = c b33 + b42 = 1+5= ; 49 49 36 13 b4 = c b3 + b4 = 1+1= ; 49 49 j = 4; b51 3 147 c = = 209 = ; b42 209 49 147 542 b52 = c b43 + b52 = 2+4= ; 209 209 147 13 53116 b5 = c b4 + b5 = + ( 5) = : 209 49 10241
382
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES 3. Pasamos a la resolución del sistema de ecuaciones triangular superior: x5 = x4 = x3 = x2 = x1 =
b5 = b52 b4 b3
53116 10241 542 209
b43 x5
=
=
2;
13 49
2
b42 b33 x4 1 = b32
b2
b23 x3 b22
b1
b13 x2 b12
= =
( 2)
209 49
1
1
49 18 18 1 5 18 5
11
= 1;
= 0; 0
( 1) 5
=
1;
( 1)
= 2:
La solución del sistema de ecuaciones lineales es ! x T = (2; 1; 0; 1; 2) : 2
3 2 3 5 2 1 0 0 0 6 2 6 6 9 7 2 1 0 7 6 7 6 7 ! 6 7 7 2 7 2 1 7; b = 6 2. Sean A = 6 1 6 14 7 : Consideramos el sistema de ecuaciones 4 0 4 3 5 1 2 6 2 5 0 0 1 2 4 0 ! ! lineales A x = b Apliquemos el algoritmo precedente. Etapa 1 2
A1
! b1
6 6 6 6 = K 1 A0 = 6 6 6 4 2
1 2 5 1 5 0 0
1 6 2 6 ! 6 6 5 = K1 b = 6 1 6 5 6 4 0 0
0 0 0 0
3
2
5 2 7 1 0 0 0 7 6 76 2 6 76 1 2 0 1 0 0 7 76 4 0 1 7 0 0 1 0 5 0 0 0 0 0 1 3 0 0 0 0 2 3 2 0 7 1 0 0 0 7 6 9 7 76 7 6 76 6 7 6 14 = 7 6 0 1 0 0 7 76 4 5 4 3 7 0 0 1 0 5 0 0 0 0 1
1 2 7 2 1 0 9 14 3 0
0 1 2 6 2
0 0 1 2 4
3
3
2
5
2 34 5 12 5 1 0
1 8 5 36 5 2 1
0
2 34 5 0
0
1
0
0
1 8 5 132 17 38 17 1
6 0 7 6 7 6 6 7=6 7 6 0 5 6 4 0 0
0
3
0
1 2 6 2
7 0 7 7 7 ; 1 7 7 7 2 5 4
7 7 7: 7 5
Etapa 2 2
A2
! b2
1 6 0 6 6 6 = K 2 A1 = 6 0 6 6 0 4 0 2 1 6 0 6 6 ! 6 = K2 b 1 = 6 0 6 6 0 4 0
0 1 6 17 5 34 0
32
0 0 0 5 6 0 0 0 7 76 0 76 6 1 0 0 7 76 0 76 6 0 1 0 7 54 0 0 0 0 1 3 0 0 0 0 2 0 1 0 0 0 7 76 7 6 6 9 1 0 0 7 14 76 17 76 4 3 5 7 0 1 0 5 34 0 0 0 0 1
2 34 5 12 5 1 0 3
1 8 5 36 5 2 1 2
6 7 6 7 6 7=6 7 6 5 6 6 4
0 9 292 17 57 34 0
0 1 2 6 2 3
7 7 7 7 7: 7 7 5
0
3
2
7 6 6 0 7 7 6 7 6 =6 1 7 7 6 7 6 2 5 6 4 4
5 0
0 1 28 17 209 34 2
0
3
7 0 7 7 7 1 7 7; 7 7 2 5 4
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES.
383
Etapa 3 2
A3
! b3
1 0 6 0 1 6 6 0 0 6 = K 3 A2 = 6 6 0 0 6 4 0 0
0 0 1 19 66 17 132
1 0 6 0 1 6 6 0 0 ! 6 = K3 b 2 = 6 6 0 0 6 4 0 0
0 0 1 19 66 17 132
2
0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1
Etapa 4
A4
1 0 8 1 0 5 28 132 0 17 17 38 209 0 1 17 34 0 0 1 2 32 3 2 0 3 0 9 7 76 9 7 6 7 76 7 6 292 7 7 6 292 7 6 6 7 76 7 7: 17 7 6 17 7 = 6 437 7 7 6 57 7 6 6 7 76 7 7 5 4 34 5 6 66 4 73 5 0 33
2
1 0 0 6 0 1 0 6 6 = K 4 A3 = 6 0 0 1 6 0 0 0 4 0 0 0 2
5 6 6 0 6 6 6 = 6 0 6 6 0 6 4 0 ! b4
32 76 76 76 76 76 76 76 56 4
2 34 5 0 0
1 8 5 132 17 0
0
0
0 1 28 17 437 66 0
2
1 0 0 6 0 1 0 6 ! 6 = K4 b 3 = 6 0 0 1 6 0 0 0 4 0 0 0
5
2 34 5 0
0 0 0 1 146 437
2
7 7 7 7 1 7 7; 113 7 7 7 66 5 8217 1748 2 3 0 0 6 6 0 0 7 76 6 0 0 7 76 6 1 0 7 56 6 146 1 4 437 0
5
6 6 0 76 76 76 0 76 76 56 0 6 1 4 0 3
0 0 0 0
0
3
2 34 5 0
7 6 6 0 7 7 6 7 6 6 1 7 7=6 7 6 7 6 2 5 6 4 4
0
1 8 5 132 17 0
0
0
0 9 292 17 437 66 73 33
3
2
3
0
2
7 6 7 6 7 6 7 6 7=6 7 6 7 6 7 4 5
5
0
2 34 5 0
0
0
1 8 5 132 17 0
0
0
0
0
0
0
1 28 17 437 66 73 33
0 9 292 17 437 66 0
0 1 28 17 437 66 73 33
0
7 7 7 7 1 7 7; 113 7 7 7 66 5 545 132
3
7 7 7 7 1 7 7 113 7 7 7 66 5 545 132 0
3
7 7 7 7 7: 7 7 5
La solución del sistema de ecuaciones triangular superior es ! x = (0; 1; 2; 1; 0)T : Adicionalmente para la resolución del sistema de ecuaciones lineales se realizaron 47 operaciones elementales para transformar el sistema en uno triangular superior y 19 operaciones para resolver este último sistema. La resolución de este sistema de ecuaciones requiere de 66 operaciones elementales. Método de Choleski ! Sea A = (aij ) 2 Mn n [R] tridiagonal, simétrica, de…nida positiva, b T = (b1 ; :::; bn ) 2 Rn . Consideramos ! el sistema de ecuaciones lineales A! x = b: La hipótesis A es una matriz simétrica, de…nida positiva implica la existencia de una matriz triangular inferior L = (lij ) 2 Mn n [R] tal que A = LLT . En inmediato veri…car que lij = 0
si ji
jj > 1; i; j = 1; :::; n;
3
0
384
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
esto es, L es una matriz de la forma 2
6 6 6 L=6 6 4
l11 l21 0 .. .
0 l22 l32
0 0
0 0 0 .. .
l33 ..
0
lnn
. 1
lnn
3
7 7 7 7: 7 5
Como se ha dicho, los coe…cientes de la matriz A se disponen en la matriz B = (bjk ) 2 Mn
3 [R] :
De la estructura de la matriz L; se sigue que los coe…cientes de interés lij son únicamente lii ; i = 1; :::; n, li;i 1 ; i = 2; :::; n; lo que conduce a de…nir una matriz C = (cij ) 2 Mn 2 [R] siguiente: c11 = 0; ci1 = lii
1;
i = 2; :::; n;
ci2 = lii ;
i = 1; :::; n; 2 3 0 l11 6 l21 l22 7 6 7 6 l31 l33 7 es decir que C es la matriz de la forma siguiente: C = 6 7: 6 .. .. 7 4 . . 5 lnn 1 lnn
Con la hipótesis A es una matriz tridiagonal, realizamos las simpli…caciones en el algoritmo de Choleski. Tenemos el procedimiento siguiente. p 1. l11 = a11 : 2. l21 =
a12 : l11
3. Para j = 2; :::; n 1 q 2 ljj = ajj ljj 1 lj+1;j =
ajj+1 ljj
Fin de bucle j q 2 4. lnn = ann lnn
1:
En términos de los elementos de las matrices B y C, el procedimiento precedente se escribe de la manera que a continuación se indica. p 1. c12 = b12 2. c21 =
b13 c12
3. Para j = 2; :::; n 1 q cj2 = bj2 c2j1 cj+1;1 =
bj3 cj2
Fin de bucle j. p 4. cn2 = bn2 c2n1 :
! Por otro lado, la resolución del sistema de ecuaciones triangular inferior L! y = b se describe en el siguiente procedimiento:
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES. b1 L11
1. y1 =
385
b1 c12 :
=
2. Para j = 2; :::; n yi =
bj
Ljj 1 yj Ljj
1
=
bj
cj1 yj cj2
1
:
Fin de bucle j. La resolución del sistema de ecuaciones triangular superior LT ! x = ! y se expresa en el siguiente procedimiento. 1. xn =
yn Lnn
yn cn2 :
=
2. Para j = n xj =
1; :::; 1
yj
Ljj 1 xj Ljj
1
=
yj
cj1 xj cj2
1
:
Fin de bucle j. Ejemplo Apliquemos el algoritmo precedente 2 4 6 2 6 6 0 A=6 6 0 6 4 0 0
! al sistema de ecuaciones lineales A! x = b , donde 3 2 3 2 0 0 0 0 2 6 1 7 5 2 0 0 0 7 7 6 7 7 ! 6 2 2 1 0 0 7 4 7 6 7: ; b =6 7 0 1 10 6 0 7 7 6 16 7 5 4 0 0 6 5 1 1 5 0
0
0
1
Primeramente, los elementos de la matriz A se disponen 2 0 4 6 2 5 6 6 2 2 B=6 6 1 10 6 4 6 5 1 5
5
0
en la matriz B siguiente: 3 2 2 7 7 1 7 7: 6 7 7 1 5 0
En el método de Choleski (sin considerar los errores de redondeo) y para matrices tridiagonales, si se tiene AT = A, y ajj > L2jj 1 j = 1; 2; :::; n; la matriz A es simétrica, de…nida positiva. ! Apliquemos el pricedimiento de resolución del sistema de ecuaciones A! x = b arriba descrito. Tenemos: p p 1. L11 b12 = 4 = 2; 2. c21 = L21 =
b13 = c12
2 2
3. Para j = 2; 3; 4; 5 p j = 2; c22 = b22 c31 =
b23 c22 =
j = 3; c32 = c41 =
b33 c32
=
2 2
p
b32
=
1 1
= 1;
c221 =
p
5
1 = 2;
p
2
1 = 1;
1; c231 =
= 1;
386
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
j = 4; c42 = c51 =
b43 c42
p
c61 = 4. c62 =
p
b62
b53 c52
6 3
=
j = 5; c52 =
c241 =
b42
p
=
1 1
c261 =
10
1 = 1;
2; c251 =
b52
=
p
p
5
4 = 1;
= 1; p
5
1 = 2:
Los elementos de la matriz L = (lij ) se disponen en la matriz C siguiente: 2
0 l2 l32 l43 l54 l65
6 6 6 C=6 6 6 4
l11 l22 l33 l44 l55 l66
3
2
7 6 7 6 7 6 7=6 7 6 7 6 5 4
0 1 1 1 2 1
2 2 1 3 1 2
3
7 7 7 7: 7 7 5
! El sistema de ecuaciones L! y = b en términos de la matriz C tiene la forma siguiente: c12 y1 c21 y1 c31 y2 c41 y3 c51 y4 c61 y5
+c22 y2 +c32 y3 +c42 y4 +c52 y5 c62 y6
= = = = = =
cuya solución es ! y T = (1; 0; 4; 4; 1; 0) :
8 b1 2y1 > > > > b2 y1 +2y2 > > < b3 y2 +y3 , b4 +3y4 > y3 > > > > 2y4 +y5 b5 > : y5 +2y6 b6
= = = = = =
2 1 4 16 7 1
El sistema de ecuaciones LT ! x =! y expresado en términos de la matriz C tiene la forma siguiente: 8 c12 x1 > > > > c22 x2 > > < c32 x3 > c42 x4 > > > > c x > : 52 5
+c21 x2 +c31 x3 +c41 x4 +c51 x5 +c61 x6 c62 x6
cuya solución es ! x T = (0; 1; 2; 2; 1; 0) :
= = = = = =
8 y1 2x1 > > > > y2 2x2 > > < y3 x3 , y4 > 3x4 > > > > y5 x > : 5 y6
x2 x3 +x4 2x5 +x6 2x6
= = = = = =
1 0 4 4 1 0
Observación Se propone como ejercicio la elaboración de un algoritmo completo para la resolución del sistema de ! ecuaciones A! x = b , donde A = (aij ) 2 Mn n [R] es tridiagonal, simétrica, de…nida positiva.
! El número total de operaciones elementales en la resolución del sistema de ecuaciones A! x = b , mediante el algoritmo arriba descrito es N oper(c) (n) = 10n 7; n 2 Z+ ; es decir que N oper > N oper = 8n 7. El método de eliminación gaussiana es mucho mejor que el método de Choleski, visto respecto del número de operaciones. Método de Crout para matrices tridiagonales ! Sean A = (aij ) 2 Mn n [R] una matriz tridiagonal no nula, b T = (b1 ; :::; bn ) 2 Rn . Consideramos el ! sistema de ecuaciones lineales A! x = b:
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES.
387
En el método de Crout se busca (si existen) una factorización de la matriz A en la forma LU , es decir, A = LU , donde 2 3 2 3 1 u12 0 0 l11 0 0 0 6 0 1 u23 7 0 6 l21 l22 0 0 7 6 7 6 7 6 7 . . . 6 0 l32 l33 7 . . . 0 6 7: . . L=6 7; U = 6 . 7 6 .. .. .. . . .. 7 6 .. 7 .. 4 . . . . . 5 4 . . un 1;n 5 0 0 0 lnn 0 1 Como se ha dicho anteriormente, los elementos de interés de la matriz A se guardan en la matriz B. De e= e e = (e acuerdo a la estructura que presentan las matrices L y U , se de…nen las matrices L lik ; U uik ) de Mn 2 [R] siguientes e l11 = 0 e li1 = lii 1 ; i = 2; :::; n; e li2 = lii ; i = 1; :::; n;
u ei1 = 1;
i = 1; :::; n;
u ei2 = uii+1 ;
u en2 = 0;
e U e tienen la forma o sea, las matrices L; 2
6 e=6 L 6 4
0 l21 .. .
lnn
l11 l22 .. . 1
lnn
3
i = 1; :::; n
2
1 1 .. .
1;
u12 u23 .. .
6 7 6 7 e =6 7; U 6 6 5 4 1 un 1;n 1 0
3
7 7 7 7: 7 5
El algoritmo de factorización LU para matrices tridiagonales se reduce al siguiente: 1. l11 = a11 a12 : 2. u12 = l11 3. Para i = 2; :::; n li;i
1
= aii
1
1
lii = aii
li;i
1 ui 1;i
uii+1 =
aii+1 : lii
Fin de bucle i. 4.ln;n
1
= ann
5. lnn = ann
1:
lnn
1 un 1;n :
e U e se expresa en los siguientes términos. Este algoritmo en términos de las matrices B; L; 1. e l12 = b12 : 2. u e12 =
b13 : e l12
3. Para i = 2; :::; n e li1 = bi1
1
388
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES e li2 = bi2 u ei2 =
bi3 : e li2
e li1 u ei
1;2
Fin de bucle i. 4. e ln1 = bn1 : 5. e ln2 = bn2
e ln1 u en
1;2 :
! e es: El sistema de ecuaciones triangular inferior L! y = b expresado en términos de la matriz L 8 e > l12 y1 = b1 > > > > e e > l y e l y = b2 22 2 < 21 1 e l31 ye2 +l32 y3 = b3 > .. > > > . > > : l y +l y = b ; n1 n 1
n2 n
n
cuya solución es 1. y1 =
b1 : e l12
2. Para i = 2; :::; n yi =
(bi
li1 yi li2
1)
:
Fin de bucle i. e es El sistema de ecuaciones triangular superior U ! x =! y expresado en términos de la matriz U 8 x1 +u12 x2 = y1 > > > < x2 +u22 x2 = y2 .. > . > > : xn = yn : cuya solución es:
1. xn = yn : 2. Para i = n xi = yi
1; :::; 1 ui2 xi+1 :
Fin de bucle i. ! El número de operaciones elementales para la resolución del sistema de ecuaciones A! x = b mediante el método de Crout, con A matriz tridiagonal, es N oper (n) = 8n
7; n 2 Z+ :
Se observa que el número de operaciones elementales para la resolución del sistema de ecuaciones lineales ! A! x = b , con A una matriz tridiagonal, estrictamente diagonalmente dominante, mediante los métodos de eliminación gaussiana y Crout, coinciden. Ejemplo ! Considerar el sistema de ecuaciones A! x = b, 2 1 2 0 6 2 0 6 6 A=6 6 0 4 13 4 0 0 3 0 0 0
con 0 0 3 11 1
0 0 0 2 2
3
7 7 7; 7 5
2
6 ! 6 b =6 6 4
3 4 2 42 18
3
7 7 7: 7 5
6.9. SISTEMAS DE ECUACIONES LINEALES CON MATRICES TRIDIAGONALES. La matriz B está de…nida como
2
6 6 B=6 6 4
0 2 4 3 1
1 0 13 11 2
2 6 3 2 0
389
3
7 7 7: 7 5
eyU e usando el algoritmo arriba presentado. Comenzamos con la contrucción (si existen) de las matrices L 1. e l12 = b12 = 1: 2. u e12 =
b13 = e l12
1 1
= 1;
3. Para i = 2; 3; 4 i = 2; e l21 = b21 = 2; e l22 = b22 e l21 u e12 = 0 b23 = 62 = 3; u e22 = e l22
( 2)
i = 3; e l31 = b31 = 4 e l32 = b32 e l31 u e22 = 13 b33 u e32 = = 31 = 3; e l32
4
i = 4; e l41 = b41 = 3; e l42 = b42 e l41 u e32 = 11 b43 2 = u42 = 2 = 1; e l42
4. e l51 = b51 = 1 5. e l52 = b52
Así,
b51
u e42 =
2
1
1 = 2;
3 = 1;
( 3)
1= 2
6 6 e L=6 6 4
3=
2;
3:
0 2 4 3 1
1 2 1 2 3
3
2
6 7 7 6 e =6 7; U 6 7 4 5
1 1 1 1 1
1 3 3 1 0
3
7 7 7: 7 5
! La solución del sistema de ecuaciones A! x = b , es por lo tanto, ! x T = ( 2; 1; 0; 2; 10) : Observación Los métodos de eliminació gaussiana, Choleski y Crout descritos para la resolución del sistema de ! ecuaciones lineales A! x = b , con A 2 Mn n [R] matriz tridiagonal más hipótesis suplementarias sobre A, pueden aplicarse, en general, a matrices A = (aij ) en banda, con longitud de banda lb = 1; 2; :::, de modo que lb < n y lb no muy grande lb < n2 , donde aij = 0
si ji
jj > lb; i; j = 1; :::; n:
Cuando n es grande y lb < n es grande, se debe pensar en guardar los datos aij con ji jj lb; i; j = 1; :::; n, en arreglos (matrices) o archivos adecuados y con estos arreglos o archivos elaborar algoritmos ! adecuados de resolución del sistema de ecuaciones A! x = b: Si n es muy grande, lb < n es pequeño con respecto de n, en este caso es recomendable los métodos iterativos que serán presentados más adelante.
390
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
6.10.
Resolución de un sistema de ecuaciones lineales en norma mínima.
! Sean A = (aij ) 2 Mm n [R] tal que R (A) = m < n, y b T = (b1 ; :::; bn ) 2 Rn . El sistema de ecuaciones ! lineales A! x = b posee una in…nidad de soluciones. Denotamos con S el conjunto de todas estas soluciones, esto es, n !o S= ! x 2 R jA! x = b :
Consideramos el problema (P) siguiente: hallar x b 2 S, si existe, tal que kb xk2 = ! Min kb xk2 ; x 2S
2 k! xk
o lo que es lo mismo kb xk2
8! x 2 S; que a su vez puede escribirse como 2 kb xk2 = ! Minn k! xk : x 2R ! A! x= b
Este es un problema de extremos condicionados en el que se busca minimizar la función g de…nida por g (! x) =! x T! x; ! x 2 Rn ;
! sujeta a la restricción A! x = b : El método de los multiplicadores de Lagrange proporciona una condición ! ! necesaria de extremo. Sea T = ( 1 ; :::; m ) 2 Rm con 6= 0 y de…nimos la …nción de Rn en R como ! ! ! x x; = g (! x ) + T A!
! ! x b =! x T! x + T A!
! b ; ! x 2 Rn :
! ! Las componentes de : 1 ; :::; m se llaman multiplicadores de Lagrange y se llama vector multiplicador de Lagrange. Las condiciones necesarias de extremo establecen que r! x
! ! x; = 0;
r!
! ! x; = 0;
! ! donde r! , x ; r! denotan los operadores gradiente con respecto de x y con respecto de respectivamente. ! Para el efecto, determinemos la derivada direccional de con respecto de ! x y de según las direcciones ! ! ! ! ! ! n m y 2R y 2 R que se escriben D! x; y D! x; , esto es, y D! y
! ! x;
D!
! ! x;
= lm
t!0
= lm
! ! x + t! y;
! ! x;
t ! ! ! x; +t
! ! x;
t!0
Comencemos con el cálculo de la derivada direccional D! y dirección ! y 2 Rn : Sean t 6= 0, ! y 2 Rn con ! y = 6 0. Entonces, ! ! x + t! y;
! ! x;
! ! x;
:
! en ! x 2 Rn , 2 Rm según la
! T = (! x + t! y ) (! x + t! y ) + T A (! x + t! y) ! ! ! x T! x + T A! x b ! = t! x T! y + t! y T! x + t2 ! y T! y + t T A! y:
2 Puesto que ! y T! x =! x T! y,y! y T! y = k! y k , resulta
! ! x + t! y;
t
;
! b
! ! ! 2 2 ! x; = 2t! x T! y + t 2 k! y k + t T A! y = t 2! x T! y + T A! y + t k! yk :
6.10. RESOLUCIÓN DE UN SISTEMA DE ECUACIONES LINEALES EN NORMA MÍNIMA.
391
Luego,
D! y
! ! x;
! ! x + t! y;
= lm
! ! x;
! 2 = l m 2! x T! y + T A! y + t k! yk
t!0 t !T ! !T ! ! T! T = 2x y + Ay = 2x + A ! y: t!0
! ! ! x; existe en toda dirección ! y y es continua en ! x ; , entonces
Como la derivada direccional D! y
! ! x; = r! x
D! y es decir
! ! x;
r! x de donde
T
! ! x;
T
! y;
! ! y = 2! x T + TA ! y;
! ! ! x; = 2! x + AT :
r! x
! ! ! Calculemos la derivada direccional D! x; en ! x 2 Rn , 2 Rm según la dirección ! 2 Rm . Para el efecto, sean ! x 2 Rn , ! 2 Rm con ! 6= 0, y t 6= 0. Entonces ! ! x ; + t!
! ! x;
! = ! + t! x T! x + ! x b : = t!T A!
T
! b
A! x
! ! x T! x + T A! x
Luego,
D!
! ! x;
! ! x ; + t!
= lm
! ! x;
x = l m !T A!
t ! b = A! x
! b
T
!:
! ! x; = A! x
! b
T
!:
t!0
x = !T A!
t!0
Por lo tanto, D! De la existencia de D!
! ! ! x; en ! 2 Rm y la continuidad en , se sigue que D!
! ! x; = r!
de donde r!
! ! x;
! ! x; = A! x
T
!;
! b:
Consecuentemente, las condiciones necesarias de extremo 8 ! ! ! < r! x; = 2! x + AT b = 0; x ! ! ! : r! x; = A! x b = 0: Note que r!
! ! ! x; = 0 es equivalente a introducir la restricción A! x = b:
! De la ecuación 2! x + AT = 0, obtenemos ! x = 0 = A! x
! b =A
1 T! 2A
1 T! A 2
de donde AAT
!
=
con lo cual ! b =
! 2b:
! 1 AAT 2
! b
! b
! b
392
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Como R (A) = m y AAT 2 Mm m [R], se tiene que el rango de AAT es también m, esto es, R AAT = m, con lo cual AAT es invertible. Luego ! 1! = 2 AAT b y ! x =
1 Th A 2 AAT 2
1 T! A = 2
Así,
x b = AT AAT
Veri…quemos que x b 2 S y que kb xk2
2 k! xk
Ab x = A AT AAT
donde I 2 Mm
m [R]
i
1!
b
1!
1!
= AT AAT
b:
2 b es solución de ! Min k! xk : x 2S
8! x 2 S: Se tiene 1!
b
= AAT AAT
1!
! ! b =I b = b;
! es la identidad. Así, A! x = b que muestra x b 2 S.
! Sea ! x 2 S. Entonces A! x = b . Se propone como ejercicio mostrar que kb xk2
2 k! xk
8! x 2 S:
Algoritmo. 1! Para el cálculo de x b = AT AAT b se utiliza el algoritmo siguiente que evita la inversión directa de la matriz AAT : ! 1! Sea ! z = AAT b entonces AAT ! z = b . Luego ! x = AT ! z:
1. Calcular B = AAT : ! 2. Aplicar el método de eliminación gaussiana para resolver el sistema de ecuaciones lineales B ! z = b: 3. Calcular x b = AT ! z: Ejemplos
1. Sean a1 ; :::; an 2 R con ai 6= 0;
i = 1; :::; n; b 6= 0: Consideramos la ecuación a1 x1 + ::: + an xn = b:
Esta ecuación admite una in…nidad de soluciones. Resolvemos el problema en norma mínima. ! Ponemos A = (a1 ; :::; an ) ; b = b; ! x T (x1 ; :::; xn ) 2 Rn : Entonces ! A! x = b , a1 x1 + ::: + an xn = b: Se tiene
2
3 a1 n 6 .. 7 X 2 T B = AA = (a1 ; :::; an ) 4 . 5 = ai : i=1 an
La solución de la ecuación Bz = b es z =
b
n P
i=1
2
: Luego a2i 2
3
a1 6 6 6 .. 7 b x b=A z=4 . 5 n =6 P 2 6 4 ai an T
i=1
a1 b n P a2i
i=1
.. .
an b n 2 P =1 ai i
Por ejemplo la solución de la ecuación x + 2y + z = 1 esb xT =
3
7 7 7: 7 5
1 1 1 6; 3; 6
:
6.11. CONDICIONAMIENTO.
393 3x + y + z = 1 Tenemos A = x + y + 2z = 0:
2. Consideramos el sistema de ecuaciones lineales 2 3 3 1 ! 1 b = . Luego AT = 4 1 2 5 ; 0 1 1
2
3 1 1 1 1 2
B = AAT =
! La solución del sistema de ecuaciones B ! z = b : 11 0 0 6 es ! zT =
1 1 11 ; 6
:
2
3 Entonces x b = AT ! z =4 1 1
6.11.
3 1 2 5 2
z1 z2 2
1 11 1 6
=4
7 66 17 66 28 66
3 1 1 5= 2
3 4 1 1
=
1 0
11 0 0 6
3 1 1 1 1 2
;
:
;
3
5:
Condicionamiento.
! Sean A 2 Mn n [R] una matriz invertible, b 2 Rn . Consideramos el problema (P) siguiente: hallar ! ! x 2 Rn solución del sistema de ecuaciones lineales A! x = b: ! En general, los coe…cientes de la matriz A y los componentes del vector b son redondeados antes de ingresar al computador. Esto hace que no tratemos el problema (P) sino el sistema de ecuaciones lineales ex = eb; de donde A e es la matriz obtenida de A por redondeo de sus e siguiente, llamado problema (P): Ae ! coe…cientes, eb es obtenido de b por redondeo de sus componentes. e es el de eliminación gaussiana. Usando este método, hallamos Un método aproximado para resolver (P) un vector x e que, en general, es diferente de ! x . La pregunta que nos ponemos es: ¿cómo in‡uencian estas perturbaciones en la solución del problema?.Consideramos dos casos: ! Los coe…cientes de la matriz A son números de máquina y perturbamos el vector b : ! Los componentes de vector b son números de máquina y perturbamos los coe…cientes de la matriz A. ! ! Supongamos que ! x + ! x es la solución del sistema de ecuaciones lineales A (! x + ! x) = b + b :
Las normas de matrices que utilizaremos a continuación son submultiplicativas, véase en el apéndice normas en Rn y normas de matrices. La norma k k en Rn que utilizaremos, es la norma euclídea y la norma de matrices submultiplicativa es cualesquiera. ! ! ! Puesto que A! x = b , se tiene entonces A ! x = b , o bien ! x = A 1 b : Resulta que ! b : k ! xk A 1 ! ! Como A! x = b , entonces b = kA! xk ! k xk la relación ! se mayora por kxk k ! xk k! xk
A
kjAjk k! x k : Por lo tanto el error relativo de ! x de…nido por
1
k! xk
! b A
1
kjAjk
! b ! : b
El condicionamiento de la matriz A se nota con cond (A) y se de…ne como sigue: cond (A) = A 1 kjAjk : El condicionamiento de una matriz es muy importante en la resolución de los sistemas de
394
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
ecuaciones lineales así como en el cálculo de los valores y vectores propios. La calidad de las soluciones numéricas de los sistemas de ecuaciones lineales está ligado al condicionamiento de la matriz. 1. Puesto que I = AA 1 , entonces 1 kjAjk A 1 = cond (A) : El condicionamiento de A mide la sensibilidad del error relativo de la solución del sistema de ecuaciones a cambios o perturbaciones en el ! vector b . Se dice que el sistema de ecuaciones lineales está mal condicionado si la matriz A está mal condicionada, es decir que el número cond (A) es muy grande. e la matriz perturbada de A. Consideramos los sistemas de 2. Sea A 2 Mn n [R] una matriz invertible, A ! ! ex = b : Tenemos entonces que ecuaciones A! x = b; y, Ae 0 = A! x
ex = A Ae
con lo cual
e (! A x
e ! e (! A x +A x
e x e) = A
x e) ;
A ! x:
! e A. Por la igualdad precedente, se tiene A e ! x =! x x e; A = A x = ! k xk , probemos primeramente el teorema siguiente: el error relativo ! kxk Notamos
Teorema 11 Sea B 2 Mn
n [R]
tal que kjBjk < 1. Entonces (I + B) (I + B)
1
1
1
A! x : Para estimar
existe, y
1 : kjBjk
Demostración. Sea TB : Rn ! Rn la aplicación lineal de…nida por TB = (! x ) = (I + B) ! x : Probemos ! ! ! n que el núcleo de la transformación T; esto es ker(TB ) = f x 2 R j TB ( x ) = 0 g se reduce al vector ! nulo, es decir ker (TB ) = f 0 g y de esta igualdad se deduce que TB es inyectiva: Utilizando la desigualdad jk! xk y poniendo ! y =
k! y kj
k! x
! y k ; 8! x; ! y 2 Rn ,
B! x , para ! x = 6 0 se tiene kTB (! x )k = k(I + B) ! x k = k! x + B! xk ! ! ! k x k kjBjk k x k = k x k (1
k! xk
kB ! xk
kjBjk) > 0;
pues kjBjk < 1 y k! x k > 0: Luego ker (TB ) = f0g, es decir que TB es invertible o sea TB 1 existe y como la matriz asociada a TB 1 relativa a la base canónica de Rn es (I + B) 1 . Se tiene entonces la existencia de (I + B) 1 : Probemos que
(I + B)
1
1 1 kjBjk :
Sea C = (I + B)
1
. Entonces
1 = kjIjk = kj(I + B) Cjk = kjC + BCjk kjCjk
kjBjk kjCjk = kjCjk (1
kjCjk
kjBjk) ;
kjBCjk
1 1 kjBjk :
de donde kjCjk
Teorema 12 Sea A 2 Mn n [R] no singular, B = A (I + F ), donde F 2 Mn n [R] tal que kjF jk < 1 ! ! ! y b 2 Rn : Sean ! x; ! x 2 Rn las soluciones respectivamente de A! x = b , y, B (! x + ! x ) = b . Se tiene entonces las siguientes estimaciones: i) ii)
k ! xk ! kxk
k ! xk ! kxk
kjF jk : 1 kjF jk cond (A) 1
cond (A)
kjB Ajk kjAjk
;
si cond (A) =
kjB Ajk kjAjk
< 1:
6.11. CONDICIONAMIENTO.
395
Demostración. Por de…nición de ! x y ! B ! x = b
! B! x = b B) ! x:
= (A
! x , tenemos
1!
BA
b = I
! b = I
1
BA
1
BA
1!
AA
b = (A
B) A
1!
b
Resulta que B es una perturbación de A: i. Por el teorema precedente, la matriz I + F es no singular y por hipótesis A es igualmente no singular, ! se tiene entonces que B = A (I + F ) es no singular. Además x = B 1 (A B) ! x : Entonces ! k xk B 1 (A B) : Pero k! xk B
1
(A
= 1
B Así
k ! xk k! xk
1
A
1
(I + F )
1
F;
B) = (I + F )
1
(A
B)
=
(A
B) = (I + F )
(I + F )
1
F
1
I
A
(I + F )
1
1
B = (I + F )
1
(I
(I + F ))
kjF jk : 1 kjF jk
kjF jk
kjF jk : kjF jk 1B
ii. Puesto que F = A k ! xk ! kxk
I=A
1 (B
A) ; entonces kjF jk
A
A 1 kjB Ajk 1 kjA 1 jk kjB Ajk 1 kjAjk kjB Ajk = kjB Ajk 1 kjAjk kjA jk kjAjk kjAjk 1
kjF jk 1 kjF jk A
=
1
Observe que si B es una perturbación de A tal que kjB
Ajk =
1
kjB
Ajk : Resulta que
cond (A) cond (A) 1 kjA 1 jk
kjB Ajk kjAjk
kjB Ajk : kjAjk
, entonces cond (A) =
kjAjk : kjB Ajk
! Consideremos nuevamente el problema (P): A! x = b: ! ! Se perturban los datos A y b respectivamente por A y b , lo que da un resultado perturbado ! ! ! ! ! ! x de x . Se tiene entonces (A + A) ( x + x ) = b + b : Por el teorema precedente, si kjB Ajk 1 cond (A) kjAjk > 0; y como B es una perturbación de A, esto es, B A = A, entonces 1 1 kj Ajk > 0 de donde kj Ajk < kjA 1 jk : Se prueba entonces que 1 A k ! xk k! xk
cond (A) 1
Ajk cond (A) kjkjAjk
0 @
1 ! b kj Ajk A : ! + kjAjk b
Ejemplo "x + 1000y = 1 donde " > 0; " 6= 1: Apliquemos el método de x + 1000y = 2; "x + 1000y = 1 eliminación gaussiana sin pivoting. Tenemos de donde 1 1 " 1000y = 2 1" = 2 " 1 ; Considerar el sistema de ecuaciones
y =
x =
2 (1 1
" 1 " 1 ) 1000
1 1000y = "
1000
2 " 1 (1 " 1 )1000
"
=
1
" 1 " (1
2+" " 1)
1
=
1 "
1
=
1 1
"
:
396
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
Así, para " > 0 y " 6= 1, la solución del sistema de ecuaciones es
(
1 1 ";
x= y=
1 1)
2 " (1 "
3:
10
Para " = 10
4,
calculamos la solución (e x; ye) con tres cifras de precisión: 2
y =
"
(1
1 ) 103
103 y
1
x =
" "
1
'
=
1
2
(1 103
104 9998 = ' 0;999 10 3 ; 4 3 10 ) 10 9999 103 0;999 10 3 1 0;999 10 3 = = = 10: 10 4 10 4 10 4
Apliquemos ahora el pivoting parcial. Tenemos x + 1000y = 2 () "x + 1000y = 1; de donde y = Para " = 10
1 2" ; (1 ")103
4,
con lo que x = 2
x + 1000y = 2; 1000 (1 ") y = 1 2";
1000y = 2
103
1 2" (1 ")103
1 2" 1 " :
=2
tenemos 1 2" 1 2 10 4 0;9998 = = ' 10 3 3 4 10 (1 ") 10 (1 10 ) 999;9 x = 2 103 y = 2 103 10 3 ' 2: y =
Luego x ' 2;
y ' 10
3
;
3:
La solución exacta es 1 1 = = = 1;000111 ' 1;001; " 1 10 4 0;9999 2" 1 0;0002 1 0;9998 = = ' 0;9999 (" 1) 103 (0;0001 1) 103 999;9 1
x =
1
y =
En resumen, la solución del sistema de ecuaciones lineales con " = 10 Sin pivoting :
x ' 10;
Con pivoting :
x ' 2;
Exacta :
y ' 0;999 y ' 10
x = 1;0001;
4
10
10
3
:
se indica a continuación 3
;
3
y ' 0;9999
10
3
:
Vemos que la solución con pivoting parcial es más próxima de la solución exacta. Este fenómeno se debe " 1000 al condicionamiento de la matriz A del sistema, esto es, si A = ; tenemos kAk1 = 10001; 1 1000 # " A
1
=
1 " 1 10 3 " 1
1 " 1 " 10 3 " 1
;y
A
1
1
=
1 1 ":
El condicionamiento de la matriz A está de…nido como
cond (A) = kAk1 A luego cond (A)
! 10001;
" !0
cond (A)
!
" !1
1 1
=
10001 1 "
1:
El número de condicionamiento depende de la norma de matriz elegida. Este número de condicionamiento es bastante grande lo que nos dice que la matriz A está mal condicionada. En esta clase de problemas es preciso resolver es sistema de ecuaciones lineales sea con el empleo del pivoting parcial o bien el pivoting total que mejora la precisión de la solución. Es importante también trabajar con más precisión: doble precisión y doble precisión extendida.
6.12. EJERCICIOS
6.12.
397
Ejercicios
1. Halle la solución de cada sistema de ecuaciones triangular superior. 8 8 8 x + 2y 3z 2w = 2 > > < < 10x + 3y 5z = 4 < 3x 2y + z = 0 y+z = 3 8y + 15z = 1 2y + 5z = 1 c) b) a) z + 8w =0 > : : > 5z = 3: 4z = 8: : 4w = 3: 8 8 > > > x1 + x2 + x3 + x4 = 0 > x1 + 2x2 + 2x3 x4 = 0 > > > > > > 2x + x x = 1 2x2 + 5x3 x4 = 1 2 3 4 < < 1 12 2 d) e) x3 + x4 = 1 x3 + x4 = 1 > > > > 3 7 5 > > > > 1 3 > > : : x4 = 1: x4 = 1: 5 5 2. Halle 8 > < a) > :
la solución de cada sistema de ecuaciones triangular inferior. 8 8 1 =0 x = 3 < 2;3x < 3x 5 1;5x 2y 5x + 4y = 10 c) b) x + 3y =0 : : 0;5x + 3;2y 2x 3y 4z = 2: 2x + y 6z = 0: 8 8 10x = 20;2 > > = 72 < 8x < 2x y = 30;5 3x + 9y = 93 d) e) 4x + 7y + 2z = 90;3 : > > 5x + 2y z = 15: : 5x 2;3y z + 4;5w = 185: 8 2 > 8 > x = 1 > 0;25x = 1 > > 3 > > < < 1 1;5x 0;4y =0 1;5x y =0 f) f) 4 8;2x 0;8y + 2;2z =0 > > > > > : 3;2x + 4;8y + z =0 > > 2;5x + 3;5y 3;2z 4;8w = 1: : x + 1;5y + 3z 4;5w = 1:
= 4;8 = 1;5 0;8z = 2;3
3. Con cada matriz triangular superior invertible A que se propone, aplique el método de eliminación gaussiana para calcular A 1 3 2 2 3 2 3 1 2 3 2 3 2 1 10 3 5 6 0 1 1 0 7 7: 5 5 : b) A = 4 0 8 15 5 : c) A = 6 a) A = 4 0 2 4 0 0 1 8 5 0 0 4 0 0 5 0 0 0 4 2 3 2 3 1 1 1 1 1 1 0 1 6 0 7 6 7 1 2 1 1 6 7 6 0 7 1 2 6 7 6 7 2 d) A = 6 0 0 1 1 7 : e) A = 6 7: 5 6 7 6 7 3 0 0 3 4 4 5 1 5 3 0 0 0 0 0 0 5 5 4. Aplique el método de eliminación gaussiana para calcular A 1 con cada matriz invertible que en cada item se da. 2 1 3 2 3 2 2 0 0 2;3 0 0 0 6 5 7 4 5 4 5 4 0 1;5 2 a) A = 4 1 3 0 5 : b) A = : c) A = 2 3 4 0;5 3;2 2 1 6 2 3 2 3 10 0 0 0 10 0 0 0 6 2 6 1 0 0 7 5 0 0 7 7 : e) A = 6 2 7: d) A = 6 4 4 5 4 7 2 0 4 0 2 0 5 5 2;3 1 4;5 0 2;3 0 1
triangular inferior 3 0 0 5: 0;8
5. Con cada matriz A que se da calcule det (A) : Para el efecto, aplique el método de eliminación gaussiana y transforme la matriz A en una triangular superior.
398
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES 2
1 0 4 a) A = 2 1 3 2 2
2 6 0 d) A = 6 4 3 1
3
2 0 5: 1 1 1 1 7
0 1 2 1
2
0 1 1 4 b) A = 1 3 0 5 : 2 1 5
3 1 2 7 7: 4 5 4
2
1 6 3 e) A = 6 4 4 2
3 0 0 1 1 6 1 3 1 0 7 7: c) A = 6 4 1 1 0 1 5 2 2 2 0 3 2 1 1 6 0 7 6 3 1 7 2 5 : f) A = 6 4 3 2 0 5 3 4 1 4 1 2
3
2 2 4 0
2 6. En cada item se propone un conjunto S: Calcule x b 2 S tal que kb xk2 = ! m n k! xk :
0 0 7 2
3 0 0 7 7 1 5 1
x 2S
a) S = (x; y) 2 R2 j 2x + 3y = 0 :
c) S = (x; y; z) 2 R3 j x + 2y
z=4 :
e) S = (x; y; z; w) 2 R4 j 2x + 3y f ) S = (x; y; z; w) 2
R4
jx
b) S =
(x; y) 2 R2 j 4x
1 y= 4
1 :
d) S = (x; y; z) 2 R3 j 2x + 3y
2z + w =
z=5 :
2 :
2y + z + 2w = 10 :
! 7. En cada item se da un sistema de ecuaciones lineales A! x = b : Aplicar el método de Crout para factorar A en (la forma A = LU: Veri…que el resultado. Resuelva el sistema de ecuaciones ! L! y = b lineales equivalente : Veri…que que ! x es solución del sistema de ecuaciones propuesto. ! ! Ux = y Contabilice el número de operaciones elementales que realiza. 8 8 2z = 8 < x < 2x + 2y 2z = 10 ! ! 2x + y z = 15 3x + 4y 7z = 2 a) x T = (4; 5; 2) : b) x T = (3; 7; 5) : : : 3x y 10z = 27; 4x + 4y + 4z = 60; 8 < 3x 3y + 6z = 18 ! x + y + 8z = 2 c) x T = (1; 5; 1) : : x 4z = 3; 8 x + 2y + 3z + 4w = 34 > > < x + 4y + 7z + 10w = 62 ! d) x T = (10; 6; 4; 0) : x + 4y + 10z + 16w = 74 > > : x + 4y + 10z + 20w = 74; 8 4x + + 20w = 48 > > < y z + 3w =5 ! d) x T = ( 3; 2; 2; 3) : -2y + 5z 12w = 22 > > : 3x + 3y 2z + 21w = 44; 8 2x1 + 2x2 + 8x3 6x4 = 10 > > > > x1 + 2x2 + 5x4 = 1 < ! 3x2 + 16x3 + 28x4 = 16 f) x T = ( 1; 0; 1; 0; 1) : > > 5x2 + 26x3 + 44x4 = 26 > > : 2x1 2x2 + 32x3 + 45x4 + 2x5 = 33; 8 2x1 + 4x2 6x3 + 8x4 + 16x5 = 26 > > > > 2x + 5x 8x3 + 8x4 + 15x5 = 24 < 1 2 ! 2x1 + 2x2 x3 + 8x4 + 20x5 = 33 g) x T = (2; 1; 1; 1; 1) : > > 2x1 + 7x2 10x3 + 11x4 + 20x5 = 32 > > : 2x1 + 5x2 + 5x3 + 10x4 + 24x5 = 48; 8. En cada literal se da una matriz A: Pruebe que A no se factora en la forma LU; con L una matriz triangular inferior, U matriz triangular superior tal que uii = 1; i = 1; : : : ; n: 2 3 2 3 0 1 2 1 2 1 0 2 4 5 5: a) A = : b) A = 4 0 0 3 5 : c) A = 4 3 3 0 2 3 0 2 1 7
6.12. EJERCICIOS 2
d) A = 4
2 1 4
399 1 1 3
3
1 1 5: 1
2
1 6 3 e) A = 6 4 4 2
2 2 4 0
1 3 2 4
3 1 1 7 7 0 5 1
! 9. Aplicar el método de Choleski para factorar la matriz A del sistema A! x = b en ( de ecuaciones ! LT ! y = b T la forma A = L L: Resuelva el sistema de ecuaciones equivalente : Compare con el L! x =! y vector ! x que se propone. Contabilice el número de operaciones elementales que realiza. 8 8 < 4x + 6y + 8z = 8 < x + 2y + 3z = 10 ! ! 6x + 10y + 12z = 10 2x + 5y + 5z = 19 x T = (5; 2; 5) x T = (2; 1; 2) : b) a) : : 8x + 12y + 80z = 336; 3x + 5y + 11z = 33; 8 x + y + z + w=5 > > < x + 5y + 5z + 5w = 9 ! c) x T = (4; 1; 1; 1) : x + 5y + 14z + 14w = 9 > > : x + 5y + 14z + 30w = 25; 8 16x1 + +12x4 = 100 > > < x2 2x3 + 3x4 = 15 ! d) x T = ( 10; 0; 0; 5) : 2x + 13x 3x = 15 > 2 3 4 > : 12x1 + 3x2 3x3 + 20x4 = 20; 8 4x1 + 2x2 4x5 = 52 > > > > 2x + 2x + 3x + 5x + 5x < 1 2 3 4 5 = 52 ! 3x2 + 25x3 + 39x4 + 53x5 = 135 e) x T = (12; 7; 3; 1; 0) : > > 5x2 + 39x3 + 65x4 + 85x5 = 217 > > : 4x1 + 5x2 + 53x3 + 85x4 + 122x5 = 231; 8 4x1 + 4x2 + 2x3 + 4x4 + 4x5 + 2x6 = 0 > > > > 4x1 + 5x2 + 7x4 + 5x5 + 3x6 = 3 > > < x1 + 14x3 4x4 x6 = 5 ! f) x T = (1; 1; 0; 1; 1; 0) : 4x + 7x 4x + 22x + 11x + 5x6 = 14 > 1 2 3 4 5 > > > > 2x1 + 5x2 + 11x4 + 13x5 + 5x6 = 1 > : 2x1 + 3x2 x3 + 5x4 + 5x5 + 28x6 = 1;
10. En cada item se da una matriz A: Determine AT A: Aplique el método de eliminación gaussiana para determinar los rangos R (A) y R AT A de las matrices A y AT A: Compruebe que R (A) = R AT A es el que se indica. 3 2 3 2 1 1 5 4 0 1 3 5 ; R (A) = 2: 3 5 ; R (A) = 3: b) A = 4 1 3 a) A = 4 1 2 0 1 2 0 1 2 2 3 2 3 1 2 3 1 1 2 1 4 5 4 c) A = 2 1 1 1 ; R (A) = 3: d) A = 1 0 3 5 ; R (A) = 2: 1 1 1 0 1 1 2 2 3 2 3 2 1 2 1 2 1 1 5 ; R (A) = 3: e) A = 4 3 2 2 5 ; R (A) = 3: f ) A = 4 2 5 5 4 3 3 2 1 2 3 2 3 1 2 1 1 2 1 1 6 3 2 3 1 7 7 ; R (A) = 3: 4 1 1 1 5 ; R (A) = 2: h) A = 6 g) A = 4 4 4 2 0 5 4 3 1 2 0 4 1 3 2 3 2 2 1 0 1 6 0 0 6 0 6 1 1 2 7 0 7 7 ; R (A) = 3: 7 ; R (A) = 4: j) A = 6 2 5 i) A = 6 4 3 1 2 4 5 4 3 3 7 5 1 7 1 4 4 1 2
400
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
! 11. En cada item se propone un sistema de ecuaciones lineales A! x = b : Estudie a la matriz A del sistema para determinar si es estrictamente diagonalmente dominante, simétrica, de…nida positiva, monótona, etc. Aplique el método de eliminación gaussiana, el de factorización de Crout LU y siempre que sea posible el de Choleski LT L y halle la solución del sistema. Contabilice el número de operaciones elementales que realiza con cada método. 3 2 3 32 2 2 x1 2 1 0 0 7 6 x2 7 6 3 7 !T 6 1 2 1 0 7 = 6 7 ; x = (5; 8; 8; 5) : 76 a) 6 4 0 1 2 1 5 4 x3 5 4 3 5 2 x4 0 0 1 2 2 32 3 2 3 4 1 0 0 x1 11 6 1 4 6 7 6 7 1 0 7 7 6 x2 7 = 6 6 7 ; ! b) 6 x T = (2; 3; 4; 2) : 4 0 1 4 5 4 5 4 1 x3 17 5 0 0 1 4 x4 12 3 3 2 32 2 16 x1 5 1 1 0 0 7 6 14 7 6 6 1 5 1 1 0 7 7 !T 6 7 6 x2 7 6 7 ; x = (2; 3; 3; 2; 1) 7 7 6 6 22 1 1 7 6 x3 7 == 6 c) 6 1 1 6 7 6 5 4 5 4 4 0 0 10 5 x4 1 6 1 8 x5 0 0 0 1 6 32 3 2 3 2 x1 3 1 0 0 0 11 6 7 6 1 3 7 6 1 0 0 7 7 6 x2 7 6 4 7 !T 6 7 6 6 7 6 1 3 1 0 7 6 x3 7 = 6 1 7 d) 6 0 7 ; x = (5; 4; 3; 4; 5) : 4 0 0 1 3 1 5 4 x4 5 4 4 5 0 0 0 1 3 11 x5 32 2 3 3 2 x1 5 2 1 0 0 12 6 2 5 1 0 0 7 6 x2 7 6 9 7 76 6 7 !T 7 6 76 7 7 6 e) 6 6 1 1 5 2 1 7 6 x3 7 = 6 1 7 ; x = ( 2; 1; 0; 1; 2) : 4 0 0 2 5 1 5 4 x4 5 4 7 5 0 0 0 1 5 x5 11 32 3 2 3 2 1 4 1 0 0 0 x1 29 2 1 6 1 5 6 7 6 7 1 0 0 7 2 6 1 7 6 x2 7 6 21 7 1 6 7 6 7 6 1 6 1 0 7 6 x3 7 6 13 7 T 2 2 7; ! =6 f) 6 1 76 1 6 0 7 7 x = (10; 8; 6; 6; 8; 10) : 1 7 1 x 19 6 6 7 2 2 76 4 7 1 4 0 0 1 8 1 5 4 x5 5 4 45 5 2 1 0 0 0 1 9 x6 79 2 12. Sea A = (aij ) 2 Mn n [R] que satisface las dos condiciones siguientes: aij = 0 si ji jj > 2 para ! i; j = 1; : : : ; n y que aii > jai i 2 j + jai i 1 j + jai i+1 j + jai i+2 j ; i = 1; : : : ; n; b 2 Rn : ! a) Demuestre que el sistema de ecuaciones A! x = b tiene una única solución.
e de n b) De…na una matriz A
5 de modo que contenga la información relevante de la matriz A:
e para elaborar un algoritmo para c) Aplique el método de eliminación gaussiana y la de…nición de A ! hallar la solución del sistema de ecuaciones A! x = b: e para escribir un algoritmo para hallar la solución d) Aplique el método de factorización LU y A ! ! e yU e apropiadas de modo que se reduzca del sistema de ecuaciones A x = b : De…na matrices L signi…cativamente el número de elementos a almacenar.
e) Suponga adicionalmente que A es simétrica, ¿ es A de…nida positiva? En caso de ser, aplique la e para elaborar un algoritmo que permita calcular factorización de Choleski LT L y la de…nición de A ! ! la solución del sistema de ecuaciones A x = b :
6.13. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
401
f ) Considere el sistema de ecuaciones lineales siguiente: 2 6 6 6 6 4
4 1 1 0 0
1 5 1 1 0
1 1 5 1 1
0 1 1 4 1
0 0 1 1 3
32 76 76 76 76 54
x1 x2 x3 x4 x5
3
2
7 6 7 6 7=6 7 6 5 4
5 10 25 4 4
3 7 7 7 7 5
e y aplique sus algoritmos para hallar la solución Veri…que las hipótesis de la matriz A: De…nida A ! T de dicho sistema y compare con x = (2; 5; 8; 5; 3) :
13. Considere el sistema de ecuaciones lineales siguiente: 32 2 4 2 2 0 0 6 2 10 2 6 3 0 7 76 6 6 2 2 18 3 6 4 7 76 6 5 4 0 4 3 3 18 3 0 0 4 3 18
x1 x2 x3 x4 x5
3
2
7 6 7 6 7=6 7 6 5 4
6 21 96 66 7
3
7 7 7: 7 5
a) Demuestre que la matriz A de este sistema es simétrica, de…nida positiva y estrictamente diagonalmente dominante. b) Aplique los métodos de eliminación gaussiana, factorización LU de Crout y de Choleski para hallar la solución de tal sistema. Contabilice con cada método el número de operaciones elementales. Compare la solución con ! x T = (0; 2; 5; 3; 1) : 2 14. Considere el conjunto S que se de…ne. Halle x b 2 S tal que kb xk2 = ! m n k! xk : x 2S
a) S =
! x = (x; y; z) 2 R3 j
x+y z =1 2x y + z = 2:
b) S =
! x = (x; y; z) 2 R3 j
2x x
:
y+z =0 2z = 1:
x z=2 : 2y + 3z = 1: n !o d) S = ! x T = (x; y; z; w) 2 R4 j A! x = b ; donde A = c) S =
! x = (x; y; z) 2 R3 j
n !o e) S = ! x T = (x; y; z; w) 2 R4 j A! x = b ; con A =
6.13.
2 1 0 1 0 1 1 1 2 0
1 1 1 2
1 1 ;
;
! b =
! b =
0 1 1 1
:
Lecturas complementarias y bibliografía
1. Owe Axelsson, Iterative Solution Methods, Editorial Cambridge University Press, Cambridge, 1996. 2. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 3. Richard H. Bartels, John C. Beatty, Brian A. Barsky, An Introduction to Splines for use in Computer Graphics and Geometric Medeling, Editorial Morgan Kaufmann Publishers, Inc., San Mateo, California, 1987. 4. Jérõme Bastien, Jean-Noël Martin, Introduction à L’Analyse Numérique, Editorial Dunod, París, 2003. 5. Abraham Berman, Robert J. Plemmons, Nonnegative Matrices in the Mathematical Sciences, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia,1994. 6. Rajendra Bhatia, Matrix Analysis, Editorial Springer-Verlag, New York, 1997.
402
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
7. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 8. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 9. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 10. P. G. Ciarlet, Introduction á L’Analyse Numérique Matricielle et á l’Optimisation, Editorial Masson, París, 1990. 11. Elaine Cohen, Richard F. Riesenfeld, Gershon Elber, Geometric Modeling with Splines, Editorial A. K. Peters, Natick, Massachusetts, 2001. 12. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 13. James W. Demmel, Applied Numerical Linear Algebra, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1997. 14. J. E. Dennis, Jr., Robert B. Schnabel, Numerical Methods for Unconstrained Optimization and Nonlinear Equations, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1996. 15. V. N. Faddeva, Métodos de Cálculo de Algebra Lineal, Editorial Paraninfo, Madrid, 1967. 16. Francis G. Florey, Fundamentos de Algebra Lineal y Aplicaciones, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1980. 17. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 18. Stephen H. Friedberg, Arnold J. Insel, Lawrence E. Spence, Algebra Lineal, Editorial Publicaciones Cultural, S. A., México, 1982. 19. Noel Gastinel, Análisis Numérico Lineal, Editorial Reverté, S. A., Barcelona, 1975. 20. M. K. Gavurin, Conferencias sobre los Métodos de Cálculo, Editorial Mir, Moscú, 1973. 21. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 22. Gene H. Golub, Charles F. Van Loan, Matrix Computations, Second Edition, The Johns Hopkins University Press, Baltimore, 1989. 23. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991. 24. I. N. Herstein, J. Winter, Algebra Lineal y Teoría de Matrices, Grupo Editorial Iberoamericana, México, 1989. 25. Nicholas J. Higham, Accuracy and Stability of Numerical Algorithms, Editorial Society for Industrial and Applied Mathematics, Philadelphia, 1996. 26. Kenneth Ho¤man, Ray Kunze, Algebra Lineal, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1987. 27. Franz E. Hohn, Algebra de Matrices, Editorial Trillas, México, 1979. 28. Roger A. Horn, Charles R. Johnson, Matrix Analysis, Editorial Cambridge University Press, Cambridge, 1999.
6.13. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
403
29. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 30. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 31. Roland E. Larson, Bruce H. Edwards, Introducción al Algebra Lineal, Editorial Limusa, Noriega Editores, México, 1995. 32. P. Lascaux, R. Théodor, Analyse Numérique Matricielle Appliquée à l’Art de l’Ingénieur, Tome 1, Editorial Masson, París, 1986. 33. P. Lascaux, R. Théodor, Analyse Numérique Matricielle Appliquée à l’Art de l’Ingénieur, Tome 2, Editorial Masson, París, 1987. 34. Charles L. Lawson, Richard J. Hanson, Solving Least Squares Problems, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1995. 35. L. Lebart, A. Morineau, J.-P. Fénelon, Tratamiento Estadístico de Datos, Editorial Marcombo Boixareu Editores, Barcelona, 1985. 36. Peter Linz, Theoretical Numerical Analysis, Editorial Dover Publications, Inc., New York, 2001. 37. Rodolfo Luthe, Antonio Olivera, Fernando Schutz, Métodos Numéricos, Editorial Limusa, México, 1986. 38. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 39. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 40. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 41. Ben Noble, James W. Daniel, Algebra Lineal Aplicada, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1989. 42. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 43. Fazlollah Reza, Los Espacios Lineales en la Ingeniería, Editorial Reverté, S. A., Barcelona, 1977. 44. A. A. Samarski, Introducción a los Métodos Numéricos, Editorial Mir, Moscú, 1986. 45. Michelle Schatzman, Analyse Numérique, Inter Editions, París, 1991. 46. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 47. M. Sibony, J. Cl. Mardon, Analyse Numérique I, Systèmes Linéaires et non Linéaires, Editorial Hermann, París, 1984. 48. Helmuth Späth, One Dimensional Spline Interpolation algorithms, Editorial A. K. Peters, Wellesley, Massachusetts, 1995. 49. G. W. Stewart, Matrix Algotithms, Volume I: Basic Decomposition, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1998. 50. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 51. Gilbert Strang, Algebra Lineal y sus Aplicaciones, Editorial Fondo Educativo Interamericano, México, 1982. 52. V. Voïévodine, Principes Numériques D’Algèbre Linéaire, Editions Mir, Moscú, 1976.
404
CAPÍTULO 6. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES LINEALES
53. E. A. Volkov, Métodos Numéricos, Editorial Mir, Moscú, 1990. 54. David S. Watkins, Fundamentals of Matrix Computations, Editorial John Wiley & Sons, New York, 1991
Capítulo 7
Métodos iterativos Resumen En este capítulo se introducen dos amplios temas de sistemas de ecuaciones lineales y no lineales. Se comienza con los sistemas de ecuaciones no lineales. Nos limitados a la aplicación del método de Newton. Este a su vez requiere del conocimiento de la diferencial de Fréchet y sus propiedades, de las aplicaciones contractivas y por supuesto del teorema de Banach del punto …jo. A continuación volvemos a tratar los sistemas de ecuaciones lineales, pero esta vez con la mira de los métodos iterativos más conocidos como son el método de Jacobi, de Gauss-Seidel y SOR.
7.1.
Diferencial de Fréchet. Propiedades
En esta sección de…niremos la diferencial de Fréchet, sus propiedades más importantes y daremos algunas aplicaciones. De…nición 1 Sean V; W dos espacios normados con normas k kV ; k kW ; un abierto no vacío de V; F una función de en W: i. Se dice que F es diferenciable en a 2 si y solo si existe Ta 2 L (V; W ) tal que F (a + h)
F (a) = Ta (h) + R (a; h) ;
kR (a; h)kW = 0: h!0 khkV
con l m
En tal caso se dice que Ta es la diferencial de F en a que se le denota Df (a) : ii. Se dice que F es diferenciable en si F es diferenciable en cada punto de : La aplicación Ta 2 L (V; W ) se le denomina aplicación diferencial de F en a, o diferencial de Fréchet de F en a: Note que si ; 2 R; h1 ; h2 2 V se tiene Ta ( h1 + h2 ) = Ta (h1 )+ Ta (h2 ) ; es decir la linealidad de Ta : Por otro lado, Ta es continua, esto es, existe Ma > 0 tal que kTa (x)kW Ma kxkV 8x 2 V; donde Ma = kTa kL(V;W ) = Sup kTa (x)kW = kDf (a)kL(V;W ) : kxkV
1
Si los espacios vectoriales V; W son de dimensiones …nitas m y n respectivamente, V = fv1 ; : : : ; vm g ; W = fw1 ; : : : ; wn g son las bases canónicas de V y W; la matriz asociada a la aplicación lineal Ta relativa a las bases V y W se le nota [Ta ] W : Esta matriz, por abuso de lenguaje, se le nota DF (a) de modo V que Ta (x) = DF (a) x 8x 2 V: n m n Particularmente, si V n= Rm ; W = o R ; las bases canónicas de R y R las designamos con m = ! ! f! e 1; : : : ; ! e m g ; n = f 1 ; : : : ; f n y las normas son la euclídea en cada espacio, el espacio L(Rm ; Rn ) es isomorfo al espacio de matrices Mn m [R]; es decir que cada elemento de L(Rm ; Rn ) se identi…ca con una matriz apropiada de Mn m [R]:
405
406
CAPÍTULO 7. MÉTODOS ITERATIVOS
Ejemplos 1. Sea un intervalo abierto de R; F una función de en Rn : Supongamos F = (f1 ; : : : ; fn ) donde las funciones fi i = 1; : : : ; n son funciones reales de…nidas en y derivables en a 2 : Se supone que R está provisto de la norma j j y Rn de la norma euclídea k k : La existencia de fi0 (a) i = 1; : : : ; n implica fi (a + h) fi (a) = fi0 (a) h + Ri (a; h) con Ri (a; h)
! 0
h!0 (f10 (a) h; : : : ; fn0 (a) h)
i = 1; : : : ; n, lo que conduce a de…nir Ta 2 L (R; Rn ) como Ta (h) = 8h 2 R: Claramente Ta es lineal continua. Además, F (a + h)
F (a) = Ta (h) + R (a; h)
kR (a; h)k = 0: Resulta que la representación h!0 jhj matricial de Ta es DF (a) = (f10 (a) ; : : : ; fn0 (a)) : Note que donde R (a; h) = (R1 (a; h) ; : : : ; Rn (a; h)) ; y l m
F (a + h)
F (a) = Ta (h) + R (a; h) () fi (a + h)
fi (a) = fi0 (a) h + Ri (a; h) i = 1; : : : ; n:
2. Sean un abierto de Rn ; F una función de en R; esto es, F un campo escalar de…nido en @F ! ! a 2 R: Recordemos que ( a ) está de…nido como sigue @xi @F ! F (! a + h! e i) (a)= lm h!0 @xi h
F (! a)
: Sea
;
siempre que el límite exista. Además, el gradiente de F en a se de…ne como @F ! @F ! ( a );:::; (a) : @x1 @xn D ! !E ! ! Se de…ne Ta 2 L (Rn ; R) como sigue: T! h = rF ( a ) ; h 8 h 2 Rn ; donde h ; i denota el a producto escalar en Rn : La linealidad y la continuidad de T! a se veri…can inmediatamente. Se tiene rF (! a)=
T! a
! h
! krF (! a )k h
! 8 h 2 Rn :
! n La representación matricial de T! a respecto de la base canónica de R es rF ( a ) : Resulta D ! !E ! ! ! ! F a + h F ( a ) = rF ( a ) ; h + R ! a; h ! con R ! a; h
! 0: Luego, la diferencial de Fréchet está de…nida como
! h !0
T! a
D ! !E ! h = rF (! a ); h 8 h 2 Rn :
3. Sean un abierto de Rm ; F una función de en Rn ; es decir, F es un campo vectorial. Ponemos F T = (f1 ; : : : ; fn ) al vector transpuesto de F donde fi i = 1; : : : ; n es un campo escalar que suponemos diferenciable en ! a 2 ; esto es, D ! !E ! fi ! a + h fi (! a ) = rfi (! a ) ; h + Ri ! a; h ! Ri ! a; h con ! lm ! h !0 h m
T! a 2
L (Rm ; Rn )
= 0: Se de…ne T! a
! h
2 D
6 6 = 6 4
!E rf1 (! a ); h .. . D !E ! rf ( a ) ; h n
3 7 7 7 5
! 8 h 2 Rn : Entonces
m pués es lineal continua. La matriz de T! a asociada a las bases canónicas de R y
7.1. DIFERENCIAL DE FRÉCHET. PROPIEDADES
407
Rn es la matriz jacobiana 2
@f1 ! @f1 ! (a) (a) 6 @x1 @xm 6 .. DF (! a)=6 . 6 4 @fn @fn ! ! (a) (a) @x1 @xm
Resulta ! F ! a; h
donde ! lm como
h !0
2 D
6 6 F (! a)=6 4
! R ! a; h ! h
n
!E rf1 (! a ); h .. . D !E ! rf ( a ) ; h n
3
2
7 6 7 6 7+6 5 4
3
7 7 7 2 Mn 7 5
! R1 ! a; h .. . ! ! R a; h n
m [R] :
3
7 ! ! 7 a) h +R ! a; h 7 = DF (! 5
= 0; que muestra que la diferencial de Fréchet es el operador T! a de…nido
m
! ! h = DF (! a) h
Ta
! 8 h 2 Rn :
=8 R2 provisto de la norma euclídea k k ; f la función real de…nida en R2 como sigue: < x2 y 2 ; si (x; y) 6= (0; 0) f (x; y) = x2 + y 2 : 0; si (x; y) = (0; 0) : ! Probemos que f no es diferenciable en 0 = (0; 0) : Para el efecto, supongamos lo contrario, es decir que existe una aplicación lineal T! 2 L R2 ; R tal que 0
4. Sea
! ! f 0 + h
! ! ! ! f 0 = T! h +R 0; h 0
! ! 0; h ! h
R con !l m! h!0
= 0:
! ! ! Ponemos h = (a; b) 2 R2 con h = 6 0 : De la de…nición de f , resulta f
! ! 0 + h
f
! a2 b2 ! ! ! = T! 0 = 2 h +R 0; h : 2 0 a +b
La representación matricial de T! respecto de la base canónica de R2 lo notamos A = ( ; ) ; es 0 decir que ! a T! h =( ; ) = a + b; 0 b luego a2 b2 a2 + b2 ! ! R 0; h lm ! ! ! h!0 h
= =
a+ b+R
=
lm ! ! h!0
Pero
lm
(a;b)!(0;0)
R lm
! ! h!0
! ! 0; h ! h
p
1 2 a + b2
a2 b2 a2 + b2
a2 b2 a2 + b2
p
lm p ! ! h!0
a2 b2 ! ! ! ! 0 ; h =) R 0 ; h = 2 a + b2
a b + p a2 + b2 a2 + b2
a
b
b
a + b2
p
a2
= 0; mientras que
a
b + b2
a2
lm
(a;b)!(0;0)
no existe, en contradicción con lo supuesto.
a2
: b2 3
(a2 + b2 ) 2
no existe, luego
408
CAPÍTULO 7. MÉTODOS ITERATIVOS
Propiedades de la diferencial. Sean V; W espacios normados con normas k kV y k kW ;
un abierto de V y F una función de
en W:
Teorema 1 Si F es diferenciable en a 2 ; entonces F es continua en a: Demostración. Debemos mostrar que l m inf F (x) = F (a) : Por hipótesis F es Fréchet diferenciable en x!a
kR (a; h)kW =0 h!0 khkV =) kR (a; h)kW < " khkV luego
a 2 ; entonces existe Ta 2 L (V; W ) tal que F (a + h) F (a) = Ta (h)+R (a; h) con l m y de la existencia del límite, para " > 0; existe kF (a + h)
F (a)k
> 0 tal que khkV <
kTa (h)k + kR (a; h)kW
kTa kL(V;W ) khkV + kR (a; h)kW
kTa kL(V;W ) + " khkV
si khkV < :
Como kTa kL(V;W ) + " khk ! 0; se sigue que l m (F (a + h) h!0
h!0
F (a)) = 0 de donde F (x) ! F (a) : x!a
Teorema 2 Sean F; G funciones diferenciables en a 2 : Entonces i) F + G es diferenciable en a y D (F + G) (a) = DF (a) + DG (a) : ii)
F es diferenciable en a y D ( F ) (a) = DF (a)
8 2 R:
Demostración. Se propone como ejercicio. En el siguiente teorema se propone la conocida regla de la cadena. Teorema 3 Sean U; V; W espacios normados con normas k kU ; k kV ; k kW ; un abierto de U; F una función de en V diferenciable en a 2 ; G una función de V en W diferenciable en F (a) : Entonces G F es diferenciable en a y D (G F ) (a) = DG (F (a)) DF (a) : Demostración. Por la diferenciabilidad de F en a 2 ; existe Sa 2 L (V; W ) tal que F (a + h) kRF (a; h)kV Sa (h) + RF (a; h) con l m = 0; de donde kRF (a; h)kV ! 0: h!0 khkU khkV !0
F (a) =
Sea y = F (a) : Por la diferenciabilidad de G en y; existe Ty 2 L (V; W ) tal que G (y + k) con l m
k!0
G (y) = Ty (k) + RG (y; k)
kRG (a; h)kW = 0 o bien kRG (y; k)kW kkkV
! 0:
kkkV !0
Por lo tanto, de la de…nición de composición de funciones, se tiene (G F ) (a + h)
(G F ) (a) = G (F (a + h))
G (F (a))
y como F (a + h) = F (a) + Sa (h) + RF (a; h) ; se tiene G (F (a + h)) = G (F (a) + Sa (h) + RF (a; h)) : Ponemos k = Sa h + RF (a; h) : Entonces kkkV = kSa (h) + RF (a; h)kV
kSa kL(U;V ) khkV + kRF (a; h)kV
! 0:
khk V
Resulta G (F (a + h)) = G (y + k) = G (y) + Ty (k) + RG (y; k) = G (F (a)) + Ty (Sa (h) + RF (a; h)) + RG (y; k) : Por la linealidad de Ty ; se tiene Ty (Sa (h) + RF (a + h)) = Ty (Sa (h)) + Ty (RF (a; h))
7.1. DIFERENCIAL DE FRÉCHET. PROPIEDADES
409
y de esta igualdad, se obtiene (G F ) (a + h) = F (F (a)) + Ty (Sa (h)) + Ty (RF (a; h)) + RG (y; k) de donde (G F ) (a + h) Es claro que Ty
(G F ) (a) = (Ty
Ta ) (h) + Ty (RF (a; h)) + RG (y; k) :
Ta 2 L (U; W ) : Probemos que l m inf h!0
kTy (RF (a; h)) + RG (y; k)kW = 0: khkv
Por la desigualdad triangular, se tiene kTy (RF (a; h)) + RG (y; k)kW
kTy (RF (a; h))kW + kRG (y; k)kW
kTy kL(V;W ) kRF (a; h)kV + kRG (y; k)kW
y como kRG (y; k)kW = Note que
kRG (y; k)kW kkkV
kRG (y; k)kW kkkV kkkV
kRG (y; k)kW kkkV
kSa kL(U;V ) khkV + kRF (a; h)kV
! 0:
khkV !0
! 0; consecuentemente
k!0
kTy (RF (a; h)) + RG (y; k)kW
kTy kL(V;W ) kRF (a; h)kV + kRG (y; k)kW
! 0
khkV !0
y de la existencia de este límite resulta que G F es diferenciable en a: Además la diferencial de Fréchet de G F en a esta de…nido como DG (F (a)) DF (a) : Una aplicación de la regla de la cadena se la da para probar la fórmula de los incrementos …nitos de Lagrange que se propone a continuación. De…nición 2 Sea
V: Se dice que
es convexo si 8 2 [0; 1]; 8x; y 2 ; se tiene x+(1
Teorema 4 Sean V; W espacios normados provistos de las normas k kV y k convexo de V; y F una función diferenciable en todo punto a 2 : Entonces Z 1 F (x) F (a) = D(F (a + (x a))d (x a) 8x 2 :
kW ;
)y 2 : un abierto
0
Demostración. Sean a 2 G0 ( ) = x a:
y G( ) = a + (x
a)
8 2 [0; 1]: Se tiene G(0) = a; G(1) = x
Sea H la función de [0; 1] en W de…nida como H( ) = (F
y
G)( ) = F (G( )) 8 2 [0; 1]: Resulta
Teorema 5 Demostración. H(0) = F (a); H(1) = F (x), y por hipótesis F es Fréchet diferenciable en todo punto a 2 ; por la regla de la cadena, se tiene H 0 ( ) = DF (G( ))G0 ( ) = DF (G( ))(x de donde F (x)
F (a) =
Z
0
1
H 0 ( )d =
Z
0
a)
1
DF (a + (x
a))d (x
a):
410
7.2.
CAPÍTULO 7. MÉTODOS ITERATIVOS
Aplicaciones contractivas y lipschisianas.
Sean V un espacio vectorial de dimensión …nita provisto de la norma k k; E un subconjunto cerrado de V . El conjunto E con la métrica de…nida como d(x; y) =k x y k 8x; y 2 E; es un espacio métrico completo, esto es, toda sucesión de Cauchy en E es convergente en el espacio normado V . Como E V , E 6= ;, el par (E; d) es un espacio métrico y siendo E cerrado, se prueba que toda sucesión de Cauchy en E es convergente en E, con lo cual (E; d) es un espacio métrico completo. El conjunto E = ]0; 1] R no es cerrado. La sucesión (xn ) E con xn = n1 n = 1; 2; : : :, es una sucesión de Cauchy en E que no es convergente en E, pues l m xn = 0 2 = E. Luego (E; d) es un espacio métrico n!1 que no es completo. En esta sección tratamos una clase de funciones denomimadas contractivas y lipschisianas de…nidas de E en E: De…nición 3 Sean E V , E 6= ; y T de E en E una función. Se dice que T es una aplicación contractiva en E si y solo si satisface la siguiente propiedad: 9k; 0
k < 1 tal que k T (x)
T (y) k
kkx
yk
8x; y 2 E.
La constante k de la de…nición precedente es independiente de x e y.
De…nición 4 Sean E V , E 6= ; y T de E en V una función. Se dice que T es una aplicación lischisiana en E si y solo si satisface la siguiente propiedad: 9k > 0 tal que k T (x)
T (y) k
kkx
yk
8x; y 2 E.
La constante k de la de…nición precedente es independiente de x e y. Como consecuencia inmediata de la de…nición se tiene que toda aplicación contractiva es uniformemente continua. El recíproco, en general, no es cierto. Sea T una aplicación contractiva y " > 0. De la de…nición se sigue que existe k, 0 8x; y 2 E, k T (x)
T (y) k
kkx
k < 1 tal que
y k< ":
" Elegimos = (k 6= 0). Entonces k x y k< )k T (x) T (y) k< ": Observe que k de x e y. Además, si k = 0 se deduce que T es constante en E.
> 0 es independiente
Por otro lado, si T es contractiva se tiene k T (x) T (y) k k x y k 8x; y 2 E.ya que 0 k < 1, pero puede suceder esto último sin ser contractiva se verá en un ejemplo propuesto más adelante. Teorema 6 Sea T de E en E una función Fréchet diferenciable y lipschisiana: Entonces k DT (x) k= sup k Tx (h) k k < 1 8x 2 E: khk 1
Si el conjunto E es convexo y k DT (x) k
k < 1 8x 2 E: Entonces T es lipschisiana.
Demostración. Por hipótesis T es Fréchet diferenciable en a 2 E, en consecuencia existe DT (a) 2 L(V ) tal que T (a + h) T (a) DT (a)(h)=R(a; h) con k R(a; h) k " k h k ! 0 con " > 0 arbitrario. Por otro lado, T es lipschisiana, luego existe k 2 [0; 1[ tal que k T (x)
T (y) k
kkx
yk
8x; y 2 E:
7.2. APLICACIONES CONTRACTIVAS Y LIPSCHISIANAS.
411
Entonces k
DT (a) kL(V ) = sup k T (a + h)
T (a)
khk 1
sup (k T (a + h) khk 1
R(a; h) k
T (a) k + k R(a; h) k)
sup (k k h k +" k h k) = k + "
khk 1
De la arbitrariedad de " > 0 se sigue que k DT (a) kL(V ) = sup k Tx (h) k khk 1
k < 1 a 2 E:
Por la fórmula de los incrementos …nitos de Lagrange, se tiene F (x)
F (y) =
Z
1
D(F (y + (x
y))d (x
y) 8x; y 2 ;
0
luego k
Z 1 D(F (y + (x y))d (x F (x) F (y) kV k 0 Z 1 D(F (y + (x y))d kL(V ) k x y kV k 0 Z 1 k D(F (y + (x y)) kL(V ) d k x y kV 0 Z 1 kd k x y kV = k k x y kV 8x; y 2 V;
y) kV
0
que muestra que F es lipschisiana. Note que se requiere de la convexidad de
:
De…nición 5 Sean E V , E 6= ; y T de E en E una función. Un punto x b 2 E se dice un punto …jo de T si veri…ca la condición T (b x) = x b:
Teorema de Banach del punto …jo.
El teorema de Banach del punto …jo es uno de los resultados importantes del análisis no lineal, que se aplica en la resolución de sistemas ecuaciones lineales, ecuaciones en derivadas parciales del tipo no lineal, etc. En esta sección extendemos los resultados obtenidos en el capítulo 5. Teorema 7 (De Banach del punto …jo) Sean E V con E 6= ; y E cerrado, T de E en E una aplicación contractiva en E. Entonces, existe un único x b 2 E tal que T (b x) = x b.
Demostración. La demostración de este teorema la dividimos en dos partes. La primera que corresponde a la existencia del punto …jo x b de T y la segunda a la unicidad. Existencia. Por hipótesis T es contractiva, entonces existe k, 0 k T (x) Sea x0 2 E. De…nimos la sucesión (xn ) x1 = T (x0 ) ;
T (y) k
kkx
k < 1 tal que
y k 8x; y 2 E:
E como sigue
x2 = T (x1 ) ;
; xn+1 = T (xn )
n = 0; 1; : : :
Mostremos que la sucesión (xn ) es una sucesión de Cauchy en E. Sean m; n 2 Z+ con m > n y sea p 2 Z+ tal que = n + p. Entonces, por la desigualdad triangular, se tiene k xn
xm k=k xn
xn+p k k xn
xn+1 k + k xn+1
xn
2
k+
+ k xn+p
1
xn+p k :
412
CAPÍTULO 7. MÉTODOS ITERATIVOS
Por la de…nición de (xn ) se tiene k
xn
xn+1 k=k T (xn
= k k T (xn .. .
2)
k n k x0 Luego, k xn obtiene
xn+1 k k
xn
k n k x0
k k xn
x1 k +k n+1 k x0
k k xn xn
2
xn k
1 1
k
+ k n+p k x0
x1 k +
p
= k k x0 .. .
x1 k (1 + k +
+k )
k n k x0
x1 k 1 + k +
+ k p + k p+1 +
x1 k
:
+ k p . Entonces
k) Sp (k) = Sp (k)
kSp (k) = 1 + k +
Sp (k) =
1
kp
+ k p+1 = 1
k + k2 +
k p+1 1 = 1 k 1 k
k p+1 :
k p+1 : 1 k
k < 1, l m k p+1 = 0. Luego p!1
p!1
P1
p=0 k
Por lo tanto k xn
p
1
p!1
= l mp!1 Sp (k) =
xm k
k n k x0
que 8" > 0, 9n0 2 Z+ tal que 8n k xn
k p+1 1 k
1
l m Sp (k) = l m
con lo cual
k
2
8n 2 Z+ : Aplicando el resultado que acabamos de obtener, se
de donde
Como 0
1)
T (xn ) k
x1 k :
x1 k
xm k
n
Sea Sp (k) = 1 + k + (1
k n k x0
T (xn
1)
k
xm k
p 1
1 1
k
lm
p!1
1
k
=
1 1
k
;
1 1 k:
P1
kn p p=0 k = 1 k k x0 k n < jx10 kx1 j ": Luego
x1 k n0 ;
=
kn 1
k
k x0
x1 k< "
x1 k : Puesto que l m k n = 0 se sigue n!1
si m; n
n0 ;
es decir que (xn ) es una sucesión de Cauchy en E y por hipótesis E es cerrado, entonces la sucesión (xn ) tiene límite en E; esto es, existe x b 2 E tal que l m xn = x b: n!1
Puesto que T es contractiva, T es uniformemente continua y por lo tanto continua. Luego l m T (xn ) = T
n!1
l m xn = T (b x) :
n!1
Además, xn+1 = T (xn ), y l mn!1 xn+1 = x b,resulta que T (b x) = l mn!1 T (xn ) = l mn!1 xn+1 = x b: Así, T (b x) = x b o sea x b 2 E es un punto …jo de T . Unicidad. Probemos que x b 2 E tal que T (b x) = x b es único. Para el efecto, supongamos que existe y 2 E tal que T (y) = y. Mostremos que y = x b: Como T es contractiva, se tiene kx b
y k=k T (b x)
T (y) k
kkx b
y k;
de donde k x b y k (1 k) 0; y siendo 0 k < 1, entonces 1 k > 0 y en consecuencia k x b Como el valor absoluto es no negativo, la única posibilidad es k x b y k= 0 , y = x b:
yk
0.
Observaciones
1. El teorema de Banach del punto …jo asegura la existencia de un único punto …jo x b 2 E de la plicación contractiva T de…nida en el conjunto cerrado E de V .
7.3. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES NO LINEALES
413
2. En los textos de Análisis, el teorema de Banach del punto …jo se enuncia como sigue: Sea (E; d) un espacio métrico completo y T de E en E una aplicación contractiva. Entonces, existe un único x b 2 E tal que T (b x) = x b: La demostración del teorema de Banach del punto …jo para espacios métricos completos muy generales (E; d) es muy similar a la aquí propuesta con la salvedad que la métrica d (x; y) =k x y k x; y 2 V se remplazan simplemente por d (x; y) con d la métrica en el conjunto E.
3. En la demostración del teorema de Banach del punto …jo se muestra una manera de calcular el punto …jol x b 2 E. Pués se parte de un punto arbitrario x0 2 E y se construye la sucesión (xn ) E tal que xn+1 = T (xn ) n = 0; 1; : : :. Entonces x b = l m xn es el punto …jo de T . De este hecho se n!1
desprende que podemos aproximar el funto …jo x b con una precisión " > 0:
7.3.
Resolución numérica de sistemas de ecuaciones no lineales
! ! Sean n 2, Rn con 6= ; y F una función de en Rn . Pongamos F = (f1 ; : : : ; fn )T donde cada fi ; i = 1; : : : ; n, es una función de en R. Consideramos el problema (P) siguiente: ! hallar x b 2 , si existe, tal que F (b x) = 0:
(P)
! Note que la ecuación F (! x ) = 0 es equivalente al sistema de ecuaciones: 8 ! > < f1 ( x ) = 0 .. . > : fn (! x ) = 0:
El teorema de Bolzano no tiene validez para funciones de Rn en Rn . Asumimos que el problema (P) ! tiene solución, esto es, asumimos la existencia de al menos una solución x b 2 tal que F (b x) = 0: 1. Método de punto …jo Supongamos que
! es cerrado y que la función F se expresa en la forma ! ! F (x) =! x
! con G una aplicación contractiva en
! ! G(x)
! x 2 ;
. Entonces, ! ! ! F ( x ) = 0 , G (b x) = x b;
! es decir que x b 2 es un punto …jo de G: La sucesión (! x m ) de…nida por ! x m+1
! x0 2 ; = G (! x m) m = 0; 1; : : :
converge a x b (teorema de Banach del punto …jo).
Sea " > 0 " = 10 4 ; 10 5 ; : : : la precisión con la que se desea aproximar x b y Nmax el número máximo de iteraciones. Se tiene el siguiente algoritmo de punto …jo para aproximar soluciones de sistemas de ecuaciones no lineales. Algoritmo Datos de entrada: " precisión, Nmax número máximo de iteraciones, funciones g1 ; : : : ; gn : ! Datos de salida: n número de iteraciones, ! y solución aproximada, F (! y ):
1. ! x =! x0
414
CAPÍTULO 7. MÉTODOS ITERATIVOS 2. Par k = 0; 1; : : : ; Nmax ! ! 3. y = G (! x)
Si k! x ! y k < " continuar en 6). ! ! 5. x = y ! 6. Si k < Nmax , imprimir k; ! y ; F (! y ). Continuar en 8). 7. Si k = Nmax , imprimir ! y ; F (! y ): 4.
8. Fin. Nota: La norma k k en Rn que se considera aquí es la norma euclídea de…nida como sigue: k! ak=
n X
2
a2i
i=1
2. Método de Newton ! Supongamos que F 2 C 1 ( ) y x b2
!1
con ! a = (a1 ; : : : ; an ) 2 Rn :
! tal que F (! x ) = 0:
Por el desarrollo de Taylor en un entormo de x b, se tiene ! ! 0 = F (b x) = F (! x ) + D F (! x ) (b x
! x ) + 0 kb x
! de donde D F (! x ) es la matriz jacobiana de…nida por: 2 @f1 ! @f1 ! (x) (x) 6 @x1 @xn 6 ! ! .. .. DF (x) = 6 . . 6 4 @f (n) @f (n) (! x) (! x) @x1 @xn
3 7 7 7 7 5
2 ! xk ;
! x 2 :
! Suponemos que la matriz D F (! x ) no es singular en todo punto ! x 2 : 2 Si se desprecia el término 0 kb x ! x k en el desarrollo de Taylor precedente, se tiene ! ! ! F ( x ) + D F (! x ) (b x
! x ) = 0;
! y siendo D F (! x ) no singular, se sigue que ! D F (! x ) (b x x b
de donde
! x) =
x b=! x
! x =
! ! F (x) ! D F (! x)
! D F (! x)
1!
F (! x)
1!
F (! x)
lo que nos permite de…nir la función de iteración ' : ' (! x) =! x
! D F (! x)
! con D F (! x ) matriz no singular. El método de Newton para aproximar la raíz x b2
1!
F (! x)
! x 2 ;
de F (! x ) = 0 es el siguiente:
! x 0 2 una aproximación inicial de x b; ! ! x m+1 = ' ( x m ) m = 0; 1; : : :
Si ' es una aplicación contractiva en , por el teorema de Banach del punto …jo, la sucesión (! x m) generada por el método de Newton converge a x b:
7.3. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES NO LINEALES
415
Puesto que ! D F (! x m)
! x m+1 = ' (! x m) = ! xm
1!
F (! x m) ;
1! ! F (! x m) = ! xm ! x m+1 ; D F (! x m) ! ! D F (! x m ) (! xm ! x m+1 ) = F (! x m) :
Ponemos ! y =! xm
! x m+1 ) ! x m+1 = ! xm
! y . Se tiene
! DF (! x m) ! y = F (! x m) ;
que es un sistema de ecuaciones lineales con ! y el vector incógnita. Este sistema de ecuaciones lineales puede ser resuelto utilizando los métodos de eliminación gaussiana con pivoting, ! factorización LU, Choleski, dependiento de las propiedades de la matriz jacobiana D F (! x): 1 ! ! Debe advertirse que el cálculo directo de D F ( x m ) no se realiza. Dado ! x , para calcular la nueva aproximación ! x de x b, resolvemos el sistema de ecuaciones m
m+1
lineales
! ! D F (! x m) ! y = F (! x m) ; y una vez calculado ! y , se tiene ! x m+1 = ! xm ! y ; y, se repite el procedimiento hasta considerar ! ! ! x m tal que F ( x m ) ' 0 sea satisfactorio. Sea " > 0 la precisión con la que se aproxima x b y Nmax el número máximo de iteraciones. El esquema numérico generado por el método de Newton se presenta a continuación. Algoritmo
Datos de Entrada: "; Nmax ; funciones f1 ; : : : ; fn ;
@fi @fj
i; j = 1; : : : ; n
~ (~x) : Datos de Salida: n número de iteraciones, ~x, F 1. ~x = ~x0 2. Para k = 1; : : : ; Nmax ~ (~x) ~y = F ~ (~x) : 3. Resolver el sistema de ecuaciones DF 4. Si k~y k < ": Continuar en 6). 5. ~x = ~x
~y
~ (~x) : Continuar en 8). 6. Si k < Nmax ; imprimir: n; ~x; F ~ (~x) : 7. Si k = Nmax ; imprimir: Nmax ; ~x; F 8. Fin Ejemplo Resolver el sistema de ecuaciones no lineales
x2 y 2 = 1 (x + 3)2 + 4 (y
3)2 = 4:
Asociemos a este sistema de ecuaciones no lineales la función siguiente: ~ (x; y) = x2 F
y2
1; (x + 3)2 + 4 (y
Entonces ~ (x; y) = (0; 0) () F
3)2
x2 y 2 = 1; (x + 3)2 + 4 (y
4
(x; y) 2 R:
3)2 = 4:
El conjunto de puntos (x; y) 2 R jx2 y 2 =o1 representa una hipérbola y la ecuación el conjunto de n puntos (x; y) 2 R j (x + 3)2 + 4 (y 3)2 = 4 representa una elipse.
416
CAPÍTULO 7. MÉTODOS ITERATIVOS
En la …gura siguiente se muestran los gra…cos de la hipérbola y de la elipse.
Figura 72
Las grá…cas de la hipérbola y de la elipse se cortan en dos puntos. Por lo tanto, el sistema de ecuaciones b1 = (b b2 = (b ~ (x; y) = (0; 0) tiene dos soluciones X F x1 ; yb1 ) ; X x2 ; yb2 ) : ~ está de…nida como La matriz jacobiana de F " # @f1 @f1 @x @y ~ (x:y) = @f DF = @f 2
2
@x
@y
2x 2y 2 (x + 3) 8 (y 3)
(x; y) 2 R:
b1 = (b i. Apliquemos el método de Newton para calcular una aproximación de X x1 ; yb1 ) : 2;5 2;5
Sea ~x0 =
~ (~x0 ) ~y = F ~ (~x0 ) ; resolviendo este sistema de ecuaciones y tomando : Entonces DF
2;11 1;91 método de Newton, se obtienen los siguientes resultados: en cuenta que
~x2 =
~x1 = ~x0
2;28453 2;051495
~y ; se obtiene
;
Con una precisión " = 10
~x3 = 5,
~x1 =
2;29376 2;064322
;
~x4 =
: Continuando con la ejecución del 2;29385 2;06440
b1 = una aproximación de la solución es X
: 2;29385 2;06440
:
b2 = (b ii. Apliquemos el método de Newton para calcular una aproximación de X x2 ; yb2 ) :
4;2 : Los resultados de la aplicación del algoritmo generado por el método de Newton 3;8 se muestra a continuación. 4;00444 3;99476 3;99473 ~x1 = ; ~x2 = ; ~x3 = ; 3;87333 3;86757 3;86754
Sea ~x0 =
b1 = X
3;99473 3;86754
:
Observación p
De la ecuación x2 y 2 = 1 se deduce x = 2 2 (x + 3) + 4 (y 3) = 4: Obtenemos p de donde y4
1 + y2 + 3
2
1 + y 2 : Pongamos x =
3)2 = 4; p 24y + 42 = 6 1 + y 2 ;
+ 4 (y
5y 2
9;6y 3 + 38;4y 2
80;64y + 69;12 = 0:
p 1 + y 2 en la ecuación
7.3. RESOLUCIÓN NUMÉRICA DE SISTEMAS DE ECUACIONES NO LINEALES
417
Sea P (y) = 69;12
80;64y + 38;4y 2
9;6y 3 + y 4
= 69;12 + y ( 80;64 + y (38;4 + y ( 9;6 + y))) : Determinemos las fronteras inferior y superior donde están localizadas las raíces positivas de la ecuación P (y) = 0: Se tiene 1
R = 1 + (80;64) 3 ' 5;3203 < 5;5 1 1 = 0;46 < 0;5: r = = max jak j 1 + 80;64 60;92 k=1;:::n 1+ ja0 j Buscamos las raíces de P (y) = 0 en el intervalo [0;5; 5;5] : Con un paso h = 0;5; la aplicación del algoritmo de búsqueda del cambio de signo muestra que existen dos raíces localizadas en los intervalos [2; 2;5] y [3;5; 4] : Además, P (2) = 0;64; P (2;5) = 3;42; P (3;5) = 4;26; P (4) = 2;56: i. Cálculo de yb1 2 [2; 2;5] : La función de iteración del método de Newton está dada por ' (y) = y
P (y) P 0 (y)
Sea y0 = 2: Entonces y1 = ' (2) = 2;0625; y2 = ' (y1 ) = ' (2;0625) = 2;064402; y3 = ' (y2 ) = ' (2;064402) = 2;064404; ii. Cálculo de yb2 2 [3;5; 4] : Sea y0 = 4;
y1 = ' (y0 ) = ' (4) = 3;882353; y2 = ' (y1 ) = ' (3;882353) = 3;867753; y3 = ' (y2 ) = ' (3;867753) = 3;867541: Con una precisión " = 10
6;
yb1 = 2;064404; yb2 = 3;867541: Resulta
P (y) = (y
= (y
yb1 ) (y
2;064404) (y
= y 4 + (b
(7;98415b con lo cual
Luego
yb2 ) y 2 + by + c
3;867541) y 2 + by + c
5;93194) y 3 + (c
5;93194b + 7;98415) y 2 +
5;93194c) y + 7;98415c:
8 b 5;93194 = 9;6 > > < c 5;93194b + 7;98415 = 38;4 b = 3;66806; ) 7;98415b 5;93194c = 80;64 c = 8;65714: > > : 7;98415c = 69;12 y 2 + by + c = 0 () y 2
3;66806y + 8;65714 = 0:
418
CAPÍTULO 7. MÉTODOS ITERATIVOS
Obtenemos y3 = 1;83403
2;30076i;
y4 = y3 = 1;83403 + 2;30076i: ¿Raíces Múltiples? Acabamos de calcular todas las raíces reales o complejas de la ecuación P (y) = 0: Si únicamente hubiesemos calculado las raíces reales yb1 ; yb2 ; las dos raíces restantes podían ser complejas o una real de multiplicidad 2. Despejamos esta duda aplicando los métodos descritos en la aproximación de raíces de multiplicidad. De…nimos u (y) =
P (y) P 0 (y)
P 0 (y) 6= 0:
La aplicación del algoritmo de búsqueda del cambio de signo aplicado a la función u muestra la existencia de dos raíces yb1 2 [2; 2;5] ; yb2 2 [3;5; 4] : ¿Qué ocurre? Explique. p p p b2 = 1 + y 2 se deducen x b1 = 1 + yb12 y x 1 + yb22 : Puesto x =
7.4.
Métodos iterativos de resolución de sistemas de ecuaciones lineales
Para terminar este capítulo, en contraposición con los métodos directos de resolución de sistemas de ecuaciones lineales presentamos dos métodos iterativos, el de Jacobi y el de SOR.
7.4.1.
Métodos de Jacobi y Gauss-Seidel
! ! Sean A = (aij ) 2 Mn n [R]; b T = (b1 ; ; bn ) 2 Rn . Consideramos el sistema de ecuaciones A! x = b que en forma explícita se escribe como sigue: a11 x1 +
+ a1n xn = b1
a21 x1 +
+ a2n xn = b2 .. .
an1 x1 +
+ amn xn = b1 :
El método que vamos a describir requiere, en principio, que los coe…cientes a11 ; a22 ; : : : ; ann que conforman la diagonal de la matriz A sean distintos de cero. Veremos más adelante que se puede hacer en caso de que esto no suceda. El método de Jacobi consiste en despejar x1 de la primera ecuación, x2 de la segunda ecuación, etc.: x1 = x2 =
a12 x2 a11 a21 x1 a22
a13 x3 a11 a23 x3 a22
a1n xn + a11 a2n xn + a22
b1 ; a11 b2 ; a22
en general xi =
n X aij j=1 j6=i
aii
xj +
bi ; aii
i = 1; 2; : : : ; n:
7.4. MÉTODOS ITERATIVOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES419
! ! Sea el vector X (0) ; un vector cualquiera: X (0)
0
(0)
x1 B .. =@ .
(0)
! el vector: X (1)
0
(1)
x1 B .. =@ .
(1)
xn
xn
1
C A ; donde (1)
xi
=
n X aij j=1
aii
(0)
xj +
1
C A ; en base a las ecuaciones precedente se obtiene
bi ; aii
i = 1; 2; : : : ; n:
! (1) Con los valores obtenidos para xi y las ecuaciones en (1) se obtiene X (2) y, así sucesivamente , se ! ! obtienen X (3) ; X (4) ; : : : ; mediante la fórmula recurrente: (k+1) xj
=
n X aij j=1
aii
(k)
xj +
bi ; aii
i = 1; 2; : : : ; n:
El procedimiento anterior se expresa en forma matricial como sigue: la matriz A del sistema se descompone en la forma A = D L U; donde D es una matriz diagonal, L una matriz triangular inferior y 0 1 0 1 0 a11 a12 a13 0 0 a11 0 0 @ a21 a22 a23 A = @ 0 a22 0 A @ a21 0 a31 a32 0 0 a33 a31 a32 a33 ! El sistema A! x = b toma entonces la forma:
U una matriz triangular superior: 1 0 1 0 a12 a13 0 0 A @ 0 0 a23 A : 0 0 0 0
! (D L U ) ! x = b ! D! x (L + U ) ! x = b ! D! x = (L + U ) ! x + b ! x = D 1 (L + U ) ! x +D así,
! A! x = b () ! x =D
1
(L + U ) ! x +D
1!
b:
1!
b:
! 1. Claramente, la matriz D es no singular. Si notamos T = D 1 (L + U ) y C = D 1 b ; la ecuación ! ! x = D 1 (L + U ) ! x + D 1 b toma la forma: ! x = T! x +! c ; y la fórmula recurrente del método De Jacobi arriba formulada se expresa como: !(k+1) ! X = T X (k) + ! c;
k = 0; 1; 2; 3; : : : :
! ! La validez de X (k) como solución aproximada del sistema A! x = b está garantizada por los siguientes resultados. Recordemos que si A es una matriz cuadrada, su radio espectral absolutos de sus valores propios.
(A) es el máximo de los valores
! ! Sea A una matriz no singular. Para cualquier vector X (0) en Rn ; la sucesión de vectores X (k) por !(k+1) ! X = T X (k) + ! c ; k = 1; 2; 3; : : : ! converge a la solución del sistema A! x = b ; si y solo si (A) < 1:
k
de…nida
420
CAPÍTULO 7. MÉTODOS ITERATIVOS
Sea A una matriz cuadrada y ! x un vector (columna) de Rn ; se tiene A! x 2 Rn y tiene sentido hablar de ! ! n la norma (en R ) kA x k1 : El máximo de estas normas cuando x recorre todos los vectores de norma 1 se llama la norma k k1 de la matriz A, y está de…nida como kAk1 =
max kA! x k1 : x k1 1 k!
Se tiene que (A) Ejemplo 0
1 Si A = @ 2 0
1 0 2 A ; se tiene 1
1 3 1
(A)
kAk1 :
kAk1 = 7:
! ! Sea A una matriz no singular. Si kT k < 1; la sucesión de vectores X (k) converge a la solución X del k ! ! sistema de ecuaciones lineales A! x = b para cualquier X (0) 2 Rn : Además se satsface: ! x
!(k) X
! kT kk X (0)
! x
!(k) X
!(1) kT kk X 1 kT k
! x
k = 1; 2; : : : ; !(0) X
k = 1; 2; : : : :
! La última desigualdad nos proporciona una cota para el error de aproximación de X (k) a la solución ! x: Ejemplo Consideremos el sistema el sistema de ecuaciones lineales siguiente: 10x1 x2 + 2x3 x1 + x2 x3 + 3x4 2x1 x2 + 10x3 x4 3x2 x3 + 8x4
=6 = 25 = 11 = 15
1 0 B 0 C ! C Apliquemos el método de Jacobi. Partiendo de: X (0) = B @ 0 A ; se obtiene en la iteración k = 10 el 0 0 1 0 1 1;0001 1 B 1;9998 C B 2 C ! C : Por otra parte, la solución exacta es ! B C vector X (10) = B x = @ 0;9998 A @ 1 A : Un método que, 0;9998 1 !(k) generalmente, produce una convergencia más rápida de la sucesión X consiste en utilizar los valores 0
(k)
(k)
(k) 1
de x1 ; x2 ; : : : ; xj
(k)
(k)
=
(k)
=
(k)
=
x1
x2
x3
(k 1)
para calcular xi ; en lugar de x1 a12 (k x a11 2 a21 (k) x a22 1 a31 (k) x a33 1
1)
a13 (k x a11 3 a23 (k x a22 3 a32 (k) x a33 2
a1n (k x a11 n
1)
1)
(k 1) 1 :
; : : : ; xj
a2n (k x a22 n a32 (k x a33 4
1)
1)
+
1)
+
Así: b1 ; a11
b2 ; a22 a3n (k x a33 n
en general (k) xi
=
i 1 X aij j=1
aii
(k) xj
n X aij (k x aii j
j=i+1
1)
+
bi : aii
1)
+
b3 ; a33
7.4. MÉTODOS ITERATIVOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES421 En forma matricial este método tiene la forma ! ! (D L) X (k) = U X (k
1)
! + b;
y considerando que la matriz D L es no singulare, la ecuación precedente es quivalente a ! !(k) ! X = (D L) 1 U X (k 1) + (D L) 1 b k = 1; 2; ; o también con T = (D
L)
1
U y! c = (D
!(k) ! X = T X (k 1) + ! c; 1! L) b : Este método se conoce como el método de Gauss-Seidel.
En el ejemplo anterior, con el método de Gauss-Seidel se obtiene para la iteración k = 5 prácticamente la solución exacta: 1 0 1;0001 !(5) B 2;0000 C C X =B @ 1;0000 A : 1;000
Tanto en el métod de Jacobi como en el de Gauss-Seidel se requiere que los términos de la diagonal de la matriz A sean no nulos: a11 6= 0; a22 6= 0; : : : ; ann 6= 0: En caso de que esto no suceda, se reordenan las ecuaciones para conseguir este objetivo: El sistema: a12 x2 + a13 x3 = b1 a21 x1 + a22 x2 + a23 x3 = b2 a31 x1 + a32 x2 + a33 x3 = b3 ; es equivalente a a21 x1 + a22 x2 + a23 x3 = b2 a12 x2 + a13 x3 = b1 a31 x1 + a32 x2 + a33 x3 = b3 : Si una reordenación no es posible de tal manera que el coe…ciente de cada xi en la i-ésima ecuación sea distinto de cero la matriz A tiene determinante nulo, lo que implica que el sistema no tiene solución o tiene in…nitas soluciones.
7.4.2.
Método SOR (Successive Over-Relaxation)
! e es una Sea el sistema de ecuaciones lineales A! x = b ; donde A es una matriz cuadrada no singular. Si X aproximación de la solución del sistema, ! ! e r = b AX e El objetivo es hallar una sucesión de soluciones aproximadas de tal se llama el vector residual de X: manera que la sucesión de los vectores residuales converja a 0: ! Con relación al método de Gauss-Seidel consideremos la solución aproximada de A! x = b : (k)
(k)
(k 1)
(k)
a su vector residual. Se tiene que
x1 ; x2 ; : : : ; xi (k)
y notemos por Ri
(k)
(k)
= r1i ; r2i ; : : : ; rni
i 1 X
(k)
rii = bi
(k)
aij xj
n X
; : : : ; x(k n
1)
(k 1)
(k 1)
aij xj
aij xi
j=i+1
j=1
Como en el método de Gauss-Seidel (k) Xi
=
i 1 X aij j=1
aii
(k) xj
n X aij (k x aii j
j=i+1
1)
+
bj ; aii
:
422
CAPÍTULO 7. MÉTODOS ITERATIVOS
se tiene para i = 1; : : : ; n (k 1)
aii xi
(k)
(k)
+ rii = aii xi
o
(k)
(k)
xi
(k 1)
= xi
+
rii : aii
Modi…cando la última ecuación a: (k)
(k) xi
=
(k 1) xi
r + ! ii ; aii
i = 1; : : : ; n 0
B !(k) B se puede demostrar que para ciertas elecciones de ! positivo la convergencia del vector X = B B @
(k)
x1 (k) x2 .. . (k)
xn
1 C C C C A
! al vector solución de A! x = b es signi…cativamente más rápida. Para …nes de cálculo es conveniente expresar la relación : (k) r (k) (k 1) xi = xi + w ii aii en forma equivalente a la sigiente: (k)
xi
= (1
(k 1)
!) xi
+
o lo que es lo mismo (k) aii xi
+!
i 1 X
(k) aij xj xj
2
! 4 bi aii
i 1 X
(k)
aij xj
j=1
!
j=1
n X
3
(k 1) 5
aij xj
j=i+1
(k 1) !) aii xi
= (1
n X
(k 1)
aij xj
+ !bi ;
j=i+1
que en forma matricial corresponde a (D de donde
!(k) X = (D
Así llegamos a la forma familiar
! !L) X (k) = [(1
!L)
1
[(1
! !) D + !U ] X k
! !) D + !U ] X (k
!(k) ! X = T X (k
1)
1)
1
! +! b;
+ ! (D
!L)
1!
b:
+! c:
Ejemplos 8 < 4x1 + 3x2 3x1 + 4x2 x3 El sistema de ecuaciones: : x2 + 4x3
1 3 tiene la solución exacta ! x = @ 4 A : Por el 5 0 1 3;0134110 !(7) método de Gauss-Seidel se obtiene en la iteración 7 la solución aproximada X = @ 3;9888241 A ; 5;0027940 0 1 3;000094 ! mientras que con el método SOR se obtiene para ! = 1;25; X (7) = @ 4;0002586 A : Terminamos esta 5;0003486 sección con algunos resultados que justi…can las a…rmaciones anteriores sobre el método SOR. = 24 = 30 = 24;
0
Iniciamos con algunas de…niciones y notaciones previas. Recordemos que una matriz cuadrada A es ! de…nida positiva si ! x t A! x > 0 para todo vector columna ! x 6= 0 :
7.4. MÉTODOS ITERATIVOS DE RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES423 Los métodos de aproximación anteriores se resumen en una expresión de la forma !(k) ! X = T X (k 1) + ! c: Usaremos las notaciones TJ ; TG y TW para indicar que la matriz T se re…ere al método de Jacobi, Gauss-Seidel o SOR respectivamente. Consideremos una matriz tridiagonal siguiente: 0 a11 a12 0 : : : ::: B a21 a22 a23 0 ::: B B 0 a32 a33 a34 0 B . . . . .. A=B .. .. .. B .. . B B .. .. .. .. .. @ . . . . . 0 : : : : : : 0 an;n
0 0 0 0 1
Se tienen los siguientes resultados.
an 1;n ann
1 C C C C C C C C A
! 1. Si A es una matriz de…nida positiva y 0 < ! < 2; la sucesión X (k) del método SOR converge para ! cualquier elección de X (0) : (TG ) = [ (TJ )]2 < 1 y la elección óptima para w es
Si, además, A es tridiagonal, entonces
w= Con este valor de w,
(TW ) = w
1:
q 1+ 1
2
: [ (TJ )]2
Ejercicio resuelto ! a) Sea A una matriz tridagonal de n n estrictamente diagonalmente dominante, b 2 Rn y 1 < ! < 2: Elaborar un algoritmo para calcular la solución aproximada usando el método S.O.R. ! b) Aplique su algoritmo para hallar la solución del sistema de ecuaciones A! x = b ; donde 3 2 3 2 0 3 2 0 0 6 1 7 6 1 4 2 0 7 7 6 7; ! b = A=6 4 1 5; 4 0 2 5 2 5 0 0 0 3 5 2;
1. T ol = 10
! = 1;5 y ! x T0 = (0; 0; 0; 0) :
Solución a) Puesto que el método S.O.R. viene dado por
donde A = tenemos 2 0 6 a21 6 6 L=6 0 6 .. 4 . 0
D
2
6 6 6 !L = 6 6 4
L+D 0 0 a32 :::
U es la descomposición habitual antes indicada. Como A es tridiagonal, 0 0 0 c :::
::: ::: ::: .. . an;n
a11 0 0 !a21 a22 0 !a32 a33 .. . 0
! w) D + !U ] ! x (k) + ! b ;
!L) ! x (k+1) = [(1
(D
:::
:::
0 0 0 .. . 1
0 ::: ::: ::: .. .
!an;n
3
7 7 7 7; 7 5
1
2
6 6 6 U =6 6 6 4 0 0 0 .. .
ann
3
7 7 7 7; 7 5
0 0 .. . .. . 0
a12 0
:::
0 ::: a23 : : : .. . .. . ::: :::
3
0 0 .. . an 0
1;n
7 7 7 7 7 7 5
424
CAPÍTULO 7. MÉTODOS ITERATIVOS 2
(D
(1
[(1
!L) ! x (k+1)
(k+1)
a11 x1
6 6 !a x(k+1) + a x(k+1) 21 1 22 2 6 6 (k+1) (k+1) =6 + a33 x3 6 !a32 x2 6 .. 6 . 4 (k+1) (k+1) !an;n 1 xn 1 + ann xn 2
(1
7 7 7 7 7 7 7 7 5
!) a11 wa12 0 ::: 0 (1 !) a22 wa23 ::: 0 0 (1 !) a33 : : : .. .. . . 0 ::: ::: : : : (1
6 6 6 !) D + !U = 6 6 4
!) D + !U ] ! x (k)
3
2
(1
(k)
!a12 x2
6 6 (1 6 6 6 (1 6 =6 6 6 6 6 (1 4 (1
(k)
!a23 x3
(k)
!) a22 x2
(k)
(k)
!) a33 x3 !) an
1;n (k) !) ann xn
!) ann
3
(k)
!) a11 x1
!a34 x4 .. . (k) !an 1 xn 1
(k) 1;n xn
3
0 0 0 .. .
7 7 7 7 7 5
7 7 7 7 7 7 7 7 7 7 7 5
Se tiene 2
2
3
(k+1)
(1
6 7 6 (1 7 6 7 6 7 6 (1 7=6 7 6 7 6 7 6 5 6 6 (1 4 (1
a11 x1
6 6 !a x(k+1) + a x(k+1) 21 1 22 2 6 6 (k+1) (k+1) 6 !a32 x + a33 x3 6 2 6 .. 6 . 4 (k+1) (k+1) !an;n 1 xn 1 + ann xn
(k)
!a12 x2
(k)
!a23 x3
!) a11 x1 !) a22 x2
(k)
!) a33 x3 !) an
1;n (k) !) ann xn
3
(k)
(k)
(k)
!a34 x4 .. . (k) !an 1 xn 1
(k) 1;n xn
3 2 !b1 7 7 6 7 6 !b2 7 7 7 6 7 6 !b3 7 7 6 . 7 ; 7+6 . 7 7 6 . 7 7 7 6 . 7 7 4 . 5 . 7 5 !bn
de donde obtenemos el siguiente esquema numérico
(k+1)
x1
=
(k+1)
=
(k+1)
=
x2
x3
(1
(k)
(k)
w) a11 x1
!a12 x2 + !b1
a11 (k+1) !a21 x1
+ (1
w) a22 x2 a22
(k+1)
+ (1
w) a33 x3 a33
!a32 x2
(k)
!a23 x3 + !b2
(k)
(k)
!a34 x4 + !b3
(k)
.. . (k+1) 1
xn
=
xn(k+1) =
!an
(k+1) 1;n 2 xn 2
(k+1) !an:n 1 xn 1
+ (1
+ (1 ann
w) an an
(k) 1;n 1 xn 1
!an
(k) 1;n xn
1;n 1 (k) w) ann xn + !bn
k = 0; 1; : : : : La solución ”exacta” es: ! x T = (0;446154; 0;6692307; 0;615384;
0;369223) :
+ !bn
1
7.5. EJERCICIOS
Ponemos ! x (0)
425 3 0 6 0 7 7 =6 4 0 5 : Primera iteración, 0 2 0 6 0;375 ! x (1) = 6 4 0;525 0;4725 2
aplicando el esquema numérico, obtenemos 3
7 7; 5
! x (1)
! x (0)
1
> T ol;
continuamos con la segunda iteración, volvemos a plicar el esquema numérico, tenemos 2 3 0;375 6 0;721875 7 ! ! 7 x (2) = 6 > T ol; x (2) ! x (1) 4 0;754125 5 ; 1 0;4424625 a continuación realizamos la tercera iteración. obtenemos 2 3 0;534375 6 0;780046875 7 ! ! 7 x (3) = 6 x (3) 4 0;656413125 5 ; 0;3695675625 luego ! x (4)
! x (5)
2
3 0;512859375 6 0;669631172 7 7 =6 4 0;595312678 5 ; 0;350997629 3 2 0;41320148 6 0;64161947 7 7 =6 4 0;597913926 5 ; 0;362623719
! x (2)
! x (4)
! x (3)
! x (5)
! x (4)
1
1
1
> T ol;
> T ol;
> T ol:
Continuado con la ejecución del esquema numérico, en la iteración 7 se veri…ca que ! x (7) ! x (6) 1 < T ol; y concluimos con el procedimiento de cálculo.
7.5.
Ejercicios
1. Sea
un intervalo de R; f una función de
x2
en M2
: Pruebe que f es Fréchet diferenciable en a 2 2ah h como Ta (h) = 8h 2 R: h 4ah
x2 1 x x 2x2 + 3 y la diferencial de Fréchet Ta está de…nida
2 [R]
de…nida como f (x) =
2. Sea un intervalo de R; f una función de en M2 2 [R] con f (x) = (aij (x)) x 2 y aij funciones reales derivables en todo punto a 2 : Demuestre que f es Fréchet diferenciable y que la diferencial Ta está de…nida como Ta (h) = (aij (a) h) 8h 2 R: 8 2 < x + y2 ; si x 6= y 3. Considere la función real de…nida en todo R2 como f (x; y) = : demuestre x2 y 2 : 0; si x = y: que f no es diferenciable en (0; 0) : 8 < x y ; si (x; y) 6= (0; 0) 2 4. Considere la función real de…nida en todo R como f (x; y) = : x2 + y 2 : 0; si (x; y) = (0; 0) : demuestre que f no es diferenciable en (0; 0) :
426
CAPÍTULO 7. MÉTODOS ITERATIVOS
5. Demuestre que la función v de R en R3 de…nida como v (t) = jt 1j ; t; 2t2 t 2 R no es diferenciable en t = 1: ! 6. Sean A 2 Mn n [R] una matriz simétrica, de…nida positiva, b 2 Rn : Se de…ne el funcional J sobre 1 T ! !T ! ! Rn como sigue: j (x) = ! x A x + b x 8 x 2 Rn : Demuestre que J es Fréchet diferenciable y 2 D ! E la diferencial de Fréchet está de…nida como hDJ (! x);! v i = A! x + b ;! v 8! v 2 Rn : 7. El espacio de matrices M2 2 [R] está provisto de la norma submultiplicativa k k : En cada item se de…ne una función F de M2 2 [R] en si mismo. Pruebe que F es Fréchet diferenciable y determine la diferencial de Fréchet TA 2 L (M2 2 [R] ; M2 2 [R]) ; con A 2 M2 2 [R] : 1 a) F (X) = X + XT X 2 M2 2 [R] : 2 1 X XT X 2 M2 2 [R] : b) F (X) = 2 c) F (X) = B 1 XB X; B 2 M2 2 [R] con B invertible …ja. d) F (X) = X T BX
X; B 2 M2
e) F (X) = X T X + BX
2 [R]
X; B 2 M2
con B …ja.
2 [R]
con B …ja.
8. Sean abierto del espacio normado V y F una función de en el espacio normado W: Pruebe que si F es Fréchet diferenciable, la diferencial Ta 2 L (V; W ) de F es única. 9. Sean abierto del espacio normado V; F y G funciones de en W diferenciables en a 2 Demostrar F + G diferenciable en a y D (F + G) (a) = DF (a) + DG (a)
:
10. Sea V un espacio provisto del producto escalar < ; > y norma asociada k k. Sea F el funcional de…nido comoF (x) =k x k2 8x 2 V: Demuestre que F es Fréchet diferenciable. 11. Sean V abierto, con V un espacio provisto del producto escalar < ; > y norma asociada k k : En cada item se de…ne un funcional: Pruebe que es diferenciaciable en : a) F (x) =< x; y >
x; y 2 V
b) F (x) =< G(x); y > c) F (x) =k G(x) k2
con y …jo.
x; y 2 V
x2
con y …jo, G función de
, G función de
en V , diferenciable en
en V , diferenciable en
:
:
12. Sea V un espacio normado de dimensión …nita con k k su norma y T 2 L (V ) tal que kT k < 1: Sea g : V ! V una aplicación de…nida por g (x) = T (x) + c con c 2 V …jo. Demostrar que la sucesión (xn ) de…nida por x0 2 V xn+1 = g (xn ) n = 0; 1; : : : converge a un punto …jo x b de g: [Sugerencia: Pruebe que g es lipschisiana].
13. Sea (E; d) un espacio métrico, g : E ! E una aplicación continua que posee un punto …jo u: Sean r > 0 y 0 < k < 1 tales que d (g (x) ; g (y)) kd (x; y) 8x; y 2 B (u; r) : Demostrar que para todo x0 2 B (u; r) ; la sucesión (xn ) de…nida por xn+1 = g (xn ) n = 0; 1; : : : es tal que (xn ) B (u; r) y l m xn = u: n!1
[Sugerencia: pruebe por inducción que xn 2 B (u; r)]. 14. Sea
: Rn ! Rn una función diferenciable con continuidad en todo punto de Rn tal que sup kD (~x)k
k < 1:
~ x2Rn
Demuestre que es contractiva y que para todo ~x0 2 Rn ; la sucesión (~xm ) generada por ~xm+1 = (~xm ) m = 0; 1; : : : converge a x b punto …jo de : Pruebe que k~xm+1
x bk
k k~xm
x bk
k m+1 k~x0
x bk ; m = 1; 2; : : : :
7.5. EJERCICIOS
427
15. En los ejercicios siguientes, calcular, si existen, las soluciones de los sistemas de ecuaciones no lineales que se indican utilizando el método de Newton. [Sugerencia: cada sistema está formado por ecuaciones de hipérbolas, parábolas, elipses, circunferencias, identifíquelas]. 8 < 2x y 2 = 3 2 2x y=1 4x2 y 2 = 1 2 a) b) c) y 2 2 x y = 1: x2 + y = 2: : 4x2 + = 1: 9 8 8 2 2 < < (x 3) + (y 2) = 9 x2 + (y 2)2 = 16 2 2 2 e) d) (y 1)2 : (x + 1) : (x 1) + (y 1) = 1: = 1: 4 9 2 5
16. En los ejercicios siguientes, calcular, si existen, las soluciones de los sistemas de ecuaciones no lineales que se indican utilizando el método de Newton. Para el efecto de…na una función vectorial asociada al sistema de ecuaciones no lineales, calcule la matriz Jacobiana, y seleccione un vector ! x 0 y mediante la aplicación del método de Newton, calcule una aproximación ! x 1 ; continue con el ! ! procedimiento. Calcule k x k+1 x k k k = 0; 1; 2; 3; y analice los resultados. 8 8 8 > 2x y 2 + 2z = 3 2 2 > y+z =1 < < 2x < 4x2 y 2 z 2 = 9 2 2x y z = 3 3x + 2y 5z = 1 2x y + 3z = 5 b) a) c) > : : 2 y2 2 2 > 2 2 x y + 2z = 2: x + y 2 + z 2 = 16: : 4x + + z = 5: 9 8 8 > 2x2 5y + 2z = 10 > 2x + 5y + z = 10 < < 2x2 y z 2 = 3 2x y 2 z = 3 d) e) : 2 > y2 > x y 2 + 3z 2 = 5: : x2 + 3z 2 = 5: 9 17. Considerar el sistema de ecuaciones 2 2 1 6 1 2 6 4 0 1 0 0
no lineales 32 0 0 6 1 0 7 76 5 2 1 4 1 2
3 2 3 x1 x1 7 6 x2 7 6 x32 + x3 5 4 x33 x4 x34
3
2
3 1 7 6 1 7 7 = 6 7: 5 4 1 5 1
(P)
~ 0 = (0; 0; 0; 0)T y el métodod a) Aplique el método de Newton con una aproximación inicial X b = (x1 ; x2 ; x3 ; x4 )T de dicho sistema con una de factorización LU para aproximar la solución X precisión de 10 2 :
b) Generalice el problema (P) para n 3 y elabore un algoritmo numérico para aproximar la solución de dicho problema. 0 1 4 3 0 1 A. 18. Considerar la matriz A = @ 3 4 0 1 4 a) Pruebe que A es una matriz de…nida positiva. b) Calcule
0 1 24 ! ! (TJ ) para el sistema A! x = b ; con b = @ 30 A : 24
c) Encuentre el valor óptimo de ! cuando se utiliza el método SOR para encontrar soluciones ! aproximadas del sistema A! x = b: ! 19. En cada item se da un sistema de ecuaciones lineales A! x = b : Aplicar el método de GaussSeidel para calcular solucione aproximadas Veri…que que ! x es solución del sistema de ecuaciones propuesto. Contabilice el número de operaciones elementales que realiza. 8 8 2z = 8 < 2x + 2y 2z = 10 < x ! ! 2x + y z = 15 3x + 4y 7z = 2 a) x T = (4; 5; 2) : b) x T = (3; 7; 5) : : : 3x y 10z = 27; 4x + 4y + 4z = 60;
428
CAPÍTULO 7. MÉTODOS ITERATIVOS 8 < 3x 3y + 6z = 18 ! x + y + 8z = 2 x T = (1; 5; 1) : c) : x 4z = 3; 8 x + 2y + 3z + 4w = 34 > > < x + 4y + 7z + 10w = 62 ! d) x T = (10; 6; 4; 0) : x + 4y + 10z + 16w = 74 > > : x + 4y + 10z + 20w = 74; 8 4x + + 20w = 48 > > < y z + 3w =5 ! d) x T = ( 3; 2; 2; 3) : -2y + 5z 12w = 22 > > : 3x + 3y 2z + 21w = 44; 8 2x1 + 2x2 + 8x3 6x4 = 10 > > > > x + 2x + 5x = 1 < 1 2 4 ! 3x2 + 16x3 + 28x4 = 16 f) x T = ( 1; 0; 1; 0; 1) : > > 5x2 + 26x3 + 44x4 = 26 > > : 2x1 2x2 + 32x3 + 45x4 + 2x5 = 33; 8 6x3 + 8x4 + 16x5 = 26 > > 2x1 + 4x2 > > 8x3 + 8x4 + 15x5 = 24 < 2x1 + 5x2 ! 2x1 + 2x2 x3 + 8x4 + 20x5 = 33 x T = (2; 1; 1; 1; 1) : g) > > > 2x1 + 7x2 10x3 + 11x4 + 20x5 = 32 > : 2x1 + 5x2 + 5x3 + 10x4 + 24x5 = 48;
! 20. Aplicar el método SOR para aproximar la solución del sistema de ecuaciones A! x = b : Compare con el vector ! x que se propone. Contabilice el número de operaciones elementales que realiza. 8 8 < x + 2y + 3z = 10 < 4x + 6y + 8z = 8 ! ! T 2x + 5y + 5z = 19 6x + 10y + 12z = 10 a) x = (2; 1; 2) : b) x T = (5; 2; 5) : : 3x + 5y + 11z = 33; 8x + 12y + 80z = 336; 8 x + y + z + w=5 > > < x + 5y + 5z + 5w = 9 ! c) x T = (4; 1; 1; 1) : x + 5y + 14z + 14w = 9 > > : x + 5y + 14z + 30w = 25; 8 16x1 + +12x4 = 100 > > < x2 2x3 + 3x4 = 15 ! d) x T = ( 10; 0; 0; 5) : 2x + 13x 3x = 15 > 2 3 4 > : 12x1 + 3x2 3x3 + 20x4 = 20; 8 4x1 + 2x2 4x5 = 52 > > > > < 2x1 + 2x2 + 3x3 + 5x4 + 5x5 = 52 ! 3x2 + 25x3 + 39x4 + 53x5 = 135 e) x T = (12; 7; 3; 1; 0) : > > 5x2 + 39x3 + 65x4 + 85x5 = 217 > > : 4x1 + 5x2 + 53x3 + 85x4 + 122x5 = 231; 8 4x1 + 4x2 + 2x3 + 4x4 + 4x5 + 2x6 = 0 > > > > 4x1 + 5x2 + 7x4 + 5x5 + 3x6 = 3 > > < x1 + 14x3 4x4 x6 = 5 ! f) x T = (1; 1; 0; 1; 1; 0) : 4x + 7x 4x + 22x + 11x + 5x = 14 > 1 2 3 4 5 6 > > > > 2x1 + 5x2 + 11x4 + 13x5 + 5x6 = 1 > : 2x1 + 3x2 x3 + 5x4 + 5x5 + 28x6 = 1;
! 21. En cada item se propone un sistema de ecuaciones lineales A! x = b : Estudie a la matriz A del sistema para determinar si es estrictamente diagonalmente dominante, simétrica, de…nida positiva, monótona, etc. Aplique los métodos de Gauss-Seidel y SOR, y, con cada uno de ellos halle la solución aproximada del sistema de ecuaciones. Contabilice el número de operaciones elementales que realiza.
7.5. EJERCICIOS 2
2 1 6 1 2 a) 6 4 0 1 0 0 2 4 1 6 1 4 b) 6 4 0 1 0 0 2 5 1 6 1 5 6 c) 6 6 1 1 4 0 0 0 0 2 3 1 6 1 3 6 1 d) 6 6 0 4 0 0 0 0 2 5 2 1 6 2 5 1 6 e) 6 6 1 1 5 4 0 0 2 0 0 0 2 4 1 6 1 5 6 1 6 1 2 f) 6 1 6 0 6 2 4 0 0 0 0
429 3 2 3 32 2 x1 0 6 x2 7 6 3 7 !T 0 7 7 = 6 7 ; x = (5; 8; 8; 5) : 76 1 5 4 x3 5 4 3 5 2 x4 2 32 3 2 3 0 0 x1 11 6 7 6 7 1 0 7 7 6 x2 7 = 6 6 7 ; ! x T = (2; 3; 4; 2) : 4 1 5 4 x3 5 4 17 5 1 4 x4 12 32 3 3 2 1 0 0 x1 16 7 6 6 14 7 1 1 0 7 7 6 x2 7 7 !T 6 7 7 7 6 6 1 1 7 6 x3 7 == 6 6 22 7 ; x = (2; 3; 3; 2; 1) 4 10 5 1 6 1 5 4 x4 5 0 1 6 x5 8 3 3 2 32 11 x1 0 0 0 7 7 6 6 1 0 0 7 7 6 x2 7 6 4 7 !T 7 7 6 6 3 1 0 7 7 6 x3 7 = 6 1 7 ; x = (5; 4; 3; 4; 5) : 5 4 5 4 4 5 x4 1 3 1 11 x5 0 1 3 32 3 2 3 0 0 x1 12 6 x2 7 6 9 7 0 0 7 76 7 6 7 T 6 x3 7 = 6 1 7 ; ! 2 1 7 76 7 6 7 x = ( 2; 1; 0; 1; 2) : 5 4 5 4 5 5 1 x4 7 1 5 x5 11 32 3 3 2 1 0 0 0 x1 29 2 1 6 7 7 6 1 0 0 7 2 7 6 x2 7 6 21 7 1 7 6 7 6 6 1 0 7 6 x3 7 6 13 7 T 2 7; ! =6 1 76 7 x = (10; 8; 6; 6; 8; 10) : 7 1 7 1 x 19 7 6 2 76 4 7 1 1 8 1 5 4 x5 5 4 45 5 0 1 2 1
2
0
1 2
1
9
x6
79
22. Sea A = (aij ) 2 Mn n [R] que satisface las dos condiciones siguientes: aij = 0 si ji jj > 2 para ! i; j = 1; : : : ; n y que aii > jai i 2 j + jai i 1 j + jai i+1 j + jai i+2 j ; i = 1; : : : ; n; b 2 Rn : ! a) Demuestre que el sistema de ecuaciones A! x = b tiene una única solución.
b) Aplique los métodos de Jacobi, Gauss-Seidel y SOR y exprese la sucesion (! x k ) en forma explícita para cada método y elabore un algoritmo que permita calcular la solución aproximada del sistema ! de ecuaciones A! x = b: c) Considere el sistema de ecuaciones lineales siguiente: 2 32 4 1 1 0 0 6 6 1 5 1 1 0 7 6 76 6 1 7 1 5 1 1 76 6 6 4 0 1 1 4 1 54 0 0 1 1 3
x1 x2 x3 x4 x5
23. Considere el sistema de ecuaciones lineales siguiente: 2 32 4 2 2 0 0 6 2 10 2 6 3 0 7 6 76 6 2 2 18 3 7 4 76 6 6 4 0 3 3 18 3 5 4 0 0 4 3 18
x1 x2 x3 x4 x5
3
2
7 6 7 6 7=6 7 6 5 4
5 10 25 4 4
3 7 7 7 7 5
Veri…que las hipótesis de la matriz A: Aplique sus algoritmos para hallar la solución de dicho sistema y compare con ! x T = (2; 5; 8; 5; 3) : 3
2
7 6 7 6 7=6 7 6 5 4
6 21 96 66 7
3
7 7 7: 7 5
430
CAPÍTULO 7. MÉTODOS ITERATIVOS a) Demuestre que la matriz A de este sistema es simétrica, de…nida positiva y estrictamente diagonalmente dominante. b) Aplique los métodos de Jacobi, Gauss-Seidel y SOR para hallar la solución aproximada de tal sistema. Contabilice con cada método el número de operaciones elementales. Compare la solución con ! x T = (0; 2; 5; 3; 1) :
7.6.
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. Tom M. Apostol, Calculus, Volumen 2, Segunda Edición, Editorial Reverté, Barcelona, 1975. 3. Owe Axelsson, Iterative Solution Methods, Editorial Cambridge University Press, Cambridge, 1996. 4. N. Bakhvalov, Métodos Numéricos, Editorial Paraninfo, Madrid, 1980. 5. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 6. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 7. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 8. P. G. Ciarlet, Introduction á l’Analyse Numérique Matricielle et á l’Optimisation, Editorial Masson, París, 1990. 9. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 10. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 11. James W. Demmel, Applied Numerical Linear Algebra, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1997. 12. J. E. Dennis, Jr., Robert B. Schnabel, Numerical Methods for Unconslrained Optimization and Nonlinear Equations, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1996. 13. V. N. Faddeva, Métodos de Cálculo de Algebra Lineal, Editorial Paraninfo, Madrid, 1967. 14. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 15. A. Kurosh, Cours D’Algèbre Supérieure, Editions Mir, Moscou, 1973. 16. Noel Gastinel, Análisis Numérico Lineal, Editorial Reverté, S. A., Barcelona, 1975. 17. Gene H. Golub, Charles F. Van Loan, Matrix Computations, Second Edition, The Johns Hopkins University Press, Baltimore, 1989. 18. Anne Greenbaum, Iterative Methods for Solving Linear Systems, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1997. 19. Wolfgang Hackbusch, Iterative Solution of Large Sparse Systems of Equations, Editorial SpringerVerlag, New York, 1994. 20. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991.
7.6. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
431
21. Nicholas J. Higham, Accuracy and Stability of Numerical Algorithms, Editorial Society for Industrial and Applied Mathematics, Philadelphia, 1996. 22. Franz E. Hohn, Algebra de Matrices, Editorial Trillas, México, 1979. 23. Roger A. Horn, Charles R. Johnson, Matrix Analysis, Editorial Cambridge University Press, Cambrisge, 1999. 24. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 25. P. Lascaux, R. Théodor, Analyse Numérique Matricielle Appliquée à L’Art de L’Ingénieur, Tome 1, Editorial Masson, París, 1986. 26. P. Lascaux, R. Théodor, Analyse Numérique Matricielle Appliquée à L’Art de L’Ingénieur, Tome 2, Editorial Masson, París, 1987. 27. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 28. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 29. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 30. Ben Noble, James W. Daniel, Algebra Lineal Aplicada, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1989. 31. J. M. Ortega, W. C. Rheinbolodt, Iterative Solution of Nonlinear Equatios in Several Variables, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 2000. 32. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 33. Werner C. Rheinboldt, Methods for Solving Systems of Nonlinear Equations, Second Edition, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1998. 34. M. Sibony, J. Cl. Mardon, Analyse Numérique I, Sustèmes Linéaires et non Linéaires, Editorial Hermann, París, 1984. 35. G. W. Stewart, Matrix Algotithms, Volume II: Eingensystems, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1998. 36. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 37. Gilbert Strang, Algebra Lineal y sus Aplicaciones, editorial Fondo Educativo Interamericano, México, 1982. 38. V. Voïévodine, Principes Numériques D’Algèbre Linéaire, Editions Mir, Moscú, 1976. 39. David S. Watkins, Fundamentals of Matrix Computations, Editorial John Wiley&Sons, New York, 1991.
432
CAPÍTULO 7. MÉTODOS ITERATIVOS
Capítulo 8
Valores y Vectores Propios Resumen Este capítulo se inicia con una revisión de resultados importantes sobre el problema de valores y vectores propios. La primera aplicación que se da es a la geometría analítica plana, más precisamente a las formas cuadráticas y ecuaciones cuadráticas. Luego se considera el cálculo de valores y vectores propios de matrices de 3 3 que se presenta con mucha frecuencia, sobre todo en los problemas de optimización de funciones reales en tres variables independientes. Se concluye este capítulo con el método de la potencia.
8.1.
Introducción
En lo sucesivo consideraremos matrices reales de n n aunque algunos resultados aparezcan dentro del campo de los números complejos. Nos interesamos fundamentalmente en el caso real. De…nición 1 Sea A 2 Mn n [R]. Un escalar 2 R se denomina valor propio de la matriz A si y solo si existe ! x 2 Rn no nulo tal que A! x = ! x . El vector ! x se llama vector propio de A asociado al valor propio : Los términos de valor y vector propio que aquí hemos de…nido, en muchos textos se los encuentran como valor y vector característico, eigenvalor y eigenvector, autovalor y autovector. ! Un valor proprio puede ser cero, esto es, = 0 pero un vector propio ! x no puede ser 0 : En el caso en ! ! que = 0; tenemos A! x = 0 para algún ! x 2 Rn con ! x 6= 0 lo que signi…ca que ! x 2 ker(A); donde ! ! ! n ker(A) denota el núcleo de la matriz A que se de…ne como ker(A) = f x 2 R j A x = 0 g:
! Sea un valor propio de A; denotamos con S = f! x 2 R n j A! x = ! x g[f 0 g: Se prueba inmediatamente que el conjunto S es un subespacio real que lo denominamos subespacio asociado al valor propio o simplemente subespacio propio de :
Sea un valor propio de A y ! x 2 Rn un vector propio asociado a : De la de…nición de valor y vector propio de A se tiene ! A! x = ! x () (A I)! x = 0: ! ! El sistema de ecuaciones homogéneo (A I)! x = 0 tiene soluciones no triviales (! x 6= 0 ) si y solo si la matrix A I es singular, que a su vez es equivalente a que det(A I) = 0: Esta última ecuación se llama ecuación característica. Se de…ne p( ) = det(A y se le denomina polinomio característico. 433
I)
2 R,
434
CAPÍTULO 8. VALORES Y VECTORES PROPIOS
El conjunto de todos los valores propios de la matriz A se denota (A) y se le denomina espectro de la matriz A; esto es, ! (A) = f 2 R j 9! x 2 Rn 8f 0 g tal que ; A! x = ! x g: Ejemplos 1. Los espacios M1 2 [R] y R2 son isomorfos. Sea A = (1; 2) ; calculemos jkAkj2 (véase el apéndice, ! normas de matrices). Tenemos A 2 M1 2 [R] y A 2 R2 ; en este último caso escribimos A = (1; 2). p p ! Resulta A = 12 + 2 = 5: Por otro lado, 2
1 2
At A =
1 2 2 4
(1; 2) =
:
2 = ( 2 4 = 5; = 0 y = 5 son los valores propios de AT A: Resulta p 1 jkAkj2 = sup kA! x k2 = (max f0; 5g) 2 = 5: x k2 1 k!
El polinomio característico de AT A está de…nido como p ( ) = p( ) = 0 ()
2
=0y
1
5) ; luego
3 2 1 2. Sea A = 4 1 0 5 : Calculemos jkAkj2 : Para el efecto, calculelos AT A y luego hallamos los 0 1 valores propios de esta matriz. Tenemos 2 3 2 1 2 1 0 4 1 0 5= 5 2 : AT A = 2 2 1 0 1 0 1 El polinomio característico p ( ) de la matriz AT A está de…nido como p ( ) = det AT A Entonces p p ( ) = 0 () jkAkj2 = 6:
I =
= 1 o
5
2 2
=
2
2
7 +6=(
= 6: Los valores propios son
1) (
= 1; y
6) : = 6: Por lo tanto
3. Sea A una matriz real de n n triangular superior (respectivamente triangular inferior), digamos A = (aij ) con aij = 0 si i > j: Entonces p( ) = det(A
I) =
n Y (aii i=1
)
2 R,
luego p( ) = 0 () 1 = a11 ; ; n = ann : ! ! 1 I) x = 0 se escribe en forma explícita como
El sistema de ecuaciones (A 8 a12 x1 + > > > < > > > :
+ a1n xn = 0; (a22 1 )x2 + .. .
+ a2n xn = 0; (ann
1 )xn
= 0;
y cualquier solución no nula de este sistema es un vector propio asociado al valor propio sucesivamente 8 (a11 + a1n xn = 0; > n )x1 + > > < (a22 + a2n xn = 0; n )x2 + .. > . > > : (an 1n n )xn = 0:
1.
Así
8.1. INTRODUCCIÓN
435
Este sistema de ecuaciones lineales consta de n 1 ecuaciones, y cualquier solución no nula de este sistema es un vector propio asociado al valor propio n : Se tiene (A) = faii j i = 1; ; ng: Como se puede apreciar, estos son lo problemas más simples de cálculo de valores y vectores propios De…nición 2 Sean A; B 2 Mn n [R]: Se dice que las matrices A; B son semejantes si y solo si existe una matriz invertible P tal que B = P 1 AP: Dos matrices que son semejantes tienen exactamente los mismos valores propios. Efectivamente, sea valor propio de la matriz A y ! x un vector porpio asociado a ; entonces A! x = ! x ; luego ! 0 = (A con ! y =P
1! x:
I)! x = (P BP
Así, p( ) = det(A
I)! x = P (B
1
I) = det(B
I)P
un
! I)! y = 0;
1!
x = (B
I):
Sea A 2 Mn n [R] tal que AT = A; es decir que la matriz A es simétrica, entonces todos sus valores propios son reales. Además, si 2 R es un valor propio de multiplicidad 2 k n; entonces dim(S ) = k: Por otro lado, si 1 ; 2 son valores propios de A tales que 1 6= 2 ; los vectores propios asociados ! x 1; ! x2 ! ! ! ! ! ! son ortogonales, es decir que si A x 1 = 1 x 2 ; A x 2 = 2 x 2 ; 1 6= 2 =) x 1 ? x 2 : Localización de los valores propios Sea A 2 Mn n [R] y jk kj una norma submultipilicativa en Mn n [R]: Entonces, si un valor propio de la matriz A y ! x un vector propio asociado a ; entonces A! x = ! x ; y en consecuencia jk ! x k=k ! x k=k A! x k jk A kjk ! x k;
j
y siendo ! x un vector porpio, se tiene k ! x k6= 0; y de esta desigualdad se sigue que j
j jk A kj :
Tenemos (véase el apéndice, normas de matrices), j
jkAkj1 =
j
j
sup x k1 k!
j
jkAkj2 = sup kA! x k2 = x k2 1 k!
j
donde
1; : : :
n
m X sup kA! x k1 = max jaij j ; j=1;:::;n x k1 1 k! i=1 n X kA! x k1 = max jaij j ;
j
1
i=1;:::;m
j=1
1 2
max j i j
i=1;:::;n
;
son los valores propios de AT A; y AT denota la matriz transpuesta de A.
Ejemplos 2
3 2 20 200 5 100 5 ; entonces j j jkAkj1 = 310; j j jkAkj1 = 222: Note que la 1. Sea A = 4 0 1 1 10 estimación j j jkAkj2 requiere del cálculo de los valores propios de la matriz AT A: Como la matriz A es real de 3 3; el polinomio característico p( ) es de grado 3 y tiene coe…cientes reales, al menos un valor propio de A es real. De las estimaciones anteriores, se tiene 2 [ 222; 222] que es un intervalo demasiado grande para localizar a esta raíz real. Este ejemplo muestra que se requieren de estimaciones más …nas.
436
CAPÍTULO 8. VALORES Y VECTORES PROPIOS
Teorema 1 (de Gershgorin) Sea A 2 Mn en la unión de los discos f 2 C j j
akk j
n [R]: Los n P j=1 j6=k
valores propios
de la matriz A están localizados
j akj jg: Estos discos se llaman discos de Gershgorin.
Además, si la unión de k discosde Gershgorin son disjuntos unos de otros, entonces la unión contiene exactamente k valores propios de la matriz A. Demostración. Sea un valor propio de la matriz A y ! x un vector porpio asociado a ; entonces ! ! ! ! A x = x : Elegimos x tal k x k1 = xk = 1: Explícitamente, la …la k de A! x = ! x es la siguiente: ak1 x1 +
+ akk xk +
de donde j akk
j=j ak1 x1 +
+ akn xn j
+ akn xn = xk n X j=1 j6=k
j akj jj xj j
n X j=1 j6=k
j akj j
Para la prueba de la segunda parte se propone como ejercicio. Ejemplo 2
3 2 20 200 5 100 5 : Los radios de los discos de Gershgorin están de…nidos como sigue: Sea A = 4 0 1 1 10 r1 =j 20 j +200 = 220; r2 = 100; r3 = 2; luego los discos de Gershgorin son B(2; 220) = f 2 C jj
2j
220g;
B(5; 100) = f 2 C jj
5j
100g;
B(10; 2) = f 2 C jj
10 j
2g;
con lo
2 B(2; 220) [ B(5; 100) [ B(10; 2):
8.2.
Formas cuadráticas y ecuaciones cuadráticas en R2 :
Sean a; b; c; d 2 R tales que c 6= 0 y jaj + jbj > 0: Consideramos el subconjunto C de R2 de…nido como C = (x; y) 2 R2 j ax2 + by 2 + cxy = d : Se trata de determinar si C = ; o C 6= ;: En el caso C 6= ;; determinar el tipo de conjunto que C representa, esto es, si es un punto, una recta, dos rectas, una cónica (circunferencia, elipse, parábola, hipérbola), encontrar la ecuación canónica de dicha cónica, o de la recta o de las rectas; y, representar grá…camente el conjunto C. Proponer un algoritmo. Sigamos la metodología propuesta en la resolución de problemas. Analicemos la existencia de soluciones, es decir determinemos si C = ; o C 6= ;: Para el efecto de…nimos la forma cuadrática Q como sigue: 2 3 1 6 a 2c 7 x Q (x; y) = ax2 + cxy + by 2 = (x; y) 4 1 (x; y) 2 R2 : 5 y c b 2 n! !o La matriz A de la forma cuadrática Q relativa a la base canónica B1 = i ; j de R2 está de…nida como 2 3 1 6 a 2c 7 A=4 1 5 : La hipótesis c 6= 0 y jaj + jbj > 0 implica A 6= 0 y claramente A es simétrica, esto es, c b 2 A = AT :
8.2. FORMAS CUADRÁTICAS Y ECUACIONES CUADRÁTICAS EN R2 : Calculemos los valores propios de A, es decir, determinamos 1 c 2
a det (A
I)
=
0 ()
()
2
1 c 2
2 R tal que det (A
= 0 () (a
b
437
) (b
)
I) = 0: Se tiene 1 2 c =0 4
1 2 c =0 4
(a + b) + ab
es decir que los valores propios de A son soluciones de la ecuación de segundo grado: t 2 C tal que t2 + t + donde ;
Sea
=
= 0;
2 R; cuya solución se determina con la conocida fórmula p 2 4 : t= 2 2
4 : Si
0; las raíces son reales; y si
< 0; las raíces son complejas.
Puesto que la matriz A es simétrica, las raíces de la ecuación: 2
(a + b) + ab
1 2 c =0 4
son reales. En efecto, el discriminante de esta ecuación es no negativo, pués = (a + b)2
1 2 c 4
4 ab
= a2 + 2ab + b2
4ab + c2 = (a
b)2 + c2 :
Por hipótesis c 6= 0 y jaj + jbj > 0; que signi…ca que al menos dos de estos números son no nulos, luego = (a b)2 + c2 0: Entonces 1
=
2
=
1 (a + b) 2 1 (a + b) + 2
son los valores propios de la matriz A:
1p (a 2 1p (a 2
b) + c2 ; b) + c2 ;
Determinemos los vectores propios asociados a 1 y 2 ; es decir, hallamos las soluciones de los sistemas de ecuaciones A! x = 1! x y A! x = 2! x ; que es equivalente al sistema de ecuaciones 8 1 > < (a ) x + cy = 0 ! 2 (a I) x = 0 () 1 > : cx + (b ) y = 0: 2
x1 Para = 1 obtenemo ! u = tal que k! u k = 1 y para = 2 obtenemos ! v = y1 k! v k = 1: Estos dos vectores propios de A son ortogonales, esto es, ! u ! v = 0: Escribimos ! ! ! 2 Consecuentemente, f u ; v g forman una base B2 de R : Ponemos B2 = f u ; ! v g: Note que Q (! u) = ! u T A! u =! uT ( Q (! v) = ! v T A! v =! vT(
1 2
! u)= ! v)=
!
1kuk
= 2 ! 2kvk =
pués k! u k = 1 y k! v k = 1: La forma bilineal simétrica F está de…nida como F (! x;! y)=! x T A! y
2
8! x;! y 2 R2 :
1; 2;
x2 con y2 ! u ? ! v:
438
CAPÍTULO 8. VALORES Y VECTORES PROPIOS
Se tiene Q (! x ) = F (! x;! x ) x 2 R2 ; y, F (! u;! u ) = 1 ; F (! v ;! v ) = 2 ; F (! u;! v ) = F (! v ;! u ) = 0: Así, ! ! la matriz de la aplicación bilineal simétrica F relativa a la base B2 = f u ; v g está de…nida como [F ]B2 = a la que notamos D; esto es, D =
1
0
0
2
1
0
0
2
;
: x1 x2 y1 y2
La matriz de cambio de base de B2 a B1 está de…nida como P = La matriz P es ortogonal, esto es, P
1
y se veri…ca que P
1 AP
= D:
= PT:
La forma cuadrática Q referida a la base B2 = f! u;! v g se escribe como Q (s; t) = (s; t)
1
0
0
2
s t
=
2 1s
+
2t
2
(s; t) 2 R2 ;
y C = (x; y) 2 R2 j ax2 + cxy + by 2 = d = (s; t) 2 R2 j Puesto que 1 2R y
1; 2
2 R, se presenta los siguientes casos: + 2 R ; 1 = 0; 2 6= 0, 1 = 6 0; 2 = 0: 2
1. Supongamos
1;
1;
2
2 1s
2 R+ ;
1 2
+
2t
2
=d :
2R ;
1
2 R+ y
2
2 R+ :
2
a) Si d < 0 entonces C = ;:
b) Si d = 0 entonces C = f(0; 0)g :
c) Si d > 0 entonces C 6= ;: En el caso
1
=
2
=
entonces la ecuación
(s; t) 2 R2 tal que
2 1s
+
2t
2
= d () (s; t) 2 R2 tal que s2 + t2 =
corresponde a la ecuación de una circunferencia de centro (0; 0) y radio r =
r
d
d
;
:
En la …gura siguiente se muestra el conjunto C, o sea una circunferencia de radio r =
1 = d>0
2
=
Figura 73
En el caso
1
6=
2,
la ecuación (s; t) 2 R2 tal que
2 2 1 s + 2 t = d () 0 12 0 12
B s C B t C C B C (s; t) 2 R2 tal que B @r d A + @r d A = 1 1
2
r
d
:
2R ;
8.2. FORMAS CUADRÁTICAS Y ECUACIONES CUADRÁTICAS EN R2 :
439
que representa a una elipse de centro (0; 0). En la …gura siguiente se muestra este conjunto
1 > d>0
2
>0
Figura 74
2. Supongamos
1;
2
2R :
a) Si d > 0; resulta que C = ;:
b) Si d = 0; entonces C = f(0; 0)g :
c) Si d < 0; multiplicando por 1 a la ecuación: (s; t) 2 R2 tal que 1 s2 + 2 t2 = d se obtiene ( 1 ) s2 + ( 2 ) t2 = d que ha sido analizado en el caso 1) parte c) precedente. Supongamos
1
2 R+ y
a) Si d = 0; la ecuación
2
2R :
(s; t) 2 R2 tal que
2 1s
+
2t
2
1 2
= 0 () (s; t) 2 R2 tal que t2 =
De la última relación se obtienen las dos siguientes r 8 > > < t= r (s; t) 2 R2 tal que > > : t=
1
s :
2
s;
2 1
s:
2
Consecuentemente
C = =
(s; t) 2 R2 j (
2 1s
(s; t) 2 R2 j t =
+ 2 t2 = 0 ) r 1 2
s
[
(
(s; t) 2 R2 j t =
r
1 2
)
s :
En la …gura siguiente se muestran los vectores ! u; ! v y las rectas de ecuaciones t = r 1 s con s 2 R: t= 2
1 1
Figura 75
> 0; 2 < 0 > j 2j
r
1 2
s;
440
CAPÍTULO 8. VALORES Y VECTORES PROPIOS b) Si d 6= 0; la ecuación
(s; t) 2 R2 tal que
2 1s
+
2t
2
=d
representa a una hipérbola. En la …gura siguiente se muestran los vectores ! u,! v y la hipérbola C = (s; t) 2 R2 j con d > 0:
2 1s
+
2t
2
=d
Note que la ecuación (s; t) 2 R2 tal que
2 1s
0
+
2 2t 12
B s C C (s; t) 2 R2 tal que B @r d A
= d () 0
1
12
B t C C =1 Br @ d A 2
> 0; d>0 j 2j > 1
2
0:
2
d 2
es contradictoria con lo que C = ;:
b) En el caso d = 0; el conjunto C se expresa como sigue C = (s; t) 2 R2 j t = 0 = fs (1; 0) j s 2 Rg ;
es decir que en el sistema de referencia f! u;! v g, C representa una recta que es paralela a ! u : En la …gura siguiente se muestra este conjunto.
Figura 77
8.2. FORMAS CUADRÁTICAS Y ECUACIONES CUADRÁTICAS EN R2 : d
En el caso
> 0; se tiene la ecuación
t2
=
2
d
; de donde t =
2
d (s; t) 2 R2 j t2 = 2 ( r
C =
(s; t) 2 R2 j t =
=
r
d 2
)
[
(
r
d
441 r
; o, t =
2
(s; t) 2 R2 j t =
r
d 2
)
d
con lo que
2
:
r
d j s 2 R ; L2 = s; j s 2 R : Los conjuntos L1 y L2 2 2 representan rectas paralelas al vector ! u : En la …gura siguiente se ilustran los conjuntos L1 , L2 : Se de…ne L1 =
s;
d
Figura 78
El caso
6= 0 y
1
2
= 0 se analiza en forma parecida al caso 4).
Con todo el análisis realizado sabemos en que condiciones C = ;; y en cuáles C 6= ;: En este último caso podemos identi…car si se trata de una circunferencia, elipse, hipérbola o simplemente rectas; y, estamos en condiciones de proponer un algoritmo que permita identi…car todos estos casos. Algoritmo Datos de entrada: a; b; c; d 2 R. Datos de salida: Mensaje 1 : C 6= ;; Mensaje 2 : C = f(0; 0)g ; Mensaje 3 : Datos no cumplen con la hipótesis; 1 ; 2 ; ! u; ! v: 1. Si c = 0; o a = 0 y b = 0: Continuar en 13) 1 (a + b) 2 q 1 = (a b)2 + c2 2
2. Calcular u =
1
=u
2
=u+
8 1 > < (a 2 ) x + cy = 0 2 3. Resolver el sistema de ecuaciones : 1 > : cx + (b 1 ) y = 0: 2 Obtener ! u =
x1 y1
tal que k! u k = 1:
8 1 > < (a 2 ) x + cy = 0 2 Resolver el sistema de ecuaciones 1 > : cx + (b 1 ) y = 0: 2
442
CAPÍTULO 8. VALORES Y VECTORES PROPIOS Obtener ! v =
x2 y2
tal que k! v k = 1:
4. Gra…car sistema de coordenadas rectangulares x; y; y respecto de B2 = f! u;! v g el sistema de coordenas s; t: 5. Si,
1
> 0;
2
> 0:
Si d < 0; continuar en 11). Si d = 0; continuar en 12). Si d > 0 Si
1
6=
2
Calcular p =
r
d
;q=
1
(
r
d
:
2
(s; t) 2 R2 j
Gra…car la elipse
s p
2
+
t q
2
)
=1 :
Continuar en 14). Si
1
=
2
Calcular r =
r
d
:
1
Gra…car la circunferencia (s; t) 2 R2 j s2 + t2 = r2 : Continuar en 14). 6. Si,
1
< 0;
2
< 0:
Si d > 0; continuar en 11). Si d = 0; continuar en 12). Si d < 0: Si
1
6=
2
Calcular p =
r
d
;q=
1
(
Gra…car la elipse
r
(s; t) 2
d
:
2
R2
j
s p
2
+
t q
2
)
=1 :
Continuar en 14). Si
1
=
2
Calcular r =
r
d
:
1
Gra…car la circunferencia (s; t) 2 R2 j s2 + t2 = r2 : Continuar en 14). 7. Si,
1
< 0;
2
> 0:
Si d > 0; Calcular p =
r
d 1
;q=
r
d 2
:
8.2. FORMAS CUADRÁTICAS Y ECUACIONES CUADRÁTICAS EN R2 : (
(s; t) 2 R2 j
Gra…car la hipérbola
s p
2
s p
2
t q
2
t q
2
)
=
1 :
Continuar en 14). Si d < 0; Calcular p =
r
d
;q=
1
(
r
d
:
2
(s; t) 2 R2 j
Gra…car la hipérbola
)
=1 :
Continuar en 14). Si d = 0; Calcular m =
r
1
:
2
Gra…car C1 = (s; t) 2 R2 j t =
ms ;
C2 = (s; t) 2 R2 j t = ms : Continuar en 14). 8. Si,
1
> 0;
2
< 0:
Si d > 0; Calcular p =
r
d
r
;q=
1
Gra…car la hipérbola
(
d
:
2 2
s p
(s; t) 2 R2 j
t q
)
2
=1 :
Continuar en 14). Si d < 0; Calcular p =
r
d
;q=
1
Gra…car la hipérbola
(
r
d
:
2
(s; t) 2
R2
j
s p
Continuar en 14). Si d = 0; Calcular m =
r
1
:
2
Gra…car C1 = (s; t) 2 R2 j t =
ms ;
C2 = (s; t) 2 R2 j t = ms : Continuar en 14). 9. Si
1
=0
Calcular p =
d
:
2
Si p < 0; continuar en 11)
2
+
t q
2
=
)
1 :
443
444
CAPÍTULO 8. VALORES Y VECTORES PROPIOS Si d = 0; Gra…car la recta C = fs (1; 0) j s 2 Rg : Continuar en 14). Si p > 0; Gra…car las recta L1 = L2 =
p
s;
p
p js2R ;
s; p j s 2 R :
Continuar en 14). 10. Si
2
=0
Calcular p =
d
:
1
Si p < 0; continuar en 11) Si d = 0; Gra…car la recta C = ft (0; 1) j t 2 Rg : Continuar en 14). Si p > 0; Gra…car las recta L1 = L2 =
p p
p; t j t 2 R ;
p; t j t 2 R :
Continuar en 14). 11. Mensaje 1 : C = ;: Continuar en 14). 12. Mensaje 2 : C = f(0; 0)g : Continuar en 14). 13. Mensaje 3 : Datos no cumplen con la hipótesis. 14. Fin El algoritmo concluye en un número …nito de pasos. Note que se realizan las 4 operaciones aritméticas y raíz cuadrada. Se realizan algunas comparaciones. Para veri…car el algoritmo proponemos tres ejemplos. 1. Consideremos el subconjunto C de R2 de…nido como C = (x; y) 2 R2 j 4x2 + 2xy + 4y 2 = 1 : Tenemos a = 4; b = 4; c = 2 y d = 1: Claramente c 6= 0; jaj + jbj > 0: Según el algoritmo (punto 1 4 1 2), pasamos a calcular los valores porpios de la matriz A = : Tenemos u = (a + b) = 4; 1 4 2 q 1 2 = (a b) + c2 = 1: 2 Los valores propios de A son 1 = u = 3 y 2 = u + = 5: Continuando con el algoritmo (punto 3), determinamos 8 los vectores propios de A asociados a 1 > < (a ) x + cy = 0; ! 2 2 2 ; esto es, determinamos x = (x; y) 2 R tal que 1 > : cx + (b ) y = 0: 2 x+y =0 Con 1 = 3 se tiene , x + y = 0 , y = x: x+y =0
1
y
8.2. FORMAS CUADRÁTICAS Y ECUACIONES CUADRÁTICAS EN R2 : Luego ! x = (x; y) = (x; x) = x (1; 1)
445
x 2 R:
1 Los vectores propios normalizados de A son (punto 4 del algoritmo) ! u = p (1; 1) y ! v = 2 1 p (1; 1) : se veri…ca inmediatamente que ! u y! v son ortogonales, esto es, ! u ! v = 0: Puesto que 2 1 > 0; 2 > 0 y d > 0 (punto 5 del algortimo) entonces r r r r p p d 1 3 d 1 5 = = p= = ' 0;577; q= = ' 0;447: 3 3 5 5 1 2 9 8 12 0 12 0 > > > > = < C B C B t 5 2 C B C B p p +@ = 1 es una elipse. Entonces C = (s; t) 2 R j @ > > 3A 5A > > ; : 3 5 En la …gura siguiente se muestran los vectores ortogonales ! u; ! v y la elipse C:
Figura 79
2. Sean d 2 R2 y C = (x; y) 2 R2 j 2x2 + 4xy + 2y 2 = d : Tenemos a = 2; b = 2; c = 4: Se veri…ca inmediatamente que jaj + jbj > 0 y c 6= 0 (punto 1 del algoritmo). Calculemos los valores propios de la matriz a = 1 (a + b) = 2; 2 = u = 0;
u = 1
2
2 2 (punto 2 del algoritmo). Tenemos 2 2 q 1 = (a b)2 + c2 = 2; 2 = u + = 4:
Determinemos los vectores propios de la matriz A asociados a los valores propios
1
y
2:
(2 1 ) x + 2y = 0; = 0; hallar ! x = (x; y) 2 R2 solución de La solución de este sistema 2x + (2 1 ) y = 0: conduce a la ecuación x + y = 0; luego ! x = (x; y) = (x; x) = x (1; 1) x 2 R: Con
1
Con
2
Resulta
= 0; hallar ! x = (x; y) 2 R2 solución de
(2 2 ) x + 2y = 0; 2x + (2 2 ) y = 0:
2x + 2y = 0 () x = y: Luego 2x 2y = 0 ! x = (x; y) = (x; x) = x (1; 1)
x 2 R:
1 1 v = p (1; 1) : Los vectores ! u y! v son vectores propios de A, esto es, Ponemos ! u = p (1; 1) ; ! 2 2 A! u = 1! u y A! v = 2! v ; y, ! u ?! v: Siguiendo con el algoritmo (punto 9) se tiene C = (s; t) 2 R2 j
2 1s
+
2t
2
= d = (s; t) 2 R2 j 4b2 = d :
446
CAPÍTULO 8. VALORES Y VECTORES PROPIOS Si d < 0; la ecuación 4t2 = d es absurda, luego C = ;:
Si d = 0; la ecuación 4t2 = 0 ) t = 0; luego c = (s; t) 2 R2 j t = 0 = fs (1; 0) j s 2 Rg : p p d d d 2 Si d > 0; la ecuación t = tiene dos raíces t1 = y t2 = con lo que 4 2 2 ( p ) ( p ) d d d = (s; t) 2 R2 j t = [ (s; t) 2 R2 j t = : C = (s; t) 2 R2 j t2 = 4 2 2
Ponemos L1 =
(
(s; t) 2 R2 j t =
p ) ( d = s; 2
) ( ) p ! p ! d d j s 2 R ; L2 = s; js2R : 2 2
En la …gura de la izquierda se representa el conjunto C = fs (1; 0) j s 2 Rg y en el de la derecha se representa el conjunto C = L1 [ L2 :
Figura 80 Figura 81
(x; y) 2 R2 j (x + y)2 =
Note que C = (x; y) 2 R2 j 2x2 + 4xy + 2y 2 = d =
d 2
:
Si d < 0; resulta C = ;: Si d = 0; se obtiene C = (x; y) 2 R2(j x + y = 0 que representa ) una p 2d recta de ecuación cartesiana y = x: Si d > 0; se tiene C = (x; y) 2 R2 j x + y = [ 2 ( ) p 2d 2 (x; y) 2 R j x + y = :Las ecuaciones cartesianas de las rectas son: 2 2
(x; y) 2 R tal que x + y =
8.3.
p
2d ; 2
2
(x; y) 2 R tal que x + y =
Valores y vectores propios de matrices de 3
p
2d : 2
3
Sea A = (aij ) 2 M3 3 [R]. Determinemos 2 R y ! x 2 R3 no nulo tal que A! x = ! x : En este caso el polinomio característico está de…nido como sigue: p( ) = det(A
= (a11
I) =
)
a22 a32
a11 a21 a31 a23 a33
a12 a22 a32 a12
a13 a23 a33 a21 a23 a31 a33
+ a13
a21 a22 a31 a32
:
Los valores propios se obtienen como solución de la ecuación p( ) = 0: Como el polinomio característico es de grado 3, existe al menos una raíz real la misma que puede ser calculada como solución aproximada
8.3. VALORES Y VECTORES PROPIOS DE MATRICES DE 3
3
447
mediante el método de Newton. Los vectores propios son solución del sistema de ecuaciones lineales 2 32 3 2 3 a11 a12 a13 x1 0 4 a21 5 4 5 4 a22 a23 x2 = 0 5 : a31 a32 a33 x3 0 Ejemplo 2
3 2 1 1 1. Consideramos la matriz A = 4 1 2 0 5 : Apliquemos los resultados obtenidos, el algoritmo 1 0 2 de búsqueda del cambio de signo y el método de Newton para calcular todos los valores propios de A: Primeramente, la matriz A es simétrica luego sus valores propios son reales, tenemos j j jkAkj1 = 4: Así 2 [ 4; 4] : Una estimación más …na la obtenemos si determinamos los discos de Gershgorin. Tenemos j 2 j 2; j 2 j 1; j 2 j 1 entonces j 2 j 2 () 2 [0; 4]. Determinemos el polinomio característico: 2 p ( ) = det (A
1 1 1
I) =
1 0
2 0
=
3
+6
2
10 + 4
2
2 R:
Para este ejemplo los valores propios se calculan fácilmente y así podemos comparar con los métodos a utilizar. Se tiene 8 < 1 = 2; p 2 p ( ) = (2 ) 4 +2 =0, 2 =2 p2; : = 2 + 2: 3
Sea h = 0;5: La aplicación del algoritmo de búsqueda del cambio de signo en el intervalo [ 0;3; 4] nos da los resultdos que se indican en la tabla siguiente: x 0;3 0;2 0;7 1;2 1;7 2;2 2;7 3;2 3;7 4;0
p (x) 7;567 2;232 0;403 1;088 0;573 0;392 1;057 0;672 1;513 4;0
Como se observa, la aplicación del algoritmo de búsqueda del cambio de signo muestra la existencia de tres raíces reales: C1 2 [0;2; 0;7] ; C2 2 [1;7; 2;2] ; C3 2 [3;3; 3;7] :
En realidad el algoritmo de búsqueda del cambio de signo se aplica en el intervalo [0; 4]: Apliquemos el método de Newton para calcular cada una de estas raíces. Tenemos p (x) = 0
p (x) =
x3 + 6x2 2
3x + 12x
10x + 4 = 4 + x ( 10 + x (6 10 =
y el esquema de Newton está de…nido como 8 < x0 dado, p (xn ) : xn+1 = xn p0 (xn )
10 + x (12
3x) ;
n = 0; 1; : : : ; Nmax :
x)) ;
448
CAPÍTULO 8. VALORES Y VECTORES PROPIOS Cálculo de C1 2 [0;2; 0;7] : Ponemos x0 el punto medio del intervalo, esto es x0 = 0;45: En la tabla siguiente se encuentran los resultados de la aplicación del método de Newton Iteración 0 1 2 3 4
xj 0;45 0;569803 0;585522 0;585786 0;585786
p (xj ) 0;623875 0;065021 : 0;0010563 0;0000003 2;33 10 14
La raíz es C1 = 0;5857864376: Procediendo en forma similar a la precedente, elegimos x0 el punto medio del intervalo [1;7; 2;2] ; es decir x0 = 1;95: En la tabla siguiente se muestran los resultados obtenidos de la aplicación del método de Newton. Iteración xj p (xj ) 0 1;95 0;099875 1 2;000125 0;0002509 : 2 1;9999999 0;39 10 11 3 2;0 0: La raíz es C2 = 2: Sea x0 el punto medio del intervalo [3;3; 3;7] : x0 = 3;45: Entonces, Iteración 0 1 2 3
xj 3;45 3;415496 3;41421530 3;414213562
p (xj ) 0;148625 0;00513764 : 0;000006965 1;28 10 11
La raíz es C3 = 3;414213562: Calculemos los vectores propios de A asociados a los valores propios 1 Tenemos 8 )x y +z < (2 ! ! x + (2 )y (A I) x = 0 , : x+ + (2 )z 8 p < 2x p y + z = 0 p Para 1 = 2 2 se tiene x + 2y p =0 : x+ + 2z = 0:
=2
de donde
Para
1
n = ! x T = (x; y; z) 2 R3 j (A
1 I)
= 2 se obtiene el sistema de ecuaciones
S
2
n = ! x 2 R3 j (A
Se deja como ejercicio determinar S 3 :
8 <
!o n ! x = 0 = z
x : x
2;
= 2;
3
p = 2+ 2:
= 0; = 0; = 0:
Aplicando el método de eliminación gaussiana se obtiene el siguiente sistema
S
p
p
8 p < 2x :
y +z =0 1 1 p y + p z = 0; 2 2
o 2; 1; 1 j z 2 R :
y+z =0 = 0 luego = 0;
!o 2I) ! x = 0 = fy (0; 1; 1) j y 2 Rg
8.4. MÉTODO DE LAS POTENCIAS
8.4.
449
Método de las Potencias
En muchas situaciones no estamos interesados en calcular todos los valores propios y todos los vectores propios, sino algunos de ellos, por ejemplo el más grande o el más pequeño en valor absoluto de los valores propios con sus respectivos vectores propios. Este método puede adaptarse en forma apropiada para calcular otros valores y vectores propios. Suponemos que la matriz A es diagonalizable, es decir que existe una matriz invertible P tal que D = P 1 AP; donde D = ( 1 ; ; n ) una matriz diagonal con los valores propios de la matriz A en su diagonal. Consecuentemente xisten ! x 1; ;! x n vectores propios asociados a 1 ; ; n ; respectivamente. ! ! Tenemos A x i = i x i i = 1; ; n: Adicionalmente, suponemos que j n j j 1 j; y asumimos que el conjunto f! x 1; ;! x n g es una base de Rn : Al valor propio 1 lo denominaremos valor propio dominante de la matriz A: P x i ; luego Sea ! x 2 Rn no nulo. Existen 1 ; ; n 2 R tales que ! x = ni=1 i ! ! y 1 = A! x =A
n X
! ixi =
i=1 n X
n X i=1
! y 2 = A2 ! x =A
i i
! xi =
i=1
.. .
! y m = Am ! x =A
! iA x i =
n X
i i
! x i;
i=1
n X
2! i i x i;
i=1
n X
m 1! xi i i
=
i=1
n X
m! i i x i:
i=1
La última igualdad se expresa como ! y m = Am ! x =
Por otro lado, de la relación j
n
j
j
lm j
m !1
1
m 1
n X
m
i i
i=1
1
j se tiene j
n m j
k m
k
1
1
j = 0 si
! x i:
j
1
j
2
1
i i
1
i=1
lm m ! x 1; m !1 1 1
=
solo si j
n X
y solo si j
1
si
m
! xi = lm
m m !1 1
k
m 1
k = 2;
! x1+
i i
m
1
i=2
! xi
; n:
j< 1;
lm m m !1 1
= 1 si y solo si
1
m m !1 1
= 1; l m
no existe si y
6= 0:
! 1x1+
n X i=2
i i
!
1
j; se tiene
! ym=
< u (x) = 1 (f (x) + f ( x)) 2 x 2 [ L; L] ; 1 > : v (x) = (f (x) f ( x)) 2 entonces u es par y v es impar. Se tiene f = u + v: El polinomio trogonométrico de Fourier m
Qm (x) =
a0 X + ak cos 2 k=1
=
a0 + 2
m X
ak cos
k=1
= Pm (x) + Rm (x)
k x L k x L
+ bk sen +
bk sen
k=1
k x L
x 2 [ L; L]
1 1 (Qm (x) + Qm ( x)) ; Rm (x) = (Qm (x) 2 2 se aproximan como en i) y ii) precedentes.
donde Pm (x) =
m X
k x L
Qm ( x)) con Pm par y Rm impar que
b m (x) se requiere de la siguiente información: número de términos del polinomio Para calcular Q trigonométrico Qm (x) ; extremo derecho L > 0 del intervalo [ L; L] par. Para calcular aproximaciones de los coe…cientes mediante el método de los trapecios se requiere conocer el número de puntos n del intervalos [0; L] : Adicionalmente requerimos de una aproximación de : Con esta información, proponemos el siguiente algoritmo de cálculo de Qm (x) Algoritmo Datos de entrada: m; n 2 Z+ ; L; x 2 R; función f:
b m (x) : Datos de salida: Q 1. pi = 3;1415926536: 2. h =
L : n
3. y0 = f (0) : 4. y1 = f (L) : 5. Para k = 0; 1; : : : ; m S = 0: Si k = 0 entonces para j = 1; : : : ; n
1
xj = jh S = S + f (xj ) …n bucle j a0 =
1 2 (y0 + y1 ) + S n n
504
CAPÍTULO 9. MÍNIMOS CUADRADOS S=0 Si a < k
n entonces
para j = 1; : : : ; n
1
S = s + f (xj ) cos
k j n
…n de bucle j b ak =
1 2 (y0 + y1 cos (k )) + S n n
Fin de bucle k 6. S = 0 7. Para k = 1; : : : ; m S = S +b ak
cos
k x L
Fin de bucle k
1 8. Qm (x) = b a0 + S 2
9. Imprimir x; Qm (x) 10. Fin Para los otros casos se elaboran algoritmos muy similares, por lo que se propone como ejercicio
9.9.
Ejercicios
1. Para la función f de…nida en [0; 1] que en cada item se propone, hallar el polinomio P que mejor se aproxima en mínimos cuadrados a la función f: a) f (x) = ex ; y P (x) = a + bx x 2 [0; 1] b) f (x) = e
x;
y P (x) = a + bx + cx2 x 2 [0; 1] p c) f (x) = sen x; y P (x) = a + bx x 2 [0; 1] : d) f (x) = x + 1; y P (x) = a + bx + cx2 x 2 [0; 1] : 2. Supongamos que se dispone del conjunto de n pares de datos experimentales S = f(xi ; yi ) 2 R2 j i = 1; :::; ng que en cada item se indica: Encontrar un polinomio P de grado n que se indica y que mejor se ajusta al conjunto de datos. a) S = f(0; 1); (1; 1); (2; 1); (3; 3)g y P (x) = a + bx
x 2 R:
b) S = f(0; 0); (1; 1); (2; 0); (3; 3); (4; 8)g y P (x) = a + bx + cx2 c) S = f(0; 0); (1; 1); (2; 0); (3; 3); (4; 8)g y P (x) = a + bx + cx2 d) S = f(0; 1); (1; 4); (2; 9); (3; 16); (4; 25)g y P (x) = a + bx +
cx2
x 2 R: x 2 R: x 2 R:
@f 3. Sea f una función real dependiente de un parámetro c. Escribiremos t = f (x; c) : Suponga que @c es continua. Se dispone de un conjunto de datos experimentales S = (xi ; yi ) 2 R2 j i = 1; : : : ; n y se asume que cada yi = f (xi ; c) + ri (c) ; donde ri (c) denota el error en la observación yi ; i = 1; : : : ; n:
9.9. EJERCICIOS
505
En el método de mínimos cuadrados se considera el problema siguiente: mn c2R
Se de…ne E (c) =
n P
i=1
ri2 (c) =
n P
(yi
n X
ri2 (c) :
i=1
f (xi ; c))2 :
i=1
a) Elaborar un algoritmo para aproximar b c 2 R tal que
E (b c) = m n E (c) : c2R
b) Se considera la siguiente información experimental: S = f(1; 1;35) ; (1;5; 0;498) ; (2; 0;183) ; (2;2; 0;123)g Aplique el método de mínimos cuadrados para calcular la constante b c > 0 tal que f (t) = 10e c) Se considera el siguiente conjunto de datos
b ct :
S = f(0;26; 5) ; (0;785; 5) ; (0;5; 8;7) ; (1;05; 8;7)g Aplique el método de mínimos cuadrados para calcular la constante b c tal que f (t) = 10 sin (ct) :
4. Sea F una función real dependiente de dos parámetros a y b.
@2f @2f @2f ; ; son continuas. @a2 @b2 @a@b Se dispone de un conjunto de datos experimentales
Escribiremos y = f (x; a; b) : Se supone que
S = (xi ; yi ) 2 R2 j i = 1; : : : ; n ; n
3:
Y se asume que cada yi = f (xi ; a; b) + ri (a; b) ; donde ri (a; b) denota el error en la observación yi ; i = 1; : : : ; n: En el método de mínimos cuadrados se considera el problema mn
(c)a;b2R2
n X
ri2 (a; b) :
(P)
i=1
A …n de calcular los parámetros a y b usando la información experimental, de…nimos E (a; b) =
n X i=1
ri2 (a; b) =
n X
(yi
f (xi ; a; b))2 :
i=1
a) Utilice el método de Newton y elabore un algoritmo para aproximar b a; bb 2 R tales que E b a; bb = m n E (a; b) : (a;b)2R
b) Considere la siguiente información experimental
S = f(2; 20) ; (10; 20;2) ; (50; 21;03) ; (100; 22;1) ; (500; 33)g b Aplique el método de mínimos cuadrados para calcular los parámetros b a; bb tales que f (t) = b aebt t 0:
c) Se dispone del conjunto de datos
S = f(0;1; 50) ; (2; 3;85) ; (4; 1;02) ; (5; 0;66)g Aplique el método de mínimos cuadrados para calcular los parámetros b a; bb tales que f (x) = x 0:
a 1+bx2
506
9.10.
CAPÍTULO 9. MÍNIMOS CUADRADOS
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Análisis Matemático, Segunda Edición, Editorial Reverté, Barcelona, 1982. 2. N. Bakhvalov, Metodos Numéricos, Editorial Paraninfo, Madrid, 1980. 3. Åke Björck, Numerical Methods for Least Squares Problems, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1996. 4. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 5. John P. Boyd, Chebyshev and Fourier Spectral Methods, Second Edition (Revised), Editorial Dover Publications, Inc.,Mineola, 2001. 6. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 7. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 8. P. G. Ciarlet, Introduction á L’ Analyse Numérique Matricielle et á L’ Optimisation, Editorial Masson, París, 1990. 9. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 10. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 11. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 12. J. E. Dennis, Jr., Robert B. Schnabel, Numerical Methods for Unconstrained Optimization and Nonlinear Equations, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1996. 13. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volumi I, II Pitagora Editrice Bologna, 1983. 14. John E. Freund, Ronald E. Walpole, Estadística Matemática con Aplicaciones, Cuarta Edición, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1990. 15. Clude Gasquet, Patrick Witomski, Analyse de Fourier et Applications: Filtrage, Calcul Numérique et Ondeletles, Editorial-Dunod, París, 2000. 16. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 17. Gene H. Golub, Charles F. Van Loan, Matrix Computations, Second Edition, The Johns Hopkins University Press, Baltimore, 1989. 18. Kenneth Ho¤man, Ray Kunze, Algebra Lineal, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1987. 19. Franz E. Hohn, Algebra de Matrices, Editorial Trillas, México, 1979. 20. Robert W. Hornbeck, Numerical Methods, Quantum Publishers, Inc., New York, 1975. 21. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 22. Erwin Kreyszig, Introducción a la Estadística Matemática, Editorial Limusa, México, 1981.
9.10. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
507
23. Charles L. Lawson, Richard J. Hanson, Solving Least Squares Problems, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1995. 24. L. Lebart, A. Morineau, J.-P. Fénelon, Tratamiento Estadístico de Datos, Editorial Marcombo Boixareu Editores, Barcelona, 1985. 25. Thomas M. Little, F. Jackson Hills, Métodos Estdísticos para la Investigación en la Agricultura, Editorial Trillas, México, 2002. 26. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 27. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 28. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 29. Fazlollah Reza, Los Espacios Lineales en la Ingeniería, Editorial Reverté, S. A., Barcelona, 1977. 30. Francis Scheid, Theory and Problems of Numerical Analysis, Schaum’s Outline Series, Editorial McGraw-Hill, New York, 1968. 31. M. Sibony, J. Cl. Mardon, Analyse Numérique I, Sustèmes Linéaires et non Linéaires, Editorial Hermann, París, 1984. 32. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 33. Gilbert Strang, Algebra Lineal y sus Aplicaciones, editorial Fondo Educativo Interamericano, México, 1982. 34. V. Voïévodine, Principes Numériques D’Algèbre Linéaire, Editions Mir, Moscú, 1976.
508
CAPÍTULO 9. MÍNIMOS CUADRADOS
Capítulo 10
Splines Resumen La teoría de los splines tiene aplicaciones en dos direcciones importantes de la matemática: la una en los métodos de resolución de ecuaciones diferenciales ordinarias, particularmente los problemas de valor inicial y los problemas de valores en la frontera; las ecuaciones en derivadas parciales y ecuaciones integrales; la otra dirección lo constituye la computación grá…ca, particularmente los modelos geométricos con splines, y el objetivo de este capítulo es dar una introducción a esta teoría. Se abordan dos clases de splines: los de interpolación y se da más énfasis a los splines cúbicos; los B-splines y particularmente los de interpolación cúbicos . En este capítulo se ha limitado los ejercicios. Al …nal del capítulo se incluye una amplia bibliografía.
10.1.
Introducción
Una spline es una función de…nida a trozos sobre intervalos de R que se unen entre si obedeciendo a ciertas condiciones de regularidad. La terminología fue introducida por I. J. Schoenberg (1946). El nombre de spline proviene del nombre del intrumento mecánico del mismo nombre que consiste en un alambre ‡exible que puede ser utilizado para dibujar curvas suaves a través de puntos asignados. Esta clase de instrumentos fueron utilizados para dibujo técnico en las industrias aeronáuticas, automotriz, naval, etc. Como aplicaciones simples de splines podemos citar el método de Euler para construir una aproximación polinomial a trozos para la solución de problemas de valor inicial de las ecuaciones diferenciales ordinarias. Este tipo de aproximación es a menudo utilizada para establecer el teorema de Peano para la existencia de soluciones de tales problemas. Con este punto de vista podemos citar también los artículos de C. Runge (1901), W. Quade y L. Collatz (1938), J. Favord (1940), R. Curant (1943). Entre los textos sobre splines, publicados recientemente, podemos citar: C. de Boor (1978); A Practical Guide to splines; L. L. Schumaker (1981): Spline Functions: Basic Theory. En la actualidad, las funciones splines se aplican fundamentalmente en gra…smo en las industrias automotriz, aeronáutica, naval; en diseño y arquitetura; en métodos numéricos para la solución numérica de ecuaciones diferenciales ordinarias o en derivadas parciales con valores iniciales y/o valores ligados a los métodos de Rayleigh-Ritz-Galerkin y Petrov-Galerkin; y se cuentan miles de artículos de splines y de sus aplicaciones.
10.2.
Espacio de funciones splines
Sean n 2 N: Se llama conjunto de nodos un conjunto de puntos (n) = fxj gj=0;:::;n ; donde a = x0 < x1 < < xn = b: Estos nodos forman una partición del intervalo [a; b] R en subintervalos [xj 1 ; xj ] ; 509
510
CAPÍTULO 10. SPLINES
j = 1; : : : ; n: Los puntos x1 ; : : : ; xn nodos frontera.
1
se llaman nodos interiores, y lospuntos x0 = a y xn = b se llaman
Un conjunto de puntos Sn = f(xi ; yi ) j xi 2 (n) ; yi 2 R; i = 0; 1; : : : ; ng ; se llama conjunto de puntos de base. Notamos con Pm el espacio de polinomios de grado m: Se designa con C 1 ([a; b]) el espacio de funciones continuas a trozos en [a; b] : Se denota con Ck 1 ([a; b]) ; a k m; el espacio de funciones que poseen derivadas continuas hasta el orden k 1 en [a; b] (C0 ([a; b]) = C ([a; b]) es el espacio de las funciones en [a; b]) : De…nición 1 Sea m 2 N: Una función S : [a; b] ! R se llama función spline polinomial de grado m si ella posee las propiedades siguientes: i) S 2 Cm
1 ([a; b]) ;
ii) S 2 Pm para x 2 [xj
1 ; xj [ ;
j = 1; : : : ; n:
Denotamos con Sm ( (n)) el conjunto de todas las funciones splines polinomiales de grado m asociadas a la subdivisión (n) de [a; b] : En lo sucesivo nos limitaremos a los splines polinomiales y nos referiremos a ellas simplemente como splines. Ejemplos
1. En la …gura siguiente se ilustra la grá…ca de una función spline de grado 0.
Figura 89
2. Sean Sn un conjunto de puntos de base. La línea poligonal que consiste en los segmentos de recta que une puntos sucesivos de Sn es un ejemplo de función spline de grado 1: En la …gura que a continuación se indica se traza una spline de grado 1:
Figura 90
10.3. INTERPOLACIÓN MEDIANTE SPLINES
511
3. Sean (n) una subdivisión del intervalo [a; b] y m 2 N: La familia de funciones fqm;j j j = 0; : : : ; n de…nidas como sigue (x xj )m ; si x 2 [xj ; b] ; qm;j (x) = 0; si x 2 [a; xj [ ; son splines de grado m asociadas a la subdivisión funciones.
1g
(n) : En la …gura siguiente se ilustran estas
Figura 91 Las funciones qm;j ;
j = 1; : : : ; n; se llaman splines de un solo lado.
Base de Sm ( (n)) El conjunto Sm ( (n)) provisto de las operaciones habituales entre funciones (adición y producto de un número real por una función) es un espacio vectorial real de dimensión m + n y una base de dicho espacio es el conjunto de funciones fp0 ; p1 ; : : : ; pm ; qm;1 ; : : : ; qm;n 1 g ; donde pi (x) = xi ;
i = 0; 1; : : : ; m;
y las funciones qm;j están de…nidas en el ejercicio 3). Se puede probar que toda función S 2 Sm ( (n)) se escribe de manera única en la forma S (x) = a0 +
m X
j
ai x +
i=1
donde a0 ; ai ; bj 2 R;
10.3.
n X1
bj qm;j (x)
j=1
x 2 [a; b] ;
i = 1; : : : ; m; j = 2; : : : ; m:
Interpolación mediante splines
Centraremos nuestra atención en la interpolación mediante splines de grado uno y tres que son las más utilizadas en las aplicaciones. La ventaja del método de interpolación mediante splines es el uso de polinomios de grado bajo para producir globalmente interpolantes suaves, al tiempo que evita la desventaja del uso de polinomios de interpolación de grado alto. Splines de interpolación de grado 1 Sea f : [a; b] ! R una función continua de…nida en [a; b] y
(n) una subdivisión de [a; b] :
512
CAPÍTULO 10. SPLINES
Sea Sn = f(xi ; f (xi )) j xi 2 (n) ; i = 0; 1; : : : ; ng un conjunto de puntos de base. El ejemplo más simple de splines de grado 1 es el spline lineal que consiste en segmentos de recta que unen puntos sucesivos de Sn ; de este modo se obtiene una línea poligonal. La spline interpolante de grado 1 está de…nida de manera única en cada subintervalo [xj 1 ; xj ] j = 1; : : : ; n; como una función afín de…nida en dicho subintervalo y que globalmente es la única línea poligonal obtenida al juntar todos los segmentos de recta. Buscamos una función real S de…nida en [a; b] que veri…que las propiedades siguientes: i) S 2 C ([a; b]) ; ii) S 2 P1 para x 2 [xj iii) S (xj ) = f (xj ) ;
1 ; xj [ ;
j = 1; : : : ; n;
j = 0; 1; : : : ; n:
Para construir una tal función S; determinemos j; S (x) = S (xj
1)
+
j x;
= f (xj
1) ;
j
j
constantes tales que
x 2 [xj
1 ; xj ] ;
j = j = 1; : : : ; n;
S (xj ) = f (xj ) : Entonces S (xj
1)
=
j
+
j xj 1
S (xj ) =
j
+
j xj
= f (xj
1) ;
= f (xj ) :
Resolviendo el sistema de ecuaciones, obtenemos j
= f (xj
j
=
f (xj ) xj
f (xj ) xj
f (xj xj 1
1)
f (xj ) f (xj xj xj 1 f (xj 1 ) : xj 1
1)
xj
1;
Por lo tanto la función S se escribe S (x) = f (xj
1)
+
1)
(x
xj
1) ;
x 2 [xj
que es la ecuación de la recta que pasa por los puntos (xj intervalo [xj 1 ; xj ] ; la misma que se escribe S (x) =
x xj
1
xj x f (xj ) + xj xj
xj xj
1
1; f
f (xj
(xj
1) ;
1 ; xj ] 1 ))
j = 1; : : : ; n;
y (xj ; f (xj )) restringida al
j = 1; : : : ; n:
1
Estimación del error De…nimos pj;1 (x) =
x xj ; xj 1 xj
pj;2 =
pj;1 (x)
0;
x xj
xj xj
1 1
8x 2 [xj
1 ; xj ] :
Se tiene entonces que
pj;1 (x) + pj;2 (x) = 1;
pj;1 (x)
0;
8x 2 [a; b] ;
8x 2 [xj
1 ; xj ] ;
j = 1; : : : ; n;
de donde f (x) = pj;1 (x) f (x) + pj;2 (x) f (x) y jf (x)
S (x)j
Max fjf (x)
f (xj
1 )j ;
jf (x)
f (xj )jg :
10.3. INTERPOLACIÓN MEDIANTE SPLINES
513
El módulo de continuidad de f relativo al intervalo [xj wf ( ) =
Sup jt1 t2 j t1 ;t2 2[xj 1 ;xj ]
donde
1 ; xj ]
se de…ne por
jf (t1 )
f (t2 )j ;
> 0:
El módulo de continuidad veri…ca las propiedades siguientes: i) wf ( 1 )
wf ( 2 ) para 0 <
2;
1
ii) wf ( ) ! 0: !0
Utilizando el módulo de continuidad, tenemos Max
x2[xj
Sea h = max jxj j=1;:::;n
xj
1j :
1 ;xj ]
jf (x)
S (x)j
wf (jxj
xj
1 j) ;
j = 1; : : : ; n:
Se tiene entonces la siguiente estimación del error: kf
SkL1 (a;b) = Max jf (x)
S (x)j
x2[a;b]
wf (h) :
De la de…nición de wf (h) ; se sigue que kf
SkL1 (a;b) ! 0; h!0
esto es, las splines de interpolación lineales convergen uniformemente a f 2 C ([a; b]) cuando h ! 0: Si f 2 C1 ([a; b]) ; se tiene la siguiente estimación de error: kf
SkL1 (a;b)
Si f 2 C2 ([a; b]) ; entonces kf
10.3.1.
SkL1 (a;b)
h wf 0 (h) : 4 h2 0 f 8
L1 (a;b)
:
Splines cúbicas de interpolación
Consideremos f 2 C2 ([a; b]) ;
(n) una subdivisión de [a; b] y Sn = f(xi ; f (xi )) j xi 2 (n) ;
i = 0; : : : ; ng
un conjunto de puntos de base. Puesto que dim S3 ( (n)) = n + 3; si se requiere interpolar en cada uno de los n + 1 nodos x0 ; : : : ; xn ; entonces quedan 2 parámetros libres que pueden ser utilizados en los tipos de splines siguientes: a) Interpolación con condiciones de frontera de Hermite Hallar S 2 S3 ( (n)) tal que i) S (xj ) = f (xj ) ; ii)
S 0 (a)
=
f 0 (a) ;
iii) S 0 (b) = f 0 (b) :
j = 0; 1; : : : ; n;
514
CAPÍTULO 10. SPLINES
b) Intepolación con condiciones de frontera naturales Suponemos que n
2:
Hallar S 2 S3 ( (n)) tal que i) S (xj ) = f (xj ) ; ii)
S 00 (a)
=
S 00 (b)
j = 0; 1; : : : ; n;
= 0:
c) Interpolación con condiciones de frontera periódicas (f (a) = f (b) y f 0 (a) = f 0 (b)) Hallar S 2 S3 ( (n)) tal que i) S (xj ) = f (xj ) ;
j = 0; 1; : : : ; n;
ii) S 0 (a) = S 0 (b) ; iii) S 00 (a) = S 00 (b) : Con el propósito de mostrar que los problemas a), b) y c) tienen solución única, enunciamos la propiedad siguiente de las splines cúbicas, conocida como relación integral. Relación integral Sea f 2 C2 ([a; b]) y S 2 S3 ( (n)) una función spline de interpolación de f tal que la diferencia E (x) = f (x) S (x) x 2 [a; b] ; satisface la condición de frontera S 00 (a) E 0 (a) = S 00 (b) E 0 (b) : Entonces
Z
b
f 00 (x)
2
dx =
a
Z
b
f 00 (x)
S 00 (x)
2
a
dx +
Z
b
S 00 (x)
2
dx:
a
De esta relación, vemos que 1. Si E 0 (a) = E 0 (b) = 0; entonces se tiene las splines del tipo a). 2. Si S 00 (a) = S 00 (b) = 0; entonces se tiene las splines del tipo b). 3. Si S 00 (a) = S 00 (b) y E 0 (a) = E 0 (b) ; corresponden entonces a las splines del tipo c). Usando la relación integral se prueba que los problemas de interpolación a), b) y c) tienen siempre una única solción S 2 S3 ( (n)) : Construcción Dada una función f 2 C2 ([a; b]) ; para construir la función spline de interpolación S, aplicamos las condiciones de las funciones splines y de las splines cúbicas al polinomio cúbico siguiente: Sj (x) = aj + bj (x S (x) = Sj (x) ;
x[
xj ) + cj (x
xj )2 + dj (x
xj )3 ;
j ; xj+1 ] ;
j = 0; 1; : : : ; n
1:
x 2 [xj ; xj+1 ] ;
j = 0; 1; : : : ; n
Por i) de los tipos de splines a), b) y c), se tiene Sj (xj ) = aj = f (xj ) ;
j = 0; 1; : : : ; n
1;
y ponemos an = f (xn ) : De la de…nición de función spline (continuidad en cada nodo), se obtiene aj+1 = Sj+1 (xj+1 ) = Sj (xj+1 ) = aj + bj (xj+1
xj ) + cj (xj+1
xj )2 + dj (xj+1
xj )3 ;
1;
10.3. INTERPOLACIÓN MEDIANTE SPLINES para j = 0; 1; : : : ; n
515
1:
Notamos con hj = xj+1
xj ; j = 0; 1; : : : ; n
1: Entonces la relación precedente se escribe
aj+1 = aj + bj hj + cj h2j + dj h3j : La derivada de Sj (x) es la función Sj0 (x) = bj + 2cj (x
xj )2 ;
xj ) + 3dj (x
x 2 [xj ; xj+1 ] ; j = 0; 1; : : : ; n
1;
de donde Sj0 (xj ) = bj ;
j = 0; 1; : : : ; n
1:
De…nimos bn = S 0 (xn ) : Por la cotinuidad de Sj0 en cada nodo xj ; tenemos 0 bj+1 = Sj+1 (xj+1 ) = Sj0 (xj+1 ) = bj + 2cj hj + 3dj h2j ;
j = 0; 1; : : : ; n
1:
La derivada segunda de Sj (x) está dada por Sj00 (x) = 2cj + 6dj (x
xj ) ;
x 2 [xj ; xj+1 ] ; j = 0; 1; : : : ; n
1;
de donde Sj00 (xj ) = 2cj ;
j = 0; 1; : : : ; n
1;
1 y de…nimos cn = S 00 (xn ) ; 2 Nuevamente, utilizando la continuidad de Sj00 (x) en cada nodo xj ; tenemos: 1 00 1 1 Cj+1 = Sj+1 (xj+1 ) = Sj00 (xj+1 ) = (2cj + 6dj hj ) = cj + 3dj hj ; 2 2 2
j = 0; 1; : : : ; n:
Obtengamos relaciones que liguen los coe…cientes bj ; cj ; dj en términos de los datos aj = f (xj ) ; j = 0; 1; : : : ; n: Resulta dj =
cj+1 cj ; 3hj
con lo cual cj+1 cj 3 1 hj = aj + bj hj + (2cj + cj+1 ) h2j ; 3hj 3 cj+1 cj 2 = bj + 2cj hj + 3 hj = bj + (cj + cj+1 ) hj ; j = 0; 1; : : : ; n 3hj
aj+1 = aj + bj hj + cj h2j + bj+1
Para obtener la relación …nal entre los coe…cientes, de la igualdad aj+1 = aj + bj hj + obtenemos bj =
1 (aj+1 hj
aj )
1 (2cj + cj+1 ) h2j ; 3
hj (2cj + cj+1 ) ; 3
j = 0; 1; : : : ; n
y para j = 0; 1; : : : ; n : bj
1
=
1 hj
(aj
aj
1)
1
hj 3
1
(2cj
1
+ cj ) ;
con lo cual la relación bj+1 = bj + (cj + cj+1 ) hj se expresa en la forma bj = b j
1
+ (cj
1
+ cj ) hj
1;
j = 1; : : : ; n;
1;
1:
516
CAPÍTULO 10. SPLINES
y hj hj 1 1 1 (aj+1 aj ) (aj aj 1 ) (2cj + cj+1 ) = (2cj 1 + cj ) + (cj 1 + cj ) hj 1 ; hj 3 hj 1 3 de donde hj hj 1 1 1 (aj+1 aj ) (aj aj 1 ) = (2cj + cj+1 ) (2cj 1 + cj ) + (cj 1 + cj ) hj 1 hj hj 1 3 3 1 2 1 = hj 1 cj 1 + (hj 1 + hj ) cj + hj cj+1 ; 3 3 3 o bien 1 0 cj 1 3 3 (hj 1 ; 2 (hj 1 + hj ) ; hj ) @ cj A = (aj+1 aj ) (aj aj 1 ) ; j = 1; : : : ; n 1: hj hj 1 cj+1 Ponemos ! c t = (c ; c ; : : : ; c ) : El sistema de ecuaciones precedente involucra únicamente el vector ! c ; las 0
n
1
longitudes de los subintervalos [xj de la subdivisión de [a; b] :
10.3.2.
1 ; xj ] ;
j = 1; : : : ; n y los valores de f en los puntos (n) = fxj gj=1;:::;n
Interpolación con condiciones de frontera de Hermite
Sea f 2 C (4) ([a; b]) ; f tiene una única spline cúbica de interolaciíon S 2 S3 ( (n)) que satisface las condiciones de frontera de hermite S 0 (a) = f (a) y S 0 (b) = f 0 (b) : En efecto, S 0 (a) = S 0 (x0 ) = b0 = f 0 (a) ; y para j = 0; b0 está dado por b0 =
1 (a1 h0
h0 (2c0 + c1 ) ; 3
a0 )
resulta que 2h0 c0 + h0 c1 =
3 (a1 h0
3f 0 (a) +
a0 ) :
De manera similar, tenemos S 0 (b) = S 0 (xn ) = bn = f 0 (b) : Como bn = bn
1
+ hn
1 (cn 1
+ cn ) ;
y bn
1
=
1 hn
(an
an
hn 3
1)
1
1
(2cn
1
+ cn ) ;
se tiene entonces que 1
f 0 (b) =
hn 1 hn
=
(an
an
(an
an
1
1
hn 3 hn 1) + 3 1)
1
1
(2cn (cn
con lo cual hn
1 cn 1
+ 2hn
1 cn
1
1
+ cn ) + hn
+ cn )
+ 2cn ) ;
3 hn
= 3f 0 (b)
1 (cn 1
(an
an
1) :
1
En resumen, tenemos que 2h0 c0 + h0 c1 = 0 1 cj 1 (hj 1 ; 2 (hj 1 + hj ) ; hj ) @ cj A = cj+1 hn
1 cn 1
+ 2hn
1 cn
3f 0 (a) + 3 (aj+1 hj
= 3f 0 (b)
3 (a1 h0 aj ) 3
hn
a0 ) ; 3 hj+1
(an 1
(aj
an
1) ;
aj
1) ;
j = 1; : : : ; n
1;
10.3. INTERPOLACIÓN MEDIANTE SPLINES
517
que puede expresarse en forma compacta como un sistema de ecuaciones ! ! AC = b ; donde
0
1 2h0 h0 0 0 ::: 0 B h0 2 (h0 + h1 ) h1 0 ::: 0 C B C B 0 h1 2 (h1 + h2 ) h2 : : : 0 C B C C: .. .. .. A=B B ... C . . . B C B .. C .. .. .. @ . . . . hn 1 A 0 ::: ::: : : : hn 1 2hn 1 1 0 3 (a1 a0 ) 3f 0 (a) + C B h0 C B 3 3 C B C B h (a2 a1 ) h (a1 a0 ) 1 0 C ! B C B .. b =B . C C B 3 C B 3 B (an an 1 ) (an 1 an 2 ) C C B hn 1 hn 2 A @ 3 0 3f (b) (an an 1 ) hn 1 La matriz A es simétrica, estrictamente diagonal dominante, por lo tanto el sistema de ecuaciones precedente tiene solución única. El método de resolución numérica que puede utilizarse es el de factorización LU de Crout o de Doolitle. Una vez calculados los coe…cientes c0 ; c1 ; : : : ; cn ; los coe…cientes bj se calculan usando la relación bj =
1 (aj+1 hj
aj )
y los coe…cientes dj por
hj (2cj + cj+1 ) ; 3
cj+1 + cj ; 3hj
dj = Finalmente, se de…ne S (x) = Sj (x) ;
x 2 [xj
j = 1; : : : ; n
j = 0; 1; : : : ; n
1 ; xj ] ;
1;
1:
j = 1; : : : ; n:
El error de interpolación en la norma L1 (a; b) satisface la desigualdad siguiente; kf donde M = f (4) Es claro que kf
10.3.3.
L1 (a;b)
;h =
SkL1 (a;b)
5 M h4 ; 384
Max hj :
j=0;1;:::;n
SkL1 (a;b) ! 0; es decir que S converge uniformemente a f cuando h ! 0: h!0
Interpolación con condiciones de frontera naturales
Sea f 2 C (4) ([a; b]) ; f tiene una única splice cúbica de interpolación S 2 S3 ( (n)) que satisface las condiciones de frontera naturales S 00 (a) = S 00 (b) = 0: Efectivamente, 0 = S 00 9a = S 00 (x0 ) = 2c0 + 6d0 (x0
x0 ) ;
de donde c0 = 0;
S 00 (xn ) S 00 (b) = = 0: 2 2 Así, c0 = 0; cn = 0: Para j = 1; : : : ; n 1; tenemos 0 1 cj 1 3 (hj 1 ; 2 (hj 1 + hj ) ; hj ) @ cj A = (aj+1 aj ) hj cj+1 cn =
3 hj
(aj 1
aj
1) ;
518
CAPÍTULO 10. SPLINES
que podemos escribir como un sistema de ecuaciones lineales ! ! AC = b ; donde
0
B B B B B A=B B B B B @
1 0 0 0 h0 2 (h0 + h1 ) h1 0 0 h1 2 (h1 + h2 ) h2 .. .. .. .. . . . . .. .. .. . . . 0 0 hn 2 2 (hn 0 0 ::: ::: 0 0 3 B 3 B (a a1 ) (a1 a0 ) B h1 2 h0 ! B . b =B B .. B 3 3 B (an an 1 ) (an 1 @ h h n 1 n 2 0
::: ::: ::: ..
. 2 + hn 0
1)
hn 1
1
an
1
0 0 0 .. . .. . 1
C C C C C C C C C C A
C C C C C C C C 2) A
La matriz A es estrictamente diagonalmente dominante. Esto implica que el siste,a de ecuaciones precedente tiene solución única. El método numérico de resolución de tal sistema es el de factorización deCrout o de Doolitle. ! ! ! Sea C t = (c0 ; c1 ; : : : ; cn ) la solución del sistema de ecuaciones A C = b : Los coe…cientes bj y dj se calculan usando las fórmulas siguientes: bj
=
dj
=
aj+1 aj hj cj+1 cj 3hj
hj (cj+1 + 2cj ) 3 j = 0; 1; : : : ; n
j = 0; 1; : : : ; n
1;
1:
Note que bn = S 0 (b) y dn = 0: De…nimos S (x) = Sj (x) x 2 [xj
1 ; xj ] ;
j = 1; : : : ; n:
Se tiene entonces la siguiente estimación de error kf
SkL1 (a;b)
C f (4)
L1 (a;b)
h4 ;
donde C > 0 es una constante independiente de n y h = Max hj : j=1;:::;n
10.3.4.
Interpolación con condiciones de frontera periódicas
Sea f 2 C 4 ([a; b]) : f tiene una única spline cúbica de interpolación S 2 S3 ( (n)) que satisface las condiciones de frontera S 0 (a) = S 0 (b) ; S 00 (a) = S 00 (b) : Mediante un razonamiento similar a los dos casos a) y b), se obtiene el sistema de ecuaciones lineales siguiente: ! ! AC = b ; donde
0
B B B B A=B B B @
2 (h0
hn
1)
h0 0 .. .
h0 2 (h0 + h1 ) h1 .. .
0 h1 2 (h1 + h2 ) .. .
0 0 h2 .. .
0 0
0 h0
::: :::
::: :::
::: ::: ::: .. . hn 0
hn 0 0 .. . 2
2 (hn
2
+ hn
hn
1
1
0 0 0 .. .
1
1)
hn 2 (h0
1
hn
1)
C C C C C C C A
10.4. SPLINES CUADRÁTICAS 0
B B B B ! B B b =B B B B B @
519 3
(an
an
3 (a1 h0
1)
a0 )
hn 1 3 3 (a2 a1 ) (a1 a0 ) h1 h0 .. . 3 3 (an an 1 ) (an 1 an hn 1 hn 2 3 3 (an an 1 ) (a1 a0 ) hn 1 h0
1
C C C C C C C C C ) 2 C C A
El valor de S (x) para x 2 [a; b] se obtiene de manera análoga a los casos a) y b). El error de interpolación es idéntico al caso b)
10.4.
Splines cuadráticas
El espacio S2 ( (n)) de las splines cuadráticas correspondientes a la subdivisión (n) = fxj gj=0;:::;n tiene dimensión n + 2: Si deseamos construir una función spline S de interpolación en cada nodo, nos queda entonces exactamente un parámetro llibre, y por lo tanto es imposible imponer condiciones de frontera simétricas como en el caso de splines de grado impar discutidas en la seccion precedente. A continuación proponemos dos problemas de interpolación que conducen a de…nir de manera única splines cuadráticas y que tienen condiciones simétricas de frontera. Para lograr esto, introducimos las subdivisiones de [a; b] siguientes: 1 (n
1) = fyj gj=0;1;:::;n
1;
(n) = fxj gj=0;1;:::;n
tales que a = x0 = y0 < x1 < y1 < x2 < Entonces el espacio S2 ( a) Hallar S 2 S3 (
1 (n
1 (n
< xn
1
< yn
1
= kn = b:
1)) tiene dimensión n + 1; mientras que S2 ( (n)) tiene dimensión n + 2:
1)) tal que S (xj ) = f (xj ) ;
j = 0; 1; : : : ; n;
donde f es una función dada de…nida en [a; b] : b) Sea f 2 C1 ([a; b]) : Hallar S 2 S2 ( (n)) tal que S (yj ) = f (yj ) ; 0
j = 0; 1; : : : ; n
1;
0
S (y0 ) = f (a) ; 0
S (yn
1)
= f 0 (b) :
Utilizando el teorema de Rolle se demuestra que los problemas a) y b) tienen solución única. Interpolación cuadrática para el problema a) Sea f una función de…nida en [a; b] : Consideremos las subdivisiones de…nidas. Buscamos una función S 2 S2 ( 1 (n 1)) tal que S (xj ) = f (xj ) ;
1 (n
1) y
(n) de [a; b] arriba
j = 0; 1; : : : ; n:
De la de…nición de función spline, S es un polinomio de grado 2 en cada subintervalo [yj j = 1; : : : ; n 1: De…nimos Sj (x) = aj + bj (x
xj ) + cj (x
xj )2 ;
j = 0; 1; : : : ; n
1;
1 ; yj ] ;
520
CAPÍTULO 10. SPLINES
y determinemos las constantes aj ; bj y cj : Tenemos Sj (xj ) = aj = f (xj ) ;
j = 0; 1; : : : ; n:
De la continuidad de S en yj ; tenemos Sj+1 (yj+1 ) = Sj (yj+1 ) ;
j = 1; : : : ; n
2;
de donde aj+1 + bj+1 (yj+1
xj+1 ) + cj+1 (yj+1
xj+1 )2 = aj + bj (yj+1
xj ) + cj (yj+1
xj )2 :
La derivada de Sj es la función de…nida por Sj0 (x) = bj + 2cj (x
xj ) ;
j = 0; 1; : : : ; n
1:
La continuidad de S 0 en yj nos permite obtener la relación siguiente: bj+1 + 2cj+1 (yj+1
xj+1 ) = bj + 2cj (yj+1
xj ) ;
j = 1; : : : ; n
2:
Para determinar los coe…cientes bj y cj ; imponemos la condición S 0 (xj ) = 0: Entonces 0 = S 0 (xj ) = Sj0 (xj ) = bj ; Luego cj+1 = cj
yj+1 yj+1
xj ; xj+1
j = 0; 1; : : : ; n:
j = 1; : : : ; n
2:
Puesto que xj+1 )2 = aj + cj (yj
aj+1 + cj+1 (yj+1 pues bj = 0; 8j = 1; : : : ; n
1
xj )2 ;
j = 1; : : : ; n
2;
2: Resulta que
aj+1 + cj
yj+1 yj+1
de donde cj =
(yj+1
xj (yj+1 xj+1
aj+1 aj xj ) (xj+1
xj )2 = aj + cj (yj+1
=
xj )
xj )2 ;
f (xj+1 ) f (xj ) : (yj+1 xj ) (xj+1 xj )
Así, Sj (x) = f (xj ) +
f (xj+1 ) f (xj ) (x (yj+1 xj ) (xj+1 xj )
xj )2 ;
j = 0; 1; : : : ; n
1:
De…nimos S (x) = Sj (x) ; Con frecuencia la subdivisión y0 = a; yn
1 (n 1
x 2 [yj
1 ; yj ] ;
j = 1; : : : ; n
1:
1) se selecciona de la manera siguiente:
= b y yj = xj + tj (xj+1
xj ) ;
j = 1; : : : ; n
2;
donde tj 2 ]0; 1[ : 1 1 ; entonces yj = (xj + xj+1 ) ; j = 1; : : : ; n 2 2 subintervalos [xj ; xj+1 ] ; j = 1; : : : ; n 2:
Si tj =
2 que corresponden a los puntos medios de los
Interpolación cuadrática para el problema b) De…nimos Sj (x) = aj + bj (x
yj ) + cj (x
yj )2 ;
x 2 [xj
1 ; xj ] ;
j = 0; 1; : : : ; n
Entonces Sj (yj ) = aj + f (yj ) ;
j = 0; 1; : : : ; n
1:
1:
10.5. B - SPLINES
521
La continuidad de S en cada nodo xj nos conduce a la siguiente relación: aj+1 + bj+1 (xj+1
yj )2 = aj + bj (xj+1
yj ) + cj+1 (xj+1
yj ) + cj (xj+1
yj )2 ;
j = 0; 1; : : : ; n
2;
y la continuidad de S 0 en cada nodo xj ; nos da la igualdad siguiente: bj+1 + 2cj+1 (xj+1
yj ) = bj + 2cj (xj+1
Por otro lado, S00 (x) = b0 + 2c0 (x
yj ) ;
j = 0; 1; : : : ; n
2:
a) ; entonces S00 (a) = b0 = f 0 (a) :
Además Sn0
1 (x)
= bn
Sn0
1 (b)
1
+ scn
1 (x
yn
1) ;
con lo cual = bn
1
= f 0 (b) :
Combinando las relaciones anteriores, obtenemos cj bj+1
=
aj
aj+1 2
(xj+1 yj ) = bj + 2 (xj+1
=
f (yj )
f (yj+1 )
(xj+1 yj )2 yj ) (cj cj+1 ) ;
;
j = 0; 1; : : : ; n
j = 0; 1; : : : ; n
2;
3:
Note que S0 (x) = f (a) + f 0 (a) (x Sn
1 (x)
= f (b) + f 0 (b) (x
f (a) f (y1 ) (x a)2 ; (x1 a)2 f (yn 2 ) f (b) (x b)2 : b) + (b yn 2 )2 a) +
Finalmente Sj (x) = f (yj ) + bj (x
10.5.
yj ) + cj (x
yj )2 ;
x 2 [xj
1 ; xj ] ;
j = 1; : : : ; n
2:
B - Splines
En las secciones precedentes construimos los espacios de splines Sm ( (n)) para una subdivisión dada (n) = fxj gj=0;:::;n : Estos espacios tienen dimensión m + n y una base de Sm ( (n)) en la familia de funciones fp0 ; p1 ; : : : ; pm ; qm;1 ; : : : ; qm;n g : En esta sección discutiremos bases alternativas para espacios de splines mejor adaptadas a los aspectos numéricos. Estas funciones fueron introducidas por Schoenberg y las denominó ”Curvas básicas de Splines” que en la actualidad se conocen simplemente como B - Splines. Notamos con
1
= fxj gj2Z una subdivisión de R tal que xj
8j 2 Z: De…nición 2 Sea
1
1; xj
! +1; y xj < xj+1 ;
j!+1
una subdivisión de R: Se nota con Bm;j la función de R en R tal que
i) Bm;j (x) = 0 si x 2 R
[xj ; xj+m+1 [ ;
j 2 Z;
ii) Bm;j 2 Pm sobre cada subintervalo [xi ; xj+1 ] ; Z +1 Z xj+m+1 iii) Bm;j (x) dx = Bm;j (x) dx = 1 1
!
j! 1
xj
i = j; : : : ; j + m + 1;
522
CAPÍTULO 10. SPLINES
Las funciones Bm;j se llaman B - Splines. La condición iii) se conoce con el nombre de condición de normalización. Se puede probar que existe una única función Bm;j que veri…ca i), ii) y iii). Las funciones fBm;j j j 2 Zg forman una base del espacio de splines Sm (
1) :
Ejemplos
1. B - spline de grado 0: Se nota con B0;j a las B-splines de grado cero. En la …gura siguiente se muestra la grá…ca de B0;j :
Figura 92
De la de…nición de B-splines, se tiene que 8 < 0; si x 2 R [xi ; xj+1 [ ; 1 B0;j (x) = ; si x 2 [xi ; xj+1 [ : : xj+1 xj Note que B0;j 2 P0 sobre [xi ; xj+1 [ ; e
Z
+1
B0;j (x) dx = 1: 1
Se tiene las siguientes propiedades: i) Sop (B0;j ) = [xi ; xj+1 ] ; 8j 2 Z: ii) B0;j (x)
0; 8x 2 R; 8j 2 Z:
iii) B0;j es continua por la derecha en todo R: iv)
+1 P
j= 1
B0;j (x) = 1; 8x 2 R:
v) La familia fB0;j j j 2 Zg es una base de S0 ( 1 ) ; pues si S 2 S0 ( +1 P x 2 [xj ; xj+1 [ ; j 2 Z: Resulta que S (x) = B0;j (x) :
1) ;
entonces S (x) = cj si
j= 1
2. B-spline de grado 1: Notamos con B1;j a las B-splines de grado uno y que se de…nen como sigue: 8 0; si x 2 R [xj ; xj+2 ] ; > > > > > < x xj ; si x 2 [x ; x [ ; j j+1 xj+1 xj B1;j (x) = > > > xj+2 x > > : xj+2 xj+1 ; si x 2 [xj+1 ; xj+2 [ ;
j 2 Z:
10.5. B - SPLINES
523
En la …gura siguiente se ilustra la grá…ca de esta función.
Figura 93
A estas funciones se les denomina también funciones techo. Se tienen las propiedades siguientes: i) Sop (B1;j ) = [xj ; xj+2 ] ; 8j 2 Z: ii) B1;j (x)
0; 8x 2 R; 8j 2 Z:
iii) B1;j 2 C1 (R) : +1 P iv) B1;j (x) = 1; 8x 2 R: j= 1
v)
+1 P
j= 1
cj B1;j =
de…nidas por
+1 P
[cj v1;j + cj
j= 1
1 (1
v1;j )] B0;j ; donde fv1;j j j 2 Zg es la familia de funciones
v1;j (x) = Note que B1;j = v1;j B0;j + (1
x xj ; xj+1 xj
j 2 Z:
v1;j+1 ) B0;j+1 :
vi) Para cada S 2 S1 ( (n)) en el intervalo [x0 ; xn ] ; se tiene una única representación en términos de B-splines: n X1 S (x) = 1 B1;i (x) ; i 2 R: i= 1
B - splines cuadráticos. 3. Sean h > 0; x0 2 R y xj = x0 + jh; j 2 Z:
Consideremos ahora splines en puntos igualmente espaciados
1
= fxj gj2Z:
Una B-spline cuadrática de grado 2 con respecto de 1 se nota con B2;j y se de…ne por 8 1 > (x xj )2 ; si x 2 [xj ; xj+1 [ ; > > 2 > 2h > h i > > < 1 h2 + 2h (x x ) 2 (x x )2 ; si x 2 [x ; x [ ; j+1 j+1 j+1 j+2 2h2 j 2 Z: B2;j (x) = > 1 > 2 > > (xj+1 x) ; si x 2 [xj+2 ; xj+3 [ ; > 2 > > : 2h 0; si x 2 R [xj ; xj+3 ] ;
4. B - splines cúbicas
Tal como en el caso de B-splines cuadráticas, consideramos igualmente espaciados. Una B-spline cúbica de grado 3 se de…ne por 8 (x xj )3 ; si x 2 [xj ; xj+1 [ ; > > > > 2 > > h3 + 3h2 (x xj+1 ) + 3h (x xj+1 ) < 1 B3;j (x) = 3 h3 + 3h2 (xj+3 x) + 3h (xj+3 x)2 6h > > > > (xj+4 )3 ; si x 2 [xj+3 ; xj+4 [ ; > > : 0; si x 2 R [xj ; xj+4 ] ;
1
= fxj gj2Z una subdivisión en puntos
3 (x
xj+1 )3 ; si x 2 [xj+1 ; xj+2 [ ;
3 (xj+3
x)2 ; si x 2 [xj+2 ; xj+3 [ ;
524
CAPÍTULO 10. SPLINES
Las funciones B-splines descritas en los ejemplos 1) a 4) son ampliamente utilizadas en el método de elementos …nitos para la resolución numérica de problemas de valores de frontera y/o de condiciones iniciales.
10.5.1.
Interpolaciones mediante B-splines cúbicas
Sea f : [a; b] ! R una función de…nida en [a; b] : Buscamos una función S 2 S3 ( (n)) tal que S (xj ) = f (xj ) ; donde
j = 0; 1; : : : ; n;
(n) es una subdivisión en puntos igualmente espaciados.
Para lograrlo, necesitamos los valores de los B-splines B3;j ; j = 3; : : : ; n 1 en los nodos x0 = 0 00 en x = a para j = a; x1 ; : : : ; xn = b; así como los valores de las derivadas B3;j o B3;j 3; 2; 1 y en 0 xn = b para j = n 3; n 2; n 1: En la tabla siguiente se ilustran estos valores: xj B3;j (x)
0
0 (x) B3;j
0
00 (x) B3;j
0
xj+1
xj+2
xj+3
1 6 1 2h 1 h2
2 3
1 6 1 2h 1 h2
0 2 h2
xj+4 0 0 0
Sea S 2 S3 ( (n)) : Supongamos que S (x) =
n X1
j B3;j
(x) ;
j= 3
x 2 [a; b] :
Los problemas a), b) y c) discutidos en la sección de interpolación mediante splines cúbicas se escriben como sigue: n X1 k = 0; 1; : : : ; n: J B3;j (xk ) = f (xk ) ; j= 3
Condiciones de frontera:
a)
kP1
j=k 3
b)
P1
j= 3
c)
P1
j=3
P1
j= 3
0 j B3;j
00 j B3;j
0 j B3;j
(xk ) = f 0 (xk ) ;
(xk ) = 0;
(a) =
00 j B3;j
k = 0; n;
nP1
j=n 3
(a) =
nP1
k = 0; n;
j=n 3
0 j B3;j
(b) ;
00 j B3;j
El sistema de ecuaciones resultante
(b) :
! ! AC = b ;
para los tres problemas, tiene las formas siguientes:
10.6. EJERCICIOS
525
a) Condiciones de frontera de Hermite 0
B B B B B 1B A= B 6B B B B B @
3 h 1 0 .. . .. . 0
0 4 1 .. .
3 4 1 4 .. . .. .
0
0
0
0 1 .. . .. . 1 3 h
0 0 .. . .. . 1 3 h
..
. 4
0
!t b = (f 0 (a) ; f (x0 ) ; : : : ; f (xn ) ; f 0 (b)) : b) Splines naturales
0 6 B h2 B 1 B B .. 1B . A= B B 6 B ... B B 0 @ 0
12 h2 4 .. .
6 h2 1 .. . .. .
0
0
0 .. . .. . 1 6 h2
0 .. . .. . 1 6 h2
..
. 4 12 h2
!t b = (0; f (x0 ) ; : : : ; f (xn ) ; 0) :
1
C C C C C C C; C C C C C A
1
C C C C C C; C C C C A
c) Splines periódicas 0
B B B B B B B 1B B A= B 6B B B B B B B @
3 h 6 h2 1 0 .. . .. . .. .
3 h 6 h2 1 4 .. .
0
0
0
0
0 1 .. . .. .
0 ..
.
..
.
..
.
..
..
0 0
!t b = (0; 0; f (x0 ) ; : : : ; f (xn
10.6.
0 12 h2 4 1
1) ; f
3 h 6 h2 0
0 12 h2 0
.
. 1 0
..
. 4 1
1 4
3 h 6 h2 0 0 .. . .. . .. . 0 1
1
C C C C C C C C C C; C C C C C C C A
(a)) :
Ejercicios
1. Construir la grá…ca de B2;j y construir sus propiedades. 2. Proponemos como ejercicios construir la grá…ca de B3 ; j así como enunciar sus propiedades.
10.7.
Lecturas complementarias y bibliografía
1. Richard H. Bartels, John C. Beatty, Brian A. Barsky, An Introduction to Splines for use in Computer Graphics and Geometric Medeling, Editorial Morgan Kaufmann Publishers, Inc., San Mateo, California, 1987.
526
CAPÍTULO 10. SPLINES
2. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 3. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 4. Elaine Cohen, Richard F. Riesenfeld, Gershon Elber, Geometric Modeling with Splines, Editorial A. K. Peters, Natick, Massachusetts, 2001. 5. Gerald Farin, Curves and Surfaces for CAGD, Fifth Edition, Editorial Morgan Kaufmann Publishing, San Francisco, 2002. 6. James D. Foley, Andries van Dam, Steven K. Feiner, John F. Hughes, Computer Graphics, Principles and Practice, Second Edition in C, Editorial Addison-Ewsley, Boston , 1997. 7. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 8. Günther H½ammerlin, Karl-Heinz Ho¤mann, Numerical Mathematics, Editorial Springer-Verlag, New York, 1991. 9. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 10. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 11. H. Prautzsch, W. Boehm, M Paluszny, Bézier and B-Spline Techniques, Editorial Springer-Verlag, Berlín, 2000. 12. Helmuth Späth, One Dimensional Spline Interpolation algorithms, Editorial A. K. Peters, Wellesley, Massachusetts, 1995. 13. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980. 14. Grace Wahba, Spline Models for Observational Data, Editorial Society for Industrial and Applied Mathematics (SIAM); Philadelphia, 1990.
Capítulo 11
Métodos numéricos de resolución de ecuaciones diferenciales ordinarias Resumen En este capítulo se tratan discretizaciones de dos tipos de problemas de ecuaciones diferenciales ordinarias: el problema de valor inicial de Cauchy, y, los problemas de valores en la frontera 1d. Se tratan los métodos clásicos de discretizaciones de problemas de valor inicial de Cauchy como son: la familia de los métodos de Runge-Kutta y el método que conduce a los métodos de Euler explícito e implícito y al método implícito de Crank-Nicolson. Por otro lado, se presenta el método de discretización del tipo PetrovGalerkin que conduce a métodos implícitos del tipo Crank-Nicolson. La discretización de los problemas de valores en la frontera 1d se limita a las ecuaciones diferenciales de segundo orden y se aplica el método de diferencias …nitas. Se estudia la consistencia, la estabilidad y la convergencia del método. Se concluye con la discretización en mallas no uniformes de ecuaciones diferenciales de segundo orden con valores en la frontera. Al …nal del capítulo se incluye una amplia bibliografía.
11.1.
Introducción
En ingeniería y las ciencias físicas y químicas, las ciencias biológicas, la economía y sociales surgen modelos gobernados por ecuaciones diferenciales ordinarias, es decir, ecuaciones de la forma: u0 (t) = f (t; u(t)) u(0) = u0 ;
t 2]0; T [;
donde T > 0; f es una función real de…nida en [0; T ] R, que en lo sucesivo supondremos al menos continua, u0 2 R se denomina condición inicial y u es una función real de…nida en el intervalo [0; T ]; u es la función incógnita. El problema de hallar una función u solución de la ecuación diferencial y que satisfaga la condición inicial, se conoce con el nombre de problema de Cauchy de valor inicial. Con más generalidad, se considera el problema de Cauchy de valor inicial siguiente: ! ! u 0 (t) = f (t; ! u (t)) t 2]0; T [; ! ! u (0) = u ; 0
! donde f es una función [0; T ] Rn en Rn ; ! u 0 2 Rn . ! Cuando f (t; ! u (t))= A! u (t) t 2 [0; T ]; se tiene un sistema lineal de ecuaciones diferenciales ordinarias de primer orden, donde A = (aij ) es una matriz real de n n. En forma explícita se escribe como sigue: 8 0 + a1n un (t) > < u1 (t) = a11 u1 (t) + .. t 2]0; T [; . > : 0 un (t) = an1 u1 (t) + + ann un (t) 527
528CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR que se le conoce como sistema de ecuaciones diferencial lineal autónomo. Una ecuación diferencial lineal homogénea de orden n con coe…cientes constantes es una ecuación de la forma u(n) (t) + a1 u(n 1) (t) + + an u(t) = 0 t 2 [0; T ]; donde a1 ;
; an 2 R. Este tipo de ecuaciones diferenciales se transforma en un sistema2de ecuaciones 3 u(t) 6 u0 (t) 7 7 6 ! diferenciales lineales como el precedente mediante la siguiente transformación: u (t) = 6 7, .. 5 4 . (n 1) u (t) resulta 2 0 3 2 3 u (t) u0 (t) 00 6 u00 (t) 7 6 7 u (t) 6 7 6 7 ! 0 u (t) = 6 = 7 6 7 .. .. 4 5 4 5 . . u(n) (t)
2
0
6 = 4 2
6 6 Ponemos ! u (t) = 6 4
a1 u(n
1 .. .
an
0
an
3
u(t) u0 (t) .. .
a1
1
2
7 7 7 2 Rn ; 5
1) (t)
0
6 A = 4
3
2
6 76 56 4
an u(t) 3 u(t) u0 (t) 7 7 7: .. 5 .
u(n
1) (t)
1 .. .
3
0
7 5 2 Mn
n [R];
resulta
an an 1 a1 u(n 1) (t) ;! u 0 (t))= A! u (t) t 2 [0; T ]: Con mayor generalidad, una ecuación diferencial lineal no homogénea de orden n con coe…cientes constantes es una ecuación de la forma u(n) (t) + a1 u(n
1)
(t) +
+ an u(t) = f (t)
t 2 [0; T ];
donde a1 ; ; an 2 R, f es una función real de…nida en [0; T ] y que se supondrá allí continua . Este tipo de ecuaciones diferenciales2se transforma 3 en un sistema de ecuaciones diferenciales lineales como el u(t) 6 u0 (t) 7 6 7 precedente si se de…ne ! u (t) = 6 7, entonces .. 4 5 . u(n
2
6 6 ! 0 u (t) = 6 4 2
6 = 4 2
6 6 Se pone ! u (t) = 6 4
u(t) u0 (t) .. .
3
1) (t)
u0 (t) 00 u (t) .. .
u(n) (t) 0 an
7 7 7 2 Rn ; 5
3
2
7 6 7 6 7=6 5 4
a1 u(n 1) (t) 2 3 u(t) 0 6 u0 (t) 76 56 .. 4 . a1 (n u 1) (t)
f (t)
1 .. . an
3
u0 (t) 00 u (t) .. .
1
2
6 ! 6 b (t) = 6 4
0 0 .. .
3
an u(t) 3 2 7 6 7 6 7+6 5 4
7 7 7 5
0 0 .. .
f (t)
3
7 7 7: 5
7 7 7 2 Rn ; t 2 [0; T ] y A la matriz arriba de…nida: 5
f (t) u(n 1) (t) ! ! ! ! ! 0 Resulta u (t) = A u (t) + b (t) t 2 [0; T ]: En este caso, f (t; ! u (t))=A! u (t) + b (t):
11.2. EL MÉTODO
529
! Si f (t; ! u (t))= A(t)! u (t); donde para cada t 2 [0; T ]; A(t) = (aij (t)) es una matriz real de n n dependiente de t; el sistema de ecuaciones diferenciales ! u 0 (t) = A(t)! u (t) se conoce como sistema lineal no autónomo. ! ! Si ! u 0 (t) = f (! u (t)) con f una función de Rn en Rn que no se se expresa como A! u , se llama sistema de ecuaciones diferenciales no lineal autónomo. ! En lo que sigue, supondremos que f es una función [0; T ] Rn en Rn lipchisiana respecto de la segunda ! ! ! variable; es decir, existe k > 0 tal que k f (t; ! u 1) f (t; u 2 ) k k k ! u1 ! u2 k 8! u 1; ! u 2 2 Rn ; 8t 2 [0; T ]: Esta hipótesis garantiza la existencia de una sola solución ! u 2 C 1 ([0; T ])n :
11.2.
El método
Sean T > 0; u0 2 R y f una función real de…nida en [0; T ] L > 0 tal que para todo y1 ; y2 2 R; se veri…ca jf (t; y1 )
f (t; y2 )j
L jy1
R que suponemos lipschisiana; esto es, existe y2 j
8t 2 [0; T ] :
Consideramos el problema de valor inicial de Cauchy: u0 (t) = f (t; u (t)) u (0) = u0 :
t 2 ]0; T [ ;
De la hipótesis sobre f , esta ecuación tiene una única solución u 2 C 1 ([0; T ]) : En muy pocos casos se puede resolver esta ecuación directamente y obtener la solución exacta u. En la generalidad de los casos, la solución u no puede obtenerse directamente y debe recurrirse a los métodos numéricos, esto signi…ca que podemos calcular soluciones aproximadas de u. Sean n 2 Z+ ; (n) = ftj j l = 0; 1; : : : ; ng una partición del intervalo [0; T ] ; esto es, t0 = 0; tj 1 < tj j = 1; : : : ; n; tn = T: Ponemos hj = tj tj 1 j = 1; : : : ; n y b h = max hj : En el caso de la j=1;:::;n
T partición uniforme, tenemos h = ; tj = jh n b h = h:
j = 0; 1; : : : ; n con lo que
(n) = fjh j j = 0; 1; : : : ; ng y
Denotamos con uj una aproximación de u (tj ) : El valor de f (tj ; u (tj )) se aproxima como f (tj ; uj ) : La derivada u0 (tj ) lo aproximamos mediante una diferencia …nita progresiva de primer orden, esto es, u0 (tj ) '
u (tj+1 ) u (tj ) hj+1
j = 0; 1; : : : ; n
1;
entonces u0 (tj ) se aproxima como u0 (tj ) '
uj+1 uj jj+1
j = 0; 1; : : : ; n
1:
Sea 2 [0; 1] : El método consiste en discretizar la ecuación diferencial mediante el esquema numérico siguiente: uj+1 uj = f (tj ; uj ) + (1 ) f (tj+1 ; uj+1 ) j = 0; 1; : : : ; n 1; hj+1 cuyos datos son los pasos temporales hj ; j = 1; : : : ; n; los tiempos tj j = 0; 1; : : : ; n: De este esquema numérico, se tiene interés en tres métodos numéricos conocidos como Euler explícito, Euler implícito y Crank-Nicolson. 1. Método de Euler explícito
530CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Para
= 1 se obtiene el siguiente esquema numérico uj+1 uj = f (tj ; uj ) hj+1
j = 0; 1; : : : ; n
1
y de este resultado uj+1 = uj + hj+1 f (tj ; uj )
j = 0; 1; : : : ; n
1;
que se conoce como esquema numérico de Euler explícito. La razón de ser método explícito se explica a continuación. Para j = 0, el esquema numérico precedente se expresa como u1 = u0 + h1 f (t0 ; u0 ) : Note que a partir de los datos conocidos: condición inicial u (0) = u0 ; paso temporal h1 ; tiempo t0 ; podemos calcular directamente u1 al instante t1 . Con u1 calculado y los datos: paso temporal h2 ; tiempo t1 pasamos a calcular u2 al instante t2 mediante el esquema numérico que se obtiene haciendo j = 1; esto es, u2 = u1 + h2 f (t1 ; u1 ) : Así sucesivamente. En el caso particular de una partición uniforme, el método de Euler explícito se escribe como uj+1 = uj + h f (tj ; uj )
j = 0; 1; : : : ; n
1:
Más adelante estudiamos la convergencia del método de Euler explícito. 2. Método de Euler implícito En el método
hacemos
= 0; obtenemos uj+1 uj = f (tj+1 ; uj+1 ) hj+1
j = 0; 1; : : : ; n
1;
y de esta igualdad resulta uj+1
hj+1 f (tj+1 ; uj+1 ) = uj
j = 0; 1; : : : ; n
1;
que se conoce como esquema numérico de Euler implícito. Para j = 0 se tiene la siguiente ecuación u1
h1 f (t1 ; u1 ) = u0
cuya incógnita es u1 al instante t1 : Solo en muy pocos casos se puede resolver esta ecuación directamente y calcularse u1 : En la generalidad de los casos, u1 se calcula en forma aproximada como solución de dicha ecuación. Con u1 calculado al instante t1 se pasa inmediatamente a calcular u2 como solución aproximada de la ecuación que se obtiene con j = 1; así u2
h2 f (t2 ; u2 ) = u1 :
El proceso continua hasta calcular u3 ; : : : ; un
1
en los instantes t3 ; : : : ; tn = T:
Para una partición uniforme, el esquema numérico de Euler implícito se escribe como uj+1 Para calcular uj
hf (tj+1 ; uj+1 ) = uj
j = 0; 1; : : : ; n
1:
j = 1; : : : ; n; de…nimos la función real G como G (x) = x
hj+1 f (tj+1 ; x)
uj
x 2 R:
Como uj+1 hj+1 f (tj+1 ; uj+1 ) uj = 0; se sigue que G (uj+1 ) = 0; es decir que x b = uj+1 es raíz de la ecuación G (x) = 0: Esta raíz x b es aproximada aplicando cualquiera de los métodos numéricos de resolución de ecuaciones no lineales que por supuesto dependen de la regularidad de la función f .
11.2. EL MÉTODO
531
El análisis de la convergencia del método de Euler implícito lo haremos más adelante. 3. Método de Crank-Nicolson 1 Este método fue propuesto por J. Crank y P. Nicolson en 1947. Para = se tiene el siguiente esquema 2 numérico uj+1 uj 1 1 = f (tj ; uj ) + f (tj+1 ; uj+1 ) j = 0; 1; : : : ; n 1 hj+1 2 2 y de esta igualdad obtenemos uj+1
hj+1 hj+1 f (tj+1 ; uj+1 ) = uj + f (tj ; uj ) 2 2
j = 0; 1; : : : ; n
1
que se conoce como esquema numérico de Crank-Nicolson. Este es un esquema numérico implícito. Al igual que en el método de Euler implícito, para j = 0 y con los datos: paso temporal h1 ; tiempo t0 ; condición inicial u (0) = u0 se tiene la ecuación u1
h1 h1 f (t1 ; u1 ) = u0 + f (t0 ; u0 ) 2 2
cuya incógnita es u1 la misma que se aproxima como solución numérica de dicha ecuación. Calculado u1 al instante t1 ; con datos el paso temporal h2 ; los tiempos t1 y t2 ; podemos calcular el valor aproximado de u2 como solución numérica de la ecuación u2
h2 f (t2 ; u2 ) = u1 2
h1 f (t1 ; u1 ) : 2
Así sucesivamente. En el caso de una partición uniforme, el esquema numérico de Crank-Nicolson se escribe como uj+1
h h f (tj+1 ; uj+1 ) = uj + f (tj ; uj ) 2 2
j = 0; 1; : : : ; n
1:
De manera similar que el método de Euler implícito, de…nimos la función real G como G (x) = x
h f (tj+1 ; x) 2
uj
h f (tj ; uj ) 2
x 2 R:
Resulta que x b = uj+1 es raíz de la ecuación G (x) = 0: El método de resolución numérica de la ecuación no lineal G (x) = 0 está relacionado con la regularidad de la función f . La convergencia de este método será tratado más adelante.
Los esquemas numéricos de Euler implícito, explícito, y de Crank - Nicolson obtenidos para una sola ecuación diferencial pueden extenderse inmediatamente a los sistemas de ecuaciones diferenciales: ( ! ! u 0 (t) = F (t; ! u (t)) t 2 ]0; T [ ; ! ! u (0) = u ; 0
! (0) (0) donde T > 0; ! u T0 = u1 ; : : : ; um 2 Rm ; F T = (f1 ; : : : ; fm ) una función vectorial de [0; T ] Rm que suponemos lipschisiana. Este sistema de ecuaciones diferenciales se expresa como 8 ! 0 > < u1 (t) = f1 (t; u (t)) .. t 2 ]0; T [ : . > : 0 ! um (t) = fm (t; u (t)) ;
Rm en
(j) (j) (n) = ftj j j = 0; 1; : : : ; ng una partición del intervalo [0; T ] : Denotamos con ! u T = u1 ; : : : ; u m una aproximación de ! u T (tj ) j = 1; : : : ; n: Los esquemas numéricos anteriores se expresan como sigue.
Sea
532CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR 1. Euler explícito
! ! u j+1 = ! u j + hj+1 F (tj ; ! u j)
2. Euler implícito
! u j+1
j = 0; 1; : : : ; n
! hj+1 F (tj+1 ; ! u j+1 ) = ! uj
j = 0; 1; : : : ; n
1:
1:
3. Crank - Nicolson ! u j+1
hj+1 ! hj+1 ! F (tj+1 ; ! u j+1 ) = ! uj + F (tj ; ! u j) 2 2
j = 0; 1; : : : ; n
1:
Más particularmente en el caso de las funciones vectoriales del tipo ! ! F (t; y ) = A (t) ! y +! g (t)
t 2 [0; T ] ;
donde para cada t 2 [0; T ] ; A (t) = (aij (t)) es una matriz de m con gj 2 C ([0; T ]) j = 1; : : : ; m:
m no nula, ! g T (t) = (g1 (t) ; : : : ; gm (t))
El método de Euler explícito se escribe como sigue: ! u j+1 = ! u j + hj+1 [A (tj ) ! uj +! g (tj )] ! = [I + hj+1 A (tj )] u j + hj+1 ! g (tj ) donde I denota la matriz identidad de m
j = 0; 1; : : : ; n
1;
m:
El método de Euler implícito se escribe como ! u j+1
hj+1 [A (tj+1 ) ! u j+1 + ! g (tj+1 )] = ! uj
j = 0; 1; : : : ; n
1;
j = 0; 1; : : : ; n
1:
que a su vez podemos expresarlo como el siguiente (I
hj+1 A (tj+1 )) ! u j+1 = ! u j + hj+1 ! g (tj+1 )
El método de Crank - Nicolson se expresa de la manera siguiente: ! u j+1
hj+1 hj+1 [A (tj+1 ) ! u j+1 + ! g (tj+1 )] = ! uj + (A (tj ) ! uj +! g (tj )) 2 2
j = 0; 1; : : : ; n
1;
Luego I
hj+1 A (tj+1 ) ! u j+1 = 2
I+
hj 1 A (tj ) ! u j + hj+1 (! g (tj ) + ! g (tj+1 )) 2 2
j = 0; 1; : : : ; n
1:
Se observa que tanto en el método de Euler implícito como en el de Crank-Nicolson, que para calcular hj+1 ! A (tj+1 ) sean invertibles. u j+1 se requieren que las matrices I hj+1 A (tj+1 ) e I 2
11.3.
Método de Petrov-Galerkin.
Sean T > 0; u0 2 R; f una función real de…nida en [0; T ] R que suponemos lipschisiana. Consideramos el problema de valor inicial de Cauchy siguiente: hallar una función u de…nida en [0; T ] solución de u0 (t) = f (t; u (t)) u (0) = u0 :
t 2 ]0; T [ ;
Antes de describir el método de Petrov-Galerkin para resolver el problema de Cauchy precedente, requerimos introducir algunas notaciones y algunos espacios de funciones. Recordemos que una función s se dice escalonada en [0; T ] si y solo si existe una partición (n) = ftj j j = 0; 1; : : : ; ng del intervalo [0; T ] tal que s (t) = si t 2 ]tj 1 ; tj [ j = 1; : : : ; n; donde si 2 R: En
11.3. MÉTODO DE PETROV-GALERKIN.
533
los puntos tj j = 0; 1; : : : ; n la función s debe estar de…nida de cualquier modo. En la …gura siguiente se muestra una función escalonada en [0; T ] :
Figura 94
De…nición 1 Diremos que una función real f de…nida en [0; T ] es discontinua en a 2 [0; T ] con salto de primera especie si y solo si f es discontinua en a, y jf (a+ ) f (a )j < 1; donde f (a+ ) = l m f (a + h) ; f (a ) = l m f (a + h) ; son los límites por derecha e izquierda respectivamente. h>0 h!0
h > hj+1 > > : 0; si t 2 [0; T ] 8 [tj 1 ; tj+1 ] :
En la …gura de la izquierda se muestra la grá…ca de la función '0 y en la derecha se muestra la grá…ca de la función 'j :
Figura 98
Figura 99
Estas funciones 'j se las denomina funciones techo. De la de…nición del espacio Vh y de la base '0 ; : : : ; 'n 1 resulta que vh 2 Vh si y solo si existen nP1 v0 ; : : : ; vn 1 2 R tales que vh = vi 'i : Note que vh (T ) = 0 pués 'i (T ) = 0 8i = 0; ; n 1: i=0
De…nición 4 Diremos que uh 2 Uh es solución aproximada del problema de Cauchy de valor inicial si y solo si satisface la ecuación integral Z
0
T
uh (t) vh0 (t) dt
= u0 vh (0) +
Z
0
T
f (t; uh (t)) vh (t) dt
8vh 2 Vh :
Esta es la formulación discreta de la formulación del tipo Petrov-Galerkin arriba de…nida, a la que nos referimos como formulación discreta del tipo Petrov-Galerkin. Observe que la función incógnita uh se busca en el espacio Uh mientras que las funciones vh ; denominadas funciones test, están en el espacio Vh : Aplicando la formulación discreta del tipo Petrov-Galerkin se construye a continuación un esquema numérico.
11.3. MÉTODO DE PETROV-GALERKIN.
537 n P
Sea uh 2 Vh la solución. Existe u1 ; : : : ; un 2 R tales que uh = discreta del tipo Petrov-Galerkin, tenemos 0 1 Z Z T X n 0 @ uj j (t)A vh (t) dt = u0 vh (0) + 0
T
0
j=1
0
f @t;
uj
j:
j=1
n X
uj
j=1
j
Remplazando en la formulación 1
(t)A vh (t) dt
8vh 2 Vh ;
y tomando en consideración la linealidad de la integral en el primer miembro, esta ecuación se expresa como 0 1 Z T Z T n n X X 0 f @t; uj uj j (t)A vh (t) dt: j (t) vh (t) dt = u0 vh (0) + 0
0
j=1
j=1
Debemos calcular u1 ; : : : ; un y tenemos una ecuación válida para todo vh 2 Vh ; en particular lo es para los elementos de la base '0 ; : : : ; 'n 1 de Vh lo que nos permite obtener las n ecuaciones requeridas. En efecto, hacemos vh ='i 2 Vh : Tenemos 0 1 Z T Z T n n X X 0 f @t; uj uj j (t)A 'i (t) dt i = 0; : : : ; n 1; j (t) 'i (t) dt = u0 'i (0) + 0
0
j=1
j=1
lo que da lugar a las n ecuaciones. Determinemos estas ecuaciones. 8 1 < ; si t 2 ]0; t1 [ ; 0 h1 además en el intervalo ]0; t1 [ intervienen Para i = 0 se tiene '0 (0) = 1; '0 (t) = : 0; en otro caso, u1 y 1 (t) = 1 t 2 ]0; t1 [ con lo que se obtiene Z t1 Z t1 1 u1 dt = u0 + f (t; u1 ) '0 (t) dt: h1 0 0 Como h1 = t1 e
R t1 0
1 dt = h1
1; entonces
u1 = u0 +
Z
0
t1
f (t; u1 ) '0 (t) dt:
1; si i = j Para i = 2; : : : ; n se tiene 'i (0) = 0; más aún 'i (tj ) = '0i (t) = 0; si i 6= j; 8 1 > > ; si t 2 ]ti 1 ; ti [ ; > > < hi 1 ; si t 2 ]ti ; ti+1 [ ; Además en los intervalos ]ti 1 ; ti [ y ]ti ; ti+1 [ intervenen ui ; ui+1 ; i (t) = > > h i+1 > > : 0; en otro caso. 1 t 2 ]ti 1 ; ti [ ; i+1 (t) = 1 t 2 ]ti ; ti+1 [ : Entonces ! Z Z ti Z ti+1 Z ti+1 ti 1 1 ui dt + ui+1 dt = f (t; ui ) 'i (t) dt + f (t; ui+1 ) 'i (t) dt: hi+1 ti 1 hi ti ti 1 ti Puesto que
R ti ti
1
Rt 1 1 dt = 1; tii+1 dt = 1; se sigue que hi hi+1 Z ti Z (ui ui+1 ) = f (t; ui ) 'i (t) dt + ti
ti
1
que a su vez se expresa como Z ti+1 Z ui+1 f (t; ui+1 ) 'i (t) dt = ui + ti
ti+1
f (t; ui+1 ) 'i (t) dt
ti
ti
f (t; ui ) 'i (t) dt i = 1; : : : ; n 1
1:
538CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR En resumen, el esquema numérico que se obtiene es el siguiente: R ti 8 > 0 f (t; ui ) '0 dt = u0 ; < ui .. . > R Rt : ti+1 ui+1 f (t; ui+1 ) 'i (t) dt = ui + tii 1 f (t; ui ) 'i (t) dt i = 1; : : : ; n ti
1:
Lastimosamente en este esquema numérico se debe aún calcular las integrales. Para ello aplicamos el Rb b a (g (a) + g (b)) : Entonces método de los trapecios; esto es, si g 2 C ([a; b]) entonces a g (t) dt ' 2 Z t1 t1 f (t; u1 ) '0 (t) dt ' [f (0; u1 ) '0 (0) + f (t1 ; u1 ) '0 (t1 )] 2 0 y como h1 = t1 ; '0 = 1; '0 (t1 ) = 0 resulta Z t1 h1 f (t; u1 ) '0 (t) dt ' f (0; ui ) : 2 0
De manera similar Z ti Z
ti ti +1
ti
1
f (t; ui ) 'i (t) dt '
f (t; ui+1 ) 'i (t) dt '
ti
ti 2
1
[f (ti
1 ; ui ) 'i (ti 1 )
ti+1 ti [f (ti ; ui+1 ) 'i (ti ) + f (ti+1 ; ui ) 'i (ti+1 )] ; 2
y por la de…nición de hi ; hi+1 ; y de las funciones '1 ; : : : ; 'n 'i (ti ) = 0: Entonces
Z
Z
ti
ti ti+1
ti
1
+ f (ti ; ui ) 'i (ti )] ;
f (t; ui ) 'i (t) dt '
f (t; ui+1 ) 'i (t) dt '
1;
tenemos 'i (ti
1)
= 'i (ti+1 ) = 0;
hi f (ti ; ui ) ; 2 hi+1 f (ti ; ui+1 ) : 2
Por abuso de lenguaje designamos nuevamente con u1 ; : : : ; un a las incógnitas que satisfacen el esquema numérico siguiente: 8 h1 > > f (0; u1 ) = u0 u1 > > < 2 .. . > > > hi+1 hi > : ui+1 f (ti ; ui+1 ) = ui + f (ti ; ui ) i = 1; : : : ; n 1: 2 2 Se observa que este esquema numérico es similar al de Crank-Nicolson al que nos referimos como esquema numérico del tipo Crank-Nicolson, el mismo que fue propuesto por HB-PB . Otra forma de obtener este esquema numérico es la siguiente. De…nimos la función 'n como sigue: 8 < 0; si t 2 [0; tn 1 [ ; 'n (t) = t tn 1 : ; si t 2 [tn 1 ; T ] : hn En la …gura siguiente se muestra la grá…ca de la función 'n :
Figura 100
11.3. MÉTODO DE PETROV-GALERKIN.
539
Introducimos los subespacios Uh y Vh de Cd1 ([0; T ]) y C 1 ([0; T ]) respectivamente como sigue: ( n ) X Uh = ui 'i j ui 2 R i = 0; : : : ; n ; i=0
Vh =
(n 1 X
i 'i
j
i=0
2R
i
i = 0; 1; : : : ; n
)
1 :
Se tiene dim Uh = n + 1; dim Vh = n: una base de Uh es la familia de funciones f'0 ; : : : ; 'n g y una de Vh es '0 ; : : : ; 'n 1 : La formulación discreta de la formulación del tipo Petrov-Galerkin se expresa como sigue: hallar una función uh 2 Uh solución de Z T Z T 0 uh (t) vh (t) dt = u0 vh (0) + f (t; uh (t)) vh (t) dt 8vh 2 Vh : 0
0
A esta acción nos referimos como formulación discreta del tipo Petrov-Galerkin. La función uh 2 Uh se escribe como uh =
i=0
Luego Z
0
T
u0 '0 (t) +
n X
n P
!
u i 'i = u 0 ' 0 +
ui 'i (t) vh0 (t) dt = u0 vh (0) +
i=1
Z
0
n P
i=1
ui 'i ; con u (0) = u0 la condición inicial.
T
f
t; u0 '0 (t) + +
n X
u i 'i
i=1
!
vh (t) dt 8vh 2 Vh :
Se observa en esta ecuación que las incógnitas son u1 ; : : : ; un 2 R: Para poder calcular estas incógnitas requerimos generar n ecuaciones, para ello remplazamos sucesivamente vh por los elementos de la base '0 ; : : : ; 'n 1 de Vh ; es decir vh = 'j j = 0; 1; : : : ; n 1: Así, u0
Z
T
0
+
Z
'0 (t) '0j
(t) dt
T
f
0
n X1
t; u0 '0 (t) +
ui
i=1 n X
Z
0
T
'i (t) '0j (t) dt = u0 'j (0) +
!
ui 'i (t) 'j (t) dt
i=1
j = 0; 1; : : : ; n
1:
Para j = 0; de la de…nición de '0 se tiene '0 (0) = 1; '0 (t) = 0 si t 2 [t1 ; T ] ; '00 (t) = 8 1 < ; si o < t < t1 ; Tomando en consideración esta información, la ecuación precedente se reduce h1 : 0; si t < t < T: 1 a la siguiente Z t1 Z t1 Z t1 1 1 u0 '0 (t) dt ui '1 (t) dt = u0 + f (t; u0 '0 (t) + u1 '1 (t)) '0 (t) dt h1 h1 0 0 0 e integrando, obtenemos 1 1 u0 + u1 = u0 + 2 2
Z
0
t1
f (t; u0 '0 (t) + u1 '1 (t)) '0 (t) dt:
Para j = 1; de la de…nición de '1 se tiene8'1 (t1 ) = 1; '1 (0) = 0; '1 (t) = 0 si t 2 [t2 ; T ] y t = 0; la derivada > 1 ; si 0 < t < t ; > 1 > > < h1 1 de '1 está de…nida como sigue:'01 (t) = ; si t1 < t < t2 ; Entonces uh = u0 '0 + u1 '1 + u2 '2 sobre > > h > 2 > : 0; si t2 < t < T: [0; t2 ] en consecuencia, por la aditividad respecto del dominio de integración, tenemos Z t1 Z t1 Z t2 Z t2 u0 '0 (t) '01 (t) dt u1 '1 (t) '01 (t) dt u1 '1 (t) '01 (t) dt u2 '2 (t) '01 (t) dt 0
= u0 '1 (0) +
Z
0
0
t1
t2
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt;
t1
540CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR y de esta , resulta
u0
Z
t1
1 h1
'0 (t)
0
Z
dt
Z
u1
t1
1 '1 (t) dt h1
0
t1
u1
Z
t2
t1
1 h2
'1 (t)
dt
Z
u2
t2
t1
'2 (t)
1 h2
dt
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt = u0 '1 (0) + 0 Z t2 f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt + t1
Integrando los tres primeros términos obtenemos el siguiente resultado u0 u2 + 2 2
Z
=
t1
0
+
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt Z
t2
t1
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt:
Continuando con este proceso, obtenemos para 1 1 uj 2
1 1 + uj+1 = 2
Z
n
1;
tj
f t; uj
tj
+
j
Z
1 'j 1 (t)
+ uj 'j (t) + uj+1 'j+1 (t) 'j (t) dt
1
tj+1
f t; uj
tj
1 'j 1 (t)
+ uj 'j (t) + uj+1 'j+1 (t) 'j (t) dt:
Para el cálculo de las integrales aplicamos la fórmula de integración del punto medio, esto es, si g 2 C ([a; b]) ; Z b a+b g (t) dt ' (b a) g : 2 a Entonces, de la de…nición de las funciones '0 ; '1 se tiene Z
0
t1
f (t; u0 ; '0 (t) + u1 '1 (t)) u0 (t) dt '
1 1 donde e t0 = (t0 + t1 ) : Note que '0 e t0 = : 2 2
h1 1 f e t0 ; (u0 + u1 ) ; 2 2
De manera similar, de la de…nición de las funciones '0 ; '1 ; '2 se tiene Z
t1
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '1 (t) dt '
0
Z
t2
f (t; u0 '0 (t) + u1 '1 (t) + u2 '2 (t)) '2 (t) dt '
t1
1 1 1 donde e t1 = (t1 + t2 ) ; '1 e t0 = ; ' 1 e t1 = : 2 2 2
h1 1 f e t0 ; (u0 + u1 ) ; 2 2 h2 1 f e t1 ; (u1 + u2 ) ; 2 2
De manera general, obtenemos Z
Z
tj
f t; uj
1 'j 1 (t)
+ uj 'j (t) + uj+1 'j+1 (t) 'j (t) dt =
f t; uj
1 'j 1 (t)
+ uj 'j (t) + uj+1 'j+1 (t) 'j (t) dt '
tj 1 tj+1
tj
con e tj
1
=
1 (tj 2
1
1 + tj ) ; e tj = (tj + tj+1 ) : 2
hj f e tj 2
1;
1 (uj 2
1
+ uj )
hj+1 1 f e tj ; (uj + uj+1 ) 2 2
11.3. MÉTODO DE PETROV-GALERKIN.
541
Resulta que para j = 0; j = 1; : : : ; n 1 el esquema numérico se expresa como 8 h 1 1 > > (u0 + u1 ) ' u0 + 1 f e t0 ; (u0 + u1 ) ; > > 2 2 2 > > > > > 1 1 h h2 1 1 1 < u0 + u2 ' f e t0 ; (u0 + u1 ) + f e t1 ; (u1 + u2 ) ; 2 2 2 2 2 2 > . > .. > > > > > hj hj+1 1 1 1 > > 1u : f e f e tj 1 ; (uj 1 + uj ) + tj ; (uj + uj+1 ) : j 1 + uj+1 ' 2 2 2 2 2 2 Sumando y restando
1 1 u1 y de manera general uj ; se tiene 2 2
8 h1 1 1 > > (u0 + u1 ) f e t0 ; (u0 + u1 ) ' u0 ; > > 2 2 2 > > > > > 1 1 h 1 h1 1 1 2 < u + u f e t1 ; (u1 + u2 ) ' (u0 + u1 ) + f e t0 ; (u0 + u1 ) ; 0 2 2 2 2 2 2 2 2 > .. > > > . > > > hj+1 hj 1 1 1 1 > > : (uj + uj+1 ) f e tj ; (uj + uj+1 ) ' (uj 1 + uj ) + f e tj 1 ; (uj 2 2 2 2 2 2
1
+ uj ) :
En base a este resultado obtenemos el siguiente esquema numérico: buscamos u e1 ; : : : ; u en 2 R solución del sistema de ecuaciones siguiente: 8 h1 e > e1 = u0 ; f t0 ; u u e1 > > > 2 > > > h2 e h1 < u e2 f t1 ; u e2 = u e1 + f e t0 ; u e1 ; 2 2 > .. > > . > > > > hj hj+1 e : f tj ; u ej+1 = u ej + f e tj 1 ; u ej j = 1; 2; : : : ; n 1: u ej+1 2 2 que es el esquema numérico del tipo Crank-Nicolson que hemos obtenido anteriormente.
El esquema numérico obtenido para el caso escalar de una ecuación diferencial se extiende inmediatamente a sistemas de ecuaciones diferenciales. Así, consideremos el sistema de ecuaciones diferenciales siguiente: ( ! ! u 0 (t) = F (t; ! u (t)) t 2 ]0; T [ ; ! ! u (0) = u ; 0
! 2 Rm ; F es una función vectorial de [0; T ] suponemos lipchisiana, esto es, existe L > 0 tal que 8! y 1; ! y 2 2 Rm ;
donde T > 0; ! u T0 =
(0)
(0)
u1 ; : : : ; u m ! ! F (t; y 1 )
Entonces
1 donde e tj = (tj 2
8 > < ! u1 1
> : ! u j+1
! ! F (t; y 2 )
L k! y1
! y 2k
8t 2 [0; T ] :
h1 ! e ! F t0 ; u 1 = ! u 0; 2 hj ! hj+1 ! e ! F tj ; u j+1 = ! uj + F (tj 2 2
+ tj ) los puntos medios de los intervalos [tj
1 ; tj ]
Rm en Rm que
ej ) 1; u
de la partición
(n) de [0; T ] :
! Más particularmente, si la función F tiene la forma ! ! ! F (t; y ) = A (t) ! y + b (t) con A (t) = (aij (t)) una matriz de m continua.
t 2 [0; T ] ;
! m no nula y cada aij (t) función continua, b una función vectorial
542CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR El esquema numérico se expresa como sigue; 8 h1 ! h1 > > u1 =! u0+ A e t0 ! b (t0 ) I > > > 2 2 < .. . > > > h hj j+1 > > A e tj ! u j+1 = I A e tj 1 : I 2 2
11.4.
1 ! ! u j + hj b e tj 2
1
! 1 + hj+1 b e tj 2
j = 1; : : : ; n
1:
Método de diferencias …nitas para problemas de valores en la frontera 1d.
El método de diferencias …nitas (MDF) es uno de los primeros métodos que fueron implementados en la resolución numérica tanto de ecuaciones diferenciales ordinarias como en derivadas parciales para problemas uni, bi y tridimensionales. Su popularidad radica en el hecho de la simplicidad con la que se discretizan tales ecuaciones mediante el uso de aproximaciones de las derivadas por medio de cocientes incrementales. En este capítulo iniciaremos con los operadores en diferencias …nitas que luego serán aplicados a una clase de problemas con valores en la frontera unidimensionales siguientes: d dx
p
du dx
+r
du + qu = f dx
sobre ]0; L] ;
de donde L > 0; p; q; r; f 2 C 0 ([0; L]) tales que i. p (x) ii. q (x)
> 0 8x 2 [0; L] ; 0 8x 2 [0; L] :
Para el problema propuesto consideramos cuatro condiciones de frontera que precisamos a continuación. 1. Condiciones de frontera de Dirichlet: u (0) = a0 ;
u (L) = a1 :
2. Condiciones de frontera de Neumann: u0 (0) = a; u0 (L) = b: 3. Condiciones de frontera mixtas: u0 (0) + u (0) = a; u0 (L) + u (L) = b: 4. Condiciones de frontera periódicas: u (0) = u (L) ; u0 (0) = u0 (L) : En este último problema debemos suponer que las funciones p; q; r; f se extienden por periodicidad a todo R y conservan la continuidad. Nótese que u (x + L) = u (x) 0
0
8x 2 R,
u (x + L) = u (x) 8x 2 R.
Suponemos que para el problema propuesto, se conocen resultados de existencia, unicidad, regularidad de la solución. Con el propósito de introducir las nociones de consistencia, estabilidad y convergencia que serán abordados más adelante, consideramos el problema modelo siguiente: hallar u 2 C 2 ([0; L]) solución de donde f; q 2 C 0 ([0; L]) con q (x)
u00 + qu = f sobre ]0; L[ ; u (0) = u (L) = 0;
(P)
0 8x 2 [0; L] :
Este problema es una simpli…cación del problema planteado en la introducción. Con este problema abordaremos otros desde el punto de vista informático que consiste en la puesta en marcha del método de diferencias …nitas.
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.543 Sea n 2 Z+ ; h =
El conjunto
L y xj = jh; j = 0; 1; :::; n: Ponemos n (n) = fxj = jh j j = 0; 1; :::; ng :
(n) se llama discretización del intervalo [0; L] o también malla de [0; L] :
Puesto que 2u (xj ) + u (xj 1 ) + rh (xj ) ; j = 1; :::; n 1; h2 (véase el capítulo 2, diferencias …nitas centrales) se sigue que (P) se discretiza del modo siguiente: 8 < u (xj+1 ) 2u (xj ) + u (xj 1 ) + q (xj ) u (xj ) + rh (xj ) = f (xj ) j = 1; :::; n 1; (P1 ) h2 : u (0) = 0; u (L) = 0 u00 (xj ) =
u (xj+1 )
En el esquema numérico precedente (P1 ) se desconocen u (xj ) y rh (xj ) ; j = 1; :::; n rh (xj ) !h!0 0 j = 1; :::; n 1:
1: Deseamos que
Denotamos con uj una aproximación de u (xj ) : Asumimos que rh (xj ) ' 0 y en consecuencia, se tiene el esquema numérico siguiente. ( u0 = 0; un = 0; uj+1 2uj + uj 1 + q (xj ) uj = f (xj ) j = 1; :::; n 1: h2 Para j = 1, se tiene 2 + q (x1 ) u1 h2 Para 1 < j < n
1; 1 uj h2
Para j = n
1 u2 = f (x1 ) : h2
1
+
2 + q (xj ) uj h2
1 uj+1 = f (xj ) : h2
1; 1 un h2
2
+
2 + q (xn h2
1)
un
1
= f (xn
1) :
El conjunto de ecuaciones precedente, en forma matricial se escribe en la siguiente forma: 2 3 2 2 2 3 u1 f (x1 ) 1 + q (x1 ) 0 0 6 7 6 h2 h2 u 2 7 1 2 1 6 76 6 f (x2 ) + q (x2 ) 0 6 7 6 .. 7 6 h2 h2 h2 .. 6 76 . 7 6 .. .. .. .. .. . 6 7 6 7 6 . . . . . 6 7 6 .. 7 = 6 .. 6 76 . 7 6 .. .. .. . 1 6 7 6 4 5 . . . h2 4 5 4 u f (x n 2 n 2) 1 2 0 + q (xn 1 ) h2 h2 un 1 f (xn 1 ) Ponemos ! u h = (u1 ; :::; un
T 1)
! ; b = (f (x1 ) ; :::; f (xn
T 1 ))
;
3 7 7 7 7 7 7 7 7 5
(1)
Ah = (aij (h)) con
2 + q (xi ) i = 1; :::; n 1; h2 1 ; i = 2; :::; n ai 1i (h) = aii 1 (h) = h2 aii (h) =
El sistema de ecuaciones lineales (1) se escribe en forma compacta como ! Ah ! uh = b :
1:
(2)
La matriz Ah es de (n 1) (n 1), tridiagonal, simétrica y se demostrará más adelante que es de…nida positiva, por lo que el sistema de ecuaciones (2) tiene una única solución ! u n 2 Rn 1 :
544CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR
11.4.1.
Aspectos informáticos del método de diferencias …nitas
El problema propuesto en la sección precedente sugiere proponer la siguiente metodología para su resolución. 1. Lectura de datos de entrada. Leer L > 0; n 2 Z+ , funciones q y f: 2. Preparación de los datos de entrada. i. Generación de la malla (n) = fxj j j = 0; 1; :::; ng : a. Generación manual. b. Generación automática. ! ii. Construcción de los vectores ! q y b: ! q = (q (x1 ) ; :::; q (xn 1 )) ; ! b = (f (x1 ) ; :::; f (xn 1 )) : iii. Condiciones de frontera: u (0) ; u (L) : u (0) = 0; u (L) = 0: iv. Construcción de la matriz Ah = (aij (h)) : 2 + q (xi ) i = 1; :::; n 1; h2 1 i = 2; :::; n ai 1i (h) = aii 1 (h) = h2 aii (h) =
1:
3. Ejecución del algoritmo. Resolución del sistema de ecuaciones
! Ah ! uh = b :
(*)
a) Método directo: factorización LU: b) Método iterativo: S:O:R: 4. Preparación de los datos de salida. i. Construir el archivo que contiene n;
(n) y ! u h ; por ejemplo uh :dat contiene n
xi
uh;i ;
i = 0; :::; n:
ii. Con el propósito de efectuar pruebas, es recomendable conocer la solución exacta u. Con esta solución se debe construir el vector ! u = (u (0) ; :::; u (L)) y en consecuencia generar el archivo u: dat que contiene n xi ui i = 0; :::; n: iii. Supongamos que u 2 V , donde V es un espacio de funciones provisto de la norma k kV : Calcular el error r (n) = ku uh kV para diferentes discretizaciones. Generar un archivo que contiene n y e (n), por ejemplo: eh .dat: n e (n)
n = n1 ; 2n1 ; 4n1 ; 8n1 ; :::; 2n0 n1 ;
donde n0 2 Z+ (por ejemplo: n1 = 20; n0 = 5).
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.545 5. Presentación de resultados. i. Grá…cas de u y uh : ii. Curva de errores. Nota: Se conocen las soluciones u y uh en los puntos xi 2 (n); esto es, se tienen los conjuntos de puntos: G1 = f(xi ; u (xi )) j i = 0; 1; :::; ng ;
G2 = f(xi ; uh;i ) j i = 0; 1; :::; ng :
Al representar G1 y G2 en el sistema de coordenadas rectangulares XY , se tienen puntos en el plano. Estos puntos pueden ser unidos con segmentos de recta, polinomios de grado 2, polinomios cúbicos, etc. En de…nitiva, se utilizarán B-splines de orden 1, 2, 3, etc. Por sencillez se utilizarán los B-splines de orden 1. Para ello de…nimos 8 x xi 1 > > ; x 2 [xi 1 ; xi ] ; > < hi x xi+1 'i (x) = ; x 2 ]xi ; xi+1 ] ; i = 1; :::; n 1: > > hi+1 > : 0; x 2 [0; L] [xi 1 ; xi+1 ] Note que 'i (xj ) =
ij
i; j = 1; :::; n
1; además hi = h; i = 1; :::; n:
Ponemos u e (x) =
uh (x) = e (n) =
n X1 i=1 n X1
i=1 n0 X
u (xi ) 'i (x) ; un;i 'i (x) e (nj )
k
(n)
k=1
con
11.4.2.
k
(n) de…nida de manera análoga a 'i (x) :
Consistencia, estabilidad, convergencia
1. Sea L > 0. Consideramos el problema siguiente: Hallar u 2 C 2 ([0; L]) solución de donde q; f 2 C 0 ([0; L]) con q (x)
u00 + qu = f sobre ]0; L[ ; u (0) = u (L) = 0;
0 8x 2 [0; L] :
El esquema numérico que aproxima la solución u es el siguiente: ( u0 = un = 0 uj+1 2uj + uj 1 + q (xj ) uj = f (xj ) ; j = 1; :::; n h2
donde
(2)
1;
(n) = fxj = jh j j = 0; 1; :::; ng es el conjunto de nodos de [0; L] ; h =
L n
y n 2 Z+ :
El esquema numérico (2), en forma matricial, se escribe: ! Ah ! uh = b ; ! con ! u h = (u1 ; :::; un 1 )T ; b = (f (x1 ) ; :::; f (xn 1 )) ; Ah = (aij (h)) la matriz de…nida por: aii (h) = aii
1 (h)
(1)
=
2 + q (xi ) i = 1; :::; n 1; h2 2 = ai 1;i (h) i = 2; :::; n h2
1:
(3)
546CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR (n) ! R De…nición 5 Toda función g : xj ! g (xj ) = yj ! g = (g (x0 ) ; :::; g (xn )) o bien ! g = (y0 ; :::; yn ) :
se llama función reticular que se escribirá
Se denota con Vh al conjunto de todas las funciones reticulares de…nidas en (n). Con las operaciones habituales de funciones: adición y producto por escalares, Vh es un espacio vectorial de dimensión n + 1. Se denota con V0 = fg 2 Vh j g (0) = g (L) = 0g : Teorema 1 Las siguientes son normas en V0 : i) kgk1 = ii) kgk2 = iii) kgk1;2 =
Max
i=1;:::;n 1 nP1
jg (xi )j
hg 2 (x)
1 2
:
i=1
"
nP1 i=0
h
g (xi+1 ) g (xi ) h
2
#1 2
:
Demostración. Son inmediatas (véase el apéndice, espacios normados). Nota: para todo f; g 2 V0 ;
n X1
hf; gi =
i=1 n X1
hf; gi1;2 =
hf (xi ) g (xi ) ; [f (xi+1 )
f (xi )] [g (xi+1 ) h
i=0
g (xi )]
son productos escalares en V0 . Además,
1
kf k2 = hf; f i 2 : 1
2 : kf k1;2 = hf; f i1;2
jhf; gij
kf k2 kgk2
jhf; gij
8f; g 2 V0 ;
kf k1;2 kgk1;2
8f; g 2 V0
Teorema 2 Para todo f 2 V0 , se veri…ca que L
1 2
kf k2
1
kf k1
L 2 kf k1;2 :
Demostración. i. Probemos primeramente que kf k1
1
L 2 kf k1;2
8f 2 V0 : En efecto, yi =
y0 = 0; i = 1; :::; n: Luego, aplicando la desigualdad de Cauchy-Schwarz, se tiene 11 0 11 0 2 2 i 1 i 1 i 1 X X X 2 2 (yj+1 yj ) A jyi j = j(yj+1 yj )j @ 1 A @ j=0
1 2
Como h = jyi j
L h
0
n @
n X1
2
(yj+1
yj )
j=0
) n = Lh . Obtenemos 0 11 0 2 n n X1 L X1 1 @ (yj+1 yj )2 A = L 2 @ h h j=0
2A
j=0
(yj+1
yj ) ya que
j=0
j=0
j=0
11
iP1
2
n X1
=4
2
n (yj+1
25
yj )
j=0
yj+1 yj h
31
2
11
:
2 1
A = L 2 kf k 1;2
i = 1; :::; n
1:
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.547 1
En consecuencia kf k1
L 2 kf k1;2 :
ii. Probemos que kf k2
L 2 kf k1 :
1
Puesto que kf k22 =
n X1
hyi2 = h
i=1
n X1
yi2
h
i=1
n X1 i=1
kf k21 = hn kf k21 = L kf k21 : 1
De la no negatividad de la norma, se sigue que kf k2
L 2 kf k1 :
De i) y ii) se deduce 1 2
L
Observación. Puesto que jyi j kf k22 =
kf k2
1
L 2 kf k1;2 n X1
hyi2
i=1
kf k1
1
L 2 kf k1;2
8f 2 V0 :
i = 1; :::; n, se sigue que n X1 i=1
hL kf k21;2 = nhL kf k21;2 = L2 kf k21;2 ;
así, kf k22
L2 kf k21;2
kf k2
L kf k1;2 :
de donde que es la análoga a la desigualdad de Poincaré: f 2 H01 (o; L) ; 9c > 0 tal que kf kL2 (o;L)
c kf 0 kL2 (0;L) :
De…nición de consistencia ! Sea U h = (u (x0 ) ; :::; u (xn ))T el vector constituido por la solución exacta en los puntos xi ; de la malla (n) : De…nimos
i = 0; :::; n
! ! eh = Uh ! u h el error sobre la solución numérica, ! ! ! b error de consistencia. r h = Ah U h De…nición 6 1. Diremos que (1) y(3) son consistentes, para una norma k k de V0 , si l m k! r h k = 0: h!0
De…nición 7 2. Diremos que (1) y (3) tienen una consistencia de orden m > 0, si existe una constante c1 > 0 independiente de h, tal que k! r h k c1 hm 8h > 0: La consistencia es necesaria, pero no su…ciente para que el sistema discreto (esquema numérico (2)) sea convergente. Sea L : C 2 ([0; L]) ! C 0 ([0; L]) el operador diferencial de…nido por Lu = Para x 2 [0; L], escribiremos Lu (x) =
u00 + qu:
u00 (x) + q (x) u (x) :
Denotamos con L : C 0 (]0; L[) ! R el operador de…nido por: L u (x) = donde h > 0; x
u (x + h)
h; x; x + h 2 [0; L] :
2u (x) + u (x h2
h)
+ q (x) u (x) ;
548CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Ponemos L ui = f (xi ) ;
i = 1; :::; n
1: Observe que
u (xi+1 )
L u (xi ) =
2u (xi ) + u (xi+1 ) + q (xi ) u (xi ) i = 1; :::; n h2
1:
La consistencia establece que el operador L aproxima al operador diferencial L cuando h ! 0. Más precisamente, tenemos el siguiente teorema. Teorema 3 Supongamos que u, solución de (1), es de clase C 4 ([0; L]) : Entonces h2 (iv) u 12 h2 (iv) u 12
k! r h k1 kL uh
Luk1
L1 (0;L)
L1 (0;L)
; :
Demostración. Esto es, el esquema numérico (2) es consistente. De la de…nición de ! r h , se sigue que ! ! ! r h = Ah U h b , u (xi+1 ) 2u (xi ) + u (xi rih = h2
1)
+ q (xi ) u (xi )
f (xi ) :
Por otro lado, u00 (x) + q (x) u (x) = f (x)
x 2 ]0; L[ ;
entonces 0=
u00 (xi ) + q (xi ) u (xi )
de donde rih = u00 (xi )
f (xi ) ;
1 (u (xi+1 ) h2
i = 1; :::; n
2u (xi ) + u (xi
1;
1 )) :
Además, h2 00 u (xi ) + 2! h2 hu0 (xi ) + u00 (xi ) 2!
u (xi+1 ) = u (xi ) + hu0 (xi ) + u (xi
1)
= u (xi )
con =1 2 [xi ; xi+1 ] ; =2 2 [xi
1 ; xi ] ;
i = 1; :::; n
2u (xi ) + u (xi h2
1)
h4 iv u (=1 ) ; 4! h4 iv u (=2 ) ; 4!
1:
Entonces u (xi+1 )
h3 000 u (xi ) + 3! h3 000 u (xi ) + 3!
= u00 (xi ) +
h2 iv u (=1 ) + uiv (=2 ) ; 4!
con lo cual rih = jrih j
h2 iv u ( 1 ) + uiv ( 2 ) 4! h2 iv u 12
L1 (0;L)
de donde k! r h k1 =
Max
i=1;:::;n 1
jrih j
Puesto que Lu = f y L u (xi ) = f (xi ) i = 1; :::; n L u (xi ) Luego
Lu (xi ) = u00 (xi )
u (xi+1 )
! L Uh
; i = 1; :::; n h2 iv u 12
1
L1 (0;L)
:
1, se sigue que 2u (xi ) + u (xi h2
Lu
! 0:
1 h!0
1)
= rih i = 1; :::; n
1:
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.549
! Nótese que k! r h k1 = L U h
Lu
1
de orden 2.
h2 12
Max uiv (x) ; que muestra que el esquema numérico es
x2[0;L]
De…nición 8 Sean k kh;1 ; k kh;2 dos normas en V0 . Diremos que el esquema numérico (2) es estable con respecto de las normas k kh;1 ; k kh;2 , si existe una constante C2 > 0 independiente de h, tal que Ah 1 ! u
h;1
C2 k! u kh;2
8! u 2 V0 ; 8h > 0:
De…nición 9 Sea k k una norma en V0 : i. Se dice que el esquema numérico (2) es convergente con respecto de k k si l m k! e h k = 0: h!0
ii. Se dice que el esquema numérico tiene un orden de convergencia p > 0, si existe una constante C3 > 0 independiente de h tal que k! e h k C3 hp 8h > 0: ! Teorema 4 El sistema de ecuaciones Ah ! u h = b tiene una única solución uh : Demostración. Probemos que Ah es invertible. Para el efecto, mostremos que Ah es de…nida positiva, esto es, ! u T Ah ! u > 0 8! u 2 Rn 1 con ! u = 6 0: Sea ! u = (u ; :::; u ) 2 Rn 1 ; u = u = 0. Entonces 1
n
n
0
2
6 6 6 ! ! T u Ah u = (u1 ; :::; un ) 6 6 6 4 =
=
n X1
i=1 n X1 i=1
=
=
1 h2
1 ui ( ui h2 n X1
ui (ui
2 h2
+
ui 1 h2 un 2 h2
+
2 h2 2 h2
1
ui+1 h2
+ q (xi ) ui .. . + q (xn
+ 2ui
ui+1 ) +
ui
n X1
1)
un
n X1
ui+1 (ui+1
ui )
i=0
7 7 7 7 7 7 5
q (xi ) u2i
ui (ui+1
i=1 n X1
un h2
1
ui+1 h2
i=1
1)
3
u2 h2
+ q (x1 ) u1 .. .
2 + q (xi ) ui h2
ui 1 h2
ui
i=1 n X2
1 h2
u0 h2
ui (ui+1
i=1
!
+
ui )
!
ui )
n X1
q (xi ) u2i
i=1 n X1
+
q (xi ) u2i :
i=1
Tomando en cuenta que u0 = 0 u un = 0, se sigue que ! u T Ah ! u = =
=
1 h2 1 h2 1 h
n X1
ui+1 (ui+1
i=0 n X1
h
i=0
ui (ui+1
i=0
(ui+1
i=0 n X1
ui )
n X1
ui )2 +
ui+1 ui h
1 ! 2 k u k1;2 : h
2
n X1
q (xi ) u2i
i=1 n X1
+
i=1
q (xi ) u2i
!
ui )
+
n X1 i=1
q (xi ) u2i
550CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Luego ! u T Ah ! u
1 h
2 k! u k1;2 8! u 2 Rn con ! u = 6 0
Si ker (Ah ) 6= 0 f0g, existe u e 2 Rn
1
con u0 = un = 0 tal que u e 6= 0 y Ah u e = 0. Resulta que 1 e=0 ke uk21;2 ) u h
0
en otra contradicción con lo supuesto. En consecuencia ker (Ah ) = f0g, que muestra que Ah es invertible. ! ! Por lo tanto, 8 b 2 Rn 1 , el sistema de ecuaciones Ah ! u = b tiene solución única. Observación: La estabilidad del esquema numérico (2) signi…ca que pequeños errores en los datos de entrada producen pequeños errores en los datos de salida, esto a su vez que existe una constante c > 0 tal que Ah 1 c 8h > 0: Note que l m Ah 1 c: h!0
La consistencia y la estabilidad son dos nociones independientes. Teorema 5 Para todo ! u 2 V 0 ; Ah 1 ! u normas k k1;2 y k k2 :
L k! u k2 ; esto es, se tiene estabilidad con respecto de las
1;2
Demostración. Probaremos el teorema en dos etapas. i. Probemos que para todo ! u 2 V0 ;
2 h! u T Bh ! u = k! u k1;2 ;
donde Bh = (bij (h)) denota la matriz de n
1 (h)
n
1 de…nida por
2 i = 1; :::; n 1; h2 1 = bi 1i (h) i = 2; :::; n h2
bii (h) = bii
1
=
1:
Procediendo de manera similar al teorema precedente, tenemos n 1
1X h! u T Bh ! u = ui ( ui h
1
+ 2ui
i=1
u ii. Probemos que Ah 1 !
2 ui+1 ) = k! u k1;2 :
c k! u k1;2 :
1;2
u entonces ! u = Ah ! v : Ponemos Ah = Bh + Qh con Bh de…nida en i) precedente y Sea ! v = Ah 1 ! Qh = diag (q (x1 ) ; :::; q (xn 1 )) : Multiplicando por ! v T , se tiene ! v T! u =! v T Ah ! v =! v T (Bh + Qh ) ! v =! v T Bh ! v +! v T Qh ! v: Luego 2 h! v T! u = h! v T Bh ! v + h! v T + Qh ! v = k! v k1;2 +
de donde 0
n X1
2 k! v k1;2 +
Puesto que k! v k2
2 k! v k1;2 +
L k! v k1;2 ; entonces 2 k! v k1;2
n X1 i=1
hq (xi ) vi2
hq (xi ) vi2
i=1
k! v k2 k! u k2 :
i=1
Además, 2 k! v k1;2
hq (xi ) vi2 = h! v T! u
n X1
k! v k2 k! u k2 :
L k! v k1;2 k! u k2 ;
0
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.551 de donde
k! v k1;2
o bien
Ah 1 ! u
L k! u k2 ; L k! u k2 :
1;2
Estabilidad + consistencia ) convergencia. Teorema 6 El esquema numérico (2) es convergente para las normas k k2 ; k k1 y k k1;2 : Demostración. Puesto que Uh = (u (x1 ) ; :::; u (xn
1 )) ;
u (0) = u (L) = 0;y ! b
! ! r h = Ah U h con lo cual
! ! Ah U h = ! rh+ b:
Además,
! Ah ! uh = b :
! Luego, el error ! eh = Uh
! u h satisface la ecuación Ah ! eh=! r h;
pues
! Ah U h
! r h: uh =!
Se tiene ! e h 2 V0 y ! e h = Ah 1 ! r h: Por el teorema precedente (estabilidad para las normas k k1;2 y k k2 ) y por el teorema relativo a la consistencia, se tiene r h 1;2 L k! r h k2 : k! e h k1;2 = Ah 1 ! Puesto que L
1 2
r h k2 k!
1 r h k1;2 ; L 2 k!
k! r h k1
resulta que 1
k! r h k2
r h k1 L k!
L2 2 h Max uiv (x) 12 x2(0;L)
L k! r h k2
L2 2 h Max uiv (x) : 12 x2[0;L]
1 2
y en consecuencia 3
k! e h k1;2 Por lo tanto,
(*)
k! e h k1;2 !h!0 0:
Por otro lado, 3
L
1 2
L2 2 h Max uiv (x) ; 12 x2[0;L]
k! e h k1
k! e h k1;2
k! e h k1
L2 2 h Max uiv (x) !h!0 0: 12 x2[0;L]
(**) (11.1)
Finalmente, 3
L
L2 2 h Max uiv (x) ; 12 x2[0;L]
k! e h k2
k! e h k1;2
k! e h k2
L2 2 h Max uiv (x) !h!0 0: 12 x2[0;L]
1
5
(***)
552CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Observe que L con c =
c0 12
1 2
k! e h k2
k! e h k1
L
1 2
k! e h k1;2
ch2 ;
5
3
Max uiv (x) y c0 = L 2 ; L2 ; L 2 de acuerdo a (*), (**) y (***) respectivamente.
x2[0;L]
Adicionalmente, el teorema muestra que el esquema numérico (2) tiene un orden de convergencia 2 para las normas k k1 ; k k2 y k k1;2 :
11.4.3.
Orden de convergencia
1. Ecuación diferencial con condiciones de frontera de Dirichlet no homogéneas. Consideramos el problema siguiente: u00 + qu = f sobre ]0; L[ ; u (0) = a; u (L) = b:
hallar u 2 C 2 ([0; L]) solución de Sean n 2 Z+ , h =
L n;
(P.)
(h) = fxj = jh j j = 0; 1; :::; ng la malla de [0; L] :
El esquema numérico del problema (P) es el siguiente: ( u0 = a; un = b; uj+1 2uj + uj 1 + q (xj ) uj = f (xj ) h2
j = 1; :::; n
(P1 :)
1:
El esquema numérico (P1 ) en forma explícita se escribe: para j = 1; u0 = a, y u2 con lo cual
Para j = n
2u1 + a + q (x1 ) u1 = f (x1 ) h2
2 + q (x1 ) u1 h2 1; un = b, luego b
2un
1
+ un
2
h2 de donde
1 a u2 = f (x1 ) + 2 : 2 h h
1 un h2
2
+
+ q (xn
2 + q (xn h2
1)
1 ) un 1
un
1
= f (xn
= f (xn
1)
+
1)
b : h2
El esquema numérico (P1 ) es: 8 2 + q (x1 ) u1 h12 u2 = f (x1 ) + ha2 < h2 1 2 1 u = f (xj ) j = 2; :::; n 2 uj 1 + h2 + q (xj ) uj h2 j+1 : h 2 b 1 u + + q (x ) u n 1 n 1 = f (xn 1 ) + h2 : h2 n 2 h2
2
(P2 :)
Sea w : [0; L] ) R la función de…nida por
w (x) =
x b+ 1 L
Entonces w (0) = a; w (L) = b: Se de…ne u e=u
u e (0) = u (0) u e (L) = u (L)
x a: L
w. Se tiene w (0) = 0; w (L) = 0:
La función u e satisface las condiciones de frontera de Dirichlet homogénea. La ecuación lineal del problema (P) se escribe u e00 + q (e u + w) = f
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.553 de donde u e00 + qe u=f
En consecuencia
con g = f
u e00 + qe u = g sobre ]0; L[ ; u e (0) = u e (L) = 0
qw:
Note que g (xj ) = f (xj )
qw:
(qw) (xj ) = f (xj )
q (xj )
xj Lb
+ 1
e (P:) xj L
a :
e , el esquema numérico es idéntico al establecido Desde el punto de vista informático, si se utiliza P ! en la sección 3, el sistema de ecuaciones Ah ! u h = b es similar al establecido en esa sección a ! ! condición de remplazar b = (f (x1 ) ; :::; f (xn ))T por el vector b = (g (x1 ) ; :::; g (xn ))T : Si se utiliza el esquema numérico (P2 ), la matriz Ah es la misma que la de la sección 3, el vector ! b se remplaza por el vector f (x1 ) + ha2 ; f (x2 ) ; :::; f (xn 2 ) ; f (x1 ) + hb2 : e ha sido discutida en la sección 5. La estabilidad, consistencia y convergencia para el problema P Por lo tanto, el esquema numérico (P2 ) es convergente, con orden de convergencia igual a 2. 2. Ecuación diferencial con condiciones de frontera de Neumann. Consideramos el problema siguiente: hallar u 2 C 2 ([0; L]) solución de
u00 + qu = f sobre ]0; L[ ; u0 (0) = a; u0 (L) = b:
(Pn :)
Sea w la función real de…nifa por: w (x) =
x2 b 2L
(L
x)2 a; x 2 [0; L] : 2L
Entonces x x b+ 1 a; L L b a b a w00 (x) = = ; L L L w0 (0) = a; w0 (L) = b: w0 (x) =
Se de…ne u e=u
w. Entonces u e0 (x) = u0 (x) 0
w0 (x) 0
u e (0) = 0; u e (L) = 0;
u e00 (x) = u00 (x)
x 2 [0; L] ;
w00 (x) = u00 (x)
b
a L
:
Consecuentemente, el problema (Pn ) se escribe
con lo cual
u e00 (x) +
b
a L
+ q (x) (e u (x) + w (x) = f (x))
x 2 ]0; L[ ;
u e00 + qe u = f b La qw sobre ]0; L[ ; u e0 (0) = u e0 (L) = 0:
e n) (P
u00 + qu = f sobre ]0; L[ ; u0 (0) = u0 (L) = 0:
(P0 )
El resultado precedente muestra que debemos estudiar la ecuación diferencial con las condiciones de Neumann homogéneas; eso es, consideramos el problema (P0 ) siguiente:
554CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Para construir un esquema numérico que aproxime la solución de (P0 ), comenzamos con la aproximación de u0 (0) y u0 (L) : Aproximación de u0 (0) y u00 (0) Sea n 2 Z+ , h =
L h
y
(n) = fxj = jh j j = 0; 1; :::; ng : Entonces u00 (0) '
u0 (e x1 )
u0 (0) h 2
=
2 0 u (e x1 ) h
a ;
donde x e1 es el punto medio del intervalo [0; x1 ]. Para la aproximación de u0 (e x1 ) utilizamos las diferencias …nitas centrales. Tenemos u (x1 )
u0 (e x1 ) '
u (0)
h
;
luego u00 (e x1 ) '
2 u (x1 ) u (0) h h
a =
2 [u (x1 ) h2
u (0)
ah] :
Utilizando el polinomio de Taylor, tenemos u (x1 ) = u (0) + hu0 (0) + con lo cual
2 [u (x1 ) h2
h3 h2 00 u (0) + u000 ( ) con 2! 3! ah] = u00 (0) +
u (0)
2 [0; x1 ] ;
h 000 u ( ): 3
Aproximación de u0 (L) y u00 (L) : Sea x en el punto medio del intervalo [xn que u00 (L) ' '
u0 (L)
1 ; L].
u0 (e xn
1)
h 2
2 b h
u (L)
Procediendo de modo similar al caso u0 (L), se deduce
=
u (xn h
2 b h 1)
u0 (e xn =
1)
2 ( u (L) + u (xn h2
1)
+ bh) :
Por el desarrollo de Taylor, se tiene u (xn entonces
1)
= u (L)
hu0 (L) +
h2 00 u (L) 2!
2 ( u (L) + u (xn h2
De…nimos Lu =
1)
h3 000 u ( 3!
n)
+ bh) = u00 (L)
con h 000 u ( 3
n
2 [xn
1 ; L] ;
n) :
u00 + qu y suponemos u 2 C 4 ([0; L]) : Entonces Lu (x) = L u (0) = L u (L) =
u00 (x) + q (x) u (x) x 2 [0; L] ; 2 (u (x1 ) u (0) ah) + q (0) u (0) ; h2 2 ( u (L) + u (xn 1 ) + bh) + q (L) u (L) : h2
Se tiene jLu (0)
L (0)j = =
jLu (L)
L u (L)j =
u00 (0) + q (0) u (0) +
2 (u (x1 ) h2
h 000 u ( 1 ) con 1 2 [0; x1 ] ; 3 h 000 h 000 u ( n) = u ( n ) con 3 3
u (0)
n
2 [xn
ah)
q (0) u (0)
1 ; L] :
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.555 Para j = 0; :::; n, el esquema numérico tiene la forma siguiente: uj+1
Luego
8 <
Poniendo L u (xj ) =
:
1
+ q (xj ) uj = f (xj )
2 + q (0) u (0) h22 u1 = f (0) 2a h; h2 2 1 1 u + + q (x ) u u = f (xj ) ; j j h j+1 h2 j 1 h2 2 2b 2 u + h2 + q (L) un = f (L) + h : h2 n 1
u (xj+1 )
jLu (xj )
2uj + uj h2
2u (xj ) + u (xj h2
1)
+ q (xj ) u (xj ) ; se tiene
h2 Max u(iv) (x) 12 x2[0;L]
L u (xj )j
(P1 )
j = 1; :::; n
1:
Como jLu (0)
L u (0)j
jLu (L)
L u (L)j
h Max u000 (x) ; 3 x2[0;L] h Max u000 (x) ; 3 x[0;L]
se sigue h Max 3
k! r hk
u000
u(iv)
L1 (o;L)
L1 (0;L)
;
que muestra que el esquema numérico es de orden 1. Se puede observar que la matriz Ah = (aij (h)) del esquema numérico (P1 ) está de…nida por 2 + q (xi ) ; i = 0; 1; :::; n; h2 2 2 a12 (h) = ; ann 1 (h) = ; 2 h h2 1 ai 1i (h) = aii 1 (h) = i = 2; :::; n 1: h2 aii (h) =
La matriz Ah no es simétrica. Además, 8 ai < aii (h)
1i (h)
aii
a11 (h) ann (h)
:
1 (h) ;
i = 1; :::; n a12 (h) ; ann 1 (h) :
1;
Si q 6= 0, existe j = 0; 1; :::; n tal que q (xj ) > 0 con lo cual ajj (h) >
aj
1j
(h)
ajj
1 (h)
que prueba que la matriz Ah es diagonalmente dominante, y en consecuencia Ah es invertible. Conclusión: El esquema numérico (P1 ) es convergente con orden de convergencia igual a 1.
11.4.4.
Método de diferencias …nitas en mallas no uniformes
Posición del problema Sea L > 0. Consideramos el problema (P) siguiente: hallar u : [0; L] ! R solución de
d dx
k (x) du dx (x) + q (x) u (x) = f (x) x 2 ]0; L[ ; u (0) = 0; u (L) = 0;
(P)
556CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR dondek; q; f 2 C 0 ([0; L]) tales que k (x)
>0
q (x)
0
8x [0; L] ;
8x 2 [0; L] :
k du dx se interpreta como el ‡ujo.
El término
Sean n 2 Z+ y (n) = fx0 = 0 < x1 < ::: < xn 1 < xn = Lg la malla de [0; L] no necesariamente uniforme. Ponemos hj = xj xj 1 j = 1; :::; n; y h = Max hj : j=1;:::;n
Deseamos aproximar la solución de u de (P) en los nodos x1 ; :::; xn
1:
Discretizando de (P) Sean a; b 2 [0; L] tales que a < b. Entonces Z b Z b Z b d du f (x) dx q (x) u (x) dx = k (x) dx + dx a a a dx Z b Z b du b k (x) + q (x) u (x) dx = f (x) dx: dx a a a hi hi+1 ; b = xi + (a y b son los puntos medios de los intervalos [xi 2 2 respectivamente) se tiene
Para a = xi
hi+1 k xi + 2 =
Z
xi +
xi
Las derivadas
hi+1 2
hi 2
du dx
du dx
hi+1 xi + 2
hi 2
k xi
du dx
xi
hi 2
+
Z
xi +
xi
hi+1 2
hi 2
1 ; xi ]
y [xi ; xi+1 ]
q (x) u (x) dx
f (x) dx
xi +
hi+1 2
du dx
y
du hi xi dx 2 hi+1 du xi + dx 2
hi 2
xi ' '
se aproximan mediante diferencias …nitas centrales u (xi )
u (xi hi u (xi + hi+1 ) hi+1
hi )
u (xi 1 ) ; hi u (xi ) u (xi+1 ) u (xi ) = : hi+1 =
u (xi )
Las integrales del modo siguiente Z
xi +
xi
hi+1 2
hi 2
Z
xi +
xi
hi + hi+1 q (xi ) u (xi ) ; 2
q (x) u (x) dx ' hi+1 2
hi 2
f (x) dx '
hi + hi+1 f (xi ) 2
i = 1; :::; n
i = 1; :::; n
1;
(1)
1:
(2)
Las fórmulas (1) y (2) son una variante de la fórmula del punto medio siguiente: si g 2 C 0 ([ ; ]) ; Z + g (x) dx ' ( )g : 2 Denotamos con ui una aproximación de u (xi ). Se establece el esquema numérico siguiente: k xi +
hi+1 2
ui+1 ui + k xi hi+1
hi 2
ui
ui hi
1
+
hi + hi+1 q (xi ) ui = 2 hi + hi+1 f (x) i = 1; :::; n 2
1:
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.557 de donde hi 2
k xi hi =
ui
1
hi + hi+1 f (xi ) 2
2
+4
hi 2
k xi
k xi + +
hi
i = 1; :::; n
3
hi+1 2
hi + hi+1 + q (xi )5 ui 2
hi+1
1:
k xi +
hi+1 2
hi+1
ui+1
Tomando en consideración las condiciones de frontera u (0) = u0 = 0 y u (L) = un = 0, resulta: # " 8 h h h k x1 + 22 k x1 + 22 k x1 21 > > 1 > + + 2 (h1 + h2 ) q (x1 ) u1 u2 = 21 (h1 + h2 ) f (x1 ) ; > h1 h2 h2 > > > " # > < h h h h k xi 2i k xi + i+1 k xi + i+1 k xi 21 2 2 hi +hi+1 ui 1 + + + q (xi ) u (xi ) ui+1 = 12 (hi + hi+1 ) f (xi ) ; hi hi hi+1 2 hi+1 > > > > hn 1 > > k xn 1 > k(xn 1 + h2n ) k(xn 1 hn2 1 ) 2 > : un 1 + + + hn 1 +hn q (xn 1 ) un 1 = 1 (hn 1 + hn ) f (xn ) hn
hn
1
hn
1
2
2
(3)
Ponemos hi 2
k xi ai =
hi 2
k xi bi =
+
ci =
1;
hi+1 2
k xi +
hi
hi+1
hi+1 2
k xi +
fi =
i = 2; :::; n
hi
;
hi+1
a1 = 0;
1 (hi + hi+1 ) q (xi ) i = 1; :::; n 2
i = 1; :::; n
2;
1 (hi + hi+1 ) f (xi ) i = 1; :::; n 2
cn
1
1;
= 0;
1
El esquema numérico (3) se escribe ai ui
1
+ bi ui + ci ui+1 = fi i = 1; :::; n
Por otro lado, se pone ! u = (u1 ; :::; un k xi aii (h) =
T 1) ,
hi 2
+
hi 1 (h)
=
! v = (b1 ; :::; bn
k (xi + hi+1 ) hi + hi+1 + q (xi ) i = 1; :::; n hi+1 2 hi 2
i = 2; :::; n
hi
T 1)
(4)
y se de…ne Ah = (aij (h)) con
k xi ai i i (h) = aii
1:
con bi =
1
1;
hi + hi+1 f (xi ) : 2
El esquema numérico (3) se escribe en la forma ! Ah ! u = b: Se veri…can las condiciones siguientes: i. Ah = ATh , es decir que Ah es simétrica. ii. bi > 0 i = 1; :::; n
1:
iii. c1 < 0; a0 < 0; ci < 0 i = 2; :::; n
2; an
1
< 0:
(5)
558CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR iv.
bi > ai ci i = 2; :::; n b1 > c1 ; bn 1 > ann
2 1:
Se demuestra que Ah es positiva, esto es, Ah 1 > 0: Observación Si se considera el problema (P) siguiente: (
k (x) du(x) + q (x) u (x) = f (x) x 2 ]0; L[ ; dx
d dx
(P)
u (0) = a; u (L) = b
donde a; b 2 R; k; q; f funciones que satisfacen las condiciones citadas precedentemente. Se de…ne w (x) =
x Lb
(L x) L a
+
x 2 [0; L]. Se tiene
w (0) = a; w (L) = b; w0 (x) = Se de…ne u e=u
b
a
8x 2 [0; L] :
L
w. Entonces (
d dx
u k de u=f dx + qe
qw +
b a dk L dx :
e (P)
u e (0) = 0; u e (L) = 0
Note que en este caso k 2 C 1 ([0; L]) :
e tiene condiciones de frontera de Dirichlet homogéneas. El problema P
Condiciones de frontera mixtas
Consideramos ahora el caso en el que las condiciones de frontera son las siguientes: 0 1 u (0) 0 1 u (L)
con
1;
2;
1;
2;
+ +
2 u (0)
= g1 2 u (L) = g2
g1 ; g2 2 R.
Condiciones de frontera en x = 0: Tomando a = 0; b =
h1 2
se tiene
Z
h1 2
0
d dx
du k (x) dx
dx +
Z
h1 2
q (x) u (x) dx =
0
du k (x) dx
h1 2
+
Z
h1 2
f (x) dx
0
h1 2
q (x) u (x) dx =
0
0
Z Z
h1 2
f (x) dx:
0
h1
Consideramos el término
k (x)
du 2 dx 0
du k (x) dx Puesto que
1u
0 (0)
+
2 u (0)
Por otro lado, la derivada
du dx
. Tenemos h1 2
=
k
0
h1 2
= g1 , suponemos que h1 2
du dx 1
h1 2
+ k (0)
du (0) : dx
6= 0, con lo cual u0 (0) =
1 1
(g1
2 u (0)) :
se aproxima mediante diferencias …nitas centrales. Se tiene du dx
h1 2
'
u (x1 ) u (0) ; h1
11.4. MÉTODO DE DIFERENCIAS FINITAS PARA PROBLEMAS DE VALORES EN LA FRONTERA 1D.559 h1
en consecuencia
k (x)
du 2 dx 0
se aproxima como
du k (x) dx
h1 2
'
0
u (x1 ) u (0) 1 + k (0) (g1 h1 1
h1 2
k
2 u (0)) :
Además, Z
h1 2
0
q (x) u (x) dx '
h1 q (0) u (0) ; 2
Z
h1 f (0) : 2
h1 2
f (x) dx '
0
Resulta
h1 2
k o bien
2
En la práctica
1
4
u1
u0
1
(g1
2 u0 )
+
1
h1 2
k
3
k
h1 k (0) + q (0)5 u0 2 1 2
h1
= 1; 2 k h21 4 h1
+ k (0)
h1
h1 h1 q (0) u0 = f (0) ; 2 2 h1 2
u1 =
h1
h1 f (0) : 2
0 con lo cual
2
3 h1 + 2 k (0) + q (0)5 u0 2
h1 2
k
h1 f (0) + k (0) g1 : 2
u1 =
h1
Condición de frontera en x = L: hn 2 ;
Tomamos a = L
b = L. Entonces L
du k (x) dx con lo cual du k (x) dx La derivada
du dx
L
hn 2
+ L
hn 2
1u
0 (L)
k (x)
L
L
L
=
k (L)
hn 2
L
hn 2
q (x) u (x) dx =
Z
L hn 2
L
du (L) + k L dx
hn 2
du dx
f (x) dx;
L
hn 2
:
se aproxima mediante diferencias …nitas centrales, esto es, du dx
Por otro lado,
Z
+
du dx
L
k (L)
= hn 2
(g2
u (L)
'
= g2 ) u0 (L) =
2 u (L)
L
hn 2
L
1 1
(g2
2 u (L))
u (xn hn
1)
2 u (L))
:
con
hn 2
+k L
1
1
6= 0. Luego,
u (L)
u (xn hn
1)
:
Por otro lado, Z
L
L
hn 2
q (x) u (x) dx '
Z
L
L
hn 2
f (x) dx '
hn q (L) u (L) ; 2 hn f (L) : 2
Entonces k (L) 1
(g2
2 u (L))
+k L
hn 2
u (L)
u (xn hn
1)
+
hn hn q (L) u (L) ' f (L) : 2 2
560CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR de dond k L hn En la práctica
1
hn 2
un
"
hn 2
"
hn 2
k L 1+ hn
+
k (L) 1
2
# hn k (L) g2 hn q (L) un = f (L) + + : 2 2 1
= 1. Así
k L hn
hn 2
un
k L 1+ hn
La matriz Ah = (aij (h)) 2 M(n+1)
(n+1) [R]
# hn hn + k (L) 2 + q (L) un = f (L) + k (L) g2 : 2 2 satisface las siguientes propiedades:
i. Ah = ATh : ii. aii (h) > 0 i = 0; 1; :::; n; iii. ai
1i (h)
= aii
1 (h)
< 0 i = 2; :::; n;
iv.
aii (h) ai 1i (h) aii 1 (h) i = 2; :::; n 1; a11 (h) > a21 (h) ; ann (h) > ann 1 (h) :
La matriz Ah es positiva.
11.5.
Ejercicios resueltos
1. Considerar el problema de valores de frontera: ( u00 (x) + x2 u (x) = 1 + x u (0) = 0; u (1) = 1:
x 2 ]0; 1[ ;
Aplicar el método de diferencias …nitas para aproximar la solución con n = 5: La matriz debe factorarse con el método de Choleski. Solución Utilizando diferencias …nitas centrales, se tiene u00 (xj ) '
u (xj+1 )
2u (xj ) + u (xj h2x
1)
;
1 = 0;2 y xj = jhx j = 0; 1; : : : ; 5: 5 Sea uj una aproximación de u (xj ) : Entonces el problema de valores de frontera: ( u00 (x) + x2 u (x) = 1 + x x 2 ]0; 1[ ;
donde hx =
u (0) = 0; u (1) = 1:
se discretiza del modo siguiente: 8 < u0 = 0; u (1) = u5 = 1; u (xj+1 ) 2u (xj ) + u (xj : h2x
1)
+ x2j uj = 1 + xj
o de manera explícita:
j = 1; j = 2; j = 3; j = 4;
u2
2u1 + x21 u1 = 1 + x1 h2x u3 2u2 + u1 + x22 u2 = 1 + x2 h2x u4 2u3 + u2 + x23 u3 = 1 + x3 h2x 1 2u4 + u3 + x24 u4 = 1 + x4 h2x
11.5. EJERCICIOS RESUELTOS
561
que expresado en forma matricial, se tiene 2
2 2 6 h2x + x1 6 6 1 6 6 2 h 6 x 6 6 0 6 6 6 4 0
1 h2x 2 + x22 h2x 1 h2x
0
0
1 h2x
0
2 + x23 h2x 1 h2x
0
3
1 h2x 2 + x24 h2x
7 72 7 7 76 76 74 7 7 7 7 5
2 3 1 + x1 u1 6 1 + x2 6 u2 7 7=6 1 + x3 u3 5 6 4 1 1 + x4 + 2 u4 hx
3
7 7 7: 7 5
Remplazando hx = 0;2 y xj = jhx j = 1; 2; 3; 4 se obtiene 2
3 50;04 25 0 0 6 25 50;16 25 0 7 7; A=6 4 0 25 50;36 25 5 0 0 25 50;64 Ponemos ! u = (u1 ; u2 ; u3 ; u4 )T : método de factorización LU: 2 L11 0 0 0 6 L21 L22 0 0 Sean L = 6 4 0 L32 L33 0 0 0 L43 L44
2
3 1;2 ! 6 1;4 7 7 b =6 4 1;6 5 26;8
! Para resolver el sistema de ecuaciones A! u = b aplicamos el
3
7 7; 5
2
3 1 u12 0 0 6 0 1 u23 0 7 7 : Entonces U =6 4 0 0 1 u34 5 0 0 0 1
3 L11 L22 u12 0 0 7 6 L21 L21 u12 + L22 L22 u23 0 7 A = LU = 6 5 4 0 L32 L32 u23 + L33 L33 u34 0 0 L43 L43 u34 + L44 2
L11 = 50;04; L21 =
25;
u12 =
25 = 50;04
L22 = 50;16
0;4996003197
( 25)
25 50;04
= 37;66999201;
25 = 0;663658224 37;66999201 25; L33 = 50;36 ( 25) ( 0;663658224) = 33;7685444; 25 u34 = = 0;740333954 33;7685444 25; L44 = 50;64 ( 25) ( 0;740333954) = 32;13165115 u23 =
L32 =
L43 =
2
3 50;04 0 0 0 6 25 37;66999201 7 0 0 7 L = 6 4 0 5 25 33;7685444 0 0 0 25 32;13165115 2 1 0;4996003197 0 0 6 0 1 0;663658224 0 U = 6 4 0 0 1 0;740333954 0 0 0 1
3
7 7: 5
! ! El sistema de ecuaciones A! x = b se transforma en los siguientes: LU ! u = b ,
(
! L! y = b : U! u =! y
562CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR ! Solución del sistema lineal de ecuaciones L! y = b : En forma explícita, este sistema de ecuaciones lineales se expresa como sigue: 2 32 3 2 3 50;04 0 0 0 y1 1;2 6 25 37;66999201 7 6 y2 7 6 1;4 7 0 0 6 76 7 6 7 4 0 5 4 y3 5 = 4 1;6 5 ; 25 33;7685444 0 0 0 25 32;13165115 y4 26;8 luego y1 = y2 = y3 = y4 =
1;2 = 0;023980815; 50;04 1;4 + 25 0;023980815 = 0;05307992589; 37;66999201 1;6 + 25 0;05307992589 = 0;0866782444; 33;7685444 26;8 + 25 0;0866782444 = 0;9015084838; 32;13165115
Solución del sistema lineal de ecuaciones U ! u =! y : Este sistema en forma explícita se escribe como sigue: 2 32 3 2 3 1 0;4996003197 0 0 u1 0;023980815 6 0 7 6 u2 7 6 0;05307992589 7 1 0;663658224 0 6 76 7=6 7; 4 0 0 1 0;740333954 5 4 u3 5 4 0;0866782444 5 0 0 0 1 u4 0;9015084838 u4 = 0;9015084838; u3 = 0;0866782444 + 0;740333954
0;9015084838 = 0;750955848;
u2 = 0;05307992589 + 0;663658224
0;750955848 = 0;5535416624;
u1 = 0;023980815 + 0;4996003197
0;5535416624 = 0;3005304065;
con 3 cifras ! u T = (0;3; 0;554; 0;751; 0;902) ; u0 = 0 y u5 = 1: 2. Considerar el problema de valores de frontera: ( u00 (x) + (1 + x) u (x) = x2 u (0) = 1; u (1) = 0:
x 2 ]0; 1[ ;
Aplicar el método de diferencias …nitas para aproximar la solución con n = 5: La matriz debe factorarse con el método LU: Solución 1 Sean n = 5; hx = = 0;2; xj = 0;2j 5 tiene u00 (xj ) '
j = 0; 1; : : : ; 5: Utilizando diferencias …nitas centrales, se u (xj+1 )
2u (xj ) + u (xj h2x
1)
:
Sea uj una aproximación de u (xj ) : Entonces el problema de valores de frontera: ( u00 (x) + (1 + x) u (x) = x2 x 2 ]0; 1[ ; u (0) = 1; u (1) = 0:
se aproxima mediante el esquema siguiente: 8 < u (xj+1 ) 2u (xj ) + u (xj 1 ) + (1 + x ) u = x2 ; j j j h2x : u (0) = u0 = 1; u (1) = u5 = 0:
j = 1; 2; 3; 4;
11.5. EJERCICIOS RESUELTOS
563
En forma explícita, este conjunto de ecuaciones se escribe: j = 1; j = 2; j = 3; j = 4;
u2
2u1 + 1 + (1 + x1 ) u1 = x21 ; u0 = 1; h2x u3 2u2 + u1 + (1 + x2 ) u2 = x22 ; h2x u4 2u3 + u2 + (1 + x3 ) u3 = x23 ; h2x 2u4 + u3 + (1 + x4 ) u4 = x24 ; u5 = 0; h2x
que en forma matricial, se escribe como sigue: 2 2 1 0 6 h2x + 1 + x1 h2x 6 6 1 2 1 6 + 1 + x2 6 2 2 hx hx h2x 6 6 2 1 6 0 + 1 + x3 6 2 hx h2x 6 6 1 4 0 0 h2x
0 0 1 h2x 2 1 + +x4 h2x
3
7 72 7 7 76 76 74 7 7 7 7 5
2
3 6 u1 6 6 u2 7 7=6 6 5 u3 6 4 u4
Poniendo hx = 0;2 y x1 = 0;2; x2 = 0;4; x3 = 0;6; x4 = 0;8; se tiene 2 32 3 2 51;20 25 0 0 u1 25;04 6 25 51;4 7 6 7 6 25 0 7 6 u2 7 6 0;16 6 = 4 0 25 51;6 25 5 4 u3 5 4 0;36 0 0 25 51;8 u4 0;64
x21
3 1 + 2 7 hx 7 7 2 x2 7: 7 2 7 x3 5 x24
3
7 7: 5
Para hallar la solución de este sistema de ecuaciones lineales, apliquemos el método de factorización LU: Para el efecto, factoramos A = LU; donde 2 3 3 2 1 u12 0 0 L11 0 0 0 6 7 6 L21 L22 0 0 7 7 ; U = 6 0 1 u23 0 7 : L=6 4 0 0 4 0 L32 L33 0 5 1 u34 5 0 0 0 1 0 0 L43 L44
Puesto que
2
3 L11 L22 u12 0 0 6 L21 L21 u12 + L22 7 L22 u23 0 7 LU = 6 4 0 5 L32 L32 u23 + L33 L33 u34 0 0 L43 L43 u34 + L44
y de la igualdad A = LU se obtienen las matrices LU como siguen: L11 = 51;20; L21 =
25;
L32 =
25;
L43 =
25;
25 a12 = = 0;48828125; L11 51;20 L22 = a22 L21 u12 = 51;4 ( 25) ( 0;48828125) = 39;19296875; a23 25 u23 = = 0;6378695158; L22 39;19296875 L33 = a33 L32 u23 = 51;66 ( 25) ( 0;6378695158) = 35;65326211; a34 25 u34 = = = 0;7011981098; L33 35;65326211 L44 = a44 L43 u34 = 51;8 ( 25) ( 0;7011981098) = 34;27004726; u12 =
! Ponemos ! u T = (u1 ; u2 ; u3 ; u4 ) : El sistema de ecuaciones A! u = b es equivalente al siguiente: ( ! ! L! y = b; ! LU u = b , U! u =! y:
564CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR ! Hallemos la solución del sistema de ecuaciones L! y = b : Tenemos 2 32 51;20 0 0 0 6 25 39;19296875 76 0 0 6 76 4 0 54 25 35;65326211 0 0 0 25 34;27004726 luego
y1 = y2 = y3 = y4 =
3 2 y1 25;04 6 0;16 y2 7 7=6 y3 5 4 0;36 y4 0;64
3
7 7; 5
25;04 = 0;4890625; 51;20 0;16 + 25 0;4890625 = 0;316040425; 39;19296875 1;6 + 25 0;316040425 = 0;2317042008; 35;65326211 26;8 + 25 0;2317042008 = 0;1877034184; 34;27004726
Hallemos la solución del sistema de ecuaciones U ! u =! y que en forma explícita se expresa como sigue: 2 32 3 2 3 1 0;48828125 0 0 u1 0;4890625 6 0 7 6 u2 7 6 0;316040425 7 1 0;6378695158 0 6 76 7=6 7; 4 0 0 1 0;7011981098 5 4 u3 5 4 0;2317042008 5 0 0 0 1 u4 0;1877034184 de donde u4 = 0;1877034184; u3 = 0;2317042008 + 0;7011981098 u2 = 0;316040425 + 0;6378695158 u1 = 0;4890625 + 0;48828125
0;1877034184 = 0;363321483; 0;363321483 = 0;5477921234;
0;5477921234 = 0;7565391228;
La aproximación de la ecuación diferencial en cuatro nodos internos con una precisión de 3 cifras es ! u T = (0;757; 0;548; 0;363; 0;188) : 3. Considerar el problema de valores de frontera no lineal siguiente: u00 + u3 = f sobre ]0; 12[ ; u (0) = u (12) = 0; donde f (x) =
0; si x 2 [0; 5] ; y el esquema numérico siguiente: 1; si x 2 ]5; 12[ ; (
uj+1
2uj + uj h2 u0 = 0; un = 0;
1
+ u3j = f (xj ) ;
j = 1; : : : ; n
1
12 ; n 2 Z+ ; xj = jh; j = 0; 1; : : : ; n y uj una aproximación de u (xj ) : n i) Para n = 6; construir el sistema no lineal correspondiente al esquema numérico propuesto. ii) Considere una aproximación inicial ! u (0) = (0; 1; 1; 1; 1; 1; 0) : Aplique el método de Newton y dos iteraciones. con h =
Solución Puesto que se requiere generar un algoritmo general para aproximar la solución del problema de valores de frontera, hemos de proceder en ese sentido para luego particularizar al caso n = 6:
11.5. EJERCICIOS RESUELTOS
565
Sean L > 0. Suponemos que f es una función de…nida en [0; L] : Sea n 2 Z+ : Ponemos h = xj = jh; j = 0; 1; : : : ; n; fj = f (xj ) ; j = 0; 1; : : : ; n: Del esquema numérico ( u 2uj + uj 1 j+1 + u3j = f (xj ) ; j = 1; : : : ; n 1; h2 u0 = 0; un = 0;
L ; n
se obtiene las siguientes ecuaciones. Para j = 1; u2 o bien
2u1 + u0 + u31 = f1 ; h2
2 u1 h2
Para 1 < j < n
1; 1 uj h2
Para j = n
1 u2 + u31 = f1 : h2
1
+
2 uj h2
1 uj+1 + u3j = fj : h2
1 un
de donde
2un 1 + un h2
2
+ u3n
1
= fn
1;
1 2 un 2 + 2 un 1 + u3n 1 = fn 1 : h2 h 1 ) ; u0 = 0; un = 0: De…nimos la matriz A = (aij (h)) y el vector
Ponemos ! u T = (u1 ; : : : ; un ! B ( u ) 2 Rn 1 como sigue 8 0; si ji jj > 1; > > < 2 ; si i = j; aij (h) = i; j = 1; : : : ; n h2 > > 1 : ; si ji jj = 1 h2 ! Se de…ne f T = (f (x1 ) ; : : : ; f (xn 1 )) = (f1 ; : : : ; fn 1 ) :
1;
bj (! u ) = u3j ; j = 1; : : : ; n
1:
Entonces, el esquema numérico propuesto, discretización del problema de valores de frontera u00 + u3 = f sobre ]0; L[ u (0) = 0 = u (L) ; se transforma en el siguiente sistema de ecuaciones no lineales: ! A! u + B (! u)= f : ! Se de…ne F : Rn 1 ! Rn 1 como F (! u ) = A! u + B (! u) f ! u 2 R4 : Para aplicar el método de Newton, requerimos de la matriz jacobiana DF (! u ) : Para el efecto, hallemos la derivada de Gâteau (derivada direccional de F) D! y F (! u ) según la dirección ! y 2 Rn 1 en ! u 2 Rn 1 : Por de…nición F (! u + t! y) D! y F (! u)= lm t!0 t
F (! u)
;
siempre que el límite exista. Sea t 6= 0: Entonces F (! u + t! y)
! F (! u ) = A (! u + t! y ) + B (! u + t! y) f = tA! y + B (! u + t! y ) B (! u):
El j-ésimo componente de B (! u + t! y) (uj + tyj )3
A! u + B (! u)
B (! u ) es
u3j = u3j + 3tu2j yj + 3t2 uj yj2 + t3 yj3 = tyj 3u2j + 3tuj yj + t2 yj2 ;
u3j
! f
566CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR de donde (uj + tyj )3 t!0 t
u3j
lm
= 3yj u2j ;
j = 1; : : : ; n
1;
luego, B (! u + t! y) F (! u + t! y ) F (! u) y + = l m A! D! y F (! u) = lm t!0 t!0 t t = A! y + D! y B (! u); donde
2
6 6 D! y B (! u) = 36 4
u21 0 .. .
0 u22
0
: : : : : : u2n
::: ::: .. .
32
0 0 .. . 1
con c (! u ) = (cij (! u )) la matriz de…nida como cij (! u)=
u3i ; si i = j ; 0; si i 6= j
76 76 76 54
3
y1 y2 .. . yn
B (! u)
7 7 u)! y; 7 = 3c (! 5
1
i; j = 1; : : : ; n
1:
Así, D! y F (! u ) = [A + 3c (! u )] ! y
8! y 2 Rn
1
;
con lo cual, la matriz jacobiana está de…nida como DF (! u ) = A + 3c (! u);
8! u 2 Rn
1
:
El método de Newton está de…nido como sigue: 8 (0) e aproximación inicial, < u DF u e(k) w e= F u e(k) ; : (k+1) u e =u e(k) + w: e
k = 0; 1; : : : ; Nmax ;
L 12 i) Para n = 6 se tiene h = = = 2; xj = jh; j = 0; 1; : : : ; n; la partición del intervalo [0,12] n 6 está constituida por los siguientes nodos: x0 = 0; x1 = 2; x2 = 4; x3 = 6; x4 = 8; x5 = 10; x6 = 12; y la función f en dichos nodos tiene los valores siguientes: f (0) = 0; f (2) = 0; f (4) = 0; f (6) = 1; f (8) = 1; f (10) = 1; f (12) = 1: Luego, fe = (0; 0; 1; 1; 1) ; 2
6 6 6 6 6 6 A=6 6 6 6 6 6 4
2 h2 1 h2 0
1 h2 2 h2 1 h2
0
0
0
0
0
0
1 h2 2 h2 1 h2
0 1 h2 2 h2 1 h2
0 2
6 6 ! B(u) =6 6 4
u31 u32 u33 u34 u35
3
7 7 7; 7 5
2 1 7 6 2 7 6 1 6 0 7 7 6 7 6 4 7 6 6 0 7 7=6 0 7 6 6 1 7 7 6 0 6 h2 7 5 4 2 0 h2 0
3
2
6 6 ! c(u) = 6 6 4
1 4 1 2 1 4 0 0
0 1 4 1 2 1 4
0
0
0
1 4 1 2 1 4
0
u21 0 0 0 0 0 u22 0 0 0 0 0 u23 0 0 0 0 0 u24 0 0 0 0 0 u25
0
3
7 7 7: 7 5
0 1 4 1 2
3
7 7 7 7 7 7 7; 7 7 7 7 7 5
11.5. EJERCICIOS RESUELTOS
567
El sistema no lineal de ecuaciones es 2 1 6 2 6 1 6 6 6 4 6 6 0 6 6 6 6 0 6 4 0
1 4 1 2 1 4
0 1 4 1 2 1 4
0 0
0
0
0
0
1 4 1 2 1 4
0
0 1 4 1 2
3
7 72 7 7 76 76 76 76 74 7 7 7 5
u1 u2 u3 u4 u5
3
2
7 6 7 6 7+6 7 6 5 4
3
u31 u32 u33 u34 u35
2
7 6 7 6 7=6 7 6 5 4
f1 f2 f3 f4 f5
3
2
3
2
3
0 0 1 1 1
7 6 7 6 7=6 7 6 5 4
7 7 7; 7 5
por lo tanto
2 1 6 2 6 1 6 6 6 4 ! 6 f =6 6 0 6 6 6 0 6 4 0
F (! u ) = A! u + B (! u)
ii) Sea ! u (0) Entonces
B u e(0)
T
1 4 1 2 1 4 0 0
0 1 4 1 2 1 4
0
0
0
0
1 4 1 2 1 4
0
0 1 4 1 2
3
7 72 7 7 76 76 76 76 74 7 7 7 5
u1 u2 u3 u4 u5
7 6 7 6 7+6 7 6 5 4
u31 u32 u33 u34 u35
= (0; 1; 1; 1; 1; 1; 0) una aproximación inicial. Ponemos ! u (0)
2
6 6 =6 6 4
13 13 13 13 13
3
2
7 6 7 6 7=6 7 6 5 4
1 1 1 1 1
3
7 7 7; 7 5
Ae u(0)
2 1 6 2 6 1 6 6 6 4 6 =6 6 0 6 6 6 0 6 4 0
2
F u e(0) = Ae u(0) + B u e(0)
6 6 6 ! 6 f =6 6 6 6 4
1 4 1 2 1 4 0 0
1 4 0 0 0 1 4
3
0
0
1 4 1 2 1 4 0
2
7 7 7 6 7 6 7+6 7 6 7 4 7 5
1 1 1 1 1
0
0
0
1 4 1 2 1 4
3 7 7 7 7 5
0 1 4 1 2
2
3
7 72 7 7 76 76 76 76 74 7 7 7 5
3
1 1 1 1 1
2
6 0 6 6 0 7 6 6 7 6 6 1 7=6 6 7 6 4 1 5 6 6 4 1
3 7 7 7 7 5
T
2 6 6 6 6 4
3
7 7 7: 7 5
= (1; 1; 1; 1; 1) :
2
3
6 6 7 6 7 6 7=6 7 6 5 6 6 4
5 4 1 0 0 1 4
0 0 1 1 1
3
7 7 7 7 7; 7 7 7 5
1 4 0 0 0 1 4
3
7 7 7 7 7; 7 7 7 5
568CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR
(0)
DF u e
(0)
= A + 3c u e 2 7 6 2 6 1 6 6 6 4 6 = 6 6 0 6 6 6 0 6 4 0
1 4 7 2 1 4 0 0
2 1 6 2 6 1 6 6 6 4 6 =6 6 0 6 6 6 0 6 4 0 0
1 4 7 2 1 4 0
1 4 1 2 1 4
1 4 1 2 1 4
0 0
0
0
0
0
1 4 7 2 1 4
0
0
1 4 7 2
0
0
0
1 4 1 2 1 4
3
0
0
0 1 4 1 2
3
7 7 2 7 7 7 6 7 6 7 + 36 7 6 7 4 7 7 7 5
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 1
3 7 7 7 7 5
7 7 7 7 7 7 7 7 7 7 7 7 5
El sistema de ecuaciones lineales es:
2 7 6 2 6 1 6 6 6 4 6 6 0 6 6 6 6 0 6 4 0
1 4 7 2 1 4 0 0
0 1 4 7 2 1 4 0
0 0 1 4 7 2 1 4
0 0 0 1 4 7 2
3
7 72 7 7 76 76 76 76 74 7 7 7 5
w1 w2 w3 w4 w5
3
7 7 7= 7 5
2 6 6 6 6 6 6 6 6 4
5 4 1 0 0 1 4
3
7 7 7 7 7: 7 7 7 5
Método de Crout. Sea D la matriz del sistema de ecuaciones precedente. Entonces, D = LU y ! Le y = eb D! w = b , LU w e = eb , Uw e = ye: Comencemos con la factorización
2
6 6 D = LU = 6 6 4 2
6 6 = 6 6 4
L11 0 0 0 0 L21 L22 0 0 0 0 L32 L33 0 0 0 0 L43 L44 0 0 0 0 L54 L55
32 76 76 76 76 54
1 u12 0 0 0 0 1 u23 0 0 0 0 1 u34 0 0 0 0 1 u45 0 0 0 0 1
3 7 7 7 7 5
L11 L11 u12 0 0 0 L21 L21 u12 + L22 L22 u23 0 0 0 L32 L32 u23 + L33 L33 u34 0 0 0 L43 L43 u34 + L44 L44 u45 0 0 0 L54 L44 u45 + L55
3 7 7 7 7 5
11.5. EJERCICIOS RESUELTOS
569
Obtenemos
L11 = u12 =
L21 =
7 ; 2 1 a12 = 4 = 7 L11 2 1 ; 4
L22 = a22
u23 =
L32 =
L43 =
L54 L55
7 2
1 4
1 14
1 4
14 195
1 4
195 2716
195 ; 56
=
14 ; 195
L32 u23 =
7 2
1 a34 4 = = 1358 L33 390 1 ; 4
L44 = a44
u45
L21 u12 =
1 a23 = 4 = 195 L22 56 1 ; 4
L33 = a33
u34 =
1 ; 14
L43 u34 =
=
1358 679 = ; 390 195
195 ; 2716
7 2
1 a45 4 = 2716 ; = = 37829 L44 37829 10864 1 = ; 4 7 1 = a55 L54 u45 = 2 4
=
2716 37829
37829 ; 10864
=
263445 : 75658
! Resolución del sistema triangular inferior L! y = b ; esto es,
2 7 6 2 6 1 6 6 6 4 6 6 0 6 6 6 6 0 6 4 0
0 195 56 1 4 0 0
0 0 679 195 1 4 0
0
0
0
0
0
0
37829 10864 1 4
0 263445 75658
3
7 72 7 7 76 76 76 76 74 7 7 7 5
y1 y2 y3 y4 y5
3
2
6 6 7 6 7 6 7=6 7 6 5 6 6 4
5 4 1 0 0 1 4
3
7 7 7 7 7: 7 7 7 5
570CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Se tiene 5 4 = 7 2
y1 = 1 195 y1 + y2 4 56 1 679 y2 + y3 4 195 37829 1 y3 + y4 4 10864 1 263445 y4 + y5 4 75658
5 = 14
0;3571428571;
1 56 1 + y1 = 0;3128205128; 195 4 195 1 = 0 ) y3 = y2 = 0;02245941926; 679 4 10864 1 = 0 ) y4 = y3 = 0;0004031298739; 37829 4 1 75658 1 1 = ) y5 = + y4 = 0;07182571318; 4 263445 4 4 =
1 ) y2 =
Resolución del sistema triangular superior U ! w =! y : 2
1 14
1
6 6 6 6 0 6 6 6 0 6 6 6 6 0 4 0
0
0
1
14 195
0
1
0
0
1
0
0
0
0
3
72 7 7 0 76 76 76 76 0 74 7 2716 7 7 37829 5 1
0 195 2716
w1 w2 w3 w4 w5
3
2
0;3571428571 0;3128205128 0;02245941926 0;0004031298739 0;07182571318
7 6 7 6 7=6 7 6 5 4
Obtenemos w5 = 2716 w5 = 37829
w4
w4 = w3
w2 =
w1 = Luego
(0)
=u e
2
6 6 +w e=6 6 4
0;0004031298739 =
0;00555998406;
0;02245949926; 195 w4 2716
0;02245949926 =
0;228586881;
0;3128205128; 14 w3 195
1 w2 = 14
w1
Segunda iteración
2716 w5 37829
14 w3 = 195
w2
u e
0;0004031298739;
195 w4 = 2716 w3 =
(1)
0;07182571318;
0;3128205128 =
0;3144616494;
0;3571428571; 1 w2 14
1 1 1 1 1
3
0;3571428571 =
2
7 6 7 6 7+6 7 6 5 4
0;3796044035 0;3144616494 0;228586881 0;00555998406 0;07182571318
0;3796044035;
3
2
7 6 7 6 7=6 7 6 5 4
0;6203955965 0;6855383506 0;9771413119 0;9944400159 0;9281742868
3
7 7 7: 7 5
3 7 7 7 7 5
11.5. EJERCICIOS RESUELTOS
571
La matriz A y el vector fe no cambian. Calculemos B u e(1) : Tenemos 2 3 (1) 3 u1 6 7 2 3 3 7 6 0;238784493 6 u(1) 7 2 6 7 6 0;3221775434 7 6 7 6 7 (1) 3 7 (1) 6 6 0;9341234603 7 : B u e = 6 u3 = 7 6 7 6 7 4 0;9987910978 5 (1) 3 7 6 6 u4 7 0;7996291156 4 5 (1) 3
u5
Calculemos F u e(1) = Ae u(1) + B u e(1) 2 0;5 0;25 0 0 6 0;25 0;5 0;25 0 6 6 0 0;25 0;5 0;25 6 4 0 0 0;25 0;5 0 0 0 0;25 3 2 0;3775977034 6 0;2654626945 7 7 6 7 =6 6 0;00160990548 7 4 0;022160836 5 0;0138170415
fe: Tenemos 32 0;6203955965 0 6 0;6855383506 0 7 76 6 0 7 7 6 0;9771413119 5 0;25 4 0;9944400159 0;9281742868 0;5
3
2
7 6 7 6 7+6 7 6 5 4
0;238784493 0;3221775434 0;9341234603 0;9987910978 0;7996291156
3 7 7 7 7 5
2 6 6 6 6 4
0 0 1 1 1
Calculemos DF u e(1) = A + 3c u e(1) :
Se tiene
A + 3c u e(1)
3 0;5 0;25 0 0 0 6 0;25 0;5 0;25 0 0 7 7 6 0;25 0;5 0;25 0 7 = 6 7 6 0 4 0 0 0;25 0;5 0;25 5 0 0 0 0;25 0;5 2 3 2 (1) u1 0 0 0 0 7 6 6 7 (1) 2 6 7 0 u2 0 0 0 6 7 6 7 2 (1) 7 +3 6 0 0 u3 0 0 6 7 6 7 2 (1) 6 7 0 0 0 u4 0 6 7 4 5 2 (1) 0 0 0 0 u5 2 1;654672089 0;25 0 0 0 6 0;25 1;90988849 0;25 0 0 6 0 0;25 3;366756292 0;25 0 = 6 6 4 0 0 0;25 3;497581708 0;25 0 0 0 0;25 3;08452252 2
El sistema de ecuaciones lineales correspondiente DF u e(1) w e= F u e(1) es el siguiente: 2 32 3 w1 1;654672089 0;25 0 0 0 6 7 6 w2 7 0;25 1;90988849 0;25 0 0 7 6 76 6 7 6 w3 7 0 0;25 3;366756292 0;25 0 7 6 76 4 5 4 w4 5 0 0 0;25 3;497581708 0;25 w5 0 0 0 0;25 3;08452252 2 3 0;3775977034 6 0;2654626945 7 6 7 7 0;00160990548 =6 6 7 4 0;02217505055 5 0;0138170415
3 7 7 7 7 5
3 7 7 7 7 5
572CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR Resolvemos este sistema utilizando el método de Crout. Para ello la matriz del sistema lo factoramos en la forma LU como se procedió en la primera iteración. Note que la matriz del sistema es simétrica, estrictamente diagonalmente dominante. Se obtienen los siguientes resultados:
L11 = 1;654672089; 0;25 u12 = = 1;654672089 L21 = 0;25;
0;1510873373;
L22 = a22 L21 u12 = 1;872116656; 0;25 a23 = u23 = = 0;1335386869; L22 0;872116656 L32 = 0;25; L33 = a33 L32 u23 = 3;33337162; a34 u34 = = 0;07499913855; L33 L43 = 0;25; L44 = a44 L43 u34 = 3;478831923; a45 u45 = = 0;7186320165; L44 L54 = 0;25; L55 = a55
El sistema triangular inferior L! y = 2 6 6 6 6 4
L54 u45 = 3;06655672:
F u e(1) es el siguiente:
1;654672089 0 0 0 0 0;25 1;872116656 0 0 0 0 0;25 3;33337162 0 0 0 0 0;25 3;478831923 0 0 0 0 0;25 3;06655682 2 3 0;3775977034 6 0;2654626945 7 6 7 7 =6 6 0;00160990548 7 4 0;02217505055 5 0;0138170415
cuya solución es
y1 = y2 = y3 = y4 = y5 =
0;3775977034 = 0;2282009263; 1;654672089 0;25y1 0;2654626945 = 0;1722718107; 1;872116656 0;25y2 0;00160990548 = 0;0134032035; 3;33337162 0;25y3 0;02217505055 = 0;007337477635; 3;478831923 0;25y4 0;0138170415 = 0;005103903935: 3;06655682
32 76 76 76 76 54
y1 y2 y3 y4 y5
3 7 7 7 7 5
11.6. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA
573
Resolución del sistema triangular superior U w e=! y : 2 1 0;1510873383 0 0 6 0 1 0;1335386869 0 6 6 0 0 1 0;07499913855 6 4 0 0 0 1 0 0 0 0 3 2 0;2282009263 6 0;1722718107 7 7 6 6 0;0134032035 7 =6 7 4 0;007337477635 5 0;005103903935
0 0 0 0;7186320165 1
32 76 76 76 76 54
w1 w2 w3 w4 w5
3 7 7 7 7 5
Obtenemos
w5 =
0;005103903935;
w4 =
0;01100530641;
w3 =
0;014228592;
w2 =
0;1741718782;
w1 =
0;2545160916;
En consecuencia:
(2)
u e
(1)
=u e
2
6 6 ! +w =6 6 4
0;6203955965 0;6855383506 0;9775405007 0;9995968701 0;9281742868
(2) (2) y con u0 = 0; u6 = 0 se obtiene ! u (2) :
11.6.
3
2
7 6 7 6 7+6 7 6 5 4
0;2545160916 0;1741718782 0;014228592 0;01100530641 0;005103903935
3
2
7 6 7 6 7=6 7 6 5 4
0;3658795049 0;5113664724 0;9633119087 0;9885915637 0;9230703829
3
7 7 7; 7 5
Lecturas complementarias y bibliografía
1. Tom M. Apostol, Calculus, Volumen 1, Segunda Edición, Editorial Reverté, Barcelona, 1977. 2. Uri M. Ascher, Robert M. M. Mattheij, Robert D. Russell, Numerical Solution of Boundary Value Problems for Ordinary Di¤erential Equations, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1995. 3. N. Bakhvalov, Metodos Numéricos, Editorial Paraninfo, Madrid, 1980. 4. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 5. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 6. Steven C. Chapra, Raymond P. Canale, Numerical Methods for Engineers, Third Edition, Editorial McGraw-Hill, Boston, 1998. 7. S. D. Conte, Carl de Boor, Análisis Numérico, Segunda Edición, Editorial Mc Graw-Hill, México, 1981. 8. M. Crouzeix, A. L. Mignot, Analyse Numérique des Equations Di¤érentielles, Seconde Edition, Editorial Masson, París, 1989. 9. Jean-Pierre Demailly, Analyse Numérique et Equations di¤erentielles, Presses Universitaires de Grenoble, Grenoble, 1991.
574CAPÍTULO 11. MÉTODOS NUMÉRICOS DE RESOLUCIÓN DE ECUACIONES DIFERENCIALES ORDINAR 10. Peter Deu‡hard, Folkmar Bornemann, Scienti…c Computing with Ordinary Di¤erential Equations, Editorial Springer-Verlag, New York, 2002. 11. B. P. Demidovich, I. A. Maron, E. Cálculo Numérico Fundamental, Editorial Paraninfo, Madrid, 1977. 12. B. P. Demidovich, I. A. Maron, E. S. Schuwalowa, Métodos Numéricos de Análisis, Editorial Paraninfo, Madrid, 1980. 13. James W. Demmel, Applied Numerical Linear Algebra, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1997. 14. C. H. Edwards, Jr., David E. Penney, Ecuaciones Diferenciales Elementales y Problemas con Condiciones en la Frontera, Tercera Edición, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1993. 15. Ferruccio Fontanella, Aldo Pasquali, Calcolo Numerico. Metodi e Algoritmi, Volume II Pitagora Editrice Bologna, 1983. 16. M. K. Gavurin, Conferencias sobre los Métodos de Cálculo, Editorial Mir, Moscú, 1973. 17. Curtis F. Gerald, Patrick O. Wheatley, Análisis Numérico con Aplicaciones, Sexta Edición, Editorial Pearson Educación de México, México, 2000. 18. E. Hairer, S. P. Norsett, G. Wanner, Solving Ordinary Di¤erential Equations I, Second Revised Edition, Editorial Springer-Verlag, Berlín, 2000. 19. R. Kent Nagle, Edward B. Sa¤, Arthur David Snider, Ecuaciones Diferenciales y Problemas con Valores en la Frontera, Tercera Edición, editorial Pearson Educación, México, 2001. 20. David Kincaid, Ward Cheney, Análisis Numérico, Editorial Addison-Wesley Iberoamericana, Wilmington, 1994. 21. Melvin J. Maron, Robert J. López, Análisis Numérico, Tercera Edición, Compañía Editorial Continental, México, 1995. 22. R. M. M. Mattheij, J. Molenaar, Ordinary Di¤erential Equations in Theory and Practice, Editorial John Wiley & Sons, New York, 1996. 23. Shoichiro Nakamura, Métodos Numérico Aplicados con Software, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1992. 24. Antonio Nieves, Federico C. Dominguez, Métodos Numéricos Aplicados a la Ingeniería, Tercera Reimpresión, Compañía Editorial Continental, S. A. De C. V., México, 1998. 25. S. Nikolski, Fórmulas de Cuadratura, Editorial Mir, Moscú, 1990. 26. J. M. Ortega, W. C. Rheinbolodt, Iterative Solution of Nonlinear Equatios in Several Variables, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 2000. 27. Anthony Ralston, Introducción al Análisis Numérico, Editorial Limusa, México, 1978. 28. Werner C. Rheinboldt, Methods for Solving Systems of Nonlinear Equations, Second Edition, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1998. 29. A. A. Samarski, Introducción a los Métodos Numéricos, Editorial Mir, Moscú, 1986. 30. M. Sibony, J. Cl. Mardon, Analyse Numérique II, Approximations et Equations Di¤érentielles, Editorial Hermann, París, 1988. 31. J. Stoer, R. Bulirsch, Introduction to Numerical Analysis, Editorial Springer-Verlag, 1980.
Capítulo 12
Apendice Resumen Este apéndice tiene como objetivo refrescar algunos resultados de los espacios vectoriales, los espacios normados y los espacios con producto interior. Al …nal se provee de una amplia bibliografía sobre estos tópicos.
12.1.
Espacios vectoriales reales.
12.1.1.
De…nición de espacio vectorial. Ejemplos.
Se denota con R al cuerpo de los números reales. Nos limitamos en de…nir los espacios vectoriales reales. De…nición 1 Un espacio vectorial V sobre R consiste en un conjunto no vacío V en el que se ha de…nido dos operaciones: adición “+” en V que a cada par de elementos x; y de V le asocia un único elemento x + y de V , y, producto de números reales por elementos de V dicha también producto por escalares que a cada 2 R y x 2 V le asocia un único elemento x de V ; y, estas operaciones satisfacen las propiedades siguientes: i. Conmutativa: para todo x; y 2 V , ii. Asociativa: para todo x; y; z 2 V ,
x + y = y + x: (x + y) + z = x + (y + z) :
iii. Existencia de elemento neutro: existe 0 2 V tal que para todo x 2 V; iv. Existencia de opuestos aditivos: para cada x 2 V , existe y 2 V tal que v. Para todo
2 R, x; y 2 R,
vi. Para todo x 2 V;
;
2 R,
vii. Para todo x 2 V;
;
2 R,
viii. Para todo x 2 V;
x + 0 = 0 + x = x: x + y = 0:
(x + y) = x + y: ( + ) x = x + x: ( x) = (
) x:
1 x = x:
Los elementos de V se llaman vectores y los elementos de R se llaman escalares. El espacio vectorial V sobre R se dirá simplemente espacio vectorial real. El conjunto V con la operación adición “+” que satisface las propiedades i) a iv) se dice grupo conmutativo que se nota (V; +) : El elemento 0 2 V de iii) es único y se denomina elemento nulo. El elemento y de iv) se escribe x, además es único. La propiedad iv) se expresa como sigue: 8x 2 V; 9 x 2 V tal que x + ( x) = 0: Para todo x; y; z 2 V , se escribe x + y + z en vez de (x + y) + z o de x + (y + z) : 575
576
CAPÍTULO 12. APENDICE
En todo espacio vectorial real se veri…can las propiedades siguientes cuyas demostraciones son inmediatas y se dejan como ejercicio. i. Para todo x 2 V; 0x = 0: ii. Para todo
2 R,
iii. Para todo
2 R, x 2 V; (
iv.
= 0 o x = 0:
x=0,
0 = 0: )x =
x:
Ejemplos 1. El espacio vectorial Rn : Sea n 2 Z+ . Se denota con Rn al conjunto f(x1 ; :::; xn ) j xi 2 R, i = 1; :::; ng ; esto es Rn = f(x1 ; :::; xn ) j xi 2 R, i = 1; :::; ng : A los elementos de Rn los notamos como ! x; ! y, ! n n etc. También escribiremos x = (x1 ; :::; xn ) 2 R y los denominaremos vectores de R : El elemento ! nulo de Rn se escribe 0 = (0; :::; 0) : En Rn se de…ne la igualdad, adición y producto de escalares por elementos de Rn como sigue. Sean ! x = (x1 ; :::; xn ) ; ! y = (y1 ; :::; yn ) dos elementos de Rn ; 2 R. ! ! Igualdad: diremos x = y si y solo si x = y ; i = 1; :::; n: i
i
Adición: ! x +! y = (x1 ; :::; xn ) + (y1 ; :::; yn ) = (x1 + y1 ; :::; xn + yn ) : Producto por escalares: ! x = (x ; :::; x ) = ( x ; :::; x ) : 1
n
n
1
De la de…nición de adición en se tiene ! x; ! y 2 Rn ) ! x +! y 2 Rn ; y, de la de…nición de ! ! n n producto por escalares 2 R; x 2 R ) x 2 R : Mas aún, se prueba fácilmente que Rn es un espacio vectorial real. El opuesto aditivo de ! x = (x ; :::; x ) 2 Rn es ! x = ( x ; :::; x ) 2 Rn : Rn ;
n
1
1
n
Para n = 1, se tiene que R es un espacio vectorial sobre si mismo. Para n = 2, R2 = f(x; y) j x; y 2 Rg : Note que si ! x = (a; b) ; ! y = (c; d) 2 R2 ;
Igualdad: ! x =! y , a = c y b = d; ! ! Adición: x + y = (a; b) + (c; d) = (a + c; b + d) :
2 R se tiene
Producto por escalares: ! x =
Para n = 3; Se tiene
R3
(a; b) = ( a; b) : = f(x; y; z) j x; y; z 2 Rg : Sean ! x = (x1 ; y1 ; z1 ) ; ! y = (x2 ; y2 ; z2 ) 2 R3 ,
2 R.
! x = ! y , x1 = x2 ; y1 = y2 ; z1 = z2 ; ! ! x + y = (x1 ; y1 ; z1 ) + (x2 ; y2 ; z2 ) = (x1 + x2 ; y1 + y2 ; z1 + z2 ) ; ! x = (x ; y ; z ) = ( x ; y ; z ) : 1
1
1
1
1
1
2
3 x1 6 7 Los elementos de Rn se escribirán también como vectores columna, así: 4 ... 5 : xn
2. Espacio de matrices Mm n [R] : Sean m; n 2 Z+ . Una matriz de m arreglo rectangular de la forma: 2 3 a11 a12 a1n 6 a21 a22 a2n 7 6 7 6 .. .. 7 ; 4 . . 5 am1 am2 amn donde ai;j 2 R, i = 1; :::; m; j = 1; :::; n:
n con valores en R es un
12.1. ESPACIOS VECTORIALES REALES.
577
Los números naturales i = 1; :::; m; j = 1; :::; n se llaman índices. Cuando i es …jo, los elementos ai1 ; ai2 ; :::; ain forman el i-ésimo renglón de la matriz y se puede considerar como un vector de Rn , esto es, (ai1 ; ai2 ; :::; ain ) 2 Rn : Para j …jo, los elementos forman la2j-ésima 3 columna de la matriz. a1j 6 7 Esta puede considerarse como un vector columna de Rm , es decir 4 ... 5 2 Rm : amj
A una matriz de m n la representaremos abreviadamente como (aij )m n . También escribiremos A = (aij )m n y simplemente (aij ) si no hay peligro de confusión. Se nota con Mm n [R] al conjunto de todas la matrices de m n con valores en R. Cuando m = n, los elementos de Mn n [R] los denominamos matrices cuadradas. Si A = (aij )n es una matriz cuadrada, si no hay peligro de confusión, escribiremos simplemente A = (aij ) :
n
Sean A = (aij )m n , B = (bij )m n 2 Mm n [R] y 2 R. De…nimos la igualdad, adición de matrices y producto de escalares por matrices, como sigue: Igualdad: A = B , aij = bij ; i = 1; :::; m; j = 1; :::; n:
Adición: A + B = (aij )m
Producto por escalares:
n
+ (bij )m A=
n
= (aij + bij )m
(aij )m
n
= ( aij )m
n: n:
Por la de…nición de adición en Mm n [R], tenemos A; B 2 Mm por la de…nición de producto de escalares por matrices tenemos Mm n [R] : Se demuestra fácilmente que Mm
n [R]
n [R]
) A + B 2 Mm n [R] ; y 2 R; A 2 Mm n [R] ) A 2
es un espacio vectorial real.
El elemento neutro de Mm n [R] es la matriz nula o matriz cero y la representamos con 0 = (0)m n , es decir que la matriz nula 0 es aquella que sus elementos son 0 2 R. El opuesto aditivo de A = (aij )m n es la matriz notada A = ( aij )m n : Por otro lado, si n = 1 las matrices de Mm 1 [R] coinciden con los vectores columna de Rm y si m = 1, las matrices de M1 n [R] coinciden con los vectores …la de Rn : 3. Los espacios C ([a; b]) y C 1 ([a; b]) : Revisemos brevemente algunos conceptos sobre funciones reales, operaciones con funciones reales, límites, continuidad, derivación e integración que son tratados en el curso de Análisis Matemático. Sea A R, A 6= ;. Una función real f de…nida en el conjunto A es un subconjunto F del producto cartesiano A R que satisface con las dos propiedades siguientes: i. Para cada x 2 A, existe un único y 2 R tal que y = f (x), o bien (x; y) 2 F .
ii. Si (x; y1 ) ; (x; y2 ) 2 F , entonces y1 = y2 :
A ! R que se lee f es la función x ! f (x) ; de A en R que a cada x 2 A le asocia un único elemento f (x) en R. Se dirá también f es la función real de A en R que a cada x 2 A le asocia o le corresponde f (x) 2 R. El conjunto A se llama dominio de f y se designa con Dom (f ) : El conjunto R se llama conjunto de llegada de f y el conjunto Rec (f ) = ff (x) j x 2 Ag se llama recorrido de f . Claramente Rec (f ) R y Rec (f ) 6= ;: Se designa con F (A) al conjunto de todas las funciones de…nidas en A. Sea f una función real de…nida en A. Escribiremos f :
La función nula 0 2 F (A) se de…ne como 0 (x) = 0 8x 2 A; y la función unidad 1 2F (A) está de…nida como 1 (x) = 1 8x 2 A:
En F (A) se de…ne la igualdad, adición y producto por escalares o producto de números reales por funciones como sigue: Igualdad: Sean f; g 2 F (A) ; f = g si y solo si f (x) = g (x) 8x 2 A: Adición: Sean f; g 2 F (A). Se de…ne f + g 2 F (A) como
Producto por escalares: Sean f (x) 8x 2 A:
(f + g) (x) = f (x) + g (x)
2 R, f 2 F (A). Se de…ne
f 2 F (A) como
8x 2 A:
( f ) (x) =
578
CAPÍTULO 12. APENDICE Se demuestra fácilmente que F (A) es un espacio vectorial real denominado espacio de funciones de…nidas en A. Funciones continuas Sea A un intervalo de R, f 2 F (A), x0 2 A y L 2 R. Se dice que f (x) tiende a L cuando x tiende a x0 que se escribe f (x) ! L, si y solo si se satisface la siguiente condición: x!x0
8" > 0; 9 > 0 tal que 8x 2 A con 0 < jx
x0 j <
) jf (x)
Lj < ":
Escribiremos también l m f (x) = L que se lee límite de f (x) cuando x tiende a x0 es igual a L. x!x0
Sea A R, A 6= ; y f 2 F (A). Se dice que f es continua en x0 2 A si y solo si se satisfacen las dos condiciones siguientes: i. f (x0 ) está bién de…nido. ii. l m f (x) = f (x0 ) : x!x0
Se dice f continua en A si y solo si f es continua en todo punto x0 2 A:
Se designa con C (A) al conjunto de todas las funciones continuas en A. En el curso de análisis matemático se prueba que la suma de dos funciones continuas es continua, y que el producto de un número real por una función continua f es también una función continua, esto es, f; g 2 C (A) ) f + g 2 C (A) ;
2 R, f 2 C (A) ) f 2 C (A) :
Se prueba además que C (A) es un espacio vectorial real. En particular, si A = [a; b] = fx 2 R j a x bg es un intervalo cerrado y acotado de R, el conjunto C (A) se denota C ([a; b]) y se le denomina espacio de funciones continuas en [a; b] : Funciones derivables f (x0 + h) f (x0 ) existe, h!0 h df (x0 ); esto es, este se denomina derivada de f en x0 que se escribe f 0 (x0 ) o también dx
Sean A
R, A 6= ;, f una función real de…nida en A y x0 2 A. Si l m
f (x0 + h) h!0 h
f 0 (x0 ) = l m
f (x0 )
:
Se dice que f es derivable en A si f 0 (x0 ) existe en todo punto x0 2 A y se de…ne una nueva función f 0 llamada función derivada de f . Se designa con C 1 (A) al conjunto de todas las funciones f tales que f 0 es continua en A, y diremos que f es de clase C 1 en A. Particularmente si A = [a; b], escribiremos C 1 ([a; b]) y diremos espacio de funciones de clase C 1 en [a; b] : Funciones integrables En esta parte proponemos algunos resultados importantes de la teoría de la integración de funciones reales acotadas. De…nición 2 Sean a; b 2 R con a < b; n 2 Z+ . Una subdivisión o partición del intervalo [a; b] se nota con (n) y se de…ne como el conjunto fx0 ; x1 ; :::; xn g, donde x0 = a; xn = b; xi < xi+1 ; i = 0; :::; n 1: Si (n) es una subdivisión de [a; b] ; [xi 1 ; xi ] ; i = 1; :::; n designa el i-ésimo subintervalo de [a; b]. Se pone hi = xi xi 1 la longitud del intervalo [xi 1 ; xi ] ; i = 1; :::; n; y h = max hi : i=0;1;:::;n 1
De…nición 3 Sean m; n 2 Z+ . Se dice que que (n) (m) :
(m) es una subdivisión mas …na que
(n) si se veri…ca
12.1. ESPACIOS VECTORIALES REALES. Particularmente, si (m) ; …na que (m) y (n) :
579
(n) son dos subdivisiones de [a; b] ;
(m) [
(n) es una subdivisión mas
De…nición 4 Sea f una función real de…nida en [a; b]. Se dice que f es acotada en [a; b] si y solo si f ([a; b]) = ff (x) j x 2 [a; b]g es acotado, es decir, existe > 0 tal que jf (x)j 8x 2 [a; b] : Sean n 2 Z+ ;
(n) una subdivisión de [a; b] y f una función acotada en [a; b]. Se pone i
=
Inf
x2[xi
=
1 ;xi ]
Min
f (x) ;
i;
i=1;:::;n
Sup x2[xi
Sup x2[xi
= Max
1 ; xi ] ;
f (x)
1 ;xi ]
f (x) ;
i = 1; :::; n;
1 ;xi ]
i:
i=1;:::;n
De…nición 5 La oscilación de f en [xi !i =
=
i
i = 1; :::; n se de…ne como Inf
x2[xi
1 ;xi ]
f (x) ;
i = 1; :::; n:
De…nición 6 Sea f una función real de…nida en [a; b]. Se dice que f es una función escalonada si y solo si existe una subdivisión (n) = fx0 = a; x1 ; :::; xn = bg y c1 ; :::; cn 2 R tales que f (x) = ci ; La subdivisión
x 2 ]xi
1 ; xi [ ;
i = 1; :::; n:
(n) se dice asociada a f:
Note que f es una función de…nida en todo [a; b] y en cada subintervalo abierto ]xi es constante.
1 ; xi [ ;
i = 1; :::; n, f
De…nición 7 Sea s una función escalonada en [a; b] con (n) = fa = x0 ; x1 ; :::; xn = bg la partición asociada a s y s (x) = ci ; x 2 ]xi 1 ; xi [ ; i = 1; :::; n. La integral de s sobre el intervalo [a; b] se nota n Rb Rb P s (x) dx = ci hi ; donde hi = xi xi 1 ; i = 1; :::; n: s (x) dx y se de…ne como a a i=1 Rb La notación a s (x) dx se lee integral de la función s con respecto de x en el intervalo [a; b]. El número real a es extremo inferior de integración, y el número real b el extremo superior de integración. Sean s; t dos funciones escalonadas en [a; b] y f una función acotada en [a; b] tales que s (x)
f (x)
t (x)
8x 2 [a; b] ;
la función s se llama función escalonada inferior a f , y t se llama función escalonada superior a f: Particularmente, sea n 2 Z+ y (n) una subdivisión de [a; b] : Se de…nen las funciones escalonadas sn y tn como sigue: sn (x) =
i
=
tn (x) =
i
=
Inf
f (x) ; x 2 ]xi
1 ; xi [ ;
i = 1; :::; n;
Sup
f (x) ; x 2 ]xi
1 ; xi [ ;
i = 1; :::; n:
x2[xi x2[xi
1 ;xi ]
1 ;xi ]
Estas funciones satisfacen la siguiente desigualdad: sn (x)
f (x)
tn (x) 8x 2 ]xi
1 ; xi [ ;
i = 1; :::; n:
Se tiene que sn es una función escalonada inferior a f , tn es una función escalonada superior a f . Las integrales de estas funciones se de…nen como: Z b Z b n n X X Sn (f ) = sn (x) dx = Tn (f ) = tn (x) dx = i hi ; i hi ; a
i=1
a
i=1
580
CAPÍTULO 12. APENDICE
donde hi = xi
xi
1;
i = 1; :::; n: Se veri…ca (b
a)
Sn (f )
Tn (f )
(b
a)
y 0
Tn (f )
n X
Sn (f )
! i hi
(
) (b
a) ;
i=1
donde ! i es la oscilación de f ,
= Inf f (x) ;
= Sup f (x) :
x2[a;b]
x2[a;b]
De…nición 8 Sea f una función real, acotada en [a; b] : i. La integral inferior de f se designa con I (f ) y se de…ne como I (f ) = Sup Sn (f ) = n2Z+ Rb Sup a sn (x) dx; donde sn es escalonada inferior a f: n2Z+
ii. La integral superior de f se designa con I (f ) y se de…ne como Rb Inf a tn (x) dx; donde tn es escalonada superior a f:
I (f ) =
Inf Tn (f ) =
n2Z+
n2Z+
Se veri…ca inmediatamente que si sn
f
Rb
tn ;
a
sn (x) dx
I (f )
I (f )
Rb
a tn (x) dx:
De…nición 9 Sea f una función real, acotada en [a; b]. Se dice que f es integrable en [a; b] si y solo Rb si I (f ) = I (f ). En tal caso, escribimos I (f ) = a f (x) dx y al número real I (f ) lo denominamos la integral de la función f en el intervalo [a; b] : Las funciones monótonas en [a; b] (crecientes, decrecientes), las funciones continuas en [a; b] son ejemplos de funciones integrables en [a; b] : Se denota con I ([a; b]) al conjunto de todas las funciones integrables en [a; b]. Con las operaciones habituales de adición \ + " de funciones y producto de escalares por funciones, I ([a; b]) es un espacio vectorial real denominado espacio de funciones integrables en [a; b]. Se tiene Rb
i. f; g 2 I ([a; b]) ) f + g 2 I ([a; b]), e ii.
a
[f (x) + g (x)] dx =
Rb 2 R, f 2 I ([a; b]) ) f 2 I ([a; b]), e a f (x) dx = R f (x) dx = 0: Si f 2 I ([a; b]) y 2 [a; b] se de…ne
Rb a
Rb a
f (x) dx +
f (x) dx:
Sea f 2 I ([a; b]) : Se veri…can las siguientes propiedades: i. Si c 2 [a; b] ; ii.
Rb a
f (x) dx =
iii. Para iv. Si f (x) v.
Rb a
6= 0; 0
f (x) dx
vi. Si [c; d]
Rb a
f (x) dx =
R b+c a+c
Rb a
f (x
8x 2 [a; b] ; a
1
f (x) +
Rb c
f (x) dx:
8c 2 R.
R
Rb a
jf (x)j dx:
[a; b] y f (x)
a
c) dx
f (x) dx =
Rb
Rc
b a f
x
dx:
f (x) dx
0:
0 8x 2 [a; b] ;
Rd c
f (x) dx
Rb a
f (x) dx:
Rb a
g (x) dx;
12.1. ESPACIOS VECTORIALES REALES. Por otro lado, si f (x) región
0
581
8x 2 [a; b], geométricamente = (x; y) 2 R2 j 0
y
Rb a
f (x) dx se interpreta como el área de la
f (x) ; x 2 [a; b] :
Ejercicios 1. Demuestre que el conjunto Rn en el que se ha de…nido la igualdad y las operaciones de adición y producto por escalares, es un espacio vectorial real. 2. Demuestre que el conjunto de matrices Mm n [R] en el que se ha de…nido la igualdad y las operaciones de adición y producto de números reales por matrices, es un espacio vectorial real. 3. Demuestre que el conjunto F (A) de funciones reales de…nidas en A en el que se ha de…nido la igualdad de funciones, y las operaciones de adición y producto de números reales por funciones, es un espacio vectorial real. 4. Pruebe que con las operaciones de adición de funciones y producto de números reales por funciones de…nidas en F (A), los siguientes conjuntos son espacios vectoriales reales. i. Conjunto I ([a; b]) de funciones integrables en [a; b] :
ii. Conjunto C ([a; b]) de funciones continuas en [a; b] :
iii. Conjunto C 1 ([a; b]) de funciones derivables con derivada continua en [a; b] :
12.1.2.
Subespacios vectoriales. Ejemplos.
De…nición 10 Sea V un espacio vectorial sobre R y W un subconjunto no vacío de V . Se dice que W es un subespacio de V si W es un espacio vectorial real con las mismas operaciones de…nidas en V: El cualquier espacio vectorial V; W = V y W = f0g con 0 2 V son subespacios de V llamados subespacios triviales de V: Teorema 1 Un subconjunto no vacío W de un espacio vectorial V es un subespacio de V si y solo si se satisfacen las tres condiciones siguientes: i. 0 2 V ) 0 2 W: ii. x; y 2 W ) x + y 2 W: iii.
2 R, x 2 W ) x 2 W:
Si W1 ; W2 son dos subespacios de V , entonces W1 \ W2 es también en subespacio de V: De…nición 11 Sean V un espacio vectorial real, S1 ; S2 dos subconjuntos no vacíos de V . Se de…ne S1 + S2 como sigue S1 + S2 = fx + y j x 2 S1 y 2 S2 g y se denomina subconjunto suma de S1 con S2 : Sea x0 2 V y W un subespacio de V . El subconjunto x0 + W = fx0 + x j x 2 W g se llama trasladado del subespacio W o subconjunto afín. Teorema 2 Si W1 , W2 son subespacios de un espacio vectorial V , W1 + W2 es un subespacio de V: El subespacio W1 + W2 se llama suma de los subespacios W1 y W2 :
582
CAPÍTULO 12. APENDICE
De…nición 12 Sean W1 ; W2 dos subespacios de V . Se dice que V es suma directa de W1 y W2 que se escribe V = W1 W2 si y solo si se satisfacen las dos condiciones siguientes: i. V = W1 + W2 : ii. W1 \ W2 = f0g : Teorema 3 Sean W1 ; W2 dos subespacios de V . Entonces, V = W1 W2 si y solo si cada x 2 V se escribe de manera única en la forma x = x1 + x2 , donde x1 2 W1 ; x2 2 W2 : Ejemplos 1. El conjunto W = f(x1 ; :::; xn
1 ; 0)
1g es un subespacio de Rn :
j xi 2 R, i = 1; :::; n
2. Sea n = 3, W1 = f(x; y; 0) j x; y 2 Rg ; W2 = f(2t; 3t; t) j t 2 Rg son subespacios de R3 . Se veri…ca que W1 \ W2 = f0g y que R3 = W1 W2 : Note que si ! x = (x; y; z) 2 R3 , existen ! x 1 = (x 2z; y 3z; 0) 2 W1 y ! x 2 = (2z; 3z; z) 2 W2 ! ! ! ! ! ! tales que x = x 1 + x 2 . El vector x = x 1 + x 2 se escribe de esta manera en forma única como ! x 2W ; ! x 2W : 1
1
2
2
3. El espacio C ([a; b]) de funciones continuas en [a; b] es un subespacio de I ([a; b]) : 4. Un polinomioP de grado
n con coe…cientes reales se de…ne como
P (x) = a0 + a1 x + ::: + an xn =
n X
ak xk ;
x 2 R; ai 2 R; i = 0; 1; :::; n:
k=0
El polinomio nulo se de…ne como P (x) = 0 8x 2 R.
Se designa con Kn [R] el conjunto de todos los polinomios de grado n. Se de…ne la igualdad de polinomios, adición y producto de números reales por polinomios como sigue: n n P P Igualdad: Sean P; Q 2 Kn [R] con P (x) = ak xk ; Q (x) = bk xk ; x 2 R. k=0
k=0
P (x) = Q (x) , ak = bk ; k = 0; 1; :::; n:
Adición: Sean P; Q 2 Kn [R] con P (x) = P + Q 2 Kn [R] como (P + Q) (x) = Producto por escalares: Sean
n P
n P
ak xk ;
Q (x) =
k=0
k=0
(ak + bk
) xk
k=0
x 2 R.
2 R; P 2 Kn [R] con P (x) =
P 2 Kn [R] como ( P ) (x) = P (x) =
n P
k=0
ak
xk ;
n P
x 2 R.
n P
bk xk ; x 2 R. Se de…ne
k=0
ak xk ; x 2 R. Se de…ne
Se demuestra que Kn [R] es un espacio vectorial real denominado espacio de polinomios de grado n. Sea V = C ([a; b]). El conjunto de todos los polinomios de grado n restringidos a [a; b] con las operaciones de adición y producto por escalares, es un subespacio de C ([a; b]). A este subespacio lo notaremos con Kn ([a; b]). Bases de V De…nición 13 Sea A un subconjunto no vacío de un espacio vectorial V: Se dice que x 2 V es una combinación lineal de elementos de A si existe un número …nito x1 ; :::; xn 2 A y 1 ; :::; n 2 R tales n P que x = i xi : i=1
12.1. ESPACIOS VECTORIALES REALES. Particularmente, si A = fx1 ; :::; xn g n P 1 ; :::; n 2 R tales que x = i xi :
583
V , x 2 V es combinación lineal de elementos de A si existen
i=1
Teorema 4 Sea A un subconjunto no vacío de V . El subconjunto W de V constituído por todas las combinaciones lineales de elementos de A es un subespacio de V . Este subconjunto W de V se denomina subespacio generado por A. Escribiremos W = L (A) : De…nición 14 Sea A un subconjunto no vacío de un espacio vectorial V . Si L (A) = V diremos que A genera a V o que A es un conjunto generador de V:
Si A
V y L (A) = V , entonces x 2 V si y solo si existen 1 ; :::; n 2 R, x1 ; :::; xn 2 A tales n P que x = V , escribiremos explícitamente al subespacio i xi : Particularmente, si A = fx1 ; :::; xn g i=1
generado por A como
W = L (x1 ; :::; xn ) =
( n X i=1
i xi j i
2 R, i = 1; :::; n
)
:
Si W = V , escribiremos V = L (x1 ; :::; xn ) y diremos que fx1 ; :::; xn g es un conjunto generador de V: De…nición 15 Sea A un subconjunto no vacío de un espacio vectorial V . i. Se dice que A es linealmente independiente si para todo x1 ; ::; xn 2 A, 0;
i = 1; :::; n:
n P
i xi
i=1
= 0 )
i
=
ii. Se dice que A es linealmente dependiente si A no es linealmente independiente. De la de…nición de dependencia lineal se sigue que A es linealmente dependiente si existen x1 ; :::; xn 2 A n P y 1 ; :::; n 2 R no todos nulos tales que i xi = 0: i=1
Sean A; B dos subconjuntos no vacíos de un espacio vectorial V tales que A B. Entonces, si A es linealmente dependiente, B también lo es; y , si B es linealemente independiente, A también lo es. De…nición 16 Se dice que un subconjunto B de un espacio vectorial V es una base de V si y solo si se satisfacen las dos condiciones siguientes: i. B es linealmente independiente. ii. B genera a V:
De…nición 17 i. Un espacio vectorial real V es de dimensión …nita n si toda base B de V está constituida por exactamente n elementos. Al único número natural n se le llama dimensión de V y se le denota dim V , esto es dim V = n: ii. Se dice que un espacio vectorial real V es de dimensión in…nita si cualquier base B de V tiene un número in…nito o numerable de elementos. Ejemplos 1. El espacio Rn es un espacio vectorial de dimensión …nita n. La base B = f! e 1 ; :::; ! e n g se conoce n como base canónica de R , donde ! e = (1; 0; :::; 0) ; ;! e = (0; :::; 0; 1) : 1
n
584
CAPÍTULO 12. APENDICE P e i = x1 ! e 1 + ::: + xn ! e n: Sea ! x = (x1 ; :::; xn ) 2 Rn . Se tiene ! x = ni=1 xi ! n! !o ! ! Para n = 2, el conjunto B = i ; j con i = (1; 0) ; j = (0; 1), es la base canónica de R2 . Note ! ! que ! x = (a; b) 2 R2 se escribe en la forma ! x =a i +bj : n! ! !o ! ! ! Para n = 3, el conjunto B = i ; j ; k con i = (1; 0; 0) ; j = (0; 1; 0) ; k = (0; 0; 1), es la base ! ! ! canónica de R3 . Si ! x = (a; b; c) 2 R3 entonces ! x =a i +bj +ck:
2. Sea V = C ([0; 2 ]). Consideremos las funciones '0 ; '1 ; :::; 'n de…nidas en [0; 2 ] como sigue: '0 (x) = 1; '1 (x) = sen x; '2 (x) = sen (2x) ; :::; 'n (x) = sen (nx) : El conjunto B = f'0 ; '1 ; :::; 'n g es linealmente independiente y genera un espacio W constituido por todas las combinaciones lineales de '0 ; '1 ; ::; 'n , esto es ( n ) X W = i 'i j i 2 R, i = 0; 1; :::; n i=1
f
donde
0 ; :::;
n
2 W , f (x) =
0
+
1 sen (x)
+ ::: +
n sen (nx) ;
x 2 [0; 2 ]
2 R son elegidos apropiadamente.
3. El espacio vectorial de matrices de Mm n [R] es de dimensión …nita m n. La base canónica B de (1) (m n) donde Mm n [R] está formada por las matrices A1 = aij ; :::; Am n = aij (1;1)
aij
=
1; si i = 1; j = 1; 0; si 1 < i m; 1 < j
(m n)
aij
n;
=
1; si i = m; j = n; 0; si 1 i < m; 1 j < n:
Por ejemplo si m = 2, n = 3, la base canónica del espacio vectorial de matrices M2 formada por las siguientes matrices: A1 =
1 0 0 0 0 0
;
A2 =
0 1 0 0 0 0
;
A3 =
0 0 1 0 0 0
;
A4 =
0 0 0 1 0 0
;
A5 =
0 0 0 0 1 0
;
A6 =
0 0 0 0 0 1
:
Sea A = (aij ) 2 M2
3 [R],
3 [R]
está
entonces A = a11 A1 + ::: + a23 A6 :
4. El espacio vectorial C ([a; b]) de funciones continuas en [a; b] es de dimensión in…nita. 5. El espacio vectorial I ([a; b]) de funciones integrables en [a; b] es de dimensión in…nita. 6. El espacio Kn ([a; b]) es de dimensión …nita n + 1. La base canónica de Kn ([a; b]) está constituido por el conjunto de funciones fP0 ; P1 ; :::; Pn g con P0 (x) = 1; Pj (x) = xj x 2 [a; b] ; j = 1; :::; n:
12.2.
De…nición de espacio normado.
De…nición 18 Sea V un espacio vectorial sobre R. Una norma en V es una función N de V en R que satisface las siguientes propiedades: i. N (x)
0 8x 2 V;
ii. N (x) = 0 , x = 0; iii. N ( x) = j j N (x) iv. N (x + y)
8 2 R, 8x 2 V;
N (x) + N (y)
8x; y 2 V (desigualdad triangular).
12.3. EJEMPLOS DE ESPACIOS NORMADOS.
585
El número real no negativo N (x) se llama norma de x. El par (V; N ) se llama espacio normado. Observación Si la función N de V en R veri…ca las propiedades i), iii) y iv) de la de…nición de norma, pero no se veri…ca ii), la función N se dice seminorma en V: Note en iv) que x + y es la suma de los elementos x; y de V , mientras que N (x) + N (y) es la suma de los números reales no negativos N (x) y N (y). En iii), x es el producto del escalar (número real) por el elemento x de V y j j N (x) es el producto de los números reales no negativos j j y N (x) : En ii), x = 0 denota el elemento neutro o nulo de V y N (x) = 0 es el elemento neutro o nulo de R. Notación Si N es una norma en V , es usual escribir esta función con el símbolo k k en vez de N y el espacio normado se escribirá (V; k k) o se dirá V espacio normado provisto de la norma k k. Para x 2 V , la norma de x se escribirá kxk : Si en V se han de…nido varias normas, es preciso señalar que norma se está utilizando. Proposición 5 Sea V un espacio normado con k k su norma. Se veri…can las siguientes propiedades: i. kx
yk = ky
ii. j kxk
kyk j
xk kx
8x; y 2 V: yk
8x; y 2 V:
Demostración. i. Sean x; y 2 V . Entonces kx
yk = k( 1) (x
y)k = j 1j ky
xk = ky
ii. Sean x; y 2 V . De la desigualdad triangular, se tiene kxk = k(x donde kxk kyk kx yk : Además, kyk = k(y
x) + xk
ky
xk + kxk = kx
y de esta desigualdad se obtiene la siguiente: kyk resulta kx yk kxk kyk : Por lo tanto, kx yk :
kx
yk
Nota: Recuerde que si a
12.3.
kxk kyk 0; jtj
kx
a,
kxk
kx
xk :
y) + yk
kx
yk + kyk ; de
yk + kxk yk que multiplicándola por
yk ; que es equivalente a la desigualdad j kxk
a
t
1
kyk j
a:
Ejemplos de espacios normados.
Comenzamos esta sección considerando el ejemplo más simple de espacio normado: el espacio vectorial R provisto de la función valor absoluto j j : Sea V = R. Se de…ne la función k k de R en R como sigue: kxk = jxj 8x 2 R. Entonces, la función k k de…nida en R es una norma en R. La veri…cación de las propiedades i) a iv) siguen inmediatamente de las propiedades del valor absoluto siguientes: i. jxj
0 8x 2 R.
ii. jxj = 0 , x = 0: iii. j xj = j j jxj iv. jx + yj
8 ; x 2 R.
jxj + jyj
8x; y 2 R, (desigualdad triangular).
586
12.3.1.
CAPÍTULO 12. APENDICE
Normas en Rn :
En el espacio vectorial real Rn se consideran dos normas importantes: la del máximo que se denota k k1 y las hölderianas k kp con p 2 [1; 1[ : Norma k k1 :
Sea V = Rn . Se de…ne la función k k1 de Rn en R como k! x k1 = Max jxi j i=1;:::;n
Se veri…ca que k k1 es una norma en Rn .
8! x = (x1 ; :::; xn ) 2 Rn :
i) Es claro que para todo ! x = (x1 ; :::; xn ) 2 Rn ; k! x k1 0: ! ii) Si ! x = 0 = (0; :::; 0) 2 Rn , se tiene k! x k1 = 0: Recíprocamente, si k! x k1 = 0 se sigue que Max jxi j = 0 y como 0 jxi j Max jxi j = 0 i = 1; :::; n, resulta que xi = 0; i = 1; :::; n, esto es, i=1;:::;n i=1;:::;n ! ! ! ! ! x = 0 : Así, k x k1 = 0 , x = 0 : iii) Sean
2 R, ! x = (x1 ; :::; xn ) 2 Rn . Entonces ! x = ( x1 ; :::; xn ) ; y
k ! x k1 = Max j xi j = Max j j jxi j = j j Max jxi j = j j k! x k1: i=1;:::;n
i=1;:::;n
i=1;:::;n
Luego k ! x k1 = j j k ! x k1 :
iv) Sean ! x = (x1 ; :::; xn ) ; ! y = (y1 ; :::; yn ) 2 Rn . Puesto que ! x +! y = (x1 + y1 ; :::; xn + yn ) ;
jxi + yi j
jxi j + jyi j i = 1; :::; n;
y de la de…nición de la función k k1 , se sigue k! x +! y k1 =
Max jxi + yi j
i=1;:::;n
Max jxi j + Max jyi j = k! x k1 + k! y k1 :
= Luego, kx + yk1
Max fjxi j + jyi jg
i=1;:::;n
i=1;:::;n
i=1;:::;n
kxk1 + kyk1 :
Conclusión: k k1 es una norma sobre Rn :
Sean n = 2, ! x = (x; y) 2 R2 , la norma k k1 en R2 está de…nida como k! x k1 = Max fjxj ; jyjg. Note que ! ! jxj k x k1 y jyj k x k1 :
Sean n = 3; ! x = (x; y; z) 2 R3 ; la norma k k1 en R3 está de…nida como k! x k1 = Max fjxj ; jyj ; jzjg. ! ! Además, se veri…can las siguientes desigualdades: jxj k x k1 ; jyj k x k1 ; jzj k! x k1 :
Si ! x = (x1 ; :::; xn ) 2 Rn . Se tiene jxi j
k! x k1 ;
i = 1; :::; n:
Normas hölderianas en el espacio Rn : Sea p 2 [1; 1[ . Se de…ne la función k kp de Rn en R como sigue: k! x kp =
n X i=1
jxi jp
!1
p
8! x = (x1 ; :::; xn ) 2 Rn :
Entonces k kp es una norma en Rn , llamada norma de Hölder o norma hölderiana. Veri…quemos las propiedades i) a iv) de la de…nición de norma. i)Sea ! x = (x1 ; :::; xn ) 2 Rn . Puesto que jxi j
0 i = 1; :::; n, de la de…nición de k kp , se sigue kxkp
0:
n P ! ii) Si ! x = 0 = (0; :::; 0) se tiene k! x kp = 0. Supongamos que k! x kp = 0 entonces jxi jp = 0. Se tiene
la siguiente desigualdad: 0
p
jxi j
n P
i=1
p
jxi j = 0 i = 1; :::; n, consecuentemente xi = 0; i = 1; :::; n, o ! sea ! x = (0; :::; 0) : Luego, k! x kp = 0 , ! x = 0: i=1
12.3. EJEMPLOS DE ESPACIOS NORMADOS.
587
2 R, ! x = (x1 ; :::; xn ) 2 Rn . Entonces
iii) Sean
n X
k ! x kp =
i=1
n X
p
j xi jp
n X
= j j
!1
! x = ( x1 ; :::; xn ) y por la de…nición de k kp , se tiene
i=1
=
i=1
!1
p
jxi jp
!1
n X p j j jxi jp
p
j jp jxi jp
=
i=1
!1
p
= j j k! x kp :
Por lo tanto, k ! x kp = j j k ! x kp : iv) Para probar la desigualdad triangular, se requieren de dos resultados preliminares: la desigualdad de Young y la desigualdad de Hölder. Desigualdad de Young. 1 p
Esta se establece en los siguientes términos: sean p; q 2 ]1; 1[ tales que Entonces 1 1 1 1 p q + : p q Para probar esta desigualdad, estudiemos la función siguiente: ( [0; 1[ ! R f: x ! f (x) = 1q + p1 x
+
1 q
= 1;
0;
0:
1
xp :
Para x > 0 calculemos la derivada f 0 (x) y determinemos los puntos críticos y los intervalos donde f 0 (x) > 0; f 0 (x) < 0; tenemos f 0 (x) =
1 p1 x p
1 p
f 0 (x) = 0 , x
1 q
f 0 (x) > 0 , 1
1
=
1 p
1 x p
1 q
=
1 p
1
x
1 q
;
= 1 , x = 1; x
0
1 q
> 0 , x > 1;
f (x) < 0 ) 0 < x < 1:
La función f es decreciente sobre ]0; 1[ y creciente si x 1. Puesto que f (1) = 0; la función f tiene un mínimo local en x = 1. Además, f (0) = 1q > 0 y f (x) ! +1. Luego f (1) = 0 es un mínimo global. x!1
En consecuencia, para todo x
0, f (x)
0. En particular, para x
0 = f (1) 1
y de esta desigualdad se obtiene x p Para x=
=0o
1
xp
1 1 + x: q p
(en el caso contrario ponemos x = 1 p
precedente, resulta 1 p
1 1 + x q p
= 0, la desigualdad de Young se veri…ca trivialmente. Supongamos que
1 si
con lo que
f (x) =
1 y siendo f creciente, se tiene
1 q
1 p
+
1 q 1 q
+
1 p
; luego
1 p
1 p +1
1). Remplazando x = 1 p
+
1 q
: Como
1 p
+
1 q
:
Esta desigualdad se expresa como a continuación se indica:
i=1
jxi yi j
k! x kp k! y kq
8! x = (x1 ; :::; xn ) ; ! y = (y1 ; :::; yn ) 2 Rn ;
>0y
en la desigualdad
= 1, se tiene
Desigualdad de Hölder.
n X
> 0;
1 q
=1
1 p,
588
CAPÍTULO 12. APENDICE 1 1 + = 1: p q
donde p; q 2 ]1; 1[ tales que
Si ! x =0o! y = 0, la desigualdad de Hölder se veri…ca trivialmente. Supongamos ! x = 6 0; ! y = 6 0: Sean
jxi jp = ! p; k x kp
jyi jq = ! q . Apliquemos la desigualdad de Young. Resulta k y kq jxi jp p k! x kp
con lo cual
!1
jyi jq q k! y kq
p
!1
1 jxi jp 1 jyi jq + p q p k! x kp q k! y kq
q
1 jxi jp 1 jyi jq + p q p k! x kp q k! y kq
jxi j jyi j k! x kp k! y kq
i = 1; :::; n;
i = 1; :::; n:
Sumando de 1 a n en cada miembro de la última desigualdad, obtenemos n 1 1 X jxi j jyi j k! x kp k! y kq
n n X X 1 1 p jx j + jyi jq : i p q p k! x kp i=1 q k! y kq i=1
1=n
n P p Puesto que k! x kp = jxi jp ;
Pn 1 1 jx j jy j jyi jq , entonces ! ! x y k kp k kq 1=n i i i=1 i=1 Pn esta desigualdad se deduce la lesigualdad de Hölder: k! x kp k! y kq : 1=n jxi yi j k! y kq = q
Desigualdad triangular: k! x +! y kp
n P
k! x kp + k! y kp
1 p
+
1 q
= 1; y de
8! x;! y 2 Rn :
De la de…nición de k kp , obtenemos p k! x +! y kp =
=
n X
i=1 n X i=1
p
jxi + yi j = p 1
jxi + yi j
n X i=1
p 1
jxi + yi j
jxi j +
n X i=1
n X
jxi + yi j
jxi + yi jp
1
i=1
jxi + yi jp
1
jyi j : 1 p
Apliquemos la desigualdad de Hölder a cada sumando del lado derecho. Ya que p + q = pq con lo que p = q (p 1) : Luego n X i=q
jxi + yi jp
1
n X
jxi j
i=1
!1
p
jxi jp
n X i=1
p = k! x kp k! x +! y kp
Análogamente,
Pn
p i=1 jxi + yi j
1
jyi j
1 q
p
i=1
jxi + yi jp
1
jxi j +
p k! x kp k! x +! y kp
=
1)q
= k! x kp
n X i=1
+
1 q
= 1, se obtiene !1 q
jxi + yi jp
;
k! y kp k! x +! y kp n X
p k! x +! y kp
!1 q
jxi + yi j(p
(jxi j + jyi j)
1 q
1 q
: Por lo tanto
n X i=1
jxi + yi jp
1
jyi j
p + k! y kp k! x +! y kp
1 q
p
k! x kp + k! y kp k! x +! y kpq ; p
p y de esta desigualdad, se deduce k! x +! y kp q k! x kp +k! y kp : Nuevamente p1 + 1q = 1 entonces 1 = p con lo que se obtiene la desigualdad triangular: k! x +! y kp k! x kp + k! y kp :
Para n = 2; ! x = (x; y) 2 R2 la norma de Hölder está de…nida como sigue: 1 k! x kp = (jxjp + jyjp ) p con p 2 [1; 1[ :
p q,
12.3. EJEMPLOS DE ESPACIOS NORMADOS.
589
Así, para p = 1; la norma k k1 está de…nida como k! x k1 = jxj + jyj : Para p = 2; la norma k k2 se escribe 1 ! 2 2 2 como k x k2 = x + y . Esta se conoce como norma euclídea. Para p = 3; la norma k k3 se escribe como k! x k3 = jxj3 + jyj3
1 3
:
Para n = 3; ! x = (x; y; z) 2 R3 la norma de Hölder k kp está de…nida como 1
k! x kp = (jxjp + jyjp + jzjp ) p con p 2 [1; 1[ : Particularmente, para p = 1;
k! x k1 = jxj + jyj + jzj : Para p = 2; k! x k2 = x2 + y 2 + z 2 7
norma euclídea. Para p = 3;5 = 27 ; k! x k7 =
7
2 7
7
jxj 2 + jyj 2 + jzj 2
2
1 2.
Esta es la
:
Consecuencias P 1. Para p = 1 la norma k k1 está de…nida como k! x k1 = ni=1 jxi j ! x = (x1 ; :::; xn ) 2 Rn : Además, ! n para y = (y1 ; :::; yn ) 2 R , se veri…ca la desigualdad de Hölder para p = 1 y q = 1: n X i=1
Max jyi j = k! y k1
En efecto, de la desigualdad jyi j n X i=1
jxi yi j =
n X i=1
k! x k1 k! y k1 :
jxi yi j
i = 1; : : : ; n; se sigue que
i=1;n
n X
jxi j jyi j
i=1
(jxi j k! y k1 )
k! y k1
n X i=1
jxi j = k! y k1 k! x k1 :
Así, la desigualdad de Hölder es válida para p = 1 y q = 1: 2. Sean p 2 ]1; 1[ y ! x = (x1 ; :::; xn ) 2 Rn con ! x 6= 0. Mostremos que l m k! x kp = k! x k1 : p!1 ! ! ! n Primeramente k x k1 k x kp 8 x 2 R : En efecto, n X
k! x k1 = Max jxi j i=1;:::;n
i=1
p
jxi j
!1
p
= k! x kp :
Por otro lado, k! x kp =
n X i=1
jxi jp
= k! x k1
!1
p
n X i=1
p
Max jxi j
i=1;:::;n
i=1
!1
p
1
n X
!1
p
=
n X i=1
p k! x k1
p!1
1 y como l m n p = 1, se deduce k! x k1
p!1
p
1
= n p k! x k1 :
De los dos resultados previos, se deduce la siguiente desigualdad: k! x k1 Tomando límite cuando p ! 1; se obtiene l m k! x k1
!1
l m k! x kp
p!1
k! x kp
1
n p k! x k1 :
1
l m n p k! x k1 ;
p!1
l mp!1 k! x kp
k! x k1 : Así, l mp!1 k! x kp = k! x k1 :
590
CAPÍTULO 12. APENDICE
3. Relación entre k kp y k kq con 1 q > p 1:
k! x kp
p < q. Mostremos que
n
q p pq
k! x kq
8! x 2 Rn con
1 1 q Sean p; q 2 [1; 1[ con q > p. Sea r = > 1 y s 2 ]1; 1[ tal que + = 1: Por la desigualdad de p r s Hölder, para cada ! x = (x ; :::; x ) 2 Rn se tiene n
1
n X
p k! x kp =
i=1
jxi jp
1
i=1
= n s k! x kq Note que r =
q p
n
q p pq
q
1 r
=
!1
1
n sp
n X
s
1s
i=1 q 1 n s k! x kqr =
(jxi jp )r
!1 r
=
n X
1 ns
i=1
jxi jpr
!1 r
=
1 ns
n X i=1
jxi jq
!1 r
1 p n s k! x kq :
1 p p x kq y tomando la raíz p-ésima = p. Se tiene k! x kp n s k! 1 1 q k! x kq : Como + = 1 y r = se sigue que s = q q p y en consecuencia r s p
entonces pr = q y
se deduce k! x kp k! x kp
n X
q r
k! x kq :
Así, si p; q 2 [1; 1[ tales que q > p
1; k! x kp
n
q p pq
k! x kq
8! x 2 Rn : 1
Pn 2 2 4. Si p = 2 y ! x = (x1 ; :::; xn ) 2 Rn , la norma k k2 viene dada por k! x k2 = que se conoce i=1 jxi j ! ! con el nombre de norma euclídea. Además, p = q = 2; x = (x1 ; :::; xn ) ; y = (y1 ; :::; yn ) 2 R2 , Ppara n la desigualdad de Hölder se escribe jx y j k! x k k! y k ; que coincide con la conocida i=1
i i
2
2
desigualdad de Cauchy-Schwarz que se verá más adelante.
5. Sean n 2 Z+ ; j 2 R+ ; j = 1; :::; n; las siguientes son normas en Rn : a) k! v k = Max f j jvj jg ! v = (v1 ; :::; vn ) 2 Rn : j=1;:::;n
n P b) k! vk=
j
j=1
c) k! vk=
n P
j=1
d) k! v k = Max
!1 2
2
j jvj j
j=1;:::;n
12.3.2.
! v = (v1 ; :::; vn ) 2 Rn :
jvj j
(
j P
i=1
j
! v = (v1 ; :::; vn ) 2 Rn : )
jvj j
! v = (v1 ; :::; vn ) 2 Rn :
Normas geométricas de matrices.
n! ! o Sean V = Rn ; W = Rm ; se designa con BV = f! e 1 ; :::; ! e n g y BW = f 1 ; :::; f m las bases canónicas de Rn y Rm , p; q 2 [1; 1] y k kp ; k kq normas en Rn y Rm , respectivamente. Se denota con Mm n [R] el espacio vectorial de las matrices reales de m n y A 2 Mm n [R]. Se de…ne la aplicación lineal T de Rn en Rm como T (! x ) = A! x 8! x 2 Rn : Entonces T es continua en todo punto ! xo 2 Rn : Más aún, debido a la linealidad de T; se tiene ! ! ! ! ! ! T( x x o ) = T ( x ) T ( x o ) 8 x ; x o 2 Rn ; por lo que la continuidad de T en ! xo es equivalente a la continuidad de T en el origen. Por lo tanto, dado > 0; 9 > 0 tal que 8! x 2 Rn con ! ! k x k < =) kT ( x )k < : p
q
Sea ! v 2 Rn tal que k! v kp = 1 y sea ! x = 2! v : Entonces, k! x kp =
2
! v
= p
2
k! v kp =
2
< ;
12.3. EJEMPLOS DE ESPACIOS NORMADOS.
591
y por la linealidad de T , se tiene T (! x ) = T(2! v ) = 2 T (! v ); en consecuencia kT (! x )kq = de donde kT (! v )kq <
2
2
kT (! v )kq < ;
= M:
Así, kT (! v )kq M 8! v 2 Rn con k! v kp = 1; y de la de…nición de T se sigue que el conjunto n o kA! x kq j ! x 2 Rn con k! x kp = 1 es acotado superiormente. Este resultado nos permite de…nir las normas geométricas de matrices que a continuación se propone. De…nición 19 Sea A = (aij ) 2 Mm n [R]. La norma geométrica de la matriz A se denota con jkAkj ! y se de…ne como jkAkj = supk! x k 1 kA x kq : p
Se veri…ca inmediatamente que jk kj es una norma en Mm n [R] : La prueba se deja como ejercicio. Además, de la de…nición de norma geométrica de una matriz se sigue inmediatamente que para toda matriz A 2 Mm n [R] se veri…ca la desigualdad siguiente: kA! x kq
Teorema 6 Sea A = (aij ) 2 Mm i. jkAkj1 =
n [R].
jkAkj k! x kp
Entonces,
m P sup kA! x k1 = max jaij j j=1;:::;n i=1 x k1 1 k!
ii. jkAkj1 =
sup x k1 k!
1
8! x 2 Rn :
kA! x k1 = max
n P
i=1;:::;m j=1
(máximo por columnas de A).
jaij j
(máximo por …las de A).
1 2 ; iii. jkAkj2 = sup kA! x k2 = max j i j i=1;:::;n x k2 1 k! y AT denota la matriz transpuesta de A.
donde
1; : : :
n
son los valores propios de AT A
Demostración. i. a) Probemos que jkAkj1
m P
max
j=1;:::;n i=1
Entonces, 2
6 A! x =4
n P jaij j : Sea ! x T = (x1 ; :::; xn ) 2 Rn tal que k! x k1 = jxj j = 1. j=1
32
a11 .. .
a1n .. 7 6 . 54 amn
am1
x1 .. . xn
2 P n a x 6 j=1 1j j 6 7 6 .. 5=6 6 n . 4 P amj xj 3
j=1
3
7 7 7 7; 7 5
y por la de…nición de la norma k k1 en Rm , se sigue que 0 1 ! n m X n n m m X X X X X ! @ jaij j jxj j = jxj j jaij j aij xj A kA x k1 = i=1
n X j=1
i=1 j=1
j=1
jxj j max
j=1;:::;n
m X i=1
!
jaij j
=
j=1
max
j=1;:::;n
m X i=1
!
jaij j
i=1
n X j=1
jxj j =
max
j=1;:::;n
m X i=1
!
jaij j :
Por lo tanto, de la de…nición de la norma geométrica jk kj1 ; se obtiene la desigualdad siguiente: jkAkj1 =
sup kA! x k1 ! x 1 k k1
max
j=1;:::;n
m X i=1
jaij j :
592
CAPÍTULO 12. APENDICE b) Probemos que max
m P
j=1;:::;n i=1 m P
jaij j
jkAkj1 : Para el efecto, sea k la columna para la cual se veri…ca
m P max jaij j = jaik j : Para ! x =! ek , el k-ésimo vector de la base canónica de Rn , j=1;:::;n i=1 i=1 2 3 a1k Pm P 6 7 se tiene A! ek = 4 ... 5 ; y en consecuencia kA! e k k1 = m i=1 jaik j : i=1 jaik j = maxj=1;:::;n amk
la igualdad
Nuevamente, de la de…nición de la norma geométrica jk kj1 ; se obtiene la desigualdad siguiente: max
j=1;:::;n
n X i=1
jaij j = kA! e k k1
sup kA! x k1 = jkAkj1 :
x k1 1 k!
De las desigualdades obtenidas en las partes a) y b) se deduce …nalmente el resultado buscado: n X ! jkAkj1 = sup kA x k1 = max jaij j : j=1;:::;n xk 1 k! i=1
ii. Primeramente, obtenemos la desigualdad jkAkj1 que k! x k1 = max jxj j = 1. Entonces, jxj j
i=1;:::;m
n X
i=1;:::;m j=1
jaij j. Sea ! x T = (x1 ; :::; xn ) 2 Rn tal
k! x k1 , j = 1; :::; n, y
j=1;:::;n
kA! x k1 = max
n P
max
aij xj
max
i=1;:::;m
j=1
n X j=1
jaij j jxj j
max
i=1;:::;m
n X j=1
jaij j ;
consecuentemente kA! x k1
sup x k1 k!
1
kA! x k1 = jkAkj1
Mostremos a continuación la desigualdad
max
n P
max
i=1;:::;m
n X j=1
jaij j :
jkAkj1 : Para el efecto, sea k el P Pn índice para el cual la …la k-ésima de A es tal que maxi=1;:::;m nj=1 jaij j = j=1 jakj j : Sea 8 < j akj j ; si akj 6= 0; ! x T = (x1 ; :::; xn ) 2 Rn de…nido como sigue: xj = Se tiene k! x k1 = 1, y akj : 0; si akj = 0: kA! x k1 = max
i=1;:::;m
de donde
n X j=1
jakj j = kA! x k1
Por lo tanto, jkAkj1 = maxi=1;:::;m
jaij j
i=1;:::;m j=1
n X
aij xj =
j=1
j=1
sup
x k1 1 k!
Pn
n X
jakj j ;
kA! x k1 = jkAkj1 :
j=1 jaij j :
iii. Las normas euclídeas en Rn y Rm están de…nidas como k! x k2 =
! xT ! x
1 2
=
n X i=1
!1 2
x2i
2 T kA! x k2 = (A! x ) A! x =! x T AT A! x
8! x 2 Rn ; 8! x 2 Rn :
! De…nimos la función ! g de Rn en R como sigue g (x) = ! x T AT A! x x 2 Rn : Esta función es ! ! T diferenciable y el gradiente de g está de…nido como rg ( x ) = 2A A x 8! x 2 Rn :
12.3. EJEMPLOS DE ESPACIOS NORMADOS.
593
Sea S = ! x 2 Rn j ! x T! x = 1 ; y consideramos el problema siguiente: max! x 2S g (x) : Note que 2 ! ! g ( x ) = kA x k2 ; de modo que jkAkj2 =
1 sup kA! x k2 = sup [g (! x )] 2 : x k2 1 x k2 1 k! k!
Apliquemos el método de los multiplicadores de Lagrange. De…nimos ! (! x ; ) = g (! x)+ 1 ! x T! x x 2 Rn ; y es el multiplicador de Lagrange. Por las condiciones necesarias de extremo, tenemos el par de ecuaciones siguiente: O! (! x ; ) = Og (! x) 2 ! x = 2AT A! x 2 ! x = 0; x
O
(! x; ) = 1
! x T! x = 0:
AT A I ! x = 0; Se obtiene el siguiente sistema de ecuaciones: ! x 2 Rn ; 2 R, Así, la ! ! T x x = 1: determinación de los puntos críticos de (! x ; ) se transforma en el clásico problema de valores ! ! T propios: A A x = x : Puesto que AT A es simétrica, se sabe que los valores propios son reales. Sean 1 ; : : : ; n 2 R tales valores propios, y ! x 1; : : : ; ! x n 2 Rn los respectivos vectores propios tales quek! x i k2 = 1 i = 1; : : : ; n; esto es, AT A! x i = i xi i = 1; : : : ; n 2 ! k x i k2 = 1: De la de…nición de la función g se deduce 0 g (! x i) = ! x Ti AT A! xi =! x Ti
Por lo tanto jkAkj2 = sup kA! x k2 = x k2 1 k!
i
! xi =
i
i = 1; : : : ; n:
1 2
max j i j
i=1;:::;n
:
Observación ! 1. Sea A = (a1 ; :::; an ) 2 Rn . Se tiene A = (a1 ; :::; an ) 2 M1 ! jkAkj1 = A :
n [R].
Entonces
jkAkj1 =
! A
1
;y
1
Las normas geométricas de matrices son submultiplicativas, como se muestra en el siguiente teorema. Teorema 7 Sean A; B 2 Mn i. jkABkj1 ii. jkABkj1 iii. jkABkj2
n [R].
Entonces
jkAkj1 jkBkj1 ; jkAkj1 jkBkj1 : jkAkj2 jkBkj2 :
Demostración. x k1 y k1 k! y k1 kAB ! kA! i. Sea ! x 2 Rn con ! x = 6 0 tal que ! y = B! x 6= 0. Entonces = : Luego ! ! x k1 k x k1 k y k1 k! kAB ! x k1 kA! y k1 k! y k1 jkABkj1 = sup = sup ! ! ! k x k1 x k1 1 k x k1 x k1 1 k y k1 k! k! kA! y k1 kB ! y k1 sup sup = jkAkj1 jkBkj1 : ! ! k y k k x k ! ! 1 1 y 1 x 1 k k1 k k1
594
CAPÍTULO 12. APENDICE Otra forma de obtener este resultado se muestra a continuación: kAB ! x k1 = kAB ! x k1 de donde
jkAkj1 jkB ! x kj1
jkAkj1 = max kAB ! x k1 x k1 1 k!
jkAkj1 jkBkj1 k! x k1 ;
jkAkj1 jkBkj1 :
ii. Sea ! x 2 Rn . Entonces, y para k! x k1
kAB ! x k1 = kA (B ! x )k1
jkAkj1 jkB ! x kj1
1, se obtiene jkABkj1
jkAkj1 jkBkj1 k! x k1 ;
jkAkj1 jkBkj1 :
iii. Es inmediata.
Otra clase de normas en Mm a) N (A) =
m P n P
i=1 j=1
b) N (A) =
se de…nen a continuación, donde A = (aij )m
2 Mm
n
n [R] :
jaij j :
m P n P
!1
2
2
i=1 j=1
c) N (A) = Max
n [R]
jaij j
:
Max jaij j :
i=1;:::;m j=1;:::;n
d) N (A) = Max
n P
i=1;:::;m j=1
e) N (A) = Max
m P
j=1;:::;n i=1
jaij j :
jaij j :
f ) Sean p 2 [1; 1[ y A = (aij )m
n
una norma de Hölder sobre Mm
n [R].
12.3.3.
2 Mm
n
2 [R]. Se de…ne kAkp =
m P n P
i=1 j=1
!1
p
p
jaij j
; entonces k kp es
Normas en el espacio de funciones continuas C ([a; b]) :
Sean a; b 2 R tales que a < b. Se denota con C ([a; b]) al espacio de todas las funciones continuas en [a; b] : En este espacio se van a de…nir dos normas: la norma de Chebyshev notada k k1 y la norma de Hölder que se denota con k kp , donde p 2 [1; 1[. Norma de Chebyshev. Se de…ne la función k k1 de C ([a; b]) en R como se indica a continuación: kf k1 = Max jf (x)j 8f 2 C ([a; b]) : x2[a;b]
Esta se conoce como norma de Chebyshev. Probemos que k k1 es una norma sobre C ([a; b]). En efecto, i) De la de…nición de k k1 , se tiene kf k1
0:
ii) Si f = 0, esto es, f (x) = 0 8x 2 [a; b] ; kf k1 = 0. Recíprocamente, si kf k1 = 0 = Max jf (x)j, x2[a;b]
entonces f (x) = 0 8x 2 [a; b], es decir que f = 0: iii) Sean
2 R, f 2 C ([a; b]). Entonces k f k1 = Max j f (x)j = j j kf k1 : x2[a;b]
12.3. EJEMPLOS DE ESPACIOS NORMADOS. iv) Sean f; g 2 C ([a; b]). Entonces jf (x) + g (x)j kf + gk1 = Max jf (x) + g (x)j
595 jf (x)j + jg (x)j
8x 2 [a; b] : Resulta,
Max jf (x)j + Max jg (x)j
x2[a;b]
x2[a;b]
x2[a;b]
kf k1 + kgk1 :
Conclusión: k k1 es una norma en C ([a; b]) : Notación: El espacio C ([a; b]) provisto de la norma k k1 se le nota L1 ([a; b]) : Normas hölderianas en el espacio de funciones continuas C([a; b]): Sea p 2 [1; 1[. Se de…ne la función k kp de C ([a; b]) en R como sigue: kf kp =
Z
b
a
1 p
p
jf (x)j dx
8f 2 C ([a; b]) :
Probemos que k kp es una norma sobre C ([a; b]) denominada norma hölderiana. Para el efecto mostremos que k kp satisface las cuatro propiedades de la de…nición de norma. i) Es claro que kf kp
0
8f 2 C ([a; b]) :
ii) Si f = 0 se tiene kf kp = 0. Supongamos que kf kp = 0 y probemos que f = 0, o lo que es equivalente a probar que f 6= 0 ) kf kp 6= 0: Recuerde que si u; v son proposiciones, se tiene la siguiente tautología: (u =) v) () [( v) =) ( u)]: Efectivamente, si f 6= 0, existe x0 2 [a; b] tal que f (x0 ) 6= 0 y como f es continua, existe [ ; ] [a; b] tal que f (x) 6= 0 8x 2 [ ; ]. Luego Z Z b p 0< jf (x)j dx jf (x)jp dx = kf kpp ; a
es decir que kf kp > 0. Así, f 6= 0 ) kf kp > 0; o lo que es lo mismo kf kp = 0 ) f = 0: iii) Sean
2 R, f 2 C ([a; b]). Se veri…ca inmediatamente que k f kp = j j kf kp :
iv) Mediante un procedimiento análogo al de la demostración de la desigualdad triangular para la norma hölderiana en Rn , se obtiene de la desigualdad de Young, la desigualdad de Hölder que para 1 1 funciones continuas se establece del modo siguiente: para todo p; q 2 [1; 1[ tales que + = 1; f; g 2 p q C ([a; b]) ; entonces f g 2 C( [a; b]) y Z b kf gk1 = jf (x) g (x)j dx kf kp kgkq ; a
o lo que es lo mismo Z
a
b
jf (x) g (x)j dx
Z
b
a
p
jf (x)j dx p
Para probar esta desigualdad se pone = jfkf(x)j , = kpp Young que ha sido establecida anteriormente. Se obtiene jf (x)j jg(x)j kf kp kgkq
1 p
Z
jg(x)jq kgkqq
1 jf (x)jp 1 jg(x)jq + p kf kpp q kgkqq
a
b
q
jg (x)j dx
1 q
:
con f 6= 0; g 6= 0 en la desigualdad de x 2 [a; b];
y luego se integra sobre el intervalo [a; b]; esto es Z b Z b Z b 1 1 1 1 1 p jf (x) g (x)j dx jf (x)j dx + jg (x)jq dx = 1; kf kp kgkq a p kf kpp a q kgkqq a y de esta desigualad se obtiene la desigualdad de Hölder. Sean f; g 2 C ([a; b]). Utilizando la desigualdad de Hölder se obtiene la desigualdad triangular siguiente: kf + gkp
kf kp + kgkp :
596
CAPÍTULO 12. APENDICE
Conclusión: k kp es una norma sobre C ([a; b]) ; p 2 [1; 1[ : Notación: El espacio C ([a; b]) provisto de la norma k kp se le nota Lp ([a; b]) :
Rb Sea f 2 C ([a; b]) : Para p = 1; la norma k k1 está de…nida como kf k1 = a jf (x)j dx. Note que 1 Rb 2 2 f 2 L1 ([a; b]) : Para p = 2, kf k2 = jf (x)j dx es la norma euclídea. Se tiene f 2 L2 ([a; b]) : a 1 Rb 4 4 Si p = 4; la función k k4 está de…nida como kf k4 = a jf (x)j dx . Note que f 2 L4 ([a; b]) : Para p = q = 2, la desigualdad de Hölder se expresa como sigue: Z b jf (x) g (x)j dx kf k2 kgk2 8f; g 2 C ([a; b]) ; kf gk1 = a
que coincide con la conocida desigualdad de Cauchy-Schwarz.
Es importante observar el signi…cado de los espacios Lp ([a; b]) que aquí hemos dado: simplemente es el espacio C ([a; b]) provisto de la norma k kp . Estos espacios Lp ([a; b]) son diferentes de los espacios Lp (a; b) que designan a los espacios de Lebesgue que se tratan en los cursos de Análisis Funcional, Teoría de Integración, etc. Para información Lp ([a; b]) Lp (a; b). Similarmente L1 ([a; b]) L1 (a; b), donde L1 (a; b) pertenece a la clase de los espacios de Lebesgue. Sean ! 2 C ([a; b]) tal que ! (x) > 0 8x 2 [a; b] ; las siguientes son normas en C ([a; b]) : Rb a) kf k = a ! (x) jf (x)j dx f 2 C ([a; b]) : Rb
b) kf k =
a
! (x) f 2 (x) dx
1 2
f 2 C ([a; b]) :
Otras normas en C 1 ([0; 10]) se de…nen a continuación: a) N (u) = Max fju (x)j ; ju0 (x)jg : x2[0;10]
b) M (u) = c) R (u) =
12.4.
R 10 0
R 10 0
(ju (x)j + ju0 (x)j) dx: p
(ju (x)j +
ju0 (x)jp ) dx
1 p
para p 2 ]1; 1[ :
Espacios con producto interno.
En esta sección revisamos brevemente una clase de espacios vectoriales reales V en los que se de…ne un producto escalar (dicho también producto interno o producto punto) que los denominaremos espacios con producto escalar o espacios con producto punto, o espacios euclídeos. En esta clase de espacios se introducirán las nociones geométricas de ángulo, de perpendicularidad u ortogonalidad, la conocida ley del paralelogramo y el teorema de Pitágoras. Enfatizaremos en dos clases de espacios Rn y C ([a; b]). De…nición 20 Sea V un espacio vectorial real. Un producto interno o producto escalar en V es una función denotada h ; i de V V en R que satisface las siguientes propiedades: i. hx; yi = hy; xi
8x; y 2 V;
ii. hx + y; zi = hx; zi + hy; zi iii. h x; yi =
hx; yi
8 2 R;
8x; y; z 2 V; 8x; y 2 V;
iv. hx; xi = 0 , x = 0;
hx; xi > 0 , x 6= 0 x 2 V:
Para x; y 2 V , el número real hx; yi se llama producto escalar o producto interno de x con y.
12.4. ESPACIOS CON PRODUCTO INTERNO.
597
De…nición 21 Un espacio vectorial V en el que se ha de…nido un producto escalar h ; i se denomina espacio con producto interior, espacio con producto escalar o espacio prehilbertiano. Observación Si V es un espacio vectorial complejo y h ; i denota un producto escalar en V , la propiedad i) se escribe como hx; yi = hy; xi 8x; y 2 V; donde el lado derecho de la igualdad designa el número complejo conjugado de hy; xi. Las propiedades ii), iii) y iv) de la de…nición de producto escalar permanecen invariables. Ejemplos Pn 1. Sea V = Rn . Un producto escalar h ; i en Rn se de…ne como h! x;! yi = i=1 xi yi ; donde ! ! n x = (x1 ; :::; xn ), y = (y1 ; :::; yn ) 2 R . En notación matricial, esto es, los elementos de Rn se escriben como vectores columna, el producto escalar h ; i en Rn se escribe como h! x;! yi=! x T! y =
n X
xi yi ;
i=1
donde ! x T = (x1 ; :::; xn ) ; ! y T = (y1 ; :::; yn ) 2 Rn denotan los vectores transpuestos de los vectores ! ! columna x e y . Las propiedades i) a iv) de la de…nición de producto escalar se veri…can fácilmente y se dejan como ejercicio.
Para n = 2, el producto h ; i en R2 está dado como sigue: si ! x = (a1 ; b1 ), ! y = (a2 ; b2 ) 2 R2 , ! ! entonces h x ; y i = a1 a2 + b1 b2 : Para n = 3, el producto h ; i en R3 está dado como h! x;! y i = a1 a2 +b1 b2 +c1 c2 con ! x = (a1 ; b1 ; c1 ), ! 3 y = (a ; b ; c ) 2 R . 2
2
2
2. Sea V = C ([a; b]). Un producto escalar h ; i en C ([a; b]) se de…ne como Z b f (x) g (x) dx 8f; g 2 C ([a; b]) : hf; gi = a
Por ejemplo, si f , g 2 C ([ 1; 1]) están dadas como f (x) = x3 , g (x) = x2 + 1 x 2 [ 1; 1]. Entonces Z 1 Z 1 hf; gi = f (x) g (x) dx = x3 x2 + 1 dx = 0: 1
1
Probemos que la función h ; i de C ([a; b]) C ([a; b]) en R satisface las cuatro propiedades de la de…nición de producto escalar. Para ello utilicemos algunas propiedades de las funciones integrables y de las funciones continuas. Sean f; g; h 2 C ([a; b]) y 2 R. Entonces Rb f (x) g (x) dx = a g (x) f (x) dx = hg; f i : Rb Rb Rb ii. hf + g; hi = a [f (x) + g (x)] h (x) dx = a f (x) h (x) dx + a g (x) h (x) dx = hf; hi + hg; hi : Rb Rb iii. h f; gi = a f (x) g (x) dx = a f (x) g (x) dx = hf; gi : i. hf; gi =
Rb a
iv. Si f = 0 es claro que hf; f i = 0. Mostremos que si hf; f i = 0 entonces f = 0. Para ello, haciendo uso de la tautología (p ) q) , [( q) ) ( p)] en la que p; q son las proposiciones siguientes p : f = 0; q : hf; f i = 0; tenemos la proposición siguiente: f 6= 0 ) hf; f i > 0: Si f 6= 0, existe x0 2 [a; b] tal que f (x0 ) 6= 0. Por hipótesis f es continua, por lo tanto es continua en x0 y siendo f (x0 ) 6= 0, existe un intervalo [ ; ] [a; b] tal que f (x) 6= 0 8x 2 [ ; ]. Luego Z Z b 0< f 2 (x) dx f 2 (x) dx = hf; f i : a
Así, f 6= 0 ) hf; f i > 0 y por la tautología antes citada se deduce hf; f i = 0 ) f = 0: Consecuentemente, hf; f i = 0 , f = 0: Además, del resultado precedente, es claro que hf; f i > 0 8f 2 C ([a; b]) con f 6= 0:
598
CAPÍTULO 12. APENDICE
3. Sean V =PMn n [R], A = (aij ) 2 Mn n [R]. La traza de la matriz A se nota tr (A) y se de…ne como tr (A) = ni=1 aii : Una función h ; i de Mn n [R] Mn n [R] en R de…nida como hA; Bi = tr B T A
es un producto escalar en Mn
8A; B 2 Mn
n [R]
n [R].
Propiedades adicionales del producto escalar. En un espacio prehilbertiano real V se veri…can las propiedades siguientes: i. hx; y + zi = hx; yi + hx; zi ii. hx; yi = iii. hx
hx; y
hx; yi
8x; y; z 2 V;
8 2 R; 8x; y 2 V;
y; zi = hx; zi
zi = hx; yi
iv. h0; xi = hx; 0i = 0
hy; zi
hx; zi
8x; y; z 2 V;
8x; y; z 2 V;
8x 2 V:
v. Sean x; y 2 V , si para todo z 2 V , hx; zi = hy; zi, entonces x = y: vi. Sean x1 ; :::; xn ; y 2 V , 1 ; :::; n 2 R. Entonces * n + n X X = i xi ; y i hxi ; yi ; y, i=1
i=1
*
y;
n X i=1
i xi
+
=
n X i=1
i hxi ;
yi :
En un espacio vectorial real V se pueden de…nir una in…nidad de productos escalares. En los ejercicios se exhiben algunos productos escalares de…nidos en R2 y en C ([0; 1]). Longitud o norma de un vector De…nición 22 Sea V un espacio vectorial real provisto de un producto escalar h ; i. La longitud o 1 norma de x 2 V se nota kxk y se de…ne como kxk = (hx; xi) 2 : Esta norma k k se dice asociada al producto escalar h ; i y se le denomina norma euclídea. Ejemplos 1. En el caso en que V = Rn , la norma del vector ! x T = (x1 ; :::; xn ) 2 Rn asociada al producto escalar n 1 1 Pn P 2 2 : Esta norma coincide de…nido como ! x T! y = xi yi , se escribe k! x k2 = ! x T! x 2 = i=1 xi i=1
con la norma hölderiana en Rn con p = 2.
2. Sea V = C ([ 1; 1]). La norma de f 2 C ([ 1; 1]) asociada al producto escalar h ; i antes de…nido, 1 R1 2 1 2 está de…nida como kf k2 = (hf; f i) 2 = f (x) dx : Esta norma coincide con la norma 1 hölderiana en C ([a; b]) con p = 2. 3. Se denota Kn ([a; b]) al espacio vectorial de los polinomios reales de grado n restringidos al intervalo [a; b] R El espacio Kn ([a; b]) es un subespacio de C ([a; b]) de dimensión n + 1. De…nido un producto escalar h ; i en C ([a; b]), este es un producto escalar en Kn ([a; b]) y la norma asociada se escribe 1 Z b 2 1 2 kpk2 = (hp; pi) 2 = p (t) dt 8p 2 Kn ([a; b]) : a
En tal caso diremos que Kn ([a; b]) es un espacio con producto intermo inducido por el de C ([a; b]) y que la norma k k2 en Kn ([a; b]) es la inducida por la norma k k2 en C ([a; b]).
12.4. ESPACIOS CON PRODUCTO INTERNO.
599
4. Sea V = C 1 ([ 1; 1]). Un producto escalar h ; i en C 1 ([ 1; 1]) se de…ne como Z
hf; gi =
1
f (x) g (x) + 1
df dg (x) (x) dx dx dx
y la norma de f 2 C 1 ([ 1; 1]) asociada a este producto escalar se de…ne como kf k1;2 =
Z
1 1
df jf (x)j2 + (x) dx
2
!
!1 2
dx
:
5. Sean = [ 1; 1] [ 1; 1] R2 . Se denota con C ( ) al espacio vectorial de funciones continuas en . Un producto escalar h ; i en C ( ) se de…ne como hf; gi =
Z
1 1
Z
1
f (x; y) g (x; y) dxdy 1
8f; g 2 C( ):
Se propone como ejercicio probar que efectivamente la función h ; i de…nida en C( ) C( ) es un producto escalar. La norma de f 2 C ( ) asociada a este producto escalar se de…ne como kf k =
Z
2
jf (x; y)j dxdy
1 2
:
6. Considerar el espacio de funciones C 1 ([ 1; 1]) que poseen derivada continua en [ 1; 1]. Se de…ne la función h ; i1 de C 1 ([ 1; 1]) C 1 ([ 1; 1]) en R como sigue: hu; vi1 =
Z
1
u (x) v (x) + u0 (x) v 0 (x) dx
1
8u; v 2 C 1 ([ 1; 1]) .
entonces h ; i es un producto escalar en C 1 ([ 1; 1]). 7. Sean = [ 1; 1] [ 1; 1] R2 . Se denota con C ( ) al espacio vectorial de funciones continuas en . Un producto escalar h ; i en C ( ) se de…ne como hf; gi =
Z
1 1
Z
1
f (x; y) g (x; y) dxdy 1
8f; g 2 C( ):
La norma de f 2 C ( ) asociada a este producto escalar se de…ne como 1 R 2 jf (x; y)j2 dxdy :
kf k =
8. Sea = [ 1; 1] [ 1; 1] R2 . Se designa con C 1 ( ) al espacio de funciones reales que poseen derivadas parciales primeras continuas en : En C 1 ( ) se de…ne la función real h ; i1;2 como a continuación se indica: hf; gi1;2 =
Z
f (x; y)g(x; y) +
@f @g @f @g (x; y) (x; y) + (x; y) (x; y) dxdy @x @x @y @y
8f; g 2 C 1 ( ):
entonces h ; i1;2 es un producto escalar en C 1 ( ): Este producto escalar se escribe en forma R abreviada como hf; gi1;2 = (f g + rf rg) 8f; g 2 C 1 ( ) y la norma asociada a este producto 1 R 2 8f 2 C 1 ( ): escalar se escribe como kf k1;2 = f 2 + jrf j2
600
CAPÍTULO 12. APENDICE
Teorema 8 Sea V un espacio vectorial real provisto de un producto escalar h ; i. La longitud o norma k k en V satisface las siguientes propiedades: i. kxk
0
8x 2 V:
ii. kxk = 0 , x = 0: iii. k xk = j j kxk iv. jhx; yij
kxk kyk
v. kx + yk vi. jkxk
8 2 R; x 2 V:
kxk + kyk
kykj
kx
vii. kx + yk2 + kx viii. hx; yi =
8x; y 2 V (desigualdad de Cauchy-Schwarz).
1 4
8x; y 2 V (desigualdad triangular).
yk
8x; y 2 V .
yk2 = 2 kxk2 + 2 kyk2
kx + yk2
kx
yk2
8x; y 2 V (ley del paralelogramo).
8x; y 2 V
(identidad de polarización).
Demostración. i. Puesto que la función h ; i de V V en R es un producto escalar, esta tiene la propiedad siguiente: para x 2 V , hx; xi = 0 , x = 0; hx; xi > 0 , x 6= 0; y de la de…nición de norma, se tiene kxk 0 8x 2 V . 1
ii. Como hx; xi = 0 , x = 0, resulta kxk = (hx; xi) 2 = 0 , x = 0: iii. Sean
2 R, x 2 V . Entonces 1
k xk = (h x; xi) 2 = Así, k xk = j j kxk
2
hx; xi
1 2
1
= j j (hx; xi) 2 = j j kxk :
8 2 R; 8x 2 V:
iv. Sean x; y 2 V . Por la parte i) de este teorema se tiene kx + yk2 de…nición de norma y las propiedades del producto escalar, se tiene 0
0
8
2 R. Luego, por la
kx + yk2 = hx + y; x + yi = hx; xi + hx; yi + h y; xi + h y; yi
= hx; xi + hx; yi + hy; xi +
2
hy; yi = kxk2 + 2 hx; yi +
2
kyk2 :
Sea P el polinomio de grado 2 de…nido por P ( ) = kxk2 + 2 hx; yi + kyk2 2 ; 2 R. Por la parte precedente se veri…ca P ( ) 0 8 2 R, con lo que el discriminante d = (2 hx; yi)2 4 kxk2 kyk2 0 de donde 4 (hx; yi)2 4 kxk2 kyk2 : Tomando la raíz cuadrada y considerando que la norma k k es no negativa, se deduce la desigualdad de Cauchy-Schwarz: jhx; yij kxk kyk : v. Sean x; y 2 V . Entonces kx + yk2 = hx + y; x + yi = hx; xi + hx; yi + hy; xi + hy; yi = kxk2 + 2 hx; yi + kyk2 : Se tiene hx; yi
jhx; yij y por la desigualdad de Cauchy-Schwarz resulta hx; yi
jhx; yij
kxk kyk
8x; y 2 V:
Luego, kx + yk2 = kxk2 + 2 hx; yi + kyk2
kxk2 + 2 kxk kyk + kyk2 = (kxk + kyk)2 :
Tomando la raíz cuadrada y considerando que la norma es no negativa, se obtiene la desigualdad triangular kx + yk kxk + kyk 8x; y 2 V:
12.4. ESPACIOS CON PRODUCTO INTERNO. vi. La desigualdad jkxk normados.
kykj
kx
yk
601
8x; y 2 V ya fue probada en la sección de los espacios
vii. De la de…nición de norma y de las propiedades del producto escalar, se tiene kx + yk2 + kx
yk2 = hx + y; x + yi + hx
y; x
yi
= hx; xi + 2 hx; yi + hy; yi + hx; xi
= 2 kxk2 + kyk2 :
2 hx; yi + hy; yi
viii. Se propone como ejercicio.
De…nición 23 Sean V un espacio prehilbertiano, x; y 2 V . La distancia de x a y se denota y se de…ne como d (x; y) = kx yk : Si h ; i es un producto escalar de…nido en V y k k la norma asociada, se tiene d (x; y) = kx
yk = (hx
y; x
Teorema 9 Sea V un espacio prehilbertiano. La función d de V V en R de…nida como d (x; y) = kx decir que satisface las propiedades siguientes: i. d (x; y)
0
1
yi) 2
yk
8x; y 2 V . 8x; y 2 V es una métrica en V , es
8x; y 2 V:
ii. d (x; y) = 0 , x = y; x; y 2 V . iii. d (x; y) = d (y; x) iv. d (x; z)
8x; y 2 V:
d (x; y) + d (y; z)
8x; y; z 2 V (desigualdad triangular).
Demostración. La prueba es inmediata y se propone como ejercicio. Si V es un espacio vectorial real provisto de un producto interior o producto escalar h ; i, la norma 1 asociada a este producto escalar está dado por kxk = (hx; xi) 2 x 2 V , y la métrica asociada a la norma k k está de…nida como d (x; y) = kx yk x; y 2 V , con lo cual V es un espacio métrico que escribimos (V; d). En la siguiente sección trataremos más en detalle las métricas sobre un conjunto no vacío E.
12.4.1.
Ortogonalidad o perpendicularidad.
De…nición 24 Sea V un espacio vectorial provisto del porducto escalar h ; i : i) Sean x; y 2 V: Se dice que x es ortogonal o perpendicular a y, que se nota x ? y; si y solo si hx; yi = 0: ii) Sean x 2 V; M V con M 6= : Se dice que x es ortogonal a M , que se escribe x ? M; si y solo si hx; yi = 0 8y 2 M: iii) Sean M; N dos subconjuntos no vacíos de V . Se dice que M es ortogonal a N; que se nota M ? N , si y solo si hx; yi = 0 8x 2 M; 8y 2 N: iv) Sea M
V con M 6= 0: Se dice que M es ortogonal si y solo si hx; yi = 0 8x; y 2 M; x 6= y:
v) Se dice que M es ortonomal si y solo si M es ortogonal, y 8x 2 M; kxk = 1: Ejemplos
602
CAPÍTULO 12. APENDICE
1. Sea V = Rn : El conjunto M = f! e 1; : : : ; ! e n g ; donde ! e T1 = (1; 0; : : : ; 0) ; : : : ; ! e Tn = (0; : : : ; 0; 1) n son los vectores de la base canónica de R ; es un conjuto ortogonal, pués ! e Tj ! e k = 0 si j 6= k; y, k! e jk = 1
j = 1; : : : ; n:
2. Sean L > 0: Se denota con C ([ L; L]) al espacio vectorial de las funciones continuas en [ L; L] : Proveemos a C ([ L; L]) del producto escalar h ; i de…nido por Z L u (x) v (x) dx 8u; v 2 C ([ L; L]) : hu; vi = L
Los siguientes conjuntos de funciones son muy importantes en el desarrollo en series de Fourier de funciones reales periódicas de período 2L y continuas a trozos en el intervalo [ L; L] : Sean M; N los subconjuntos de C ([ L; L]) de…nidos como M = f'k j k 2 Ng ; N = f k j k 2 Z+ g ; donde '0 (x) = 1 x 2 [ L; L] ; k
(x) = sen
k x L
k x L
'k (x) = cos
x 2 [ L; L] ;
k = 1; 2; : : : ;
x 2 [ L; L] ; k = 1; 2; : : :
Se tiene i) M es un conjunto ortogonal. ii) N es un conjunto ortogonal. iii) M ? N:
i) Probemos que M es ortogonal, esto es, h'0 ; 'k i = 0 'j ; ' k
8k = 1; 2; : : :
= 0
8j; k 2 Z con j 6= k:
En efecto, de la de…nición de '0 y 'k ; se tiene Z L Z L k x cos '0 (x) 'k (x) dx = h'0 ; 'k i = L L L
dx =
L sen k
j x L
sen
k x L
L L
=0
k = 1; 2; : : :
Por otro lado, 'j ; ' k = j x L
Como cos
Z
L L
= cos
'j (x) 'k (x) dx = j x L
; sen
k x L
Z
L
cos l
=
k x L
sen
k x L
dx
8x 2 [ L; L] :
entonces la función 'j 'k es impar para
j 6= k. Luego 'j ; 'k = 0:
ii) Pasemos a probar que N es ortogonal, es decir, Z L j x k x sen sen j; k = L L l
dx = 0
8j; k 2 Z con j 6= k:
Sean a; b 2 R; de las identidades trigonométricas cos (a + b) = cos a cos b
sen a sen b;
se obtiene sen a sen b = y poniendo a = j;
k
1 [cos (a 2
cos (a b)
b) = cos a cos b + sen a sen b; cos (a + b)] ;
j x L ;
b = kLx ; resulta Z L 1 (j k) x = cos cos L L 2 1 L (j k) x = sen 2 (j k) L = 0 si j 6= k:
(j + k) x dx L L (j + k) x sen (j + k) L
L L
12.5. LECTURAS COMPLEMENTARIAS Y BIBLIOGRAFÍA iii) Para mostrar que M ? N; se debe probar que h'0 ; Z+ . La veri…cación se propone como ejercicio.
ki
603 = 0 k = 1; 2; : : : y 'j ;
De…nición 25 Sea V un espacio con producto interior, x; y 2 V: El ángulo hx;yi vectores x e y se de…ne como cos = kxkkyk x 6= 0; y = 6 0:
k
= 0 j; k 2
2 [0; ] que forman los
Teorema 10 (de Pitágoras) Sea V un espacio con producto interior, x; y 2 V . Si x ? y se tiene kx + yk2 = kxk2 + kyk2 : De manera mas general, sea fx1 ;
; xn g un conjunto ortogonal de V , entonces n X i=1
2
xi
=
n X i=1
k xi k2 :
Demostración. De la de…nición de la norma k:k ; se tiene kx + yk2 = hx + y; x + yi = hx; xi + 2 hx; yi + hy; yi : Por hipótesis x ? y, luego hx; yi = 0; y como hx; xi = kxk2 ; hy; yi = kyk2 ; se concluye kx + yk2 = kxk2 + kyk2 : La prueba de la generalización del teorema de Pitágoras a una familia ortogonal …nita se realiza por inducción y se propone como ejercicio. En el caso de espacios vectoriales reales, se tiene que: si x; y 2 V tales que kx + yk2 = kxk2 + kyk2 entonces x ? y: Efectivamente, si x; y 2 V entonces kx + yk2 = kxk2 + 2 hx; yi + kyk2 : Por hipótesis, kx + yk2 = kxk2 + kyk2 ; y de la igualdad kxk2 + kyk2 = kxk2 + 2 hx; yi + kyk2 de donde hx; yi = 0; o sea x ? y:
12.5.
Lecturas complementarias y bibliografía
1. Owe Axelsson, Iterative Solution Methods, Editorial Cambridge University Press, Cambridge, 1996. 2. E. K. Blum, Numerical Analysis and Computation. Theory and Practice, Editorial Addison-Wesley Publishing Company, Reading, Massachusetts, 1972. 3. Richard L. Burden, J. Douglas Faires, Análisis Numérico, Séptima Edición, International Thomson Editores, S. A., México,2002. 4. P. G. Ciarlet, Introduction á l’Analyse Numérique Matricielle et á l’Optimisation, Editorial Masson, París, 1990. 5. James W. Demmel, Applied Numerical Linear Algebra, Editorial Society for Industrial and Applied Mathematics (SIAM), Philadelphia, 1997. 6. V. N. Faddeva, Métodos de Cálculo de Algebra Lineal, Editorial Paraninfo, Madrid, 1967. 7. Francis G. Florey, Fundamentos de Algebra Lineal y Aplicaciones, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1980. 8. Stephen H. Friedberg, Arnold J. Insel, Lawrence E. Spence, Algebra Lineal, Editorial Publicaciones Cultural, S. A., México, 1982. 9. Noel Gastinel, Análisis Numérico Lineal, Editorial Reverté, S. A., Barcelona, 1975.
604
CAPÍTULO 12. APENDICE
10. Gene H. Golub, Charles F. Van Loan, Matrix Computations, Second Edition, The Johns Hopkins University Press, Baltimore, 1989. 11. Kenneth Ho¤man, Ray Kunze, Algebra Lineal, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1987. 12. Franz E. Hohn, Algebra de Matrices, Editorial Trillas, México, 1979. 13. Roger A. Horn, Charles R. Johnson, Matrix Analysis, Editorial Cambridge University Press, Cambridge, 1999. 14. A. N. Kolmogórov, S. V. Fomín, Elementos de la Teoría de Funciones y del Análisis Funcional. Editorial Mir, Moscú, 1972. 15. Peter Linz, Theoretical Numerical Analysis, Editorial Dover Publications, Inc., New York, 2001. 16. Anthony N. Michel, Charles J. Herget, Applied Algebra and Functional Analysis, Editorial Dover Publications, Inc., New York, 1981. 17. Ben Noble, James W. Daniel, Algebra Lineal Aplicada, Editorial Prentice-Hall Hispanoamericana, S. A., México, 1989. 18. Fazlollah Reza, Los Espacios Lineales en la Ingeniería, Editorial Reverté, S. A., Barcelona, 1977. 19. Gilbert Strang, Algebra Lineal y sus Aplicaciones, Editorial Fondo Educativo Interamericano, México, 1982. 20. Arthur Wouk, A Course of Applied Functional Analysis, Editorial John Wiley&Sons, New York, 1979.
View more...
Comments