CÁLCULO EN VARIAS VARIABLES. ITOP - INGENIERÍA CIVIL
Short Description
Download CÁLCULO EN VARIAS VARIABLES. ITOP - INGENIERÍA CIVIL...
Description
C´ alculo en varias variables Asignatura “An´alisis Matem´atico” de 1o I.T.O.P. Memoria de la segunda parte - segundo parcial- de la asignatura. Departamento de Matem´aticas de la Escuela Polit´ecnica. Ricardo del Campo Acosta y Ricardo Garc´ıa Gonz´alez.
A mis alumnos, por querer aprender algo nuevo
´Indice Introducci´on
v
Cap´ıtulo 1. TOPOLOG´IA DE RN 1.1. Producto escalar, norma y distancia eucl´ıdeas 1.2. Bolas, entornos, abiertos y cerrados de RN 1.3. Convergencia de sucesiones en RN
1 1 2 5
Cap´ıtulo 2. L´IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES 7 2.1. L´ımite de una funci´on de varias variables 8 2.2. Algunas t´ecnicas y m´etodos para el c´alculo de l´ımites 9 2.3. L´ımites en el infinito y funciones divergentes 11 2.4. Continuidad de una funci´on de varias variables 11 ´ DE FUNCIONES DE VARIAS Cap´ıtulo 3. DIFERENCIACION VARIABLES 3.1. Derivadas parciales y derivadas direccionales 3.2. Diferencial y gradiente de una funci´on real de varias variables. Relaci´on e interpretaci´on geom´etrica 3.3. Diferencial y matriz jacobiana de una funci´on vectorial de varias variables. Regla de la cadena 3.4. Funciones definidas de forma impl´ıcita. El teorema de la funci´on impl´ıcita 3.5. Derivadas parciales y diferencial de orden superior. Matriz hessiana de una funci´on real de varias variables 3.6. El teorema de Taylor en varias variables 3.7. Extremos relativos de una funci´on real de varias variables 3.8. Extremos condicionados de una funci´on real de varias variables. El teorema de los multiplicadores de Lagrange 3.9. Extremos absolutos de una funci´on real de varias variables
iii
15 15 17 21 24 26 28 30 32 34
Introducci´ on El estudio de las aplicaciones o funciones de varias variables es uno de los objetivos fundamentales de las matem´aticas, ya que la mayor´ıa de los fen´omenos de cualquier tipo (f´ısicos, qu´ımicos, econ´omicos, etc.) se pueden modelizar mediante una funci´on de este tipo. Cuando la aplicaci´on es lineal, conocemos t´ecnicas algebraicas que me permiten manejarla y estudiarla f´acilmente, pues tales aplicaciones se pueden caracterizar mediante una matriz de coeficientes y as´ı trabajar con aplicaciones lineales se reduce a trabajar con matrices: µ ¶ x 8 1 −1 y f (x, y, z) = (8x + y − z, x + 2y + 3z) = 1 2 3 z 1 0 −1 x 6 y f (x, y, z) = (x − z, 4y + 6z, x − y − z) = 0 4 1 −1 −1 z Obviamente la cantidad de aplicaciones con las que podemos trabajar as´ı es bastante limitada, pues cuando la aplicaci´on no es lineal ya no podemos estudiar su comportamiento global a trav´es de una matriz, pero a menudo si vamos a poder estudiar su comportamiento local a trav´es de ciertas matrices. De hecho, en esencia, el objetivo del c´ alculo diferencial que vamos a presentar en esta memoria es ese: Estudiar una clase de funciones (las funciones diferenciables) que se parecen mucho a una aplicaci´on af´ın (esto es, su incremento se parece mucho a una aplicaci´on lineal) en un entorno de cada punto. De este modo las t´ecnicas algebraicas que ya conocemos nos permitir´an obtener consecuencias locales sobre tales funciones a partir de las propiedades (globales) de las aplicaciones lineales a las que se parecen en cada punto. Se trata por tanto de explotar tanto como podamos las t´ecnicas algebraicas para estudiar funciones que no tienen por qu´e ser lineales. De este modo estamos ampliando enormemente la cantidad de funciones con las que podemos trabajar, pues disponemos de herramientas matem´aticas para extraer informaci´on u ´til sobre ellas. v
CAP´ıTULO 1
TOPOLOG´IA DE RN En el estudio de las funciones reales de variable real los intervalos desempe˜ nan un papel crucial pues algunas propiedades de tales funciones s´olo se dan en un determinado tipo de intervalos. La importancia de los intervalos se debe a que nos permiten manejar (de un modo sencillo y riguroso) los n´ umeros reales que se encuentran entorno a un n´ umero real dado a, en concreto, los n´ umeros reales que est´an a una distancia menor (o menor o igual) que ε de a, pues ]a − ε, a + ε[= {x ∈ R : |x − a| < ε} [a − ε, a + ε] = {x ∈ R : |x − a| ≤ ε} Si ahora pretendemos estudiar funciones de varias variables necesitaremos una noci´on que generalice la idea del valor absoluto como herramienta para medir distancias entre puntos y unos conjuntos que hagan el papel de los intervalos como conjuntos de puntos entorno a un punto dado a. 1.1.
Producto escalar, norma y distancia eucl´ıdeas
Vamos a comenzar presentando de forma abstracta las nociones b´asicas con las que vamos a trabajar. Si X es un espacio vectorial sobre R se llama distancia a toda aplicaci´on d : X × X −→ R que ∀x, y, z ∈ X verifica las siguientes propiedades: • d(x, y) ≥ 0 y d(x, y) = 0 ⇔ x = y • d(x, y) = d(y, x) • d(x, y) ≤ d(x, z) + d(z, y) Se llama norma a toda aplicaci´on k · k : X −→ R que ∀x, y, z ∈ X y ∀λ ∈ R cumple lo siguiente: • kxk ≥ 0 y kxk = 0 ⇔ x = 0 • kλxk = |λ|kxk • kx + yk ≤ kxk + kyk Por u ´ltimo, se llama producto escalar a toda forma bilineal sim´etrica definida positiva de X, esto es a toda aplicaci´on < ·, · >: X × X −→ R tal que ∀x, x0 , y ∈ X y ∀α, β ∈ R verifica que: 1
1. TOPOLOG´IA DE RN
2
• < αx + βx0 , y >= α < x, y > +β < x0 y > • < x, y >=< y, x > • < x, x > ≥ 0 y < x, x >= 0 ⇔ x = 0 Intuitivamente una distancia es una funci´on que mide el grado de proximidad entre los puntos, una norma es una funci´on que mide las longitudes de los vectores y un producto escalar es una funci´on que me permite medir ´angulos y hablar de ortogonalidad entre vectores. Adem´as estas nociones no son independientes entre si, pues todo producto escalar induce una norma, definida mediante la expresi´on √ kxk := < x, x >, ∀x ∈ X y toda norma induce una distancia del siguiente modo: d(x, y) := kx − yk, ∀x, y ∈ X es decir, que “si tengo un producto escalar en un espacio vectorial puedo medir longitudes de vectores sin m´as que hacer la ra´ız cuadrada del producto escalar de cada vector consigo mismo, y si tengo una norma puedo medir distancias entre dos puntos cualesquiera midiendo la longitud de su diferencia como vectores”. Como RN es un espacio vectorial con un producto escalar can´onicamente asociado, el producto escalar eucl´ıdeo, dado por x · y = < x, y > := x1 y1 + · · · + xN yN para todo x = (x1 , . . . , xN ) e y = (y1 , . . . , yN ) de RN , en particular tenemos una norma y una distancia inducidas, que reciben el nombre de norma y distancia eucl´ıdeas y vienen dadas por q kxk = x21 + · · · + x2N p d(x, y) = (x1 − y1 )2 + · · · + (xN − yN )2 ´ Estas son las nociones de producto escalar, norma y distancia que vamos a consideras can´onicamente asociadas a RN . N´otese que para N = 1 la norma eucl´ıdea no es otra cosa que el valor absoluto de un n´ umero real. 1.2.
Bolas, entornos, abiertos y cerrados de RN
´ n 1.2.1. Sea a ∈ RN y ε > 0. Se define la bola (abierta) Definicio de centro a y radio ε como el siguiente conjunto: Bε (a) := {x ∈ RN : kx − ak < ε} An´alogamente, se define la bola cerrada de centro a y radio ε como Bε (a) := {x ∈ RN : kx − ak ≤ ε}
1.2. BOLAS, ENTORNOS, ABIERTOS Y CERRADOS DE RN
3
Obs´ervese que para N = 1 las bolas vuelven a ser intervalos, pues Bε (a) =]a − ε, a + ε[ y Bε (a) = [a − ε, a + ε], para N = 2 lo que quedan son c´ırculos (con o sin su circunferencia) y para N = 3 las bolas son esferas. Podemos considerar a las bolas centradas en un punto a como los entornos del punto a, pero conviene m´as pensar en los entornos de a como cualquier conjunto que contenga una bola centrada en a. ´ n 1.2.2. Un conjunto V de RN se dice que es un entorno Definicio del punto a si existe ε > 0 tal que Bε (a) ⊆ V . Ya tenemos unos conjuntos, las bolas, que extienden la definici´on de los intervalos a RN . Sin embargo, dada la riqueza de conjuntos que hay en RN , las bolas son unos conjuntos demasiados restrictivos para nuestros fines: En R es suficiente con limitarnos a estudiar las funciones definidas en un intervalo ya que la mayor´ıa de las funciones suelen estar definidas de un modo natural sobre uno (o varios) intervalos, pero en RN los conjuntos en los que est´an definidas las funciones pueden tener una geometr´ıa muy diversa y no ser´ıa muy interesante limitarnos s´olo a estudiar las funciones definidas en una (o varias) bolas. Por este motivo vamos a usar las bolas para introducir un par de familias de conjuntos de RN muchos m´as amplia que las propias bolas, que ser´an la familia de los conjuntos abiertos y la de los conjuntos cerrados de RN . ´ n 1.2.3. Sea A ⊆ RN y x ∈ RN . Se dice que Definicio • x es un punto interior de A si ∃ε > 0 tal que Bε (x) ⊆ A • x es un punto adherente de A si ∀ε > 0, Bε (x) ∩ A 6= ∅ Al conjunto A◦ de todos los puntos interiores de A lo llamaremos interior de A y al conjunto A de todos los puntos adherentes de A lo llamaremos clausura, cierre o adherencia de A. Es claro que todo punto interior de un conjunto A es forzosamente un punto de A y que todo punto de A es un punto adherente de A. En s´ımbolos, para todo A ⊆ RN se tiene que A◦ ⊆ A ⊆ A. Pongamos nombre a los conjuntos que de hecho coinciden con su interior o con su adherencia: ´ n 1.2.4. Sea A un conjunto cualquiera de RN . Definicio Se dice que A es abierto si A = A◦ (todos los puntos de A son interiores o, expresado de otro modo, A es entorno de todos sus puntos). Se dice que A es cerrado si A = A (todos los puntos adherentes de A est´an de hecho en A).
1. TOPOLOG´IA DE RN
4
Ejemplo 1.2.5. Las bolas abiertas son conjuntos abiertos y las bolas cerradas son conjuntos cerrados de RN . Intuitivamente, los conjuntos abiertos son aquellos que no tienen frontera o borde alguno y los conjuntos cerrados son lo que contienen a toda su frontera o borde. Esto se puede expresar de un modo riguroso definiendo la frontera de un conjunto del siguiente modo: ´ n 1.2.6. Se dice que x es un punto frontera de A si Definicio ∀ε > 0, Bε (x) ∩ A 6= ∅ y Bε (x) ∩ (RN \A) 6= ∅ Denotaremos por F r(A) al conjunto de todos los puntos frontera de A. Como F r(A) = A \A◦ , es evidente que un conjunto A es abierto si y s´olo si no contiene ning´ un punto frontera y es cerrado si y s´olo si contiene a toda su frontera. En la pr´actica no se suele trabajar mucho con la frontera de un conjunto: Es mejor trabajar directamente con los conjuntos abiertos y cerrados ya que verifican unas propiedades f´aciles de formular como vemos a continuaci´on. ´ n 1.2.7. Los abiertos de RN cumplen estas propiedades: Proposicio (i) ∅ y RN son abiertos (ii) La uni´on arbitraria de abiertos es un abierto (ii) La intersecci´ on finita de abiertos es un abierto Adem´ as, un conjunto A es cerrado si y s´olo si RN \A es abierto. Por tanto, los cerrados de RN verifican las siguientes propiedades: (i) ∅ y RN son cerrados (ii) La uni´on finita de cerrados es un cerrado (ii) La intersecci´ on finita de cerrados es un cerrado ´ n 1.2.8. La familia T de todos los conjuntos abiertos de Definicio R recibe el nombre de topolog´ıa (usual ) de RN . N
Muchas de las propiedades de los conjuntos y de las funciones de RN dependen en gran medida de la topolog´ıa de RN . Por este motivo, la topolog´ıa de RN estar´a presente de uno u otro modo en la mayor´ıa de los resultados que vamos a obtener para funciones de varias variables. En este sentido, hay un tipo particular de cerrados que merecen especial atenci´on, pues (como veremos posteriormente) van a conservar alguna de las propiedades que pose´ıan los intervalos cerrados y acotados de R. ´ n 1.2.9. Sea A un conjunto cualquiera de RN Definicio Se dice que A est´a acotado si ∃M > 0 tal que kxk ≤ M , ∀x ∈ A. Se dice que A es compacto si es cerrado y acotado.
1.3. CONVERGENCIA DE SUCESIONES EN RN
5
Para terminar esta secci´on vamos a presentar dos tipos distintos de puntos adherentes que es interesante distinguir. ´ n 1.2.10. Sea A ⊆ RN y x ∈ RN . Se dice que Definicio • x es un punto aislado de A si ∃ε > 0 tal que Bε (x) ∩ A = {x} • x es un punto de acumulaci´on de A si ∀ε > 0 Bε (x)∩A\{x} 6= ∅ El conjunto de todos los puntos de acumulaci´on de A se llama conjunto derivado de A y se denota por A0 . 1.3.
Convergencia de sucesiones en RN
´ n 1.3.1 (Convergencia de una sucesi´ Definicio on en RN ). Se dice N N que una sucesi´on {xn } ⊆ R converge a l ∈ R , y notaremos xn → l si ∀ε > 0, ∃m ∈ N : ∀n ≥ m, kxn − lk < ε. Pero una sucesi´on {xn } de RN est´a formada realmente por N sucesiones de n´ umeros reales, pues cada t´ermino xn es un vector con N componentes, xn = (x1n , . . . , xN n ), por lo que cabe preguntarse si podemos caracterizar su convergencia mediante la convergencia tales sucesiones de n´ umeros reales xin , ∀i = 1, . . . , N . La respuesta es afirmativa: la convergencia en RN se puede calcular coordenada a coordenada, como pone de manifiesto el siguiente resultado: ´ n 1.3.2. xn → l ⇔ xin → li , ∀i = 1, . . . , N . Proposicio Esto simplifica mucho la situaci´on ya que reduce la nueva noci´on de convergencia a la ya conocida y ampliamente estudiada convergencia de sucesiones de n´ umeros reales (luego no necesitamos introducir ninguna t´ecnica nueva para estudiar la convergencia de las sucesiones de vectores). n Ejemplo 1.3.3. ( n1 , n+1 ) → (0, 1) en R2 porque
1 n
→0y
n n+1
→ 1.
La principal utilidad de la noci´on de convergencia de sucesiones es que permite caracterizar la topolog´ıa de RN y por tanto todos los conceptos que se pueden definir a partir de ella. A modo de ejemplo, veamos como podemos caracterizar (de un modo sencillo y elegante) los puntos adherentes y los puntos de acumulaci´on mediante sucesiones convergentes: ´ n 1.3.4. Dados A ⊆ RN y x ∈ RN , se cumple que: Proposicio (i) x ∈ A ⇔ ∃{xn } ⊆ A, xn → x. (ii) x ∈ A0 ⇔ ∃{xn } ⊆ A, xn 6= x, ∀n ∈ N, xn → x. En particular, A es cerrado si y solo si contiene el l´ımite de cualquier sucesi´ on convergente de elementos de A.
CAP´ıTULO 2
L´IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES El objetivo de los dos pr´oximos cap´ıtulos consiste en definir y estudiar las principales propiedades de las funciones f : A ⊆ RN −→ RM . Para ello, procederemos del siguiente modo: Vamos a trabajar principalmente con funciones f : A ⊆ RN −→ R, definiendo los distintos conceptos o propiedades para ellas, ya que las funciones F : A ⊆ RN −→ RM est´an caracterizadas por sus M funciones coordenadas o componentes fi : A ⊆ RN −→ R, ∀i = 1, . . . , M que verifican que F (x) = (f1 (x), . . . , fM (x)), ∀x ∈ RN , por lo que notaremos F = (f1 , . . . , fM ). Por lo tanto, podremos extender la mayor´ıa de los conceptos y propiedades a funciones F : A ⊆ RN −→ RM a trav´es de sus funciones coordenadas o componentes: Diremos que F presenta una cierta condici´on o propiedad si y solo si todas sus funciones coordenadas fi , con i = 1, . . . , M , la cumplen. ´ n 2.0.5. El dominio de una funci´on f : A ⊆ RN −→ Observacio RM es el conjunto A donde est´a definida la funci´on. Siempre podremos restringirnos a un dominio B m´as peque˜ no (en el sentido de contenido en A) sin m´as que considerar que la funci´on f act´ ua tan s´olo sobre los puntos de B (en tal caso, se suele decir que trabajamos con la restricci´ on de f a B o que f est´a restringida al conjunto B y se denota por f |B ). Ahora bien, si no se expresa un dominio A de manera expl´ıcita, se entiende que ´este es el m´as grande posible, esto es, el conjunto A de RN donde la expresi´on f (x) tiene sentido ln(xy) Ejemplo 2.0.6. Calcular el dominio de f (x, y) = p 1 − x2 − y 2 ´ n 2.0.7. El rango o la imagen de una funci´on f : A ⊆ Observacio RN −→ RM es el conjunto f (A) de los valores que toma la funci´on, esto es, los puntos del espacio de llegada, y ∈ RM , que son la imagen y = f (x) de alg´ un x ∈ A. 7
8
2. L´IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES
2.1.
L´ımite de una funci´ on de varias variables
´ n 2.1.1. Sean A ⊆ RN , a ∈ A0 , l ∈ R, L = (l1 , . . . , lM ), Definicio f : A ⊆ RN −→ R y F : A ⊆ RN −→ RM con F = (f1 , . . . , fM ). Se dice que f tiene l´ımite l en el punto a, y se nota l´ım f (x) = l, si x→a
∀ε > 0, ∃δ > 0 : 0 < kx − ak < δ ⇒ |f (x) − l| < ε. Se dice que F tiene l´ımite L en el punto a, y notaremos igualmente l´ım F (x) = L, si fi tiene l´ımite li en el punto a, o sea, que el l´ımite de x→a una funci´on vectorial se calcula componente a componente: ³ ´ l´ım F (x) = l´ım f1 (x), . . . , l´ım fM (x) . x→a
x→a
x→a
´ n 2.1.2. Para hablar de l´ımite de una funci´on f en un Observacio punto a no es necesario que la funci´on f est´e definida en tal punto: basta con que a sea un punto de acumulaci´on del dominio A de f (es decir que podamos acercarnos al punto mediante una sucesi´on de otros puntos de A que no sean el propio a). De hecho se puede dar una definici´on equivalente del concepto de l´ımite de una funci´on f en a mediante sucesiones del siguiente modo: l´ım f (x) = l ⇔ ∀{xn } ⊆ A con xn 6= a, ∀n ∈ N y xn → a, f (xn ) → l.
x→a
la cual deja mucho m´as claro la necesidad de que a sea un punto de acumulaci´on de A para que la definici´on de l´ımite no sea vac´ıa. ´ n 2.1.3. La notaci´on l´ım f (x) = l encierra realmente Observacio x→a dos afirmaciones: que ese l´ımite realmente existe, o sea, que es un n´ umero real, y que tal l´ımite es, en concreto, el valor l. Para enfatizar este hecho a menudo escribiremos ∃ l´ım f (x) = l, o s´olo ∃ l´ım f (x) si x→a x→a no sabemos o no los interesa el valor de ese l´ımite. ´ n 2.1.4 (unicidad del l´ımite). Se puede probar Observacio f´acilmente que, el l´ımite de una funci´on en un punto a, si existe, es u ´nico. En s´ımbolos: Si l´ım f (x) = l y l´ım f (x) = l0 entonces l = l0 . x→a
x→a
´ n 2.1.5 (a ´ lgebra de l´ımites). Sean f y g dos funProposicio N M ciones de A ⊆ R en R y a ∈ A0 . (i) l´ım (f +g)(x) = l´ım f (x)+ l´ım g(x), si ∃ l´ım f (x) y ∃ l´ım g(x) x→a
x→a
x→a
x→a
x→ a
(ii) l´ım (f g)(x) = l´ım f (x) l´ım g(x), si ∃ l´ım f (x) y ∃ l´ım g(x) x→a
x→a
l´ım f (x)
x→a
x→a
f (x) x→a , si ∃ l´ım f (x) y ∃ l´ım g(x) 6= 0 x→a x→ a x→a g l´ım g(x)
(iii) l´ım
x→a
x→ a
´ ´ ´ 2.2. ALGUNAS TECNICAS Y METODOS PARA EL CALCULO DE L´IMITES 9
2.2.
Algunas t´ ecnicas y m´ etodos para el c´ alculo de l´ımites
2.2.1. L´ımites por caminos y l´ımites direccionales: En R, para acercarnos a un punto a podemos hacerlo de tres maneras: Podemos movernos s´olo por puntos situados a la izquierda de a, hacerlo s´olo por puntos situados a la derecha de a o hacerlo por ambos lados del punto a. Cuando calculamos el l´ımite de una funci´on real de variable real, estas distintas formas de acercarse a un punto conducen a los conceptos de l´ımite por la izquierda, por la derecha y l´ımite (global) de la funci´on en a y sabemos que la existencia del l´ımite de la funci´on en un punto a es equivalente a que ambos l´ımites laterales existan y tomen el mismo valor real. En RN podemos acercarnos a un punto a de muchas m´as formas. En general, si f : A ⊆ RN −→ RM y a ∈ A, podemos acercarnos al punto a a trav´es de cualquier subconjunto B ⊆ A tal que a ∈ B 0 . En estas condiciones vamos a denotar por l´ ım f (x) := l´ım f |B (x) x→a
x∈B
x→a
esto es, al l´ımite de f cuando x tiende a a pero movi´endonos s´olo a trav´es de los puntos de B. Con esta notaci´on es claro que l´ım f (x) = l ⇒ l´ ım f (x) = l x→a
x→a
x∈B
o sea, que “si existe el l´ımite de f cuando x tiende a a existe entonces existe el l´ımite de f cuando x tiende a a a trav´es de cualquier subconjunto suyo y adem´as coincide con ´el”. Esta ingenua afirmaci´on es una herramienta muy u ´til para comprobar que ciertas funciones no tienen l´ımite en un punto o para obtener el u ´nico candidato a l´ımite posible. Los l´ımites a trav´es de subconjuntos se usan sobre todo tomando como conjunto B ciertos caminos en RN que conducen hacia el punto a, como por ejemplo las rectas que pasan por a. Estos u ´ltimos reciben el nombre de l´ımites direccionales de f en a y para funciones de dos variables son especialmente f´aciles de calcular ya que se reducen a l´ımites de funciones reales de variable real. Su doble uso se resume brevemente de la siguiente manera: (1o ) Si existen los l´ımites direccionales de f en a y no son todos iguales, entonces f no tiene l´ımite en a (2o ) Si todos los l´ımites direccionales de f en a son iguales a l, entonces l es el u ´nico candidato admisible a l´ımite (o sea, el l´ımite de f en a, si existe, es a la fuerza l)
10 2. L´IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES
El siguiente ejemplo muestra la utilidad de los l´ımites direccionales para probar la no existencia de l´ımite de una funci´on en un punto. Ejemplo 2.2.1. La funci´on f (x, y) :=
xy x2 +y 2
no tiene l´ımite en (0, 0)
Sin embargo, el que todos los l´ımites direccionales de f en un punto a sean iguales no significa que la funci´on tenga l´ımite (global) como pone de manifiesto el siguiente ejemplo Ejemplo 2.2.2. Todos los l´ımites direccionales en (0, 0) de la fun3 ci´on f (x, y) = x2x−y valen 0 y sin embargo f no tiene l´ımite en (0, 0). 2.2.2. L´ımites reiterados: Se llaman l´ımites reiterados de una funci´on f de dos variables en un punto (a, b) a los limites dobles ³ ´ ³ ´ l´ım l´ım f (x, y) y l´ım l´ım f (x, y) x→a
x→b
x→b
x→a
donde se entiende que en el l´ımite interior s´olo se mueve una variable y la otra se trata como si fuese constante. Cabe preguntarse ¿qu´e relaci´on existe entre el l´ımite (global) de la funci´on f en (a, b) y sus l´ımites reiterados? El siguiente resultado establece la u ´nica relaci´on general entre esos valores. ´ n 2.2.3. Si existe Proposicio
l´ım
(x,y)→(a,b)
f (x, y) = l y existen los
l´ımites reiterados, entonces l´ım l´ım f (x, y) = l´ım l´ım f (x, y) = l. x→a x→b
x→b x→a
Por tanto, podemos usar los l´ımites reiterados de este modo: (1o ) Si l´ım l´ım f (x, y) 6= l´ım l´ım f (x, y) ⇒ f no tiene l´ımite en a x→a x→b
x→b x→a
x→a x→b
x→b x→a
(2o ) Si l´ım l´ım f (x, y) = l´ım l´ım f (x, y) = l ⇒ l es el u ´nico candidato admisible a l´ımite Un ejemplo de uso t´ıpico del primer caso es el siguiente: Ejemplo 2.2.4. La funci´on f (x, y) :=
x2 −y 2 x2 +y 2
no tiene l´ımite en (0, 0)
No obstante, ejemplos sencillos ponen de manifiesto que la igualdad de los l´ımites reiterados no garantiza la existencia de l´ımite (global) de la funci´on: Ejemplo 2.2.5. La funci´on f (x, y) := x2xy no tiene l´ımite en (0, 0) +y 2 como ya sabemos y sin embargo sus limites reiterados valen ambos 0. Por otra parte tambi´en es importante se˜ nalar que si no existe alguno (o ninguno) de los l´ımites reiterados tampoco podemos asegurar nada: ½ y x≥0 Ejemplo 2.2.6. La funci´on f (x, y) := tiene l´ımite 0 −y x < 0 cuando (x, y) → (0, 0) pero no existe el l´ım f (x, y) para ning´ un y 6= 0. x→0
´ DE VARIAS VARIABLES 2.4. CONTINUIDAD DE UNA FUNCION
11
Ejemplo 2.2.7. La funci´on f (x, y) := x sen( y1 ) + y cos( x1 ) tiene l´ımite 0 cuando (x, y) → (0, 0) y sin embargo no existen ninguno de los dos l´ımites reiterados en (0, 0). 2.2.3. L´ımites en polares: Podemos calcular el l´ımite de una funci´on f (x, y) de dos variables en el punto (0, 0) haciendo el cambio a coordenadas a polares ½ x = r cos θ y = r sen θ Teniendo en cuenta que (x, y) → (0, 0) equivale a r → 0, ∀θ ∈]0, 2π[, l´ım
(x,y)→(0,0)
f (x, y) = l´ım f (r cos θ, r sen θ), ∀θ ∈]0, 2π[ r→0
luego para que ese l´ımite exista no puede depender de θ. Ejemplo 2.2.8. Calcular mediante el cambio a coordenadas polares xy x2 y l´ım y l´ ım (x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2 2.3.
L´ımites en el infinito y funciones divergentes
Si f : RN −→ R, a ∈ RN y l ∈ R tambi´en se pueden definir los l´ımites en el infinito y las funciones divergentes en un punto a o el infinito del siguiente modo: • l´ım f (x) = l ⇔ ∀ε > 0, ∃M > 0 : kxk > M ⇒ |f (x) − l| < ε. x→∞
• l´ım f (x) = ∞ ⇔ ∀K > 0, ∃δ > 0 : kx − ak < δ ⇒ |f (x)| > K. x→a
• l´ım f (x) = ∞ ⇔ ∀K > 0, ∃M > 0 : kxk > M ⇒ |f (x)| > K. x→∞
´ n 2.3.1. Notese que para x ∈ RN , la expresi´on x → Observacio ∞ significa realmente que ||x|| → ∞ (o sea que cubrimos todas las direcciones posibles de RN ). 2.4.
Continuidad de una funci´ on de varias variables
´ n 2.4.1. Sean A ⊆ RN , a ∈ A, f : A ⊆ RN −→ R y Definicio N F : A ⊆ R −→ RM con F = (f1 , . . . , fM ). Se dice que f es continua en el punto a si verifica lo siguiente: ∀ε > 0, ∃δ > 0 : kx − ak < δ ⇒ |f (x) − f (a)| < ε Se dice que F es continua en el punto a si fi es continua en el punto a, ∀i = 1, . . . , M (equivalentemente: ∀ε > 0, ∃δ > 0 : kx − ak < δ ⇒ kf (x) − f (a)k < ε). Adem´as, diremos que f (o F ) es continua en A si y solo si lo es para todo punto a ∈ A.
12 2. L´IMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES
´ n 2.4.2. La continuidad de f (y de F ) se puede definir Observacio tambi´en equivalentemente mediante sucesiones del siguiente modo: f es continua en a ⇔ ∀{xn } ⊆ A con xn → a, f (xn ) → f (a). Ejemplo 2.4.3. Demuestre, haciendo uso de la definici´on de continuidad, que la norma es una aplicaci´on continua de RN en R (pruebe que | kxk − kyk | ≤ kx − yk, ∀x, y ∈ RN ) y que toda aplicaci´on lineal de RN en RM es continua. A la vista de esta definici´on, la relaci´on entre los conceptos de continuidad y l´ımite es casi inmediata: ´ n 2.4.4. Sean A ⊆ RN , a ∈ A y f : A ⊆ RN −→ RM . Proposicio (i) Si a es un punto aislado de A entonces f es continua en a. (ii) Si a ∈ A0 , f es continua en a si y solo si ∃ l´ım f (x) = f (a). x→a
Puesto que ya sabemos que los l´ımites (cuando existen) se comportan bien con las operaciones algebraicas tenemos, en particular que las sumas, productos y cocientes (por funciones no nulas) de funciones continuas son funciones continuas. Adem´as la composici´on de funciones continuas es tambi´en una funci´on continua. Por tanto, todas las sumas, productos, exponenciales y logaritmos de funciones polin´omicas en varias variables (por ejemplo, x, xy, x3 y + 2x2 , cos x, sin(x + y), exp(2x + y), ln(x2 + y 2 ), . . .) son funciones continuas. El u ´nico problema que se nos puede presentar es cuando una funci´on f esta definida de distinta forma en distintas regiones del dominio. En esta situaci´on f puede coincidir con una continua en una de tales regiones, pero eso solo nos dice que f , restringida a ese subconjunto del dominio, es continua. El siguiente resultado puede sernos muy u ´til para garantizar la continuidad de f en esa situaci´on, pues afirma que la continuidad de una funci´on en un punto es una propiedad local: la continuidad en un punto a s´ olo depende de los puntos que hay en un entorno de a. ´ n 2.4.5 (cara ´ cter local de la continuidad). Proposicio N ◦ Sean A ⊆ R , a ∈ A y f : A ⊆ RN −→ RM . (i) Si f |Ba (ε) es continua en a, entonces f es continua en a. (ii) Si B ⊆ A, B abierto, f |B es continua en B, entonces f es continua en B. ½ x2 y (x, y) 6= (0, 0) x2 +y 2 Ejemplo 2.4.6. f (x, y) := es continua 0 (x, y) = (0, 0)
´ DE VARIAS VARIABLES 2.4. CONTINUIDAD DE UNA FUNCION
13
Recordemos que para funciones f reales de variable real sabemos que la imagen mediante una funci´on continua de un intervalo compacto es un intervalo compacto. Para funciones de varias variables la propiedad que se verifica, en general, es que la imagen mediante una funci´ on continua de una conjunto compacto es un compacto, esto es, Teorema 2.4.7 (propiedad de compacidad). Sea A ⊆ RN . Si f : A −→ RM es una funci´on continua y A es compacto, entonces f (A) es compacto. Este resultado nos dice, en particular, que las funciones reales de varias variables sobre compactos siguen teniendo m´aximo y m´ınimo absoluto. Corolario 2.4.8 (teorema de Weierstrass). Sea A ⊆ RN . Si f : A −→ R es continua y A es compacto, entonces f alcanza su m´ aximo y su m´ınimo en A. Acabamos de asegurar que las funciones continuas transforman compactos en compactos. No ocurre lo mismo con los abiertos ni con los cerrados: Una funci´on continua puede trasformar abiertos en conjuntos que no sean abiertos y cerrados en conjuntos que no sean cerrados (incluso una funci´on real de variable real). Lo que ocurre en realidad es que es la imagen inversa de una funci´on continua la que se comporta bien con los abiertos y con los cerrados. De hecho podemos caracterizar las funciones continuas mediante esa propiedad del siguiente modo: Teorema 2.4.9. Sea f : A ⊆ RN −→ RM . (i) f es continua si y solo si f −1 (E) es un abierto de RN cortado con A para todo E abierto de RM . (ii) f es continua si y solo si f −1 (F ) es un cerrado de RN cortado con A para todo F cerrado de RM . Sin embargo esta caracterizaci´on de la continuidad se suele usar m´as en el sentido contrario que para estudiar la continuidad de una funci´on dada: Se suele emplear para probar que ciertos conjuntos (definidos mediante una funci´on continua de sus coordenadas) son abiertos o cerrados. Por ejemplo, se puede ver de este modo que las bolas abiertas son conjuntos abiertos, pues se pueden expresar como Ba (ε) = {x ∈ RM : kx − ak < ε} = f −1 ( ] − ∞, ε[ ), siendo f la funci´on f : RN −→ R dada por f (x) := kx − ak que es claramente continua.
CAP´ıTULO 3
´ DE FUNCIONES DE DIFERENCIACION VARIAS VARIABLES 3.1.
Derivadas parciales y derivadas direccionales
Pretendemos extender la noci´on de derivabilidad de una funci´on f : R −→ R a funciones de varias variables. Recordemos que f es derivable en un punto a si existe el siguiente l´ımite (expresado de cualquiera de estas dos formas equivalentes): f (a + h) − f (a) f (x) − f (a) = l´ım . x→a h→0 h x−a Si tenemos ahora una funci´on f : A ⊆ RN −→ R, el modo m´as sencillo de proceder es intentar reducirnos al caso unidimensional, considerando la funci´on f como si fuese una funci´on de una u ´nica variable, es decir, manteniendo fijas todas las variables menos una. Esto nos conduce al concepto de derivada parcial de una funci´on de varias variables f 0 (a) = l´ım
´ n 3.1.1. Sea f : A ⊆ RN −→ R, a ∈ A0 , a = (a1 , . . . , aN ). Definicio Se dice que f es derivable (parcialmente) en a con respecto a la variable xi , para i = 1, . . . , N , si existe el siguiente l´ımite ∂f f (a1 , . . . , ai + h, . . . , aN ) − f (a1 , . . . , a2 ) (a) := l´ım h→0 ∂xi h que llamaremos derivada parcial de f en a respecto a xi . ∂f es la Si no se expresa un punto a concreto se entiende que ∂x i ∂f funci´on de varias variables ∂xi (x) definida en todos los puntos x ∈ R en los cuales f es derivable con respecto a xi . Para N = 2, las derivadas parciales de f en a = (a1 , a2 ) quedan as´ı: f (a1 + h, a2 ) − f (a1 , a2 ) ∂f (a1 , a2 ) = l´ım h→0 ∂x h ∂f f (a1 , a2 + h) − f (a1 , a2 ) (a1 , a2 ) = l´ım h→0 ∂y h ´ n 3.1.2. Si definimos las funciones reales de variable Observacio real u y v como u(x) := f (x, a2 ) y v(y) := f (a1 , y), es claro que las 15
16
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
parciales de f no son otra cosa que las derivadas de u y v en a2 y a1 , respectivamente, pues ∂f u(a1 + h) − u(a1 ) (a1 , a2 ) = l´ım = u0 (a1 ) h→0 ∂x h ∂f v(a2 + h) − v(a2 ) (a1 , a2 ) = l´ım = v 0 (a2 ) h→0 ∂x h Por lo tanto, podemos calcular las derivadas parciales de f derivando las funciones reales de variable real u y v. Pero u y v no son otra cosa que f cuando se fija una de sus variables, luego lo que estamos diciendo es que podemos calcular las parciales de f derivando f como si s´olo dependiese de una variable y la otra fuese constante. Lo bueno de este procedimiento es que nos permite usar todos las t´ecnicas que ya conocemos para derivar funciones reales de variable real a la hora de calcular derivadas parciales, lo que facilita enormemente su c´alculo. Ejemplo 3.1.3. Para f (x, y) = x2 y + 2xy 3 + 4x, se tiene que = 2xy + 2y 3 + 4 y ∂f (x, y) = x2 + 6xy 2 , ∀(x, y) ∈ R2 ∂y
∂f (x, y) ∂x
El problema que presenta el concepto de derivada parcial es que la existencia de todas las derivadas parciales de una funci´on f en un punto no garantiza la continuidad de f en tal punto, luego el concepto de derivada parcial no generaliza adecuadamente al de derivabilidad de funciones reales de variable real ya que no conserva una de sus principales propiedades. ½ 1 si x = 0 ´o y = 0 Ejemplo 3.1.4. f (x, y) := en (0, 0). 0 si x 6= 0 e y 6= 0 Este mal comportamiento de las derivadas parciales de una funci´on f se debe a que las derivadas parciales nos dan s´olo una visi´on parcial de la funci´on. En concreto, las derivadas parciales de f en a nos proporcionan la pendiente de la recta tangente a la gr´afica de f en las direcciones de las variables y eso, en general, no nos dice nada del comportamiento global de la funci´on en un entorno del punto a. Esta idea de derivar en la direcci´on de las variables se puede generalizar a cualquier vector de RN del siguiente modo: ´ n 3.1.5. f : A ⊆ RN −→ R, a ∈ A0 , v ∈ RN (kvk = 1). Definicio Se dice que f es derivable en a seg´ un el vector v si existe el siguiente l´ımite f (a + hv) − f (a) ∂f (a) := l´ım Dv f (a) = h→0 ∂v h que llamaremos derivada (direccional) de f en a seg´ un (la direcci´ on del vector) v.
3.2. DIFERENCIAL Y GRADIENTE
3.2.
17
Diferencial y gradiente de una funci´ on real de varias variables. Relaci´ on e interpretaci´ on geom´ etrica
Como la existencia de todas las derivadas direccionales de una funci´on en un punto no implica la continuidad de la funci´on en dicho punto, el concepto de derivada direccional no extiende satisfactoriamente el caso real. Por ello vamos a introducir un nuevo concepto, el de diferencial de una funci´on de varias variables, que si extiende el concepto de derivada adecuadamente, esto es, conservando sus principales propiedades. La noci´on de diferenciabilidad surge de manera natural a partir de la siguiente reformulaci´on de la derivabilidad de funciones de reales de variable real f : A ⊆ R −→ R: f es derivable en a ⇔ f 0 (a) = f (a + h) − f (a) f (a + h) − f (a) − f 0 (a)h l´ım ⇔ l´ım = 0 ⇔ existe h→0 h→0 h h una aplicaci´on lineal D : R −→ R, dada por D(h) = f 0 (a)h, tal que f (a + h) − f (a) − D(h) l´ım 0. h→0 h ´ n 3.2.1. Sea A ⊆ RN abierto, f : A ⊆ RN −→ R, a ∈ A. Definicio Se dice que f es diferenciable en el punto a si existe una aplicaci´on lineal (necesariamente u ´nica por ser A abierto) que denotaremos por df (a) o Df (a) y llamaremos diferencial de f en a , tal que f (a + h) − f (a) − df (a)(h) l´ım = 0. h→0 khk ´ n 3.2.2. N´otese que aqu´ı h = (h1 , h2 , . . . , hN ) es un Observacio incremento para cada una de las variables de f , es decir, que estamos moviendo todas las variables de f (a diferencia de lo que hemos estado haciendo hasta ahora, donde la h era un n´ umero real). En primer lugar veamos que la diferenciabilidad es un concepto m´as fuerte, m´as restrictivo, que el de la derivabilidad seg´ un cualquier vector y por tanto que la derivabilidad parcial. Teorema 3.2.3 (conds. necesarias de diferenciabilidad). Si f es diferenciable en a entonces f es derivable en a seg´ un cualquier vector v ∈ RN con Dv f (a) = df (a)(v). En particular, si f es diferenciable en a entonces existen todas las derivadas parciales de f en a y ∂f (a) = df (a)(ei ), ∀i = 1, . . . , N, ∂xi siendo {e1 , . . . , eN } la base can´ onica de RN .
18
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
El resultado anterior nos dice en particular que la existencia de derivadas parciales (y en general, de cualquier derivada direccional) de una funci´on en un punto es una condici´ on necesaria para que la funci´on pueda ser diferenciable en ese punto. Pero a´ un podemos extraer m´as informaci´on del resultado anterior: Como la diferencial de una funci´on f sobre la base can´onica est´e dada por las parciales de de f se deduce inmediatamente que las derivadas parciales de f determinan a la diferencial de f de la siguiente manera Corolario 3.2.4. Si f es diferenciable en a entonces la diferencial de f en a es la aplicaci´ on lineal de RN en R dada por ∂f ∂f df (a)(x1 , . . . , xN ) = (a) x1 + · · · + (a) xN . ∂x1 ∂xN ´ n 3.2.5. A menudo (sobre todo, cuando la diferencial Observacio se calcula en un punto arbitrario x de RN ) se usa como variable de df (x) el vector dx = (dx1 , . . . , dxN ) pues se entiende que la diferencial de f en x act´ ua sobre un incremento dx de la variable x. Con esta notaci´on la diferencial quedar´ıa expresada del siguiente modo: ∂f ∂f df (x)(dx1 , . . . , dxN ) = (x) dx1 + · · · + (x) dxN ∂x1 ∂xN o m´as abreviadamente (omitiendo todas las variables para simplificar la notaci´on), ∂f ∂f df = dx1 + · · · + dxN . ∂x1 ∂xN ´ n 3.2.6. Sea A ⊆ RN abierto, a ∈ A0 y f : A ⊆ RN −→ R Definicio parcialmente derivable en a con respecto a xi , ∀i = 1, . . . , N . Se llama vector gradiente de f en a al siguiente vector de RN ¶ µ ∂f ∂f (a), . . . , (a) ∇f (a) := ∂x1 ∂xN Corolario 3.2.7. El vector gradiente de una funci´on f diferenciable en un punto a es la matriz asociada a la diferencial de f en a respecto de las bases can´onicas de RN y R. Por tanto, la diferencial de f en a act´ ua as´ı ¶ x1 µ ∂f ∂f (a), . . . , (a) ... df (a)(x1 , . . . , xN ) = ∂x1 ∂xN xN lo cual tambi´en se puede interpretar como el producto escalar del vector gradiente ∇f (a) por el vector (x1 , . . . , xN ), esto es df (a)(x) = ∇f (a) · x, ∀x ∈ RN .
3.2. DIFERENCIAL Y GRADIENTE
19
Por tanto, las derivadas parciales de una funci´on f me dan toda la informaci´on que necesito para poder estudiar la diferenciabilidad de tal funci´on, ya que (1o ) Si no existe alguna derivada parcial de f en un punto a entonces f no es diferenciable en ese punto. (2o ) Si existen todas las derivadas parciales de f en a entonces tenemos la u ´nica aplicaci´on lineal D candidata a ser la df (a): ∂f ∂f la dada por D(x1 , . . . , xN ) = ∂x (a) x1 + · · · + ∂x (a) xN . 1 N Adem´as, las derivadas direccionales permiten dar una interesante interpretaci´on geom´etrica del vector gradiente: Como Dv f (a) = df (a)(v) = ∇f (a) · v, ∀v ∈ RN , tenemos que Dv f (a) = k∇f (a)kkvk cos θ, siendo θ el ´angulo entre ∇f (a) y v, de lo que se deducen las siguientes consecuencias: Corolario 3.2.8. Sea A ⊆ RN abierto, f : A ⊆ RN −→ R, a ∈ A. ∀v ∈ RN con kvk = 1 se tiene que −k∇f (a)k ≤ Dv f (a) ≤ k∇f (a)k (las derivadas direccionales de la funci´on est´an acotadas por la norma del gradiente). Adem´ as, ∇f (a) (i) Dv f (a) = k∇f (a)k ⇔ v = (La derivada direccional k∇f (a)k m´ axima se alcanza s´olo en la direcci´ on del gradiente). ∇f (a) (ii) Dv f (a) = −k∇f (a)k ⇔ v − (La derivada direck∇f (a)k cional m´ınima se alcanza s´ olo en la direcci´ on opuesta). (iii) Dv f (a) = 0 ⇔ v ⊥ ∇f (a) (La derivada direccional se anula u ´nicamente en la direcci´ on perpendicular a la del gradiente). Por lo tanto, (1o ) El vector gradiente los proporciona la direcci´on de m´aximo crecimiento del la funci´on. o (2 ) La direcci´on opuesta a la del gradiente es la direcci´on de m´aximo decrecimiento de la funci´on. o (3 ) La direcci´on perpendicular a la del gradiente es la de m´ınima variaci´on de la funci´on. (De hecho, el gradiente es un vector perpendicular a las curvas de nivel de la funci´on). Ejemplo 3.2.9. Sea T (x, y) = 100 − x2 − y 2 la temperatura de una placa con un foco de calor en el punto (0, 0) y supongamos que una part´ıcula se encuentra en le punto (1, 1). ¿En que direcci´on debe
20
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
moverse la part´ıcula sobra la placa para hacerlo sobre la mayor temperatura posible?, ¿y la menor?, ¿y para que su temperatura var´ıa lo menos posible? Por otra parte, la diferenciabilidad de una funci´on si conserva una propiedad fundamental de la derivabilidad de funciones reales de variable real, pues la continuidad de una funci´on es tambi´en una condici´on necesaria para la diferenciabilidad de tal funci´on. Teorema 3.2.10 (2a cond. necesaria de diferenciabilidad). Si una funci´on f es diferenciable en a entonces f es continua en a. De hecho, lo u ´nico que le falta a una funci´on continua en un punto a para ser diferenciable es que se pueda aproximar en un entorno del punto a mediante una funci´on af´ın. Esto es lo que afirma el siguiente resultado, el cual nos proporciona la interpretaci´on geom´etrica de la diferenciaci´on de funciones de varias variables. Teorema 3.2.11. Las siguientes afirmaciones son equivalentes: (i) f es diferenciable en a. (ii) f es continua en a y existe una aplicaci´ on af´ın g : RN −→ R f (x) − f (a) tal que l´ım = 0. x→a x−a Adem´ as, en tal caso, g es forzosamente la aplicaci´ on dada por g(x) := f (a) + ∇f (a) · (x − a), ∀x ∈ RN . ´ n geome ´trica de la dif.). Corolario 3.2.12 (interpretacio N Sea A ⊆ R abierto, f : A −→ R y a ∈ A con a = (a1 , . . . , aN ). La gr´afica de la aplicaci´ on g del teorema anterior, esto es el conjunto {(x1 , . . . , xN , xN +1 ) : xN +1 = g(x1 , . . . , xN )}, es el hiperplano de RN +1 dado por la ecuaci´ on xN +1 = f (a) +
∂f ∂f (a) (x1 − a1 ) + · · · + (a) (xN − aN ) ∂x1 ∂xN
que, evidentemente, pasa por el punto (a1 , . . . , an , f (a)) de RN +1 . Si f es diferenciable en a este hiperplano recibe el nombre de hiperplano tangente a la gr´afica de f en a, ya que es el que mejor aproxima a la gr´afica de f en un entorno de a. Para N = 1, se trata de la (ya conocida) recta tangente a la gr´afica y = f (x) en a: y = f (a) + f 0 (a)(x − a)
3.3. DIFERENCIAL Y MATRIZ JACOBIANA
21
Para N = 2, lo que nos queda es la ecuaci´ on del plano tangente a la gr´afica z = f (x, y) en (a1 , a2 ): z = f (a) +
∂f ∂f (a) (x − a1 ) + (a) (y − a2 ) ∂x ∂y
Ejemplo 3.2.13. Determinar el plano tangente a la gr´afica de f (x, y) = x2 + y 2 en el punto (1, 1). Hasta ahora hemos estado viendo condiciones necesarias para la diferenciabilidad de una funci´on que se pueden usar para probar que una funci´on no es diferenciable en un punto pero no para comprobar que sea diferenciable. A continuaci´on vamos a presentar una sencilla condici´on suficiente para la diferenciabilidad que evita tener que recurrir a la definici´on de diferenciabilidad en muchos casos. ´ n 3.2.14. Sea A ⊆ RN abierto y f : A −→ R. Se dice Definicio que f es de clase C 1 en A, y se nota f ∈ C 1 (A), si existen todas las derivadas parciales de f en A y son continuas. Teorema 3.2.15 (cond. suficiente de diferenciabilidad). Si f es de clase C 1 en A entonces f es diferenciable en A. Sin embargo el rec´ıproco del teorema anterior no es cierto en general, es decir que no todas las funciones diferenciables son de clase C 1 , como pone de manifiesto el siguiente ejemplo. Ejemplo 3.2.16. La funci´on f definida por ( (x2 + y 2 ) sin √ 21 2 (x, y) 6= (0, 0) x +y f (x, y) = 0 (x, y) = (0, 0) es diferenciable en todo R2 y sin embargo sus derivadas parciales no son continuas en el punto (0, 0). 3.3.
Diferencial y matriz jacobiana de una funci´ on vectorial de varias variables. Regla de la cadena
´ n 3.3.1. Sea A ⊆ RN abierto, a ∈ A y F : A −→ RM , Definicio F = (f1 , . . . , fM ). Se dice que F es diferenciable en a si todas sus funciones coordenadas fi lo son y, en tal caso, la diferencial de F en a es la aplicaci´on lineal dF (a) : (df1 , . . . , dfM ).
22
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
´ n 3.3.2. Sea A ⊆ RN abierto, a ∈ A y F : A −→ RM , Definicio F = (f1 , . . . , fM ). Se llama matriz jacobiana de f en a a la matriz ∂F1 ∂F1 (a) · · · ∂x (a) ∂x1 N .. .. JF (a) := . . ∂FM (a) ∂x1
···
∂FM (a) ∂xN
y su determinante se denomina determinante jacobiano de f en a. ´ n 3.3.3. Tambi´en se emplea la notaci´on F 0 (a) para la Observacio matriz jacobiana de F en a, ya que si f es una funci´on real de variable real (esto es M = N = 1) la matriz jacobiana f 0 (a) queda la matriz de orden 1, (f 0 (a)). Teorema 3.3.4. La matriz Jacobiana de F en a es la matriz asociada a la diferencial de F en a respecto de las bases can´ onicas de RN y RM . Por tanto, dF (a)(x) = F 0 (a) · x, esto es, la dF (a) act´ ua as´ı: ∂F1 ∂F1 (a) · · · ∂x (a) x1 ∂x1 N .. .. .. dF (a)(x1 , . . . , xM ) = . . . ∂FM (a) ∂x1
···
∂FM (a) ∂xN
xN
Ejemplo 3.3.5. La matriz jacobiana de F (x, y) = (x2 + y, exy ) es µ ¶ 2x 1 JF (x, y) = yexy xexy Teorema 3.3.6 (regla de la cadena). Sean A ⊆ RN , B ⊆ RM abiertos, f : A −→ RM , g : B −→ RP con f (A) ⊆ B y a ∈ A. Si f es diferenciable en a y g es diferenciable en f (a) entonces h := g ◦ f es diferenciable en a con dh(a)dg(f (a)) ◦ df (a). Por tanto, matricialmente, Jh(a) = Jg(f (a)) · Jf (a), esto es ∂h1 ∂g1 ∂f1 ∂g1 ∂f1 ∂h1 · · · · · · · · · ∂y1 ∂yM ∂x1 ∂xN ∂x1 ∂xN .. .. = .. .. .. .. . . . . . . ∂hP ∂hP ∂gP ∂fM ∂gP ∂fM · · · ∂xN · · · ∂yM · · · ∂xN ∂x1 ∂y1 ∂x1 donde la primera y la u ´ltima de esas matrices est´an evaluadas en el punto a mientras que la de en medio se eval´ ua en f (a). As´ı pues, para todo i = 1, . . . , P y para todo j = 1, . . . , N , se tiene la siguiente relaci´ on entre las derivadas parciales de la composici´ on y las de las funciones que se componen: M
X ∂gi ∂fk ∂hi (a) = (f (a)) (a) ∂xj ∂y ∂x k j k=1
3.3. DIFERENCIAL Y MATRIZ JACOBIANA
23
Cuando la regla de la cadena se aplica en todo el dominio de las funciones involucradas se puede interpretar del siguiente modo: Estamos realizando un cambio de variables y = f (x), esto es y1 = f1 (x1 , . . . , xN ) .. .. . . yM = fM (x1 , . . . , xN ) en la funci´on g(y1 , . . . yM ), de manera que al sustituir se obtiene una nueva funci´on g(f1 (x), . . . , fM (x)) que ya s´olo depende de las variables x = (x1 , . . . , xN ), y queremos calcular las derivadas parciales de esta u ´ltima funci´on a partir de las parciales de la funci´on original g y las parciales de la funci´on del cambio de variable f . Por este motivo se suelen hacer las siguientes simplificaciones que facilitan mucho su expresi´on y comprensi´on: (1o ) Se omiten los puntos a y f (a) donde se aplican las parciales. (2o ) Las funciones coordenadas fk del cambio de variable f se denotan igual que las variables de g, esto es se entiende que f es el cambio de variables y1 = y1 (x1 , . . . , xN ) .. .. . . yM = yM (x1 , . . . , xN ) (3o ) La composici´on h se sigue denotando como la funci´on g pero ahora directamente como funci´on de las variables (x1 , . . . , xN ) despu´es de haber realizado el cambio de variables. Es decir que la funci´on g(y) de las variables y = (y1 , . . . , yM ) (antes del cambio de variables) se puede ver tambi´en como funci´on g(x) de las variables x = (x1 , . . . , xN ) directamente (despu´es de cambio de variables) entendiendo que g(x) := g (y1 (x1 , . . . , xN ), . . . , yM (x1 , . . . , xN )) Con esta nueva notaci´on la regla de la cadena queda as´ı: ∂gi ∂gi ∂yM = xj + · · · + ∂xj ∂yM ∂xj y se puede interpretar de la siguiente manera: “cuando en una funci´on g(y1 . . . , yM ) se realiza un cambio de variables, yk = yk (x1 , . . . , xN ), ∀k = 1, . . . M , podemos calcular la derivada de la componente gi de la funci´on resultante con respecto de una de las variables xj sumando todas las derivadas de gi con respecto a todas sus variables yk pero, como a su vez estas variables son funciones de xj , hay que multiplicar cada una de ellas por su derivada con respecto a xj ”.
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
24
3.4.
Funciones definidas de forma impl´ıcita. El teorema de la funci´ on impl´ıcita
Hasta ahora hemos tratado con funciones dadas forma expl´ıcita, esto es, definidas por medio de una expresi´on expl´ıcita f : RN −→ RM de la funci´on que me permite calcular directamente su vector imagen y = (y1 , . . . , yM ) en cualquier punto x = (x1 , . . . , xN ) mediante la f´ormula y = f (x). Sin embargo, a menudo encontraremos funciones definidas de forma impl´ıcita por medio de una ecuaci´on F (x, y) = 0 siendo F : D ⊆ RN +M −→ RM , en el sentido de que existe una u ´nica funci´on f : A ⊆ N M R −→ R tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ D. Ejemplo 3.4.1. 2x3 + y + yx2 + 3 = 0 ⇔ y =
−2x3 − 3 1 + x2
Obviamente toda funci´on dada de forma expl´ıcita y = f (x) se puede dar tambi´en de forma impl´ıcita F (x, y) = 0, sin m´as que definir F (x, y) := y − f (x), pero no siempre podremos obtener la forma expl´ıcita a partir de una ecuaci´on impl´ıcita F (x, y) = 0 ya que para ello tendr´ıamos que poder despejar las variables y = (y1 , . . . , yM ) en funci´on de las variables x = (x1 , . . . , xN ) y eso no siempre ser´a posible o sencillo Ejemplo 3.4.2. y 3 + y 2 − 5y − x2 + 4 = 0 ⇔ ¿ y = f (x) ? Adem´as, a´ un en el caso de que tal despeje se pudiese realizar, no siempre se va a poder hacer de forma u ´nica, como se pone de manifiesto con este sencillo ejemplo. √ √ Ejemplo 3.4.3. x2 + y 2 = 1 ⇔ y = 1 − x2 ´o y = − 1 − x2 No obstante, si planteamos el problema de despejar ciertas variables de la ecuaci´on F (x, y) = 0 desde un punto de vista local (es decir, en un entorno de cada punto que verifica esa ecuaci´on) la situaci´on mejora notablemente. El Teorema de la Funci´on Impl´ıcita (T.F.I.) proporciona unas condiciones que garantizan que, localmente, se pueden despejar las variables y de una ecuaci´on F (x, y) = 0 en funci´on de las x. Comencemos analizando los casos m´as sencillos en los que se puede plantear este problema, que es cuando x e y representan u ´nicamente un par de variables reales o cuando queremos despejar una variable real z en funci´on de otras dos (x, y). En ambos casos la regla de la cadena nos proporciona una sencilla f´ormula para calcular las derivadas parciales de la funci´on expl´ıcita f a partir de las derivadas parciales de la funci´on impl´ıcita F de la que partimos, F : D ⊆: RN −→ R.
3.4. FUNCIONES DEFINIDAS DE FORMA IMPL´ICITA
25
Teorema 3.4.4 (N=2). Sea F : D ⊆: R2 −→ R, F ∈ C 1 (D), D abierto, a = (a1 , a2 ) ∈ D con F (a1 , a2 ) = 0 y ∂F (a1 , a2 ) 6= 0. ∂y Entonces F define a y impl´ıcitamente como funci´on de x en un entorno de (a1 , a2 ), esto es, existen A1 , A2 ⊆ R, abiertos con a1 ∈ A1 y a2 ∈ A2 y existe una u ´nica funci´on f : A1 −→ A2 tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ A1 × A2 . 1
Adem´ as f ∈ C (A1 ) y
∂f ∂x
=
∂F ∂x − ∂F ∂y
en todo A1 .
Teorema 3.4.5 (N=3). Sea F : D ⊆: R3 −→ R, F ∈ C 1 (D), D abierto, a = (a1 , a2 , a3 ) ∈ D con F (a1 , a2 , a3 ) = 0 y ∂F (a1 , a2 , a3 ) 6= 0. ∂z Entonces F define a y impl´ıcitamente como funci´on de (x, y) en un entorno de a, esto es, existen A1 ⊆ R2 , A2 ⊆ R abiertos con (a1 , a2 ) ∈ A1 y a3 ∈ A2 y existe una u ´nica funci´on f : A1 → A2 tal que F (x, y, z) = 0 ⇔ z = f (x, y), ∀(x, y, z) ∈ A1 × A2 . 1
Adem´ as f ∈ C (A1 ) y
∂f ∂x
=
∂F ∂x − ∂F ∂z
y
∂f ∂y
=−
∂F ∂y ∂F ∂z
en A1 .
Por tanto la ecuaci´ on del plano tangente a la superficie dada por la ecuaci´ on F (x, y, z) = 0 en el punto a es ∂F ∂F ∂F (a)(x − a1 ) + (a)(y − a2 ) + (a)(z − a3 ) = 0 ∂x ∂y ∂z esto es, ∇F (a) es el vector normal tal superficie. En su forma m´as general, esto es cuando tenemos una funci´on F con N + M variables igualada a cero y queremos despejar de esa ecuaci´on M de tales variables, el teorema quedar´ıa de la siguiente manera: ´ n impl´ıcita). Sea Teorema 3.4.6 (el teorema de la funcio N +M M 1 F : D ⊆: R −→ R , F ∈ C (D), D abierto, (a, b) ∈ RN +M N M (a ∈ R , b ∈ R ) con F (a, b) = 0 y det J(F, y1 , . . . , yM ) 6= 0, siendo ∂F1 ∂F1 (a, b) · · · ∂y (a, b) ∂y1 M .. .. J(F, y1 , . . . , yM ) := . . ∂FM (a, b) ∂y1
···
∂FM (a, b) ∂yM
Entonces F define a y = (y1 , . . . , yM ) impl´ıcitamente como funci´on de x = (x1 , . . . , xN ) en un entorno de (a, b), esto es, existen A ⊆ RN , B ⊆ RM abiertos con a ∈ A y b ∈ B y existe una u ´nica funci´on f : A −→ B tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ A × B. Adem´ as f ∈ C 1 (A) y sus derivadas parciales se pueden calcular resolviendo el sistema lineal J(F, y1 , . . . , yM ) · Jf (a, b) = −J(F, x1 , . . . , yN )
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
26
3.5.
Derivadas parciales y diferencial de orden superior. Matriz hessiana de una funci´ on real de varias variables
∂f Si tenemos una funci´on f : A −→ R la funciones ∂x , ∀i = 1, . . . , N i reciben el nombre gen´erico de derivadas parciales de orden 1 de f (y se notan tambi´en por fxi ). Al igual que para funciones reales de variable real, el proceso de derivaci´on parcial tambi´en se puede reiterar s´olo que ahora cada una de las derivadas parciales de f la podremos derivar de nuevo (donde se pueda) con respecto a cada una de las N variables que tiene. De este modo se obtienen las N 2 derivadas parciales de orden 2 de f :
´ n 3.5.1. Sea f : A −→ R, A abierto, a ∈ A. Se llama Definicio derivada parcial segunda (o de orden 2) de f en a respecto de xi y xj al valor ³ ´ ∂f ∂ 2 ∂xi ∂ f (a) : (a) ( o bien, fxi xj = (fxi )xj ) ∂xi ∂xj ∂xj En particular, una funci´on f de dos variables tiene 4 funciones derivadas parciales segundas, ∂ 2f ∂2f ∂ 2f ∂ 2f , , , ∂x2 ∂x∂y ∂y∂x ∂y 2 A las parciales de en medio se les llama derivadas parciales cruzadas de f . Ejemplo 3.5.2. Si f (x, y) = 3xy 2 − 2y + 5x2 y 2 se tiene que fx (x, y) = 3y 2 + 10xy 2 fxx (x, y) = 20y 2 fyx (x, y) = 6y + 20xy
fy (x, y) = 6xy − 2 + 10x2 y fxy (x, y) = 6y + 20xy fyy (x, y) = 6 + 20x2
Se observa en el ejemplo anterior que las parciales cruzadas de f coinciden. Aunque esto se verifica frecuentemente no ocurre en general como pone de manifesto el siguiente ejemplo Ejemplo 3.5.3. La funci´on f dada por ½ 2 −y 2 xy xx2 +y (x, y) 6= (0, 0) 2 f (x, y) = 0 (x, y) = (0, 0) verifica que fxy (0, 0) = −1 y fyx (0, 0) = 1. El siguiente teorema proporciona una condici´on suficiente para que las derivadas parciales cruzadas coincidan.
3.5. DERIVADAS PARCIALES Y DIFERENCIAL DE ORDEN SUPERIOR
27
Teorema 3.5.4 (de schwartz). Si fx , fy , fxy , fyx son continuas en un abierto R de R2 entonces fxy = fyx en todo R. Las definiciones anteriores se pueden extender por recurrencia a un orden cualquiera n + 1. As´ı pues, supuestas ya definidas las derivadas parciales de orden n de f , se define la derivada parcial de orden n + 1 de f en a respecto de las variables xi1 , . . . , xin+1 (con i1 ,. . . , in+1 ∈ {1, . . . , N }) del siguiente modo: ³ n ´ f ∂ ∂xi∂ ···x ∂ (n+1) f in 1 (a) := (a) ∂xi1 · · · ∂xin+1 ∂xin+1 ´ n 3.5.5. Se dice que f es de clase C n en A, y se nota Definicio f ∈ C n (A), si todas las derivadas parciales de orden n existen y son continuas en A Corolario 3.5.6. Si f es de clase C n en A las derivadas parciales de cualquier orden r ≤ n no dependen del orden en que derivemos Del mismo modo que hemos introducido las derivadas parciales de orden n se puede hacer algo similar con el concepto de diferencial, pues podemos definir el diferencial de orden n de una funci´on real de varias variables. Empecemos con el caso n = 2, que es el m´as importante. Observemos que el diferencial de una funci´on f : A ⊆ RN −→ R se puede ver como una aplicaci´on df que depende tanto del punto x donde la calculamos como del vector h donde se eval´ ua: ½ N X ∂f ∀x = (x1 , . . . , xN ) ∈ RN df (x)(h) = (x)hj , ∀h = (h1 , . . . , hN ) ∈ RN ∂xj j=1
Si variamos s´olo el vector h, h 7→ df (x)(h) es una aplicaci´on lineal de RN en R, pero si variamos s´olo el punto x tenemos una aplicaci´on x 7→ df (x)(h) (continua, si f es de clase C 1 en A) de RN en R a la que podemos calcular de nuevo su diferencial, y que denotaremos por df (h) (la diferencial de f pero como funci´on de x) ´ n 3.5.7. Se define el diferencial de orden 2 como la apliDefinicio 2 caci´on d f que a cada punto a (tal que df (h) exista en un entorno suyo para todo h) le hace corresponder la aplicaci´on d2 f (a) dada por d2 f (a)(h) = d(df (h))(a) (abreviadamente d2 f = d(df )). ´ n 3.5.8. Se llama matriz hessiana de f en a a la matriz Definicio ∂2f ∂2f (a) · · · (a) 2 ∂x1 ∂xN ∂x1. .. . Hf (a) = . . 2 2 ∂ f ∂ f (a) · · · (a) ∂xN ∂x1 ∂x2 N
28
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
Teorema 3.5.9. El diferencial de orden dos d2 f en un punto a es una forma cuadr´atica cuya matriz asociada respecto de la base can´ onica N de R es la matriz hessiana Hf en el punto a, o sea que, para cada h = (h1 , . . . , hN ) ∈ RN , d2 f act´ ua as´ı: h1 d2 f (a)(h) = (h1 , . . . , hN ) · Hf (a) · ... hN En particular, para N = 2 tenemos que d2 f (a)(h1 , h2 ) =
∂ 2f ∂ 2f ∂ 2f 2 (a)h + 2 (a)h h + (a)h22 1 2 1 ∂x2 ∂x∂y ∂y 2
o, usando la notaci´on (h1 , h2 ) = (dx, dy) y omitiendo el punto a, d2 f =
∂ 2f 2 ∂ 2f ∂2f 2 dx + 2 dxdy + dy ∂x2 ∂x∂y ∂y 2
Reiterando este proceso se pueden definir de forma an´aloga el diferencial de orden 3 de f , d3 f , el de orden 4, d4 f , y, en general, el diferencial de orden n, dn f . Por ejemplo, d3 f actuar´ıa as´ı: 3
d f (a)(h1 , h2 , h3 ) =
N X N X N X i=1 j=1 k=1
3.6.
∂ 3f (a)h1 h2 h3 ∂xi ∂xj ∂xk
El teorema de Taylor en varias variables
Hasta ahora sabemos que las funciones diferenciables se pueden aproximar por medio funciones afines (cuyas ecuaciones no son otra cosa que polinomios de grado 1). El teorema de Taylor trata de mejorar esta aproximaci´on utilizando para ello polinomios en varias variables de grado superior, para lo cual necesitaremos que la funci´on posea diferenciales de orden superior. Adem´as el teorema de Taylor nos dar´a tambi´en una expresi´on para el error que se comete al aproximar un valor de una funci´on por el valor correspondiente de los polinomios de Taylor. Recordemos que para una funci´on f : I ⊆ R −→ R, f ∈ C n (I) siendo I un intervalo de R y para todo x, a ∈ I el teorema de Taylor para funciones reales de variable real nos garantiza la existencia de un c en el intervalo de extremos a y x tal que f (x) = Pn (x)+Rn (x), siendo 1 1 0 f (a)(x − a)2 + · · · + f (n) (a)(x − a)n 2! n! 1 Rn (x) := f (n+1) (c)(x − a)n+1 (n + 1)!
Pn (x) := f (a) + f 0 (a)(x − a) +
3.6. EL TEOREMA DE TAYLOR EN VARIAS VARIABLES
29
En el caso general, para una funci´on de N variables, esas funciones se definen de la siguiente manera: ´ n 3.6.1. Sea f : A ⊆ RN −→ R. Se llama polinomio de Definicio Taylor de orden n de f en a al polinomio Tn (f, a) = Pn dado por 1 1 Pn (x) := f (a) + df (a)(x − a) + df 2 (a)(x − a) + · · · + df n (a)(x − a) 2! n! y se llama resto de Taylor de orden n de f en a a la funci´on R(x) := f (x) − Pn (x) Adem´as, para funciones de varias variables, el papel que despe˜ na el intervalo de extremos a y x va a ser llevado a cabo por el segmento de extremos a y x. Dados un par de puntos a y b de RN , el segmento de extremos a y b se puede definir, de un modo riguroso, como el conjunto [a, b] := {ta + (1 − t)b : 0 ≤ t ≤ 1} donde los puntos a y b se obtienen para los valores t = 1 y t = 0 respectivamente, por lo que tambi´en es coherente denotar por ]a, b[:= {ta + (1 − t)b : 0 < t < 1} al segmento [a, b] sin sus correspondientes extremos a y b. Ya estamos en condiciones de enunciar el Teorema de Taylor en varias variables, el cual me dice que puedo usar Tn (f, a) para aproximar el valor exacto de f (x) para puntos pr´oximos al punto a y me da una expresi´on del resto de Taylor que me permite acotar el error cometido al realizar tal aproximaci´on. Teorema 3.6.2 (de taylor en varias variables). Si tenemos una funci´on f : A ⊆ RN −→ R, f ∈ C n+1 (A), A abierto, entonces para todo x, a ∈ A con [a, x] ⊆ A existe un c ∈]a, x[ tal que 1 f (x) = Tn (f, a)(x) + df n+1 (c)(x − a) (n + 1)! Merece la pena observar que, en particular, el teorema de Taylor con resto de orden 1 (esto es, para n = 0 con la notaci´on anterior) no es m´as que la siguiente generalizaci´on del Teorema del Valor Medio a varias variables (pues para N = 1 se vuelve a obtener dicho teorema): Teorema 3.6.3 (del valor medio en varias variables). Si f : A ⊆ RN −→ R, f ∈ C n (A), A abierto, entonces para todo a, b ∈ A con [a, b] ⊆ A existe un c ∈]a, b[ tal que f (b) − f (a) = df (c)(b − a) Adem´as, la f´ormula del resto que nos proporciona el Teorema de Taylor, nos permite deducir el siguiente resultado de manera inmediata, el cual nos dice que “a medida que aumente el orden n del polinomio
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
30
de Taylor usado para aproximar f , aumenta tambi´en el grado de aproximaci´on entre ambas funciones en un entorno del punto considerado” ´ rmula infinitesimal del resto). Si f : Corolario 3.6.4 (fo A ⊆ RN −→ R, f ∈ C n+1 (A), A abierto, entonces se verifica que f (x) − Pn (x) =0 x→a kx − akn l´ım
∀n ∈ N, siendo Pn el polinomio de Taylor de orden n de f en a. N´otese que para n = 1 volvemos a obtener que el polinomio (de grado 1) P1 (x) = f (a) + df (a)(x − a) es la funci´on af´ın que mejor f (x) − P1 (x) aproxima a f en un entorno del punto a, pues l´ım = 0. x→a kx − ak Y para n = 2, el polinomio de Taylor P2 = T2 (f, a) es 1 P2 (x) = f (a) + df (a)(x − a) + d2 f (a)(x − a) 2 que para una funci´on de N = 2 variables y un punto a = (a1 , a2 ) queda +
1 2
³
∂f (a)(x − a1 ) + ∂f (a)(y − a2 ) + ∂x ∂y 2 2 ∂ f 2 ∂x∂y (a)(x − a1 )(y − a2 ) + ∂∂yf2 (a)(y −
P2 (x, y) = f (a) + ∂2f (a)(x ∂x2
− a1 )2 +
´ a2 )
Ejemplo 3.6.5. Calcular el polinomio de Taylor de orden 2 de la funci´on f (x, y) = exp xy en el punto (0, 0). 3.7.
Extremos relativos de una funci´ on real de varias variables
´ n 3.7.1. Sea f : A ⊆ RN −→ R, A abierto, a ∈ A. Definicio • f alcanza un m´ aximo relativo (o local) en a si ∃δ > 0 tal que Bδ (a) ⊆ A y f (x) ≤ f (a), ∀x ∈ A. • f alcanza un m´ınimo relativo (o local) en a si ∃δ > 0 tal que Bδ (a) ⊆ A y f (a) ≤ f (x), ∀x ∈ A. • f alcanza un extremo relativo en a si alcanza un m´aximo o un m´ınimo relativo en a • f presenta un punto de silla en a si ∀ε > 0 existen x1 , x2 ∈ Bε (a) ∩ A tal que f (x1 ) ≤ f (a) ≤ f (x2 ). • a es un punto cr´ıtico de f si df (a) = 0, esto es, si ∇f (a) = 0. Geom´etricamente es evidente que si una funci´on f de dos variables alcanza un extremo relativo en un punto a, el plano tangente de f en dicho punto tiene que ser paralelo al plano z = 0. El siguiente resultado expresa esta idea de un modo riguroso.
3.7. EXTREMOS RELATIVOS
31
´ n 3.7.2 (cond. necesaria de extremo relativo). Proposicio Sea A ⊆ RN abierto, a ∈ A y f : A −→ R diferenciable en a. Si f alcanza un extremo relativo en a entonces a es un punto cr´ıtico de f . Por lo tanto, los posibles extremos relativos de f se encuentran entre los puntos cr´ıticos de f , pero no en todo punto cr´ıtico la funci´on alcanza un extremo relativo, como ponen de manifiesto ejemplos sencillos como este Ejemplo 3.7.3. La funci´on f (x, y) := x2 − y 2 es diferenciable en el punto (0, 0) con ∇f (0, 0) = 0 y sin embargo no tiene extremo relativo en (0, 0). Como acabamos de ver, entre los puntos cr´ıticos de una funci´on f puede haber tambi´en puntos de silla. En el caso real, era la derivada segunda de la funci´on la que permit´ıa decidir si en tales puntos se alcanzaba o no un extremo relativo. En el caso de funciones reales de varias variable este papel le va a corresponder a la matriz hessiana (la matriz con todas las derivadas parciales de orden 2 de f ), realmente a su forma cuadr´atica asociada d2 f : Teorema 3.7.4 (conds. suficientes de extremo relativo). Sea A ⊆ RN abierto, f : A −→ R, f ∈ C 2 (A), a un punto cr´ıtico de f . (i) Si d2 f (a) es definida positiva entonces f alcanza un m´ınimo relativo en el punto a (ii) Si d2 f (a) es definida negativa entonces f alcanza un m´aximo relativo en el punto a (iii) Si d2 f (a) es indefinida entonces a es un punto de silla de f . Corolario 3.7.5 (N=2). Sea f ∈ C 2 , a un punto cr´ıtico de f , µ ¶ α β Hf (a) = , ∆1 := α, ∆2 := αγ − β 2 β γ • • • •
∆1 > 0, ∆2 > 0 ⇒ f alcanza un m´ınimo relativo en a ∆1 < 0, ∆2 > 0 ⇒ f alcanza un m´aximo relativo en a ∆2 < 0 ⇒ f tiene un punto de silla en a Si ∆2 = 0 este criterio no da informaci´on
Corolario 3.7.6 (N=3). Sean f ∈ C 2 , a un punto cr´ıtico de f , y sean ∆1 , ∆2 , ∆3 los menores principales de Hf (a). • ∆1 > 0, ∆2 > 0, ∆3 > 0 ⇒ m´ınimo relativo de f en a • ∆1 < 0, ∆2 > 0, ∆3 < 0 ⇒ m´aximo relativo de f en a • ∆3 6= 0 y no (i) ni (ii) ⇒ punto de silla de f en a • Si ∆3 = 0 este criterio no da informaci´on
32
3.8.
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
Extremos condicionados de una funci´ on real de varias variables. El teorema de los multiplicadores de Lagrange
Muchos problemas de optimizaci´on tiene condiciones (restricciones o ligaduras) que limitan los valores que pueden usarse para lograr la soluci´on ´optima. Esto tiende a complicar los problemas de optimizaci´on ya que dicha soluci´on ´optima puede encontrarse f´acilmente en un punto de la frontera del dominio. Ejemplo 3.8.1. Hallar el rect´angulo de ´area m´axima que puede 2 2 inscribirse en la elipse x32 + y42 = 1. Se trata, por tanto, de maximizar la funci´on A(x, y) := 4xy restringida a los puntos de esa elipse. En general queremos hallar los puntos x ∈ A ⊆ RN tal que una cierta funci´on f : A −→ R (llamada funci´ on objetivo) sea m´axima o m´ınima, de entre todos los que verifican una cierta ecuaci´on (o ligadura) g(x) = 0. A tales puntos les llamaremos extremos de f condicionados a g (o sujetos a la ligadura g(x) = 0). Vamos a empezar considerando el caso m´as sencillo, cuando f y g son funciones reales de dos variables. En este caso, el conjunto de puntos donde buscamos los extremos de f es una curva del plano, dada por la ecuaci´on (impl´ıcita) g(x, y) = 0. Por tanto, si consideramos las curvas de nivel f (x, y) = k de la funci´on objetivo f , es claro (gr´aficamente) que las curvas de esa familia que corten a la curva g(x, y) = 0 corresponden a aquellos valores k de la funci´on f para los cuales hay puntos que cumplen la ligadura. La idea ingeniosa que permite hallar los extremos de f condicionados a g consiste en darse cuenta que (si f es continua) el mayor o menor valor de k que cumple lo anterior corresponder´a, precisamente, a la curva (o curvas) de nivel k que sea tangente a la curva g(x, y) = 0. Como dos curvas son tangentes si y solo si sus vectores normales son paralelos y los vectores normales a las curvas de nivel f (x, y) = k y g(x, y) = 0 son sus gradientes ∇f y ∇g, los extremos de f condicionados a g se encontraran entre aquellos puntos donde exista un λ (llamado multiplicador de Lagrange) tal que ∇f = λ∇g. En el siguiente teorema precisamos las condiciones bajo las cuales se puede garantizar la existencia de tales multiplicadores. Teorema 3.8.2 (de los multiplicadores de lagrange, N=2). Sea A ⊆ R2 abierto, f, g : A −→ R de clase C 1 (A), y a ∈ A. Si f alcanza en a un extremo condicionado a la curva g(x, y) = 0 y ∇g(a) 6= 0, entonces ∃λ ∈ R tal que ∇f (a) = λ∇g(a).
3.8. EXTREMOS CONDICIONADOS
33
En la pr´actica, como ∇(f − λg) = ∇f − λ∇g, los puntos para los que existe multiplicador de Lagrange se suelen hallar de la siguiente manera: ´todo de los multiplicadores, N=2). Corolario 3.8.3 (me N Sea A ⊆ R abierto, f, g : A −→ R de clase C 1 (A), y a ∈ A. Si f alcanza un extremo condicionado a g(x, y) = 0 en un punto a entonces a es un punto cr´ıtico de la funci´on F (llamada funci´on auxiliar de Lagrange) dada por F (x, y, λ) := f (x, y) − λg(x, y). En general, si tenemos una funci´on f de N variables con M restricciones para ellas g1 (x1 , . . . , xN ) = 0, . . . , gM (x1 , . . . , xN ) = 0 tambi´en se puede emplear el m´etodo anterior, pero ahora usaremos tantos multiplicadores como restricciones tengamos. ´todo de los multiplicadores). Sea A ⊆ Teorema 3.8.4 (me R abierto, f : A −→ R, g : A −→ RM de clase C 1 (A), y a ∈ A. Si f tiene un extremo condicionado a g(x1 , . . . , xN ) = 0 en un punto a entonces a es un punto cr´ıtico de la funci´on (auxiliar de Lagrange) F : RN +M −→ R dada por N
F (x, λ1 , . . . , λM ) := f (x) − λ1 g1 (x) − · · · − λM gM (x). ´ n 3.8.5. El sistema de ecuaciones que surge en el m´etoObservacio do de los multiplicadores de Lagrange no es, en general, un sistema lineal y resolverlo requiere frecuentemente algo de ingenio. ´ n 3.8.6. Para averiguar si los puntos cr´ıticos de la funObservacio ci´on auxiliar de la Lagrange F son extremos de f se puede usar el criterio de la matriz hessiana sobre dicha funci´on auxiliar F pero s´olo como condici´on suficiente, esto es del siguiente modo: (i) Si HF (a) es definida positiva entonces f alcanza un m´ınimo relativo condicionado a g (ii) Si HF (a) es definida negativa entonces f alcanza un m´aximo relativo condicionado a g De hecho, se puede probar que realmente basta con estudiar el car´acter de la forma cuadr´atica dF (a) restringida al Ker∇g(a). Pero a menudo no necesitaremos recurrir a esto ya que podremos garantizar su existencia a priori y por tanto simplemente tendremos que evaluar la funci´on en los puntos cr´ıticos de la funci´on auxiliar de Lagrange para ver en cual de ellos la funci´on toma su mayor y su menor valor.
34
´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION
3.9.
Extremos absolutos de una funci´ on real de varias variables
A menudo, los m´etodos dados anteriormente para el c´alculo de extremos relativos y para el c´alculo de extremos condicionados se pueden combinar para encontrar los extremos absolutos de una funci´on en ciertos conjuntos. En concreto, supongamos que f : A ⊆ RN −→ R es una funci´on continua y K ⊆ A es un conjunto compacto con frontera F r(K) = {x ∈ RN : g(x) = 0}, siendo g una funci´on de RN en RM de clase C 1 . El Teorema de Weierstrass garantiza entonces que f alcanza sus extremos absolutos en algunos puntos de K. Podemos localizar esos puntos x0 pues en ellos tiene que ocurrir una de estas tres cosas: (1o ) f no es diferenciable en x0 (2o ) f es diferenciable en x0 y x0 ∈ K ◦ (3o ) f es diferenciable en x0 y x0 ∈ F r(K) En el segundo caso f alcanza un extremo relativo en x0 y en el tercer caso f alcanza un extremo condicionado a g en x0 . Por tanto, para determinar los extremos absolutos de f sobre K tenemos que (1o ) Localizar los puntos en los que f no es diferenciable (2o ) Calcular los puntos cr´ıticos de f que pertenecen a K ◦ (3o ) Hallar los puntos cr´ıticos de f condicionados a g y entre todos esos puntos se encuentran forzosamente aquellos en los que f alcanza sus extremos, con lo cual solamente tenemos que estudiar en cual de ellos toma f toma el mayor y el menor valor.
View more...
Comments