CÁLCULO EN VARIAS VARIABLES. ITOP - INGENIERÍA CIVIL

August 10, 2017 | Author: Lucrecia Carrasco García | Category: Derivative, Continuous Function, Gradient, Interval (Mathematics), Scalar (Mathematics)

Share Embed Donate

Report this link

Short Description

Download CÁLCULO EN VARIAS VARIABLES. ITOP - INGENIERÍA CIVIL...

Description

C´ alculo en varias variables Asignatura “Análisis Matemático” de 1o I.T.O.P. Memoria de la segunda parte - segundo parcial- de la asignatura. Departamento de Matemáticas de la Escuela Politécnica. Ricardo del Campo Acosta y Ricardo Garc´ıa González.

A mis alumnos, por querer aprender algo nuevo

Índice Introducción

v

Cap´ıtulo 1. TOPOLOGÍA DE RN 1.1. Producto escalar, norma y distancia eucl´ıdeas 1.2. Bolas, entornos, abiertos y cerrados de RN 1.3. Convergencia de sucesiones en RN

1 1 2 5

Cap´ıtulo 2. LÍMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES 7 2.1. L´ımite de una función de varias variables 8 2.2. Algunas técnicas y métodos para el cálculo de l´ımites 9 2.3. L´ımites en el infinito y funciones divergentes 11 2.4. Continuidad de una función de varias variables 11 ´ DE FUNCIONES DE VARIAS Cap´ıtulo 3. DIFERENCIACION VARIABLES 3.1. Derivadas parciales y derivadas direccionales 3.2. Diferencial y gradiente de una función real de varias variables. Relación e interpretación geométrica 3.3. Diferencial y matriz jacobiana de una función vectorial de varias variables. Regla de la cadena 3.4. Funciones definidas de forma impl´ıcita. El teorema de la función impl´ıcita 3.5. Derivadas parciales y diferencial de orden superior. Matriz hessiana de una función real de varias variables 3.6. El teorema de Taylor en varias variables 3.7. Extremos relativos de una función real de varias variables 3.8. Extremos condicionados de una función real de varias variables. El teorema de los multiplicadores de Lagrange 3.9. Extremos absolutos de una función real de varias variables

iii

15 15 17 21 24 26 28 30 32 34

Introducci´ on El estudio de las aplicaciones o funciones de varias variables es uno de los objetivos fundamentales de las matemáticas, ya que la mayor´ıa de los fenómenos de cualquier tipo (f´ısicos, qu´ımicos, económicos, etc.) se pueden modelizar mediante una función de este tipo. Cuando la aplicación es lineal, conocemos técnicas algebraicas que me permiten manejarla y estudiarla fácilmente, pues tales aplicaciones se pueden caracterizar mediante una matriz de coeficientes y as´ı trabajar con aplicaciones lineales se reduce a trabajar con matrices:   µ ¶ x 8 1 −1   y f (x, y, z) = (8x + y − z, x + 2y + 3z) = 1 2 3 z    1 0 −1 x 6  y  f (x, y, z) = (x − z, 4y + 6z, x − y − z) =  0 4 1 −1 −1 z Obviamente la cantidad de aplicaciones con las que podemos trabajar as´ı es bastante limitada, pues cuando la aplicación no es lineal ya no podemos estudiar su comportamiento global a través de una matriz, pero a menudo si vamos a poder estudiar su comportamiento local a través de ciertas matrices. De hecho, en esencia, el objetivo del c´ alculo diferencial que vamos a presentar en esta memoria es ese: Estudiar una clase de funciones (las funciones diferenciables) que se parecen mucho a una aplicación af´ın (esto es, su incremento se parece mucho a una aplicación lineal) en un entorno de cada punto. De este modo las técnicas algebraicas que ya conocemos nos permitirán obtener consecuencias locales sobre tales funciones a partir de las propiedades (globales) de las aplicaciones lineales a las que se parecen en cada punto. Se trata por tanto de explotar tanto como podamos las técnicas algebraicas para estudiar funciones que no tienen por qué ser lineales. De este modo estamos ampliando enormemente la cantidad de funciones con las que podemos trabajar, pues disponemos de herramientas matemáticas para extraer información u ´til sobre ellas. v

CAP´ıTULO 1

TOPOLOGÍA DE RN En el estudio de las funciones reales de variable real los intervalos desempe˜ nan un papel crucial pues algunas propiedades de tales funciones sólo se dan en un determinado tipo de intervalos. La importancia de los intervalos se debe a que nos permiten manejar (de un modo sencillo y riguroso) los n´ umeros reales que se encuentran entorno a un n´ umero real dado a, en concreto, los n´ umeros reales que están a una distancia menor (o menor o igual) que ε de a, pues ]a − ε, a + ε[= {x ∈ R : |x − a| < ε} [a − ε, a + ε] = {x ∈ R : |x − a| ≤ ε} Si ahora pretendemos estudiar funciones de varias variables necesitaremos una noción que generalice la idea del valor absoluto como herramienta para medir distancias entre puntos y unos conjuntos que hagan el papel de los intervalos como conjuntos de puntos entorno a un punto dado a. 1.1.

Producto escalar, norma y distancia eucl´ıdeas

Vamos a comenzar presentando de forma abstracta las nociones básicas con las que vamos a trabajar. Si X es un espacio vectorial sobre R se llama distancia a toda aplicación d : X × X −→ R que ∀x, y, z ∈ X verifica las siguientes propiedades: • d(x, y) ≥ 0 y d(x, y) = 0 ⇔ x = y • d(x, y) = d(y, x) • d(x, y) ≤ d(x, z) + d(z, y) Se llama norma a toda aplicación k · k : X −→ R que ∀x, y, z ∈ X y ∀λ ∈ R cumple lo siguiente: • kxk ≥ 0 y kxk = 0 ⇔ x = 0 • kλxk = |λ|kxk • kx + yk ≤ kxk + kyk Por u ´ltimo, se llama producto escalar a toda forma bilineal simétrica definida positiva de X, esto es a toda aplicación < ·, · >: X × X −→ R tal que ∀x, x0 , y ∈ X y ∀α, β ∈ R verifica que: 1

1. TOPOLOGÍA DE RN

2

• < αx + βx0 , y >= α < x, y > +β < x0 y > • < x, y >=< y, x > • < x, x > ≥ 0 y < x, x >= 0 ⇔ x = 0 Intuitivamente una distancia es una función que mide el grado de proximidad entre los puntos, una norma es una función que mide las longitudes de los vectores y un producto escalar es una función que me permite medir ángulos y hablar de ortogonalidad entre vectores. Además estas nociones no son independientes entre si, pues todo producto escalar induce una norma, definida mediante la expresión √ kxk := < x, x >, ∀x ∈ X y toda norma induce una distancia del siguiente modo: d(x, y) := kx − yk, ∀x, y ∈ X es decir, que “si tengo un producto escalar en un espacio vectorial puedo medir longitudes de vectores sin más que hacer la ra´ız cuadrada del producto escalar de cada vector consigo mismo, y si tengo una norma puedo medir distancias entre dos puntos cualesquiera midiendo la longitud de su diferencia como vectores”. Como RN es un espacio vectorial con un producto escalar canónicamente asociado, el producto escalar eucl´ıdeo, dado por x · y = < x, y > := x1 y1 + · · · + xN yN para todo x = (x1 , . . . , xN ) e y = (y1 , . . . , yN ) de RN , en particular tenemos una norma y una distancia inducidas, que reciben el nombre de norma y distancia eucl´ıdeas y vienen dadas por q kxk = x21 + · · · + x2N p d(x, y) = (x1 − y1 )2 + · · · + (xN − yN )2 ´ Estas son las nociones de producto escalar, norma y distancia que vamos a consideras canónicamente asociadas a RN . Nótese que para N = 1 la norma eucl´ıdea no es otra cosa que el valor absoluto de un n´ umero real. 1.2.

Bolas, entornos, abiertos y cerrados de RN

´ n 1.2.1. Sea a ∈ RN y ε > 0. Se define la bola (abierta) Definicio de centro a y radio ε como el siguiente conjunto: Bε (a) := {x ∈ RN : kx − ak < ε} Análogamente, se define la bola cerrada de centro a y radio ε como Bε (a) := {x ∈ RN : kx − ak ≤ ε}

1.2. BOLAS, ENTORNOS, ABIERTOS Y CERRADOS DE RN

3

Obsérvese que para N = 1 las bolas vuelven a ser intervalos, pues Bε (a) =]a − ε, a + ε[ y Bε (a) = [a − ε, a + ε], para N = 2 lo que quedan son c´ırculos (con o sin su circunferencia) y para N = 3 las bolas son esferas. Podemos considerar a las bolas centradas en un punto a como los entornos del punto a, pero conviene más pensar en los entornos de a como cualquier conjunto que contenga una bola centrada en a. ´ n 1.2.2. Un conjunto V de RN se dice que es un entorno Definicio del punto a si existe ε > 0 tal que Bε (a) ⊆ V . Ya tenemos unos conjuntos, las bolas, que extienden la definición de los intervalos a RN . Sin embargo, dada la riqueza de conjuntos que hay en RN , las bolas son unos conjuntos demasiados restrictivos para nuestros fines: En R es suficiente con limitarnos a estudiar las funciones definidas en un intervalo ya que la mayor´ıa de las funciones suelen estar definidas de un modo natural sobre uno (o varios) intervalos, pero en RN los conjuntos en los que están definidas las funciones pueden tener una geometr´ıa muy diversa y no ser´ıa muy interesante limitarnos sólo a estudiar las funciones definidas en una (o varias) bolas. Por este motivo vamos a usar las bolas para introducir un par de familias de conjuntos de RN muchos más amplia que las propias bolas, que serán la familia de los conjuntos abiertos y la de los conjuntos cerrados de RN . ´ n 1.2.3. Sea A ⊆ RN y x ∈ RN . Se dice que Definicio • x es un punto interior de A si ∃ε > 0 tal que Bε (x) ⊆ A • x es un punto adherente de A si ∀ε > 0, Bε (x) ∩ A 6= ∅ Al conjunto A◦ de todos los puntos interiores de A lo llamaremos interior de A y al conjunto A de todos los puntos adherentes de A lo llamaremos clausura, cierre o adherencia de A. Es claro que todo punto interior de un conjunto A es forzosamente un punto de A y que todo punto de A es un punto adherente de A. En s´ımbolos, para todo A ⊆ RN se tiene que A◦ ⊆ A ⊆ A. Pongamos nombre a los conjuntos que de hecho coinciden con su interior o con su adherencia: ´ n 1.2.4. Sea A un conjunto cualquiera de RN . Definicio Se dice que A es abierto si A = A◦ (todos los puntos de A son interiores o, expresado de otro modo, A es entorno de todos sus puntos). Se dice que A es cerrado si A = A (todos los puntos adherentes de A están de hecho en A).

1. TOPOLOGÍA DE RN

4

Ejemplo 1.2.5. Las bolas abiertas son conjuntos abiertos y las bolas cerradas son conjuntos cerrados de RN . Intuitivamente, los conjuntos abiertos son aquellos que no tienen frontera o borde alguno y los conjuntos cerrados son lo que contienen a toda su frontera o borde. Esto se puede expresar de un modo riguroso definiendo la frontera de un conjunto del siguiente modo: ´ n 1.2.6. Se dice que x es un punto frontera de A si Definicio ∀ε > 0, Bε (x) ∩ A 6= ∅ y Bε (x) ∩ (RN \A) 6= ∅ Denotaremos por F r(A) al conjunto de todos los puntos frontera de A. Como F r(A) = A \A◦ , es evidente que un conjunto A es abierto si y sólo si no contiene ning´ un punto frontera y es cerrado si y sólo si contiene a toda su frontera. En la práctica no se suele trabajar mucho con la frontera de un conjunto: Es mejor trabajar directamente con los conjuntos abiertos y cerrados ya que verifican unas propiedades fáciles de formular como vemos a continuación. ´ n 1.2.7. Los abiertos de RN cumplen estas propiedades: Proposicio (i) ∅ y RN son abiertos (ii) La unión arbitraria de abiertos es un abierto (ii) La intersecci´ on finita de abiertos es un abierto Adem´ as, un conjunto A es cerrado si y sólo si RN \A es abierto. Por tanto, los cerrados de RN verifican las siguientes propiedades: (i) ∅ y RN son cerrados (ii) La unión finita de cerrados es un cerrado (ii) La intersecci´ on finita de cerrados es un cerrado ´ n 1.2.8. La familia T de todos los conjuntos abiertos de Definicio R recibe el nombre de topolog´ıa (usual ) de RN . N

Muchas de las propiedades de los conjuntos y de las funciones de RN dependen en gran medida de la topolog´ıa de RN . Por este motivo, la topolog´ıa de RN estará presente de uno u otro modo en la mayor´ıa de los resultados que vamos a obtener para funciones de varias variables. En este sentido, hay un tipo particular de cerrados que merecen especial atención, pues (como veremos posteriormente) van a conservar alguna de las propiedades que pose´ıan los intervalos cerrados y acotados de R. ´ n 1.2.9. Sea A un conjunto cualquiera de RN Definicio Se dice que A está acotado si ∃M > 0 tal que kxk ≤ M , ∀x ∈ A. Se dice que A es compacto si es cerrado y acotado.

1.3. CONVERGENCIA DE SUCESIONES EN RN

5

Para terminar esta sección vamos a presentar dos tipos distintos de puntos adherentes que es interesante distinguir. ´ n 1.2.10. Sea A ⊆ RN y x ∈ RN . Se dice que Definicio • x es un punto aislado de A si ∃ε > 0 tal que Bε (x) ∩ A = {x} • x es un punto de acumulación de A si ∀ε > 0 Bε (x)∩A\{x} 6= ∅ El conjunto de todos los puntos de acumulación de A se llama conjunto derivado de A y se denota por A0 . 1.3.

Convergencia de sucesiones en RN

´ n 1.3.1 (Convergencia de una sucesi´ Definicio on en RN ). Se dice N N que una sucesión {xn } ⊆ R converge a l ∈ R , y notaremos xn → l si ∀ε > 0, ∃m ∈ N : ∀n ≥ m, kxn − lk < ε. Pero una sucesión {xn } de RN está formada realmente por N sucesiones de n´ umeros reales, pues cada término xn es un vector con N componentes, xn = (x1n , . . . , xN n ), por lo que cabe preguntarse si podemos caracterizar su convergencia mediante la convergencia tales sucesiones de n´ umeros reales xin , ∀i = 1, . . . , N . La respuesta es afirmativa: la convergencia en RN se puede calcular coordenada a coordenada, como pone de manifiesto el siguiente resultado: ´ n 1.3.2. xn → l ⇔ xin → li , ∀i = 1, . . . , N . Proposicio Esto simplifica mucho la situación ya que reduce la nueva noción de convergencia a la ya conocida y ampliamente estudiada convergencia de sucesiones de n´ umeros reales (luego no necesitamos introducir ninguna técnica nueva para estudiar la convergencia de las sucesiones de vectores). n Ejemplo 1.3.3. ( n1 , n+1 ) → (0, 1) en R2 porque

1 n

→0y

n n+1

→ 1.

La principal utilidad de la noción de convergencia de sucesiones es que permite caracterizar la topolog´ıa de RN y por tanto todos los conceptos que se pueden definir a partir de ella. A modo de ejemplo, veamos como podemos caracterizar (de un modo sencillo y elegante) los puntos adherentes y los puntos de acumulación mediante sucesiones convergentes: ´ n 1.3.4. Dados A ⊆ RN y x ∈ RN , se cumple que: Proposicio (i) x ∈ A ⇔ ∃{xn } ⊆ A, xn → x. (ii) x ∈ A0 ⇔ ∃{xn } ⊆ A, xn 6= x, ∀n ∈ N, xn → x. En particular, A es cerrado si y solo si contiene el l´ımite de cualquier sucesi´ on convergente de elementos de A.

CAP´ıTULO 2

LÍMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES El objetivo de los dos próximos cap´ıtulos consiste en definir y estudiar las principales propiedades de las funciones f : A ⊆ RN −→ RM . Para ello, procederemos del siguiente modo: Vamos a trabajar principalmente con funciones f : A ⊆ RN −→ R, definiendo los distintos conceptos o propiedades para ellas, ya que las funciones F : A ⊆ RN −→ RM están caracterizadas por sus M funciones coordenadas o componentes fi : A ⊆ RN −→ R, ∀i = 1, . . . , M que verifican que F (x) = (f1 (x), . . . , fM (x)), ∀x ∈ RN , por lo que notaremos F = (f1 , . . . , fM ). Por lo tanto, podremos extender la mayor´ıa de los conceptos y propiedades a funciones F : A ⊆ RN −→ RM a través de sus funciones coordenadas o componentes: Diremos que F presenta una cierta condición o propiedad si y solo si todas sus funciones coordenadas fi , con i = 1, . . . , M , la cumplen. ´ n 2.0.5. El dominio de una función f : A ⊆ RN −→ Observacio RM es el conjunto A donde está definida la función. Siempre podremos restringirnos a un dominio B más peque˜ no (en el sentido de contenido en A) sin más que considerar que la función f act´ ua tan sólo sobre los puntos de B (en tal caso, se suele decir que trabajamos con la restricci´ on de f a B o que f está restringida al conjunto B y se denota por f |B ). Ahora bien, si no se expresa un dominio A de manera expl´ıcita, se entiende que éste es el más grande posible, esto es, el conjunto A de RN donde la expresión f (x) tiene sentido ln(xy) Ejemplo 2.0.6. Calcular el dominio de f (x, y) = p 1 − x2 − y 2 ´ n 2.0.7. El rango o la imagen de una función f : A ⊆ Observacio RN −→ RM es el conjunto f (A) de los valores que toma la función, esto es, los puntos del espacio de llegada, y ∈ RM , que son la imagen y = f (x) de alg´ un x ∈ A. 7

8

2. LÍMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES

2.1.

L´ımite de una funci´ on de varias variables

´ n 2.1.1. Sean A ⊆ RN , a ∈ A0 , l ∈ R, L = (l1 , . . . , lM ), Definicio f : A ⊆ RN −→ R y F : A ⊆ RN −→ RM con F = (f1 , . . . , fM ). Se dice que f tiene l´ımite l en el punto a, y se nota l´ım f (x) = l, si x→a

∀ε > 0, ∃δ > 0 : 0 < kx − ak < δ ⇒ |f (x) − l| < ε. Se dice que F tiene l´ımite L en el punto a, y notaremos igualmente l´ım F (x) = L, si fi tiene l´ımite li en el punto a, o sea, que el l´ımite de x→a una función vectorial se calcula componente a componente: ³ ´ l´ım F (x) = l´ım f1 (x), . . . , l´ım fM (x) . x→a

x→a

x→a

´ n 2.1.2. Para hablar de l´ımite de una función f en un Observacio punto a no es necesario que la función f esté definida en tal punto: basta con que a sea un punto de acumulación del dominio A de f (es decir que podamos acercarnos al punto mediante una sucesión de otros puntos de A que no sean el propio a). De hecho se puede dar una definición equivalente del concepto de l´ımite de una función f en a mediante sucesiones del siguiente modo: l´ım f (x) = l ⇔ ∀{xn } ⊆ A con xn 6= a, ∀n ∈ N y xn → a, f (xn ) → l.

x→a

la cual deja mucho más claro la necesidad de que a sea un punto de acumulación de A para que la definición de l´ımite no sea vac´ıa. ´ n 2.1.3. La notación l´ım f (x) = l encierra realmente Observacio x→a dos afirmaciones: que ese l´ımite realmente existe, o sea, que es un n´ umero real, y que tal l´ımite es, en concreto, el valor l. Para enfatizar este hecho a menudo escribiremos ∃ l´ım f (x) = l, o sólo ∃ l´ım f (x) si x→a x→a no sabemos o no los interesa el valor de ese l´ımite. ´ n 2.1.4 (unicidad del l´ımite). Se puede probar Observacio fácilmente que, el l´ımite de una función en un punto a, si existe, es u ńico. En s´ımbolos: Si l´ım f (x) = l y l´ım f (x) = l0 entonces l = l0 . x→a

x→a

´ n 2.1.5 (a ´ lgebra de l´ımites). Sean f y g dos funProposicio N M ciones de A ⊆ R en R y a ∈ A0 . (i) l´ım (f +g)(x) = l´ım f (x)+ l´ım g(x), si ∃ l´ım f (x) y ∃ l´ım g(x) x→a

x→a

x→a

x→a

x→ a

(ii) l´ım (f g)(x) = l´ım f (x) l´ım g(x), si ∃ l´ım f (x) y ∃ l´ım g(x) x→a

x→a

l´ım f (x)

x→a

x→a

f (x) x→a , si ∃ l´ım f (x) y ∃ l´ım g(x) 6= 0 x→a x→ a x→a g l´ım g(x)

(iii) l´ım

x→a

x→ a

´ ´ ´ 2.2. ALGUNAS TECNICAS Y METODOS PARA EL CALCULO DE LÍMITES 9

2.2.

Algunas t´ ecnicas y m´ etodos para el c´ alculo de l´ımites

2.2.1. L´ımites por caminos y l´ımites direccionales: En R, para acercarnos a un punto a podemos hacerlo de tres maneras: Podemos movernos sólo por puntos situados a la izquierda de a, hacerlo sólo por puntos situados a la derecha de a o hacerlo por ambos lados del punto a. Cuando calculamos el l´ımite de una función real de variable real, estas distintas formas de acercarse a un punto conducen a los conceptos de l´ımite por la izquierda, por la derecha y l´ımite (global) de la función en a y sabemos que la existencia del l´ımite de la función en un punto a es equivalente a que ambos l´ımites laterales existan y tomen el mismo valor real. En RN podemos acercarnos a un punto a de muchas más formas. En general, si f : A ⊆ RN −→ RM y a ∈ A, podemos acercarnos al punto a a través de cualquier subconjunto B ⊆ A tal que a ∈ B 0 . En estas condiciones vamos a denotar por l´ ım f (x) := l´ım f |B (x) x→a

x∈B

x→a

esto es, al l´ımite de f cuando x tiende a a pero moviéndonos sólo a través de los puntos de B. Con esta notación es claro que l´ım f (x) = l ⇒ l´ ım f (x) = l x→a

x→a

x∈B

o sea, que “si existe el l´ımite de f cuando x tiende a a existe entonces existe el l´ımite de f cuando x tiende a a a través de cualquier subconjunto suyo y además coincide con él”. Esta ingenua afirmación es una herramienta muy u ´til para comprobar que ciertas funciones no tienen l´ımite en un punto o para obtener el u ńico candidato a l´ımite posible. Los l´ımites a través de subconjuntos se usan sobre todo tomando como conjunto B ciertos caminos en RN que conducen hacia el punto a, como por ejemplo las rectas que pasan por a. Estos u ´ltimos reciben el nombre de l´ımites direccionales de f en a y para funciones de dos variables son especialmente fáciles de calcular ya que se reducen a l´ımites de funciones reales de variable real. Su doble uso se resume brevemente de la siguiente manera: (1o ) Si existen los l´ımites direccionales de f en a y no son todos iguales, entonces f no tiene l´ımite en a (2o ) Si todos los l´ımites direccionales de f en a son iguales a l, entonces l es el u ńico candidato admisible a l´ımite (o sea, el l´ımite de f en a, si existe, es a la fuerza l)

10 2. LÍMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES

El siguiente ejemplo muestra la utilidad de los l´ımites direccionales para probar la no existencia de l´ımite de una función en un punto. Ejemplo 2.2.1. La función f (x, y) :=

xy x2 +y 2

no tiene l´ımite en (0, 0)

Sin embargo, el que todos los l´ımites direccionales de f en un punto a sean iguales no significa que la función tenga l´ımite (global) como pone de manifiesto el siguiente ejemplo Ejemplo 2.2.2. Todos los l´ımites direccionales en (0, 0) de la fun3 ción f (x, y) = x2x−y valen 0 y sin embargo f no tiene l´ımite en (0, 0). 2.2.2. L´ımites reiterados: Se llaman l´ımites reiterados de una función f de dos variables en un punto (a, b) a los limites dobles ³ ´ ³ ´ l´ım l´ım f (x, y) y l´ım l´ım f (x, y) x→a

x→b

x→b

x→a

donde se entiende que en el l´ımite interior sólo se mueve una variable y la otra se trata como si fuese constante. Cabe preguntarse ¿qué relación existe entre el l´ımite (global) de la función f en (a, b) y sus l´ımites reiterados? El siguiente resultado establece la u ńica relación general entre esos valores. ´ n 2.2.3. Si existe Proposicio

l´ım

(x,y)→(a,b)

f (x, y) = l y existen los

l´ımites reiterados, entonces l´ım l´ım f (x, y) = l´ım l´ım f (x, y) = l. x→a x→b

x→b x→a

Por tanto, podemos usar los l´ımites reiterados de este modo: (1o ) Si l´ım l´ım f (x, y) 6= l´ım l´ım f (x, y) ⇒ f no tiene l´ımite en a x→a x→b

x→b x→a

x→a x→b

x→b x→a

(2o ) Si l´ım l´ım f (x, y) = l´ım l´ım f (x, y) = l ⇒ l es el u ńico candidato admisible a l´ımite Un ejemplo de uso t´ıpico del primer caso es el siguiente: Ejemplo 2.2.4. La función f (x, y) :=

x2 −y 2 x2 +y 2

no tiene l´ımite en (0, 0)

No obstante, ejemplos sencillos ponen de manifiesto que la igualdad de los l´ımites reiterados no garantiza la existencia de l´ımite (global) de la función: Ejemplo 2.2.5. La función f (x, y) := x2xy no tiene l´ımite en (0, 0) +y 2 como ya sabemos y sin embargo sus limites reiterados valen ambos 0. Por otra parte también es importante se˜ nalar que si no existe alguno (o ninguno) de los l´ımites reiterados tampoco podemos asegurar nada: ½ y x≥0 Ejemplo 2.2.6. La función f (x, y) := tiene l´ımite 0 −y x < 0 cuando (x, y) → (0, 0) pero no existe el l´ım f (x, y) para ning´ un y 6= 0. x→0

´ DE VARIAS VARIABLES 2.4. CONTINUIDAD DE UNA FUNCION

11

Ejemplo 2.2.7. La función f (x, y) := x sen( y1 ) + y cos( x1 ) tiene l´ımite 0 cuando (x, y) → (0, 0) y sin embargo no existen ninguno de los dos l´ımites reiterados en (0, 0). 2.2.3. L´ımites en polares: Podemos calcular el l´ımite de una función f (x, y) de dos variables en el punto (0, 0) haciendo el cambio a coordenadas a polares ½ x = r cos θ y = r sen θ Teniendo en cuenta que (x, y) → (0, 0) equivale a r → 0, ∀θ ∈]0, 2π[, l´ım

(x,y)→(0,0)

f (x, y) = l´ım f (r cos θ, r sen θ), ∀θ ∈]0, 2π[ r→0

luego para que ese l´ımite exista no puede depender de θ. Ejemplo 2.2.8. Calcular mediante el cambio a coordenadas polares xy x2 y l´ım y l´ ım (x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2 2.3.

L´ımites en el infinito y funciones divergentes

Si f : RN −→ R, a ∈ RN y l ∈ R también se pueden definir los l´ımites en el infinito y las funciones divergentes en un punto a o el infinito del siguiente modo: • l´ım f (x) = l ⇔ ∀ε > 0, ∃M > 0 : kxk > M ⇒ |f (x) − l| < ε. x→∞

• l´ım f (x) = ∞ ⇔ ∀K > 0, ∃δ > 0 : kx − ak < δ ⇒ |f (x)| > K. x→a

• l´ım f (x) = ∞ ⇔ ∀K > 0, ∃M > 0 : kxk > M ⇒ |f (x)| > K. x→∞

´ n 2.3.1. Notese que para x ∈ RN , la expresión x → Observacio ∞ significa realmente que ||x|| → ∞ (o sea que cubrimos todas las direcciones posibles de RN ). 2.4.

Continuidad de una funci´ on de varias variables

´ n 2.4.1. Sean A ⊆ RN , a ∈ A, f : A ⊆ RN −→ R y Definicio N F : A ⊆ R −→ RM con F = (f1 , . . . , fM ). Se dice que f es continua en el punto a si verifica lo siguiente: ∀ε > 0, ∃δ > 0 : kx − ak < δ ⇒ |f (x) − f (a)| < ε Se dice que F es continua en el punto a si fi es continua en el punto a, ∀i = 1, . . . , M (equivalentemente: ∀ε > 0, ∃δ > 0 : kx − ak < δ ⇒ kf (x) − f (a)k < ε). Además, diremos que f (o F ) es continua en A si y solo si lo es para todo punto a ∈ A.

12 2. LÍMITES Y CONTINUIDAD DE FUNCIONES DE VARIAS VARIABLES

´ n 2.4.2. La continuidad de f (y de F ) se puede definir Observacio también equivalentemente mediante sucesiones del siguiente modo: f es continua en a ⇔ ∀{xn } ⊆ A con xn → a, f (xn ) → f (a). Ejemplo 2.4.3. Demuestre, haciendo uso de la definición de continuidad, que la norma es una aplicación continua de RN en R (pruebe que | kxk − kyk | ≤ kx − yk, ∀x, y ∈ RN ) y que toda aplicación lineal de RN en RM es continua. A la vista de esta definición, la relación entre los conceptos de continuidad y l´ımite es casi inmediata: ´ n 2.4.4. Sean A ⊆ RN , a ∈ A y f : A ⊆ RN −→ RM . Proposicio (i) Si a es un punto aislado de A entonces f es continua en a. (ii) Si a ∈ A0 , f es continua en a si y solo si ∃ l´ım f (x) = f (a). x→a

Puesto que ya sabemos que los l´ımites (cuando existen) se comportan bien con las operaciones algebraicas tenemos, en particular que las sumas, productos y cocientes (por funciones no nulas) de funciones continuas son funciones continuas. Además la composición de funciones continuas es también una función continua. Por tanto, todas las sumas, productos, exponenciales y logaritmos de funciones polinómicas en varias variables (por ejemplo, x, xy, x3 y + 2x2 , cos x, sin(x + y), exp(2x + y), ln(x2 + y 2 ), . . .) son funciones continuas. El u ńico problema que se nos puede presentar es cuando una función f esta definida de distinta forma en distintas regiones del dominio. En esta situación f puede coincidir con una continua en una de tales regiones, pero eso solo nos dice que f , restringida a ese subconjunto del dominio, es continua. El siguiente resultado puede sernos muy u ´til para garantizar la continuidad de f en esa situación, pues afirma que la continuidad de una función en un punto es una propiedad local: la continuidad en un punto a s´ olo depende de los puntos que hay en un entorno de a. ´ n 2.4.5 (cara ´ cter local de la continuidad). Proposicio N ◦ Sean A ⊆ R , a ∈ A y f : A ⊆ RN −→ RM . (i) Si f |Ba (ε) es continua en a, entonces f es continua en a. (ii) Si B ⊆ A, B abierto, f |B es continua en B, entonces f es continua en B. ½ x2 y (x, y) 6= (0, 0) x2 +y 2 Ejemplo 2.4.6. f (x, y) := es continua 0 (x, y) = (0, 0)

´ DE VARIAS VARIABLES 2.4. CONTINUIDAD DE UNA FUNCION

13

Recordemos que para funciones f reales de variable real sabemos que la imagen mediante una función continua de un intervalo compacto es un intervalo compacto. Para funciones de varias variables la propiedad que se verifica, en general, es que la imagen mediante una funci´ on continua de una conjunto compacto es un compacto, esto es, Teorema 2.4.7 (propiedad de compacidad). Sea A ⊆ RN . Si f : A −→ RM es una función continua y A es compacto, entonces f (A) es compacto. Este resultado nos dice, en particular, que las funciones reales de varias variables sobre compactos siguen teniendo máximo y m´ınimo absoluto. Corolario 2.4.8 (teorema de Weierstrass). Sea A ⊆ RN . Si f : A −→ R es continua y A es compacto, entonces f alcanza su m´ aximo y su m´ınimo en A. Acabamos de asegurar que las funciones continuas transforman compactos en compactos. No ocurre lo mismo con los abiertos ni con los cerrados: Una función continua puede trasformar abiertos en conjuntos que no sean abiertos y cerrados en conjuntos que no sean cerrados (incluso una función real de variable real). Lo que ocurre en realidad es que es la imagen inversa de una función continua la que se comporta bien con los abiertos y con los cerrados. De hecho podemos caracterizar las funciones continuas mediante esa propiedad del siguiente modo: Teorema 2.4.9. Sea f : A ⊆ RN −→ RM . (i) f es continua si y solo si f −1 (E) es un abierto de RN cortado con A para todo E abierto de RM . (ii) f es continua si y solo si f −1 (F ) es un cerrado de RN cortado con A para todo F cerrado de RM . Sin embargo esta caracterización de la continuidad se suele usar más en el sentido contrario que para estudiar la continuidad de una función dada: Se suele emplear para probar que ciertos conjuntos (definidos mediante una función continua de sus coordenadas) son abiertos o cerrados. Por ejemplo, se puede ver de este modo que las bolas abiertas son conjuntos abiertos, pues se pueden expresar como Ba (ε) = {x ∈ RM : kx − ak < ε} = f −1 ( ] − ∞, ε[ ), siendo f la función f : RN −→ R dada por f (x) := kx − ak que es claramente continua.

CAP´ıTULO 3

´ DE FUNCIONES DE DIFERENCIACION VARIAS VARIABLES 3.1.

Derivadas parciales y derivadas direccionales

Pretendemos extender la noción de derivabilidad de una función f : R −→ R a funciones de varias variables. Recordemos que f es derivable en un punto a si existe el siguiente l´ımite (expresado de cualquiera de estas dos formas equivalentes): f (a + h) − f (a) f (x) − f (a) = l´ım . x→a h→0 h x−a Si tenemos ahora una función f : A ⊆ RN −→ R, el modo más sencillo de proceder es intentar reducirnos al caso unidimensional, considerando la función f como si fuese una función de una u ńica variable, es decir, manteniendo fijas todas las variables menos una. Esto nos conduce al concepto de derivada parcial de una función de varias variables f 0 (a) = l´ım

´ n 3.1.1. Sea f : A ⊆ RN −→ R, a ∈ A0 , a = (a1 , . . . , aN ). Definicio Se dice que f es derivable (parcialmente) en a con respecto a la variable xi , para i = 1, . . . , N , si existe el siguiente l´ımite ∂f f (a1 , . . . , ai + h, . . . , aN ) − f (a1 , . . . , a2 ) (a) := l´ım h→0 ∂xi h que llamaremos derivada parcial de f en a respecto a xi . ∂f es la Si no se expresa un punto a concreto se entiende que ∂x i ∂f función de varias variables ∂xi (x) definida en todos los puntos x ∈ R en los cuales f es derivable con respecto a xi . Para N = 2, las derivadas parciales de f en a = (a1 , a2 ) quedan as´ı: f (a1 + h, a2 ) − f (a1 , a2 ) ∂f (a1 , a2 ) = l´ım h→0 ∂x h ∂f f (a1 , a2 + h) − f (a1 , a2 ) (a1 , a2 ) = l´ım h→0 ∂y h ´ n 3.1.2. Si definimos las funciones reales de variable Observacio real u y v como u(x) := f (x, a2 ) y v(y) := f (a1 , y), es claro que las 15

16

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

parciales de f no son otra cosa que las derivadas de u y v en a2 y a1 , respectivamente, pues ∂f u(a1 + h) − u(a1 ) (a1 , a2 ) = l´ım = u0 (a1 ) h→0 ∂x h ∂f v(a2 + h) − v(a2 ) (a1 , a2 ) = l´ım = v 0 (a2 ) h→0 ∂x h Por lo tanto, podemos calcular las derivadas parciales de f derivando las funciones reales de variable real u y v. Pero u y v no son otra cosa que f cuando se fija una de sus variables, luego lo que estamos diciendo es que podemos calcular las parciales de f derivando f como si sólo dependiese de una variable y la otra fuese constante. Lo bueno de este procedimiento es que nos permite usar todos las técnicas que ya conocemos para derivar funciones reales de variable real a la hora de calcular derivadas parciales, lo que facilita enormemente su cálculo. Ejemplo 3.1.3. Para f (x, y) = x2 y + 2xy 3 + 4x, se tiene que = 2xy + 2y 3 + 4 y ∂f (x, y) = x2 + 6xy 2 , ∀(x, y) ∈ R2 ∂y

∂f (x, y) ∂x

El problema que presenta el concepto de derivada parcial es que la existencia de todas las derivadas parciales de una función f en un punto no garantiza la continuidad de f en tal punto, luego el concepto de derivada parcial no generaliza adecuadamente al de derivabilidad de funciones reales de variable real ya que no conserva una de sus principales propiedades. ½ 1 si x = 0 ó y = 0 Ejemplo 3.1.4. f (x, y) := en (0, 0). 0 si x 6= 0 e y 6= 0 Este mal comportamiento de las derivadas parciales de una función f se debe a que las derivadas parciales nos dan sólo una visión parcial de la función. En concreto, las derivadas parciales de f en a nos proporcionan la pendiente de la recta tangente a la gráfica de f en las direcciones de las variables y eso, en general, no nos dice nada del comportamiento global de la función en un entorno del punto a. Esta idea de derivar en la dirección de las variables se puede generalizar a cualquier vector de RN del siguiente modo: ´ n 3.1.5. f : A ⊆ RN −→ R, a ∈ A0 , v ∈ RN (kvk = 1). Definicio Se dice que f es derivable en a seg´ un el vector v si existe el siguiente l´ımite f (a + hv) − f (a) ∂f (a) := l´ım Dv f (a) = h→0 ∂v h que llamaremos derivada (direccional) de f en a seg´ un (la direcci´ on del vector) v.

3.2. DIFERENCIAL Y GRADIENTE

3.2.

17

Diferencial y gradiente de una funci´ on real de varias variables. Relaci´ on e interpretaci´ on geom´ etrica

Como la existencia de todas las derivadas direccionales de una función en un punto no implica la continuidad de la función en dicho punto, el concepto de derivada direccional no extiende satisfactoriamente el caso real. Por ello vamos a introducir un nuevo concepto, el de diferencial de una función de varias variables, que si extiende el concepto de derivada adecuadamente, esto es, conservando sus principales propiedades. La noción de diferenciabilidad surge de manera natural a partir de la siguiente reformulación de la derivabilidad de funciones de reales de variable real f : A ⊆ R −→ R: f es derivable en a ⇔ f 0 (a) = f (a + h) − f (a) f (a + h) − f (a) − f 0 (a)h l´ım ⇔ l´ım = 0 ⇔ existe h→0 h→0 h h una aplicación lineal D : R −→ R, dada por D(h) = f 0 (a)h, tal que f (a + h) − f (a) − D(h) l´ım 0. h→0 h ´ n 3.2.1. Sea A ⊆ RN abierto, f : A ⊆ RN −→ R, a ∈ A. Definicio Se dice que f es diferenciable en el punto a si existe una aplicación lineal (necesariamente u ńica por ser A abierto) que denotaremos por df (a) o Df (a) y llamaremos diferencial de f en a , tal que f (a + h) − f (a) − df (a)(h) l´ım = 0. h→0 khk ´ n 3.2.2. Nótese que aqu´ı h = (h1 , h2 , . . . , hN ) es un Observacio incremento para cada una de las variables de f , es decir, que estamos moviendo todas las variables de f (a diferencia de lo que hemos estado haciendo hasta ahora, donde la h era un n´ umero real). En primer lugar veamos que la diferenciabilidad es un concepto más fuerte, más restrictivo, que el de la derivabilidad seg´ un cualquier vector y por tanto que la derivabilidad parcial. Teorema 3.2.3 (conds. necesarias de diferenciabilidad). Si f es diferenciable en a entonces f es derivable en a seg´ un cualquier vector v ∈ RN con Dv f (a) = df (a)(v). En particular, si f es diferenciable en a entonces existen todas las derivadas parciales de f en a y ∂f (a) = df (a)(ei ), ∀i = 1, . . . , N, ∂xi siendo {e1 , . . . , eN } la base can´ onica de RN .

18

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

El resultado anterior nos dice en particular que la existencia de derivadas parciales (y en general, de cualquier derivada direccional) de una función en un punto es una condici´ on necesaria para que la función pueda ser diferenciable en ese punto. Pero a´ un podemos extraer más información del resultado anterior: Como la diferencial de una función f sobre la base canónica esté dada por las parciales de de f se deduce inmediatamente que las derivadas parciales de f determinan a la diferencial de f de la siguiente manera Corolario 3.2.4. Si f es diferenciable en a entonces la diferencial de f en a es la aplicaci´ on lineal de RN en R dada por ∂f ∂f df (a)(x1 , . . . , xN ) = (a) x1 + · · · + (a) xN . ∂x1 ∂xN ´ n 3.2.5. A menudo (sobre todo, cuando la diferencial Observacio se calcula en un punto arbitrario x de RN ) se usa como variable de df (x) el vector dx = (dx1 , . . . , dxN ) pues se entiende que la diferencial de f en x act´ ua sobre un incremento dx de la variable x. Con esta notación la diferencial quedar´ıa expresada del siguiente modo: ∂f ∂f df (x)(dx1 , . . . , dxN ) = (x) dx1 + · · · + (x) dxN ∂x1 ∂xN o más abreviadamente (omitiendo todas las variables para simplificar la notación), ∂f ∂f df = dx1 + · · · + dxN . ∂x1 ∂xN ´ n 3.2.6. Sea A ⊆ RN abierto, a ∈ A0 y f : A ⊆ RN −→ R Definicio parcialmente derivable en a con respecto a xi , ∀i = 1, . . . , N . Se llama vector gradiente de f en a al siguiente vector de RN ¶ µ ∂f ∂f (a), . . . , (a) ∇f (a) := ∂x1 ∂xN Corolario 3.2.7. El vector gradiente de una función f diferenciable en un punto a es la matriz asociada a la diferencial de f en a respecto de las bases canónicas de RN y R. Por tanto, la diferencial de f en a act´ ua as´ı   ¶ x1 µ ∂f ∂f (a), . . . , (a)  ...  df (a)(x1 , . . . , xN ) = ∂x1 ∂xN xN lo cual también se puede interpretar como el producto escalar del vector gradiente ∇f (a) por el vector (x1 , . . . , xN ), esto es df (a)(x) = ∇f (a) · x, ∀x ∈ RN .

3.2. DIFERENCIAL Y GRADIENTE

19

Por tanto, las derivadas parciales de una función f me dan toda la información que necesito para poder estudiar la diferenciabilidad de tal función, ya que (1o ) Si no existe alguna derivada parcial de f en un punto a entonces f no es diferenciable en ese punto. (2o ) Si existen todas las derivadas parciales de f en a entonces tenemos la u ńica aplicación lineal D candidata a ser la df (a): ∂f ∂f la dada por D(x1 , . . . , xN ) = ∂x (a) x1 + · · · + ∂x (a) xN . 1 N Además, las derivadas direccionales permiten dar una interesante interpretación geométrica del vector gradiente: Como Dv f (a) = df (a)(v) = ∇f (a) · v, ∀v ∈ RN , tenemos que Dv f (a) = k∇f (a)kkvk cos θ, siendo θ el ángulo entre ∇f (a) y v, de lo que se deducen las siguientes consecuencias: Corolario 3.2.8. Sea A ⊆ RN abierto, f : A ⊆ RN −→ R, a ∈ A. ∀v ∈ RN con kvk = 1 se tiene que −k∇f (a)k ≤ Dv f (a) ≤ k∇f (a)k (las derivadas direccionales de la función están acotadas por la norma del gradiente). Adem´ as, ∇f (a) (i) Dv f (a) = k∇f (a)k ⇔ v = (La derivada direccional k∇f (a)k m´ axima se alcanza sólo en la direcci´ on del gradiente). ∇f (a) (ii) Dv f (a) = −k∇f (a)k ⇔ v − (La derivada direck∇f (a)k cional m´ınima se alcanza s´ olo en la direcci´ on opuesta). (iii) Dv f (a) = 0 ⇔ v ⊥ ∇f (a) (La derivada direccional se anula u ńicamente en la direcci´ on perpendicular a la del gradiente). Por lo tanto, (1o ) El vector gradiente los proporciona la dirección de máximo crecimiento del la función. o (2 ) La dirección opuesta a la del gradiente es la dirección de máximo decrecimiento de la función. o (3 ) La dirección perpendicular a la del gradiente es la de m´ınima variación de la función. (De hecho, el gradiente es un vector perpendicular a las curvas de nivel de la función). Ejemplo 3.2.9. Sea T (x, y) = 100 − x2 − y 2 la temperatura de una placa con un foco de calor en el punto (0, 0) y supongamos que una part´ıcula se encuentra en le punto (1, 1). ¿En que dirección debe

20

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

moverse la part´ıcula sobra la placa para hacerlo sobre la mayor temperatura posible?, ¿y la menor?, ¿y para que su temperatura var´ıa lo menos posible? Por otra parte, la diferenciabilidad de una función si conserva una propiedad fundamental de la derivabilidad de funciones reales de variable real, pues la continuidad de una función es también una condición necesaria para la diferenciabilidad de tal función. Teorema 3.2.10 (2a cond. necesaria de diferenciabilidad). Si una función f es diferenciable en a entonces f es continua en a. De hecho, lo u ńico que le falta a una función continua en un punto a para ser diferenciable es que se pueda aproximar en un entorno del punto a mediante una función af´ın. Esto es lo que afirma el siguiente resultado, el cual nos proporciona la interpretación geométrica de la diferenciación de funciones de varias variables. Teorema 3.2.11. Las siguientes afirmaciones son equivalentes: (i) f es diferenciable en a. (ii) f es continua en a y existe una aplicaci´ on af´ın g : RN −→ R f (x) − f (a) tal que l´ım = 0. x→a x−a Adem´ as, en tal caso, g es forzosamente la aplicaci´ on dada por g(x) := f (a) + ∇f (a) · (x − a), ∀x ∈ RN . ´ n geome ´trica de la dif.). Corolario 3.2.12 (interpretacio N Sea A ⊆ R abierto, f : A −→ R y a ∈ A con a = (a1 , . . . , aN ). La gráfica de la aplicaci´ on g del teorema anterior, esto es el conjunto {(x1 , . . . , xN , xN +1 ) : xN +1 = g(x1 , . . . , xN )}, es el hiperplano de RN +1 dado por la ecuaci´ on xN +1 = f (a) +

∂f ∂f (a) (x1 − a1 ) + · · · + (a) (xN − aN ) ∂x1 ∂xN

que, evidentemente, pasa por el punto (a1 , . . . , an , f (a)) de RN +1 . Si f es diferenciable en a este hiperplano recibe el nombre de hiperplano tangente a la gráfica de f en a, ya que es el que mejor aproxima a la gráfica de f en un entorno de a. Para N = 1, se trata de la (ya conocida) recta tangente a la gráfica y = f (x) en a: y = f (a) + f 0 (a)(x − a)

3.3. DIFERENCIAL Y MATRIZ JACOBIANA

21

Para N = 2, lo que nos queda es la ecuaci´ on del plano tangente a la gráfica z = f (x, y) en (a1 , a2 ): z = f (a) +

∂f ∂f (a) (x − a1 ) + (a) (y − a2 ) ∂x ∂y

Ejemplo 3.2.13. Determinar el plano tangente a la gráfica de f (x, y) = x2 + y 2 en el punto (1, 1). Hasta ahora hemos estado viendo condiciones necesarias para la diferenciabilidad de una función que se pueden usar para probar que una función no es diferenciable en un punto pero no para comprobar que sea diferenciable. A continuación vamos a presentar una sencilla condición suficiente para la diferenciabilidad que evita tener que recurrir a la definición de diferenciabilidad en muchos casos. ´ n 3.2.14. Sea A ⊆ RN abierto y f : A −→ R. Se dice Definicio que f es de clase C 1 en A, y se nota f ∈ C 1 (A), si existen todas las derivadas parciales de f en A y son continuas. Teorema 3.2.15 (cond. suficiente de diferenciabilidad). Si f es de clase C 1 en A entonces f es diferenciable en A. Sin embargo el rec´ıproco del teorema anterior no es cierto en general, es decir que no todas las funciones diferenciables son de clase C 1 , como pone de manifiesto el siguiente ejemplo. Ejemplo 3.2.16. La función f definida por ( (x2 + y 2 ) sin √ 21 2 (x, y) 6= (0, 0) x +y f (x, y) = 0 (x, y) = (0, 0) es diferenciable en todo R2 y sin embargo sus derivadas parciales no son continuas en el punto (0, 0). 3.3.

Diferencial y matriz jacobiana de una funci´ on vectorial de varias variables. Regla de la cadena

´ n 3.3.1. Sea A ⊆ RN abierto, a ∈ A y F : A −→ RM , Definicio F = (f1 , . . . , fM ). Se dice que F es diferenciable en a si todas sus funciones coordenadas fi lo son y, en tal caso, la diferencial de F en a es la aplicación lineal dF (a) : (df1 , . . . , dfM ).

22

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

´ n 3.3.2. Sea A ⊆ RN abierto, a ∈ A y F : A −→ RM , Definicio F = (f1 , . . . , fM ). Se llama matriz jacobiana de f en a a la matriz  ∂F1  ∂F1 (a) · · · ∂x (a) ∂x1 N   .. .. JF (a) :=   . . ∂FM (a) ∂x1

···

∂FM (a) ∂xN

y su determinante se denomina determinante jacobiano de f en a. ´ n 3.3.3. También se emplea la notación F 0 (a) para la Observacio matriz jacobiana de F en a, ya que si f es una función real de variable real (esto es M = N = 1) la matriz jacobiana f 0 (a) queda la matriz de orden 1, (f 0 (a)). Teorema 3.3.4. La matriz Jacobiana de F en a es la matriz asociada a la diferencial de F en a respecto de las bases can´ onicas de RN y RM . Por tanto, dF (a)(x) = F 0 (a) · x, esto es, la dF (a) act´ ua as´ı:  ∂F1    ∂F1 (a) · · · ∂x (a) x1 ∂x1 N    ..  .. .. dF (a)(x1 , . . . , xM ) =   . . . ∂FM (a) ∂x1

···

∂FM (a) ∂xN

xN

Ejemplo 3.3.5. La matriz jacobiana de F (x, y) = (x2 + y, exy ) es µ ¶ 2x 1 JF (x, y) = yexy xexy Teorema 3.3.6 (regla de la cadena). Sean A ⊆ RN , B ⊆ RM abiertos, f : A −→ RM , g : B −→ RP con f (A) ⊆ B y a ∈ A. Si f es diferenciable en a y g es diferenciable en f (a) entonces h := g ◦ f es diferenciable en a con dh(a)dg(f (a)) ◦ df (a). Por tanto, matricialmente, Jh(a) = Jg(f (a)) · Jf (a), esto es  ∂h1   ∂g1   ∂f1  ∂g1 ∂f1 ∂h1 · · · · · · · · · ∂y1 ∂yM ∂x1 ∂xN ∂x1 ∂xN  .. ..  =  .. ..   .. ..   .     . . . . .  ∂hP ∂hP ∂gP ∂fM ∂gP ∂fM · · · ∂xN · · · ∂yM · · · ∂xN ∂x1 ∂y1 ∂x1 donde la primera y la u ´ltima de esas matrices están evaluadas en el punto a mientras que la de en medio se eval´ ua en f (a). As´ı pues, para todo i = 1, . . . , P y para todo j = 1, . . . , N , se tiene la siguiente relaci´ on entre las derivadas parciales de la composici´ on y las de las funciones que se componen: M

X ∂gi ∂fk ∂hi (a) = (f (a)) (a) ∂xj ∂y ∂x k j k=1

3.3. DIFERENCIAL Y MATRIZ JACOBIANA

23

Cuando la regla de la cadena se aplica en todo el dominio de las funciones involucradas se puede interpretar del siguiente modo: Estamos realizando un cambio de variables y = f (x), esto es   y1 = f1 (x1 , . . . , xN ) .. .. .  . yM = fM (x1 , . . . , xN ) en la función g(y1 , . . . yM ), de manera que al sustituir se obtiene una nueva función g(f1 (x), . . . , fM (x)) que ya sólo depende de las variables x = (x1 , . . . , xN ), y queremos calcular las derivadas parciales de esta u ´ltima función a partir de las parciales de la función original g y las parciales de la función del cambio de variable f . Por este motivo se suelen hacer las siguientes simplificaciones que facilitan mucho su expresión y comprensión: (1o ) Se omiten los puntos a y f (a) donde se aplican las parciales. (2o ) Las funciones coordenadas fk del cambio de variable f se denotan igual que las variables de g, esto es se entiende que f es el cambio de variables   y1 = y1 (x1 , . . . , xN ) .. .. . .  yM = yM (x1 , . . . , xN ) (3o ) La composición h se sigue denotando como la función g pero ahora directamente como función de las variables (x1 , . . . , xN ) después de haber realizado el cambio de variables. Es decir que la función g(y) de las variables y = (y1 , . . . , yM ) (antes del cambio de variables) se puede ver también como función g(x) de las variables x = (x1 , . . . , xN ) directamente (después de cambio de variables) entendiendo que g(x) := g (y1 (x1 , . . . , xN ), . . . , yM (x1 , . . . , xN )) Con esta nueva notación la regla de la cadena queda as´ı: ∂gi ∂gi ∂yM = xj + · · · + ∂xj ∂yM ∂xj y se puede interpretar de la siguiente manera: “cuando en una función g(y1 . . . , yM ) se realiza un cambio de variables, yk = yk (x1 , . . . , xN ), ∀k = 1, . . . M , podemos calcular la derivada de la componente gi de la función resultante con respecto de una de las variables xj sumando todas las derivadas de gi con respecto a todas sus variables yk pero, como a su vez estas variables son funciones de xj , hay que multiplicar cada una de ellas por su derivada con respecto a xj ”.

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

24

3.4.

Funciones definidas de forma impl´ıcita. El teorema de la funci´ on impl´ıcita

Hasta ahora hemos tratado con funciones dadas forma expl´ıcita, esto es, definidas por medio de una expresión expl´ıcita f : RN −→ RM de la función que me permite calcular directamente su vector imagen y = (y1 , . . . , yM ) en cualquier punto x = (x1 , . . . , xN ) mediante la fórmula y = f (x). Sin embargo, a menudo encontraremos funciones definidas de forma impl´ıcita por medio de una ecuación F (x, y) = 0 siendo F : D ⊆ RN +M −→ RM , en el sentido de que existe una u ńica función f : A ⊆ N M R −→ R tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ D. Ejemplo 3.4.1. 2x3 + y + yx2 + 3 = 0 ⇔ y =

−2x3 − 3 1 + x2

Obviamente toda función dada de forma expl´ıcita y = f (x) se puede dar también de forma impl´ıcita F (x, y) = 0, sin más que definir F (x, y) := y − f (x), pero no siempre podremos obtener la forma expl´ıcita a partir de una ecuación impl´ıcita F (x, y) = 0 ya que para ello tendr´ıamos que poder despejar las variables y = (y1 , . . . , yM ) en función de las variables x = (x1 , . . . , xN ) y eso no siempre será posible o sencillo Ejemplo 3.4.2. y 3 + y 2 − 5y − x2 + 4 = 0 ⇔ ¿ y = f (x) ? Además, a´ un en el caso de que tal despeje se pudiese realizar, no siempre se va a poder hacer de forma u ńica, como se pone de manifiesto con este sencillo ejemplo. √ √ Ejemplo 3.4.3. x2 + y 2 = 1 ⇔ y = 1 − x2 ó y = − 1 − x2 No obstante, si planteamos el problema de despejar ciertas variables de la ecuación F (x, y) = 0 desde un punto de vista local (es decir, en un entorno de cada punto que verifica esa ecuación) la situación mejora notablemente. El Teorema de la Función Impl´ıcita (T.F.I.) proporciona unas condiciones que garantizan que, localmente, se pueden despejar las variables y de una ecuación F (x, y) = 0 en función de las x. Comencemos analizando los casos más sencillos en los que se puede plantear este problema, que es cuando x e y representan u ńicamente un par de variables reales o cuando queremos despejar una variable real z en función de otras dos (x, y). En ambos casos la regla de la cadena nos proporciona una sencilla fórmula para calcular las derivadas parciales de la función expl´ıcita f a partir de las derivadas parciales de la función impl´ıcita F de la que partimos, F : D ⊆: RN −→ R.

3.4. FUNCIONES DEFINIDAS DE FORMA IMPLÍCITA

25

Teorema 3.4.4 (N=2). Sea F : D ⊆: R2 −→ R, F ∈ C 1 (D), D abierto, a = (a1 , a2 ) ∈ D con F (a1 , a2 ) = 0 y ∂F (a1 , a2 ) 6= 0. ∂y Entonces F define a y impl´ıcitamente como función de x en un entorno de (a1 , a2 ), esto es, existen A1 , A2 ⊆ R, abiertos con a1 ∈ A1 y a2 ∈ A2 y existe una u ńica función f : A1 −→ A2 tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ A1 × A2 . 1

Adem´ as f ∈ C (A1 ) y

∂f ∂x

=

∂F ∂x − ∂F ∂y

en todo A1 .

Teorema 3.4.5 (N=3). Sea F : D ⊆: R3 −→ R, F ∈ C 1 (D), D abierto, a = (a1 , a2 , a3 ) ∈ D con F (a1 , a2 , a3 ) = 0 y ∂F (a1 , a2 , a3 ) 6= 0. ∂z Entonces F define a y impl´ıcitamente como función de (x, y) en un entorno de a, esto es, existen A1 ⊆ R2 , A2 ⊆ R abiertos con (a1 , a2 ) ∈ A1 y a3 ∈ A2 y existe una u ńica función f : A1 → A2 tal que F (x, y, z) = 0 ⇔ z = f (x, y), ∀(x, y, z) ∈ A1 × A2 . 1

Adem´ as f ∈ C (A1 ) y

∂f ∂x

=

∂F ∂x − ∂F ∂z

y

∂f ∂y

=−

∂F ∂y ∂F ∂z

en A1 .

Por tanto la ecuaci´ on del plano tangente a la superficie dada por la ecuaci´ on F (x, y, z) = 0 en el punto a es ∂F ∂F ∂F (a)(x − a1 ) + (a)(y − a2 ) + (a)(z − a3 ) = 0 ∂x ∂y ∂z esto es, ∇F (a) es el vector normal tal superficie. En su forma más general, esto es cuando tenemos una función F con N + M variables igualada a cero y queremos despejar de esa ecuación M de tales variables, el teorema quedar´ıa de la siguiente manera: ´ n impl´ıcita). Sea Teorema 3.4.6 (el teorema de la funcio N +M M 1 F : D ⊆: R −→ R , F ∈ C (D), D abierto, (a, b) ∈ RN +M N M (a ∈ R , b ∈ R ) con F (a, b) = 0 y det J(F, y1 , . . . , yM ) 6= 0, siendo  ∂F1  ∂F1 (a, b) · · · ∂y (a, b) ∂y1 M   .. .. J(F, y1 , . . . , yM ) :=   . . ∂FM (a, b) ∂y1

···

∂FM (a, b) ∂yM

Entonces F define a y = (y1 , . . . , yM ) impl´ıcitamente como función de x = (x1 , . . . , xN ) en un entorno de (a, b), esto es, existen A ⊆ RN , B ⊆ RM abiertos con a ∈ A y b ∈ B y existe una u ńica función f : A −→ B tal que F (x, y) = 0 ⇔ y = f (x), ∀(x, y) ∈ A × B. Adem´ as f ∈ C 1 (A) y sus derivadas parciales se pueden calcular resolviendo el sistema lineal J(F, y1 , . . . , yM ) · Jf (a, b) = −J(F, x1 , . . . , yN )

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

26

3.5.

Derivadas parciales y diferencial de orden superior. Matriz hessiana de una funci´ on real de varias variables

∂f Si tenemos una función f : A −→ R la funciones ∂x , ∀i = 1, . . . , N i reciben el nombre genérico de derivadas parciales de orden 1 de f (y se notan también por fxi ). Al igual que para funciones reales de variable real, el proceso de derivación parcial también se puede reiterar sólo que ahora cada una de las derivadas parciales de f la podremos derivar de nuevo (donde se pueda) con respecto a cada una de las N variables que tiene. De este modo se obtienen las N 2 derivadas parciales de orden 2 de f :

´ n 3.5.1. Sea f : A −→ R, A abierto, a ∈ A. Se llama Definicio derivada parcial segunda (o de orden 2) de f en a respecto de xi y xj al valor ³ ´ ∂f ∂ 2 ∂xi ∂ f (a) : (a) ( o bien, fxi xj = (fxi )xj ) ∂xi ∂xj ∂xj En particular, una función f de dos variables tiene 4 funciones derivadas parciales segundas, ∂ 2f ∂2f ∂ 2f ∂ 2f , , , ∂x2 ∂x∂y ∂y∂x ∂y 2 A las parciales de en medio se les llama derivadas parciales cruzadas de f . Ejemplo 3.5.2. Si f (x, y) = 3xy 2 − 2y + 5x2 y 2 se tiene que fx (x, y) = 3y 2 + 10xy 2 fxx (x, y) = 20y 2 fyx (x, y) = 6y + 20xy

fy (x, y) = 6xy − 2 + 10x2 y fxy (x, y) = 6y + 20xy fyy (x, y) = 6 + 20x2

Se observa en el ejemplo anterior que las parciales cruzadas de f coinciden. Aunque esto se verifica frecuentemente no ocurre en general como pone de manifesto el siguiente ejemplo Ejemplo 3.5.3. La función f dada por ½ 2 −y 2 xy xx2 +y (x, y) 6= (0, 0) 2 f (x, y) = 0 (x, y) = (0, 0) verifica que fxy (0, 0) = −1 y fyx (0, 0) = 1. El siguiente teorema proporciona una condición suficiente para que las derivadas parciales cruzadas coincidan.

3.5. DERIVADAS PARCIALES Y DIFERENCIAL DE ORDEN SUPERIOR

27

Teorema 3.5.4 (de schwartz). Si fx , fy , fxy , fyx son continuas en un abierto R de R2 entonces fxy = fyx en todo R. Las definiciones anteriores se pueden extender por recurrencia a un orden cualquiera n + 1. As´ı pues, supuestas ya definidas las derivadas parciales de orden n de f , se define la derivada parcial de orden n + 1 de f en a respecto de las variables xi1 , . . . , xin+1 (con i1 ,. . . , in+1 ∈ {1, . . . , N }) del siguiente modo: ³ n ´ f ∂ ∂xi∂ ···x ∂ (n+1) f in 1 (a) := (a) ∂xi1 · · · ∂xin+1 ∂xin+1 ´ n 3.5.5. Se dice que f es de clase C n en A, y se nota Definicio f ∈ C n (A), si todas las derivadas parciales de orden n existen y son continuas en A Corolario 3.5.6. Si f es de clase C n en A las derivadas parciales de cualquier orden r ≤ n no dependen del orden en que derivemos Del mismo modo que hemos introducido las derivadas parciales de orden n se puede hacer algo similar con el concepto de diferencial, pues podemos definir el diferencial de orden n de una función real de varias variables. Empecemos con el caso n = 2, que es el más importante. Observemos que el diferencial de una función f : A ⊆ RN −→ R se puede ver como una aplicación df que depende tanto del punto x donde la calculamos como del vector h donde se eval´ ua: ½ N X ∂f ∀x = (x1 , . . . , xN ) ∈ RN df (x)(h) = (x)hj , ∀h = (h1 , . . . , hN ) ∈ RN ∂xj j=1

Si variamos sólo el vector h, h 7→ df (x)(h) es una aplicación lineal de RN en R, pero si variamos sólo el punto x tenemos una aplicación x 7→ df (x)(h) (continua, si f es de clase C 1 en A) de RN en R a la que podemos calcular de nuevo su diferencial, y que denotaremos por df (h) (la diferencial de f pero como función de x) ´ n 3.5.7. Se define el diferencial de orden 2 como la apliDefinicio 2 cación d f que a cada punto a (tal que df (h) exista en un entorno suyo para todo h) le hace corresponder la aplicación d2 f (a) dada por d2 f (a)(h) = d(df (h))(a) (abreviadamente d2 f = d(df )). ´ n 3.5.8. Se llama matriz hessiana de f en a a la matriz Definicio   ∂2f ∂2f (a) · · · (a) 2 ∂x1 ∂xN  ∂x1.  ..   . Hf (a) =  . .  2 2 ∂ f ∂ f (a) · · · (a) ∂xN ∂x1 ∂x2 N

28

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

Teorema 3.5.9. El diferencial de orden dos d2 f en un punto a es una forma cuadrática cuya matriz asociada respecto de la base can´ onica N de R es la matriz hessiana Hf en el punto a, o sea que, para cada h = (h1 , . . . , hN ) ∈ RN , d2 f act´ ua as´ı:   h1 d2 f (a)(h) = (h1 , . . . , hN ) · Hf (a) ·  ...  hN En particular, para N = 2 tenemos que d2 f (a)(h1 , h2 ) =

∂ 2f ∂ 2f ∂ 2f 2 (a)h + 2 (a)h h + (a)h22 1 2 1 ∂x2 ∂x∂y ∂y 2

o, usando la notación (h1 , h2 ) = (dx, dy) y omitiendo el punto a, d2 f =

∂ 2f 2 ∂ 2f ∂2f 2 dx + 2 dxdy + dy ∂x2 ∂x∂y ∂y 2

Reiterando este proceso se pueden definir de forma análoga el diferencial de orden 3 de f , d3 f , el de orden 4, d4 f , y, en general, el diferencial de orden n, dn f . Por ejemplo, d3 f actuar´ıa as´ı: 3

d f (a)(h1 , h2 , h3 ) =

N X N X N X i=1 j=1 k=1

3.6.

∂ 3f (a)h1 h2 h3 ∂xi ∂xj ∂xk

El teorema de Taylor en varias variables

Hasta ahora sabemos que las funciones diferenciables se pueden aproximar por medio funciones afines (cuyas ecuaciones no son otra cosa que polinomios de grado 1). El teorema de Taylor trata de mejorar esta aproximación utilizando para ello polinomios en varias variables de grado superior, para lo cual necesitaremos que la función posea diferenciales de orden superior. Además el teorema de Taylor nos dará también una expresión para el error que se comete al aproximar un valor de una función por el valor correspondiente de los polinomios de Taylor. Recordemos que para una función f : I ⊆ R −→ R, f ∈ C n (I) siendo I un intervalo de R y para todo x, a ∈ I el teorema de Taylor para funciones reales de variable real nos garantiza la existencia de un c en el intervalo de extremos a y x tal que f (x) = Pn (x)+Rn (x), siendo 1 1 0 f (a)(x − a)2 + · · · + f (n) (a)(x − a)n 2! n! 1 Rn (x) := f (n+1) (c)(x − a)n+1 (n + 1)!

Pn (x) := f (a) + f 0 (a)(x − a) +

3.6. EL TEOREMA DE TAYLOR EN VARIAS VARIABLES

29

En el caso general, para una función de N variables, esas funciones se definen de la siguiente manera: ´ n 3.6.1. Sea f : A ⊆ RN −→ R. Se llama polinomio de Definicio Taylor de orden n de f en a al polinomio Tn (f, a) = Pn dado por 1 1 Pn (x) := f (a) + df (a)(x − a) + df 2 (a)(x − a) + · · · + df n (a)(x − a) 2! n! y se llama resto de Taylor de orden n de f en a a la función R(x) := f (x) − Pn (x) Además, para funciones de varias variables, el papel que despe˜ na el intervalo de extremos a y x va a ser llevado a cabo por el segmento de extremos a y x. Dados un par de puntos a y b de RN , el segmento de extremos a y b se puede definir, de un modo riguroso, como el conjunto [a, b] := {ta + (1 − t)b : 0 ≤ t ≤ 1} donde los puntos a y b se obtienen para los valores t = 1 y t = 0 respectivamente, por lo que también es coherente denotar por ]a, b[:= {ta + (1 − t)b : 0 < t < 1} al segmento [a, b] sin sus correspondientes extremos a y b. Ya estamos en condiciones de enunciar el Teorema de Taylor en varias variables, el cual me dice que puedo usar Tn (f, a) para aproximar el valor exacto de f (x) para puntos próximos al punto a y me da una expresión del resto de Taylor que me permite acotar el error cometido al realizar tal aproximación. Teorema 3.6.2 (de taylor en varias variables). Si tenemos una función f : A ⊆ RN −→ R, f ∈ C n+1 (A), A abierto, entonces para todo x, a ∈ A con [a, x] ⊆ A existe un c ∈]a, x[ tal que 1 f (x) = Tn (f, a)(x) + df n+1 (c)(x − a) (n + 1)! Merece la pena observar que, en particular, el teorema de Taylor con resto de orden 1 (esto es, para n = 0 con la notación anterior) no es más que la siguiente generalización del Teorema del Valor Medio a varias variables (pues para N = 1 se vuelve a obtener dicho teorema): Teorema 3.6.3 (del valor medio en varias variables). Si f : A ⊆ RN −→ R, f ∈ C n (A), A abierto, entonces para todo a, b ∈ A con [a, b] ⊆ A existe un c ∈]a, b[ tal que f (b) − f (a) = df (c)(b − a) Además, la fórmula del resto que nos proporciona el Teorema de Taylor, nos permite deducir el siguiente resultado de manera inmediata, el cual nos dice que “a medida que aumente el orden n del polinomio

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

30

de Taylor usado para aproximar f , aumenta también el grado de aproximación entre ambas funciones en un entorno del punto considerado” ´ rmula infinitesimal del resto). Si f : Corolario 3.6.4 (fo A ⊆ RN −→ R, f ∈ C n+1 (A), A abierto, entonces se verifica que f (x) − Pn (x) =0 x→a kx − akn l´ım

∀n ∈ N, siendo Pn el polinomio de Taylor de orden n de f en a. Nótese que para n = 1 volvemos a obtener que el polinomio (de grado 1) P1 (x) = f (a) + df (a)(x − a) es la función af´ın que mejor f (x) − P1 (x) aproxima a f en un entorno del punto a, pues l´ım = 0. x→a kx − ak Y para n = 2, el polinomio de Taylor P2 = T2 (f, a) es 1 P2 (x) = f (a) + df (a)(x − a) + d2 f (a)(x − a) 2 que para una función de N = 2 variables y un punto a = (a1 , a2 ) queda +

1 2

³

∂f (a)(x − a1 ) + ∂f (a)(y − a2 ) + ∂x ∂y 2 2 ∂ f 2 ∂x∂y (a)(x − a1 )(y − a2 ) + ∂∂yf2 (a)(y −

P2 (x, y) = f (a) + ∂2f (a)(x ∂x2

− a1 )2 +

´ a2 )

Ejemplo 3.6.5. Calcular el polinomio de Taylor de orden 2 de la función f (x, y) = exp xy en el punto (0, 0). 3.7.

Extremos relativos de una funci´ on real de varias variables

´ n 3.7.1. Sea f : A ⊆ RN −→ R, A abierto, a ∈ A. Definicio • f alcanza un m´ aximo relativo (o local) en a si ∃δ > 0 tal que Bδ (a) ⊆ A y f (x) ≤ f (a), ∀x ∈ A. • f alcanza un m´ınimo relativo (o local) en a si ∃δ > 0 tal que Bδ (a) ⊆ A y f (a) ≤ f (x), ∀x ∈ A. • f alcanza un extremo relativo en a si alcanza un máximo o un m´ınimo relativo en a • f presenta un punto de silla en a si ∀ε > 0 existen x1 , x2 ∈ Bε (a) ∩ A tal que f (x1 ) ≤ f (a) ≤ f (x2 ). • a es un punto cr´ıtico de f si df (a) = 0, esto es, si ∇f (a) = 0. Geométricamente es evidente que si una función f de dos variables alcanza un extremo relativo en un punto a, el plano tangente de f en dicho punto tiene que ser paralelo al plano z = 0. El siguiente resultado expresa esta idea de un modo riguroso.

3.7. EXTREMOS RELATIVOS

31

´ n 3.7.2 (cond. necesaria de extremo relativo). Proposicio Sea A ⊆ RN abierto, a ∈ A y f : A −→ R diferenciable en a. Si f alcanza un extremo relativo en a entonces a es un punto cr´ıtico de f . Por lo tanto, los posibles extremos relativos de f se encuentran entre los puntos cr´ıticos de f , pero no en todo punto cr´ıtico la función alcanza un extremo relativo, como ponen de manifiesto ejemplos sencillos como este Ejemplo 3.7.3. La función f (x, y) := x2 − y 2 es diferenciable en el punto (0, 0) con ∇f (0, 0) = 0 y sin embargo no tiene extremo relativo en (0, 0). Como acabamos de ver, entre los puntos cr´ıticos de una función f puede haber también puntos de silla. En el caso real, era la derivada segunda de la función la que permit´ıa decidir si en tales puntos se alcanzaba o no un extremo relativo. En el caso de funciones reales de varias variable este papel le va a corresponder a la matriz hessiana (la matriz con todas las derivadas parciales de orden 2 de f ), realmente a su forma cuadrática asociada d2 f : Teorema 3.7.4 (conds. suficientes de extremo relativo). Sea A ⊆ RN abierto, f : A −→ R, f ∈ C 2 (A), a un punto cr´ıtico de f . (i) Si d2 f (a) es definida positiva entonces f alcanza un m´ınimo relativo en el punto a (ii) Si d2 f (a) es definida negativa entonces f alcanza un máximo relativo en el punto a (iii) Si d2 f (a) es indefinida entonces a es un punto de silla de f . Corolario 3.7.5 (N=2). Sea f ∈ C 2 , a un punto cr´ıtico de f , µ ¶ α β Hf (a) = , ∆1 := α, ∆2 := αγ − β 2 β γ • • • •

∆1 > 0, ∆2 > 0 ⇒ f alcanza un m´ınimo relativo en a ∆1 < 0, ∆2 > 0 ⇒ f alcanza un máximo relativo en a ∆2 < 0 ⇒ f tiene un punto de silla en a Si ∆2 = 0 este criterio no da información

Corolario 3.7.6 (N=3). Sean f ∈ C 2 , a un punto cr´ıtico de f , y sean ∆1 , ∆2 , ∆3 los menores principales de Hf (a). • ∆1 > 0, ∆2 > 0, ∆3 > 0 ⇒ m´ınimo relativo de f en a • ∆1 < 0, ∆2 > 0, ∆3 < 0 ⇒ máximo relativo de f en a • ∆3 6= 0 y no (i) ni (ii) ⇒ punto de silla de f en a • Si ∆3 = 0 este criterio no da información

32

3.8.

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

Extremos condicionados de una funci´ on real de varias variables. El teorema de los multiplicadores de Lagrange

Muchos problemas de optimización tiene condiciones (restricciones o ligaduras) que limitan los valores que pueden usarse para lograr la solución óptima. Esto tiende a complicar los problemas de optimización ya que dicha solución óptima puede encontrarse fácilmente en un punto de la frontera del dominio. Ejemplo 3.8.1. Hallar el rectángulo de área máxima que puede 2 2 inscribirse en la elipse x32 + y42 = 1. Se trata, por tanto, de maximizar la función A(x, y) := 4xy restringida a los puntos de esa elipse. En general queremos hallar los puntos x ∈ A ⊆ RN tal que una cierta función f : A −→ R (llamada funci´ on objetivo) sea máxima o m´ınima, de entre todos los que verifican una cierta ecuación (o ligadura) g(x) = 0. A tales puntos les llamaremos extremos de f condicionados a g (o sujetos a la ligadura g(x) = 0). Vamos a empezar considerando el caso más sencillo, cuando f y g son funciones reales de dos variables. En este caso, el conjunto de puntos donde buscamos los extremos de f es una curva del plano, dada por la ecuación (impl´ıcita) g(x, y) = 0. Por tanto, si consideramos las curvas de nivel f (x, y) = k de la función objetivo f , es claro (gráficamente) que las curvas de esa familia que corten a la curva g(x, y) = 0 corresponden a aquellos valores k de la función f para los cuales hay puntos que cumplen la ligadura. La idea ingeniosa que permite hallar los extremos de f condicionados a g consiste en darse cuenta que (si f es continua) el mayor o menor valor de k que cumple lo anterior corresponderá, precisamente, a la curva (o curvas) de nivel k que sea tangente a la curva g(x, y) = 0. Como dos curvas son tangentes si y solo si sus vectores normales son paralelos y los vectores normales a las curvas de nivel f (x, y) = k y g(x, y) = 0 son sus gradientes ∇f y ∇g, los extremos de f condicionados a g se encontraran entre aquellos puntos donde exista un λ (llamado multiplicador de Lagrange) tal que ∇f = λ∇g. En el siguiente teorema precisamos las condiciones bajo las cuales se puede garantizar la existencia de tales multiplicadores. Teorema 3.8.2 (de los multiplicadores de lagrange, N=2). Sea A ⊆ R2 abierto, f, g : A −→ R de clase C 1 (A), y a ∈ A. Si f alcanza en a un extremo condicionado a la curva g(x, y) = 0 y ∇g(a) 6= 0, entonces ∃λ ∈ R tal que ∇f (a) = λ∇g(a).

3.8. EXTREMOS CONDICIONADOS

33

En la práctica, como ∇(f − λg) = ∇f − λ∇g, los puntos para los que existe multiplicador de Lagrange se suelen hallar de la siguiente manera: ´todo de los multiplicadores, N=2). Corolario 3.8.3 (me N Sea A ⊆ R abierto, f, g : A −→ R de clase C 1 (A), y a ∈ A. Si f alcanza un extremo condicionado a g(x, y) = 0 en un punto a entonces a es un punto cr´ıtico de la función F (llamada función auxiliar de Lagrange) dada por F (x, y, λ) := f (x, y) − λg(x, y). En general, si tenemos una función f de N variables con M restricciones para ellas g1 (x1 , . . . , xN ) = 0, . . . , gM (x1 , . . . , xN ) = 0 también se puede emplear el método anterior, pero ahora usaremos tantos multiplicadores como restricciones tengamos. ´todo de los multiplicadores). Sea A ⊆ Teorema 3.8.4 (me R abierto, f : A −→ R, g : A −→ RM de clase C 1 (A), y a ∈ A. Si f tiene un extremo condicionado a g(x1 , . . . , xN ) = 0 en un punto a entonces a es un punto cr´ıtico de la función (auxiliar de Lagrange) F : RN +M −→ R dada por N

F (x, λ1 , . . . , λM ) := f (x) − λ1 g1 (x) − · · · − λM gM (x). ´ n 3.8.5. El sistema de ecuaciones que surge en el métoObservacio do de los multiplicadores de Lagrange no es, en general, un sistema lineal y resolverlo requiere frecuentemente algo de ingenio. ´ n 3.8.6. Para averiguar si los puntos cr´ıticos de la funObservacio ción auxiliar de la Lagrange F son extremos de f se puede usar el criterio de la matriz hessiana sobre dicha función auxiliar F pero sólo como condición suficiente, esto es del siguiente modo: (i) Si HF (a) es definida positiva entonces f alcanza un m´ınimo relativo condicionado a g (ii) Si HF (a) es definida negativa entonces f alcanza un máximo relativo condicionado a g De hecho, se puede probar que realmente basta con estudiar el carácter de la forma cuadrática dF (a) restringida al Ker∇g(a). Pero a menudo no necesitaremos recurrir a esto ya que podremos garantizar su existencia a priori y por tanto simplemente tendremos que evaluar la función en los puntos cr´ıticos de la función auxiliar de Lagrange para ver en cual de ellos la función toma su mayor y su menor valor.

34

´ DE FUNCIONES DE VARIAS VARIABLES 3. DIFERENCIACION

3.9.

Extremos absolutos de una funci´ on real de varias variables

A menudo, los métodos dados anteriormente para el cálculo de extremos relativos y para el cálculo de extremos condicionados se pueden combinar para encontrar los extremos absolutos de una función en ciertos conjuntos. En concreto, supongamos que f : A ⊆ RN −→ R es una función continua y K ⊆ A es un conjunto compacto con frontera F r(K) = {x ∈ RN : g(x) = 0}, siendo g una función de RN en RM de clase C 1 . El Teorema de Weierstrass garantiza entonces que f alcanza sus extremos absolutos en algunos puntos de K. Podemos localizar esos puntos x0 pues en ellos tiene que ocurrir una de estas tres cosas: (1o ) f no es diferenciable en x0 (2o ) f es diferenciable en x0 y x0 ∈ K ◦ (3o ) f es diferenciable en x0 y x0 ∈ F r(K) En el segundo caso f alcanza un extremo relativo en x0 y en el tercer caso f alcanza un extremo condicionado a g en x0 . Por tanto, para determinar los extremos absolutos de f sobre K tenemos que (1o ) Localizar los puntos en los que f no es diferenciable (2o ) Calcular los puntos cr´ıticos de f que pertenecen a K ◦ (3o ) Hallar los puntos cr´ıticos de f condicionados a g y entre todos esos puntos se encuentran forzosamente aquellos en los que f alcanza sus extremos, con lo cual solamente tenemos que estudiar en cual de ellos toma f toma el mayor y el menor valor.

CÁLCULO EN VARIAS VARIABLES. ITOP - INGENIERÍA CIVIL

Short Description

Description

Comments

We need your help!