April 5, 2017 | Author: Javier Palacios | Category: N/A
Download libro matematicas 2º bachillerato(2)...
Matemáticas II Segundo curso de Bachillerato
Juan Luis Corcobado Cartes Departamento de Matemáticas IES Universidad Laboral. Cáceres. 2003.
Este es un libro que puede usarse sin ninguna limitación y del que se pueden distribuir cuantas copias se desee, pero se ruega no modificar ninguna de sus partes y mantener, en todo caso, el nombre del autor, al que pueden enviarse comentarios o sugerencias a la dirección:
[email protected]
Presentación
Amable lector: permíteme unas breves palabras con las que presentarte estas páginas que tienes entre las manos. Obedecen, más que nada, al deseo de que aproveches el curso lo mejor posible, de forma que puedas centrar tu atención a lo largo del mismo en los aspectos fundamentales del programa de nuestra asignatura y que en las clases no te veas sujeto a la imperiosa necesidad de anotar todo lo que diga el profesor. Existen montones de libros de texto de esta asignatura, algunos excelentes, otros no tanto, pero la mayoría de ellos suelen adolecer de un mismo defecto: sus autores olvidan que el curso tiene los días contados y que, aunque haya muchas cosas que aprender, el tiempo para aprenderlas es escaso; de modo que nosotros hemos procurado ir al grano, intentando alcanzar el máximo rigor que permitan las circunstancias, pero sin perder de vista las limitaciones de tiempo. Como verás, cada uno de los ocho temas que integran nuestro curso se divide en varios apartados, y al final de cada uno de ellos se proponen numerosos ejercicios. No se pretende que se resuelvan todos ellos en clase, pero sí que, si lo deseas, tengas material complementario para profundizar en los conceptos e ideas que se han estudiado previamente. Entre los ejercicios que se incluyen figuran muchos de los que han sido propuestos en las últimas Pruebas de Acesso a la Universidad, exámenes –conviene decirlo– que aunque no dejen de ser una referencia que has de tener presente, no debieran constituirse en tu principal preocupación. El programa consta dos bloques perfectamente diferenciados. El primero, una introducción al Análisis Matemático, abarca desde el primer tema hasta el cuarto y constituye una ampliación de lo que estudiaste en primer curso sobre funciones, límites y derivadas, a lo que se añade la presentación del concepto de integral. El segundo bloque, también constituido por cuatro temas, es una introducción al Álgebra Lineal. En él se estudian las matrices y los determinantes, los sistemas de ecuaciones lineales y se avanza en el estudio de la Geometría afín y euclídea que iniciaste el año pasado, resolviendo problemas geométricos en el espacio. Espero que las páginas que siguen, aunque acaso de aspecto inicialmente fiero, terminen por resultarte buenas alforjas para el viaje que estás iniciando. Con ese deseo, y con el más importante de que el viaje finalice felizmente, te saludo afectuosamente. El autor.
Índice
Tema 1:
Límites y continuidad
4
Tema 2:
El concepto de derivada
20
Tema 3:
Funciones derivables
35
Tema 4:
La integral
55
Tema 5:
Matrices y determinantes
70
Tema 6:
Sistemas de ecuaciones lineales
88
Tema 7:
El espacio afín
101
Tema 8:
El espacio euclídeo
120
Tema 1 Límites y continuidad
Límites y continuidad
1. INTRODUCCIÓN Si dijéramos que en esta parte del curso nos dedicaremos casi exclusivamente a examinar la tangente a una curva en un punto (en resumen, en eso consiste el cálculo diferencial) y a determinar el área encerrada por tal curva (eso es el cálculo integral), podría pensarse que somos poco ambiciosos; pero el tiempo se encargaría de demostrar que no es pequeño el propósito. Si la Humanidad hubo de esperar a los siglos XVII y XVIII, el llamado Siglo de las Luces, para que, dos mil años después de que Arquímedes diera un primer procedimiento para calcular el área encerrada por un segmento parabólico, genios como Newton, Leibniz, los Bernouilli o Euler, entre otros, o Rieman y Cauchy, ya en el XIX, pudieran no sólo plantear tales problemas, sino resolverlos casi definitivamente, no debe ser, pues, tan trivial como pudiera parecer este asunto de las tangentes y las áreas... El concepto clave de todo lo que sigue, en el que nunca se detendrá uno tanto como sería necesario, es el de límite. No hay por qué ocultar su dificultad. Con frecuencia, cuando se cree haberlo asimilado bien, nuevos casos sumen en la mayor de las dudas. Los conceptos de infinitésimo e infinito, y con ellos el de límite, son posiblemente los más difíciles de las matemáticas y sólo el trabajo metódico, en ocasiones aparentemente infructuoso, hace posible que un día empecemos a comprender por qué la suma de infinitas cantidades positivas puede ser una cantidad finita, por qué Aquiles alcanza a la tortuga o por qué el universo puede ser finito e ilimitado a la vez... Así que teniendo presente lo anterior y el consejo que otra figura del XVIII, D'Alembert, daba a sus estudiantes: "¡Proseguid; ya llegará la confianza!", empezamos. ¿Quieres seguirnos?
2. FUNCIONES REALES DE VARIABLE REAL El conjunto de los números reales Aunque no sea ésta la ocasión de establecer con rigor qué cosa son los números reales, podemos decir que en el proceso de construcción de conjuntos numéricos, el que aparece en primer lugar es el conjunto N de los números naturales. En él es posible sumar y multiplicar, pero no siempre se puede restar o dividir. En Z , conjunto de los números enteros, la resta es siempre posible, pero no la división, la cual sí es posible (excepto entre cero) en Q , conjunto de los números racionales. Como sabes, todo número racional puede representarse mediante una fracción decimal finita o infinita periódica. Por otra parte, N Ã Z Ã Q , es decir, todo número natural es entero y todo entero es racional. Sin embargo, no existe número racional que nos exprese la longitud de la diagonal de un cuadrado de lado unidad, o el cociente entre la longitud de una circunferencia y su diámetro, o el límite de la sucesión de término general (1+1/n)n... De este último tipo de números, 2 , p , e ... , que no admiten una expresión decimal finita o infinita periódica, se dice que son irracionales. El conjunto R de los números reales, finalmente, es el formado por los números racionales y los irracionales. En R operaremos como lo hemos hecho siempre, sumando, multiplicando, ordenando sus elementos mediante la relación £... Descartada aquí, como queda dicho, una construcción rigurosa de R , conviene no obstante mencionar la propiedad fundamental de los números reales; la propiedad de c o n t i n u i d a d : Los números reales llenan la recta. Es decir, que si sobre una recta representamos el 0 y el 1, a cada número real corresponderá un punto de la recta y a cada punto de la recta, un número real, sin que haya puntos a los que no corresponda un número real. Se podrá, en resumen, efectuar la habitual identificación entre números reales y puntos de una recta.
Vocabulario básico Cuando se trabaja con números reales suelen utilizarse expresiones y símbolos cuyo significado conviene recordar: • Siendo a, b dos números reales, con a < b, se define el intervalo abierto (a, b) mediante la igualdad: (a, b) = { x Œ R / a < x < b } • Análogamente se define el intervalo cerrado [a, b] mediante: [a, b] = { x Œ R / a £ x £ b }
–5–
Límites y continuidad • El valor absoluto, |x|, de un número real x, se define así: Ï- x x =Ì Ó x • La distancia entre dos números reales a y b es:
si x < 0 si x 0
d(a, b) = |b – a|
• El entorno E(a; r) de centro un número real a y radio r > 0, es el conjunto: E(a; r) = { x Œ R / a – r < x < a + r } • El entorno reducido E’(a ; r) de centro un número real a y radio r > 0 es el conjunto que resulta de prescindir en E(a ; r ) del punto a. Es decir: E’( a ; r) = E(a ; r) – { a } E(a; r)
a–r
a
E’ (a; r)
a –+rr
a–r
a
a+r
Funciones reales de variable real Se llama función real de variable real a toda aplicación f : D æÆ æ R donde D es un subconjunto de R . Es decir, a todo criterio que permita asociar a cada número real x de D un único número real y. • Existen muchas formas de designar simbólicamente las funciones, pero siendo habitual escribir f (x ) para referirse a la imagen de x, o sea, al número real que f hace corresponder a x, la función anterior suele identificarse mediante la notación:
y = f (x ) diciéndose que x es la variable independiente e y la variable dependiente. • Aunque, como decimos, f (x ) designe un número real, también se escribe a menudo f (x ) para referirse a la función.
Dominio y recorrido de una función Siendo y = f (x ) una función real de variable real, se definen el dominio y el recorrido de f (x ) mediante las igualdades: Dominio de f = D f = {x ŒR / existe f (x )} Recorrido de f = R f = {f (x ) / x ŒD f }
Recorrido
Y
O
f
Dominio
X
Conviene decir que si al definir una función mediante una expresión algebraica no se precisa cuál es su dominio, habrá que entender que éste es el más amplio subconjunto de R en el que pueda tomar valores la variable independiente x , de modo que exista la imagen f (x ). Así, por ejemplo, considerada la función:
f (x ) =
x2-4 ,
como la raíz cuadrada anterior sólo tiene sentido en R cuando sea x 2 - 4 0 , resultará: D f = { x / x 2 - 4 0 } = R - (-2, 2). –6–
Límites y continuidad
3. EL CONCEPTO DE LÍMITE Ejemplos previos ➀
Consideremos, en primer lugar, la función:
f (x ) =
3x 2 + 3x - 18 3( x - 2)( x + 3) = x -2 x -2
Para x = 2 la función no está definida, pero si calculamos valores como f (1' 99), f (2' 01), f (1' 999) observaremos que tales valores se aproximan a 15, tanto más cuanto más aproximemos el valor de x a 2. Y no sólo eso, sino que fijado cualquier número e > 0, por pequeño que sea, podemos conseguir que la distancia de f (x ) a 15 sea menor que e, sin más que hacer que, siendo x 2, la distancia de x a 2 sea menor que otro número d > 0, que seremos capaces de determinar. Efectivamente, no es difícil comprobar que para lograr: 3x 2 + 3x - 18 - 15 < e x -2 basta con tomar x tal que:
Juan Luis Corcobado Cartes
Digitally signed by Juan Luis Corcobado Cartes DN: CN = Juan Luis Corcobado Cartes, C = ES Date: 2005.12.05 13:42:04 +01'00'
e 3 Diremos que el límite de f (x ) cuando x tiende a 2 es 15, y escribiremos: 0< x -2 < d =
➔
lím f ( x ) = 15
x Æ2
➁
Consideremos ahora la función:
g( x ) = 7 x + 1 A diferencia de lo que ocurría antes, en este caso sí existe g(2). Pero con independencia de ello, también conseguríamos que la función tomara valores tan próximos a 15 como quisiéramos, sin más que aproximar el valor de x a 2 lo suficiente. ➔
Diremos que el límite de g( x ) cuando x tiende a 2 es 15, y escribiremos: lím g( x ) = 15
x Æ2
➠ En resumen, que aunque una de las funciones anteriores no esté definida en el punto x = 2 y la otra sí (lo cual también tiene su importancia, como veremos más adelante), en las cercanías de ese punto se comportan de forma semejante: sus valores se aproximan a 15 tanto como se quiera sin más que dar a x valores suficientemente próximos a 2. Por ello diremos que el límite de ambas funciones, cuando x tiende a 2, es 15.
Definición (de límite de una función en un punto) ☞
Dada una función real de variable real f : D æ æÆ R , diremos que su límite cuando x tiende hacia a es L y escribiremos: lím f ( x ) = L
x Æa
si y sólo si: Fijado cualquier número positivo e, existe otro número positivo, d, tal que si x cumple: 0 < x - a < d , entonces se verifica: f ( x ) - L < e .
Simbólicamente: lím f ( x ) = L
x Æa
¤
"e > 0 $d > 0 / 0 < x - a < d f ( x ) - L < e
–7–
Límites y continuidad
Observación La definición anterior puede darse en términos de entornos. En la figura pretendemos ilustrar que la existencia de lím f ( x ) = L x Æa
equivale a que fijado cualquier entorno E(L; e ) =(L - e , L + e ) exista un entorno E(a; d ) =(a - d , a + d ) tal que tomado cualquier x perteneciente a E'(a; d ) se tenga f ( x ) ŒE(L; e ) . Y ello, con independencia de que exista o no f (a). Y
Y
f
L+e L L–e
f
L+e L L–e a
O
a
X
a–d a+d
O
a–d
X
a+d
Ejemplo previo Consideremos la función cuya gráfica aparece a la derecha: Y
Ï x2 Ô si x < 2 f (x ) = Ì 2 Ô - x +5 si x > 2 Ó
3
Como puede observarse, si los valores de x se aproximan a 2 por la izquierda, los valores de f ( x ) lo hacen 2, mientras que si los valores de x se aproximan a 2, pero por la derecha, los de la función lo hacen a 3. Es decir, que según que la aproximación de x a 2 se haga con valores menores o mayores que 2, las consecuencias son unas u otras. Surge así la idea de límite lateral, que formalizamos a continuación.
2 1
1
O
2
3
X
Definiciones (de límites laterales) 1 Diremos que el límite de una función f ( x ) cuando x tiende hacia a por la izquierda es L, y escribiremos: lím f (x ) = L si y x Æa -
sólo si f ( x ) se aproxima a L tanto como se quiera, sin más que dar a x valores suficientemente próximos a a, pero menores que a: lím f (x ) = L ¤ "e > 0 $d > 0 / x Œ(a - d , a) f (x ) - L < e x Æa -
2 Diremos que el límite de una función f ( x ) cuando x tiende hacia a por la derecha es L, y escribiremos: lím f (x ) = L si y x Æa +
sólo si f ( x ) se aproxima a L tanto como se quiera, sin más que dar a x valores suficientemente próximos a a, pero mayores que a: lím f (x ) = L ¤ "e > 0 $d > 0 / x Œ(a, a + d ) f (x ) - L < e
x Æa +
Consecuencia Existe el lím f (x ) si y solo si existen los límites laterales en el punto a , verificándose: lím f (x ) = lím f (x ) x Æa -
x Æa
La demostración es inmediata y queda como ejercicio.
Ejemplo Supongamos que se desea saber si existe
lím
xÆ0
3x + x 5x - 2 x
. Dado que:
–8–
x Æa +
Límites y continuidad
lím xÆ0
3x + x -
5x - 2 x
= lím xÆ0
-
3x - x 2x 2 = lím = . 5 x + 2x x Æ 0 - 7 x 7
lím xÆ0
3x + x +
5x - 2 x
= lím xÆ0
+
3x + x 4x 4 = lím = 5 x - 2x x Æ 0 + 3 x 3
habremos de concluir que, al ser distintos los límites laterales, no existe el límite en cuestión.
Observación Supongamos que fuera lím f (x ) = 0 . Como ello significaría que f (x ) tomaría valores tan próximos a cero (tan pequeños, podríax Æa
mos decir) como quisiéramos, sin más que dar a x valores suficientemente próximos a a, y dado que el término infinitésimo se ha asociado tradicionalmente a una “magnitud muy pequeña”, lo mejor que podemos hacer es establecer formalmente tal concepto.
Definiciones (sobre infinitésimos) ➀ Se dice que una función f (x ) es un infinitésimo para x tendiendo hacia a (de ahora en adelante, “ x Æ a ”) si lím f (x ) = 0 x Æa
Es decir, si f (x ) toma valores tan próximos a cero como se quiera, sin más que aproximar x a a lo suficiente. ➁ Siendo f (x ) , g (x ) infinitésimos para x Æ a , diremos que son de igual orden si lím
x Æa
f (x ) = k 0. g (x )
f (x ) En particular, si lím = 1 se dice que f (x ) , g(x ) son infinitésimos equivalentes. x Æa g ( x ) ③ Siendo f (x ) , g (x ) infinitésimos para x Æ a , diremos que f (x ) es un infinitésimo de mayor orden que g (x ) si lím
x Æa
f (x ) =0 g (x )
Ejemplo importante Que las funciones f (x ) = sen x , g (x ) = x son infinitésimos para x Æ 0 es inmediato, pues lím sen x = lím x = 0 . Tiene mucho xÆ0
xÆ0
sen x = 1. xÆ0 x
interés, pues lo necesitaremos más adelante, demostrar que ambos son infinitésimos equivalentes; es decir, que lím Vamos a probarlo viendo, en primer lugar, que lím
x Æ 0+
sen x = 1. x
A tal fin, considerado en la circunferencia de la figura, de radio unidad, el ángulo de amplitud x (radianes) y recordando que: cos x = OA, sen x = AC, tg x = BD, la comparación entre las áreas del triángulo OAC, del sector circular OBC y del triángulo OBD nos permite escribir: x 1 1 cos x sen x £ £ 1 tg x 2 2 2
Y D C
cos x £ Pero lím cos x = 1; lím xÆ0
+
xÆ0
+
x 1 £ sen x cos x
x
tg x
sen x
Si x > 0, dividiendo entre sen x , que es positivo, y simplificando, resulta: cos x
O
A
B
sen x 1 x = 1, por lo tanto habrá de ser lím = 1, y también lím = 1. + + cos x x x Æ 0 sen x xÆ0
Como procediendo de forma análoga a la anterior se llegaría a que, igualmente, lím
x Æ 0-
efecto: sen x =1 xÆ0 x lím
–9–
sen x = 1, concluiríamos que, en x
X
Límites y continuidad
Límite de la suma, producto y cociente de funciones Supongamos ahora que f (x ) , g (x ) son dos funciones para las que existen los límites cuando x tiende hacia a. ¿Qué ocurrirá con el límite de la suma, el producto y el cociente de ambas funciones? ➀ El límite de una suma es igual a la suma de los límites: lím [ f (x ) + g (x )] = lím f (x ) + lím g (x )
x Æa
x Æa
x Æa
➁ El límite de un producto es igual al producto de los límites: lím [ f (x ) g (x )] = lím f (x ) lím g (x )
x Æa
x Æa
x Æa
③ El límite de un cociente es igual al cociente de los límites: lím
x Æa
lím f (x ) f (x ) = x Æa lím g (x ) g(x )
(si lím g (x ) 0 ) x Æa
x Æa
No efectuaremos las demostraciones, aunque no sean muy complicadas.
4. LÍMITES INFINITOS Y EN EL INFINITO Como sabemos desde el curso pasado, existen límites funcionales de tipos distintos al anterior. Más que memorizar las definiciones siguientes conviene fijarse en el par de ideas que, combinadas de una u otra forma, aparecen en todos ellas. 1. 1 Si los valores de una función f (x ) se aproximan tanto como se quiera a un cierto número L sin más que hacer que la variable x tome valores positivos suficientemente grandes, tal hecho se simboliza escribiendo: lím f (x ) = L
x Æ +•
1. 2 Si los valores de una función f (x ) se aproximan tanto como se quiera a un cierto número L sin más que hacer que la variable x tome valores negativos de valor absoluto suficientemente grande, tal hecho se simboliza escribiendo: lím f (x ) = L
x Æ -•
➡ Los dos casos anteriores se ilustran en la siguiente figura. La recta de ecuación y = L que aparece en ella se dice que es una asíntota horizontal de la curva o de la función f (x ). Y
Y L
asíntota
L
f
f
X
X lím f (x ) = L
lím f (x ) = L
x Æ +•
1. 3 Cuando suceda que
asíntota
x Æ -•
lím f (x ) = lím f (x ) = L , se escribe simplemente: lím f (x ) = L
x Æ -•
x Æ +•
xƕ
2. 1 Si para conseguir que f (x ) tome valores mayores que cualquier numero positivo fijado previamente, basta con que x se aproxime lo suficiente por la derecha a un cierto número real a (es decir: tomando valores mayores que a) escribiremos: lím f (x ) = +•
x Æa +
– 10 –
Límites y continuidad 2 . 2 Si para conseguir que f (x ) tome valores mayores que cualquier numero positivo fijado previamente, basta con que x se aproxime lo suficiente por la izquierda a un cierto número real a (es decir: tomando valores menores que a) escribiremos: lím f (x ) = +•
x Æa -
2. 3 Cuando suceda que lím f (x ) = lím f (x ) = +• , se escribe simplemente: lím f (x ) = +• x Æa -
x Æa +
x Æa
2 . 4 Si para conseguir que f (x ) tome valores menores que cualquier numero negativo fijado previamente, basta con que x se aproxime lo suficiente por la derecha a un cierto número real a escribiremos: lím f (x ) = -•
x Æa +
2 . 5 Si para conseguir que f (x ) tome valores menores que cualquier numero negativo fijado previamente, basta con que x se aproxime lo suficiente por la izquierda a un cierto número real a escribiremos: lím f (x ) = -•
x Æa -
2 . 6 Cuando suceda que lím f (x ) = lím f (x ) = -• , se escribe simplemente: lím f (x ) = -• x Æa -
➡
x Æa +
x Æa
Si lím f (x ) = ±• o lím f (x ) = ±• o suceden ambas cosas simultáneamente, se dice que la recta x = a es una x Æa -
x Æa +
asíntota vertical de la función.
asíntota
3 . 1 También puede suceder que baste con que x tome valores suficientemente grandes para lograr que f (x ) tome valores mayores que cualquier numero fijado previamente. En tal caso escribiremos: lím f (x ) = +•
x Æ +•
3 . 2 Si para lograr que f (x ) tome valores mayores que cualquier numero fijado previamente baste con que x tome valores negativos, pero de valor absoluto suficientemente grande, escribiremos: lím f (x ) = +•
x Æ -•
3 . 3 Cuando suceda que
lím f (x ) = lím f (x ) = +• , se escribe simplemente: lím f (x ) = +•
x Æ -•
x Æ +•
xƕ
4 . 1 También puede suceder que baste con que x tome valores suficientemente grandes para lograr que f (x ) tome valores negativos, de valor absoluto mayor que cualquier numero fijado previamente. En tal caso escribiremos: lím f (x ) = -•
x Æ +•
4. 2 Si para lograr que f (x ) tome valores negativos, de valor absoluto mayor que cualquier numero fijado previamente. basta con que x tome valores negativos, pero de valor absoluto suficientemente grande, escribiremos: lím f (x ) = -•
x Æ -•
4 . 3 Cuando suceda que
lím f (x ) = lím f (x ) = -• , se escribe simplemente: lím f (x ) = -•
x Æ -•
x Æ +•
xƕ
– 11 –
Límites y continuidad
Indeterminaciones Hemos visto líneas atrás que si lím f (x ) = L ; lím g (x ) = M , puede saberse inmediatamente qué valor toman los límites, para x Æa
x Æa
f (x ) ... Tampoco nos cabrían muchas dudas acerca del valor de estos límites si hubiéramos partido x Æ a , de f (x ) + g (x ) , f (x ) g (x ) , g (x ) de que lím f (x ) = +• ; lím g (x ) = M , por ejemplo. x Æa
x Æa
Pero hay otros casos en los que la respuesta no está previamente determinada. Así, por ejemplo, si: lím f (x ) = 0 ; lím g (x ) = 0 , a la hora de calcular lím x Æa
x Æa
x Æa
f (x ) pueden ocurrir diferentes cosas. Veamos un par g (x )
de casos diferentes para ilustrar lo que decimos:
x2 + x - 6 corresponde al supuesto anterior, pues tanto el límite del numerador como el del denominador para x Æ 2, x -2 x Æ2 son nulos, teniéndose: 1 El lím
(x + 3)(x - 2) x2 + x - 6 = lím (x + 3) = 5 = lím x -2 x -2 x Æ2 x Æ2 x Æ2 lím
2 En cambio, para el lím
x Æ2
x2 + x - 6 (x - 2)3 lím
, cuyo numerador y denominador también tienen por límite cero, lo que sucede es esto otro:
x2 + x - 6
x Æ2
3
(x - 2)
= lím
(x + 3)(x - 2) 3
(x - 2)
x Æ2
= lím
(x + 3)
x Æ 2 (x
- 2)2
= +•
0 ➡ Debido a ello se dice que “ ” es una indeterminación. 0 Otro ejemplo: si: lím f (x ) = • ; lím g (x ) = • , a la hora de calcular lím [f (x ) - g (x )] nos podemos encontrar con diferentes x Æa
x Æa
x Æa
resultados. Veamos un par de casos al respecto. Ê 1 2 ˆ 1 El lím Á ˜ , que corresponde al supuesto anterior, no existe, pues los límites laterales son distintos: x Æ 1 Ë x - 1 x - 1¯ Ê 1 Ê 2 ˆ 1 ˆ lím Á ˜ = lím - Á ˜ = +• - Ë x -1 x - 1¯ x Æ 1 Ë x - 1¯ x Æ1
;
Ê 1 Ê 2 ˆ 1 ˆ lím Á ˜ = lím + Á ˜ = -• + Ë x -1 x - 1¯ x Æ 1 Ë x - 1¯ x Æ1
Ê 1 2 ˆ ˜ , que también corresponde al mismo supuesto, lo que se tiene es: 2 En cambio, para el lím ÁÁ x Æ 1 Ë (x - 1)2 (x - 1)2 ˜¯ Ê 1 Ê 2 ˆ 1 ˆ ˜ = lím Á ˜ = -• lím ÁÁ x Æ 1 Ë (x - 1)2 (x - 1)2 ˜¯ x Æ 1 ÁË (x - 1)2 ˜¯ ➡ Debido a ello se dice que “• - •” es otra indeterminación. Cuando haya que calcular el límite de una expresión y no sea posible saber de antemano cuál será su valor, por aparecernos alguna • , 0 • , 0 0, • 0 , habrá que analizar en cada caso cuál es la forma más expresión como las anteriores u otras semejantes, como 1• , • adecuada de proceder. Algunas de ellas ya los conocemos desde el curso pasado. Otras las aprenderemos en el actual.
– 12 –
Límites y continuidad
5. FUNCIÓN CONTINUA EN UN PUNTO Consideraciones previas El concepto de continuidad, sin cuyo estudio poco podríamos hacer de ahora en adelante, no es un invento de los matemáticos, sino que, como tantas otras, se trata de una idea que éstos han tomado de la realidad y, posteriormente, han formalizado. En efecto, en la vida diaria se dan muchos fenómenos físicos, sociales, etc., tales que las funciones que en ellos intervienen y los explican son continuas, es decir, se caracterizan porque a pequeños incrementos de la variable independiente corresponden incrementos también pequeños de la variable dependiente. Así, por poner el más típico de los ejemplos, si un movimiento se rige por una ley de la forma e = f (t), con la que se expresa la dependencia del espacio recorrido en función del tiempo, es normal que a pequeñas variaciones en el valor de t correspondan variaciones igualmente pequeñas de e; el espacio será una función continua del tiempo. Y no faltarían otras situaciones con las que ilustrar lo que decimos. Veamos, sin embargo, antes de dar la definición de función continua, y de forma intuitiva, algunos ejemplos de lo que no son funciones continuas.
Ejemplos previos Para la función f (x ) a la que correspondería esta gráfica, se verificaría que: • No existe f (a) • No existe lím f (x ) x Æa
En este segundo caso, para la función f (x ) de la figura, se verificaría que: • No existe f (a) • Existe lím f (x ) x Æa
Y
Y
f
f
X
X
a
a
En este tercer caso, para f (x ) se tiene: • Existe f (a) • No existe lím f (x )
En este cuarto caso se verifica: • Existe f (a) • Existe lím f (x ) x Æa
x Æa
• Ambos valores son distintos Y
Y
f
f
X
X
a
a
Definición (de función continua en un punto) Hablando sin mucho rigor, podríamos decir que, aun siendo diferentes, lo que tienen en común los casos anteriores es que las gráficas se rompen en el punto de abscisa a, hay que levantar el lápiz del papel al llegar a x = a... Justamente cuando no suceda eso, cuando no haya que levantar el lápiz del papel para dibujar la gráfica, será cuando diremos que la función es continua. Formalmente: Una función f (x ) es continua en x = a
si y sólo si
– 13 –
lím f (x ) = f (a)
x Æa
Límites y continuidad O, dicho de otra manera: Una función f (x ) es continua en x = a
si y sólo si
"e > 0 $d > 0 / x - a < d f (x ) - f (a) < e
si y sólo si
Tomado cualquier entorno de f (a), f (x ) pertenecerá a él, siempre que x se halle en un entorno de a, que será posible determinar.
O, en términos de entornos:
Una función f (x ) es continua en x = a
Parece innecesaria añadir que la función de la siguiente figura sí es continua en el punto a. Y
f
f (a)
X a
Observación Dijimos antes que las funciones continuas hacían corresponder a incrementos pequeños de la variable independiente, incrementos también pequeños de la variable dependiente. Vamos a explicarlo un poco mejor ahora, aprovechando la ocasión para introducir una notación bastante tradicional, que sigue siendo interesante conocer. Sea la función f (x ) y consideremos un valor x 0 de la variable independiente, perteneciente a su dominio D f ; el valor correspondiente de la función será f (x 0) . Si a x 0 le sumamos cierta “cantidad” Dx , a la que llamaremos incremento de x, el valor de la función será f (x 0 + Dx ) [supuesto que (x 0 + Dx ) ŒD f ). A la diferencia f (x 0 + Dx ) - f (x 0) , que refleja la variación de f (x ) cuando la variable independiente ha pasado de valer x 0 a valer x 0 + Dx , la llamaremos incremento de la variable dependiente y la representaremos por Dy. Y f
f (x0+x0) f (x0) x0
x0 +x
X
Pues bien: si la función f (x ) es continua en x 0 , entonces lím f (x ) = f (x 0) y en tal caso, sustituyendo x por x 0 + Dx , se tendrá: x Æ x0
lím f (x o + Dx ) = f (x o ) , es decir:
Dx Æ 0
lím
Dx Æ 0
[f (xo + Dx ) - f (xo )] = DxlímÆ 0 Dy = 0
Luego, que f (x ) sea continua en x 0 significa, efectivamente, que a incrementos Dx de la variable independiente muy pequeños (infinitesimales), corresponden incrementos Dy de la variable dependiente también muy pequeños (infinitesimales). Por otra parte, este hecho de que la continuidad de una función en un punto suponga que a pequeños incrementos de la variable independiente correspondan pequeños incrementos de la función, permite predecir cómo se comportará ésta en las proximidades de tal punto. Así, por ejemplo, si f (x ) es continua y toma valor positivo en un punto a, es lógico pensar que en las proximidades de dicho punto f (x ) siga siendo positiva... Sobre esto y algo más tratan los siguientes teoremas.
– 14 –
Límites y continuidad
Teorema (conservación del signo) Si f (x ) es continua en un punto a, siendo f (a) 0, existe un entorno de a en el que f (x ) tiene igual signo que f (a) k ˆ Ê k 3k ˆ ˜ = Á , ˜ , la 2¯ Ë 2 2 ¯ Ê k 3k ˆ continuidad de f (x ) en a asegura la existencia de un entorno de a: E(a ; d ) tal que cuando x ŒE(a ; d ) , entonces f (x ) ŒÁ , ˜ y, Ë2 2 ¯ por tanto f (x ) > 0. En el caso en que fuera f (a) < 0 la demostración sería análoga. En efecto. Supongamos que, por ejemplo, f (a) = k > 0. Tomado el entorno de k de radio
k Ê k : Ák - , k + 2 Ë 2
Y
f En este entorno f (x) es positiva, al serlo f (a)
X a-d a a+d
Una consecuencia inmediata de lo anterior es que si una función f (x ) es continua en un punto a, y toma valores positivos y negativos en cualquier entorno de dicho punto, entonces necesariamente ha de ser f (a) = 0.
Teorema (acotación) Si una función f (x ) es continua en un punto a, existe un entorno de a en el que f (x )está acotada (o sea, existen dos números reales k, k’ tales que k £ f (x ) £ k') En efecto. Considerado, por ejemplo, el entorno (f (a) - 1, f (a) + 1) , existirá un entorno E(a ; d ) tal que si x ŒE(a ; d ) , entonces
f (x ) Œ(f (a) - 1, f (a) + 1) ; es decir: f (a) - 1< f (x ) < f (a) + 1.
Operaciones con funciones continuas Partiendo de la definición de función continua y de las propiedades de los límites, se puede establecer:
1 La suma, producto y cociente de dos funciones, f (x ), g (x ), continuas en un punto a es otra función continua en a (con la excepción, para el cociente entre f (x ) y g (x ) , del caso en que g (a) = 0.)
2 La función compuesta, (f o g)(x ), es continua en a si g (x ) lo es en a y f (x ) en g (a). Por otra parte, dado que las funciones constante: f (x ) = k, e identidad: f (x ) = x , son continuas en todo punto a Œ R , la aplicación de los resultados anteriores conduce a que:
3 Tanto las funciones polinómicas: como las funciones racionales:
f (x ) = a 0 + a1x + a2 x 2 + a3 x 3 +º+ an x n ; ai ŒR , n ŒN g (x ) =
a 0 + a1x + a2 x 2 + a3 x 3 +º+ an x n b0 + b1x + b2 x 2 + b3 x 3 +º+ bm x m
; ai ,bi ŒR ; n,m ŒN
son continuas en todo punto a Œ R (salvo, en el segundo caso, en los puntos en los que el denominador se anule). Finalmente, aunque se trate de algo más difícil de demostrar:
4 Las funciones trigonométricas: f (x ) = sen x ; g (x ) = cos x ; exponencial: f (x ) = a x , a > 0; y logarítmica: f (x ) = loga x , a > 0, son continuas en todos los puntos en los que están definidas.
– 15 –
Límites y continuidad
6. FUNCIONES CONTINUAS EN UN INTERVALO Definiciones (de función continua en intervalo abierto y cerrado) 1 Diremos que una función f (x ) es continua en un intervalo abierto (a, b) si lo es en todos los puntos de dicho intervalo. Como la cuestión es así de sencilla, no vamos a darle más vueltas. Pero, en cambio, considera ahora una función f (x ) cuya gráfica fuera como la que tienes a la vista: De acuerdo con la noción intuitiva de continuidad, resulta razonable decir que tal función es continua en el intervalo cerrado [a, b]. Pero no podríamos basarnos para ello en que f (x ) sea continua en todos los puntos del intervalo pues en realidad no sabríamos qué ocurre con los límites de f (x ) en los extremos a y b . Se hace necesaria, pues, una definición más precisa.
f
Y
a
X
b
2 Diremos que una función f (x ) es continua en un intervalo cerrado [a, b] si lo es en el intervalo abierto (a, b) y, además: lím f (x ) = f (a) ;
x Æa +
lím f (x ) = f (b)
x Æb -
Teorema (de Bolzano) Si una función es continua en un intervalo cerrado y toma valores de distinto signo en sus extremos, entonces existe al menos un punto en el interior del intervalo en el que la función se anula.
Y
En este punto f(x) se anula
f
a La demostración rigurosa del teorema no es trivial y requiere utilizar el que todo conjunto no vacío de números reales acotado superiormente tiene una cota superior mínima.
X b
Intuitivamente, sin embargo, la cosa parece fácil. El que la función pudiera pasar de valores negativos a positivos sin pasar por cero, supondría que la función tendría que dar un salto y, como sabes, las funciones continuas no saltan.
Aplicación a la resolución de ecuaciones Supongamos que se desea hallar una raíz o solución aproximada de la ecuación:
x 3 + x - 4 = 0. Considerada la función f (x ) = x 3 + x - 4, continua en todo punto de R , se tiene que f (0) = -4 < 0 , f (2) = 6 > 0 , luego la ecuación tendrá una raíz entre 0 y 2. Tomemos el punto medio del intervalo [0, 2], es decir, el 1. Como f (1) = -2 < 0 , habrá una raíz entre 1 y 2. Tomado el punto medio del intervalo [1, 2], 1’5, y viendo que f (15 ' ) = 0'875 > 0 , deduciremos que la raíz se halla entre 1 y 1’5. Prosiguiendo así sucesivamente, podríamos hallar una raíz de la ecuación con la aproximación que deseásemos. En este caso, por ejemplo, una aproximación hasta la cuarta cifra decimal nos daría : x = 1’3788.
Definiciones (de máximo y mínimo absolutos) ➬ Diremos que una función f : D æ æÆ R tiene un máximo absoluto en un punto a Œ D si f (a) f (x ), "x ŒDD . ➬ Diremos que una función f : D æ æÆ R tiene un mínimo absoluto en un punto a Œ D si f (a) £ f (x ), "x ŒDD . (No deben confundirse estos máximos y mínimos absolutos con los máximos y mínimos locales, de los que hablaremos más adelante).
– 16 –
Límites y continuidad
Teorema (de Weierstrass) Admitiremos sin demostración que: Máximo absoluto
Si una función es continua en un intervalo cerrado , tiene en él un máximo y un mínimo absolutos.
Y
f
Dos comentarios:
Mínimo absoluto
El primero, que en la figura hemos situado el máximo absoluto en el interior del intervalo y el mínimo absoluto en un extremo. Es un caso entre otros posibles.
a
b
X
El segundo, que sería erróneo pensar que toda función definida en un intervalo cerrado, aunque no sea continua en él, habrá de tomar un valor que sea el mayor de todos y otro que sea el menor. Basta para comprobarlo con observar la figura siguiente: Y f(c)
a
c
b
X
La función correspondiente estaría definida en [a, b] y, sin embargo, no existirían valores que fueran el máximo o el mínimo.
Teorema (de los valores intermedios) Si una función es continua en un intervalo cerrado , toma en él cualquier valor comprendido entre el máximo y el mínimo absolutos. La demostración de este teorema, admitidos los anteriores, resulta asequible. Siendo x M y x m los puntos del intervalo [a, b] en los que f (x ) alcanza el máximo absoluto y el mínimo absoluto, respectivamente, y siendo y 0 un valor cualquiera comprendido entre el mínimo y el máximo absolutos, la función g (x ) = f (x ) - y 0 es
Y
y0 a
x0
X b
continua en [x M , x m] (suponemos x M a la izquierda de x m ) y en los extremos de dicho intervalo cerrado toma valores de distinto signo. Por consiguiente, y en virtud del teorema de Bolzano, existirá al menos un punto x 0 Œ[x M , x m] , luego x 0 Œ[a , b ], tal que:
g (x 0 ) = f (x 0 ) - y 0 = 0 es decir, tal que:
f (x 0 ) = y 0
Ejemplo È p Considerada la función f (x ) = sen x , dicha función es continua en el intervalo Í0 , , en el que su valor mínimo absoluto es 0 y Î 2 È p su valor máximo absoluto 1. En consecuencia, podremos asegurar que para todo y 0 Œ[0 , 1] existirá x 0 ŒÍ0 , tal que y 0 = sen x 0 . Î 2
– 17 –
Límites y continuidad
7. EJERCICIOS 1.-
Además de los vistos páginas atrás, en ocasiones aparecen los intervalos [a , b),(a , b],(-• , b) ,(a , •) ,(-• , b],[a , •) , que no parece necesario definir. Pues bien, simplifica al máximo la expresión: { (-•, 3) »[ 2, 5 ] } « (4 , • ) .
2.-
Un punto de acumulación de un conjunto C de números reales es un punto (número real) a tal que todo entorno reducido de él contiene algún punto de C. Demuestra que si a es punto de acumulación de C, entonces todo entorno de a contiene infinitos puntos de C. (Sugerencia: Supón que hubiera un entorno de a que sólo tuviera un número finito de puntos de C).
3.-
Demuestra que: lím (2x + 4) = 10 ;
4.-
Sabiendo que lím (5 - 2x 2) = 3 , determina un entorno de 1 tal que si x está en él, f (x ) - 3 < 0 ' 001.
5 .-
Pon un ejemplo de función definida para todo valor de x, que no tenga límite para x Æ 2.
6 .-
Si existe lím f (x ), siendo f (x ) > 0 si x < a , ¿podemos asegurar que tal límite es positivo? ¿Y que no es negativo?
7 .-
Sabiendo que
8 .9.-
x Æ3
lím x . sen
xÆ0
1 = 0; x
lím f (x ) = lím f (a + h);
x Æa
hÆ0
lím x 2 = 9
x Æ3
x Æ1
x Æa
4x + 1 4x + 1 = 4, determina para qué valores de x se verifica: - 4 < 10 -5 . x x x Æ +• 1 Justifica que no existen: lím sen x ; lím sen x x Æ +• xÆ0 lím
Calcula, en los casos en que existan, los siguientes límites: 1 . lím
xÆ0
5 . lím
xÆ0
x5 + 3 x2 2- x - 2 + x x
9 . lím (2x xÆ0
1 x + 1)
x 2 - 5x + 6 x -3 x Æ3
2 . lím
6 . lím
x Æ3
1 0 . lím
3 . lím
xÆ4
2x - 8
Ê 2x + 1ˆ 7 . lím Á ˜ x Æ 1Ë x + 2 ¯
x + 1- 2 x -3
x Æ -•
2x - 8
x 2 + 2x + x
1 1 . lím
x Æ +•
1 -1 x
x 2 - 2x - (x - 2) x -2
4 . lím
x Æ -3
x 3 + 5 x 2 + 10 x + 12 x 3 + 2x 2 - 2x + 3 5
Ê x 2 - x - 2 ˆ x -2 ˜ 8 . lím ÁÁ x Æ 2 Ë 4x - 8 ˜ ¯
1 2 . lím
xƕ
2x 2 + 4 x x
1 0. - Demuestra, aplicando la definición, que la función f ( x ) = x 2 - 6 x + 9 es continua en x = 3. 1 1. - Siendo x Œ R , con el símbolo [x] se representa la parte entera de x, o sea, el mayor de los números enteros menores o iguales que x. Sabiendo lo anterior, representa gráficamente la funcion f (x ) = [x ] , di qué ocurre con sus límites laterales para x Æ a , siendo a un número entero, y estudia su continuidad. 1 2 . - Haz lo mismo que en el ejercicio anterior, pero con la función f (x ) = x - [x ]. 1 3. - Determina el valor de k para que las funciones: Ï x2 - 9 Ô f (x ) = Ì x - 3 Ô k Ó
n Ï si x 3 ; g (x ) = ÔÌ (1+ x ) - 1 si x 0 ÔÓ k si x = 0 si x = 3
sean continuas en los puntos x = 3 y x = 0, respectivamente. 1 4. - Representa gráficamente la función f (x ) = x y estudia su continuidad en x = 0.
– 18 –
Límites y continuidad 1 5 . - Estudia la continuidad de las funciones:
f (x ) =
x -2 2
; g (x ) = x + [x ] ; h (x ) =
x x
1 6. - Determina si existe algún valor de k para el que sea continua en a = 2 la función: Ï 3x - 6 Ô f (x ) = Ì x 2 - 4 Ô k Ó
si x 2 si x = 2
1 7. - Determina si existe algún valor de k tal que la función: Ï 2x + k si x £ 1 f (x ) = Ì 2 Ó x - kx + 2 si x > 1 sea continua en todo punto. 1 8. - ¿Para qué valores de k la función f (x ) =
x +1 2
x - 3x + k
no es continua en x = k?
1 9. - Determina una expresión algebraica y estudia la continuidad de la función cuya gráfica es la siguiente: Y 1 1
2
3
4
X
2 0. - Tras representarla, estudia la continuidad de la función f (x ) = x - 2 + x - 6 . 2 1. - Estudia la continuidad en el punto x = 0 de la función: Ï 2 1 Ô x sen si x 0 f (x ) = Ì x ÔÓ 0 si x = 0 2 2. - Determina un entorno de centro a = 2 en el que la función f (x ) = 9 x - 4 x 2 tenga signo constante. 2 3. - Aplica el teorema de Bolzano para comprobar que la ecuación ex = 2 - x 2 tiene alguna solución entre 0 y 1 y para calcular esa solución con la primera cifra decimal exacta. 2 4. - ¿Se puede asegurar que la ecuación ax 5 + bx 3 + cx + d = 0 tiene al menos una solución real? 2 5. - Explica por qué puede asegurarse que existe algún x, 0 £ x £ p, tal que:
5 = 4. 2 + cos x
2 6. - Sea f (x ) = x 4 - 3 x 3 + 2x 2 - 1. ¿Existe algún a , 2< a < 3 , tal que f (a ) = 2 ? 6 toma distinto signo en los extremos del intervalo [2, 4] y, sin embargo, no se anula en ningún punto de x -3 dicho intervalo. ¿No se contradice el teorema de Bolzano?
2 7. - La función f (x ) =
2 8 . - Compara los valores que en los puntos 1 y 2 toman las funciones f (x ) = ln x g (x ) = e- x y justifica a partir de ello que las gráficas de ambas funciones se cortan en algún punto.
– 19 –
Tema 2 El concepto de derivada
El concepto de derivada
1. INTRODUCCIÓN Siendo cierto que los conceptos de función, límite y continuidad estudiados en el tema anterior son fundamentales, no lo es menos que todo lo hecho antes ha sido una preparación para lo que viene ahora: el concepto de derivada. Su interés radica, básicamente, en que es el instrumento que las matemáticas proporcionan a otras ciencias, especialmente la física, para que en aquellas situaciones en que se producen cambios, pueda medirse la rapidez con la que éstos se producen. Si las funciones continuas constituyen un tipo especial en el universo variopinto de las funciones, aún siguen siendo demasiadas. Restringir algo el tipo de funciones con las que trabajaremos, exigir la derivabilidad a una función, nos va a permitir obtener resultados mucho más interesantes que los ya obtenidos para las funciones continuas. Si éstas, las funciones continuas, podrían ser caracterizadas intuitivamente como aquellas cuyas gráficas no se quiebran, no se rompen, aquéllas, las derivables, serán las funciones que, además de no romperse, son suaves, no tienen picos... Las consecuencias que se obtendrán de limitar nuestra trabajo a las funciones derivables van a ser de una riqueza y variedad insospechada.
2. DERIVADA DE UNA FUNCIÓN EN UN PUNTO Tangente a una curva en un punto Si alguien nos preguntara qué es la tangente a una curva en un punto, nosotros, pensando quizás en el caso de la circunferencia, podríamos responder que es la recta que corta a la curva en ese único punto... Pero mala respuesta sería, porque entonces no nos quedaría más remedio que admitir que la segunda recta del dibujo no sería tangente a la sinusoide y que, en cambio, sí lo sería la tercera a la parábola...
La cuestión se resuelve así: 1 º ) Como se observa en la figura siguiente, la recta secante a la función y = f (x ) en los puntos P ( x 0 , f (x 0)) y Q ( x 1, f (x 1)) es la recta que pasando por P tiene por pendiente: f (x ) - f (x o ) m PQ = tag a = 1 x1 - x o pues, como sabes, la pendiente de una recta en el plano es la tangente trigonométrica del ángulo que forman el eje OX y dicha recta. Y
secantes
Y
Q
f(x 1 )
P f(x 0 )
tangente en P
f(x 1 ) - f(x 0 )
P
a x1 - x0
a x0
x1
X
X
2 º ) Por otro lado, la tangente en el punto P parece ser la recta a la que tenderían las secantes en P y Q cuando el punto Q tendiera a confundirse con el P. ➩ Por todo ello, se define formalmente la tangente a la función y = f (x ) en el punto P ( x 0 , f (x 0)) como la recta que pasando por dicho punto tiene por pendiente el siguiente límite, si éste existe: lím
x Æ xo
f (x ) - f (x o ) x - xo
– 21 –
El concepto de derivada • Interesa observar que si donde pone x ponemos x o + Dx , la pendiente de la tangente vendrá dada por: Dy f ( x o + Dx ) - f ( x o ) = lím Dx Dx Æ 0 Dx Æ 0 Dx
m = lím
expresión que, en el fondo, lo que hace es comparar en el punto considerado dos incrementos, el de variable dependiente y el de la independiente cuando éste tiende a cero; o dicho de otra forma: cómo varía la y en relación a la x.
Velocidad de una partícula • Imaginemos ahora una partícula que se mueve rectilíneamente recorriendo un espacio definido por una función e = e(t ), que expresa la dependencia de la distancia a la que el móvil se halla de un cierto origen, 0, con relación al tiempo.
e(t1) e(t1)- e(t0)
e(t0)
0
posición en t = t0
posición en t = t1
Si quisiéramos definir la velocidad en el instante t o , podríamos partir de que el cociente
e(t1) - e(t o ) t1 - t o es la velocidad media en el intervalo de tiempo comprendido entre t 0 y t1 , y tomando instantes cada vez más próximos, que tendieran a confundirse, considerar las velocidades medias entre ellos. Pero eso resulta bastante impreciso, de modo que la cuestión se resuelve formalmente definiendo la velocidad en el instante t 0 así:
v (t o ) = lím t Æt o
e(t ) - e(t o ) t - to
O también, llamando Dt a la diferencia t - t o :
e(t o + Dt ) - e(t o ) De = lím Dt Dt Æ 0 Dt Æ 0 Dt
v (t o ) = lím
(La velocidad instantánea es un concepto teórico, abstracto, que no corresponde exactamente a ninguna magnitud medible; aunque nazca de una que sí lo es, como la velocidad media. La velocidad en el instante t o no es igual al cociente:
e(t o + Dt ) - e(t o ) Dt para ningún valor de D t , pero sí es igual al valor del límite para Dt Æ 0 del cociente anterior, calculado matemáticamente. Así, pues, cuando los físicos miden velocidades, lo hacen para intervalos de tiempo, por pequeños que éstos sean).
En resumen, que problemas aparentemente tan dispares como obtener la tangente a una curva o calcular una velocidad instantánea encuentran su solución con la misma herramienta. Será cuestión de darle nombre propio.
Definición (derivada de una función en un punto) ➬ Sea y = f ( x ) una función real de variable real. Diremos que f ( x ) es derivable en un punto x 0 si existe y es finito:
lím
x Æ xo
f (x ) - f (x o ) x - xo
– 22 –
El concepto de derivada ➬ Tal límite, que también puede expresarse como: lím
Dx Æ 0
f ( x o + Dx ) - f ( x o ) Dx
recibe el nombre de derivada de la función f ( x ) en el punto x o y se representa normalmente por f '( x o ), aunque también son utilizadas Ê dy ˆ expresiones como y '( x o ), Á ˜ , etc. Ë dx ¯x o
➬ Finalmente, dado que f ( x o + Dx ) - f ( x o ) = D y , se tendría:
f ' (x o ) = lím
Dx Æ 0
Dy Dx
expresión que permite interpretar la derivada de f ( x ) en el punto x o como el límite del cociente entre el incremento de la variable dependiente y el de la variable independiente, cuando éste último tiende a cero. ➬ Observemos, por cierto, que de acuerdo con la nueva notación, la ecuación de la tangentea la curva y = f ( x ) en un punto x o en el que sea derivable será: y - y 0 = f '( x o ) ( x - x o )
Ejemplos Debe quedar claro que una función será derivable en un punto sólo si existe el límite anterior. Así, por ejemplo: ➩
➀
La función “valor absoluto”: f ( x ) = x , no es derivable en el punto x 0 = 0 , al ser distintos los límites laterales: lím xÆ0
lím
+
-
xÆ0
x - 0 f ( x ) - f ( 0) = lím + x -0 x -0 xÆ0
= lím
x - 0 f ( x ) - f ( 0) = lím x -0 x -0 xÆ0
= lím
+
x -0 x -0
-
-x - 0 = -1 x -0
xÆ0
xÆ0
= +1
Cuando sospechemos que no habrá ningún problema, una forma de calcular —por ahora— la derivada de f ( x ) en x o es la del siguiente ejemplo: ➩
➁
Para hallar la derivada de f ( x ) = x 2 en el punto x o = 5 :
1º)
Hallaríamos f ( x o ) = 52 = 25
2º)
Calcularíamos f ( x o + Dx ) = (5 + Dx )2 = 25 + 10 Dx + ( Dx )2
3º)
Obtendríamos Dy = f ( x o + Dx ) - f ( x o ) = 10 Dx + ( Dx )2 Df Hallaríamos = 10 + Dx Dx Df = lím (10 + Dx ) = 10 Finalmente, calcularíamos lím Dx Æ 0 Dx Dx Æ 0
4º) 5º)
Teorema (la derivabilidad implica la continuidad) ➩
Si una función es derivable en un punto, entonces es continua en dicho punto. En efecto, si siendo x x 0 , escribimos: f ( x ) - f ( x o ) = lím [f (x ) - f (x o )] = lím
x Æ xo
luego:
x Æ xo
f (x ) - f (x o ) ( x - x o ) y tomamos límites para x Æ x o , se tendrá: x - xo
f (x ) - f (x o ) lím (x - x o ) = f ' (x o ) 0 = 0 x - xo x Æ xo
lím f (x ) = f (x o )
x Æ xo
– 23 –
El concepto de derivada
Advertencia importante El teorema recíproco del anterior no es cierto. Así, por citar el más típico de los ejemplos, la función f ( x ) = x , cuya gráfica aparece en la figura, es continua en el punto x 0 = 0 y, sin embargo, como hemos visto antes, no es derivable en dicho punto. En otras palabras: toda función derivable es continua, pero hay funciones continuas que no son derivables. Y
Observa la gráfica: el único punto en que f ( x ) = x no es derivable es aquel en que la gráfica parece quebrarse, aunque no se rompa. Si, hablando sin mucha precisión, las funciones continuas eran aquellas cuyas gráficas podían dibujarse sin levantar el lápiz del papel –no estaban rotas–, las funciones derivables son las que, además, tienen gráficas suaves, sin picos... Evidentemente, este lenguaje que utiliza expresiones como roto , suave, etc., aunque sumamente intuitivo, es demasiado ambiguo; justamente por eso se dan las definiciones matemáticas, para precisar las ideas.
f (x)=| x |
X
O
Definiciones (funciones derivables en un intervalo) 1. Diremos que una función f (x ) es derivable en un intervalo abierto (a, b) si es derivable en todo punto x 0 Œ(a , b). 2 . Diremos que una función f (x ) es derivable en un intervalo cerrado [a, b] si es derivable en el intervalo abierto (a , b) y, además, existen y son finitos: lím x Æa
+
f (x ) - f (a) ; x -a
lím x Æb
-
f (x ) - f (b) x -b
a los que se llama derivadas laterales a derecha e izquierda, en los puntos a y b, respectivamente, de la función f (x ).
Ejemplo Consideremos la función f (x ) = x . Tomado cualquier punto x 0 Œ( 0 , 1), se tiene:
f ' (x o ) = lím
x Æ xo
x - x0 = lím x - x0 x Æ xo
(
)( x+ x )= (x - x ) ( x + x ) x - x0
0
0
0
lím
x Æ xo
(x - x 0 ) (x - x 0 ) ( x +
x0
)
=
1 2 x0
Se trata, pues, de una función derivable en el intervalo abierto ( 0 , 1). En cambio, dado que:
lím xÆ0
+
f (x ) - f (0) x 1 = lím = lím = + • , f (x ) = x no es derivable en el intervalo [0, 1]. + + x -0 x x xÆ0 xÆ0
3. FUNCIÓN DERIVADA Ejemplo previo Supongamos que dada la función f (x ) = x 3 quisiéramos obtener f ¢(2) . Tendríamos que calcular:
f (x ) - f (2) , o bien: x -2 x Æ2 Tanto en un caso como otro, llegaríamos a que: f ¢(2) = 12. lím
lím
Dx Æ 0
f (2 + Dx ) - f (2) Dx
Si, posteriormente, necesitáramos conocer f ¢(5) , tendríamos que calcular: lím
x Æ5
f (x ) - f (5) , o bien: x -5
lím
Dx Æ 0
f (5 + Dx ) - f (5) Dx
Llegaríamos a que: f ¢(5) = 75 Pero, ¿y si posteriormente tuviéramos necesidad de conocer f ¢(8), f ¢(-3), f ¢(0) ...?
– 24 –
El concepto de derivada
Lo mejor sería ver que:
(x + Dx )3 - x 3 = 3x 2 Dx Dx Æ 0
"x ŒR : f ¢(x ) = lím
y el cálculo de f ¢(8), f ¢(-3), f ¢(0) ... sería inmediato, pues bastaría con hallar las imágenes de 8, –3, 0... mediante la función:
f¢ R æ æÆ R æÆ 3 x 2 x æ
Definición (de función derivada) ☞ Dada la función f (x ), designaremos por f ¢(x ) y llamaremos función derivada de f (x ) o, simplemente, derivada de f (x ), a la función: f¢ R æ æÆ R x æ æÆ f ¢(x ) que a cada punto x 0 en el cual f (x ) sea derivable hace corresponder como imagen f ¢(x 0) .
Ejemplo Para hallar la función derivada de f (x ) = x 2 procederíamos de la siguiente manera:
f (x + Dx ) - f (x ) (x + Dx )2 - x 2 2xDx + Dx 2 = lím = lím = 2x Dx Dx Dx Dx Æ 0 Dx Æ 0 Dx Æ 0
"x ŒR : f ¢(x ) = lím
f ¢(x ) = 2x
La derivada buscada sería, pues:
Definiciones (de derivadas sucesivas) ➀ Definida la función derivada de f (x ), tiene sentido hablar de: lím
x Æ x0
f ¢(x ) - f ¢(x 0) x - x0
A tal límite, cuando exista, lo llamaremos derivada segunda de la función f (x ) en el punto x 0 y lo representaremos por f ¢¢(x 0) . ➁ Por función derivada segunda de f (x ) se entenderá la función:
f ¢¢ D ææÆ x æ æÆ
R f ¢¢(x 0)
que a cada punto x 0 en el cual f ¢(x ) sea derivable hace corresponder como imagen f ¢¢(x 0) . (El conjunto D es el formado por todos los puntos en los que f ¢(x ) es derivable). En otras palabras: la derivada segunda de f (x ) es la derivada de la derivada de f (x ). ③
Reiterando el proceso se pueden definir las derivadas tercera, cuarta... n-ésima de f (x ) en un punto x 0 y las funciones deri-
vadas tercera, cuarta... n-ésima de la función f (x ). A la derivada n-ésima de f (x ) la representaremos por f (n (x ).
4. DERIVACIÓN Visto ya que el conocimiento de la función derivada de f (x ) convierte en trivial el cálculo de la derivada de f (x ) en cualquier punto, es claro que la simplificación será aún mayor cuando se disponga de unas reglas que permitan calcular mecánicamente la función derivada de otra. A la demostración de tales reglas dedicaremos el presente apartado. Veremos cuáles son las derivadas de funciones “elementales”, que no son el resultado de operar con otras más sencillas y, también, cuáles son las derivadas de las funciones obtenidas sumando, multiplicando, dividiendo... otras más sencillas.
– 25 –
El concepto de derivada
Derivada de la función constante Siendo f (x ) = k (constante), se tendrá: "x ŒR : f ¢(x ) = lím
Dx Æ 0
f (x + Dx ) - f (x ) k-k = lím =0 Dx Dx Æ 0 Dx
Por tanto:
f (x ) = k f ¢(x ) = 0
Derivada de la función identidad Siendo f (x ) = x , se tendrá: "x ŒR : f ¢(x ) = lím
Dx Æ 0
f (x + Dx ) - f (x ) (x + Dx ) - x = lím =1 Dx Dx Dx Æ 0
Por tanto:
f (x ) = x f ¢(x ) = 1
Derivada de una suma Siendo f (x ), g (x ) dos funciones y s (x ) = (f + g)(x ) = f (x ) + g (x ) la suma de ellas, en todo punto x ŒRR en el que f y g sean derivables se tendrá:
f (x + Dx ) + g (x + Dx ) - f (x ) - g (x ) (f + g)(x + Dx ) - (f + g)(x ) = lím = Dx Dx Dx Æ 0 Dx Æ 0
(f + g)¢ (x ) = lím = lím
Dx Æ 0
g (x + Dx ) - g (x ) f (x + Dx ) - f (x ) + lím = f ¢(x ) + g ¢(x ) Dx Dx Dx Æ 0
Por tanto:
s ( x ) = f ( x ) + g ( x ) s ¢ ( x ) = f ¢( x ) + g ¢ ( x )
Derivada de un producto Siendo f (x ), g (x ) dos funciones y p (x ) = (f g)(x ) = f (x ) g (x ) el producto de ellas, en todo punto x ŒRR en el que f y g sean derivables se tendrá: (f g)¢ (x )
f (x + Dx ) g (x + Dx ) - f (x ) g (x ) * (f g)(x + Dx ) - (f g)(x ) = lím = Dx Dx Dx Æ 0 Dx Æ 0
= lím
f (x + Dx ) g (x + Dx ) - f (x ) g (x + Dx ) + f (x ) g (x + Dx ) - f (x ) g (x ) = Dx È È f (x + Dx ) - f (x ) g (x + Dx ) - g (x ) = lím Í g (x + Dx ) + lím Íf (x ) = Dx Dx Dx Æ 0 Î Dx Æ 0 Î *
= lím
Dx Æ 0
= lím
Dx Æ 0
g (x + Dx ) - g (x ) ** f (x + Dx ) - f (x ) lím g (x + Dx ) + lím f (x ) lím = f ¢(x ) g (x ) + f (x ) g ¢ (x ) Dx Dx Dx Æ 0 Dx Æ 0 Dx Æ 0
[ En la igualdad * hemos sumado y restado f (x ) g (x + Dx ) ; en la ** hemos tenido en cuenta que g, derivable en x, es continua en x, por lo que lím g (x + Dx ) = g (x ) ] Dx Æ 0
– 26 –
El concepto de derivada Por tanto:
p ( x ) = f ( x ) g ( x ) p ¢ ( x ) = f ¢( x ) g (x ) + f (x ) g ¢(x )
Derivada del producto de un número por una función Siendo f (x ) una función y k ŒRR un número, consideremos la función: g(x) = k f (x ) . En todo punto x ŒRR en el que f sea derivable se tendrá:
g ¢(x ) = [k f (x )] ¢ = k¢ f (x )+ k f ¢(x ) = 0 f (x )+ k f ¢(x ) = k f ¢(x ) Por tanto:
g (x ) = k f (x ) g ¢(x ) = k f ¢(x )
Derivada de la función f ( x ) = x n (n Œ N) Sea f (x ) = x n (n ŒN) . En todo punto x ŒRR se tendrá: Ê nˆ
f ¢(x )
Ê nˆ
Ê nˆ
Ê nˆ
Ê nˆ
Á ˜ x n + Á ˜ x n-1Dx + Á ˜ x n-2 Dx 2 + Á ˜ x n-3 Dx 3 + L + Á ˜ Dx n - x n (x + Dx )n - x n Ë 0¯ Ë 1¯ Ë 2¯ Ë 3¯ Ën ¯ = lím = lím = Dx Dx Dx Æ 0 Dx Æ 0
[
Ênˆ n-1 Ênˆ n-2 Á ˜ x + Á ˜ x Dx 1 Ë2 ¯ Dx Æ 0 Ë ¯
= lím
Ê nˆ
Ê nˆ
]
Ê nˆ
+ ÁË3 ˜¯ x n-3 Dx 2 + L + ÁËn˜¯ Dx n-1 = ÁË 1˜¯ x n-1 = n x n-1
Por tanto:
f (x ) = x n (n ŒN) f ¢(x ) = n x n-1
Ejemplo Llegados a este punto, la derivada de una función polinómica resulta inmediata de calcular. Así, por ejemplo:
y = 2x 4 + 2x 3 - x + 2 y ¢ = 8 x 3 + 6 x 2 - 1
Derivada de un cociente Êf ˆ f (x ) Siendo f (x ), g (x ) dos funciones y c (x ) = Á ˜ (x ) = el cociente de ellas, en todo punto x ŒRR en el que f y g sean g (x ) Ëg¯ derivables y g no se anule, se tendrá:
f ( x ) = c ( x ) g ( x ) f ¢( x ) = c ¢ ( x ) g ( x ) + c ( x ) g ¢ ( x ) = c ¢ ( x ) g ( x ) + De donde:
c ¢(x ) =
f ¢(x ) f (x ) g ¢ (x ) f ¢(x ) g (x ) - f (x ) g ¢ (x ) = g (x ) [g (x )] 2 [g (x )] 2
– 27 –
f (x ) g ¢ (x ) g (x )
El concepto de derivada Por tanto:
f ¢( x ) g ( x ) - f ( x ) g ¢ ( x ) f (x ) c ¢(x ) = 2 g (x ) g (x )
c (x ) =
Ejemplo La derivada de la función y =
x 3 + 2x x2 +1
(3x + 2) (x + 1) - (x será: y ¢ = (x + 1) 2
2
2
3
[
)
+ 2x 2x
2
=
]
x 4 + x2 + 2
(x + 1) 2
2
Derivada de la función logarítmica Siendo f (x ) = ln x , en todo punto x ŒR + ( R + es el conjunto de los números reales mayores que cero), se tendrá:
f ¢( x )
È 1 Ê x + Dx ln(x + Dx ) - ln x = lím = lím Í ln Á Dx Dx Æ 0 Dx Æ 0 Î Dx Ë x È Ê x + Dx ˆ * Í = ln lím Á ˜ ÍDx Æ 0 Ë x ¯ Î
x Dx
1 x
1 x = ln e
=
Ê x + Dx ˆ ˆ ˜ ˜ = lím ln Á ¯ Dx Æ 0 Ë x ¯
1 Dx
*
=
1 x
[ En la igualdad * hemos tenido en cuenta que la función ln x es continua en R + ] Por tanto: 1 f (x ) = ln x f ¢(x ) = x
Derivada de una función compuesta Dadas dos funciones f (x ), g (x ), sea la función compuesta: h (x ) = (f o g)(x ) = f [g (x )]. Admitiremos sin demostración que: (f o g)¢ (x ) = f ¢ [g (x )] g ¢ (x ) La igualdad anterior es conocida como regla de la cadena.
Ejemplos Basta aplicar la regla de la cadena y algunos resultados vistos anteriormente para poder escribir, por ejemplo: 1
f (x ) = (x 3 + 2x )7
2
f (x ) = ln(x 2 + 5 x )3
f ¢( x ) =
3
Ê x2 +1ˆ 3 ˜ f (x ) = ÁÁ ˜ Ë x -2 ¯
Ê x 2 + 1 ˆ 2 2x (x - 2) - (x 2 + 1) 1 ˜ f ¢(x ) = 3 ÁÁ ˜ (x - 2)2 Ë x -2 ¯
f ¢(x ) = 7(x 3 + 2x )6 (3 x 2 + 2) 3(x 2 + 5 x )2(2x + 5) (x 2 + 5 x )3
– 28 –
El concepto de derivada
Derivación logarítmica La regla de la cadena y el que conozcamos la derivada de la función logarítmica nos van a permitir hallar las derivadas de muchas otras funciones. La llamada derivación logarítmica consiste, como veremos en los siguientes casos particulares, en derivar, no la función f (x ) directamente (normalmente porque ello resultará complicado), sino, siempre que sea f (x ) > 0, la función ln[f (x )]. Dicho así parece complicado pero, como veremos enseguida, es un procedimiento sencillo de aplicar.
Derivada de la función f ( x ) = x r (r Œ R ) La primera aplicación de la derivación logarítmica afectará a la función f (x ) = x r (r ŒR), en la que el exponente, a diferencia de un caso que vimos con anterioridad, puede ser cualquier número real. La siguiente cadena de implicaciones no requiere mucha explicación:
f (x ) = x r
ln f (x ) = ln x r = r ln x
[lnf (x )]¢ = (r ln x )¢
1 1 f ¢(x ) = r f (x ) x
f ¢(x ) = r
f (x ) = r x r -1 x
f (x ) = x r (r ŒR) f ¢(x ) = r x r - 1
Derivada de la función f ( x ) =
x
Un caso particular del que acabamos de ver es el de la derivada de f (x ) = x . Escribiendo f (x ) = x anterior, se tendría: f ¢(x ) =
1 x 2
1 -1 2 =
1 2 x
1 2
y aplicando el resultado
.
f (x ) = x f ¢(x ) =
1 2 x
Derivada de la función exponencial Sea f (x ) = a x . Si “tomamos logaritmos”: ln[f ( x )] = ln[a x ] = x ln a . Derivando ahora las funciones de cada miembro: f ¢(x ) = 1 ln a+ x 0 = ln a de donde: f ¢(x ) = f (x ) ln a = a x ln a . f (x )
f (x ) = a x f ¢(x ) = a x ln a
Derivada de la función f ( x ) = log a x Sea f (x ) = log a x . Entonces, af ( x ) = x .Tomando logaritmos neperianos: f (x ) ln a = ln x . Derivando las funciones de cada miembro:
f ¢(x ) lna =
1 1 . Finalmente: f ¢(x ) = . x x ln a
f (x ) = log a x f ¢(x ) =
Ejemplos 1 ) f (x ) =
ln(x 2 + 1) f ¢(x ) =
x
;
ln(x 2 + 1) (x 2 + 1)
– 29 –
3
2 ) f (x ) = 2x + 3
f ¢(x ) =
2 3
3 (2x + 3)2
1 x ln a
El concepto de derivada
Derivadas de las funciones trigonométricas 1
Sea f (x ) = sen x . Entonces, "x ŒR , se tendrá:
2x + Dx Dx Dx sen sen Ê ˆ ** x D 2 2 = lím cos x + 2 = cos x 1= cos x Á ˜ lím 2 ¯ Dx Æ 0 Dx Dx Dx Æ 0 Ë 2 A +B A-B sen ; en la ** hemos tenido en cuenta, por una [ En la igualdad * hemos aplicado la fórmula: senA - senB = 2 cos x 2 2 sen a =1] parte, la continuidad en R de la función coseno y, por otra, que lím aÆ 0 a 2cos sen(x + Dx ) - sen x * f ¢(x ) = lím = lím Dx Dx Æ 0 Dx Æ 0
f (x ) = sen x f ¢(x ) = cos x
2
Sea f (x ) = cos x . Entonces, "x ŒR , escribiendo f (x ) = sen[
p - x ] y aplicando la regla de la cadena, se tendrá: 2
È p p f ¢(x ) = Ícos[ - x ] (-1) = -cos[ - x ] = -sen x 2 2 Î
f (x ) = cos x f ¢(x ) = -sen x
3
Sea f (x ) = tg x . Entonces, "x ŒR , x (p / 2) + kp (k Œ Z ) , escribiendo f (x ) =
f ¢(x ) =
cos x cos x - sen x (-sen x ) 2
cos x
=
cos2 x + sen2 x 2
cos x
=
sen x y derivando, se tendrá: cos x
1 cos2 x
f (x ) = tag x f ¢(x ) =
Derivadas de las funciones trigonométricas inversas Antes de nada, recordemos brevemente cómo se definían las funciones trigonométricas inversas.
1
f (x ) = arc sen x era la función: arc sen
[-1 , 1] æææÆ [- p / 2 , p / 2] æ æÆ
x
y = arc sen x
que a cada x Œ[-1 , 1] le hacía corresponder el único y Œ[- p / 2 , p / 2] tal que sen y = x .
2
f (x ) = arc cos x era la función: arc cos
[0 , p]
æ æÆ
y = arc cos x
[-1 , 1] æææÆ
x
que a cada x Œ[-1 , 1] le hacía corresponder el único y Œ[0 , p] tal que cos y = x .
– 30 –
1 cos2 x
El concepto de derivada
3
f (x ) = arc tg x era la función: arc tg
R ææ æÆ (- p / 2 , p / 2)
x
æ æÆ
y = arc tg x
que a cada número real x le hacía corresponder el único y Œ(- p / 2 , p / 2) tal que tg y = x . Recordado lo anterior, veamos cuáles son las derivadas de tales funciones. 1
*
f (x ) = arc sen x sen f (x ) = x cos f (x ) f ¢(x ) = 1 f ¢(x ) =
1 ** 1 1 = = cos f (x ) + 1- sen2 f (x ) 1- x 2
[ La implicación * aplicando la regla de la cadena; la ** teniendo en cuenta que cos f ( x ) > 0 , pues f (x ) Œ(-p / 2 , p / 2) ]
f (x ) = arc sen x
2
*
f (x ) = arc cos x cos f (x ) = x - sen f (x ) f ¢(x ) = 1 f ¢(x ) = -
1 1- x 2
1 ** 1 1 ==sen f (x ) + 1- cos2 f (x ) 1- x 2
[ La implicación * aplicando la regla de la cadena; la ** teniendo en cuenta que sen f (x ) > 0, pues f (x ) Œ(0 , p) ]
f (x ) = arc cos x f ¢(x ) = -
3
1
*
f (x ) = arc tg x tg f (x ) = x
2
cos f (x )
**
f ¢(x ) = 1 f ¢(x ) = cos2 f (x ) =
1 2
1+ tg f (x )
=
1 1- x 2
1 1+ x 2
[ La implicación * aplicando la regla de la cadena; la ** teniendo en cuenta que 1+ tg2 a = 1/ cos2 a ]
f (x ) = arc tg x f ¢(x ) =
1 1+ x 2
Derivación implícita En ocasiones, la relación de dependencia entre las variables independiente y dependiente de una función no viene dada en forma explícita y = f (x ); es decir, mediante una igualdad en uno de cuyos miembros está la y aislada y en el otro una expresión en x. En tales casos, para hallar la derivada y ¢ = f ¢(x ), si fuera posible despejar la y, lo haríamos, procediendo luego a derivar normalmente. En caso contrario hay que proceder a la llamada derivación implícita, aplicando la regla de la cadena como en el ejemplo siguiente.
Ejemplo Supongamos que se desea hallar el valor de la derivada y ¢ = f ¢(x ) en el punto (0, 1) siendo y 7 + y 4 + yx 2 - 2y + x = 0 . Aplicando la regla de la cadena tendríamos: de donde sustituyendo x = 0 , y = 1, obtendríamos:
7y 6y ¢ + 4y 3y ¢ + y ¢x 2 + y 2x - 2y ¢ + 1= 0 , 7y ¢ + 4y ¢ - 2y ¢ + 1= 0
– 31 –
y, por tanto: y ¢ = -
1 9
El concepto de derivada
5. EJERCICIOS 1.-
Recordando que la derivada de una función en un punto es el límite de un cociente de incrementos, calcula un valor aproximado de las derivadas de las siguientes funciones en los puntos que se indican, pero sin calcular los correspondientes límites por los procedimientos habituales, sino utilizando la calculadora para hallar el valor de Dy / Dx para valores muy pequeños de Dx : 1 . f (x ) = x 2 en x 0 = 5
2 . f (x ) = 2x + 7
3 . f (x ) = sen x en x 0 = p / 2 .
en x 0 = 1
2 .-
Halla el valor exacto de las derivada de las funciones anteriores en los puntos indicados, pero aplicando la definición.
3 .-
Partiendo de la definición de derivada de una función en un punto, demuestra que: f (x ) =
4 .-
Determina en qué puntos son derivables las siguientes funciones: f (x ) =
5 .-
Halla el valor de a, sabiendo que la siguiente función es derivable en x = 0:
1 1 f ¢(a) = - 2 x a
, "a 0 .
|x | ; g (x ) =|x |- x . x
Ï a x +3 si x £ 0 f (x ) = Ì 3 Ó x - 3 x + 3 si x > 0 6 .-
Halla el valor de a y b sabiendo que la siguiente función es derivable en todo punto de R . ÏÔ a x 2 + 3 x si x £ 2 f (x ) = Ì 2 ÔÓ x - bx - 4 si x > 2
7 .-
Determina, si es que existen, los valores de a y b para los que la siguiente función es derivable en el punto x = 3. Ï a x 2 + b si |x |£ 3 Ô f (x ) = Ì 1 si |x |> 3 Ô Ó |x |
8 .-
De cierta función g (x ) se sabe que es continua en el punto x = 0. Demuestra que, entonces, la función f (x ) = x g (x ) es derivable en dicho punto.
9.-
Estudia si la función f (x ) = |x 2 - 4 x - 5| es derivable en los puntos de su gráfica pertenecientes al eje de abscisas.
1 0. - La posición de un móvil en función del tiempo es e (t ) = 100 + 20t - 8t 2 , donde e se mide en metros y t en segundos. Halla la velocidad media entre los instantes t = 1 y t = 2 y la velocidad instantánea para t = 3. Determina también la función velocidad y di si se trata de un movimiento uniformemente acelerado. En caso afirmativo, ¿cuál es la aceleración? 1 1. - Halla la derivada de las siguientes funciones: 1 ln x y= x x x 2 y= + 2 x 2
y = tg 5 x y=
x + sen x x + cos x
y = 7x
2
3
y = 3 + x3 y =x x
3 3
x2
x 2 - 2x + 1 y= x y = esen x y = ln
2
1 - cos x 1 + cos x
Ê ax + b ˆ 3 y =Á ˜ Ë c ¯
y=
y =cos 4 x - 4 cos x
y = tg( x 2 + 1)
y = x 3 + 3x
4 x -1 y= 4 3 x +2
Ê a + bx n ˆ m ˜ y = ÁÁ n˜ Ë a - bx ¯
y=
y = ln x
y = 4 3x - 2
y=
y = sen(cos x 2 )
y = ln sen25 x
y = ln
1 + sen x 1 - sen x
– 32 –
x8 2 4
8(1- x )
y =3 x + x
a - 2sen x cos x 1 2 ax - x 2
El concepto de derivada 1 2 . - Halla la derivada de las siguientes funciones:
y=
1 2
1+ tag x
[
]
y = ln x + ln(ln x )
y = arctg
y = cos2 x cos x 2
2
x +1
3
3
y = x e ex
y = sen[1 / sen(1 / x )]
y = ln x 2 + (ln x )2
y=
y =( x + cos2 x )3
y =sen sen x
y = cos 2 x 3 + tg2x
y =arc sen cos x
y =(1 + x 2 ) arc tg x
y =arc sen( cos x )
y = ln
y=
x +a 1 - ax
a 3
y=
x
2
-
b 3
x- x
y = ln(sen2 x + cos 2 x )
y= x+ x
y =sen[sen( sen x )] y = tg 1 / (1 + tg2 x )
x2 -1
y = sen
x
sen x + cos x sen x - cos x
y=
1 - cos x 1 + cos x
y = ln
a2 + x 2 + x a2 + x 2 - x
1 + tg x 1 - tg x
a - 2 sen x
y=
cos x
y = arcsen(sen x 2 )
y = sen( arcsen x )
y = ln( arcsen5 x )
y = arcsen(ln x )
y = eln arcsen
y =xx
y = logx ( x 2 + x )
y = x senp
y = ( sen x )x
y = x2+x
1- x 2
x
1 3. - ¿En qué punto la derivada de la función y = (ln x - 1) x es 1? 1 4 . - Calcula f ¢(1), siendo f (x ) = 1 5. - Sean las funciones f (x ) =
1 1 1 arctg x + ln . 2 4 x +1
x , x -3
g (x ) = tg x ,
Ê ˆ Ê ˆ h (x ) = ecos x . Calcula: f ¢(2) , g ¢ Á p ˜ , h ¢( p ) , (f o g)¢ Á p ˜ , (g o f )¢ (1) Ë3¯ Ë 4¯ 2
1 6 . - La población de una cierta colonia de bacterias crece según la función: y = 100 t +1- 100 (t + 1), donde t se mide en horas e y en miles de individuos. Calcula : a ) la tasa media de crecimiento de la población entre los instantes 2 y 3,5 horas; b ) la velocidad de crecimiento de la población al cabo de 5 horas. 1 7 . - Halla las ecuaciones de las tangentes a las siguientes curvas en los puntos que se indican:
y = x 2 - 7 x + 10 en x 0 = 2 ; 1 8. - Halla los puntos de la curva y =
x 1- x 2
y x = 10 en x 0 = 5
en los que la tangente tiene una inclinación de 45° respecto del eje OX.
1 9. - Halla las ecuaciones de las tangentes a la elipse 4 x 2 + 9y 2 = 40 cuyas pendientes son –2/9. 2 0. - Halla las ecuaciones de las rectas verticales que cortan a las curvas y = x 3 + 2x 2 - 4 x + 5 ; 3y = 2x 3 + 9 x 2 - 3 x - 3 en los puntos en que sus respectivas tangentes son paralelas. 2 1. - Halla las ecuaciones de las tangentes a la parábola y 2 = 2 px de pendiente p. 2 2. - ¿Hay algún punto en la curva y = e2x de tangente horizontal? 2 3. - Calcula las ecuaciones de las tangentes a las siguientes curvas, en los puntos dados:
x -1 en el punto de intersección con el eje OX. 2 2) A la curva y = arc cos3 x en el punto de intersección con el eje de ordenadas.
1) A la curva y = arcsen
3) A la curva y = x 3 en el punto x = 0 (haz un dibujo al respecto). 2 4. - Calcula la pendiente de la tangente a la circunferencia: x 2 + y 2 - 2x + 3y - 17 = 0 en el punto de abscisa 1 y ordenada positiva.
– 33 –
El concepto de derivada 2 5 . - Determina m con la condición de que la pendiente de la recta tangente a la curva: y = 2 6. - Dada la función f (x ) = ln 27.-
mx + 1 , en el punto x = 1 sea - 1. 2x + m
2x - 1 , halla a para que lím f ¢(x ) = • . 3x - 1 x Æa
Dadas las funciones: f (x ) = x 2 - 3 x + 1; g (x ) = tg x , halla la ecuación de la tangente a cada una de ellas en el punto de abscisa x = 0. Calcula también el punto intersección de dichas tangentes.
2 8. - Halla los coeficientes de la función: y = ax 2 + bx + c , sabiendo que la correspondiente parábola pasa por los puntos (0,3) y (2, 1) y que, en este último, la tangente tiene por pendiente 3. 2 9. - Dada la parábola y = x 2 - 2x + 5, halla la ecuación de la tangente a ella paralela a la recta secante a dicha parábola en los puntos de abscisas 1 y 3. 1
3 0. - Halla la ecuación de la tangente a la curva: y = (sen35 x ) 2 , en x 0 = p / 6 3 1. - Siendo f (x ) = x 3 , calcula f [f ¢(x )] ; f ¢[f (x )] ; [f (x 2)]¢ ; f ¢[f (x 2)] 3 2. - Obtén la derivada de la función: Ï 2 Ô x sen 1 si x 0 f (x ) = Ì x ÔÓ 0 si x = 0 ¿Es f ¢(x ) continua en x = 0 ? ¿Es derivable en ese punto? 3 3. - Demuestra, utilizando la derivación logarítmica, la regla de derivación del producto de dos funciones. 3 4. - Demuestra, utilizando la derivación logarítmica, la regla de derivación del cociente de dos funciones. n
3 5. - Obtén, utilizando la derivación logarítmica, la derivada de f (x ) = x . 3 6. - Siendo f (x ) = ln(2x + 1) , halla la función inversa f -1(x ). ¿A qué será igual, en los puntos en los que exista, la derivada de la
(
)
función f o f -1 (x )? 3 7. - Halla las derivadas segundas de las funciones: f (x ) = (1+ x 2) arc tg x ; g (x ) = sen2 x 3 8. - Demuestra que siendo y = e2x sen5 x , se verifica: y ¢¢ - 4y ¢ + 29y = 0. 3 9. - Halla la derivada n-ésima de las siguientes funciones:
f (x ) = sen x
g (x ) = cos x
j (x ) = ln x
l (x ) =
x +1 x -1
h (x ) = e-3x m (x ) =
2x - 1 2
x -x -2
k (x ) = n (x ) =
4 0 . - Halla el valor de y ¢ en el punto x = 1, y = 1, siendo: x y + x 2y + y 2 x + x 3y 3 - 4 = 0. 4 1. - Halla el valor de y ¢ en el punto x = 1, y = 1, siendo: x y y x = 1.
y 4 2. - Mediante derivación implícita halla y ¢ , siendo: ln x 2 + y 2 = arctg . x
– 34 –
1 1+ x x 2 + 7 x + 11
x 2 + 5x + 6
Tema 3 Funciones derivables
Funciones derivables
1. INTRODUCCIÓN En el tema anterior hemos presentado el concepto de derivada en sus dos acepciones: derivada de una función en un punto y función derivada de otra; en éste, sacaremos algún provecho de todo ello. En primer lugar hablaremos de la aplicación de la derivada al cálculo de valores aproximados de una función y al estudio de su crecimiento, decrecimiento, máximos y mínimos relativos. Si alguna vez has sentido la curiosidad de saber por qué todos los botes de refrescos son de las mismas dimensiones, por poner un ejemplo, ahora tendrás ocasión de satisfacerla. Posteriormente estudiaremos los teoremas de Rolle, del valor medio, de Cauchy, la regla de l'Hôpital..., resultados cumbres del pensamiento científico que verás por primera vez y que no te abandonarán mientras sigas teniendo algo que ver con las matemáticas. Finalizaremos el tema dando las técnicas necesarias para representar gráficamente una función.
2. LA DIFERENCIAL Planteamiento y definición Siendo f (x ) una función derivable en un punto x 0 , consideremos un Dx tal que x 0 + Dx pertenezca al dominio de f . Puede considerarse, entonces, la diferencia Dy = f (x 0 + Dx ) - f (x 0) que en la figura viene representada por el segmento BD.
f
Y
f (x0+x0 )
f (x0 ) a
x0
x0 +x0
X
Tracemos la tangente a la función en el punto x 0 , recta de pendiente f ¢(x 0) . Considerado el triángulo ABC se tendrá:
f ¢(x 0) = tga =
BC BC = BC = f ¢(x 0) Dx AB Dx
Dy = BD = BC + CD
Por otra parte:
[*]
Habida cuenta de que x 0 , aunque sea un punto cualquiera, es un punto fijo, el valor de CD dependerá de Dx , de modo que podríamos escribir CD como función de Dx : CD = r (Dx ) En estas condiciones, sustituyendo en [*] BC por f ¢(x 0) Dx y CD por r (Dx ) , tendríamos: Dy = f ¢(x 0) Dx + r (Dx ) y, por tanto:
r (Dx ) = Dy - f ¢(x 0) Dx de donde: lím
Dx Æ 0
r (Dx ) Dy - f ¢(x 0) Dx Dy = lím = lím - f ¢(x 0) = f ¢(x 0) - f ¢(x 0) = 0 Dx Dx Dx Æ 0 Dx Æ 0 Dx
En r e sum e n: Que cuando, considerada una función f (x ) derivable en un punto x 0 , tomamos un incremento Dx de la variable independiente, la variable dependiente experimenta a su vez un incremento que puede expresarse en forma de suma: Dy = f ¢(x 0) Dx + r (Dx ) igualdad que también puede escribirse en la forma:
f (x 0 + Dx ) = f (x 0) + f ¢(x 0) Dx + r (Dx ) con la particularidad de que r (Dx ) es, para Dx Æ 0, un infinitésimo de mayor orden que Dx , de tal manera que para valores de Dx suficientemente pequeños, como valor aproximado de f (x 0 + Dx ) podrá tomarse el de f (x 0) + f ¢(x 0) Dx .
– 36 –
Funciones derivables ☛ Observa que fijado el punto x 0 , el valor de f ¢(x 0) Dx depende sólo de Dx . Pues bien, a la función (df )x 0 tal que: (df )x 0 (Dx ) = f ¢(x 0) Dx la llamaremos diferencial de f (x ) en el punto x 0 , de modo que f ¢(x 0) Dx será el valor tomado por dicha diferencial para el incremento Dx . Digamos, por último, que la igualdad anterior suele escribirse habitualmente en la forma: dy = f ¢(x ) dx (El que se sustituya Dx por dx se justifica en que para la función y = x se verifica que f ¢(x 0) = 1 en cualquier punto, de donde, en ese caso, dy = 1 D x = Dx . Pero, dado que y = x , también habría de ser dy = dx , luego dx = Dx ).
Ejemplo (cálculo de un valor aproximado) 3
3
Supongamos que se desea conocer un valor aproximado de 64,153 . Tomada la función: f (x ) = x , lo primeros que haremos será fijar el x 0 más próximo a 64,153 en el cual se conozca el valor exacto de f (x 0) . Es decir, tomamos x 0 = 64 . Haciendo Dx = 0,153 y recordando la igualdad aproximada: f (x 0 + Dx ) @ f (x 0) + f ¢(x 0) Dx como en este caso se tiene: 1 f ¢(x ) = 3 2 3 x concluiremos que: 0,153 0, 051 3 3 64,153 @ 64 + =4+ = 4, 0031875 3 2 16 3 64 (Ciertamente, dar un valor aproximado sin acotar el error cometido es algo incompleto. En el futuro quizás completes el cálculo.)
3. CRECIMIENTO Y DECRECIMIENTO Definiciones (de función creciente y decreciente) Tras observar detenidamente las figuras siguientes: Y
Y
f
f
f (x 2) f (a) f (x 1)
f (x 1) f (a) f (x 2)
E(a)
x1 a
x2
X
E(a)
x1 a
x2
X
resultará razonable que digamos: ➀ Una función es creciente en un punto aŒRR si existe un entorno E(a) tal que:
Ï x < a f (x ) < f (a) x ŒE(a) Ÿ Ì Ó x > a f (x ) > f (a)
➁ Una función es decreciente en un punto aŒRR si existe un entorno E(a) tal que:
Ï x < a f (x ) > f (a) x ŒE(a) Ÿ Ì Ó x > a f (x ) < f (a)
☞ Por extensión, diremos que una función es creciente (decreciente) en un intervalo abierto cuando sea creciente (decreciente) en todos los puntos del intervalo.
– 37 –
Funciones derivables
Teorema (sobre la relación signo de la derivada-crecimiento) El siguiente es el primero de una serie de teoremas en los que se pondrá de manifiesto cómo el conocimiento de la derivada de una función permitirá conocer muchas propiedades de ésta: Sea f (x ) una función derivable en un punto a ŒRR . Entonces:
f ¢(a ) > 0 la función es creciente en a. f ¢(a ) < 0 la función es decreciente en a.
En efecto. Supongamos, por ejemplo, que f ¢(a) = k > 0; o sea: lím
x Æa
f ( x ) - f (a ) =k>0 x -a
Tomado entonces el entorno de centro k y radio k , podrá asegurarse, en virtud de la definición de límite, que el cociente 2 f ( x ) - f (a ) se hallará en él, y por lo tanto será positivo, sin más que tomar x perteneciente a cierto entorno reducido de a , E¢(a ). x -a Ï x ŒE¢(a ), con x < a f ( x ) < f (a ) y por tanto la función f sería creciente en a. Pero, entonces: Ì Ó x ŒE¢(a ), con x > a f ( x ) > f (a ) En el caso en que f ¢(a ) < 0 , se procede de forma análoga.
Advertencia El que la derivada de f ( x ) en el punto a sea positiva (negativa) constituye, como acabamos de ver, una condición suficiente para que la función sea creciente (decreciente) en dicho punto, pero no es una condición necesaria. Observemos la gráfica de la función f ( x ) = x 3 , que se halla a la derecha. Dicha función es creciente en el punto a=0 y, sin embargo, su derivada en dicho punto no es positiva.
Y
f (x) = x 3
O
X
Ejemplo Ï 2x - 2 > 0 ¤ x > 1 , la función será decreciente en el intervalo Sea f ( x ) = x 2 - 2x + 8. Como f ¢( x ) = 2x - 2, y sucede: Ì Ó 2x - 2 < 0 ¤ x < 1 (–•, 1) y creciente en el intervalo (1, •).
4. MÁXIMOS Y MÍNIMOS LOCALES Una de las aplicaciones más útiles de la derivada es, la referida a la obtención de los máximos y mínimos locales o relativos de una función (aunque se trata de ideas relacionadas, no debes confundir estos extremos locales con los absolutos, que fueron definidos en el primer tema). Empecemos estableciendo tales conceptos.
Definiciones (de máximo y mínimo local) 1
Diremos que una función y = f ( x ) tiene un máximo local o relativo en un punto a cuando exista un entorno E(a) tal que:
x ŒE(a ) f ( x ) £ f (a )
2
Diremos que una función y = f ( x ) tiene un mínimo local o relativo en un punto a cuando exista un entorno E(a) tal que:
x ŒE(a ) f ( x ) f (a )
– 38 –
Funciones derivables Y
Y máximo local en a
mínimo local en a
f f f (x 1)
f (a) f (x 2)
x1 a
x2
f (x 1)
X
x1
f (a) a
f (x 2) x2
X
Teorema (condición necesaria para la existencia de extremos locales) ➤ La condición necesaria para que una función, derivable en un punto a ŒRR , tenga un máximo o un mínimo local en dicho punto es que f ¢(a ) = 0 En efecto: Si fuera f ¢(a ) 0, se tendría, o bien f ¢(a ) < 0 , o bien f ¢(a ) > 0 , y la función sería o bien decreciente o bien creciente en a, donde no podría haber ni máximo ni mínimo local.
Tres observaciones • La primera, que la anterior no es condición suficiente para la existencia de extremos locales. En la página anterior hemos visto que siendo f ( x ) = x 3 , se tiene f ¢(0) = 0, y en tal punto la función no tiene ni máximo ni mínimo local: es creciente. • La segunda, que f ¢(a ) = 0 es, efectivamente, una condición necesaria para la existencia de extremo local, pero sólo en el supuesto de que f ( x ) sea derivable en el punto a. El ejemplo más sencillo para ilustrar lo que decimos lo constituye la función f ( x ) =|x |, de la que ya hemos hablado en otras ocasiones y cuya gráfica está a la derecha. En a = 0 tiene un mínimo local y en ese punto la función ni siquiera es derivable.
Y
f (x)=| x |
O
X
• La tercera, que el teorema anterior permite seleccionar los puntos, de entre aquellos en los que f ( x ) es derivable, en los que puede haber máximos o mínimos relativos; pero aun en ellos, no despeja totalmente las dudas. Así, considerada la función:
f ( x ) = 3x 4 - 28 x 3 + 60 x 2 + 5 su derivada se anula en los puntos x = 0 , x = 2 y x = 5 , pero ¿cómo saber si, efectivamente, alcanza extremos locales en ellos?
Teorema (condición suficiente para la existencia de extremos locales) Sean f ( x ) una función y a ŒRR un punto tales que f ¢(a ) = 0
Entonces:
f ¢¢(a ) < 0 En a existe un máximo local. f ¢¢(a ) > 0 En a existe un mínimo local.
En efecto. Supongamos f ¢(a ) = 0 , f ¢¢(a ) < 0 . En tal caso, la función f ¢(x ) sería decreciente en a, y dado que f ¢(a) = 0, habrá un entorno de a en el que:
f ¢(x ) > 0 a la izquierda de a ¸ f (x ) creciente a la izquierda de a ¸ f ¢(x ) < 0 a la derecha de a
f (x ) decreciente a la derecha de a
En a existe máximo local.
☛ Observemos que, sin necesidad de calcular f ¢¢(a), cuando partiéndose de que f ¢(a) = 0 se sepa que hay un entorno de a en el que a la izquierda de a es f ¢(x ) > 0, y a la derecha f ¢(x ) < 0, eso bastará para concluir que en a habrá un máximo local. (En el caso f ¢(a) = 0 , f ¢¢(a) > 0 el razonamiento es análogo)
– 39 –
Funciones derivables
Observaciones 1 . - Ahora podemos concluir que la función que antes mencionábamos, f ( x ) = 3x 4 - 28 x 3 + 60 x 2 + 5 , alcanza en x = 0 y x = 5 mínimos locales y en x = 2 un máximo local. 2. - Naturalmente, podría uno preguntarse que sucederá en puntos en los que, anulándose la derivada primera de f ( x ), también se anule la segunda. Pues puede que haya un máximo local, puede que un mínimo local, o puede que ni lo uno ni lo otro, como se puede comprobar dibujando las gráficas de las funciones f ( x ) = x 3 y de f ( x ) = x 4 y viendo qué sucede, en ambos casos, con f ¢(0) y f ¢¢(0) . Hay criterios que permiten salir de dudas en tales casos, pero no se estudian en este curso.
5. PROBLEMAS DE OPTIMIZACIÓN Consideraciones previas Con frecuencia, en ciencias como la economía, la física, la sociología... se presentan situaciones en las que intervienen funciones, normalmente de varias variables, y se deseará conocer para qué valores de éstas las funciones alcanzan un valor óptimo, esto es: máximo o mínimo. Nosotros nos limitaremos a estudiar algunos ejemplos sencillos, con funciones como máximo de dos variables, entre las que será posible establecer alguna relación, de forma que, finalmente, la función que deseemos optimizar dependerá de una sola variable. Estos problemas son de índole eminentemente práctica, y en su resolución se pueden permitir ciertas alegrías que serían impropias en un contexto más teórico. El máximo o mínimo absoluto de la función f ( x ) se buscará en un intervalo cerrado que habrá que deducir del propio contexto del problema y, salvo que dicho valor se alcance en uno de los extremos del intervalo, el maximo o mínimo absoluto será local y se encontrará en un punto en el que la derivada se anule. Resolveremos a continuación un ejemplo, dejando otros para el apartado de ejercicios.
Ejemplo x
Se desea averiguar cuál es el envase cilíndrico de 333 cm3 de capacidad que, por tener superficie total mínima, resulte el más económico. En primer lugar hemos de establecer la función que se desea optimizar; en este caso, el área total, A, del cilindro. Siendo x el radio de la base e y la altura del cilindro se tendrá:
y
A( x , y ) = 2p x 2 + 2p x y A continuación, buscaremos alguna relación entre las dos variables, x e y. El hecho de que el volumen del cilindro sea 333 cm3 nos permite escribir:
p x 2 y = 333 Resumiendo: Función a optimizar:
A( x , y ) = 2p x 2 + 2p x y [*]
Relación entre las variables:
p x 2 y = 333
Despejando en [**]: y =
333
px
2
[**]
y llevando ese valor a [*]: A( x , y ) = 2p x 2 + 2p x
333
px
2
= 2p x 2 +
666 x
Como vemos, la función A depende ya de una sola variable, x (el radio de la base del cilindro) y tendrá por dominio el intervalo (0, +•) : el mínimo absoluto coincidirá con el mínimo local, luego: 666 A ¢( x ) = 4p x - 2 = 0 x de donde resulta: x = 3, 756 cm. El correspondiente valor de la altura es: y = 7, 49 cm. (Podría comprobarse que para ese valor de x, la derivada segunda de A es positiva).
– 40 –
Funciones derivables
6. CURVATURA Consideraciones previas Cuando próximamente nos dispongamos a trazar la gráfica de una función, la información que nos proporcionará su derivada será fundamental, pues el conocimiento de los intervalos de crecimiento y decrecimiento, de los extremos locales, es decisivo a la hora de dibujar la curva. Hay, sin embargo, algunos aspectos más sutiles, que hacen referencia a la forma de la curva, para cuyo estudio hay que hacer uso de la segunda y, en algunos casos, la tercera derivada. A ellos dedicaremos este apartado.
Definiciones Observa las figuras siguientes. En todas aparece una curva y = f ( x ) y su recta tangente ( y t ) en el punto a. Lo que distingue unos casos de otros es la posición relativa en un entorno de a de la curva y la tangente: en el primer caso, el de la izquierda, la curva queda por encima de la tangente en a ; en el segundo, la curva queda por debajo de la tangente y, finalmente, en el tercero, el que la curva quede por encima o por debajo de la tangente depende de que nos situemos a la derecha o a la izquierda de a. En el primer caso, diremos que la función es cóncava en a; en el segundo que es convexa y, en el tercer caso, diremos que a es un punto de inflexión. Y
yt
Y
f
Y
yt f
yt
a
X
a
f X
a
X
Formalizando un poco lo anterior: • Sea f ( x ) una función derivable en un punto a y consideremos su tangente en ese punto, de ecuación: y t = f (a ) + f ¢(a ) ( x - a ). 1 Diremos que f ( x ) es cóncava en a si existe un entorno E(a) tal que x ŒE¢(a ) f ( x ) > y t 2 Diremos que f ( x ) es convexa en a si existe un entorno E(a) tal que x ŒE¢(a ) f ( x ) < y t 3 Diremos que f ( x ) tiene un punto de inflexión en a si existe un entorno E(a) tal que, tomado x ŒE¢(a ), el signo de f ( x ) - y t es distinto, según sea x < a ó x > a .
Teorema Si f ( x ) es una función y a ŒRR un punto tales que existen f ¢(a ) , f ¢¢(a ), siendo además f ¢¢( x ) continua en a, entonces: ➟ Si f ¢¢(a ) < 0, entonces f ( x ) es convexa en a . ➟ Si f ¢¢(a ) > 0, entonces f ( x ) es cóncava en a . ➟ Si f ¢¢(a ) = 0, f ¢¢¢(a ) 0 , entonces f ( x ) tiene un punto de inflexión en a . Demostremos la primera proposición: Considerada la función g (x ) = f (x ) - y t , se tiene: g (a) = 0 ; g ¢ (a) = 0 ; g ¢¢ (a) = f ¢¢(a). Luego, si como estamos suponiendo, f ¢¢(a) < 0, entonces g ¢ (a) = 0, g ¢¢ (a) < 0 y, por tanto, g (x ) tiene un máximo local en a. Pero, entonces, g (x ), al anularse en a, habrá de ser negativa en un entorno de a, o sea, que f (x ) será convexa en a. Las otras proposiciones se demuestran análogamente.
Ejemplo Considerada la función: f ( x ) = x 3 - 6 x 2 + 12, como: f ¢( x ) = 3x 2 - 12x ; f ¢¢( x ) = 6 x - 12 ; f ¢¢¢( x ) = 6 , se tiene: a ) f ( x ) es convexa en el intervalo (-• , 2) b ) f ( x ) es cóncava en el intervalo (2 , •) c ) f ( x ) tiene una inflexión en a = 2.
– 41 –
Funciones derivables
7. TEOREMA DE ROLLE Teorema (de Rolle) ➤ Si f ( x ) es una función continua en [a , b ], derivable en (a , b ) y tal que f (a ) = f (b ), entonces existe al menos un punto a Œ(a , b ) tal que f ¢(a ) = 0 . En efecto. Recordando el teorema de Weierstrass, la demostración de éste es fácil: Como f ( x ) es continua en el intervalo cerrado [a , b ], alcanza en él un máximo y un mínimo absolutos y, entonces, una de dos: ➼ O bien cada uno de esos valores los toma en los extremos del intervalo, y eso supondría, al ser f (a ) = f (b ), que los valores máximo y mínimo de la función en el intervalo coincidirían, luego la función sería constante, con derivada nula en todos los puntos de (a , b ), ➼ O bien uno al menos de esos valores los toma en un punto interior a , de (a , b ). Pero ese máximo o mínimo absoluto sería local –¿por qué?– y, en consecuencia, siendo la función f ( x ) derivable en (a , b ), habría de ser f ¢(a ) = 0 .
Interpretación geométrica Una inmediata interpretación geométrica del teorema de Rolle es la que se desprende de la figura adjunta: Trazada la gráfica de una función f ( x ) continua en [a , b ], derivable en (a , b ) y tal que f (a ) = f (b ), existe al menos un punto en el interior del intervalo en el que la tangente a la curva es horizontal, de pendiente cero.
Y
f f (a)
Ejemplo
f (b) a
a
b
X
La función f ( x ) = x 2 - 8 x es continua en el intervalo [3, 5] y derivable en (3, 5), verificándose que f (3) = f (5) = -15 . Por tanto, existirá a Œ(3 , 5) tal que f ¢(a ) = 0 . Ahora bien, como f ¢( x ) = 2x - 8 , tendremos que f ¢(4) = 0; luego, en este caso, el punto a del teorema (que puede ser más de uno, aunque en este caso sea sólo uno) es igual a 4.
Una interpretación física Supongamos que la función f ( x ) del teorema indicara la posición en función del tiempo de un punto en movimiento rectilíneo. La igualdad f (a ) = f (b ) significaría que transcurrido un tiempo b – a desde el instante a, el móvil se encontraría en el punto de partida, luego al ser f ¢(a ) = 0 para algún a Œ(a , b ) , la velocidad habría sido nula en algún momento. O sea, que o bien no se habría producido realmente movimiento o bien habría existido al menos un momento en el que, al dejar de avanzar, y retroceder, el móvil se habría detenido.
8. TEOREMAS DEL VALOR MEDIO Teorema (de Cauchy o del valor medio generalizado) ➤ Si f ( x ) y g ( x ) son dos funciones continuas en [a , b ] y derivables en (a , b ), entonces existe al menos un punto a Œ(a , b ) tal que: f (b ) - f (a ) g ¢(a ) = g (b ) - g (a ) f ¢(a )
[
]
[
igualdad que puede escribirse:
f (b ) - f (a ) f ¢(a ) = g (b ) - g (a ) g ¢(a ) si los denominadores no son nulos.
– 42 –
]
Funciones derivables En efecto. La función:
[
]
[
]
h ( x ) = f (b ) - f (a ) g ( x ) - g (b ) - g (a ) f (x ) es continua en [a , b ], derivable en (a , b ) y cumple: h (a ) = h (b ). Entonces, en virtud del teorema de Rolle, existirá al menos un punto a Œ(a , b ) tal que h ¢(a ) = 0. Pero como:
[
]
[
]
h ¢(a ) = f (b ) - f (a ) g ¢(a ) - g (b ) - g (a ) f ¢(a ) se concluye lo que habíamos anunciado. Observemos que el teorema de Cauchy permite comparar el incremento experimentado por las dos funciones a lo largo del intervalo [a, b] comparando sus derivadas en un punto interior. Buscarle una interpretación geométrica es algo más complicado que en el caso anterior; pero, sin embargo, desde un punto de vista físico, lo que se deduce de lo demostrado es que la relación entre los espacios recorridos por dos móviles en un mismo intervalo de tiempo coincide con la relación entre sus velocidades en un instante determinado.
Teorema (del valor medio) ➤ Si f ( x ) es una función continua en [a , b ] y derivable en (a , b ), entonces existe al menos un punto a Œ(a , b ) tal que
f (b ) - f (a ) = f ¢(a ) b -a La demostración es sencilla: Tanto la función f ( x ) como la g ( x ) = x , son continuas en [a , b ] y derivables en (a , b ), luego existirá al menos un punto a Œ(a , b ) tal que:
f (b ) - f (a ) f ¢(a ) o sea: = g (b ) - g (a ) g ¢(a )
f (b ) - f (a ) = f ¢(a ) b -a
Interpretación geométrica Observando la figura de la derecha se comprenderá que el teorema del valor medio, desde un punto de vista geométrico, significa que en el arco de la curva f ( x ), continua en [a , b ] y derivable en (a , b ), existe al menos un punto en el que la tangente, por tener la misma pendiente que la secante que une los extremos del arco: (a,f (a )) , (b ,f (b )) , es paralela a ella.
Y
f
f (b) f (a) a
Una interpretación física
a
X
b
Considerado un movimiento rectilíneo de ecuación e = f (t ), con f (t ) derivable en R , el teorema precedente permite asegurar que entre dos instantes t 0 y t1 siempre habrá otro en el que la velocidad coincida con la velocidad media a lo largo del intervalo t 0 , t1 .
[
]
Observación Antes de seguir, parece conveniente hacer alguna apostilla sobre la fórmula:
f (b ) - f (a ) = f ¢(a ) b -a llamada fórmula de los incrementos finitos. El hecho de que el teorema asegure la existencia del punto a, pero lo deje indeterminado, no le priva de trascendencia, y sobre ello quizás tengas ocasión de hablar con más detalle en el futuro. Por el momento, podemos decir que la fórmula anterior puede utilizarse para acotar el valor de f ( x ) en lugares en los que f ¢( x ) esté acotada, mejorando las aproximaciones que se hacían con la diferencial. Así, por ejemplo, intentemos encontrar un valor aproximado de
5
– 43 –
244 :
Funciones derivables Buscamos en la sucesión de potencias quintas: 15, 25, 35, 45... la última menor de 244, y vemos que es 35 = 243. Entonces, consi1 5 , existirá deramos la función f ( x ) = x , que es continua en [243, 244] y derivable en (243, 244), por lo que, dado que f ¢( x ) = 5 5 x4 a , 243 < a < 244, tal que: 5
5
244 - 243 1 = 5 244 - 243 5 a4 1 1 5 5 244 - 3 = 5 o bien: 244 = 3 + 5 5 a4 5 a4
De modo que:
Pero el que sea 35 = 243 < a < 244 < 3, 015 , nos permitirá escribir: 1 5
3, 01
<
1 1 1 1 1 1 1 1 < 5 < 5 < 4 3+ < 3+ < 3+ 4 4 5 a 3 3, 01 3 5 3, 01 5 34 a4 5 a 4 5
3, 00243 < 244 < 3, 00247
O también:
con lo que habremos dado un valor aproximado hasta la cuarta cifra decimal de
5
244 .
Corolario ☞
Si f (x ) es una función tal que f ¢(x ) = 0 , "x Œ(a , b ) , entonces f (x ) es constante en (a , b ) .
En efecto. Tomado un intervalo cerrado [a ¢, b¢] contenido en (a , b ) , f (x ) será continua en [a ¢, b¢] y derivable en (a ¢, b¢) , luego existirá a Œ(a ¢, b¢) tal que: f (b¢) - f (a ¢) = f ¢ (a ) = 0 b¢ - a ¢ o sea: f (b¢) = f (a ¢) , de donde, al ser a ¢, b¢ arbitrarios, se deduce la tesis. O sea, que no sólo es cierto que la derivada de una constante es cero, sino que una función de derivada nula en un intervalo es constante en el intervalo.
Otro corolario ☞
Si f (x ) y g (x ) son dos funciones tales que f ¢(x ) = g ¢(x ), "x Œ(a , b ) , entonces existe k ŒRR tal que, en dicho intervalo: f (x ) = g (x ) + k. (Es decir, si dos funciones tienen igual derivada, difieren en una constante.)
Para demostrarlo, basta aplicar el corolario anterior a la función h (x ) = f (x ) - g (x ) .
9. REGLA DE L'HÔPITAL Teorema (Regla de l'Hôpital)
Si lím f (x ) = lím g (x ) = 0 y existe lím x Æa
x Æa
x Æa
f ¢(x ) f (x ) f (x ) f ¢(x ) , verificándose: lím , entonces también existe lím = lím g ¢(x ) x Æa g ( x ) x Æa g ( x ) x Æa g ¢(x )
Efectuaremos la demostración en dos partes. ➪
Primero, veamos qué tenemos.
f ¢(x ) , supongamos que es igual a L, garantiza que existe un entorno E(a) tal que g ¢(x ) f (x ) y g (x ) son derivables y g ¢(x ) no se anula en E¢ (a) . 1 ) La hipótesis de que existe lím
x Æa
– 44 –
Funciones derivables (En caso contrario, o sea, si todo entorno de a contuviera puntos en los que f (x ) o g (x ) no fueran derivables, o g ¢(x ) tomara el valor 0, no cabría que lím
x Æa
f ¢(x ) f ¢(x ) esté definida en un entorno de a.) = L , pues ello exige que la función g ¢(x ) g ¢(x )
2 ) Además, podemos suponer que f (a) = g (a) = 0, porque aunque no fuese así inicialmente, podríamos cambiar el valor de las funciones en a, ya que para la existencia y, en su caso, valor de los límites para x Æ a , es indiferente lo que ocurra precisamente en a. 3 ) En tal caso, cualquiera que sea x ŒE¢(a) (supongamos x > a), la función g no se anula en (a , x ], porque de anularse en un punto y , con a < y £ x , g cumpliría las condiciones del teorema de Rolle en [a , y ] , luego existiría b Œ(a , y ) (y, por tanto, b Œ(a , x ) , que está contenido en E¢ (a) ) tal que g ¢(b) = 0, contra lo dicho en 1 ) ➪
Segundo:
Como consecuencia de todo lo anterior, cualquiera que sea x ŒE¢(a) (supongamos x > a ), f y g cumplen las hipótesis de Cauchy en [ a, x] , luego existirá un z Œ(a , x ) tal que:
f (x ) - f (a) f ¢ (z ) f (x ) f ¢ (z ) = , es decir: = g (x ) - g (a) g ¢ (z ) g (x ) g ¢ (z ) Pero, siendo lím
x Æa
f ¢ (z ) = L , se tendrá que para todo e > 0 existirá d > 0 tal que: g ¢ (z ) 0 < z -a < d
f ¢ (z ) -L < e g ¢ (z )
y en esas condiciones, fijado e > 0 bastará tomar un x ŒE¢(a) que verifique: 0 0
podremos concluir que en el punto (- 3 , - 3 3 / 2) existe un máximo local y en el ( 3 , 3 3 / 2) un mínimo local. Lo que suceda en el punto (0, 0), queda a expensas de lo que veamos posteriormente.
– 47 –
Funciones derivables 6 . Crecimiento y decrecimiento Recordemos lo dicho líneas atrás: Si f (x ) una función derivable en un punto a ŒRR , entonces:
f ¢(a ) > 0 la función es creciente en a. f ¢(a ) < 0 la función es decreciente en a. (Desde luego, una función puede ser creciente o decreciente en otros puntos, además de aquellos en los que la derivada es positiva o negativa, pero se trata de casos de más interés teórico que práctico).
x 4 - 3x 2
f ¢(x ) =
En el ejemplo que estamos considerando se tenía que:
(x 2 - 1)2
=
x 2 (x 2 - 3) (x 2 - 1)2
cociente que es positivo en los intervalos (-•, - 3 ) y ( 3 , •), en los que la función será creciente. En el intervalo (- 3 , 3 ) , en el que –salvo en el origen– la derivada es negativa, la función sera decreciente. En cuanto a lo que suceda en el origen precisamente, basta con observar que para valores x < 0 la función toma valores negativos, en x = 0 se anula y para valores x > 0 valores positivos. También sera, pues, creciente en este punto. 7 . Concavidad, convexidad y puntos de inflexión Dijimos páginas atrás que si f ( x ) es una función y a ŒRR un punto tales que existen f ¢(a ) , f ¢¢(a ), siendo f ¢¢( x ) continua en a, entonces: 1 Si f ¢¢(a ) < 0, entonces f ( x ) es convexa en a. 2
Si f ¢¢(a ) > 0, entonces f ( x ) es cóncava en a.
3
Si f ¢¢(a ) = 0, f ¢¢¢(a ) 0 , entonces f ( x ) tiene un punto de inflexión en a.
En el caso que estamos analizando la segunda derivada es: f ¢¢(x ) = forma f ¢¢(x ) =
2x (x 2 + 3)(x 2 - 1) (x 2 - 1)4
2x (x 2 + 3) (x 2 - 1)3
, cuyo signo se analiza mejor escribiéndola en la
, pues así nos aseguramos de que el denominador o es cero o positivo.
Igualado el numerador a cero, se ve que las únicas raíces de la correspondiente ecuación son –1, 0 y 1, por lo que dividiendo la recta real en los intervalos (-•, -1) , (-1, 0) , (0, 1) y (1, •) y viendo qué signo toma f ¢¢(x ) en un punto de cada uno de ellos, se llega a las siguientes conclusiones, que expresamos mediante un esquema:
Signo de f ’’(x)
–
+
–
–1
Tipo de curva
convexa
0
cónvaca
+ +1
convexa
cóncava
En los puntos –1 y +1 la función no estaba definida, y en x = 0 podría comprobarse que la tercera derivada es distinta de cero, por lo que en x = 0 hay un punto de inflexión. 8 . Asíntotas En el primer tema de esta parte del curso ya había aparecido el concepto de asíntota, que ahora completaremos. 1.
Cuando, dada una función f ( x ), suceda que
lím f (x ) = L ó
x Æ +•
lím f (x ) = L , de la recta y = L diremos que es una asíntota
x Æ -•
horizontal de dicha función. En cualquiera de los cuatro casos de la figura siguiente, la recta dibujada en línea de puntos es una asíntota horizontal de la curva.
– 48 –
Funciones derivables Y
Y L
asíntota
L
asíntota
f f X
X
Y
Y
f f L
L
asíntota
asíntota
X 2.
X
Si, dada una función f ( x ), sucede que lím f (x ) = ±• ó x Æa -
lím f (x ) = ±• , de la recta x = a diremos que es una asíntota
x Æa +
vertical de dicha función. La recta dibujada en línea de puntos en la figura siguiente es una asíntota vertical de la correspondiente curva. Y
f
asíntota
a X
3.
Pensemos, ahora, en una recta, cuya de ecuación y = m x + p, cuya situación respecto de la curva f ( x ) fuese la de la siguiente
figura. Habría de ser: lím [y - f (x )] = 0. En tal caso, diríamos que la recta en cuestión es una asíntota oblicua de la función f ( x ). xÆ•
Y
f X
¿Cómo se calcularán los valores de m y p ? Observemos, a tal fin, que: 1. 2.
lím [m x + p - f (x )] = 0 lím
xƕ
xƕ
È m x + p - f (x ) f (x ) f (x ) = 0 lím Ím = 0 m = lím x x x Æ •Î xÆ• x
lím [m x + p - f (x )] = 0 lím [m x - f (x )] + p= 0 p= lím [f (x ) - m x ]
xƕ
xƕ
xƕ
Veamos cómo se aplica lo anterior a la función de nuestro ejemplo, y = f (x ) = 1.
Como el lím
xƕ
x3 x2 -1
no es finito, no existe asíntota horizontal.
– 49 –
x3 x2 -1
.
Funciones derivables
2.
lím
x Æ 1-
x3 x2 -1
= -• ;
x3
lím
x Æ 1+
x2 -1
= +• , luego la recta de ecuación x = 1 es una asíntota vertical.
f (x ) f (x ) x2 = lím 2 = 1, luego , observando que lím xÆ• x xÆ• x xÆ• x -1 hay una asíntota oblicua , y = m x + p, siendo m = 1. El valor de p lo calculamos así: 3.
Para ver si hay alguna asíntota oblicua, vemos si es finito lím
È x3 x =0 p= lím [f (x ) - m x ] = lím Í 2 - x = lím 2 xÆ• x Æ •Í Î x - 1 x Æ • x - 1 Así pues, la asíntota oblicua tiene por ecuación: y = x . 9 . Posición de la curva respecto de las asíntotas Conocidas las asíntotas de una función, conocer la posición de la curva respecto de ellas puede darnos la última y muy significativa información sobre la gráfica que queremos dibujar. • Consideremos, en primer lugar, una asíntota vertical, de ecuación x = a . ¿Cómo saber en qué zonas, de las cuatro señaladas en la siguiente figura, se halla la curva? Y
1 3
Si lím f (x ) = +•
la curva se hallará en la zona [1]
Si lím f (x ) = -•
la curva se hallará en la zona [2]
Si lím f (x ) = +•
la curva se hallará en la zona [3]
Si lím f (x ) = -•
la curva se hallará en la zona [4]
x Æa -
a
x Æa -
X
x Æa +
2
4
x Æa +
• En cuanto a cómo conocer la posición de la curva respecto de una asíntota horizontal o una oblicua, en ambos casos se sigue el mksmo procedimiento, que consiste en lo siguiente: Representemos por y c los valores de las ordenadas de los puntos de la curva, y por y a las de los puntos de la asíntota. ¿Cómo saber en qué zonas, de las cuatro señaladas en esta nueva figura, se halla la curva? Y
Si y c - y a > 0, para x Æ +•, la curva se hallará en la zona [1]
1
Si y c - y a < 0, para x Æ +•, la curva se hallará en la zona [2]
2
X 3
Si y c - y a > 0, para x Æ -•, la curva se hallará en la zona [3]
4
Si y c - y a < 0, para x Æ -•, la curva se hallará en la zona [4]
Apliquemos lo anterior a nuestro e je m p lo , empezando por dibujar las asíntotas de ecuaciones conocidas: x = -1 , x = 1 , y = x . 2
3
6
1) Las posiciones indicadas con [1] y [2] se deben, respectivamente, a que: lím
x Æ -1-
x3 x2 -1
= -• ;
lím
x3
x Æ -1+
x2 -1
= +•
1) En cuanto a las posiciones indicadas con [3] y [4] son debidas a que: 5
1
lím
4
x Æ 1-
3) Con relación a la asíntota oblicua, y a = x , observemos que siendo y c - y a =
x3 x2 -1 x
= -• ;
x Æ 1+
, se tendrá: x -1 y c - y a < 0, para x Æ -• mientras que y c - y a > 0, para x Æ +•.
De ello se deduce que la curva estará en las zonas [5] y [6], respectivamente.
– 50 –
2
lím
x3 x2 -1
= +•
Funciones derivables Despues de todo lo anterior, sólo nos queda trazar la curva. Lo hacemos a continuación, dejando para el lector la tarea de comprobar que en ella se reflejan exactamente todas las propiedades de la función, previamente analizadas.
Gráfica de la función
f (x ) =
x3 x2 -1 4 3 2 1
-4
-3
-2
-1
2
3
4
-2 -3 -4
Otro ejemplo Se muestra a continuación la gráfica de otras función, cuya obtención puede ser un interesante ejercicio.
Gráfica de la función
f (x ) =
x2 2x - 2
4 2 -2 -4
2 -2 -4
– 51 –
4
Funciones derivables
11. EJERCICIOS 1.-
Calcula el valor de la diferencial de las siguientes funciones en los puntos y para los incrementos de la variable independiente que se indican: 1 . f (x ) = x 2 en x 0 = 5 , para Dx = 0, 001 1 3 . f (x ) = en x 0 = 2, para Dx = 0, 002 x
2 .-
3 .-
4 .-
2 . f (x ) = x en x 0 = 25 , para Dx = 0, 001 4 . f (x ) = ln x en x 0 = 1, para Dx = 0, 001
Utilizando la diferencial, calcula un valor aproximado de: 1 a. b . 4 1, 00325 - 2 1, 00323 5 1, 024
50
Decide si las siguientes funciones son crecientes o decrecientes en los puntos que se indican:
f (x ) = x 2 - 6 x + 8 f (x ) = cos x - sen x
x 0 = -3 , x 1 = 2 , x3 = 3 x 0 = 0 , x 1 = p / 4 , x 3 = 3p / 4
f (x ) = x 3 - 6 x 2 + 12
x0 = 0,
Estudia el crecimiento de las siguientes funciones: 1 f (x ) = x x i (x ) = 2 x - 6 x - 16
m (x ) = x .ln x 5.-
c.
x1 = 2,
x3 = 4
g ( x ) = ex + e- x
h(x ) = x (x - 2) (x + 2)
x j (x ) = - 3 x 3
k(x ) = ln(1+ x 2 )
n (x ) = x + sen x
p(x ) = ln[(x - 1)(x - 2)]
Determina los máximos y mínimos relativos de las funciones: y = x 3 - 6 x + 12 y=
2x - 7 x2 + 8
y = x .(x - 1)2.(x - 2)3
y= y=
x2 + 1 x2 - 1 x 2 + 14 x + 9 x 2 + 2x + 3
y = x - ln(1+ x)
y = cos x - sen x y = arctgx x y = [sen(ln x) - cos(ln x)] 2
6 .-
Halla a, b, c, d sabiendo que los extremos locales de la función y = a x 3 + b x 2 + c x + d son los puntos (0, 4) y (2, 0).
7 .8 .-
La ecuación de la tangente a la curva y = a x 3 + b x 2 + c x + d en el punto de inflexión (1, 0) es y = -3 x + 3 y la función tiene un extremo local en x = 0. Calcula f (5) . 1 La trayectoria de un proyectil lanzado verticalmente hacia arriba tiene por ecuación e = v t - g t 2 , donde v es la velocidad inicial, 2 en m/sg y t el tiempo en sg. Calcula el tiempo que el proyectil tardará en alcanzar su altura máxima y cuánto tardará en caer desde el momento del disparo si la velocidad inicial es de 360 m/sg.
9 .-
Calcula la longitud de los lados del triángulo isósceles de 24 cm de perímetro y área máxima.
1 0. - Halla las dimensiones del rectángulo de 400 m2 de área y perímetro mínimo. 1 1. - Halla el radio de la base y la altura del cono de generatriz 4 m y volumen máximo. 1 2. - Halla las dimensiones del cilindro de área lateral máxima inscrito en una esfera de radio 18 m. 1 3. - Halla la altura del cono de volumen máximo entre todos los inscritos en una esfera de 20 m de radio. 1 4. - Calcula el radio y la amplitud, en radianes, del sector circular de mayor área entre todos los de 4 cm de perímetro.
– 52 –
Funciones derivables 1 5 . - El precio de un diamante es proporcional al cuadrado de su peso. Determina cuál es la forma de partir un diamante que produce una mayor depreciación de su valor. 1 6 . - Calcula las dimensiones del rectángulo de área máxima de entre todos los de centro el origen de coordenadas, lados paralelos a los ejes y vértices situados en la elipse:
x2 y2 + =1 4 2 1 7. - Determina en qué punto de la función y =
1 1+ x 2
la tangente a la misma forma el mayor ángulo posible con la horizontal.
1 8. - ¿Qué longitud ha de tener una cuerda de una circunferencia para que sea máximo su producto por la distancia de la cuerda al centro de la circunferencia? 1 9. - Las dimensiones de un campo de fútbol son 62 por 104 m, y las porterías miden 6 m. Determina desde qué punto de la banda lateral es más probable marcar gol en un tiro directo. 2 0. - Si una función derivable y positiva f (x ) tiene un mínimo local en un punto x = a y la segunda derivada f ¢¢(a) no es nula, ¿qué se 2
puede decir del signo de las dos primeras derivadas de [f (x )] en ese punto? 2 1. - Determina los valores máximo y mínimo absolutos de las funciones que se indican, en los intervalos correspondientes:
f (x ) = x 2 - 2x en [-2 , 5]
g (x ) = x 3 - x 2 - 8 x en [-2 , 2]
h (x ) = sen2 x en [p / 2 , 4p /3]
2 2. - Aplica, si es posible, el teorema de Rolle a las funciones que se indican, en los intervalos correspondientes:
f (x ) = x 2 - 5 x + 8 , en [-2, 5]
g (x ) = tg x , en [ 0, p]
2
h (x ) = x + 7 x + 4 , en [-7, 0 ]
j (x ) =|cos x |, en [ 0, 2p]
2 3. - Para cada una de las funciones f e intervalos [a , b] que se indican a continuación, se cumple f (a) = f (b) y, sin embargo, no existe ningún a Œ(a , b) tal que f ¢(a ) = 0. Explica en cada caso por qué no se contradice el teorema de Rolle: 1)
2 4. - La función:
f (x ) =
1
x2
, en [-2, 2].
2)
f (x ) = 1- |x |, en [-1, 1]
ÏÔ ax 2 + bx + 5 si x < 2 f (x ) = Ì cx + 1 si x 2 ÓÔ
cumple las hipótesis del teorema de Rolle en el intervalo [0, 4]. Halla a, b y c y determina en qué punto(s) se verifica lo asegurado por el teorema. 2 5. - Si la derivada de una función f (x ) es positiva en todo punto x ŒRR , ¿pueden existir dos puntos a , b ŒR tales que: f (a) = f (b)? 2 6. - Demuestra que x = 0 es la única raíz real de la ecuación 5 x 9 + 3 x 5 + 7 x = 0 . 2 7. - Siendo f (x ) = x (x + 1) (x + 2) (x + 3) , demuestra que la ecuación f ¢(x ) = 0 tiene tres raíces reales. 2 8 .- La ecuación ex = 1+ x tiene una raíz real en x = 0. Demuestra que es la única. 2 9 .- Determina los valores de a y b tales que la función:
Ï ax + 2 si x < 3 f (x ) = Ì 2 Ó x + 4 x + b si x 3
cumpla las hipótesis del teorema del valor medio en el intervalo [0, 8]. ¿En qué punto(s) se verifica la tesis?
– 53 –
Funciones derivables 3 0 . - Determina un punto en el que se verifique el teorema del valor medio en el intervalo [2, 8] para la función: f (x ) = log2 x . 3 1 . - Determina un punto en el que se verifique el teorema del valor medio en el intervalo [
p p , ] para la función: f (x ) = sen x . 4 2
3 2 . - Aplica, si es posible, el teorema del valor medio a las funciones que se indican, en los intervalos correspondientes:
f (x ) = x 2 - 3 x + 4 en [-2 , 3] 3 3 . - Calcula un valor aproximado, hasta la segunda cifra decimal, de
g (x ) = x - x 3 en [-2 , 1]. 172 , haciendo uso del teorema del valor medio.
3 4. - Aplica, si es posible, el teorema de Cauchy a las funciones que se indican, en los intervalos correspondientes:
f (x ) = x 2 + 2 , g (x ) = x 3 - 1 en [1 , 2] f (x ) = sen x , g (x ) = cos x en [0 , p / 2] 3 5 .- Calcula los siguientes límites:
x sen x x Æ 0 1- cos x
xÆ0
1 lím x ln(1+ ) x xÆ•
Ê 1 ˆ tg x lím Á ˜ xÆ0 Ë x ¯
p tg(x + ) - 1 4 lím sen x xÆ0
È e 1 lím Í x x Æ 1 Î e - e x - 1
lím x ln x
lím
x
lím x ( a - 1)
lím
x 2 + 5x + 6
xƕ
x Æ -2
1 sen x lím ln x xÆ0 x
sen x - x lím x Æ 0 x - tg x
Ê4 2 ˆ lím Á 2 ˜ 1- cos x ¯ xÆ0 Ë x
lím
5
lím
2 (cos 4 x ) x
xÆ0
etg x - ex x Æ 0 tg x - x
3- 5 + x
x Æ 4 1-
3 6 . - Representa gráficamente la función: p (x ) = x 4 +
Ê 1 ˆ sen x lím Á ˜ x Æ 0 Ë 1- cos x ¯
x3 + 8
lím
5- x
4 3 x + 2x 2 - 2. ¿Cuántas raíces reales tiene el polinomio p (x )? 3
3 7 . - Representa gráficamente las siguientes funciones:
y = x 4 - 2x 2 - 8 y=
x2 8 + 2 x
y = ln( x 2 - 4 )
y = x ln x y= y=
x x 3 -1 x3 ( x - 1)
y = sen2 x
x2 2-x ( x + 1)2 y= 2 ( x - 1) y=
2
y= y=
y=
x 3 - 3x 2 + 4 x2 4x - 5
y = x 3 - 3x 2 + 2 y = e- x y= y= y=
2
2( x - 1)
x2+1
y=
2
x -1
– 54 –
2
ln x x
x2 ) 9
y = sen x + cos x y = ex x
3
x 3 - 3x |x + 3| 1 + |x |
x2+1 2
y = x 2 (1 -
x + x -2
y=
x3 x 2 -1
y = x 4 - 4x 3
y = x 2 + 2 x - 15
Tema 4 La integral
La integral
1. INTRODUCCIÓN Abordamos ya el único tema que dedicaremos en nuestro curso al cálculo integral. En él confirmaremos lo dicho con anterioridad, cuando afirmábamos que integrar, proceso inverso al de derivar, nos permitirá conocer el área limitada por una curva. O también, utilizando términos de la Física, que si el cálculo diferencial es un método para hallar la velocidad cuando se conoce el espacio recorrido, el cálculo integral es un método para hallar el espacio cuando se conoce la velocidad. Espacio que coincidirá con el área bajo la curva que expresa la dependencia de velocidad respecto del tiempo, al igual que la pendiente de la tangente a la curva que expresaba el espacio en función del tiempo, coincidía con la velocidad... Todas estas son ideas que nacieron de trabajos realizados de forma independiente en el siglo XVII por Newton y Leibniz, quienes, utilizando los métodos de la geometría analítica de Descartes, el concepto de límite y los conocimientos geométricos legados por los griegos, lograron aglutinar materias dispersas hasta entonces, inventando lo que más tarde dio en llamarse cálculo diferencial e integral. Posiblemente ni ellos mismos fueron conscientes del horizonte de posibilidades que se abriría con sus trabajos. La deuda de la Humanidad con ellos es imperecedera...
2. INTEGRACIÓN Definiciones (primitiva e integral indefinida) ■ Una primitiva de una función f (x ) es toda función F (x ) tal que:
F ¢(x ) = f (x )
■ La integral indefinida de f (x ) es el conjunto de todas las primitivas de f (x ) y se representa por Ú f (x )dx . Si F (x ) es una de esas primitivas, cualquier otra habría de tener la misma derivada y, en consecuencia, sería de la forma F (x ) + k , k ŒR . Por ello, se escribe:
Ú f (x ) dx = F (x ) + k En resumen:
Ú f (x ) dx = F (x ) + k
¤ F ¢(x ) = f (x )
Ejemplos Sin más que aplicar las definiciones anteriores podríamos escribir:
Ú x dx =
1
x2 +k 2
2
Ú cos x dx = sen x + k
3
Ú 1.dx = Ú dx = x + k
Integrales inmediatas Habida cuenta de que la obtención de la integral indefinida de una función, la integración, no es sino el proceso inverso al de derivación, basta con recordar las propiedades ya estudiadas de la derivación para poder escribir: 1
Ú [f (x ) + g (x )]dx = Ú f (x ) dx + Ú g(x ) dx x
2
Ú k f (x ) dx = k Ú f (x ) dx ; (k ŒR) Ú x = ln x + C Ú cos x dx = sen x + C
n +1
3
n Ú x dx = n + 1 + C ; si n -1
4
5
Ú sen x dx = - cos x + C
6
7
x x Ú e dx = e + C
8
9
Ú
11
Ú
1 2
cos x dx
dx = tag x + C
1- x 2
= arcsen x + C
dx
ax
x Ú a dx = ln a + C
10
Ú
12
Ú
1 sen2 x dx 1+ x 2
dx = - cotag x + C = arc tg x + C
En adelante, cada vez que hayamos de calcular una integral que no figure entre las anteriores, intentaremos dar los pasos que nos permitan expresarla en función de las que sí aparecen en la lista.
– 56 –
La integral
Ejemplos En los casos más sencillos, basta con aplicar directamente los resultados anteriores. Y así, por ejemplo, resulta muy fácil escribir:
Ú
[5 x 3 + 3 x 2 +
5 5 1 5x 4 ] dx = Ú 5 x 3 dx + Ú 3 x 2 dx + Ú dx =5 Ú x 3 dx +3 Ú x 2 dx +5 Ú dx = + x 3 + 5 ln x + C 4 x x x 1
4
4
Ú [sen x + 1+ x 2 - 3] dx = Ú sen x dx + Ú 1+ x 2 dx - Ú 3 dx = Ú sen x dx +4Ú 1+ x 2 dx -3Ú dx = -cos x + 4 arctg x - 3x + C Normalmente, sin embargo se requerirán ciertas transformaciones antes de poder dar la integración por finalizada. A continuación estudiaremos los procedimientos más comunes a tal fin, empezando por el llamado método de integración por cambio de variable.
Integración por cambio de variable En ocasiones, el cálculo de la integral Ú f (x )dx resulta complicado, pero la introducción de una nueva variable, t, función a su vez de x, permite simplificar los cálculos. A título de ejemplo, supongamos que se deseara calcular la integral:
Ú 5x
1+ x 2 dx
Efectuando el cambio de variable:
t = 1+ x 2 se tendrá: dt = 2x dx y, en consecuencia:
Ú 5x
1+ x 2 dx = Ú 5 x t
dt 5 = 2x 2
Ú
t dt =
5 3 5 t +C= (1+ x 2 )3 + C 3 3
Ejemplos Utilizando el método anterior puede comprobarse fácilmente que: 2 Ú sen x cos x dx =
sen3 x + C; 3
Ú
x 2 - 2x 4 dx = -
1 (1- 2x 2)3 + C 6
Integración por partes Se basa este procedimiento en la fórmula de la derivada de un producto: [u(x ) v (x )]¢ = u ¢(x ) v (x ) + u(x ) v ¢(x ) Se tendrá:
Ú [u(x ) v (x )]¢ dx = Ú u¢(x ) v (x ) dx + Ú u(x ) v ¢(x ) dx y como:
Ú [u(x ) v (x )]¢ dx = u (x )v (x ),
u ¢(x ) dx = du , v ¢(x ) dx = dv
será:
u v = Ú v du + Ú u dv es decir: Fórmula de la integración por partes
➤➤➤➤
Ú u dv = u v - Ú v du
Algunos, para recordar la fórmula anterior, dicen: "un día vi un viejo vestido de uniforme"
– 57 –
La integral
Ejemplo Para calcular:
Ú x e
x
dx
procederemos así:
u=x
Æ du = dx
x
e dx = dv Æ v = ex de donde:
Ú x e
x
dx = x ex - Ú ex dx = x ex - ex + C
Más ejemplos Comprueba, tras aplicar la fórmula de la integración por partes, que:
Ú x sen x dx = - x cos x + sen x + C
Úx
1 + x dx =
2 4 x (1 + x )3 (1 + x )5 + C 3 15
Integración de funciones racionales Explicaremos ahora, sirviéndonos de algunos ejemplos, cómo se calculan las integrales del tipo:
P (x )
Ú Q (x )
dx
donde P (x ) y Q(x ) son dos funciones polinómicas tales que grado de P (x ) < grado de Q(x ). De los cuatro casos posibles, nosotros consideraremos tres: a) b) c)
El polinomio Q(x ) sólo tiene raíces reales simples. El polinomio Q(x ) sólo tiene raíces reales, simples y múltiples. El polinomio Q(x ) sólo tiene raíces reales simples y múltiples y complejas simples.
Ejemplo del primer caso
Ú
Para calcular:
x +1 3
x + x 2 - 6x
dx
procederemos de la siguiente forma: •
Efectuaremos la descomposición factorial del denominador, obteniendo:
x 3 + x 2 - 6 x = x (x - 2) (x + 3) •
Descompondremos la fracción inicial en fracciones simples:
x +1 3
2
x + x - 6x
=
A B C + + x x - 2 x +3
En consecuencia:
x + 1= A (x - 2) (x + 3) + B x (x + 3) + C x (x - 2) igualdad de la que se obtiene, tras dar a x los valores x = 0, x = 2, x = –3: •
Ú
A=-
1 3 ; B= 6 10
; C=-
2 15
Concluiremos escribiendo:
x +1 3
2
x + x - 6x
dx = -
1 6
Ú
dx 3 + x 10
Ú
dx 2 x -2 15
Ú
dx 2 1 3 = - ln x + ln(x - 2) ln(x + 3) + C 15 x +3 6 10
– 58 –
La integral Ejemplo del segundo caso
Ú
Para calcular: •
3x + 5 3
x - x2 - x +1
dx
Efectuaremos la descomposición factorial del denominador:
x 3 - x 2 - x + 1= (x + 1) (x - 1)2 •
Descompondremos la fracción inicial en fracciones simples: 3x + 5 3
2
x - x - x +1
=
A
+
x +1
B
+
x -1
C (x - 1)2
En consecuencia: 3 x + 5 = A (x - 1)2 + B (x + 1).(x - 1) + C (x + 1) igualdad de la que se obtiene, sea tras identificar coeficientes, sea tras dar a x los valores x = 1, x = –1, x = 0: A= •
Ú
1 1 ; B=; C=4 2 2
Concluiremos escribiendo: 3x + 5 3
2
x - x - x +1
dx =
dx dx 4 1 1 1 dx 1 + 4Ú = +C ln(x + 1) - ln(x - 1) 2 2 2 Ú x +1 2 Ú x -1 2 x -1 (x - 1)
Ejemplo del tercer caso 3 x 2 - 3 x + 11
Ú (x + 1)(x 2 - 6x + 10) dx
Para calcular:
•
Partiremos de la descomposición factorial, ya dada, del denominador y escribiremos: 3 x 2 - 3 x + 11 2
(x + 1)(x - 6 x + 10 )
Bx + C A + 2 x + 1 x - 6 x + 10
=
En consecuencia: 3 x 2 - 3 x + 11= A (x 2 - 6 x + 10 ) + (Bx + C )(x + 1) igualdad de la que se obtiene, sea tras identificar coeficientes, sea tras dar a x valores cualesquiera, como x = –1, x = 0, x =1: A = 1; B = 2; C = 1 •
Escribiremos: 3 x 2 - 3 x + 11
Ú (x + 1)(x 2 - 6x + 10) dx = Ú y sin más que hacer el cambio: •
1 dx + x +1
Ú
2x + 1 2
x - 6 x + 10
dx =
Ú
1 dx + x +1
2x + 1
Ú (x - 3)2 + 1dx
t=x–3
Concluiremos: 3 x 2 - 3 x + 11
2
Ú (x + 1)(x 2 - 6x + 10) dx = ln(x + 1) + ln[(x - 3) – 59 –
+ 1] + 7 arc tg(x - 3) + C
La integral Advertencia Si quisiéramos calcular una integral como:
x 3 - 4x 2 + x + 9
Ú
dx x 2 - 5x + 6 en la que el grado del polinomio del numerador es mayor o igual que el del denominador, antes de efectuar la descomposición en fracciones simples habría que proceder así:
x 3 - 4x 2 + x + 9 2
x - 5x + 6 aplicando a continuación lo visto líneas atrás.
= (efectuando la división) = (x + 1) +
3 2
x - 5x + 6
Integración de funciones trigonométricas Algunas integrales de funciones trigonométricas resultan fáciles de calcular utilizando determinadas transformaciones. Veamos dos o tres de ellas a continuación:
1
n
Ú sen x dx
Para calcular integrales del tipo:
sen x =
es útil aplicar las fórmulas del ángulo mitad:
;
n
Ú cos x dx
1- cos 2x 2
, siendo n un número natural p a r
; cos x =
1+ cos 2x 2
lo cual reducirá el grado de la función que ha de integrarse. Así, por ejemplo, aplicando lo anterior al cálculo de 4
Ú sen
x dx = Ú (
4
2
x dx =
x dx , se tendrá:
1- cos 2x 2 1 1 1 ) dx = Ú dx - Ú cos 2x dx + Ú cos2 2x dx 4 2 4 2 cos 2x =
y, considerando ahora que:
Ú sen
4
Ú sen
x 1 sen 2x 1 + 4 2 2 4
Ú
1+ cos 4 x 2
, quedará:
1+ cos 4 x sen 4 x ˆ x sen 2x 1Ê 3 x sen 2x sen 4 x + +C dx = + Áx + ˜ +C= 2 4 4 8Ë 4 ¯ 4 4 32 n
Ú sen x dx
Las integrales del tipo:
;
n
Ú cos x dx
senn x = sen x senn - 1x
pueden calcularse escribiendo:
ó
, siendo n un número natural i m p a r cosn x = cos x cosn - 1x
y procediendo como en el siguiente ejemplo: 5 4 2 2 2 4 Ú cos x dx = Ú cos x cos x dx = Ú cos x (1- sen x ) dx = Ú (cos x - 2sen x cos x + sen x cos x ) dx = sen x -
3
sen5 x 2 3 sen x + +C 3 5
En general, para integrar una función racional de sen x , cos x : R (sen x , cos x ) suele dar resultado aplicar los cambios de variable que se indican a continuación: x a ) Si R (sen x , cos x ) = R (-sen x , -cos x ), t = tag x b ) En otros casos, t = tag 2 Aplicando los cambios anteriores pueden obtenerse, por ejemplo: a)
dx
Ú 1+ sen2x =
1 2
arctg( 2tgx ) + C
b)
– 60 –
dx
x
Ú 1+ sen x + cos x = ln(1+ tg 2 ) + C
La integral
3. EL CONCEPTO DE INTEGRAL DEFINIDA Planteamiento del problema Admitamos como punto de partida y, por tanto, utilizable sin definirlo previamente, el concepto de área de un cuadrado. No resulta entonces difícil, sin más que hacer consideraciones geométricas intuitivas, calcular áreas de triángulos, cuadriláteros o polígonos en general... Pero consideremos la figura siguiente:
f (x)
La curva y = f (x ), que supondremos continua y positiva en el intervalo [a, b] para simplificar el razonamiento, las rectas x = a , x = b y el eje OX forman un recinto.
Esta área es la que queremos calcular
¿Qué se entenderá por área de dicho recinto? ¿Cómo se calculará? a
b
Cuestiones previas 1 Sea f (x ) una función continua y positiva en un intervalo cerrado [a, b] y consideremos una partición del intervalo [a, b] ; o sea, cualquier conjunto de puntos: P = { x 0 , x1 , x2 , L, xn / a = x 0 < x1 < x2 < L < xn = b } Llamemos: 1 ) m i al valor mínimo de f (x ) en el subintervalo [ x i-1 , x i]. (Que existe, pues f (x ) es continua en dicho subintervalo cerrado.) 2 ) M i al valor máximo de f (x ) en el subintervalo [ x i-1 , x i]. (También existe, por la misma razón.) 3 ) Dx i a la longitud del subintervalo [ x i-1 , x i], o sea, a la diferencia x i - x i-1. ( Dx 1 es la longitud del primer trozo en el que se ha dividido [a, b], Dx 2 la del segundo, etc.) 4 ) A(PP ), o anchura de la partición P , a la mayor de las longitudes Dx i Entonces, las sumas: n
s = m1 D x 1 + m2 D x 2 + m3 D x 3 + º + mn D x n =
 mi D x i i=1 n
S = M 1 D x 1 + M2 D x 2 + M 3 D x 3 + º + M n D x n
=
 Mi D x i i=1
son, respectivamente, las sumas de las áreas de todos los rectángulos que aparecen en las figuras 1 y 2 siguientes:
f (x)
f (x) M1
m1 x1
a=x0 x1
x1
x2
x n-1
x n=b
a=x0 x1
Figura 1
x2
x n-1
Figura 2
A s y S las llamaremos suma inferior y suma superior de f (x ) en [a, b] correspondientes a la partición P .
– 61 –
x n=b
La integral ➞
Observemos que, aunque no sepamos cuál es el área del recinto limitado por f (x ), el eje OX y las rectas x = a, x = b, es razob
b
nable que si la representamos por Ú f ( x )d x , haya de ser:
s £ Ú f ( x )d x £ S
a
a
2 Si ahora tomáramos otra partición P¢ más fina que la anterior, añadiendo nuevos puntos a P , tendríamos otras dos sumas inferior y superior, s ¢ y S¢ : Nueva suma inferior
Nueva suma superior
f (x)
f (x)
Puntos que añadidos a los anteriores hacen más fina la partición
Puntos que añadidos a los anteriores hacen más fina la partición
s £ s¢ £ S ¢ £ S .
Sumas que, como resulta fácil comprobar cumplen: ➞
b
s £ s¢ £ Ú f (x ) dx £ S ¢ £ S .
Por consiguiente, habrá de ser:
a
3 Si de forma semejante, siguiéramos tomando particiones P¢¢ , P¢¢¢K cada vez más finas, las correspondientes sumas inferiores y superiores cumplirían: s £ s¢ £ s¢¢ £ s¢¢¢ £ L £ S ¢¢¢ £ S ¢¢ £ S ¢ £ S ➞
Por tanto, habría de ser:
b
s £ s¢ £ s¢¢ £ s¢¢¢ £ L Ú f (x )dx L £ S ¢¢¢ £ S ¢¢ £ S ¢ £ S a
Definición (de integral definida) Llegados a este punto, admitiremos sin demostración algo que quizá ya estés sospechando: ➤ Si, dada una función f (x ), continua y positiva en el intervalo cerrado [a, b], se toma una sucesión de particiones P , P ¢ , P ¢¢ , P ¢¢¢K de [a, b] tal que: 1 . Cada partición contiene todos los puntos de la anterior. 2 . La sucesión de las anchuras de las particiones: A (P) , A (P ¢) , A (P ¢¢) , A (P ¢¢¢) K tiene por límite cero. Entonces, las sucesiones: 1 ) De las sumas inferiores s , s¢ , s¢¢ , s¢¢¢ K 2 ) De las sumas superiores: S , S ¢ , S ¢¢ , S ¢¢¢ K tienen igual límite. A tal límite le llamaremos integral definida de f (x ) sobre [a, b] y lo representaremos por
b
Úa f (x )dx
Naturalmente, y con independencia de que, por el momento no sepamos calcularlo, el área del recinto limitado por y = f (x ), las rectas x = a , x = b y el eje OX coincidirá con el valor de esa integral.
Otra forma de considerar la integral A efectos prácticos, resulta interesante contemplar la integral desde otro punto de vista, algo distinto al anterior. Consideremos, pues, la partición P = {x 0 , x 1 , x 2 , L , x n } del intervalo [a, b] y las correspondientes suma inferior, s , y superior, S .
– 62 –
La integral Si en cada subintervalo [ x i-1 , x i] tomáramos un punto arbitrario x i se tendría:
f (x) m 1 D x 1 £ f (x 1)D x 1 £ M 1 D x1 m 2 D x 2 £ f (x 2 )D x 2 £ M 2 D x 2 L £ L £ L
M1
f (x 1 )
m1
m n D x n £ f (x n )D x n £ M n D x n
x0 x1 x1 x2
x2
x n - 1x n
xn
y por tanto, sumando "miembro a miembro" las desigualdades anteriores: n
s £ Â f (x i ) D x i £ S i=1
En consecuencia, si en los supuestos de la definición precedente las sucesiones: s , s¢ , s¢¢ , s¢¢¢ K S , S ¢ , S ¢¢ , S ¢¢¢ K b
de las sumas inferiores y superiores tienen el mismo límite, Ú f (x )dx , también tendrá ese límite la sucesión cuyos términos sean de la a
forma: n
 f (x i) D x i i=1
(n representa en cada caso el número de trozos en los que las particiones P , P ¢ , P ¢¢ , P ¢¢¢K dividen el intervalo [a, b])
pues cada uno de esos términos está comprendido entre las correspondientes suma inferior y superior, cuyas sucesiones tienen por límite común la integral. Podrá escribirse, pues: b
Úa
n
 f (x i) D x i Dx Æ 0
f (x ) dx = lím i
o, incluso:
i=1
b
Úa f (x ) dx = DxlímÆ 0 Â
f (x ) D x
a £ x £b
(Observemos que la condición D x i Æ 0 implica que n Æ •, por decirlo en un lenguaje asequible, aunque algo impreciso.)
Observaciones 1 . - La última igualdad permite considerar la integral como suma de infinitos elementos diferenciales de área, "rectángulos de altura f (x ) y base D x infinitamente pequeña", según los términos que acuñó Leibniz, cuyo significado se sugiere en la siguiente figura.
f (x)
f (x)
a
x
b
2. - Identificada la integral con un área, resulta que la función f (x ) no tiene que ser necesariamente continua en [a, b] para que exista su integral. Pensemos, por ejemplo, en la integral en el intervalo [2, 5] de la función parte entera f (x ) = [x ]... Quede constancia, pues, que de lo hecho hasta ahora se deduce que si una función es continua entonces es integrable, pero no que sólo sean integrables las funciones continuas.
– 63 –
La integral
4. PROPIEDADES DE LA INTEGRAL DEFINIDA Propiedades inmediatas Puede demostrarse que si f (x ) , g (x ) son funciones para las que existe la integral definida en [a, b], entonces se verifican: a
1
Úa f (x ) dx = 0
2
Úa k f (x ) dx = k Úa f (x ) dx
3
Úa [f (x ) + g (x )]dx = Úa f (x ) dx + Úa g (x ) dx
4
Úa f (x ) dx + Úc f (x ) dx = Úa f (x ) dx ; c Œ[a,b]
b
b
b
; k ŒR
b
c
b
b
b
Las demostraciones no son muy complicadas. Así, por ejemplo, la de la tercera igualdad sería la siguiente: b
Úa
n
[ f ( x ) + g ( x ) ]dx = lím
n
 [ f (xi ) + g (xi ) ] Dx i =
Dx i Æ 0 i = 1
lím
n
 f (xi ) Dx i +
Dx i Æ 0 i = 1
lím
b
b
 g (xi ) Dx i = Úa f ( x ) dx + Úa g ( x ) dx
Dx i Æ 0 i = 1
Ni que decir tiene que los x i , Dx i , etc., tienen el significado que hemos visto líneas atrás.
Teorema (del valor medio del cálculo integral) Vamos a demostrar a continuación un teorema que, más adelante, nos permitirá establecer un resultado fundamental: Si f (x ) es una función continua en [a, b], entonces existe x Œ[a, b] tal que: b
Úa f (x ) dx = f (x) (b - a) En efecto. Sean m y M los valores mínimo y máximo absolutos de f (x ) en [a, b], existentes al ser f (x ) continua en dicho intervalo. Entonces, cualesquiera que sean la partición P = {x 0 , x 1 , x 2 , L , x n } de [a, b] y los puntos x i en cada intervalo [ x i-1 , x i], como m £ f (x i ) £ M , se tendrá: n
n
n
n
n
i=1
i=1
i=1
i=1
i=1
m  Dx i =  m Dx i £  f (xi ) Dx i £  M Dx i = M  Dx i n
 Dx i = (x 1 - xo ) + (x 2 - x 1) + (x 3 - x 2) + º+ (x n - x n -1) = b - a
y ya que
i=1 n
m (b - a) £ lím
será:
 f (x i) Dx i
£ M (b - a)
Dx i Æ 0 i = 1 b
m£
o sea:
Úa f (x ) dx b- a
£M
b
Úa f (x )dx
es un número comprendido entre el valor mínimo, m, y el máximo, M, de f (x ) en [a, b]. Recordando b- a finalmente que toda función continua en un intervalo cerrado toma en él cualquier valor comprendido entre el mínimo y el máximo Por lo tanto,
b
concluiremos que existe al menos un punto x en [a, b] tal que:
Úa f (x ) dx b- a
– 64 –
= f (x) es decir, tal que:
b
Úa f (x ) dx = f (x) (b - a).
La integral
Una fácil interpretación geométrica La figura de la derecha sugiere una interpretación geométrica del teorema del valor medio: Existe al menos un rectángulo de base b–a y altura f (x) , con x Œ[a, b], cuya área es igual a la del recinto limitado por la curva y = f (x ), el eje OX y las rectas x = a, x = b.
f (x)
a
x
b
5. CÁLCULO DE LA INTEGRAL DEFINIDA Observación Definida la integral definida y estudiadas algunas de sus propiedades, seguimos sin decir cómo se calcula su valor, por lo que ha llegado el momento de aclararlo. El teorema fundamental del Cálculo Integral, también conocido como regla de Barrow, que veremos a continuación, además de permitirnos calcular la integral definida de una función de la que se conozca una primitiva, pondrá de manifiesto la relación entre las integrales indefinida y definida.
Teorema (regla de Barrow) ➤ Si f (x ) es una función continua en [a, b] y F (x ) una primitiva cualquiera de f (x ) en [a, b] (esto es, una función tal que F ¢(x ) = f (x ) "x Œ[a, b]) , entonces: b
Úa f (x ) dx = F (b) - F (a) En efecto: x
1 . Demostremos en primer lugar que la función G (x ) = Ú f (t ) d t es una primitiva de f (x ) en [a, b]. a
A tal fin, sea a Œ[a, b]. Entonces: a +h
G (a + h) - G (a ) G ¢ (a ) = lím = lím h hÆ 0 hÆ 0
Úa
a
f (t ) dt - Ú f (t ) dt a
h
a +h
(1)
= lím
hÆ 0
Úa
f (t ) dt h
(2)
= lím
hÆ 0
f (x) h , x Œ[a,a + h] h
(la igualdad (1), por la propiedad 4ª de la integral definida; la (2), por el teorema del valor medio)
G ¢(a ) = lím f (x) = f (a )
es decir:
hÆ 0
(pues f (x ) es continua en a, y cuando h tiende a cero, x lo hace a a). En realidad lo anterior prueba que G (x ) es primitiva de f (x ) en el intervalo abierto (a, b), pero no que lo sea también en los extremos a y b y, por tanto, en el intervalo cerrado [a, b]. Ello, sin embargo, no sería difícil de demostrar, admitiendo que G ¢ (a) y G ¢ (b) vendrían dadas por: G (a + h) - G (a) G (b + h) - G (b) G ¢(a) = lím ; G ¢(b) = lím h h hÆ 0 + hÆ 0 -
2 . Pero recordenos que se trataba de calcular
b
Úa f (x )dx , es decir, G (b).
Supongamos que F (x ) fuese otra primitiva cualquiera de f (x ). Las funciones G (x ) y F (x ) tendrían igual derivada, luego existiría k ŒRR tal que: G (x ) = F (x ) + k Sólo nos faltaría calcular k.
– 65 –
La integral ¸ Ô k = - F (a) a G(a) = Ú f (x ) dx = 0 Ô a
G(a) = F(a) + k
Pero como que suele escribirse así:
se tendría, finalmente:
b
Úa f (x ) dx = F(b) - F(a) ,
diferencia
[F (x )] a b
Ejemplo Después de lo anterior resultará inmediato que:
1
Ú-1(2x
2
- x 3) dx = [
x4 1 2x 3 2 1 2 1 4 ] = ( - ) - (- - ) = 3 4 -1 3 4 3 4 3
6. CÁLCULO DE ÁREAS PLANAS Primer caso Si el recinto cuya área queremos calcular está definido por una curva y = f (x ), continua y positiva en el intervalo [a, b], las rectas x = a, x = b y el eje OX, para hallar dicha área bastará con calcular, como ya sabes:
y = f (x)
b
Úa f (x )dx sin que haya más complicación.
b
a
Ejemplo Comprueba que el área limitada por la sinusoide, el eje OX y la recta x = p / 2 es 1.
Segundo caso Si se tratara de calcular un área como la de la derecha, habría que considerar que cuando una función continua toma valores negativos en un intervalo, como le sucede a la f (x ) del dibujo en el intervalo [c, d] , también existe:
f (x)
S1
S2
S3
d
Úc f (x )dx = DxlímÆ0 Â f (x ) D x
c
a
d b
c£ x £d
aunque en ese caso la integral será negativa. Por ello, para resolver el problema: 1.- Determinaremos los puntos, c y d, de corte de y = f (x ) con el eje OX. c
S1 = Ú f (x ) dx , S2 =
2. - Calcularemos por separado:
a
d
Úc f (x ) dx
b
, S3 = Ú f (x ) dx d
3. - Determinaremos el área pedida, S, como suma de las otras tres: S = S1 + S2 + S3
Ejemplo El área limitada por la curva y = x 2 + x , el eje OX y las rectas x = –2, x = 3 es 87/6.
Tercer caso y = f (x)
Para calcular el área de un recinto como el de la derecha podríamos utilizar la terminología, imprecisa pero intuitiva, de los elementos diferenciales. Tal área sería la suma de las de infinitos rectángulos de base D x y altura f (x ) - g (x ) como el dibujado. O sea:
f(x)–g(x)
b
Área = Ú [ f (x ) - g (x )]dx
y = g (x)
x
a
a
b
Tal integral proporcionaría el área incluso cuando la función g (x ) tomara valores negativos en el intervalo [a, b], pues también en ese caso la altura del elemento diferencial de área vendría dada por la diferencia f (x ) - g (x ) .
– 66 –
La integral
Ejemplo Dibuja sobre un sistema coordenado las parábolas de ecuaciones: y = - x 2 + 4 x , y = x 2 - 2x y tras verificar que se cortan en los puntos de abscisas x = 0, x = 3, comprueba que el área del recinto que limitan es de 9 unidades cuadradas.
7. CÁLCULO DE VOLÚMENES DE REVOLUCIÓN Primer caso Supongamos que el recinto limitado por la función y = f (x ), continua y positiva en [a, b], las rectas x = a, x = b y el eje de abscisas, girara sobre OX, dando lugar a un sólido: y = f (x)
f ( x)
a
Dx
b El volumen de este elemento diferencial es
.[f ( x)]2.x
x
Para calcular su volumen, procederemos de forma análoga a como hicimos para calcular áreas, considerando tal volumen como suma de los volúmenes de los infinitos elementos diferenciales de volumen del tipo del representado en el dibujo. Es decir:
Â
V = lím
p [ f (x )] 2 Dx
Dx Æ 0 a £ x £b
y, por consiguiente: b
V = p Ú [ f (x )] 2 dx a
Ejemplo Para calcular el volumen que se engendra cuando el recinto limitado por la parábola y = x y la recta x = 3 gira alrededor del eje de abscisas, bastará con escribir:
V =p Ú
3
0
2
2
[ x ] dx = p [ x2 ]
3 0
=
9p 2
Segundo caso Después de lo hecho, resultará fácil entender cómo se calculará el volumen de un sólido como el de la figura siguiente, engendrado cuando el recinto limitado por dos curvas f (x ) y g (x ) continuas y positivas en un intervalo [a, b], gira alrededor del eje de abscisas:
f
f(x)
g
g(x)
a
x
b
El volumen de este elemento diferencial es
.[f(x) 2 -g(x) 2 ].x
x
Dicho volumen vendrá dado por:
b
V = p Ú [ f (x )2 - g (x )2] dx a
Ejemplo El volumen engendrado al girar 360° alrededor de OX el recinto limitado por y = - x 2 - 3 x + 6 e y = 3 - x es 1792p / 15 .
– 67 –
La integral
8. EJERCICIOS 1.-
Determina una función f (x ), sabiendo que f ¢¢¢(x ) = 2x y, además: f (0) = 0 ; f (1) = -
2 .-
Calcula una primitiva de la función f (x ) =
3 .-
Calcula las siguientes integrales: 1
Ú
5
Ú
9 13
2
2 dx
2
6
sen 5 x
1 que se anule para x = 0. 1+ 3x
dx
Ú
4-x2 1+ 2x dx Ú 1+ x 2
7 Ú
10
3 Ú tg x dx
11 Ú
2 x Ú x e dx
14
2 2x Ú x e dx
15 Ú
1 1 + 16 x
dx 2
18
Ú
dx
22
Ú
ex 1+ e
3
4 .-
3 Ú
Ú sen 3x cos5 x dx
Ú
17
5 dx x +4
x +2
21
Ú
25
Ú 5 x dx
26
29
Ú arc tg x dx
30
2
x -1
33
Ú x 1 + x dx
37
Ú
41
2 Ú0 sen x dx
45
Ú2
dx ( x + 1)3( x + 2 ) p
5x
3 2
x + 3x + 2
dx
2x
dx
x2+1 3
2
x + x - 2x 5 dx Ú 2 x +4
dx
Ú x cos 3x dx x -2
Ú
38
Ú
42
3 Ú0 cos x dx
46
2 Ú0 4 - x dx
x2+x 2x + 5
dx
( x + 3)3
1+ x
2
dx
x
dx
p
Ú
8
4 Ú sen x cos x dx
1- 4x 2
x2
dx
dx 3 x + x sen( a + x ) dx 19 Ú sen x
16
Ú
20
2 Ú x cos x dx
23 Ú tg3x sec2 x dx
24
Ú
27 Ú ln x dx
28
Ú tg x dx
32
2 Ú 9 - x dx
36
x Ú e sen x dx
40
Ú
44
Ú0 arcsen x dx
48
Ú-1
1- x 2
x
6
dx 2
x -9
( x + 2 ) dx ( x - 1)2( x 2 - 4 x + 13) 1
43 Ú0 x 2 ex dx
1
dx
4
Ú
39 Ú
2
47 Ú-2 |x |dx
1- x 2 dx ex + 4
dx 1+ x + 2
x3+5 x2-4
dx
1
dx
0
1 + ex
Calcula las derivadas de las siguientes funciones: 2
x
5
0
1+ t
G( x ) = Ú
0
6.-
4+ x2 2+ x
35 Ú x 2sen x dx
dx
34
dx
12
31 Ú
F (x ) = Ú sent d t ; 5.-
2 1 ; f (2) = . 3 4
dt
1 y que f (x ) 0, "x Œ [0, 1]. ¿ Se verifica entonces que f (x ) £ 2 "x Œ [0, 1] ? (Si fuese siempre 2 cierto, demuéstralo; si pudiera ser falso, pon un ejemplo numérico en el que así sea). Se sabe que
Si
1
Ú 0 f (x ) dx <
a
a
Ú - a f (x )dx = 0 , ¿se verifica entonces que Ú - a x f (x )dx = 0 ? Si fuese siempre cierto pruébalo; si pudiera ser falso, pon un
ejemplo que lo confirme. 7.-
Sea f (x ) una función para la que se verifica que
0
2
0
Ú-2 f (x ) dx = - Ú 0 f (x ) dx . ¿Se verifica entonces que Ú-2 f (x )
Si la respuesta es afirmativa, justifícala; si es negativa, da un contraejemplo.
– 68 –
2
dx = Ú f (x ) dx ? 0
La integral 8.-
Sea f(x) una función tal que, cualquiera que sea a > 0, se cumple que
0
a
Ú-a f (x ) dx = - Ú 0 f (x ) dx . Demuestra que, entonces,
f (- x ) = -f (x ) 9.-
Ï 3 x si 0 £ x £ 1 x , se define la nueva función F (x ) = Ú f (t ) dt . Da la expresión de F (x ) definida a Dada la función f (x ) = Ì 0 Ó 1 si 1< x £ 2 trozos y dibujala en el intervalo [0, 2].
1 0 . - Calcula el valor de la integral
2p
Ú -p
x sen x dx
1 1. - Calcula las áreas de los recintos limitados por las siguientes curvas: 1
y = 4 x - x 2 y el eje OX
2 y = x 3 - 6 x 2 + 8 x y el eje OX
3
y = 6 x - x 2 ; y = x 2 - 2x
4 y = x 2 - 4 ; y = 8 - 2x 2
5
x = 4 - y 2 y el eje OY
6 y = 3x - x 2 ; y = x - 3
3 2 3 9 x - x; 3 x - 2y + 3 = 0 4 2 4 1 2. - Determina el valor de a de modo que el área comprendida entre la curva y = a x - x 2 y el eje de abscisas sea 36. 7 y 2 = 4 x ; y - 2x + 4 = 0
8 y=
1 3. - Sea la función f (x ) = x x - 1 . Haz un dibujo aproximado de ella y, después, calcula el área limitada por su gráfica, el eje de abscisas y las rectas x = 0 y x = 1. 1 4. - Sea la función f (x ) = ( x - 1) ex . Dibuja su gráfica y halla el área del recinto encerrado entre ella y la recta y = x - 1. 1 5 . - Se consideran las curvas y = x 2 e y = a , donde a es un número del intervalo (0, 1). Ambas curvas se cortan en un punto (x 0 , y 0) de abscisa positiva. Halla a sabiendo que el área encerrada entre ambas curvas desde x = 0 hasta x = x 0 es igual a la encerrada entre ellas desde x = x 0 hasta x = 1. 1 6. - Calcula el área limitada por la parábola y 2 = 8 x , el eje de ordenadas y la tangente a la parábola paralela a la recta x - y + 28 = 0. 1 7. - Calcula el área limitada por la curva: y = - x 2 - 12x + 6, los ejes de coordenadas y la ordenada correspondiente al máximo de la función. 1 8. - Halla el área comprendida entre la curva y = ex y la cuerda de la misma que tiene por extremos los puntos de abscisas 0 y 1. 1 9. - Halla el área de la elipse de semiejes a y b, de ecuación
x2 y2 + =1 a 2 b2
2 0. - Halla el área del círculo de radio r. 2 1. - Calcula el volumen que se engendra cuando: 1º) El recinto limitado por la parábola y 2 = 8 x y las rectas x = 2, x = 3, gira alrededor del eje de abscisas. 2º) La elipse de semiejes a , b gira 360° alrededor del eje de abscisas. 3º) La elipse de semiejes a , b gira 360° alrededor del eje de ordenadas. 2 2. - Deduce las fórmulas del volumen de cono y de la esfera. 2 3. - El recinto limitado por la parábola y = 34 x 2 - 32 x - 94 y la recta 3 x - 2y + 3 = 0 gira 360° alrededor del eje de abscisas. Calcula el volumen del sólido así engendrado. 2 4. - Calcula el volumen de un tronco de cono cuyos radios miden 8 y 5 cm. y cuya altura es 10 cm. 2 5. - Representa gráficamente la función y = x 2 x + 4 y obtén el volumen del sólido engendrado al girar 360° alrededor del eje OX la región limitada por el semieje de abscisas negativas y la gráfica de la función.
– 69 –
Tema 5 Matrices y determinantes
Matrices y determinantes
1. INTRODUCCIÓN El tema más importante de esta parte del curso es el que trata de los sistemas de ecuaciones lineales, con los que habremos de trabajar de una manera sistemática y rigurosa, ampliando los conocimientos que tenemos sobre ellos de cursos anteriores. Con objeto de poder encarar esta tarea con ciertas garantías de éxito hemos de proveernos de unas herramientas útiles, no sólo para el tratamiento de los sistemas de ecuaciones, sino de muchos otros problemas de carácter no exclusivamente matemático: las matrices y los determinantes. Sucede, sin embargo, que para hablar de las matrices y los determinantes con un mínimo de detalle hemos de conocer, aunque sea de forma somera, algunas ideas básicas sobre espacios vectoriales y, más concretamente, sobre dependencia e independencia lineal. De modo que tendremos que empezar dedicando unas líneas —las menos posible— a estos conceptos.
2. EL ESPACIO VECTORIAL (R n, +, .) Ejemplo ya conocido Consideremos el conjunto R 2 = { x = (x 1 , x 2) / x 1 , x 2 Œ R } , o conjunto de todos los pares ordenados de números reales, y definamos las dos operaciones siguientes: 1
( x 1 , x 2 ) + ( y1 , y 2 ) = ( x 1 + y1 , x 2 + y 2 )
" ( x 1 , x 2 ) ,( y1 , y 2 ) ŒR 2
2
a ( x 1 , x 2 ) = (a x1 , a x 2)
" a ŒR , ( x 1 , x 2 ) ŒR 2
Se dice entonces que la operación (+) es una ley de composición interna en R 2, a la que llamaremos suma, y la operación (.. ) una ley de composición externa en R 2 con operadores en R , a la que llamaremos multiplicación por un número. Dichas operaciones, como es fácil de comprobar, cumplen las siguientes propiedades: La suma: 1.1) 1.2) 1.3) 1.4)
x+y =y+x x + (yy + z ) = (xx + y ) + z x+0=x x + (–xx ) = 0
" " " "
x , y Œ R2 x , y , z Œ R2 x Œ R 2 , siendo 0 = (0, 0) x = (x 1 , x 2) Œ R 2 , siendo –xx = (–x 1 , –x 2)
" " " "
a Œ R ; x , y Œ R2 a , b Œ R , x Œ R2 a , b Œ R , x Œ R2 x Œ R2
La multiplicación por un número: 2.1) 2.2) 2.3) 2.4) ☞
a. (xx + y ) = a.xx + a.yy (a + b) .xx = a.xx + b.xx (a.b). x = a.(b. x ) 1. x = x
Por todo ello, se dice que la terna (RR 2 , +, .) es un espacio vectorial.
El espacio vectorial (R n, +, .) De igual manera que antes, ahora podríamos considerar el conjunto R n = { x = (x 1 , x 2 , .... , x n) / x i Œ R } y definir las dos operaciones siguientes: 1
( x 1 , x 2 , L , x n ) + ( y1 , y 2 , L , y n ) = ( x 1 + y1 , x 2 + y 2 , L , x n + y n )
" ( x 1 , x 2 , L , x n ) ,( y1 , y 2 , L , y n ) ŒR n
2
a ( x 1 , x 2 , L , x n ) = (a x1 , a x 2 , L , a x n )
" a ŒR , ( x 1 , x 2 , L , x n ) ŒR n
Veríamos que estas operaciones cumplen propiedades análogas a las que detallamos para el caso de R 2 y, por ello, diríamos que (RR n , +, . ) es un espacio vectorial. A sus elementos (n-tuplas de números reales) les llamaremos vectores. De 0 = ( 0 , 0 ,L, 0 ) diremos que es el vector nulo, y, dado x = ( x1 , x 2 , L , x n ) , de - x = (- x 1 , - x 2 , L , - x n ) diremos que es el vector opuesto de x . De los x i se dice que son las componentes del vector x .
– 71 –
Matrices y determinantes
Ejemplo previo Consideremos en R 3 los vectores a 1 = (2, 1, –1), a 2 = (0, 2, 3). Es inmediato que, por ejemplo: 2.aa 1 + 3.aa 2 = (4, 8, 7) o que: –1.aa 1 + 2.aa 2 = (–2, 3, 7) Pues bien, tanto del vector (4, 8, 7) como del (–2, 3, 7) diremos que son una combinación lineal de a 1 y a 2 .
Definición (de combinación lineal) Dados p vectores a 1 , a 2 , ... , a p del espacio vectorial (RR n , +, . ), diremos que otro vector a Œ R n es combinación lineal de los anteriores si existen a 1 , a 2 , ... , a p Œ R , que llamaremos coeficientes de la combinación lineal, tales que: a = a1 a 1 + a 2 a 2 + a3 a 3 + L + a p a p • Observa que, en particular, el vector nulo es combinación lineal de cualesquiera otros, pues para todo a 1 , a 2 , ... , a p Œ R n: 0 = 0 a1 + 0 a 2 + 0 a3 + L + 0 a p
Ejemplos previos ① ☞ Considerados los vectores de R 2 a 1 = (2, 0), a 2 = (1, 3) , supongamos que se verificase: a 1 a 1 + a 2 a 2 = 0 . En tal caso: a 1 (2, 0) + a 2 (1, 3) = (0 , 0)
2a 1 + a 2 = 0 ¸ a1 = a 2 = 0 3a 2 = 0
② ☞ Tomemos ahora a 1 = (2, 4), a 2 = (1, 2). Podríamos comprobar que, a diferencia de lo que sucedía en el caso anterior, para que se verificase a 1 a 1 + a 2 a 2 = 0 no sería necesario que a 1 = a 2 = 0 , bastando con que a 2 = -2a 1.
Definiciones (de independencia y dependencia lineal) ① ☞ Se dice que una familia { a 1 , a 2 , ... , a p } de vectores es libre, o que los vectores que la forman son linealmente independientes, si la única combinación lineal de ellos que es igual al vector nulo es aquella en la que todos los coeficientes son iguales a cero. O sea: a 1 , a 2 , ... , a p son linealmente independientes
si y sólo si
a1 a 1 + a 2 a 2 + L + a p a p = 0 a1 = a 2 = L = a p = 0
② ☞ En caso contrario, o sea, si existe alguna combinación lineal de a 1 , a 2 , ... , a p que, pese a tener algún coeficiente distinto de cero, sea igual al vector nulo, se dice que dichos vectores son linealmente dependientes, o que forman una familia ligada.
Consecuencia Siendo a 1 , a 2 , a 3 tres vectores cualesquiera de R n (podrían ser más; se trata de un ejemplo) consideremos la combinación lineal: 0 a 1 + 0 a 2 + 0 a 3 + 1 0 . Dicha combinación lineal no tiene todos los coeficientes nulos y, sin embargo, resulta ser igual al vector nulo. Podemos concluir, pues, que: Si en un conjunto de vectores se halla el vector nulo, tales vectores son linealmente dependientes.
Otra forma de definir la dependencia lineal Sean ahora a 1 , a 2 , a 3 , a 4 cuatro vectores (podría ser cualquier otro número) de R n. Supongamos, en primer lugar, que uno de ellos, a 4 , por ejemplo, fuera combinación lineal de los restantes. Se tendría:
– 72 –
Matrices y determinantes a 4 = a1 a 1 + a 2 a 2 + a3 a 3
(a i ŒR)
luego: a 1 a 1 + a 2 a 2 + a 3 a 3 + (-1) a 4 = 0 y los cuatro vectores serían linealmente dependientes. Si, recíprocamente, sucediera que los cuatro vectores fueran linealmente dependientes, existiría una combinación lineal nula: a1 a 1 + a 2 a 2 + a3 a 3 + a4 a 4 = 0 con algún coeficiente, a 4 , por ejemplo, distinto de 0. Despejando a 4 , se tendría: a4 =
-a1 -a 2 -a a + a + 3 a3 a4 1 a4 2 a4
En conclusión: El que los vectores de un conjunto sean linealmente dependientes equivale a que uno al menos de ellos sea combinación lineal de los restantes.
Consecuencia Dados dos vectores de R n : x = (x 1 , x 2 , .... , x n) , y = (y 1 , y 2 , .... , y n) ¿en qué se traduciría, en relación con la proporcionalidad de sus componentes, la dependencia e independencia lineal? ¿Son linealmente independientes los vectores de R 4 (2, 0, –1, 3) y (4, 0, –2, 6)?
Ejemplos previos 1 Consideremos, en R 2 , los vectores: a 1 = (1, 2) ; a 2 = ( 2 , 0 ). Que todo otro vector x = ( x 1 , x 2 ) de R 2 se puede escribir como combinación lineal de ellos es fácil de demostrar, pues: ( x 1 , x 2 ) = a 1 (1, 2) + a 2 ( 2 , 0 )
¤
2x 1 - x 2 a 1 + 2a 2 = x 1 ¸ x ¤ a1 = 2 ; a 2 = = x2
2a 1 2 4
Pero, además: a 1 (1, 2) + a 2 ( 2 , 0 ) = ( 0 , 0 ) a 1 = 0 ; a 2 = 0 luego a 1 , a 2 son linealmente independientes.
2 Tomados en R 3 los vectores: e1 = (1, 0 , 0 ) , e 2 = ( 0 , 1, 0 ) , e3 = ( 0 , 0 , 1) , se tiene que: 1
( x 1 , x 2 , x3 ) = x1 (1, 0 , 0 ) + x 2 ( 0 , 1, 0 ) + x3 ( 0 , 0 , 1)
2
x 1 (1, 0 , 0 ) + x 2 ( 0 , 1, 0 ) + x3 ( 0 , 0 , 1) = ( 0 , 0 , 0 ) x 1 = x 2 = x3 = 0
O sea, que: 1) Cualquier vector de R 3 se puede escribir como combinación lineal de e1 , e 2 , e3 2) Los vectores e1 , e 2 , e3 son linealmente independientes
Definición (de base de (R n, +, .)) ➪ Una base del espacio vectorial (RR n , +, . ) es cualquier conjunto de n vectores B = { a 1 , a 2 , a 3 , L , a n } de R n (tienen que ser necesariamente n) tales que: 1
Los vectores a 1 , a 2 , a 3 , L , a n son linealmente independientes.
2
Cualquier vector de R n puede escribirse como combinación lineal de a 1 , a 2 , a 3 , L , a n .
– 73 –
Matrices y determinantes
Definición (coordenadas de un vector) Sea B = { a 1 , a 2 , a 3 , L , a n } una base de (RR n , +, . ). Dado a Œ R n, sabemos que existen x 1 , x 2 , .... , x nŒ R tales que: a = x1 a 1 + x 2 a 2 + L + x n a n Pero ¿son estos x i los únicos números para los que se cumple lo anterior? Si otros números y 1 , y 2 , .... , y nŒ R cumplieran: a = y1 a 1 + y 2 a 2 + L + y n a n y restásemos las dos últimas igualdades, obtendríamos: (x 1 - y 1 ) a 1 + (x 2 - y 2 ) a 2 + L + (x n - y n ) a n = 0 y, por ser los vectores a i linealmente independientes, todos los coeficientes habrían de ser nulos, luego x i = y i , para i = 1, 2, ... , n.
• De esos números x i , únicos para los que se cumple: a = x1 a 1 + x 2 a 2 + L + x n a n , se dice que son las c o o r d e n a d a s del vector a en la base B = { a 1 , a 2 , a 3 , L , a n }
Observación De forma semejante a como hicimos antes para el caso de R 3, es muy fácil comprobar que los vectores: e1 = (1, 0 , 0 , 0 , L , 0 ) , e 2 = ( 0 , 1, 0 , 0 , L , 0 ) , L , e n = ( 0 , 0 , 0 , 0 , L , 1) forman una base de (RR n , +, . ). Por ser la más sencilla, se dice que es la base canónica. Una de las ventajas de utilizar la base canónica es que las coordenadas de un vector en ella coinciden con sus componentes.
2. MATRICES DE NÚMEROS REALES Definición (de matriz) ☞ Llamaremos matriz de números reales de orden m ¥ n a un conjunto ordenado de m . n números reales, dispuestos en m filas y n columnas: Ê a11 a12 a13 L a1j L a1n ˆ Á ˜ Á a 21 a 22 a 23 L a 2 j L a 2 n ˜ A =Á L L L L L L L ˜ Á a i1 a i2 a i3 L a i j L a i n ˜ Á ˜ ÁL L L L L L L ˜ Ë a m1 a m2 a m3 L a m j L a m n ¯ Con el símbolo a i j nos referiremos al elemento situado en la fila i y la columna j, y la matriz se escribirá: A = (a i j) . Naturalmente, puede ocurrir que m = n. Se dice, entonces, que la matriz es cuadrada. Además, conviene observar cada una de las m filas de A puede considerarse como un vector de (RR n , +, . ), y cada una de sus n columnas como un vector de (RR m , +, . ).
Definición (de suma de matrices) • Dadas dos matrices A = (a i j) ; B = (b i j) , que necesariamente han de ser del mismo orden m ¥ n , se define la matriz suma C = A + B como la matriz de orden m ¥ n dada por C = (c i j) , con c i j = a i j + b i j . Así, por ejemplo:
Ê3 2 1 2 ˆ Ê-1 2 3 0 ˆ Ê2 4 4 2 ˆ Á2 1 3 0 ˜ + Á 0 -1 2 4 ˜ = Á2 0 5 4 ˜ Ë ¯ Ë ¯ Ë ¯
Definición (de producto de un número real por una matriz) • Dada una matriz de orden m ¥ n , A = (a i j) , y un número a Œ R , se define el producto a AA como la matriz de orden m ¥ n dada por a A = (a . a i j) . Así, por ejemplo:
Ê3 2 1 2 ˆ Ê6 4 2 4 ˆ = Á 2 Á ˜ ˜ Ë2 1 3 0 ¯ Ë4 2 6 0 ¯
– 74 –
Matrices y determinantes
Definición (de producto de matrices) • Dadas una matriz A , de orden m ¥ n y otra matriz B , de orden n ¥ p (el número de columnas de A ha de coincidir con el de filas de B ), se define la matriz producto C = A ¥ B como la matriz de orden m ¥ p cuyo elemento c i j viene dado por: n
c i j = a i 1 b1 j + a i 2 b 2 j + a i 3 b3 j + º + a i n b n j = Â a i k b k j k=1
Es decir, para obtener el elemento c i j de la matriz C = A B basta con multiplicar “uno a uno” los elementos de la fila i de A por los de la columna j de B (en negrita en el siguiente esquema) y sumar todos esos productos. Ê a11 a12 Áa a Á 21 22 ÁL L Á a i1 a i2 ÁL L Áa Ë m1 a m2
L L L L L L
L L L a ik L L
L L L L L L
a1n a 2n L a in L a mn
Ê b11 b12 L ˆ Á ˜ Á b 21 b 22 L ˜ ˜ ¥ ÁL L L ÁL L L ˜ Á ˜ ÁL L L ˜ ¯ Ë b n1 b n2 L
b1 j b2 j L bkj L bn j
L L L L L L
b1p b 2p L L L b np
Ê c11 ˆ Á ˜ Á c21 ˜ ˜ = ÁL Á ci 1 ˜ Á ˜ ÁL ˜ ¯ Ë cm1
c12 c22 L ci 2 L cm2
L L L L L L
c1j c2 j L ci j L cm j
L L L L L L
c1p c2p L ci p L cmp
ˆ ˜ ˜ ˜ ˜ ˜ ˜ ¯
Así, por ejemplo: Ê 2 Ê 1 2 3 2 ˆ Á -3 Á ˜ ¥ Ë 3 1 4 2 ¯ ÁÁ -1 Ë 5
3 0 2 1
0ˆ 1 ˜ ÊÁ 3 11 10 ˆ˜ = 2 ˜˜ Ë 9 19 11 ¯ 1¯
Definición (de rango de una matriz) Dada la matriz: Ê Á A =Á Á Á Ë
a11 a 21
a12 a 22
L L a m1 a m 2
L a1 n ˆ ˜ L a2 n ˜ L L L L L ˜ ˜ a m3 L a m j L a m n ¯ a13 a 23
L a1j L a 2j
llamaremos rango de A al máximo número de filas de A que, como vectores de (RR n , +, . ) , son linealmente independientes. (O sea, que si el rango de A es tres, por ejemplo, eso quiere decir que se pueden encontrar tres filas de A linealmente independientes –lo cual no significa que tomados tres filas cualesquiera, hayan de ser linealmente independientes–, mientras que siempre que se tomen cuatro, cinco, etc., serán dependientes).
Ejemplo En la matriz:
Ê 2 -1 -1 0 ˆ A = Á0 1 3 2 ˜ Á2 1 5 4 ˜ ¯ Ë
la tercera fila es combinación lineal de las dos primeras, pues: (2 1 5 4) = (2 –1 –1 0) + 2.(0 1 3 2). Las dos primeras filas, en cambio, son linealmente independientes, luego el rango de A es 2.
Consecuencias (transformaciones que no modifican el rango de una matriz) Llegados a este punto, y con objeto de simplificar al máximo la tarea, admitiremos sin demostración que: El rango de una matriz no se modifica si: 1 Se cambia el orden de las filas 2 Se prescinde de una fila que sea combinación lineal de las demás. (En particular, no se modificará el rango de una matriz si, existiendo en ella una fila de ceros, se prescinde de ella).
3 A una de sus filas se la multiplica por un número distinto de cero. 4 A una fila se le suma una combinación lineal de las demás.
– 75 –
Matrices y determinantes
Rango de una matriz triangular Para calcular el rango de una matriz por el llamado método de Gauss, que veremos enseguida, necesitamos preparar un poco el terreno. A tal efecto, sea A una matriz triangular, esto es, una matriz de la forma: Ê a11 a12 Á Á 0 a 22 A =Á 0 0 Á ÁL L 0 Ë 0
a13 a 23 a 33 L 0
L L L L L
a1r a 2r a3r L arr
L L L L L
a1 n a2 n a3r L arn
ˆ ˜ ˜ ˜ ˜ ˜ ¯
en la que, además, todos los elementos de la forma a i i son distintos de cero. Si fuera: a1.(a11 , a12 , L, a1r , L, a1n ) + a 2 .(0 , a 22 , L, a 2r , L, a 2n ) + L + a r .(0 , 0 , L, a rr , L, a r n ) = (0 , 0 , L, 0 , L, 0 ) habría de ser a 1 = a 2 = L = a r = 0 . Las r filas de A , en consecuencia, son linealmente independientes y el rango de A es r.
Cálculo del rango por el método de Gauss Este método, que explicaremos a continuación sirviéndonos de un ejemplo, consiste en aplicar de forma sistemática a la matriz cuyo rango se desee calcular, transformaciones lineales que, sin modificar su rango, transformen dicha matriz en otra de igual rango pero triangular. Supongamos dada, por ejemplo, la matriz: Ê2 Á3 A=Á 7 Á2 Ë
3 1 7 1
1 0 2 3
2 4 8 0
0ˆ 2˜ 2˜ 1 ˜¯
El rango de A no se modificará si: ① ② ➂
Multiplicamos la segunda fila por 2 y le restamos la primera multiplicada por 3. Multiplicamos la tercera fila por 2 y le restamos la primera multiplicada por 7. Restamos a la cuarta fila la primera. Ê Á Á Á Ë
➃
3 1 7 1
1 0 2 3
2 4 8 0
igual 0ˆ rango 2˜ æææÆ 2 ˜˜ 1¯
Ê Á Á Á Ë
2 3 1 2 0ˆ 0 -7 -3 2 4 ˜ 0 -7 -3 2 4 ˜˜ 0 -2 2 -2 1 ¯
Quitamos la tercera fila: Ê Á Á Á Ë
➄
2 3 7 2
igual 2 3 1 2 0ˆ rango 0 -7 -3 2 4 ˜ æææÆ 0 -7 -3 2 4 ˜˜ 0 -2 2 -2 1 ¯
Ê2 3 1 2 0ˆ Á 0 -7 -3 2 4 ˜ Á ˜ Ë 0 -2 2 -2 1 ¯
Si, por último, multiplicamos por –7 la tercera fila y le restamos la segunda multiplicada por –2: igual Ê2 3 1 2 0ˆ rango Á 0 -7 -3 2 4 ˜ æææÆ Á ˜ Ë 0 -2 2 -2 1 ¯
Ê2 3 1 2 0ˆ Á 0 -7 3 2 4 ˜˜ Á 0 -20 18 1 ¯ Ë0
Y, en consecuencia, visto el resultado anterior, rango A = 3.
Observación La aplicación de este método, que toma como “pivote” el elemento a 11 de la matriz, exige que éste sea distinto de cero. De no ser así, habría que hacer un cambio en el orden de las filas. Ello no modificaría el rango y nos permitiría aplicar el procedimiento.
– 76 –
Matrices y determinantes
Dos definiciones (matriz unidad y matriz inversa) • En el conjunto M (n) de las matrices cuadradas de orden n existe una matriz, la: Ê 1 0 L 0 Á 0 1 L 0 ÁL L L L In = Á 0 0 L 1 ÁL L L L Á Ë 0 0 0 0
L 0 ˆ L 0 ˜ L L˜ L 0 ˜ L L ˜˜ 0 1 ¯
a la que se llama matriz unidad de orden n, tal que, cualquiera que sea la matriz cuadrada A de orden n: A ¥ In = In ¥ A = A
• Así mismo, dada una matriz A , cuadrada de orden n, se puede demostrar que si se cumple determinada condición (concretamente, que su rango sea n), existe otra matriz A -1, tal que A -1 ¥ A = A ¥ A -1 = I n De A -1, cuando existe, se dice que es la matriz inversa de A.
Cálculo de la matriz inversa El llamado método de Gauss permite calcular de forma sencilla la inversa de una matriz cuadrada de orden n (siempre que exista). Explicamos cómo se aplica en el siguiente ejemplo. Ê2 1 2ˆ Supongamos que se desea calcular la inversa de la matriz: A = Á 3 0 1 ˜ Á 1 1 2˜ Ë ¯ Escribiremos una nueva matriz, adosando a la derecha de A la matriz unidad de orden 3: Ê2 1 2 1 0 0ˆ Á3 0 1 0 1 0˜ Á 1 1 2 0 0 1˜ Ë ¯ A continuación, aplicaremos a esta nueva matriz las transformaciones que vimos antes al usar el método de Gauss, hasta que en la caja de la izquierda aparezca la matriz I 3 . Cuando ello suceda, la matriz que aparezca en la caja derecha será la inversa de A , A -1. (Designaremos cada paso por un número; su significado se explica al final). Ê2 1 2 1 0 0ˆ 1 Á3 0 1 0 1 0˜ æ æÆ Á 1 1 2 0 0 1˜ Ë ¯
Ê2 1 2 Ê2 1 2 1 0 0ˆ 1 0 0ˆ 2 3 Á 0 -3 -4 -3 2 0 ˜ æÆ Á 0 -3 -4 -3 2 0 ˜ æÆ æ æ Á ˜ Á0 ˜ 2 -6 2 6 ¯ 1 2 -1 0 2 ¯ Ë0 0 Ë
Ê6 0 0 Ê2 1 0 Ê2 1 2 7 -2 -6 ˆ 6 0 -6 ˆ 1 0 0ˆ 4 5 6 Á 0 -3 0 -15 6 12 ˜ æÆ Á 0 -3 0 -15 6 12 ˜ æÆ Á 0 -3 0 -15 6 12 ˜ æÆ æ æ æ Á 0 0 2 -6 2 6 ˜ Á 0 0 2 -6 2 6 ˜ Á 0 0 2 -6 2 6 ˜ Ë ¯ ¯ Ë Ë ¯ Ê1 0 0 1 0 -1 Á 0 1 0 5 -2 -4 Á 0 0 1 -3 1 3 Ë
ˆ Ê 1 0 ˜ La matriz inversa de A es: A -1 = Á 5 -2 ˜ Á-3 1 ¯ Ë
-1ˆ -4 ˜ 3 ˜¯
(1) A la segunda fila multiplicada por 2 se le resta la primera multiplicada por 3 y a la tercera fila multiplicada por 2 se le resta la primera.
(2) A la tercera fila multiplicada por 3 se le suma la segunda
(3) A la segunda fila se le suma la tercera multiplicada por 2
(4) A la primera fila se le resta la tercera
(5) A la primera fila, multiplicada por 3, se le suma la segunda
(6) Se divide la primera fila por 6, la segunda por –3 y la tercera por 2
– 77 –
Matrices y determinantes
3. DETERMINANTES Un instrumento muy útil en próximos temas son los determinantes. No nos preocuparemos mucho por las demostraciones de sus propiedades –bastante artificiosas, en honor a la verdad– e intentaremos, sobre todo, adquirir cierta destreza en su manejo.
Definiciones previas ➀ Llamaremos permutación principal de los n primeros números naturales a la ordenación: 1
2
3
4
...
n
i4
...
in
➁ Formada otra permutación de esos mismos números: i1
i2
i3
diremos que entre dos de sus elementos se presenta una inversión si el orden relativo en el que tales elementos aparecen es distinto del que les corresponde en la permutación principal.
Ejemplo Considerada la ordenación 3 1 4 2 , formada con los cuatro primeros números naturales, podemos observar que el 3 está en inversión con el 1 y el 2 , y el 4 con el 2 . No hay más inversiones. El número total de ellas en esa permutación es, pues, tres.
Definición (de determinante) ☞ Llamaremos determinante de una matriz cuadrada de orden n, A = ( a i j ) , y lo representaremos por A al número que se obtiene sumando todos los productos que se puedan formar con n elementos de la matriz, tomando un elemento de cada fila y de cada columna, y adjudicando a cada producto el signo + ó – según que siendo a1i1 a 2i2 a 3i3 ºa nin uno de ellos (con sus factores ordenados respecto al primer subíndice), el número de inversiones de la permutación i1 i2 i3 ºin sea par o impar. En consecuencia, siendo s el número de inversiones de cada permutación i1 i2 i3 ºin , como (–1) s será igual a +1 si s es par, e igual a –1 si s es impar, se tendrá: A = Â (-1)s a1i1a 2i2 a 3i3 ºa nin La suma anterior consta de tantos sumandos como permutaciones pueden hacerse con los n primeros números naturales, es decir, n !, número que, a poco grande que sea n, corresponderá a tantas permutaciones como para que calcular el valor del determinante aplicando la definición sea inviable en la práctica. Más adelante veremos cómo se subsana este inconveniente.
Consecuencias (determinantes de órdenes 2 y 3) Como consecuencia de la definición anterior, resulta que: ①➠
a 11 a 12 = a 11 a 2 2 - a 12 a 21 a 21 a 2 2
O sea, que para calcular un determinante de orden dos basta con seguir el esquema: Producto con signo +
➁➠
Producto con signo –
a 11 a 1 2 a 13 a 2 1 a 2 2 a 2 3 = a11 a 22 a33 + a12 a 23 a31 + a13 a 21 a32 - a13 a 22 a31 - a12 a 21 a33 - a11 a 23 a32 a 31 a 3 2 a 33
Desarrollo que puede memorizarse fácilmente haciendo uso del siguiente esquema, conocido como regla de Sarrus:
– 78 –
Matrices y determinantes
Productos con signo +
Productos con signo -
Observación Como hemos dicho, mal asunto sería que, para conocer el valor de un determinante de orden n, tuviéramos que calcular los n! sumandos necesarios. El cálculo de un determinante de orden 4 exigiría calcular 24 productos; el de uno de orden 5, 120... Para calcular un determinante de orden 10 necesitaríamos calcular la friolera de 3.628.800 productos, cada uno de ellos de 10 factores... Afortunadamente, dos nuevas definiciones nos conducirán a un procedimiento que evitará tales dificultades.
Definiciones (de menor complementario y adjunto) 1 ) Llamaremos menor complementario del elemento a i j de una matriz A , cuadrada de orden n, y lo representaremos por a i j , al determinante de la matriz cuadrada de orden n – 1 que resulta de prescindir en A de la fila i y de la columna j . 2 ) Llamaremos adjunto del elemento a i j de A, y lo representaremos por A i j, a: A i j = (-1) i+ j a i j
Ejemplos Ê Á Es fácil comprobar que para la matriz A = Á Á Ë
2 1 0 4
1 0 2 1
0 3 1 0
2ˆ 1˜ se tiene: a 11 = -13 2˜ ˜ 3¯
a 23 = 0
A34 = -6
A44 = -13 .
Consecuencia (desarrollo de un determinante por los elementos de una línea) Una propiedad fundamental para el cálculo de determinantes de orden superior a 3 es la siguiente, cuya demostración, bastante artificiosa, no efectuaremos. El valor de un determinante es igual a la suma de los productos de los elementos de una línea (fila o columna) por sus adjuntos respectivos. O sea :
A =
a11 a 21 L a i1 L a n1
a12 a 22 L a i2 L an2
a13 a 23 L a i3 L a n3
L L L L L L
a1 j a2j L aij L an j
L L L L L L
a1 n a2 n L ai n L an n
= a i1 A i1 + a i2 A i2 + º + a in A in = a1j A1j + a 2 j A 2 j + º + a n j A n j
Ejemplo Supongamos que se deseara calcular el valor de:
1 0 3 2 -3 1 A = -3 1 2 2 -5 3
2 0 0 1
Como en la cuarta columna aparecen dos ceros, eligiremos dicha línea para efectuar el desarrollo y tendremos: 2 -3 1 1 0 3 A = -2 -3 1 2 + 1 2 -3 1 = -2 0 + 1 (-28) = -28 2 -5 3 -3 1 2
– 79 –
Matrices y determinantes
Observación Aunque el desarrollo de un determinante por los elementos de una línea permite un cálculo más rápido de éste, si en dicha línea no aparecieran varios ceros, aún resultaría tarea excesivamente prolija. El problema se resolverá, definitivamente, con lo que sigue.
Teorema (transformaciones en un determinante) ☞ Dada una matriz cuadrada A = (a i j ) , se verifican las siguientes proposiciones, sobre cuyas demostraciones te ofrecemos algunas sugerencias: ①
El valor de |A| no varía si se intercambian filas por columnas. Es difícil de demostrar, pues habría que ver que los productos cuya suma es igual a |AA | aparecen con el mismo signo, sin que sobre ni falte ninguno, en el desarrollo del nuevo determinante. Puede comprobrarse para un determinante de orden 3.
②
Si todos los elementos de una fila (columna) de A son nulos, entonces |A| = 0. Todos los sumandos de |AA| (que, a su vez, son productos) contendrán un elemento de tal fila, luego serán nulos.
➂
Si en A se intercambian dos filas (columnas), obteniéndose la matriz B, entonces |B|= – | A | . Es muy liosa de demostrar. Compruébala, si acaso, para un determinante de orden 3.
➃
Si en A existen dos filas (columnas) iguales, entonces |A| = 0. Según la propiedad anterior, al intercambiarse tales filas (columnas) se obtendrá otra matriz, B , tal que |BB |= –|AA |, pero como B = A , se tendrá |AA |= 0.
➄
Si se multiplican todos los elementos de una fila (columna) de A por un mismo número k , o b t e n i é n dose la matriz B, entonces |B|= k | A | . Si, por ejemplo, hubiéramos multiplicado la segunda fila de A por k, obtendiendo la matriz B , sería: B =  (-1)s a1i1 (ka2 i 2 ) º an i n = k  (-1)s a1i1a2 i 2 º an i n = k . A
➅
Si en A existen dos filas (columnas) proporcionales, entonces |A| = 0. Utilizando las propiedades 4ª y 5ª es fácil. Así, por ejemplo: a a a11 k a11 = k 11 11 = 0 a 21 a 21 a 21 k a 21
➆
El valor de |A| no se modifica si a una fila (columna) se le suma otra fila (columna) multiplicada por un número. Si, efectuada esa suma, se desarrolla el determinante por los adjuntos de la nueva línea, tal determinante puede descomponerse en suma de otros dos: uno que coincide con el inicial y otro que, al tener dos líneas paralelas iguales, será nulo.
➇
Si en A existe una fila (columna) combinación lineal de otras, entonces |A| = 0. Por ejemplo:
⑨
a b aa + b b a b 0 Ê ˆ c d ac + b d = Á restando a la tercera columna la primera ˜ = c d 0 = 0 a b multiplicada por y la segunda por Ë ¯ e f 0 e f ae + b f
La suma de los productos de los elementos de una fila (columna) de A por los adjuntos de otra fila (columna) es igual a cero. En efecto: La suma en cuestión coincidiría con el desarrollo por adjuntos de un determinante con dos líneas paralelas iguales, que sería nulo por la propiedad 4ª.
Ejemplo Ahora se trata de ver cómo se aplican las propiedades anteriores al cálculo de determinantes, especialmente para lograr cuantos más ceros mejor en una línea, lo cual permitirá un cómodo desarrollo del determinante por los adjuntos de tal línea.
– 80 –
Matrices y determinantes 1 2 5 3
Supongamos, por ejemplo, que deseáramos calcular:
3 1 2 8
2 3 7 9
5 4 6 2
Aplicando reiteradamente la propiedad 7ª anterior, a la segunda fila le podemos restar la primera multiplicada por 2; a la tercera, la primera multiplicada por 5; y, a la última, la primera multiplicada por 3. Llegados aquí, la primera columna tendría todos sus elementos, salvo uno, nulos, y bastaría con desarrollar por ella para calcular el determinante: 1 2 5 3
3 1 2 8
2 3 7 9
5 1 3 2 5 -5 -1 -6 4 0 -5 -1 -6 = = 1 -13 -3 -19 = - 78 6 0 -13 -3 -19 -1 3 -13 2 0 -1 3 -13
Un error fácil de cometer consiste en pensar que para conseguir un cero en el lugar (2, 2), por ejemplo, se puede multiplicar por 3 la segunda fila y restarle la primera. Efectivamente, obtendríamos un cero en dicho lugar, pero el valor del determinante, de acuerdo con la propiedad 5ª, ya no sería el mismo.
Ejemplo Comprueba que el siguiente determinante, caso particular del llamado determinante de Vandermonde, tiene el valor indicado: 1 a a2 a3
1 b b2 b3
1 c c2 c3
1 d = (a - b)(a - c)(a - d)(b - c)(b - d)(c - d) d2 3 d
Ejemplo (de otra cosa) Observa la matriz:
Ê2 Á4 A=Á 0 Á5 Ë
7ˆ 9˜ 2˜ 7 ˜¯
5 4 6 2 1 8 8 4 1 3 7 1
En ella se han señalado los elementos comunes a las filas segunda y tercera con las columnas segunda y cuarta. Pues bien, el 2 8 determinante es un ejemplo de lo que llamaremos menor de la matriz A . Menor de orden dos, en este caso. 1 2
Definición (de menor de orden r en una matriz) Si en una matriz A = (a i j ) , de orden m ¥ n , se eligen las r filas i 1 , i 2 , L , i r (en el orden natural) y las r columnas j 1 , j 2 , L , j r (en igual orden), el menor de orden r correspondiente a tales filas y columnas es el siguiente determinante: ai1 j1
ai1 j2
ai1 j3
L
ai1 jr
ai2 j1
ai2 j2
ai2 j3
L
ai2 jr
L air j1
L air j2
L air j3
L L
L air jr
Teorema Las filas de una matriz A = (a i j ) con las que pueda formarse un menor no nulo son linealmente independientes. En efecto: Supongamos que siendo, por ejemplo: Ê a 11 Á Á a21 A =Á a31 ÁÁ Ë a41
a12 a13 a1 4 a15 ˆ ˜ a2 2 a23 a2 4 a25 ˜ a3 2 a33 a3 4 a35 ˜ ˜ a 4 2 a 4 3 a 4 4 a 4 5 ˜¯
– 81 –
Matrices y determinantes se tuviera: a 11 a 1 2 D = a 21 a 2 2 a 31 a 3 2
a 13 a 23 0 a33
Entonces, si las correspondientes filas de A (las tres primeras, en este caso) no fueran linealmente independientes, serían linealmente dependientes y una al menos de ellas, la primera, por ejemplo, sería combinación lineal de las otras dos:
(a
11
)
(
) (
a 1 2 a 1 3 a 1 4 a 1 5 = a a 2 1 a 2 2 a 2 3 a 2 4 a 2 5 + b a 3 1 a 3 2 a 3 3 a 3 4 a 3 5
)
a , b ŒR
Pero, entonces, también sería:
(a
11
)
(
) (
a 1 2 a 1 3 = a a 2 1 a 2 2 a 2 3 + b a 3 1 a 3 2 a 3 3
)
y el menor D no podría ser distinto de cero, pues su primera fila sería combinación lineal de las otras dos.
Cálculo del rango de una matriz usando menores Ê a 11 a 1 2 Á a 21 a 2 2 A =Á Á a 31 a 3 2 Á Ë a 41 a 42
Supongamos que, dada la matriz
a 13 a 23 a33 a43
a 14 a24 a34 a44
a 15 a 25 a35 a45
ˆ ˜ ˜ ˜ ˜ ¯
a11 a12 0 , mientras que cualquier otro menor de A, de orden superior a 2, es nulo. Vamos a demostrar que, a 21 a 22 entonces, rango de A = 2. el menor D =
① ➠ Veamos, en primer lugar, que la tercera fila de A es combinación lineal de las dos primeras. Se puede asegurar que: ( 1)
( 2)
a 1 1 a 1 2 a11 a 2 1 a 2 2 a 21 = 0 , a31 a32 a31 (3)
a 1 1 a 1 2 a12 a 2 1 a 2 2 a 22 = 0 a31 a32 a32
(4 )
a 1 1 a 1 2 a13 a 2 1 a 2 2 a 23 = 0 , a31 a32 a33
(5)
a 1 1 a 1 2 a14 a 2 1 a 2 2 a 24 = 0 , a31 a32 a34
a 1 1 a 1 2 a15 a 2 1 a 2 2 a 25 = 0 a31 a32 a35
En los casos (1) y (2), por ser determinantes en los que hay dos columnas iguales; en los casos (3), (4) y (5), por ser de menores de A, de orden superior a 2.
Desarrollando los 5 determinantes anteriores por la última columna, y siendo: A1 =
a 21 a 22 a31 a32
, A2 = -
a11 a12 a31 a32
, A3 =
a11 a12 = D 0; a 21 a 22
Se tendrá: a11A1 + a 21A 2 + a31 D = 0 ¸ Ô a12 A1 + a 22 A 2 + a32 D = 0 Ô Ô a13 A1 + a 23 A 2 + a33 D = 0 Ô a14 A1 + a 24 A 2 + a34 D = 0 Ô a15 A1 + a 25 A 2 + a35 D = 0 Ô
Es decir:
– 82 –
Matrices y determinantes a3 1
=
a3 2
=
M
M
a35
=
-A 1 D -A 1 D
+
a12
+
M
-A 1 D
a11
M a15
+
-A 2 D -A 2 D
a2 1 a2 2
È a3 1 È a11 È a2 1 Í Í Í Ía3 2 = - A 1 Ía12 + - A 2 Ía2 2 Í M D ÍM D Í M Ía Ía Ía Î 35 Î 15 Î 25
, o sea:
M
-A 2 D
a25
luego, efectivamente, la tercera fila de A es combinación lineal de las dos primeras. ➁ ➠ Análogamente, podríamos demostrar que la cuarta fila de A es combinación lineal de las dos primeras. ➂ ➠ Como consecuencia de ➀ y ➁, podremos prescindir de las filas tercera y cuarta de A sin que su rango varíe. Es decir: Ê a11 a12 a13 a14 a15 ˆ rango A = rango Á ˜ Ëa 21 a 2 2 a 2 3 a 2 4 a 2 5 ¯ c u y o v a l o r e s 2 , pues al ser D =
a11 a12 0, las dos filas de la última matriz son linealmente independientes. a 21 a 22
➠ Observemos, por tanto, que dado un menor no nulo de A , de orden r, para ver si otra fila de A es combinación lineal de aquéllas con parte de cuyos elementos se ha formado tal menor, basta con calcular todos los menores de orden (r+1) que se puedan escribir completando el inicial con los elementos de esa nueva fila. (Se dice que tales menores se han obtenido orlando el menor inicial con tal fila). Si hubiera alguno no nulo, el rango de A sería como mínimo (r+1) y partiríamos de él para formar, ahora, menores de orden (r+2). Si, por el contrario, todos los menores de orden (r+1) obtenidos orlando el inicial con dicha fila fueran nulos, eso nos permitiría prescindir de ella sin que el rango de A se modificara, pues la fila en cuestión sería combinación lineal de las que intervienen en el menor de orden r.
Observación La demostración anterior, aunque referida a un caso particular para facilitar su comprensión, es conceptualmente idéntica a la que habría de efectuarse en el caso general. Ello nos permite concluir, pues, que: El rango de una matriz coincide con el orden del menor o los menores de dicha matriz de mayor orden no nulos.
Ejemplo Ê Á A=Á Á Ë
Supongamos que se deseara calcular el rango de la matriz:
Como
2 1
2 1 6 1
1 0 2 1
-2 1 -2 -3
4ˆ 0˜ 8˜ 2 ˜¯
1 -2 -2 4
1 0 , las dos primeras filas de A son linealmente independientes y el rango de A , como mínimo, será 2. Orlando el 0
menor anterior con la tercera fila, se tiene:
2 1 6
1 0 2
-2 1 =0 , -2
2 1 6
1 0 2
1 -2 = 0 , -2
2 1 6
1 0 2
4 0 =0 8
luego dicha fila es combinación lineal de las dos primeras y, en consecuencia, puede prescindirse de ella sin que el rango de A varíe. Es decir: Ê 2 1 -2 1 4ˆ rango A = rango Á 1 0 1 -2 0 ˜ Á 1 1 -3 4 2 ˜¯ Ë
– 83 –
Matrices y determinantes Partiendo, de nuevo, de que
2 1
1 0 , si orlamos dicho menor con la tercera fila de la nueva matriz, se tiene: 0 2 1 -2 1 0 1 =0 , 1 1 -3
2 1 1 1 0 -2 0 1 1 4
y sin necesidad de considerar el tercer menor que se podría formar (pues ya hemos hallado uno no nulo) concluiríamos que rango A = 3.
Advertencia importante Si hubiéramos definido el rango A como el máximo número de columnas, y no filas, de A linealmente independientes, habríamos visto que también en ese caso el rango A coincidiría con el orden del menor de A de mayor orden no nulo, luego: Es indiferente definir el rango de una matriz como el máximo número de filas linealmente independientes o como el máximo número de columnas linealmente independientes, pues ambos valores coinciden. Y al igual que vimos transformaciones entre filas de A que no modificaban el rango, también podríamos haber demostrado que: El rango de una matriz no se modifica si: 1 Se prescinde de una columna combinación lineal de otras. 2 Se multiplica una columna por un número distinto de cero. 3 Se suma a una columna una combinación lineal de otras.
Cálculo de la matriz inversa mediante adjuntos Líneas atrás vimos cómo podía calcularse la inversa de una matriz cuadrada, A = (a i j ) , siempre que fuera rango A = n. A continuación vamos a explicar otro método, que hace uso de los adjuntos. Ê4 2 Sea, por ejemplo, la matriz: A = Á 3 2 Á 1 0 Ë
1ˆ 2 ˜. 3 ˜¯
En primer lugar comprobamos que A 0 (que es la condición equivalente a que rango A = 3). Efectivamente, A = 8 0.A continuación escribimos la matriz “adjunta” de A , a d j ( A ) , en la que el elemento de lugar (i, j) es el adjunto del elemento a i j de A : Ê 6 -7 -2 ˆ a d j (A) = (A i j ) = Á -6 11 2 ˜ Á 2 -5 2 ˜¯ Ë Escribimos ahora la traspuesta de la anterior, que es la matriz cuyas filas son las columnas de matriz de arriba: Ê 6 T [a d j (A)] = Á -7 Á -2 Ë
-6 2ˆ 11 -5 ˜ 2 2 ˜¯
Pues bien, finalmente: Ê 3 ˆ 3 1˜ Á 4 -4 T [a d j (A)] Á 7 11 ˜ A -1 = =Á -5 ˜ 8 8˜ A Á 8 1 1˜ Á-1 Ë 4 4 4¯ Observación: Ciertamente, este método del cálculo de la matriz inversa, como el que ya habíamos visto, puede parecer un tanto artificioso y carente de justificación. Son razones de eficacia y economía del escaso tiempo disponible en el curso las que nos han aconsejado incluirlos aquí. Al final del próximo tema, sin embargo, justificaremos lo que hemos hecho ahora.
– 84 –
Matrices y determinantes
4. EJERCICIOS 1.-
Obtén el valor de x, sabiendo que el vector (8, 7, x, 6) se puede expresar como combinación lineal de (1, 2, 3, 0) y (2, 1, 1, 2).
2.-
El vector (x, y, –23, –5) es una combinación lineal de (1, 2, –5, 3) y (2, –1, 4, 7). Halla x, y.
3.-
Averigua cuáles de las siguientes familias de vectores de (RR 3 , +, . ) son libres: A = { (0, 0, 0), (1, 1, 1) }
B = { (1, 2, 3), (3, 2, 1) }
C = { (2, 3, 1) }
D = { (0, 2, –4), (1, –2, 1), (1, -4, 3) }
E = { (1, –2, 3), (3, –6, 9) }
F = { (1, -1, 1), (2, 3, 1), (–1, 4, 0), (1, 1, 0) }
4.-
Demuestra que si a , b , c son vectores linealmente independientes, entonces también son linealmente independientes los vectores a + b , a + c , b + c . ¿Se deduce de lo anterior que si a + b , a + c , b + c son linealmente dependientes, entonces a , b , c también lo son?
5.-
Los vectores (3, –2, –1, 3), (1, 0, 2, 4), (7, –4, x, y) son linealmente dependientes. Halla x, y.
6.-
Demuestra que los vectores (2, 0, 1), (2, 0, 2), (0, 4, 0) forman una base de (RR 3 , +, . ). Halla las coordenadas en esa base del vector (4, –3, 6).
7.-
Las coordenadas de un vector v de R 3 respecto de la base B = {(1, 2, 0), (0, 2, 4), (1, 0, 4)} son (2, 2, 3). Halla las coordenadas de v en la base B ’ = { (2, 2, 0), (1, 0, 1), (3, 2, 0)}.
8.-
Calcula (AA + B ) . C y ( 2.AA – 3.BB ) . C , siendo:
9.-
2
Calcula A + B ¥ C siendo:
Ê Á A=Á Á Ë
1 2 3 0
0 1 2ˆ 1 0 1˜ 1 1 3˜ 1 0 1 ˜¯
Ê1 A=Á Ë3 Ê Á B=Á Á Ë
2 0
Ê2 1ˆ B=Á 2 ˜¯ Ë0
2 0 4 0
1 2ˆ 1 3˜ 1 0˜ 3 1 ˜¯
Ê 1 1 2ˆ Á 1 C = 1 3 ˜¯ Á0 Ë
Ê0 C=Á 1 Á2 Ë
3 2 0 1 1 5
0 2 1
2 5 0
-1 ˆ -4 ˜ 2 ˜¯
1ˆ 0˜ 1 ˜¯
Ê cos a -sen a 0 ˆ Á ˜ 1 0 . - Siendo A = Á sen a cos a 0 ˜ , calcula A 2 , A 3 , ... , A n. Á 0 0 1 ˜¯ Ë 1 1 . - Dada una matriz A , de orden mxn, sea A t su traspuesta (matriz de orden nxm cuyas filas son las columnas de A ) y llamemos traza de A a la suma de todos los elementos de la forma a ii . Sabido lo anterior, halla una matriz A , cuadrada de orden 2, tal que la traza de A ¥ A t sea cero. 1 2 . - Obtén las matrices A y B para las que se cumple:
Ê8 3ˆ 3A + 2B = Á ˜ Ë5 4¯
Ê 1 2ˆ ; 2A - 3B = Á ˜ Ë -1 -6 ¯
1 3 . - Halla la matriz X 2 + Y 2 sabiendo que X e Y verifican:
Ê 2 0ˆ Ê 1 -1 ˆ 5X + 3Y = Á ˜ ; 3 X + 2Y = Á -2 9 ˜ 4 15 Ë ¯ Ë ¯
1 4 . - Determina qué relaciones han de existir entre a, b, c y d para que se cumpla que A M = M A , siendo A y M las matrices: Ê0 A=Á Ë1 Ê 1 5 . - Sean A = Á a Ë a'
bˆ ; b'˜¯
Êa B=Á Ë a'
b b'
-1 ˆ 1 ˜¯
Êa M=Á Ë c
bˆ d ˜¯
cˆ , con rango A rango B . ¿Cuál es el valor de rango B – rango A ? c'˜¯
1 6 . - Una matriz cuadrada de orden 3 tiene de rango 3. ¿Cómo puede variar el rango si quitamos una columna? Si suprimimos una fila y una columna, ¿podemos asegurar que el rango de la matriz resultante será 2?
– 85 –
Matrices y determinantes 1 7 . - Sean A una matriz que tiene tres filas y B la matriz que resulta de sustituir en A la primera fila por la suma de las otras dos. ¿Qué debe ocurrir entre las filas de A para que A y B tengan el mismo rango? 1 8 . - Halla el rango de las siguientes matrices, por el método de Gauss:
Ê 1 2 Á2 4 Á6 5 Ë
0ˆ 3˜ 8 ˜¯
Ê2 Á4 Á6 Ë
3 2 -3
1 2 1 5 0 3
Ê Á Á Á Á Á Ë
5ˆ -3 ˜ 4 ˜¯
2 0 -1 3 3 2 8 -2 4 3 6 -4
-3 ˆ 0˜ 1˜ 2˜ 1 ˜˜ 2¯
Ê Á Á Á Á Á Ë
4 -5 -2 4 0 2 -2 5 -1 3 -8 13
1 3 2ˆ 1 -1 0 ˜ 2 4 6˜ 2 1 3˜ 0 -2 1 ˜˜ 1 -5 -2 ¯
1 9 . - Analiza si los vectores de (RR 4, +, .) : (6, 3, –3, 9), (0, 4, 2, 8), (3, 1, 0, –2), (5, 4, 0, 5) son linealmente independientes. Ê a b c ˆ Ê ˆ 2 0 . - Si rango Á a b c˜ = 2, ¿puede ser rango Á d - a e + b f + c˜ = 2? Á d Ëd e f¯ e f ˜¯ Ë Ê 2 2 0ˆ ˆ Ê 2 1 . - Dada las matrices A = Á 2 -1˜ ; B = Á 3 3 1˜, halla sus inversas y comprueba que las soluciones son correctas. Á 0 3 5˜ Ë4 3¯ Ë ¯ 2 2 . - Calcula los siguientes determinantes: 1 2 1 -3 -2 3 2 1 ; 3 -2 1 4 5 4 -3 2
2 2 4 5
3 0 5 1
1 3 6 2
5 1 2 4
;
x x2 y y2 z z2 w w2
1 1 1 b+ c c+ a a + b bc ac ab
;
1 1 1 1
1 1 1 x 1 x2 1 x3
1 x2 x4 x6
1 x3 =0 x6 x9
x3 y3 z3 w3
;
;
1 0 1 0
0 1 0 1
a 1 1 1
1 a 1 1
1 1 a 1
0 0 1 0
a 0 0 1
2 3 . - Resuelve las ecuaciones siguientes: 1- x 2 - x 3 - x 2- x 3 - x 4 - x = 0 ; 3- x 4- x 5- x 2 4 . - Expresa en forma de producto los determinantes siguientes: a a a a a
a b b b b
a b c c c
a b c d d
a b c d e
;
a2 b2 c2 a b c b+ c a + c a + b
;
2a 2a a - b- c 2b 2b b- c - a 2c 2c c - b- a
1 1 1 a
2 5 . - Calcula el valor de los determinantes de orden n siguientes: 1 1 1 L 1 L -1 a -1 -1 a L L L L L -1 -1 -1 L
1 1 1 1 a
;
n 1 1 L 1 n 2 1 L 1 n 1 3 L 1 L L L L L n 1 1 L n
;
1 n n L n n 2 n L n n n 3 L n L L L L L n n n L n
2 6 . - Si el determinante de A , matriz cuadrada de orden 5, vale 1, ¿qué valor tomará el determinante de la matriz 3.AA ? 2 7 . - Demuestra que si una matriz tiene inversa, ésta es única. 2 8 . - Demuestra que si una matriz cuadrada de orden n, A , verifica A 2 + 3.AA – 3.. I n = ( 0)) , donde ( 0)) es la matriz cuadrada de orden n todos cuyos términos son nulos, entonces dicha matriz tiene inversa. 2 9 . - Sea A una matriz cuadrada de orden n y sea I n la matriz unidad. Demuestra que si A 2 + 5.AA = I n, entonces A posee inversa.
– 86 –
Matrices y determinantes Ê 1 0 4ˆ 3 0 . - Averigua para qué valores del parámetro t la matriz A = Á 0 t 4 ˜ no tiene inversa. Después, halla la inversa de A para t = 1 Á -1 3 t ˜ Ë ¯ y compara el valor de los determinantes de ambas matrices. Ê 1 1 1ˆ 3 1 . - Averigua para qué valores del parámetro t la matriz A = Á t 2 t2 ˜ no tiene inversa. Después, halla la inversa de A para t = 3. Á ˜ Ë0 1 0 ¯ 3 2 . - Sean A y B dos matrices cuadradas de igual orden. Se sabe que las matrices M = A + B y N = A – B tienen inversa. Analiza si A y B han de tenerla también. (Si la respuesta es afirmativa, justifícala; en caso contrario, da un contraejemplo que lo confirme). 3 3 . - Comprueba si se verifica que A ¥ B = B ¥ A , siendo A y B las siguientes matrices: Ê 1 0ˆ Á 2 -1˜ Ê 1 3 0 -2ˆ A=Á ˜ B = Á 0 3˜ 2 2 1 4 Ë ¯ Á -1 1˜ ¯ Ë 3 4 . - Calcula el rango de las siguientes matrices, utilizando menores: Ê Á A=Á Á Ë
1 2 -1 0 1ˆ 4 3 2 -1 4 ˜ 3 1 3 -1 3 ˜ -2 -4 2 0 -2 ˜¯
Ê Á B=Á Á Ë
1 1 2 2
2 -1 1 1 3 0 3 1
0 4ˆ 1 -1 ˜ 1 3˜ 1 3 ˜¯
3 5 . - Halla el valor de x, sabiendo que las dos matrices siguientes tienen igual rango: Ê2 3 4ˆ A=Á 3 4 2 ˜ Á5 2 x˜ Ë ¯
Ê3 5 3 1 5ˆ B=Á 2 6 4 4 3 ˜ Á 2 -2 -2 -6 4 ˜ Ë ¯
3 6 . - Determina los valores de t para los que cada una de las siguientes matrices no admite inversa y halla, para tales valores de t, los correspondientes rangos de las matrices. Ê Á A=Á Á Ë
1 t 1 0
0 1 t 1
3 0 ˆ 1 1 ˜ 1 1 ˜ 2 -1 ˜¯
Ê Á B=Á Á Ë
0 0 t t
t 1 1 1
1 t 0 0
0ˆ 1˜ 0˜ t ˜¯
Êa 0 aˆ 3 7 . - Determina el rango máximo y el mínimo que puede tener una matriz de la forma: A = Á 0 1- a 0 ˜ Á 0 1 1˜ Ë ¯ 3 8 . - Los vectores de (RR 3, +, .): (2, 1, –3), (1, 3, 2), (5, x, –4) son linealmente dependientes. Halla el valor de x. 3 9 . - Analiza si para cualquier valor de x, los vectores de (RR 4, +, .): (1, 2, 3, 0), (x, 1, 0, 2), (2, 1, 1, 2), (4, 4, 5, 4) son linealmente dependientes. 4 0 . - Estudia si más de cuatro vectores de (RR 4, +, .) pueden ser linealmente independientes. 4 1 . - Estudia, según los valores de los parámetros, los rangos de las matrices: Ê a 1 1ˆ A=Á 1 a 1˜ Á1 1 a˜ Ë ¯ Ê m2 - 1 (m + 1)2 ˆ D=Á ˜ Ë m +1 m-1 ¯
Ê 2 1 -1 ˆ 1˜ B=Á 1 a Á 3 1 -a ˜ Ë ¯
Ê1 1 1 ˆ Á 1 ˜ C = 1 1+ a Á 1 1 1+ a ˜ Ë ¯
Ê m2 - 1 (m + 1)2 m + 1 ˆ E=Á ˜ Ë m +1 m-1 m +1¯
– 87 –
Ê a b 1ˆ F = Á 1 ab 1 ˜ Á1 b a˜ Ë ¯
Tema 6 Sistemas de ecuaciones lineales
Sistemas de ecuaciones lineales
1. INTRODUCCIÓN Llega el momento de empezar a dar utilidad a lo visto en el tema anterior. En éste vamos a estudiar cómo hay que proceder ante un sistema ecuaciones lineales para saber si tiene o no solución(es) y, en caso afirmativo, obtenerla(s). Ciertamente, para resolver un sistema de tres ecuaciones lineales con tres incógnitas, por ejemplo, no hacen falta grandes conocimientos teóricos y nos bastaría con las herramientas ya conocidas desde hace tiempo. Pero analizar y resolver sistemas de centenares e incluso miles de incógnitas, como hoy en día se hace en ciencias como la Astronáutica o la Economía, si los ordenadores que se encargan de ello no fueran programados de forma adecuada, sería tarea imposible. Aquí explicaremos el par de métodos en los que se basan tales programas. Como tenemos por norma, procuraremos simplificar al máximo todo lo que hagamos.
2. DEFINICIONES Y CLASIFICACIÓN Definiciones (vocabulario) ☞ Llamaremos sistema de m ecuaciones lineales con n incógnitas a un conjunto de m expresiones algebraicas de primer grado: a 11 x 1 + a 12 x2 + L + a 1 n x n = b 1 ¸ Ô a 21 x 1 + a 22 x 2 + L + a 2 n x n = b 2 Ô [S] L L L L LÔ a m 1 x 1 + a m 2 x 2 + L + a mn x n = b m Ô
donde a i j , b i son números reales fijos, llamados coeficientes y términos independientes, respectivamente, y x j números reales sin determinar, llamados incógnitas. En el caso particular en que b 1 = b 2 = ... = b m = 0, el sistema se llama homogéneo. ☞ Con el símbolo E i representaremos la ecuación:
a i 1 x 1 + a i 2 x 2 + L + a in x n = b i
☞ Si a Œ R , con la notación a . E i nos referiremos a:
(a a i 1)x 1 + (a a i 2)x 2 + L + (a a in )x n = (a b i )
☞ De las matrices: Ê Á Á A=Á Á Á Ë
a 11 a 12 a 13 L a 1 n ˆ ˜ a 21 a 22 a 23 L a 2 n ˜ L L L L L˜ ˜ a m 1 a m 2 a m 3 L a mn ˜¯
Ê Á Á A* = Á Á Á Ë
a 11 a 12 a 13 L a 1 n b 1 ˆ ˜ a 21 a 22 a 23 L a 2 n b 2 ˜ L L L L L L˜ ˜ a m 1 a m 2 a m 3 L a mn b m ˜¯
diremos que son la matriz de los coeficientes del sistema y la matriz ampliada con los términos independientes, respectivamente. Ê Á X=Á Á Á Ë
☞ Observa, por último, que escritas las matrices:
x1 ˆ ˜ x2 ˜ M ˜ x n ˜¯
Ê Á B=Á Á Á Ë
b1 ˆ ˜ b2 ˜ M ˜ bm ˜¯
el sistema [S] puede expresarse en forma matricial: A ¥ X=B
Otras definiciones (más vocabulario) ➫ Diremos que n números reales ( a 1 , a 2 , a 3 , L , a n ) constituyen una solución del sistema [S] si al sustituir x j por a j en los primeros miembros de todas las ecuaciones, cada uno de ellos toma como valor el del correspondiente término independiente ➫ Discutir un sistema consiste en averiguar si posee alguna solución y, en caso afirmativo, cuántas. ➫ Diremos que un sistema es compatible si tiene alguna solución. Como veremos, un sistema compatible en R o bien admite una solución única (diremos que es compatible determinado) o bien infinitas (se dice, en expresión no muy atinada, que es compatible indeterminado). Si un sistema no tiene solución, diremos que es incompatible. ➫ Resolver un sistema compatible es, como te puedes suponer, encontrar todas sus soluciones.
– 89 –
Sistemas de ecuaciones lineales
Definición (de sistemas equivalentes) ☞ De dos sistemas de ecuaciones lineales con el mismo número de incógnitas (aunque no tengan el mismo número de ecuaciones) se dice que son equivalentes si tienen las mismas soluciones; es decir, si toda solución del primero es solución del segundo y viceversa.
Teorema ☞ Si ( a 1 , a 2 , a 3 , L , a n ) es una solución del sistema [S], también lo es de cualquier ecuación que sea "combinación lineal" de las que forman dicho sistema. La demostración es muy sencilla: Supongamos formada la siguiente ecuación, combinación lineal de las de [S]): l 1(a11 x 1 + º + a1n x n ) + l 2 (a21 x 1 + º + a2 n x n ) + º + l m (am 1 x1 + º + amn x n ) = l 1 b1 + º + l m bm ; l i ŒRR Al sustituir x j por a j el primer paréntesis anterior tomará el valor b 1 ; el segundo, b 2 , ... y, el último, b m. Por consiguiente, ambos miembros de la igualdad coincidirán.
Teorema (paso de un sistema a otro equivalente) • Se obtiene un sistema de ecuaciones equivalente a otro dado si: 1
Se altera el orden de las ecuaciones.
2
Se prescinde de una ecuación que sea combinación lineal de otras.
3
Se sustituye una ecuación por la que resulta de multiplicarla por un número distnto de cero.
4
Se sustituye una ecuación por la que resulta de sumarle una combinación lineal de otras.
Las demostraciones son fáciles y las dejamos como ejercicio para quien desee efectuarlas.
3. REGLA DE CRAMER Definición (de sistemas de Cramer) • Llamaremos sistema de Cramer a todo sistema de n ecuaciones lineales con n incógnitas: a 11 x 1 + a 12 x2 + L + a 1 n x n = b 1 a 21x 1 + a 22 x 2 + L + a 2n x n = b2 L L L L L + a nn x n = bn a n1x 1 + a n2 x 2 +
¸ Ô Ô Ô Ô
en el que la matriz de los coeficientes, A , tenga determinante no nulo: |AA | 0 .
Teorema (de Cramer) Enunciado: El sistema de Cramer anterior es compatible determinado y su única solución es: Ê A A2 A3 An ˆ 1 Á ˜ , , , º , Á A A A A ˜¯ Ë donde A j representa la matriz obtenida al sustituir la columna j de la matriz de los coeficientes del sistema, A, por la formada por los términos independientes.
– 90 –
Sistemas de ecuaciones lineales Demostración: Con el objeto de simplificar la notación, vamos a efectuar la demostración para un sistema de Cramer de tres ecuaciones con tres incógnitas. El razonamiento en el caso general es conceptualmente idéntico al que nosotros seguiremos. Sea pues el sistema: a 11 x 1 + a 12 x2 + a 13 x3 = b 1 a 2 1 x 1 + a 2 2 x 2 + a 13 x3 = b 2 a 31x 1 + a 32 x 2 + a 33 x 3 = b3
¸ Ô [S] Ô
con a 11 a 12 a 13 A = a 21 a 22 a 23 0 a 31 a 32 a 33 Primer paso: ① En primer lugar, vamos a obtener unas ecuaciones, combinaciones lineales de las de [S], de las que hallaremos las soluciones. A tal efecto, multiplicando la primera ecuación de [S] por el adjunto del elemento a 11 de la matriz A , A 11 ; la segunda por A 2 1 , y la tercera por A 3 1 , y sumando posteriormente, se obtiene la ecuación E '1:
(a
11
= b1A
11
A
11
x1+ a + b2 A
12
x
21
2
+ a
+ b3 A
13
x
3
) + A (a 21
21
x1+ a
22
x
2
+ a
23
x
3
) + A (a 31
31
x1+ a
32
x
2
+ a
33
x
3
)=
31
Es decir:
(A
11 a 11 +
)
(
)
(
)
A 2 1 a 2 1 + A 3 1 a 3 1 x 1 + A 11 a 12 + A 2 1 a 2 2 + A 3 1 a 3 2 x 2 + A 11 a 13 + A 2 1 a 2 3 + A 3 1 a 3 3 x 3 =
= b 1 A 11 + b 2 A 2 1 + b 3 A 3 1 En la ecuación anterior, el primer paréntesis es el desarrollo por la primera columna del determinante de A , mientras que el segundo y tercer paréntesis contienen la suma de los productos de los elementos de una columna de A por los adjuntos de otra columna, sumas nulas en virtud de la propiedad 9ª de los determinantes. En cuanto al segundo miembro, sería el desarrollo por la primera columna de la matriz, A 1 , obtenida sustituyendo la primera columna de A por la formada por los términos independientes del sistema. Resulta, pues, la ecuación: E '1 :
A . x 1 + 0. x 2 + 0 . x 3 = A 1
Observemos que cualquier solución (a 1 , a 2 , a 3 ) de E ' 1 ha de verificar: a 1 =
A1 A
, cualesquiera que sean a 2 , a 3 .
② Si en lugar de multiplicar las ecuaciones del sistema [S] por los adjuntos de los elementos de la primera columna de A lo hubiéramos hecho por los adjuntos de los elementos de la segunda columna de A, habríamos llegado a la ecuación: E '2 :
0. x 1 + A . x 2 + 0 . x 3 = A 2
(en la que A 2 es la matriz obtenida sustituyendo la segunda columna de A por la formada por los términos independientes). Toda solución (a 1 , a 2 , a 3 ) de esa ecuación habría de verificar: a 2 =
A2 A
, cualesquiera que fueran a 1 , a 3 .
➂ Multiplicando finalmente las ecuaciones de[S] por los adjuntos de los elementos de la tercera columna de A y sumando, llegaríamos a la ecuación: E '3 :
0. x 1 + 0. x 2 + A . x 3 = A 3
(no necesitamos explicar qué es A 3 ) de la que toda solución (a 1 , a 2 , a 3 ) habría de verificar: a 3 = fueran a 1 , a 2 .
– 91 –
A3 A
, cualesquiera que
Sistemas de ecuaciones lineales Segundo paso: Como consecuencia de todo lo anterior y de que toda solución de [S], si es que existe, ha de serlo de E ' 1 , E ' 2 , E ' 3 (pues son combinación lineal de las que forman [S]), resulta que la única solución que, en todo caso, podrá tener [S] es: Ê (a 1 , a 2 , a 3 ) = Á Á Ë
A1 A
A2
,
A3
,
A
A
ˆ ˜ ˜ ¯
pues ésta es la única “terna” (a 1 , a 2 , a 3 ) que cumple las condiciones requeridas. Tercer paso: Así pues, si [S] posee solución, es única y sólo puede ser la anterior. Pero, ¿cómo confirmar que, efectivamente, es solución de Aj
[S]? Pues comprobando que al sustituir en las tres ecuaciones x j por
A
los dos miembros de cada ecuación toman el mismo valor. 3
Aj
Sustituyendo, pues, en cada ecuación E i cada x j por
a i1a 1 + a i2 a 2 + a i3 a 3 =
1 A
[b (a 1
i 1 A 11
=
A
 bh Ahj
, o sea, por
h=1
, resulta:
A
3 3 3 1 È Ía i 1 Â b h A h 1 + a i 2 Â b h A h 2 + a i 3 Â b h A h 3 = A Î h=1 h=1 h=1
)
(
)
(
+ a i 2 A 12 + a i 3 A 13 + b 2 a i 1 A 2 1 + a i 2 A 2 2 + a i 3 A 2 3 + b 3 a i 1 A 3 1 + a i 2 A 3 2 + a i 3 A 3 3
)]
Observemos los paréntesis que aparecen en la igualdad anterior: Si i = 1, el primero de ellos es A y los demás son cero; el valor del segundo miembro de la igualdad sería Si i = 2, el segundo de ellos es A y los demás son cero; el valor del segundo miembro de la igualdad sería Si i = 3, el tercero de ellos es A y los demás son cero; el valor del segundo miembro de la igualdad sería
1 A 1 A 1 A
En resumen: que, efectivamente, para i = 1, 2 ó 3, se tendría: a i 1 a 1 + a i 2 a 2 + a i 3 a 3 = b i Ê E n c o n c l u s i ó n : (a 1 , a 2 , a 3 ) = Á Á Ë
A1 A
A2
,
A
,
A3 A
ˆ ˜ es la única solución del sistema [S]. ˜ ¯
Ejemplo 2x + 3y + z = 5 3 x - y + 5z = 20 5 x + y - 6z = 2
Supongamos que se desea resolver el sistema:
Como A =
2 3 5
3 -1 1
x=
5 20 2
¸ Ô Ô
1 5 = 139 0, se tratará de un sistema de Cramer, luego: -6 3 -1 1 139
1 5 -6
=3 y =
2 3 5
5 1 2 20 5 3 2 -6 5 = -1 z = 139
– 92 –
3 5 -1 20 1 2 =2 139
b1 A = b1 b2 A = b2 b3 A = b3
Sistemas de ecuaciones lineales Observación En general, nada obliga a que un sistema de ecuaciones lineales haya de tener necesariamente igual número de ecuaciones que de incógnitas; o, incluso, aunque así ocurra, la matriz de los coeficientes puede tener determinante nulo y la regla de Cramer será, al menos en principio, inaplicable. A estudiar cómo proceder en tales casos es a lo que dedicaremos el siguiente apartado.
4. TEOREMA DE ROUCHÉ-FRÖBENIUS Enunciado: Dado el sistema: a 11 x 1 + a 12 x2 a 21 x 1 + a 22 x 2 L L a m1 x 1 + a m2 x 2
+ L + a 1n x n + L + a 2n x n L L + L + a mn x n
b1 b2 L = bm = =
¸ Ô Ô [S] Ô Ô
y consideradas las matrices A, de los coeficientes, y A *, ampliada con los términos independientes, se verifica: 1)
[S] es compatible ¤ rango A = rango A *
2)
ÏÔ < n [S] es compatible indeterminado rango A = rango A * Ì ÔÓ = n [S] es compatible determinado
Demostración: Primera parte: Supongamos que el sistema [S] fuera compatible. Eso significa que existirían números reales ( a 1 , a 2 , L , a n ) tales que: È a 11 È a 12 È a 1n È b 1 Í Í Í Í Í a 21 Í a 22 Í a 2n Í b 2 a 1 Í + a 2 Í +L + a n Í = Í M M M M Í Í Í Í ÍÎa m 1 ÍÎa m 2 ÍÎa mn ÍÎb m luego la última columna de A * sería combinación lineal de las restantes y aunque se prescindiera de ella, quedándonos entonces la matriz A , el rango no se modificaría; es decir, rango A * = rango A . Segunda parte: Supongamos ahora que rango A = rango A * = r. Eso significa que en A existe al menos un menor de orden r no nulo y que no hay ninguno de orden superior a r ni en A ni en A * que sea distinto de cero. Además, podemos suponer que uno de tales menores de orden r no nulos es el formado por los elementos comunes a las r primeras filas y r primeras columnas de A, pues si no fuera así, un cambio en el orden de las ecuaciones y/o en el de las incógnitas, permitiría suponerlo: a 13 L a 1 r a 21 a 22 a 23 L a 2 r 0 L L L L L a r1 a r2 a r3 L a rr a 11 a 12
Entonces, el sistema [S] será equivalente al:
– 93 –
Sistemas de ecuaciones lineales a 11 x 1 + a 12 x2 a 21 x 1 + a 22 x 2 L L a r1x 1 + a r2 x 2
+ L + a 1n x n + L + a 2n x n L L + L + a rn x n
= b1 ¸ Ô = b2 Ô [ S'] LÔ = b r Ô
obtenido suprimiendo, si es que existían, las (m–r) últimas ecuaciones de [S], ya que al ser las (m–r) últimas filas de A * combinación lineal de las r primeras, dichas últimas ecuaciones también lo serán de las r primeras de [S]. Considerado, pues, ese nuevo sistema [S’], pueden presentarse dos posibilidades: 1 Q u e r = n . Entonces, [S’] es de Cramer y tendrá solución única. [S], equivalente a [S’], será compatible determinado. 2 Q u e r < n . Dejando, entonces, en los primeros miembros de [S’] las r primeras incógnitas (principales) y pasando a los segundos miembros las (n–r) restantes (auxiliares), el sistema quedaría así: a 11 x 1 + a 12 x2 a 21 x 1 + a 22 x 2 L L
+ L + a 1r x r + L + a 2r x r L L
a r1x 1 + a r2 x 2
+ L + a rr x r
= b 1 - a 1, r +1 x r +1 - L - a 1 n x n = b 2 - a 2 , r + 1 x r +1 - L - a 2 n x n L = b r - a r , r +1 x r + 1 - L - a r n x n
¸ Ô Ô [ S'] Ô Ô
Este sistema, cualesquiera que fueran los valores que diéramos a x r +1 , x r +2 ,L , x n , sería en un sistema de Cramer, luego podríamos obtener los correspondientes valores para x 1 , x 2 , L , x r que, junto a los dados a x r +1 , x r +2 ,L , x n , constituirían una solución de [S]. Como a las incógnitas auxiliares les podemos dar tantos valores como queramos, y en cada caso obtendríamos los correspondientes valores de las incógnitas principales, el sistema tendrá infinitas soluciones. Será compatible indeterminado.
Ejemplos 1
Supongamos que se desea discutir y, en su caso, resolver, el sistema: 2x 3x 5x 3x
+ y + 2y - 2y - y
= 4¸ = 7 ÔÔ = 1Ô = 1 Ô
- z + z + 2z - 7z
En primer lugar, procederemos a calcular los rangos de las matrices: Ê2 1 -1 ˆ Á3 2 1˜ A=Á 5 -2 2 ˜ Á 3 -1 -7 ˜ ¯ Ë Como
Ê2 1 -1 Á3 2 1 A* = Á 5 -2 2 Á 3 -1 -7 Ë
4ˆ 7˜ 1˜ 1 ˜¯
2 1 0 , si orlamos ese menor de orden dos de la matriz A con la tercera fila, nos encontramos con que el menor de 3 2
orden tres correspondiente a las tres primeras filas de A es distinto de cero:
2 1 -1 3 2 1 = 27 0 , luego rango A = 3. 5 -2 2
Partiendo en A * del menor anterior de orden 3 no nulo, para ver si el rango de A * es 3 ó 4, consideramos el único menor que se puede formar orlando el anterior con la cuarta fila y vemos que: 2 1 -1 3 2 1 5 -2 2 3 -1 -7
4 7 = 0, 1 1
En consecuencia, la cuarta fila de A * es combinación lineal de las tres primeras y, si en el sistema prescindimos de la última ecuación, el nuevo sistema:
– 94 –
Sistemas de ecuaciones lineales 2x + y - z = 4 ¸ Ô 3 x + 2y + z = 7 5 x - 2y + 2z = 1 Ô
en el que la matriz de los coeficientes y la ampliada tienen rango igual a 3, sería equivalente al inicial y, ambos, compatibles determinados. Bastaría aplicar la regla de Cramer para obtener su única solución: x = 1; y = 2; z = 0.
2
Supongamos dado el sistema: 2x + 3y - 5z = 7 ¸ Ô 3 x - y + 2z = 9 4 x - 5y + 9z = 11 Ô
Como
2 3 = -11 0 ; 3 -1
2 3 -5 3 -1 2 = 0 el rango de A es 2. 4 -5 9
2 3 ya hemos visto que es nulo, nos 3 -1 fijamos en el único que podría hacer, si fuera no nulo, que el rango de A * fuese 3. Pero como sucede que: Para calcular el rango de A *, y dado que el primer menor que se obtendría orlando
2 3 7 3 -1 9 = 0 4 -5 11 la tercera fila de A * será combinación lineal de las dos primeras (así como la tercera ecuación lo será de las otras dos) y se tendrá que rangoAA =rangoAA*=2. El sistema, compatible indeterminado en virtud del teorema de Rouché-Fröbenius, será equivalente a este otro: 2x + 3y - 5z = 7 ¸ 3 x - y + 2z = 9
2 3 0 , tomaremos como incógnitas principales x, y, considerando la z como auxiliar. Escribiendo: 3 -1 2x + 3y = 7 + 5z ¸ 3 x - y = 9 - 2z
y aplicando la regla de Cramer, se tendría: Para resolverlo, ya que
x=
7 + 5z 3 9 - 2z -1 -11
=
34 - z 11
; y=
2 7 + 5z 3 9 - 2z -11
=
3 + 19z 11
En resumen, las infinitas soluciones del sistema formarían el conjunto: Ï Ê 34 - z 3 + 19z ˆ ¸ ÌÁ , , z ˜ / z ŒR 11 ¯ Ó Ë 11
3
Por último, el sistema: 2x + 3y - z = 2 ¸ Ô 3 x + y + 2z = 4 x - 9y + 10z = 1 Ô
es incompatible, pues: Ê 2 3 -1 2 ˆ Ê 2 3 -1 ˆ ˜ Á ˜ Á rango A = rango Á 3 1 2 ˜ = 2 ; rango A* = rango Á 3 1 2 4 ˜ = 3 Á 1 -9 10 1 ˜ Á 1 -9 10 ˜ ¯ Ë ¯ Ë
– 95 –
Sistemas de ecuaciones lineales
Sistemas homogéneos Como un sistema homogéneo tiene todos los términos independientes nulos, la última columna de A * estará formada exclusivamente por ceros y, en consecuencia, rango A = rango A *. La única duda, pues, en un sistema homogéneo es la referente a si tendrá solución única o infinitas soluciones. Si rango A = rango A* = n (número de incógnitas), la única solución será la trivial, es decir, x 1 = x 2 = L = x n = 0 . Si rango A = rango A * < n, se procederá como hemos visto en el segundo ejemplo anterior, expresando las r incógnitas principales en función de las (n–r) restantes.
Ejemplos 2x + y - z = 0 ¸ Ô 3 x - y + 2z = 0 x + 3y + 3z = 0 Ô
1 Dado el sistema homogéneo:
2 1 -1 A = 3 -1 2 0 1 3 3
se verifica:
luego rango A = 3 (número de incógnitas) y, en consecuencia, la única solución será la trivial: x = 0, y = 0, z = 0.
2 El sistema:
2x 3x x -x
tiene infinitas soluciones, que forman el conjunto:
+ y - y + 2y + 3y
- 5z + t - 5z - 6 t - 4z + 5 t - z + 10 t
= = = =
0¸ Ô 0Ô 0Ô 0 Ô
{(2z + t , z - 3t, z, t) / z, t ŒR}
5. MÉTODO DE GAUSS Observación La regla de Cramer puede ser útil para resolver sistemas en los que el número de ecuaciones y/o incógnitas sea dos, tres o, a lo sumo, cuatro. Pero para valores superiores su aplicación es poco recomendable, por la cantidad de determinantes de orden elevado que hay que calcular. Buena parte de esos inconveninetes se obvian con el llamado método de Gauss, o de los pivotes, que tiene entre otras ventajas, como habíamos anunciado, la de ser fácilmente programable para que un ordenador lo aplique. Dicho método, como ya sabes desde el curso pasado, consiste en la aplicación reiterada al sistema que se trate de resolver de transformaciones “lineales”, hasta que se llega a otro sistema equivalente, “triangular”, pero lo más sencillo posible; por otra parte, como lo que realmente caracteriza a un sistema son sus coeficientes y términos independientes, y no las letras con las que representemos las incógnitas, se trabaja directamente con la matriz ampliada. El método de Gauss, en resumen, consiste en transformar la matriz del sistema inicial en otra que tenga nulos todos los elementos situados por debajo de la diagonal principal, es decir, todos los elementos a i j en los que i > j. Se trata de algo semejante a lo que hacíamos para calcular el rango de una matriz. Entenderás mejor cómo se aplica tal metodo estudiando los siguientes ejemplos, correspondientes a los tres casos posibles.
Primer ejemplo
Discutir y resolver el sistema:
2x x 3x 5x
+ y - 2y + 2y - y
+ z + z - 3z + z
El esquema de la discusión-resolución es:
– 96 –
+ t + 2t - t + 4t
= 7¸ Ô = 1Ô = 0Ô = 8 Ô
Sistemas de ecuaciones lineales Ê2 1 1 1 Á 1 2 1 2 Á Á 3 2 -3 -1 Á Ë 5 -1 1 4 Ê Á 3 æ æÆ Á Á Á Ë
Ê2 Ê 1 1 1 7ˆ 7ˆ ˜ Á ˜ Á 1 3 -5 ˜ 2 Á 1 ˜ 1 Á 0 -5 æ æÆ Æ Á0 Á 1 -9 -5 -21 ˜ 0˜ ˜ Á ˜ Á 0 7 3 3 19 8¯ Ë ¯ Ë 2 1 1 1 7ˆ ˜ 0 -5 1 3 -5 ˜ 4 æ æÆ 0 0 22 11 55 ˜ ˜ 0 0 11 3 30 ¯
Ê Á Á Á Á Ë
2 1 1 1 7ˆ ˜ 0 -5 1 3 -5 ˜ 0 0 44 22 110 ˜ ˜ 0 0 22 6 60 ¯
2 1 1 1 7ˆ ˜ 0 -5 1 3 -5 ˜ 0 0 22 11 55 ˜ ˜ 0 0 0 -55 55 ¯
(1) A la segunda fila multiplicada por 2 se le resta la primera, a la tercera multiplicada por 2 se le resta la primera multiplicada por 3 y a la cuarta fila multiplicada por 2 se le resta la primera multiplicada por 5.
(2) A la tercera fila multiplicada por –5 le restamos la segunda y a la cuarta fila, multiplicada por –5, le restamos la segunda multiplicada por –7.
(3) Dividimos la tercera y la cuarta fila entre 2.
(4) Multiplicamos la cuarta fila por 22 y le restamos la tercera multiplicada por 11.
Por lo tanto, el sistema dado es equivalente al: 2x + y + - 5y +
= 7 ¸ Ô = -5 Ô 22z + 11 t = 55 Ô - 55 t = 55 Ô
z z
+ t + 3t
que se resuelve empezando por la última ecuación, de la que se obtiene: t = –1; llevando después ese valor a la tercera: z = 3; llevando ambos valores a la segunda: y = 1; finalmente, sustituyendo en la primera: x = 2. El sistema, por tanto, es compatible determinado.
Segundo ejemplo Discutir y resolver el sistema:
2x + 3y - z = 17 ¸ Ô x - 2y + 3z = -2 4 x - y + 5z = 13 Ô
El esquema de la discusión-resolución es: Ê 2 3 -1 17 ˆ Ê 2 3 -1 17 ˆ Ê 2 3 -1 17 ˆ ˜ Ê 2 3 -1 17 ˆ ˜ Á ˜ Á Á Á 1 -2 3 -2 ˜ Æ Á 0 -7 7 -21 ˜ Æ Á 0 -7 7 -21 ˜ Æ Á 0 -1 1 -3 ˜ Ë ¯ Á 4 -1 5 13 ˜ Á 0 -14 14 42 ˜ Á 0 0 0 0 ˜¯ ¯ Ë ¯ Ë Ë (En el último paso se ha simplificado la segunda fila, dividiendo entre –7, y se ha prescindido de la tercera fila, por corresponder a la ecuación 0 x + 0 y + 0 z = 0, que, además de ser combinación lineal de las anteriores, se verifica para cualquier valor de las incógnitas.) Por tanto, el sistema inicial es equivalente al: 2x + 3y - z = 17 ¸ - y + z = -3
cuyas soluciones, y = 3 + z, x = 4 – z, forman el conjunto: { ( 4 – z, 3 + z, z) / z Œ R }. (En otras palabras, que si, por ejemplo, hacemos z = 2, los valores x = 2, y = 5, z = 2 son una solución; si tomamos z = 1, los valores x = 3, y = 4, z = 1 también son solución, y así tantas veces como queramos.) El sistema, al tener infinitas soluciones, es compatible indeterminado.
– 97 –
Sistemas de ecuaciones lineales
Tercer ejemplo 2x 3x 4x x
Discutir y resolver el sistema:
+ y - y - 3y + 3y
+ + + +
3z 4z 5z 2z
= 8 ¸ Ô = 11 Ô = 3 Ô = 5 Ô
El esquema es: Ê2 1 Á Á 3 -1 Á 4 -3 ÁÁ Ë1 3
8 ˆ Ê ˜ Á 4 11 ˜ Á Æ 5 3 ˜ Á ˜ Á 2 5 ˜¯ ÁË 3
8 ˆ Ê ˜ Á 0 -5 -1 -2 ˜ Á Æ 0 -10 -2 -26 ˜ Á ˜ Á 0 -5 -1 -2 ˜¯ ÁË 2
1
3
8 ˆ ˜ Ê2 1 3 8ˆ 0 5 1 2 ˜ Á ˜ ÆÁ0 5 1 2˜ ˜ 0 5 1 13 ˜ ÁË 0 0 0 11 ˜¯ 0 5 1 2 ˜¯ 2 1 3
Por tanto, el sistema dado es incompatible, pues es equivalente al siguiente, cuya última ecuación carece de solución: 2x 0x 0x
+ y + 5y + 0y
+ 3z + z + 0z
– 98 –
= 8 ¸ Ô = 2 Ô = 11
Sistemas de ecuaciones lineales
6. EJERCICIOS 1.-
Discute, aplicando el teorema de Rouché-Fröbenius y, en su caso, resuelve por la regla de Cramer, los sistemas: 3 x + 2y + z = 0 ¸ Ô x - y + 2z = 2 4 x + y + 3z = 5 Ô
x x 2x 3x
+ + + -
y 2y y y
+ -
z z z 2z
= = = =
1¸ Ô 2Ô 3Ô 5 Ô
x - y + z = 1¸ Ô x + y + z = 5 2x - y + 3z = 5 Ô
x - 2y - z + w = -2 ¸ Ô x + y + 2z - w = 3 Ô x + y + w = 9Ô x + z = 3 Ô
Ê -3 ˆ Ê 4ˆ Ê 2 0 5ˆ Ê x ˆ Á ˜ Á ˜ ˜Á ˜ Á Á 1 1 -2˜ Á y ˜ + Á 1 ˜ = Á -1˜ Á -1 1 1˜ Á z ˜ Á 2˜ Á 1˜ ¯Ë ¯ Ë Ë ¯ Ë ¯
3 x + 2y + z = 0 ¸ Ô x - y + 2z = 2 4 x + y + 3z = 2 Ô
x + y x x 3x + y
- 3z - z + z - 2w - 3z - 2w
= = = =
0¸ Ô 0Ô 0Ô 0 Ô
Ê 4ˆ Ê 6 9 3ˆ Ê x ˆ Á ˜ ˜Á ˜ Á Á 5 3 3˜ Á y ˜ = Á 0˜ Á 3 0 2˜ Á z ˜ Á 1˜ ¯Ë ¯ Ë Ë ¯
2.-
Se va a confeccionar una dieta con tres clases de alimentos: A, B y C. El alimento A tiene 10 calorías por cada 100 gramos, el B 30 calorías por cada 100 gr y el C 40 calorias por cada 100 gr. La dieta consta de G gramos de alimento por día, está restringida a exactamente 800 calorías y la cantidad que debe ingerirse de alimento A ha de ser doble que la de C. Halla en función de G las cantidades que deben ingerirse de cada uno de los alimentos y calcula después los valores entre los que ha de estar comprendido G para que las condiciones exigidas a la dieta puedan cumplirse.
3.-
La tabla adjunta muestra el número de unidades/gramo de vitaminas A, B y C que posee por unidad de peso cada uno de los productos P, Q, R y S: P
A
B
C
1
2
0
Q
1
0
2
R
2
1
0
S
1
1
1
a ) Analíza si se pueden elaborar dietas en las que entren todos los productos y que contengan 20 unidades de vitamina A, 25 de vitamina B y 6 de vitamina C. ¿Cuántas hay? b ) En función de la cantidad del producto Q que entra en la dieta, obtén las cantidades de los otros productos. ¿Entre qué valores habría de estar la cantidad de producto Q? 4.-
¿Puede ser compatible indeterminado un sistema de dos ecuaciones lineales con cuatro incógnitas? Pon algún ejemplo.
5.-
En un sistema de cuatro ecuaciones con tres incógnitas la matriz del sistema tiene un menor de orden 2 distinto de cero y todos los menores de orden 3 nulos, mientras que la matriz ampliada tiene un menor de orden 3 distinto de cero. Halla el determinante de la matriz ampliada. ¿Cuál es el rango de ambas matrices? ¿Tiene solución el sistema?
6.-
La matriz ampliada de cierto sistema de tres ecuaciones lineales con tres incógnitas tiene de rango 3. ¿Puede asegurarse que el sistema es compatible?
7.-
Dos sistemas de dos ecuaciones con dos incógnitas sólo se distinguen en los términos independientes. Si el primero es compatible indeterminado, ¿puede ser el segundo compatible determinado?
8.
Se consideran un sistema S , compatible determinado, de m ecuaciones lineales con n incógnitas y S ’ , sistema que resulta de prescindir en S de la última ecuación. a ) ¿Puede ser incompatible el sistema S ’ ? b ) ¿Es compatible el sistema S ’? c ) ¿Ha de ser compatible indeterminado el sistema S ’ ?
– 99 –
Sistemas de ecuaciones lineales 9.-
Halla los valores de m que hacen compatibles cada uno de los siguientes sistemas y resuélvelos en esos casos : 2x 4x 3x mx
4x + m y + z = m + 2 ¸ Ô mx + y - z = 0 x + 3y + z = 0 Ô
4x + m y + z = m + 2 ¸ Ô x + y + m z = -2(m + 1) Ô m 4x + y + z =
+ +
3y 5y 4y 5y
- z + 6z + 3z - 3z
= 5¸ Ô = -7 Ô = -9 Ô = 7 Ô
1¸ Ô m Ô y + m z = m2
mx + y + x + my + x +
z = z =
Ê 3ˆ Ê 3ˆ Ê m 1ˆ ˜ Ê xˆ Á ˜ Á ˜ Á Á 1 -1˜ ¥ Á y ˜ + Á -1˜ z = Á 0 ˜ Á 5 -3 ˜ Ë ¯ Á 2˜ Á 6 ˜ ¯ Ë ¯ Ë ¯ Ë
(m2 - 1) x - (m + 1)2 y = m + 1 ¸Ô (m + 1) x + (m - 1) y = m + 1 Ô
1 0 . - Discute, aplicando el teorema de Rouché-Fröbenius, los siguientes sistemas:
a x + by + z = 1 ¸ Ô x + aby + z = b x + by + az = 1 Ô
2x + y - z = a ¸ Ô x + my + z = b 3 x + y - m z = c Ô
m x + 2y = 2 ¸ Ô 2x + my = m x - y = -1 Ô
3 x - 2y + z = m ¸ Ô 5x - 8 y + 9 z = 3 2 x + y - 3 z = -1 Ô
2x + y - z = -1 ¸ Ô x - 2y + 2 z = m 3 x - y + m z = 4 Ô
x + y + z = a - 1¸ Ô 2x + y + az = a 1 Ô
x + ay + z =
1 1 . - Se tiene el siguiente sistema de ecuaciones, en el que las incógnitas son x, y, z:
ay + bx = c ¸ Ô cx + ay = b bz + cy = a Ô
Halla la solución sabiendo que es única. Ï a x + b y = c a1 a2 a3 1 1 Ô 1 1 2 . - Se consideran el siguiente sistema de ecuaciones y el siguiente determinante: S Ì a 2 x + b 2 y = c 2 D b 1 b 2 b 3 Ô c1 c2 c3 Ó a 3 x + b3 y = c 3 a ) Si S es compatible, ¿se verifica entonces que D = 0? b ) Si D = 0, ¿se verifica entonces que S es compatible?
( )
( )
1 3 . - Sean A = a i j una matriz cuadrada de orden 3 y X = x i j su inversa que , como sabemos, si existe, es única. Habrá de verificarse: A ¥ X = I3 , igualdad que da lugar a tres sistemas de ecuaciones lineales, cada una de ellas con tres incógnitas. Pues bien, determina una condición necesaria y suficiente para que dichos sistemas sean compatibles determinados y resuélvelos. Comprueba que la matriz obtenida coincide con la que se conocía desde el tema anterior. Ê x1 ˆ Ê 1ˆ Ê 1 2 0ˆ 1 4 . - Se considera el sistema: A . X = B , donde: A = Á 2 1 3 ˜ X = ÁÁ x 2 ˜˜ B = Á-4 ˜ . Halla la matriz inversa de A , A –1, y después Á 1˜ Á3 3 1˜ Áx ˜ Ë ¯ Ë ¯ Ë 3¯ resuelve el sistema observando que: A ¥ X = B A -1 ¥ (A ¥ X ) = A -1 ¥ B ( A -1 ¥A ) ¥ X = A -1 ¥ B I3 ¥ X = A -1 ¥ B X = A -1 ¥ B 1 5 . - Estudia y resuelve en caso de compatibilidad, por el método de Gauss, los sistemas:
x 2y + z = 0 ¸ Ô 3x 2x + 9y + 8z = 1 5x -6 x + 2y + z = -5 Ô
-2x
+ + + -
y 2y 3y y
+ + +
z z 4z 5z
= = = =
1¸ Ô 1Ô 2Ô 6 Ô
2x 5x 3x 5x 8x 3x 4x
+ + + + -
3y 2y y y 5y 4y 3y
– 100 –
+ + + + + -
5z z 5z 4z 13z 8z z
= = = = = = =
4 ¸ Ô -1 Ô -5 Ô Ô 2 0 Ô Ô -2 Ô 11 Ô
2x x 4x x 2x
-
5y 2y 13y 4y 5y
+ + + + +
4z z 16z 6z 4z
+ + + +
v v 5v 2v v
+ + + -
w 5w w w w
= -3 = 5 = 23 = 10 = 3
¸ Ô Ô Ô Ô
Tema 7 El espacio afín
El espacio afín
1. INTRODUCCIÓN En cursos anteriores hemos estudiado geometría del plano. Los elementos con los que trabajábamos, recuerda, eran puntos y rectas. Este año vamos a dar un pequeño avance: nos moveremos en el espacio, y en él manejaremos no sólo puntos y rectas, sino puntos, rectas... y planos. El método que seguiremos no diferirá mucho del que ya conoces de primero de bachillerato, pues allí establecimos las bases teóricas que nos van a permitir, ahora, progresar en nuestro estudio. Iniciaremos este capítulo hablando de vectores fijos y libres; veremos después distintas ecuaciones de la recta y el plano y terminaremos estudiando los que se han dado en llamar problemas de incidencia, o sea, problemas de paralelismo, intersecciones... En el capítulo próximo, con el producto escalar, trataremos las cuestiones métricas, es decir, aquellas relativas a perpendicularidad, medida de ángulos y distancias, y daremos unas definiciones que nos permitirán multiplicar vectores, además de escalarmente, de otras formas; formas útiles para trabajar no sólo en matemáticas, sino también y especialmente en física. Recuerda lo que decía Platón -¿era él?- respecto al ingreso en su Academia: "¡Que no entre aquí nadie que no sepa Geometría!". Podríamos parafrasearle, diciendo: ¡Que no salga nadie de aquí sin saber Geometría!
2. VECTORES EN EL ESPACIO Cuestión previa Piensa en un punto en el espacio... en una recta... en un plano... ¿Has sido capaz de imaginarlos? Podemos suponer, pues, que los conceptos de punto, recta, plano y espacio son intuitivos y, por consiguiente, los utilizaremos en lo que sigue sin necesidad de definirlos previamente.
Definición (de vector fijo) B
Llamaremos vector fijo a un par ordenado (A,B) de puntos del espacio ordinario, E, no excluyendo la posibilidad de que ambos sean coincidentes, caso en el que hablaremos de vector nulo. Con el símbolo A B designaremos el vector definido por los puntos A y B, en ese orden, y diremos que el vector A B tiene por origen A y extremo B.
A
Observa que el vector AB está definido exclusivamente por los puntos A y B. Dibujar la flecha obedece a la necesidad de indicar, en la figura, un orden.
Definición (relación de equipolencia) Con objeto de establecer una relación entre vectores fijos, consideremos los siguientes casos: Primer caso
Segundo caso
Tercer caso B
CD
A
B
C
D
D
A AB
E
F
C En los tres casos aparecen los vectores A B y C D . En el último, aparece además un tercer vector, el E F . ➠ En el primer caso, los vectores A B y C D son nulos, es decir, A = B y C = D. ➠ En el segundo caso, en el que los puntos A, B, C y D no están alineados, la figura ABDC (¡Atención al orden de los vértices!) es un paralelogramo.
– 102 –
El espacio afín ➠ En el tercer caso, en el que los puntos A, B, C y D están alineados, existe otro vector E F tal que las figuras ABFE, CDFE son paralelogramos. ☞ Pues bien, cuando ocurra uno cualquiera de los tres casos anteriores, diremos que los vectores fijos A B y C D son equipolentes y escribiremos A B ª C D .
Definiciones (de vector libre y V 3) Aunque sea en el "plano" de un papel, dibuja un vector fijo A B ... Ahora, dibuja cuatro vectores equipolentes a él... ¿Hay más? ¿Cuántos? Al conjunto formado por todos ellos le vamos a llamar vector libre. Es decir: ☞ Dado un vector fijo A B , llamaremos vector libre [AA B ] al conjunto de todos los vectores fijos equipolentes a él: [AAB] = { XY / XY ª AB } Cuando no haya posibilidad de error, escribiremos A B en lugar de [AA B ] y utilizaremos los símbolos a , b , c ... para designar vectores libres cualesquiera. En particular, designaremos por 0 el vector libre nulo, es decir, el formado por todos los vectores fijos nulos. Para mostrar en las figuras un vector libre dibujaremos uno cualquiera de sus representantes o vectores fijos equipolentes que lo formen. ☞ Con el símbolo V3 designaremos el conjunto de todos los vectores libres del espacio, conjunto de gran importancia en matemáticas y en física. En él se dio origen al concepto de espacio vectorial y debido a ello los elementos de cualquier conjunto que esté dotado de esa estructura reciben el nombre de vectores, sean dichos elementos polinomios, funciones o lo que sea, siempre que el conjunto tenga estructura de espacio vectorial.
3. EL ESPACIO VECTORIAL V3 Establecidos los vectores libres, definiremos algunas operaciones entre ellos. Antes, necesitamos un sencillo teorema.
Teorema ➠ Fijado un punto O del espacio, es posible encontrar para todo vector libre [AAB] un único representante de origen O. La demostración es sencilla. Fijado el punto O, la situación de los puntos A y B puede ser una de las siguientes: Primer caso
Segundo caso
Tercer caso B
A
AB
B
O
A O O Entonces, el único representante de [AAB] con origen en O sería en cada caso el que se indica a continuación: Primer caso
Segundo caso
Tercer caso B
AB
A
X
A OX O
– 103 –
B
O
X
El espacio afín
Definición (de suma de vectores libres) Estamos ahora en condiciones de definir una operación entre vectores libres a la que, convencionalmente, llamaremos suma. A tal fin, sean a y b dos vectores libres del espacio. Como se ve en la figura siguiente, tomado un punto cualquiera, O, existirá un único punto A tal que O A sea representante del vector libre a y, considerado este punto A, otro único punto B tal que A B sea representante de b . Se define entonces la suma a +bb como el vector libre del cual O B es un representante: B
a + b b a
O
A
(Convendría que demostraras que la suma a + b no depende de los representantes de a y b elegidos.)
Propiedades de la suma de vectores libres La suma de vectores libres cumple las propiedades propias de la ley interna de un espacio vectorial.
Otras definiciones (módulo, dirección y sentido) ➀ Según definimos la relación de equipolencia, si A B y C D son dos representantes cualesquiera de un mismo vector libre a , entonces la longitud de AB es igual a la de CD. A dicha longitud, común a todos los representantes de a , la representaremos por |aa | y la llamaremos módulo de a . ➁ Diremos que dos vectores libres a y b tienen igual dirección, y escribiremos a // b , cuando considerados representantes suyos con el mismo origen, O A y O B , respectivamente, los puntos O, A y B estén alineados (O sea, que dos vectores libres a y b tienen la misma dirección cuando... son "paralelos".)
➂ Dados dos vectores libres no nulos a y b de igual dirección, diremos que tienen el mismo sentido cuando elegidos representantes suyos con el mismo origen, O A y O B , respectivamente, los extremos A y B estén en la misma semirrecta de origen O. En caso contrario, se dirá que a y b tienen distinto sentido.
Ejemplos Los vectores a y c de la figura siguiente tienen igual dirección y sentido. Los vectores b y d tienen igual dirección, pero sentidos opuestos. En cambio, no hay en la figura ningún vector que tenga igual dirección que el e . b a
c
d
e
Consecuencia ➠ De lo anterior se deduce que dos vectores libres no nulos son iguales si y sólo si tienen igual módulo, dirección y sentido Definición (de producto de un número real por un vector libre) ☞ Sea a un vector libre no nulo y sea l Œ R , l 0. Se define l.. a como el vector libre de igual dirección que a , de módulo a |l|.|a | y cuyo sentido es el de a si l> 0 y el opuesto si l< 0. Si l = 0 ó a = 0 , se define l.. a = 0 . Consecuencia ( (V 3, +, . ) es espacio vectorial) La operación anterior cumple las cuatro propiedades exigidas a la ley de composición externa de un espacio vectorial. Como la suma de vectores libres también cumplía las oportunas propiedades, concluiremos que (V3, +, .) es un espacio vectorial.
– 104 –
El espacio afín
Teorema (dependencia lineal de dos vectores libres) Sean a y b dos vectores libres no nulos. Entonces, las proposiciones siguientes son equivalentes: 1 a y b son linealmente dependientes 2 a y b están contenidos en una misma recta (Cuando decimos que los vectores libres están en una misma recta queremos decir que existen representantes suyos contenidos en ella).
① En efecto, si se verifica 1) , uno de los dos vectores (el primero, por ejemplo) será combinación lineal del otro, luego existirá un número l tal que a = l.bb . Por consiguiente, a y b , de igual dirección, tendrán representantes en una misma recta.
② Si se verifica 2) , a y b diferirán, a lo sumo, en módulo y sentido, luego tomando l =
a b
, será a = l.bb ó a = –l.bb ; en
ambos casos, a y b serán linealmente dependientes. Mira la figura: b
Teorema (dependencia lineal de tres vectores libres) Sean a , b y c tres vectores libres no nulos. Entonces, las proposiciones siguientes son equivalentes: 1 a , b y c son linealmente dependientes 2 a , b y c están contenidos en un mismo plano (Cuando decimos que los vectores libres están en un mismo plano queremos decir que existen representantes suyos contenidos en él)
En efecto:
① Supongamos en primer lugar que a , b y c son linealmente dependientes: Al menos uno de ellos será combinación lineal de los otros dos, por ejemplo: c = l.aa + m.bb , y tomando representantes con el mismo origen O, podremos escribir: O C = l.O O A + m.O OB luego O C está en el mismo plano que O A y O B . B' B
C c
b O
a
A
A'
② Supongamos ahora que O A , O B y O C , representantes de a , b y c con igual origen, están en el mismo plano. Se tendrá: OC = OA' + OB' y como existen números l , m tales que: O A' = l.O O A, O B' = m.O OB se concluirá: O C = l.O O A + m.O O B, o sea: c = l.aa + m.bb luego a , b , c son linealmente dependientes.
– 105 –
El espacio afín
Definición (de bases en V 3 y de coordenadas de un vector) Supongamos que e 1 , e 2 , e 3 son tres vectores libres que, como los de la figura, al no estar en un mismo plano, son linealmente independientes. Veamos que, entonces, cualquier vector de V3 puede expresarse como combinación lineal de ellos: X3 X E3 e
x
3
O e1
E2
X2
e2
X1 E1 A tal fin, sean: ➠
x un vector cualquiera de V3, cuyo representante con origen O es O X .
➠
O E 1 , O E 2 y O E 3 los representantes con origen O de e 1 , e 2 , e 3.
Entonces, siendo x i (i = 1, 2, 3) los números reales que cumplen: O X i = x i . O E i , podremos escribir: O E 1 + x 2.O O E 2 + x 3.O O E 3 = x 1.ee 1 + x 2.ee 2 + x 3.ee 3 , x = O X = O X 1 + O X 2 + O X 3 = x 1.O luego x es combinación lineal de los vectores e 1 , e 2 , e 3 que, por tanto, forman una base de V3 (pues cumplen las dos condiciones requeridas para ello).
☞ Como es normal, de (x1, x2, x3) se dirá que son las coordenadas del vector x en la base {ee 1, e 2, e 3} y, cuando no haya dudas sobre la base utilizada, se escribirá simplemente: x = (x1, x2, x3).
Consecuencia Más adelante nos será útil tener en cuenta que si se conocen las coordenadas de dos vectores libres: x = (x 1 , x 2 , x 3) , y = (y 1 , y 2 , y 3), entonces: l . x = ( lx 1 , l x 2 , l x 3 ), lŒ R ,
x + y = ( x1 + y1 , x2 + y2 , x3 + y3 )
como se puede comprobar sin más que expresar x e y en función de la correspondiente base y aplicar las propiedades de la suma de vectores libres y de la multiplicación de un número por un vector. 3
4. EL ESPACIO AFÍN E
Hasta ahora, y a partir de los puntos del espacio, hemos definido unos entes a los que hemos llamado vectores libres; pero, ¿qué utilidad tienen los vectores libres para el estudio de rectas y planos? ¿Qué relación existe entre el espacio vectorial V3 y el conjunto de puntos del espacio, E, del que las rectas y planos son subconjuntos? ¿Cómo podremos establecer una correspondencia entre vectores y puntos, de tal forma que las operaciones que conocemos entre aquéllos las podamos trasladar a éstos? A responder estas preguntas dedicaremos las siguientes líneas.
– 106 –
El espacio afín
Definiciones (de vector de posición de un punto y espacio afín) Siendo O un punto fijo del espacio E, consideremos la aplicación: E Æ V 3 que a cada punto X le hace corresponder como imagen el vector libre O X . Tal aplicación en biyectiva; es decir, a cada punto X le corresponde un único vector libre x = O X y, recíprocamente, a cada vector libre x , como sólo hay un representante de él con origen en O, O X, le corresponde un único punto X. En esas condiciones:
☞ Del vector libre O X diremos que es el vector de posición del punto X. ☞ Hablaremos de espacio afín, al que representaremos por E3, para referirnos al conjunto de puntos, E, una vez establecida la aplicación anterior.
Definiciones (de sistema de referencia afín y coordenadas de un punto) Llamaremos sistema de referencia afín en el espacio a cualquier conjunto S={O, e 1 ,ee 2 ,ee 3 }, donde O es un punto fijo del espacio y {ee 1,ee 2,ee 3} una base de V3. Al punto O se le llama origen del sistema de referencia y a las rectas que pasan por el origen y contienen los representantes de los vectores de la base, ejes del sistema de referencia o ejes de coordenadas.
e3 O e1
e2
❏ La importancia de establecer un sistema de referencia, S, estriba en que a cada punto X del espacio se le puede hacer corresponder una única terna de números reales, y recíprocamente. ¿Cuál? la formada por las coordenadas, en la base que forma parte de S, del vector de posición del punto. El esquema del proceso es éste: Punto ´ Vector de posición O X = x 1e1 + x 2e 2 + x3e3 X
´ Terna de números x1, x 2, x3
(
)
❏ De ( x 1 , x 2 , x 3 ) se dice que son las coordenadas del punto X en el sistema de referencia S.
Consecuencia ☞ Es inmediato que las coordenadas del origen son (0, 0, 0) y las de los puntos situados en los ejes, (x1 , 0 , 0), (0 , x2 , 0) y (0 , 0 , x3), respectivamente.
Coordenadas de un vector definido por dos puntos Con frecuencia es necesario, dados dos puntos A y B de coordenadas ( a 1 , a 2 , a 3 ) y ( b 1 , b 2 , b 3 ), respecto de un sistema de referencia S = { O, e 1 , e 2 , e 3 }, conocer las coordenadas respecto de la base {ee 1 , e 2 , e 3} del vector libre A B. Basta con observar que: OA + AB = OB , para concluir que las coordenadas de AB serán ( b 1 – a 1 , b 2 – a 2 , b 3 – a 3 ).
Coordenadas del punto medio de un segmento Otras veces se necesita conocer las coordenadas del punto medio, M, del segmento AB: A
M
B
Como A M = M B , llamando ( m 1 , m 2 , m 3 ) a las coordenadas de M, se tendrá: ( m 1 - a 1 , m 2 - a 2 , m 3 - a 3 ) = ( b 1 - m 1 , b 2 - m 2 , b 3 - m 3 ), de donde: m1 =
a1 + b1 2
m2 =
a 2 + b2 2
– 107 –
m3 =
a3 + b3 2
El espacio afín
5. LA RECTA EN EL ESPACIO Llegados a este punto, parece obligado decir que de rectas y planos los antiguos griegos sabían mucho, pese a que no conocían los vectores. Euclides, por ejemplo, no los necesitó para escribir en el siglo III a. de C. sus Elementos, obra cumbre en la historia de las matemáticas. Ello significa, pues, que se podría estudiar la recta sin utilizar vectores: a base exclusivamente de figuras y representaciones. Pero el trabajo se ve extraordinariamente simplificado si se utilizan ecuaciones; las cuales se obtienen fácil y rápidamente mediante un enfoque vectorial. Y eso haremos aquí: expresar en términos de vectores lo esencial de rectas y planos; comprobaremos que el que tres puntos estén alineados se corresponderá con que haya dos vectores linealmente dependientes, y el que cuatro puntos sean coplanarios, con que tres vectores sean linealmente dependientes... A partir de ahí saldrá todo lo demás.
Definición (de vector de dirección de una recta) Sea r una recta en el espacio. De un vector libre, v , no nulo, que tenga un representante contenido en la recta diremos que es un vector de dirección de la misma. En consecuencia: Dos vectores, v y w son vectores de dirección de una misma recta
¤
Existe un número real, l, tal que w = lv
Dos preguntas: ¿Cuántos vectores de dirección tiene una recta? ¿Cuáles son las coordenadas de los más sencillos vectores de dirección de los ejes de coordenadas?
Ecuaciones de una recta Como sabes, una ecuación de una recta, de un plano o de cualquier otra curva o superficie es una ecuación que es satisfecha por todos los puntos que la forman (o por sus coordenadas, que es lo mismo) y sólo por ellos. Supongamos inicialmente que la recta r , cuya ecuación deseamos obtener, es la que pasa por un punto A, conocido, y tiene a v , no nulo, también conocido, por vector de dirección.
X
v
Un punto X pertenecerá a la recta si y sólo si los vectores A X y v tienen igual dirección, es decir:
e3
A X Œ r ¤ AX = l.vv , para algún lŒ R
r
O
e2
e1
Ecuación vectorial de una recta Fijado un punto O de E3, se cumplirá: O A + A X = O X , luego tendremos que un punto X pertenecerá a la recta r si y sólo si: Ecuación vectorial de la recta r
OX = OA + l.v
Ecuaciones paramétricas de una recta Fijado ahora un sistema de referencia S ={O, e 1 , e 2 , e 3}, sean ( a 1 , a 2 , a 3 ) las coordenadas del punto A respecto de dicho sistema y ( v1, v2 , v3) las del vector v respecto de la base {ee 1 , e 2 , e 3}. Si llamamos ( x 1 , x 2 , x 3 ) a las coordenadas del punto genérico X, la ecuación vectorial anterior se transforma en: x 1 e 1 + x 2 e 2 + x 3 e 3 = a 1 e 1 + a 2 e 2 + a 3 e 3 + l.( v 1 e 1 + v 2 e 2 + v 3 e 3 ) o también:
– 108 –
El espacio afín x 1 = a1 + lv1 x 2 = a2 + lv2 x 3 = a3 + lv3
Ecuaciones paramétricas de la recta
Ecuación continua de una recta En el supuesto de que todas las coordenadas v i sean distintas de cero, eliminando el parámetro l de las tres ecuaciones anteriores se llega a: x1 - a1 x 2 - a2 x3 - a3 = = v1 v2 v3
Ecuación continua de la recta
Ejemplo Sea la recta que pasa por los puntos A(2, 0, 1) y B(4, 5, 4). Como el vector A B , cuyas coordenadas son (2, 5, 3), es un vector de dirección de ella, se tendrá:
(x1,x2,x3 ) = (2,0,1) + l(2,5,3)
x 1 = 2 + 2l x2 = 5l x 3 = 1 + 3l
x1 - 2 x2 x -1 = = 3 2 5 3
Ecuación vectorial
Ecuaciones paramétricas
Ecuación continua
Posición relativa de dos rectas en el espacio Dos rectas, en el plano, o se cortan en un punto o son paralelas o coincidentes. Ahora, en el espacio, la intuición nos indica que existe una cuarta posibilidad: que se crucen sin cortarse. Veamos si algebraicamente se llega a la misma conclusión. A tal efecto, supongamos que tenemos dos rectas en el espacio, r y s . (En la figura se ha supuesto que tienen un punto en común, pero su posición relativa podría ser cualquier otra). La recta r queda determinada, como ves, por el punto A y el vector v ; la recta s , por el punto B y el vector w . r
B
w
X P
O
v
Y
A
s
Las ecuaciones vectoriales de r y s, respectivamente, serán: OX = OA + l v ,
OY = OB + m w
¿En qué consiste el estudio de la posición relativa de ellas? Pues en determinar si tienen o no puntos en común; y de cuántos sean éstos, en el primer caso, y de por qué no los tienen, en el segundo. ¿Que son infinitos los puntos en común? Las rectas son coincidentes. ¿Que sólo tienen un punto en común? Se cortan. ¿Ninguno? O se cruzan o son paralelas. En términos de vectores, habrá algún punto común cuando algún O X , vector de posición de los puntos de r , coincida con algún O Y , vector de posición de los puntos de s . Y en términos de ecuaciones, habrá algún punto común cuando existan valores de los parámetros l, m tales que: OX = OA + l v = OB + m w
– 109 –
El espacio afín Es decir, cuando tenga solución el sistema de tres ecuaciones lineales en las incógnitas l, m: v1 l - w1 m = b1 - a1 v2 l - w2 m = b2 - a2 v3 l - w3 m = b3 - a3 Pero, aplicando el teorema de Rouché, y considerando la matriz de los coeficientes y la ampliada con los términos independientes: Ê v1 - w1ˆ A = Á v 2 - w2 ˜ ÁÁ ˜˜ Ë v 3 - w3 ¯
Ê v1 - w1 b1 - a1 ˆ A* = Á v2 - w2 b2 - a2 ˜ ÁÁ ˜˜ Ë v3 - w3 b3 - a3 ¯
se tendrá: rang A* = 3
rang A* = 2
rang A* = 1
Caso imposible, pues si rang A = 1, las dos primeras columnas de A* serán proporcionales y su rango no podrá ser 3.
El sistema es incompatible y las rectas no tienen ningún punto común. Además, al ser rang A = 1, los vectores v y w son de igual dirección. Las rectas son paralelas.
El sistema es compatible indeterminado, con infinitas soluciones. Las dos rectas tienen infinitos puntos en común y son coincidentes.
rang A = 1
r
r=s
s
w
v A
B
A v
w B
rang A = 2
El sistema es incompatible y las rectas no tienen ningún punto común. Además, al ser rang A = 2, los vectores v y w son de distinta dirección. Las rectas se cruzan. B
w
El sistema es compatible determinado con solución única. Las rectas se cortan en un punto cuyas coordenadas podremos obtener resolviendo el sistema.
s
B w
r
P A
Caso imposible, pues el rang A no puede ser mayor que el de A*.
r v
A
v
s
Ejemplo Supongamos que se desea conocer la posición relativa de las rectas, r y s, de ecuaciones paramétricas: Ï x = 2+ t Ô r : Ì y = 3 + 2t Ô z = 1+ t Ó
Ï x = 1 + 3p Ô s: Ì y = 4 - p Ô z = 5 + 2p Ó
Tales rectas tendrán algún punto común si y sólo si existen valores de t , p tales que: 2 + t = 1+ 3p 3 + 2t = 4 - p 1+ t = 5 + 2p El sistema anterior es incompatible, luego las dos rectas no tienen ningún punto común. Como no son paralelas, pues los vectores (1, 2, 1), (3, –1, 2), de coordenadas no proporcionales, son de distinta dirección, se concluye que r y s se cruzan.
– 110 –
El espacio afín
6. EL PLANO EN EL ESPACIO Hay varias formas de determinar un plano, empezando por la que consiste en dar tres puntos no alineados (¿Por qué, si no, los fotógrafos utilizan trípode?). Sin embargo, por razones didácticas, consideraremos inicialmente el plano p determinado por un punto A, perteneciente a él, y dos vectores libres no nulos, v y w , de distinta dirección, contenidos en él. (Recuerda lo que quería decir que un vector libre esté contenido en un plano). C
X
w v
A
B
Ecuación vectorial de un plano Sea p el plano de la figura anterior, definido por el punto A y los vectores v , w . Un punto X pertenecerá a p si y sólo si existen números reales l, m tales que: AX = l v + m w Si fijamos un punto O de E3, al cumplirse que O A + A X = O X , se tendrá que X pertenecerá al plano p si y sólo si: ➟
OX = 0A + l v + m w
Ecuación vectorial del plano p
Ecuaciones paramétricas de un plano Fijado un sistema de referencia S = {O, e 1 , e 2 , e 3} sean ( a 1 , a 2 , a 3 ) las coordenadas del punto A respecto de S y ( v 1, v 2, v 3 ), ( w 1, w 2, w 3 ) las de los vectores v , w , respecto de la base {ee 1 , e 2 , e 3}. Si llamamos ( x 1, x 2, x 3 ) a las coordenadas del punto genérico X, la ecuación vectorial anterior equivale a: x 1 = a1 + lv1 + mw1 x 2 = a2 + lv2 + mw2 x 3 = a3 + lv3 + mw3
➟
Ecuaciones paramétricas del plano p
Ecuación general o cartesiana de un plano Un punto de coordenadas( x 1 , x 2 , x 3 ) pertenecerá al plano si y sólo si existen valores de l y m para los que: x 1 - a1 = lv1 + mw1 x 2 - a2 = lv2 + mw2 x 3 - a3 = lv3 + mw3 es decir, si y sólo si el sistema anterior de tres ecuaciones en las incógnitas l y m es compatible. Pero como el rango de la matriz de los coeficientes es 2, ello sucederá si y sólo si el rango de la matriz ampliada es también 2, es decir, si y sólo si su determinante es nulo: v 1 w1 x 1 - a1 v2 w2 x 2 - a2 = 0, o lo que es equivalente: v 3 w3 x 3 - a3
x 1 - a1 x 2 - a2 x 3 - a3 v1 v2 v3 =0 w1 w3 w3
✍ Observa que la ecuación anterior constituye ya una ecuación del plano.
– 111 –
El espacio afín Desarrollando el último determinante por los elementos de la primera fila y llamando A1, A2, A3 a los adjuntos: A1 =
v2 v3 w2 w3
; A2 = -
v1 v3 w1 w3
; A3 =
v1 v2 w1 w2
resulta: A1(x 1 - a1) + A2 (x2 - a2) + A3 (x3 - a3) = 0 o, también: A1 x 1 + A2 x 2 + A3 x 3 + A 4 = 0
➟
Ecuación general o cartesiana del plano p
(No merece la pena memorizar los valores de los coeficientes y del término independiente de la ecuación anterior; ya verás en un próximo ejemplo cómo proceder en la práctica.) Recíprocamente, ¿formarán un plano todos los puntos cuyas coordenadas verifiquen una ecuación como la anterior? Supongamos que A1 0. Entonces, A1 x 1 + A2 x2 + A3 x 3 + A 4 = 0 equivale a: A A A x1 = - 4 - 2 x2 - 3 x3 A1 A1 A1 que también se puede escribir: Ï A4 A2 A3 Ô x1 = - A - A l - A m 1 1 1 Ô Ì x2 = 0 + l + 0 Ôx = 0 + 0 + m Ô 3 Ó Ê A ˆÊ A ˆ Ê A ˆ lo que significa que tales puntos forman el plano definido por el punto Á - 4 , 0, 0˜ y los vectores Á- 2 , 1, 0˜ Á- 3 , 0 , 1˜ . Ë A1 ¯ ¯ Ë A1 ¯ Ë A1 Ejemplo El plano definido por el punto A(2, 3, 1) y los vectores v (2, 0, 3), w (1, 4, 5) tendrá las siguientes ecuaciones: Vectorial:
Paramétricas:
General:
➟
(x, y, z) = (2, 3, 1) + l (2, 0, 3) + m (1, 4, 5)
➟
Ï x = 2 + 2l + m Ô 4m + Ìy = 3 Ô z = 1 + 3 l + 5m Ó
➟
x - 2 y -3 z -1 2 0 3 = 0, es decir: 12 x + 7 y – 8 z – 37 = 0 1 4 5
Plano definido por tres puntos Como dijimos, un plano p también queda determinado por tres puntos no alineados, A, B y C. Para obtener su ecuación vectorial bastará con pensar que p es el plano definido, por ejemplo, por el punto A y los vectores AB y AC:
C w A
v
B
Un caso interesante es aquél en que los tres puntos anteriores son los puntos A(a,0,0), B(0,b,0) y C(0,0,c) en que el plano corta a los ejes coordenados. Puedes comprobar que la ecuación del plano puede escribirse así: x y z + + =1 a b c
– 112 –
El espacio afín
Observación Existen muchas otras formas de determinar un plano. Así, por ejemplo, aunque más adelante volveremos sobre ello, para obtener la ecuación del plano determinado por contener una recta r y un punto A que no pertenece a r , podríamos obtener dos puntos de la recta. Esos dos puntos, junto con el punto A, permitirán aplicar lo visto antes.
Posición relativa de dos planos Para estudiar las posiciones relativas de dos planos haremos un estudio similar, utilizando el teorema de Rouché, al que hicimos en el caso de dos rectas, pues el que dos planos p, p', de ecuaciones: A1 x 1 + A2 x2 + A3 x 3 + A 4 = 0 , A'1 x1 + A'2 x 2 + A'3 x3 + A'4 = 0 , respectivamente, tengan una u otra posición relativa dependerá de que ambos posean o no puntos en común; y, en el primer caso, de cuántos sean éstos. Lo cual se analiza estudiando el sistema: ÏA1 x 1 + A2 x2 + A3 x 3 + A 4 = 0 Ì ÓA'1 x 1 + A'2 x2 + A'3 x 3 + A'4 = 0 En consecuencia, siendo:
ÊA A A ˆ ÊA A A A ˆ A = Á 1 2 3 ˜ ; A* = Á 1 2 3 4 ˜ Ë A'1 A'2 A'3 ¯ Ë A'1 A'2 A'3 A'4 ¯
los casos posibles son: 1.- Rango de A* = 2 1.1 Rango de A = 1 El sistema es incompatible y los planos son paralelos, no tienen ningún punto en común. Los coeficientes de las xi en las dos ecuaciones son proporcionales, pero esa proporcionalidad no se da entre los términos independientes.
'
1.2 Rango de A = 2 El sistema es compatible indeterminado. Los planos tienen infinitos puntos en común y son planos distintos. Se cortan en una recta.
'
2.- Rango de A* = 1 2.1 Rango de A = 1 El sistema es compatible indeterminado, pero, a diferencia del caso anterior, ambas ecuaciones (cuyos coeficientes y términos independientes son proporcionales) son equivalentes. Los planos, formados por los mismos puntos, son coincidentes.
Observaciones El caso en el que los dos planos se cortan en una recta tiene un interés especial, ya que una nueva forma de dar una recta r consistirá en escribir las ecuaciones de dos planos que se corten en ella. En ese supuesto se pueden plantear dos preguntas:
➀ ¿Cómo obtener una ecuación continua de r? ➁ ¿De qué forma será la ecuación de cualquier otro plano que contenga a r? – 113 –
El espacio afín
Ecuación continua de una recta dada como intersección de dos planos Supongamos que una recta r viniera dada como intersección de dos planos: Ïp: A1 x 1 + A2 x2 + A3 x 3 + A 4 = 0 r: Ì Óp': A'1 x 1 + A'2 x2 + A'3 x 3 + A'4 = 0 Como algún menor de orden 2 de la matriz de los coeficientes del sistema ha de ser no nulo (pues el rango de tal matriz es 2), podremos asegurar que, por ejemplo: A1 A2 D= 0 A'1 A'2 Resolviendo el sistema se llega a que sus soluciones están constituidas por todos los puntos (x1, x2, x3) tales que: x 1 - a1 x -a x3 =- 2 2 = A2 A3 A1 A3 A1 A2 A'2 A'3 A'1 A'3 A'1 A'2 A2 A 4 A' A' donde a1 = 2 4 D
; a2 =
A1 A 4 A'1 A'4 D
, respectivamente.
O sea, que las soluciones del sistema (los puntos comunes a los dos planos) forman una recta, como sabíamos, de la cual tendremos una ecuación continua. ✍ Te recomendamos que en la práctica, para hallar una ecuación continua de r , en lugar de memorizar las formulas anteriores, obtengas un punto arbitrario de la recta —basta con dar un valor cualquiera a una de las x i en las ecuaciones de p y p' y obtener el valor de las otras dos— y utilices, de lo que hemos hecho, las coordenadas de un vector de dirección. Mira el siguiente ejemplo.
Ejemplos ➀ Para hallar una ecuación continua de la recta: Ï 2x + y - z r :Ì Ó x + 3y + z
-
2 8
= 0 = 0
bastará con obtener un punto de ella, ya que el vector: Ê 1 -1 2 -1 Á 3 1 ,- 1 1 , Ë
2 1 ˆ = (4, - 3,5) 1 3 ˜¯
es uno de sus vectores de dirección. Pero dado que en la recta r se hallan todos los puntos cuyas coordenadas (x, y, z) son solución del sistema: 2x + y - z - 2 = 0¸ x + 3y + z - 8 = 0
si damos a x un valor arbitrario, x = 2, por ejemplo, obtendremos y = 1, z = 3, lo cual indica que el punto (2, 1, 3) pertenecerá a r . En consecuencia, una ecuación continua de r será la siguiente: x - 2 y -1 z -3 = = 4 -3 5 A d v e r t e n c i a : Si el menor correspondiente a las incógnitas y, z del sistema hubiera sido nulo, no habríamos podido obtener los valores de y, z a partir de un valor arbitrario de x. Para hallar, en tal caso, un punto de r , tendríamos que haber partido de un valor cualquiera de y o de z.
– 114 –
El espacio afín
➁ El problema recíproco del anterior, es decir, la obtención de las ecuaciones de dos planos que se corten en una recta de la que se conozca una ecuación continua, es muy fácil de resolver. Así, supongamos que se desea hallar dos planos cuya intersección sea la recta de ecuación continua: x -3 y +1 z - 6 = = 2 3 5 Ïx -3 y +1 ÔÔ 2 = 3 Ì Ôx -3 = z - 6 ÔÓ 2 5
Bastará con escribir las igualdades precedentes así:
Ï 3 x - 2y - 11 = 0 Ì Ó 5 x - 2z - 3 = 0
es decir, en la forma: para tener resuelta la cuestión.
Haz de planos Habíamos planteado, líneas atrás, otra cuestión: Cuál sería la ecuación de cualquier otro plano p ' ' que, como el de la figura, contuviera a una recta r , dada como intersección de dos planos p y p ' .
p
Ïp: A1 x 1 + A2 x2 + A3 x 3 + A 4 = 0 r: Ì Óp': A'1 x 1 + A'2 x2 + A'3 x 3 + A'4 = 0
p''
Observa que p ’ ’ habrá de poseer una ecuación que, añadida a las del sistema precedente, dé lugar a un sistema con las mismas soluciones; es decir, una ecuación que sea combinación lineal de las de p y p ’ . Por consiguiente, todo plano que contenga a r tendrá una ecuación de la forma:
p'
(
)
(
)
a A1 x 1 + A2 x2 + A3 x 3 + A 4 + b A'1 x1 + A'2 x2 + A'3 x3 + A'4 = 0 Naturalmente, al variar a y b se obtienen los infinitos planos que contienen a r . El conjunto de todos ellos es el haz de planos definido por la recta r .
r
Ejemplo ➀ Para hallar la ecuación del plano que contiene a la recta r:
2x
+
y - z
-
2
x
+ 3y + z
-
8
= 0¸ = 0
y pasa por el punto A(2, 0,1), bastará con pensar que tal plano, por pertenecer al haz definido por los dos anteriores, tendrá una ecuación de la forma: a.(2x + y – z – 2) + b.(x + 3y + z – 8) = 0, habiendo de tomar a, b valores para los que la correspondiente ecuación sea satisfecha por las coordenadas, (2, 0,1), del punto A. Habrá de ser, por tanto, a – 5b = 0. Todos los a, b que cumplan a = 5b proporcionarán la ecuación buscada. Haciendo b = 1, por ejemplo, será a = 5, y sustituyendo tales valores en la ecuación anterior, se tendrá que el plano buscado es el: 11x + 8y – 4z – 18 = 0.
➁ Comprueba que la ecuación del plano que contiene al eje OX y al punto (3, 1, 2) es 2y – z = 0.
– 115 –
El espacio afín
Posiciones relativas de una recta y un plano Para estudiar las posiciones relativas de una recta r y un plano p , supuesta dada r en la forma: Ï A x + A2 x2 + A3 x3 + A4 = 0 r: Ì 1 1 Ó A '1 x 1 + A '2 x 2 + A '3 x 3 + A '4 = 0 p : A''1 x 1 + A''2 x2 + A''3 x 3 + A''4 = 0
y siendo el plano:
bastará con estudiar el sistema formado por las tres ecuaciones anteriores. Pero consideradas las matrices: Ê A1
A = Á A'1 ÁÁ Ë A''1
A2 A'2 A''2
A3 ˆ A'3 ˜ ˜ A''3 ˜¯
,
Ê A1 A * = Á A'1 ÁÁ Ë A''1
A2 A'2 A''2
A3 A'3 A''3
A4 ˆ A'4 ˜ ˜ A''4 ˜¯
y no poder ser igual a 1 ni el rango de A* ni el de A (¿por qué?), los casos posibles son: 1.- Rango de A* = 3 1.1 Rango de A = 2 r
El sistema es incompatible y la recta y el plano, que no tienen ningún punto en común, son paralelos.
1.2 Rango de A = 3 r
El sistema es compatible determinado. La recta y el plano se cortan en un punto, cuyas coordenadas pueden obtenerse resolviendo el sistema.
2.- Rango de A* = 2 2.1 Rango de A = 2 El sistema es compatible indeterminado y la recta y el plano tienen infinitos puntos comunes: la recta está contenida en el plano.. r
Ejemplo Cuando la recta venga dada en la forma paramétrica la discusión se simplifica bastante. Así, por ejemplo, si se desea conocer la posición relativa de la recta r : x = 1 + 2t, y = 2 + t, z = 3 + 2t y el plano: p : 2x + y – z – 4 = 0, la cuestión se reducirá a averiguar si existe algún valor del parámetro t para el que los valores de x, y, z de la ecuación de r, verifiquen la de p. Esto es, tal que: 2(1 + 2t) + (2 + t) – (3 + 2t) – 4 = 0 ecuación que se cumple para t = 1, y sólo para ese valor. La recta y el plano se cortarán en el punto de coordenadas (3, 3, 5). (Si la última ecuación no hubiera tenido solución, la recta y el plano habrían sido paralelos; si hubiera tenido infinitas, la recta habría estado contenida en el plano).
– 116 –
El espacio afín
7. EJERCICIOS 1.-
En el espacio afín E3 se considera un sistema de referencia S = { O, O A , O B , O C }. Obtén las coordenadas de los vectores A B , A C y B C en la base que forma parte de S.
2.-
Siendo A, B, C y D cuatro puntos no coplanarios, se considera el sistema de referencia S = { A, A B , A C , A D } y el punto M de coordenadas (x, y, z) en S. Obtén las coordenadas de M respecto del sistema S ' = { B, B A , B C , B D }.
3.-
De un paralelogramo ABCD se conocen los vértices A(3, 5, 2), B(4, 2, 0) y C(7, 6, 5). Halla las coordenadas del cuarto vértice.
4.-
Halla los vértices C y D de un paralelogramo del que A(1, -1, 2), B(2, 3, -4) son dos vértices consecutivos y M(3, 1, 0) el centro.
5.-
Halla las coordenadas de los puntos que dividen un segmento AB en 3 partes iguales.
6.-
Demuestra que los puntos medios de los lados de un cuadrilátero cualquiera determinan un paralelogramo.
7.-
Sabiendo que el centro de gravedad de un triángulo coincide con el baricentro, o punto donde se cortan las medianas, expresa sus coordenadas en función de las coordenadas de los vértices del triángulo.
8.-
Los puntos A(2, -1, -1), B(-1, 3, 2) y C(x, y, 3) están alineados. Calcula x e y.
9.-
Escribe unas ecuaciones paramétricas y continua de la recta que contiene los tres puntos del ejercicio anterior.
1 0 . - Se considera el sistema de referencia S = {O, e 1, e 2, e 3}, donde O es el vértice de un cubo de arista unidad y los vectores e 1, e 2, e 3 los determinados por las aristas del cubo concurrentes en O. Halla unas ecuaciones paramétricas de: a) Las diagonales del cubo. b) Las rectas determinadas por O y los puntos medios de las aristas que concurren en el vértice opuesto a O. c) Las rectas determinadas por el vértice opuesto a O y los puntos medios de las aristas que concurren en O. d) Las rectas determinadas por O y los centros de las caras que pasan por O. 1 1 . - Halla el punto simétrico del A(4, -2, 6) respecto del M(2, 3, 5). x -1 y +3 z 1 2 . - Estudia la posición relativa de las rectas de ecuaciones: r: = = 2 4 5
Ï x = 2 - 3t Ô s:Ì y = 1 + t Ôz = 3t Ó
x y z x +1 y + 4 z - 7 1 3 . - Las rectas : = = ; s : = = son paralelas. Halla a y b. 2 a 4 b 3 2 1 4 . - Los puntos A(1, 2, 0), B(5, 3, 0), C(2, 6, 0) y D(3, 4, 3) son los vértices de un tetraedro. Comprueba que los puntos medios de los segmentos AB, BD, DC y CA forman un paralelogramo. 1 5 . - Halla el valor que debe tomar k para que se corten las rectas de ecuaciones: x -2 y-k z = = ; 2 3 -1
x + 2 y -1 z - 3 = = -1 2 3
y, posteriormente, halla la ecuación del plano definido por ambas. 1 6 . - Halla unas ecuaciones cartesianas de los siguientes planos: 1º) El que pasando por el punto A(2, 5, 1) contiene a la recta r del ejercicio 12. 2º) El que contiene a la recta x = 2t ; y = 7 - t ; z = 3 y es paralelo al eje OY.
– 117 –
El espacio afín 1 7 . - Obtén una ecuación continua de la recta determinada por los planos de ecuaciones: x + 2y – z + 7 = 0 ; 4x – y + 2z – 5 = 0. 1 8 . - La recta que pasa por el punto P(2, 1, 0) con vector de dirección v (–3, 1, 2), tiene un segmento comprendido entre los planos de ecuaciones x + 2 y – z – 2 = 0, x + 2 y – z – 6 = 0. Halla los extremos de dicho segmento. 1 9 . - Escribe unas ecuaciones cartesianas de los siguientes planos: 1º) El determinado por la recta x = y = z y el punto A(0, 2, 3). 2º) El paralelo a las rectas r : x = y = z; s : x – 6 = 6y = 2z por el punto P(1, 1, 3). 3º) El que contiene los puntos A(2, 3, 2), B(–1, 3, –4) y es paralelo a la recta de ecuación: x = 3 + 2t ; y = 5 – 6t ; z = 1 + t. 2 0 .- Obtén una ecuación del plano simétrico del p: x + y + z = 0 respecto del punto P(1, 1, 1) 2 1 . - Halla una ecuación continua de la recta que siendo paralela a la definida por los planos 4x + y + 6z = 7 , x - 3z = 4 , pasa por el punto (3, 2, 6). 2 2 . - Siendo a ŒR , se considera la recta que pasa por el punto P(1, 2, 3) y de la que el vector v = (a–1, 2a+4, 3a–6) es un vector de dirección. Escribe, en primer lugar, las ecuaciones de las correspondientes rectas para los valores a=0, a=1. Demuestra, después, que todas las rectas así obtenidas están en un mismo plano y halla una ecuación de éste. 2 3 . - Estudia la posición relativa de: x - 2 y +1 z - 4 = = y el plano p : 2x + y – 5z = 0 3 5 1 2º) El plano p y la recta s : x = 3 - 2t ; y = 1 – t ; z = 2 + t .
1º) La recta r :
3º) Las rectas r y s . 2 4 . - ¿Existe algún valor de a para el cual la recta definida por los planos p : –x + y – 2z = 1, p': –2x – y + 5z = 1 sea paralela al plano p'': ax + y – z = 2? 2 5 . - ¿Existen valores de a y b tales que la recta definida por los planos: x = a y ; y + z = 1 esté contenida en el plano 2x – 3y + z = b? Ï3 x - y + 2z = 1 2 6 . - Estudia la posición relativa, según los valores de a y b, del plano p : 2x – 5y + az = –2 y la recta r : Ì Ó x + 4y + z = b 2 7 . - Determina las condiciones que han de cumplir a y b para que los planos de ecuaciones x – 2z = 0, y – z = 1, ax + by + z = 1 se corten en un punto. Halla también el lugar geométrico de los puntos de corte (es decir, el conjunto formado por tales puntos). Ïx - 2y - 2z = 1 2 8 . - Se consideran la recta r : Ì y el plano p: 2x + y + mz + n = 0. Hay que calcular los valores de m y n a fin de que: Ó x + 5y - z = 0 1º) La recta corte al plano en un punto. 2º) La recta sea paralela al plano 3º) La recta esté contenida en el plano. 2 9 . - Dibuja la recta que pasa por los puntos A y B de coordenadas (5, 6, 5) y (2, 0, 2), respecto del sistema del ejercicio 10, y las rectas proyecciones de ella sobre los planos coordenados. Obtén una ecuación de cada una de las cuatro rectas dibujadas. 3 0 . - Obtén una ecuación de la recta que pasa por el punto A(1, –1, 0) y se apoya (corta) en las rectas: Ï2x + y + 3z = 0 x - 2 y z -1 = = ; s: Ì 3 2 2 Óx - 3y + 2z = 0 3 1 . - Obtén una ecuación de la recta que cortando al eje OX y a la recta r de ecuaciones paramétricas x = 2 + 6 t ; y = 3 t ; z = 2 + t , pasa por el punto A(2, –3, 1). r:
– 118 –
El espacio afín 3 2 . - Obtén unas ecuaciones paramétricas de la recta que pasa por el origen de coordenadas y corta a las rectas: r : x = 2y = z – 1; s : 3x = 2y – 2 = 6z. y+6 z-6 3 3 . - Sean A, B y C los puntos de la recta r : x - 12 = = que están en los planos coordenados. Determina razonada2 3 mente cuál de los tres puntos se encuentra entre los otros dos. x -1 y + 2 z -5 x y-2 z-2 = = s: = = . Calcula a continuación el determinante -5 2 2 3 3 1 cuyas filas son las coordenadas de unos vectores de dirección de r y s y de cualquier vector que se obtenga uniendo un punto A de r con otro B de s . Decide si las rectas anteriores son o no coplanarias según cual sea el valor de dicho determinante.
3 4 . - Considera las dos rectas siguientes: r :
3 5 . - Determina una condición para que las siguientes rectas sean coplanarias: Ï x = az + 2 r: Ì Ó y = z +3
Ï x = 2z + 1 s: Ì Ó y = -z + b
3 6 . - Determina la posición relativa de los siguientes grupos de 3 planos: 2x - y + z = 1 ¸ Ô 3 x + 2y - z = 3 x - 2y + 2z = 4 Ô
2x + 2y - z = 1 ¸ Ô x - 2y + z = 0 = 3 Ô
x
= 5¸ 2x - y Ô 3 x + 2y - z = 3 4 x + 5y - 2z = 1 Ô
3 7 . - Averigua si los siguientes planos forman un tetraedro: -x + y + x - y + x + y x + y +
1¸ Ô 1Ô z = 1Ô z = -1 Ô
z = z =
3 8 . - Halla el valor que han de tomar a y b para que los planos de ecuaciones: x + by + z = 1 2x + ay - z = b x - y + z = a contengan una misma recta. Determina, así mismo, otro plano que contenga esa recta y el punto A = (1, 0, 1). 3 9 . - Demuestra que todos los planos de ecuación: (1+ 2k)x + (1- k)y + (1+ 3k)z + (2k - 1) = 0 , k ŒR , pasan por una misma recta. 4 0 . - Determina la posición relativa de los siguientes planos, según el valor del parámetro a: 3 x - ay + 2z = a +1 2x - 5y + 3z = 1 x + 3y - (a - 1)z = 0 4 1 . - Se consideran las rectas: Ï x = 1+ 2l Ô r: Ì y = 2- l Ôz = l Ó
Ï x = 3-m Ô s : Ì y = 1- 2m Ô z = 3+m Ó
a ) Si P es un punto genérico de la recta r , halla, en función de l, las coordenadas del punto Q de s tal que la recta PQ sea paralela al plano x + y + z = 3. b ) Halla el lugar geométrico que describe el punto medio del segmento PQ. Ïx + 3z = 3 4 2 . - Dadas las rectas: r : Ì , s : x = y = z, halla la ecuación del lugar geométrico de los puntos medios de los segmentos que Óy= 0 tienen un extremo en la primera y otro en la segunda. ¿Qué relación hay entre este lugar geométrico y las rectas dadas?
– 119 –
Tema 8 El espacio euclídeo
El espacio euclídeo
1. INTRODUCCIÓN Como decíamos al comienzo del capítulo anterior, en éste vamos a estudiar problemas de los llamados métricos, es decir, problemas relativos a la medición de ángulos entre rectas y planos, distancias entre puntos y rectas, etc. Empezaremos definiendo la herramienta que nos permitirá resolver tales cuestiones: el producto escalar. Ocurre a menudo en matemáticas que, enfrentados a la necesidad de definir algo nuevo, las posibilidades a priori son múltiples; y sólo cuando se quiere llegar a resultados concretos aparecen condiciones que obligan a definir los conceptos de una forma determinada; eso sucede con el producto escalar en el espacio, que no será sino una generalización del que ya conoces en el plano. Terminaremos el tema definiendo los productos vectorial y mixto y viendo algunas de sus aplicaciones para el cálculo de áreas y volúmenes..
2. PRODUCTO ESCALAR Definición (de ángulo de dos vectores) ☞ Se define el ángulo formado por dos vectores libres no nulos a y b , al que designaremos por (aa , b ), como el ángulo que forman dos representantes O A y O B de dichos vectores tomados con un mismo origen. b
a B (aa ,bb )
O
A
Es importante hacer constar que el ángulo (aa , b ) no se modifica al cambiar de representantes.
Definición (de producto escalar) ☞ Dados dos vectores libres no nulos, a y b , de V3, se define el producto escalar de a y b , que representaremos mediante a . b , como el número que resulta de multiplicar el módulo de a por el módulo de b por el coseno del ángulo que forman a y b . O sea: a b = a . b . cos(a, b) ☞ Si a ó b son nulos, se define a . b = 0 Propiedades del producto escalar Cualesquiera que sean los vectores libres a , b de V3 y el número real l, se verifican las siguientes igualdades: 1
a b = ba
Propiedad conmutativa
2
a ( b + c) = a b + a c
Propiedad distributiva
3
l ( a b) = (l a) b = a (l b)
Propiedad pseudoasociativa
4
a a 0
Para demostrar la propiedad distributiva, única un poco complicada, observa la siguiente figura, que corresponde al caso más genral, en el que ninguno de los vectores a , b , c , b + c es nulo. Se tendrá: a (b + c) = a . b + c .cos a = a . O D = a .( O B ' + B C ' ) = a . O B ' + a . B C ' = a . b .cos b + a . c .cos g = a b + a c
– 121 –
El espacio euclídeo C c g
B
C' b
+
c
b b a
O
B'
a
D
A
Consecuencia Interesa destacar que de la definición de producto escalar y de la cuarta propiedad anterior se deduce que el módulo de un vector es la raíz cuadrada del producto escalar de dicho vector por sí mismo: a =
a a
Definición (de vectores ortogonales) ☞ Diremos que dos vectores no nulos a y b son ortogonales o perpendiculares, y escribiremos a ^ b , si el ángulo que forman es de 90° ó de 270°. Es decir: a ^ b ¤ a b = 0
Definición (de base ortonormal) Los vectores se dan habitualmente a través de sus coordenadas respecto de una base, de modo que de poco serviría el producto escalar si no pudiéramos calcularlo a partir de ellas. A tal fin, supongamos dados una base B = { e 1 , e 2 , e 3 } y dos vectores a y b de coordenadas ( a 1 , a 2 , a 3 ) y ( b 1 , b 2 , b 3 ), respectivamente. En virtud de las propiedades del producto escalar, podremos escribir: a b = (a 1 e 1 + a 2 e 2 + a 3 e 3 ) . (b1 e 1 + b2 e 2 + b3 e 3 ) = =
a 1 b1 . e 12
+( a 1 b2 + a 2 b1 ).( e 1 e 2 ) +( a 1 b3 + a 3 b1 ).( e 1 e 3 ) +( a 2 b3 + a 3 b2 ).( e 2 e 3 ) + a 2 b2 . e 22 + a 3 b3 . e 32
Llegados aquí, los cálculos se facilitarían bastante si a la hora de elegir la base los vectores e 1 , e 2 , e 3 fuera ortogonales dos a dos y unitarios (de módulo 1), pues en tal caso los productos e i e j (ij) serían nulos y los e 2i iguales a la unidad. A tal tipo de base la llamaremos ortonormal, y utilizaremos habitualmente los símbolos u1, u2 , u3 para designar sus vectores.
Expresión analítica del producto escalar Si la base utilizada es ortonormal, sustituyendo en la expresión anterior del producto escalar a . b cada e 2i por 1 y cada e i e j (ij) por 0, resulta: a b = a1 b1 + a 2 b2 + a3 b3 Cómo calcular un vector perpendicular a otro Con frecuencia interesa obtener un vector perpendicular a otro previamente dado. Teniendo en cuenta la expresión anterior y el hecho de que para que dos vectores sean ortogonales basta con que su producto escalar sea cero, el problema puede resolverse fácilmente: Si queremos hallar un vector b perpendicular al a = (3, 2, 5), pongamos por caso, basta con que escribamos una de las coordenadas de b , la primera por ejemplo, nula. Después, con cambiar el orden de las coordenadas segunda y tercera de a , cambiar una de ellas de signo y adjudicárselas a b , tendremos el asunto resuelto. El vector (0, –5, 2) es perpendicular al (3, 2, 5).
– 122 –
El espacio euclídeo
Cálculo del módulo de un vector Si a es un vector de coordenadas ( a 1 , a 2 , a 3 ) respecto de una base ortonormal se tendrá: a . a = a21 + a22 + a23 , de donde: a =
a21 + a22 + a23
Cálculo del ángulo de dos vectores Si, ahora, quisiéramos calcular el ángulo formado por dos vectores a y b , de coordenadas ( a 1 , a 2 , a 3 ) y ( b 1 , b 2 , b 3 ) respecto de una base ortonormal, bastaría con observar que: cos (a , b) =
a b cos (a , b) = |a|.|b|
a1 b1 + a 2 b 2 + a 3 b3 a12 + a 22 + a 32 . b12 + b 22 + b32
Observación Disponer de una base ortonormal facilita, pues, extraordinariamente los cálculos. La única cuestión que quedaría por resolver sería si dada una base cualquiera se podrá construir a partir de ella otra ortonormal. Nos limitaremos a decirte que la respuesta es afirmativa y que de ahora en adelante, salvo aviso en contra, utilizaremos siempre bases ortonormales.
3. EL ESPACIO EUCLÍDEO En el tema anterior partimos de un conjunto de puntos, el espacio E, y mediante una sencilla definición construimos el conjunto de vectores V3; establecimos una correspondencia entre puntos y vectores y a la estructura así creada la llamamos espacio afín E3. Ahora hablaremos del espacio euclídeo E3, refiriéndonos con tal expresión al mismo espacio de siempre, pero indicando, con ella, que podremos utilizar el producto escalar.
Definición (de sistema de referencia métrico) Llamaremos sistema de referencia métrico o simplemente sistema métrico, a todo sistema de referencia S={O, u 1,uu 2,uu 3}, en el que la base sea ortonormal.
u 3 O u 1 u2
Así, el sistema representado a la derecha es un sistema métrico, supuesto que los vectores perpendiculares dos a dos que en ella aparecen son unitarios.
Distancia entre dos puntos Es el más sencillo de los problemas métricos. Si se desea calcular la distancia entre dos puntos A ( a 1 , a 2 , a 3 ) y B ( b 1 , b 2 , b 3 ), como esa distancia coincide con el módulo del vector AB, cuyas coordenadas son ( b 1– a 1 , b 2– a 2 , b 3– a 3 ), se tendrá: d(A,B) =
(a1 - b1)2 + (a2 - b2 )2 + (a3 - b3 )2
Ángulo de dos rectas Al contrario de lo que sucede en el plano, en el espacio dos rectas no paralelas pueden no tener ningún punto común; sin embargo, aun así se habla del ángulo que forman: el menor de los ángulos que forman dos paralelas a dichas rectas por un punto cualquiera. Si observas la figura, verás que si v y w son vectores de dirección de r y s , entonces o bien a = (vv , w ) o bien a = 180° – (vv , w ). Tanto en un caso como en otro se tendrá:
– 123 –
v w
s
r
w a
v
El espacio euclídeo
cos a = cos v , w =
v 1 w1 + v 2 w 2 + v 3 w 3 2 1
v + v 22 + v 32 . w12 + w 22 + w 32
supuesto que v i, w i (i = 1, 2, 3) son las coordenadas de v y w, respectivamente.
Cosenos directores Sean a 1 , a 2 , a 3 los ángulos que forma un vector de dirección de una recta r con los vectores del sistema de referencia. Si partiendo de una ecuación continua de r : x 1 - a1 x 2 - a2 x 3 - a3 = = v1 v2 v3 v dividimos todos los denominadores por |vv |, y tenemos en cuenta que cosa i = i , se llega a: |v | x 1 - a1 x 2 - a2 x -a = = 3 3 cos a 1 cos a 2 cos a3 nueva ecuación continua a cuyos denominadores se les llama cosenos directores de la recta.
Vector característico de un plano Dado un punto A ( a 1 , a 2 , a 3 ) y un vector v ( v 1 , v 2 , v 3 ), consideremos el conjunto de todos los puntos X ( x 1 , x 2 , x 3 ) tales que A X y v son ortogonales. Tales puntos verificarán: A X v = 0, o sea: v1 (x1 - a1)+ v2 (x2 - a2)+ v3 (x3 - a3 ) = 0 v
relación que constituye la ecuación de un plano p. Diremos que v es un vector normal, perpendicular o característico de dicho plano. Pero, recíprocamente, ¿podrán obtenerse las coordenadas de un vector perpendicular a un plano p a partir de una ecuación general de éste?
A
X
X
Supongamos que la ecuación de p es: A1 x1 + A2 x2 + A3 x3 + A 4 = 0 y que A ( a 1 , a 2 , a 3 ), B ( b 1 , b 2 , b 3 ) son dos puntos cualesquiera de él. Se tendrá: A1 a1 + A2a2 + A3a3 + A 4 = 0 ; A1 b1 + A2b2 + A3b3 + A 4 = 0 de donde, restando ambas igualdades: A1(b1 - a1)+ A 2 (b2 - a 2 )+ A 3 (b3 - a3 ) = 0 lo cual indica que el vector v ( A 1 , A 2 , A 3 ) es perpendicular al A B y, por tanto, al plano p .
Ejemplo La ecuación del plano que contiene el punto A (2,–3, 1) y es perpendicular al vector v (4, 5, 6) será: 4 (x – 2) + 5 (y + 3) + 6 (z – 1) = 0 es decir: 4x + 5y + 6z + 1 = 0.
Un par de consecuencias 1 Para hallar la ecuación de la recta r que pasando por un punto es perpendicular a un plano, bastará con tomar como vector director de la recta cualquier vector perpendicular al plano. Así, por ejemplo, si éste tiene por ecuación A1 x1 + A2 x2 + A3 x3 + A 4 = 0 y el punto es el A ( a 1 , a 2 , a 3 ), unas ecuaciones paramétricas de la recta r serán: x 1 = a1 + A1 l , x2 = a2 + A2 l , x3 = a3 + A3 l.
– 124 –
El espacio euclídeo 2 También es fácil entender que una recta de dirección v ( v 1 , v 2 , v 3 ) y un plano de vector normal w ( A 1 , A 2 , A 3 ) serán perpendiculares si y sólo si v y w tienen la misma dirección, son proporcionales, linealmente dependientes... O sea, si y sólo si: A1 A2 A3 = = v1 v2 v3
(v i 0 )
Ángulo de dos planos ☞ Se entiende por ángulo a formado por dos planos el que forman vectores normales a ellos, v y w , o el suplementario de éste si fuese (v, w) > 90°. '
a a
El hecho de que, tanto en un caso como en otro, se tenga cos a = Ácos ( v , w ) Á, nos permitirá concluir que si los planos tienen por ecuaciones: p: A1x1 + A2 x2 + A3 x3 + A4 = 0 p ': A '1 x 1 + A '2 x 2 + A '3 x 3 + A '4 = 0 entonces: A1 A1' + A 2 A'2 + A3 A3'
cos a =
2
2
A'1 + A'2 + A3'
A12 + A 22 + A32
2
☞ De lo anterior se desprende que una condición necesaria y suficiente para que los dos planos sean perpendiculares es: A1 A1' + A 2 A 2' + A3 A3' = 0 .
Ángulo de recta y plano ☞ El ángulo a formado por una recta r y un plano p es el que forma dicha recta con su proyección r ' sobre el plano: r w
v a
r’
p
Si v es un vector director de la recta y w un vector normal del plano, entonces a = 90°– (vv , w ) ó a = (vv , w ) – 90°. Tanto en un caso como en otro, se tendrá sen a = cos( v , w ) , por lo que si v = ( v 1 , v 2 , v 3 ) y w = ( A 1 , A 2 , A 3 ), será:
sen a =
v1 A1 + v 2 A 2 + v3 A3 v12 + v 22 + v32
A12 + A 22 + A32
Observación No merece la pena memorizar las fórmulas anteriores. Es preferible manejar con soltura los vectores, pues ello bastará normalmente para resolver las cuestiones que puedan surgir.
– 125 –
El espacio euclídeo
Distancia de un punto a un plano La distancia desde un punto P a un plano p es la distancia existente entre el punto P y el pie de la perpendicular, A, trazada desde P a p . Para calcularla, siendo ( p 1 , p 2 , p 3 ) las coordenadas de P y A1 x1 + A2 x2 + A3 x3 + A 4 = 0 la ecuación de p, llamemos ( a 1 , a 2 , a 3 ) a las coordenadas desconocidas del punto A. Se tendrá: d(P, p ) = d(P, A ) = (a1 - p1)2 + (a 2 - p2 )2 + (a3 - p3 )2
P
A
como el vector P A tendrá igual dirección que el ( A 1 , A 2 , A 3 ), vector característico del plano, se tendrá: a1 - p1 = l A1 , a2 - p2 = l A2 , a3 - p3 = l A3 , para algún l ŒRR con lo cual: d(P, A) = l A21 + A22 + A23
[*]
Pero al ser A es un punto de p sus coordenadas cumplirán: A1( p1 + lA1)+ A2( p2 + lA2 )+ A3( p3 + lA3 )+ A 4 = 0 y de ahí, despejando el valor de l y llevándolo a [*], resulta:
d(P, p ) =
A1 p1 + A 2 p2 + A3 p3 + A4 A12 + A 22 + A32
(Las barras de valor absoluto evitan obtener distancias negativas, lo que estaría en contradicción con la idea física que se tiene de distancia; sin embargo el signo del numerador anterior, sin las barras, permite saber en cuál de los dos semiespacios en los que el plano p divide el espacio E se encuentra el punto P considerado.)
Distancia de un punto a una recta Entendiendo por distancia entre un punto P y una recta r la menor de todas las que resulten de unir P con puntos de r , existen varios procedimientos para calcularla. Explicaremos por el momento dos, dejando un tercer método para más adelante. ➀ El primer procedimiento consiste en obtener el punto Q, intersección de la recta r con el plano p que pasa por P y es perpendicular a ella, resolviendo el sistema formado por las ecuaciones de r y p . La distancia buscada será la que haya entre P y Q.
➁ El segundo procedimiento consiste en partir de unas ecuaciones paramétricas de r : x 1 = a 1 + v 1 l , x 2 = a2 + v 2 l , x 3 = a3 + v 3 l
Q
y fijarse en que el valor de l correspondiente al punto Q es el único para el que los vectores P Q y v ( v 1 , v 2 , v 3 ) vector de dirección de r , son ortogonales; o sea, el único tal que P Q . v = 0. Obtenido el valor de l y sustituido en las ecuaciones paramétricas de r , se tendrán las coordenadas de Q. La distancia buscada será, como antes, la existente entre P y Q.
r
P
Ejemplo Para hallar la distancia del punto P (7, 9, –4) a la recta r x = 3 + 2l , y = 1+ l, z = -3l , obtendremos el único punto Q de r tal que P Q es ortogonal a v (2, 1, –3), vector director de r . Dado que QŒrr , se tendrá Q=(3+2l, 1+l,–3l), y, por tanto, PQ=(2l–4, l–8, –3l+4). De P Q ^ v , se obtiene P Q . v = 2 (2l–4) + 1 (l–8) – 3 (–3l+4) = 0, es decir, l = 2. Por consiguiente, el punto Q es el (7, 3, –6) y la distancia buscada será: d(P, r ) = d(P, Q) = 2 10
P Q'
Q Q"
– 126 –
r
El espacio euclídeo
Distancia entre dos rectas La distancia entre dos rectas r y s se define como la longitud del menor de los segmentos que tienen un extremo en una de ellas y el otro en la otra. O, en otras palabras: como la longitud del único segmento que corta perpendicularmente a las dos. P r
v
s w
Q
p
① Una primera forma de calcular dicha distancia consiste en hallar la ecuación del plano p que conteniendo una de las rectas, s , por ejemplo, es paralelo a la otra, r . Obtenida tal ecuación todo se reduce a calcular la distancia desde cualquier punto de r a p. ② Otro procedimiento se basa en hallar los únicos puntos puntos P, de r , y Q, de s , para los que P Q es perpendicular tanto a r como a s . Para ello, basta con expresar las coordenadas de tales puntos mediante las igualdades: p1 = a1 + lv1 , q1 = b1 + mw1 ,
p2 = a2 + lv2 , p3 = a3 + lv3 q2 = b2 + mw2 , q3 = b3 + mw3
obtenidas de las ecuaciones paramétricas de r y s , e imponer las condiciones: P Q . v =v0, P Q . w = 0. De ellas se obtendrán los valores de l y m correspondientes a los puntos P y Q, quedando así resuelto el problema.
Ejemplo x-2 y z = = ; s : (x = 5 + 5b ; y = 1; z = 7 - b) basta con hallar los 1 2 1 valores de a y b tales que los puntos P(2+a, 2a, a), de r , y Q(5+5 b, 1, 7–b), de s , dan lugar a un vector P Q ortogonal tanto a v r, vector de dirección de r , como a v s , vector de dirección de s . Imponiendo, pues, las condiciones: P Q . v r = 0, P Q . v s = 0, se obtiene a = 2, b = 0, luego: P = (4, 4, 2), Q = (5, 1, 7) y d(rr , s ) = d(P, Q) = 35 Para calcular la distancia existente entre las rectas: r :
4. PRODUCTOS VECTORIAL Y MIXTO Si bien es cierto que el producto escalar es suficiente para resolver un buen número de problemas métricos, también lo es que algunos de tales problemas se simplifican si se establecen otro tipo de operaciones entre vectores, entre las cuales la más importante es el producto vectorial. Pero dado que una definición rigurosa del mismo tendría más dificultad que la que nos podemos permitir, haremos un pequeño arreglo que será más que suficiente para satisfacer nuestras necesidades.
Definición (de producto vectorial) Supongamos fijado en E3 un sistema de referencia métrico S={O, u 1 ,uu 2 ,uu 3 }. Si dados dos vectores libres no nulos, de distinta dirección, a ( a 1 , a 2 , a 3 ) , b ( b 1 , b 2 , b 3 ), quisiéramos calcular las coordenadas ( x 1 , x 2 , x 3 ) de otro vector x que fuera ortogonal tanto a a como a b , tendríamos que resolver el sistema: a1 x 1 + a2 x 2 + a3 x 3 = 0 ¸ b1 x 1 + b2 x 2 + b3 x 3 = 0
Pero este sistema homogéneo es compatible indeterminado (¿por qué?) y resolviéndolo, se llegaría a que x habría de ser necesariamente un vector de la forma: Ê a a a a a .Á 2 3 , - 1 3 b1 b3 Ë b2 b3
,
a1 a2 ˆ , a ŒRR b1 b2 ˜¯
– 127 –
El espacio euclídeo En particular, para a = 1 se obtiene el vector: Ê a2 a3 a1 a3 Á b b , - b b Ë 2 3 1 3
a1 a2 ˆ b1 b2 ˜¯
,
al que llamaremos producto vectorial de a por b y representaremos por a Ÿ b .
Ÿ b) Consecuencias (módulo, dirección y sentido de aŸ ➀ A partir de las coordenadas de a Ÿ b podemos expresar su módulo en función de los módulos de a y b y del ángulo (aa , b ). En efecto, por una parte: 2
2
(a . b )2 = a . b .cos2(a , b ) = (a 1 b1 + a 2 b2 + a 3 b3)2 y, por otra: a Ÿb
a a = 2 3 b2 b3
2
2
2
a a + 1 3 b1 b3
a a + 1 2 b1 b2
2
de donde sumando ambas igualdades y efectuando algunos cálculos, se obtiene: a Ÿb
2
2
2
2
+ a . b .cos 2(a , b) = a . b
2
o sea: a Ÿb
2
2
2
[
]
2
2
= a . b . 1- cos 2( a , b ) = a . b . sen 2( a , b)
es decir: a Ÿ b = a . b . sen( a , b) ➁ En cuanto a la dirección de a Ÿ b , poco nuevo hay que decir: del procedimiento que hemos seguido para definir el producto vectorial se desprende que el vector a Ÿ b es perpendicular tanto a a como a b . ➂ Finalmente, en lo que se refiere al sentido del vector a Ÿ b , veamos qué ocurriría al calcular u 1 Ÿ u 2 , siendo u 1 = (1, 0 , 0) u 2 = (0 , 1, 0) los dos primeros vectores de la base ortonormal {uu1,uu2,uu3}, orientados como en la figura. Según la definición: Ê 0 0 u 1Ÿ u 2 = Á Ë 1 0
, -
1 0 0 0
,
1 0 ˆ = 0, 0,1 = u 3 0 1 ˜¯
( )
u3 u1
Por lo tanto, en general, el producto vectorial a Ÿ b da lugar a otro vector perpendicular a ambos vectores y tal que cuando a coincidiera con u 1 y b con u 2, su sentido habría de ser el mismo que el de u 3.
u2
Algunas aplicaciones del producto vectorial ➀ La primera aplicación es consecuencia de que el producto vectorial de dos vectores es otro vector perpendicular a ambos: Como vector característico de un plano puede tomarse el producto vectorial de dos vectores contenidos en él. ➁ Análogamente, como vector de dirección de una recta perpendicular a otras dos r y s , de vectores de dirección v r y v s, podrá ser tomado el vector v r Ÿ v s. ➂ Designemos por S el área de un triángulo de vértices A, B, C. Se tendrá: S=
1 1 1 A B h = A B A C sena = A B Ÿ A C 2 2 2
– 128 –
C h A
a
B
El espacio euclídeo ➃ Por último para calcular la distancia de un punto P a una recta r , tomados dos puntos cualesquiera, A y B, de la recta r , será: P
A B Ÿ A P = A B A P sena = A B d
d
y, por tanto: d=
AB ŸAP
a
AB
B
r A
Definición (de producto mixto de tres vectores) Veamos una última definición, que combina los productos escalar y vectorial, y que permitirá calcular volúmenes. ☞ Dados tres vectores libres a , b y c , se llama producto mixto de ellos, en el orden dado, y se representa por [aa , b , c ] al producto escalar de a por el vector (bb Ÿ c ); esto es: [aa , b , c ] = a . (bb Ÿ c )
Consecuencia (cálculo del producto mixto) Si las coordenadas de los vectores a , b , y c son ( a 1 , a 2 , a 3 ), ( b 1 , b 2 , b 3 ) y ( c 1 , c 2 , c 3 ), respectivamente, se tendrá: b2 b3
[ a , b , c ] = a1
c2 c3
- a2
b1 b3
+ a3
c1 c3
a1 a2 a3 = b1 b2 b3 c2 c1 c2 c3
b1 b2 c1
expresión analítica que nos permitirá calcular fácilmente el producto mixto.
Volumen del tetraedro La principal aplicación, para nosotros, del producto mixto, es que permite calcular volúmenes de cuerpos poliédricos de forma sencilla: Considera el tetraedro de la figura. aŸb D h
c h
f
b
A
C
a B
Si llamamos S al área de su base y h a su altura, se tendrá: V = 1 S h = 1 1 a Ÿ b c cos f = 1 c (a Ÿ b) 3
3 2
6
o también, tomando el volumen en valor absoluto: 1 [ a , b, c ] 6 Si las coordenadas de los vértices del tetraedro son: A( a 1 , a 2 , a 3 ), B( b 1 , b 2 , b 3 ), C( c 1 , c 2 , c 3 ), D( d 1 , d 2 , d 3 ), tendremos, finalmente: V=
V=
1 6
b1 - a1 b2 - a 2 c1 - a1 c2 - a 2 d1 - a1 d2 - a 2
b3 - a3 c3 - a3 d3 - a3
=
– 129 –
1 6
1 1 1 1
a1 b1 c1 d1
a2 b2 c2 d2
a3 b3 c3 d3
El espacio euclídeo
5. EJERCICIOS 1.-
Sean a , b , c tres vectores libres del espacio. Demuestra que: 1º) Si a y b tienen el mismo módulo, entonces a + b y a – b son perpendiculares. 2º) Si a , b , c son perpendiculares dos a dos, entonces (aa + b ) . (bb + c ) 0.
2.-
Averigua si existen valores de x, y tales que el vector (2–x– y, 1+x– y, 1– y) sea ortogonal a los vectores (2, 1, –1) y (1, 0, 2).
3.-
Demuestra que las alturas de un triángulo son concurrentes, es decir, se cortan en un mismo punto.
4.-
En un vértice de un cubo se aplican tres fuerzas dirigidas según las diagonales de las tres caras que pasan por dicho vértice. Los módulos de estas fuerzas son 1, 2 y 3. Halla el módulo de la fuerza resultante.
5.-
Halla los ángulos que la recta
6.-
Calcula los ángulos que la recta de ecuación x = y = z forma con:
x -1 y - 2 z -3 = = forma con los ejes coordenados. 2 3 6
1º) Los ejes coordenados.
2º) La recta de ecuación x + 7 = 3 y + 5 = 3 z – 4 .
7.-
Obtén los planos bisectores de los planos: 3x – 4 y – 5 = 0, 2 x – y + 2 z – 5 = 0. (Plano bisector de otros dos: que forma iguales ángulos con ellos).
8.-
Halla la longitud de la proyección del segmento de extremos P(2, 0, 3) y Q(0, 1, 5) sobre el plano de ecuaciones: Ïx = l + m Ô Ìy = 2 + m Ôz = 1 - m Ó
9.-
Calcula las ecuaciones de los siguientes planos: 1º) El que pasa por el punto A(2, 3, 4) y tiene como vector característico el (5, 0, 1). 2º) El perpendicular al segmento de extremos P(2, 5, 3) y Q(4, 1, –1), en su punto medio. 3º) El perpendicular a la recta en la que se cortan los planos de ecuaciones: 2x + y = 5, x – z = 2 y pasa por el punto P anterior. 4º) El perpendicular a la recta x = 2 ; y = 3 + t ; z = 4t por el origen.
1 0 . - Demuestra que los tres planos perpendiculares a los lados de un triángulo ABC, en sus puntos medios, pertenecen a un mismo haz. Determina la ecuación de este haz si A(1, 3, –5), B(–2, 2, 0), C(–1, –3, –2). 1 1 . - Halla el punto P equidistante de A(1, 3, 3), B(2, -1, 2), C(5, 0, 6) y D(4, 3, 2). 1 2 . - Halla los puntos simétricos del P(1, 2, 3) respecto a: 1º) El plano que pasa por los puntos A(1, 0, 0), B(0, 2, 0) y C(0, 0, 3) 2º) La recta x = 2 y = z – 3 . 1 3 . - De entre todos los puntos pertenecientes a cierto plano p, el más próximo al origen de coordenadas es el P(1, 2, 5). Halla una ecuación general de p Ïx - y + z = 0 1 4 . - Determina qué puntos de la recta Ì son equidistantes de los planos OYZ y OXZ. Óx + 3y - 1 = 0 1 5 . - Obtén la ecuación de una cualquiera de las infinitas rectas que estando contenidas en el plano OXY son perpendiculares a la recta x = y = z.
– 130 –
El espacio euclídeo 1 6 . - Se consideran los planos de ecuaciones a x + 9 y – 3 z = 8, x + a y – z = 0. Determina los valores de a para los que: 1º) Los dos planos son paralelos. 2º) Los dos planos son perpendiculares. 3º) La recta determinada por ambos corta al plano OXY en un punto cuya distancia al origen de coordenadas es
2.
Ï2x - y = 3 1 7 . - Halla la distancia del punto P(3, 2, 4) a la recta Ì Ó3 x + y = 2 1 8 . - Calcula unas ecuaciones paramétricas del plano que contiene a la recta: x = 2 + 3t , y = –4 + 5t , z = t ; y es perpendicular al plano 2x + y – 7z = 3. 1 9 . - La recta
x y -1 z = = y el plano x + 2 y – z = 4 son perpendiculares. Halla a y b. 5 a +1 b
2 0 . - Obtén una ecuación de la recta que resulta de proyectar ortogonalmente la recta de ecuación
x +1 y + 2 z +1 = = sobre el plano 2 3 5
x + y – z = 1. 2 1 . - Halla la ecuación de la recta que pasando por el punto P(2, 2, 4) y estando contenida en el plano x + y – z = 0 tiene máxima pendiente respecto del plano z = 0. 2 2 . - Tomados en el espacio el eje OZ vertical ascendente y el plano OXY horizontal, se considera la varilla vertical cuyos extremos son los puntos A(–1, 2, 9) y A’(–1, 2, 0). En dos momentos determinados de un mismo día, las sombras que proyecta A sobre el plano OXY son los puntos S1(4,–3,0) y S2(1,6,0). Se pide: a) La recta que describe la sombra de A a lo largo del día. b) La sombra S0 de A en el momento en que la sombra de AA’ es más corta. c) La sombra S3 de A en el otro momento del día en que la sombra de AA’ tiene la misma longitud que la sombra S1A’. 2 3 . - Dadas las rectas r :
x y +1 z x -1 y = = ; s: = = z y el punto A(2, 1, 0), se pide: 1 2 2 2 3
1º) Distancia entre A y r.
2º) Distancia entre r y s.
3º) Plano paralelo a r y s pasando por el origen.
4º) Recta que corta perpendicularmente a r y s.
5º) Recta perpendicular a r y s pasando por A.
6º) Plano que pasa por A, es paralelo a r y perpendicular al plano OYZ.
2 4 . - Halla una ecuación de la recta que pasa por el punto A(3, 4, 2) y corta perpendicularmente al eje OX. 2 5 . - Tomados en el espacio el eje OZ vertical ascendente y el plano OXY horizontal se consideran las rectas: Ïx r:Ì Ó
Ï x - y - 3z = 2 + y = 1 s: Ì z = 4 Ó2y + z + 3 = 0 Una conducción de agua ocupa la posición de r . En un punto P de esta conducción se produce una fuga de agua; el correspondiente goteo cae sobre un punto Q de s . Halla los puntos P y Q. Ïx + y = 0 2 6 . - Dada la recta r : Ì y el plano p : 2 x – y + 2 z + 1 = 0, determina: Óy + z = 0 1º) Los puntos de r que distan 1 de p. 3 2º) Los puntos de p que distan 1 de los hallados en el apartado anterior. 3 x-4 y z-2 2 7 . - Halla el punto de la recta de ecuación = = que junto con el origen de coordenadas y el punto A(2, 3, 1) forma un -2 2 1 triángulo rectángulo en A. Halla la longitud de la altura sobre la hipotenusa de dicho triángulo.
– 131 –
El espacio euclídeo Ï x - y + z = 3 2 8 . - Obtén los puntos de la recta r : Ì que equidistan de los planos OXY y p: 2 x – 6 y + 3 z = 10. Ó2x + y + 2z = -4 2 9 . - Halla la distancia existente entre las siguientes rectas: Ïz + y = 5 r:Ì z = 4 Ó
Ï2x - z = 3 s: Ì y = 0 Ó
3 0 . - Halla la distancia existente entre las rectas: r:
Ï 2x - y + 1 = 0 s: Ì Ó 3y - 2z - 3 = 0
x - 2 y -1 z = = ; 3 2 3
3 1 . - Halla una ecuación de la recta que corta perpendicularmente a las rectas: r: x - 8 =
Ï x + y - 13 = 0 y -5 z -3 = ; s: Ì 3 -2 Ó- x + 3y + z = 10
3 2 . - Halla el área de un paralelogramo ABCD en el que A(1, 2, 4), B(3, 0, –2), C(1, 5, 5). 3 3 . - Calcula el área del triángulo cuyos vértices son los puntos en los que los ejes coordenados cortan al plano de ecuación: x y z + + = 1. 2 3 5 3 4 . - El plano perpendicular al segmento de extremos P(0, 3, 8) y Q(2, 1, 6) en su punto medio corta a los ejes coordenados en los puntos A, B y C. Halla el área del triángulo ABC. Ïx = 2 3 5 . - Las rectas x = y = z ; Ì son aristas opuestas de un tetraedro. La recta que une los puntos medios de las mismas es Óy = 3 perpendicular a ambas, y la distancia entre esos dos puntos es igual a la longitud de ambas aristas. Halla los vértices del tetraedro y su volumen. 3 6 . - Obtén las ecuaciones de los planos que pasando por los puntos A(1, 0, 0) y B(0, 1, 0), cortan al eje OZ en puntos C tales que el área de los triángulos ABC es de 10 unidades. 3 7 . - Obtén el lugar geométrico de las rectas que cortando al eje OZ y a la recta x = y - 1 = z, se mantienen paralelas al plano z = 0. 3 8 . - Sean a , b y c tres vectores linealmente independientes. Indica cuál o cuáles de los siguientes productos mixtos vale cero:
[a + c , a - c , a + b + c ]
[a + c , b , a + b]
[a - c , b - c , c - a ]
3 9 . - Calcula el volumen del tetraedro de vértices O(0, 0, 0), A(0, 2, 0), B(1, 0, 0) y C(0, 0, 3). Después, calcula la altura correspondiente a la cara ABC, la distancia entre las aristas AB y OC y el ángulo que forman las aristas AB y OA. 4 0 . - Halla el volumen del tetraedro de vértices A(2, 1, 0), B(4, 5, 0), C(5, 5, 0), D(3, 3, 4). Calcula, después, los angulos formados por sus caras. 4 1 . - Halla el volumen del prisma de vértices A(2, 1, 0), B(4, 5, 0), C(5, 5, 0), D(2, 2, 4), E(4, 6, 4), F(5, 6, 4). Si ese prisma se corta por el plano de ecuación z = 2, se forma un triángulo. Halla su área. 4 2 . - Existen infinitos planos tangentes a la esfera de centro el origen de coordenadas y radio unidad, pero sólo dos son paralelos al de ecuación 2 x + y = 3. ¿Cuáles son? 4 3 . - Halla los dos planos paralelos al de ecuación 2x + y – 2z = 0 que cortan a la esfera de centro C(1, 5, 3) y radio 5 en una circunferencia de radio 4.
(
2
2
) ( ) (
)
2
4 4 . - La ecuación: x - 2 + y - 1 + z - 4 = 25 corresponde a una esfera de centro el punto C(2, 1, 4) y radio 5. ¿Es cortada dicha esfera por el plano x + 2y + z – 14 = 0? En caso afirmativo halla la longitud de la correspondiente circunferencia.
– 132 –