Matemáticas PES Volumen I

December 14, 2017 | Author: gonzalorv | Category: Axiom, Numbers, Natural Number, Arithmetic, Set (Mathematics)
Share Embed Donate


Short Description

Descripción: volumen i...

Description

Cuerpo de Profesores de Enseñanza Secundaria

Matemáticas Temario Volumen I

Jesús Gómez Gómez Emilio M. Pina Coronado Fulgencio García Gómez Jorge Navarro Camacho

ESTA ESPECIA LIDAD

CONTIENE

Servicio Exclusivo Gratuito

Cuerpo de Profesores de Enseñanza Secundaria

Matemáticas

¡ESTE AÑO CONSEGUIRÁS TU PLAZA CON EDITORIAL MAD! Publicaciones + servicio exclusivo por internet*

3

Temarios actualizados Programaciones para todas las especialidades

años

El servicio exclusivo incluye... Actualizaciones durante 3 años Material adicional

www.oposicion-secundaria.com Incluye 3 años de SERVICIO EXCLUSIVO por internet

*Consultar condiciones

Cursos Online de Formación Permanente del Profesorado Título acreditativo Homologación válida en todas las CC AA Temáticas de actualidad Sin desplazamientos y a tu ritmo Tutores expertos Y mucho más....

-

Infórmate y haz tu matrícula llamando al

902 111 163 O N L I N E

EL AULA VIRTUAL DE EDITORIAL MAD

www.eduformaonline.com/portal/profesores Servicios gratuitos de información - Información de oposiciones: www.oposicion-secundaria.com/form-inform-sec.asp - Novedades de editoriales: www.mad.es/nov-libros.asp - Información de cursos online: www.eduformaonline.com/portal/suscrip-nov-formul.asp

¡ESTE AÑO CONSEGUIRÁS TU PLAZA CON EDITORIAL MAD! Publicaciones + servicio exclusivo por internet* Temarios actualizados Programaciones para todas las especialidades

Coordinación: Isabel García Lucas TRIVIUM. Centro de Oposiciones de Murcia

El servicio exclusivo incluye... Actualizaciones durante 3 años Material adicional

3

años

www.oposicion-secundaria.com *Consultar condiciones

Incluye 3 años de SERVICIO EXCLUSIVO por internet

Temario Volumen I

Cursos Online de Formación Permanente del Profesorado Título acreditativo Homologación válida en todas las CC AA Temáticas de actualidad Sin desplazamientos y a tu ritmo Tutores expertos Y mucho más....

Infórmate y haz tu matrícula llamando al

902 111 163 O N L I N E

-

Matemáticas EL AULA VIRTUAL DE EDITORIAL MAD

www.eduformaonline.com/portal/profesores Servicios gratuitos de información - Información de oposiciones: www.oposicion-secundaria.com/form-inform-sec.asp - Novedades de editoriales: www.mad.es/nov-libros.asp

Cuerpo de Profesores de Enseñanza Secundaria - Información de cursos online: www.eduformaonline.com/portal/suscrip-nov-formul.asp

Jesús Gómez Gómez Licenciado en Ciencias Exactas y en Ciencias de la Educación-Pedagogía. Catedrático de Matemáticas en el IES Diego Tortosa, de Cieza (Murcia). Jorge Navarro Camacho Doctor en Ciencias Matemáticas por la Universidad de Murcia. Profesor Titular de Facultad del Departamento de Estadística e Investigación Operativa de la Universidad de Murcia. Fulgencio García Gómez Licenciado en Ciencias Exactas. Profesor de Matemáticas en el IES Infanta Elena, de Jumilla (Murcia). Emilio M. Pina Coronado Licenciado en Psicología. Profesor en el IES José Castillo Puche, de Yecla.

© Editorial MAD, S.L. © Los autores. Segunda edición, julio 2007. Depósito Legal: SE-3787-2007 (I) (446 páginas) Derechos de edición reservados a favor de EDITORIAL MAD, S.L. Prohibida la reproducción total o parcial sin permiso escrito del editor. IMPRESO EN ESPAÑA. Diseño Portada: EDITORIAL MAD, S.L. Edita: EDITORIAL MAD, S.L. Plg. Merka, c/B. Nave 1. 41500 ALCALÁ DE GUADAÍRA (Sevilla). Telf.: +34 902 452 900. WEB: www.mad.es ISBN-13: 978-84-665-7919-3. ISBN-10: 84-665-7919-2. ISBN-13 obra completa: 978-84-665-0948-0. ISBN-10 obra completa: 84-665-0948-8.

Presentación El libro que tiene en las manos corresponde al temario de Oposiciones para el Cuerpo de Profesores de Enseñanza Secundaria de la especialidad de Matemáticas que Editorial MAD pone a disposición de todos aquéllos que aspiren a conseguir una excelente preparación que garantice, en la medida de lo posible, su éxito en las oposiciones. A la hora de escribir un temario de oposiciones de gran calidad el criterio básico ha de ser redactar cada tema con la finalidad de que el opositor no tenga necesidad de acudir a ninguna otra obra de consulta, es decir, que encuentre en el propio temario absolutamente todo el material que necesita. La premura con que casi siempre se estudia una oposición hace necesario que toda la materia esté presentada de forma clara, al mismo tiempo que sistemática y rigurosamente expuesta, conjugando esto con un nivel de comprensión que no haga que el opositor deba realizar un doble esfuerzo: entender el tema, y entender al redactor del tema. Disponer de un temario contrastado y actualizado otorga al futuro profesor la garantía de contar con un material que le ahorre múltiples esfuerzos y que le asegure una excelente preparación. Nuestra experiencia durante bastantes años en el campo de la preparación de opositores nos ha permitido comprobar, por haber tenido alumnos de todas las Comunidades Autónomas, que, por lo general, aproximadamente una cuarta parte de los temas son “nuevos” (en su contenido) tanto para los recién licenciados como para muchos doctorados, al no haber estudiado los aspectos fundamentales de éstos durante su formación como alumnos en las diferentes universidades. Por eso este temario incorpora no sólo todo el material (y de forma abundante) necesario para la comprensión del tema, sino también la definición clara de cualquier concepto relevante que aparezca, así como las aclaraciones cuando sean pertinentes y también muchos otros datos que posibiliten la comprensión. Es preferible que los datos y las explicaciones sobreabunden a que sean demasiado escasos; el opositor siempre podrá “recortar” el tema o sintetizar lo que estime más relevante. Los resultados obtenidos durante bastantes años por muchos de nuestros alumnos han sido extraordinarios, y han logrado en diferentes convocatorias y en tribunales de oposición varios números uno y muchísimos aprobados con plaza. Esto siempre nos ha estimulado a seguir actualizando y “puliendo” los temas, así como animando a los opositores a conseguir la preparación de la mayor calidad posible, con la confianza en que su esfuerzo finalmente tendrá el resultado anhelado.

Los autores TRIVIUM. Centro de Oposiciones de Murcia.

Índice Tema 1. Números naturales. Sistemas de numeración. .........................................

11

Tema 2. Fundamentos y aplicaciones de la teoría de grafos. Diagramas de árbol. ....

41

Tema 3. Técnicas de recuento. Combinatoria........................................................

57

Tema 4. Números enteros. Divisibilidad. Números primos. Congruencia. ..........

71

Tema 5. El número racional. ..................................................................................

99

Tema 6. Números reales. Topología de la recta real.............................................

113

Tema 7. Aproximación de números. Errores. Notación científica........................

131

Tema 8. Sucesiones. Progresiones aritméticas y geométricas. Aplicaciones........

143

Tema 9. Números complejos. Aplicaciones geométricas. .....................................

157

Tema 10. Sucesivas ampliaciones del concepto de número. Evolución histórica y problemas que resuelve cada una. ...........................................................................

171

Tema 11. Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas. ...

181

Tema 12. Espacios vectoriales. Variedades lineales. Aplicaciones lineales entre espacios vectoriales. Teorema de isomorfía............................................................

195

Tema 13. Polinomios. Operaciones. Formula de Newton. Divisibilidad de polinomios. Fracciones algebraicas. ..............................................................................

229

Tema 14. Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces. ...........................................................................................................................

247

Tema 15. Ecuaciones diofánticas............................................................................

267

Tema 16. Discusión y resolución de sistemas de ecuaciones lineales. Teorema de Rouche. Regla de Cramer. Método de Gauss-Jordan.............................................

287

Tema 17. Programación lineal. Aplicaciones.........................................................

303

Tema 18. Matrices. Álgebra de matrices. Aplicaciones a las Ciencias Sociales y a la Naturaleza..........................................................................................................

317

Tema 19. Determinantes. Propiedades. Aplicación al cálculo del rango de una matriz. .......................................................................................................................

329

Tema 20. El lenguaje algebraico. Símbolos y números. Importancia de su desarrollo y problemas que resuelve. Evolución histórica. ...........................................

337

Tema 21. Funciones reales de variable real. Funciones elementales; situaciones reales en las que aparecen. Composición de funciones. ........................................

357

441

Bibliografía ..............................................................................................................

415

Tema 24. Funciones dadas en forma de tabla. Interpolación polinómica. Interpolación y extrapolación de datos. ..............................................................................

Tema 22. Funciones exponenciales y logarítmicas. Situaciones reales en las que aparecen. ...................................................................................................................

375

Tema 23. Funciones circulares e hiperbólicas y sus recíprocas. Situaciones reales en las que aparecen. .................................................................................................

389

Tema 23. Funciones circulares e hiperbólicas y sus recíprocas. Situaciones reales en las que aparecen. .................................................................................................

389

Tema 22. Funciones exponenciales y logarítmicas. Situaciones reales en las que aparecen. ...................................................................................................................

375

Tema 24. Funciones dadas en forma de tabla. Interpolación polinómica. Interpolación y extrapolación de datos. ..............................................................................

415

357

Tema 21. Funciones reales de variable real. Funciones elementales; situaciones reales en las que aparecen. Composición de funciones. ........................................

337

Tema 20. El lenguaje algebraico. Símbolos y números. Importancia de su desarrollo y problemas que resuelve. Evolución histórica. ...........................................

329

Tema 19. Determinantes. Propiedades. Aplicación al cálculo del rango de una matriz. .......................................................................................................................

317

Tema 18. Matrices. Álgebra de matrices. Aplicaciones a las Ciencias Sociales y a la Naturaleza..........................................................................................................

303

Tema 17. Programación lineal. Aplicaciones.........................................................

287

Tema 16. Discusión y resolución de sistemas de ecuaciones lineales. Teorema de Rouche. Regla de Cramer. Método de Gauss-Jordan.............................................

Bibliografía ..............................................................................................................

441

TEMA

1 Números naturales. Sistemas de numeración

Jesús Gómez Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

12

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN: GÉNESIS Y FUNDAMENTACIÓN DE LA NOCIÓN DE NÚMERO

2.

CONSTRUCCIÓN AXIOMÁTICA DE N 2.1. El sistema axiomático de Peano 2.2. Principio de inducción completa. Consecuencias 2.3. Suma o adición de números naturales 2.4. Producto o multiplicación de números naturales 2.5. Orden en N 2.6. Compatibilidad del orden con las operaciones 2.7. Relación de orden estricto 2.8. Elementos consecutivos 2.9. Secciones de N y conjuntos finitos 2.10. Primero y último elemento. El principio de buena ordenación

3.

CONSTRUCCIÓN DE N BASADA EN LA TEORÍA DE CLASES 3.1. Conjuntos coordinables o equipotentes 3.2. El paradójico conjunto de todos los conjuntos 3.3. Conjuntos finitos e infinitos 3.4. Potencia o cardinal de un conjunto 3.5. Operaciones con cardinales 3.6. Orden entre cardinales 3.7. Los números naturales como cardinales de los conjuntos finitos 3.8. N es un conjunto infinito 3.9. Las operaciones y el orden en N 3.10. Propiedades de los conjuntos finitos 3.11. Construcción conjuntista recurrente

4.

SISTEMAS DE NUMERACIÓN 4.1. Introducción histórica 4.2. Sistema de numeración. Nociones generales 4.3. Teorema fundamental de la numeración 4.4. Consecuencia: el principio del valor relativo 4.5. Propiedades de la numeración 4.6. Cambio de sistema de numeración 4.7. Algoritmos de las operaciones básicas

SISTEMAS DE NUMERACIÓN 4.1. Introducción histórica 4.2. Sistema de numeración. Nociones generales 4.3. Teorema fundamental de la numeración 4.4. Consecuencia: el principio del valor relativo 4.5. Propiedades de la numeración 4.6. Cambio de sistema de numeración 4.7. Algoritmos de las operaciones básicas

4.

CONSTRUCCIÓN DE N BASADA EN LA TEORÍA DE CLASES 3.1. Conjuntos coordinables o equipotentes 3.2. El paradójico conjunto de todos los conjuntos 3.3. Conjuntos finitos e infinitos 3.4. Potencia o cardinal de un conjunto 3.5. Operaciones con cardinales 3.6. Orden entre cardinales 3.7. Los números naturales como cardinales de los conjuntos finitos 3.8. N es un conjunto infinito 3.9. Las operaciones y el orden en N 3.10. Propiedades de los conjuntos finitos 3.11. Construcción conjuntista recurrente

3.

CONSTRUCCIÓN AXIOMÁTICA DE N 2.1. El sistema axiomático de Peano 2.2. Principio de inducción completa. Consecuencias 2.3. Suma o adición de números naturales 2.4. Producto o multiplicación de números naturales 2.5. Orden en N 2.6. Compatibilidad del orden con las operaciones 2.7. Relación de orden estricto 2.8. Elementos consecutivos 2.9. Secciones de N y conjuntos finitos 2.10. Primero y último elemento. El principio de buena ordenación

2.

INTRODUCCIÓN: GÉNESIS Y FUNDAMENTACIÓN DE LA NOCIÓN DE NÚMERO

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

12

Números naturales. Sistemas de numeración

1. INTRODUCCIÓN: GÉNESIS Y FUNDAMENTACIÓN DE LA NOCIÓN DE NÚMERO La noción primitiva de número (al igual que otras como magnitud, forma...) puede remontarse a los albores de la raza humana, pero su desarrollo fue un proceso largo y lento. Muchas civilizaciones antiguas sólo distinguían entre uno y muchos, o entre uno, dos y más de dos. Incluso algunas tribus actuales subdesarrolladas, como los pigmeos y los zulúes, sólo conocen dos nombres de número: uno para la unidad y otro para el par. Desde un punto de vista filogenético, todo parece indicar que fue apareciendo de manera gradual una consciencia o reconocimiento general de una propiedad abstracta que tienen en común ciertos grupos, a la que nosotros llamamos número. Probablemente la clave en ese paso, tan decisivo dentro del progreso cultural del hombre, habría que buscarla en la constatación empírica que éste hace, a través de experiencias desordenadas, de que ciertos grupos de cosas pueden ponerse en correspondencia biunívoca. La consciencia de número se hizo tan extendida y clara que dio paso a la necesidad de expresar esta propiedad de alguna manera mediante un lenguaje simbólico. Al principio se usaban los dedos de una o dos manos, lo que explica la primitiva dominancia de los sistemas quinario y decimal. Después se utilizaron montones de guijarros para representar correspondencias biunívocas con elementos de otro conjunto, que el hombre prehistórico pronto sustituyó por muescas en un palo o trozo de hueso, con la ayuda de un sílex. Por un lado, los signos para representar números precedieron con toda probabilidad a las palabras, porque era más fácil hacer muescas en un palo que establecer una frase para identificar un número concreto de objetos. Por otro lado, la tendencia natural del lenguaje a desarrollarse de lo concreto a lo abstracto explica la tardanza de miles de años que la especie humana necesitó para conseguir abstracciones tales como el número. Hay que referirse también a una doble vertiente del concepto de número natural. En efecto, la noción de número reviste dos aspectos complementarios: uno, llamado cardinal, que sólo se basa en el principio del emparejamiento, y el otro, llamado ordinal, que exige a la vez el concepto de sucesión. Hay estudios antropológicos que sugieren la posibilidad de un origen alternativo. Si disponemos de una nube de puntos dispuestos de forma desordenada, nuestra percepción global del número no nos permite reconocer a primera vista la cantidad exacta, es decir, el cardinal del conjunto. Debemos recurrir al recuento, para lo cual habrá que “unir” los puntos mediante una línea en zigzag que pase de uno al siguiente; de esta manera asignaremos a cada punto un rango e identificaremos el rango del último elemento de la cadena con una noción abstracta y homogénea: la de cantidad absoluta. Para ello habrá que pasar también por la asimilación de la independencia del orden de la “enumeración”. En realidad todo elemento de la serie regular de los números naturales se obtiene añadiendo una unidad al número que le antecede. El filósofo alemán Schopenhauer hizo referencia a este principio de recurrencia con la expresión: “Todo número entero natural presupone que los anteriores son la causa de su existencia, es decir, que nuestro espíritu sólo puede concebir un número bajo el ángulo de la abstracción si ya ha asimilado los anteriores”. La base de los progresos en la consolidación del concepto de número es precisamente la facilidad de identificar los aspectos cardinal y ordinal. Mientras que en la práctica el número cardinal es el que nos interesa, éste es incapaz de servir de base a una aritmética, pues las operaciones aritméticas están fundadas en la hipótesis tácita de que siempre podemos pasar de un número cualquiera a su sucesor. Ahora bien, en esto consiste la esencia del concepto de número ordinal. El emparejamiento, por sí solo es incapaz de crear cálculo. Sin nuestra facilidad para disponer los seres y objetos según la sucesión natural, se habrá progresado muy poco. Nuestro sistema numérico está impregnado de estos dos principios, el de la correspondencia y el de la sucesión, que constituyen el tejido de todas las matemáticas. La construcción formal de N puede hacerse por dos vías que tienen que ver con el doble aspecto: ordinal y cardinal. Como concepto primitivo, el número natural puede introducirse axiomáticamente, camino seguido entre otros por Peano y Hilbert. Otra fundamentación del número natural, como concepto derivado de la teoría de clases, se basa en la idea de conjuntos coordinables, siendo este camino iniciado por Cantor y Frege y perfeccionado posteriormente por Russell. Podemos decir que la definición de número cardinal, tal como hoy es conocida, se debe al lógico y matemático alemán F.L.G. Frege (1848-1925). Insatisfecho con las imprecisas bases en que se apoyaban los conceptos aritméticos, tomó en consideración la teoría de conjuntos de Boole y de Cantor, e intentó en primer lugar dar a la noción de cardinal un sentido más riguroso, apoyándose en la idea de correspondencia biunívoca entre dos conjuntos. Pero la teoría de conjuntos, que se consagró oficialmente en el Congreso de Zurich de 1897, trajo TEMARIO DE MATEMÁTICAS. PRUEBA A

13

Volumen I. Matemáticas

14

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

consigo el hallazgo de “conjuntos paradójicos”, dando lugar a una polémica en los primeros decenios del siglo XX. Algunas de esas paradojas (de Burali-Forti, de Russell, etc.) , que se deben al uso indebido del concepto “todos” condujeron a cuestionar la existencia del “conjunto de todos los conjuntos”. De ahí que, partiendo de un objetivo similar al de Frege, el conocido matemático italiano Giuseppe Peano (1858-1932) intentó desarrollar un lenguaje formalizado que permitiera fundamentar la aritmética. Su nombre ha quedado asociado a los llamados axiomas de Peano, sobre los que se han apoyado tantas construcciones rigurosas del álgebra y del análisis. Eligió tres conceptos primitivos: cero, número y la relación binaria es sucesor de, y estableció sus cinco postulados. No obstante, fue Hilbert, adalid de la corriente formalista, el verdadero sistematizador del pensamiento axiomático, aunque en realidad los primeros pasos en la axiomatización de la aritmética parecen deberse a Grassmann y Dedekind. Con la axiomatización parecía haberse logrado los fundamentos definitivos, pero aunque el método axiomático fue universalmente aceptado, simultáneamente se abría la gran crisis de los fundamentos que conmovería el mundo matemático entre 1900 y 1930. En este contexto se situaron las controversias que tuvieron lugar acerca de la noción de número. Hay que señalar que el desarrollo completo de ambos procedimientos, el axiomático de Peano y el conjuntista de Russell, no fueron en su día totalmente satisfactorios. Mientras el sistema de Peano es axiomático y ordinal en su iniciación, y posteriormente intenta desarrollar la teoría cardinal, Russell desarrolla la aritmética cardinal como un capítulo de la teoría de clases, y posteriormente introduce el número ordinal. Tanto en uno como en otro sistema la justificación lógica del aspecto postergado aparece a la intuición como inútilmente complicada, al demostrar teoremas cuya sola enunciación “evidente” asombra al principiante.

Observaciones: a) En la formulación original de sus axiomas Peano estableció el 1, y no el 0, como el primer número natural. b) Se han dado otros sistemas de axiomas (Padoa, Pieri, etc.) semejantes a los de Peano, probablemente más simples en algunos aspectos, pero menos intuitivos. El sistema de Peano permite deducir lógicamente de él toda la Aritmética, aunque se le ha criticado que sólo caracteriza a las sucesiones. En realidad, para que pueda aceptarse como lógicamente satisfactorio, habría que demostrar que cumple las condiciones de compatibilidad, independencia y saturación. c) El axioma A1 significa que N es no vacío. Contiene al número 0, a partir del cual se van a obtener todos los demás. El axioma A2 da el procedimiento general de construcción, pues introduce la correspondencia s: x ® x+. De esta manera podemos denotar al siguiente de 0 por algún símbolo (no necesariamente por 1), por ejemplo 0+ = ¨. Si solamente se exigieran los axiomas A1 y A2 se podría pensar que la correspondencia da la cadena 0 ® ¨ ® 0, pues los dos primeros axiomas son verificados por el conjunto {0, ¨}. Pero el axioma A3 impide que se vuelva a 0 y el conjunto {0, ¨} no lo cumpliría, por lo cual la cadena debe desarrollarse: 0 ® ¨ ® ¨¨ ® … Si se tuvieran sólo los tres primeros axiomas, podría imaginarse que la correspondencia s da la cadena 0 ® ¨ ®¨¨ ® ¨ y el conjunto {0,¨, ¨¨} verifica A1, A2 y A3. d)

A5) Si un conjunto de números naturales U contiene al cero y también al sucesor de cualquier número que pertenezca a U, entonces todo número pertenece a U.

A4) A dos números naturales distintos corresponden siguientes distintos o, lo que es lo mismo, si los siguientes de dos números son iguales, entonces ambos números son iguales. (Si n, m Î N: n+ = m+ Þ n = m).

2. CONSTRUCCIÓN AXIOMÁTICA DE N

A3) Cero no es el siguiente de ningún número natural ("n Î N: n+ ¹ 0)

2.1. El sistema axiomático de Peano

A2) A cada número natural n Î N, le corresponde otro número natural único al que llamamos sucesor o siguiente de n, y al que denotaremos por n+, sg(n) ó s(n). (Si n Î N, n+ Î N).

El conjunto de los números naturales se define como un conjunto N que verifica los axiomas siguientes: A1) Cero es un número natural (0 Î N)

A1) Cero es un número natural (0 Î N)

A2) A cada número natural n Î N, le corresponde otro número natural único al que llamamos sucesor o siguiente de n, y al que denotaremos por n+, sg(n) ó s(n). (Si n Î N, n+ Î N).

El conjunto de los números naturales se define como un conjunto N que verifica los axiomas siguientes:

2.1. El sistema axiomático de Peano

A3) Cero no es el siguiente de ningún número natural ("n Î N: n+ ¹ 0)

2. CONSTRUCCIÓN AXIOMÁTICA DE N

A4) A dos números naturales distintos corresponden siguientes distintos o, lo que es lo mismo, si los siguientes de dos números son iguales, entonces ambos números son iguales. (Si n, m Î N: n+ = m+ Þ n = m). A5) Si un conjunto de números naturales U contiene al cero y también al sucesor de cualquier número que pertenezca a U, entonces todo número pertenece a U.

consigo el hallazgo de “conjuntos paradójicos”, dando lugar a una polémica en los primeros decenios del siglo XX. Algunas de esas paradojas (de Burali-Forti, de Russell, etc.) , que se deben al uso indebido del concepto “todos” condujeron a cuestionar la existencia del “conjunto de todos los conjuntos”. De ahí que, partiendo de un objetivo similar al de Frege, el conocido matemático italiano Giuseppe Peano (1858-1932) intentó desarrollar un lenguaje formalizado que permitiera fundamentar la aritmética. Su nombre ha quedado asociado a los llamados axiomas de Peano, sobre los que se han apoyado tantas construcciones rigurosas del álgebra y del análisis. Eligió tres conceptos primitivos: cero, número y la relación binaria es sucesor de, y estableció sus cinco postulados. No obstante, fue Hilbert, adalid de la corriente formalista, el verdadero sistematizador del pensamiento axiomático, aunque en realidad los primeros pasos en la axiomatización de la aritmética parecen deberse a Grassmann y Dedekind. Con la axiomatización parecía haberse logrado los fundamentos definitivos, pero aunque el método axiomático fue universalmente aceptado, simultáneamente se abría la gran crisis de los fundamentos que conmovería el mundo matemático entre 1900 y 1930. En este contexto se situaron las controversias que tuvieron lugar acerca de la noción de número. Hay que señalar que el desarrollo completo de ambos procedimientos, el axiomático de Peano y el conjuntista de Russell, no fueron en su día totalmente satisfactorios. Mientras el sistema de Peano es axiomático y ordinal en su iniciación, y posteriormente intenta desarrollar la teoría cardinal, Russell desarrolla la aritmética cardinal como un capítulo de la teoría de clases, y posteriormente introduce el número ordinal. Tanto en uno como en otro sistema la justificación lógica del aspecto postergado aparece a la intuición como inútilmente complicada, al demostrar teoremas cuya sola enunciación “evidente” asombra al principiante.

Observaciones: a) En la formulación original de sus axiomas Peano estableció el 1, y no el 0, como el primer número natural. b) Se han dado otros sistemas de axiomas (Padoa, Pieri, etc.) semejantes a los de Peano, probablemente más simples en algunos aspectos, pero menos intuitivos. El sistema de Peano permite deducir lógicamente de él toda la Aritmética, aunque se le ha criticado que sólo caracteriza a las sucesiones. En realidad, para que pueda aceptarse como lógicamente satisfactorio, habría que demostrar que cumple las condiciones de compatibilidad, independencia y saturación. c) El axioma A1 significa que N es no vacío. Contiene al número 0, a partir del cual se van a obtener todos los demás. El axioma A2 da el procedimiento general de construcción, pues introduce la correspondencia s: x ® x+. De esta manera podemos denotar al siguiente de 0 por algún símbolo (no necesariamente por 1), por ejemplo 0+ = ¨. Si solamente se exigieran los axiomas A1 y A2 se podría pensar que la correspondencia da la cadena 0 ® ¨ ® 0, pues los dos primeros axiomas son verificados por el conjunto {0, ¨}. Pero el axioma A3 impide que se vuelva a 0 y el conjunto {0, ¨} no lo cumpliría, por lo cual la cadena debe desarrollarse: 0 ® ¨ ® ¨¨ ® … d) Si se tuvieran sólo los tres primeros axiomas, podría imaginarse que la correspondencia s da la cadena 0 ® ¨ ®¨¨ ® ¨ y el conjunto {0,¨, ¨¨} verifica A1, A2 y A3.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

14

Números naturales. Sistemas de numeración El axioma A4 garantiza que la correspondencia s: N ® N es una inyección (además 0 Ï N), con lo cual el siguiente de cada número no puede volver a ser alguno de los obtenidos anteriormente en la “cadena”. La cadena 0 ® ¨ ®¨¨ ®¨¨¨ ® ... es “ilimitada”, lo que nos va a conducir a la idea de que N será un conjunto “infinito”. Diremos que N = {0, 1, 2, 3,...} está engendrado a partir de 0 por s, siguiendo el esquema 0 ® 1 ® 2 ® ... Pero entonces ¿cómo concebir N en su forma “acabada”? El axioma A5 responde a la cuestión antes planteada. Se conoce como axioma de recurrencia: ì1) 0 Î U ü ý entonces U se identifica con N (U º N)” “Si U Ì N cumple í + î2 ) n Î U Þ n Î U þ En resumen, los cuatro primeros axiomas determinan la construcción de N y el quinto suministra una herramienta de razonamiento que será de gran utilidad en lo que sigue.

2.2. Principio de inducción completa. Consecuencias Sea P una propiedad que se refiera a un número natural n cualquiera. Designaremos por P0, P1, P2, ... la sucesión de proposiciones que se refieren a n = 0, n = 1, n = 2, ... El principio de inducción completa o inducción matemática dice: “Supuesto que: 1. La proposición P0 es cierta. 2.

Bajo la hipótesis de validez de Ph puede deducirse (mediante un determinado razonamiento matemático) la validez de Ph +1. Entonces son ciertas todas las proposiciones de la sucesión Pn y la validez de la propiedad general à quedaría así probada” Si designamos por U = {n Î N / Pn es cierta}, el axioma de recurrencia nos lleva a que U = N, lo que significa que Pn es cierta para cualquier n Î N. Si consideráramos, como hacen algunos autores, que el primer elemento de N es el 1, el principio anterior se enunciaría de manera análoga. Intuitivamente podría ser entendido con el símil de los soldaditos de plomo colocados en fila.

Figura 1. Si nos aseguramos de que están colocados de tal forma que si cualquiera de ellos cae, automáticamente golpea y hace caer al siguiente (la “máquina” está preparada para funcionar correctamente), y que el primero se cae (la “máquina” se pone en marcha), entonces podremos concluir que, aunque la fila se extienda indefinidamente, todos los soldados caerán. En este principio de inducción se basan las “definiciones por recurrencia”. CONSECUENCIAS: TEOREMA 1: “Todo elemento de N es distinto de su siguiente, es decir n+ ¹ n, " n Î N” En efecto, si consideramos el conjunto U = {x Î N / x ≠ x+}, el axioma 3 garantiza que 0 Î U. Además, si h Î U, entonces h ≠ h+ (por definición del conjunto U) y por ser inyectiva la correspondencia σ se tendrá h+ ≠ (h+)+, de lo que se desprende que h+ Î U. Luego U = N, en virtud del principio de inducción completa. TEMARIO DE MATEMÁTICAS. PRUEBA A

15

Volumen I. Matemáticas

16

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si denotamos por un símbolo determinado el siguiente de 0 (por ejemplo 0+ = 1), reemplazando en b) y por 0, tendríamos x + 0+ = x+ o, lo que es lo mismo, x + 1 = x+. TEOREMA 2:

“Todo elemento de N, salvo el 0, es el siguiente de algún número natural, es decir " n Î N*: $ m Î N / m+ = n”. Observación:

podemos probar que " n, m Î N: n Å m = n + m. La inducción respecto a m nos da la justificación, puesto que por a) y a’) se tiene n Å 0 = n + 0 = n, y si fuese cierto que n Å m = n + m, entonces n Å m+ = (n Å m)+ = (n + m)+ = n + m+. Queda sobradamente probado que la ley composición +: N · N ® N definida anteriormente es una operación interna en el conjunto N. La demostración es similar a la anterior. Construyamos el conjunto: U = {0} ∪ {x Î N* / $ y Î N, siendo y+ = x}

Obviamente 0 Î U. Si h Î U, también es obvio que h+ Î U, pues existe entonces un número en U, que no es otro que h, cuyo siguiente es h+. Por tanto, U = N, lo que nos lleva a que dado un número natural cualquiera, o es cero o es siguiente de otro. Como ya se apuntó en la observación d), el axioma A4 nos dice que cada número natural tiene a lo más un “precedente”, pero no nos garantiza que lo tenga (el cero sabemos que no por el primer axioma). Si tomamos N* = N – {0}, está claro que la correspondencia s: x ® x+ es una inyección de N en N*. Pero el teorema 2, antes probado, nos permite asegurar que la correspondencia anterior es también suprayectiva.

Si para m es n + m Î N, probamos para m+ que n + m+ = (n + m)+ Î N, pues de los axiomas se desprende que el siguiente de un elemento de N también está en N. Asimismo, la unicidad está garantizada por la axiomática. En efecto, si hubiese otra suma Å cumpliendo a’) x Å 0 = x. b’) x Å y+ = (x Å y)+ Si m = 0, tenemos por a) que n + 0 = n Î N

COROLARIO:

Ø

“La correspondencia s de N en N* definida por s(x) = x+ es biunívoca”

Ø

La suma está bien definida: “" n, m Î N: n + m Î N” Equivale a decir que N es estable o cerrado para la operación y puede probarse también por inducción respecto a m:

La recíproca s–1 de N* en N nos da la definición de precedente. El precedente de x Î N* es s–1(x); dicho de otro modo: si x+ es el siguiente de x, también decimos que x es el precedente de x+. 1.

PROPIEDADES:

2.3. Suma o adición de números naturales

a)

x + 0 = x.

b)

Suponiendo definido x + y, definimos x + y+ como x + y+ = (x + y) +.

DEFINICIÓN: A todo par (x,y) de números naturales asociamos otro número natural, llamado suma de x e y, que denotamos por x + y, definiéndolo por recurrencia como sigue: DEFINICIÓN: A todo par (x,y) de números naturales asociamos otro número natural, llamado suma de x e y, que denotamos por x + y, definiéndolo por recurrencia como sigue: Suponiendo definido x + y, definimos x + y+ como x + y+ = (x + y) +.

b)

x + 0 = x.

a)

2.3. Suma o adición de números naturales

PROPIEDADES: 1.

La suma está bien definida: “" n, m Î N: n + m Î N” Equivale a decir que N es estable o cerrado para la operación y puede probarse también por inducción respecto a m:

La recíproca s–1 de N* en N nos da la definición de precedente. El precedente de x Î N* es s–1(x); dicho de otro modo: si x+ es el siguiente de x, también decimos que x es el precedente de x+.

Ø

“La correspondencia s de N en N* definida por s(x) = x+ es biunívoca” Si m = 0, tenemos por a) que n + 0 = n Î N

COROLARIO:

Ø Si para m es n + m Î N, probamos para m+ que n + m+ = (n + m)+ Î N, pues de los axiomas se desprende que el siguiente de un elemento de N también está en N. Asimismo, la unicidad está garantizada por la axiomática. En efecto, si hubiese otra suma Å cumpliendo a’) x Å 0 = x. b’) x Å y+ = (x Å y)+

Obviamente 0 Î U. Si h Î U, también es obvio que h+ Î U, pues existe entonces un número en U, que no es otro que h, cuyo siguiente es h+. Por tanto, U = N, lo que nos lleva a que dado un número natural cualquiera, o es cero o es siguiente de otro. Como ya se apuntó en la observación d), el axioma A4 nos dice que cada número natural tiene a lo más un “precedente”, pero no nos garantiza que lo tenga (el cero sabemos que no por el primer axioma). Si tomamos N* = N – {0}, está claro que la correspondencia s: x ® x+ es una inyección de N en N*. Pero el teorema 2, antes probado, nos permite asegurar que la correspondencia anterior es también suprayectiva.

podemos probar que " n, m Î N: n Å m = n + m. La inducción respecto a m nos da la justificación, puesto que por a) y a’) se tiene n Å 0 = n + 0 = n, y si fuese cierto que n Å m = n + m, entonces n Å m+ = (n Å m)+ = (n + m)+ = n + m+. Queda sobradamente probado que la ley composición +: N · N ® N definida anteriormente es una operación interna en el conjunto N. U = {0} ∪ {x Î N* / $ y Î N, siendo y+ = x}

La demostración es similar a la anterior. Construyamos el conjunto:

“Todo elemento de N, salvo el 0, es el siguiente de algún número natural, es decir " n Î N*: $ m Î N / m+ = n”. Observación:

Si denotamos por un símbolo determinado el siguiente de 0 (por ejemplo 0+ = 1), reemplazando en b) y por 0, tendríamos x + 0+ = x+ o, lo que es lo mismo, x + 1 = x+. TEOREMA 2:

16

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Números naturales. Sistemas de numeración

2.

Asociatividad: “Para cualesquiera m, n, p Î N es (m + n) + p = m + (n + p)” Fijando m y n, lo probamos por inducción respecto a p.

Ø

Para p = 0 se cumple, pues, por definición de suma: (m + n) + 0 = m + n m + (n + 0) = m + n

Ø

Si para p es cierta, veamos que también es cierta para p+: (m + n) + p+ = [(m + n) + p]+ +

(Por definición de suma)

[(m + n) + p] = [m + (n + p)] +

+

(Por hipótesis de recurrencia)

+

+

[m + (n + p)] = m + (n + p) = m + (n + p )

(Por definición de suma)

Podemos decir que (N,+) es un semigrupo aditivo. 3.

Elemento neutro:“Existe un elemento de N, que es el cero, verificando: n + 0 = 0 + n = n (" n Î N)”. Por la definición de suma, el 0 es neutro por la derecha, pues n + 0 = n. Probemos que también es neutro por la izquierda, es decir: 0 + n = n (1)

Ø Ø

Para n = 0 es cierto (1), pues 0 es elemento neutro a la derecha. Si suponemos (1) cierta para n, veamos que es cierta para n+: (Por definición de suma) 0 + n+ = (0 + n)+ (0 + n)+ = n+

(Por hipótesis de recurrencia)

Luego (1) es cierta para cualquier n. 4.

Conmutatividad: “Para cualesquiera m, n Î N se cumple m + n = n + m” Fijando m, lo probamos por inducción respecto a n.

Ø

Para n = 0 se cumple, pues ya quedó probado, que 0 es elemento neutro y por tanto conmuta con todo m (m + 0 = 0 + m = m).

Ø

Probemos la propiedad para n = 0+ = 1, es decir m + 1 = 1 + m (2) En efecto, (2) es cierta para m = 0, pues 0 es el elemento neutro. Supongamos demostrada (2) para m y veamos que es cierta también para m+: (Ya identificamos m+ con m + 1 anteriorm+ + 1 = (m + 1) + 1 mente) (m + 1) + 1 = (1 + m) + 1

(Por hipótesis de recurrencia)

(1 + m) + 1 = 1 + (m + 1) = 1 + m

+

(Por asociatividad)

Luego la relación (2) queda probada

Ø

Volviendo a la propiedad que queremos probar, supongámosla cierta para n y veamos que entonces es también cierta para n+: (Por asociatividad) m + n+ = m + (n + 1) = (m + n) + 1 (m + n) + 1 = (n + m) + 1

(Por hipótesis de recurrencia)

(n + m) + 1 = n + (m + 1)

(Por asociatividad)

n + (m + 1) = n + (1 + m)

(Por relación (2)) +

n + (1 + m) = (n + 1) + m = n + m

(Por asociatividad)

Con las propiedades 1, 2, 3 y 4 podemos decir que la estructura aditiva (N,+) es un semigrupo abeliano con elemento neutro. TEMARIO DE MATEMÁTICAS. PRUEBA A

17

Volumen I. Matemáticas

18

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

“Ningún número natural, salvo 0, tiene simétrico: m + n = 0 Þ m = n = 0” Razonamos por reducción al absurdo. Supongamos m + n = 0 con n ¹ 0, probaremos que se llega a una contradicción. Si n ¹ 0 existiría un n’ (precedente de n) tal que n’ + 1 = n. Entonces m + n = 0 Þ m + n’ + 1 = 0 Þ Þ (m + n’) + = 0, lo cual contradice el axioma A3 que establece que 0 no es siguiente de ningún número natural. Se tiene entonces que debe ser n = 0 y por consiguiente también m = 0.

Si para p es cierta, veamos que también lo es para p+: m · (n + p+) = m · n + m · p+ m · (n + p+) = m · (n + p) + (Por definición de suma) (Por definición de producto) m · (n + p) + = m · (n + p) + m m · (n + p) + m = m · n + m · p + m (Por hipótesis de recurrencia) (Por definición de producto) m · n + m · p + m = m · n + m · p+

Ø

Para p = 0 se cumple, pues obviamente m · (n + 0) = m · n = m · n + 0 = m · n + m · 0 (por ser 0 neutro para la suma y por a) en la definición de producto)

Ø

6.

Ley cancelativa o simplificativa: “m + p = n + p Þ m = n” Ello significa que todo número natural es regular para la suma. La propiedad es evidente para p = 0. Supongámosla cierta para p y probemos que también lo será entonces para p+. De m + p+ = n + p+ deducimos (m + p)+ = (n + p)+ por definición de suma. El axioma A4 permite deducir que m + p = = n + p, y por hipótesis de recurrencia llegamos a m = n. Luego cualquier p Î N es regular. 2.

5.

Distributividad respecto a la suma: “Para cualesquiera m, n, p Î N se cumplen: m · (n + p) = m· n + m · p (Distributividad por la izquierda) (m + n ) · p = m · p + n · p (Distributividad por la izquierda)” Probaremos una de ellas, por ejemplo la primera. La otra se justifica de modo análogo. Fijando m y n razonamos por inducción respecto a p:

Asimismo, la unicidad está garantizada por la axiomática. En efecto, si hubiese otra multiplicación Ä cumpliendo: a’) x Ä 0 = 0. b’) x Ä y+ = x Ä y + y podemos probar que " n, m Î N: n Ä m = n · m. La inducción respecto a m nos da la justificación, puesto que por a) y a’) se tiene n Ä 0 = n · 0 = 0, y si fuese cierto que n Ä m = n · m, entonces n Ä m+ = n Ä m + n = n · m + n = n · m+.

2.4. Producto o multiplicación de números naturales

DEFINICIÓN: A todo par (x,y) de números naturales asociamos otro número natural, llamado producto de x e y, que denotamos por x · y (o simplemente por yuxtaposición xy), definiéndolo de forma recurrente como sigue: x · 0 = 0.

b)

Suponiendo definido x · y, definimos x · y+ como sigue: x · y+ = x · y + x

Si para m es n · m Î N, probamos para m+ que n · m+ = nm + n Î N, por hipótesis de recurrencia y por ser N estable para la suma. PROPIEDADES:

El producto está bien definido: “" n, m Î N: n · m Î N” Lo anterior es equivalente a que N es estable o cerrado para la operación y se prueba también por inducción respecto a m:

El producto está bien definido: “" n, m Î N: n · m Î N” Lo anterior es equivalente a que N es estable o cerrado para la operación y se prueba también por inducción respecto a m: Si m = 0, tenemos por a) que n · 0 = 0 Î N (axioma A1)

Si para m es n · m Î N, probamos para m+ que n · m+ = nm + n Î N, por hipótesis de recurrencia y por ser N estable para la suma. PROPIEDADES:

Suponiendo definido x · y, definimos x · y+ como sigue: x · y+ = x · y + x

b)

x · 0 = 0.

a)

Ø Ø

1.

Si m = 0, tenemos por a) que n · 0 = 0 Î N (axioma A1)

1.

Ø Ø

a)

Asimismo, la unicidad está garantizada por la axiomática. En efecto, si hubiese otra multiplicación Ä cumpliendo: a’) x Ä 0 = 0. b’) x Ä y+ = x Ä y + y podemos probar que " n, m Î N: n Ä m = n · m. La inducción respecto a m nos da la justificación, puesto que por a) y a’) se tiene n Ä 0 = n · 0 = 0, y si fuese cierto que n Ä m = n · m, entonces n Ä m+ = n Ä m + n = n · m + n = n · m+.

DEFINICIÓN: A todo par (x,y) de números naturales asociamos otro número natural, llamado producto de x e y, que denotamos por x · y (o simplemente por yuxtaposición xy), definiéndolo de forma recurrente como sigue:

2.4. Producto o multiplicación de números naturales

2.

Distributividad respecto a la suma: “Para cualesquiera m, n, p Î N se cumplen: m · (n + p) = m· n + m · p (Distributividad por la izquierda) (m + n ) · p = m · p + n · p (Distributividad por la izquierda)” Probaremos una de ellas, por ejemplo la primera. La otra se justifica de modo análogo. Fijando m y n razonamos por inducción respecto a p:

Ley cancelativa o simplificativa: “m + p = n + p Þ m = n” Ello significa que todo número natural es regular para la suma. La propiedad es evidente para p = 0. Supongámosla cierta para p y probemos que también lo será entonces para p+. De m + p+ = n + p+ deducimos (m + p)+ = (n + p)+ por definición de suma. El axioma A4 permite deducir que m + p = = n + p, y por hipótesis de recurrencia llegamos a m = n. Luego cualquier p Î N es regular.

6.

“Ningún número natural, salvo 0, tiene simétrico: m + n = 0 Þ m = n = 0” Razonamos por reducción al absurdo. Supongamos m + n = 0 con n ¹ 0, probaremos que se llega a una contradicción. Si n ¹ 0 existiría un n’ (precedente de n) tal que n’ + 1 = n. Entonces m + n = 0 Þ m + n’ + 1 = 0 Þ Þ (m + n’) + = 0, lo cual contradice el axioma A3 que establece que 0 no es siguiente de ningún número natural. Se tiene entonces que debe ser n = 0 y por consiguiente también m = 0.

5.

Para p = 0 se cumple, pues obviamente m · (n + 0) = m · n = m · n + 0 = m · n + m · 0 (por ser 0 neutro para la suma y por a) en la definición de producto)

Ø

Si para p es cierta, veamos que también lo es para p+: m · (n + p+) = m · n + m · p+ m · (n + p+) = m · (n + p) + (Por definición de suma) (Por definición de producto) m · (n + p) + = m · (n + p) + m m · (n + p) + m = m · n + m · p + m (Por hipótesis de recurrencia) (Por definición de producto) m · n + m · p + m = m · n + m · p+

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

18

Ø

Números naturales. Sistemas de numeración

3.

Asociatividad: “Para cualesquiera m, n, p Î N se cumple (m · n) · p = m · (n · p)” Fijando m y n, lo probamos por inducción respecto a p

Ø

Para p = 0 se cumple, pues por a) en la definición de producto: (m · n) · 0 = 0, m · (n · 0) = = m · 0 = 0.

Ø

Si para p es cierta, veamos que también lo es para p+: (m · n) · p+ = m · (n · p+). En efecto: (m · n) · p+ = (m · n) · p + m · n

(Por definición de producto)

(m · n) · p + m · n = m · (n · p) + m · n

(Por hipótesis de recurrencia)

m · (n · p) + m · n = m · (n · p + n)

(Por distributividad)

+

m · (n · p + n) = m · (n · p ) 4.

(Por definición de producto)

Conmutatividad: “Para cualesquiera m, n Î N se cumple: m · n = n · m” Para probar esta propiedad, debemos apoyarnos en otras dos previas: P1. “Todo número natural conmuta con 1 (" n Î N: n ·1 = 1 · n)” Como ya se señaló antes se entiende “uno” como el “siguiente de 0” (1 = 0+) Por inducción respecto a n.

Ø

Para n = 0 se cumple: 1·0=0

( Por a) en la definición de producto)

+

0·1=0·0 =0·0+0=0

Ø

(Por definición de producto y ser 0 neutro)

Si se cumple para n, veamos que también se cumple para n+: n+ · 1 = 1 · n+ En efecto: (Por distributividad) n+ · 1 = (n +1) · 1 = n · 1 + 1 · 1 n·1+1·1=1·n+1·1 1 ·n + 1 · 1 = 1 · (n + 1) = 1 · n

(Por hipótesis de inducción) +

(Por distributividad)

P2. “El 0 es absorbente por la izquierda para el producto (" n Î N: 0 · n = 0)” Por inducción respecto a n

Ø Ø

Para n = 0 se cumple trivialmente por a) en la definición de producto 0 · 0 = 0 Si se cumple para n, entonces para n también pues 0 · n+ = 0 · n + 0 = 0 + 0 = 0, por definición de producto y por la hipótesis de recurrencia.

Probamos ahora que m · n = n · m (" n, m Î N), por inducción respecto de m.

Ø Ø

Para m = 0 se cumple pues 0 · n = 0, por P2, y n · 0 = 0, por la definición Si para m es cierta, veamos que también lo es para m+: En efecto: m+ · n = (m + 1) · n = m · n + 1 ·n

(Por distributividad)

m·n+1·n=n·m+n·1

(Por P1 y por hipótesis de recurrencia) +

n · m + n · 1 = n · (m + 1) = n · m (Por distributividad) Nota: una vez probada la conmutatividad la propiedad P2 puede completarse al asegurar que 0 es también absorbente por la derecha para la multiplicación. 5.

Elemento neutro: “Existe un elemento de N, que es el uno, verificando: n · 1 = 1 · n = n (" n Î N)” En efecto, las propiedades distributiva y conmutativa nos llevan a que 1 es neutro por la derecha: n · 1 = n · 0+ = n · 0 + n = 0 · n + n = 0 + n = n.

La conmutativa nos asegura que 1 también es neutro por la izquierda. TEMARIO DE MATEMÁTICAS. PRUEBA A

19

Volumen I. Matemáticas

20

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Podría justificarse también por inducción respecto a n:

Sustituyendo en la segunda igualdad el valor de b dado por la primera: (a + x) + y = a, de donde, por la asociativa y cancelativa de la suma x + y = 0, y de aquí llegamos a x = y = 0, resultando a = b.

Ø

Para n = 0, se cumple 0 · 1 = 0 · 0+ = 0 · 0 + 0 = 0 + 0 = 0 (por definición de producto y ser 0 neutro para la suma) y 1 · 0 = 0 (por la definición de producto).

Ø

Si es cierta para n, entonces para n tendremos n+ · 1 = (n + 1) · 1 = n · 1 + 1 · 1 = n + 1 · 0+ = n + 1 · 0 + 1 = n + 0 + 1 = n + 1 = n+ 1 · n+ = 1 · (n + 1) = 1 · n + 1 · 1 = n + 1 · 0+ = n + 1 · 0 + 1 = n + 0 + 1 = n + 1 = n+

b£aÞ$yÎN/b+y=a

a£bÞ$xÎN/a+x=b

Antisimétrica (a £ b y b £ a Þ a = b)

3.

Reflexiva (" a Î N: a £ a) Es trivial, puesto que el 0 cumple para cualquier a Î N que a + 0 = a.

2.

Podemos decir que la estructura multiplicativa (N,·) es también de semigrupo abeliano con elemento neutro (unidad). Por tanto (N,+, ·) es un semianillo abeliano. 6.

En N no hay “divisores de cero”: “n · m = 0 Þ n = 0 ó m = 0” En efecto, sea m · n = 0, con m ¹ 0. Vamos a probar por reducción al absurdo que ha de ser n = 0. Si fuese n ¹ 0 tendría un precedente x Î N, x = n. Entonces m · n = m · x = mx + m ¹ 0, pues habíamos supuesto que m ¹ 0. Llegaríamos a una contradicción con m · n = 0. Luego ha de ser n = 0.

7.

Ley cancelativa o simplificativa: “Si n ¹ 0 , n · m = n · p Þ m = p” Significa que todo número natural, salvo 0, es regular para la multiplicación. Se prueba por inducción.

8.

“Ningún número natural, salvo 1, tiene simétrico: m · n = 1 Þ m = n =1”. Razonamos por reducción al absurdo. Supongamos m · n = 1, con n ¹ 1 y m ¹ 1. Entonces tendrán sendos precedentes n’ y m’ distintos de cero. Se tendrá m · n = m · n’ + m = m · n’ + m’ +1 = 1 y de aquí, por la propiedad cancelativa de la suma se llega a m · n’ + m’ = 0. Pero ya vimos que ningún número natural, salvo el cero, tiene simétrico para la suma, por lo que forzosamente m · n’ = m’ = 0 y de aquí m = 1, lo cual es una contradicción.

a + x = bü ý Þ a + x = a + x’, y al ser todo número a regular Þ x = x’ a + x'= bþ

1.

Unicidad Si existiesen dos números x, x’ Î N cumpliendo lo anterior tendríamos

Propiedades:

Decimos también que b es mayor o igual que a y puede escribirse b ³ a. a£bÛ$xÎN/a+x=b

DEFINICIÓN: Dados dos números naturales a y b, decimos que a es menor o igual que b y escribimos a £ b, si existe un número natural x, tal que a + x = b

2.5. Orden en N

“Ningún número natural, salvo 1, tiene simétrico: m · n = 1 Þ m = n =1”. Razonamos por reducción al absurdo. Supongamos m · n = 1, con n ¹ 1 y m ¹ 1. Entonces tendrán sendos precedentes n’ y m’ distintos de cero. Se tendrá m · n = m · n’ + m = m · n’ + m’ +1 = 1 y de aquí, por la propiedad cancelativa de la suma se llega a m · n’ + m’ = 0. Pero ya vimos que ningún número natural, salvo el cero, tiene simétrico para la suma, por lo que forzosamente m · n’ = m’ = 0 y de aquí m = 1, lo cual es una contradicción.

8.

Ley cancelativa o simplificativa: “Si n ¹ 0 , n · m = n · p Þ m = p” Significa que todo número natural, salvo 0, es regular para la multiplicación. Se prueba por inducción.

7.

En N no hay “divisores de cero”: “n · m = 0 Þ n = 0 ó m = 0” En efecto, sea m · n = 0, con m ¹ 0. Vamos a probar por reducción al absurdo que ha de ser n = 0. Si fuese n ¹ 0 tendría un precedente x Î N, x = n. Entonces m · n = m · x = mx + m ¹ 0, pues habíamos supuesto que m ¹ 0. Llegaríamos a una contradicción con m · n = 0. Luego ha de ser n = 0.

6.

2.5. Orden en N

DEFINICIÓN: Dados dos números naturales a y b, decimos que a es menor o igual que b y escribimos a £ b, si existe un número natural x, tal que a + x = b a£bÛ$xÎN/a+x=b

Decimos también que b es mayor o igual que a y puede escribirse b ³ a.

Propiedades: 1.

Unicidad Si existiesen dos números x, x’ Î N cumpliendo lo anterior tendríamos

a + x = bü ý Þ a + x = a + x’, y al ser todo número a regular Þ x = x’ a + x'= bþ

Reflexiva (" a Î N: a £ a) Es trivial, puesto que el 0 cumple para cualquier a Î N que a + 0 = a.

Podemos decir que la estructura multiplicativa (N,·) es también de semigrupo abeliano con elemento neutro (unidad). Por tanto (N,+, ·) es un semianillo abeliano. Si es cierta para n, entonces para n tendremos n+ · 1 = (n + 1) · 1 = n · 1 + 1 · 1 = n + 1 · 0+ = n + 1 · 0 + 1 = n + 0 + 1 = n + 1 = n+ 1 · n+ = 1 · (n + 1) = 1 · n + 1 · 1 = n + 1 · 0+ = n + 1 · 0 + 1 = n + 0 + 1 = n + 1 = n+ Antisimétrica (a £ b y b £ a Þ a = b)

a£bÞ$xÎN/a+x=b b£aÞ$yÎN/b+y=a

Ø

3.

Ø

2.

Para n = 0, se cumple 0 · 1 = 0 · 0+ = 0 · 0 + 0 = 0 + 0 = 0 (por definición de producto y ser 0 neutro para la suma) y 1 · 0 = 0 (por la definición de producto).

Sustituyendo en la segunda igualdad el valor de b dado por la primera: (a + x) + y = a, de donde, por la asociativa y cancelativa de la suma x + y = 0, y de aquí llegamos a x = y = 0, resultando a = b. Podría justificarse también por inducción respecto a n:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

20

Números naturales. Sistemas de numeración

4.

Transitiva (a £ b y b £ c Þ a £ c) a£bÞ$xÎN/a+x=b b£cÞ$yÎN/b+y=c Sustituyendo en la segunda igualdad el valor de b dado por la primera: (a + x) + y = c. En virtud de la asociativa de la suma existirá un número natural x + y cumpliendo a + (x + y) = c y, por tanto, a £ c. Con las propiedades anteriores £ es una relación de orden.

5.

Conexa (" a, b Î N: a £ b ó b £ a) Fijemos b y formemos el conjunto U = {a Î N / a £ b ó b £ a}.

Ø

0 Î U, lo cual es obvio porque para cualquier b Î N es 0 £ b, ya que existe b, siendo 0 + b £ b en virtud de la propiedad reflexiva.

Ø

Supongamos que a Î U, y veamos que también a+ Î U.

La hipótesis de recurrencia significa que a £ b ó b £ a. Separemos ambas posibilidades: a)

Si a ³ b, existe un c Î N tal a = b + c, de donde a + 1 = b + c + 1, por lo que a + 1 ³ b y tendríamos a+ Î U.

b)

Si fuese a £ b, podríamos suponer a ¹ b, ya que el caso a = b está incluido anteriormente. Existe un c ¹ 0 tal que a + c = b. Como c ¹ 0, existe un precedente c’ Î N, siendo c’ + 1 = = c. Sustituyendo se llega a que a + c’ + 1 = b; de donde resulta a + 1 £ b y, por consiguiente, a+ Î U.

Esta última propiedad permite afirmar que la relación binaria £ es de orden total. Es decir, (N, £ ) es un conjunto totalmente ordenado.

2.6. Compatibilidad del orden con las operaciones a)

Ley de monotonía para la suma: “" a, b, c Î N: a £ b Û a + c £ b + c” En efecto: a £ b Û $ d Î N / a + d = b Û $ d Î N / a + d + c = b + c Û a + c £ b + c Como consecuencia se puede sumar miembro a miembro dos inigualdades como se expresa en el siguiente enunciado. COROLARIO: “a £ b y c £ d Þ a + c £ b + d ”. De la ley anterior se deduce: a £ b Þ (sumando c) a + c £ b + c; c £ d Þ (sumando b) b + c £ b + d, y por la transitividad, a + c £ b + d.

b)

Ley de monotonía para el producto: “" a, b, c Î N: a £ b Þ a · c £ b · c” Si c = 0 es trivial, ya que al ser 0 absorbente para la multiplicación a · 0 = b · 0 = 0 y por la reflexiva 0 £ 0. Si c ¹ 0, de a £ b (por definición de £) existirá un d Î N, tal que a + d = b, y multiplicando por c tendremos: (a + d) · c = b · c; por distributividad a · c + d · c = b · c, de donde a · c £ b · c. La implicación recíproca es también cierta si c ¹ 0. Luego podemos concluir que la relación de orden es estable tanto para la adición como para la multiplicación en N o, dicho de otro modo, que la relación binaria “£ ” es compatible con las operaciones en N. Por tanto: (N,+,·,£) es un semianillo abeliano totalmente ordenado

TEMARIO DE MATEMÁTICAS. PRUEBA A

21

Volumen I. Matemáticas

22

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Veamos que estos conceptos son concordantes con las nociones de siguiente y precedente que se desprenden de los propios axiomas. Para ello debemos probar que para cualquier número natural “n” no existe ningún x Î N, tal que n < x < n +1. En efecto, si así fuese debería haber dos números p y q cum-

2.7. Relación de orden estricto

DEFINICIÓN: Si existe un número natural x ¹ 0, tal que a + x = b decimos que a es estrictamente menor que b y escribimos a < b, o bien que b es estrictamente mayor que a y escribimos b > a. También se puede expresar lo anterior diciendo que a es anterior a b o que b es posterior a a. a y b consecutivos Û a < b y $ x Î N / a < x < b

Sean dos números naturales a y b. Supongamos que a < b. Podemos decir que a es anterior a b o que b es posterior a a. Si además no existe ningún número natural que sea posterior a a y anterior a b, decimos entonces que a y b son consecutivos; lo cual puede expresarse también diciendo que a es el precedente de b (a = pr(b)) o que b es el siguiente de a (b = sg(a)). PROPIEDADES: 1.

Antirreflexiva (" a Î N: a < / a”). Es trivial, ya que el único número x que cumple a + x = a es el neutro 0.

2.

Transitiva (a < b y b < c Þ a < c) a < b Þ $ x Î N / x ¹ 0, a + x = b;

2.8. Elementos consecutivos

b < c Þ $ y Î N / y ¹ 0, b + y = c

Sustituyendo en la segunda igualdad el valor de b dado por la primera: (a + x) + y = c. En virtud de la asociativa de la suma existirá entonces un número natural x + y cumpliendo a + (x + y) = c, y como x + y ¹ 0 (por ser x ¹ 0 e y ¹ 0) tendríamos a < c. " a, b Î N, con a ¹ b: a < b ó a > b

La ley anterior puede enuciarse de modo equivalente así:

a< bÞa¹b Si a < b, existe x ¹ 0 cumpliendo a + x = b. Si fuese a = b, llegaríamos a que a + x = a y, por tanto, a < a, lo cual es una contradicción con la antirreflexiva.

Si es a > b, existe un x ¹ 0, siendo a = b + x. Puede ser x = 1, en cuyo caso a = b + 1 = b+. O bien, x ¹ 1, y entonces el precedente de x sería x’ ¹ 0 (por ser s inyectiva); podríamos escribir a = b + x = b + x’ + 1, de donde resulta a > b + 1 = b+.

Ley de tricotomía: “" a, b Î N vale una y sólo una de las relaciones a < b, a = b, a > b” Puede probarse por inducción respecto a b:

Si es a < b, entonces existe un x tal que a + x = b, de donde a + x + 1 = b + 1 y de aquí a < b + 1 = b+. Si es a = b, está claro que a < b+ , ya que existe 1 Î N, tal que a + 1 = b + 1 = b+.

Para b = 0, veamos que una de las relaciones a < 0, a = 0 o a > 0 es cierta. Si fuese a = 0 ya estaría. La antirreflexiva excluye las otras dos alternativas. Supongamos que a ¹ 0. Entonces no puede darse a < 0, pues existiría un x ¹ 0, tal que a + x = = 0, pero si esto ocurre vimos en una propiedad anterior que debe ser a = x = 0 con lo que llegaríamos a una contradicción. En cambio, sí es cierto 0 < a, pues existe un número distinto de 0, el propio a, cumpliendo 0 + a < a por el axioma A3. Si la propiedad es cierta para b, hemos de probar que sólo una de las relaciones a < b+, a = b+, a > b+ es cierta. En efecto: a)

Para b = 0, veamos que una de las relaciones a < 0, a = 0 o a > 0 es cierta. Si fuese a = 0 ya estaría. La antirreflexiva excluye las otras dos alternativas. Supongamos que a ¹ 0. Entonces no puede darse a < 0, pues existiría un x ¹ 0, tal que a + x = = 0, pero si esto ocurre vimos en una propiedad anterior que debe ser a = x = 0 con lo que llegaríamos a una contradicción. En cambio, sí es cierto 0 < a, pues existe un número distinto de 0, el propio a, cumpliendo 0 + a < a por el axioma A3. Si la propiedad es cierta para b, hemos de probar que sólo una de las relaciones a < b+, a = b+, a > b+ es cierta. En efecto:

v v

Si es a = b, está claro que a < b+ , ya que existe 1 Î N, tal que a + 1 = b + 1 = b+.

v

Si es a > b, existe un x ¹ 0, siendo a = b + x. Puede ser x = 1, en cuyo caso a = b + 1 = b+. O bien, x ¹ 1, y entonces el precedente de x sería x’ ¹ 0 (por ser s inyectiva); podríamos escribir a = b + x = b + x’ + 1, de donde resulta a > b + 1 = b+.

Ley de tricotomía: “" a, b Î N vale una y sólo una de las relaciones a < b, a = b, a > b” Puede probarse por inducción respecto a b:

Si es a < b, entonces existe un x tal que a + x = b, de donde a + x + 1 = b + 1 y de aquí a < b + 1 = b+. 4.

3.

b)

b)

a)

v v

4.

v

3.

a< bÞa¹b Si a < b, existe x ¹ 0 cumpliendo a + x = b. Si fuese a = b, llegaríamos a que a + x = a y, por tanto, a < a, lo cual es una contradicción con la antirreflexiva. La ley anterior puede enuciarse de modo equivalente así:

Sustituyendo en la segunda igualdad el valor de b dado por la primera: (a + x) + y = c. En virtud de la asociativa de la suma existirá entonces un número natural x + y cumpliendo a + (x + y) = c, y como x + y ¹ 0 (por ser x ¹ 0 e y ¹ 0) tendríamos a < c. " a, b Î N, con a ¹ b: a < b ó a > b

2.

Transitiva (a < b y b < c Þ a < c) a < b Þ $ x Î N / x ¹ 0, a + x = b;

b < c Þ $ y Î N / y ¹ 0, b + y = c

2.8. Elementos consecutivos

Sean dos números naturales a y b. Supongamos que a < b. Podemos decir que a es anterior a b o que b es posterior a a. Si además no existe ningún número natural que sea posterior a a y anterior a b, decimos entonces que a y b son consecutivos; lo cual puede expresarse también diciendo que a es el precedente de b (a = pr(b)) o que b es el siguiente de a (b = sg(a)). 1.

Antirreflexiva (" a Î N: a < / a”). Es trivial, ya que el único número x que cumple a + x = a es el neutro 0.

PROPIEDADES:

DEFINICIÓN: Si existe un número natural x ¹ 0, tal que a + x = b decimos que a es estrictamente menor que b y escribimos a < b, o bien que b es estrictamente mayor que a y escribimos b > a. También se puede expresar lo anterior diciendo que a es anterior a b o que b es posterior a a. a y b consecutivos Û a < b y $ x Î N / a < x < b

Veamos que estos conceptos son concordantes con las nociones de siguiente y precedente que se desprenden de los propios axiomas. Para ello debemos probar que para cualquier número natural “n” no existe ningún x Î N, tal que n < x < n +1. En efecto, si así fuese debería haber dos números p y q cum-

2.7. Relación de orden estricto

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

22

Números naturales. Sistemas de numeración pliendo n + p = x, x + q = n + 1. Sustituyendo una en otra llegamos a n + p + q = n + 1, y por la ley cancelativa de la suma a p + q = 1. Esta igualdad es absurda, ya que:

– –

Si fuese p = 0 tendríamos n = x, lo cual contradice que n < x. Si fuese p ¹ 0, entonces p tiene un precedente p’, siendo p = p’ + 1, de donde p’ + 1 + q = 1 Þ Þ p’ + q = 0 Þ p’ = q = 0. Tendríamos x = n + 1, lo cual contradice que x < n + 1.

2.9. Secciones de N y conjuntos finitos Se define una sección de N como el intervalo [1,n] = {x Î N / 1 £ x £ n}. La noción anterior sirve para definir otro concepto: el de conjunto finito. Diremos que el conjunto A es finito si existe una biyección entre A y una sección de N A es un conjunto finito Û $ j: A ® [1,n] / j es biyectiva El orden total de N induce asimismo un orden total en cualquier conjunto finito A. Entonces los elementos del conjunto finito A pueden designarse por a1, a2, a3, ..., an. Diremos que se trata de una sucesión finita.

2.10. Primero y último elemento. El principio de buena ordenación En general los conceptos de primer y último elemento pueden definirse para cualquier conjunto ordenado A. Si en A hay un elemento que sea anterior a todos los demás, se denomina primer elemento o mínimo de A (lo denotamos por min A). Asimismo un elemento que sea posterior a los restantes se llama último elemento o máximo de A (lo denotamos por min A). Puede probarse fácilmente que tanto el mínimo como el máximo de un conjunto ordenado A, si existen, son únicos. El conjunto A se dice bien ordenado si cumple que todo subconjunto del mismo tiene primer elemento. Recogemos a continuación algunas propiedades de N relacionadas con los conceptos anteriormente definidos: 1.

El conjunto N tiene un primer elemento, que es 0, pero no tiene último elemento.

2.

Todo subconjunto no vacío de N tiene primer elemento o, lo que es lo mismo, (N, £) es un conjunto bien ordenado. Este enunciado podría tomarse como axioma bajo el nombre de “principio de buena ordenación”, sustituyendo al principio de inducción completa, el cual pasaría a ser entonces un teorema demostrable a partir de aquel y de la ley cancelativa.

3.

Toda parte finita de N admite un primer elemento y un último elemento. Lo probaremos sólo para el último elemento. Si A es finito, existe una biyección entre A y [1,n] la proposición se prueba por inducción con respecto a n.

– –

Si n = 1 es trivial, ya que A tendría un solo elemento.



Si suponemos la propiedad cierta para n, es que toda parte de N con n elementos admite un último elemento. Entonces hemos de tener en cuenta que un conjunto A de n + 1 números naturales es A = A’ ∪ {a}, siendo A’ una parte de N con n elementos. Por hipótesis de inducción A’ tendrá un máximo al que denotaremos por b. Tendríamos que el conjunto {a,b} tendría un último elemento (verificado para n = 2), que sería evidentemente el último de A.

Si n = 2, entonces A = {a,b}, siendo a ≠ b, y de la ley de tricotomía resulta a < b o b < a, con lo cual uno de ellos sería el último elemento de A.

4.

Si una parte no vacía de N tiene último elemento, se trata de un conjunto finito. En efecto, si “a” es el último elemento de AÌ N , entonces A Ì [0,n]. A sería finito por serlo [0,n].

5.

Para que una parte no vacía de N tenga último elemento es necesario y suficiente que sea finita.

TEMARIO DE MATEMÁTICAS. PRUEBA A

23

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

De igual manera la aplicación (f,g): A x A’ ® B x B’ definida por (f,g) (a,a’) = (f(a), f(a’)) " a Î A y " a’ Î A’, es tambien biyectiva y por tanto A x A’ ~ B x B’.

Figura 2.

Toda parte infinita de N no admite último elemento. Este enunciado es consecuencia del anterior. A’

B’

Toda parte infinita P de N admite un primer elemento. Elijamos un elemento “a” cualquiera de P. Si no hubiese elementos de P inferiores a “a”, entonces éste sería el primer elemento de P. En caso contrario, los elementos inferiores a “a” estarían en el intervalo [0,a] y constituyen, junto con a, el conjunto J = P Ç [0,a]. J ¹ Æ, pues al menos contiene a “a”. J es finito, ya que está incluido en [0,a]. Entonces J tiene un primer elemento que es el primer elemento de P. que prueba que A È A’ ~ B È B’.

g

En efecto: A ~ B Þ $ f: A ® B / f es biyectiva A’ ~ B’ Þ $ g: A’® B’ / g es biyectiva Podemos establecer una biyección h: A È A’ ® B È B’definida ì f(z) si z Î A por h(z) = í îg(z) si z Î A'

B

f

3. CONSTRUCCIÓN DE N BASADA EN LA TEORÍA DE CLASES

b)

A

7.

24

6.

A x A’ ~ B x B’.

La introducción del conjunto N a partir de la teoría de conjuntos es una vía tal vez más intuitiva que la vía axiomática. Pero plantea también mayores problemas en cuanto a rigor matemático, pues hay que tener en cuenta que en algunos momentos es preciso “tocar” nociones tan controvertidas como la de “finitud” o el farragoso tema de los “conjuntos paradójicos” (como el conjunto de todos los conjuntos). Una construcción impecable desde el punto de vista del rigor matemático pasaría previamente por una formulación adecuada de la teoría de clases y hemos de tener en cuenta que se trata de uno de los campos en el que más acuciante fue la crisis de los fundamentos y en donde más incidencia tuvo el movimiento revisionista (Cantor, Russell, Whitehead,..) PROPOSICIÓN 4: Sean A, B, A’ y B’ conjuntos tales que A ~ B y A’ ~ B’, entonces: a) Si A Ç A’ = B Ç B’ = Æ, se tiene A È A’ ~ B È B’.

PROPOSICIÓN 3: A~ByB~CÞA~C Si f: A ® B y g: B ® C son biyecciones también lo es la aplicación compuesta g ° f: A ® C.

3.1. Conjuntos coordinables o equipotentes

PROPOSICIÓN 2: A~BÞB~A Si existe una biyección f: A ® B, la correspondencia inversa f–1: B ® A es también biyectiva.

DEFINICIÓN: Dos conjuntos A y B son coordinables (también equipotentes, equivalentes o semejantes), y denotamos A ~ B, si puede establecerse una biyección entre A y B: A ~ B Û $ f: A ® B / f es biyectiva PROPOSICIÓN 1: Todo conjunto es coordinable consigo mismo: A ~ A. Basta considerar la aplicación identidad iA: A ® A, dada por iA(x) = x, " x Î A. Obviamente iA es biyectiva.

PROPOSICIÓN 1: Todo conjunto es coordinable consigo mismo: A ~ A. Basta considerar la aplicación identidad iA: A ® A, dada por iA(x) = x, " x Î A. Obviamente iA es biyectiva.

PROPOSICIÓN 2: A~BÞB~A Si existe una biyección f: A ® B, la correspondencia inversa f–1: B ® A es también biyectiva.

DEFINICIÓN: Dos conjuntos A y B son coordinables (también equipotentes, equivalentes o semejantes), y denotamos A ~ B, si puede establecerse una biyección entre A y B: A ~ B Û $ f: A ® B / f es biyectiva

3.1. Conjuntos coordinables o equipotentes

PROPOSICIÓN 3: A~ByB~CÞA~C Si f: A ® B y g: B ® C son biyecciones también lo es la aplicación compuesta g ° f: A ® C.

La introducción del conjunto N a partir de la teoría de conjuntos es una vía tal vez más intuitiva que la vía axiomática. Pero plantea también mayores problemas en cuanto a rigor matemático, pues hay que tener en cuenta que en algunos momentos es preciso “tocar” nociones tan controvertidas como la de “finitud” o el farragoso tema de los “conjuntos paradójicos” (como el conjunto de todos los conjuntos). Una construcción impecable desde el punto de vista del rigor matemático pasaría previamente por una formulación adecuada de la teoría de clases y hemos de tener en cuenta que se trata de uno de los campos en el que más acuciante fue la crisis de los fundamentos y en donde más incidencia tuvo el movimiento revisionista (Cantor, Russell, Whitehead,..) PROPOSICIÓN 4: Sean A, B, A’ y B’ conjuntos tales que A ~ B y A’ ~ B’, entonces: a) Si A Ç A’ = B Ç B’ = Æ, se tiene A È A’ ~ B È B’. A x A’ ~ B x B’.

3. CONSTRUCCIÓN DE N BASADA EN LA TEORÍA DE CLASES

Toda parte infinita P de N admite un primer elemento. Elijamos un elemento “a” cualquiera de P. Si no hubiese elementos de P inferiores a “a”, entonces éste sería el primer elemento de P. En caso contrario, los elementos inferiores a “a” estarían en el intervalo [0,a] y constituyen, junto con a, el conjunto J = P Ç [0,a]. J ¹ Æ, pues al menos contiene a “a”. J es finito, ya que está incluido en [0,a]. Entonces J tiene un primer elemento que es el primer elemento de P. f

A

B

g

que prueba que A È A’ ~ B È B’.

De igual manera la aplicación (f,g): A x A’ ® B x B’ definida por (f,g) (a,a’) = (f(a), f(a’)) " a Î A y " a’ Î A’, es tambien biyectiva y por tanto A x A’ ~ B x B’.

A’

B’

Toda parte infinita de N no admite último elemento. Este enunciado es consecuencia del anterior.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

24

Figura 2.

6.

En efecto: A ~ B Þ $ f: A ® B / f es biyectiva A’ ~ B’ Þ $ g: A’® B’ / g es biyectiva Podemos establecer una biyección h: A È A’ ® B È B’definida ì f(z) si z Î A por h(z) = í îg(z) si z Î A'

7.

b)

Números naturales. Sistemas de numeración PROPOSICIÓN 5: “Dados dos conjuntos A y B cualesquiera, podemos encontrar A’ y B’ tales que A ~ A’ y B ~ B’, siendo A’ Ç B’ = Æ” Bastaría tomar dos elementos t y s cualesquiera distintos (t ¹ s) y formar los conjuntos A’ = A · {t} y B’ = B · {s}. Las aplicaciones f: A ® A’ y g: B ® B’, dadas respectivamente por f(x) = (x,t) y g(x) = (x,s) son biyecciones, luego A ~ A’ y B ~ B’. Es evidente que A’ Ç B’ = Æ. PROPOSICIÓN 6: “Dados dos conjuntos A y B cualesquiera, se verifica una de las dos proposiciones siguientes:

– –

A es coordinable con una parte de B B es coordinable con una parte de A

Si se verifican ambas simultáneamente, entonces A ~ B” La primera parte de esta propiedad se conoce también como Teorema de Zermelo y será “admitida” para conjuntos cualesquiera. La segunda parte (que viene a ser el Teorema de Cantor-Bernstein) se prueba más adelante, una vez construido N, para conjuntos finitos. Se puede “anticipar” una justificación como la que se esboza a continuación (aunque tiene el inconveniente de que utiliza el conjunto N, que es precisamente el que estamos construyendo) Si f: A ® B1 y g: B ® A1 son biyecciones, con A1 Ì A y B1 Ì B, podemos formar dos sucesiones {Xn} e {Yn} constituidas por los subconjuntos de A y B respectivamente que se obtienen como sigue: X0 = A – A1, Y0 = f(X0), X1 = g(Y0), Y1 = f(X1), X2 = g(Y1)... Definiendo la aplicación h: A ® B de la forma: ì ïf(x) si x Î nÎUN X n h(x) = í –1 ïg (x) si x Ï nÎUN X n î es fácil probar que h es biyectiva.

3.2. El paradójico conjunto de todos los conjuntos Si los elementos entre los que se establece la relación “~” son conjuntos, ¿en qué dominio W podríamos considerar definida dicha relación binaria? En principio W debería tener como elementos a todos los conjuntos, es decir, W debería ser… ¿el conjunto de todos los conjuntos? Pero el dilema que surge es si existe dicho conjunto o se trata de una mera entelequia. En 1897 Burali-Forti ya hizo esa observación. En 1899 Cantor, en una carta a Dedekind, expuso la “antinomia” a la que conduce el admitir la existencia de tal conjunto W (el conjunto de partes de W sería equipotente con una parte de W, con lo que se llegaría a una contradicción con la desigualdad m < 2m, que él previamente había demostrado y que constituye lo que se conoce como “Teorema de Cantor”). Precisamente los intentos de los formalistas de dar una base axiomática de la teoría de conjuntos buscan en cierto modo no tener que ocuparse de a qué “cosas” se puede llamar conjunto. Así surgen diversas axiomatizaciones (la axiomática de Zermelo-Fraenkel, la teoría de clases de von Newman, los sistemas lógicos de Russell y Whitehead,...). Así por ejemplo, Von Newman distingue entre “conjuntos” y “clases”. En su sistema, casi totalmente formalizado, se diferencian en que las clases no pueden ser colocadas a la izquierda del signo Î. Se rehabilita la noción de “clase universal” empleada por los lógicos del XIX, pero naturalmente ¡no es un conjunto!. Por su parte Russell y Whitehead, que encabezaron la corriente logicista, hacen notar que todos los conjuntos paradójicos violan el “principio del círculo vicioso”, según el cual “un elemento cuya definición implica la totalidad de los elementos de un conjunto no puede pertenecer a dicho conjunto”. En el sistema de Russell y Whitehead la relación x Î x no puede estar legítimamente escrita. Si W fuese el “conjunto” de todos los conjuntos sería el conjunto más amplio, es decir, no existiría otro W’ (¹ W) tal que W Ì W’. Si fuese W Ï W, podríamos formar W’ = W È {W} que contendría propiamente a W, luego debe ser W Î W, por lo que se viola el principio del círculo vicioso y por tanto W sería un “conjunto paradójico”. TEMARIO DE MATEMÁTICAS. PRUEBA A

25

Volumen I. Matemáticas

26

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Asignaremos a todos los conjuntos que sean coordinables entre sí un mismo ente matemático, que ponga de manifiesto lo que de común tienen todos ellos al prescindir de la naturaleza de sus propios elementos. La relación de coordinabilidad entre conjuntos nos lleva, pues, a definir por abstracción lo que denominamos cardinal o potencia de un conjunto. A cualquier conjunto X, le asignaremos su cardinal Card(X) que será el mismo para todos los conjuntos de su clase. La equivalencia siguiente constituye por tanto la propia definición: Card(X) = Card(Y) Û X ~ Y A la clase constituida por el conjunto vacío le asignamos un cardinal que denotamos por 0. A la clase de todos los conjuntos unitarios le asignamos el cardinal que denotaremos por 1 Card(Æ) = 0 Card({m}) = 1

Volviendo a la relación de coordinabilidad entre conjuntos, sería más acertado interpretar X ~ Y como una “función proposicional de dos variables” X e Y que al ser sustituidas por dos conjuntos concretos nos da una proposición cierta o falsa. Sólo si tenemos “definido” el conjunto en el que se establece podremos hablar de relación binaria, que en virtud de las proposiciones 1, 2 y 3 del epígrafe anterior sería reflexiva, simétrica y transitiva, y por tanto una relación de equivalencia. El “axioma de elección” y el “axioma del infinito” vienen a evitar las paradojas que pudieran surgir. Si nos quedamos sólo con la clase Wf de todos los conjuntos “finitos” ( previamente hay que definir qué se entiende por conjunto “infinito”) la relación de coordinabilidad permite llegar al concepto de “cardinal finito”. El “axioma de elección” y el “axioma del infinito” vienen a evitar las paradojas que pudieran surgir. El segundo de los axiomas mencionados establece que los cardinales finitos constituyen un conjunto al que denominaremos N.

3.4. Potencia o cardinal de un conjunto

3.3. Conjuntos finitos e infinitos

Consideremos el segmento AB de la figura. Elijamos un “trozo” del mismo, por ejemplo el segmento AC, y sometamos este último a una traslación hasta llevarlo a la “posición” A’C’ (la traslación es una aplicación biyectiva peculiar que nos permite aceptar que A’C’ es el “mismo” segmento que el AC).

Un conjunto A que no es finito se denomina conjunto “infinito”. En tal caso existe un X Ì A, siendo X ¹ A, tal que X ~ A. Nota: Partiendo de otra definición de conjunto finito, la definición anterior se puede demostrar como teorema, es el famoso teorema de Dedekind, que a su vez es consecuencia de otro llamado teorema fundamental de la Aritmética, que dice que un conjunto finito no es coordinable con ningún otro conjunto del que forme parte. O

Figura 3.

A’

C’

DEFINICIÓN: “Un conjunto A es finito si no es coordinable con ninguno de sus subconjuntos propios”. Uniendo A con A’ y B con C’ obtendremos el punto O, que puede ser tomado como el centro de una homotecia que transforma el segmento A’C’ en el AB , siendo tal aplicación biunívoca. Así podemos llegar a asignar a cada punto de AB un punto de A’C’ y, por ende, uno de AC, y viceversa. Tendremos que es posible poner el conjunto de puntos del segmento AB en biyección con una parte propia del mismo. Esto no podremos hacerlo, por ejemplo, con el conjunto V = {a, e, i, o, u}. Decimos que mientras que el conjunto de puntos del segmento AB es “infinito”, el conjunto de las vocales es “finito”. C

A

B

Uniendo A con A’ y B con C’ obtendremos el punto O, que puede ser tomado como el centro de una homotecia que transforma el segmento A’C’ en el AB , siendo tal aplicación biunívoca. Así podemos llegar a asignar a cada punto de AB un punto de A’C’ y, por ende, uno de AC, y viceversa. Tendremos que es posible poner el conjunto de puntos del segmento AB en biyección con una parte propia del mismo. Esto no podremos hacerlo, por ejemplo, con el conjunto V = {a, e, i, o, u}. Decimos que mientras que el conjunto de puntos del segmento AB es “infinito”, el conjunto de las vocales es “finito”. A

C

B

DEFINICIÓN: “Un conjunto A es finito si no es coordinable con ninguno de sus subconjuntos propios”. A’

C’

Un conjunto A que no es finito se denomina conjunto “infinito”. En tal caso existe un X Ì A, siendo X ¹ A, tal que X ~ A. Nota: Partiendo de otra definición de conjunto finito, la definición anterior se puede demostrar como teorema, es el famoso teorema de Dedekind, que a su vez es consecuencia de otro llamado teorema fundamental de la Aritmética, que dice que un conjunto finito no es coordinable con ningún otro conjunto del que forme parte. Figura 3.

O

Consideremos el segmento AB de la figura. Elijamos un “trozo” del mismo, por ejemplo el segmento AC, y sometamos este último a una traslación hasta llevarlo a la “posición” A’C’ (la traslación es una aplicación biyectiva peculiar que nos permite aceptar que A’C’ es el “mismo” segmento que el AC).

3.3. Conjuntos finitos e infinitos

3.4. Potencia o cardinal de un conjunto

Asignaremos a todos los conjuntos que sean coordinables entre sí un mismo ente matemático, que ponga de manifiesto lo que de común tienen todos ellos al prescindir de la naturaleza de sus propios elementos. La relación de coordinabilidad entre conjuntos nos lleva, pues, a definir por abstracción lo que denominamos cardinal o potencia de un conjunto. A cualquier conjunto X, le asignaremos su cardinal Card(X) que será el mismo para todos los conjuntos de su clase. La equivalencia siguiente constituye por tanto la propia definición: Card(X) = Card(Y) Û X ~ Y A la clase constituida por el conjunto vacío le asignamos un cardinal que denotamos por 0. A la clase de todos los conjuntos unitarios le asignamos el cardinal que denotaremos por 1 Card(Æ) = 0 Card({m}) = 1

Volviendo a la relación de coordinabilidad entre conjuntos, sería más acertado interpretar X ~ Y como una “función proposicional de dos variables” X e Y que al ser sustituidas por dos conjuntos concretos nos da una proposición cierta o falsa. Sólo si tenemos “definido” el conjunto en el que se establece podremos hablar de relación binaria, que en virtud de las proposiciones 1, 2 y 3 del epígrafe anterior sería reflexiva, simétrica y transitiva, y por tanto una relación de equivalencia. El “axioma de elección” y el “axioma del infinito” vienen a evitar las paradojas que pudieran surgir. Si nos quedamos sólo con la clase Wf de todos los conjuntos “finitos” ( previamente hay que definir qué se entiende por conjunto “infinito”) la relación de coordinabilidad permite llegar al concepto de “cardinal finito”. El “axioma de elección” y el “axioma del infinito” vienen a evitar las paradojas que pudieran surgir. El segundo de los axiomas mencionados establece que los cardinales finitos constituyen un conjunto al que denominaremos N.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

26

Números naturales. Sistemas de numeración

3.5. Operaciones con cardinales a)

Adición Sean x = Card(X) e y = Card(Y). Es posible, por la proposición 5, escoger X e Y de modo que sean disjuntos. Entonces se define el cardinal suma como: x + y = Card(X È Y)

XÇY=Æ

– – – –

La proposición 4a garantiza que la suma no depende de los representantes X e Y tomados.



Como consecuencia, para dos conjuntos X e Y cualesquiera se cumple:

Para la conmutatividad basta tener en cuenta que X È Y = Y È X. La asociatividad asimismo se basa en (X È Y) È Z = X È (Y È Z). De X È Æ = Æ È X = X, siendo X Ç Æ = Æ, se desprende que 0 es neutro para la suma de cardinales. Card(X È Y) + Card(X Ç Y) = Card(X) + Card(Y)

b)

Multiplicación Dados dos cardinales x = Card(X) e y = Card(Y), se define el producto como: x.y = Card(X x Y)



La proposición 4b garantiza que la multiplicación está bien definida, es decir, el producto no depende de los representantes X e Y escogidos.



La aplicación f: X x Y ® Y x X dada por f(a,b) = (b,a) es biyectiva, por lo que X x Y ~ Y x X, de donde se deduce la conmutatividad.



Tomando g(a,(b,c)) = ((a,b),c) queda definida una biyección g: X x (Y x Z) ® (X x Y) x Z que justifica la asociativa.



Si {m} es un conjunto unitario, la biyección u(1,a) = a prueba que {m} x X ~ X y, por tanto, para cualquier cardinal x, se cumple 1 · x = x.



Dados x = Card(X), y = Card(Y), z = Card(Y), podemos escoger Y y Z de modo que sean disjuntos. Entonces la distributividad x · (y + z) = x · y + x · z es consecuencia de que para conjuntos se cumple que X x (Y È Z) = (X x Y) È (X x Z) y que si Y Ç Z también es (X x Y) Ç (X x Z) = Æ

Nótese que las operaciones anteriores no pueden considerarse leyes de composición interna en un conjunto hasta que no precisemos en qué conjunto.

3.6. Orden entre cardinales DEFINICIÓN: “Dados dos cardinales x = Card(X), y = Card(Y), decimos que x es menor o igual que y, escribiendo x £ y, si y sólo si existe una inyección de X en Y, o lo que es lo mismo X es equipotente a una parte de Y” La relación £ es independiente de los representantes escogidos. En sentido estricto, podemos poner que x < y cuando sea x £ y y x ¹ y. PROPIEDADES: 1. Para todo cardinal x = Card(X) se cumple x £ x La demostración es trivial. 2.

Dados dos cardinales x e y, entonces: x £ y e y £ x Þ x = y (Teorema de Cantor-Bernstein) Demostración: Sean x = Card(X), y = Card(Y). Si x £ y, existe una parte de Y de cardinal x, la tomamos como X. Si y £ x, existe una parte de X de cardinal y, la tomamos como Z.

TEMARIO DE MATEMÁTICAS. PRUEBA A

27

Volumen I. Matemáticas

28

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En ambos casos se concluye que x = y.

Entonces Card(Y) = Card(Z) = y, por lo cual existe una biyección f: Y ® Z, siendo Z = f(Y). Llamemos C = X – Z y formemos el conjunto: X

Y

Figura 4.

b

f

Y

S = C ∪ f(C) ∪ f f(C) ∪ … = C ∪ f(S) X

a’

f x

y

ìy si y Î S Definimos ahora la aplicación g(y) = í î f(y) si y Î Y – S f, g

y

x

g

Probaremos ahora que g es biunívoca de Y en X

f

b’

f

a

Si f(a) ¹ f(b), sea b’ = f(a) y a’ = f–1(b). Pongamos X” = X – {a’} e Y” = Y – {b’}. La restricción de f a X” es una biyección entre X” e Y”. Prolongándola con g(a’) = b’ obtendremos una biyección entre X e Y. g(Y) = C ∪ f(S) ∪ f(Y – S) = C ∪ f(Y) = C ∪ Z = (X – Z) ∪ Z = X

– –

b

Como puede ponerse S = C ∪ f(S), tendremos:

a

g(Y) = g(S ∪ (Y – S)) = g(S) ∪ g(Y – S) = S ∪ f(Y – S)

Luego ya hemos probado que g es sobreyectiva. Ahora nos queda probar que g es inyectiva. En efecto, g es inyectiva sobre S y sobre Y – S, por serlo f. Si f(a) = f(b), entonces la restricción de f a X es una biyección entre X e Y.

Veamos que g(S) ∩ g(Y – S) = ∅, o lo que es lo mismo S ∩ f(Y – S) = ∅, lo cual es cierto ya que f(Y – S) = f(Y) – f(S) = (f(Y) – C) – f(S) = f(Y) – C ∪ f(S) = f(Y) – S. Puesto que x + 1 = y + 1, existe una biyección entre X’ e Y’.

y + 1 = Card(Y’), siendo Y’ = Y È {b}

COROLARIO: “A Ì B Ì C y Card(A) = Card(C) Þ Card(A) = Card(B) = Card(C)” x + 1 = Card(X’), siendo X’= X È {a}

La implicación Ü es trivial, pues la suma de cardinales estaba bien definida. Sean x e y dos cardinales tales que x + 1 = y + 1 y sean X e Y tales que x = Card(X), y = Card(Y). Sean a y b dos elementos distintos y no pertenecientes a X È Y. Entonces: 3.

Dados tres cardinales x, y, z, entonces: x £ y e y £ z Þ x £ z Sean x = Card(X), y = Card(Y), z = Card(Z). x £ y Þ $ f: X ® Y inyectiva

LEMA: “Dados dos cardinales x e y cualesquiera: x + 1 = y + 1 Û x = y” y £ z Þ $ g: Y ® Z inyectiva

Entonces la aplicación compuesta g ° f es tambien inyectiva de X en Z. Luego x £ z.

3.7. Los números naturales como cardinales de los conjuntos finitos

3.7. Los números naturales como cardinales de los conjuntos finitos

Entonces la aplicación compuesta g ° f es tambien inyectiva de X en Z. Luego x £ z. y £ z Þ $ g: Y ® Z inyectiva

LEMA: “Dados dos cardinales x e y cualesquiera: x + 1 = y + 1 Û x = y” x £ y Þ $ f: X ® Y inyectiva

La implicación Ü es trivial, pues la suma de cardinales estaba bien definida. Sean x e y dos cardinales tales que x + 1 = y + 1 y sean X e Y tales que x = Card(X), y = Card(Y). Sean a y b dos elementos distintos y no pertenecientes a X È Y. Entonces: 3.

Dados tres cardinales x, y, z, entonces: x £ y e y £ z Þ x £ z Sean x = Card(X), y = Card(Y), z = Card(Z).

COROLARIO: “A Ì B Ì C y Card(A) = Card(C) Þ Card(A) = Card(B) = Card(C)” x + 1 = Card(X’), siendo X’= X È {a}

y + 1 = Card(Y’), siendo Y’ = Y È {b}

Veamos que g(S) ∩ g(Y – S) = ∅, o lo que es lo mismo S ∩ f(Y – S) = ∅, lo cual es cierto ya que f(Y – S) = f(Y) – f(S) = (f(Y) – C) – f(S) = f(Y) – C ∪ f(S) = f(Y) – S. Puesto que x + 1 = y + 1, existe una biyección entre X’ e Y’.

– –

Si f(a) = f(b), entonces la restricción de f a X es una biyección entre X e Y.

Luego ya hemos probado que g es sobreyectiva. Ahora nos queda probar que g es inyectiva. En efecto, g es inyectiva sobre S y sobre Y – S, por serlo f.

Si f(a) ¹ f(b), sea b’ = f(a) y a’ = f–1(b). Pongamos X” = X – {a’} e Y” = Y – {b’}. La restricción de f a X” es una biyección entre X” e Y”. Prolongándola con g(a’) = b’ obtendremos una biyección entre X e Y. g(Y) = C ∪ f(S) ∪ f(Y – S) = C ∪ f(Y) = C ∪ Z = (X – Z) ∪ Z = X

Como puede ponerse S = C ∪ f(S), tendremos: a

b

f

g(Y) = g(S ∪ (Y – S)) = g(S) ∪ g(Y – S) = S ∪ f(Y – S)

a

f

b’

Probaremos ahora que g es biunívoca de Y en X g

x

y f

ìy si y Î S Definimos ahora la aplicación g(y) = í î f(y) si y Î Y – S

x

y

f, g

a’

S = C ∪ f(C) ∪ f f(C) ∪ … = C ∪ f(S)

X

Y

X

f

b

Y

Figura 4.

Entonces Card(Y) = Card(Z) = y, por lo cual existe una biyección f: Y ® Z, siendo Z = f(Y). Llamemos C = X – Z y formemos el conjunto: En ambos casos se concluye que x = y.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

28

Números naturales. Sistemas de numeración La siguiente proposición nos dará una nueva caracterización de los conjuntos infinitos. PROPOSICIÓN: “A es infinito Û n = n + 1, donde n = Card(A)” Demostración: (Ü) Si n = n + 1, tomando un t Ï A, existe una biyección f: A È {t} ® A. Sea f(t) = a Î A; entonces la restricción g de f a A, es decir, g: A ® A – {a}, es una biyección. Luego A es equipotente a A – {a}, que es una parte propia de A. (Þ) Si A es infinito, existe B Ì A, siendo B ¹ A, y tal que B ~ A. Tendremos n = Card(A) = Card(B). Sea un a Î A – B, que existe por ser la inclusión estricta. Entonces: Card(BÈ{a}) = Card(B) + Card({a}) = n + 1 Como B È {a} Ì A, se cumple n + 1 £ n. Es obvio que n £ n + 1. Luego n = n + 1. DEFINICIONES:

– – –

Un cardinal n es finito si n ¹ n + 1 Un cardinal n es infinito si n = n + 1 Un conjunto es finito o infinito según lo sea su cardinal.

AXIOMA DEL INFINITO: “Los cardinales finitos constituyen un conjunto” Notemos que los cardinales no constituyen un conjunto, mientras que después de este axioma los cardinales finitos sí. Esto permitirá enunciar más cómodamente algunas propiedades. Más adelante se justificará también por qué a este axioma se le llama axioma del infinito. Llamamos número natural a todo cardinal finito, mientras que si X es un conjunto infinito Card(X) es llamado cardinal transfinito. Si consideramos el conjunto Wf de todos los conjunto finitos (éste ya no es paradójico), la relación de coordinabilidad antes definida resulta ser una relación binaria de equivalencia en Wf .Cada clase de equivalencia de las que constituyen el conjunto cociente Wf / ~ será un cardinal finito. Designaremos por N al conjunto de números naturales: N = Wf / ~. Vimos que 0 = Card(Æ) y 1 = Card({m}). Entonces, como Æ È {m} = {m}, se tiene 0 + 1 = 1 y, por tanto, 0 es un cardinal finito. Luego 0 Î N. Denotaremos en adelante N* = N –{0}.

3.8. N es un conjunto infinito PROPOSICIÓN: “La aplicación f: N ® N dada por f(n) = n + 1 (" n Î N) es una biyección de N en N*” Demostración: Para todo n Î N, también es n + 1 Î N. En efecto, si n ¹ n + 1 también será n + 1 ¹ (n + 1) + 1, pues en caso contrario, de n + 1 = (n + 1) + 1 el lema anterior nos daría n = n + 1, lo cual es contradictorio. Para todo n Î N, es n + 1¹ 0. Además el lema anterior garantiza que es inyectiva, pues: f(n) = f(m) Þ n + 1 = m + 1 Þ n = m Falta ver que f es sobreyectiva, o sea que " n Î N* $ m Î N / m + 1 = n. Dado n Î N*, será n = Card(X) con X ¹ Æ. Tomemos un a Î X, entonces el conjunto X’ = X – {a} cumple X = X’ È {a} y X’ Ç {a} = Æ. Por tanto, Card(X) = Card(X’) + 1. Luego m = Card(X’) es tal que f(m) = n. Además m es finito, pues si no, como m + 1 = n, n tampoco sería finito. DEFINICIÓN: “Para todo n Î N, el cardinal finito n + 1 se llama sucesor de n” Los números naturales x tales que n £ x se denominan siguientes de x. Al sucesor n + 1 le llamamos “siguiente inmediato”. TEMARIO DE MATEMÁTICAS. PRUEBA A

29

Volumen I. Matemáticas

30

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Nota: Puede probarse que para cardinales finitos la definición de £ obtenida por restricción de la dada para cardinales cualesquiera (existencia de una inyección de X en Y) es equivalente a “x £. y Û Û $ z Î N / x + z = y”. En efecto, si x £. y existe f: X ® Y inyectiva, de donde f: X ® f(X) es biyectiva, con lo que Card(X) = Card(f(X)) = x. Tomando Z = Y – f(X), tenemos Y = f(X) È Z y f(X) Ç Z = Æ. Si z = Card(Z), resulta y = Card(Y) = Card(f(X)) + Card(Z) = Card(X) + Card(Z) = x + z. La proposición anterior significa que en el conjunto N de los números naturales:

– – –

Todo elemento n tiene un sucesor único

Dos elementos diferentes tienen sucesores diferentes El 0 no es sucesor de ningún elemento.”

En los dos casos n Î A Þ n + 1 Î A. Luego A = N. En consecuencia podemos decir que la estructura de (N, £) es una cadena, es decir, un conjunto totalmente ordenado.

– –

CONSECUENCIAS Puesto que N = N* È {0} y N* Ç {0} = Æ, se tiene Card(N) = Card(N*) + 1. Ahora bien, N ~ N* por ser la aplicación f biyectiva, de donde Card(N*) = Card(N). Sustituyendo llegamos a Card(N) = Card(N) + 1. Por consiguiente:

En caso contrario n < y, y en consecuencia n + 1 £. y

Si y £. n, entonces como n £. n + 1 se tendrá y £. n + 1

En cuanto al orden que ya definimos para cardinales cualesquiera, al restringirlo a cardinales finitos tenemos una relación binaria £ en el conjunto N. Las propiedades ya vistas (incluido el teorema de Cantor-Bernstein) para cardinales cualesquiera, son válidas para cardinales finitos, por lo que la relación £ en N es reflexiva, antisimétrica y transitiva, y por tanto una relación de orden. La propiedad que garantiza que cualesquiera dos cardinales son comparables (Teorema de Zermelo) fue “admitida” sin demostración para cardinales cualesquiera. Para cardinales finitos supone la propiedad conexa de la relación £., es decir: " (x, y) Î N2: x £. y ó y £. x Si admitimos el principio de recurrencia, podemos formar el conjunto A = {x Î N/x es comparable con y} Se tiene que 0 Î A obviamente, pues " n Î N es 0 £ n. Si n Î A, entonces n £. y ó y £. n.



Card(N) no es un cardinal finito y el conjunto N es infinito. Se designa a Card(N) por Ào (se lee alef sub cero), que es un número transfinito.



Si Card(E) = Ào , decimos que E es infinito numerable (se puede poner en correspondencia biunívoca con N). Al número transfinito Ào se le llama también potencia del numerable.



Se ve aquí que el axioma del infinito se denomina así porque implica la existencia de un conjunto infinito.

3.9. Las operaciones y el orden en N

La adición y multiplicación de cardinales (cualesquiera) ya fueron estudiadas antes. Obviamente tanto las definiciones como las propiedades son válidas para cardinales finitos, esto es, para números naturales. Pero ahora disponemos de un conjunto N donde dichas operaciones son leyes de composición interna. Podemos establecer que (N, +, ·) es un semianillo abeliano con elemento unidad. Además pueden probarse otras propiedades como las siguientes, que no son válidas para cardinales no finitos:

Todo elemento de N* es regular para la multipicación. O lo que es lo mismo, " a Î N* la aplicación ga de N en N dada por ga: x ® a · x es inyectiva.

2.

Todo elemento de N es regular para la suma. O lo que es lo mismo, " a Î N la aplicación fa de N en N dada por fa: x ® a + x es inyectiva.

1.

La adición y multiplicación de cardinales (cualesquiera) ya fueron estudiadas antes. Obviamente tanto las definiciones como las propiedades son válidas para cardinales finitos, esto es, para números naturales. Pero ahora disponemos de un conjunto N donde dichas operaciones son leyes de composición interna. Podemos establecer que (N, +, ·) es un semianillo abeliano con elemento unidad. Además pueden probarse otras propiedades como las siguientes, que no son válidas para cardinales no finitos: 1.

Todo elemento de N es regular para la suma. O lo que es lo mismo, " a Î N la aplicación fa de N en N dada por fa: x ® a + x es inyectiva.

2.

Todo elemento de N* es regular para la multipicación. O lo que es lo mismo, " a Î N* la aplicación ga de N en N dada por ga: x ® a · x es inyectiva.

En cuanto al orden que ya definimos para cardinales cualesquiera, al restringirlo a cardinales finitos tenemos una relación binaria £ en el conjunto N. Las propiedades ya vistas (incluido el teorema de Cantor-Bernstein) para cardinales cualesquiera, son válidas para cardinales finitos, por lo que la relación £ en N es reflexiva, antisimétrica y transitiva, y por tanto una relación de orden. La propiedad que garantiza que cualesquiera dos cardinales son comparables (Teorema de Zermelo) fue “admitida” sin demostración para cardinales cualesquiera. Para cardinales finitos supone la propiedad conexa de la relación £., es decir: " (x, y) Î N2: x £. y ó y £. x Si admitimos el principio de recurrencia, podemos formar el conjunto A = {x Î N/x es comparable con y} Se tiene que 0 Î A obviamente, pues " n Î N es 0 £ n. Si n Î A, entonces n £. y ó y £. n.

3.9. Las operaciones y el orden en N

Se ve aquí que el axioma del infinito se denomina así porque implica la existencia de un conjunto infinito.



Si Card(E) = Ào , decimos que E es infinito numerable (se puede poner en correspondencia biunívoca con N). Al número transfinito Ào se le llama también potencia del numerable.



Card(N) no es un cardinal finito y el conjunto N es infinito. Se designa a Card(N) por Ào (se lee alef sub cero), que es un número transfinito.



CONSECUENCIAS Puesto que N = N* È {0} y N* Ç {0} = Æ, se tiene Card(N) = Card(N*) + 1. Ahora bien, N ~ N* por ser la aplicación f biyectiva, de donde Card(N*) = Card(N). Sustituyendo llegamos a Card(N) = Card(N) + 1. Por consiguiente:

– –

Si y £. n, entonces como n £. n + 1 se tendrá y £. n + 1 En caso contrario n < y, y en consecuencia n + 1 £. y

En los dos casos n Î A Þ n + 1 Î A. Luego A = N. En consecuencia podemos decir que la estructura de (N, £) es una cadena, es decir, un conjunto totalmente ordenado.

– – –

El 0 no es sucesor de ningún elemento.”

Nota: Puede probarse que para cardinales finitos la definición de £ obtenida por restricción de la dada para cardinales cualesquiera (existencia de una inyección de X en Y) es equivalente a “x £. y Û Û $ z Î N / x + z = y”. En efecto, si x £. y existe f: X ® Y inyectiva, de donde f: X ® f(X) es biyectiva, con lo que Card(X) = Card(f(X)) = x. Tomando Z = Y – f(X), tenemos Y = f(X) È Z y f(X) Ç Z = Æ. Si z = Card(Z), resulta y = Card(Y) = Card(f(X)) + Card(Z) = Card(X) + Card(Z) = x + z. Dos elementos diferentes tienen sucesores diferentes Todo elemento n tiene un sucesor único

La proposición anterior significa que en el conjunto N de los números naturales:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

30

Números naturales. Sistemas de numeración Al igual que en la construcción axiomática de N, se prueba la compatibilidad del orden con las operaciones. Leyes de monotonía 1.

a £ b, c Î N Þ a + c £ b + c

2.

a £ b, c Î N Þ a · c £ b · c

Sea Card(A) = a y Card(B) = b. Si a £ b, existe una inyección de A en B. Entonces podemos escoger un C tal que A Ç C = B Ç C = Æ. Sea Card(C) = c. ìx si x Î C es inyectiva y, por tanto, a + c £ b + c. AsiLa aplicación g: A È C ® B È C dada porg(x)í îf(x) si x Î A mismo la aplicación h: A · C ® B · C dada por h(x,y) = (f(x),y) es también inyectiva y, por tanto, a · c £ b · c. Con lo anterior resulta: (N, +, ·, £.) es un semianillo totalmente ordenado. Si definimos previamente la “relación de orden estricto” (x < y Û x £ y, x ¹ y) y la noción de “sección” o “segmento” de N ([a,n] = {x Î N / a £ x £ n}), podemos enunciar otras propiedades complementarias relativas al orden en N: a)

Para cualesquiera x e y de N es x < y si, y sólo si, x + 1 £ y.

b)

Para cualquier n Î N*, Card([1,n]) = n.

c)

En (N, £) el 0 es el primer elemento.

d)

En (N, £) no hay último elemento.

e)

Toda parte de N no vacía y mayorada tiene un último elemento.

f)

Toda parte no vacía de N tiene primer elemento (principio de buena ordenación).

g)

Para la relación de orden £, el conjunto N es arquimediano: " a Î N*, " b Î N: $ n Î N / n · a > b Probemos, por ejemplo, ésta última: Considerando el segmento [1,b].

– –

Si a Ï [1,b], el resultado es evidente, pues basta escoger n = 1 (ya que a > b) Si a Î [1,b], consideremos el conjunto A = {z Î N / $ x Î N, siendo z = x · a.

Sea B = A Ç [1,b]. El conjunto B es no vacío (al menos a Î B) y está mayorado (por b), por lo cual tendrá un elemento máximo. Supongamos que ese elemento máximo sea x · a; entonces (x + 1) · a Ï [1,b] y (x + 1) · a > b; bastará tomar n = x + 1 y se verificará na > b.

3.10. Propiedades de los conjuntos finitos a)

“Todo conjunto finito de cardinal n es equipotente al segmento [1,n]” Esta propiedad se puede tomar como definición de conjunto finito, equivalente a la dada. Se deduce como consecuencia inmediata de la propiedad b del epígrafe anterior.

b)

“Si A es finito y A ~ B, entonces B es finito” Si B fuese infinito existiría una biyección entre B y una de sus partes propias B1, y como A ~ B, tendríamos una biyección g entre A y B1. Ahora bien, por existir una biyección h entre A y B existe una biyección h1 entre A1 y B1, siendo A1 parte propia de A. Se deduce que h 1–1 o g sería una biyección entre A y A1, lo cual contradice que A es finito.

TEMARIO DE MATEMÁTICAS. PRUEBA A

31

Volumen I. Matemáticas

32

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

3 =2+ = {Æ,{Æ},{Æ,{Æ}}}, etc., etc.

c)

“Todo subconjunto de un conjunto finito A es también finito” Sea B un subconjunto propio de A. Si B fuera infinito existiría una biyección f entre B y una parte propia B1, que sería también parte propia de A. Si i es la biyección identidad sobre A – B podemos definir la aplicación g: A ® (A – B) È B1 dada por 2 = 1+ = {Æ,{Æ}} 1 = 0+ ={Æ} 0=Æ

ìf(x) si x Î B g(x) = í î x si x Î A – B

Hay procedimientos estándar para construir N, que se basan en identificar cada número natural con un conjunto-modelo, de manera que cada uno se va definiendo a partir del anterior. El axioma de recurrencia nos dice que todos los cardinales finitos pueden formarse así. El axioma del infinito garantiza que mediante este proceso obtenemos un conjunto infinito. que resulta ser una biyección entre A y una parte propia, lo cual contradice que A es finito.

d)

“Si A y B son finitos, entonces A È B y A · B son también finitos” La demostración es análoga a las anteriores.

e)

“Para toda parte A estrictamtente incluida en un conjunto finito E se tiene Card(A) < Card(E)” En efecto, A Ì E con A ¹ E, implica que E – A ¹ Æ y Card(E – A) ¹ Æ. Entonces de Card(A) + Card(E – A) = Card(E) resulta Card(A) < Card(E).

3.11. Construcción conjuntista recurrente

Omitiremos la demostración, que puede hacerse como ejercicio. Después de estudiar a lo largo del tema las propiedades de los conjuntos finitos, podemos ver que algunas de ellas pueden constituir por sí mismas la propia definición de conjunto finito. A modo de conclusión podemos decir que: “Un conjunto A es finito si verfica cualquiera de las siguientes proposiciones (todas ellas equivalentes): 1. Es posible ordenarlo de modo que tenga primer y último elemento. 2. Todo subconjunto de A tiene primer y último elemento. 3. A no es equipotente a ningún subconjunto propio de A. 4. O bien A es vacío, o bien coordinable con una sección [1,n] de N” f)

“Para cualesquiera dos conjuntos finitos X e Y se tiene: a) Card(X) + Card(Y) = Card(X È Y) + Card(X Ç Y) b)

Card(X) · Card(Y) = Card (X · Y)”

El apartado b) es la definición de producto de cardinales, válida a fortiori para los cardinales finitos. Probemos el apartado a): Sean Card(X) = x, Card(Y) = y, Z = X Ç Y, Card(Z) = z, Y’ = Y – X, Card(Y’) = y’. Entonces Y’ È Z = Y e Y’ Ç Z = Æ, por lo cual: y’ + Card(X Ç Y) = y Además X È Y’ = X È Y y X Ç Y’ = Æ, por lo cual: Card(X È Y) = x + y’ Sumando m.a.m. y al ser y’ regular, queda Card(X È Y) + Card(X Ç Y) = x + y (1) f es inyectiva

g)

(2) f es suprayectiva

(3) f es biyectiva”

“Si E y F son dos conjuntos finitos equipotentes, y f una aplicación de E en F, las afirmaciones siguientes son equivalentes: Sean Card(X) = x, Card(Y) = y, Z = X Ç Y, Card(Z) = z, Y’ = Y – X, Card(Y’) = y’. Entonces Y’ È Z = Y e Y’ Ç Z = Æ, por lo cual: y’ + Card(X Ç Y) = y Además X È Y’ = X È Y y X Ç Y’ = Æ, por lo cual: Card(X È Y) = x + y’ Sumando m.a.m. y al ser y’ regular, queda Card(X È Y) + Card(X Ç Y) = x + y

g)

“Si E y F son dos conjuntos finitos equipotentes, y f una aplicación de E en F, las afirmaciones siguientes son equivalentes: (1) f es inyectiva

(2) f es suprayectiva

(3) f es biyectiva”

Omitiremos la demostración, que puede hacerse como ejercicio. Después de estudiar a lo largo del tema las propiedades de los conjuntos finitos, podemos ver que algunas de ellas pueden constituir por sí mismas la propia definición de conjunto finito. A modo de conclusión podemos decir que: “Un conjunto A es finito si verfica cualquiera de las siguientes proposiciones (todas ellas equivalentes): 1. Es posible ordenarlo de modo que tenga primer y último elemento. 2. Todo subconjunto de A tiene primer y último elemento. 3. A no es equipotente a ningún subconjunto propio de A. 4. O bien A es vacío, o bien coordinable con una sección [1,n] de N”

El apartado b) es la definición de producto de cardinales, válida a fortiori para los cardinales finitos. Probemos el apartado a): b)

Card(X) · Card(Y) = Card (X · Y)”

“Para cualesquiera dos conjuntos finitos X e Y se tiene: a) Card(X) + Card(Y) = Card(X È Y) + Card(X Ç Y)

f)

“Para toda parte A estrictamtente incluida en un conjunto finito E se tiene Card(A) < Card(E)” En efecto, A Ì E con A ¹ E, implica que E – A ¹ Æ y Card(E – A) ¹ Æ. Entonces de Card(A) + Card(E – A) = Card(E) resulta Card(A) < Card(E).

e)

“Si A y B son finitos, entonces A È B y A · B son también finitos” La demostración es análoga a las anteriores.

d)

3.11. Construcción conjuntista recurrente

Hay procedimientos estándar para construir N, que se basan en identificar cada número natural con un conjunto-modelo, de manera que cada uno se va definiendo a partir del anterior. El axioma de recurrencia nos dice que todos los cardinales finitos pueden formarse así. El axioma del infinito garantiza que mediante este proceso obtenemos un conjunto infinito. que resulta ser una biyección entre A y una parte propia, lo cual contradice que A es finito. ìf(x) si x Î B g(x) = í î x si x Î A – B

0=Æ

“Todo subconjunto de un conjunto finito A es también finito” Sea B un subconjunto propio de A. Si B fuera infinito existiría una biyección f entre B y una parte propia B1, que sería también parte propia de A. Si i es la biyección identidad sobre A – B podemos definir la aplicación g: A ® (A – B) È B1 dada por 1 = 0+ ={Æ}

2 = 1+ = {Æ,{Æ}}

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

32

c)

3 =2+ = {Æ,{Æ},{Æ,{Æ}}}, etc., etc.

Números naturales. Sistemas de numeración O bien: 0=Æ 0+ = 0 È {0} = {0} = 1 1+ = 1È{1}= {0,1}= 2 2+ = 2 È {2} = {0, 1, 2} = 3, etc., etc., etc. La idea clave de esta construcción es que si definimos el sucesor de un conjunto A como el conjunto A+ = A È {A}, entonces se cumple una propiedad que es crucial: A Ì X Ì A + Þ X = A ó X = A+ En efecto, si fuese X ¹ A, existirá algún elemento x tal que x Î X y x Ï A, pero como X Ì A+ debe ser x Î A+ = A È {A}. Puesto que x Ï A, será x Î {A}, y por tanto x = A.

4. SISTEMAS DE NUMERACIÓN 4.1. Introducción histórica Hace unos 5.000 años los egipcios empezaron utilizando un sistema de numeración jeroglífico basado en una escala numérica de base 10 y en un sencillo esquema iterativo. Posteriormente los numerales no aparecen en la forma jeroglífica sino en la forma conocida como “hierática” (o sagrada). El sistema de numeración sigue siendo decimal, pero el tedioso principio repetitivo de la numeración jeroglífica se ve reemplazado por la introducción de cifras o símbolos especiales para representar los dígitos y los múltiplos de las potencias de 10. Miles de tablillas descubiertas, procedentes de la dinastía Hammurabí (1.800 a 1.600 a.C.), muestran que los babilonios tenían un sistema de numeración ya completamente desarrollado, en el cual el sistema decimal quedaba sumergido bajo un sistema en el que la base fundamental era 60. Para números pequeños la analogía entre el sistema jeroglífico egipcio y el sistema cuneiforme babilónico es evidente. Pero más allá del número 59 los sistemas egipcio y mesopotámico difieren sustancialmente, porque los babilonios intuyeron que bastaba con sus dos símbolos del 1 y del 10 para representar cualquier número. Esto ocurrió hace más de 4.000 años con la invención del sistema de notación posicional, con el mismo fundamento que nuestro sistema de numeración actual. Sin embargo no fueron capaces de inventar una forma clara de representar una “posición vacía” en un numeral, es decir, no dispusieron de un símbolo para el cero en su sentido no cardinal sino posicional. La frase “Todo es número” de Pitágoras resume el misticismo numérico que caracterizó a la numerología de los antiguos griegos. Los pitagóricos llevaron el culto a los números hasta su extremo, basando en él tanto su filosofía como su método de vida. Cada número tenía sus propiedades especiales, pero el más sagrado de todos era el número diez o tetractis. En términos generales parece haber existido dos sistemas de numeración principales en Grecia, ambos basados en una escala de base diez. El más primitivo recibe el nombre de sistema de notación “ático” o “herodiánico” y consiste en un simple esquema iterativo que está emparentado con la numeración jeroglífica egipcia anterior y con los numerales romanos posteriores. En cambio, el cifrado del posterior sistema “jónico” o “alfabético” parece sugerir que los helenos tenían en la cabeza el principio posicional, pero lo cierto es que no terminaron de ver del todo las ventajas de este paso. Los romanos utilizaron los grafismos conocidos como cifras romanas, que, como las griegas “acrofónicas”, no eran mas que abreviaturas destinadas a conocer y retener los números. Pero este sistema no servía para hacer cálculos, por lo que siempre recurrían al ábaco. Los romanos complicaron los sistemas anteriores basados en el principio aditivo de la yuxtaposición, introduciendo la regla de que todo signo numérico colocado a la izquierda de otro de mayor valor se resta. Vemos cómo una civilización que alcanzó en pocos siglos un nivel técnico muy alto, conservó durante toda su existencia un sistema de numeración inútilmente complicado, no operacional y que denota un pensamiento muy arcaico. La grafía de las cifras romanas, así como la práctica simultánea del principio aditivo y del principio de la resta, lógicamente contradictorios en un sistema de numeración, constituyen los vestigios de un pasado lejano en donde el pensamiento lógico todavía no se había desarrollado del todo. TEMARIO DE MATEMÁTICAS. PRUEBA A

33

Volumen I. Matemáticas

34

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

La creencia de que nuestro sistema de numeración procede de los árabes es falsa. La exposición del sistema hindú que el samánida Al-Khowarizmi, matemático y astrónomo, hace en uno de sus libros era tan completa, que las traducciones latinas posteriores le atribuían la autoría no sólo de la obra sino también del

El sistema de numeración de los chinos permaneció esencialmente decimal y su aportación principal fue la introducción de una nueva regla, el principio multiplicativo, que ampliaba considerablemente las posibilidades de representación de números grandes y acababa con las limitaciones del viejo principio de la suma de egipcios y griegos. En China se utilizaron dos esquemas de notación distintos desde los tiempos más primitivos. En uno de ellos predominaba el principio multiplicativo, mientras que en otro se utilizaba una forma de notación posicional. El sistema de los “numerales a base de varillas” o “cifras de bambú” se utilizaba ya varios siglos antes de nuestra era, mucho antes de que adoptase el sistema de notación posicional en la India. Las varillas acabaron siendo sustituidas por un marco rígido con bolas movibles a lo largo de barras paralelas, que resultaba más cómodo para la computación. Las versiones más modernas de estas variantes del ábaco, son el sua phan chino y su pariente japonés el soroban. El uso de un sistema posicional centesimal más que decimal en China resultó más conveniente para la adaptación de los cálculos a la tabla de calcular. Un hito importante en la historia de la numeración fue la aparición del cero que ocurrió independientemente, según todos los indicios, tanto en el mundo occidental como en el oriental asiático. No obstante, la invención del cero se atribuye a la civilización precolombina de los indios mayas de Yucatán, en América Central. Si bien los babilonios habían introducido un signo para sortear el inconveniente de las “posiciones vacías”, el uso que hicieron de ese “cero babilonio” fue bastante ambiguo. Los mayas representaban las posiciones vacías por un símbolo que recuerda a un ojo semiabierto y que constituía un verdadero “cero”, que utilizaban tanto en la posiciones intermedias como en las finales. Los descubrimientos de los mayas escaparon a la mayoría de los pueblos, en particular a los occidentales, que tuvieron que esperar a la Edad Media para que les llegaran a través de los árabes, quienes a su vez los habían recibido de los hindúes. Puede decirse que la India fue la cuna de la civilización moderna . La idea del valor local o posicional estaba presente en el sistema de numeración babilónico, pero los hindúes se dieron cuenta de que era también aplicable al sistema de notación decimal. De los numerales cifrados hindúes hasta nuestra notación moderna hubo que superar únicamente dos pasos: uno consistente en reconocer que, utilizando estrictamente el principio posicional, las cifras que representan los nueve primeros números pueden servir para representar los múltiplos correspondientes de cualquier potencia de 10; otro, la introducción de una notación especial para una posición que falte o, lo que es lo mismo, de un símbolo para el cero. Parece evidente que la reducción a nueve cifras tuvo lugar en la India, fruto probablemente de sus intercambios occidentales con Persia y orientales con China. Hay que hacer notar, sin embargo, que la referencia a nueve símbolos y no a diez implica que los hindúes no habían superado aún el segundo paso hacia el sistema de numeración moderno. La primera aparición indudable del cero en la India es una inscripción del año 876, o sea, más de dos siglos después de la primera referencia conocida a los otros nueve numerales. Es muy posible que el cero tuviera su origen en el mundo griego, probablemente en Alejandría, y que desde allí se propagase a la India. Los hindúes utilizaban la forma de un redondo huevo de oca, que durante un tiempo se creyó que tenía su origen en la letra griega “omicron”, que es la inicial de la palabra griega “ouden” o vacío, pero investigaciones recientes han desestimado esta tesis. Sea como sea, el genio hindú reunió en su “cero” dos nociones complejas aparentemente distintas : la de ausencia (“vacío”) y la de nulidad ( “nada”); es decir, lo enriquecieron con la adquisición del sentido que damos hoy día a “cifra-cero” o “cantidad nula”. Por tanto, aunque las formas hindúes medievales de las diez cifras son muy diferentes a las que usamos hoy día, podemos decir que fue en el norte de la India, alrededor del siglo V de la era cristiana, donde nació el antecesor de nuestro sistema de numeración moderno, que quedó establecido definitivamente en una nueva combinación de tres principios básicos, todos ellos de un origen mucho más antiguo: Una forma cifrada para cada uno de los diez numerales básicos.

3.

Una notación posicional.

2.

Una base decimal.

1.

El sistema de numeración de los chinos permaneció esencialmente decimal y su aportación principal fue la introducción de una nueva regla, el principio multiplicativo, que ampliaba considerablemente las posibilidades de representación de números grandes y acababa con las limitaciones del viejo principio de la suma de egipcios y griegos. En China se utilizaron dos esquemas de notación distintos desde los tiempos más primitivos. En uno de ellos predominaba el principio multiplicativo, mientras que en otro se utilizaba una forma de notación posicional. El sistema de los “numerales a base de varillas” o “cifras de bambú” se utilizaba ya varios siglos antes de nuestra era, mucho antes de que adoptase el sistema de notación posicional en la India. Las varillas acabaron siendo sustituidas por un marco rígido con bolas movibles a lo largo de barras paralelas, que resultaba más cómodo para la computación. Las versiones más modernas de estas variantes del ábaco, son el sua phan chino y su pariente japonés el soroban. El uso de un sistema posicional centesimal más que decimal en China resultó más conveniente para la adaptación de los cálculos a la tabla de calcular. Un hito importante en la historia de la numeración fue la aparición del cero que ocurrió independientemente, según todos los indicios, tanto en el mundo occidental como en el oriental asiático. No obstante, la invención del cero se atribuye a la civilización precolombina de los indios mayas de Yucatán, en América Central. Si bien los babilonios habían introducido un signo para sortear el inconveniente de las “posiciones vacías”, el uso que hicieron de ese “cero babilonio” fue bastante ambiguo. Los mayas representaban las posiciones vacías por un símbolo que recuerda a un ojo semiabierto y que constituía un verdadero “cero”, que utilizaban tanto en la posiciones intermedias como en las finales. Los descubrimientos de los mayas escaparon a la mayoría de los pueblos, en particular a los occidentales, que tuvieron que esperar a la Edad Media para que les llegaran a través de los árabes, quienes a su vez los habían recibido de los hindúes. Puede decirse que la India fue la cuna de la civilización moderna . La idea del valor local o posicional estaba presente en el sistema de numeración babilónico, pero los hindúes se dieron cuenta de que era también aplicable al sistema de notación decimal. De los numerales cifrados hindúes hasta nuestra notación moderna hubo que superar únicamente dos pasos: uno consistente en reconocer que, utilizando estrictamente el principio posicional, las cifras que representan los nueve primeros números pueden servir para representar los múltiplos correspondientes de cualquier potencia de 10; otro, la introducción de una notación especial para una posición que falte o, lo que es lo mismo, de un símbolo para el cero. Parece evidente que la reducción a nueve cifras tuvo lugar en la India, fruto probablemente de sus intercambios occidentales con Persia y orientales con China. Hay que hacer notar, sin embargo, que la referencia a nueve símbolos y no a diez implica que los hindúes no habían superado aún el segundo paso hacia el sistema de numeración moderno. La primera aparición indudable del cero en la India es una inscripción del año 876, o sea, más de dos siglos después de la primera referencia conocida a los otros nueve numerales. Es muy posible que el cero tuviera su origen en el mundo griego, probablemente en Alejandría, y que desde allí se propagase a la India. Los hindúes utilizaban la forma de un redondo huevo de oca, que durante un tiempo se creyó que tenía su origen en la letra griega “omicron”, que es la inicial de la palabra griega “ouden” o vacío, pero investigaciones recientes han desestimado esta tesis. Sea como sea, el genio hindú reunió en su “cero” dos nociones complejas aparentemente distintas : la de ausencia (“vacío”) y la de nulidad ( “nada”); es decir, lo enriquecieron con la adquisición del sentido que damos hoy día a “cifra-cero” o “cantidad nula”. Por tanto, aunque las formas hindúes medievales de las diez cifras son muy diferentes a las que usamos hoy día, podemos decir que fue en el norte de la India, alrededor del siglo V de la era cristiana, donde nació el antecesor de nuestro sistema de numeración moderno, que quedó establecido definitivamente en una nueva combinación de tres principios básicos, todos ellos de un origen mucho más antiguo: 1.

Una base decimal.

2.

Una notación posicional.

3.

Una forma cifrada para cada uno de los diez numerales básicos.

La creencia de que nuestro sistema de numeración procede de los árabes es falsa. La exposición del sistema hindú que el samánida Al-Khowarizmi, matemático y astrónomo, hace en uno de sus libros era tan completa, que las traducciones latinas posteriores le atribuían la autoría no sólo de la obra sino también del CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

34

Números naturales. Sistemas de numeración sistema de numeración expuesto en ella, que por deformaciones en la transmisión pasó denominarse algorismi. De aquí procede la palabra actual algoritmo con que conocemos a cualquier procedimiento operativo para resolver un problema. Sería más correcto llamar a nuestro sistema de numeración sistema hindú-árabe, ya que los árabes lo que hicieron fue adoptar los principios del sistema de numeración hindú y garantizar su continuidad transmitiéndolo a Europa. De cualquier manera los numerales indoarábigos no se establecieron de manera definitiva hasta el siglo XIII, destacando dos hitos importantes en la transmisión cultural: las cruzadas religiosas y las escuelas de traductores. A pesar de ello la transición del sistema de numeración romano al decimal indoárabigo fue sorprendentemente lenta. Quizás fuera debido a que el uso del ábaco estaba tan arraigado que no se apreciaban las ventajas del nuevo sistema para calcular algorítmicamente. Muchos autores del siglo XII se esforzaron en popularizar el “algorismo”. Entre ellos destacó de manera especial Leonardo de Pisa (1180-1250), más conocido como Fibonacci, quien en su famoso y paradójicamente titulado Liber Abaci, hace un tratado completo de los métodos algebraicos árabes, incluido el uso de los numerales indoarábigos que recomienda enérgicamente. Describe las “nueve formas hindúes” junto con el zephirum, palabra árabe de la que se derivan las nuestras “cifra” y “cero”. Durante varios siglos hubo una feroz competencia entre “abacistas” y “algoristas” que culminó con la victoria definitiva de estos últimos hacia el siglo XVI. Podemos decir que, al generalizarse y normalizarse el uso de las cifras árabes en Europa, quedó ya consolidado nuestro actual sistema de numeración.

4.2. Sistemas de numeración. Nociones generales Al ser infinita la serie de los números naturales, obviamente no podemos utilizar un símbolo particular para cada uno de ellos. Entonces es preciso un conjunto finito de signos (palabras, iconos, etc.) que, combinados mediante unas cuantas reglas o convenios, permitan simbolizar cualquier número natural. Denominamos “sistema de numeración” al conjunto normas y convenios que se utilizan para representar todos los números naturales, mediante la adecuada combinación de un grupo reducido de signos De esa forma, cada número cardinal (ente abstracto) tendrá “representaciones” diferentes según el sistema de numeración utilizado. Los signos o símbolos básicos se llaman cifras, guarismos o dígitos del sistema. Nos referiremos a sistemas de numeración posicional basados en el principio del valor relativo, como nuestro sistema de numeración decimal, excluyendo de nuestro estudio aquellos como el sistema romano, que no utilizan dicho principio. Esencialmente se establece un número “b” como base del sistema de numeración, y los b primeros números naturales (empezando por el “cero”), es decir, desde el 0 hasta b-1 unidades simples o de primer orden, se simbolizan por sus correspondientes guarismos o cifras. Al llegar a b unidades se introduce la unidad de segundo orden (en el caso de base 10, la “decena”); así b unidades simples constituyen una de segundo orden; después b unidades de segundo orden, una unidad de tercer orden (en caso de base 10, la “centena”), y así sucesivamente, cada b unidades de un orden constituyen una del orden inmediato superior. De este modo en el sistema de numeración de base b utilizamos b guarismos o cifras, que simbolizan los números desde el 0 hasta el b-1. El principio del valor relativo permite utilizar el mismo guarismo para expresar ese número de unidades simples o ese mismo número de unidades de otro orden superior, dependiendo del lugar o posición que ocupe dicho guarismo en la escritura. Cualquier cardinal quedará expresado por una sucesión finita de esos guarismos elegidos. El sistema decimal (base 10), es indudablemente el de uso más extendido actualmente, lográndose imponer a lo largo de la historia a todos los demás por su ventajas en el cálculo algorítmico. Algunos sistemas de numeración han quedado relegados al simple interés histórico, como el sistema quinario (base 5), utilizado por algunas civilizaciones antiguas y que tiene su génesis en el cálculo con los dedos de una mano, o el viejo sistema sexagesimal (base 60) mesopotámico, del que son vestigios el sistema de medida de ángulos y del tiempo. TEMARIO DE MATEMÁTICAS. PRUEBA A

35

Volumen I. Matemáticas

36

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

y por tanto la expresión polinómica de n es única.

El mundo de la informática ha otorgado una relevancia especial al sistema binario (base 2), que sólo utiliza los dígitos 0 y 1 y es usado por los computadores para la codificación interna de la información. Otros sistemas cuya base es una potencia de 2, también se usan en el cálculo automático, tales como es sistema octal (base 8) o el sistema hexadecimal(base 16). a0 = a’0;

a1 = a’1;

ak = a’k

...;

Agotando hasta el final el proceso anterior concluiremos que: a1 = a’1;

q2 = a’2 + a’3b + a’4b2 + … + a’kbk–2

4.3. Teorema fundamental de la numeración

Entonces a’1 y a’2 + a’3b + … + a’kbk–2 son respectivamente el resto y el cociente de dividir q1 entre b, y de nuevo por la uniformidad de la división entera:

Dada una base b (b Î N y b > 1), entonces todo número natural n Î N puede expresarse de manera única como: q1 = a’1 + (a’2 + a’3b + … + a’kbk–2)b

[*], siendo aj Î N y aj< b (j = 0, 1, ..., k)”

Volviendo a sacar b factor común en esta última:

n = a0 + a 1 b + a 2 b 2 + a 3 b 3 + … + a k b k

La expresión [*] recibe el nombre de expresión polinómica del número n en la base b. a0 = a’0;

q1 = a’1 + a’2b + a’3b2 + … + a’kbk–1

Demostración: Si fuese n < b, quedaría demostrado tomando a0 = n y todos los demás aj nulos. Supongamos ahora que n ³ b. Efectuamos la división euclídea de n entre b, obteniendo un cociente q1 y un resto a0, que nos permiten poner n = a0 + q1b con a0 < b. Si fuese q1 < b, ya estaría acabado el proceso; en caso contrario q1 ³ b, volvemos a efectuar la división de q1 entre b, y así sucesivamente vamos reiterando el proceso hasta llegar a un cociente qk menor que b (en efecto, el proceso anterior es finito ya que n > q1 > q2 > ...). Es decir: n = a0 + q1b; a0 < b n b q 1 = a1 + q2b; a1< b b q1 a0 q2 = a2 + q3b; a2 < b a1 q2 :::::::::::::::::::::::::::::::::::: qk – 1 b qk–1 = ak–1 + qkb; ak–1 < b qk – 1 qk = ak qk = ak; ak < b

Sacando factor común b: n = a’0 + (a’1 + a’2b + a’3b2 + … + a’kbk–1)b Entonces a’0 y a’1 + a’2b + a’3b2 + … + a’kbk son respectivamente el resto y el cociente de dividir n entre b, y como la división es uniforme, se tendrá: n = a’0 + a’1b + a’2b2 + a’3b3 + … + a’kbk, con a’j < b

Ahora hemos de probar la unicidad. Supongamos que hubiese otra expresión polinómica en la base b del número n:

la base b.

j=1

quedaría la expresión buscada n = åa jb j, a la cual denominamos expresión polinómica del número n en k

Si sustituimos cada una de las igualdades anteriores en la anterior, se eliminan los cocientes qj y nos qk – 1

qk – 1

qk =

n = a0 + q1b; a0 < b q1 = a1 + q2b; a1< b q2 = a2 + q3b; a2 < b :::::::::::::::::::::::::::::::::::: qk–1 = ak–1 + qkb; ak–1 < b qk = ak; ak < b

ak

b

Si sustituimos cada una de las igualdades anteriores en la anterior, se eliminan los cocientes qj y nos k

quedaría la expresión buscada n = åa jb j, a la cual denominamos expresión polinómica del número n en a0 n

q2

b q1 a1

b

j=1

la base b.

Ahora hemos de probar la unicidad. Supongamos que hubiese otra expresión polinómica en la base b del número n:

Demostración: Si fuese n < b, quedaría demostrado tomando a0 = n y todos los demás aj nulos. Supongamos ahora que n ³ b. Efectuamos la división euclídea de n entre b, obteniendo un cociente q1 y un resto a0, que nos permiten poner n = a0 + q1b con a0 < b. Si fuese q1 < b, ya estaría acabado el proceso; en caso contrario q1 ³ b, volvemos a efectuar la división de q1 entre b, y así sucesivamente vamos reiterando el proceso hasta llegar a un cociente qk menor que b (en efecto, el proceso anterior es finito ya que n > q1 > q2 > ...). Es decir: n = a’0 + a’1b + a’2b2 + a’3b3 + … + a’kbk, con a’j < b

Sacando factor común b: n = a’0 + (a’1 + a’2b + a’3b2 + … + a’kbk–1)b Entonces a’0 y a’1 + a’2b + a’3b2 + … + a’kbk son respectivamente el resto y el cociente de dividir n entre b, y como la división es uniforme, se tendrá: a0 = a’0;

q1 = a’1 + a’2b + a’3b2 + … + a’kbk–1

La expresión [*] recibe el nombre de expresión polinómica del número n en la base b. n = a0 + a 1 b + a 2 b 2 + a 3 b 3 + … + a k b k

Volviendo a sacar b factor común en esta última: [*], siendo aj Î N y aj< b (j = 0, 1, ..., k)”

q1 = a’1 + (a’2 + a’3b + … + a’kbk–2)b

Dada una base b (b Î N y b > 1), entonces todo número natural n Î N puede expresarse de manera única como:

Entonces a’1 y a’2 + a’3b + … + a’kbk–2 son respectivamente el resto y el cociente de dividir q1 entre b, y de nuevo por la uniformidad de la división entera:

4.3. Teorema fundamental de la numeración

a1 = a’1;

q2 = a’2 + a’3b + a’4b2 + … + a’kbk–2

Agotando hasta el final el proceso anterior concluiremos que:

El mundo de la informática ha otorgado una relevancia especial al sistema binario (base 2), que sólo utiliza los dígitos 0 y 1 y es usado por los computadores para la codificación interna de la información. Otros sistemas cuya base es una potencia de 2, también se usan en el cálculo automático, tales como es sistema octal (base 8) o el sistema hexadecimal(base 16). a0 = a’0;

a1 = a’1;

...;

ak = a’k

y por tanto la expresión polinómica de n es única.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

36

Números naturales. Sistemas de numeración

4.4. Consecuencia: el principio del valor relativo Puesto que todos los coeficientes aj en la expresión polinómica de n son menores que la base b, al escoger un guarismo para cada una de los cardinales desde 0 hasta b – 1, podemos concluir que cada uno de los aj es uno de los b guarismos elegidos en el sistema de numeración, es decir, todos los aj se escriben con una sola cifra. De ese modo el número natural n se puede expresar escribiendo ordenadamente sus cifras como n = ak ak–1 ... a2 a1 a0 o bien, si se quiere especificar la base, n = ak ak–1 ... a2 a1 a0 (b Entonces se adopta el siguiente convenio: “si se escriben sucesivamente, de modo ordenado, las cifras de un número, el orden de las unidades que cada una representa viene dado por el orden que ocupa en la escritura del número” (principio del valor relativo). Así pues, en la expresión n = akak–1 … a2 a1 a0 la cifra aj representa las unidades de orden j + 1.

4.5. Propiedades de la numeración PROPOSICIÓN 1: “Si el número n se escribe ak ak–1 ... a2 a1 a0 en la base b, entonces el número n · bh, que resulta de multiplicar n por una potencia de la base, se escribe añadiendo h ceros a la derecha”. Es trivial, pues si n = a0 + a1b + a2b2 + … + a kbk entonces: n · bh = a0bh + a1bh +1 + a2bh +2 + … + a kbh+k = h–1 = 01 b 0 + 0× b1 2 + 4444 ... + 0× b3 + a 0b h + a1b h+1 + ... + a kb h+k, de donde ×4444 h términos

n · bh = ak ak–1 … a2 a1 a0 00...00 123 h ceros

PROPOSICIÓN 2: “Si el número natural m escrito en la base b tiene p cifras, entonces dicho número está comprendido entre bp–1 y b p. El recíproco también es cierto.” m (b tiene p cifras Û bp–1 £ m < b p Demostración: (Þ) En efecto, si m tiene p cifras es m = a p–1bp–1 + ap–2bp–2 + … + a2b2 + a1b + a0 ³ bp–1, como resulta obvio. Vamos a probar ahora que m < b p. Como a0 , a1, a2, ..., ap–1 < b, se tendrá: a1b + a0 < a1b + b = (a1 + 1) · b £ b2 a2b + a1b + a0 < a2b2 + b2 = (a2 + 1) · b2 £ b3 ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: m = a p–1bp–1 + ap–2bp–2 + … + a2b2 + a1b +a0 < ap–1bp–1 + bp–1 = (ap–1 + 1) · bp–1 £ bp 2

(Ü) Sea bp–1 £ m < b p y supongamos que m no tuviera p cifras, lo cual significa que m tuviera menos de p cifras o más de p cifras. En el primero de los casos, podemos suponer que m tiene p – 1 cifras y entonces por la implicación anterior sería bp–1 £ m < b p, lo que contradice la hipótesis. De igual modo, en el segundo caso podemos suponer que m tiene p + 1 cifras y entonces llegaríamos igualmente a la contradicción bp £ m < b p+1. Por tanto m no puede tener ni menos ni más de p cifras. PROPOSICIÓN 3: “Dados dos números m y n , que tienen respectivamente p y k cifras al expresarlos en la base b, entonces: p < k Þ m < n” En efecto, por la proposición 2 se tendrá: m tiene p cifras Þ bp–1 £ m < bp n tiene k cifras Þ bk–1 £ n < bk Como p < k, se tiene p £ k – 1, y de aquí bp £ bk–1. Por tanto m < bp £ bk–1 £ n. TEMARIO DE MATEMÁTICAS. PRUEBA A

37

Volumen I. Matemáticas

38

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

PROPOSICIÓN 4: “Si m y n tienen igual número de cifras expresados en la base b, entonces m < n si y sólo si la cifra de mayor orden de m (primera empezando por la izquierda) que es distinta a su correspondiente en n, es menor que ésta” n

n (b

n (b’

Cambio de base b a base 10

Cambio de base 10 a base b’

Demostración: (Ü) Supongamos que m y n tienen ambos p cifras. Sea aj la primera cifra de m que es distinta a su correspondiente bj de n, siendo aj < bj, y por tanto aj + 1 £ bj. Entonces: m = a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1+ajbj + … +a2b2 + a1b + a0 n = a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 +bjbj + … +b2b2 + b1b + b0 Prescindiendo de los términos que son iguales podemos considerar los números: m* = ajbj + … +a2b2 + a1b + a0 n* = bjbj + … +b2b2 + b1b + b0 cumpliéndose, con el apoyo de la proposición 2 que: n* = bjbj + … + b1b + b0 ³ bjbj ³ (aj +1)bj = aj bj +bj > ajbj +aj-1bj-1...+ a1b + a0 = m*. Hemos probado, pues, que m* < n*. Ahora sólo bastaría sumar a ambos miembros los términos iguales, haciendo uso de la ley de monotonía para la suma llegando a: a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 + m* < a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 + n* de donde m < n. (Þ) Resulta inmediata, pues si m < n debe existir al menos una cifra de m que sea distinta a su correspondiente en n y razonaríamos por reducción al absurdo, apoyándonos en la implicación anterior. c)

Cambio de una base a otra cualquiera Si queremos pasar un número escrito en la base b a otra base b’, basta combinar los procedimientos anteriores según el esquema 1

558 008 3

b)

5 111 11

2

5 22

4

5

558 = 4213 (5

Paso de base decimal a una base cualquiera Puede llevarse a cabo un procedimiento de división sucesiva como el que se indica en la demostración del teorema fundamental de la numeración. Cuando llegamos a un cociente menor que la base, el proceso acaba, y entonces tomaríamos para la expresión del número en dicha base como primera cifra de la izquierda el último cociente, y a continuación la sucesión de los restos en orden inverso. Ejemplo: 4

5

4

2 20 22

1 110 110

4213 (5 = 4 · 53 + 2 · 52 + 1 · 5 + 3 = 558

3 555 558

Paso de base cualquiera a base decimal Bastaría efectuar las operaciones indicadas en la expresión polinómica. En la práctica puede hacerse uso del teorema del resto para polinomios, y utilizar el algoritmo de Ruffini. Ejemplo:

4.6. Cambio de sistema de numeración

Paso de base cualquiera a base decimal Bastaría efectuar las operaciones indicadas en la expresión polinómica. En la práctica puede hacerse uso del teorema del resto para polinomios, y utilizar el algoritmo de Ruffini. Ejemplo: a)

a)

4.6. Cambio de sistema de numeración

4

2 20 22

1 110 110

3 555 558

Demostración: (Ü) Supongamos que m y n tienen ambos p cifras. Sea aj la primera cifra de m que es distinta a su correspondiente bj de n, siendo aj < bj, y por tanto aj + 1 £ bj. Entonces: m = a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1+ajbj + … +a2b2 + a1b + a0 n = a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 +bjbj + … +b2b2 + b1b + b0 Prescindiendo de los términos que son iguales podemos considerar los números: m* = ajbj + … +a2b2 + a1b + a0 n* = bjbj + … +b2b2 + b1b + b0 cumpliéndose, con el apoyo de la proposición 2 que: n* = bjbj + … + b1b + b0 ³ bjbj ³ (aj +1)bj = aj bj +bj > ajbj +aj-1bj-1...+ a1b + a0 = m*. Hemos probado, pues, que m* < n*. Ahora sólo bastaría sumar a ambos miembros los términos iguales, haciendo uso de la ley de monotonía para la suma llegando a: a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 + m* < a p-1bp-1 + ap-2bp-2 + … + aj+1bj+1 + n* de donde m < n. (Þ) Resulta inmediata, pues si m < n debe existir al menos una cifra de m que sea distinta a su correspondiente en n y razonaríamos por reducción al absurdo, apoyándonos en la implicación anterior. 5

4

b)

Paso de base decimal a una base cualquiera Puede llevarse a cabo un procedimiento de división sucesiva como el que se indica en la demostración del teorema fundamental de la numeración. Cuando llegamos a un cociente menor que la base, el proceso acaba, y entonces tomaríamos para la expresión del número en dicha base como primera cifra de la izquierda el último cociente, y a continuación la sucesión de los restos en orden inverso. Ejemplo: 558 5 558 = 4213 (5 008 111 5 3

c)

4213 (5 = 4 · 53 + 2 · 52 + 1 · 5 + 3 = 558

11

22

1

2

5

4

Cambio de una base a otra cualquiera Si queremos pasar un número escrito en la base b a otra base b’, basta combinar los procedimientos anteriores según el esquema Cambio de base b a base 10

Cambio de base 10 a base b’

PROPOSICIÓN 4: “Si m y n tienen igual número de cifras expresados en la base b, entonces m < n si y sólo si la cifra de mayor orden de m (primera empezando por la izquierda) que es distinta a su correspondiente en n, es menor que ésta” 38

n

n (b’

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

n (b

Números naturales. Sistemas de numeración No obstante hay algunos cambios de base particulares en los que el esquema anterior puede ser sustituido por un algoritmo más sencillo. Es, por ejemplo, la conversión de los sistemas octal (base 8) y hexadecimal (base16) al sistema binario y viceversa. Es precisamente en la facilidad de paso de uno a otro en la que se fundamenta su empleo en los códigos intermedios más usuales. Teniendo en cuenta que tanto 8 como 16 son potencias de 2, puede hacerse: n = ...hgfedcba (2 = a + b · 2 + b · 22 + c · 23 + d · 24 + e · 25 + f · 26 + g · 27 + h · 28 + … = = a + b · 2 + c · 22 + (d + e · 2 + f · 22) · 23 + (g + h · 2 + i · 22) · 26 + … = = (a + b · 2 + c · 22) + (d + e · 2 + f · 22) · 8 + (g + h · 2 + i · 22) ·82 + … Esto quiere decir que para pasar del sistema binario al octal agruparemos los dígitos del número (que serán ceros y unos), en grupos de tres, empezando por la derecha. Si cada grupo lo convertimos a decimal resultará un valor inferior a 8, pues el grupo mayor sería el 111 que equivale al 7. Los dígitos resultantes (todos menores que 7) son los del número expresado en el octal. Recíprocamente el paso del sistema octal al binario se ejecuta convirtiendo cada cifra (de 0 a 7) del número en base 8 al sistema binario formando un grupo de 3 dígitos binarios(bits) completando con ceros a la izquierda si fuese preciso. Ejemplo: nº binario ® 10 001 101 100 = 2154 (8 nº octal ® 2 1 5 4 Análogamente: n = ...hgfedcba (2 = a + b · 2 + b · 22 + c · 23 + d · 24 + e · 25 + f · 26 + g · 27 + h · 28 + … = = a + b · 2 + c · 22 + d · 23 + (e + f · 2 +g · 22 + h · 23) · 24 + (i + j · 2 + k · 22 + l · 23) · 28 … = = (a + b · 2 + c · 22 + d · 23) + (e + f · 2 + g · 22 + h · 23) · 16 + (i + j · 2 + k · 22 + l · 23) · 162 ... Para el paso del binario al hexadecimal y viceversa el procedimiento es similar al anterior pero el número en binario ha de dividirse ahora en grupos de cuatro bits del sistema binario que se pasa a base 16. Hemos de tener en cuenta que el sistema hexadecimal utiliza 16 dígitos que podemos llamar 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F. Dado el número escrito en hexadecimal, se pasa a binario convirtiendo cada cifra en un grupo de cuatro bits. Ejemplo: nº binario ® 010 1101 1111 0101 = 2DF5 (16 nº hexadecimal ® 2 D F 5 Hexadecimal 0 1 2 3 4 5 6 7 8 9 A B C D E F

Decimal 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Binario 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111

4.7. Algoritmos de las operaciones básicas La ejecución de las operaciones elementales (suma, resta, multiplicación y división) con números expresados en base no decimal, se automatiza mediante algoritmos muy similares a los usuales del sistema decimal, cuyo desarrollo pormenorizado omitiremos, remitiendo al lector a la realización de ejercicios prácticos. TEMARIO DE MATEMÁTICAS. PRUEBA A

39

TEMA

2 Fundamentos y aplicaciones de la teoría de grafos. Diagramas de árbol

Jorge Navarro Camacho

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

42

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN. DEFINICIONES 1.1. Grafo 1.2. Grafo dirigido 1.3. Redes

2.

GRAFOS CONEXOS 2.1. Orden, tamaño y grado de incidencia 2.2. Subgrafos y componentes conexas 2.3. Cadenas y ciclos 2.4. Caminos y circuitos 2.5. Grafos conexos y fuertemente conexos

3.

MATRICES ASOCIADAS A UN GRAFO

4.

GRAFOS EULERIANOS

5.

GRAFOS HAMILTONIANOS

6.

DIAGRAMAS DE ÁRBOL

7.

GRAFOS PLANOS

8.

TEOREMA DE LOS CUATRO COLORES

9.

APLICACIONES 9.1. Matemáticas 9.2. Teoría de Juegos 9.3. Ingenierías (informática, telecomunicaciones, etc.) 9.4. Varios

APLICACIONES 9.1. Matemáticas 9.2. Teoría de Juegos 9.3. Ingenierías (informática, telecomunicaciones, etc.) 9.4. Varios

9.

TEOREMA DE LOS CUATRO COLORES

8.

GRAFOS PLANOS

7.

DIAGRAMAS DE ÁRBOL

6.

GRAFOS HAMILTONIANOS

5.

GRAFOS EULERIANOS

4.

MATRICES ASOCIADAS A UN GRAFO

3.

GRAFOS CONEXOS 2.1. Orden, tamaño y grado de incidencia 2.2. Subgrafos y componentes conexas 2.3. Cadenas y ciclos 2.4. Caminos y circuitos 2.5. Grafos conexos y fuertemente conexos

2.

INTRODUCCIÓN. DEFINICIONES 1.1. Grafo 1.2. Grafo dirigido 1.3. Redes

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

42

Fundamentos y aplicaciones de la teoría de grafos

1. INTRODUCCIÓN. DEFINICIONES De forma general, puede decirse que los grafos se utilizan para representar las relaciones existentes entre los elementos de un conjunto. Por lo tanto, podemos decir que los grafos son un artificio matemático que puede representar (simplificar) y resolver numerosas situaciones o problemas reales, desde los problemas relacionados con tráfico (aéreo, por carretera, de mercancías, de información en redes de ordenadores, de gas, de energía eléctrica, envíos postales, o de cualquier otra mercancía) o diseño de redes (de transporte, en sistemas eléctricos, etc...) hasta aplicaciones en ciencias tan dispares como la química, la genética, la informática, la biblioteconomía o la arqueología.

1.1. Grafo DEFINICIÓN 1. Un grafo será un par (V, E) donde V es un conjunto y E es un conjunto formado por conjuntos de dos elementos de V, es decir: E = {ej = {vj1, vj2}: vj1, vj2 Î V} Por ejemplo, V = {1, 2, 3} y E = {{1, 2}, {2, 3}} es un grafo que puede representarse mediante el diagrama siguiente: 1

2 3

Este grafo puede representar la relación de equivalencia se diferencian en una unidad (x ~ y sii |x – y| = 1) en el conjunto de números V = {1, 2, 3} o puede representar las conexiones aéreas con vuelos regulares entre tres ciudades o las conexiones entre tres ordenadores. A los elementos de V se les suele llamar vértices (o nodos) y a los de E ejes (o aristas). Habitualmente, el conjunto de vértices (y por tanto el de ejes) suele ser un conjunto finito, por lo que representaremos a los vértices mediante números naturales V = {1, 2 ...} y a los ejes mediante conjuntos (de cardinal 2) de números naturales (repetidos o no). En la mayoría de los resultados que veremos en este tema se supondrá que V es finito salvo que se indique lo contrario. Diremos que dos vértices i, j Î V son adyacentes cuando estén relacionados (unidos por un eje), es decir cuando {i, j} Î E. En este caso, i y j serán los vértices extremos del eje {i, j}. De esta forma, los grafos pueden verse como relaciones binarias en el conjunto V con la propiedad simétrica (si i ~ j, entonces j ~ i). Un eje será un bucle cuando sus dos vértices extremos sean iguales ({i, i}). Cuando un grafo carece de bucles se le llamará grafo simple. Un grafo será nulo cuando no tenga ningún eje y un grafo será completo si tiene todos los ejes posibles. En particular, un grafo simple será completo si todos los vértices son adyacentes. La definición anterior de grafo se puede extender mediante el concepto de multigrafo. DEFINICIÓN 2. Un multigrafo de orden p o un p-grafo será un par (V, E) donde V es un conjunto y E es un conjunto formado por conjuntos de dos elementos de V que pueden repetirse a lo sumo p-veces, es decir: E = {ej = {vj1, vj2}: vj1, vj2 Î V} con I(e) = åj 1(ej = e) £ p para todo e Î E (1(A) = 1, si A es cierta y 0 si no). Evidentemente, con esta definición, un grafo será un multigrafo de orden 1 (un 1-Grafo). Otros autores adoptan esta definición como definición general de grafo, señalando los 1-grafos como un caso especial. Un ejemplo clásico de multigrafo de orden 2 es el que permite representar los 7 puentes sobre la ciudad de Königsberg (en Prusia oriental) mediante el grafo (V, E) con V = {A, B, C, D} donde B y D representan dos islas en un río y A y C representan las dos orillas, y con: E = {e1 = {A, B}, e2 = {A, B}, e3 = {A, D}, e4 = {C, D}, e5 = {B, C}, e6 = {B, C}, e7 = {B, D}} que representan los siete puentes sobre el río Pregel. TEMARIO DE MATEMÁTICAS. PRUEBA A

43

Volumen I. Matemáticas

44

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Todo grafo puede considerarse un grafo dirigido sustituyendo cada eje {i, j} por los pares (i, j) y (j, i). Análogamente se definen los multigrafos dirigidos de orden p. Un grafo dirigido será simétrico si para cada arco (i, j) existe el arco (j, i). Un grafo será antisimétrico si para cada arco (i, j) no existe el arco (j, i). Como en el ejemplo anterior, los grafos asociados a las relaciones de parentesco suelen ser antisimétricos. Evidentemente, el grafo dirigido asociado a un grafo cualquiera es simétrico, y a todo grafo dirigido simétrico se le puede asociar un grafo (no dirigido), con lo que ambos conceptos son equivalentes. A

e1

e3

e2

B

D

e7

e5

e4

Figura 1. Puentes de Königsberg.

e6

C

A = {(A, C), (B, C), (C, D), (E, D)}

se puede representar mediante el grafo dirigido de vértices V = {A, B, C, D, E} y arcos

La mayoría de autores sitúa el nacimiento de la teoría de grafos en el artículo publicado por Euler en 1736 en el que comenzaba estudiando un problema (pasatiempo) asociado a este 2-grafo. En concreto estudiaba si se pueden recorrer todos los puentes sin pasar dos veces por el mismo. Para tener completamente determinado un grafo basta tener el conjunto de vértices V y la función de adyacentes G: V® Ã(V) definida mediante G(v) = {v’: {v, v’} Î E} (Ã(V) es el conjunto de todos los subconjuntos de V. Entre los grafos (o multigrafos) se puede establecer una relación de equivalencia mediante la relación siguiente: David

Carlos

Elena

Andrés

Beatriz

o más sencillo, A Í Ã(V x V) (donde x denota el producto cartesiano). En este caso, a los elementos de A se les suele llamar arcos. Por ejemplo, la relación de parentesco siguiente:

DEFINICIÓN 3. Dos grafos (o multigrafos) (V, E) y (V’, E’) serán isomorfos si existe una aplicación biyectiva F: V ® V’ tal que {v1, v2} Î E Û {F(v1), F(v2)} Î E’ A = {aj = (vj1, vj2): vj1, vj2 Î V}

Con esto será indiferente el orden de numeración de los vértices o de los ejes.

En muchas ocasiones, las relaciones entre los elementos no son simétricas, como ocurre por ejemplo en la relación matemática ser divisor de, en la de parentesco ser hijo de, que permite construir los denominados árboles genealógicos, o en los esquemas de tráfico de las ciudades con calles de sentido único. Estas situaciones conducen al concepto de grafo dirigido. DEFINICIÓN 4. Un grafo dirigido (orientado) será un par (V, A) donde V es un conjunto y A es un conjunto formado por pares ordenados de elementos de V, es decir:

1.2. Grafo dirigido

En muchas ocasiones, las relaciones entre los elementos no son simétricas, como ocurre por ejemplo en la relación matemática ser divisor de, en la de parentesco ser hijo de, que permite construir los denominados árboles genealógicos, o en los esquemas de tráfico de las ciudades con calles de sentido único. Estas situaciones conducen al concepto de grafo dirigido. DEFINICIÓN 4. Un grafo dirigido (orientado) será un par (V, A) donde V es un conjunto y A es un conjunto formado por pares ordenados de elementos de V, es decir:

1.2. Grafo dirigido

Con esto será indiferente el orden de numeración de los vértices o de los ejes. A = {aj = (vj1, vj2): vj1, vj2 Î V}

{v1, v2} Î E Û {F(v1), F(v2)} Î E’

o más sencillo, A Í Ã(V x V) (donde x denota el producto cartesiano). En este caso, a los elementos de A se les suele llamar arcos. Por ejemplo, la relación de parentesco siguiente:

DEFINICIÓN 3. Dos grafos (o multigrafos) (V, E) y (V’, E’) serán isomorfos si existe una aplicación biyectiva F: V ® V’ tal que La mayoría de autores sitúa el nacimiento de la teoría de grafos en el artículo publicado por Euler en 1736 en el que comenzaba estudiando un problema (pasatiempo) asociado a este 2-grafo. En concreto estudiaba si se pueden recorrer todos los puentes sin pasar dos veces por el mismo. Para tener completamente determinado un grafo basta tener el conjunto de vértices V y la función de adyacentes G: V® Ã(V) definida mediante G(v) = {v’: {v, v’} Î E} (Ã(V) es el conjunto de todos los subconjuntos de V. Entre los grafos (o multigrafos) se puede establecer una relación de equivalencia mediante la relación siguiente: Andrés

Beatriz

Carlos

Elena

David

se puede representar mediante el grafo dirigido de vértices V = {A, B, C, D, E} y arcos A = {(A, C), (B, C), (C, D), (E, D)}

Figura 1. Puentes de Königsberg.

e6

C

Todo grafo puede considerarse un grafo dirigido sustituyendo cada eje {i, j} por los pares (i, j) y (j, i). Análogamente se definen los multigrafos dirigidos de orden p. Un grafo dirigido será simétrico si para cada arco (i, j) existe el arco (j, i). Un grafo será antisimétrico si para cada arco (i, j) no existe el arco (j, i). Como en el ejemplo anterior, los grafos asociados a las relaciones de parentesco suelen ser antisimétricos. Evidentemente, el grafo dirigido asociado a un grafo cualquiera es simétrico, y a todo grafo dirigido simétrico se le puede asociar un grafo (no dirigido), con lo que ambos conceptos son equivalentes. e4

e5

e7

D

B

e2

e1

e3

A

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

44

Fundamentos y aplicaciones de la teoría de grafos De nuevo, un grafo dirigido simple será un grafo dirigido sin bucles. Evidentemente, los grafos dirigidos antisimétricos serán simples. Dado un arco (i, j), i será el vértice inicial y j el vértice final, y diremos que i es un predecesor de j y j un sucesor de i. De esta forma, para dar un grafo dirigido bastará con dar el conjunto de vértices y la función de sucesores Gs: V ® Ã(V) definida mediante Gs(i) = {j: (i, j) Î A} (o la de predecesores Gp(i) = {j: (j, i) Î A}). De nuevo observamos la equivalencia de los grafos dirigidos con las relaciones binarias en V (en este caso, con o sin la propiedad simétrica). Para grafos dirigidos se tiene la relación de isomorfía siguiente: DEFINICIÓN 5. Dos grafos dirigidos (o p-grafos dirigidos) (V, A) y (V’, A’) serán isomorfos si existe una aplicación biyectiva F: V ® V’ tal que: (v1, v2) Î A Û (F(v1), F(v2)) Î A’

1.3. Redes En otras situaciones, a cada eje o arco se le puede asociar una medida (valor numérico) que indique su longitud, su capacidad, su resistencia, el tiempo que tarda en recorrerse, etc... De esta forma se obtienen los conceptos de redes y redes dirigidas. DEFINICIÓN 6. Una red (red dirigida) será una tripleta (V, E, l) donde (V, E) es un grafo (grafo dirigido) y l una función l: E ® R que asocia a cada eje (arco) un valor numérico. A veces hay más de una característica asociada a cada eje y entonces l sería una función multivaluada (l: E ® Rk). Por ejemplo, el grafo V = {1, 2, 3} y E = {{1, 2}, {2, 3}, {1, 3}} se puede convertir en una red mediante la asignación l {1, 2} = 35 l {2, 3} = 20 l {1, 3} = 40 Si el grafo anterior representa las conexiones entre tres ciudades, los valores numéricos pueden ser, por ejemplo, las distancias en Km. Análogamente se puede definir el concepto de multirred de orden p que, en este ejemplo, podrían representar diferentes formas (carreteras) de ir de una ciudad a otra. Todo multigrafo puede representarse como una red completa asignando al eje entre dos vértices el número de ejes que los une. DEFINICIÓN 7. Dos redes (V, E, l) y (V’, E’, l’) serán isomorfas si existe una aplicación biyectiva F: V ® V’ tal que {v1; v2} Î E Û {F(v1), F(v2)} Î E’ y además l({v1, v2}) = l’({F(v1), F(v2)}) para todo {v1, v2} Î E.

2. GRAFOS CONEXOS 2.1. Orden, tamaño y grado de incidencia DEFINICIÓN 8. Dado un grafo (dirigido) G = (V, E) llamaremos orden de G (o(G)) al número de vértices y tamaño de G (t(G)) al número de ejes (arcos). æn ö Un grafo simple de orden n tiene como máximo tamañoç ÷(número de subconjuntos de {1 ... n} con è2ø æn ö dos elementos distintos), mientras que un grafo puede tener hasta n +ç ÷ejes. Un grafo dirigido simple tiene è2ø como máximo tamaño n(n – 1), mientras que un grafo dirigido puede tener hasta tamaño n2 (ver tema 3). TEMARIO DE MATEMÁTICAS. PRUEBA A

45

Volumen I. Matemáticas

46

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

DEFINICIÓN 16. Dos grafos (V, E) y (V’, E’) serán disjuntos si V Ç V’ = Æ.

DEFINICIÓN 9. Dado un vértice i de un grafo (dirigido) G, llamaremos grado de incidencia de i (y lo representaremos mediante g(i)) al número de ejes (arcos) en los que interviene i teniendo en cuenta que el bucle {i, i} cuenta doble. Llamaremos grado de salida (entrada) de un vértice i en un grafo dirigido (y lo representaremos mediante g+(i) (g–(i))) al número de arcos en los que i es el extremo inicial (final). Veamos algunas propiedades.

Se pueden dar definiciones análogas para grafos orientados. Sin embargo, en multigrafos esta operación puede entenderse de dos formas distintas, ya que {{1, 2}} È {{1, 2}} puede ser igual a {{1, 2}} o a {{1, 2}, {1, 2}}. Evidentemente, un grafo es la unión de todos sus subgrafos, y si unimos un grafo con su complementario, se obtiene un grafo completo.

LEMA 10 (del apretón de manos). El tamaño de un grafo es igual a la semisuma de todos los grados de incidencia. Es decir: DEFINICIÓN 15. Llamaremos grafo unión de dos grafos (V, E) y (V’, E’) a (V È V’, E È E’).

åg(i) = 2t(G)

iÎ V

DEFINICIÓN 14. Diremos que (V’, E’) es el grafo complementario de un grafo (V, E) si V’ = V y E’ = Ec (complementario).

La demostración es consecuencia de que todo eje contribuye con una unidad a los grados de sus dos vértices extremos. DEFINICIÓN 13. Diremos que (V’, E’) es un subgrafo de un grafo (V, E) si V’ Í V y E’ Í E. PROPOSICIÓN 11. En todo grafo hay un número par de vértices de grado impar.

2.2. Subgrafos y componentes conexas

Demostración. Por el lema anterior, tenemos La demostración es inmediata. Nótese que en ambas propiedades se utiliza que (i, i) contribuye de manera doble al índice del vértice i.

åg(i) = 2t(G)

iÎ V

g(i) = g+(i) + g–(i)

Si separamos los vértices de grado par P y los de grado impar I, se tiene PROPOSICIÓN 12. En todo grafo dirigido y para todo vértice i se verifica:

åg(i) = 2t(G) – åg(i)

con lo que el cardinal de I, |I| debe ser par.

iÎ I

iÎ P

iÎ I

iÎ I

con lo que åiÎIg(i) será par. Pero como g(i) es impar, para i Î I, es decir, g(i) = 2ki + 1, entonces

åg(i) = 2( åk )+|I|= par i

åg(i) = 2( åk )+|I|= par i

con lo que åiÎIg(i) será par. Pero como g(i) es impar, para i Î I, es decir, g(i) = 2ki + 1, entonces iÎ I

iÎ I

iÎ I

iÎ P

con lo que el cardinal de I, |I| debe ser par.

åg(i) = 2t(G) – åg(i)

PROPOSICIÓN 12. En todo grafo dirigido y para todo vértice i se verifica: Si separamos los vértices de grado par P y los de grado impar I, se tiene g(i) = g+(i) + g–(i) iÎ V

åg(i) = 2t(G)

La demostración es inmediata. Nótese que en ambas propiedades se utiliza que (i, i) contribuye de manera doble al índice del vértice i. Demostración. Por el lema anterior, tenemos

2.2. Subgrafos y componentes conexas

PROPOSICIÓN 11. En todo grafo hay un número par de vértices de grado impar.

DEFINICIÓN 13. Diremos que (V’, E’) es un subgrafo de un grafo (V, E) si V’ Í V y E’ Í E.

La demostración es consecuencia de que todo eje contribuye con una unidad a los grados de sus dos vértices extremos.

DEFINICIÓN 14. Diremos que (V’, E’) es el grafo complementario de un grafo (V, E) si V’ = V y E’ = Ec (complementario). iÎ V

åg(i) = 2t(G)

DEFINICIÓN 15. Llamaremos grafo unión de dos grafos (V, E) y (V’, E’) a (V È V’, E È E’).

LEMA 10 (del apretón de manos). El tamaño de un grafo es igual a la semisuma de todos los grados de incidencia. Es decir:

Se pueden dar definiciones análogas para grafos orientados. Sin embargo, en multigrafos esta operación puede entenderse de dos formas distintas, ya que {{1, 2}} È {{1, 2}} puede ser igual a {{1, 2}} o a {{1, 2}, {1, 2}}. Evidentemente, un grafo es la unión de todos sus subgrafos, y si unimos un grafo con su complementario, se obtiene un grafo completo.

DEFINICIÓN 9. Dado un vértice i de un grafo (dirigido) G, llamaremos grado de incidencia de i (y lo representaremos mediante g(i)) al número de ejes (arcos) en los que interviene i teniendo en cuenta que el bucle {i, i} cuenta doble. Llamaremos grado de salida (entrada) de un vértice i en un grafo dirigido (y lo representaremos mediante g+(i) (g–(i))) al número de arcos en los que i es el extremo inicial (final). Veamos algunas propiedades. DEFINICIÓN 16. Dos grafos (V, E) y (V’, E’) serán disjuntos si V Ç V’ = Æ.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

46

Fundamentos y aplicaciones de la teoría de grafos DEFINICIÓN 17. Un grafo (V, E) será conexo si no se puede poner como unión de dos grafos disjuntos. En otro caso será inconexo y los subgrafos conexos se llamarán componentes conexas. Por ejemplo, 1 2 4 3

5

es un grafo conexo y 1

2 3

4 5

será inconexo, con dos componentes conexas. PROPOSICIÓN 18. En un grafo conexo el número de ejes debe ser mayor o igual que el número de vértices menos 1, t(G) ³ o(G) – 1 La demostración se puede hacer por inducción, teniendo en cuenta que para conectar 2 vértices necesitamos, al menos, un eje, y que, para añadir un nuevo vértice a un grafo, necesitamos al menos un nuevo eje.

2.3. Cadenas y ciclos DEFINICIÓN 19. Dado un grafo (V, E) llamaremos cadena a una secuencia alternante de vértices y ejes que comienza y acaba en vértices y que se puede escribir de la forma siguiente: v1, {v1, v2}, v2, {v2, v3}, v3 ... vk Diremos que una cadena de este tipo une o conecta a los vértices v1 y vk. Una cadena será simple si en ella no se repite ningún eje y será elemental si en ella no se repite ningún vértice. Una cadena será un ciclo si coinciden los vértices inicial y final. Un ciclo será elemental si sólo coinciden el vértice inicial con el final. Esto es equivalente a dar una secuencia (sucesión finita) de vértices v1, v2 ... tales que {vj, vj+1}Î E para todo j o una secuencia de pares ordenados ej = (v 1j , v 2j ) tales que {v 1j , v 2j } Î E y v 2j = v 1j+1 para todo j. Por ejemplo, en el primero de los grafos anteriores, 1, {1, 2}, 2, {2, 4}, 4 es un cadena elemental y simple que puede representarse mediante la secuencia de vértices 1, 2, 4 o la de ejes (1, 2), (2, 4). Nótese que la cadena 1, {1, 2}, 2 es diferente de la cadena 2, {1, 2}, 1. Cuando trabajemos con multigrafos, la representación mediante vértices puede no ser válida, ya que entre dos vértices podemos tener varios ejes y deberemos especificar uno de ellos. Por ejemplo, en el grafo de los puentes de Königsberg, B, e1, A, e2, B, e7, D, e3, A es un cadena simple.

2.4. Caminos y circuitos DEFINICIÓN 20. Dado un grafo dirigido (V, A) llamaremos camino a una secuencia de arcos a1, a2 ... (vértices v1, v2 ...) tal que el vértice final de cada arco coincide con el inicial del vértice siguiente (existe el arco entre un vértice y el siguiente): fin(aj) = ori(aj + 1) ((vj , vj + 1) Î A) para todo j. El camino será simple si no se repite ningún arco y será elemental si no se repite ninguno de los vértices que intervienen en los arcos (salvo los finales y los iniciales en arcos consecutivos). El camino será un circuito si el vértice final del último arco coincide con el vértice inicial del primero. Con estas definiciones, si a un grafo lo transformamos en un grafo orientado considerando las dos posibles opciones para cada eje (ver sección 1), toda cadena se convierte en un camino que mantiene sus mismas propiedades (es decir, si la cadena era simple, el camino también lo será). De nuevo señalaremos que, en un multigrafo dirigido no basta con dar la secuencia de vértices, si no que deberemos especificar qué arco se toma en cada posición. TEMARIO DE MATEMÁTICAS. PRUEBA A

47

Volumen I. Matemáticas

48

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

2.5. Grafos conexos y fuertemente conexos

æ0 ç ç1 M= ç 1 ç ç0 ç è0

1 0 1 1 0

1 1 0 0 0

0 1 0 0 1

0ö ÷ 0÷ 0÷ ÷ 1÷ ÷ 0ø

Comenzaremos caracterizando a los grafos conexos mediante las cadenas. PROPOSICIÓN 21. Un grafo es conexo si, y sólo si, para cualquier pareja de vértices existe una cadena que los une. Además, dicha cadena siempre puede elegirse elemental (sin vértices repetidos) y simple (sin ejes repetidos). La demostración es sencilla, ya que si hubiera un conjunto de vértices que no se pudieran conectar con un vértice dado entonces el grafo no sería conexo. Además, si un vértice aparece más de una vez en la cadena, podemos eliminar del camino el ciclo que comienza y termina en dicho vértice. Repitiendo esta operación con los vértices repetidos se obtiene una cadena elemental. es

5

3

De la misma forma eliminaremos los ejes repetidos hasta conseguir una cadena simple. Sin embargo, en el caso de grafos dirigidos el resultado no es cierto. 1

2

4

Por ejemplo: 1

2

3

Por ejemplo, la matriz de adyacencia del grafo

Evidentemente la matriz indica si dos vértices son adyacentes (existe un eje que los une). En este caso la matriz será simétrica. Puede darse una definición similar para grafos dirigidos, aunque en este caso la matriz ya no tiene por qué ser simétrica. Para p-grafos la matriz indicará cuántos ejes hay entre cada par de vértices y, por lo tanto, debe tomar valores entre 0 y p.

es un grafo conexo pero no existe un camino que conecte 3 con 1. Esto conduce a la definición siguiente:

DEFINICIÓN 22. Un grafo dirigido es fuertemente conexo si para cualquier par de vértices existe un camino que los une. ì1 si{i , j} Î E mij = í î0 si{i , j} Ï E

Este concepto puede tener interés, por ejemplo, al diseñar los esquemas de tráfico en una ciudad con calles de sentido único. DEFINICIÓN 23. Dado un grafo G = (V, E) con V = {1 ... n} llamaremos matriz de adyacencia a la matriz n x n, M definida por

3. MATRICES ASOCIADAS A UN GRAFO

3. MATRICES ASOCIADAS A UN GRAFO

DEFINICIÓN 23. Dado un grafo G = (V, E) con V = {1 ... n} llamaremos matriz de adyacencia a la matriz n x n, M definida por ì1 si{i , j} Î E mij = í î0 si{i , j} Ï E

Este concepto puede tener interés, por ejemplo, al diseñar los esquemas de tráfico en una ciudad con calles de sentido único. DEFINICIÓN 22. Un grafo dirigido es fuertemente conexo si para cualquier par de vértices existe un camino que los une.

Evidentemente la matriz indica si dos vértices son adyacentes (existe un eje que los une). En este caso la matriz será simétrica. Puede darse una definición similar para grafos dirigidos, aunque en este caso la matriz ya no tiene por qué ser simétrica. Para p-grafos la matriz indicará cuántos ejes hay entre cada par de vértices y, por lo tanto, debe tomar valores entre 0 y p.

es un grafo conexo pero no existe un camino que conecte 3 con 1. Esto conduce a la definición siguiente: Por ejemplo, la matriz de adyacencia del grafo

1

2

3

Por ejemplo: 1

2

4

Sin embargo, en el caso de grafos dirigidos el resultado no es cierto. De la misma forma eliminaremos los ejes repetidos hasta conseguir una cadena simple. 3

5

La demostración es sencilla, ya que si hubiera un conjunto de vértices que no se pudieran conectar con un vértice dado entonces el grafo no sería conexo. Además, si un vértice aparece más de una vez en la cadena, podemos eliminar del camino el ciclo que comienza y termina en dicho vértice. Repitiendo esta operación con los vértices repetidos se obtiene una cadena elemental. es

æ0 ç ç1 M= ç 1 ç ç0 ç è0

1 1 0 0ö ÷ 0 1 1 0÷ 1 0 0 0÷ ÷ 1 0 0 1÷ ÷ 0 0 1 0ø

PROPOSICIÓN 21. Un grafo es conexo si, y sólo si, para cualquier pareja de vértices existe una cadena que los une. Además, dicha cadena siempre puede elegirse elemental (sin vértices repetidos) y simple (sin ejes repetidos). Comenzaremos caracterizando a los grafos conexos mediante las cadenas.

2.5. Grafos conexos y fuertemente conexos

48

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Fundamentos y aplicaciones de la teoría de grafos æ2 ç ç1 Si elevamos al cuadrado la matriz M (ver tema 18), se obtiene M 2= ç 1 ç ç1 ç è0

1 1 1 0ö ÷ 3 1 0 1÷ 1 2 1 0÷ ÷ 0 1 2 0÷ ÷ 1 0 0 1ø

que corresponde con el número de cadenas con dos ejes que unen a cada par de vértices. Análogamente, M3 da las cadenas con tres ejes, etc... De forma general se tiene el resultado siguiente: PROPOSICIÓN 24. Mk da el número de cadenas con k ejes que unen a cada par de vértices. Lo demostraremos por inducción. Para k = 1 es obvio. Supongamos que el resultado es cierto para k – 1 y que A = Mk–1. Entonces, el número de cadenas con k ejes uniendo los vértices i y j será igual a la suma de las cadenas con k – 1 ejes uniendo i con cualquier eje s (ais) para el que exista el eje {s, j}. Es decir, cadk(i, j) =

åa

is

{s,j}Î E

Pero como si msj = 1, entonces {s, j} Î E y si msj = 0, entonces {s, j} Ï E, se tiene cadk(i, j) = åa ismsj = b ij s

k–1

k

donde B = AM = M M = M . Como consecuencia de la proposición anterior tenemos el resultado siguiente: PROPOSICIÓN 25. Un grafo es conexo si, y sólo si, la matriz C = M + M2 + ... + Mn–1 no tiene elementos nulos (n es el número de vértices del grafo). æ11 12 11 7 2ö ÷ ç ç12 17 12 7 5÷ En el ejemplo anterior se tiene, C = M+ M 2+ M 3+ M 4= ç11 12 11 7 2÷ ç ÷ ç 7 7 7 8 3÷ ç ÷ è 2 5 2 3 3ø 1

2

4

Sin embargo, para el grafo 3

5

1 1 0 0ö ÷ 0 1 0 0÷ 1 0 0 0÷ ÷ 0 0 0 1÷ ÷ 0 0 1 0ø

se tiene

æ0 ç ç1 M=ç 1 ç ç0 ç è0

y

æ10 10 10 0 0ö ÷ ç ç10 10 10 0 0÷ C = M+ M 2+ M 3+ M 4= ç10 10 10 0 0÷ ç ÷ ç 0 0 0 2 2÷ ç ÷ è 0 0 0 2 2ø

con lo que se comprueba no sólo que G no es conexo, sino que además nos muestra qué vértices se pueden conectar, obteniéndose que G tiene dos componentes conexas y que éstas son {1, 2, 3} y {4,5}. TEMARIO DE MATEMÁTICAS. PRUEBA A

49

Volumen I. Matemáticas

50

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

TEOREMA 30. (Euler). Un grafo (p-grafo) es Euleriano si y sólo si es conexo (salvo vértices aislados) y todos sus vértices tienen índice par. Supongamos que todos los vértices tienen índice par comenzamos una cadena por un vértice cualquiera (1) y nos movemos tan lejos como sea posible, por ejes que no se hayan usado antes en la cadena. Como el grado de todos los vértices es par, el último vértice de dicha cadena deber ser 1 (si fuese otro, los ejes que entran superarían a los que salen y dicho vértice tendría grado impar). Sin embargo puede haber ejes que no se encuentren en dicha cadena (ciclo). Como el grafo es conexo, uno de esos ejes debe tener

DEFINICIÓN 26. Dado un grafo G = (V, E) con V = {1 ... n} y E = {e1 ... em}, llamaremos matriz de incidencia a la matriz n x m; M definida por ì1 si i Î e j mij= í î0 si i Ï ej

Esta definición también vale para p -grafos. En el caso de grafos dirigidos simples la definición será la siguiente:

PROPOSICIÓN 29. Si un grafo es Euleriano, entonces es conexo (salvo vértices aislados) y todos sus vértices tienen grado par. Euler demostró que el recíproco era cierto, con lo que los grafos Eulerianos quedaban caracterizados mediante la condición siguiente:

DEFINICIÓN 27. Dado un grafo dirigido simple G = (V, E) con V = {1 ... n} y E = {e1 ... em}, llamaremos matriz de incidencia a la matriz n x m, M definida por ì 1 si e j = ( i, k) ï m = í 0 si ej= ( k, l) , k¹ i , l¹ i ï î–1 si ej = ( k, i)

DEFINICIÓN 28. Un grafo (p-grafo) es Euleriano si existe un ciclo simple que recorra todos sus ejes. Es evidente que si un grafo es Euleriano entonces debe ser conexo, salvo en el caso trivial en el que existan vértices aislados. Teniendo en cuenta el argumento usado en el grafo de los puentes de Königsberg, se obtiene el resultado siguiente: ij

Euler probó que esto no era posible usando el argumento siguiente: si existiera un ciclo simple que recorra todos los ejes de un grafo, el número de ejes que salen de un vértice en dicho ciclo, debe ser igual al número de ejes que entran, por lo que todos los vértices deben tener grado par. Pero en el grafo de los puentes de Königsberg todos los vértices son impares y, por lo tanto, no puede existir un ciclo elemental. Euler planteó el problema en general: ¿en qué grafos podemos encontrar un ciclo simple recorriendo todos sus ejes? Lo que conduce a la definición siguiente:

4. GRAFOS EULERIANOS

Volveremos ahora sobre el problema de los puentes de Königsberg, que consistía en buscar un ciclo simple que recorra todos los ejes (puentes) del grafo: A

e1

e3 e2

e4

B

C

e7 e7

Figura 2. Puentes de Königsberg.

e5

e6

D

e4

e6

D

e5

C

B

e2 e1

e3

Figura 2. Puentes de Königsberg.

Euler probó que esto no era posible usando el argumento siguiente: si existiera un ciclo simple que recorra todos los ejes de un grafo, el número de ejes que salen de un vértice en dicho ciclo, debe ser igual al número de ejes que entran, por lo que todos los vértices deben tener grado par. Pero en el grafo de los puentes de Königsberg todos los vértices son impares y, por lo tanto, no puede existir un ciclo elemental. Euler planteó el problema en general: ¿en qué grafos podemos encontrar un ciclo simple recorriendo todos sus ejes? Lo que conduce a la definición siguiente: A

Volveremos ahora sobre el problema de los puentes de Königsberg, que consistía en buscar un ciclo simple que recorra todos los ejes (puentes) del grafo:

4. GRAFOS EULERIANOS

DEFINICIÓN 28. Un grafo (p-grafo) es Euleriano si existe un ciclo simple que recorra todos sus ejes. Es evidente que si un grafo es Euleriano entonces debe ser conexo, salvo en el caso trivial en el que existan vértices aislados. Teniendo en cuenta el argumento usado en el grafo de los puentes de Königsberg, se obtiene el resultado siguiente: ì 1 si e j = ( i, k) ï mij= í 0 si ej= ( k, l) , k¹ i , l¹ i ï î–1 si ej = ( k, i)

PROPOSICIÓN 29. Si un grafo es Euleriano, entonces es conexo (salvo vértices aislados) y todos sus vértices tienen grado par. Euler demostró que el recíproco era cierto, con lo que los grafos Eulerianos quedaban caracterizados mediante la condición siguiente:

DEFINICIÓN 27. Dado un grafo dirigido simple G = (V, E) con V = {1 ... n} y E = {e1 ... em}, llamaremos matriz de incidencia a la matriz n x m, M definida por Esta definición también vale para p -grafos. En el caso de grafos dirigidos simples la definición será la siguiente:

TEOREMA 30. (Euler). Un grafo (p-grafo) es Euleriano si y sólo si es conexo (salvo vértices aislados) y todos sus vértices tienen índice par. Supongamos que todos los vértices tienen índice par comenzamos una cadena por un vértice cualquiera (1) y nos movemos tan lejos como sea posible, por ejes que no se hayan usado antes en la cadena. Como el grado de todos los vértices es par, el último vértice de dicha cadena deber ser 1 (si fuese otro, los ejes que entran superarían a los que salen y dicho vértice tendría grado impar). Sin embargo puede haber ejes que no se encuentren en dicha cadena (ciclo). Como el grafo es conexo, uno de esos ejes debe tener ì1 si i Î e j mij= í î0 si i Ï ej

DEFINICIÓN 26. Dado un grafo G = (V, E) con V = {1 ... n} y E = {e1 ... em}, llamaremos matriz de incidencia a la matriz n x m; M definida por 50

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Fundamentos y aplicaciones de la teoría de grafos un extremo a en la cadena anterior. Repetiremos el proceso construyendo una cadena con ejes nuevos partiendo de dicho vértice a. De nuevo, dicha cadena debe terminar en a, por lo que se podrá unir a la cadena inicial. Repetimos este proceso hasta que la cadena contenga a todos los ejes del grafo (nótese que es necesario suponer que el grafo es finito). Por ejemplo, el grafo 1

2

3

4 5

no es Euleriano, por que los vértices 2 y 5 son impares. Este resultado también puede utilizarse para estudiar cuándo existen cadenas simples conectadas a dos vértices de un grafo que utilicen todos los ejes del mismo. PROPOSICIÓN 31. En un grafo (p-grafo) conexo existe una cadena simple entre los vértices a y b que recorra todos los ejes del grafo si, y sólo si, a y b son los únicos vértices de grado impar. La demostración es la misma que antes si añadimos al grafo un eje nuevo que una a con b. Este criterio es muy sencillo de aplicar en la práctica y permite, incluso, siguiendo los pasos de la demostración construir cadenas elementales entre dos vértices que recorran todos los ejes de un grafo. Por ejemplo, en el grafo anterior existirá una cadena simple uniendo a los vértices 2 y 5. Esto se puede aplicar para determinar los itinerarios en museos o parques de atracciones que permitan completar toda la visita sin tener que volver atrás (repetir ejes). Si en un museo existen objetos expuestos a ambos lado del recorrido, entonces deberemos representarlo mediante un grafo dirigido que se estudia de forma similar.

5. GRAFOS HAMILTONIANOS En 1859 el matemático irlandés W. R. Hamilton puso en circulación un peculiar rompecabezas basado en un dodecaedro regular (sólido regular formado por 12 pentágonos iguales). El juego consistía en estudiar si se podían recorrer sus 20 vértices sin repetir ninguno, moviéndose a través de las aristas. Hamilton marcó con una ciudad cada vértice y puso alfileres en los mismos, de modo que con un hilo se podían ir trazando diversos itinerarios. A pesar de ésto, el dodecaedro era incómodo de manejar, por lo que Hamilton desarrolló una versión equivalente mediante grafo plano (un grafo que se puede dibujar en el plano de forma que los cortes de los ejes siempre coincidan con algún vértice) isomorfo al dodecaedro. El grafo obtenido es el siguiente: Figura 3.

Puede comprobarse fácilmente que en el grafo anterior existen ciclos que pasan por todos los vértices sin repetir ninguno, salvo el inicial y el final (ciclos elementales). Otro juego similar de Hamilton (y bastante más popular) es el que consiste en recorrer todas las casillas de un tablero de ajedrez (sin repetir ninguna) usando un caballo. En este caso los vértices serían las casillas del tablero y los ejes los posibles movimientos de una casilla a otra. De nuevo el problema se puede plantear de forma general mediante la definición siguiente: DEFINICIÓN 32. Un grafo (o un p-grafo) es Hamiltoniano si existe un ciclo elemental que recorra todos sus vértices (ciclo Hamiltoniano). Es evidente que, igual que en el caso de los grafos Eulerianos, todo grafo Hamiltoniano debe ser conexo (en este caso no pueden haber vértices aislados). Sin embargo no se ha conseguido una propiedad sencilla que caracterice a los grafos Hamiltonianos como ocurría con los grafos Eulerianos. Puede comprobarse fácilmente que existen grafos Eulerianos que no son Hamiltonianos y viceversa. Sin embargo, estos conceptos sí coinciden en un caso especial de grafos, los grafos cuyos vértices tienen TEMARIO DE MATEMÁTICAS. PRUEBA A

51

Volumen I. Matemáticas

52

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

PROPOSICIÓN 36. Un bosque con k componentes conexas y con n vértices tiene n – k ejes.

grados todos iguales a 2. En este caso se obtienen grafos que son a la vez Eulerianos y Hamiltonianos, como por ejemplo, ocurre en

PROPOSICIÓN 35. Un árbol con n vértices tiene n – 1 ejes. La demostración es inmediata ya que si asignamos a cada vértice el eje que lo une con su predecesor, se obtiene una biyección entre ejes y vértices excluyendo el vértice raíz. Como consecuencia se tiene la proposición siguiente: 1

2

4

3

5

Las estructuras tipo árbol se presentan en numerosos campos científicos, de los cuales destacan las estructuras de almacenamiento de la información en ordenadores (discos duros), en redes de ordenadores (Internet, redes locales, cajeros automáticos, etc.) o en bibliotecas (sistema Dewey), redes de suministro (eléctricas, telefónicas, de agua, de gas, etc.), clasificación de especies naturales (taxonomía), clasificación del correo (continentes, países, etc.), genética (herencia genética, árboles genealógicos), programación y análisis de algoritmos, etc. En matemáticas podemos destacar el uso del los diagramas de árbol para la resolución de problemas de probabilidad o para estructurar las posibles opciones a la hora de resolver un problema. También hay que señalar la equivalencia entre los diagramas de árbol y los sistemas de numeración posicionales como, por ejemplo, el decimal, en el que los números 0...9 serían la primera generación, los del 10 al 99, los de la segunda, etc.

Desde el punto de vista práctico las aplicaciones también son similares. Por ejemplo, un ciclo (o cadena) Hamiltoniano es el ideal para hacer una visita a un museo o un palacio si los vértices representan cada una de las estancias y los ejes las conexiones entre ellas (en este caso las conexiones carecen de interés). Los ciclos (o cadenas) Hamiltonianos también pueden utilizarse para estudiar el denominado problema del viajante (o del cartero), en el que se quieren visitar distintas ciudades (puntos de un plano) procurando no repetir ninguna o haciéndolo en el menor tiempo (espacio) posible. Si se trata de visitar puntos en una ciudad y las calles no tienen todas doble sentido, entonces utilizaremos un grafo dirigido.

6. DIAGRAMAS DE ÁRBOL

V32

Un caso especial de grafo son las estructuras denominadas diagramas de árbol, introducidas por primera vez en los trabajos de Kirchoff (1847) sobre redes eléctricas y definidas de la forma siguiente: V21

V2

V12

V1

V2113

V211

V2112 V2111

DEFINICIÓN 34. Un bosque es un grafo sin ciclos.

V0

V31

V3

DEFINICIÓN 33. Un árbol es un grafo conexo sin ciclos.

De esta forma, las componentes conexas de un bosque serán árboles. Al no haber ciclos en un árbol, una vez que dos cadenas se separan ya no volverán a juntarse (como ocurre con las ramas de un árbol). Habitualmente, para representar un árbol se elige un vértice cualquiera (vértice raíz), a continuación se representan los que están unidos directamente con él por ejes (descendientes), se prosigue con los que están unidos con éstos y así sucesivamente hasta llegar a los vértices terminales (sin descendientes). Por ejemplo, podemos obtener el siguiente diagrama de árbol: V11

De esta forma, las componentes conexas de un bosque serán árboles. Al no haber ciclos en un árbol, una vez que dos cadenas se separan ya no volverán a juntarse (como ocurre con las ramas de un árbol). Habitualmente, para representar un árbol se elige un vértice cualquiera (vértice raíz), a continuación se representan los que están unidos directamente con él por ejes (descendientes), se prosigue con los que están unidos con éstos y así sucesivamente hasta llegar a los vértices terminales (sin descendientes). Por ejemplo, podemos obtener el siguiente diagrama de árbol: V11

V12

V2111

DEFINICIÓN 33. Un árbol es un grafo conexo sin ciclos.

V0

DEFINICIÓN 34. Un bosque es un grafo sin ciclos.

V1 V2

V21

V211

V2112

Un caso especial de grafo son las estructuras denominadas diagramas de árbol, introducidas por primera vez en los trabajos de Kirchoff (1847) sobre redes eléctricas y definidas de la forma siguiente: V3

V31

V2113

V32

6. DIAGRAMAS DE ÁRBOL

Las estructuras tipo árbol se presentan en numerosos campos científicos, de los cuales destacan las estructuras de almacenamiento de la información en ordenadores (discos duros), en redes de ordenadores (Internet, redes locales, cajeros automáticos, etc.) o en bibliotecas (sistema Dewey), redes de suministro (eléctricas, telefónicas, de agua, de gas, etc.), clasificación de especies naturales (taxonomía), clasificación del correo (continentes, países, etc.), genética (herencia genética, árboles genealógicos), programación y análisis de algoritmos, etc. En matemáticas podemos destacar el uso del los diagramas de árbol para la resolución de problemas de probabilidad o para estructurar las posibles opciones a la hora de resolver un problema. También hay que señalar la equivalencia entre los diagramas de árbol y los sistemas de numeración posicionales como, por ejemplo, el decimal, en el que los números 0...9 serían la primera generación, los del 10 al 99, los de la segunda, etc.

Desde el punto de vista práctico las aplicaciones también son similares. Por ejemplo, un ciclo (o cadena) Hamiltoniano es el ideal para hacer una visita a un museo o un palacio si los vértices representan cada una de las estancias y los ejes las conexiones entre ellas (en este caso las conexiones carecen de interés). Los ciclos (o cadenas) Hamiltonianos también pueden utilizarse para estudiar el denominado problema del viajante (o del cartero), en el que se quieren visitar distintas ciudades (puntos de un plano) procurando no repetir ninguna o haciéndolo en el menor tiempo (espacio) posible. Si se trata de visitar puntos en una ciudad y las calles no tienen todas doble sentido, entonces utilizaremos un grafo dirigido. 5

3

PROPOSICIÓN 35. Un árbol con n vértices tiene n – 1 ejes. La demostración es inmediata ya que si asignamos a cada vértice el eje que lo une con su predecesor, se obtiene una biyección entre ejes y vértices excluyendo el vértice raíz. Como consecuencia se tiene la proposición siguiente: 1

2

4

grados todos iguales a 2. En este caso se obtienen grafos que son a la vez Eulerianos y Hamiltonianos, como por ejemplo, ocurre en PROPOSICIÓN 36. Un bosque con k componentes conexas y con n vértices tiene n – k ejes.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

52

Fundamentos y aplicaciones de la teoría de grafos Las propiedades siguientes caracterizan a los diagramas de árbol, por lo que pueden utilizarse para su definición. PROPOSICIÓN 37. Las propiedades siguientes son equivalentes: 1.

G es conexo y sin ciclos.

2.

G es conexo y t(G) = o(G) – 1.

3.

G no tiene ciclos y t(G) = o(G) – 1.

4.

Entre cada dos vértices existe una única cadena que los une.

5.

G es conexo minimal (cualquier otro grafo sobre los mismos vértices con menos ejes deja de ser conexo).

La demostración es sencilla (ver Pelegrín y otros ,1992, pag. 63). La última propiedad muestra que los diagramas tipo árbol son los más económicos a la hora de conectar n vértices, por lo que se suelen utilizar para diseñar redes eléctricas, telefónicas, viarias, etc... Los árboles dirigidos (grafos dirigidos, conexos y sin ciclos) se utilizarán para representar relaciones no simétricas, como ocurre con la relación ser hijo de utilizada para la construcción de árboles genealógicos, o como ocurre con la organización en directorios del disco duro de un ordenador.

7. GRAFOS PLANOS De nuevo introduciremos el problema con un juego. Supongamos que tenemos que conectar tres granjas (1, 2, 3) y tres pozos de agua (4, 5, 6), pero como los granjeros están enemistados, los caminos no deben cruzarse. Utilizando grafos, el problema consistiría en representar el grafo V = {1, 2, 3, 4, 5, 6} y E = {{1, 4}, {1, 5}, {1, 6}, {2, 4}, {2, 5}, {2, 6}, {3, 4}, {3, 5}, {3, 6}} en un plano, de forma que los ejes sólo se crucen en los vértices. Puede comprobarse que ésto es imposible, lo que nos conduce a la definición siguiente: DEFINICIÓN 38. Un grafo plano es un grafo que se puede representar en el plano de forma que los cortes entre los ejes coincidan con vértices del mismo. Si existe dicha representación la llamaremos mapa. Anteriormente vimos cómo la representación plana del grafo que representa al dodecaedro permitió un manejo más cómodo del juego ideado por Hamilton. Puede comprobarse que los grafos de los 5 sólidos platónicos (tetraedro, cubo, dodecaedro, octaedro e icosaedro) son planos. Esta cuestión también es interesante a la hora de diseñar circuitos electrónicos impresos en los que si los ejes se tocan se produce un cortocircuito. Sin embargo, no siempre es sencillo el determinar cuándo un grafo es plano. El criterio más sencillo viene dado por el teorema de Kuratowski que, básicamente, dice que un grafo es plano si, y sólo si, no contiene a un grafo pentagonal (grafo completo de 5 vértices) o hexagonal (como el del ejemplo anterior de los granjeros) tras eliminar vértices superfluos (situados en medio de los ejes). Los grafos (o p-grafos) planos conexos (finitos) descomponen el plano en trozos poligonales adyacentes que denominaremos caras como, por ejemplo, ocurre con los grafos que representan mapas donde las caras corresponden a países o regiones. La parte externa del grafo también suele considerarse como una cara más del mismo (cara infinita). Nótese que si el grafo plano se traslada a una esfera la distinción entre caras finitas o infinitas deja de tener sentido. Para evitar malentendidos debe quedar claro que en estos polígonos las aristas (ejes) no tienen por qué ser líneas rectas. La fórmula de Euler nos proporciona la relación existente entre los vértices, los ejes y las caras de un grafo plano. PROPOSICIÓN 39. En un p-grafo plano conexo el número de vértices (o(G)), el número de ejes (t(G)) y el número de caras (c(G)) se relacionan mediante: o(G) + c(G) = t(G) + 2 Hagamos la demostración por inducción sobre el número de caras. Si el grafo sólo tiene una cara (la cara exterior) eso significa que no tiene ciclos (es un árbol), verificándose o(G) = t(G) + 1 TEMARIO DE MATEMÁTICAS. PRUEBA A

53

Volumen I. Matemáticas

54

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Como ya hemos comentado, los grafos (dirigidos) y las relaciones binarias son prácticamente un mismo objeto matemático aunque representado y estudiado de forma diferente. De esta forma, las propiedades de una relación binaria darán lugar a un tipo especial de grafos. Por ejemplo, la propiedad reflexiva dará lugar a grafos con bucles en todos sus vértices, o la propiedad simétrica dará lugar a los grafos no dirigidos (o simétricos). De esta forma relaciones como, ser divisor, ser múltiplo, ser perpendicular, ser paralelo, ser equivalente módulo m (a º b(mod m) sii a – b = km); o como cualquier tipo de orden parcial, darán lugar a grafos con distintos tipos de vértices (números reales, rectas, números naturales, etc.).

Supongamos cierta la fórmula de Euler para grafos con k – 1 caras. Si Gk es un grafo con k caras, entonces puede construirse añadiendo una cara (exterior) a un grafo Gk–1 con k – 1 caras. Para ésto deberemos unir dos de sus vértices por una cadena simple y elemental con vértices nuevos. Así, si añadimos r vértices nuevos se añadirán también r + 1 ejes nuevos (los que los conectan entre sí más los dos que los conectan con los vértices antiguos). De esta forma, el grafo Gk tendrá k caras, o(Gk–1) + r vértices y t(Gk–1) + r + 1 ejes. Como por inducción se verifica o(Gk–1) + c(Gk–1) = t(Gk–1) + 2 también se verificará o(Gk–1) + r + c(Gk–1) + 1 = t(Gk–1) + r + 1 + 2 es decir o(Gk) + c(Gk) = t(Gk) + 2

9.1. Matemáticas

9. APLICACIONES

DEFINICIÓN 41. Un grafo es coloreable si podemos asignar colores a los vértices de forma que a los vértices extremos de sus ejes les correspondan colores diferentes. Al número mínimo de colores necesarios para la coloración de un grafo se le denomina número cromático del grafo. Se puede comprobar que para colorear cualquier grafo plano conexo se necesitan al menos cuatro colores y que, de hecho, este problema es equivalente al teorema de los cuatro colores (es decir, con cuatro colores basta) utilizando el concepto de grafo dual de un grafo plano que es el que se construye eligiendo un punto en cada región del grafo plano (país) y uniéndolo mediante un eje con los países fronterizos.

8. TEOREMA DE LOS CUATRO COLORES

Otro problema interesante relacionado con los grafos planos es el denominado problema de los cuatro colores. Supongamos que tenemos un p-grafo plano que representa el mapa de una determinada región, donde cada compartimiento representa a un país distinto. La pregunta es ¿cuántos colores se necesitan para colorear dicho mapa de forma que a países contiguos les correspondan colores distintos? Puede comprobarse fácilmente que, al menos, se necesitan cuatro colores. La primera constancia escrita de dicho problema es una carta que dirige el matemático londinense De Morgan a W. R. Hamilton en 1852, en la que comentaba que uno de sus estudiantes (F. Guthrie) le planteó dicho problema señalando que la solución correcta era cuatro, pero que él no estaba convencido de dicha solución. Esto es lo que se conoce como teorema de los cuatro colores.

TEOREMA 40. Todo mapa puede colorearse con cuatro colores (sin que coincidan los colores de regiones fronterizas). Aunque inicialmente no se le dio mucha importancia a este problema, posteriormente ha sido una de las asignaturas pendientes de las matemáticas, resistiendo los análisis de los matemáticos más capacitados del mundo entero durante más de cien años, hasta que en 1976 Appel y Haken obtuvieron una demostración del mismo. Dicha demostración hacía uso de un ordenador para colorear los 2000 grafos a los que habían reducido el problema Appel y Haken, por lo que, además de resolver una cuestión pendiente, introdujo una nueva forma de demostración matemática en la que era fundamental el uso de un ordenador. Tras las primeras reticencias a estas innovaciones y las resoluciones de algunos errores en dicha demostración, parece que ésta ha sido admitida finalmente como correcta. Recientemente también se ha investigado sobre la coloración de mapas sobre otras superficies (esfera, toro, etc...) o en el espacio (véase Ore, 1995, pag. 133). El problema también se puede estudiar en grafos en general mediante la definición siguiente:

TEOREMA 40. Todo mapa puede colorearse con cuatro colores (sin que coincidan los colores de regiones fronterizas). Aunque inicialmente no se le dio mucha importancia a este problema, posteriormente ha sido una de las asignaturas pendientes de las matemáticas, resistiendo los análisis de los matemáticos más capacitados del mundo entero durante más de cien años, hasta que en 1976 Appel y Haken obtuvieron una demostración del mismo. Dicha demostración hacía uso de un ordenador para colorear los 2000 grafos a los que habían reducido el problema Appel y Haken, por lo que, además de resolver una cuestión pendiente, introdujo una nueva forma de demostración matemática en la que era fundamental el uso de un ordenador. Tras las primeras reticencias a estas innovaciones y las resoluciones de algunos errores en dicha demostración, parece que ésta ha sido admitida finalmente como correcta. Recientemente también se ha investigado sobre la coloración de mapas sobre otras superficies (esfera, toro, etc...) o en el espacio (véase Ore, 1995, pag. 133). El problema también se puede estudiar en grafos en general mediante la definición siguiente:

Otro problema interesante relacionado con los grafos planos es el denominado problema de los cuatro colores. Supongamos que tenemos un p-grafo plano que representa el mapa de una determinada región, donde cada compartimiento representa a un país distinto. La pregunta es ¿cuántos colores se necesitan para colorear dicho mapa de forma que a países contiguos les correspondan colores distintos? Puede comprobarse fácilmente que, al menos, se necesitan cuatro colores. La primera constancia escrita de dicho problema es una carta que dirige el matemático londinense De Morgan a W. R. Hamilton en 1852, en la que comentaba que uno de sus estudiantes (F. Guthrie) le planteó dicho problema señalando que la solución correcta era cuatro, pero que él no estaba convencido de dicha solución. Esto es lo que se conoce como teorema de los cuatro colores.

DEFINICIÓN 41. Un grafo es coloreable si podemos asignar colores a los vértices de forma que a los vértices extremos de sus ejes les correspondan colores diferentes. Al número mínimo de colores necesarios para la coloración de un grafo se le denomina número cromático del grafo. Se puede comprobar que para colorear cualquier grafo plano conexo se necesitan al menos cuatro colores y que, de hecho, este problema es equivalente al teorema de los cuatro colores (es decir, con cuatro colores basta) utilizando el concepto de grafo dual de un grafo plano que es el que se construye eligiendo un punto en cada región del grafo plano (país) y uniéndolo mediante un eje con los países fronterizos.

8. TEOREMA DE LOS CUATRO COLORES

o(Gk) + c(Gk) = t(Gk) + 2 o(Gk–1) + r + c(Gk–1) + 1 = t(Gk–1) + r + 1 + 2 también se verificará

9.1. Matemáticas

es decir

9. APLICACIONES

Supongamos cierta la fórmula de Euler para grafos con k – 1 caras. Si Gk es un grafo con k caras, entonces puede construirse añadiendo una cara (exterior) a un grafo Gk–1 con k – 1 caras. Para ésto deberemos unir dos de sus vértices por una cadena simple y elemental con vértices nuevos. Así, si añadimos r vértices nuevos se añadirán también r + 1 ejes nuevos (los que los conectan entre sí más los dos que los conectan con los vértices antiguos). De esta forma, el grafo Gk tendrá k caras, o(Gk–1) + r vértices y t(Gk–1) + r + 1 ejes. Como por inducción se verifica o(Gk–1) + c(Gk–1) = t(Gk–1) + 2

Como ya hemos comentado, los grafos (dirigidos) y las relaciones binarias son prácticamente un mismo objeto matemático aunque representado y estudiado de forma diferente. De esta forma, las propiedades de una relación binaria darán lugar a un tipo especial de grafos. Por ejemplo, la propiedad reflexiva dará lugar a grafos con bucles en todos sus vértices, o la propiedad simétrica dará lugar a los grafos no dirigidos (o simétricos). De esta forma relaciones como, ser divisor, ser múltiplo, ser perpendicular, ser paralelo, ser equivalente módulo m (a º b(mod m) sii a – b = km); o como cualquier tipo de orden parcial, darán lugar a grafos con distintos tipos de vértices (números reales, rectas, números naturales, etc.). CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

54

Fundamentos y aplicaciones de la teoría de grafos Un caso particular son las relaciones definidas entre intervalos de la recta real, de forma que dos intervalos están relacionados si, y sólo si, tienen intersección no vacía. Estas relaciones dan lugar a los denominados grafos de intervalos que aparecen al tratar una amplia variedad de problemas, desde problemas de tipo genético (estudio de la linealidad en estructura del interior de un gen) o arqueológico (ordenación de acontecimientos de manera cronológica), hasta el análisis de estilos literarios o pictóricos para la ordenación cronológica de obras o con el fin de determinar la autoría de las mismas. En Estadística ya hemos señalado su aplicación a la hora de resolver problemas de probabilidad (ver tema 64) o de combinatoria (ver tema 3). A un nivel más avanzado, los grafos también se utilizan para representar las clasificaciones de diversos individuos en grupos por procedimientos estadísticos de análisis multivariante obteniendo una distancia entre los mismos. Una técnica similar se utiliza, por ejemplo, para obtener clasificaciones en Biología en especies, géneros, subgéneros, etc. Por último, los fractales también pueden considerarse como cadenas sobre grafos con infinitos vértices.

9.2. Teoría de Juegos Ya hemos señalado como el estudio de los grafos Eulerianos y Hamiltonianos puede servirnos para la resolución de algunos juegos o pasatiempos (juego Hamilton, salto del caballo, laberintos, etc.). Además, de forma general, los grafos se pueden utilizar para analizar diversos juegos en los que las posiciones se representan mediante vértices y los posibles movimientos mediante ejes que permiten pasar de una posición a otra. De nuevo, si los movimientos son irreversibles (como ocurre, por ejemplo, con los movimientos de los peones en ajedrez), deberemos usar grafos dirigidos. En juegos de dos contrincantes deberemos representar en los vértices, además de las posiciones, a qué jugador le toca mover. Estos grafos pueden ayudarnos en la resolución de juegos sencillos en los denominados Talleres de Matemáticas analizando desde qué vértices se pueden llegar a las posiciones ganadoras (vértices finales) como, por ejemplo ocurre, en los juegos consistentes en retirar cerillas (o palillos) de diversos montones (ver Ore, 1995, pag. 83), o en los que consisten en atravesar un río con una barca bajo diversas condiciones (ver Ore, 1995, pag. 33). También se pueden utilizar los grafos para analizar juegos más complicados, como el ajedrez y señalar cómo pueden ser de ayuda a la hora de construir programas que jueguen al ajedrez.

9.3. Ingenierías (informática, telecomunicaciones, etc.) Ya hemos señalado la utilización de los grafos a la hora de diseñar redes (de transporte, de comunicaciones, de ordenadores, etc.) o de analizar su funcionamiento (problemas de tráfico, problema del viajante, reparto de correo o abastecimiento de comercios). Los grafos también se utilizan para diseñar circuitos impresos (grafos planos) o para construir programas (como los diagramas de flujo o los esquemas de menús utilizados en los programas para cajeros automáticos, las páginas Web o los puntos de información existentes en ciudades o campus universitarios). Los grafos también se utilizan a la hora de analizar la solidez de estructuras arquitectónicas (ver Ore, 1995, pag. 46) o de obras de ingeniería (puentes, andamios, etc.).

9.4. Varios Finalmente señalaremos algunas de las aplicaciones de los grafos en distintos tipos de ciencias. Así, en Química se usan para representar estructuras atómicas o el desarrollo de reacciones, en Biblioteconomía para organizar los materiales en Bibliotecas o Archivos (como los que utiliza el sistema Dewey, que primero clasifica por temas, después por materias, etc...), o para diseñar recorridos en museos o exposiciones (grafos Eulerianos o Hamiltonianos), en Genética para el estudio de problemas de descendencia o herencia (enfermedades genéticas, árboles genealógicos, pruebas de paternidad), en Medicina para diseñar esquemas de diagnóstico (se construye un árbol por el que nos movemos según las pruebas diagnósticas obtenidas para el paciente), en Derecho se pueden utilizar para analizar contratos o leyes complicados (aseguradoras, superposición de leyes, etc.) en Dirección de Empresas pueden utilizarse para representar la estructura del personal de una empresa o de sus tiendas y almacenes, o en Deportes para diseñar calendarios deportivos (grafos completos: sistema de liguilla (todo contra todos), árboles: sistemas de copa (play off), etc.). En Ore (1995) puede verse un resumen sencillo y completo sobre algunas aplicaciones de los grafos.

TEMARIO DE MATEMÁTICAS. PRUEBA A

55

TEMA

3 Técnicas de recuento. Combinatoria

Jorge Navarro Camacho

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

58

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN A LAS TÉCNICAS DE RECUENTO

2.

VARIACIONES

3.

PERMUTACIONES

4.

COMBINACIONES

5.

VARIACIONES CON REPETICIÓN

6.

PERMUTACIONES CON REPETICIÓN

7.

COMBINACIONES CON REPETICIÓN

8.

APLICACIONES

APLICACIONES

8.

COMBINACIONES CON REPETICIÓN

7.

PERMUTACIONES CON REPETICIÓN

6.

VARIACIONES CON REPETICIÓN

5.

COMBINACIONES

4.

PERMUTACIONES

3.

VARIACIONES

2.

INTRODUCCIÓN A LAS TÉCNICAS DE RECUENTO

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

58

Técnicas de recuento

1. INTRODUCCIÓN A LAS TÉCNICAS DE RECUENTO En numerosas ocasiones resulta difícil o muy tedioso la enumeración de todas las posibles soluciones de un problema. Por ejemplo, si queremos saber cuántas matrículas se pueden formar con dos letras y cuatro números, sería muy laborioso escribirlas todas. Sin embargo, si establecemos un mecanismo (algoritmo) que las genere, este mismo mecanismo puede servirnos para su recuento, sin la necesidad de generarlas todas. La ciencia que estudia las reglas de recuento (conteo) se denomina Combinatoria. Veamos, mediante ejemplos, algunas técnicas que nos permitan deducir el número de opciones en un problema. Por ejemplo, en este caso, podemos empezar por las matrículas AA0000, AA0001, etc., con lo que en total tendríamos 10.000 matrículas que empiezan con las letras AA desde la AA0000 a la AA9999. Esta primera técnica (enumeración) se basa en la ordenación de las posibles opciones, es decir, se trata de construir una biyección entre el conjunto de posibles opciones y un conjunto de números naturales de la forma In = { 1,..., n} cuyo cardinal es n. En este caso, la biyección es muy sencilla, ya que a cada matrícula se le asocia el número que se obtiene al eliminar las letras excepto a la matrícula AA0000 a la que se le asocia el número 10.000. De esta forma se obtiene una biyección entre las matrículas que empiezan por AA y los elementos de I10000. Esta misma técnica se puede aplicar para ver cuáles de esas matrículas serán impares o cuáles serán múltiplos de tres. Como los números impares entre 0000 y 9999 pueden escribirse como ak = – 1 + 2k desde k = 1,..., 5.000, se tendrá una biyección con I5.000. Análogamente, se obtiene que el número de matrículas múltiplos de tres serán 3.333. También podríamos haber razonado que como hay tantas matrículas pares como impares y en total hay diez mil, el número de matrículas impares será 10.000/2 = 5.000. De la misma forma se puede razonar para los múltiplos de tres si antes eliminamos el número (la matrícula) 0000. Denominaremos a esta técnica reducción. Ahora debemos contar cuántas “palabras” podemos formar con dos letras (con o sin sentido). En este caso, no es sencillo encontrar una biyección con un conjunto de la forma In. Sin embargo, sí es fácil encontrar una biyección con un producto cartesiano de ese tipo de conjuntos. Por ejemplo, si a cada letra le asignamos un número (A = 1, B = 2, ..., Z = 26), a cada pareja de letras se le puede asociar un punto del conjunto producto I26 x I26, con lo que su número será 26 · 26 = 676. En general, esta técnica consistirá en establecer una biyección entre las posibles opciones y un conjunto de la forma In x Im x ... x Ik. Como el número de elementos de un producto cartesiano es el producto de los cardinales de cada conjunto, su número será: nm...k. Por ejemplo, esta misma técnica sirve para calcular de nuevo el número de matrículas que empiezan por AA, ya que los números del 0000 al 9999 se pueden poner en biyección con los elementos de I10 x I10 x I10 x I10, por lo que su número será 104. También se puede utilizar para analizar el problema calculando cuántas matrículas habrá en total, ya que éstas se pueden relacionar de forma biyectiva con el conjunto I26 x I26 x I10 x I10 x I10 x I10, por lo que su número será 6760000. Además, las distintas opciones se pueden representar mediante un diagrama de árbol (ver tema 2), en el que se van representando las opciones que se tienen en cada paso, cuyo número es constante en cada paso (no depende de los pasos anteriores). a

1 letra

a

2 letra

er

1 número 0

A

1

... A

B

B

0

...

...

A

0

...

...

Veamos otro ejemplo en el que el conjunto de soluciones se puede representar con un diagrama de árbol de este tipo. Supongamos que para montar ordenadores, debemos elegir entre 3 tipos de unidades centrales, 2 tipos de pantalla y 3 tipos de teclado, todos ellos compatibles entre sí. ¿Cuántos ordenadores distintos podemos montar? La solución sería 3·2·3 = 18, Aplicaremos estas técnicas para deducir en las secciones siguientes el número de opciones en una serie de situaciones muy frecuentes (problemas tipo) que merecen un nombre propio. TEMARIO DE MATEMÁTICAS. PRUEBA A

59

Volumen I. Matemáticas

60

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

donde n!, se lee como ene factorial y es simplemente una forma de representar la multiplicación n(n – 1) ... 1. Por convenio 0! = 1. Con esta notación se tiene Vn,m = n! / (n – m)! Lógicamente, las permutaciones corresponden al número de aplicaciones biyectivas de In en In ya que, al coincidir los cardinales, si son inyectivas, serán biyectivas. De nuevo debemos distinguir entre el conjunto Pn de permutaciones de orden n y su número Pn.

2. VARIACIONES

Introduciremos la situación tipo denominada Variaciones con un ejemplo. ¿Cuántas palabras (con o sin sentido) pueden formarse escogiendo 3 letras distintas de las que forman la palabra CARLOS? Para resolver este problema podemos simplificarlo, estudiando primero cuántas palabras de una letra se pueden formar: C, A, R, L, O, S (6), cuántas de dos letras, etc., hasta obtener una formula general. Nos pueden ser de ayuda los diagramas en forma de árbol Pn = Vn,n = n(n – 1) ... 1= n [ n] = n!

Un caso particular de variaciones son aquellas en las que intervienen todos los elementos (n = m), denominadas Permutaciones, cuyo número será a

a

2 letra A

C

3 letra

...

3. PERMUTACIONES

a

1 letra

R

R

donde, por convenio, x[0] = 1. Nótese que x[ m] es un polinomio de grado m en x. ...

Vn,m = n[m]

A

C

...

donde x es un número real cualquiera y m es un número natural, entonces Así se obtiene que con sólo una letra tenemos 6 palabras distintas, con dos, 6 · 5 = 30 palabras distintas y con tres, 6 · 5 · 4 = 120, etc., ya que una vez colocada la primera letra sólo tenemos cinco opciones para la segunda, y colocadas las dos primeras letras, sólo tenemos cuatro opciones para la tercera. En general, el número de palabras de longitud m que pueden formarse con n letras (símbolos) diferentes es x[ m] = x (x – 1) ... (x – m+ 1)

donde la letra V proviene de Variaciones, que es el nombre que reciben estas formaciones caracterizadas por el hecho de que en ellas infuye el orden en que se coloquen los símbolos, de forma que la palabra CAR es diferente de la palabra CRA. De un modo más formal, las variaciones de n elementos tomados de m en m (Vm,n) es el conjunto de las distintas las m-úplas ordenadas que se pueden formar con n elementos distintos (sin repetir ninguno) y se pueden representar como aplicaciones inyectivas del conjunto Im en el conjunto In. De esta forma, si numeramos los elementos del 1 al m, la asignación f(3) = 4 indicaría que el elemento 4 es elegido en la tercera posición. Esta forma de representación nos permite la formación ordenada de todas las posibles opciones siguiendo el esquema del diagrama de árbol, comenzando por todas las aplicaciones f(1) = 1, ..., f(m) = m, f(1) = 1, ..., f(m) = m+ 1, etc., y siguiendo a continuación con las que verifica f(1) = 1, ..., f(m – 1) = m, etc. Formalmente, se llama variaciones al conjunto de todas las posibles opciones (m – úplas ordenadas), es decir, al conjunto de todas las posible aplicaciones inyectivas de Im en In, distinguiendo este conjunto de su cardinal dado por la fórmula (3.2.1). Si usamos la notación siguiente m–4números 1 243

Vn,m = n (n – 1)

...

(3.2.1)

= n (n – 1) ... (n – m+1)

donde la letra V proviene de Variaciones, que es el nombre que reciben estas formaciones caracterizadas por el hecho de que en ellas infuye el orden en que se coloquen los símbolos, de forma que la palabra CAR es diferente de la palabra CRA. De un modo más formal, las variaciones de n elementos tomados de m en m (Vm,n) es el conjunto de las distintas las m-úplas ordenadas que se pueden formar con n elementos distintos (sin repetir ninguno) y se pueden representar como aplicaciones inyectivas del conjunto Im en el conjunto In. De esta forma, si numeramos los elementos del 1 al m, la asignación f(3) = 4 indicaría que el elemento 4 es elegido en la tercera posición. Esta forma de representación nos permite la formación ordenada de todas las posibles opciones siguiendo el esquema del diagrama de árbol, comenzando por todas las aplicaciones f(1) = 1, ..., f(m) = m, f(1) = 1, ..., f(m) = m+ 1, etc., y siguiendo a continuación con las que verifica f(1) = 1, ..., f(m – 1) = m, etc. Formalmente, se llama variaciones al conjunto de todas las posibles opciones (m – úplas ordenadas), es decir, al conjunto de todas las posible aplicaciones inyectivas de Im en In, distinguiendo este conjunto de su cardinal dado por la fórmula (3.2.1). Si usamos la notación siguiente Vn,m = n (n – 1)

= n (n – 1) ... (n – m+1)

...

(3.2.1)

m–4números 1 243

Así se obtiene que con sólo una letra tenemos 6 palabras distintas, con dos, 6 · 5 = 30 palabras distintas y con tres, 6 · 5 · 4 = 120, etc., ya que una vez colocada la primera letra sólo tenemos cinco opciones para la segunda, y colocadas las dos primeras letras, sólo tenemos cuatro opciones para la tercera. En general, el número de palabras de longitud m que pueden formarse con n letras (símbolos) diferentes es x[ m] = x (x – 1) ... (x – m+ 1)

donde x es un número real cualquiera y m es un número natural, entonces ...

A

Vn,m = n[m] C

...

donde, por convenio, x[0] = 1. Nótese que x[ m] es un polinomio de grado m en x. C

R

A 1 letra a

...

2 letra a

R 3 letra

3. PERMUTACIONES

a

Un caso particular de variaciones son aquellas en las que intervienen todos los elementos (n = m), denominadas Permutaciones, cuyo número será

Introduciremos la situación tipo denominada Variaciones con un ejemplo. ¿Cuántas palabras (con o sin sentido) pueden formarse escogiendo 3 letras distintas de las que forman la palabra CARLOS? Para resolver este problema podemos simplificarlo, estudiando primero cuántas palabras de una letra se pueden formar: C, A, R, L, O, S (6), cuántas de dos letras, etc., hasta obtener una formula general. Nos pueden ser de ayuda los diagramas en forma de árbol Pn = Vn,n = n(n – 1) ... 1= n [ n] = n!

donde n!, se lee como ene factorial y es simplemente una forma de representar la multiplicación n(n – 1) ... 1. Por convenio 0! = 1. Con esta notación se tiene Vn,m = n! / (n – m)! Lógicamente, las permutaciones corresponden al número de aplicaciones biyectivas de In en In ya que, al coincidir los cardinales, si son inyectivas, serán biyectivas. De nuevo debemos distinguir entre el conjunto Pn de permutaciones de orden n y su número Pn.

2. VARIACIONES

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

60

Técnicas de recuento Veamos algunos ejemplos. EJEMPLO 1. ¿Cuántas palabras pueden formarse permutando (cambiando) las letras de la palabra CARLOS? La solución es: P6 = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720 EJEMPLO 2. Un servicio secreto decide codificar sus mensajes cambiando las 26 letras del alfabeto por 26 símbolos distintos. ¿Cuántos códigos distintos puede haber? La solución será P26 = 26! = 403291461126605635584000000 El conjunto Pn de permutaciones de orden n es un grupo no conmutativo para la composición de aplicaciones y cuyo elemento neutro es la aplicación identidad (s1(i) = i para i = 1, ..., n). Las permutaciones se suelen representar mediante n – úlplas. Por ejemplo, (3, 1, 2) representa a la permutación que hace las asignaciones siguientes: s(1) = 3, s(2) = 1, s(3) = 2. Llamaremos trasposición a una permutación en la que se permutan dos índices, dejando los n – 2 índices restantes invariantes, es decir, la trasposición de los índices i y j (i ¹ j), verifica tij (i) = j tij (j) = i tij (k) = k (k ¹ i y k ¹ j) Por ejemplo, en P3, t12 representa a (2, 1, 3). Supongamos fijada una permutación sp que denominaremos permutación principal (por ejemplo, la identidad). Entonces diremos que dos elementos en una permutación están invertidos si están en diferente orden que en la permutación principal. Formalmente, los elementos i y j están invertidos en s si (s(i) – s(j))(sp(i) – sp(j)) < 0. Por ejemplo, los elementos 2 y 1 están invertidos en (2, 1, 3) con respecto a la permutación identidad (1, 2, 3). Sin embargo los elementos 1 y 3 y 2 y 3 no están invertidos. Llamaremos índice de una permutación al número de inversiones que presenta. Lógicamente, este índice dependerá de la permutación principal que fijemos ya que, por ejemplo, el índice de la propia permutación principal será cero sólo cuando este índice se mida respecto de ella misma. Puede probarse que el índice coincide con el número mínimo de trasposiciones que hay que hacer (con las que debemos componerla) para convertirla en la permutación principal ind( s ) = min t k o ... o t1 o s = s p k

t transposiciones Diremos que una permutación es par (impar) si su índice es un número par (impar). Esta definición también depende de la permutación principal fijada. Sin embargo, el número de permutaciones pares no depende de la permutación principal fijada, ya que es igual al número de permutaciones impares y por lo tanto ambos son n!/2. Para demostrar esto señalaremos primero que, al realizar una trasposición, la permutación cambia de signo, es decir, sig(tij o s) ¹ sig(s) Esto es evidente, ya que si i y j estaban invertidos, al aplicar la trasposición dejarán de estarlo y al revés. De esta forma, dada una trasposición cualquiera, podemos establecer una biyección entre Pn y Pn mediante F(s) = tij o s. Como esta aplicación transforma las permutaciones pares en impares y viceversa, sus cardinales deben ser iguales. TEMARIO DE MATEMÁTICAS. PRUEBA A

61

Volumen I. Matemáticas

62

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

4. COMBINACIONES

æn ö n! ç ÷ ÷= ç è mø m!(n – m)!

Existen otro tipo de problemas donde el orden no tiene importancia, por ejemplo, si tenemos que escoger a dos ingenieros para trabajar en nuestra empresa de entre siete candidatos, ¿cuántas opciones diferentes tenemos? Este problema consiste en elegir un subconjunto de dos personas de un conjunto formado por los siete candidatos:

Estos son los números que aparecen en el triángulo de Pascal en la fila n y en la posición m+1, se deæn ö ç ÷ ÷(que se lee “n sobre m”), siendo nominan números combinatorios y se suelen representar medianteç è mø a b c d

b g

Cn,m =

V n! n,m = Pm m!(n – m)! e f g

De nuevo, para resolver el problema, estudiaremos primero otros más simples. Primero supongamos que tenemos un conjunto con un solo elemento {a}, que tendrá 1 subconjunto con cero elementos (el vacío f) y otro con un elemento {a}. Si el conjunto tiene dos elementos {a,b}, tendrá 1 con cero elementos, 2 ({a} y {b}) con un elemento, y 1 ({a,b}) con dos elementos. Para {a,b,c} se obtienen 1, 3, 3, 1, para {a,b,c,d}, 1, 4, 6, 4, 1, etc... Estos números pueden escribirse de la forma siguiente:

Estos números reciben el nombre de números combinatorios y esta forma de presentarlos es conocida como el triángulo de Pascal (escuela francesa) o de Tartaglia (escuela italiana) o simplemente triángulo aritmético. Hay que señalar que dicho triángulo es anterior a ambos autores, ya que aparece en Oriente en 1303 en el Ssu Yuang Yii Chien, y en Occidente en la portada de Aritmética de Pietrus Apianus (ver Vizmanos y Anzola (1990, pag. 268)), aunque fue Pascal el primero que sistematizó sus propiedades (ver Rey Pastor y Babini (1997, pag. 58)). En general, llamaremos combinaciones de n elementos tomados de m en m, a todos los subconjuntos distintos de cardinal m que podemos formar con n elementos distintos (sin repetir ninguno). Para deducir su número hay que tener en cuenta que el número de combinaciones (el orden no influye) será menor que el número de variaciones (el orden sí influye). De hecho se trata de deducir cuántas veces será menor. Esto es sencillo, ya que de cada conjunto con m elementos podemos formar Pm = m! – úplas distintas. De esta forma se tiene que el número de combinaciones de n elementos tomados de m en m es 1

1

2

1

1

3

1

4

5

3

1

6

4

10

10

1

5

1

1

1

1

4

Obsérvese que los números de una fila se obtienen sumando los situados justamente encima de él. 1

3

1

3

Obsérvese que los números de una fila se obtienen sumando los situados justamente encima de él. 1

4

Estos números reciben el nombre de números combinatorios y esta forma de presentarlos es conocida como el triángulo de Pascal (escuela francesa) o de Tartaglia (escuela italiana) o simplemente triángulo aritmético. Hay que señalar que dicho triángulo es anterior a ambos autores, ya que aparece en Oriente en 1303 en el Ssu Yuang Yii Chien, y en Occidente en la portada de Aritmética de Pietrus Apianus (ver Vizmanos y Anzola (1990, pag. 268)), aunque fue Pascal el primero que sistematizó sus propiedades (ver Rey Pastor y Babini (1997, pag. 58)). En general, llamaremos combinaciones de n elementos tomados de m en m, a todos los subconjuntos distintos de cardinal m que podemos formar con n elementos distintos (sin repetir ninguno). Para deducir su número hay que tener en cuenta que el número de combinaciones (el orden no influye) será menor que el número de variaciones (el orden sí influye). De hecho se trata de deducir cuántas veces será menor. Esto es sencillo, ya que de cada conjunto con m elementos podemos formar Pm = m! – úplas distintas. De esta forma se tiene que el número de combinaciones de n elementos tomados de m en m es 1

5

1

10

4

1

10

6

3

1

3

2

1

5

4

1

1

1

1

1

De nuevo, para resolver el problema, estudiaremos primero otros más simples. Primero supongamos que tenemos un conjunto con un solo elemento {a}, que tendrá 1 subconjunto con cero elementos (el vacío f) y otro con un elemento {a}. Si el conjunto tiene dos elementos {a,b}, tendrá 1 con cero elementos, 2 ({a} y {b}) con un elemento, y 1 ({a,b}) con dos elementos. Para {a,b,c} se obtienen 1, 3, 3, 1, para {a,b,c,d}, 1, 4, 6, 4, 1, etc... Estos números pueden escribirse de la forma siguiente: Vn,m n! = Pm m!(n – m)! e f g

Cn,m = b g

a b c d

Estos son los números que aparecen en el triángulo de Pascal en la fila n y en la posición m+1, se deæn ö nominan números combinatorios y se suelen representar medianteç ç ÷ ÷(que se lee “n sobre m”), siendo è mø

Existen otro tipo de problemas donde el orden no tiene importancia, por ejemplo, si tenemos que escoger a dos ingenieros para trabajar en nuestra empresa de entre siete candidatos, ¿cuántas opciones diferentes tenemos? Este problema consiste en elegir un subconjunto de dos personas de un conjunto formado por los siete candidatos:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

62

4. COMBINACIONES

æn ö n! ç ç ÷ ÷= m è ø m!(n – m)!

Técnicas de recuento æ4 ö 4 ! æ4 ö 4 ! Por ejemplo, ç = 6 . Por convenio, se define 0! = 1 para que ç = 1 . Es decir, el ç ÷ ç ÷ ÷= ÷= è 2ø 2!2! è 0ø 4 !0! triángulo de Pascal estaría formado por

( 10 ) ( 20 ) ( 30 ) ( 40 )

( 11 ) ( 21 )

( 31 ) ( 41 )

( 22 ) ( 32 )

( 42 )

( 33 ) ( 43 )

( 44 )

EJEMPLO 3. Por fin volveremos a nuestro problema original, que consistía en elegir a dos personas entre siete candidatos, para el que tendremos æ 7ö 7! 7× 6 C7,2 = ç = = 21 ç ÷ ÷= 2 è 2ø 2!5! opciones diferentes. EJEMPLO 4. Otro ejemplo típico es el de cuántos boletos hay que rellenar para asegurarnos un pleno en la lotería primitiva, es decir, cuántos subconjuntos de tamaño 6 se pueden formar con 49 números. La solución es æ 49ö C49,6 = ç ç ÷ ÷= 13983816 è6ø Las propiedades que permiten la formación de este triángulo y que mencionamos anteriormente fueron estudiadas por Blaise Pascal en 1654, y pueden formularse usando números combinatorios de la forma siguiente: æn ö æn ö 1. ç ç ÷ ÷= 1 yç ç ÷ ÷= 1 para todo n (unos en los lados) è 0ø èn ø 2. 3.

4. 5.

æn ö æ n ö ç ÷ ç ÷ ÷=ç ç ÷para todo m £ n (simetría) è mø è n – mø æ n + 1ö æ n ö æ n ö ç ÷ ÷ ç ÷= ç ç ÷ ÷+ç ç ÷para todo m £ n (al sumar dos números consecutivos en una fila se obtiene el è m ø è mø è m – 1ø número de la fila siguiente situado debajo de ellos). æ n + 1ö æ n ö æ n – 1ö æ mö ç ÷ ÷ ç ÷= ç ç ÷ ÷+ç ç ÷+... +ç ç ÷ ÷para todo m £ n. è m+ 1ø è mø è m ø è mø æ n + 1ö æ n ö æ n – 1ö æ n – mö ç ÷ ÷ ÷ ç ÷= ç ç ÷ ÷+ç ç ÷+... +ç ç ÷para todo m £ n. è m ø è mø è m – 1ø è 0 ø

La demostración de las dos primeras propiedades es muy sencilla. Para demostrar la tercera, basta considerar que æn ö æ n ö n! n! ç ÷ = + = ç ÷ ÷+ç ç ÷ m!(n – m)! (m – 1)!(n – m+ 1)! è mø è m – 1ø (n – m+ 1)+ m = m!(n – m+ 1)! (n + 1)! = = m!(n – m+ 1)! æ n + 1ö ÷ =ç ç ÷ è m ø = n!

TEMARIO DE MATEMÁTICAS. PRUEBA A

63

Volumen I. Matemáticas

64

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

para – 1 < t < 1 (ver Zoroa y Zoroa (1991)).

Para demostrar la cuarta y la quinta basta aplicar repetidas veces la tercera. Los números combinatorios aparecen también al calcular las diferentes potencias de un binomio, ¥ æ xö i ç ÷ ÷t (1+ t)x = åç i i=0 è ø

(a + b)1 = a + b

(a + b)2 = a2 + 2ab + b2

Con esta definición, la fórmula de Newton puede extenderse mediante (a + b)3 = a3 + 3a2b + 3ab2 + b3 æ x ö x[ m] ç ÷ ÷= ç è mø m!

y en la fórmula general que se conoce como fórmula del Binomio de Newton. (este ejemplo muestra cómo es conveniente contar al conjunto vacío como uno de los posibles subconjuntos de un conjunto dado). Posteriormente resolveremos este mismo problema de forma diferente. Los números combinatorios pueden extenderse para un número real cualquiera x y un entero positivo m mediante la definición siguiente PROPOSICIÓN. Si a y b son dos números reales y n es un entero positivo, entonces æ n ö n 0 æ n ö n–1 1 æ n ö 1 n–1 æ n ö 0 n ÷ (a + b)n = ç ç ÷ ÷ a b +ç ç ÷ ÷ a b + ... +ç ç ÷ a b +ç ç ÷ ÷a b è 0ø è 1ø è n – 1ø èn ø æ 7ö æ 7ö æ 7ö æ 7ö ç ÷ ÷+ç ç ÷ ÷+ ... +ç ç ÷ ÷+ç ç ÷ ÷= (1+ 1)7 = 27 ç è 0ø è 1ø è 6ø è 7ø

La demostración es consecuencia de que, como

n– veces 1 42 4 3

(a + b) = (a + b) n

...

(a + b)

EJEMPLO 5. Si reformulamos el problema inicial de forma que podamos elegir a los candidatos que queramos (desde ninguno, f, a todos), las opciones serán si queremos contar cuántas veces aparece el polinomio ai bn–i (para un i fijo), debemos ver cuántos subconjuntos de cardinal i se pueden extraer del conjunto In = {1, ..., n}, ya que los números incluidos en estos subconjuntos nos indicaría en qué factores tomaríamos la letra a (por ejemplo, para i = n sólo hay un subconjunto de tamaño n, el propio In, que indicaría que para obtener an debemos tomar en todos los factores la letra a). Como hemos demostrado antes, el número de subconjuntos de cardinal i que se pueden extraer de æn ö un conjunto de tamaño n, esç ç ÷ ÷con lo que se prueba la fórmula de Newton. Esta fórmula también se puede èiø demostrar por inducción en n.

es decir, que el número de los subconjuntos (de cualquier tamaño, incluido el vacío) de un conjunto con n elementos es igual a 2n (e igual a la suma de la fila n-ésima del triángulo de Pascal). æn ö æn ö æ n ö æn ö ç ÷ ÷+ç ç ÷ ÷+ ... +ç ç ÷+ç ç ÷ ÷, (1+ 1)n = 2n = ç ÷ è 0ø è 1ø è n – 1ø è n ø

COROLARIO. Si en la fórmula de Newton hacemos a = 1 y b = 1, se obtiene que

si queremos contar cuántas veces aparece el polinomio ai bn–i (para un i fijo), debemos ver cuántos subconjuntos de cardinal i se pueden extraer del conjunto In = {1, ..., n}, ya que los números incluidos en estos subconjuntos nos indicaría en qué factores tomaríamos la letra a (por ejemplo, para i = n sólo hay un subconjunto de tamaño n, el propio In, que indicaría que para obtener an debemos tomar en todos los factores la letra a). Como hemos demostrado antes, el número de subconjuntos de cardinal i que se pueden extraer de æn ö ç ÷ ÷con lo que se prueba la fórmula de Newton. Esta fórmula también se puede un conjunto de tamaño n, esç èiø demostrar por inducción en n. COROLARIO. Si en la fórmula de Newton hacemos a = 1 y b = 1, se obtiene que æn ö æn ö æ n ö æn ö ÷ (1+ 1)n = 2n = ç ç ÷ ÷+ç ç ÷ ÷+ ... +ç ç ÷+ç ç ÷ ÷, è 0ø è 1ø è n – 1ø è n ø

es decir, que el número de los subconjuntos (de cualquier tamaño, incluido el vacío) de un conjunto con n elementos es igual a 2n (e igual a la suma de la fila n-ésima del triángulo de Pascal). EJEMPLO 5. Si reformulamos el problema inicial de forma que podamos elegir a los candidatos que queramos (desde ninguno, f, a todos), las opciones serán (a + b)n = (a + b)

(a + b)

...

æ 7ö æ 7ö æ 7ö æ 7ö 7 7 ç ç ÷ ÷+ç ç ÷ ÷+ ... +ç ç ÷ ÷+ç ç ÷ ÷= (1+ 1) = 2 è 0ø è 1ø è 6ø è 7ø n– veces 1 42 4 3

La demostración es consecuencia de que, como

æn ö æn ö æ n ö æn ö 0 n ç ÷ ÷ a nb 0 +ç ç ÷ ÷ a n–1b1+ ... +ç ç ÷ a 1b n–1+ç ç ÷ ÷a b (a + b)n = ç ÷ è 0ø è 1ø è n – 1ø èn ø

(este ejemplo muestra cómo es conveniente contar al conjunto vacío como uno de los posibles subconjuntos de un conjunto dado). Posteriormente resolveremos este mismo problema de forma diferente. Los números combinatorios pueden extenderse para un número real cualquiera x y un entero positivo m mediante la definición siguiente PROPOSICIÓN. Si a y b son dos números reales y n es un entero positivo, entonces æ x ö x[ m] ç ç ÷ ÷= è mø m!

y en la fórmula general que se conoce como fórmula del Binomio de Newton. (a + b)3 = a3 + 3a2b + 3ab2 + b3 (a + b)2 = a2 + 2ab + b2

Con esta definición, la fórmula de Newton puede extenderse mediante ¥ æ xö i (1+ t)x = åç ç ÷ ÷t i i=0 è ø

(a + b)1 = a + b

Para demostrar la cuarta y la quinta basta aplicar repetidas veces la tercera. Los números combinatorios aparecen también al calcular las diferentes potencias de un binomio,

para – 1 < t < 1 (ver Zoroa y Zoroa (1991)).

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

64

Técnicas de recuento

5. VARIACIONES CON REPETICIÓN Volvamos al ejemplo de la sección anterior. Para resolverlo de forma distinta tendremos en cuenta que para el primer candidato tenemos dos opciones, elegirlo o no elegirlo, para el segundo lo mismo, etc. Así la decisión se podría escribir de la forma siguiente 0110011, donde el primer cero indica que el primer candidato no es elegido, el segundo dígito (1) indica que el segundo sí es elegido y así sucesivamente. Entonces nuestro problema sería estudiar cuántas palabras (números) de longitud 7 pueden formarse con dos símbolos (0 y 1). Formando un diagrama de árbol como al comienzo del tema, como para cada posición tendremos dos opciones, en total se podrán formar 27 palabras distintas. También se pueden poner en 7 x I 2. relación biyectiva con I2 x ... De igual forma podemos estudiar cuántas palabras pueden formarse con las letras de CARLOS pero permitiéndose que éstas se repitan. Comenzaremos por las palabras formadas por una sola letra para las que tendremos 6 opciones. Para las de dos letras tendremos 36, etc., y en general se tendrán 6m, donde m indica la longitud de las palabras (m puede ser mayor que 6). En general, con n símbolos distintos, ¿cuántas palabras de longitud m se podrán formar? Estas formaciones reciben el nombre de Variaciones con Repetición (m-úplas formadas con los elementos distintos o no de un conjunto de cardinal n) y su número es V Rn,m = nm Las variaciones con repetición de n elementos tomados de m en m se pueden representar como aplicaciones del conjunto Im en In que indiquen qué elemento de In se sitúa en el lugar 1, 2, ..., m. Las variaciones ordinarias (es decir, las aplicaciones inyectivas) serán un subconjunto de las variaciones con repetición. Nótese que en este caso m no tiene que ser menor que n, como ocurre en el ejemplo inicial (n = 2 y m = 7). EJEMPLO 6. Un ejemplo típico es el de los sistemas de numeración posicionales como el decimal. En ellos los números se forman usando una serie de cadenas (palabras) con una serie de signos distintos. El valor de un número se obtiene sumando el código de cada posición por la potencia de la base correspondiente. Por ejemplo, en notación decimal 346 = 3 +4 · 10 + 6 · 102 ó en base 7, 3467 = 3 + 4 · 7 + 6 · 72 = 325. Así, en notación decimal con tres cifras podemos formar V R10,3 = 103 = 1000 números distintos (del 0 al 999, considerando 003 como un número de tres cifras). ¿Cuántos se pueden codificar en base 2? Se pueden formar V R2,3 = 23 = 8 (del 0002 = 0 al 1112 = 1 + 2 + 4 = 7). De esta forma se obtiene que con m cifras en base b se pueden formar bm números, del 0 al mayor posible (b – 1) + (b – 1)b1 + ... + (b – 1)bm – 1, es decir (b – 1) + (b – 1)b1 + ... + (b – 1)bm – 1 = bm – 1 que equivale a, (b – 1)(1 + b + ... + bm – 1) = bm – 1 de donde se obtiene la fórmula que da la suma de los primeros términos de una progresión geométrica: 1 + b + ... + bm – 1 = (bm – 1) = (b – 1) EJEMPLO 7. Otro ejemplo típico es el de cuántos boletos debemos rellenar para estar seguros de acertar 14 en las quinielas. Es decir, cuántas palabras de longitud 14 podemos formar con tres símbolos, cuyo número es V R3,14 = 314 = 4782969

6. PERMUTACIONES CON REPETICIÓN Supongamos ahora que estamos participando en el juego de las palabras cruzadas (Scrable) y que disponemos de las letras A,S,R,Q,A,A,S. ¿Cuántas palabras podemos formar usándolas todas? El problema es equivalente a estudiar cuántas palabras se pueden formar permutando (cambiando de orden) las letras de CASA. Si todas las letras fuesen distintas (COSA) tendríamos P4 = 4! = 24 opciones. Pero al tener dos letras repetidas (A,A), cuando las permutemos obtendremos la misma palabra. De forma que de COSA y TEMARIO DE MATEMÁTICAS. PRUEBA A

65

Volumen I. Matemáticas

66

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

CASO, se obtiene sólo CASA. Así se obtiene que con CASA se podrán formar 24/2 = 12 palabras distintas. Nótese que se divide por el número de posibles permutaciones de los símbolos que son iguales ¿Qué ocurrirá con las letras CAAAS? ¿Y con CASAS? A partir de estos ejemplos y teniendo en cuenta las consideraciones que hicimos al comienzo del tema, podemos deducir la siguiente fórmula general. Las n-úplas (palabras de longitud n) que pueden formarse con n elementos (letras) distintos, donde el primero se repite n1 veces, el segundo n2, etc... (n1 + ... + nk = n) se denominan Permutaciones con Repetición y su número es: æ n + m – 1ö ç ÷ CR n,m = ç ÷ è m ø

Por último estudiaremos las formaciones denominadas Combinaciones con Repetición. Introduciremos el problema con un ejemplo. Supongamos que el capitán de un barco puede cargar 5 contenedores. Puede elegir entre tres mercancías diferentes: transistores, ordenadores o cintas de vídeo, habiendo en el puerto existencias suficientes de las tres ¿Cuántas opciones tiene? Una opción sería cargar sólo transistores {TTTTT}, otra dos de transistores y tres de ordenadores {T,T,O,O,O}, etc. Se trata de calcular el número de subconjuntos de 5 elementos que pueden formarse con los elementos de {T,O,C} permitiéndose la repetición de éstos. En general, llamaremos combinaciones con repetición de n elementos tomados de m en m, a todos los posibles subconjuntos de cardinal m que pueden formarse con los n elementos permitiendo que éstos se repitan y su número es: PR nn 1 ,n 2 ... n k =

n! n 1! ... n k!

En particular, si no se repite ninguno (n1 = ... = nk = 1), se obtienen las permutaciones ordinarias PR1,n ...1 =

n! = n!= Pn 1! ... 1!

7. COMBINACIONES CON REPETICIÓN

Nótese que

que se puede demostrar de forma similar a como demostramos la de Newton, es decir, contando cuantas palabras se pueden formar con los símbolos {1, ..., m} si el primero se repite k1-veces (tiene potencia k1), etc. Pn = Pn1 ... Pnk PR nn1 , n2 ... nk

es decir, que el número de palabras de longitud n que se pueden formar con n elementos distintos es igual a las que se pueden formar si hubiera algunos iguales por las que se podrían formar con esos elementos iguales si no lo fueran (esto es otra forma de probar la fórmula que da el número de permutaciones con repetición). EJEMPLO 8. Usando esta formula general se obtiene que con CAAAS, pueden formarse 5! PR1,5 3, 1 = = 20 1!3!1! palabras distintas, con CASAS, 5! PR1,5 2, 2 = = 30, 1!2!2! y con A, S, R, Q, A, A, S, 7! PR 73, 2, 1, 1 = = 420 3!2!1!1! palabras distintas. Usando estos números, la fórmula de Newton se generaliza mediante la fórmula de Leibniz n! (x1+ ... + xm )n = å k ! ... k ! x1k1 ... xkmm m k1 + ... + k m =n 1 k1 + ... + k m =n

es decir, que el número de palabras de longitud n que se pueden formar con n elementos distintos es igual a las que se pueden formar si hubiera algunos iguales por las que se podrían formar con esos elementos iguales si no lo fueran (esto es otra forma de probar la fórmula que da el número de permutaciones con repetición). EJEMPLO 8. Usando esta formula general se obtiene que con CAAAS, pueden formarse 5! PR1,5 3, 1 = = 20 1!3!1! palabras distintas, con CASAS, 5! PR1,5 2, 2 = = 30, 1!2!2! y con A, S, R, Q, A, A, S, 7! PR 3,7 2, 1, 1 = = 420 3!2!1!1! palabras distintas. Usando estos números, la fórmula de Newton se generaliza mediante la fórmula de Leibniz n! xk1 ... xmkm k1! ... k m! 1 (x1+ ... + xm )n =

å

que se puede demostrar de forma similar a como demostramos la de Newton, es decir, contando cuantas palabras se pueden formar con los símbolos {1, ..., m} si el primero se repite k1-veces (tiene potencia k1), etc. Pn = Pn1 ... Pnk PR nn1 , n2 ... nk

Nótese que

PR1,n ...1 =

n! = n!= Pn 1! ... 1!

7. COMBINACIONES CON REPETICIÓN

Por último estudiaremos las formaciones denominadas Combinaciones con Repetición. Introduciremos el problema con un ejemplo. Supongamos que el capitán de un barco puede cargar 5 contenedores. Puede elegir entre tres mercancías diferentes: transistores, ordenadores o cintas de vídeo, habiendo en el puerto existencias suficientes de las tres ¿Cuántas opciones tiene? Una opción sería cargar sólo transistores {TTTTT}, otra dos de transistores y tres de ordenadores {T,T,O,O,O}, etc. Se trata de calcular el número de subconjuntos de 5 elementos que pueden formarse con los elementos de {T,O,C} permitiéndose la repetición de éstos. En general, llamaremos combinaciones con repetición de n elementos tomados de m en m, a todos los posibles subconjuntos de cardinal m que pueden formarse con los n elementos permitiendo que éstos se repitan y su número es: æ n + m – 1ö ÷ CR n,m = ç ç ÷ è m ø En particular, si no se repite ninguno (n1 = ... = nk = 1), se obtienen las permutaciones ordinarias PR nn 1 ,n 2 ... n k =

n! n 1! ... n k!

CASO, se obtiene sólo CASA. Así se obtiene que con CASA se podrán formar 24/2 = 12 palabras distintas. Nótese que se divide por el número de posibles permutaciones de los símbolos que son iguales ¿Qué ocurrirá con las letras CAAAS? ¿Y con CASAS? A partir de estos ejemplos y teniendo en cuenta las consideraciones que hicimos al comienzo del tema, podemos deducir la siguiente fórmula general. Las n-úplas (palabras de longitud n) que pueden formarse con n elementos (letras) distintos, donde el primero se repite n1 veces, el segundo n2, etc... (n1 + ... + nk = n) se denominan Permutaciones con Repetición y su número es:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

66

Técnicas de recuento Demostraremos esta fórmula por inducción en m. En primer lugar, si m = 1, entonces no se puede repetir ningún elemento, por lo que su número será æn ö CR n,1 = Cn,1 = ç ç ÷ ÷= n è 1ø (número de subconjuntos de un solo elemento). Supongamos formadas todas las posibles combinaciones con repetición de orden m – 1. Supongamos también que si los elementos están ordenados como en el conjunto de partida {a1, ..., an}. Es decir, que si en un conjunto están ai y aj con i < j, ponemos antes a ai que a aj. De esta forma, si a cada uno de estos conjuntos, le añadimos un elemento igual o posterior al último, obtenemos subconjuntos de tamaño m distintos entre sí. Por ejemplo, a {a1, ..., a1} le podemos añadir a1 o a2 o ... o an y a {a1, ..., a1, a2} se le puede añadir a2 o ... o an. Además, evidentemente, de esta forma se obtienen todos los posibles subconjuntos de tamaño m. Así, para cada subconjunto de tamaño m – 1 se obtienen tantos subconjuntos como n – i + 1 siendo i el índice de su último elemento. Ahora tenemos que contar cuántas veces aparece ai el último. Esta claro que a1 sólo aparece una vez y que a2 aparece m – 2 veces (los subconjuntos de tamaño m – 1 que se pueden formar æ 2+ m – 3ö ÷ con dos elementos a1 y a2, es decir, por inducción CR 2, m– 2 = ç ç ÷= m – 1). Análogamente, tendreè m– 2 ø æ i + m – 3ö ÷ mos CR i, m– 2 = ç ç ÷subconjuntos que finalizan en el elemento ai. De esta forma, se obtiene è m– 2 ø CRn,m

= nCR1,m – 1 + (n – 1)CR2,m – 1 + ... + CRn,m – 1 = n æ i + m – 3ö ÷ = å(n – i + 1)ç ç ÷= è m– 2 ø i=1 n

= å[n – (i – 1)] i=1

(i + m – 3)! = (m – 2)!(i – 1)!

n n æ i + m – 3ö æ i + m – 3ö ÷ ÷ = n åç ç ÷– (m – 1)åç ç ÷ m– 2 ø m–1 ø i=1 è i=1 è

Si usamos ahora la propiedad (4) de los números combinatorios, se tiene CRn,m

æ n + m – 2ö æ n + m – 2ö ÷ ÷ = nç ç ÷– (m – 1) ç ç ÷= m – 1 m è ø è ø =n

(n + m – 2)! (n + m – 2)! – (m – 1) = (m – 1)!(n – 1)! m!(n – 2)!

= (n + m – 2)! =

nm – (m – 1)(n – 1) = m!(n – 1)!

n + m – 1ö (n + m – 1)! æ ÷ =ç ç ÷ m!(n – 1)! è m ø

Nótese que además de demostrar la fórmula que da el número de combinaciones con repetición, hemos dado una forma para construirlas ordenadamente. EJEMPLO 9. En el ejemplo inicial, la solución sería: æ 7ö 7! 7× 6 CR 3, 5 = ç = = 21 ç ÷ ÷= 2 è 5ø 5!2! que se podría obtener de la forma siguiente: Con un elemento: {1}, {2}, {3}

TEMARIO DE MATEMÁTICAS. PRUEBA A

67

Volumen I. Matemáticas

68

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Con dos elementos:

La combinatoria también se puede aplicar a la resolución de algunos problemas geométricos como el cálculo del número de vértices en diferentes figuras o aritméticos en donde, se puede mostrar como, los números de las primeras filas del triángulo de Pascal coinciden (sorprendentemente) con las potencias de 11. También a la hora de resolver un problema en programación lineal (o de análisis) una de las opciones es enumerar todas las posibles soluciones y compararlas entre sí (ver cuál da el máximo o el mínimo) cuando éstas no son muy numerosas (con ayuda de un programa para ordenador que las genere). Por ejemplo, si queremos ver de cuántas formas diferentes podemos ir de un punto a otro en una cuadrícula (ciudad) (avanzando siempre hacia el punto origen), deberemos usar la fórmula de las permutaciones con repetición (en la figura, como debemos elegir cuatro tramos horizontales y cuatro verticales, será PR 4,8 4) {1, 1}, {1, 2}, {1, 3} {2, 2}, {2, 3} {3, 3} etc., ... El resultado puede mostrarse con un diagrama de árbol.

8. APLICACIONES

Durante todo el tema hemos mostrado mediante ejemplos algunas de las numerosas aplicaciones que tiene la combinatoria. Además señalaremos que es imprescindible en Estadística a la hora de asignar probabilidades mediante la definición clásica (número casos a favor/número de casos totales) y en modelos como la Binomial, la Binomial Negativa o la Multinomial, cuyas definiciones se basan en las fórmulas de Newton y de Leibniz. Estas distribuciones se utilizan, por ejemplo, para realizar el control de calidad sobre lotes de piezas de un determinados producto. También hemos visto cómo en muchos juegos hay que tener en cuenta todas las opciones posibles y lo mismo ocurre a la hora de poner claves de acceso (passwords) o candados electrónicos. Además, en informática (teoría de la información), todo se representa mediante palabras formadas por dos símbolos 0 y 1 (números en base 2) y las variaciones con repetición de estos símbolos se utilizan como unidad básica para medir la información que es capaz de almacenar un ordenador (un bit una palabra de longitud 1, un byte una palabra de longitud 8, es decir, 28 símbolos, 1 kilobyte, 1gigabyte, etc.). También se puede estudiar otro tipo de códigos como el morse, o el de banderas, utilizado en la navegación. Por ejemplo, los números combinatorios se pueden introducir en los talleres de matemáticas o en visitas a museos de ciencias mediante un juego que consiste en dejar caer una bola por un plano inclinado en el que se han colocado una serie de postes y unas cajas en la parte inferior de la forma siguiente (aparato de Galton-Pearson):

Si admitimos que en cada poste la probabilidad de que la bola caiga hacia la izquierda es igual que la de que caiga a la derecha, entonces el número de bolas que se recogen en cada caja es proporcional (a la larga) a los números correspondientes del triángulo de Pascal (en la figura 1, 5, 10, 10, 5, 1), o, lo que es igual, la probabilidad de que una bola caiga en una caja es igual el número combinatorio correspondiente dividiææ n ö ö do por la suma de toda la filaçç ÷/ 2n ÷. èè i ø ø Figura 1.

Figura 1.

Durante todo el tema hemos mostrado mediante ejemplos algunas de las numerosas aplicaciones que tiene la combinatoria. Además señalaremos que es imprescindible en Estadística a la hora de asignar probabilidades mediante la definición clásica (número casos a favor/número de casos totales) y en modelos como la Binomial, la Binomial Negativa o la Multinomial, cuyas definiciones se basan en las fórmulas de Newton y de Leibniz. Estas distribuciones se utilizan, por ejemplo, para realizar el control de calidad sobre lotes de piezas de un determinados producto. También hemos visto cómo en muchos juegos hay que tener en cuenta todas las opciones posibles y lo mismo ocurre a la hora de poner claves de acceso (passwords) o candados electrónicos. Además, en informática (teoría de la información), todo se representa mediante palabras formadas por dos símbolos 0 y 1 (números en base 2) y las variaciones con repetición de estos símbolos se utilizan como unidad básica para medir la información que es capaz de almacenar un ordenador (un bit una palabra de longitud 1, un byte una palabra de longitud 8, es decir, 28 símbolos, 1 kilobyte, 1gigabyte, etc.). También se puede estudiar otro tipo de códigos como el morse, o el de banderas, utilizado en la navegación. Por ejemplo, los números combinatorios se pueden introducir en los talleres de matemáticas o en visitas a museos de ciencias mediante un juego que consiste en dejar caer una bola por un plano inclinado en el que se han colocado una serie de postes y unas cajas en la parte inferior de la forma siguiente (aparato de Galton-Pearson):

Si admitimos que en cada poste la probabilidad de que la bola caiga hacia la izquierda es igual que la de que caiga a la derecha, entonces el número de bolas que se recogen en cada caja es proporcional (a la larga) a los números correspondientes del triángulo de Pascal (en la figura 1, 5, 10, 10, 5, 1), o, lo que es igual, la probabilidad de que una bola caiga en una caja es igual el número combinatorio correspondiente dividiææ n ö ö do por la suma de toda la filaçç ÷/ 2n ÷. èè i ø ø La combinatoria también se puede aplicar a la resolución de algunos problemas geométricos como el cálculo del número de vértices en diferentes figuras o aritméticos en donde, se puede mostrar como, los números de las primeras filas del triángulo de Pascal coinciden (sorprendentemente) con las potencias de 11. También a la hora de resolver un problema en programación lineal (o de análisis) una de las opciones es enumerar todas las posibles soluciones y compararlas entre sí (ver cuál da el máximo o el mínimo) cuando éstas no son muy numerosas (con ayuda de un programa para ordenador que las genere). Por ejemplo, si queremos ver de cuántas formas diferentes podemos ir de un punto a otro en una cuadrícula (ciudad) (avanzando siempre hacia el punto origen), deberemos usar la fórmula de las permutaciones con repetición (en la figura, como debemos elegir cuatro tramos horizontales y cuatro verticales, será PR 84, 4)

8. APLICACIONES

Con dos elementos: {1, 1}, {1, 2}, {1, 3} {2, 2}, {2, 3} {3, 3} etc., ... El resultado puede mostrarse con un diagrama de árbol.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

68

Técnicas de recuento Salida

Figura 2.

Llegada

De esta forma, si cada tramo tiene una distancia (tiempo esperado), a cada camino se le puede asignar una distancia total. Sin embargo, tanto las potencias como los factoriales o los números combinatorios crecen muy deprisa por lo que muchos problemas reales tienen tantas opciones que incluso con los ordenadores mas potentes, su comparación tardaría mucho (son lo denominados problemas no programables en los que el tiempo o la memoria necesaria para su resolución aumenta muy rápidamente al aumentar los datos iniciales, como, por ejemplo, ocurre al estudiar si un número es primo).

TEMARIO DE MATEMÁTICAS. PRUEBA A

69

TEMA

4 Números enteros. Divisibilidad. Números primos. Congruencia

Jesús Goméz Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

72

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

CONSTRUCCIÓN DEL ANILLO ORDENADO DE LOS NÚMEROS ENTEROS 2.1. Definición del conjunto Z 2.2. Suma o adición en Z 2.3. Producto o multiplicación en Z 2.4. El orden en Z 2.5. Simetrización de la suma en N. Otra forma de construir Z 2.6. Otras propiedades relevantes de Z

3.

IDEALES EN EL ANILLO DE LOS ENTEROS. ANILLOS COCIENTE 3.1. División entera o euclídea en Z 3.2. Subgrupos de (Z,+) 3.3. Ideales del anillo (Z,+,·) 3.4. Anillos de clases residuales 3.4.1. Anillo Zn de restos módulo n 3.4.2. Anillo cociente Z nZ 3.4.3. Identificación entre Z nZ y Zn

4.

DIVISIBILIDAD 4.1. Nociones preliminares 4.2. Relación de divisibilidad en Z 4.3. Números primos 4.4. Máximo común divisor 4.5. Mínimo común múltiplo 4.6. Algoritmo de Euclides 4.7. Factorización. Teorema fundamental 4.8. Caracterización de los ideales primos de Z 4.9. Divisores de un número

5.

CONGRUENCIAS EN EL ANILLO DE LOS ENTEROS 5.1. Relación de congruencia en Z 5.2. Propiedades de las congruencias 5.3. Restos potenciales 5.4. Criterios de divisibilidad. 5.5. Sistemas de números incongruentes 5.6. Congruencia de Fermat

CONGRUENCIAS EN EL ANILLO DE LOS ENTEROS 5.1. Relación de congruencia en Z 5.2. Propiedades de las congruencias 5.3. Restos potenciales 5.4. Criterios de divisibilidad. 5.5. Sistemas de números incongruentes 5.6. Congruencia de Fermat

5.

DIVISIBILIDAD 4.1. Nociones preliminares 4.2. Relación de divisibilidad en Z 4.3. Números primos 4.4. Máximo común divisor 4.5. Mínimo común múltiplo 4.6. Algoritmo de Euclides 4.7. Factorización. Teorema fundamental 4.8. Caracterización de los ideales primos de Z 4.9. Divisores de un número

4.

IDEALES EN EL ANILLO DE LOS ENTEROS. ANILLOS COCIENTE 3.1. División entera o euclídea en Z 3.2. Subgrupos de (Z,+) 3.3. Ideales del anillo (Z,+,·) 3.4. Anillos de clases residuales 3.4.1. Anillo Zn de restos módulo n 3.4.2. Anillo cociente Z nZ Identificación entre Z nZ y Zn

3.

CONSTRUCCIÓN DEL ANILLO ORDENADO DE LOS NÚMEROS ENTEROS 2.1. Definición del conjunto Z 2.2. Suma o adición en Z 2.3. Producto o multiplicación en Z 2.4. El orden en Z 2.5. Simetrización de la suma en N. Otra forma de construir Z 2.6. Otras propiedades relevantes de Z

2.

INTRODUCCIÓN

1.

3.4.3.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

72

Números enteros. Divisibilidad. Números primos. Congruencia

1. INTRODUCCIÓN Las operaciones aritméticas elementales dieron lugar a algunas constataciones empíricas sobre la divisibilidad. Pero ni los babilonios (tan expertos en álgebra) ni los egipcios (pese a su acrobático cálculo con fracciones) fueron capaces de dar reglas rigiendo estas propiedades. Es a los griegos a quienes corresponde la iniciativa en este campo. Los libros VII y IX de Euclides contienen exposiciones magistrales de bellos descubrimientos sobre divisibilidad. Así pues, la existencia del m.c.d. es demostrada y al principio del libro VII aparece el conocido “algoritmo de Euclides”. La existencia de infinitos números primos está también probada en el libro IX, ofreciendo un procedimiento de construcción de números pares perfectos a partir de ciertos números primos. Si bien Euclides no llegó a demostrar el teorema general sobre la existencia y unicidad de la descomposición en factores primos, sin embargo Euclides sí demostró explícitamente que todo entero es divisible por un número primo (libro VII). Parece ser que Euclides no llegó a enunciar el teorema general debido solamente a una carencia de terminología y notación adecuadas para las potencias cualesquiera de un número entero. Los números negativos aparecieron tardíamente si se les compara con los irracionales. Los signos + y –, de procedencia germánica, se utilizaban originalmente al parecer para indicar exceso o defecto en las medidas. El libro más antiguo en que aparecen impresos es una aritmética comercial publicada en 1489 por un alemán, Johann Widman, maestro calculista en Leipzig. Otro alemán, Stifel, publica su Arithmética íntegra, que supuso la más importante álgebra germánica del siglo XVII. Su importancia se debe, entre otras cosas, al tratamiento de los números negativos, contribuyendo además a popularizar los símbolos “germánicos” + y – en detrimento de la notación “italiana” que empleaba la p y la m. Pero sorprende cómo, a pesar de conocer todas sus propiedades, Stifel no los admitía como raíces de una ecuación, persistiendo en llamarlos numeri absurdi. Esta resistencia a aceptar los números negativos estuvo también presente en los algebristas italianos del Renacimiento (Tartaglia, Cardano, etc.). Los números irracionales habían sido aceptados con normalidad, a pesar de que no estaban aún fundamentados rigurosamente. Sin embargo, los números negativos planteaban más dificultades, pues no se podían aproximar, en el sentido natural, mediante números positivos. Ahora bien, la idea de sentido o dirección sobre una recta los hacía plausibles como representación de una magnitud orientada. Sin embargo, Cardano ya utilizó los números negativos a pesar de llamarlos, como hiciera Stifel, numeri fictici. Podemos decir que la aceptación casi definitiva se produjo ya en el siglo XVI, en plena transición del Renacimiento al mundo moderno, contribuyendo a ello de modo especial una gran figura del momento: François Viète. Hay que destacar también la posterior contribución de Fermat (1601-1665) a la teoría de números, y dentro de ella a la divisibilidad. Fueron numerosas sus conjeturas sobre los números primos. Consiguió probar la conjetura de Girard de que todo número primo de la forma 4n+1 puede expresarse de manera única como suma de cuadrados. Asimismo llegó a formular y demostrar el “teorema menor” de Fermat, que supuso una generalización de la “hipótesis china” de que n es primo si y sólo si 2n - 2 es divisible por n (hoy sabemos que ésta no se cumple pues 2341 – 2 es divisible por 341 y sin embargo 341 = 11 x 31 es un número compuesto. Del estudio de los números de la forma ap-1 – 1 parecía deducirse que siempre que p sea primo y a primo con p, ap-1 – 1 es divisible por p. Otra conjetura de las que hizo Fermat se refería a los números de 2n la forma 2 +1, de los que aseguró que eran todos primos (primos de Fermat), basándose en una inducción finita correspondiente a los cinco casos n = 0,1,2,3,4. Sin embargo, un siglo más tarde Euler probó la false5 dad de la conjetura, pues precisamente el número siguiente 22 +1es compuesto. Los números de Fermat entre 5 y 16 inclusive no son primos. Aunque la descomposición en factores primos era conocida y utilizada desde la antigüedad, a pesar de ello hubo que esperar a que en 1801 Gauss hiciera la demostración general en sus Disquisitiones arithmeticae, tratado en latín de teoría de números en el que desarrolla toda la teoría conocida como álgebra de las congruencias y en el que la notación empleada es la misma que seguimos empleando hoy.

2. CONSTRUCCIÓN DEL ANILLO ORDENADO DE LOS NÚMEROS ENTEROS En N no es siempre posible la sustracción; es decir, dados m, n Î N la ecuación m + x = n no siempre tiene solución en N. Para que ello sea posible N debe ser ampliado. TEMARIO DE MATEMÁTICAS. PRUEBA A

73

Volumen I. Matemáticas

74

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Esto define a d(m,n) para todos los pares (m,n), pues la ley de tricotomía relativa al orden en N nos dice que dado un par (m,n)ÎN´N pueden ocurrir los siguientes casos completos y excluyentes: a) m < n, en cuyo caso n = m + k b) m = n, en cuyo caso m = n + 0 c) m > n, en cuyo caso m = n + k

2.1. Definición del conjunto Z

Sea P = N* = N -{0} y consideremos un conjunto unitario {—} a cuyo único elemento hemos denotado por “—” de una manera arbitraria. Ahora formamos el producto cartesiano {—} x P = {(–, p) / p es natural, p > 0 } Al par (—, p) con pÎP lo denotaremos abreviadamente por —p. Evidentemente los conjuntos {—} x P y N son disjuntos. Definimos el conjunto Z como la unión disjunta de ambos. Esto es:

Suma en N x N La suma de pares ordenados de números naturales puede definirse como (m , n) + (m’, n’) = (m + m’, n + n’) Resulta fácil probar que es una ley de composición interna, asociativa, conmutativa y con el par (0,0) como elemento neutro. Definición de una “función diferencia” Todo entero se encontrará como la sustracción de dos naturales m , n. Por consiguiente partimos de N x N y definimos una función diferencia d: N x N ® Z por medio de las reglas: ìd(m, n + k) = –k para m, k Î N, k ¹ 0 í para n, k Î N îd(n + k, n) = k ·

b) a)

Z = ({—} x P) È N Podemos decir que cualquier elemento de Z es de una de las formas siguientes: ìa = n Î Z ï siendo la disyunción exclusiva. a ÎZÞí o ï îa = (–, p) = –p Î {—}È P

Es obvio que el conjunto Z así definido es una extensión del conjunto N, es decir N es una parte propia de Z (N Ì Z). En lo sucesivo notaremos por a, b, c,... a los elementos de Z y por m, n, k,... a los elementos de N. Nótese que la condición 3 significa que todos los elementos de Z son “necesarios”.

3.

La suma de los elementos de N coincide con la suma en Z, es decir m+n=mÅn " (m,n) Î N2 Para cualesquiera dos elementos de Z la sustracción es posible " (a,b) Î Z2 existe un x Î Z tal que a Å x = b. Todo elemento de Z resulta de la sustracción de dos elementos de N " a Î Z existen m, n Î N tales que n Å a = m”

2.2. Suma o adición en Z

Pretendemos ampliar o extender la estructura aditiva de N a una estructura aditiva del nuevo conjunto Z É N, que conserve las propiedades de asociatividad y conmutatividad, y que siga admitiendo a 0 como elemento neutro, pero donde quede resuelto el problema de la sustracción. Para ello vamos a dotar a Z de una operación binaria “suma” Å, que ha de cumplir: 2.

1.

1.

La suma de los elementos de N coincide con la suma en Z, es decir m+n=mÅn " (m,n) Î N2 Para cualesquiera dos elementos de Z la sustracción es posible " (a,b) Î Z2 existe un x Î Z tal que a Å x = b. Todo elemento de Z resulta de la sustracción de dos elementos de N " a Î Z existen m, n Î N tales que n Å a = m”

Pretendemos ampliar o extender la estructura aditiva de N a una estructura aditiva del nuevo conjunto Z É N, que conserve las propiedades de asociatividad y conmutatividad, y que siga admitiendo a 0 como elemento neutro, pero donde quede resuelto el problema de la sustracción. Para ello vamos a dotar a Z de una operación binaria “suma” Å, que ha de cumplir: 3.

2.2. Suma o adición en Z

2.

Nótese que la condición 3 significa que todos los elementos de Z son “necesarios”.

Es obvio que el conjunto Z así definido es una extensión del conjunto N, es decir N es una parte propia de Z (N Ì Z). En lo sucesivo notaremos por a, b, c,... a los elementos de Z y por m, n, k,... a los elementos de N. a)

Suma en N x N La suma de pares ordenados de números naturales puede definirse como (m , n) + (m’, n’) = (m + m’, n + n’) Resulta fácil probar que es una ley de composición interna, asociativa, conmutativa y con el par (0,0) como elemento neutro. Definición de una “función diferencia” Todo entero se encontrará como la sustracción de dos naturales m , n. Por consiguiente partimos de N x N y definimos una función diferencia d: N x N ® Z por medio de las reglas: ìd(m, n + k) = –k para m, k Î N, k ¹ 0 í para n, k Î N îd(n + k, n) = k ìa = n Î Z ï siendo la disyunción exclusiva. a ÎZÞí o ï îa = (–, p) = –p Î {—}È P

Z = ({—} x P) È N Podemos decir que cualquier elemento de Z es de una de las formas siguientes:

b)

·

Sea P = N* = N -{0} y consideremos un conjunto unitario {—} a cuyo único elemento hemos denotado por “—” de una manera arbitraria. Ahora formamos el producto cartesiano {—} x P = {(–, p) / p es natural, p > 0 } Al par (—, p) con pÎP lo denotaremos abreviadamente por —p. Evidentemente los conjuntos {—} x P y N son disjuntos. Definimos el conjunto Z como la unión disjunta de ambos. Esto es:

Esto define a d(m,n) para todos los pares (m,n), pues la ley de tricotomía relativa al orden en N nos dice que dado un par (m,n)ÎN´N pueden ocurrir los siguientes casos completos y excluyentes: a) m < n, en cuyo caso n = m + k b) m = n, en cuyo caso m = n + 0 c) m > n, en cuyo caso m = n + k

2.1. Definición del conjunto Z

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

74

Números enteros. Divisibilidad. Números primos. Congruencia Denotaremos simbólicamente d(m,n) = m - n. La función d puede ser representada gráficamente como la proyección diagonal de N x N sobre los valores a Î Z obtenidos como d(m,n) = a = m - n. Figura 1. NxN (0.3) (0.2) (0.1) (0.0)(1.0)(2.0) Z ..........–5 –4 –3 –2 –1

0

1

2

3 4

5 ...........

A los pares de la forma (m, m) les llamaremos parejas diagonales. Nótese que para cualquier pareja diagonal d = (m,m) y para toda pareja cualquiera u = (k,n) se cumple d(u + d) = d(u). c)

La función diferencia es sobreyectiva En efecto, dado a Î Z, puede ocurrir que a Î N o que a Î{—} x P. En el primer caso es a = m y el par (m,0) será una preimagen, es decir (m,0) = d -1(a). En el segundo caso es a = (-,p) y entonces (0,p) = d-1(a). Se puede, por tanto, definir para d una “inversa por la derecha” g: Z ® N x N dada por: g(m) = (m,0) g(–p) = (0,p) para p>0 Se tiene entonces que d ° g = iz; sin embargo g ° d no es la identidad en N x N, ya que por ejemplo g ° d (n + k,n)= g(k) = (k,0). Es decir, mientras el diagrama 1 es conmutativo, el diagrama 2 no lo es.

NxN

d

g

Z

NxN

iZ

iNx

d

Z g NxN

Z

No obstante, para cada par u Î N x N existe un par diagonal d Î N x N tal que g ° d(u) + d = u. En efecto, si u = (m,m + k) entonces g ° d (u) = (0,k) y bastará tomar d = (m,m). Si u = (n + k,n) entonces g ° d (u) = (k,0) y se tomará d = (n,n). Diagrama 1

d)

Diagrama 2

Definición de la suma en Z Definamos la suma de dos enteros cualesquiera a y b por : a Å b = d(g(a) + g(b)). Veamos que esta operación binaria Å: Z x Z ® Z verifica: d(u) Å d(v) = d (u + v)

(" u,v Î N x N)

En efecto, dados u,v Î N x N, según vimos antes, existen dos pares diagonales d y d’ tales que u = g ° d(u) + d , v = g ° d(v) + d’ Entonces: d(u) Å d(v) = d[g(d(u)) + g(d(v))] = d[g ° d(u) + g ° d(v)] = = d[g ° d(u) + d + g ° d(v) + d'] = d(u + v) TEMARIO DE MATEMÁTICAS. PRUEBA A

75

Volumen I. Matemáticas

76

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Nótese además que si m,n ÎN es m-n = n’Å m = d(0,n) Å d(m,0) = d((0,n)+(m,0)) = d(m,n). Podríamos esquematizar lo anterior en el diagrama siguiente: +

Z x -y = y’Å x

N

2



(u , v)

u+v

La sustracción es siempre posible en Z Para cualesquiera a,b Î Z se cumple: a Å (a’Å b) = (a Å a’) Å b = 0 Å b = b, de manera que la ecuación a Å x = b tiene al menos una solución x = a’Å b. Con lo cual queda probada la condición 2) que hacía referencia a la posibilidad de restar. Es fácil probar que esa solución es única, por lo que ahora adquiere sentido el símbolo “-”, pues podemos definir la operación “diferencia”: (d , d)

ZxZ

d

+

Z d(u) + d(v) = d(u + v)

[d(u), d(v)]

f)

2

Z´Z (x,y)

2

N xN

a Å b = d(g(a) +g(b)) = d(g(b) +g(a)) = d ° g(b) Å d ° g(a) = b Å a La asociatividad y el hecho de que 0 sea el elemento neutro para la adición en Z se demuestran de manera análoga. Veamos que todo elemento de Z tiene un simétrico respecto de Å. Si a Î Z podremos ponerlo bajo la forma a = d((m,n). Sea a’ = d(n,m). Puesto que (m,n) + (n,m) = (m + n, m + n) = d es un par diagonal, se tiene a Å a’ = d(m,n) Å d(n,m) = d((m,n) + (n,m)) = d(d) = 0. Resulta por tanto que a’ es el simétrico de a respecto de la adición en Z. Tendremos que (Z, Å) es un grupo aditivo abeliano.



Para los enteros naturales m,n Î N se tiene g(m) = (m,0) y g(n) = (n,0). De manera que la definición da: m Å n = d((m,0) + (n,0)) = d(m+n,0) = m+n; es decir, la suma en N. Con esto queda probada la condición 1) de que la suma en Z fuese una extensión de la suma en N, es decir, “N es una parte estable de Z para la adición”



Si a y b son enteros negativos, entonces a = (-, p) = -p, b = (-, q) = -q. Se tendrá: (-p) Å (-q) = d((0,p) + (0,q)) = d(0,p+q) = - (p+q)



Si uno es natural y el otro entero negativo, entonces a = m, b = (-, q) = -q. Se tendrá: m Å (-q) = d((m,0) + (0,q)) = d(m,q) = m – q

Propiedades de la suma en Z El lema anterior enuncia que la sobreyección d: N x N ® Z transforma las sumas (+) de pares de N x N en sumas (Å) de elementos de Z. Por consiguiente se puede utilizar para transportar las reglas válidas en N a reglas válidas en Z. Por ejemplo, para probar que la adición es conmutativa en Z , utilizamos que d ° g = iZ para escribir a Å b de la forma: a Å b = d ° g(a) Å d ° g(b) = d(g(a) +g(b)) Utilizando la conmutatividad en N´N podemos llegar a:

Propiedades de la suma en Z El lema anterior enuncia que la sobreyección d: N x N ® Z transforma las sumas (+) de pares de N x N en sumas (Å) de elementos de Z. Por consiguiente se puede utilizar para transportar las reglas válidas en N a reglas válidas en Z. Por ejemplo, para probar que la adición es conmutativa en Z , utilizamos que d ° g = iZ para escribir a Å b de la forma: a Å b = d ° g(a) Å d ° g(b) = d(g(a) +g(b)) Utilizando la conmutatividad en N´N podemos llegar a: a Å b = d(g(a) +g(b)) = d(g(b) +g(a)) = d ° g(b) Å d ° g(a) = b Å a e)

e)

Si uno es natural y el otro entero negativo, entonces a = m, b = (-, q) = -q. Se tendrá: m Å (-q) = d((m,0) + (0,q)) = d(m,q) = m – q



Si a y b son enteros negativos, entonces a = (-, p) = -p, b = (-, q) = -q. Se tendrá: (-p) Å (-q) = d((0,p) + (0,q)) = d(0,p+q) = - (p+q)



Para los enteros naturales m,n Î N se tiene g(m) = (m,0) y g(n) = (n,0). De manera que la definición da: m Å n = d((m,0) + (n,0)) = d(m+n,0) = m+n; es decir, la suma en N. Con esto queda probada la condición 1) de que la suma en Z fuese una extensión de la suma en N, es decir, “N es una parte estable de Z para la adición”



La asociatividad y el hecho de que 0 sea el elemento neutro para la adición en Z se demuestran de manera análoga. Veamos que todo elemento de Z tiene un simétrico respecto de Å. Si a Î Z podremos ponerlo bajo la forma a = d((m,n). Sea a’ = d(n,m). Puesto que (m,n) + (n,m) = (m + n, m + n) = d es un par diagonal, se tiene a Å a’ = d(m,n) Å d(n,m) = d((m,n) + (n,m)) = d(d) = 0. Resulta por tanto que a’ es el simétrico de a respecto de la adición en Z. Tendremos que (Z, Å) es un grupo aditivo abeliano. [d(u), d(v)]

Z d(u) + d(v) = d(u + v)

La sustracción es siempre posible en Z Para cualesquiera a,b Î Z se cumple: a Å (a’Å b) = (a Å a’) Å b = 0 Å b = b, de manera que la ecuación a Å x = b tiene al menos una solución x = a’Å b. Con lo cual queda probada la condición 2) que hacía referencia a la posibilidad de restar. Es fácil probar que esa solución es única, por lo que ahora adquiere sentido el símbolo “-”, pues podemos definir la operación “diferencia”: ZxZ

+

d

(d , d)

u+v

Z x -y = y’Å x

2

2

+



(u , v)

N

2

Z´Z (x,y)

N xN

f)

Nótese además que si m,n ÎN es m-n = n’Å m = d(0,n) Å d(m,0) = d((0,n)+(m,0)) = d(m,n). Podríamos esquematizar lo anterior en el diagrama siguiente:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

76

Números enteros. Divisibilidad. Números primos. Congruencia Por otro lado, veamos que todo número entero es diferencia de dos números naturales. Ello resulta de que todo nÎN verifica 0 Å n = 0 + n = n , y de que todo elemento nuevo -p de Z verifica (-p) Å p = 0. Con lo cual la condición 3) también queda satisfecha. Cesaremos de emplear sistemáticamente el símbolo especial Å para la adición en Z y escribiremos como de costumbre a-b en lugar de a Å b’.

2.3. Producto o multiplicación en Z El conjunto Z puede ser dotado también de una operación binaria “producto” Ä que será, al igual que ocurría con la suma, una extensión del producto en N, conservando las propiedades. Es decir, la nueva multiplicación en Z seguirá siendo conmutativa, asociativa, distributiva respecto de la adición, admitiendo a 1 = s(0) (siguiente de 0) como elemento neutro, y tal que el producto de dos elementos de N será el mismo en N que en Z. a) Producto en N x N La multiplicación de pares de números naturales puede definirse por: (m , n) · (m’, n’) = (mm’+ nn’, mn’ + m’n) Se prueba que esta operación es asociativa, conmutativa, admite el par (1,0) como elemento neutro, y es distributiva respecto a la suma de pares de N´N. b) Definición del producto en Z Definamos el producto de dos enteros cualesquiera a y b por a Ä b = d(g(a) · g(b)) Para los enteros naturales m,n Î N se tiene g(m) = (m,0) y g(n) = (n,0). De manera que la definición da: m Ä n = d((m,0) · (n,0)) = d(mn,0) = mn (" m,n Î N) Es decir, el producto en Z es una extensión del producto en N, o lo que es lo mismo, “N es una parte estable de Z para la multiplicación”. La función diferencia verifica entonces · d(u) Ä d(v) = d(u · v) ("u,v Î N x N) [1] 2 2 2 N xN (u , v)

N u·v

(d , d)

ZxZ [d(u), d(v)]

d

+

Z d(u), + d(v) = d(u · v)

La demostración es similar al caso de la suma. Sólo hay que hacer notar que un producto u · v es diagonal si uno de los pares es diagonal, pues (m,n) · (k,k) = (mk + nk,mk + nk). Dados u, v Î N x N, existen parejas diagonales d y d’ tales que u = g ° d(u) + d; v = g ° d(v) + d’ Entonces: diagonal 64444 4 744444 8 d(u × v) = d[(g o d(u) + d)× (g o d(v) + d' )] = d[g o d(u)×g o d(v) + g o d(u)×d'+g o d(v)×d + d ×d'] = = d[g ( d(u)) ×g ( d(v))] = d(u) Ä d(v) Podemos además probar que sólo existe una operación binaria de multiplicación en Z que verifique [1]. Si fuese d(u) = d(u1) y d(v) = d(v1) es porque existen parejas diagonales d, d, d1, d1’ , tales que u + d1 = u1 + d y v + d1’= v1 + d’ . Se deduce que: (u + d1) · (v + d1’) = (u1 + d) · (v1 + d’) Þ uv + ud1’ + vd1 + d1d1’ = u1v1 + u1d’ + v1d + dd’ Þ Þ uv + f = u1v1 + e , siendo f y e parejas diagonales Þ d(u · v) = d(u1 · v1) El valor de d(u) Ä d(v) no depende por tanto más que de d(u) y d(v) y no de la elección de los pares u y v en N x N. TEMARIO DE MATEMÁTICAS. PRUEBA A

77

Volumen I. Matemáticas

78

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Sea S cualquier parte de Z que cumpla S + S Ì S, S · S Ì S, Z = S ·È{0}·È(–S). Como 1 es idempotente para la multiplicación, deberá ser 1 Î S. Si fuese 1 Î –S , entonces sería –1 Î S con lo cual (–1) · (–1) Î S, y llegaríamos a una contradicción. Para cualquier n Î P, será n = 1 + 1 + 1 +....+ 1 , y por tanto n Î S. Con ello concluimos que P Ì S, y de aquí –P Ì –S, por definición de –P y de –S. Ahora tenemos, de P Ì S y S Ç (–S) = Æ, que también se cumple P Ç (–S) = Æ Þ –S Ì Z –P = (–P) È{0}. Como 0 Ï –S, resulta –S Ì –P. Por tanto –S = –P, y en consecuencia S = P. En lo sucesivo denotaremos a P por Z+ y a –P por Z-. Resulta que 0 Ï Z+ y 0 Ï Z-. c)

Propiedades del producto en Z Como la función diferencia verifica también el hecho de transformar productos en N en productos en Z podremos transportar también las propiedades del producto de pares de N x N a las propiedades correspondientes en Z. Por ejemplo, probemos la distributiva de Ä respecto de Å. Teniendo en cuenta que la función d es sobreyectiva, todo elemento de Z es de la forma d(u). Entonces: d(u) Ä [d(v) Å d(w)] = d(u) Ä d(v + w) = d[u × (v + w)] = d(u × v + u × w) = = d(u × v) Å d(u × w) = [d(u) Ä d(v)] Å [d(u) Ä d(w)]

Puede probarse como sigue:

A partir de ahora también cesaremos de denotar el producto en Z por el signo especial Ä, y utilizaremos la notación usual. “El anillo (Z,+,0) sólo puede ser ordenado de la manera usual”

Además, se tiene la unicidad de la ordenación de Z:

Podremos resumir la construcción de Z:

“(Z,+, ·) es un anillo totalmente ordenado”.

“El conjunto Z así construido, con las operaciones suma y producto definidas, tiene estructura de anillo conmutativo unitario y contiene un semianillo isomorfo a N”

O lo que es lo mismo: a £ b Û $ m Î N=P È {0}/a + m = b. Es fácil probar las propiedades reflexiva, antisimétrica, transitiva y conexa de £. Las condiciones 1. y 2. implican fácilmente la compatibilidad del orden con las operaciones de Z. Por tanto:

2.4. El orden en Z

Recordemos que P = N* = N – {0}. Dado un a Î Z denotaremos a su “opuesto” por –a. Si llamamos también –P = {a Î Z / –a Î N}, se cumplen: ìa = b ï a£b Ûí ó ï îb – a Î P

1. P + P Ì P 2. P · P Ì P

por:

En consecuencia, en virtud de la partición de Z que indica 3), P induce en Z una ordenación total dada ·

3. Z = P È {0}È (–P) ·

·

3. Z = P È {0}È (–P)

·

En consecuencia, en virtud de la partición de Z que indica 3), P induce en Z una ordenación total dada 2. P · P Ì P

por:

ìa = b ï a£b Ûí ó ï îb – a Î P

1. P + P Ì P

Recordemos que P = N* = N – {0}. Dado un a Î Z denotaremos a su “opuesto” por –a. Si llamamos también –P = {a Î Z / –a Î N}, se cumplen: O lo que es lo mismo: a £ b Û $ m Î N=P È {0}/a + m = b. Es fácil probar las propiedades reflexiva, antisimétrica, transitiva y conexa de £. Las condiciones 1. y 2. implican fácilmente la compatibilidad del orden con las operaciones de Z. Por tanto:

2.4. El orden en Z

“El conjunto Z así construido, con las operaciones suma y producto definidas, tiene estructura de anillo conmutativo unitario y contiene un semianillo isomorfo a N”

Podremos resumir la construcción de Z:

“(Z,+, ·) es un anillo totalmente ordenado”.

Además, se tiene la unicidad de la ordenación de Z:

A partir de ahora también cesaremos de denotar el producto en Z por el signo especial Ä, y utilizaremos la notación usual. “El anillo (Z,+,0) sólo puede ser ordenado de la manera usual”

Puede probarse como sigue:

= d(u × v) Å d(u × w) = [d(u) Ä d(v)] Å [d(u) Ä d(w)]

Sea S cualquier parte de Z que cumpla S + S Ì S, S · S Ì S, Z = S ·È{0}·È(–S). Como 1 es idempotente para la multiplicación, deberá ser 1 Î S. Si fuese 1 Î –S , entonces sería –1 Î S con lo cual (–1) · (–1) Î S, y llegaríamos a una contradicción. Para cualquier n Î P, será n = 1 + 1 + 1 +....+ 1 , y por tanto n Î S. Con ello concluimos que P Ì S, y de aquí –P Ì –S, por definición de –P y de –S. Ahora tenemos, de P Ì S y S Ç (–S) = Æ, que también se cumple P Ç (–S) = Æ Þ –S Ì Z –P = (–P) È{0}. Como 0 Ï –S, resulta –S Ì –P. Por tanto –S = –P, y en consecuencia S = P. En lo sucesivo denotaremos a P por Z+ y a –P por Z-. Resulta que 0 Ï Z+ y 0 Ï Z-. d(u) Ä [d(v) Å d(w)] = d(u) Ä d(v + w) = d[u × (v + w)] = d(u × v + u × w) =

c)

Propiedades del producto en Z Como la función diferencia verifica también el hecho de transformar productos en N en productos en Z podremos transportar también las propiedades del producto de pares de N x N a las propiedades correspondientes en Z. Por ejemplo, probemos la distributiva de Ä respecto de Å. Teniendo en cuenta que la función d es sobreyectiva, todo elemento de Z es de la forma d(u). Entonces:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

78

Números enteros. Divisibilidad. Números primos. Congruencia

2.5. Simetrización de la suma en N. Otra forma de construir Z Ahora que Z está construido con todas las propiedades esperadas no es necesario referirse a la función diferencia d : N´N ® Z o a su inversa g como se hizo en la construcción anterior. La función d es sobreyectiva y la relación x Rd y Û d(x) = d(y) es de equivalencia. N´ N la proyección sobre el conjunto cociente correspondiente. Sea p: N´N ® Rd Un teorema relativo a conjuntos enuncia que existe una biyección h : ma siguiente es conmutativo; es decir h o p = d. NxN

p

d

N´ N ® Z tal que el diagraRd

NxN Rd

h

Z

Por consiguiente, Z puede construirse como el conjunto cociente

N´ N . La relación Rd es: Rd

(m, n) Rd (m’, n’) Û d(m,n) = d(m’,n’) Û m – n = m’– n’ Û m + n’ = m’ + n. La motivación esencial para la extensión de N a Z era la posibilidad de la sustracción; pero ello va íntimamente ligado a la existencia de simétrico para la adición. Sabemos que (N,+) es semigrupo abeliano con elemento neutro y además todos sus elementos son regulares; sin embargo, salvo el 0, ningún elemento de N tiene “opuesto”. Pretendemos, pues, ampliar N a otro conjunto que pueda dotarse de una estructura aditiva en la que cada elemento tenga su simétrico. Este planteamiento puede generalizarse a un monoide cualquiera (M,*). El proceso de “simetrización” de la ley de composición viene recogido en el siguiente TEOREMA: “Si el monoide (M,*) tiene estructura de semigrupo abeliano en el que se cumple la ley cancelativa, existe un grupo mínimo G que contiene a un semigrupo S isomorfo a M (ningún subgrupo propio de G tiene la propiedad de contener un semigrupo isomorfo a M)”. En efecto, partiendo de D = M x M , definimos la relación (a,b) ~ (c,d) Û a * d = b * c , que resulta ser de equivalencia. Tomamos el conjunto cociente G = D/ ~ y definimos la operación (a,b) Å (c,d) = (a * c,b* d ) que es asociativa, conmutativa y admite la clase (a,a) como elemento neutro. Entonces dado (a,b) Î G el elemento simétrico es (b,a) Î G, puesto que (a,b) Å (b,a) = (a* b,b* a) = (a* b,a* b) . Tomando S = { (a* m,m) / a Î M} Ì G, la aplicación j: M ® S resulta ser un isomorfismo de semigrupos, pues es biyectiva y además: j (a* b) = (a * b* m,m) = (a * m* b* m,m* m) = (a * m,m) Å b* m,m) = j(a) Å j(b). Si G’ es un subgrupo de G que contiene a S, tendremos que para cualquier X Î G será X = (a,b); tomando A = (a* m,m) y B = (b* m,m) serán A, B Î S Ì G’ y además: (a,b) = (a * m,m) Å (m,b* m) Þ X = A Å B–1 Î G. Luego G’ Ì G, y por tanto G’ = G. En nuestro caso la relación binaria “ ~ ” de partida en N x N, es precisamente Rd, o sea: (m , n) ~ (m’, n’) Û m + n’ = m’ + n TEMARIO DE MATEMÁTICAS. PRUEBA A

79

Volumen I. Matemáticas

80

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Podemos concluir que el anillo Z contiene una parte isomorfa a N. El orden puede entonces definirse en Z, de una manera equivalente a la dada anteriormente, como sigue: Primero se define un orden en N x N: (m,n) £ (m’,n’) Û m + n’ £ m’+ n Nótese que si d es un par diagonal y u £ v, entonces u + d £ v + d . Por tanto la relación de orden está bien definida al tomar el conjunto cociente. Es decir: Dados a,b Î Z, a £ b Û a = d(m,n) y b = d(m’, n’) con m + n’ £ m’ + n . Se prueba que la relación anterior no depende de los representantes elegidos en N x N. Asimismo se justifican también las propiedades relativas al orden en Z.

Aquí no es necesario referirse, de entrada, a la función diferencia. Fácilmente se prueba que la relación anterior es de equivalencia. Para cada clase de equivalencia puede elegirse un representante canónico. A saber, dado (x,y) Î N x N, puede ocurrir: a) b) c)

x < y, entonces existe n Î N* tal que x + n = y, teniendo (x,y) ~ (0,n) x > y, entonces existe m Î N* tal que x = m + y, teniendo (x,y) ~ (m,0) x = y, entonces x + 0 = 0 + y, teniendo (x,y) ~ (0,0)

Escogemos como representantes canónicos los pares con alguna componente nula: (n,0) = + n (0,m) = –m (0,0) = 0 Las operaciones en Z se pueden definir a partir de las operaciones en N x N. Si u = (m,n) y v = (m’,n’) son dos pares de N x N, definimos: u + v = (m,n) + (m’, n’) = (m+m’, n+n’) u · v = (m,n) · (m’,n’) = (mm’ + nn’, mn’ + m’n) Entonces j(n · m) = +(n · m) = (n × m,0) = (n,0)× (m,0) = (+n)× (+m) = j (n)× j (m)

j(n + m) = +(n + m) = (n + m,0) = (n,0) + (m,0) = (+n) + (+m) = j (n) + j (m)

La aplicación j: N* ® Z+, dada por j(n) = +n = (n,0) es un isomorfismo que identifica la suma y el producto de dos naturales en N con su suma y su producto en Z. En efecto: Resultan, por tanto: Z+ + Z+ = Z+; Z- + Z- = Z-; Z+ · Z+ = Z+; Z- · Z- = Z+; Z+ · Z- = ZEs fácil probar las propiedades de las operaciones, y en especial que todo elemento de Z tiene su simétrico. En términos de representantes canónicos se expresaría p + (–p) = 0. Ello posibilita la sustracción en Z (la solución única de la ecuación p + x = q es x = (–p) + q. p(u + v) = p(u) Å p(v) , o sea: (m,n) + (m'.n' ) = (mm'+nn',mn'+m'n)

ì+(m – n) si m > n (+m) + (-n) = í î–(n – m) si m < n

p(u · v) = p(u) Ä p(v) , o sea: (m,n)× (m'.n' ) = (mm'+nn',mn'+m'n) (+m) · (–n) = –(mn)

Las operaciones están bien definidas, lo que significa que no dependen de los representantes escogidos. Pero si tomamos los representantes canónicos, obtenemos las reglas de los signos: (+m) + (+n) = +(m + n) (–m) + (–n) = –(m + n)

(+m) · (+n) = +(mn) (–m) · (–n) = +(mn)

Suma

Producto

Suma

Producto

(+m) + (+n) = +(m + n) (–m) + (–n) = –(m + n)

(+m) · (+n) = +(mn) (–m) · (–n) = +(mn)

ì+(m – n) si m > n (+m) + (-n) = í î–(n – m) si m < n

(+m) · (–n) = –(mn)

Las operaciones están bien definidas, lo que significa que no dependen de los representantes escogidos. Pero si tomamos los representantes canónicos, obtenemos las reglas de los signos: p(u · v) = p(u) Ä p(v) , o sea: (m,n)× (m'.n' ) = (mm'+nn',mn'+m'n)

p(u + v) = p(u) Å p(v) , o sea: (m,n) + (m'.n' ) = (mm'+nn',mn'+m'n)

Resultan, por tanto: Z+ + Z+ = Z+; Z- + Z- = Z-; Z+ · Z+ = Z+; Z- · Z- = Z+; Z+ · Z- = ZEs fácil probar las propiedades de las operaciones, y en especial que todo elemento de Z tiene su simétrico. En términos de representantes canónicos se expresaría p + (–p) = 0. Ello posibilita la sustracción en Z (la solución única de la ecuación p + x = q es x = (–p) + q. Entonces

Escogemos como representantes canónicos los pares con alguna componente nula: (n,0) = + n (0,m) = –m (0,0) = 0 Las operaciones en Z se pueden definir a partir de las operaciones en N x N. Si u = (m,n) y v = (m’,n’) son dos pares de N x N, definimos: u + v = (m,n) + (m’, n’) = (m+m’, n+n’) u · v = (m,n) · (m’,n’) = (mm’ + nn’, mn’ + m’n)

La aplicación j: N* ® Z+, dada por j(n) = +n = (n,0) es un isomorfismo que identifica la suma y el producto de dos naturales en N con su suma y su producto en Z. En efecto: j(n + m) = +(n + m) = (n + m,0) = (n,0) + (m,0) = (+n) + (+m) = j (n) + j (m) j(n · m) = +(n · m) = (n × m,0) = (n,0)× (m,0) = (+n)× (+m) = j (n)× j (m)

Podemos concluir que el anillo Z contiene una parte isomorfa a N. El orden puede entonces definirse en Z, de una manera equivalente a la dada anteriormente, como sigue: Primero se define un orden en N x N: (m,n) £ (m’,n’) Û m + n’ £ m’+ n Nótese que si d es un par diagonal y u £ v, entonces u + d £ v + d . Por tanto la relación de orden está bien definida al tomar el conjunto cociente. Es decir: Dados a,b Î Z, a £ b Û a = d(m,n) y b = d(m’, n’) con m + n’ £ m’ + n . Se prueba que la relación anterior no depende de los representantes elegidos en N x N. Asimismo se justifican también las propiedades relativas al orden en Z. a) b) c)

x < y, entonces existe n Î N* tal que x + n = y, teniendo (x,y) ~ (0,n) x > y, entonces existe m Î N* tal que x = m + y, teniendo (x,y) ~ (m,0) x = y, entonces x + 0 = 0 + y, teniendo (x,y) ~ (0,0)

Aquí no es necesario referirse, de entrada, a la función diferencia. Fácilmente se prueba que la relación anterior es de equivalencia. Para cada clase de equivalencia puede elegirse un representante canónico. A saber, dado (x,y) Î N x N, puede ocurrir:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

80

Números enteros. Divisibilidad. Números primos. Congruencia

2.6. Otras propiedades relevantes de Z a)

“En Z no hay divisores de cero: " (x,y) Î Z2 x · y = 0 Þ x = 0 ó y = 0”. Por tanto, (Z,+, ·) es un dominio de integridad. Como la función diferencia d es suprayectiva, cualquier número entero puede ponerse como d(u) siendo u Î N x N. En particular 0 = d(d) siendo d cualquier pareja diagonal. Entonces d(u) Ä d(v) = d(d) Þ d(u.v) = d(d) Þ u.v + d1 = d + d1’ Þ u.v = f = pareja diagonal ìmp + nq = kü ý Þ si fuese d(v) ¹ 0, Si u = (m,n), v = (p,q), f = (k,k), tendríamos (m,n) · (p,q) = (k,k) Þí î mq + np = k þ entonces p ¹ q (supongamos p > q) tendremos mp + nq = mq + np Þ m(p-q) = n(p–q) Þ m = n (por ley cancelativa del producto en N). Resultaría que u = (m,n) sería una pareja diagonal y por tanto d(u) = 0.

b)

“Todos los elementos de Z, salvo el cero, son regulares para la multiplicación”. Esto significa que en Z la multiplicación también cumple la propiedad cancelativa o simplificativa. La misma propiedad para la adición es obvia, pues (Z,+) es grupo, y todos los elementos en un grupo son regulares.

c)

“El 0 es elemento absorbente para la multiplicación: " x Î Z, x · 0 = 0” Siendo x = d(u) y 0 = d(d) donde d es una pareja diagonal. Basta entonces recordar que el producto de dos pares de N x N es diagonal si uno de ellos lo es. Luego x · 0 = d(u) Ä d(d) = d(u · v) = d(d’) = 0.

d)

“Los únicos elementos 'inversibles' de Z son +1 y –1”. Cualquier otro número entero no tiene simétrico respecto del producto en Z.

e)

“La relación de orden total £ en Z verifica las leyes de monotonía (compatibilidad con las operaciones)”

f)

“Puede definirse la relación de orden estricto < , que es antirreflexiva y transitiva, verificándose la ley de 'tricotomía' (para cualesquiera a,b Î Z es a < b ó a > b ó a = b)”

g)

“La ordenación usual de Z no es una buena ordenación” Efectivamente no todo subconjunto de Z tiene primer elemento, por ejemplo A= {...–4, –2, 0, +2, +4,...} no tiene primer elemento. En cambio (Z+, £) sí está bien ordenado. También la ordenación de Z dada por 0, 1, –1, 2, –2, 3, –3, 4, –4... es una buena ordenación.

h)

“Z es un conjunto infinito numerable” ì n si n es par ï– ï 2 es una biyección. La aplicación f: N ® Z dada por f(n) = í ïn – 1 si n es impar ï î 2 Luego la potencia de Z es Card(Z) = Card(N) = À0.

i)

“Z es arquimediano, o sea "a Î Z+, "b Î Z: $ n Î N / na > b” Se deduce por ser N arquimediano.

j)

Z puede ser valuado Definimos para cualquier a Î Z su “valor absoluto” como |a| = max{a,-a}, verificando: 1. a Î Z: |a| ³ 0 (|a| = 0 Û a = 0) 2. a, b Î Z: |a.b| = |a| · |b| 3. a, b Î Z: |a + b| £ |a| + |b|

TEMARIO DE MATEMÁTICAS. PRUEBA A

81

Volumen I. Matemáticas

82

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

3. IDEALES EN EL ANILLO DE LOS ENTEROS. ANILLOS COCIENTE

Luego también se prueba que nZ Ì H. En consecuencia: “Los únicos subgrupos del grupo aditivo (Z,+) son los subconjuntos de Z formados por los múltiplos enteros de un número dado n”. Decimos que n es un generador del subgrupo H de Z, cuando sea H = nZ. Se ve fácilmente que todo subgrupo de Z puede ser generado por el menor entero positivo de dicho subgrupo o por su opuesto, pues como es obvio puede ponerse nq = (–n) · (–q), de donde nZ = –nZ. En particular el propio Z puede ser generado por 1 o por -1. Por consiguiente, otra particularidad de los subgrupos de Z es: “(Z,+) es un grupo cíclico infinito y todos sus subgrupos también son cíclicos infinitos”.

3.1. División entera o euclídea en Z

TEOREMA: “Dados a , b Î Z , siendo b > 0, existe un único par de elementos (q,r) Î Z x Z tal que: 1. a = bq + r 2. 0 £ r < b ” Demostración:

Si q = 0 Þ nq = 0 Î H –q veces 67 8 Si q < 0 Þ nq = (–n) + (–n) + ... + (–n) Î H

En efecto, si r existe ha de ser de la forma r = a – bq. Sea A el conjunto {x Î N / x = a – bl, l Î Z}, que es no vacío, puesto que: Si a ³ 0, entonces a = a – b · 0 Î A Si a < 0, entonces 0 £ (–a) · (b – 1) = a – b · a, luego (–a) · (b – 1) Î A. Entonces A es un subconjunto de N no vacío, y como N está bien ordenado, tendremos que A posee primer elemento. Sea éste r = a – b · q. Sólo falta probar que r < b. Si fuese r ³ b, al ser r y b naturales, existiría un x ÎN, tal que r = b + x. Por ello se tendrá: a = r + b · q = = (b + x) + b · q = x + b · (1 + q); y de aquí x = a – b · (1 + q); por tanto x Î A siendo x < r, lo que contradice que r fuera el primer elemento de A. Para la unicidad, supongamos que hubiese además de (q, r) otro par solución (q’,r’) que cumpla a = bq’ + r’. Entonces también r’ = a – bq’ Î A. Pero como r era el primer elemento de A, tendremos que r < r’, y de aquí r’ – r = (a – bq’) – (a – bq) = b(q – q’) > 0. Se deduce que q – q’ > 0 o, lo que es lo mismo, q – q’ ³ 1. Entonces r’> r + b(q – q’) ³ b(q – q’) ³ b. Llegaríamos a que el par (q’,r’) no satisface la división entera de a entre b, lo que contradice lo que habíamos supuesto. q veces 67 8 Si q > 0 Þ nq = n + n + ... + n Î H

Dado un número entero n Î Z, definimos nZ = (n) = {nx/x Î Z}. Vamos a investigar cuáles son los subgrupos propios del grupo aditivo (Z ,+). Sea H uno de ellos, que suponemos que no es el trivial, y sea n el menor entero positivo que hay en H. Para cualquier otro a Î H, tendremos a = nq + r, donde 0 £ r < n (por el algoritmo de la división euclídea). Entonces r = a – nq, donde a, nq Î H y, puesto que H es subgrupo de Z, tendremos r Î H. Ahora bien, deberá ser r = 0 si no queremos llegar a una contradicción, ya que el menor entero positivo de Z era n. Por lo tanto a = nq, lo que nos dice que todos los elementos de H son múltiplos de un cierto entero. Hemos probado que H Ì nZ. Para el recíproco, dado un q Î Z cualquiera, se tiene, al ser H subgrupo de Z:

3.2. Subgrupos de (Z,+)

3.2. Subgrupos de (Z,+)

En efecto, si r existe ha de ser de la forma r = a – bq. Sea A el conjunto {x Î N / x = a – bl, l Î Z}, que es no vacío, puesto que: Si a ³ 0, entonces a = a – b · 0 Î A Si a < 0, entonces 0 £ (–a) · (b – 1) = a – b · a, luego (–a) · (b – 1) Î A. Entonces A es un subconjunto de N no vacío, y como N está bien ordenado, tendremos que A posee primer elemento. Sea éste r = a – b · q. Sólo falta probar que r < b. Si fuese r ³ b, al ser r y b naturales, existiría un x ÎN, tal que r = b + x. Por ello se tendrá: a = r + b · q = = (b + x) + b · q = x + b · (1 + q); y de aquí x = a – b · (1 + q); por tanto x Î A siendo x < r, lo que contradice que r fuera el primer elemento de A. Para la unicidad, supongamos que hubiese además de (q, r) otro par solución (q’,r’) que cumpla a = bq’ + r’. Entonces también r’ = a – bq’ Î A. Pero como r era el primer elemento de A, tendremos que r < r’, y de aquí r’ – r = (a – bq’) – (a – bq) = b(q – q’) > 0. Se deduce que q – q’ > 0 o, lo que es lo mismo, q – q’ ³ 1. Entonces r’> r + b(q – q’) ³ b(q – q’) ³ b. Llegaríamos a que el par (q’,r’) no satisface la división entera de a entre b, lo que contradice lo que habíamos supuesto.

Dado un número entero n Î Z, definimos nZ = (n) = {nx/x Î Z}. Vamos a investigar cuáles son los subgrupos propios del grupo aditivo (Z ,+). Sea H uno de ellos, que suponemos que no es el trivial, y sea n el menor entero positivo que hay en H. Para cualquier otro a Î H, tendremos a = nq + r, donde 0 £ r < n (por el algoritmo de la división euclídea). Entonces r = a – nq, donde a, nq Î H y, puesto que H es subgrupo de Z, tendremos r Î H. Ahora bien, deberá ser r = 0 si no queremos llegar a una contradicción, ya que el menor entero positivo de Z era n. Por lo tanto a = nq, lo que nos dice que todos los elementos de H son múltiplos de un cierto entero. Hemos probado que H Ì nZ. Para el recíproco, dado un q Î Z cualquiera, se tiene, al ser H subgrupo de Z: q veces 67 8 Si q > 0 Þ nq = n + n + ... + n Î H

Si q = 0 Þ nq = 0 Î H

–q veces 67 8 Si q < 0 Þ nq = (–n) + (–n) + ... + (–n) Î H

Demostración:

Luego también se prueba que nZ Ì H. En consecuencia: “Los únicos subgrupos del grupo aditivo (Z,+) son los subconjuntos de Z formados por los múltiplos enteros de un número dado n”. Decimos que n es un generador del subgrupo H de Z, cuando sea H = nZ. Se ve fácilmente que todo subgrupo de Z puede ser generado por el menor entero positivo de dicho subgrupo o por su opuesto, pues como es obvio puede ponerse nq = (–n) · (–q), de donde nZ = –nZ. En particular el propio Z puede ser generado por 1 o por -1. Por consiguiente, otra particularidad de los subgrupos de Z es: “(Z,+) es un grupo cíclico infinito y todos sus subgrupos también son cíclicos infinitos”. TEOREMA: “Dados a , b Î Z , siendo b > 0, existe un único par de elementos (q,r) Î Z x Z tal que: 1. a = bq + r 2. 0 £ r < b ”

3.1. División entera o euclídea en Z

3. IDEALES EN EL ANILLO DE LOS ENTEROS. ANILLOS COCIENTE

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

82

Números enteros. Divisibilidad. Números primos. Congruencia Para cualquier grupo (G, *) y un subgrupo suyo H puede definirse el grupo cociente G H por la relación de equivalencia inducida en G por H (xRy Û x*y-1 Î H). En el caso particular de Z el grupo cociente Z nZ resulta ser cíclico finito de orden n. Se tiene la siguiente proposición “Todo grupo cíclico infinito es isomorfo a (Z,+) y todo grupo cíclico finito de orden n es isomorfo a (Z nZ,+)”. Al ser (Z,+) un grupo conmutativo es obvio que: “todos los subgrupos de Z son normales”. Esto es, cualquier subgrupo H de Z conmuta con cualquier entero; o sea " x Î Z: xH = Hx. Un “elemento de torsión” de un grupo (G, *) es todo elemento a Î G que cumpla que para cierto n Î Z n veces n veces 678 6 78 –1 –1 esa * a * ...* a = e ó a * a * ...* a –1 = e. Es decir, los elementos de torsión de un grupo son los que tienen período finito, y forman un subgrupo de G. En el caso de Z está claro que el subgrupo de torsión es el subgrupo trivial {0}, lo que significa que “(Z,+) es un grupo libre de torsión”.

3.3. Ideales del anillo (Z,+, ·) Se sabe que “Z es un dominio de integridad” (anillo conmutativo sin divisores de cero). La conmutatividad de la multiplicación en Z implica que “todo ideal de Z es bilátero”. La definición de ideal en este caso, que no precisaría de distinción entre ideal por la izquierda e ideal por la derecha, se concreta en: ì1) I es un grupo aditivo de Z Dado I Ì Z, I es un ideal de Z Û í î2) " x Î Z: xI Ì I Dados dos ideales I e I’ se pueden definir: I + I’={x + y / x Î I, y Î I’} (ideal suma) I · I’ = {x1y1 + x2y2 + ... + xnyn / xi Î I, yi Î I’} (ideal producto) Se prueba fácilmente que ambos son ideales y que si son biláteros entonces el ideal producto I · I’ coincide con la intersección I Ç I’ , que será el mayor ideal del anillo que es a la vez subideal de I y de I’. Asimismo el ideal suma I + I’ es el menor ideal que contiene a I e I’. Sabemos ya que los únicos subgrupos aditivos de Z son los nZ, y además se cumple que para cualquier x Î Z y cualquier nq Î Z se tiene x · (nq) = n · (xq) = nq’ Î nZ, entonces resulta también que “los únicos ideales de Z son los de la forma nZ; es decir todo ideal de Z está constituido por los múltiplos de un número entero n”. Ello significa que todo ideal de Z está generado por un solo elemento, escribimos I = nZ = (n), es decir, todo ideal de Z es un ideal principal, lo que se resume diciendo que “Z es un anillo principal” (esto es, un dominio de integridad en el que todos sus ideales son principales). En un anillo (A,+,·) en general se define “ideal primo” como aquel ideal p ¹ A, tal que: " x,y Î p, x · y Î p Þ x Î p ó y Î p. Un “ideal maximal” es un ideal m ¹ A, tal que no hay otro ideal a que cumpla mÌ a Ì A, siendo a ¹ m y a ¹ A. Se prueban las equivalencias: p es ideal primo Û A/p es dominio de integridad. a es ideal maximal Û A/a es cuerpo. Vamos a investigar ahora cuáles son los ideales primos y maximales en el anillo de los enteros: Ya vimos antes que, al ser un ideal de Z un subgrupo aditivo de Z, todos los ideales de Z serán de la forma nZ para algún n Î Z, es decir, todos son principales. Sea p un ideal primo, entonces p = nZ. Si fuese n = m · m’, con m, m’ Ï nZ llegaríamos a contradicción con que p es ideal primo. Luego n es primo. La condición es también suficiente. En efecto, sean m, m’ Î pZ con p primo, entonces si p divide al producto m · m’, debe dividir a uno de ellos, luego m Î pZ ó m’ Î pZ. Resulta además, en el caso de Z, que todo ideal primo es maximal, pues: pZ Ì nZ Þ p = m · n, con m Î Z Þ m = 1 (nZ = Z) ó m = p (nZ = pZ) En resumen: “Los ideales primos y maximales de Z (que coinciden) son de la forma pZ para p primo”. TEMARIO DE MATEMÁTICAS. PRUEBA A

83

Volumen I. Matemáticas

84

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Z nZ = {0, 1, 2, ..., n – 1}

3.4. Anillos de clases residuales

Dado un n Î Z+, denotaremos por nZ al conjunto de todos los múltiplos enteros de n, es decir nZ = {nx / xÎ Z}. Definimos en Z la relación binaria: a R b Û a - b Î nZ. Se prueba fácilmente que dicha relación es de equivalencia y que cada clase de equivalencia está formada por todos los números enteros que dan un mismo resto al dividir entre n. Es decir, la clase de representante a es: a = [a] = {x Î Z/x da el mismo resto que a al dividir entre n} = {x Î Z/x = a + nq, con q Î Z} = a + nZ Hay n clases distintas y disjuntas que forman una partición de Z. Tomando para cada clase el representante canónico (menor entero natural de dicha clase) el conjunto cociente vendrá dado por las n “clases residuales módulo n” que notaremos de la forma:

3.4.1. Anillo Zn de restos módulo n

Para cada n Î Z+ sea Zn el conjunto de restos al dividir por n (“restos módulo n”); esto es: Zn = {0, 1, 2, ...., n–1}= {r / 0 £ r < n} Definamos una aplicación r: Z ® Zn que a cada número entero asocia su resto al dividirlo por n.

TEOREMA 1: “Existe una única operación binaria Å en Zn tal que " (a,b) Î Z, r(a + b) = r(a) Å r(b), siendo dicha operación conmutativa, asociativa, admitiendo a 0 como elemento neutro y tal que " r Î Zn, $ r’ Î Zn / r Å r’ = 0” Dicha operación “suma” de restos módulo n es la que asocia a dos restos r,s Î Zn el resto de su suma ordinaria al dividirla por n, es decir r Å s = r(r + s). Para cualesquiera a,b Î Z , si realizamos la división entera entre n, tendremos a = q n + rü ý Þ a + b = (q + q' )n + r + s b = q'n + sþ

3.4.2. Anillo cociente Z nZ

y de aquí r(a · b) = r(rs) = r Ä s = r(a) Ä r(b). Al ser r sobreyectiva transporta las propiedades del producto en Z a propiedades de Ä en Zn. Con las propiedades recogidas en ambos teoremas (Zn, Å, Ä) resulta ser un anillo conmutativo.

De manera que r(a + b) = r(r + s) = r Å s = r(a) Å r(b). La aplicación r: Z ®Zn tal como se definió es sobreyectiva, y de aquí se prueba fácilmente la asociatividad y la conmutatividad de Å en Zn que son consecuencia de la asociatividad y la conmutatividad de + en Z. Como r(0) = 0 es obvio que para cualquier r Î Zn, se tiene r Å 0 = r(r + 0) = r(r) = r. El simétrico de r respecto de Å es r’= n – r, pues r Å r’ = r Å (n – r) = r(r + n – r) = r(n) = 0

TEOREMA 2: “Existe una única operación binaria Ä en Zn tal que " (a,b) Î Z, r(a · b) = r(a) Ä r(b), siendo dicha operación conmutativa, asociativa, distributiva respecto de Å admitiendo a 1 como elemento neutro” Al igual que antes con la suma, para dos restos r,s Î Zn la operación Ä asociará el resto de dividir su producto ordinario entre n, es decir r Ä s = r(rs). Entonces: a = q n + rü ý Þ ab = (nqq'+qs + q'r)n + rs b = q'n + sþ

TEOREMA 2: “Existe una única operación binaria Ä en Zn tal que " (a,b) Î Z, r(a · b) = r(a) Ä r(b), siendo dicha operación conmutativa, asociativa, distributiva respecto de Å admitiendo a 1 como elemento neutro” Al igual que antes con la suma, para dos restos r,s Î Zn la operación Ä asociará el resto de dividir su producto ordinario entre n, es decir r Ä s = r(rs). Entonces: a = q n + rü ý Þ ab = (nqq'+qs + q'r)n + rs b = q'n + sþ

De manera que r(a + b) = r(r + s) = r Å s = r(a) Å r(b). La aplicación r: Z ®Zn tal como se definió es sobreyectiva, y de aquí se prueba fácilmente la asociatividad y la conmutatividad de Å en Zn que son consecuencia de la asociatividad y la conmutatividad de + en Z. Como r(0) = 0 es obvio que para cualquier r Î Zn, se tiene r Å 0 = r(r + 0) = r(r) = r. El simétrico de r respecto de Å es r’= n – r, pues r Å r’ = r Å (n – r) = r(r + n – r) = r(n) = 0

y de aquí r(a · b) = r(rs) = r Ä s = r(a) Ä r(b). Al ser r sobreyectiva transporta las propiedades del producto en Z a propiedades de Ä en Zn. Con las propiedades recogidas en ambos teoremas (Zn, Å, Ä) resulta ser un anillo conmutativo.

TEOREMA 1: “Existe una única operación binaria Å en Zn tal que " (a,b) Î Z, r(a + b) = r(a) Å r(b), siendo dicha operación conmutativa, asociativa, admitiendo a 0 como elemento neutro y tal que " r Î Zn, $ r’ Î Zn / r Å r’ = 0” Dicha operación “suma” de restos módulo n es la que asocia a dos restos r,s Î Zn el resto de su suma ordinaria al dividirla por n, es decir r Å s = r(r + s). Para cualesquiera a,b Î Z , si realizamos la división entera entre n, tendremos a = q n + rü ý Þ a + b = (q + q' )n + r + s b = q'n + sþ

3.4.2. Anillo cociente Z nZ

Dado un n Î Z+, denotaremos por nZ al conjunto de todos los múltiplos enteros de n, es decir nZ = {nx / xÎ Z}. Definimos en Z la relación binaria: a R b Û a - b Î nZ. Se prueba fácilmente que dicha relación es de equivalencia y que cada clase de equivalencia está formada por todos los números enteros que dan un mismo resto al dividir entre n. Es decir, la clase de representante a es: a = [a] = {x Î Z/x da el mismo resto que a al dividir entre n} = {x Î Z/x = a + nq, con q Î Z} = a + nZ Hay n clases distintas y disjuntas que forman una partición de Z. Tomando para cada clase el representante canónico (menor entero natural de dicha clase) el conjunto cociente vendrá dado por las n “clases residuales módulo n” que notaremos de la forma: Para cada n Î Z+ sea Zn el conjunto de restos al dividir por n (“restos módulo n”); esto es: Zn = {0, 1, 2, ...., n–1}= {r / 0 £ r < n} Definamos una aplicación r: Z ® Zn que a cada número entero asocia su resto al dividirlo por n.

3.4.1. Anillo Zn de restos módulo n

Z nZ = {0, 1, 2, ..., n – 1}

3.4. Anillos de clases residuales

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

84

Números enteros. Divisibilidad. Números primos. Congruencia La proyección canónica p: Z ® Z/nZ aplica cada número entero k en su clase residual módulo n. La suma y el producto de clases residuales se definen como: (a + nZ) + (b + nZ) = (a + b) + nZ,

o sea a + b = a + b

(a + nZ) . (b + nZ) = (ab) + nZ, o sea a × b = a × b Es fácil probar que el conjunto de clases residuales módulo n, con esas dos operaciones tiene estructura de anillo conmutativo. Se trata del anillo cociente (Z/nZ, +, ·). En particular, si p es primo el ideal pZ es a la vez primo y maximal y en consecuencia el anillo cociente (Z/pZ, +, ·) es un cuerpo.

3.4.3. Indentificación entre Z nZ y Zn Dado un número entero k veamos qué relación hay entre r(k) y p(k). Según la definición r(x) = r(y) Û x e y dan el mismo resto al dividir entre n, o sea x = nq + r, y = nq’ + r . Restando tenemos x – y = n(q-q’) Î nZ. Es decir r(x) = r(y) Û p(x) = p(y). p Z Z Lo anterior se traduce en la existencia de una biyección única Y: Z/nZ® Zn nZ que hace conmutativo el diagrama. Dicha biyección aplica cada clase a en su resto módulo n. Y r En general se llama “característica" de un anillo (A,+,·) al menor entero positivo k que verifica kx = x + x + ..(k..+ x = 0, " x Î A. Si dicho entero no existe, decimos que A tiene característica 0. Obviamente “Z es un anillo de caZn racterística 0”, pero además “Zp con p primo tiene de característica p”. También se cumple que la característica de todo dominio de integridad o bien es 0 o bien es un número primo. Para cualquier anillo A de característica k podemos definir la aplicación l: Z ® A mediante l(n) = nu = = u + u + ..(n..+ u, donde u es el elemento unidad de A. Obviamente l es un homomorfismo de anillos y Kerl es un ideal de Z. Por consiguiente Kerl = kZ. Tendremos la inyección canónica Z/kZ = Zk ® A. Por los teoremas de isomorfía y por la descomposición canónica del homomorfismo l, tenemos que si A es un dominio de integridad lo será también el subanillo Iml y por tanto también Z/kZ. Resultaría que kZ es un ideal primo, con lo cual k = 0 ó k = p primo. En el primer caso A contiene un subanillo isomorfo a Z. En el segundo caso A contiene un subanillo (Iml) isomorfo a Zp. Llegamos a la conclusión siguiente: “Todo dominio de integridad A contiene un subanillo isomorfo a Z ó a Zp con p primo”.

4. DIVISIBILIDAD 4.1. Nociones preliminares En un dominio de integridad A en general podemos dar las siguientes definiciones:



Dados a, b Î A, decimos que a divide a b (o que a es un divisor de b, o que b es divisible entre a, y escribimos a | b, si existe un c Î A, tal que a · c = b.



Dos elementos a,b Î A se llaman asociados si se cumple a la vez a | b y b | a. Se trata de una relación de equivalencia. El hecho de que u | 1 significa que $ u’ Î A tal que u · u’ = 1, luego los asociados de la unidad son los elementos inversibles del anillo A. Es fácil probar que en un dominio de integridad a,b Î A son asociados si y sólo si a = ub, siendo u un elemento inversible de A. Si denotamos por (a) al ideal principal engendrado por a, es decir aA, también se verifican las equivalencias: (a) Ì (b) Û b | a (a) = (b) Û a y b son asociados (a) = A Û a es inversible

TEMARIO DE MATEMÁTICAS. PRUEBA A

85

Volumen I. Matemáticas

86

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Para solventar esto, introducimos precisamente la noción de elementos “asociados” (a ~ b Û cumplen a la vez a | b y b | a). En el caso particular de Z, la relación anterior que es de equivalencia establece como clases de enteros asociados: la trivial {0} y los subconjuntos binarios formados por un entero y su opuesto: {0} o {–n, +n}. Está claro que los elementos inversibles en Z, los asociados de la unidad, constituyen una de tales clases U = {–1, +1}. La definición de asociados en Z se traduce en que exista un u Î U tal que a = u b, es decir que a y b sean “iguales salvo factores inversibles”.



En un dominio de integridad A un elemento irreducible es todo a Î A no nulo que cumpla: 1. a no es invertible. 2. Si a = b · c, entonces b es inversible o c es inversible. Si a es irreducible y u es inversible, entonces ua es también irreducible.



Se dice que un elemento a Î A (a ¹ 0) tiene una factorización en elementos irreducibles si existen elementos irreducibles p1, p2, ..., pr Î A tales que a = u p1 p2 ... pr , donde u es un elemento invertible de A. La anterior factorización es única si para cualquier otra factorización a = u’q1 q2 ... qs se tiene r = s, y después de una permutación de los índices se cumple: " i Î {1, 2, ..., n}, pi = ui qi con ui invertibles.

– –

m = n = –1, en cuyo caso a = –b m = n = 1, en cuyo caso a = b

También se razona a partir de la transitividad de la inclusión, de (a) Ì (b) y (b) Ì (c) resulta (a) Ì (c). No se cumple la propiedad antisimétrica, que necesitaríamos para tener un orden en Z. Si a y b son dos números enteros tales que a| b y b| a, podemos decir que existen m,n Î Z siendo b = am y a = bn. Sustituida una en la otra llegamos a a = (am)n = a(mn) y de aquí mn = 1. Tendremos dos posibilidades:

Un anillo A se llama anillo factorial o dominio de factorización única si A es un dominio de integridad en el que todo elemento no nulo admite una factorización única en elementos irreducibles.

La relación anterior es de preorden. Es decir, verifica: Reflexiva (“" a Î Z, a | a”). Obvio ya que " aÎ Z, a = a · 1. O bien teniendo en cuenta que (a) Ì (a) Transitiva (" a, b, c Î Z, a | b y b | c Þ a| c) ìa|b Þ $ t Î Z, b = taü í ý Þ c = s(ta) = (st)a, siendo st Î Z Þ a |c îb|c Þ $ s Î Z, c = sbþ



La relación a ~ b (asociados) definida antes era una relación de equivalencia. Si A es un anillo factorial, podemos formar un conjunto P escogiendo de cada clase de equivalencia un elemento irreducible, si existe, y sólo uno; a estos representantes les llamamos elementos “primos”. Podría probarse entonces que todo elemento no nulo a Î A admite una factorización única a = up1v1 p v22 ...p vnn , con pi Î P, llamada descomposición en factores primos de a o factorización prima de a. a) b)



DEFINICIÓN: Dados a, b Î Z, decimos que a divide a b (o que a es un divisor de b, o que b es divisible entre a) y escribimos a|b si se cumple una de las condiciones siguientes: 1. existe un c Î Z, tal que a · c = b. 2. (b) es subideal de (a), o sea (b) Ì (a) Ambas condiciones son equivalentes: 1) Û 2).

4.2. Relación de divisibilidad en Z

Sabemos que Z es un dominio de integridad principal. Las definiciones y equivalencias dadas en el epígrafe anterior se concretan en Z tal como veremos a continuación. DEFINICIÓN: Dados a, b Î Z, decimos que a divide a b (o que a es un divisor de b, o que b es divisible entre a) y escribimos a|b si se cumple una de las condiciones siguientes: 1. existe un c Î Z, tal que a · c = b. 2. (b) es subideal de (a), o sea (b) Ì (a) Ambas condiciones son equivalentes: 1) Û 2).

Sabemos que Z es un dominio de integridad principal. Las definiciones y equivalencias dadas en el epígrafe anterior se concretan en Z tal como veremos a continuación.

4.2. Relación de divisibilidad en Z

La relación a ~ b (asociados) definida antes era una relación de equivalencia. Si A es un anillo factorial, podemos formar un conjunto P escogiendo de cada clase de equivalencia un elemento irreducible, si existe, y sólo uno; a estos representantes les llamamos elementos “primos”. Podría probarse entonces que todo elemento no nulo a Î A admite una factorización única a = up1v1 p 2v2 ...p nvn , con pi Î P, llamada descomposición en factores primos de a o factorización prima de a.



Un anillo A se llama anillo factorial o dominio de factorización única si A es un dominio de integridad en el que todo elemento no nulo admite una factorización única en elementos irreducibles.



Se dice que un elemento a Î A (a ¹ 0) tiene una factorización en elementos irreducibles si existen elementos irreducibles p1, p2, ..., pr Î A tales que a = u p1 p2 ... pr , donde u es un elemento invertible de A. La anterior factorización es única si para cualquier otra factorización a = u’q1 q2 ... qs se tiene r = s, y después de una permutación de los índices se cumple: " i Î {1, 2, ..., n}, pi = ui qi con ui invertibles.



En un dominio de integridad A un elemento irreducible es todo a Î A no nulo que cumpla: 1. a no es invertible. 2. Si a = b · c, entonces b es inversible o c es inversible. Si a es irreducible y u es inversible, entonces ua es también irreducible.



a) b)

La relación anterior es de preorden. Es decir, verifica: Reflexiva (“" a Î Z, a | a”). Obvio ya que " aÎ Z, a = a · 1. O bien teniendo en cuenta que (a) Ì (a) Transitiva (" a, b, c Î Z, a | b y b | c Þ a| c) ìa|b Þ $ t Î Z, b = taü í ý Þ c = s(ta) = (st)a, siendo st Î Z Þ a |c îb|c Þ $ s Î Z, c = sbþ

También se razona a partir de la transitividad de la inclusión, de (a) Ì (b) y (b) Ì (c) resulta (a) Ì (c). No se cumple la propiedad antisimétrica, que necesitaríamos para tener un orden en Z. Si a y b son dos números enteros tales que a| b y b| a, podemos decir que existen m,n Î Z siendo b = am y a = bn. Sustituida una en la otra llegamos a a = (am)n = a(mn) y de aquí mn = 1. Tendremos dos posibilidades:

– –

m = n = 1, en cuyo caso a = b

m = n = –1, en cuyo caso a = –b

Para solventar esto, introducimos precisamente la noción de elementos “asociados” (a ~ b Û cumplen a la vez a | b y b | a). En el caso particular de Z, la relación anterior que es de equivalencia establece como clases de enteros asociados: la trivial {0} y los subconjuntos binarios formados por un entero y su opuesto: {0} o {–n, +n}. Está claro que los elementos inversibles en Z, los asociados de la unidad, constituyen una de tales clases U = {–1, +1}. La definición de asociados en Z se traduce en que exista un u Î U tal que a = u b, es decir que a y b sean “iguales salvo factores inversibles”. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

86

Números enteros. Divisibilidad. Números primos. Congruencia Supongamos, por ejemplo, que fuese a un número entero tal que a = m · n · p. Es obvio que también son ciertas: a = (–m) · (–n) · p a = (–m) · n · (–p) a = m · (–n) · (–p) Surge la cuestión: ¿son la misma factorización de a? Podemos responder diciendo que “son la misma salvo factores inversibles”, pero en cualquier caso la unicidad es aquí cuestionable. El inconveniente es fácilmente subsanable desde un punto de vista~formal. En efecto, si la relación ~ es de equivalencia parece insoslayable el recurrir al conjunto cociente Z = Z/~. ~ Los elementos de Z son las clases 0 = {0} y n = {n,–n} con n Î Z+. ~ Resulta ahora que en Z la relación de igualdad se traduce a a = b Û (a) = (b) y la relación de~divisibilidad a a | b Û (b) Ì (a). Inmediato resulta que la relación de divisibilidad sí~sería ahora antisimétrica en Z, como consecuencia de la antisimétrica de la relación de inclusión, ~y por tanto (Z, |) es un conjunto ordenado. Las factorizaciones se convertirían en la misma al tomar clases de Z. Podemos ahora adoptar de manera táctica el criterio de tomar para cada clase no nula el representante positivo n, que es por otra parte el menor entero positivo que pertenece al ideal (n) y que tomaremos también de modo tácito como su generador, aunque dicho ideal pueda también ser generado por su asociado –n. ~ Si nos percatamos de que la aplicación ~ h: Z ® N dada por {–n,n} ® n y {0}®0 es una biyección, lo que hemos hecho no es más que identificar Z con N, es decir, reducir el estudio de la divisibilidad en Z al estudio de la divisibilidad en N. Propiedades: 1. 2.

Si a | b y a | c, entonces a | a + b y a | a – b Si a | b, entonces a | bc " c Î Z

4.3. Números primos La definición general de elementos irreducibles en cualquier dominio de integridad, se traduce en el caso concreto de Z se reduce a: DEFINICIÓN: Un número entero p Î Z –{0,–1,1} es irreducible si sólo admite como divisores los inversibles y los asociados, es decir, sus únicos divisores son +1, –1, +p y –p (divisores impropios de p). Nótese que si p y q son irreducibles y p|q entonces p y q son asociados. Es obvio además que si p es irreducible entonces también lo es –p. Las formas de expresar p como producto de dos factores son “triviales” p = (+1) · (+p) ó p = (–1) · (–p) En el supuesto de que un número tenga divisores propios podrá obtenerse como producto de otros de manera “no trivial”. Podemos escoger en Z–{0,–1,1} como conjunto de números primos P el de~los irreducibles positivos y nos salen los primos ordinarios {2, 3, 5, 7, 11, 13,...}. Es decir, al pasar de Z a Z identificamos los irreducibles con los primos en N, en el sentido usual. Un número compuesto es un número no primo. Excluimos de esta clasificación al cero y a los inversibles que no se consideran ni primos ni compuestos. Uno de los próximos objetivos en lo que sigue es probar que todo número compuesto a admite una descomposición factorial única de la forma±p1v1 p v22 ...p vnn siendo pi Î P (pi ¹ pj si i¹j). 1.

Criba de Eratóstenes: Como método práctico para obtener todos los números primos menores que uno dado:

– – – – –

Escribimos todos los números naturales hasta el número dado Suprimimos todos los múltiplos de 2 a partir de 22= 4. Suprimimos a continuación todos los que queden que sean múltiplos de 3 a partir del 32 = 9. Hacemos lo mismo con los múltiplos de 5 a partir de 52 = 25 Repetimos este proceso con los múltiplos de 7,11,13, etc., hasta que se quede sin tachar un número primo cuyo cuadrado sea mayor que el número dado.

TEMARIO DE MATEMÁTICAS. PRUEBA A

87

Volumen I. Matemáticas

88

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

COROLARIO: “Si (a, c) = (1) y c | ab Þ c | b” Es consecuencia inmediata del lema anterior.

Vamos a justificar este método. Primero eliminamos los números pares a partir del 4 y todos los números que quedan sin tachar, salvo el 2, son impares. Cuando en un paso nos diponemos a suprimir todos los múltiplos de a >2 que son mayores que a2 , los que quedan son a2 + 2a, a2 + 4a, a2 + 6a, ..., a2 + 2ka,... pues los de la forma a2+ (2k + 1)a ya están tachados antes por ser pares. Luego suprimimos todos los a2 + 2ka, que no son primos. Después de hacer esto todos los que queden menores que a2 son primos, pues si b< a2 no es primo, entonces b = pq con p y q primos; si p es el menor de los dos factores tenemos que p2 £ b < a2, es decir, p< a, luego el número b ya estaría tachado antes por ser un múltiplo del número primo p mayor que p2.

LEMA: “Sea A un dominio de integridad principal, y sea pÎ A un elemento irreducible. Entonces p | ab Þ p | a o p | b”. Por ser p irreducible no admite más divisores que inversibles o asociados, por lo cual (p,a) = (p) ó (p,a) = (1). Si fuese (p, a) = (p) entonces a Î (p), o lo que es lo mismo p | a, ya estaría probado. Supongamos que (p, a) = (1), entonces existen s y t tales que ps + at = 1. De donde b = b · 1 = b · (ps + at) = = bsp + tab. Como p | ab, por hipótesis, podremos poner ab = kp que sustituyendo nos da b = bsp + tkp = = (bs + tk) p . Luego p | b 2.

Para averiguar si un número es primo: Para ello bastaría ver si n es divisible o no entre los números primos menores que él. Pero sabemos que en una división entera el divisor y el cociente son intercambiables sin que varíe el resto, y que a medida que aumenta el divisor disminuye el cociente Por tanto de las divisiones de n entre cada número primo, bastaría hacer sólo aquellas en que el divisor es menor que el cociente. El proceso de indagación acabaría cuando o bien nos salga exacta alguna de esas divisiones, o bien cuando no saliendo ninguna exacta lleguemos a una en que el cociente sea inferior al divisor. Por tanto, un número n es primo cuando al dividirlo sucesivamente por los números primos p tales que p2 £ n ninguna de esas divisiones sale exacta.

DEFINICIÓN: Los elementos a y b son coprimos, (primos relativos o primos entre sí) cuando (a, b) = (1). PROPOSICIÓN 2: “Sea A un dominio de integridad principal y a, b elementos no nulos de A. Sea I = (a, b) el ideal de A generado por ambos. Si (a, b) = (d), entonces d es un máximo común divisor de a y b”

PROPOSICIÓN 1: “En un anillo principal A cualquiera, todo par de elementos no nulos a,bÎA admite un máximo común divisor d que puede ponerse como combinación lineal d = sa + tb con coeficientes apropiados s, t Î A” En efecto, sea (a, b) el ideal de A generado por a y b, que coincide en este caso con el ideal suma (a) + (b). Como A es anillo principal todo ideal es principal, por lo que existirá un d Î A, tal que (a, b) = (d). Entonces, como d Î (a,b), existen s, t Î A tales que d = sa + tb [2]. Se tendrá a, b Î (d), de donde d | a y d | b. Además, si c Î A es tal que c | a y c | b existen x, y Î A tales que xc = a e yc = b. Sustituyendo en [2] queda d = s(xc) + t(yc) = (sx)c + (ty)c = (sx + ty)c, luego d | c.

4.4. Máximo común divisor

DEFINICIÓN: En un dominio de integridad cualquiera decimos que d Î A (d¹0) es máximo común divisor de a y b y escribimos d = m.c.d. (a,b) si cumple: 1. d | a y d | b 2. c | a y c | b Þ c | d Nótese que, en general, puede o no existir d con esas condiciones, y en caso de existir cualquier otro elemento asociado de d también las cumpliría.

DEFINICIÓN: En un dominio de integridad cualquiera decimos que d Î A (d¹0) es máximo común divisor de a y b y escribimos d = m.c.d. (a,b) si cumple: 1. d | a y d | b 2. c | a y c | b Þ c | d Nótese que, en general, puede o no existir d con esas condiciones, y en caso de existir cualquier otro elemento asociado de d también las cumpliría.

PROPOSICIÓN 1: “En un anillo principal A cualquiera, todo par de elementos no nulos a,bÎA admite un máximo común divisor d que puede ponerse como combinación lineal d = sa + tb con coeficientes apropiados s, t Î A” En efecto, sea (a, b) el ideal de A generado por a y b, que coincide en este caso con el ideal suma (a) + (b). Como A es anillo principal todo ideal es principal, por lo que existirá un d Î A, tal que (a, b) = (d). Entonces, como d Î (a,b), existen s, t Î A tales que d = sa + tb [2]. Se tendrá a, b Î (d), de donde d | a y d | b. Además, si c Î A es tal que c | a y c | b existen x, y Î A tales que xc = a e yc = b. Sustituyendo en [2] queda d = s(xc) + t(yc) = (sx)c + (ty)c = (sx + ty)c, luego d | c.

4.4. Máximo común divisor

Para averiguar si un número es primo: Para ello bastaría ver si n es divisible o no entre los números primos menores que él. Pero sabemos que en una división entera el divisor y el cociente son intercambiables sin que varíe el resto, y que a medida que aumenta el divisor disminuye el cociente Por tanto de las divisiones de n entre cada número primo, bastaría hacer sólo aquellas en que el divisor es menor que el cociente. El proceso de indagación acabaría cuando o bien nos salga exacta alguna de esas divisiones, o bien cuando no saliendo ninguna exacta lleguemos a una en que el cociente sea inferior al divisor. Por tanto, un número n es primo cuando al dividirlo sucesivamente por los números primos p tales que p2 £ n ninguna de esas divisiones sale exacta.

PROPOSICIÓN 2: “Sea A un dominio de integridad principal y a, b elementos no nulos de A. Sea I = (a, b) el ideal de A generado por ambos. Si (a, b) = (d), entonces d es un máximo común divisor de a y b” DEFINICIÓN: Los elementos a y b son coprimos, (primos relativos o primos entre sí) cuando (a, b) = (1). LEMA: “Sea A un dominio de integridad principal, y sea pÎ A un elemento irreducible. Entonces p | ab Þ p | a o p | b”. Por ser p irreducible no admite más divisores que inversibles o asociados, por lo cual (p,a) = (p) ó (p,a) = (1). Si fuese (p, a) = (p) entonces a Î (p), o lo que es lo mismo p | a, ya estaría probado. Supongamos que (p, a) = (1), entonces existen s y t tales que ps + at = 1. De donde b = b · 1 = b · (ps + at) = = bsp + tab. Como p | ab, por hipótesis, podremos poner ab = kp que sustituyendo nos da b = bsp + tkp = = (bs + tk) p . Luego p | b 2.

Vamos a justificar este método. Primero eliminamos los números pares a partir del 4 y todos los números que quedan sin tachar, salvo el 2, son impares. Cuando en un paso nos diponemos a suprimir todos los múltiplos de a >2 que son mayores que a2 , los que quedan son a2 + 2a, a2 + 4a, a2 + 6a, ..., a2 + 2ka,... pues los de la forma a2+ (2k + 1)a ya están tachados antes por ser pares. Luego suprimimos todos los a2 + 2ka, que no son primos. Después de hacer esto todos los que queden menores que a2 son primos, pues si b< a2 no es primo, entonces b = pq con p y q primos; si p es el menor de los dos factores tenemos que p2 £ b < a2, es decir, p< a, luego el número b ya estaría tachado antes por ser un múltiplo del número primo p mayor que p2. COROLARIO: “Si (a, c) = (1) y c | ab Þ c | b” Es consecuencia inmediata del lema anterior.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

88

Números enteros. Divisibilidad. Números primos. Congruencia En el caso particular de Z, como tal dominio de integridad principal que es, las definiciones y resultados anteriores son válidas. En este caso vamos a hacer algunas precisiones. El máximo común divisor de dos números enteros a y b que, como establece la proposición anterior, es el generador d del ideal suma (a) + (b), que no estaría unívocamente determinado en Z, pues podría ser d o –d. Si adoptamos tácitamente como generador de dicho ideal el positivo, ya tendríamos garantizada la unicidad de D = m.c.d. (a, b), que es por tanto el mayor de los divisores positivos comunes de a y b. La proposición 1 enunciada para Z se conoce como: TEOREMA DE BEZOUT: “Si m.c.d. (a, b) = D, entonces existen l, m Î Z, tales que D = la + mb” En particular dos números enteros a,b Î Z son “primos entre sí” cuando los únicos números que dividen simultáneamente a ambos son +1 y –1. Obviamente dos enteros coprimos no pueden ser ambos nulos, y a y 0 son coprimos sólo si a = ±1. Se tiene: “a,b Î Z primos entre sí Û m.c.d (a, b) = 1”. En efecto si tomamos S = {enteros positivos de la forma ax + by, con x,y Î Z }, obviamente S Ì N y S ¹ Æ, pues a · a + b · b = a 2 + b2 > 0 y tanto a como b son de S. Por el principio de buena ordenación de N el conjunto S tiene un mínimo d > 0, siendo d = au + bv, con u,v Î Z. Por el algoritmo de la división entera a = dq + r (0 £ r< d). Si fuese r ¹ 0, tendríamos que r = a – dq = a – (au + bv)q = a – auq – bvq = a(1 – uq) + b(–vq) y por tanto r Î S. Pero como r < d, llegaríamos a una contradicción. Luego r = 0 y a = dq, de donde d | a. De manera análoga comprobaríamos que d | b. Pero como a y b eran coprimos, sus únicos divisores comunes son + 1 y –1, por lo cual d = ±1. Al ser d positivo resulta d = 1, luego 1 = au + bv. Según el teorema de Bezout resultará m.c.d. (a, b) = 1. Consecuencias:

– –

“Si m.c.d. (a, b) = D, entonces a = a’D y b = b’D siendo m.c.d. (a’,b’) =1” “Si m.c.d (a, b) = 1, existen l , m ÎZ, tales que la + mb = 1 (Igualdad de Bezout)”

El corolario del lema se conoce en Z como TEOREMA DE EUCLIDES: “Si un número divide a un producto y es primo con uno de los factores, entonces divide al otro: c | ab y m.c.d. (c,a) = 1 Þ c | b” En efecto, por el teorema de Bezout lc + ma = 1, de donde b = lbc + mab, pero como c | ab, podremos poner b = lbc + mkc = (lb + mk)c , luego c | b. Otras propiedades:

– – – –

“Si a | b entonces m.c.d. (a,b) = a” “Si m.c.d. (a,b) = D, entonces m.c.d. (ka,kb) = kD” a b D “Si m.c.d. (a,b) = D y k | D, entonces m.c.d. ( , ) = ” k k k “Si m.c.d. (p,a) = 1 entonces m.c.d. (pk, a) = 1 para cualquier k Î Z+.”

4.5. Mínimo común múltiplo DEFINICIÓN: En un dominio de integridad cualquiera decimos que m Î A (m¹0) es mínimo común múltiplo de a y b y escribimos m = m.c.m. (a,b) si cumple:

– –

a|m y b|m

a|c y b|cÞm|c Es decir m es un múltiplo común de a y b que divide a los demás múltiplos comunes de a y b.

TEMARIO DE MATEMÁTICAS. PRUEBA A

89

Volumen I. Matemáticas

90

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Nótese que, en general, puede o no existir m con esas condiciones y, en caso de existir, cualquier otro elemento asociado de m también las cumpliría. Pero si A es un dominio de integridad principal, como ocurre con Z, siempre existe un m.c.m. de dos elementos cualesquiera. En efecto, el ideal (a) Ç (b) de los múltiplos comunes es un ideal principal (m) y su generador m (o sus asociados, que generan el mismo ideal) cumplen las condiciones anteriores. En caso de Z podemos optar el generador positivo, al que nos referiremos siempre al escribir M = m.c.m. (a, b).

Si (a,b) es el ideal de Z generado por a y b , las igualdades anteriores conducen a (a,b) = (b, r1) = (r1, r2) = (r2, r3) =...= (rn-1, rn) = (rn, rn+1) = (rn), y de aquí m.c.d.(a,b) = rn Expresemos ahora los restos anteriores en función de a y b: r 1 = a – q 1b r2 = –q2a + (1 + q1q2)b r3 = (1 + q2q3)a - (q1 + q3 + q1q2q3)b :::::::::::::::::::::::::::::::::::::::::::::::::::::: Siguiendo este proceso, de forma recurrente llegamos a rh = axh + byh (1£ h £ n + 1), una vez obtenidas rh-2 = axh-2 + byh-2 y rh-1 = axh -1+ byh-1 En efecto: rh = rh–2 – qh rh–1 = axh–2 + byh–2 – qh (axh–1+ byh–1) = a(xh–2 – qh xh–1) + b(yh–2 – qh yh–1) = axh + byh Propiedades:

– – –

“Si a | b entonces m.c.m. (a,b) = b”

“Si m.c.m. (a,b) = M, entonces m.c.m. (ka,kb) = kM.” a b M “Si m.c.m. (a,b) = M, k | a y k | b entonces m.c.m. ( , ) = ” k k k

TEOREMA: “" a, b Î Z+: m.c.d. (a,b) x m.c.m. (a,b) = a · b” rn–1 = q

n+1 rn

rn+1 = 0

Demostración: m.c.d.(a,b) = D Þ a = a’D y b = b’D, siendo m.c.d. (a’,b’) =1. rn–2 = qnrn–1+rn

0 < rn < rn–1

a=qb+r 0 < r1 < b 1 1 b = q2r1 + r2 0 < r2 < r1 0 < r3 < r2 r1 = q3r2 + r3 ........................................ ........................................

Veamos que m.c.m. (a,b) = a’ b’D = a’b = a b’. En efecto, si x es otro múltiplo cualquiera de a y b, entonces x = as = bt = (a’D)s = (b’D)t. Simplificando por D: a’s = b’t, de donde a’| b’t. Pero como m.c.d. (a’,b’) = 1 por el teorema de Euclides será a’| t, es decir, t = ka’. Sustituyendo: x = bt = b(ka’) = (b’D) · (ka’) = k(a’b’D), luego x | a’b’D. a r1

b r2

q1

q2 r1 r3

q3 ............. qn qn+1 r2 ............. rn–2 rn–1 rn ............. rn 0

En todo dominio de integridad principal, y por tanto en Z, hay un método directo para hallar el máximo común divisor d de dos elementos a y b y a la vez los coeficientes de d = s a + t b. Dados a,b Î Z (b ¹ 0) podemos efectuar una sucesión de divisiones hasta obtener una con resto nulo: COROLARIO: “a y b son primos relativos Û m.c.m. (a,b) = ab”

4.6. Algoritmo de Euclides 4.6. Algoritmo de Euclides COROLARIO: “a y b son primos relativos Û m.c.m. (a,b) = ab”

En todo dominio de integridad principal, y por tanto en Z, hay un método directo para hallar el máximo común divisor d de dos elementos a y b y a la vez los coeficientes de d = s a + t b. Dados a,b Î Z (b ¹ 0) podemos efectuar una sucesión de divisiones hasta obtener una con resto nulo:

Veamos que m.c.m. (a,b) = a’ b’D = a’b = a b’. En efecto, si x es otro múltiplo cualquiera de a y b, entonces x = as = bt = (a’D)s = (b’D)t. Simplificando por D: a’s = b’t, de donde a’| b’t. Pero como m.c.d. (a’,b’) = 1 por el teorema de Euclides será a’| t, es decir, t = ka’. Sustituyendo: x = bt = b(ka’) = (b’D) · (ka’) = k(a’b’D), luego x | a’b’D. q1

a r1

b r2

q2 r1 r3

q3 ............. qn qn+1 r2 ............. rn–2 rn–1 rn ............. rn 0

a = q1b + r1 0 < r1 < b b = q2r1 + r2 0 < r2 < r1 0 < r3 < r2 r1 = q3r2 + r3 ........................................ ........................................

Demostración: m.c.d.(a,b) = D Þ a = a’D y b = b’D, siendo m.c.d. (a’,b’) =1. rn–2 = qnrn–1+rn

0 < rn < rn–1

rn–1 = q

rn+1 = 0

n+1 rn

TEOREMA: “" a, b Î Z+: m.c.d. (a,b) x m.c.m. (a,b) = a · b”

Si (a,b) es el ideal de Z generado por a y b , las igualdades anteriores conducen a (a,b) = (b, r1) = (r1, r2) = (r2, r3) =...= (rn-1, rn) = (rn, rn+1) = (rn), y de aquí m.c.d.(a,b) = rn Expresemos ahora los restos anteriores en función de a y b: r 1 = a – q 1b r2 = –q2a + (1 + q1q2)b r3 = (1 + q2q3)a - (q1 + q3 + q1q2q3)b :::::::::::::::::::::::::::::::::::::::::::::::::::::: Siguiendo este proceso, de forma recurrente llegamos a rh = axh + byh (1£ h £ n + 1), una vez obtenidas rh-2 = axh-2 + byh-2 y rh-1 = axh -1+ byh-1 En efecto: rh = rh–2 – qh rh–1 = axh–2 + byh–2 – qh (axh–1+ byh–1) = a(xh–2 – qh xh–1) + b(yh–2 – qh yh–1) = axh + byh

– – –

“Si m.c.m. (a,b) = M, entonces m.c.m. (ka,kb) = kM.” a b M “Si m.c.m. (a,b) = M, k | a y k | b entonces m.c.m. ( , ) = ” k k k “Si a | b entonces m.c.m. (a,b) = b”

Propiedades:

Nótese que, en general, puede o no existir m con esas condiciones y, en caso de existir, cualquier otro elemento asociado de m también las cumpliría. Pero si A es un dominio de integridad principal, como ocurre con Z, siempre existe un m.c.m. de dos elementos cualesquiera. En efecto, el ideal (a) Ç (b) de los múltiplos comunes es un ideal principal (m) y su generador m (o sus asociados, que generan el mismo ideal) cumplen las condiciones anteriores. En caso de Z podemos optar el generador positivo, al que nos referiremos siempre al escribir M = m.c.m. (a, b).

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

90

Números enteros. Divisibilidad. Números primos. Congruencia ì xh = xh– 2 + (–q h )xh–1 donde í îy h = y h– 2 + (–q h )y h–1 Las fórmulas anteriores nos permiten obtener x3 , y3 , x4 , y4 ,..., xn , yn partiendo de y1 = - q1 x1 = 1; x2 = –q2; y 2 = 1 + q 1q2 Entonces es posible encontrar una solución entera (xn , yn) de la ecuación d = ax + by, pues resultará d = rn = axn + byn .

4.7. Factorización. Teorema fundamental TEOREMA: “Todo dominio de integridad principal A es un dominio de factorización única” El enunciado anterior se traduce en que " a Î A (a ¹ 0), se tiene que a es inversible o a es un producto a = u p1p2...pn , donde u es inversible y pi son primos. Si además fuese a = u’q1q2...qm con los qi primos, tendríamos que n = m y que puede encontrarse una permutación s de {1, 2, 3,..., n} tal que s(qi) = ui pi. Para la demostración general, sustituimos el razonamiento por recurrencia, que puede hacer en el caso particular de Z, por la “condición de cadena ascendente” (en un anillo principal A toda sucesión creciente de ideales es estacionaria). En efecto, si tenemos una cadena ascendente de ideales principales (a1) Ì (a2) Ì (a3) Ì ... Ì (an) Ì … ¹

¹

¹

¹

¹

dicha cadena no puede ser infinita. En efecto, la unión de esa cadena È (ai) es un ideal de A y, por tanto, i será un ideal principal (a). Como a Î (a), existe un n para el que a Î(an). Tendríamos (a) Ì (an) y además (an) Ì È (ai) = (a); luego (a) = (an). Y para m > n se tendrá (am) Ì (a) Ì (an), de donde (am) = (an). i Consideremos ahora en un anillo principal A el conjunto S de ideales distintos del trivial {0} cuyo generador no admita una factorización en elementos irreducibles. Si fuese S ¹ Æ, entonces tendríamos un (a1) ∈ S. Tomando una cadena ascendente de ideales de S, dicha cadena se estaciona en un (an) Î S. (b), esto implica que b admite una factorización en elementos Si (b) es un ideal de A tal que (an) Ì ¹ irreducibles mientras que an no la admite. Entonces an = b · c donde b y c no son inversibles. Por tanto (b) y (an) Ì (c), de donde b y c admiten tal factorización: (an) Ì ¹ ¹ c = v q1q2...qt b = u p1p2...pr, Resultaría an = (uv) p1p2...pr q1q2...qt , lo que contradice que (an) Î S . Por tanto S = Æ y todo elemento de A admite una factorización en elementos irreducibles. Vamos a probar ahora la unicidad. Si fuese a = u p1p2...pn = u’q1q2...qm con m ³ n, entonces: p1 | a Þ p1 | u’q1q2...qm Þ p1 | q1q2...qm Þ por el lema anterior $ iÎ{1, 2, ..., m}/ p1 | qi , o sea qi = u1p1 Reordenando los qi podemos suponer q1 = u1p1 , y por tanto: u p1p2...pn = u’ u1p1 q2...qm. Por ser A dominio de integridad, vale la ley cancelativa: up2...pn = u’u1q2...qm. Procediendo igual con p2, p3,...pn llegamos finalmente a que u = u’u1u2... unqm-n...qm. Pero entonces u-1u’u1u2 ... unqm-n...qm = 1, lo cual es absurdo pues los qi no son inversibles. Luego es n = m y tras las reordenaciones oportunas qi = uipi . Hemos probado la unicidad de la factorización en elementos irreducibles, salvo factores inversibles. Si consideramos el conjunto P de primos en A, tal como los habíamos definido con anterioridad, llegamos a una única descomposición factorial: " a Î A (a ¹ 0): a = up1v1 p v22 ...p vnn con pi Î P A la descomposición anterior se le llama factorización prima de a y a cada ni ÎN* (único) se le llama orden de pi en a. TEMARIO DE MATEMÁTICAS. PRUEBA A

91

Volumen I. Matemáticas

92

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

TEOREMA: “Dado pÎZ+, se verifica:

p primo Û (p) es ideal primo”

En el caso de Z , los número primos se toman como los irreducibles positivos y los inversibles son +1 y –1. Lo anterior se concreta en el llamado b = b · 1 = b(xp + ya) = (bx)p + y(ab) = (bx)p + (yc)p = (bx + yc)p Þ p | b Þ b Î(p) Con ello queda demostrado en Z el siguiente

Teorema fundamental de la aritmética:

“Todo número compuesto n Î Z puede ponerse como producto de+1 ó –1 por otros factores primos, siendo dicha descomposición única salvo el orden de los factores”. No perdemos generalidad si consideramos sólo enteros positivos. Si n es primo, la demostración es trivial. Si n es compuesto y p1 es el menor divisor primo de n entonces n = p1k1 , con k1 Î Z. Si es k1 primo ya está, en caso contrario, sea p2 el menor divisor primo de k1. Se tiene q1 = p2 k2 y por tanto n = p1k1 = p1 p2 k2. Repitiendo el proceso n = p1 p2 p3... La descomposición es finita pues los ki son cada vez menores. La unicidad se prueba como hicimos antes en caso de un anillo principal cualquiera. Si en la factorización aparecen factores primos repetidos se pueden agrupar, con lo que al final quedará una factorización única n = ±p1v1 p v22 ...p vkk , siendo pi Î P (pi ¹ pj si i¹j).

Se verifica en cualquier dominio de integridad A: “(a) es ideal primo Þ a es irreducible”. En efecto, si a = b · c con b, c Î A tendremos por ser (a) ideal primo que b Î (a) ó c Î (a). Supongamos que b Î (a), entonces existe k Î A siendo b = ak, y por tanto a = akc. Al ser A dominio de integridad, todos los elementos no nulos son regulares y llegamos a kc = 1, por lo cual c sería inversible. La recíproca de la proposición anterior no es cierta en general. Ahora bien si A es un dominio de integridad principal y por tanto anillo factorial, como ocurre con Z, puede probarse la implicación: p es un primo de A Þ (p) es ideal primo. La demostración es fácil si nos basamos en los resultados anteriores. En efecto, sean a,b Î A, ab Î (p) Þ Þ ab = cp Þ p | ab. Si fuese a Ï(p), entonces p | a y como p es primo sería m.c.d. (p,a) = 1. Existirían x,y Î A tales que xp + ya = 1, y de aquí:

4.8. Caracterización de los ideales primos de Z Consecuencias del teorema fundamental: “La condición necesaria y suficiente para que dos números sean primos entre sí es que no tengan ningún factor primo común”

5.

“El m.c.m. de dos números es el producto de todos los factores primos de uno u otro, tomando cada uno con el mayor exponente”

4.

“El m.c.d. de dos números es el producto de los factores primos comunes tomando cada uno con el menor exponente”

3.

“La condición necesaria y suficiente para que un número m sea múltiplo de otro n es que contenga todos los factores primos de éste con iguales o mayores exponentes”

2.

“Hay una infinidad de números primos en Z” De lo contrario podemos suponer que q es el último de ellos. El número n obtenido en n = q! + 1 = 1 · 2 · … · q + 1 daría resto 1 al dividirlo por cualquier primo; pero, según el teorema anterior, también sería descomponible en factores primos, por lo que sería divisible entre algún primo. Llegamos, pues, a un absurdo; luego el conjunto de los números primos no puede ser finito.

1.

1.

2.

“Hay una infinidad de números primos en Z” De lo contrario podemos suponer que q es el último de ellos. El número n obtenido en n = q! + 1 = 1 · 2 · … · q + 1 daría resto 1 al dividirlo por cualquier primo; pero, según el teorema anterior, también sería descomponible en factores primos, por lo que sería divisible entre algún primo. Llegamos, pues, a un absurdo; luego el conjunto de los números primos no puede ser finito. “La condición necesaria y suficiente para que un número m sea múltiplo de otro n es que contenga todos los factores primos de éste con iguales o mayores exponentes”

3.

“El m.c.d. de dos números es el producto de los factores primos comunes tomando cada uno con el menor exponente”

4.

“El m.c.m. de dos números es el producto de todos los factores primos de uno u otro, tomando cada uno con el mayor exponente”

5.

“La condición necesaria y suficiente para que dos números sean primos entre sí es que no tengan ningún factor primo común”

Consecuencias del teorema fundamental:

4.8. Caracterización de los ideales primos de Z “Todo número compuesto n Î Z puede ponerse como producto de+1 ó –1 por otros factores primos, siendo dicha descomposición única salvo el orden de los factores”. No perdemos generalidad si consideramos sólo enteros positivos. Si n es primo, la demostración es trivial. Si n es compuesto y p1 es el menor divisor primo de n entonces n = p1k1 , con k1 Î Z. Si es k1 primo ya está, en caso contrario, sea p2 el menor divisor primo de k1. Se tiene q1 = p2 k2 y por tanto n = p1k1 = p1 p2 k2. Repitiendo el proceso n = p1 p2 p3... La descomposición es finita pues los ki son cada vez menores. La unicidad se prueba como hicimos antes en caso de un anillo principal cualquiera. Si en la factorización aparecen factores primos repetidos se pueden agrupar, con lo que al final quedará una factorización única n = ±p1v1 p 2v2 ...p kvk , siendo pi Î P (pi ¹ pj si i¹j).

Se verifica en cualquier dominio de integridad A: “(a) es ideal primo Þ a es irreducible”. En efecto, si a = b · c con b, c Î A tendremos por ser (a) ideal primo que b Î (a) ó c Î (a). Supongamos que b Î (a), entonces existe k Î A siendo b = ak, y por tanto a = akc. Al ser A dominio de integridad, todos los elementos no nulos son regulares y llegamos a kc = 1, por lo cual c sería inversible. La recíproca de la proposición anterior no es cierta en general. Ahora bien si A es un dominio de integridad principal y por tanto anillo factorial, como ocurre con Z, puede probarse la implicación: p es un primo de A Þ (p) es ideal primo. La demostración es fácil si nos basamos en los resultados anteriores. En efecto, sean a,b Î A, ab Î (p) Þ Þ ab = cp Þ p | ab. Si fuese a Ï(p), entonces p | a y como p es primo sería m.c.d. (p,a) = 1. Existirían x,y Î A tales que xp + ya = 1, y de aquí: b = b · 1 = b(xp + ya) = (bx)p + y(ab) = (bx)p + (yc)p = (bx + yc)p Þ p | b Þ b Î(p) Con ello queda demostrado en Z el siguiente

Teorema fundamental de la aritmética:

TEOREMA: “Dado pÎZ+, se verifica:

En el caso de Z , los número primos se toman como los irreducibles positivos y los inversibles son +1 y –1. Lo anterior se concreta en el llamado CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

92

p primo Û (p) es ideal primo”

Números enteros. Divisibilidad. Números primos. Congruencia

4.9. Divisores de un número Si p es primo ya vimos que los divisores de p son {+1, –1, +p, –p}. Tratamos ahora de obtener todos los divisores enteros de un número entero n. No perderemos generalidad si nos limitamos al caso en que n sea natural y a los divisores naturales de n, pues es fácil extender el resultado a Z, ya que n y –n tendrán los mismos divisores, los cuales en ambos casos serán los divisores naturales de n y sus asociados. a)

Obtención de todos los divisores de un número compuesto Si n Î N* y tiene como factorización prima n = p1v1 p v22 ...p vkk entonces todos los divisores de n son los términos del producto [3] (1+ p1 + p12 +...p1v1 )× (1+ p 2 + p 22 +...p v22 )...(1+ p k + p k2 +...p vkk ) En efecto pues, todos los términos que resultan al desarrollar este producto son de la forma p1b1 p 2b2 ...p kbk , siendo 0 £ bi £ ni (i = 1, 2,..., k).

b)

Número de divisores de un número compuesto Cada uno de los paréntesis de [3] tiene ni +1 términos de donde el número de divisores será el número de productos posibles con un término de cada uno de los paréntesis, es decir: k

n = Õ ( n i + 1)( n1 + 1)( n 2 + 1)...( n k + 1) i=1

c)

Suma de todos los divisores Cada uno de los paréntesis es suma de términos consecutivos de una progresión geométrica de razón pi , por tanto la suma total es: k

p vi i +1 – 1 p1v1+1 – 1 p v22+1 – 1 p vk+1 – 1 = ´ ´...´ k p1 – 1 p2 – 1 pk – 1 i = 1 pi – 1

S=Õ d)

Producto de todos los divisores Si p1b1 p 2b2 ...p kbk es un divisor de n, su complementario es p1v1 – b1 p v22 – b2 ...p vkk – bk . Es obvio que el producto de cada divisor de n por su complementario da n. Si ordenamos de menor a mayor todos los divisores y ponemos debajo sus complementarios, tendremos 1 = d1 < d2 < ... < dn–1< dn = n n = d n< d n-1 < ...< d2 < d1 = 1 Multiplicando ambas sucesiones n veces } 2 P = (d1d2 … dn–1dn) · (d nd n-1 ....d2d1) = (d1 d n).(d2 d n-1)....(dn-1 d2)(dn d1) = n · n ... n = nn De donde resulta que el producto de todos los divisores de n es: P = nn

( n = número de divisores de n)

5. CONGRUENCIAS EN EL ANILLO DE LOS ENTEROS 5.1. Relación de congruencia en Z DEFINICIÓN: Dado m Î Z+ decimos que dos números enteros a y b son “congruentes módulo m” y escribimos a º b (mód. m) si a – b Î (m). Recordemos que el ideal principal (m) = mZ es el conjunto de múltiplos enteros de m, por tanto la condición a - b Î (m) equivale a m | a - b. La relación anterior es de equivalencia: 1. Reflexiva: a º a (mód m) " a Î Z. Es obvia, pues a -a = 0 = m · 0 2. Simétrica: a º b (mód m) Þ b º a (mód m) En efecto, m | a - b Þ a - b = m.k Þ b - a = m.(-k) Þ m | b - a. TEMARIO DE MATEMÁTICAS. PRUEBA A

93

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

94

“Si a · c º b · c (mód m) y m.c.d. (c,m) =1, entonces a º b (mód m)” En efecto, si ac º bc (mód m) es ac – bc = mq, de donde m | (a – b)c. Pero como m es primo con c, por el teorema de Euclides debe ser m | (a – b) de donde a º b (mód m).

6.

3.

Transitiva: a º b (mód m) y b º c (mód m) Þ a º c (mód m) ìa º b (mód m)ü ìa – b = mk ü í ýÞ í ý Þ Sumando: (a –b) + (b – c) = mk + mk’ Þ a –c = m(k+k’) = îb º c (mód m)þ îb – c = mk 'þ Las propiedades 3, 4 y 5 son consecuencia de las dos primeras. = mk’’ Þ a º c (mód m)

“Sea a º b (mód m) y P(x) un polinomio con coeficientes enteros, entonces P(a) º P(b) (mód m) ”

PROPOSICIÓN: “a º b (mód m) Û a y b dan el mismo resto al dividir entre m.” En efecto, si a º b (mód m), entonces a – b = mk. Si efectuamos la división entera de b entre m, tenemos b = mq + r con 0 £ r < m. Entonces a = b + mk = (mq + r) + mk = m(q + k) + r. Luego ambos darían resto r al dividir entre m. Supongamos ahora que a = mq + r y b = mq’ + r. Entonces a – b = m(q – q’) y es inmediato. Como ya se vio en el epígrafe 3.4. las clases de números congruentes módulo m son las clases residuales módulo m, que constituyen el anillo cociente Zm = Z/(m), ya estudiado. En cada clase están todos los números enteros que dan el mismo resto al dividir entre m. Hay tantas clases como restos posibles, es decir, podemos tomar como representante de cada una el menor entero positivo y tendremos Zm= {0, 1 , 2, ..., m – 1}. 5.

ìa º a ' (mód m)ü í ý Þ la + mb º la '+ mb ' (mód m), " (l,m) Î Z2. îb º b ' (mód m)þ

“Toda combinación lineal con coeficientes enteros de dos congruencias (mód m) es otra congruencia (mód m)”

4.

“Si a º b (mód m), entonces ka º kb (mód m) , " k Î Z”

3.

En efecto, si a º a’ (mód m) y b º b’ (mód m), entonces a – a’ = mh y b – b’ = mk. Multiplicando la primera igualdad por b y la segunda por a’: b(a – a’) = b(mh) a’(b – b’) = a’(mk) Si las sumamos ahora llegamos a ab – a’b’ = m(hb + ka’), de donde a . b º a’. b’ (mód m). Las propiedades anteriores significan que la relación de congruencia es compatible con las operaciones en el anillo Z; esto viene a ser lo mismo que asegurar que la suma y el producto en Zm están bien definidas

5.2. Propiedades de las congruencias 1.

Suma de congruencias:

ìa º a ' (mód m)ü í ý Þ a + b º a’ + b’ (mód m) îb º b ' (mód m)þ

Producto de congruencias: ìa º a ' (mód m)ü í ý Þ a · b º a’ · b’ (mód m) îb º b ' (mód m)þ

En efecto, si a ºa’ (mód m) y b ºb’ (mód m), entonces a – a’ = mh y b – b’ = mk. Sumando (a – a’) + + (b– b’) = mh + mk ; es decir (a + b) – (a’ + b’) = m(h + k). De donde se llega a a + b º a’+ b’ (mód m). 2.

En efecto, si a ºa’ (mód m) y b ºb’ (mód m), entonces a – a’ = mh y b – b’ = mk. Sumando (a – a’) + + (b– b’) = mh + mk ; es decir (a + b) – (a’ + b’) = m(h + k). De donde se llega a a + b º a’+ b’ (mód m). 2.

Producto de congruencias: ìa º a ' (mód m)ü í ý Þ a · b º a’ · b’ (mód m) îb º b ' (mód m)þ

ìa º a ' (mód m)ü í ý Þ a + b º a’ + b’ (mód m) îb º b ' (mód m)þ

En efecto, si a º a’ (mód m) y b º b’ (mód m), entonces a – a’ = mh y b – b’ = mk. Multiplicando la primera igualdad por b y la segunda por a’: b(a – a’) = b(mh) a’(b – b’) = a’(mk) Si las sumamos ahora llegamos a ab – a’b’ = m(hb + ka’), de donde a . b º a’. b’ (mód m). Las propiedades anteriores significan que la relación de congruencia es compatible con las operaciones en el anillo Z; esto viene a ser lo mismo que asegurar que la suma y el producto en Zm están bien definidas 1.

Suma de congruencias:

5.2. Propiedades de las congruencias

PROPOSICIÓN: “a º b (mód m) Û a y b dan el mismo resto al dividir entre m.” En efecto, si a º b (mód m), entonces a – b = mk. Si efectuamos la división entera de b entre m, tenemos b = mq + r con 0 £ r < m. Entonces a = b + mk = (mq + r) + mk = m(q + k) + r. Luego ambos darían resto r al dividir entre m. Supongamos ahora que a = mq + r y b = mq’ + r. Entonces a – b = m(q – q’) y es inmediato. Como ya se vio en el epígrafe 3.4. las clases de números congruentes módulo m son las clases residuales módulo m, que constituyen el anillo cociente Zm = Z/(m), ya estudiado. En cada clase están todos los números enteros que dan el mismo resto al dividir entre m. Hay tantas clases como restos posibles, es decir, podemos tomar como representante de cada una el menor entero positivo y tendremos Zm= {0, 1 , 2, ..., m – 1}. 3.

“Si a º b (mód m), entonces ka º kb (mód m) , " k Î Z”

4.

“Toda combinación lineal con coeficientes enteros de dos congruencias (mód m) es otra congruencia (mód m)” ìa º a ' (mód m)ü ý Þ la + mb º la '+ mb ' (mód m), " (l,m) Î Z2. í îb º b ' (mód m)þ

5.

“Sea a º b (mód m) y P(x) un polinomio con coeficientes enteros, entonces P(a) º P(b) (mód m) ” = mk’’ Þ a º c (mód m)

Las propiedades 3, 4 y 5 son consecuencia de las dos primeras.

Transitiva: a º b (mód m) y b º c (mód m) Þ a º c (mód m) ìa º b (mód m)ü ìa – b = mk ü í ýÞ í ý Þ Sumando: (a –b) + (b – c) = mk + mk’ Þ a –c = m(k+k’) = îb º c (mód m)þ îb – c = mk 'þ 6.

“Si a · c º b · c (mód m) y m.c.d. (c,m) =1, entonces a º b (mód m)” En efecto, si ac º bc (mód m) es ac – bc = mq, de donde m | (a – b)c. Pero como m es primo con c, por el teorema de Euclides debe ser m | (a – b) de donde a º b (mód m).

94

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

3.

Volumen I. Matemáticas

Números enteros. Divisibilidad. Números primos. Congruencia

7.

Omitiremos las demostraciones de las que siguen, por ser también sencillas “Si a º b (mód km) con k¹0, entonces a º b (mód m)”

8.

“Si a · c º b · c (mód m) y m.c.d. (c,m) = D, entonces a º b (mód m/D)”

9.

“Si a º b (mód mi) " i Î {1, 2, ..., k}, entonces a º b (mód m.c.m(m1,m2...mk))”

5.3. Restos potenciales Dado un nÎZ+, se denominan restos potenciales de p módulo m a los restos r0, r1 , r2 .....rk ,.... de dividir las sucesivas potencias n0, n1 , n2 ,.....nk ,... entre m. Algunas propiedades de los restos potenciales son inmediatas:

– – – – –

nk º rk (mód p)

k = 1,2,.....

r0 = 1 El número de restos potenciales distintos es menor que m, y por tanto finito. Si algún resto potencial es nulo, son nulos todos los que siguen (rk = 0 Þ rj = 0, para j ³ k)

Para obtener un resto potencial cualquiera basta multiplicar por n el resto potencial anterior (pues de nk º rk (mód m), se obtiene nk+1 º rk n (mód m) Los restos potenciales de un número n módulo m siguen una periodicidad, que puede estudiarse según sean las factorizaciones primas de n y m.

Caso 1: Los factores primos de las descomposiciones de n y m son los mismos. Es decir n = p1a1 p 2a 2 ...p ar r y m = p1b1 p 2b2 ...p rbr Si fuesen bi £ a i para todo i Î{1, 2, ..., r}, sería m | n, por lo cual nk º 0 (mód m) para cualquier k ³1: Todos los restos potenciales serían nulos salvo r0 = 1 Si algún bi es mayor que el a i correspondiente, podemos encontrar un k suficientemente grande tal que bi £ ka i para todo i Î{1,2,..,r}. Tomando el mínimo k que lo cumpla, entonces nk sería la menor potencia de n que es múltiplo de m. En consecuencia los restos r0, r1, ..., rk-1 serían no nulos y los siguientes serían ceros.

Caso 2: Ninguno de los factores primos de m figura en la factorización prima de n En este caso es obvio que m y n son primos entre sí. Sea na+h la potencia de exponente más pequeño que vuelve a dar el mismo resto que na al dividir entre m. Entonces se tendrá na+h º na (mód m) Þ na (nh – 1) º 0 (mód m). Como m y n son primos relativos también lo serán m y na ; en consecuencia resulta nh - 1 º 0 (mód m), o sea nh º n0 º 1 (mód m). En este caso, si h es el menor número natural que cumple nh º1, los restos potenciales r0, r1 , r2, ..., rh-1 serían distintos, y luego rh, rh+1, ..., r2h -1 serían respectivamente los mismos que los anteriores, y así sucesivamente formando una secuencia periódica pura.

Caso 3: Algunos factores primos de m figuran en la factorización prima de n y otros no Se puede probar también que los restos potenciales de n módulo p siguen una secuencia periódica mixta. Omitimos la demostración, pero puede verse en la obra de Julio Rey Pastor citada en la bibliografía.

5.4. Criterios de divisibilidad Sea un número natural n = ckck-1 ......c2c1c0 (b escrito en base b, siendo ci (i = 0,1,...k) las cifras de n (0 £ ci < b). Su expresión polinómica en dicha base es n = c0 b0 +c1 b1 + c2 b2 + .......+ ck-1 bk-1 + ck bk = Pk (b) TEMARIO DE MATEMÁTICAS. PRUEBA A

95

Volumen I. Matemáticas

96

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si queremos estudiar la divisibilidad de n entre otro número natural m, podemos recurrir a los restos potenciales módulo m de la base de numeración b. Es decir:

10

11

1

9

2

8

1 1

10 1

1 1

1

10

1

1

0

0

Un número es divisible entre 11 si la suma de las cifras de c0 + 10c1 + c2 + 10c3 + ... lugar impar más diez veces la suma de las de lugar impar da un múltiplo de 11(2) b0 º 1 (mód m) b1 º r1 (mód m) b2 º r2 (mód m) ::::::::::::::::::::::::: bk º rk (mód m)

Un número es divisible entre 9 si lo es la suma de sus cifras

c0 + c1 + c2 + .......+ ck

Según vimos en 5.2., una combinación lineal con coeficientes enteros de congruencias módulo m da otra congruencia módulo m. Por tanto tendremos n = c0 +c1 b + c2 b2 + .......+ ck-1 bk-1 + ck bk º c0 +c1 r1 + c2 r1 + .......+ ck rk (mód m)

4

0

0

Un número es divisible entre 8 si lo es la suma de la cifra de las unidades, el doble de la de las decenas y el cuádruple de la de las centenas

En consecuencia, un criterio general de divisibilidad es: “n es divisible entre m si y sólo si lo es Y = c0 +c1 r1 + c2 r1 + .......+ ck rk”

c0 +2c1+ 4c2

Si particularizamos para base decimal podemos empezar construyendo un tabla de restos potenciales de 10 respecto de un módulo m, para ver cómo quedaría la expresión Y, que nos dará el criterio buscado. Para los criterios de divisibilidad usuales (m = 2,3,4,5,8,9,11) se tiene el cuadro que sigue.

r2

r1

Un número es divisible entre 4 si lo es la suma de la cifra de las unidades y el doble de la de las decenas (1) r3

r4

r6

r5

Y

c0

m

c0 0

0

0

0

Un número es divisible entre 2 si la cifra de las unidades es par

Criterio de divisibilidad 0

0

0

Un número es divisible entre 3 si lo es la suma de sus cifras

0

0

0

0

0

Un número es divisible entre 3 si lo es la suma de sus cifras

5

2

c0 + c1 + c2 + … + ck 0

1

0

1

0

1

0

c0 +2c1

1

0

c0 + c1 + c2 + … + ck

Un número es divisible entre 2 si la cifra de las unidades es par

1

2

1

1

4

1

c0

3

1

c +2c

Un número es divisible entre 4 si lo es la suma de la cifra de las unidades y el doble de la de las decenas (1)

1

1

1

0

1

0

0

0

0

0

0

0

0

0

0

Criterio de divisibilidad 2

0

Y

4

Un número es divisible entre 5 si la cifra de las unidades es 0 ó 5

c0

2

3

0

r6

0

r5

0

r4

0

r3

0

r2

0

r1

5

m

Un número es divisible entre 5 si la cifra de las unidades es 0 ó 5

Si particularizamos para base decimal podemos empezar construyendo un tabla de restos potenciales de 10 respecto de un módulo m, para ver cómo quedaría la expresión Y, que nos dará el criterio buscado. Para los criterios de divisibilidad usuales (m = 2,3,4,5,8,9,11) se tiene el cuadro que sigue.

2

En consecuencia, un criterio general de divisibilidad es: “n es divisible entre m si y sólo si lo es Y = c0 +c1 r1 + c2 r1 + .......+ ck rk”

8

Un número es divisible entre 8 si lo es la suma de la cifra de las unidades, el doble de la de las decenas y el cuádruple de la de las centenas

4

0

0

0

0

c0 +2c1+ 4c2

Según vimos en 5.2., una combinación lineal con coeficientes enteros de congruencias módulo m da otra congruencia módulo m. Por tanto tendremos n = c0 +c1 b + c2 b2 + .......+ ck-1 bk-1 + ck bk º c0 +c1 r1 + c2 r1 + .......+ ck rk (mód m)

11

1

10

1

1

1

10

1

1

1

10

1

1

c0 + c1 + c2 + .......+ ck

b0 º 1 (mód m) b1 º r1 (mód m) b2 º r2 (mód m) ::::::::::::::::::::::::: bk º rk (mód m)

9

Un número es divisible entre 9 si lo es la suma de sus cifras

Un número es divisible entre 11 si la suma de las cifras de c0 + 10c1 + c2 + 10c3 + ... lugar impar más diez veces la suma de las de lugar impar da un múltiplo de 11(2)

Si queremos estudiar la divisibilidad de n entre otro número natural m, podemos recurrir a los restos potenciales módulo m de la base de numeración b. Es decir: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

96

Números enteros. Divisibilidad. Números primos. Congruencia (1) Como 2 º 10 (mód 4), se desprende que c0 +2c1 º c0 +10c1, de donde el criterio de divisibilidad por 4 es el conocido, o sea, un número es divisible por 4 si su terminación de dos cifras es 00 ó un múltiplo de 4. (2) En este caso podemos tener en cuenta que 10 = 11 – 1 y poner Y= c0+10c1 +c2 +10 c3 +...... = c0+(11 – 1)c1 +c2 +(11 – 1) c3 +...... = ·

= 11(c1 +c3 +....) + (c0+c2+...) – (c1+c3+...) = (c0+c2+...) – (c1+c3+...) + 11 Luego Y º (c0 + c2 + ...) – (c1 + c3 + ...) (mód 11), con lo cual queda el criterio usual de divisibilidad entre 11, o sea, un número es divisible entre 11 si al restar la suma de las cifras de lugar par y la suma de las cifras de lugar par resulta 0 ó múltiplo de 11.

5.5. Sistemas de números incongruentes Un conjunto de k números enteros (k< m) forma un “sistema de números incongruentes módulo m”, si los restos de todos ellos al dividir entre m son todos distintos. Sabemos que hay m clases residuales módulo m, que forman una partición de Z. Si escogemos un número entero y sólo uno de cada una de las clases, obtendríamos un conjunto de m números enteros {n1,n2,...nm}, que dan entre todos ellos todos los restos posibles al dividir entre m; es decir, es un sistema de números incongruentes módulo m de orden máximo (si tomáramos otro más ya daría el mismo resto entre m que alguno de los que había). Decimos entonces que {n1,n2,...nm} es un sistema completo de números incongruentes módulo m. El sistema completo de números incongruente módulo n más sencillo es {0,1,2,....n – 1}. Si multiplicamos k números incongruentes por un mismo número a que sea primo con el módulo m, obtenemos otros k números incongruentes. Lo mismo podemos decir si sumamos un entero c cualquiera a k número incongruentes. Se puede, pues, resumir en el siguiente enunciado PROPOSICIÓN: “Si {n1,n2,...nk} es un sistema de números incongruentes (mód m) y a,cÎZ, siendo m.c.d(a,m) = 1, entonces {an1+ c, an2+ c,..... , ank + c } es otro sistema de números incongruentes (mód m)”. En efecto con i¹j si la diferencia (ani + c) – (anj + c) = a(ni – nj) fuese múltiplo de m, al ser éste primo con a, debiera ocurrir que m|(ni – nj) , lo que contradice que ni y nj sean incongruentes módulo m.

5.6. Congruencia de Fermat Si nÎZ , el anillo cociente Z nZ = Zn se llama anillo de enteros módulo n. En el caso de p primo, el

anillo cociente Zp es un cuerpo y el orden del – grupo multiplicativo (Zp - {0}, ·) es p – 1; es decir, cada elemento x ¹ 0 tiene de período p – 1: xp–1 =1. Esto se traduce en la siguiente proposición PROPOSICIÓN (Congruencia de Fermat) “Dado un número entero primo positivo p, para cualquier x Î Z que no sea múltiplo de p se verifica x p-1 º 1 (mód p) ” En efecto, el conjunto {0, 1, 2, ..., p – 1} forma un sistema completo números incongruentes módulo p, y por consiguiente también lo será el conjunto {0 · x, 1 · x, 2 · x, ... , (p – 1)x} pues al ser p primo y p | x será m.c.d. (p,x) = 1. Quitando el 0, los demás darán los p – 1 restos distintos al dividir entre p, que salvo el orden serán 1, 2, ... p – 1. Como el producto de congruencias es otra congruencia, llegaremos a 1x · 2x ... (p – 1) x º º 1 · 2 ... (p – 1) (mód p), es decir a (p – 1)! x p -1 º (p – 1)! (mód p) [*] Ahora bien (p – 1)! es primo con p pues todos los factores de (p – 1)! son primos con p, o sea m.c.d. (1, 2, 3, ... p – 1, p) = 1 Þ m.c.d.((p – 1)!, p) = 1. Entonces, por la propiedad 6 de las congruencias (ver epígrafe 5.2.) de [*], se llega a x p-1 º 1 (mód p) c.s.q.d.

TEMARIO DE MATEMÁTICAS. PRUEBA A

97

TEMA

5 El número racional

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

100

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

EL CONJUNTO DE LOS NÚMEROS RACIONALES

3.

REPRESENTACIÓN GEOMÉTRICA DE LOS NÚMEROS RACIONALES 3.1. Representación gráfica de las clases de equivalencia

4.

ADICIÓN DE NÚMEROS RACIONALES 4.1. Propiedades de la adición de números racionales

5.

MULTIPLICACIÓN DE NÚMEROS RACIONALES 5.1. Propiedades de la multiplicación de números racionales

6.

EL CUERPO DE LOS NÚMEROS RACIONALES

7.

ORDEN EN EL CUERPO DE LOS NÚMEROS RACIONALES 7.1. Relación de orden en el cuerpo de los números racionales 7.2. Propiedades de la ordenación en Q

8.

VALOR ABSOLUTO DE LOS NÚMEROS RACIONALES

9.

LOS NÚMEROS RACIONALES COMO AMPLIACIÓN DE LOS ENTEROS EL CONJUNTO DE LOS NÚMEROS RACIONALES ES NUMERABLE

10.

10.

EL CONJUNTO DE LOS NÚMEROS RACIONALES ES NUMERABLE LOS NÚMEROS RACIONALES COMO AMPLIACIÓN DE LOS ENTEROS

9.

VALOR ABSOLUTO DE LOS NÚMEROS RACIONALES

8.

ORDEN EN EL CUERPO DE LOS NÚMEROS RACIONALES 7.1. Relación de orden en el cuerpo de los números racionales 7.2. Propiedades de la ordenación en Q

7.

EL CUERPO DE LOS NÚMEROS RACIONALES

6.

MULTIPLICACIÓN DE NÚMEROS RACIONALES 5.1. Propiedades de la multiplicación de números racionales

5.

ADICIÓN DE NÚMEROS RACIONALES 4.1. Propiedades de la adición de números racionales

4.

REPRESENTACIÓN GEOMÉTRICA DE LOS NÚMEROS RACIONALES 3.1. Representación gráfica de las clases de equivalencia

3.

EL CONJUNTO DE LOS NÚMEROS RACIONALES

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

100

El número racional

1. INTRODUCCIÓN Las fracciones, o números racionales, son más antiguas que los números negativos. Aparecen en los más antiguos textos matemáticos y fueron discutidos extensamente nada menos que en el año 1550 a.C. en el papiro Rhind de Egipto. El modo actual de escribir las fracciones (por ejemplo 2/3, 5/6, 4/17) y también el modo actual de hacer aritmética con ellas datan de los siglos XV y XVI. En el dominio de integridad ( Z,+,×) de los números enteros no existe solución de la ecuación ax = b, a ¹ 0, a,b Î Z salvo en el caso particular de que a sea un divisor de b. Es por ello que para encontrar una solución a la misma en todos los casos debemos ampliar el conjunto de los enteros. Primeramente extenderemos Z y con posterioridad estructuraremos el nuevo conjunto obtenido.

2. EL CONJUNTO DE LOS NÚMEROS RACIONALES En Z la operación inversa de la multiplicación, la división, no es siempre posible. Vamos pues a extender Z por el procedimiento de simetrización aplicado a la multiplicación. Todos los elementos de Z no son regulares; suprimamos el elemento no regular 0 y sea Z* el nuevo conjunto obtenido, es decir, el conjunto de todos los enteros excepto el cero. Consideremos Z x Z* , es decir los pares (a,b) donde a Î Z y b Î Z*. Este par se denomina fracción y se escribe usualmente a/b, donde a es el numerador y b el denominador. En este conjunto consideremos la relación R definida del siguiente modo: (a,b) R (c,d) significa que a · d = b · c. Demostraremos que R así definida es una relación de equivalencia, para lo que debe cumplir las propiedades reflexiva, simétrica y transitiva:



Reflexiva: Para todo (a,b) perteneciente a Z x Z*, se verifica que (a,b) R (a,b). Esto es evidente ya que a · b = b · a, basándonos en la propiedad conmutativa del conjunto de los números enteros. Dicho de otra manera, toda fracción es equivalente a sí misma.



Simétrica: Para todos (a,b), (c,d), pertenecientes a Z x Z* si (a,b) R (c,d), entonces (c,d) R (a,b). En efecto si (a,b) R (c,d), se verifica que a · d = b · c, que es lo mismo que escribir que c · b = d · a (aplicando la propiedad conmutativa de los enteros), lo cual equivale a que (c,d) R (a,b).



Transitiva: Para todos (a,b), (c,d), (e,f), pertenecientes a Z x Z* si (a,b) R (c,d), y (c,d) R (e,f), entonces (a,b) R (e,f). En efecto si (a,b) R (c,d) y (c,d) R (e,f), se verifica que a · d = b · c y c · f = d · e. Entonces a · d · f = = b · c· f = b · d · e, de donde a · d · f = b · d · e y por ser d ¹ 0 al pertenecer a Z* y Z dominio de integridad, si dividimos por d ambos miembros de la igualdad nos queda a · f = b · e, lo que equivale a (a,b) R (e,f). Por tanto R al ser una relación de equivalencia produce en Z x Z* una clasificación en clases de equivalencia. Al conjunto Z x Z*/R, le llamaremos conjunto de los números racionales y lo denotaremos por Q. Se llama número racional a cada una de las clases de equivalencia. ìa ü Designamos por í ý a la clase que contiene al elemento (a,b) Î Z x Z* îb þ y por

ìa ü a a un representante del número racional o clase í ý. îb þ b

Veamos algunas propiedades inmediatas de la definición de número racional. Proposición 1. Si h es un número entero distinto de cero, entonces

a) b)

a a ×h R . b b×h

Para que esto ocurra es necesario que se cumplan dos cosas a · b · h = b · a · h, cosa cierta aplicando la conmutatividad de los enteros. b · h ¹ 0, que también ocurre al ser b ¹ 0 y h ¹ 0 (Z dominio de integridad).

TEMARIO DE MATEMÁTICAS. PRUEBA A

101

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Pero a es primo con b y divide a a 1× b, por lo que debe dividir a a1 (Teorema de Euclides). a1 pa = . b1 pb Por lo tanto se tiene que a1 = p ×a y b1 = p × b, de donde

1.

102

CONSECUENCIAS

Todo número racional tiene representantes con denominador positivo.

En efecto, a sea con b perteneciente a los enteros negativos un representante de un número racional. b Entonces, aplicando la proposición 1, y multiplicando por -1 el numerador y denominador de dicho representante, tendremos que

pa a Todas las fracciones de la clase a son de la forma , siendo fracción irreducible de dicha clase y pb b p un entero cualquiera de Z*. a1 a1 a un representante cualquiera de la clase a; entonces R ,es decir a1× b = b1×a b1 b1 b Sea

5.

a a × (-1) a1 R = , donde b' pertenecerá a los enteros positivos en virtud de la regla de los signos de Z. b b × (-1) b1

sea d = m.c.d.(a’,b’), entonces a’ = a · d y b’ = b · d, donde a y b son primos entre sí. a' a ×d a Luego = R . b' b ×d b A este representante se le llama fracción irreducible y se adopta por representante canónico de un número racional, a su representante que sea fracción irreducible con denominador positivo. 2.

Dados dos números racionales siempre tienen representantes con el mismo denominador positivo. En efecto, a c sean y representantes de dos números racionales, tal que m.c.m.(b,d) = m; b d

a Todo número racional tiene un representante tal que a y b son primos entre sí. b En efecto, a' un representante de un número racional a y b' sea

entonces m = b · b’, m = d · d’, siendo b’ y d’ primos entre sí. a a × b' a' c c×d' c' Entonces R = y R = . b b × b' m d d ×d' m Por lo tanto hemos encontrado dos representantes de dichos números racionales que tienen el mismo denominador (m), siendo sus numeradores números enteros por la propiedad de la operación interna del producto en Z. Esto equivale en el lenguaje matemático tradicional a decir que, dados dos números racionales, siempre es posible encontrar representantes de los mismos que tienen el mismo denominador (reducir a común denominador). 4. 3.

Dados dos números racionales cualesquiera siempre es posible encontrar representantes con el mismo numerador positivo (Esto equivale a calcular el menor numerador común y la demostración es equivalente a la consecuencia 2). entonces m = b · b’, m = d · d’, siendo b’ y d’ primos entre sí. a a × b' a' c c×d' c' Entonces R = y R = . b b × b' m d d ×d' m Por lo tanto hemos encontrado dos representantes de dichos números racionales que tienen el mismo denominador (m), siendo sus numeradores números enteros por la propiedad de la operación interna del producto en Z. Esto equivale en el lenguaje matemático tradicional a decir que, dados dos números racionales, siempre es posible encontrar representantes de los mismos que tienen el mismo denominador (reducir a común denominador). 3.

Dados dos números racionales cualesquiera siempre es posible encontrar representantes con el mismo numerador positivo (Esto equivale a calcular el menor numerador común y la demostración es equivalente a la consecuencia 2).

4.

Todo número racional tiene un representante

a tal que a y b son primos entre sí. b

En efecto, a' sea un representante de un número racional a y b'

En efecto, a c y representantes de dos números racionales, tal que m.c.m.(b,d) = m; b d sean

sea d = m.c.d.(a’,b’), entonces a’ = a · d y b’ = b · d, donde a y b son primos entre sí. a' a ×d a Luego = R . b' b ×d b A este representante se le llama fracción irreducible y se adopta por representante canónico de un número racional, a su representante que sea fracción irreducible con denominador positivo. 2.

Dados dos números racionales siempre tienen representantes con el mismo denominador positivo. a a × (-1) a1 R = , donde b' pertenecerá a los enteros positivos en virtud de la regla de los signos de Z. b b × (-1) b1

5.

Todas las fracciones de la clase a son de la forma

pa a , siendo fracción irreducible de dicha clase y pb b

En efecto, a sea con b perteneciente a los enteros negativos un representante de un número racional. b Entonces, aplicando la proposición 1, y multiplicando por -1 el numerador y denominador de dicho representante, tendremos que p un entero cualquiera de Z*. a a a Sea 1 un representante cualquiera de la clase a; entonces 1 R ,es decir a1× b = b1×a b1 b1 b

1.

Pero a es primo con b y divide a a 1× b, por lo que debe dividir a a1 (Teorema de Euclides). a pa Por lo tanto se tiene que a1 = p ×a y b1 = p × b, de donde 1 = . b1 pb

Todo número racional tiene representantes con denominador positivo. CONSECUENCIAS

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

102

El número racional

Proposición 2. Las fracciones del tipo

0 forman una clase, es decir, un número racional. b

En efecto 0 a R equivale a que 0 · c = b · a o sea b · a = 0 y como b ¹ 0, obligatoriamente a = 0. b c El conjunto de todas las fracciones con el numerador nulo es el número racional cero. (Para ser fracción se presupone que el denominador es un entero distinto de cero) a Proposición 3. Las fracciones de la forma , constituyen una clase, es decir, un número racional. a En efecto, a b R equivale a que a · c = a · b, con lo que al ser a ¹ 0 entonces b = c. a c El conjunto de todas las fracciones con igual numerador que denominador forman el número racional uno.

3. REPRESENTACIÓN GEOMÉTRICA DE LOS NÚMEROS RACIONALES Sobre una recta tomemos un punto O como origen que representa a la clase {0}. Elijamos un segmento como unidad de longitud y llevémoslo sucesivamente tanto a derecha como a izquierda. Los puntos de división representan los números enteros, los positivos a la derecha de O y los negativos a la izquierda. u -4

Figura 1.

-3

-2

-1

0

1

2

3

4

ìa ü Para representar las fracciones de denominador n, es decir, funciones de la clase í ý, dividimos cada în þ uno de los segmentos de longitud unidad en n partes iguales, y se lleva (a la derecha o a la izquierda, según proceda) a veces n. Existe una forma geométrica de dividir la unidad en n partes. Esta consiste en trazar un segmento auxiliar con origen en el origen de la unidad y dibujar en ese segmento n partes iguales. Después se une el final de ese segmento con el final de la unidad y se trazan rectas paralelas a ella. 1 Los puntos donde estas rectas corten a la unidad estarán distanciados en . n 3 Como ejemplo representaremos el número racional 5 Figura 2.

0

1/5

2/5

3/5

4/5

1

Dados dos números racionales, siempre el mayor está a la derecha del menor. La propiedad más notable de este conjunto de puntos es que es denso en toda la recta; esto quiere decir que hay siempre infinitos puntos racionales interiores a todo intervalo, por pequeño que sea. TEMARIO DE MATEMÁTICAS. PRUEBA A

103

Volumen I. Matemáticas

104

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

igualdad que es evidente.

3.1. Representación gráfica de las clases de equivalencia

Desarrollando: a’bqq’ + ab’ qq’ = bb’ pq’ + bb’ p’ q Si aplicamos (1) y (2), llegamos a b’ p’ bq + bpb’ q’ = bb’ pq’ + bb’ p’ q

Si representamos en forma cartesiana el conjunto Z x Z*, de forma que Z esté situado en el eje horizontal y Z* en el eje vertical, todo elemento (a,b) Î Z x Z* vendrá determinado por un punto del plano, salvo los puntos pertenecientes al eje horizontal ya que 0 Î Z* no puede tomarse dicho valor en el eje vertical. Como Q = Zx Z* / R, cada una de sus clases de equivalencia (o lo que es lo mismo, cada número racional) vendrá determinada por una recta que pasa por el origen pero sin contenerlo. De todos los puntos del producto cartesiano (representantes de cada número racional), el que esté más cerca del origen será el representante canónico de esa clase de equivalencia. Así: Q: Es el haz de líneas que pasan por el origen sin contenerlo Z x Z*:Puntos del plano, representantes de cada clase de equivalencia o recta (número racional) en la que están contenidos.

0

1/2

1

Para que esto ocurra se deberá cumplir que (a’b + ab’) · qq’ = bb’ · (pq’ + p’q) Tendremos que demostrar que –2

ab'+a'b pq'+p'q . R bb' qq'

a' p' y representantes de b se verifica que a’ · q’ = b’ · p’ (2) b' q'

al ser

a p y representantes de a se verifica que a · q = b · p (1) y b q

Al ser

Comprobaremos que este número así obtenido es representante de la misma clase de equivalencia que el primero. Figura 3.

ì pq'+p'q ü ý Formemos el número racional al igual que en el párrafo anterior í î qq' þ

4. ADICIÓN DE NÚMEROS RACIONALES

Comprobaremos que tomando otros representantes de esos números racionales el número racional formado es el mismo. p p' y otros representantes de los números racionales a y b. q q' Sean

Sean a y b dos números racionales y a a' sean y dos representantes (fracciones) de dichos números. b b' ìab'+a'b ü ý (Nótese que bb’ ¹ 0 al ser b ¹ 0 y b’¹ 0). Formemos el número racional í î bb' þ

Sean a y b dos números racionales y a a' sean y dos representantes (fracciones) de dichos números. b b' ìab'+a'b ü ý (Nótese que bb’ ¹ 0 al ser b ¹ 0 y b’¹ 0). Formemos el número racional í î bb' þ

Comprobaremos que tomando otros representantes de esos números racionales el número racional formado es el mismo. p p' Sean y otros representantes de los números racionales a y b. q q'

4. ADICIÓN DE NÚMEROS RACIONALES

ì pq'+p'q ü ý Formemos el número racional al igual que en el párrafo anterior í î qq' þ

Si representamos en forma cartesiana el conjunto Z x Z*, de forma que Z esté situado en el eje horizontal y Z* en el eje vertical, todo elemento (a,b) Î Z x Z* vendrá determinado por un punto del plano, salvo los puntos pertenecientes al eje horizontal ya que 0 Î Z* no puede tomarse dicho valor en el eje vertical. Como Q = Zx Z* / R, cada una de sus clases de equivalencia (o lo que es lo mismo, cada número racional) vendrá determinada por una recta que pasa por el origen pero sin contenerlo. De todos los puntos del producto cartesiano (representantes de cada número racional), el que esté más cerca del origen será el representante canónico de esa clase de equivalencia. Así: Q: Es el haz de líneas que pasan por el origen sin contenerlo Z x Z*:Puntos del plano, representantes de cada clase de equivalencia o recta (número racional) en la que están contenidos.

Figura 3.

Comprobaremos que este número así obtenido es representante de la misma clase de equivalencia que el primero. Al ser

a p y representantes de a se verifica que a · q = b · p (1) y b q

al ser

a' p' y representantes de b se verifica que a’ · q’ = b’ · p’ (2) b' q' –2

Tendremos que demostrar que

ab'+a'b pq'+p'q . R bb' qq'

Para que esto ocurra se deberá cumplir que (a’b + ab’) · qq’ = bb’ · (pq’ + p’q)

1

Desarrollando:

a’bqq’ + ab’ qq’ = bb’ pq’ + bb’ p’ q Si aplicamos (1) y (2), llegamos a b’ p’ bq + bpb’ q’ = bb’ pq’ + bb’ p’ q igualdad que es evidente. 0

1/2

3.1. Representación gráfica de las clases de equivalencia CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

104

El número racional ìab'+a'b ü ý obtenido a partir de a y b, no depende de los representantes elegidos de a y b. Así, el número í î bb' þ A este número se le llama suma de a con b (en este orden) y se denota por a + b, y a la operación de atribuir a cada dos números racionales su suma, se le llama adición de números racionales.

4.1. Propiedades de la adición de números racionales Comprobaremos que la adición de números racionales tiene las mismas propiedades que la adición de enteros, que son las que caracterizan a los grupos conmutativos o abelianos. Para facilitar la demostración de las propiedades que enumeraremos y basándonos en la uniformidad de la adición (la suma no depende del representante elegido), operaremos con representantes de las clases de igual denominador. Apliquemos a los mismos la definición de suma. Tomemos pues dos fracciones con el mismo denominador a b y c c y le aplicamos la definición de suma,con lo que nos queda ac+ bc . c×c Si aplicamos la proposición 1 y simplificamos el numerador y denominador por c, la fracción que nos queda es a+b . c Por lo tanto podemos afirmar que para sumar fracciones que tienen el mismo denominador basta con sumar los numeradores y dejar ese denominador.



Operación interna. Se cumple por la propia definición de la adición al quedarnos el denominador distinto de cero.



Propiedad asociativa. Dados tres números racionales arbitrarios a, b, y g se verifica que a + (b + g) = (a + b) + g ìaü ìbü ìcü Sean a = í ý, b = í ý y g = í ý. îd þ îd þ îd þ Entonces: ìa ü æì b ü ì c üö ìa ü ì b +cü ìa + (b + c)ü ý= ý= í a + ( b + g) = í ý+çí ý+ í ý÷= í ý+ í þ îd þ èîd þ îd þø îd þ î d þ î d ì (a + b)+ c ü ìa + b ü ì c ü æìa ü ì b üö ì c ü ý+ í ý = çí ý+ í ý÷+ í ý = ( a + b ) + g ý= í =í þ î d þ îd þ èîd þ îd þø îd þ î d Para realizar las operaciones anteriores nos hemos basado en la asociatividad del conjunto de los enteros.



Propiedad conmutativa. Dados dos números racionales arbitrarios a y b se verifica que a + b = = b + a. Si utilizamos las mismas fracciones que en la propiedad asociativa, y aplicando la conmutatividad de los números enteros, tendremos que: ìa ü ì b ü ìa + b ü ì b + a ü ì b ü ìa ü ý = í ý+ í ý = b + a ý= í a + b =í ý+ í ý = í îd þ îd þ î d þ î d þ îd þ îd þ

TEMARIO DE MATEMÁTICAS. PRUEBA A

105

Volumen I. Matemáticas

106

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA



Elemento neutro. Habrá que demostrar la existencia de un número racional w, tal que a + w = w + a = a, cualesquiera que sea a. Por verificarse la propiedad conmutativa bastará probar la existencia sólo por un lado. ìa ü ìzü Sea a = í ý y tomamos de w = í ý un representante con el mismo denominador que a. îb þ îb þ

Es inmediato comprobar que por este mecanismo se obtiene un número racional independiente de las fracciones tomadas en a y b. A este racional le llamaremos producto de a por b (en este orden) y le denotaremos por a × b. A la operación de atribuir a cada par de números racionales su producto, le llamaremos multiplicación de números racionales.

ìa × a' ü ý lo cual tiene sentido al ser b × b' ¹ 0 í î b × b'þ

Si aplicamos la igualdad por la derecha, tendremos que ìa ü ì z ü ìa + z ü ìa ü ý= í ý a + w = í ý+ í ý = í îb þ îb þ î b þ îb þ

Tomemos arbitrariamente las fracciones

a a' Î a y Î b y consideremos el nuevo número racional b b'

Sean a y b dos números racionales.

Para que se verifique esta última igualdad debe cumplirse que a + z = a de donde z = 0. ì 0ü Así pues w = í ý, que según la proposición 2 es el número racional cero. îb þ

5. MULTIPLICACIÓN DE NÚMEROS RACIONALES



Elemento simétrico. Dado un número racional a, se trata de ver si existe otro número racional –a que llamaremos opuesto o simétrico de a de forma que a + (– a ) = (– a ) + a = 0 (siendo 0 el elemento neutro de la suma). Al cumplirse la propiedad conmutativa bastará probar la existencia por un solo lado. ìa ü ì xü Sea a = í ý y tomamos de – a= í ý un representante con el mismo denominador que a. îb þ îb þ

Al número b+( – a) se le llama diferencia entre b y a, y se representa por b – a. Fácilmente se puede ver que la operación diferencia es una operación interna en Q, pero que no cumple la propiedad conmutativa.

( – a) + a+x =( – a)+ b ® 0+x =( – a)+ b ® x = b+( – a)

Por cumplir las anteriores propiedades el conjunto Q de los números racionales es un grupo abeliano aditivo. Se representa por (Q,+). Así, dados dos números racionales a y b al ser Q un grupo aditivo, la ecuación a + x = b siempre admite solución en Q, pues sumando – a a ambos miembros, tendríamos Si aplicamos la igualdad de la derecha tendremos que ìa ü ì xü ìa + xü ì 0ü ý= í ý a + (– a ) = í ý+ í ý = í îb þ îb þ î b þ îb þ

Para que se verifique esta última igualdad debe cumplirse que a + x = 0, de donde x = –a. ìa ü ì– a ü Así, un representante del opuesto de a = í ý sería í ý îb þ î b þ

Para que se verifique esta última igualdad debe cumplirse que a + x = 0, de donde x = –a. ìa ü ì– a ü Así, un representante del opuesto de a = í ý sería í ý îb þ î b þ Si aplicamos la igualdad de la derecha tendremos que ìa ü ì xü ìa + xü ì 0ü ý= í ý a + (– a ) = í ý+ í ý = í îb þ îb þ î b þ îb þ

Por cumplir las anteriores propiedades el conjunto Q de los números racionales es un grupo abeliano aditivo. Se representa por (Q,+). Así, dados dos números racionales a y b al ser Q un grupo aditivo, la ecuación a + x = b siempre admite solución en Q, pues sumando – a a ambos miembros, tendríamos

Elemento simétrico. Dado un número racional a, se trata de ver si existe otro número racional –a que llamaremos opuesto o simétrico de a de forma que a + (– a ) = (– a ) + a = 0 (siendo 0 el elemento neutro de la suma). Al cumplirse la propiedad conmutativa bastará probar la existencia por un solo lado. ìa ü ì xü Sea a = í ý y tomamos de – a= í ý un representante con el mismo denominador que a. îb þ îb þ

( – a) + a+x =( – a)+ b ® 0+x =( – a)+ b ® x = b+( – a)

Al número b+( – a) se le llama diferencia entre b y a, y se representa por b – a. Fácilmente se puede ver que la operación diferencia es una operación interna en Q, pero que no cumple la propiedad conmutativa.



Para que se verifique esta última igualdad debe cumplirse que a + z = a de donde z = 0. ì 0ü Así pues w = í ý, que según la proposición 2 es el número racional cero. îb þ

5. MULTIPLICACIÓN DE NÚMEROS RACIONALES Sean a y b dos números racionales.

Si aplicamos la igualdad por la derecha, tendremos que ìa ü ì z ü ìa + z ü ìa ü ý= í ý a + w = í ý+ í ý = í îb þ îb þ î b þ îb þ

Tomemos arbitrariamente las fracciones

ìa × a' ü ý lo cual tiene sentido al ser b × b' ¹ 0 í î b × b'þ

a a' Î a y Î b y consideremos el nuevo número racional b b'

Elemento neutro. Habrá que demostrar la existencia de un número racional w, tal que a + w = w + a = a, cualesquiera que sea a. Por verificarse la propiedad conmutativa bastará probar la existencia sólo por un lado. ìa ü ìzü Sea a = í ý y tomamos de w = í ý un representante con el mismo denominador que a. îb þ îb þ

Es inmediato comprobar que por este mecanismo se obtiene un número racional independiente de las fracciones tomadas en a y b. A este racional le llamaremos producto de a por b (en este orden) y le denotaremos por a × b. A la operación de atribuir a cada par de números racionales su producto, le llamaremos multiplicación de números racionales.



CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

106

El número racional

5.1. Propiedades de la multiplicación de números racionales Operación interna. Para todo par de números racionales a y b, su producto también es racional. Esto es evidente por la propia definición del producto al ser el denominador distinto de cero y tener la propiedad uniforme de no depender dicha definición de las fracciones escogidas.



Propiedad asociativa. ìa'' ü ìa' ü ìa ü Sean a = í ý, b = í ý y g =í ý tres números racionales arbitrarios. î b''þ î b'þ îb þ Entonces se verifica que a × ( b × g) = ( a × b) × g En efecto ya que ìa ü æìa' ü ìa'' üö ìa ü ìa × ' a ''ü ì a × (a'×a '' ) ü ý= í ý= a ×( b + g) = í ý×çí ý×í ý÷= í ý×í î b þ èî b'þ î b''þø î b þ î b'×b''þ î b ×( b'×b'') þ

.

ì (a ×a ' )×a ''ü ìa ×a 'ü ìa'' ü æìa ü ìa' üö ìa'' ü ý×í ý = çí ý×í ý÷×í ý = ( a × b) × g ý= í =í î( b × b') × b ''þ î b × b'þ î b''þ èî b þ î b'þø î b''þ Hemos aplicado la propiedad asociativa del conjunto de los enteros.



Propiedad conmutativa. ìa ü ìa' ü Sean a = í ý y b = í ý dos números racionales cualesquiera. îb þ î b'þ Entonces se verifica que a · b = b · a En efecto ya que ìa ü ìa' ü ì a ×a' ü ì a'×a ü ìa' ü ìa ü ý= í ý= í ý× í ý= b × a a × b = í ý× í ý = í î b þ î b'þ î b × b'þ î b'×b þ î b'þ î b þ Hemos aplicado la propiedad conmutativa del conjunto de los enteros.



Elemento neutro o unidad. ìa ü ìu ü Dado un número racional a = í ý se trata de ver si existe un racional u = í ý tal que îb þ îv þ a×u = u ×a= a Por verificarse la propiedad conmutativa, bastará probar su existencia por un lado. Si existe u, se verificará que ìa ü ì u ü ìa × u ü ìa ü ý= í ý a × u = í ý× í ý= í îb þ îv þ îb × v þ îb þ Para que esto ocurra se verificará que a × u × b =b × v × a o lo que es lo mismo u = v. Así el elemento neutro del producto será la clase de fracciones que tienen el numerador y el deì u ü ì1ü nominador igual u = í ý = í ý y que según la proposición 3 es el número racional uno. î u þ î1þ A partir de ahora lo llamaremos 1.



Elemento simétrico o inverso. ìa ü ìa' ü Dado un número racional a = í ý se trata de ver si existe un racional a –1 = í ý tal que a · a–1 = îb þ î b'þ = a–1 · a = 1 Por verificarse la propiedad conmutativa, bastará probar su existencia por un lado.

TEMARIO DE MATEMÁTICAS. PRUEBA A

107

Volumen I. Matemáticas

108

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Evidentemente esta definición no depende del representante elegido. En caso contrario, esto es si a × b Ï Z+ y a ¹ 0 diremos que a es racional negativo.

ìa ü ìa' ü ì a ×a' ü ì1ü ý= í ý Si existe a –1 , se verificará que a × a –1 = í ý × í ý = í î b þ î b'þ î b × b'þ î1þ

Vamos a establecer una relación de orden total en Q. Esta ha de ser compatible con la definida en Z al considerar Z un subconjunto de Q. Definición. ìa ü Se dice que un número racional a = í ý es positivo, cuandoa × b Î Z+ (o lo que es lo mismoa × b> 0). îb þ

Para que esto ocurra se verificará que a ×a ' = b × b '. Esta ecuación se verifica para a' = b y b' = a . ìa ü ìb ü Así pues el inverso de un número racional í ý será í ý. Pero para que esto ocurra, es necesario îb þ îa þ que a ¹ 0, ya que si no este último número no sería racional. Así pues esto nos asegura la existencia de inverso para todo número de Q, excepto para el 0. Si llamamos Q* = Q – {0}, el conjunto Q* con la operación de multiplicar es un grupo abeliano, mientras que Q con dicha operación es un semigrupo abeliano con elemento unidad. Relacionando la suma y la multiplicación se verifica al igual que en el conjunto de los enteros la

7. ORDEN EN EL CUERPO DE LOS NÚMEROS RACIONALES a–1 · a · x1 = a–1 · a · x2 ® 1 · x1 = 1 · x2 ® x1 = x2 Así la solución debe ser única.



Propiedad distributiva de la multiplicación respecto a la adición. ìa ü ìa' ü ìa'' ü Sean a = í ý, b = í ý y g = í ý tres números racionales arbitrarios. îb þ î b'þ î b''þ

a–1 · a · x = a–1 · b ® 1 · x = a –1 · b ® x = a–1 · b Veremos que la solución es única. Para ello supongamos que existen dos soluciones distintas x1 y x2. Por ser soluciones se verificará que a × x1 = b y a × x2 = b. Al ser iguales los segundos miembros serán también iguales los primeros. Así a × x1 = a × x2. Si multiplicamos ambos miembros por a–1 tendremos: Entonces se verifica que a · (b + g) = a · b + a · g. En efecto ya que

Cuando en un conjunto tal como el Q se han definido dos operaciones binarias como la adición y multiplicación de racionales, que cumplen las propiedades enumeradas anteriormente, se dice que se ha dado a ese conjunto la estructura algebraica de cuerpo conmutativo. En Q la operación de restar siempre es posible: restar del número racional a el número racional b, significará, por definición, sumar a con el opuesto de b. Análogamente dividir el racional a entre el racional b, supuesto b ¹ 0, significará multiplicar a por el inverso de b. Así podemos decir que cualesquiera que sean los números racionales a ¹ 0 y b, la ecuación a · x = b tiene siempre solución única en Q. En efecto si a · x = b, multiplicamos ambos miembros por a–1, quedando ìa ü æìa' ü ìa'' üö ìa ü ìa × ' b ''+b'×a''ü ìa × (a'×b ''+b'×a'' )ü ìa × a '× b '' + a × b '× a''ü ý= í ý= í ý= a ×( b + g) = í ý×çí ý+ í ý÷= í ý×í î b þ èî b'þ î b''þø î b þ î b'×b'' þ î þ b × b× ' b'' þ î b × b' × b''

ìa ×a ' × b '' ü ìa × b' × a''ü ì a ×a' ü ì a ×a'' ü ìa ü ìa' ü ìa ü ìa'' ü ý= í ý×í ý+ í ý×í ý = a × b + a × g ý+í ý= í ý+ í =í î b × b' × b''þ î b × b'× b'' þ î b × b'þ î b × b''þ î b þ î b'þ î b þ î b''þ

6. EL CUERPO DE LOS NÚMEROS RACIONALES

6. EL CUERPO DE LOS NÚMEROS RACIONALES

Cuando en un conjunto tal como el Q se han definido dos operaciones binarias como la adición y multiplicación de racionales, que cumplen las propiedades enumeradas anteriormente, se dice que se ha dado a ese conjunto la estructura algebraica de cuerpo conmutativo. En Q la operación de restar siempre es posible: restar del número racional a el número racional b, significará, por definición, sumar a con el opuesto de b. Análogamente dividir el racional a entre el racional b, supuesto b ¹ 0, significará multiplicar a por el inverso de b. Así podemos decir que cualesquiera que sean los números racionales a ¹ 0 y b, la ecuación a · x = b tiene siempre solución única en Q. En efecto si a · x = b, multiplicamos ambos miembros por a–1, quedando ìa ×a ' × b '' ü ìa × b' × a''ü ì a ×a' ü ì a ×a'' ü ìa ü ìa' ü ìa ü ìa'' ü ý= í ý×í ý+ í ý×í ý = a × b + a × g ý+í ý= í ý+ í =í î b × b' × b''þ î b × b'× b'' þ î b × b'þ î b × b''þ î b þ î b'þ î b þ î b''þ

ü ü ì ü ì ì ü æì ü ì üö ì ü ì a a' a'' a ' '' a ' b '' b' a'' a × (a' × b '' + b' × a'' ) × × + × × × + × a a b a b ' a'' ý= í ý= í ý= a ×( b + g) = í ý×çí ý+ í ý÷= í ý×í î b þ èî b'þ î b''þø î b þ î b'×b'' þ î þ b × b× ' b'' þ î b × b' × b'' Entonces se verifica que a · (b + g) = a · b + a · g. En efecto ya que

a–1 · a · x = a–1 · b ® 1 · x = a –1 · b ® x = a–1 · b Veremos que la solución es única. Para ello supongamos que existen dos soluciones distintas x1 y x2. Por ser soluciones se verificará que a × x1 = b y a × x2 = b. Al ser iguales los segundos miembros serán también iguales los primeros. Así a × x1 = a × x2. Si multiplicamos ambos miembros por a–1 tendremos:



Propiedad distributiva de la multiplicación respecto a la adición. ì ü ì ü ìa'' ü a a' Sean a = í ý, b = í ý y g = í ý tres números racionales arbitrarios. îb þ î b'þ î b''þ

a–1 · a · x1 = a–1 · a · x2 ® 1 · x1 = 1 · x2 ® x1 = x2 Así la solución debe ser única.

Para que esto ocurra se verificará que a ×a ' = b × b '. Esta ecuación se verifica para a' = b y b' = a . ìa ü ìb ü Así pues el inverso de un número racional í ý será í ý. Pero para que esto ocurra, es necesario îb þ îa þ que a ¹ 0, ya que si no este último número no sería racional. Así pues esto nos asegura la existencia de inverso para todo número de Q, excepto para el 0. Si llamamos Q* = Q – {0}, el conjunto Q* con la operación de multiplicar es un grupo abeliano, mientras que Q con dicha operación es un semigrupo abeliano con elemento unidad. Relacionando la suma y la multiplicación se verifica al igual que en el conjunto de los enteros la

7. ORDEN EN EL CUERPO DE LOS NÚMEROS RACIONALES

Vamos a establecer una relación de orden total en Q. Esta ha de ser compatible con la definida en Z al considerar Z un subconjunto de Q. Definición. ìa ü Se dice que un número racional a = í ý es positivo, cuandoa × b Î Z+ (o lo que es lo mismoa × b> 0). îb þ ìa ü ìa' ü ì a ×a' ü ì1ü ý= í ý Si existe a –1 , se verificará que a × a –1 = í ý × í ý = í î b þ î b'þ î b × b'þ î1þ

Evidentemente esta definición no depende del representante elegido. En caso contrario, esto es si a × b Ï Z+ y a ¹ 0 diremos que a es racional negativo.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

108

El número racional

Proposición. Sea Q+ el subconjunto de Q formado por los racionales positivos. Entonces: a) 0 Ï Q+ b) Para todo a Î Q, se verifica una de las propiedades: a Î Q+ , a = 0, o – a Î Q+ c) Dados dos racionales a , b Î Q+ , tanto su suma como su producto pertenecen a Q+. Demostraremos las tres propiedades. ì 0ü a) Si 0 = í ý evidentemente 0 · 1 = 0, con lo que no cumple ser mayor que cero. Así 0 no pertenece î 1þ a Q+. ìa ü b) Sea a = í ý un elemento de Q. Por ser Z ordenado y poseer la propiedad de tricotomía se verifiîb þ can una de las tres condiciones: a · b > 0, o a · b = 0, o a · b < 0. Si a · b > 0, entonces a Î Q+ .

c)

ì 0ü ì 0ü Si a · b = 0, como b ¹ 0, obligatoriamente a = 0 y a = í ý = í ý = 0 (número racional î b þ î 1þ cero, según la proposición 2). Si a · b < 0 entonces –a · b > 0, con lo que –a Î Q+ . A estos números se les llaman racionales negativos y su conjunto se denota por Q–. ìa' ü ìa ü Sean a = í ý y b = í ý dos números racionales pertenecientes a Q+, por lo que se verifica que î b'þ îb þ a · b > 0 y a’ · b’ > 0. ì a × b ' + b × a 'ü ý. Si realizamos su suma tendremos a + b = í î b×b' þ Para que pertenezca a Q+, debe cumplirse (a · b’ + b · a’) · b · b’ > 0. Realizando operaciones tendremos a × b'×b × b'+b ×a'×b × b'= a × b ×( b') +b 2 ×a'b ' > 0 2

Esto es evidente ya que a×b> 0,( b ') > 0, b 2 > 0 y a '×b ' > 0 y la suma y producto de números enteros positivos es positivo. ì a × a 'ü ý. Si realizamos su producto a × b = í î b × b 'þ 2

Para que sea racional positivo debe cumplirse que a × a '×b × b ' > 0. Si aplicamos la conmutatividad en Z, tendremos que debe cumplirse a × b× a ' × b ' > 0 algo que evidentemente se cumple al ser a × b > 0 y a'×b' > 0 Podemos pues afirmar que dado un número racional o es racional positivo, o cero o racional negativo. Así Q = Q+ È {0} È Q–

7.1. Relación de orden en el cuerpo de los números racionales Dados dos números racionales a y b, definimos la relación £ (menor o igual) y decimos que a £ b (a es menor o igual que b) si b – a ³ 0. Si se cumple que a £ b, podemos decir que b ³ a (b es mayor o igual que a). Se define también la relación < (menor) y se dice que a < b (a es menor que b) si b – a > 0. Veremos que así definida la relación £ es una relación de orden al cumplir las propiedades:



Reflexiva. Para todo número racional a se verifica que a £ a. Es evidente ya que a – a = 0.



Antisimétrica. Para todo par de números racionales a y b que cumplan a £ b y b £ a, entonces a = b.

TEMARIO DE MATEMÁTICAS. PRUEBA A

109

Volumen I. Matemáticas

110

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En efecto si a £ b se verifica que b – a ³ 0 y si b £ a, entonces a – b ³ 0. Si sumamos tenemos que (b – a) + (a – b) = 0. Así el opuesto de (b – a) es (a – b), luego si estos números no fueran cero, uno pertenecería a los racionales positivos y otro a los racionales negativos, lo que contradice la hipótesis. Así a – b = 0 ® a = b. ü ì ( ü ì ü ì ì )ü × × × × b × c a c b c – a c c b – a ý=í ý³ 0, Si operamos, tendremos í 2 ý – í 2 ý = í þ î d2 îd þ îd þ î d2 þ

ì b ü ìa ü ì b –a ü ý ³ 0. Así pues d · (b – a) ³ 0 y al ser d>0, Por ser a £ b se verifica b – a ³ 0 ® í ý – í ý = í îd þ îd þ î d þ obligatoriamente (b – a) ³ 0. Queremos ver ahora que a · g £ b · g siendo g Î Q+, con lo que c >0. ì b ü ì c ü ìa ü ì c ü Para que ello ocurra debe cumplirse que í ý× í ý – í ý × í ý ³ 0. îd þ îd þ îd þ îd þ



Transitiva. Dados tres números racionales a, b y g, que verifiquen a £ b y b £ g, entonces se cumplirá que a £ g. Por ser a £ b se verifica b – a ³ 0 y si b £ g, entonces g – b ³ 0. Si sumamos ambas desigualdades, tendremos (b – a) + (g – b) ³ 0 ® b–a+g–b³0 ® g–a³0 ® a£ g La relación £ así definida es además de orden total pues todos los números racionales son comparables por dicha relación. En consecuencia Q con la relación £ es un conjunto totalmente ordenado y podemos representarlo mediante una cadena, que además es un retículo (conjunto ordenado tal que para cualquier par de elementos x e y pertenecientes al mismo, siempre existe el supremo y el ínfimo del conjunto {x, y }).

La relación de orden £ no es siempre compatible con el producto. (Sólo se conserva si se multiplica por un número racional positivo). Si a £ b, se verificará que a · g £ b · g si g Î Q+ y a · g ³ b · g si g Î Q– Demostraremos la primera e indicaremos cómo hacer la segunda. Para ello utilizaremos los representantes de los números racionales con el mismo denominador y positivo. ìc ü ìb ü ìa ü Si a = í ý, b= í ý y g = í ý tendremos: îd þ îd þ îd þ

2.

La relación de orden £ es compatible con la suma. Si a £ b, cualquiera que sea g, se cumple que a + g £ b + g. En efecto si a £ b se cumple que b – a ³ 0. Si se cumpliera que a + g £ b + g, tendría que ocurrir que (b + g) – (a + g) ³ 0 ® b + g – a – g³ 0 ® b – a ³ 0 cosa que evidentemente se cumple. La compatibilidad de la relación de orden £ con la suma podemos generalizarla de la siguiente forma. Si a £ b y g £ d, entonces a + g £ b + d. En efecto si a £ b y le aplicamos la primera propiedad con g, tendremos que a + g £ b + g. Análogamente si g £ d y le aplicamos la primera propiedad con b, tendremos que b + g £ b + d. Si aplicamos la propiedad transitiva de la relación £, tendremos que a + g £ b + d que es a lo que queríamos llegar. Por tanto (Q, +, £) es un grupo aditivo ordenado. Se denomina grupo aditivo ordenado de los números racionales.

1.

7.2. Propiedades de la ordenación en Q 1.

La relación de orden £ es compatible con la suma. Si a £ b, cualquiera que sea g, se cumple que a + g £ b + g. En efecto si a £ b se cumple que b – a ³ 0. Si se cumpliera que a + g £ b + g, tendría que ocurrir que (b + g) – (a + g) ³ 0 ® b + g – a – g³ 0 ® b – a ³ 0 cosa que evidentemente se cumple. La compatibilidad de la relación de orden £ con la suma podemos generalizarla de la siguiente forma. Si a £ b y g £ d, entonces a + g £ b + d. En efecto si a £ b y le aplicamos la primera propiedad con g, tendremos que a + g £ b + g. Análogamente si g £ d y le aplicamos la primera propiedad con b, tendremos que b + g £ b + d. Si aplicamos la propiedad transitiva de la relación £, tendremos que a + g £ b + d que es a lo que queríamos llegar. Por tanto (Q, +, £) es un grupo aditivo ordenado. Se denomina grupo aditivo ordenado de los números racionales.

7.2. Propiedades de la ordenación en Q

Transitiva. Dados tres números racionales a, b y g, que verifiquen a £ b y b £ g, entonces se cumplirá que a £ g. Por ser a £ b se verifica b – a ³ 0 y si b £ g, entonces g – b ³ 0. Si sumamos ambas desigualdades, tendremos (b – a) + (g – b) ³ 0 ® b–a+g–b³0 ® g–a³0 ® a£ g La relación £ así definida es además de orden total pues todos los números racionales son comparables por dicha relación. En consecuencia Q con la relación £ es un conjunto totalmente ordenado y podemos representarlo mediante una cadena, que además es un retículo (conjunto ordenado tal que para cualquier par de elementos x e y pertenecientes al mismo, siempre existe el supremo y el ínfimo del conjunto {x, y }). 2.

La relación de orden £ no es siempre compatible con el producto. (Sólo se conserva si se multiplica por un número racional positivo). Si a £ b, se verificará que a · g £ b · g si g Î Q+ y a · g ³ b · g si g Î Q– Demostraremos la primera e indicaremos cómo hacer la segunda. Para ello utilizaremos los representantes de los números racionales con el mismo denominador y positivo. ìc ü ìb ü ìa ü Si a = í ý, b= í ý y g = í ý tendremos: îd þ îd þ îd þ ì b ü ìa ü ì b –a ü ý ³ 0. Así pues d · (b – a) ³ 0 y al ser d>0, Por ser a £ b se verifica b – a ³ 0 ® í ý – í ý = í îd þ îd þ î d þ obligatoriamente (b – a) ³ 0. Queremos ver ahora que a · g £ b · g siendo g Î Q+, con lo que c >0. ì b ü ì c ü ìa ü ì c ü Para que ello ocurra debe cumplirse que í ý× í ý – í ý × í ý ³ 0. îd þ îd þ îd þ îd þ



En efecto si a £ b se verifica que b – a ³ 0 y si b £ a, entonces a – b ³ 0. Si sumamos tenemos que (b – a) + (a – b) = 0. Así el opuesto de (b – a) es (a – b), luego si estos números no fueran cero, uno pertenecería a los racionales positivos y otro a los racionales negativos, lo que contradice la hipótesis. Así a – b = 0 ® a = b. ì b ×c ü ìa ×c ü ì b ×c – a ×c ü ìc ×( b – a) ü ý=í ý³ 0, Si operamos, tendremos í 2 ý – í 2 ý = í þ î d2 îd þ îd þ î d2 þ

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

110

El número racional con lo que debe cumplirse que c · (b – a) · d2 ³ 0 que resulta evidente al ser c > 0, d2 > 0 y (b – a) ³ 0. La demostración de la segunda se hace de forma análoga tomando c < 0. 3.

En Q se verifica la propiedad arquimediana, es decir, dados los números racionales a > 0 y b cualquier número racional, existe siempre un número natural n, tal que n · a > b. La notación n · a signifiìn ü ca í ý × a î 1þ ìa ü ìb ü En efecto, elijamos en a y b dos fracciones que tengan positivo e igual denominador a = í ý y b = í ý. îd þ îd þ De la hipótesis a > 0, se deduce entonces que a > 0. En virtud de las propiedades del orden en Z y de la propiedad arquimediana de los números naturales existe un número natural n tal que b < n · a. Multiplicanì b ü ì n ×a ü ý. do por el entero positivo d esta desigualdad, tendremos b · d < n · a · d, lo cual expresa que í ý < í îd þ î d þ ì n ×a ü ì n ü ìa ü ìb ü ý = í ý × í ý = n × a, llegamos a la conclusión de que b < n · a, o lo que es lo Como í ý = b y í î d þ î 1 þ îd þ îd þ mismo n · a > b.

4.

Densidad del orden. Si a y b son dos números racionales tales que a < b, entonces existe otro número racional g tal que a < g < b. ìa ü ìb ü En efecto tomemos a = í ý y b = í ý. îd þ îd þ ìa + b ü ý que es la semisuma de los representantes de a y b, la demostración es trivial. Si tomamos g = í î 2d þ Una vez determinado g, podemos aplicar de nuevo el proceso entre g y b, demostrando así la existencia de otro número racional entre ambos y a la vez entre a y b. Reiterando el proceso se ve que entre dos números racionales existen infinitos números racionales. Por ello se dice que el orden en Q es denso. Es una propiedad del orden de Q, que no existe en N ni en Z, a consecuencia de la cual no puede hablarse del número racional anterior o siguiente a uno dado.

8. VALOR ABSOLUTO DE LOS NÚMEROS RACIONALES Los números racionales tal que a > 0, se llaman positivos; los números tal que a < 0 se llaman negativos y son justamente los opuestos de los positivos. El número 0 no se considera ni positivo ni negativo. Llamaremos valor absoluto del número racional al racional no negativo |a| = sup(a, –a). Se comprende entonces que si a > 0, |a| = a; si es a < 0, será |a| = –a, y finalmente |a| = 0 si y sólo si a = 0. Es claro por otra parte que |–a| = |a| cualquiera que sea a. Las propiedades que posee la aplicación valor absoluto son las mismas que verificaba el valor absoluto en Z, que son las siguientes: (para cualesquiera números racionales a y b) 1.

|a| ³ 0

2.

|a| = 0 si y sólo si a = 0

3.

|a + b| £ |a| + |b| (A esta propiedad se le llama desigualdad triangular)

4.

|a · b| = |a| · |b|

Las dos primeras propiedades resultan evidentes por la propia definición del valor absoluto. Para demostrar la tercera observemos que se tiene siempre que a £ |a|; en efecto, si a ³ 0 esta desigualdad se escribe a £ a, lo que es evidente por cumplir la propiedad reflexiva; si a < 0, la desigualdad se escribe a £ –a, es decir –a – (–a ) ³ 0, luego –2a ³ 0. (Evidente al ser a < 0). Sustituyendo a por –a , se tiene igualmente cualquiera que sea a, la desigualdad –a £ |a|, o bien |–a| £ a. Considerando las dos desigualdades, tendremos –|a| £ a £ |a| y –|b| £ b £ |b| sumando ambas desigualdades, llegamos a –|a| – |b| £ a + b £ |a| + |b| TEMARIO DE MATEMÁTICAS. PRUEBA A

111

Volumen I. Matemáticas

112

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si a + b ³ 0 se tiene |a + b| = a + b £ |a| + |b|. Si a + b £ 0, se tiene |a + b| = –a –b £ –(–|a| – |b|) = |a| + |b|. Así pues en ambos casos hemos llegado a que |a + b| £ |a| + |b| Para la demostración de 4, consideremos tres casos: a) Si a > 0 y b > 0, a · b > 0 y tendremos |a · b| = a · b = |a| · |b| b) Si a < 0 y b > 0, a · b < 0 con lo que |a · b| = –a · b = (–a) · b = |a| · |b| c) Si a < 0 y b < 0, a · b > 0 y tendremos |a · b| = a · b = (–a) · (–b) = |a| · |b|.

Sea Qk el conjunto de todas las fracciones de denominador k Î N. El subconjunto Q+k de todas las que tienen numerador positivo evidentemente es numerable. Del mismo modo, el conjunto Q–k de las que tienen numerador negativo es también numerable y como Qk = Q+k È {0}ÈQ–k resulta que Qk es un conjunto numerable. La reunión de conjuntos Q1,Q2,...,Qn,... será de nuevo un conjunto numerable y como Q está contenido en dicha reunión, resulta que el conjunto de los números racionales es numerable.

10. EL CONJUNTO DE LOS NÚMEROS RACIONALES ES NUMERABLE Si consideramos que N se puede identificar con Z+, lo que se traduce en que N Ì Z, podemos escribir N Ì Z Ì Q.

9. LOS NÚMEROS RACIONALES COMO AMPLIACIÓN DE LOS ENTEROS

El conjunto de los números racionales contiene un subconjunto que es isomorfo, algebraicamente y en cuanto al orden, al conjunto de los números enteros, es decir, existe un subconjunto de Q* de Q, formado por las ìn ü ìn ü clases í ý con n Î Z, tal que podemos establecer una aplicación biyectiva f : Z ® Q* definida por f(n) = í ý, î 1þ î 1þ tal que f(n + m) = f(n) + f(m) y f(m · n) = f(m) · f(n) y además conserve las estructuras de orden. Este conjunto Q* = Q – {0}. Comprobaremos que es biyectiva. Para ello veremos que es sobreyectiva e inyectiva. ìn ü En efecto es sobreyectiva ya que para todo elemento de Q*, í ý, existe n perteneciente a Z, tal que î 1þ ìn ü f(n)= í ý. î 1þ ì mü Así cada número racional í ý se identifica con el entero m del cual es imagen por el isomorfismo f. î 1þ

Así pues la aplicación f así definida es un isomorfismo. Por último veremos que conserva las estructuras de orden ya que si m < n en Z, f(m)< f(n) en Q*. ì mü ì n ü Si m < n, entonces í ý < í ý ® f(m) < f(n). î 1 þ î 1þ ì m× n ü ì mü ì n ü ý =í ý×í ý = f ( m)× f ( n ) y que f(m× n) = í î 1 þ î 1 þ î 1þ

m es distinto de n. ì m+ n ü ì mü ì n ü ý= í ý+í ý= f ( m)+ f ( n ) Vemos también que f (m + n) = í î 1 þ î 1 þ î 1þ

ì mü ì n ü También es inyectiva ya que si m ¹ n, entonces f(m) ¹ f(n), al ser distintas las clases í ý y í ý si î 1 þ î 1þ m es distinto de n. ì m+ n ü ì mü ì n ü ý= í ý+í ý= f ( m)+ f ( n ) Vemos también que f (m + n) = í î 1 þ î 1 þ î 1þ

ì mü ì n ü También es inyectiva ya que si m ¹ n, entonces f(m) ¹ f(n), al ser distintas las clases í ý y í ý si î 1 þ î 1þ

ìn ü f(n)= í ý. î 1þ

ì m× n ü ì mü ì n ü ý =í ý×í ý = f ( m)× f ( n ) y que f(m× n) = í î 1 þ î 1 þ î 1þ

El conjunto de los números racionales contiene un subconjunto que es isomorfo, algebraicamente y en cuanto al orden, al conjunto de los números enteros, es decir, existe un subconjunto de Q* de Q, formado por las ìn ü ìn ü clases í ý con n Î Z, tal que podemos establecer una aplicación biyectiva f : Z ® Q* definida por f(n) = í ý, î 1þ î 1þ tal que f(n + m) = f(n) + f(m) y f(m · n) = f(m) · f(n) y además conserve las estructuras de orden. Este conjunto Q* = Q – {0}. Comprobaremos que es biyectiva. Para ello veremos que es sobreyectiva e inyectiva. ìn ü En efecto es sobreyectiva ya que para todo elemento de Q*, í ý, existe n perteneciente a Z, tal que î 1þ Así pues la aplicación f así definida es un isomorfismo. Por último veremos que conserva las estructuras de orden ya que si m < n en Z, f(m)< f(n) en Q*. ì mü ì n ü Si m < n, entonces í ý < í ý ® f(m) < f(n). î 1 þ î 1þ

ì mü Así cada número racional í ý se identifica con el entero m del cual es imagen por el isomorfismo f. î 1þ

Si consideramos que N se puede identificar con Z+, lo que se traduce en que N Ì Z, podemos escribir N Ì Z Ì Q.

9. LOS NÚMEROS RACIONALES COMO AMPLIACIÓN DE LOS ENTEROS Si a + b ³ 0 se tiene |a + b| = a + b £ |a| + |b|. Si a + b £ 0, se tiene |a + b| = –a –b £ –(–|a| – |b|) = |a| + |b|. Así pues en ambos casos hemos llegado a que |a + b| £ |a| + |b| Para la demostración de 4, consideremos tres casos: a) Si a > 0 y b > 0, a · b > 0 y tendremos |a · b| = a · b = |a| · |b| b) Si a < 0 y b > 0, a · b < 0 con lo que |a · b| = –a · b = (–a) · b = |a| · |b| c) Si a < 0 y b < 0, a · b > 0 y tendremos |a · b| = a · b = (–a) · (–b) = |a| · |b|.

10. EL CONJUNTO DE LOS NÚMEROS RACIONALES ES NUMERABLE Sea Qk el conjunto de todas las fracciones de denominador k Î N. El subconjunto Q+k de todas las que tienen numerador positivo evidentemente es numerable. Del mismo modo, el conjunto Q–k de las que tienen numerador negativo es también numerable y como Qk = Q+k È {0}ÈQ–k resulta que Qk es un conjunto numerable. La reunión de conjuntos Q1,Q2,...,Qn,... será de nuevo un conjunto numerable y como Q está contenido en dicha reunión, resulta que el conjunto de los números racionales es numerable.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

112

TEMA

6 Números reales. Topología de la recta real

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

114

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

CONSTRUCCIÓN DEL CUERPO DE LOS NÚMEROS REALES

3.

EL CONJUNTO DE LOS NÚMEROS REALES

4.

DEFINICIÓN DE NÚMERO REAL

5.

ADICIÓN DE NÚMEROS REALES

6.

MULTIPLICACIÓN DE NÚMEROS REALES

7.

ORDENACIÓN EN EL CUERPO DE LOS NÚMEROS REALES

8.

ISOMORFISMO ENTRE Q Y UNA PARTE DE R

9.

VALOR ABSOLUTO DE LOS NÚMEROS REALES

10.

TOPOLOGÍA DE LA RECTA REAL

11.

LA RECTA REAL

12.

INTERVALOS Y ENTORNOS EN LA RECTA REAL. COTAS Y EXTREMOS

13.

CONJUNTOS ABIERTOS Y CERRADOS. PUNTOS INTERIOR, EXTERIOR Y FRONTERA. PROPIEDADES

14.

PUNTO DE ACUMULACIÓN Y CONJUNTO DERIVADO

15.

PUNTO ADHERENTE. ADHERENCIA DE UN CONJUNTO

PUNTO ADHERENTE. ADHERENCIA DE UN CONJUNTO

15.

PUNTO DE ACUMULACIÓN Y CONJUNTO DERIVADO

14.

CONJUNTOS ABIERTOS Y CERRADOS. PUNTOS INTERIOR, EXTERIOR Y FRONTERA. PROPIEDADES

13.

INTERVALOS Y ENTORNOS EN LA RECTA REAL. COTAS Y EXTREMOS

12.

LA RECTA REAL

11.

TOPOLOGÍA DE LA RECTA REAL

10.

VALOR ABSOLUTO DE LOS NÚMEROS REALES

9.

ISOMORFISMO ENTRE Q Y UNA PARTE DE R

8.

ORDENACIÓN EN EL CUERPO DE LOS NÚMEROS REALES

7.

MULTIPLICACIÓN DE NÚMEROS REALES

6.

ADICIÓN DE NÚMEROS REALES

5.

DEFINICIÓN DE NÚMERO REAL

4.

EL CONJUNTO DE LOS NÚMEROS REALES

3.

CONSTRUCCIÓN DEL CUERPO DE LOS NÚMEROS REALES

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

114

Números reales. Topología de la recta real

1. INTRODUCCIÓN Desde el siglo VI antes de Cristo, los matemáticos griegos, a partir de Pitágoras, habían descubierto que la medida de la diagonal de un cuadrado «no tiene medida común», «es inconmensurable» con el lado del mismo. Para ellos un número era simplemente la razón (a:b) entre dos segmentos rectilíneos. Lograron construcciones geométricas directas para establecer la igualdad entre razones, y para su suma, resta, multiplicación y división. Pitágoras sabía, aplicando el teorema que se conoce con su nombre y aplicándolo a un cuadrado de lado uno, que debía existir un «numero» d (diagonal) tal que d2 =12 + 12, o lo que es lo mismo d2 = 2. Pero, por otra parte, Pitágoras reconoció que este número (d) no puede representarse como un coa a2 ciente de enteros d = , ya que si así fuera d 2 = 2 , lo que nos llevaría a a2 = 2 · b2. Ahora bien, en la desb b composición en factores primos del primer miembro de esta ecuación el factor 2 (ya que a es múltiplo de 2 al serlo su cuadrado) quedará elevado a un exponente par, mientras que en la descomposición del segundo miembro dicho exponente es impar. Como la descomposición de un número natural en factores primos es única, se ve que esta ecuación no tiene solución, luego no puede existir ningún número racional cuyo cuadrado sea 2. Este descubrimiento produjo una gran consternación entre los pitagóricos, que creían a la sazón que «el número rige el universo», pensando únicamente en los números enteros y en sus razones (fracciones). A estas magnitudes se les dio el nombre de «inexpresables» y los pitagóricos se juramentaron no divulgar entre los profanos la existencia de tales números, ya que dada su visión del mundo no comprendían este error inexplicable en la obra del Supremo Arquitecto y creían que debía mantenerse en secreto para no incurrir en su cólera. Con posterioridad, hacia el siglo V después de Cristo los matemáticos hindúes ya consideraban como números las raíces irracionales de otros números, cosa que no hicieron nunca los griegos. Este paso supuso una ayuda enorme para el álgebra, pero hay que recordar que en este caso la contribución hindú fue el resultado de una inconsciencia de tipo lógico más que de una profundidad matemática ya que no tomaban en consideración seriamente las diferencias profundas entre magnitudes conmensurables e inconmensurables. Generaciones posteriores siguieron el mismo camino de una manera alegre e ingenua, hasta que en el siglo XIX consiguieron al fin los matemáticos fundamentar los números reales sobre una base sólida. Los matemáticos europeos de tiempos más recientes triunfaron allí donde sus antepasados habían fracasado. Descubrieron que los números irracionales podían expresarse en forma decimal, siendo infinitas las cifras tras la coma, sin que se reprodujeran nunca en el mismo orden, es decir, no se podían poner como números decimales periódicos, cosa que los distingue de los números racionales o fracciones ordinarias. Pero la definición de esos números no se basa actualmente en tal propiedad, sino en una caracterización algebraica, según la cual un número es irracional cuando no es solución de ninguna ecuación de primer grado con coeficientes enteros. El concepto mismo de esos números no habría quedado bien definido si en el siglo XIX, Abel y Galois no hubieran hecho otra extensión de la noción de número: los números “irracionales algebraicos” que serían todas las soluciones de una ecuación algebraica con coeficientes enteros. Evidentemente estos engloban a los enteros, racionales e irracionales expresables mediante radicales. Pero esta categoría se mostró también insuficiente para clasificar a todos los números. Gracias a los trabajos de Liouville, Hermite, Lindenman y otros se descubrió que existían otros “números reales” que no son ni enteros, ni racionales ni irracionales algebraicos; son los que actualmente llamamos números trascendentes que no son solución de ninguna ecuación algebraica con coeficientes enteros o fraccionarios”. Son irracionales que no pueden expresarse por medio de radicales, tales como p el número e, log 2, etc. Históricamente otra forma de definir los números irracionales fue mediante las cortaduras de Dedeking, que vio que se podía extender el conjunto de los números racionales para formar un continuo de números reales si se admite lo que hoy suele llamarse el axioma de Cantor-Dedeking, que afirma que los puntos de una recta pueden ponerse en correspondencia biunívoca con los números reales. Expresado esto aritméticamente significa que para cualquier partición de los números racionales en dos clases disjuntas A y B tales que todo número de la primera clase A sea menor que todo número de la segunda clase B, existe uno y sólo un número real que produce una cortadura de Dedeking. Si en A hay un número máximo o en B un mínimo, entonces la cortadura define un número racional, pero si en A no hay máximo ni en B mínimo, entonces la cortadura define un número irracional. Con posterioridad en el desarrollo del tema construiremos el número real a partir de sucesiones de Cauchy de números racionales.

TEMARIO DE MATEMÁTICAS. PRUEBA A

115

Volumen I. Matemáticas

116

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

e 2k 2

Si p ³ n2 y q ³ n2, entonces |bp – bq| <

e y 2k1

Si p ³ n1 y q ³ n1, entonces |ap – aq| <

2. CONSTRUCCIÓN DEL CUERPO DE LOS NÚMEROS REALES De las diversas formas que se conocen para construir un conjunto con la estructura de los números reales, la que tiene mayor interés es sin duda la que se basa en las sucesiones de Cauchy de números racionales. Sucesión de números racionales. Se llama así a toda aplicación a del conjunto N de los números naturales en el conjunto Q de los números racionales, es decir a: N ® Q. El número racional correspondiente al 1 se llama primer término de la sucesión, el correspondiente al 2, segundo término y así sucesivamente el correspondiente al n, término enésimo. La forma de representarla sería a1, a2, a3, ..., an,... o más brevemente por su término general (an). Sucesiones de Cauchy de números racionales. Una sucesión (an) de números racionales se dice de Cauchy cuando para todo número racional e > 0, existe un número natural n0 tal que para cualesquiera valores m y n mayores que n0, el valor absoluto de la diferencia de am y an es menor o igual que e Simbólicamente lo expresaríamos " e Î Q, e > 0, $ n0 Î N/m ³ n0, n ³ n0 Þ |am – an| £ e



Proposición 3. Si (an) y (bn) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (an · bn) es también de Cauchy. En efecto al ser (an) y (bn) sucesiones de Cauchy, si aplicamos la proposición 1, existen dos números racionales positivos k1 y k2, tales que |an| £ k1 y |bn| £ k2 para todo n perteneciente a los naturales. Además por ser sucesiones de Cauchy se cumplirá que para cada e > 0, existen dos números naturales n1 y n2 tales que con lo que (an + bn) es sucesión de Cauchy.

Si tomamos n0 = sup{n1,n2}, para cualesquiera valores p y q mayores o iguales que n0 se cumplirán las dos implicaciones anteriores simultáneamente, con lo que se tendrá que e e + =e 2 2 |(ap + bp) – (aq + bq)| = |ap – aq + bp – bq| £ |ap – aq| + |bp – bq| <

Al conjunto de todas las sucesiones de Cauchy de números racionales lo llamaremos Sc. Veremos ahora algunas propiedades de las sucesiones de Cauchy, que aplicaremos con posterioridad. Proposición 1. Toda sucesión de Cauchy (an) de números racionales está acotada en valor absoluto en Q, o lo que es lo mismo, si (an) es una sucesión de Cauchy, existe un número racional k tal que |an| £ k para todo n perteneciente a los números naturales. En efecto si (an) es una sucesión de Cauchy, y tomando cualquier e existe un n0, perteneciente a los naturales tal que si m y n son mayores que n0, entonces |am – an| £ e. En particular |am – an0| £ e. Por otra parte se verifica: |am| = |am – an0 + an0| £ |am – an0| + |an0| £ e + |an0| e Si p ³ n1 y q ³ n1, entonces |ap – aq| < y 2 e 2



Si p ³ n2 y q ³ n2, entonces |bp – bq| <

Proposición 2. Si (an) y (bn) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (an + bn) es también de Cauchy. En efecto al ser (an) y (bn) sucesiones de Cauchy, para cada e > 0, existen dos números naturales n1 y n2 tales que

Hemos así acotado superiormente el valor absoluto de todos los términos de la sucesión a partir del índice n0. Por tanto para que k sea cota superior de la sucesión (an), es suficiente que k = sup (|a1|, |a2|, … |an0 – 1|, |an0| + e).



Hemos así acotado superiormente el valor absoluto de todos los términos de la sucesión a partir del índice n0. Por tanto para que k sea cota superior de la sucesión (an), es suficiente que k = sup (|a1|, |a2|, … |an0 – 1|, |an0| + e).

Proposición 2. Si (an) y (bn) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (an + bn) es también de Cauchy. En efecto al ser (an) y (bn) sucesiones de Cauchy, para cada e > 0, existen dos números naturales n1 y n2 tales que e Si p ³ n1 y q ³ n1, entonces |ap – aq| < y 2 e Si p ³ n2 y q ³ n2, entonces |bp – bq| < 2





Proposición 1. Toda sucesión de Cauchy (an) de números racionales está acotada en valor absoluto en Q, o lo que es lo mismo, si (an) es una sucesión de Cauchy, existe un número racional k tal que |an| £ k para todo n perteneciente a los números naturales. En efecto si (an) es una sucesión de Cauchy, y tomando cualquier e existe un n0, perteneciente a los naturales tal que si m y n son mayores que n0, entonces |am – an| £ e. En particular |am – an0| £ e. Por otra parte se verifica: |am| = |am – an0 + an0| £ |am – an0| + |an0| £ e + |an0|

Si tomamos n0 = sup{n1,n2}, para cualesquiera valores p y q mayores o iguales que n0 se cumplirán las dos implicaciones anteriores simultáneamente, con lo que se tendrá que e e |(ap + bp) – (aq + bq)| = |ap – aq + bp – bq| £ |ap – aq| + |bp – bq| < + = e 2 2 con lo que (an + bn) es sucesión de Cauchy.

Al conjunto de todas las sucesiones de Cauchy de números racionales lo llamaremos Sc. Veremos ahora algunas propiedades de las sucesiones de Cauchy, que aplicaremos con posterioridad.

De las diversas formas que se conocen para construir un conjunto con la estructura de los números reales, la que tiene mayor interés es sin duda la que se basa en las sucesiones de Cauchy de números racionales. Sucesión de números racionales. Se llama así a toda aplicación a del conjunto N de los números naturales en el conjunto Q de los números racionales, es decir a: N ® Q. El número racional correspondiente al 1 se llama primer término de la sucesión, el correspondiente al 2, segundo término y así sucesivamente el correspondiente al n, término enésimo. La forma de representarla sería a1, a2, a3, ..., an,... o más brevemente por su término general (an). Sucesiones de Cauchy de números racionales. Una sucesión (an) de números racionales se dice de Cauchy cuando para todo número racional e > 0, existe un número natural n0 tal que para cualesquiera valores m y n mayores que n0, el valor absoluto de la diferencia de am y an es menor o igual que e Simbólicamente lo expresaríamos " e Î Q, e > 0, $ n0 Î N/m ³ n0, n ³ n0 Þ |am – an| £ e



Proposición 3. Si (an) y (bn) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (an · bn) es también de Cauchy. En efecto al ser (an) y (bn) sucesiones de Cauchy, si aplicamos la proposición 1, existen dos números racionales positivos k1 y k2, tales que |an| £ k1 y |bn| £ k2 para todo n perteneciente a los naturales. Además por ser sucesiones de Cauchy se cumplirá que para cada e > 0, existen dos números naturales n1 y n2 tales que e Si p ³ n1 y q ³ n1, entonces |ap – aq| < y 2k1 Si p ³ n2 y q ³ n2, entonces |bp – bq| <

e 2k 2

2. CONSTRUCCIÓN DEL CUERPO DE LOS NÚMEROS REALES CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

116

Números reales. Topología de la recta real Si tomamos n0 = sup{n1,n2}, para cualesquiera valores p y q mayores o iguales que n0 se cumplirán las dos implicaciones anteriores simultáneamente, con lo que se tendrá que |(ap · bp) – (aq · bq)| = |ap · bp – ap · bq + ap · bq – aq · bq| = |ap · (bp –bq) + bq · (ap – aq)| £ |ap| · |bp – bq| + e e e e + |bq| · |ap – aq| £ k1 · + k2 · = + = e con lo que (an · bn) es de Cauchy. 2k1 2k 2 2 2

3. EL CONJUNTO DE LOS NÚMEROS REALES Sea Sc el conjunto de todas las sucesiones de Cauchy de números racionales. Definimos en este conjunto la relación binaria ˜ de la forma siguiente. Dadas dos sucesiones (an) y (bn) de Sc, (an)˜(bn) si para todo número racional e > 0, existe un número natural n0 tal que para todos los valores n ³ n0, se verifica que |an – bn| £ e . Esto equivale a decir que la sucesión diferencia (an – bn) tiene de límite cero. En particular una sucesión (an) es equivalente a 0, si es equivalente a (0,0,.....,0,...) o lo que es lo mismo para todo número racional positivo e , existe un número entero n0 tal que si n ³ n0, entonces |an| £ e . La relación ~ es de equivalencia ya que cumple las propiedades reflexiva y simétrica de forma evidente. Veremos que también cumple la transitiva. Para ello supongamos que existen sucesiones de Cauchy que cumplen que (an) ~ (bn) y (bn) ~ (cn). Veremos entonces que (an) ~ (cn). Fijemos un número racional e Si (an) ~ (bn), existe un número natural n1 tal que e si n ³ n1, entonces |an – bn| £ 2 Si (bn) ~ (cn), existe un número natural n2 tal que e si n ³ n2, entonces |bn – cn| £ 2 Si tomamos n0 = sup {n1,n2}, al cumplirse las dos verificaciones anteriores, tendremos que |an – cn| = |an – bn + bn – cn| £ |an – bn| + |bn + cn| £

e e + =e 2 2

con lo que (an)~(bn).



Proposición 4. Si una sucesión de Cauchy no es equivalente a cero, sus términos se conservan acotados inferiormente en valor absoluto desde un cierto lugar en adelante. Esto equivale a ver que si (an) Î Sc y no es equivalente a cero, existe un n0 perteneciente a los naturales y un número racional positivo a tal que si n ³ n0, entonces |an| ³ a. La demostración la haremos por reducción al absurdo. Sea (an) una sucesión de Cauchy no equivalente a cero para la cual la conclusión es falsa, es decir, cualesquiera que sean a y n0, existe un n1 > n0, tal que |an1| £ a. Pero por ser (an) sucesión de Cauchy, existe un número natural n2 (que dependerá de a), tal que si n y q > n2, entonces |an – aq| £ a. Tomemos n0 = n2, con lo que se tendrá que para todo n > n2, |an| = |an1 + an – an1| £ |an1| + |an – an1| £ a + a = 2a. Como el número racional a es arbitrario, lo podemos elegir tan pequeño como queramos y la sucesión (an) es equivalente a cero, lo que contradice la hipótesis.



Proposición 5. Si en una sucesión de Cauchy (an) se suprimen los p primeros términos, resulta otra sucesión de Cauchy (a’n) equivalente con la primera. En efecto ya que por la definición (a’n) = (an + p), lo cual prueba que (a’n) es de Cauchy. Además |a’n – an| = |an + p – an| < e para todo n ³ n0 por ser an de Cauchy, lo cual prueba que (a’n) ~ (an).



Colorario 6. Si una sucesión de Cauchy no es equivalente a cero, es equivalente a: a) Otra sucesión en la que todos sus términos son positivos, mayores que un número que se puede hallar en cada caso y se llamará sucesión de Cauchy positiva.

TEMARIO DE MATEMÁTICAS. PRUEBA A

117

Volumen I. Matemáticas

118

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA



Propiedad asociativa. Dados tres números reales a, b y c, debe cumplirse que (a + b) + c = a + (b + c). Si tomamos sucesiones de Cauchy representantes de a, b y c; (an), (bn) y (cn) respectivamente, un representante del primer miembro será ((an + bn) + cn) y un representante del segundo miembro (an + (bn + cn)). En virtud de la propiedad asociativa de la suma de los números racionales estos dos términos son iguales con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad asociativa.



Propiedad conmutativa. Dados dos números reales a y b, debe cumplirse que a + b = b + a. Si tomamos sucesiones de Cauchy representantes de a y b; (an), y (bn) respectivamente, un representante del primer miembro será (an + bn) y un representante del segundo miembro (bn + an). En virtud de la propiedad conmutativa de la suma de los números racionales estos dos términos son iguales, con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad conmutativa.

b) Otra sucesión en la que todos sus términos son negativos menores que un número que se puede hallar en cada caso y se llamará sucesión de Cauchy negativa. Se demuestra utilizando las proposiciones 4 y 5. De aquí podemos deducir que una sucesión de Cauchy es nula, positiva o negativa.

4. DEFINICIÓN DE NÚMERO REAL

La relación de equivalencia ˜ divide al conjunto Sc en clases de equivalencia, cada una de las cuales llamaremos número real. El conjunto cociente Sc/˜, será el conjunto de los números reales, que designaremos por R. Sobre este conjunto definiremos ahora dos propiedades que llamaremos adición y multiplicación y veremos que con las mismas adquiere la estructura de cuerpo. Si escribimos a = [(an)], estamos indicando que la sucesión de Cauchy de números racionales (an) es un representante del número real a.

Propiedad uniforme. La adición de números reales no depende de los representantes elegidos. En efecto si tomamos otros representantes de a y b, (a’n) y (b’n) tendremos que (an) ~ (a’n) y (bn) ~ (b’n), y demostraremos que (an) + (bn) ~ (a’n) + (b’n). Por la proposición 2 sabemos que (an) + (bn) y (a’n) + (b’n) que son sucesiones de Cauchy y de acuerdo con la definición de ~ tendremos que demostrar que para todo número racional e > 0, existe un n0 perteneciente a los naturales tal que si n ³ n0, entonces |((an) + (bn)) – ((a’n) + (b’n))| £ e . Fijemos e > 0 y como (an) ~ (a’n) existe un n1, natural tal que si n ³ n1, entonces e |an – a’n| £ 2 De forma análoga como (bn) ~ (b’n), existe un n2, natural tal que si n ³ n2, entonces e |bn – b’n| £ 2 Si tomamos n0 = sup{n1,n2}se cumplirán simultáneamente las dos implicaciones anteriores, con lo que tendremos |((an) + (bn)) – ((a’n) + (b’n))| = |(an) + (bn) – (a’n) – (b’n)| = e e |((an) – (a’n)) + ((bn) – (b’n))| £ |(an) – a’n)| + |(bn) – (b’n)| £ + e 2 2

5. ADICIÓN DE NÚMEROS REALES

Sean a y b dos números reales. Si tomamos dos representantes de dichos números (an) y (bn), definiremos la adición de a y b, como a + b = [(an) + (bn)]. La sucesión (an) + (bn) es una sucesión de Cauchy (proposición 2), por lo que dados dos números reales cualesquiera siempre existe su suma. La adición así definida cumple las siguientes propiedades:

Propiedad asociativa. Dados tres números reales a, b y c, debe cumplirse que (a + b) + c = a + (b + c). Si tomamos sucesiones de Cauchy representantes de a, b y c; (an), (bn) y (cn) respectivamente, un representante del primer miembro será ((an + bn) + cn) y un representante del segundo miembro (an + (bn + cn)). En virtud de la propiedad asociativa de la suma de los números racionales estos dos términos son iguales con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad asociativa.



Propiedad uniforme. La adición de números reales no depende de los representantes elegidos. En efecto si tomamos otros representantes de a y b, (a’n) y (b’n) tendremos que (an) ~ (a’n) y (bn) ~ (b’n), y demostraremos que (an) + (bn) ~ (a’n) + (b’n). Por la proposición 2 sabemos que (an) + (bn) y (a’n) + (b’n) que son sucesiones de Cauchy y de acuerdo con la definición de ~ tendremos que demostrar que para todo número racional e > 0, existe un n0 perteneciente a los naturales tal que si n ³ n0, entonces |((an) + (bn)) – ((a’n) + (b’n))| £ e . Fijemos e > 0 y como (an) ~ (a’n) existe un n1, natural tal que si n ³ n1, entonces e |an – a’n| £ 2 De forma análoga como (b ) ~ (b’ ), existe un n2, natural tal que si n ³ n2, entonces n n e |bn – b’n| £ 2 Si tomamos n0 = sup{n1,n2}se cumplirán simultáneamente las dos implicaciones anteriores, con lo que tendremos |((an) + (bn)) – ((a’n) + (b’n))| = |(an) + (bn) – (a’n) – (b’n)| = e e + e 2 2





Sean a y b dos números reales. Si tomamos dos representantes de dichos números (an) y (bn), definiremos la adición de a y b, como a + b = [(an) + (bn)]. La sucesión (an) + (bn) es una sucesión de Cauchy (proposición 2), por lo que dados dos números reales cualesquiera siempre existe su suma. La adición así definida cumple las siguientes propiedades:

5. ADICIÓN DE NÚMEROS REALES

|((an) – (a’n)) + ((bn) – (b’n))| £ |(an) – a’n)| + |(bn) – (b’n)| £

La relación de equivalencia ˜ divide al conjunto Sc en clases de equivalencia, cada una de las cuales llamaremos número real. El conjunto cociente Sc/˜, será el conjunto de los números reales, que designaremos por R. Sobre este conjunto definiremos ahora dos propiedades que llamaremos adición y multiplicación y veremos que con las mismas adquiere la estructura de cuerpo. Si escribimos a = [(an)], estamos indicando que la sucesión de Cauchy de números racionales (an) es un representante del número real a.

4. DEFINICIÓN DE NÚMERO REAL



Propiedad conmutativa. Dados dos números reales a y b, debe cumplirse que a + b = b + a. Si tomamos sucesiones de Cauchy representantes de a y b; (an), y (bn) respectivamente, un representante del primer miembro será (an + bn) y un representante del segundo miembro (bn + an). En virtud de la propiedad conmutativa de la suma de los números racionales estos dos términos son iguales, con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad conmutativa.

Otra sucesión en la que todos sus términos son negativos menores que un número que se puede hallar en cada caso y se llamará sucesión de Cauchy negativa. Se demuestra utilizando las proposiciones 4 y 5. De aquí podemos deducir que una sucesión de Cauchy es nula, positiva o negativa. b)

118

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Números reales. Topología de la recta real



Elemento neutro. La sucesión constante (0) (representante del número real 0) es de Cauchy y verifica que dado cualquier número real a, se cumple que a + 0 = 0 + a = a. La demostración es inmediata.



Elemento simétrico. Para cada número real a existe un único número real que denotaremos por –a (y que llamaremos opuesto de a),que verifica que a + (–a) = (–a) + a = 0. En efecto si (an) es un representante de a, la sucesión (–an), es también de Cauchy y determina el opuesto de a. La demostración es trivial.

A la vista de estas propiedades podemos afirmar que el conjunto de los números reales, con la operación adición tiene la estructura de grupo abeliano.

6. MULTIPLICACIÓN DE NÚMEROS REALES Sean a y b dos números reales. Si tomamos dos representantes de dichos números (an) y (bn), definiremos la multiplicación de a y b, como a · b = [(an) (bn)]. La sucesión (an) · (bn) es una sucesión de Cauchy (proposición 3), por lo que dados dos números reales cualesquiera siempre existe su producto. La multiplicación así definida cumple las siguientes propiedades:



Propiedad uniforme. La multiplicación de números reales no depende de los representantes elegidos. En efecto si tomamos otros representantes de a y b, (a’n) y (b’n), tendremos que (an) ~ (a’n) y (bn) ~ (b’n), y demostraremos que (an) · (bn) ~ (a’n) · (b’n). Por la proposición 3 sabemos que (an) · (bn) ~ (a’n) · (b’n) son sucesiones de Cauchy y de acuerdo con la definición de ~ tendremos que demostrar que para todo número racional e >0, existe un n0 perteneciente a los naturales tal que si n ³ n0, entonces |(an) · (bn) – (a’n) · (b’n)| £ e . Al ser (an) y (b’n) sucesiones de Cauchy, por la proposición 1 existirán dos constantes positivas k1 y k2 tales que |an|£ k1 y |b’n| £ k2, cualesquiera que sea n. Fijemos e > 0 y como (an) ~ (a’n), existe un n1, natural tal que si n ³ n1, entonces e |an – a’n| £ 2k 2 De forma análoga como (bn) ~ (b’n), existe un n2, natural tal que si n ³ n2, entonces e |bn – b’n| £ 2k1 Si tomamos n0 = sup{n1,n2} se cumplirán simultáneamente las dos implicaciones anteriores, con lo que tendremos |(an) · (bn) – (a’n) · (b’n)| = |(an) · (bn) – (an) · (b’n) + (an) · (b’n) – (a’n) · (b’n) = e e e e + k2 · = + =e |(an) · ((bn) – (b’n)) + |an| |(bn) – (b’n)| + |(an) – a’n)| · |(b’n)| £ k1 · 2k1 2k 2 2 2



Propiedad asociativa. Dados tres números reales a, b y c, debe cumplirse que (a · b) · c = a · (b · c). Si tomamos sucesiones de Cauchy representantes de a, b y c; (an), (bn) y (cn) respectivamente, un representante del primer miembro será ((an · bn) · cn) y un representante del segundo miembro (an · (bn · cn)). En virtud de la propiedad asociativa del producto de los números racionales estos dos términos son iguales con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad asociativa.



Propiedad conmutativa. Dados dos números reales a y b, debe cumplirse que a · b = b · a. Si tomamos sucesiones de Cauchy representantes de a y b; (an), y (bn) respectivamente, un representante del primer miembro será (an · bn) y un representante del segundo miembro (bn · an). En virtud de la propiedad conmutativa del producto de los números racionales estos dos términos son iguales con lo que representarán la misma clase de equivalencia, quedando así demostrada la propiedad conmutativa.

TEMARIO DE MATEMÁTICAS. PRUEBA A

119

Volumen I. Matemáticas

120

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Veremos que esta relación definida en R es de orden total al cumplir las propiedades reflexiva, antisimétrica y transitiva (relación de orden) y en la que todos los elementos son comparables entre sí (orden total). 1. Reflexiva. Es claro que a £ a ya que a – a = 0 (sucesión nula) 2. Antisimétrica. Si a £ b y b £ a, esto implicará que a = b. Si a £ b y b £ a, podemos tomar un representante de b – a, que será (rn), que deberá ser una sucesión de Cauchy positiva o nula. Un representante de a – b, será (–rn), sucesión que al cumplirse b £ a, debe ser también positiva o nula. Al ser (rn) y (–rn) sucesiones opuestas, no pueden ser a la vez positivas por lo que deben ser nulas. Así b – a = 0, por lo que a = b. 3. Transitiva. Si a £ b y b £ c entonces a £ c. Si a £ b y b £ c, podemos tomar dos representantes, uno de b – a, que será (rn) y otro de c – b, que será (sn). Ambos serán sucesiones de Cauchy positivas o nulas. Si sumamos ambos la sucesión resultante (rn + sn) será representante de c – a y como rn + sn ³ 0, para todo n, resulta que a £ c. 4. Orden total. Dados dos números reales a y b, consideremos el número b – a Î R y sea (rn) un representante de dicho número. Dicha sucesión será positiva (con lo que a £ b), negativa (con lo que b £ a) o nula, (con lo que a = b) por lo que se trata de una relación de orden total.

Elemento simétrico o inverso. Para todo número real a ¹ 0, existe un único número real a–1 que llamaremos inverso de a, tal que a · a–1 = a–1 · a = 1. Sea (an) un representante de a. Veremos que la sucesión 1 ) es de Cauchy y verifica el enunciado. an



Elemento neutro. La clase de la sucesión (1, 1, 1, … 1, ...), que denotaremos como el número real 1 es evidente que es el elemento neutro de la multiplicación al verificar que para todo número real a, se cumple que a · 1 = 1 · a = a.



(a n–1 ) = (

Por ser (an) de Cauchy, por la proposición 4 se cumple que existe un racional positivo a, para el cual (an) cumple la condición |an|³ a para todo n y también que para todo e > 0, existe un n0, natural tal que si p y q > n0, entonces |ap – aq| £ e · a2. Para la sucesión inversa se verifica ap – aq ap – aq e ×a 2 1 1 £ 2 = e cualesquiera que sean p y q ³ n0, – = = aq ap a q ×a p a a q ×a p

a)

Dados dos números reales a y b, diremos que a £ b (se leerá a menor o igual que b), cuando el número b – a admita como representante una sucesión de Cauchy positiva, o nula, es decir, una sucesión (rn), donde rn ³ 0, para todo n (Corolario 1).

lo que prueba que la sucesión (a n–1 ) es de Cauchy. Además (an) · (a n–1 ) = (1, 1, 1, … 1, ...) = 1. Así queda demostrado que todo elemento a de R, distinto de cero es inversible.

7. ORDENACIÓN EN EL CUERPO DE LOS NÚMEROS REALES



Propiedad distributiva. Dados tres números reales a, b y c, se verifica a · (b + c) = a · b + a · c. La demostración es una consecuencia inmediata de la misma propiedad en el conjunto de las sucesiones de Cauchy de números racionales.

El conjunto de los números reales, con las operaciones de adición y multiplicación, tiene la estructura algebraica de cuerpo conmutativo.

A la vista de estas propiedades podemos afirmar que el conjunto de los números reales (menos el cero), con la operación multiplicación tiene la estructura de grupo abeliano.

El cuerpo de los números reales:

El cuerpo de los números reales:

A la vista de estas propiedades podemos afirmar que el conjunto de los números reales (menos el cero), con la operación multiplicación tiene la estructura de grupo abeliano.

El conjunto de los números reales, con las operaciones de adición y multiplicación, tiene la estructura algebraica de cuerpo conmutativo.



Propiedad distributiva. Dados tres números reales a, b y c, se verifica a · (b + c) = a · b + a · c. La demostración es una consecuencia inmediata de la misma propiedad en el conjunto de las sucesiones de Cauchy de números racionales.

7. ORDENACIÓN EN EL CUERPO DE LOS NÚMEROS REALES

–1 lo que prueba que la sucesión (a –1 n ) es de Cauchy. Además (an) · (a n ) = (1, 1, 1, … 1, ...) = 1. Así queda demostrado que todo elemento a de R, distinto de cero es inversible.

Dados dos números reales a y b, diremos que a £ b (se leerá a menor o igual que b), cuando el número b – a admita como representante una sucesión de Cauchy positiva, o nula, es decir, una sucesión (rn), donde rn ³ 0, para todo n (Corolario 1). a)

ap – aq ap – aq e ×a 2 1 1 £ 2 = e cualesquiera que sean p y q ³ n0, – = = a q ×a p a aq ap a q ×a p

Veremos que esta relación definida en R es de orden total al cumplir las propiedades reflexiva, antisimétrica y transitiva (relación de orden) y en la que todos los elementos son comparables entre sí (orden total). 1. Reflexiva. Es claro que a £ a ya que a – a = 0 (sucesión nula) 2. Antisimétrica. Si a £ b y b £ a, esto implicará que a = b. Si a £ b y b £ a, podemos tomar un representante de b – a, que será (rn), que deberá ser una sucesión de Cauchy positiva o nula. Un representante de a – b, será (–rn), sucesión que al cumplirse b £ a, debe ser también positiva o nula. Al ser (rn) y (–rn) sucesiones opuestas, no pueden ser a la vez positivas por lo que deben ser nulas. Así b – a = 0, por lo que a = b. 3. Transitiva. Si a £ b y b £ c entonces a £ c. Si a £ b y b £ c, podemos tomar dos representantes, uno de b – a, que será (rn) y otro de c – b, que será (sn). Ambos serán sucesiones de Cauchy positivas o nulas. Si sumamos ambos la sucesión resultante (rn + sn) será representante de c – a y como rn + sn ³ 0, para todo n, resulta que a £ c. 4. Orden total. Dados dos números reales a y b, consideremos el número b – a Î R y sea (rn) un representante de dicho número. Dicha sucesión será positiva (con lo que a £ b), negativa (con lo que b £ a) o nula, (con lo que a = b) por lo que se trata de una relación de orden total.

Por ser (an) de Cauchy, por la proposición 4 se cumple que existe un racional positivo a, para el cual (an) cumple la condición |an|³ a para todo n y también que para todo e > 0, existe un n0, natural tal que si p y q > n0, entonces |ap – aq| £ e · a2. Para la sucesión inversa se verifica



Elemento neutro. La clase de la sucesión (1, 1, 1, … 1, ...), que denotaremos como el número real 1 es evidente que es el elemento neutro de la multiplicación al verificar que para todo número real a, se cumple que a · 1 = 1 · a = a.



Elemento simétrico o inverso. Para todo número real a ¹ 0, existe un único número real a–1 que llamaremos inverso de a, tal que a · a–1 = a–1 · a = 1. Sea (an) un representante de a. Veremos que la sucesión 1 (a –1 ) es de Cauchy y verifica el enunciado. n )=( an 120

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Números reales. Topología de la recta real Para que R sea un cuerpo totalmente ordenado es necesario ver que esta relación es compatible con la estructura de cuerpo, es decir, con las operaciones suma y producto para lo que se deben verificar las siguientes propiedades: 1. Si a £ b, entonces a + c £ b + c, cualquiera que sea c. En efecto si a £ b, un representante de b – a, será la sucesión de Cauchy positiva o nula (rn). Para comprobar la segunda relación buscamos un representante de (b + c) – (a + c) = b – a, que también será (rn), con lo que queda demostrado. 2. Si a £ b, entonces a · c £ b · c, cualquiera que sea c ³ 0. En efecto, si a £ b, un representante de b – a, será la sucesión de Cauchy positiva o nula (rn). Como c ³ 0, un representante de la misma (sn), será sucesión de Cauchy positiva o nula. Si hacemos el producto de ambos representantes, la sucesión resultante (rn sn) será representante del producto (b – a) · c = b · c – a · c y al ser positiva o nula tendremos que a · c £ b · c. c) Propiedad arquimediana de los números reales. Sea a un número real positivo y b un número real cualquiera. Entonces existe un número natural n, y un número entero m tal que m · a < b < n · a. La notación n · a significa el producto por a del número real que determina la sucesión constante (n). Lo mismo ocurre para m · a. Consideremos el número real b/a y tomemos del mismo una sucesión representante (rn). En virtud de la proposición 1, existe un número racional k > 0, tal que | rn|£ k, para todo n, o lo que es lo mismo –k £ rn k. Las sucesiones constantes (k) y (–k) determinan sendos números reales, que denotaremos por las clases [(k)] y [(–k)], y se verifica entonces que [(–k)] £ b/a £ [(k)]. Ahora bien por la propiedad arquimediana de los números racionales, existen un número natural n y un número entero m, tales que k < n y m < –k. Luego [(k)] < [(n)] y [(m)] < [(–k)], y por consiguiente [(m)] < b/a < [(n)]. Multiplicando todos los miembros por el número positivo a se obtiene lo que queríamos demostrar. d) Densidad del orden. Para cada dos números reales a y b, con a < b, existen un número racional r y un número irracional c tales que a < r < b y a < c < b. Esto es lo mismo que decir que el conjunto de los números reales comprendidos estrictamente entre dos números reales no está vacío y contiene tanto números racionales como irracionales. La notación a < r, significa a < [(r)] , siendo [(r)] el número real que define la sucesión constante (r). Demostraremos ahora la primera parte. Supongamos que 0 £ a < b. Si aplicamos la propiedad arquimediana al número real b – a > 0, tomando como número real cualquiera el 1, existe un número natural n, tal que 1 < n · (b – a) = n · b – n · a, de donde se deduce que 1 + n · a < n · b. Sea ahora m el menor natural de los que son mayores que n · a, es decir, que m está caracterizado por ser m – 1 £ n · a < m. m De estas desigualdades se sigue que n · a < m £ 1 + n · a < n · b, luego a < < b, quedando demostran da la existencia de un número racional comprendido entre a y b. Si a < 0, –a > 0 y por la propiedad arquimediana, existe un número natural p tal que –a < p, luego 0 < a + p y tendremos que 0 < a + p < b + p. Aplicando el resultado anterior, existirá un número racional r tal que a + p < r < b + p, de donde a < r – p < b y como r – p es otro número racional la propiedad queda establecida. Demostraremos ahora la segunda parte. En virtud de lo demostrado en la primera parte existen dos números racionales r y s, tales que a < r < s < b. Ahora bien el número 2 es irracional así como el número 2 c=r+ (s – r) y como a < r < c < s < b, de donde a < c < b, quedando demostrada la afirmación. 2 Hasta aquí las propiedades del orden de los números reales son las mismas que las del orden de los números racionales. Vamos a establecer ahora una propiedad fundamental que marca la diferencia que existe entre el orden en Q y el orden en R. Sabemos que hay conjuntos de números racionales acotados superiormente que no tienen extremo superior en Q. Esta circunstancia no se da en R, donde todo conjunto acotado superiormente tiene siempre extremo superior. Para alcanzar este resultado fundamental estableceremos antes otras propiedades de los números reales relacionadas con el orden. b)



Teorema 7. Sea a un número real positivo. Si (an) es una sucesión de Cauchy representante de a, existe un número natural n0 tal que an > 0 para todo n ³ n0. En efecto, en virtud del corolario 1, existe un número racional positivo r y una sucesión de Cauchy (xn) representante de a, tal que xn ³ r , para todo n. Como la sucesión (xn) es equivalente a la suce-

TEMARIO DE MATEMÁTICAS. PRUEBA A

121

Volumen I. Matemáticas

122

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

r sión an (al ser representantes del mismo número racional), para el racional debe existir un núme2 r r r r ro natural n0 tal que |an – xn| £ para todo n ³ n0, entonces será an ³ xn – ³ r – = > 0, luego 2 2 2 2 an > 0 para todo n ³ n0. De la demostración se desprende que el enunciado del teorema puede precisarse más en el sentido de afirmar la existencia de un número racional inferior a todos los términos de la sucesión que lleven índice superior a un cierto número natural. xn –

1 < xm para todo m ³ n. 2n

Teorema 9. (Teorema fundamental del orden en R). Todo conjunto acotado superiormente (resp. inferiormente), tiene extremo superior (resp. inferior) en R. Sea M un conjunto de números reales acotado superiormente, es decir, para el cual existe un número real l tal que x < l, cualquiera que sea x Î M. Sea K un número natural mayor o igual que l y sea H otro número entero que supondremos menor que algún elemento del conjunto M. Entonces, entre los términos de la sucesión finita de números racionales: 1 2 K H < H + n < H + n < ... < H + n < ... < K 2 2 2 que para cada valor del número natural n podemos escribir, habrá algunos (por lo menos el último) que sean cotas superiores del conjunto M. Denotemos por xn al menor de estos números que son cotas superiores, de modo que el número 1 xn – n ya no es cota superior de M. 2 Para un natural m > n los términos de la sucesión correspondiente serán los de la sucesión anterior junto con otros nuevos intercalados entre aquellos, por lo cual el número xm correspondiente será £ xn, aunque estrictamente superior al 1 xn – n porque este no es cota superior del conjunto M. 2 Es decir que tendremos 1 xn – n < xm £ xn para todo m ³ n. 2 Entonces 1 xn – xm £ n para todo m ³ n. 2 Fijado arbitrariamente un número racional r > 0, de la propiedad arquimediana se deduce la existencia de un natural n0 tal que si n ³ n0, implica que 1 £ r, 2n luego para todo r, racional positivo, existe un natural n0, tal que si m ³ n ³ n0 implica que |xm – xn| £ r, lo cual prueba que la sucesión decreciente (xn) que hemos construido es una sucesión de Cauchy de números racionales. Sea a el número real definido por ella. Demostraremos que a es el extremo superior del conjunto M. Antes hemos visto que



Teorema 8. Sean a y b números reales y sean (an) y (bn) dos sucesiones de Cauchy de números racionales representantes de a y b respectivamente. Si existe un número natural n0 tal que an £ bn para todo n ³ n0, entonces a £ b. En efecto si no fuese a £ b, sería a – b > 0 y en virtud del teorema anterior, existiría un número natural n’0 tal que an – bn > 0 para todo n ³ n’0. Así pues para índices superiores a n0 y n’0, obtendríamos desigualdades contradictorias.





Teorema 8. Sean a y b números reales y sean (an) y (bn) dos sucesiones de Cauchy de números racionales representantes de a y b respectivamente. Si existe un número natural n0 tal que an £ bn para todo n ³ n0, entonces a £ b. En efecto si no fuese a £ b, sería a – b > 0 y en virtud del teorema anterior, existiría un número natural n’0 tal que an – bn > 0 para todo n ³ n’0. Así pues para índices superiores a n0 y n’0, obtendríamos desigualdades contradictorias.



Teorema 9. (Teorema fundamental del orden en R). Todo conjunto acotado superiormente (resp. inferiormente), tiene extremo superior (resp. inferior) en R. Sea M un conjunto de números reales acotado superiormente, es decir, para el cual existe un número real l tal que x < l, cualquiera que sea x Î M. Sea K un número natural mayor o igual que l y sea H otro número entero que supondremos menor que algún elemento del conjunto M. Entonces, entre los términos de la sucesión finita de números racionales: 1 2 K H < H + n < H + n < ... < H + n < ... < K 2 2 2 que para cada valor del número natural n podemos escribir, habrá algunos (por lo menos el último) que sean cotas superiores del conjunto M. Denotemos por xn al menor de estos números que son cotas superiores, de modo que el número 1 xn – n ya no es cota superior de M. 2 Para un natural m > n los términos de la sucesión correspondiente serán los de la sucesión anterior junto con otros nuevos intercalados entre aquellos, por lo cual el número xm correspondiente será £ xn, aunque estrictamente superior al 1 xn – n porque este no es cota superior del conjunto M. 2 Es decir que tendremos 1 xn – n < xm £ xn para todo m ³ n. 2 Entonces 1 xn – xm £ n para todo m ³ n. 2 Fijado arbitrariamente un número racional r > 0, de la propiedad arquimediana se deduce la existencia de un natural n0 tal que si n ³ n0, implica que 1 £ r, 2n luego para todo r, racional positivo, existe un natural n0, tal que si m ³ n ³ n0 implica que |xm – xn| £ r, lo cual prueba que la sucesión decreciente (xn) que hemos construido es una sucesión de Cauchy de números racionales. Sea a el número real definido por ella. Demostraremos que a es el extremo superior del conjunto M. Antes hemos visto que 1 xn – n < xm para todo m ³ n. 2

r sión an (al ser representantes del mismo número racional), para el racional debe existir un núme2 r r r r ro natural n0 tal que |an – xn| £ para todo n ³ n0, entonces será an ³ xn – ³ r – = > 0, luego 2 2 2 2 an > 0 para todo n ³ n0. De la demostración se desprende que el enunciado del teorema puede precisarse más en el sentido de afirmar la existencia de un número racional inferior a todos los términos de la sucesión que lleven índice superior a un cierto número natural.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

122

Números reales. Topología de la recta real Si consideramos entonces para un n fijo, la sucesión constante 1 (xn – n ) 2 y por otra parte la sucesión de Cauchy (xm), la aplicación del teorema 2 nos dará que 1 xn – n £ a. 2 Y esta desigualdad se verificará cualquiera que sea n, puesto que n fue fijado arbitrariamente. Supongamos que a no fuese cota superior del conjunto M, es decir, existiera algún elemento y Î M, con a < y. De la propiedad arquimediana se deduce, como sabemos, la existencia de un número natural p tal que 1 0, existe un natural n0 tal que |rn – rp| < e si n y p son mayores que n0. Luego |a – rp| tiende a cero cuando p tiende a infinito.



Teorema 11. Toda sucesión de Cauchy de números reales es convergente en R. (R es completo). Sea ap una sucesión de números reales de Cauchy. Por la densidad de Q en R (propiedad arquimediana de Q), a todo ap perteneciente a los reales se le puede asociar un número racional xp, tal que |ap – xp| < ep, para cualquier ep > 0, tan pequeño como queramos (puede tender a cero), con lo cual tendremos |xp – xq| £ |xp – ap| + |aq – xq| + |ap – aq| £ ep + ep + |ap – aq| Como el límite de |am – an|, cuando m y n tienden a infinito es cero, resulta que el límite de |xp – xq|, cuando p y q tiendan a infinito será cero, por lo que la sucesión (xn) es una sucesión de Cauchy que definirá un número real a0, para el que se cumple |a0 – ap| £ |a0 – xp| + |xp – ap|

y por lo tanto el limite de an, cuando n tiende a infinito es a0. Así pues se puede afirmar que el conjunto de los números reales es un conjunto totalmente ordenado, arquimediano y completo. TEMARIO DE MATEMÁTICAS. PRUEBA A

123

Volumen I. Matemáticas

124

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Las demostraciones de 3 y 4 son triviales.

8. ISOMORFISMO ENTRE Q Y UNA PARTE DE R... a a = b b

El conjunto de los números reales contiene un subconjunto que es isomorfo en cuanto a estructura y en cuanto al orden con el conjunto de los números racionales, o lo que es lo mismo, existen un subconjunto R0 de R y una aplicación biyectiva f: Q ® R0, que verifica las siguientes propiedades:

El valor absoluto del cociente es igual al cociente de dividir el valor absoluto del numerador entre el valor absoluto del denominador f(a + b) = f(a) + f(b)

2.

f(a · b) = f(a) · f(b)

3.

Si a < b, entonces f(a) < f(b)

4.

1.

|a · b| = |a| · |b 3.

El valor absoluto del producto es el producto de los valores absolutos |a| – |b| £ |a – b|

Sea R0 el conjunto de los números reales de la forma [(a)], donde a es un número racional cualquiera. (La sucesión (a) es la sucesión constante cuyos términos son todos iguales a a). Definamos la aplicación f: Q ® R0 de la forma f(a) = [(a)] . Es evidente que esta aplicación es exhaustiva. Por otra parte, si a y b son números racionales distintos, las sucesiones constantes (a) y (b), no son equivalentes y los números reales [(a)] y [(b)] son distintos. Así pues a ¹ b implica que f(a) ¹ f(b), con lo que f es inyectiva. Así pues f es biyectiva. Además f(a) + f(b) = [(a)] + [(b)] = [(a + b)] = f(a + b) y f(a) · f(b) = [(a)] · [(b)] = [(a · b)] = f(a · b), y si a < b, entonces f(a) = [(a)] < [(b)] = f(b). Esto permite identificar cada número real de la forma [(a)] con el número racional a del cual es imagen por el isomorfismo f. Con esta identificación los números reales de R0, se llaman también números racionales. Los números reales de R ® R0 se llaman irracionales. de donde

|a| = |b + c| £ |b| + |c| = |b| + |a – b|

|a – b| ³ |a| – |b| En efecto, supongamos que a – b = c, de donde a = b + c y según la propiedad anterior

El valor absoluto de la diferencia de dos números reales no es menor que la diferencia de los valores absolutos del minuendo y del sustraendo

2.

El valor absoluto de la suma algebraica de varios números reales no es mayor que la suma de los valores absolutos de los sumandos |a + b| £ |a| + |b| En efecto sea a + b ³ 0. Entonces |a + b| = a + b £ |a| + |b|, ya que x £ |x|, para todo número real x. Si a + b < 0, entonces |a + b| = –(a + b) = (–a) + (–b) £ |a| +|b|.

1.

9. VALOR ABSOLUTO DE LOS NÚMEROS REALES

Se llama valor absoluto o módulo de un número real a, al número real no negativo definido como |a| = sup (a,–a). Es claro entonces que si a > 0, entonces |a| = a y si a < 0, entonces |a| = –a. Será |a| = 0 si y sólo si a = 0. De la definición se deduce que |a| = |–a| ,que a £ |a| y que |a| ³ 0 para todo número real a. La aplicación de R en R que hace corresponder a cada número su valor absoluto, tiene las siguientes propiedades:

Se llama valor absoluto o módulo de un número real a, al número real no negativo definido como |a| = sup (a,–a). Es claro entonces que si a > 0, entonces |a| = a y si a < 0, entonces |a| = –a. Será |a| = 0 si y sólo si a = 0. De la definición se deduce que |a| = |–a| ,que a £ |a| y que |a| ³ 0 para todo número real a. La aplicación de R en R que hace corresponder a cada número su valor absoluto, tiene las siguientes propiedades: 1.

El valor absoluto de la suma algebraica de varios números reales no es mayor que la suma de los valores absolutos de los sumandos |a + b| £ |a| + |b| En efecto sea a + b ³ 0. Entonces |a + b| = a + b £ |a| + |b|, ya que x £ |x|, para todo número real x. Si a + b < 0, entonces |a + b| = –(a + b) = (–a) + (–b) £ |a| +|b|.

9. VALOR ABSOLUTO DE LOS NÚMEROS REALES

Sea R0 el conjunto de los números reales de la forma [(a)], donde a es un número racional cualquiera. (La sucesión (a) es la sucesión constante cuyos términos son todos iguales a a). Definamos la aplicación f: Q ® R0 de la forma f(a) = [(a)] . Es evidente que esta aplicación es exhaustiva. Por otra parte, si a y b son números racionales distintos, las sucesiones constantes (a) y (b), no son equivalentes y los números reales [(a)] y [(b)] son distintos. Así pues a ¹ b implica que f(a) ¹ f(b), con lo que f es inyectiva. Así pues f es biyectiva. Además f(a) + f(b) = [(a)] + [(b)] = [(a + b)] = f(a + b) y f(a) · f(b) = [(a)] · [(b)] = [(a · b)] = f(a · b), y si a < b, entonces f(a) = [(a)] < [(b)] = f(b). Esto permite identificar cada número real de la forma [(a)] con el número racional a del cual es imagen por el isomorfismo f. Con esta identificación los números reales de R0, se llaman también números racionales. Los números reales de R ® R0 se llaman irracionales. 2.

El valor absoluto de la diferencia de dos números reales no es menor que la diferencia de los valores absolutos del minuendo y del sustraendo |a – b| ³ |a| – |b| En efecto, supongamos que a – b = c, de donde a = b + c y según la propiedad anterior |a| = |b + c| £ |b| + |c| = |b| + |a – b|

de donde

|a| – |b| £ |a – b|

Si a < b, entonces f(a) < f(b) f(a · b) = f(a) · f(b)

2.

f(a + b) = f(a) + f(b)

1.

El valor absoluto del producto es el producto de los valores absolutos |a · b| = |a| · |b

4.

3.

3.

El valor absoluto del cociente es igual al cociente de dividir el valor absoluto del numerador entre el valor absoluto del denominador

El conjunto de los números reales contiene un subconjunto que es isomorfo en cuanto a estructura y en cuanto al orden con el conjunto de los números racionales, o lo que es lo mismo, existen un subconjunto R0 de R y una aplicación biyectiva f: Q ® R0, que verifica las siguientes propiedades: a a = b b

8. ISOMORFISMO ENTRE Q Y UNA PARTE DE R...

Las demostraciones de 3 y 4 son triviales.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

124

Números reales. Topología de la recta real

10. TOPOLOGÍA DE LA RECTA REAL La topología es una rama de las matemáticas de desarrollo reciente. La topología no fue invención de un solo hombre. Algunos problemas topológicos se encuentran ya en la obra de Euler, de Möbius y de Cantor, e incluso la misma palabra “topología” había sido utilizada ya en 1847 por J. B. Listing (1808-1882) en el título de su libro Vorstudien zur Topologie (Introducción al Estudio de la Topología), pero si queremos fijar la fecha que señale los comienzos “oficiales” de esta rama de la matemática, ninguna sería más adecuada que la del año 1895, el año en que Poincaré publicó su Analysis Situs. En este libro se daba por primera vez un desarrollo sistemático del tema. La topología llamada algebraica surge con el famoso problema de los puentes de Koenigsberg, resuelto por Euler, cuestión en la que se trataba el asunto aparentemente trivial de si era posible pasar por los siete puentes que unen entre sí dos islas, y las orillas del río de la ciudad alemana de Koenigsberg, de forma que sólo se pasase una vez por cada puente. Euler conoció el problema y lo resolvió ante la academia rusa de San Petesburgo en 1736, demostrando que no es posible encontrar un camino que pase una sola vez por cada uno de los siete puentes. El primer paso en la resolución sistemática de este tipo de problemas fue dado por el francés Jordan en el siglo XIX, enunciando un teorema fundamental básico para el desarrollo de toda topología: “Toda curva cerrada en el plano, que no se cruza a sí misma, divide el plano en un interior y en un exterior”. Los términos cerrada, cruce, interior y exterior son, sin embargo, mucho más precisos en la topología que en el lenguaje usual. La topología da lugar a curiosos, y aparentemente inútiles problemas, como, por ejemplo, demostrar que una “rosquilla” es equivalente topológicamente a una “taza de café”, mediante una transformación continua (sin cortes), y no es equivalente a una “esfera” (que exigiría un corte). Es decir, que toda superficie simplemente conexa es equivalente a una esfera. Georg Cantor (1845-1918) creó los instrumentos básicos de la topología conjuntista o topología del análisis, como punto de acumulación, frontera, interior, etc., permitiendo el estudio sistemático de la topología de la recta real y del plano. Estudió los conjuntos de cardinal, infinito (con infinitos elementos) y demostró que el conjunto de los números reales no es numerable (Q, Z y N son numerables) existiendo, por tanto diferentes tipos de infinito.

11. LA RECTA REAL El conjunto R, de los números reales, desempeña un papel importantísimo en la matemática pues es el punto de partida de muchas abstracciones. Los elementos de R pueden representarse como puntos de una línea recta, definiéndose como recta real al conjunto de todos los puntos representativos de los números reales. Se considera como punto origen el 0 representativo del número real cero y por unidad la distancia entre el número real cero y el número real uno, es decir, u = d(0,1) = 1. La elección de u establece el sentido y se admite el postulado de continuidad en la recta real: “Entre los puntos de una recta y el conjunto de los números reales existe una aplicación biunívoca, tal que a cada punto de la recta le corresponde un número real, la abscisa respecto del sistema de referencia R = {0,u}, y recíprocamente.

12. INTERVALOS Y ENTORNOS EN LA RECTA REAL. COTAS Y EXTREMOS Sean a y b dos números reales tal que a £ b. Se dice que a está a la izquierda de b o que b está a la derecha de a. Bajo estas consideraciones: Se llama intervalo abierto de extremos a y b al conjunto de los números reales tales que a < x < b. Se le designa por (a,b). Si a = b, este intervalo no contiene ningún punto, y se dice que está vacío. Se llama intervalo cerrado de extremos a y b al conjunto de los números reales tales que a £ x £ b. Se le designa por [a,b]. Si a = b este intervalo se reduce a un punto a = b. Por tanto se considera a un punto como un intervalo cerrado.

TEMARIO DE MATEMÁTICAS. PRUEBA A

125

Volumen I. Matemáticas

126

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

como para todo conjunto A Ì R se cumple que A Ì A, también se puede decir que A es abierto si A = A.

Se llaman intervalos semiabiertos de extremos a y b al conjunto de números reales tal que a £ x < b designándose por [a,b) y al a < x £ b, designándose por (a,b]. El conjunto de los números reales x tal que a £ x (respectivamente a < x), es designado por [a, ¥) (respectivamente (a, ¥)). El conjunto de los números reales x tal que x £ a (respectivamente x < a), es designado por (–¥, a] (respectivamente (–¥, a)). El conjunto R de todos los números reales, designado por (–¥, ¥) es considerado como un intervalo abierto. Se llama entorno abierto centrado en x0 Î R a todo intervalo abierto de la forma (x0 –r, x0 + r), donde r es el radio del entorno y es un número real estrictamente positivo. Se llama entorno abierto de x0 Î R a todo intervalo abierto que contenga a x0. Habitualmente se entenderá que es centrado en x0 y se designará simplemente entorno de x0; en caso contrario se indicará. Se designará a los entornos de x0 de la forma Ux0 y, si fuese necesario, se indicará el radio del entorno escribiendo U(x0,r): U(x0,r) = (x0 – r, xo + r) = {x Î R, x0 – r < x < xo + r}= = {x Î R, – r < x – xo < r} = {x Î R, |x – xo| < r} o

o

Se dice que un conjunto A Ì R es abierto si todos sus puntos son interiores, es decir, si A Ì A, y o

Al conjunto de puntos interiores de A se le designa int(A) o A y se lee interior de A. Es claro que si un punto no pertenece al conjunto A, no puede ser interior de A. Sin embargo no basta que un punto pertenezca a A, para que sea interior a A. En efecto, para el conjunto [0,1], el punto 1 pertenece a dicho conjunto pero sin embargo no es interior al mismo ya que cualquier entorno de 1 (con r > 0), U1 = (1 – r, 1 + r) no está contenido en [0,1] ya que los puntos x, tales que 1 < x < 1 + r, pertenecen al entorno pero no al conjunto [0,1]. o

Sea A Ì R, se dice que x0 Î A, es un punto interior de A, si existe un entorno de x0 contenido en A.

13. CONJUNTOS ABIERTOS Y CERRADOS. PUNTOS INTERIOR, EXTERIOR Y FRONTERA. PROPIEDADES

Un conjunto A de puntos de R se denomina acotado superiormente si existe un número real k tal que k ³ x para todo x perteneciente a A, es decir, si existe un número real k que es mayor o igual que todos los elementos del conjunto A. A este valor k se le llama cota superior. Análogamente se dice que A está acotado inferiormente si existe un número real k’ tal que k’ £ x para todo x perteneciente a A, es decir, si existe un número real k’ que es menor o igual que todos los elementos del conjunto A. A este valor k’ se le llama cota inferior. Si un conjunto está acotado superior e inferiormente diremos que está acotado. Un conjunto A no acotado superiormente posee la propiedad de que cualquiera que sea el número a, existe un x perteneciente a A, talque x > a. Como para todo número real se puede encontrar un número mayor que él, sea a1 un número dado y un x1 Î A, tal que x1 > a1. Sea a2 > x1; existe un x2 Î A tal que x2 > a2, etc. Luego si A no está acotado superiormente, se puede hallar una sucesión (xn) formada por puntos de A, tal que por grande que sea a, todas las xn salvo un número finito de ellas son mayores que a. Propiedades análogas pueden definirse para un conjunto no acotado inferiormente o no acotado. Se llama extremo superior o supremo de A Ì R al valor real M Î R que sea la menor de las cotas superiores de A. Se llama extremo inferior o ínfimo de A Ì R que sea la mayor de las cotas inferiores de A. A estos extremos M y m se les llama máximo y mínimo si pertenecen al conjunto A.

Se llama entorno reducido de x0, y se escribe U*x0 o U*(xo,r) al conjunto U*x0 = Ux0 – {x0}, es decir, U*x0 = (x0 – r, xo) È (x0, xo + r) = {x Î R, 0 < |x – xo| < r}

que es el entorno de centro x0 y radio r, excluido el punto x0.

Un conjunto A de puntos de R se denomina acotado superiormente si existe un número real k tal que k ³ x para todo x perteneciente a A, es decir, si existe un número real k que es mayor o igual que todos los elementos del conjunto A. A este valor k se le llama cota superior. Análogamente se dice que A está acotado inferiormente si existe un número real k’ tal que k’ £ x para todo x perteneciente a A, es decir, si existe un número real k’ que es menor o igual que todos los elementos del conjunto A. A este valor k’ se le llama cota inferior. Si un conjunto está acotado superior e inferiormente diremos que está acotado. Un conjunto A no acotado superiormente posee la propiedad de que cualquiera que sea el número a, existe un x perteneciente a A, talque x > a. Como para todo número real se puede encontrar un número mayor que él, sea a1 un número dado y un x1 Î A, tal que x1 > a1. Sea a2 > x1; existe un x2 Î A tal que x2 > a2, etc. Luego si A no está acotado superiormente, se puede hallar una sucesión (xn) formada por puntos de A, tal que por grande que sea a, todas las xn salvo un número finito de ellas son mayores que a. Propiedades análogas pueden definirse para un conjunto no acotado inferiormente o no acotado. Se llama extremo superior o supremo de A Ì R al valor real M Î R que sea la menor de las cotas superiores de A. Se llama extremo inferior o ínfimo de A Ì R que sea la mayor de las cotas inferiores de A. A estos extremos M y m se les llama máximo y mínimo si pertenecen al conjunto A. que es el entorno de centro x0 y radio r, excluido el punto x0.

Se llama entorno reducido de x0, y se escribe U*x0 o U*(xo,r) al conjunto U*x0 = Ux0 – {x0}, es decir, U*x0 = (x0 – r, xo) È (x0, xo + r) = {x Î R, 0 < |x – xo| < r} U(x0,r) = (x0 – r, xo + r) = {x Î R, x0 – r < x < xo + r}= = {x Î R, – r < x – xo < r} = {x Î R, |x – xo| < r}

Se llaman intervalos semiabiertos de extremos a y b al conjunto de números reales tal que a £ x < b designándose por [a,b) y al a < x £ b, designándose por (a,b]. El conjunto de los números reales x tal que a £ x (respectivamente a < x), es designado por [a, ¥) (respectivamente (a, ¥)). El conjunto de los números reales x tal que x £ a (respectivamente x < a), es designado por (–¥, a] (respectivamente (–¥, a)). El conjunto R de todos los números reales, designado por (–¥, ¥) es considerado como un intervalo abierto. Se llama entorno abierto centrado en x0 Î R a todo intervalo abierto de la forma (x0 –r, x0 + r), donde r es el radio del entorno y es un número real estrictamente positivo. Se llama entorno abierto de x0 Î R a todo intervalo abierto que contenga a x0. Habitualmente se entenderá que es centrado en x0 y se designará simplemente entorno de x0; en caso contrario se indicará. Se designará a los entornos de x0 de la forma Ux0 y, si fuese necesario, se indicará el radio del entorno escribiendo U(x0,r):

13. CONJUNTOS ABIERTOS Y CERRADOS. PUNTOS INTERIOR, EXTERIOR Y FRONTERA. PROPIEDADES

Sea A Ì R, se dice que x0 Î A, es un punto interior de A, si existe un entorno de x0 contenido en A. o

Al conjunto de puntos interiores de A se le designa int(A) o A y se lee interior de A. Es claro que si un punto no pertenece al conjunto A, no puede ser interior de A. Sin embargo no basta que un punto pertenezca a A, para que sea interior a A. En efecto, para el conjunto [0,1], el punto 1 pertenece a dicho conjunto pero sin embargo no es interior al mismo ya que cualquier entorno de 1 (con r > 0), U1 = (1 – r, 1 + r) no está contenido en [0,1] ya que los puntos x, tales que 1 < x < 1 + r, pertenecen al entorno pero no al conjunto [0,1]. o

Se dice que un conjunto A Ì R es abierto si todos sus puntos son interiores, es decir, si A Ì A, y o

o

como para todo conjunto A Ì R se cumple que A Ì A, también se puede decir que A es abierto si A = A.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

126

Números reales. Topología de la recta real Los conjuntos abiertos tienen las siguientes propiedades: o

o

1.

El conjunto vacío (Æ) y R son conjuntos abiertos, ya que Æ = Æ y R = R

2.

Todo intervalo abierto es un conjunto abierto, ya que int((a,b)) = (a,b).

3.

Toda unión de una colección de conjuntos abiertos (finita o infinita) es un conjunto abierto. En efecto, sea {Ai}iÎI, donde I es un conjunto de subíndices finito o infinito y Ai es abierto para todo iÎI. Entonces È Ai iÎ I

es un conjunto abierto ya que, para todo

x Î È A i, iÎ I existe al menos un j Î I, tal que x Î Aj, y como Aj es abierto, entonces existe un Ux Ì Aj y por tanto Ux Ì È A i, iÎ I con lo que x es interior a È A i y È A i es abierto ya que todos sus puntos son interiores. iÎ I

4.

iÎ I

La intersección finita de una colección de conjuntos abiertos es un conjunto abierto. En efecto, sea {Ai}i=1...n una colección finita de conjuntos abiertos y x Î Ç A i, i=1,n por lo que x Î Ai, para todo i=1...n y por ser los Ai abiertos, existe un entorno U(x,ri) Ì Ai, para todo i=1...n. Si tomamos r = min{ri}i=1...n, el entorno U(x,r) pertenecerá a Ai para todos los valores de i desde 1 hasta n, por lo que pertenecerá a la intersección. De este modo al ser todos los puntos de la intersección puntos interiores, la intersección será un conjunto abierto.

Se dice que un conjunto A Ì R es cerrado si su conjunto complementario Ac es abierto. (Ac = R – A = = {x Î R, x Ï A}). Sea A Ì R; se dice que x0 Î R es exterior de A si existe un entorno de x0, Ux0, contenido en Ac, es decir si x0 Î int(Ac). Al conjunto de puntos exteriores se le designa por ext(A) y se lee exterior de A. Sea A Ì R; se dice que x0 Î R es frontera de A si todo entorno de x0, Ux0, contiene puntos de A y Ac. Al conjunto de puntos frontera de A se le designa front(A) y se lee frontera de A.



Teorema 12. Sea A Ì R, un conjunto cualquiera de números reales. Entonces int(A), ext(A) y front(A), son conjuntos disjuntos y además se verifica que R = int(A) È ext(A) È front(A). También se dice que constituyen una partición de R, es decir, que todo número real es exterior, interior o frontera de cualquier conjunto A, y sólo una de estas tres cosas.

En efecto sea A Ì R, cualquiera, entonces R = int(A) È ext(A) È front(A). Veremos ambos sentidos de la igualdad. Está claro que int(A) È ext(A) È front(A) Ì R, puesto que un punto cualquiera que pertenezca a int(A) È ext(A) È front(A) puede pertenecer o no a A, pero siempre pertenecerá a R. Veamos ahora que R Ì int(A) È ext(A) È front(A). Sea x Î R y supongamos que x no es ni punto interior ni exterior de A, por lo que todo entorno de x, no estará incluido ni en A, ni en Ac, siendo su intersección con los mismos no vacía. Así pues, x será un punto frontera de A. De la misma forma podemos razonar si x no pertenece al interior o frontera de A, con lo que pertenecería al exterior o si x no pertenece al exterior o frontera de A, con lo que pertenecería al interior. Además los tres conjuntos son disjuntos ya que ningún punto puede pertenecer a dos de ellos a la vez.

Propiedades: 1.

Sean A y B conjuntos de R, tal que A Ì B, entonces int(A) Ì int(B) y ext(B) Ì ext(A).

2.

Para todo conjunto A incluido en R, se verifica que int(A) es un conjunto abierto, ext(A) es un conjunto abierto y front(A) es un conjunto cerrado.

TEMARIO DE MATEMÁTICAS. PRUEBA A

127

Volumen I. Matemáticas

128

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

14. PUNTO DE ACUMULACIÓN Y CONJUNTO DERIVADO



Teorema 13. Un conjunto A de R es cerrado si y sólo sí coincide con su adherencia, es decir, si A = A.

Sea A un conjunto de puntos de R. Se dice que un punto x0 es de acumulación de A si todo intervalo abierto que contiene a x0 contiene un punto de A, distinto de x0. Consideremos por ejemplo el conjunto A de R, dado por –1 A = (1,2] È {3} È{ : n Î Z}. n Podemos observar que 0 es un punto de acumulación, ya que todo entorno suyo contiene puntos de la 1 forma , que pertenecen a A. También todos los puntos de [1,2] son puntos de acumulación, mientras que n el 3 no es punto de acumulación. Este ejemplo muestra que un punto de acumulación de A puede no pertenecer a A. El conjunto de puntos de acumulación de A, se llama conjunto derivado de A y se designa por A’. Sea A un conjunto de puntos de R que admite un punto de acumulación x0. Sea e1 un número real positivo. Por ser x0 punto de acumulación, en el intervalo (x0 – e1, x0 + e1) existe al menos un punto de A distinto de x0. Sea ese punto x1. Si tomamos otro número positivo e2 0, tal que (x0 – e, x0 + e) Ì C. Pero si n es suficientemente grande, como bn – an tiende a cero se tendrá que In Ì (x0 – e, x0 + e) Ì C, aunque A Ç In, parte de A contenida en In, está contenido en (x0 – e ,x0 + e ) y por tanto en el intervalo abierto C de la familia B. Así An está recubierto por C perteneciente a la familia B contrariamente a lo que habíamos supuesto, con lo cual el teorema queda demostrado. Supongamos que A tiene un número infinito de puntos, que los intervalos de B recubren a A y que la propiedad es falsa. Entonces si se fracciona A en dos conjuntos A’ y A’’, al menos uno no puede ser recubierto por un número finito de intervalos de B, pues si ocurriera lo contrario la propiedad sería cierta. Como A está acotado existe un intervalo I0 = [a,b] en el que A está contenido. a+b Sea b1 = , 2 y tomemos los intervalos cerrados [a,b1] y [b1,b], cuya unión nos da el intervalo [a,b]. Tomemos A’ = A Ç [a,b1] y A’’ = A Ç [b1,b], que serán intervalos cerrados al ser intersección de cerrados. Designemos por A1 uno de los dos conjuntos A’ y A’’ donde la propiedad no se cumple y por I1 el intervalo que lo contiene. Repitiendo esta operación se obtiene una familia A de intervalos cerrados, situados en los intervalos n æb – a ö In = [an,bn], de longitud bn – an =ç n ÷, è 2 ø CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

130

TEMA

7 Aproximación de números. Errores. Notación científica

Emilio M. Pina Coronado

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

132

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

TIPOS DE ERRORES 2.1. Error absoluto 2.2. Error relativo

3.

ERROR ABSOLUTO Y RELATIVO DE UN NÚMERO EN EL REDONDEO

4.

EFECTO DE LA MULTIPLICACIÓN DE UN NÚMERO EXACTO Y SU APROXIMADO POR OTRO NÚMERO

5.

COTA SUPERIOR DEL ERROR RELATIVO

6.

OPERACIONES CON NÚMEROS APROXIMADOS 6.1. Suma y resta de números aproximados 6.2. Producto de números aproximados 6.3. Producto de dos números aproximados 6.4. División de un número aproximado entre un número exacto 6.5. División de un número exacto entre un número aproximado 6.6. División de dos números aproximados 6.7. Potenciación de números aproximados 6.8. Raíz m - ésima de un número aproximado

7.

NOTACIÓN CIENTÍFICA 7.1. Orden de magnitud de un número 7.2. Notación científica

NOTACIÓN CIENTÍFICA 7.1. Orden de magnitud de un número 7.2. Notación científica

7.

OPERACIONES CON NÚMEROS APROXIMADOS 6.1. Suma y resta de números aproximados 6.2. Producto de números aproximados 6.3. Producto de dos números aproximados 6.4. División de un número aproximado entre un número exacto 6.5. División de un número exacto entre un número aproximado 6.6. División de dos números aproximados 6.7. Potenciación de números aproximados 6.8. Raíz m - ésima de un número aproximado

6.

COTA SUPERIOR DEL ERROR RELATIVO

5.

EFECTO DE LA MULTIPLICACIÓN DE UN NÚMERO EXACTO Y SU APROXIMADO POR OTRO NÚMERO

4.

ERROR ABSOLUTO Y RELATIVO DE UN NÚMERO EN EL REDONDEO

3.

TIPOS DE ERRORES 2.1. Error absoluto 2.2. Error relativo

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

132

Aproximación de números. Errores. Notación científica

1. INTRODUCCIÓN La medida de una cantidad nunca será completamente exacta, sino que siempre contaremos con una cierta imprecisión debida, por una parte, a la imperfección de los instrumentos de medida, y por otra, a la mayor o menor habilidad del experimentador o a las circunstancias en que se verifica la medición. A estas imprecisiones se les denomina errores y podemos distinguir entre ellos dos clases:



Errores sistemáticos: Debidos a defectos en la construcción de instrumentos de medida, se producen en todas y cada una de las medidas que se realicen con ese instrumento.



Errores accidentales: Debidos a defectos en un proceso de medida concreto, podemos distinguir dentro de los errores accidentales.

Ø Ø Ø

Equivocaciones: Debidas a imprecisiones en la toma y/o manejo de los datos. Truncación. Redondeo: Debidos al método de resolución del problema, bajo el supuesto de que no existan equivocaciones.

2. TIPOS DE ERRORES Llamaremos número exacto, A, a aquel que representa el valor íntegro de la cantidad a medir; mientras que llamaremos número aproximado, B, de un número exacto, A, a aquel que reemplaza a A debido a imperfecciones en nuestra capacidad de observar o de los instrumentos de medida. La aproximación puede darse por exceso (si B > A) o por defecto (si B < A).

2.1. Error absoluto Definimos el error absoluto (Ea) como la diferencia entre el valor exacto (número exacto A) y el valor aproximado (número aproximado B) que otorgamos al medir una cantidad. Ea = A – B en consecuencia, si el Ea > 0 la aproximación se ha realizado por defecto, y si el Ea < 0 la aproximación se ha realizado por defecto. Generalmente no se precisa si la aproximación se ha realizado por exceso o por defecto, por lo que tomamos como error absoluto el correspondiente al valor absoluto del error absoluto (|Ea|). Es frecuente que no conozcamos el valor exacto de lo que se mide y entonces utilizamos lo que se denomina cota del error absoluto (ka), también llamado límite del error absoluto, que entenderemos como el valor máximo que permitiremos al error. Así, por ejemplo, sabemos que el número p = 3,14159265..., pero con nuestros alumnos y en cálculos ordinarios empleamos 3,14 o, como máximo, 3,141; lo que estamos haciendo es una aproximación por defecto (B < A) y el error cometido es: Ea = 3,14,159265... – 3.141 = 0,0005926... y podemos observar que ese valor es inferior, por ejemplo, a 0,001, luego podemos afirmar que la cota de error ka < 10–3 y, en consecuencia diremos que Ea < 10–3. El grado del exponente de la potencia de 10 que aparece en la cota de error se denomina grado de aproximación (en nuestro caso las milésimas), y así el número exacto p podemos decir que: 3,141 < p < 3,142 donde 3,141 correspondería a una aproximación por defecto y 3,142 a una aproximación por exceso. Generalizando el razonamiento anterior, dada la aproximación B con n cifras decimales de un número exacto A, cometemos en valor absoluto un error inferior a una unidad del orden de las cifras de B. |Ea| < 10–n –n B < A < B + 10 (Aproximación por exceso) B – 10–n < B < A (Aproximación por defecto) B – 10–n < A < B + 10–n TEMARIO DE MATEMÁTICAS. PRUEBA A

133

Volumen I. Matemáticas

134

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

2

Llamamos redondeo al proceso de buscar la aproximación decimal en la que el error es menor. Para ello planteamos: 1 |Ea| < · 10–n 2 Habrá que tener en cuenta la regla del redondeo que nos indica que si redondeamos a una cifra determinada añadiremos una unidad si la siguiente es mayor o igual a 5 y en caso contrario mantendremos la unidad. Hechas estas precisiones, llamaremos cifras exactas de un número aproximado a las cifras enteras o decimales hasta la que nos da el grado de aproximación inclusive. La cota de error que hemos cometido en el redondeo será:

100– 5+1

= 5×10–5.

B = 3 · 100 + 1 · 10–1 + 4 · 10–2 + 1 · 10–3 + 5 · 10–4 + 9 · 10–5 = 3,14159 » 3,1416 a 10 ya que como bm+1 ³ , en nuestro caso 9 ³ , tomamos cm = bm+1. 2 2

B = b1an + b2an–1 + … + cman–m+1 a a a n– m+1 donde cm = bm si bm+1 < , o bien cm = bm + 1 cuando bm + 1 ³ , así una cota de error cometido será . 2 2 2 Volviendo al ejemplo del número p, si lo queremos redondear a 5 cifras significativas:

A = b1an + b2an–1 + … + bkan–k+1 donde los bi son las cifras de su representación en base a, así, por ejemplo, el número p podemos escribirlo como: A = p = 3 · 100 + 1 · 10–1 + 4 · 10–2 + 1 · 10–3 + ... si ahora queremos redondear para tener m cifras significativas el número redondeado será:

2.2. Error relativo

Es el cociente que resulta de dividir el error absoluto por el valor verdadero de la medición, es decir, es la relación entre el error absoluto y el número exacto A. E Er = a A Podemos expresar un número A como:

nos indica cómo se reparte el error absoluto entre el valor exacto y nos da una idea de la aproximación con que realizamos la medida, cosa que no hace el error absoluto, ya que calcular el Er supone la comparación entre el error cometido y la cantidad sobre la que se comete. El Ea es una magnitud de la misma naturaleza que la que se ha medido, A, mientras que el Er, por ser el cociente de dos cantidades homogéneas, es un número abstracto, no tiene unidades ya que expresa sólo una relación. El Er es el que da idea de la precisión de la medida y no el absoluto, pues la precisión no sólo depende de la aproximación de la medida, sino también del valor total de la cantidad medida. Como expresiones de error también se suele utilizar el tanto por ciento, cuyo valor es cien veces el del error relativo, y el error logarítmico que vendría dado por:

3. ERROR ABSOLUTO Y RELATIVO DE UN NÚMERO EN EL REDONDEO log

æA – E ö æ E ö B a ÷ = logç1– a ÷ = log(1– Er ) = logç è A ø è Aø A

nos indica cómo se reparte el error absoluto entre el valor exacto y nos da una idea de la aproximación con que realizamos la medida, cosa que no hace el error absoluto, ya que calcular el Er supone la comparación entre el error cometido y la cantidad sobre la que se comete. El Ea es una magnitud de la misma naturaleza que la que se ha medido, A, mientras que el Er, por ser el cociente de dos cantidades homogéneas, es un número abstracto, no tiene unidades ya que expresa sólo una relación. El Er es el que da idea de la precisión de la medida y no el absoluto, pues la precisión no sólo depende de la aproximación de la medida, sino también del valor total de la cantidad medida. Como expresiones de error también se suele utilizar el tanto por ciento, cuyo valor es cien veces el del error relativo, y el error logarítmico que vendría dado por: log

æ A – Ea ö æ E ö B ÷ = logç1– a ÷ = log(1– Er ) = logç è A ø è Aø A

3. ERROR ABSOLUTO Y RELATIVO DE UN NÚMERO EN EL REDONDEO Podemos expresar un número A como:

Es el cociente que resulta de dividir el error absoluto por el valor verdadero de la medición, es decir, es la relación entre el error absoluto y el número exacto A. Ea A

A = b1an + b2an–1 + … + bkan–k+1 donde los bi son las cifras de su representación en base a, así, por ejemplo, el número p podemos escribirlo como: A = p = 3 · 100 + 1 · 10–1 + 4 · 10–2 + 1 · 10–3 + ... si ahora queremos redondear para tener m cifras significativas el número redondeado será: Er =

2.2. Error relativo

B = b1an + b2an–1 + … + cman–m+1 a a a n– m+1 donde cm = bm si bm+1 < , o bien cm = bm + 1 cuando bm + 1 ³ , así una cota de error cometido será . 2 2 2 Volviendo al ejemplo del número p, si lo queremos redondear a 5 cifras significativas:

Llamamos redondeo al proceso de buscar la aproximación decimal en la que el error es menor. Para ello planteamos: 1 |Ea| < · 10–n 2 Habrá que tener en cuenta la regla del redondeo que nos indica que si redondeamos a una cifra determinada añadiremos una unidad si la siguiente es mayor o igual a 5 y en caso contrario mantendremos la unidad. Hechas estas precisiones, llamaremos cifras exactas de un número aproximado a las cifras enteras o decimales hasta la que nos da el grado de aproximación inclusive. B = 3 · 100 + 1 · 10–1 + 4 · 10–2 + 1 · 10–3 + 5 · 10–4 + 9 · 10–5 = 3,14159 » 3,1416 a 10 ya que como bm+1 ³ , en nuestro caso 9 ³ , tomamos cm = bm+1. 2 2 100– 5+1 La cota de error que hemos cometido en el redondeo será: = 5×10–5. 2

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

134

Aproximación de números. Errores. Notación científica Si la cota del error absoluto que permitíamos para el número antes de redondearlo era ka ahora esta se ve modificada y tenemos k*a. a n– m+1 k*a = ka + 2 así la nueva cota para el error relativo vendría dado por: a n– m+1 k + * n– m+1 a k a n– m+1 2 = ka + a k*r = a = = kr + = A A A 2A 2A kr +

a n– m+1 a n– m+1 £ k + = r 2b1a n 2( b1a n + b 2a n–1+...+b ka n– k+1) kr +

a –m+1 1 £ kr + 2b1 2b1a m–1

y éste es el valor que podemos tomar como cota máxima del error relativo.

4. EFECTO DE LA MULTIPLICACIÓN DE UN NÚMERO EXACTO Y SU APROXIMADO POR OTRO NÚMERO Si un número exacto A y su aproximado B se multiplica por un número N no nulo, el error absoluto queda multiplicado por dicho número, mientras que el error relativo permanece constante. |Ea| = |A – B| el error absoluto tras la multiplicación, E*a, vendría dado por: |E*a| = |NA – NB| = |N(A – B)| = |N||A – B| = |N||Ea| y en cuanto al error relativo E*r =

E*a NA

=

N Ea = Er NA

Siempre podemos hacer enteras todas las cifras exactas de un número aproximado, multiplicándolo por 10n, donde n es el número de cifras decimales exactas que tiene el número, y así obtendremos Ea como un número entero y, como hemos visto, Er permanece invariable.

5. COTA SUPERIOR DEL ERROR RELATIVO Debido a que, normalmente, desconocemos el valor de A y, en consecuencia, también desconocemos el Ea, entonces tomamos como error relativo una cota superior del mismo. Se nos presentan dos casos: 1.

Conocido el valor aproximado, B, del número exacto, A, y una cota superior, k, del Ea, queremos encontrar una cota superior del Er. Al ser k cota superior del Ea podemos escribir que k > |Ea|, luego: E k Ea = |A – B| < k Þ B – k < A < B + k Þ Er = a < A B– k que será cota superior del Er.

2.

Conocido el valor aproximado por exceso B de un número exacto A y una cota superior k* del Er queremos encontrar una cota superior del error absoluto. E Er = a Þ Ea = A × Er A y como B > A y k* > Er Þ Ea < B · k* y constituiría una cota superior del Ea.

TEMARIO DE MATEMÁTICAS. PRUEBA A

135

Volumen I. Matemáticas

136

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Para desarrollar este punto convendremos en llamar A, B, C, ... a los números exactos y A ± a, B ± b, C ± c, … a los números aproximados, empleando el signo (+) cuando se trate de una aproximación por exceso y el signo (–) cuando la aproximación sea por defecto. Emplearemos a*, b*, c*, … para representar los errores absolutos y a’, b’, c’, … para sus correspondientes cotas superiores, y las letras griegas a, b, g, … para la representación de los errores relativos, así como a’, b’, g’, … para las cotas superiores de los mismos. En el cálculo de errores se nos plantean dos problemas fundamentales:

A)

Conocidas las aproximaciones de los datos, encontrar la aproximación del resultado. Para abordar la solución de este tipo de problemas hemos de basarnos en el siguiente teorema: “Una cota superior del Er de un número aproximado es 1 a ×10n–1 donde a es la primera cifra significativa de la izquierda y n el número de cifras exactas”. E Er = a y como habíamos indicado si multiplicamos por 10n (siendo n el número de cifras exactas del A 1 número A) podemos escribir que Er < y como, también hemos visto, el Er permanece invariable. A 1 1 n–1 . A > a · 10 , ya que a es la primera cifra de A, luego: Er < < A a ×10n–1

6. OPERACIONES CON NÚMEROS APROXIMADOS

3 · 103 £ 1 · 10n–1 Como 3 < 1; 3 = n – 1, luego n = 4 Habrá que tomar cuatro cifras exactas, con lo que el valor a utilizar será 1.414. 1 1 £ 1×10n–1 b ×10m

Sigamos con el ejemplo anterior. ¿Con cuántas cifras hay que tomar 2 para que Er =

1 ? 3×10–3

Si b < a Þ m = n – 1 Þ n = m + 1 Si b = a Þ m = n – 1 Þ n = m + 1 Si b > a Þ m + 1 = n – 1 Þ n = m + 2

Veamos un ejemplo: 2 = 1,4142136... está aproximado con un Ea = 10–3 ¿Cuál es la cota superior del error relativo? 2 tiene una cifra entera (1) y el Ea tiene cuatro cifras exactas (1 entera + 3 decimales), luego: 1 Er < = 10–3 1×104–1 1 1 ³ a ×10n–1 b ×10m

Conocida la aproximación del resultado, fijar con qué aproximación habremos de tomar los datos. Ahora utilizaremos el teorema recíproco del anterior, según el cual “Si la cota superior del Er aplicable a un número A es 1 b ×10m A tiene n cifras exactas si a ³ b (siendo a la primera cifra significativa del número A) o bien A tiene n+1 cifras exactas cuando a < b”. Si n es el número de cifras exactas con el que hay que calcular el número para que su 1 b ×10m B)

Conocida la aproximación del resultado, fijar con qué aproximación habremos de tomar los datos. Ahora utilizaremos el teorema recíproco del anterior, según el cual “Si la cota superior del Er aplicable a un número A es 1 b ×10m A tiene n cifras exactas si a ³ b (siendo a la primera cifra significativa del número A) o bien A tiene n+1 cifras exactas cuando a < b”. Si n es el número de cifras exactas con el que hay que calcular el número para que su 1 Er = b ×10m Er =

B)

2 tiene una cifra entera (1) y el Ea tiene cuatro cifras exactas (1 entera + 3 decimales), luego: 1 = 10–3 1×104–1 1 1 ³ a ×10n–1 b ×10m

Er <

Si b < a Þ m = n – 1 Þ n = m + 1 Si b = a Þ m = n – 1 Þ n = m + 1 Si b > a Þ m + 1 = n – 1 Þ n = m + 2

Veamos un ejemplo: 2 = 1,4142136... está aproximado con un Ea = 10–3 ¿Cuál es la cota superior del error relativo? A > a · 10n–1, ya que a es la primera cifra de A, luego: Er <

1 1 . < A a ×10n–1

Sigamos con el ejemplo anterior. ¿Con cuántas cifras hay que tomar 2 para que Er =

número A) podemos escribir que Er <

1 y como, también hemos visto, el Er permanece invariable. A 1 1 n–1 £ 1×10 b ×10m

1 ? 3×10–3

Conocidas las aproximaciones de los datos, encontrar la aproximación del resultado. Para abordar la solución de este tipo de problemas hemos de basarnos en el siguiente teorema: “Una cota superior del Er de un número aproximado es 1 a ×10n–1 donde a es la primera cifra significativa de la izquierda y n el número de cifras exactas”. Ea y como habíamos indicado si multiplicamos por 10n (siendo n el número de cifras exactas del A Er =

3 · 103 £ 1 · 10n–1 Como 3 < 1; 3 = n – 1, luego n = 4 Habrá que tomar cuatro cifras exactas, con lo que el valor a utilizar será 1.414.

6. OPERACIONES CON NÚMEROS APROXIMADOS

Para desarrollar este punto convendremos en llamar A, B, C, ... a los números exactos y A ± a, B ± b, C ± c, … a los números aproximados, empleando el signo (+) cuando se trate de una aproximación por exceso y el signo (–) cuando la aproximación sea por defecto. Emplearemos a*, b*, c*, … para representar los errores absolutos y a’, b’, c’, … para sus correspondientes cotas superiores, y las letras griegas a, b, g, … para la representación de los errores relativos, así como a’, b’, g’, … para las cotas superiores de los mismos. A)

En el cálculo de errores se nos plantean dos problemas fundamentales:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

136

Aproximación de números. Errores. Notación científica

6.1. Suma y resta de números aproximados El Ea de la suma de números aproximados es la suma de sus errores absolutos. Sean los números aproximados A + a, B + b, C + c, ..., K + k, al estar tomados por exceso, su suma aproximada también lo será por exceso. Sea N = A + B + C + ... + K Sea N’ = (A + a) + (B + b) + (C + c) + … + (K + k) |Ea| = |N’ – N| = |[(A + a) + (B + b) + … + (K + k)] – [A + B + ... + K] = =a+b+…+k Consecuentemente, como el error absoluto cometido en cada número es menor que su correspondiente cota superior, escribiremos: Ea = a + b + … + k < a’ + b’ + … + k’ Una cota superior de la suma de números aproximados es el producto de la mayor de las cotas superiores de cada uno de los sumando por el número de sumandos. Así, por ejemplo, supongamos que en la expresión anterior k’ es la mayor de las cotas superiores Þ Þ a’ < k’, b’ < k’, … k’ = k’ Þ Ea < k‘ + k’ + … + k’ Þ Ea < n · k’ Desde un punto de vista práctico, podemos formular la siguiente regla: “El error absoluto de la suma de números aproximados tiene una cota superior cuyo valor es 10n · k’ , siendo k’ la mayor de las cotas superiores de los sumandos y n el número de sumandos”. Así, cuando tenemos números con distintas aproximaciones, la suma tendrá 1, 2, 3,... cifras decimales exactas menos que el sumando que tenga menos cifras decimales exactas según el número de sumandos sea menor que 10, menor que 100,... Y, por el contrario, para calcular la suma de varios números aproximados con un error menor que 1 10n realizaremos la suma tomando 1, 2, 3,... cifras decimales más que n, dependiendo de que se trate de sumar menos de 10 sumandos, menos de 100 sumandos, menos de 1000,... Al realizar la suma obtendremos así n cifras exactas siendo la última inexacta. Veamos un ejemplo. Queremos sumar p + e + 0,0057 con un error absoluto menor que una milésima. 3,1415 2,7182 + 0,0057 5,8654

Hemos escrito los sumandos aproximando hasta las diezmilésimas (una cifra decimal más), al realizar la suma la última cifra (4) será inexacta. La resta tiene un tratamiento análogo al de la suma, pero hemos de tener en cuenta los siguientes lemas: 1º.

|Ea| = |[(A + a) – (B + b)] – (A – B) = a + b| estando A y B aproximados en sentido contrario.

2º.

Como a < a’ y b < b’ Þ Ea = a + b < a’ + b’

3º. Si b’ < a’ Þ Ea < a’ + b’ < 2a’ < 10a’ Los problemas con resta, tanto directo como inverso, se afrontan con las mismas estrategias que antes se han descrito. TEMARIO DE MATEMÁTICAS. PRUEBA A

137

Volumen I. Matemáticas

138

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Dado el producto de dos números aproximados, una cota superior del Er del mismo es la suma de los límites superiores de los factores. Demostrémoslo. Si llamamos (A + a) y (B + b) a dos números aproximados por exceso, el Ea cometido en el producto de estos números vendrá dado por: Ea = [(A+ a) · (B + b)] – AB = Ab + aB + ab

6.2. Producto de números aproximados

Estudiemos el producto de un número exacto por otro aproximado. “Una cota superior del Er del producto de un número exacto y un número aproximado es la misma que el del número aproximado”. Ea = [A · (B + b)] – A · B = Ab Ab b Er = = =b AB B

6.3. Producto de dos números aproximados

Si hemos acordado llamar b’ a la cota superior del Er, como b < b’, entonces Er < b’. Si suponemos que la aproximación es por defecto entonces:

Si lo que queremos es que al realizar un producto este tenga n cifras exactas, habremos de tomar el número aproximado con n + 1 cifras exactas si la primera cifra significativa de la izquierda del producto es mayor que la primera cifra significativa de la izquierda del número aproximado, y tomaremos el número aproximado con n cifras cuando la primera cifra significativa de la izquierda del producto es menor o igual que la primera cifra significativa de la izquierda del número aproximado. Ea = A · B – A ·(B – b) = Ab Ab b Er = = = b < b’ AB B

& El producto tiene tres cifras exactas, 3,141 x 25 = 3,141 x 25 = 78,525

Desde un punto de vista práctico podemos aplicar la siguiente regla: “Si el factor aproximado tiene m cifras exactas, el producto tendrá m cifras significativas si la primera cifra significativa de la izquierda del número aproximado es mayor o igual que la primera cifra significativa de la izquierda del producto, y tendrá m – 1 si la primera cifra significativa de la izquierda del número aproximado es menor que la primera cifra significativa del producto” Para demostrarlo llamaremos u a la primera cifra significativa de la izquierda del número aproximado y v a la primera cifra significativa del producto. Llamaremos m al número de cifras que tiene el número aproximado y n al número de cifras que tiene el producto. 1 1 £ Þ 7×10n–1 ³ 3×103 Þ n – 1 = 3 – 1 Þ n = 3 3×103 7×10n–1

Veamos un ejemplo. Multipliquemos un número aproximado (p = 3,141) por un número exacto (25). Al realizar la multiplicación obtenemos: 3,141 x 25 = 78,525. Veamos ahora cuántas de esas cifras son exactas. Si u ³ v Þ n – 1 = m – 1 Þ n = m cifras exactas. Si u < v Þ n – 1 = m – 2 Þ n = m – 1 cifras exactas.

A · uabc … k = va’b’c’ … k’

1 1 £ Þ u ×10m–1 ³ v ×10n–1 u ×10m–1 v ×10n–1

1 1 £ Þ u ×10m–1 ³ v ×10n–1 u ×10m–1 v ×10n–1 Er <

Er <

A · uabc … k = va’b’c’ … k’

Si u ³ v Þ n – 1 = m – 1 Þ n = m cifras exactas. Si u < v Þ n – 1 = m – 2 Þ n = m – 1 cifras exactas.

Desde un punto de vista práctico podemos aplicar la siguiente regla: “Si el factor aproximado tiene m cifras exactas, el producto tendrá m cifras significativas si la primera cifra significativa de la izquierda del número aproximado es mayor o igual que la primera cifra significativa de la izquierda del producto, y tendrá m – 1 si la primera cifra significativa de la izquierda del número aproximado es menor que la primera cifra significativa del producto” Para demostrarlo llamaremos u a la primera cifra significativa de la izquierda del número aproximado y v a la primera cifra significativa del producto. Llamaremos m al número de cifras que tiene el número aproximado y n al número de cifras que tiene el producto.

Veamos un ejemplo. Multipliquemos un número aproximado (p = 3,141) por un número exacto (25). Al realizar la multiplicación obtenemos: 3,141 x 25 = 78,525. Veamos ahora cuántas de esas cifras son exactas. 1 1 Þ 7×10n–1 ³ 3×103 Þ n – 1 = 3 – 1 Þ n = 3 3 £ 3×10 7×10n–1

& El producto tiene tres cifras exactas, 3,141 x 25 = 3,141 x 25 = 78,525 Ea = A · B – A ·(B – b) = Ab Ab b = = b < b’ AB B Er =

Si lo que queremos es que al realizar un producto este tenga n cifras exactas, habremos de tomar el número aproximado con n + 1 cifras exactas si la primera cifra significativa de la izquierda del producto es mayor que la primera cifra significativa de la izquierda del número aproximado, y tomaremos el número aproximado con n cifras cuando la primera cifra significativa de la izquierda del producto es menor o igual que la primera cifra significativa de la izquierda del número aproximado. Si hemos acordado llamar b’ a la cota superior del Er, como b < b’, entonces Er < b’. Si suponemos que la aproximación es por defecto entonces: Ea = [A · (B + b)] – A · B = Ab Ab b = =b AB B

Er =

6.3. Producto de dos números aproximados

Dado el producto de dos números aproximados, una cota superior del Er del mismo es la suma de los límites superiores de los factores. Demostrémoslo. Si llamamos (A + a) y (B + b) a dos números aproximados por exceso, el Ea cometido en el producto de estos números vendrá dado por: Ea = [(A+ a) · (B + b)] – AB = Ab + aB + ab

Estudiemos el producto de un número exacto por otro aproximado. “Una cota superior del Er del producto de un número exacto y un número aproximado es la misma que el del número aproximado”.

6.2. Producto de números aproximados

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

138

Aproximación de números. Errores. Notación científica y, en consecuencia, el Er vendría dado por: E Ab + aB + ab b a ab Er = a = = + + = a + b + ab AB AB B A AB teniendo en cuenta que los errores relativos a y b son números decimales muy pequeños, su producto será aún más pequeño, y atendiendo a sus cotas superiores podemos afirmar que Er < a’ + b’. Nos podemos plantear el siguiente problema: Si tenemos dos números aproximados uabc y u’a’b’c’, cada uno de los cuales tiene m cifras exactas, queremos determinar con cuántas cifras exactas resultará el producto de esos dos números aproximados. 1 1 1 1 u + u' uu' Er < ×10m–1 ³ v ×10n–1 n–1 Þ m–1 + m–1 £ n–1 Þ m–1 £ ' 10 u ×10 u× v ×10 uu'×10 v ×10 u + u' Si

uu' ³ v Þ m – 1 = n – 1 Þ n = m cifras exactas. u + u'

Si

uu' < v Þ m – 1 = n cifras exactas. u + u'

Si lo que nos planteamos es que queremos el producto con n cifras exactas habremos de afrontar el problema inverso y, en consecuencia tomaremos en los factores el mismo número de cifras exactas que deseamos para el producto si se cumple que uu' ³v u + u' y tomaremos una cifra más en los factores cuando uu' b, y considerando la situación natural como un caso particular en el que a < b. Para una construcción formal de los números enteros hemos de recurrir, entre otras vías, al establecimiento de una relación de equivalencia sobre N · N donde se utiliza como operación la suma usual de números naturales, que constituye una partición de N · N.

Ya se había comentado que el hombre hizo uso de los racionales antes que de los números enteros. Una vez más, la introducción está ligada a la resolución de problemas de la vida real relacionados con la medida, ya que se hace necesario representar partes de la unidad elegida como patrón. Aunque se supone que su utilización fue anterior, los hombres de la Edad de Bronce pueden considerarse como los pioneros en el uso de fracciones, las primeras referencias escritas que se tiene de los racionales aparecen en los Papiros del Rhin datados en el 1550 a.C. donde aparece una notación para representar fracciones del tipo 1/n. También en Mesopotamia se utilizaron las fracciones y dado que este pueblo poseía un sistema de numeración posicional los acuerdos tomados a propósito de las fracciones y su cálculo son bastante similares a los que se utilizan en la actualidad. Por otra parte llama la atención la no consideración de las fracciones por parte de los griegos argumentando razones filosóficas como “no pudiendo dividir la unidad sin perder por ello su unidad, el número racional no puede ser un número, y se llamará razón de números”. A partir de finales del siglo XV y comienzos del siglo XVI se adopta la forma que aún conservamos de escribir las fracciones, expresando cada cantidad por un número m de unidades que contiene y la especie de estas unidades, el número n de ellas que contiene la unidad fundamental, representándolo bien por el par m (m.n) bien con la notación donde a m se le denomina numerador que nos indica la parte de la unidad fundan mental y n que se denomina denominador y nos indica las unidades contenidas en la unidad de referencia. (a, b) Â (a’, b’) Û a + b’ = b + a’

Esto nos permite definir los números enteros como el conjunto cociente Z = N · N/Â donde, para cada clase de equivalencia su representante canónico vendría dado por:

3.2. Los números racionales

Sea (a, b) Î N · N 1. Si a < b Þ $ n Î N* |a + n = b Þ (a, b) Â (0, n) 2. Si a > b Þ $ m Î N* |a = b + m Þ (a, b) Â (m, 0) 3. Si a = b Þ a + 0 = b + 0 Þ (a, b) Â (0, 0)

Podemos entender por números enteros el menor anillo que contiene al conjunto de los números naturales. escogiendo como representantes canónicos los pares que contengan una componente nula, e introduciendo la notación usual para los números enteros tenemos: (n, 0) = +n (0, m) = –m (0, 0) = 0

escogiendo como representantes canónicos los pares que contengan una componente nula, e introduciendo la notación usual para los números enteros tenemos: (n, 0) = +n (0, m) = –m (0, 0) = 0 Sea (a, b) Î N · N 1. Si a < b Þ $ n Î N* |a + n = b Þ (a, b) Â (0, n) 2. Si a > b Þ $ m Î N* |a = b + m Þ (a, b) Â (m, 0) 3. Si a = b Þ a + 0 = b + 0 Þ (a, b) Â (0, 0)

Podemos entender por números enteros el menor anillo que contiene al conjunto de los números naturales. Esto nos permite definir los números enteros como el conjunto cociente Z = N · N/Â donde, para cada clase de equivalencia su representante canónico vendría dado por:

3.2. Los números racionales

(a, b) Â (a’, b’) Û a + b’ = b + a’

Ya se había comentado que el hombre hizo uso de los racionales antes que de los números enteros. Una vez más, la introducción está ligada a la resolución de problemas de la vida real relacionados con la medida, ya que se hace necesario representar partes de la unidad elegida como patrón. Aunque se supone que su utilización fue anterior, los hombres de la Edad de Bronce pueden considerarse como los pioneros en el uso de fracciones, las primeras referencias escritas que se tiene de los racionales aparecen en los Papiros del Rhin datados en el 1550 a.C. donde aparece una notación para representar fracciones del tipo 1/n. También en Mesopotamia se utilizaron las fracciones y dado que este pueblo poseía un sistema de numeración posicional los acuerdos tomados a propósito de las fracciones y su cálculo son bastante similares a los que se utilizan en la actualidad. Por otra parte llama la atención la no consideración de las fracciones por parte de los griegos argumentando razones filosóficas como “no pudiendo dividir la unidad sin perder por ello su unidad, el número racional no puede ser un número, y se llamará razón de números”. A partir de finales del siglo XV y comienzos del siglo XVI se adopta la forma que aún conservamos de escribir las fracciones, expresando cada cantidad por un número m de unidades que contiene y la especie de estas unidades, el número n de ellas que contiene la unidad fundamental, representándolo bien por el par m (m.n) bien con la notación donde a m se le denomina numerador que nos indica la parte de la unidad fundan mental y n que se denomina denominador y nos indica las unidades contenidas en la unidad de referencia.

comercial publicado por Widman (1489), y sigue ligado a la práctica comercial en el mantenimiento de registros contables como se refleja en la obra datada en el siglo XV De computis et scripturia, popularizándose su uso y fijándose a partir de la publicación de la Arithmética Íntegra de Stifel en el siglo XVI. Curiosamente, Stifel, pese a su contribución y a conocer las propiedades de los números enteros no los admitía como soluciones de una ecuación, denominándolos númeri absurdi. Pese a la resistencia inicial de notables algebristas como Cardano o Tartaglia en torno a la aproximación en sentido natural mediante números positivos, los números enteros mostraron su idoneidad a la hora de describir sentido o dirección, siendo aceptados definitivamente a finales del siglo XVII, teniendo en ello gran importancia las aportaciones de Viète. Desde un punto de vista estrictamente matemático, los números enteros Z surgen ante la necesidad de resolver ecuaciones del tipo x + a = b, " a, b Î N, el campo de trabajo en este contexto son los números enteros, siendo claro en aquellos casos en que a > b, y considerando la situación natural como un caso particular en el que a < b. Para una construcción formal de los números enteros hemos de recurrir, entre otras vías, al establecimiento de una relación de equivalencia sobre N · N donde se utiliza como operación la suma usual de números naturales, que constituye una partición de N · N.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

176

Sucesivas ampliaciones del concepto de número El conjunto de los pares (m.n) con m y n enteros constituye el conjunto de los números racionales(Q), haciendo la salvedad de que el segundo término del par habrá de ser siempre no nulo. Los números racionales surgen a fin de poder resolver ecuaciones del tipo ax = b con a, b Î Z a ¹ 0, y el conjunto de soluciones de esta ecuación amplía el conjunto de los números enteros. Si en Z · Z definimos la siguiente relación binaria de equivalencia: (a, b) Â (c, d) Û a · d = b · c el conjunto cociente Q = Z · Z*/Â constituye el conjunto de los números racionales, y cada una de las clases de equivalencia constituye un número racional. Q = {a b |a, b Î Z ^ b ¹ 0} Como fácilmente puede apreciarse Q es una extensión de Z, ya que los elementos de este conjunto aparecen en aquellos casos en que a sea un múltiplo de b. El menor cuerpo que contiene al conjunto de los números naturales es el conjunto de los números racionales.

3.3. Los números reales Desde el siglo VI a.C. los griegos habían descubierto que la medida de la diagonal de un cuadrado era “inconmensurable” entendiendo esto como que no existía relación con la medida del cuadrado en el que se dibujaba. Trabajando en base a construcciones geométricas para establecer la razón entre dos segmentos rectilíneos y aplicando el teorema de Pitagoras, éste intuyó que debía existir un número “diagonal” tal que trabajando sobre un cuadrado de lado 1, se verificase que d2 = 12 + 12 = 2, pero se encontró con la dificultad de no poder utilizar un número racional como expresión de d, ya que: d 2 = 12 + 1 2 = 2 a2 a2 d2 = 2 Þ 2 = 2 Þ a2 = 2b2 b b lo que estaba en contra del planteamiento inicial, con lo que llegó a que no existe ningún número racional cuyo cuadrado sea 2, y al no entrar estos planteamientos dentro de lo conocido hasta el momento denominó a estos números “inexpresables”. Posteriormente, en el siglo V, los matemáticos hindúes consideraron como números las raíces irracionales de números, planteándose tímidamente la diferencia entre números mensurables e inconmensurables, pasando el tiempo hasta que matemáticos europeos encontraron la transformación de números irracionales en fracciones generatrices. Caracteriza a los números racionales el no ser solución de ninguna ecuación de primer grado con coeficientes enteros, a lo que en el siglo XIX Abel y Galois dieron la vuelta ampliando el conjunto numérico al de los números irracionales definiéndolos como soluciones de una ecuación algebraica con coeficientes enteros, lo que constituyó un marco de trabajo que se vio modificado por las aportaciones de Hermite y Liuville que enunciaron la existencia de los números trascendentes como aquellos que no son solución de ninguna ecuación algebraica con coeficientes enteros o fraccionarios. Entre las construcciones de los números reales más interesantes destacar las de Cantor en base a las sucesiones de Cauchy de números racionales, y la construcción de Dedekind en base a cortaduras en el conjunto de los números racionales. Podemos definir el conjunto de los números reales como aquel conjunto que contenga a los números racionales y su completo, es decir, que cualquier sucesión convergente o de Cauchy de números racionales pertenezca a dicho conjunto. En la construcción en base a sucesiones de Cauchy de números racionales los números racionales se definen por pares de sucesiones monótonas convergentes de números racionales que verifican: 1. 2. 3.

Una sucesión es creciente y la otra decreciente. Cualquier término de la creciente es siempre menor que cualquier término de la decreciente. La diferencia entre los términos correspondientes de ambas sucesiones puede hacerse tan pequeña como se desee, avanzando lo suficiente en las sucesiones (cortaduras en los números racionales)

TEMARIO DE MATEMÁTICAS. PRUEBA A

177

Volumen I. Matemáticas

178

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Definimos en el conjunto de las sucesiones de Cauchy de números racionales, S una relación binaria de equivalencia: Ley conmutativa. Adición. z1 + z2 = z2 + z1 Multiplicación. z1z2 = z2z1

2.

Ley de clausura. z 1 + z2 Î C z1z2 Î C

1.

Sean Xn, Yn Î S

(Xn) Â (Yn) Û " e > 0, $ n’ Î N |si n ³ n’ Þ |Xn – Yn| £ e

Cada una de las clases de equivalencia constituye un número real , estando constituido el conjunto de los números reales por el conjunto cociente R = S/Â R es una extensión del conjunto de los números racionales ya que contiene a estos. Los números reales que no son racionales, es decir que proviene de la diferencia R – Q se denominan números irracionales.

El conjunto de los pares ordenados z = (a,b) constituye el conjunto de los números complejos (C). A partir de estas definiciones podemos afirmar que el conjunto de los números complejos satisface las siguientes propiedades: Producto:

C.

Suma:

B.

Igualdad:

A.

3.4. Los números complejos

(a,b)(c,d) = (ac –bd,ad + bc) m(a,b) = (ma,mb)

Los algebristas del siglo XVI ante la resolución de ecuaciones en las que aparecían raíces de índice par de números negativos encontraron que, lógicamente, no tenían soluciones reales. Es crucial la aportación de Liebnitz, quien en el siglo XVII realizó una aproximación a lo que posteriormente se denominó unidad imaginaria, siguiendo un razonamiento en el que, como hemos comentado, la introducción de los complejos aparece motivada por la necesidad de resolver problemas a los que no daban solución los números reales, y podemos situar el punto de partida en la solución de raíces cuadradas de números negativos, operándose como sigue: (a,b) + (c,d) = (a + c,b + d) (a,b) = (c,d) Û a = b, c = d

así, utilizando la simbología debida a Euler (1777), designamos por i el valor –1 dotándolo así de un significado numérico, pero esto originaba numerosas paradojas y lagunas..., pero la construcción de una base sólida para el trabajo con números complejos hay que datarla en el s. XIX con las contribuciones de Cauchy, Riemann, Weiestrass, Gauss –a quien se debe la denominación de números complejos (1832)– y Hamilton –quien plantea la introducción de los números complejos mediante pares ordenados (1857)–, entre otros grandes matemáticos. Se define un número complejo como una pareja ordenada z = (a,b) de números reales a y b sometida a ciertas definiciones operacionales: –a = (–1)a = –1 a = i a

así, utilizando la simbología debida a Euler (1777), designamos por i el valor –1 dotándolo así de un significado numérico, pero esto originaba numerosas paradojas y lagunas..., pero la construcción de una base sólida para el trabajo con números complejos hay que datarla en el s. XIX con las contribuciones de Cauchy, Riemann, Weiestrass, Gauss –a quien se debe la denominación de números complejos (1832)– y Hamilton –quien plantea la introducción de los números complejos mediante pares ordenados (1857)–, entre otros grandes matemáticos. Se define un número complejo como una pareja ordenada z = (a,b) de números reales a y b sometida a ciertas definiciones operacionales: –a = (–1)a = –1 a = i a

Los algebristas del siglo XVI ante la resolución de ecuaciones en las que aparecían raíces de índice par de números negativos encontraron que, lógicamente, no tenían soluciones reales. Es crucial la aportación de Liebnitz, quien en el siglo XVII realizó una aproximación a lo que posteriormente se denominó unidad imaginaria, siguiendo un razonamiento en el que, como hemos comentado, la introducción de los complejos aparece motivada por la necesidad de resolver problemas a los que no daban solución los números reales, y podemos situar el punto de partida en la solución de raíces cuadradas de números negativos, operándose como sigue: Igualdad:

(a,b) = (c,d) Û a = b, c = d

B.

Suma:

(a,b) + (c,d) = (a + c,b + d)

C.

Producto:

(a,b)(c,d) = (ac –bd,ad + bc) m(a,b) = (ma,mb)

3.4. Los números complejos

A.

El conjunto de los pares ordenados z = (a,b) constituye el conjunto de los números complejos (C). A partir de estas definiciones podemos afirmar que el conjunto de los números complejos satisface las siguientes propiedades:

R = S/Â R es una extensión del conjunto de los números racionales ya que contiene a estos. Los números reales que no son racionales, es decir que proviene de la diferencia R – Q se denominan números irracionales. 1.

Ley de clausura. z 1 + z2 Î C z1z2 Î C

Cada una de las clases de equivalencia constituye un número real , estando constituido el conjunto de los números reales por el conjunto cociente 2.

Ley conmutativa. Adición. z1 + z2 = z2 + z1 Multiplicación. z1z2 = z2z1

(Xn) Â (Yn) Û " e > 0, $ n’ Î N |si n ³ n’ Þ |Xn – Yn| £ e Sean Xn, Yn Î S

Definimos en el conjunto de las sucesiones de Cauchy de números racionales, S una relación binaria de equivalencia: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

178

Sucesivas ampliaciones del concepto de número 3.

Ley asociativa. Adición. z1 + (z2 + z3) = (z1 + z2) + z3 Multiplicación. z1(z2z3) = (z1z2)z3

4.

Ley distributiva. z1(z2 + z3) = z1z2 + z1z3

5.

Ley del elemento neutro. Adición. z 1 + 0 = 0 + z 1 = z1 donde 0 es el elemento neutro o idéntico para la adición, así el complejo 0 toma la forma (0,0). Producto. z1 · 1 = 1z1 = z1 donde el complejo 1 es el elemento neutro o idéntico para la multiplicación y toma la forma (1,0).

6.

Ley del recíproco. Adición. Para cada zi ¹ 0, $ un complejo z, único, tal que z + zi = zi + z = 0, y z recibe nombre de recíproco (u opuesto) de zi con respecto a la adición y se denota por z = –zi = (–a,–b). Producto. Para cada zi ¹ 0, $ un número complejo único z tal que ziz = zzi = 1 y z recibe el nombre de recíproco (o inverso) de zi con respecto al producto y se denota por z–1 i o æ ö a –b 1 =ç ÷ zi èa 2 + b 2 , a 2 + b 2 ø

Analizando las propiedades anteriormente expuestas podemos afirmar que (C,+) posee estructura algebraica de grupo conmutativo y que tomando el conjunto de los números complejos con exclusión del (0,0), que denotaremos por C*, podemos afirmar que (C*,·) tiene estructura algebraica de grupo conmutativo. Apoyándonos en esto, y habiendo definido la ley distributiva del producto respecto de la adición, podemos afirmar que (C,+,·) tiene estructura algebraica de cuerpo conmutativo.

TEMARIO DE MATEMÁTICAS. PRUEBA A

179

TEMA

11 Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas

Emilio M. Pina Coronado

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

182

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO INTRODUCCIÓN 1.1. Subconjuntos de un conjunto

2.

ÁLGEBRA DE BOOLE DE LAS PARTES DE UN CONJUNTO

3.

LEYES DE MORGAN

4.

PRODUCTO DE CONJUNTOS 4.1. Pares ordenados 4.2. Producto cartesiano

5.

GRAFOS Y RELACIONES 5.1. Grafos 5.2. Relaciones 5.3. Relaciones binarias 5.4. Relaciones de equivalencia 5.5. Relaciones de orden

6.

APLICACIONES 6.1. Tipos de aplicaciones

7.

ESTRUCTURAS ALGEBRAICAS 7.1. Leyes de composición 7.2. Propiedades de las leyes de composición internas 7.3. Definición de estructura algebraica

8.

GRUPOS 8.1. Semigrupo 8.2. Grupo 8.3. Concepto de clase adjunta 8.4. Núcleo de un homomorfismo. Primer teorema de isomorfía

9.

ANILLOS 9.1. Subanillos e ideales

CUERPOS

ANILLOS 9.1. Subanillos e ideales

9.

GRUPOS 8.1. Semigrupo 8.2. Grupo 8.3. Concepto de clase adjunta 8.4. Núcleo de un homomorfismo. Primer teorema de isomorfía

8.

ESTRUCTURAS ALGEBRAICAS 7.1. Leyes de composición 7.2. Propiedades de las leyes de composición internas 7.3. Definición de estructura algebraica

7.

APLICACIONES 6.1. Tipos de aplicaciones

6.

GRAFOS Y RELACIONES 5.1. Grafos 5.2. Relaciones 5.3. Relaciones binarias 5.4. Relaciones de equivalencia 5.5. Relaciones de orden

5.

PRODUCTO DE CONJUNTOS 4.1. Pares ordenados 4.2. Producto cartesiano

4.

LEYES DE MORGAN

3.

ÁLGEBRA DE BOOLE DE LAS PARTES DE UN CONJUNTO

2.

INTRODUCCIÓN 1.1. Subconjuntos de un conjunto

1.

10.

10.

1.

CUERPOS

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

182

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas

1. INTRODUCCIÓN Una de las nociones fundamentales, y a la vez más intuitiva, de la Matemática es la de conjunto, la cual fue desarrollada como teoría autónoma por G. Cantor entre los años 1871 y 1883, construyendo una teoría completa desde sus fundamentos hasta sus conclusiones, la cual posee una estructura de la que gran parte se conserva actualmente. Cantor nos ofreció la siguiente definición: “un conjunto es la reunión de un todo de determinados objetos bien definidos y diferenciables los unos de los otros”. Podemos interpretar esta definición afirmando que una colección de objetos, considerada como una entidad única constituye un conjunto. Los objetos de la colección (que representaremos con letras minúsculas) son los elementos del conjunto (que representaremos con letras mayúsculas). La relación más simple entre conjuntos es la de igualdad (A = B) y diremos que dos conjuntos son iguales si y sólo si tienen los mismos elementos (Axioma de unicidad), es decir, que todo elemento del primer conjunto lo es del segundo y recíprocamente. A=BÛAÌByBÌA lo que nos lleva a la necesidad de definir un conjunto, para lo cual hay que precisar cuáles son todos y cada uno de los elementos que lo forman y esto lo podemos hacer por extensión (nombrando todos y cada uno de los elementos que lo forman) o por comprensión (definiendo la propiedad que caracteriza a los elementos del conjunto). La noción de conjunto como objeto matemático queda delimitada por axiomas que permiten construir conjuntos a partir de otros, aunque previamente hay que aceptar la existencia de un conjunto: existe al menos un conjunto (Axioma de existencia), y el caso más simple lo constituye un conjunto de dos elementos, así : Sea un conjunto a y un conjunto b (excepcionalmente representados con minúsculas), existe un conjunto M, que contiene como elementos a “a” y a “b” y ningún otro (Axioma de apareamiento). Si a = b el par {a,b} se reduce a un solo elemento {a} y, en consecuencia del axioma de apareamiento también resulta que dado un conjunto a, existe un conjunto M, cuyo único elemento es a.

1.1. Subconjuntos de un conjunto Dado un conjunto A, llamaremos subconjunto de A a todo conjunto cuyos elementos lo sean también de A. BÌAÛ"xÎBÞxÎA Atendiendo a la definición anterior todo conjunto es subconjunto de sí mismo, y esto nos da pié a introducir el concepto de contenido estricto, según el cual si B es un subconjunto propio de A cuando existe, al menos, un elemento de A que no es también de B. Dados dos subconjuntos B y C de un conjunto A, diremos que constituyen partes disjuntas cuando no existen elementos en común entre B y C. Llamaremos conjunto vacio (Æ) a un conjunto carente de elementos, es decir, el conjunto vació está formado por el complementario de un conjunto con respecto a sí mismo. Dado un conjunto A, si consideramos todos sus posibles subconjuntos, estaremos ante lo que se denomina conjunto de las partes de A o potencia de A y se suele designar por P(A). Llamamos conjunto universal o referencial (U) al conjunto formado por todos los conjuntos con los que estamos trabajando.

2. ÁLGEBRA DE BOOLE DE LAS PARTES DE UN CONJUNTO Habiendo definido el conjunto de las partes de un conjunto P(A), veamos ahora cuáles son las operaciones que podemos establecer entre ellas. Unión. La unión del conjunto B con el conjunto C, constituye un conjunto cuyos elementos pertenecen a B, a C o a B y C simultáneamente. B È C ={x|x Î B £Ú x Î C} TEMARIO DE MATEMÁTICAS. PRUEBA A

183

Volumen I. Matemáticas

184

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Monotonía. B Ì C Û B É C Complementaria. B È B = A; B I B = Æ

2. 3.

Involutiva. ( B) = B

1.

Intersección. La intersección del conjunto B con el conjunto C es otro conjunto cuyos elementos pertenecen simultáneamente a B y C. B I C ={x|x Î BÙ x Î C} Asociando a cada B Î P(A) su complementario B Î P( A) queda establecida la correspondencia de complementos entre las partes de A, con las siguientes propiedades: La unión e intersección de conjuntos satisfacen las siguientes propiedades: " B, C, D Î P (A)

Como casos particulares se tiene que A =Æ y Æ =A.

Complementario. Si B es un subconjunto de A, el complementario de B respecto de A es el conjunto diferencia A – B. B ={x|x Î A Ù x Ï B} PROPIEDAD

UNIÓN

INTERSECCIÓN

BÈB=B

BÇB=B

B È (C È D) = (B È C) ÈD

B Ç (C Ç D) = (B Ç C) ÇD

Conmutativa

BÈC=CÈB

B ÇC = C Ç B

Simplificativas

B È (BÇC) = B

B Ç (BÈC) = B

Elemento neutro

BÈÆ=B

BÇA=B

Elemento universal

BÈA=A

_________

Elemento ínfimo

_________

BÇÆ=Æ

Idempotencia Asociativa

Las propiedades antes enunciadas son fácilmente demostrables basándonos en las propiedades de la lógica de conjuntos. A modo de ejemplo se demuestra una de las propiedades distributivas. (B È C) Ç D = (B Ç D) È (C Ç D) Þ Si x Î [(B È C) Ç D] Þ x Î (B È C) Ù x Î D x Î (B È C) Þ x Î B Ú x Î C Si x Î B Ù x Î D Þ x Î (B Ç D) Þ x Î (B Ç D) È (C Ç D) Si x Î C Ù x Î D Þ x Î (C Ç D) Þ x Î (B Ç D) È (C Ç D) Ü Si x Î (B Ç D) È (C Ç D) Þ x Î (B Ç D) Ú x Î (C Ç D) Si x Î (B Ç D) Þ x Î B Ù x Î D Þ x Î (B È C) Ç D Si x Î (C Ç D) Þ x Î C Ù x Î D Þ x Î (B È C) Ç D Diferencia. La diferencia entre dos conjuntos B y C es el conjunto de elementos de B que no pertenecen a C. B – C={x|x Î BÙ x Ï C} (B È C) Ç D = (B Ç D) È(C Ç D)

Distributivas

(B Ç C) È D = (B È D) Ç(C È D)

Las propiedades antes enunciadas son fácilmente demostrables basándonos en las propiedades de la lógica de conjuntos. A modo de ejemplo se demuestra una de las propiedades distributivas. (B È C) Ç D = (B Ç D) È (C Ç D) Þ Si x Î [(B È C) Ç D] Þ x Î (B È C) Ù x Î D x Î (B È C) Þ x Î B Ú x Î C Si x Î B Ù x Î D Þ x Î (B Ç D) Þ x Î (B Ç D) È (C Ç D) Si x Î C Ù x Î D Þ x Î (C Ç D) Þ x Î (B Ç D) È (C Ç D) Ü Si x Î (B Ç D) È (C Ç D) Þ x Î (B Ç D) Ú x Î (C Ç D) Si x Î (B Ç D) Þ x Î B Ù x Î D Þ x Î (B È C) Ç D Si x Î (C Ç D) Þ x Î C Ù x Î D Þ x Î (B È C) Ç D Diferencia. La diferencia entre dos conjuntos B y C es el conjunto de elementos de B que no pertenecen a C. B – C={x|x Î BÙ x Ï C} Distributivas

(B Ç C) È D = (B È D) Ç(C È D) (B È C) Ç D = (B Ç D) È(C Ç D)

BÇÆ=Æ

_________

Elemento ínfimo

BÈA=A

Elemento universal

BÇA=B

BÈÆ=B

Elemento neutro

B Ç (BÈC) = B

B È (BÇC) = B

Simplificativas

B ÇC = C Ç B

BÈC=CÈB

Conmutativa

B Ç (C Ç D) = (B Ç C) ÇD

B È (C È D) = (B È C) ÈD

Asociativa

_________

Complementario. Si B es un subconjunto de A, el complementario de B respecto de A es el conjunto diferencia A – B. B ={x|x Î A Ù x Ï B} Idempotencia

PROPIEDAD

BÇB=B

BÈB=B UNIÓN

INTERSECCIÓN

Como casos particulares se tiene que A =Æ y Æ =A.

" B, C, D Î P (A)

Asociando a cada B Î P(A) su complementario B Î P( A) queda establecida la correspondencia de complementos entre las partes de A, con las siguientes propiedades: La unión e intersección de conjuntos satisfacen las siguientes propiedades:

1.

Involutiva. ( B) = B

2. 3.

Monotonía. B Ì C Û B É C Complementaria. B È B = A; B I B = Æ

Intersección. La intersección del conjunto B con el conjunto C es otro conjunto cuyos elementos pertenecen simultáneamente a B y C. B I C ={x|x Î BÙ x Î C} CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

184

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas Dado que se denominan álgebras de Boole a los retículos distributivos y complementarios, a la luz de las propiedades que hemos enunciado podemos afirmar que las operaciones de unión e intersección definen en P(A) un álgebra de Boole.

3. LEYES DE MORGAN Constituyen las propiedades más importantes de la correspondencia de complementos entre las partes de un conjunto. ( B U C) = B I C; ( B I C) = ( B U C) y, a partir de ellas, aplicando la propiedad involutiva antes presentada, se deduce: B È C = ( B I C) ; B I C= ( B U C) Es sencilla la demostración de las leyes de Morgan, a título de ejemplo vamos a demostrar la primera de ellas: ( B U C)= B I C Þ

Si x Î ( B U C) Þ x Ï( B U C) Þ x Ï BÙ x Ï C Þ x Î BÙ x Î C Þ x Î B I C

Ü

Si x Î B I C Þ x Î BÙ x Î C Þ x Ï BÙ x Ï C Þ x Ï B U C Þ x Î ( B U C)

4. PRODUCTO DE CONJUNTOS 4.1. Pares ordenados Los pares ordenados son los elementos más simples a partir de los cuales se definen las relaciones, se originan cuando en un conjunto de dos elementos se introduce un principio de asimetría. A partir del concepto de par ordenado llegamos al de producto cartesiano y por generalización a la definición de las n-plas como conjuntos ordenados de n elementos y a los productos cartesianos de n conjuntos. Definimos un par ordenado (x,y) como un conjunto formado por dos objetos, uno es el conjunto {x,y} y el otro es el subconjunto {x}, cuyo único elemento es el considerado como primero. Dos pares ordenados {x,y} y {u,v} son iguales si y sólo si x = u e y = v.

4.2. Producto cartesiano Dados dos conjuntos A y B, se denomina producto cartesiano de A por B (o simplemente producto) y se representa como A · B al conjunto cuyos elementos son todos los pares ordenados (x,y) con x Î A e y Î B . El producto cartesiano A · B es un conjunto que queda unívocamente determinado. De la definición de producto cartesiano se deducen las siguientes consecuencias: 1. Si A × B = ÆÞ que uno de los dos conjunto, o ambos, son el conjunto vacío. 2. Si A × B = Æ y existe un producto C× D Ì A × B Þ C Ì A Ù D Ì B. 3. Propiedad distributiva por la derecha con respecto a la unión: (A È B) · C = (A · C) È (B · C). 4. Propiedad distributiva por la izquierda con respecto a la unión: A · (BÈC) = (A · B) È (A · C). 5. Propiedad distributiva por la derecha con respecto a la intersección: (A Ç B) · C = (A · C) Ç (B · C). 6. Propiedad distributiva por la izquierda con respecto a la intersección: A · (B Ç C) = (A · B) Ç (A · C). 7. (A · B) Ç (C · D) = (A Ç C) · (B Ç D). 8. Propiedad distributiva por la derecha con respecto a la diferencia: (A – B) · C = (A · C) – (B · C). 9. Propiedad distributiva por la izquierda con respecto a la diferencia: A · (B – C) = (A · B) – (A · C). 10. A · B = B · A Û A = B La definición de par ordenado se generaliza obteniéndose la terna ordenada (x, y, z) = ((x, y), z), y por inducción la n- pla; así, dados n conjuntos A1, A2, ..., An una n - pla es un par ordenado cuyo primer elemento es la (n–1)-pla y cuyo segundo elemento es xn donde x1 Î A1, x2 Î A2,...,xn Î An. Si los Ai conjuntos son iguales podemos recurrir a la notación potencial obteniendo así An, por lo cual R2 será el plano cartesiano y Rn el espacio de dimensiones. TEMARIO DE MATEMÁTICAS. PRUEBA A

185

Volumen I. Matemáticas

186

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Cuando en una relación los conjuntos de partida y de llegada coinciden, es decir, Â Ì A · A, hablamos de relación binaria, en la cual se define un conjunto de dos elementos  = {G, A}, en donde si G = A · A hablaremos de relación total, mientras que si G = Æ estaremos ante una relación vacía.

5. GRAFOS Y RELACIONES 5.1. Grafos

5.3. Relaciones binarias

Entendemos por grafo un conjunto cualquiera de G pares ordenados (x,y). Dado un grafo G, existe un conjunto único A cuyos elementos son los primeros elementos (x) de los pares (x,y) Î G, al que se denomina primera proyección del grafo G; y existe otro conjunto B, también único, constituido por los segundos elementos (y) de los pares (x,y) Î G y al que se denomina segunda proyección de G. Â1 o (  2 o  3)= ( Â1 o  2) o  3

Una relación  entre un conjunto A y un conjunto B, es un conjunto formado por tres elementos  = {G, A, B} donde G es un grafo (grafo de la relación) en el que su primera proyección está incluida en A (conjunto de partida, que constituye el dominio de la relación) y su segunda proyección está incluida en B (conjunto de llegada, que constituye el recorrido o codominio), y  es la relación de A a B. Así, si (x, y) Î G decimos que x está relacionado con y en Â, y se suele representar como x  y. Podemos entender una relación entre A y B como un subconjunto del producto cartesiano de A · B. La relación inversa de  está definida como –1 = {G–1, B, A}, donde el grafo inverso G–1 define una nueva relación entre B y A que es la que se designa como –1. El dominio y el recorrido de la relación inversa –1 coincide con el recorrido y dominio de Â. Basándonos en lo visto sobre composición de grafos podemos definir la composición de relaciones. Así, sean Â1 = {G1, A, B} y Â2 = {G2, B, C}, la relación compuesta Â1 ° Â2 viene dada por Â1 ° Â2 = {G1 ° G2, A, C}. Sobre la misma base podemos abordar la propiedad asociativa de las relaciones, según la cual si Â1, Â2 y Â3 son tres relaciones que satisfacen que el conjunto de llegada de cada una de ellas coincide con el de salida de la siguiente, se puede escribir que A= {x $ y, ( x, y ) Î G} { }

B= y $ x, ( x, y ) Î G

De lo anterior resulta que G Ì A · B Dado un grafo G, el conjunto de todos los pares (y,x), tales que (x,y) Î G es el grafo inverso del G y se designa por G–1. Entre G y G–1 se verifica que la primera proyección de G es igual a la segunda proyección de G–1, y la segunda proyección de G es igual a la primera de G–1. Sean G1 y G2, existe un grafo compuesto, y se designa por G1 ° G2, que es el conjunto de todos los pares ordenados (x, z), formados con el primer elemento de un par (x, y) Î G1 y el segundo elemento de otro par (y, z) Î G2, cuando los elementos segundo del primer par y primero del segundo par coinciden.

{

}

G1 o G2 = ( x,z) $ y, ( x, y ) Î G1Ù( y, z) Î G2

A partir de aquí se puede fácilmente deducir la propiedad asociativa de la composición de grafos, según la cual dados tres grafos G1, G2 y G3 se verifica que G1 o ( G2 o G3)= ( G1 o G2) o G3.

5.2. Relaciones

Un grafo en el que no existan pares distintos que tengan igual el primer elemento se denomina grafo funcional. Un grafo en el que no existan pares distintos que tengan igual el primer elemento se denomina grafo funcional.

5.2. Relaciones

A partir de aquí se puede fácilmente deducir la propiedad asociativa de la composición de grafos, según la cual dados tres grafos G1, G2 y G3 se verifica que G1 o ( G2 o G3)= ( G1 o G2) o G3.

Una relación  entre un conjunto A y un conjunto B, es un conjunto formado por tres elementos  = {G, A, B} donde G es un grafo (grafo de la relación) en el que su primera proyección está incluida en A (conjunto de partida, que constituye el dominio de la relación) y su segunda proyección está incluida en B (conjunto de llegada, que constituye el recorrido o codominio), y  es la relación de A a B. Así, si (x, y) Î G decimos que x está relacionado con y en Â, y se suele representar como x  y. Podemos entender una relación entre A y B como un subconjunto del producto cartesiano de A · B. La relación inversa de  está definida como –1 = {G–1, B, A}, donde el grafo inverso G–1 define una nueva relación entre B y A que es la que se designa como –1. El dominio y el recorrido de la relación inversa –1 coincide con el recorrido y dominio de Â. Basándonos en lo visto sobre composición de grafos podemos definir la composición de relaciones. Así, sean Â1 = {G1, A, B} y Â2 = {G2, B, C}, la relación compuesta Â1 ° Â2 viene dada por Â1 ° Â2 = {G1 ° G , A, C}. 2 Sobre la misma base podemos abordar la propiedad asociativa de las relaciones, según la cual si Â1, Â2 y Â3 son tres relaciones que satisfacen que el conjunto de llegada de cada una de ellas coincide con el de salida de la siguiente, se puede escribir que

{

}

G1 o G2 = ( x,z) $ y, ( x, y ) Î G1Ù( y, z) Î G2

De lo anterior resulta que G Ì A · B Dado un grafo G, el conjunto de todos los pares (y,x), tales que (x,y) Î G es el grafo inverso del G y se designa por G–1. Entre G y G–1 se verifica que la primera proyección de G es igual a la segunda proyección de G–1, y la segunda proyección de G es igual a la primera de G–1. Sean G1 y G2, existe un grafo compuesto, y se designa por G1 ° G2, que es el conjunto de todos los pares ordenados (x, z), formados con el primer elemento de un par (x, y) Î G1 y el segundo elemento de otro par (y, z) Î G2, cuando los elementos segundo del primer par y primero del segundo par coinciden.

{ } B= {y $ x, ( x, y ) Î G} A= x $ y, ( x, y ) Î G

Entendemos por grafo un conjunto cualquiera de G pares ordenados (x,y). Dado un grafo G, existe un conjunto único A cuyos elementos son los primeros elementos (x) de los pares (x,y) Î G, al que se denomina primera proyección del grafo G; y existe otro conjunto B, también único, constituido por los segundos elementos (y) de los pares (x,y) Î G y al que se denomina segunda proyección de G. Â1 o (  2 o  3)= ( Â1 o  2) o  3

5.3. Relaciones binarias

5.1. Grafos

Cuando en una relación los conjuntos de partida y de llegada coinciden, es decir, Â Ì A · A, hablamos de relación binaria, en la cual se define un conjunto de dos elementos  = {G, A}, en donde si G = A · A hablaremos de relación total, mientras que si G = Æ estaremos ante una relación vacía.

5. GRAFOS Y RELACIONES

186

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas Prestemos atención a los siguientes tipos de relaciones binarias:



Relación reflexiva: Una relación binaria, Â = {G, A}, es reflexiva si para todo elemento x Î A el par de elementos iguales (x, x) Î A.

A

" x Î A Þ (x, x) Î G G

Si utilizamos una representación cartesiana de Â, cuando A sea un intervalo, encontramos que la reflexividad es equivalente a que la diagonal del cuadrado A · A pertenezca a G. Figura 1. Relación reflexiva.

A A



Relación simétrica: Una relación binaria, Â = {G, A}, es simétrica si para todo par (x, y) Î G, el par. (y, x) Î G Atendiendo a la representación cartesiana, en las mismas condiciones antes expuestas, la relación simétrica está representada por una figura con simetría de G respecto a la diagonal.

G

Figura 2. Relación simétrica. A

A



Relación antisimétrica: Una relación binaria, Â = {G, A}, es antisimétrica si cuando el par (x, y) Î G, con x ¹ y, el par (y, x) Ï G. Gráficamente tendríamos una figura no simétrica respecto a la diagonal.

G

Figura 3. Relación antidimétrica. A

A



Relación transitiva: Una relación binaria, Â = {G, A}, es transitiva cuando para cada dos pares (x, y), (y, z) Î G, el par (x, z) Î G. La representación exige que el vértice (x, z) Î G, opuesto a (y, y) Î G, si (x, y), (y, z) Î G.

G Y Z

Figura 4. Relación transitiva. Y

X

A

TEMARIO DE MATEMÁTICAS. PRUEBA A

187

Volumen I. Matemáticas

188

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En general, el recorrido de f es un subconjunto de B, pero no coincide con éste, cuando así lo hace decimos que f es exhaustiva.

5.4. Relaciones de equivalencia

Una relación  definida en un conjunto A no vacío es de equivalencia si es reflexiva, simétrica y transitiva. Una relación de equivalencia definida en un conjunto A determina una partición de A, cuyas partes son las clases de equivalencia, y recíprocamente toda partición del conjunto A da lugar a una relación de equivalencia en A, en la que el conjunto de las clases de equivalencia coincide con la partición. Si  es una relación de equivalencia definida en un conjunto A, el conjunto de las clases de equivalencia se denomina conjunto cociente (A /  ) de A respecto de la relación Â. Dom. f= {x x Î A, ( x, y ) Î F} { y y Î B, ( x, y ) Î F} Rec. f=

En cuanto al dominio y al recorrido de la aplicación:

1. 2.

" x Î A, existe, al menos, un par (x, y) Î F. No existen pares distintos en F que tengan el primer elemento igual.

Se define una aplicación f de A en B como una terna {F, A, B} en la que F es una parte del producto cartesiano de A · B que verifica las siguientes condiciones:

5.5. Relaciones de orden

Una relación  definida en un conjunto A no vacío es de orden si es reflexiva, antisimétrica y transitiva. Una relación  definida en un conjunto A no vacío es de orden estricto si es transitiva y " x Î A el par (x, x) Ï Â. Si en el conjunto A se define una relación Â, dados dos elementos x, y Î A, puede presentarse sólo una de las dos situaciones siguientes:

Podemos entender las aplicaciones como un tipo de relaciones entre conjuntos. Así, una aplicación entre A y B es una relación entre A y B donde el dominio de la relación coincide con A y el grafo de la misma es funcional.

6. APLICACIONES

1ª. 2ª.

Al menos uno de los dos pares (x, y), (y, x) Î Â, entonces decimos que x, y Î A son comparables. Ninguno de los pares (x, y), (y, x) Î Â.

Máximo: Un elemento m1 Î A es un máximo de A si es comparable con todos los elementos x Î A y x < m 1. Mínimo: Un elemento m0 Î A es un mínimo de A si es comparable con todos los elementos x Î A y x > m 0. No todos los conjuntos ordenados poseen mínimo, pero cuando lo poseen éste es único, y análogamente para el máximo. Maximal: Un elemento m1 Î A es un máximal de A si con todos los elementos x Î A con los que se compara se verifica que x < m1. Minimal: Un elemento m0 Î A es un minimal de A si con todos los elementos x Î A con los que se compara se verifica que x > m0.

A consecuencia de lo anterior diremos que un conjunto A está totalmente ordenado si cada dos elementos x, y Î A son comparables.

Elementos notables de los conjuntos ordenados

Máximo: Un elemento m1 Î A es un máximo de A si es comparable con todos los elementos x Î A y x < m 1. Mínimo: Un elemento m0 Î A es un mínimo de A si es comparable con todos los elementos x Î A y x > m 0. No todos los conjuntos ordenados poseen mínimo, pero cuando lo poseen éste es único, y análogamente para el máximo. Maximal: Un elemento m1 Î A es un máximal de A si con todos los elementos x Î A con los que se compara se verifica que x < m1. Minimal: Un elemento m0 Î A es un minimal de A si con todos los elementos x Î A con los que se compara se verifica que x > m0.

Elementos notables de los conjuntos ordenados

A consecuencia de lo anterior diremos que un conjunto A está totalmente ordenado si cada dos elementos x, y Î A son comparables. 1ª. 2ª.

Al menos uno de los dos pares (x, y), (y, x) Î Â, entonces decimos que x, y Î A son comparables. Ninguno de los pares (x, y), (y, x) Î Â.

Una relación  definida en un conjunto A no vacío es de orden si es reflexiva, antisimétrica y transitiva. Una relación  definida en un conjunto A no vacío es de orden estricto si es transitiva y " x Î A el par (x, x) Ï Â. Si en el conjunto A se define una relación Â, dados dos elementos x, y Î A, puede presentarse sólo una de las dos situaciones siguientes:

6. APLICACIONES

Podemos entender las aplicaciones como un tipo de relaciones entre conjuntos. Así, una aplicación entre A y B es una relación entre A y B donde el dominio de la relación coincide con A y el grafo de la misma es funcional. Se define una aplicación f de A en B como una terna {F, A, B} en la que F es una parte del producto cartesiano de A · B que verifica las siguientes condiciones:

5.5. Relaciones de orden

1. 2.

" x Î A, existe, al menos, un par (x, y) Î F. No existen pares distintos en F que tengan el primer elemento igual.

Una relación  definida en un conjunto A no vacío es de equivalencia si es reflexiva, simétrica y transitiva. Una relación de equivalencia definida en un conjunto A determina una partición de A, cuyas partes son las clases de equivalencia, y recíprocamente toda partición del conjunto A da lugar a una relación de equivalencia en A, en la que el conjunto de las clases de equivalencia coincide con la partición. Si  es una relación de equivalencia definida en un conjunto A, el conjunto de las clases de equivalencia se denomina conjunto cociente (A /  ) de A respecto de la relación Â. En cuanto al dominio y al recorrido de la aplicación:

{ Rec. f= { y

} y Î B, ( x, y ) Î F}

Dom. f= x x Î A, ( x, y ) Î F

En general, el recorrido de f es un subconjunto de B, pero no coincide con éste, cuando así lo hace decimos que f es exhaustiva.

5.4. Relaciones de equivalencia

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

188

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas

6.1. Tipos de aplicaciones –

Aplicación inyectiva. La aplicación f: A ® B, es inyectiva cuando para todo par x, x’ Î A, si x ¹ x’ entonces f (x) ¹ f (x’). Si f: A ® B es inyectiva se verifica que el cardinal del conjunto A es menor o igual que el cardinal de B.



Aplicación sobreyectiva o suprayectiva. Cuando en la aplicación f: A ® B, el recorrido f: (A) º B, decimos que es sobreyectiva. Si es sobreyectiva se verifica que el cardinal de A es mayor o igual que el cardinal de B.



Aplicación biyectiva. La aplicación f: A ® B, es biyectiva cuando todo elemento y Î B es imagen de uno y sólo un elemento x Î A. Una aplicación biyectiva es a la vez inyectiva y sobreyectiva. Si f: A ® B es biyectiva, se verifica que el Cardinal de A es igual al cardinal de B. Definamos, ahora, el concepto de antiimagen. Así, dada la aplicación f: A ® B, la antiimagen de un y Î B es el conjunto de todos los elementos x Î A, tales que f(x) = y. f –1( y ) = {x x Î A, f ( x) = y} f–1 (y) constituye la aplicación inversa o recíproca de f.



Aplicación constante. Una aplicación f: A ® B es constante sobre una parte M de A si y sólo si " x, x’ Î A se verifica que f (x) = f (x’). En el caso de que M º A diremos, simplemente, que la aplicación es constante.



Parte estable de una aplicación. Sea f: A ® A, diremos que M Ì A es una parte estable de la aplicación si se verifica que " x Î M® f (x) Î M. En el caso de que A esté formado por un solo elemento, si se verifica que f (x) = x, diremos que x es un punto fijo o invariante en la aplicación.



Aplicación restricción. Sea f: una aplicación A ® B y M Ì A, llamaremos aplicación restricción de la aplicación f al conjunto M, y lo representaremos como f / M, a la aplicación que actúa sobre M en B tal que f / M(x) = f (x), " x Î M.



Aplicación prolongación. Mediante un razonamiento análogo al anterior consideramos la aplicación f / M definida de M Ì A en B, llamamos aplicación prolongada a la f: A ® B.



Aplicación identidad. Dada f: A ® A, diremos que f es una aplicación identidad, y la representaremos por iA, si iA (x) = x, " x Î A. Evidentemente iA es biyectiva.



Inyección canónica. Dados dos conjuntos A y B, tales que A Ì B, decimos que i: A ® B es una inyección canónica si i(x) = " x Î A.

7. ESTRUCTURAS ALGEBRAICAS 7.1. Leyes de composición Definición de ley de composición interna. Dado un conjunto E, una ley de composición interna (*) definida en E, es una aplicación de una parte de E · E en E; es decir, f: A ® E donde A Ì E · E. Si A = E · E diremos que la ley de composición interna está definida en todo el conjunto E. La aplicación f hace corresponder a cada par de elementos (a, b) Î A otro elemento c Î E, que se llama elemento operado de a y b, y lo representaremos como a * b = c. Cuando un conjunto A está provisto de una ley de composición interna (*) , lo representaremos mediante el par (A, *). TEMARIO DE MATEMÁTICAS. PRUEBA A

189

Volumen I. Matemáticas

190

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

a’ = a’ * e = a’ * (a * a’’) = (a’ * a) * a’’ = e * a’’ = a’’ Por lo tanto, si un elemento a Î E tiene simétrico, éste es único.

Definición de ley de composición externa.

Dado un conjunto E, y otro conjunto W que denominaremos dominio de operadores, una ley de composición externa (#) definida en E por los operadores de W, es una aplicación de una parte de W · E en E; es decir, j:A ® E donde A Ì W · E La aplicación j hace corresponder a cada par de elementos (a, a) Î A un elemento c Î E.

a * a’ = a’ * a = e Si, respecto a una ley de composición asociativa, un elemento tiene simétrico, éste es único. Veamos una sencilla demostración donde partimos de la existencia de dos simétricos a’ Î E y a’’ Î E de un elemento a Î E. Existencia de simétricos: Decimos que, respecto a una ley de composición interna * definida en un conjunto E, con elemento neutro, existen elementos simétricos, si para cada elemento a Î E, existe un elemento a’ Î E tal que:

7.2. Propiedades de las leyes de composición internas – Asociatividad: Una ley de composición interna (*), definida en un conjunto E, es asociativa si –

se verifica que:

"aÎE ®a*e=e*a=a Si existe, el elemento neutro es único. El neutro es un elemento central del conjunto A para esa ley de composición interna. " a, b, c Î E ® (a * b) * c = a * (b * c)

Conmutatividad: Una ley de composición interna (*), definida en un conjunto E, es conmutativa si se verifica que:





Existencia de neutro: Decimos que una ley de composición interna * definida en un conjunto E, tiene elemento neutro si $ e Î E, tal que:

" a, b Î E ® a * b = b * a Puede ocurrir que, sin ser conmutativa la ley de composición interna se verifique que para dos elementos concretos a * b = b * a, y en este caso diremos que esos dos elemento son permutables o conmutables en la ley de composición interna. Si existe un cierto elemento que es permutable con cualquier elemento del conjunto A, a este elemento lo denominaremos elemento central del conjunto A para esa ley de composición interna, y al conjunto de todos los elementos centrales se le denomina centro.

" a, b Î A; a * s = b * s Þ a = b Cuando un elemento s Î A es regular por la izquierda y por la derecha, decimos que es regular. Esta propiedad se denomina, también, de cancelación; y de verificarse se dice que la ley de composición interna es cancelativa. " a, b Î A; s * a = s * b Þ a = b Análogamente la regularidad por la derecha vendría dada por:

Distributividad: Si en el conjunto E están definidas dos leyes de composición interna * y °, la ley ° es distributiva por la izquierda con relación a la ley * si se verifica que:

" a, b, c, Î E ® a * (b ° c) = (a * b) ° (a * c) Elementos regulares (Propiedad de simplificación): Un elemento s Î A decimos que es regular por la izquierda, para la operación interna *, cuando se verifica que: " a, b, c, Î E ® a ° (b * c) = (a ° b) * (a ° c) Análogamente la distributividad por la derecha vendrá dada por:





" a, b, c, Î E ® a * (b ° c) = (a * b) ° (a * c)

Distributividad: Si en el conjunto E están definidas dos leyes de composición interna * y °, la ley ° es distributiva por la izquierda con relación a la ley * si se verifica que: " a, b, c, Î E ® a ° (b * c) = (a ° b) * (a ° c) Análogamente la distributividad por la derecha vendrá dada por:

Elementos regulares (Propiedad de simplificación): Un elemento s Î A decimos que es regular por la izquierda, para la operación interna *, cuando se verifica que: " a, b Î A; s * a = s * b Þ a = b Análogamente la regularidad por la derecha vendría dada por:





" a, b Î E ® a * b = b * a Puede ocurrir que, sin ser conmutativa la ley de composición interna se verifique que para dos elementos concretos a * b = b * a, y en este caso diremos que esos dos elemento son permutables o conmutables en la ley de composición interna. Si existe un cierto elemento que es permutable con cualquier elemento del conjunto A, a este elemento lo denominaremos elemento central del conjunto A para esa ley de composición interna, y al conjunto de todos los elementos centrales se le denomina centro.

" a, b Î A; a * s = b * s Þ a = b Cuando un elemento s Î A es regular por la izquierda y por la derecha, decimos que es regular. Esta propiedad se denomina, también, de cancelación; y de verificarse se dice que la ley de composición interna es cancelativa. Existencia de neutro: Decimos que una ley de composición interna * definida en un conjunto E, tiene elemento neutro si $ e Î E, tal que:





Conmutatividad: Una ley de composición interna (*), definida en un conjunto E, es conmutativa si se verifica que:

"aÎE ®a*e=e*a=a Si existe, el elemento neutro es único. El neutro es un elemento central del conjunto A para esa ley de composición interna. " a, b, c Î E ® (a * b) * c = a * (b * c)

se verifica que:

7.2. Propiedades de las leyes de composición internas – Asociatividad: Una ley de composición interna (*), definida en un conjunto E, es asociativa si –

Existencia de simétricos: Decimos que, respecto a una ley de composición interna * definida en un conjunto E, con elemento neutro, existen elementos simétricos, si para cada elemento a Î E, existe un elemento a’ Î E tal que:

a * a’ = a’ * a = e Si, respecto a una ley de composición asociativa, un elemento tiene simétrico, éste es único. Veamos una sencilla demostración donde partimos de la existencia de dos simétricos a’ Î E y a’’ Î E de un elemento a Î E.

Dado un conjunto E, y otro conjunto W que denominaremos dominio de operadores, una ley de composición externa (#) definida en E por los operadores de W, es una aplicación de una parte de W · E en E; es decir, j:A ® E donde A Ì W · E La aplicación j hace corresponder a cada par de elementos (a, a) Î A un elemento c Î E. a’ = a’ * e = a’ * (a * a’’) = (a’ * a) * a’’ = e * a’’ = a’’ Por lo tanto, si un elemento a Î E tiene simétrico, éste es único.

Definición de ley de composición externa.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

190

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas

7.3. Definición de estructura algebraica Una estructura algebraica es un conjunto de leyes de composición interna o externa, definidas cada una de ellas en todo o en parte de un mismo conjunto E, y relacionadas por las propiedades que las liguen. Así, por ejemplo, una estructura algebraica es la definida en el conjunto de los números enteros por las operaciones + y · que están ligadas entre sí por la propiedad distributiva. Una estructura algebraica queda definida por las propiedades esenciales que se exigen a las leyes de composición que las definen, las cuales se enuncian como axiomas; así, según los axiomas elegidos las estructuras algebraicas reciben distintos nombres como grupos, anillos, cuerpos, espacios vectoriales, etc. Si en un mismo conjunto E estuviesen definidas dos colecciones de leyes de composición, sin que existiese ningún axioma que las ligase, habrá que considerarlas como dos estructuras algebraicas diferentes definidas sobre el mismo conjunto E. Sean A y B dos conjuntos, si definimos dos leyes de composición interna * y °, la ley * definida sobre A y la ley ° definida sobre B, diremos que una aplicación f: A ® B es un homomorfismo si se verifica que: " a,b Î A ® f(a * b) = f(a) ° f(b) Cuando en un homomorfismo la aplicación f: A ® B es biyectiva, decimos que se trata de un isomorfismo. Consecuentemente, si B es isomorfo a A también será A isomorfo a B y tienen el mismo cardinal. Cuando en un isomorfismo, se verifica que A = B, y las leyes de composición interna también coinciden, estamos ante un automorfismo. Cuando en un homomorfismo la aplicación f: A ® B es sobreyectiva, decimos que se trata de un epimorfismo. Consecuentemente la estructura de llegada es la imagen homomorfa de la de partida. Cuando en un homomorfismo la aplicación f: A ® B es inyectiva, decimos que se trata de un monomorfismo. Cuando en un homomorfismo la aplicación se realiza en una estructura algebraica sobre sí misma, estamos ante un endomorfismo.

8. GRUPOS 8.1. Semigrupo Sea un conjunto E y una ley de composición interna * definida en todoE, decimos que constituyen un semigrupo si se satisface la propiedad asociativa. " a, b, c, Î E ® (a * b) * c = a * (b * c) Si en E existe elemento neutro diremos que estamos ante un semigrupo unitario.

8.2. Grupo Diremos que {G, * } tiene estructura algebraica de grupo si la ley de composición interna verifica las siguientes propiedades: 1.

Asociativa: " a, b, c, Î E ® (a * b) * c = a * (b * c)

2.

Neutro: " a Î E ® a * e = e * a = a

3.

Simétrico: Para cada a Î E, $ a ' Î E | a * a’ = a’ * a = e Si además se satisface la propiedad conmutativa, diremos que el grupo es abeliano o conmutativo.

4.

Conmutativa: " a, b Î E ® a * b = b * a

Conjugando las dos definiciones antes vistas, diremos que un subconjunto H de un conjunto G es un subgrupo de G, si H es un grupo respecto de la misma operación que G. TEMARIO DE MATEMÁTICAS. PRUEBA A

191

Volumen I. Matemáticas

192

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

f(x) = f(y) Û f(x) * (f(y))’ = f(x) * (fy’) = f(x * y’) e1 Û x * y’ Î Ker(f) de lo que se prueba que cada X de la partición de G coincide con una clase adjunta respecto al divisor normal Ker(f). Sea N = Ker(f) y j la biyección en la que a cada X = f –1(u) le corresponde u Î G1, se tiene que en la aplicación j: G / N ® G1, j (X) = f(x), donde X = N * x, y, por lo tanto, j (X * Y) = j (N * (x * y)) = f(x * y) = = f(x) · f(y), con lo que queda probado que es un isomorfismo.

8.3. Concepto de clase adjunta

Sea el grupo {G, * }, y un subgrupo H, se denomina clase adjunta de H por la izquierda, a cada subconjunto a * H, con a Î G. Análogamente, denominamos clase adjunta de H por la derecha a cada subconjunto H * a, con a Î G. Cuando el subgrupo H tiene la propiedad de que para cada a Î G, el conjunto a * H coincide con el conjunto H * a, decimos que H es un divisor normal o invariante de G. Si G es un grupo abeliano, todo subgrupo es divisor normal. En el estudio de las clases adjuntas respecto de un divisor normal designaremos por N el divisor normal del grupo. Dado un grupo G y un divisor normal N, se define una relación  entre los elementos de G de la forma x y Û x * y’ Î N; esta relación es de equivalencia y cada una de las clases de equivalencia coincide con la clase adjunta. Al ser una relación de equivalencia:

Como f es una aplicación de G sobre G1, consideremos una partición de G en la que dos elementos x, y Î G pertenecen a dicha partición si f(x) = f(y), lo que puede transformarse teniendo en cuenta que:

Sean {G, *} y {G1, ·} dos grupos y f un homomorfismo suprayectivo de G sobre G1, entonces G / ker(f) y G1 son isomorfos. Vamos a demostrarlo:

Primer teorema de isomorfía

– –

 es reflexiva: x  x, ya que x * x’ Î N



 es transitiva: Si x  y e y  z entonces x  z. (x * y’) * (y * z’) = x * (y * y’) * z’ = x * z’ Î N Þ x  z

 es simétrica: x  y Þ y  x x  y Þ x * y' Î N ® (x * y’)’ = (y’)’ * x’ = y * x’ Þ y  x

Visto lo anterior podemos afirmar que dados dos grupos {G, *} y {G1, ·} y f un homomorfismo de G sobre G1, el Ker(f) es un divisor normal de G. ker(f) = {x x Î G, f ( x )= e1Î G1}

Sean {G, *} y {G, ·} dos grupos y f un homomorfismo de G sobre G1, llamamos núcleo del homomorfismo f, y lo representaremos por Ker(f) al conjunto de los elementos de G cuya imagen por f es el elemento neutro de G1.

Para probar que las clases adjuntas respecto de N coinciden con las de equivalencia habrá que probar que x  y Û N * x = N * y.

8.4. Núcleo de un homomorfismo. Primer teorema de isomorfía

x  y Þ x * y’ Î N Þ $ z Î Nïx * y’ = z Þ x =z * y Î N * y empleando el mismo razonamiento a la inversa que si x Î N * y Þ x  y Dado un grupo {G, *}, y un divisor normal N, el conjunto de las clases adjuntas con la operación *, tiene estructura de grupo. Además, la aplicación f en la que a cada elemento x Î G le corresponde la clase adjunta N * x, es un homomorfismo de G sobre el grupo de las clases adjuntas que designaremos como G/Â, y como la relación está originada por el divisor normal N se suele designar como G/N y se denomina grupo cociente.

x  y Þ x * y’ Î N Þ $ z Î Nïx * y’ = z Þ x =z * y Î N * y empleando el mismo razonamiento a la inversa que si x Î N * y Þ x  y Dado un grupo {G, *}, y un divisor normal N, el conjunto de las clases adjuntas con la operación *, tiene estructura de grupo. Además, la aplicación f en la que a cada elemento x Î G le corresponde la clase adjunta N * x, es un homomorfismo de G sobre el grupo de las clases adjuntas que designaremos como G/Â, y como la relación está originada por el divisor normal N se suele designar como G/N y se denomina grupo cociente.

8.4. Núcleo de un homomorfismo. Primer teorema de isomorfía

Para probar que las clases adjuntas respecto de N coinciden con las de equivalencia habrá que probar que x  y Û N * x = N * y.

Sean {G, *} y {G, ·} dos grupos y f un homomorfismo de G sobre G1, llamamos núcleo del homomorfismo f, y lo representaremos por Ker(f) al conjunto de los elementos de G cuya imagen por f es el elemento neutro de G1.



 es transitiva: Si x  y e y  z entonces x  z. (x * y’) * (y * z’) = x * (y * y’) * z’ = x * z’ Î N Þ x  z ker(f) = {x x Î G, f ( x )= e1Î G1}

 es simétrica: x  y Þ y  x x  y Þ x * y' Î N ® (x * y’)’ = (y’)’ * x’ = y * x’ Þ y  x

Visto lo anterior podemos afirmar que dados dos grupos {G, *} y {G1, ·} y f un homomorfismo de G sobre G1, el Ker(f) es un divisor normal de G.

– –

 es reflexiva: x  x, ya que x * x’ Î N

Primer teorema de isomorfía

Sea el grupo {G, * }, y un subgrupo H, se denomina clase adjunta de H por la izquierda, a cada subconjunto a * H, con a Î G. Análogamente, denominamos clase adjunta de H por la derecha a cada subconjunto H * a, con a Î G. Cuando el subgrupo H tiene la propiedad de que para cada a Î G, el conjunto a * H coincide con el conjunto H * a, decimos que H es un divisor normal o invariante de G. Si G es un grupo abeliano, todo subgrupo es divisor normal. En el estudio de las clases adjuntas respecto de un divisor normal designaremos por N el divisor normal del grupo. Dado un grupo G y un divisor normal N, se define una relación  entre los elementos de G de la forma x y Û x * y’ Î N; esta relación es de equivalencia y cada una de las clases de equivalencia coincide con la clase adjunta. Al ser una relación de equivalencia:

Sean {G, *} y {G1, ·} dos grupos y f un homomorfismo suprayectivo de G sobre G1, entonces G / ker(f) y G1 son isomorfos. Vamos a demostrarlo: Como f es una aplicación de G sobre G1, consideremos una partición de G en la que dos elementos x, y Î G pertenecen a dicha partición si f(x) = f(y), lo que puede transformarse teniendo en cuenta que:

f(x) = f(y) Û f(x) * (f(y))’ = f(x) * (fy’) = f(x * y’) e1 Û x * y’ Î Ker(f) de lo que se prueba que cada X de la partición de G coincide con una clase adjunta respecto al divisor normal Ker(f). Sea N = Ker(f) y j la biyección en la que a cada X = f –1(u) le corresponde u Î G1, se tiene que en la aplicación j: G / N ® G1, j (X) = f(x), donde X = N * x, y, por lo tanto, j (X * Y) = j (N * (x * y)) = f(x * y) = = f(x) · f(y), con lo que queda probado que es un isomorfismo.

8.3. Concepto de clase adjunta

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

192

Conceptos básicos de la teoría de conjuntos. Estructuras algebraicas

9. ANILLOS Un conjunto A y dos leyes de composición interna, que se indican con + y · , definidas en todo A, es decir {A, +, ·}, es un anillo, si las leyes de composición cumplen las siguientes propiedades: 1ª.

{A, +} satisface las propiedades que lo caracterizan como un grupo abeliano.

2ª.

Propiedad asociativa para la segunda ley (·): " x, y, z Î A ® (x · y) · z = x · (y · z)

3ª.

Propiedad distributiva de · respecto a +: " x, y, z Î A ® x · (y + z) = x · y + x · z (x + y) · z = x · z + y · z Además, si la segunda ley de composición, ·, es conmutativa el anillo se denomina anillo conmutativo. " x, y Î A ® x · y = y · x Si la segunda ley de composición, ·, tiene elemento neutro, e1, ahora se denominará anillo unitario. " x Î A, $ e1 Î Aúx · e1 = e1 · x = x

En este caso se suele decir que {A, +, ·} es un anillo con elemento unidad. Un anillo conmutativo con elemento unidad, en el que se verifique la ley de simplificación se denomina dominio de integridad.

9.1. Subanillo e ideales Dado un anillo {A, +, ·}, decimos que un subconjunto H Ì A es un subanillo de A, si H es un anillo respecto a las mismas operaciones que A. Dicho de otra forma, un subconjunto H de un anillo {A, +, ·} es subanillo, si y sólo si, para cada par x, y Î H se verifica que x – y Î H, x · y Î H, y · x Î H. Dentro de los subanillos distinguiremos un tipo especial que lo constituyen los ideales, diferenciando entre ideales por la izquierda e ideales por la derecha ya que, a priori, no podemos suponer que {A, +, ·} sea conmutativo.





Ideal por la izquierda Dado un anillo {A, +, ·}, un subconjunto I Ì A es un ideal por la izquierda si se verifica que: 1.

" x, y Î I ® x – y Î I.

2.

" x Î IÙ" z Î A ® z · x Î I.

Ideal por la derecha Dado un anillo {A, +, ·}, un subconjunto I Ì A es un ideal por la derecha si se verifica que: 1.

" x, y Î I ® x – y Î I.

2.

" x Î IÙ" z Î A ® x · z Î I.

Cuando I es ideal por la izquierda y por la derecha, se le denomina ideal bilátero. PROPOSICIÓN: Dado un anillo {A, +, ·} y un ideal por la izquierda I, si definimos una relación  entre los elementos de A tal que x  y Û x – y Î I, dicha relación es de equivalencia. (La demostración es análoga a la que hicimos al estudiar los grupos.) El conjunto de las clases de equivalencia A /  lo designaremos como A/I (anillo cociente de A respecto del ideal I), y cada una de las clases de equivalencia es de la forma I + x con x Î A. Dos clases I + x e I + x1 coinciden si y sólo si x – x1 Î I. TEMARIO DE MATEMÁTICAS. PRUEBA A

193

Volumen I. Matemáticas

194

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

PROPOSICIÓN Definidas en A/I las operaciones de adición y multiplicación de la forma: (I + x) + (I + y) = I + (x + y) (I + x) · (I + y) = I + (x · y) queda A/I dotado de estructura de anillo (por la izquierda), y además, la aplicación en la que a cada elemento x Î I le corresponde la clase I + x es un homomorfismo del anillo {A, +, ·} sobre el A/I.

Ademas si en K existen pares x, x’ Î Kúj(x + x’) > máximo {j( x) , j( x')}diremos que la valoración es arquimediana. j(x + x’) £ j (x)+ j (x')

4ª.

j(x · x’) = j(x) · j(x')

3ª.

j (x) > 0, " x Î K, x ¹ 0

2ª.

j (0) = 0

1ª.

Demostrción Como I es un grupo abeliano podemos escribir: (x – x1) + (y – y1) = (x + y) – (x1 + y1) Î I luego I + (x + y) coincide con I + (x1 + y1). Como I es un ideal por la izquierda tenemos que: x · y – x1 · y1 = x · (y – y1) + y · (x – x1) Î I luego I + (x · y) coincide con I + (x1 · y1). Análogamente a como vimos en los divisores normales de los grupos podemos afirmar que si {A, +, ·} y {A1, +, ·} son dos anillos con las mismas leyes de composición y f un homomorfismo de A sobre A1, se denomina núcleo del homomorfismo al conjunto de todos los elementos de A cuya imagen es el neutro de A1 en la adición.

Dada la parte positiva K+, se define x < y Û y – x Î K+ Decimos que un cuerpo {K, +, ·} ordenado, está ordenado arquimedianamente, si para cada x Î K, $ n Î K | x < n. Dado un cuerpo {K, +, ·}, una valoración definida en K es una aplicación j: K ® R+ È {0} que satisface las siguientes propiedades:

– – –

Estabilidad de la ordenación: " x, y Î K+ ® x + y Î K+ Ù x · y Î K+. Propiedad de tricomía: " x Î K ® x Î K+ Ú x = 0 Ú – x Î K+. El cero no es positivo, 0 Ï K+.

Sea {K, +, ·}, definida la parte K+ de K que se denomina parte positiva, y sus elementos los denominamos positivos, si verifican los siguientes axiomas:

2ª.

ker(f) = {x x Î A , f ( x )= 0}

{K, ·} es un grupo abeliano respecto a la segunda ley de composición.

El núcleo de un homomorfismo f de un anillo {A, +, ·} sobre el anillo {A1, +, ·} es un ideal bilátero, y además se cumple que A/Ker(f) y {A1, +, ·} son dos anillos isomorfos (esto constituye el teorema de isomorfía para anillos). 1ª.

K satisface las propiedades que lo caracterizan como un anillo conmutativo con elemento unidad.

Un conjunto K y dos leyes de composición interna, que se indican con + y · , definidas en todo K, es decir {K, +, ·}, es un cuerpo, si las leyes de composición cumplen las siguientes propiedades:

10. CUERPOS

10. CUERPOS

Un conjunto K y dos leyes de composición interna, que se indican con + y · , definidas en todo K, es decir {K, +, ·}, es un cuerpo, si las leyes de composición cumplen las siguientes propiedades:

El núcleo de un homomorfismo f de un anillo {A, +, ·} sobre el anillo {A1, +, ·} es un ideal bilátero, y además se cumple que A/Ker(f) y {A1, +, ·} son dos anillos isomorfos (esto constituye el teorema de isomorfía para anillos). 1ª.

K satisface las propiedades que lo caracterizan como un anillo conmutativo con elemento unidad.

2ª.

{K, ·} es un grupo abeliano respecto a la segunda ley de composición. ker(f) = {x x Î A , f ( x )= 0}

Sea {K, +, ·}, definida la parte K+ de K que se denomina parte positiva, y sus elementos los denominamos positivos, si verifican los siguientes axiomas:

Demostrción Como I es un grupo abeliano podemos escribir: (x – x1) + (y – y1) = (x + y) – (x1 + y1) Î I luego I + (x + y) coincide con I + (x1 + y1). Como I es un ideal por la izquierda tenemos que: x · y – x1 · y1 = x · (y – y1) + y · (x – x1) Î I luego I + (x · y) coincide con I + (x1 · y1). Análogamente a como vimos en los divisores normales de los grupos podemos afirmar que si {A, +, ·} y {A1, +, ·} son dos anillos con las mismas leyes de composición y f un homomorfismo de A sobre A1, se denomina núcleo del homomorfismo al conjunto de todos los elementos de A cuya imagen es el neutro de A1 en la adición.

– – –

El cero no es positivo, 0 Ï K+.

Propiedad de tricomía: " x Î K ® x Î K+ Ú x = 0 Ú – x Î K+.

Estabilidad de la ordenación: " x, y Î K+ ® x + y Î K+ Ù x · y Î K+.

Dada la parte positiva K+, se define x < y Û y – x Î K+ Decimos que un cuerpo {K, +, ·} ordenado, está ordenado arquimedianamente, si para cada x Î K, $ n Î K | x < n. Dado un cuerpo {K, +, ·}, una valoración definida en K es una aplicación j: K ® R+ È {0} que satisface las siguientes propiedades: 1ª.

j (0) = 0

PROPOSICIÓN Definidas en A/I las operaciones de adición y multiplicación de la forma: (I + x) + (I + y) = I + (x + y) (I + x) · (I + y) = I + (x · y) queda A/I dotado de estructura de anillo (por la izquierda), y además, la aplicación en la que a cada elemento x Î I le corresponde la clase I + x es un homomorfismo del anillo {A, +, ·} sobre el A/I. 2ª.

j (x) > 0, " x Î K, x ¹ 0

3ª.

j(x · x’) = j(x) · j(x')

4ª.

j(x + x’) £ j (x)+ j (x')

Ademas si en K existen pares x, x’ Î Kúj(x + x’) > máximo {j( x) , j( x')}diremos que la valoración es arquimediana.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

194

TEMA

12 Espacios vectoriales. Variedades lineales. Aplicaciones lineales entre espacios vectoriales. Teorema de isomorfía

Jesús Gómez Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

196

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO INTRODUCCIÓN

2.

LA ESTRUCTURA DE ESPACIO VECTORIAL 2.1. Definición de espacio vectorial 2.2. Consecuencias inmediatas 2.3. Ejemplos de espacios vectoriales 2.4. Espacio vectorial producto

3.

DEPENDENCIA E INDEPENDENCIA LINEAL 3.1. Combinaciones lineales 3.2. Sistemas libres y ligados

4.

VARIEDADES LINEALES 4.1. Subespacio vectorial. Condiciones necesarias y suficientes 4.2. Intersección y suma de subespacios 4.2.1. Subespacio “intersección” 4.2.2. Subespacio “suma” 4.3. Variedad lineal generada por un sistema de vectores 4.4. El retículo de las variedades lineales de un espacio vectorial 4.5. Suma directa. Variedades complementarias

10.

1.

APLICACIONES LINEALES Y MATRICES 10.1. Matriz asociada a una aplicación lineal 10.2. Ecuaciones del núcleo y de la imagen. 10.3. Rango de una aplicación lineal

DUALIDAD 9.1. Estructuras de Hom(E,F), End(E) y Aut(E) 9.2. Espacio dual

9.

TEOREMAS DE ISOMORFÍA 8.1. Espacios cociente. Aplicación canónica de un subespacio 8.2. Descomposición canónica de un homomorfismo 8.3. Teoremas de isomorfía 8.4. Consecuencias: teoremas de la dimensión

8.

APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES 7.1. Noción de aplicación lineal 7.2. Primeras consecuencias de la definición 7.3. Núcleo e imagen de una aplicación lineal 7.4. Tipos de aplicaciones lineales 7.5. Caracterización de monomorfismos, epimorfismos e isomorfismos.

7.

COORDENADAS DE UN VECTOR RESPECTO DE UNA BASE 6.1. Caracterización de las bases 6.2. Noción de coordenadas 6.3. Cambio de base

6.

SISTEMAS GENERADORES Y BASES DE UN ESPACIO VECTORIAL 5.1. Sistema generador 5.2. Bases de un espacio vectorial 5.3. Teorema de la base. 5.4. Dimensión de un espacio vectorial 5.5. Sistemas de vectores equivalentes 5.6. Rango de un sistema de vectores

5.

5.

SISTEMAS GENERADORES Y BASES DE UN ESPACIO VECTORIAL 5.1. Sistema generador 5.2. Bases de un espacio vectorial 5.3. Teorema de la base. 5.4. Dimensión de un espacio vectorial 5.5. Sistemas de vectores equivalentes 5.6. Rango de un sistema de vectores

6.

COORDENADAS DE UN VECTOR RESPECTO DE UNA BASE 6.1. Caracterización de las bases 6.2. Noción de coordenadas 6.3. Cambio de base

7.

APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES 7.1. Noción de aplicación lineal 7.2. Primeras consecuencias de la definición 7.3. Núcleo e imagen de una aplicación lineal 7.4. Tipos de aplicaciones lineales 7.5. Caracterización de monomorfismos, epimorfismos e isomorfismos.

8.

TEOREMAS DE ISOMORFÍA 8.1. Espacios cociente. Aplicación canónica de un subespacio 8.2. Descomposición canónica de un homomorfismo 8.3. Teoremas de isomorfía 8.4. Consecuencias: teoremas de la dimensión

9.

DUALIDAD 9.1. Estructuras de Hom(E,F), End(E) y Aut(E) 9.2. Espacio dual

4.3. 4.4. 4.5.

VARIEDADES LINEALES 4.1. Subespacio vectorial. Condiciones necesarias y suficientes 4.2. Intersección y suma de subespacios 4.2.1. Subespacio “intersección” 4.2.2. Subespacio “suma” Variedad lineal generada por un sistema de vectores El retículo de las variedades lineales de un espacio vectorial Suma directa. Variedades complementarias

4.

DEPENDENCIA E INDEPENDENCIA LINEAL 3.1. Combinaciones lineales 3.2. Sistemas libres y ligados

3.

LA ESTRUCTURA DE ESPACIO VECTORIAL 2.1. Definición de espacio vectorial 2.2. Consecuencias inmediatas 2.3. Ejemplos de espacios vectoriales 2.4. Espacio vectorial producto

2.

INTRODUCCIÓN

1.

10.

APLICACIONES LINEALES Y MATRICES 10.1. Matriz asociada a una aplicación lineal 10.2. Ecuaciones del núcleo y de la imagen. 10.3. Rango de una aplicación lineal

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

196

Espacios vectoriales. Variedades lineales

1. INTRODUCCIÓN El ente denominado “vector” era ya utilizado en Mecánica desde fines del siglo XVII para la composición de fuerzas y velocidades. Pero entre los matemáticos no tuvo repercusión hasta el XIX, cuando Gauss utiliza implícitamente la suma vectorial en su representación de los números complejos en el plano, cuando Möbius expone en su “cálculo baricéntrico” de 1827 aplicaciones geométricas donde las coordenadas tienen un sentido aritmético, no geométrico, y cuando Giusto Bellavitis desarrolla entre 1832 y 1837, con sus “equipolencias”, un conjunto de operaciones con “cantidades dirigidas” que equivale al cálculo vectorial de hoy. La noción de un espacio n-dimesional para n > 3, se aceptó gradualmente durante el siglo XIX; por tanto, es difícil señalar una primera “invención” de espacio vectorial abstracto. Entre los usos tempranos de dicho concepto cabe señalar su presencia en un trabajo escrito en 1836 por el ruso Mikhail Ostogradski, en los tratados geométricos de Hermann Grassmann a principio de la década de 1840 y en un breve artículo de Arthur Cayley, en 1846. Lamentablemente los dos primeros fueron ignorados en vida, mientras que el trabajo de Grassmann pecaba de ser excesivamente filosófico y difícil de leer. Por su parte Sir William Hamilton ya observó en una carta de 1841 la posibilidad de introducir las políadas (lo que nosotros llamamos n-uplas) como generalizaciones de pares y ternas. A él parece deberse el propio nombre de “vector” y la creación de un sistema de números complejos de cuatro componentes que denominó cuaterniones. De cualquier forma Hamilton, que ejerció como astrónomo real de Irlanda, fue más conocido por sus contribuciones a la dinámica. Pero aunque los vectores de Rn fueron tratados por matemáticos y físicos de la segunda mitad del XIX, no se imprimió una definición axiomática de espacio vectorial abstracto hasta la aparición en 1918 del tratado Space-Time-Matter, cuyo autor Hermann Weyl escribió como introducción a la teoría general de la relatividad de Einstein. Analizando la naturaleza del espacio euclidiano, formuló lo que ahora son los axiomas comunes de espacio vectorial. Como sólo trató de espacios de dimensión finita incluyó el axioma de dimensionalidad: “Para algún número entero h hay h vectores linealmente independientes en V, pero todo conjunto de h+1 vectores es linealmente dependiente”. Los axiomas de espacio vectorial se conocían ya años atrás, pero se demostraban como consecuencia de otras definiciones de vectores. Así por ejemplo aparecen en 1888 en un breve texto en italiano de Giuseppe Peano, titulado Cálculo Geométrico, donde explica el trabajo de Grassmann. Este último había publicado en 1862 una segunda versión de su tratado anterior, cuyo título traducido del alemán es Teoría de la Extensión Lineal, donde logró suprimir el sesgo filosófico que lo hacía tan ilegible y concentrarse más en las ideas matemáticas, entre las que estaban las ideas básicas de la teoría de espacios vectoriales n- dimensionales (combinación lineal, dependencia lineal, subespacio y base). Desarrolló la noción de dimensión como el número máximo de vectores linealmente independientes y probó la relación fundamental para dos subespacios U y W de que dim(U+W) = dim U + dimW – dim (U Ç W) (fórmula que lleva su nombre). Las nociones de Grassmann se derivaron del intento de traducir las ideas geométricas que se tenían sobre el espacio n-dimensional al lenguaje del álgebra, sin introducir coordenadas como se hace en la geometría analítica ordinaria. Aunque sus ideas fueron inicialmente difíciles de entender, al fin entraron en la corriente matemática en campos como el análisis vectorial y el álgebra exterior. Paradójicamente Grassmann nunca logró su objetivo de ser profesor en una universidad alemana y pasó parte de su vida como maestro de matemáticas en una escuela secundaria, hasta que al final de su vida se alejó de las matemáticas convirtiéndose en un experto en lingüística. En cuanto al concepto de aplicación lineal, éste data del siglo XVIII, pero entendido como “sustitución lineal” no como función de vectores. Hasta que los físicos no se acostumbraron a tratar con vectores no se explicitó como tal. Así, uno de los fundadores del análisis vectorial, Oliver Heaviside, introdujo en 1885 la idea de “operador vectorial lineal” en uno de sus trabajos sobre electromagnetismo. En sus clases de Yale, publicadas en 1901, el físico Josiah Willard Gibbs llamó “transformación función vectorial lineal” a una función vectorial continua f tal que f(v + w) = f(v) + f(w). La definición completamente abstracta, exactamente igual a la actual, de “transformación lineal” fue dada por Weyl en 1918 en su Space-Time-Matter. Por último, las ideas de Hamilton, Grassmann y Peano se generalizan aún más en los famosos Grundlagen der Geometrie (“Fundamentos de Geometría”) de David Hilbert, publicados en 1899, y en las aportaciones de Stefan Banach (1892-1945), máximo exponente de la “escuela polaca” de matemáticas que floreció en el período comprendido entre las dos guerras mundiales. Con Hilbert y Banach, puede decirse que se completa la formalización de la teoría de espacios vectoriales abstractos, generalizando las ideas anTEMARIO DE MATEMÁTICAS. PRUEBA A

197

Volumen I. Matemáticas

198

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

3.

Si el cuerpo de escalares es R , entonces hablaremos de espacio vectorial real.

4.

Aunque en la estructura de espacio vectorial intervienen dos “sumas” distintas (Å y +) que son leyes de composición interna en V y R respectivamente, las representaremos ambas por el mismo símbolo + . De igual forma, sin perjuicio de distinguir entre producto (·) de escalares (operación interna en K) y producto (°) de escalares por vectores (operación externa sobre V con operadores en K), ambos “productos” se expresarán por yuxtaposición; esto es, escribiremos en ambos casos lm y lu.

teriores. A propósito de ello, Toepliz en 1933 hace la observación de que la teoría de determinantes no es necesaria para la demostración de los principales teoremas del Algebra Lineal, lo que permite extender éstos a los espacios de dimensión infinita y hace notar que el Algebra Lineal así entendida se aplica a un cuerpo de base conmutativo cualquiera. Así pues, la parte de la matemática que se conoce como Algebra Lineal está basada en la propia estructura de espacio vectorial; esto es, se ha desarrollado a partir del vasto edificio algebraico-geométrico que Grassmann construyó basándose en una concepción geométrica o “intrínseca” ( ya más o menos axiomatizada) del espacio de n dimensiones. La “linealización” es una de las propiedades más características del álgebra más antigua, pero también del álgebra moderna, en la que el método axiomático y la definición de estructura permiten formular con precisión y con generalidad lo que antes era vago o inconsciente. 2.

Se plantea la siguiente cuestión: ¿puede convertirse un espacio vectorial por la izquierda (o por la derecha) en un espacio vectorial bilátero? Se piensa en la identificación l°u = u ° l. Pero entonces l ° (m ° u) = (m ° u) ° l = (u ° m) ° l = u ° (m · l), mientras hubiésemos debido obtener (l · m) ° u; es decir, esta definición “natural” no es correcta más que si el cuerpo K es conmutativo. De ahí que en adelante, supondremos K conmutativo y operaremos los escalares de K con elementos de V indistintamente por ambos lados. Tendremos un espacio vectorial bilátero, al que nos referiremos simplemente como K-espacio vectorial o espacio vectorial sobre K. r r r A los elementos de V les llamamos “vectores” y se suelen designar por u, v, w, … (ó u, v, w, ...) y a los elementos del cuerpo K “escalares”, designándolos por letras griegas a, b, l, m,........

2. LA ESTRUCTURA DE ESPACIO VECTORIAL 2.1. Definición de espacio vectorial

1.

Sea ( K,+, ·) un cuerpo conmutativo y sea V un conjunto no vacío en el que hay definidas

Observaciones:



Una ley de composición interna Å : V x V ® V

– Una ley de composición interna °: K x V ® V con “escalares” en el cuerpo K Decimos que la terna (V, Å, ° ) tiene estructura de espacio vectorial por la izquierda sobre K si cumple los axiomas siguientes:

Si la ley de composición externa es °: V x K ® V, podemos definir análogamente espacio vectorial por la derecha sobre K.

Los axiomas 2 y 3 vienen a ser dos propiedades distributivas de la ley externa ° con relación a la suma de vectores y a la suma de escalares respectivamente. El axioma 4 es una propiedad “pseudoasociativa” o asociativa mixta, pues intervienen dos operaciones distintas (el producto en K y la ley externa °). Por último, el axioma 5 hace referencia a la neutralidad del escalar 1 respecto a la ley externa °. Ax.1: (V, Å) es un grupo abeliano

Ax.2: l ° (u Å v) = (l ° u) Å (l ° u) (" l Î K ," u, v Î V) Ax.3: (l + m) °u = (l ° u) Å (m ° u) (" l, m Î K ," u Î V) l ° (m ° u) = (l · m) ° u (" l,m Î K, " u Î V)

Ax.1:

(V, Å) es un grupo abeliano

Ax.2:

l ° (u Å v) = (l ° u) Å (l ° u) (" l Î K ," u, v Î V)

Ax.3:

(l + m) °u = (l ° u) Å (m ° u) (" l, m Î K ," u Î V)

Ax.4:

l ° (m ° u) = (l · m) ° u (" l,m Î K, " u Î V)

Ax.5:

1 ° u = u (" u Î V)

Ax.4:

Ax.5: 1 ° u = u (" u Î V) Los axiomas 2 y 3 vienen a ser dos propiedades distributivas de la ley externa ° con relación a la suma de vectores y a la suma de escalares respectivamente. El axioma 4 es una propiedad “pseudoasociativa” o asociativa mixta, pues intervienen dos operaciones distintas (el producto en K y la ley externa °). Por último, el axioma 5 hace referencia a la neutralidad del escalar 1 respecto a la ley externa °. Si la ley de composición externa es °: V x K ® V, podemos definir análogamente espacio vectorial por la derecha sobre K.

Decimos que la terna (V, Å, ° ) tiene estructura de espacio vectorial por la izquierda sobre K si cumple los axiomas siguientes:

– –

Una ley de composición interna °: K x V ® V con “escalares” en el cuerpo K Una ley de composición interna Å : V x V ® V

Observaciones:

Sea ( K,+, ·) un cuerpo conmutativo y sea V un conjunto no vacío en el que hay definidas

1.

Se plantea la siguiente cuestión: ¿puede convertirse un espacio vectorial por la izquierda (o por la derecha) en un espacio vectorial bilátero? Se piensa en la identificación l°u = u ° l. Pero entonces l ° (m ° u) = (m ° u) ° l = (u ° m) ° l = u ° (m · l), mientras hubiésemos debido obtener (l · m) ° u; es decir, esta definición “natural” no es correcta más que si el cuerpo K es conmutativo. De ahí que en adelante, supondremos K conmutativo y operaremos los escalares de K con elementos de V indistintamente por ambos lados. Tendremos un espacio vectorial bilátero, al que nos referiremos simplemente como K-espacio vectorial o espacio vectorial sobre K. r r r A los elementos de V les llamamos “vectores” y se suelen designar por u, v, w, … (ó u, v, w, ...) y a los elementos del cuerpo K “escalares”, designándolos por letras griegas a, b, l, m,........

2.1. Definición de espacio vectorial

2. LA ESTRUCTURA DE ESPACIO VECTORIAL

teriores. A propósito de ello, Toepliz en 1933 hace la observación de que la teoría de determinantes no es necesaria para la demostración de los principales teoremas del Algebra Lineal, lo que permite extender éstos a los espacios de dimensión infinita y hace notar que el Algebra Lineal así entendida se aplica a un cuerpo de base conmutativo cualquiera. Así pues, la parte de la matemática que se conoce como Algebra Lineal está basada en la propia estructura de espacio vectorial; esto es, se ha desarrollado a partir del vasto edificio algebraico-geométrico que Grassmann construyó basándose en una concepción geométrica o “intrínseca” ( ya más o menos axiomatizada) del espacio de n dimensiones. La “linealización” es una de las propiedades más características del álgebra más antigua, pero también del álgebra moderna, en la que el método axiomático y la definición de estructura permiten formular con precisión y con generalidad lo que antes era vago o inconsciente. 2.

Aunque en la estructura de espacio vectorial intervienen dos “sumas” distintas (Å y +) que son leyes de composición interna en V y R respectivamente, las representaremos ambas por el mismo símbolo + . De igual forma, sin perjuicio de distinguir entre producto (·) de escalares (operación interna en K) y producto (°) de escalares por vectores (operación externa sobre V con operadores en K), ambos “productos” se expresarán por yuxtaposición; esto es, escribiremos en ambos casos lm y lu.

4.

Si el cuerpo de escalares es R , entonces hablaremos de espacio vectorial real.

3.

198

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales

2.2. Consecuencias inmediatas Al ser la estructura aditiva (V,+) de grupo abeliano se cumplirán obviamente todas las consecuencias. Denotaremos por 0 al neutro para la suma en V (vector nulo) distinguiéndolo del neutro en K, que designaremos por 0 (escalar “cero”). Asimismo denotaremos por –u al simétrico (vector “opuesto”) de u respecto a la suma en V. Señalaremos a continuación algunas consecuencias relevantes de la propia definición de espacio vectorial: 1.

“Todo espacio vectorial es no vacío”. Al menos debe contener al vector 0. El espacio vectorial más simple es el trivial ({0},+, ·) donde las operaciones se definen como 0 + 0 = 0 y l0 = 0 para cualquier l Î K.

2.

“En todo espacio vectorial, para cualesquiera l, m Î K y para cualesquiera u, v Î V, se cumplen: a) 0u = 0 b) l0 = 0 c) lu = 0 Þ l = 0 ó u = 0 d) (–l)u = l (–u) = –(lu) e) (–l)(–u) = lu f) l u = mu, u ¹ 0 Þ l = m g) l u = l v, l ¹ 0 Þ u = v

En efecto, a) y b) son consecuencias de la unicidad del neutro para la suma en V y son inmediatas a partir de las igualdades 0u = (0 + 0)u = 0u + 0u y l0 = l(0 + 0) = l0 + l0. Para probar c) partimos de l · u = 0 y si fuese l = 0 ya estaría, en caso contrario l ¹0, entonces como K es cuerpo existe l–1, y multiplicando l–1(l u) = l–10, de donde llegamos a que l–1(l u) = (l–1 · l) u = 1 · u = u = 0. De las igualdades 0 = 0u = [l + (–l)]u = lu + (–l) u y 0 = l0 = l[u + (–u)] = lu + l(–u) resultan d). La e) es inmediata conjugando las d) y la propiedad involutiva del opuesto. Las dos últimas se basan en la c), pues l u = m u, u ¹ 0 Þ (l – m) u = 0, con u ¹ 0 Þ l – m = 0 Þ l = m l u = l v , l ¹ 0 Þ l (u – v) = 0, con l ¹ 0 Þ u – v = 0 Þ u = v

2.3. Ejemplos de espacios vectoriales Hay numerosos ejemplos de objetos matemáticos de diversa índole con los que es posible definir una “suma” y un “producto por escalares”, y que se comportan como “vectores”. Es decir, tras prescindir de la propia naturaleza de tales objetos (“desustanciación”) quedan las propiedades formales que configuran la estructura de espacio vectorial o estructura lineal. Dicha estructura está presente en multitud de “modelos matemáticos”, algunos de los cuales se citan a continuación:



Si V2 y V3 son respectivamente el conjunto de vectores libres (clases de equipolencia) en el plano y en el espacio, con las operaciones suma de vectores y producto de números reales por vectores, definidas “geométricamente” de la forma habitual, entonces (V2,+,· ) y (V3,+,· ) son espacios vectoriales reales.



El conjunto C = {a + bi / a, b Î R} de los números complejos con las operaciones “lineales” usuales también tiene estructura de espacio vectorial real.



Si denotamos por Á (D,R) al conjunto de todas las funciones reales de variable real con dominio D Ì R, podemos definir f + g y lf como (f + g)(x) = f(x) + g(x) y (lf)(x) = lf(x) " x Î D. Entonces (Á (D,R), +, ·) es otro espacio vectorial real.



El conjunto Ã(X) de polinomios en la indeterminada X con coeficientes en un cuerpo K cualquiera, así como el conjunto Mm·n(K) de las matrices m · n de elementos de K, ambos con las operaciones lineales usuales, constituyen nuevos ejemplos de K-espacios vectoriales.

TEMARIO DE MATEMÁTICAS. PRUEBA A

199

Volumen I. Matemáticas Pero cabe destacar entre todos estos modelos el constituido por las n-uplas (x1, x2, …, xn) de elementos de un cuerpo cualquiera K, definiendo las operaciones usuales con n-uplas: (x1, x2, ..., xn) + (y1, y2, ..., yn) = (x1 + y1, x2 + y2, ..., xn + yn) l(x1, x2, ..., xn) = (l x1, l x2, ..., l xn) Se prueba que con las operaciones anteriores (Kn, +, ·) es un espacio vectorial sobre el cuerpo K. En particular si K = R, tenemos los espacios vectoriales “numéricos” R2, R3, R4,.... de los pares, ternas, cuádruplas,... de números reales. Su importancia estriba en que al introducir las coordenadas de un vector respecto de una base, el estudio de cualquier espacio vectorial real quedará reducido al habitual de tales espacios (Rn ,+,·).

2.4. Espacio vectorial producto Dados dos espacios vectoriales (V1 ,+,·) y (V2,+,·) sobre un mismo cuerpo K, podemos definir en el conjunto V1 · V2 las operaciones: a)

(u1, u2) + (v1, v2) = (u1 + v1 , u2 + v2) (" u1, v1 Î V1, " u2, v2 Î V2)

b)

l(u1, u2) = (l u1, l u2) (" u1 Î V1, "u2 Î V2 , " l Î K) Con ambas operaciones es fácil probar que (V1 x V2, +,·) es otro K-espacio vectorial.

La construcción anterior puede generalizarse para el espacio producto (V1 x V2 x … x Vn , +, ·) donde (Vi ,+,·) son espacios vectoriales sobre el mismo cuerpo K.

3. DEPENDENCIA E INDEPENDENCIA LINEAL 3.1. Combinaciones lineales Sea S = {u1, u2, ..., un} un conjunto finito (o sistema) de n vectores de un K-espacio vectorial. A toda expresión l1u1 + l2 u2 + .....+ ln un , donde li Î K(i = 1, 2, ..., n) son escalares cualesquiera de K, se denomina combinación lineal de los vectores de S. Dichos escalares li (i = 1, 2, ..., n) se denominan “coeficientes” de la combinación lineal. Obviamente, el resultado de una combinación lineal de vectores de V es otro vector de V. Si se toman todos los coeficientes nulos, se tiene la combinación lineal trivial 0u1 + 0u2 + … + 0un cuyo resultado es el vector nulo 0. Si un vector v Î V puede obtenerse mediante combinación lineal de {u1, u2, ..., un}, o sea, existen escalares li (i = 1, 2, ..., n), tales que v = l1u1 + l2 u2 + ... + ln un = å l

, entonces decimos que v depende li-

nealmente de los u1, u2, ..., un. Son inmediatas las siguientes consecuencias: 1.

“El vector nulo depende linealmente de cualquier sistema de vectores” (Bastaría tomar la combinación lineal trivial.)

2.

“Todo vector depende linealmente de cualquier sistema de vectores que lo contenga” (Cualquier uk Î {u1, u2, ..., un} puede ponerse como uk = 0u1 + 0u2+ ... + 1uk + ... + 0un)

3.

“Si v depende linealmente del sistema {u1, u2, ..., un} y cada uk depende linealmente a su vez del sistema {w1, w2, ..., wm}, entonces v depende linealmente de {w1, w2, ..., wm}”. (Transitividad de las combinaciones lineales). (En efecto, sería

200

åa

åa ( å b

å åa b =

åd

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Espacios vectoriales. Variedades lineales

3.2. Sistemas libres y ligados DEFINICIÓN: “Se dice S = {u1, u2, ..., un} es un sistema “libre” de vectores de V, si la única combinación lineal de ellos que da como resultado el vector nulo 0 es la trivial. Es decir: l1u1 + l2 u2 + … + ln un = 0 Þ l1 = l2 = ... = ln = 0 En tal caso decimos también que los vectores u1, u2, ..., un son linealmente independientes” DEFINICIÓN: “Si el sistema S = {u1, u2, ..., un} no es libre se denomina sistema “ligado”; esto es, si el vector nulo 0 puede obtenerse mediante alguna combinación lineal no trivial de los vectores de S. O sea, si existen coeficientes l1 , l2, ... ln Î K, no todos nulos, tales que l 1u1 + l 2 u 2 + … + l n un = 0 Si es así decimos también que los vectores u1, u2, ..., un son linealmente dependientes” TEOREMA (Caracterización de los sistemas libres): “Un sistema S = {u1, u2, ..., un} de vectores es libre si y sólo si todo vector de V que dependa linealmente de los vectores de S, sólo puede expresarse de una forma como combinación lineal de los vectores de S” Demostración: Supongamos que S es libre y sea v un vector que depende linealmente de los vectores de S. Si fuese v = l1u1 + l2 u2 + … + ln un y v = m1u1 + m2 u2 + … + mn un, restando ambas expresiones (l1 – m1)u1 + + (l2 – m2)u2 + … + (ln– mn) un = 0; y de aquí, por ser S libre, necesariamente l1 – m1 = l2 – m2 = … = = ln– mn = 0, de donde li = mi (i = 1, 2, ..., n). Recíprocamente, si ningún vector puede obtenerse mediante dos combinaciones lineales distintas de los vectores de S, resultaría obvio que el vector nulo sólo se podría obtener mediante la combinación lineal trivial de S. Por tanto S sería un sistema libre. TEOREMA (Caracterización de los sistemas ligados): “Un sistema S = {u1, u2, ..., un} de vectores es ligado si y sólo si hay al menos un vector en S que es combinación lineal de los restantes vectores de S”. Demostración: Si S es ligado podremos poner l1u1 + l2 u2 + ... + ln un = 0, con algún li ¹ 0. Reordenando los sumandos si fuese preciso, podemos suponer l1 ¹ 0. Entonces trasponiendo términos y multiplicando por l–1 1 quedará –1

–1

–1

u1 = –l1 l2 u2 –l1 l3 u3 – ... –l1 ln un de donde u1 es combinación lineal de u2, u3, ...,un. Observación: La condición anterior puede “afinarse” aún más. Podemos decir que S es ligado si y sólo si, una vez ordenados los vectores de S, alguno de ellos es combinación lineal de los precedentes. La demostración es fácil de “retocar”. Bastaría considerar el primer entero positivo k tal que u1, u2, ..., uk k

son linealmente dependientes. Entonces å b iu i = 0 (*) con algún bi ¹ 0. Debe ser bk ¹ 0, ya que i=1

en caso contrario u1, u2, ..., uk–1 serían linealmente dependientes contradiciendo la definición de k. k–1

Podríamos despejar uk a partir de los precedentes, quedando uk = å b –1 k b iu i. i=1

En el conjunto V3 de “vectores libres” del plano, la dependencia lineal tiene una interpretación geométrica sencilla u1

Figura 1.

u1

u1 u3

u2 { u1, u2 } ligado misma dirección

u1

{ u1, u2 } libre distinta dirección

TEMARIO DE MATEMÁTICAS. PRUEBA A

u3 { u1, u2 u3} ligado coplanarios

u2

u2

u3 { u1, u2 u3} libre no coplanarios 201

Volumen I. Matemáticas

202

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Demostración: De cumplirse ambas condiciones, está garantizada la estabilidad de H para las operaciones; es decir “+” es interna en H y “ · ” es externa en H con escalares en K. La asociatividad y la conmutatividad de la suma de vectores se verifican en H por ser subconjunto de V. Para cualquier vector u Î H, tomando el escalar –1, la condición 2. nos permite asegurar que –u = = (–1)u Î H. Asimismo, por la condición 1. se tendrá 0 = u + (–1)u Î H. Por tanto H es un subgrupo abeliano de V. Los axiomas 2, 3, 4, 5 de la definición de espacio vectorial referentes a la ley externa se cumplen en H por cumplirse para elementos de V en general. Luego las operaciones inducirían en H una estructura de espacio vectorial. Recíprocamente, si H es subespacio vectorial de V, es obvio que ambas condiciones se verifican. Otras propiedades:

1.

“Todo sistema de vectores que incluya el vector 0 es ligado”

2.

“Todo subconjunto de un sistema libre es también un sistema libre”

3.

“Todo sistema de vectores que contenga un subsistema ligado es también ligado”

4.

“Si {u1, u2, ..., un} es un sistema libre y {u1, u2, ..., un, v} es ligado, entonces v depende linealmente de u1, u2, ..., un”

Hasta aquí hemos considerado sólo conjuntos finitos de vectores de V. Pero el concepto de dependencia lineal puede extenderse al caso de un conjunto S infinito de vectores de V. Podemos entonces definir como libre aquel conjunto S que cumpla que todo sistema de n vectores {u1, u2, ..., un} extraído de S es linealmente independiente, es decir:

TEOREMA: “Dado un K-espacio vectorial V y un subconjunto H Ì V (H ¹ Æ), H es subespacio vectorial de V si y sólo si se cumplen las dos condiciones siguientes: 1. " u,v Î H: u + v Î H 2. " u Î H, " l Î K : lu Î H ” " ui Î S (i = 1,2,..n) : a1u1 + a2u2, + ... + anun = 0 Þ a1 = a2 = ... = an = 0

En caso contrario, de S podrá extraerse un sistema de vectores ligado; o lo que es lo mismo una combinación lineal no trivial de un número finito de vectores de S cuyo resultado sea el vector nulo 0. Entonces diremos que S es un conjunto ligado. Las cuatro propiedades anteriores son válidas para conjuntos cualesquiera de vectores:

DEFINICIÓN: “Sea H un subconjunto no vacío de un espacio vectorial V sobre el cuerpo K. Si las operaciones lineales de V, al restringirlas a elementos de H, confieren también a éste una estructura de espacio vectorial, diremos que H es un subespacio vectorial de V” Para ello será preciso que H sea una parte estable o cerrada para las operaciones definidas en V, y que éstas induzcan en H la misma estructura que V. Lo anterior es obvio si fuese H = {0} ó si H = V. Por tanto, todo espacio vectorial V admite al menos dos subespacios vectoriales, a saber, el trivial {0} y el mismo V. Se les denomina subespacios vectoriales impropios de V

– – –

Si 0 Î S, S es un conjunto ligado ìS' libre Þ Slibre Si S Ì S’, entonces í îS ligado Þ S' ligado

Si S es libre y S È {v} es ligado, entonces v es combinación lineal de un número finito de vectores de S.

4. VARIEDADES LINEALES 4.1. Subespacio vectorial. Condiciones necesarias y suficientes

4. VARIEDADES LINEALES 4.1. Subespacio vectorial. Condiciones necesarias y suficientes

DEFINICIÓN: “Sea H un subconjunto no vacío de un espacio vectorial V sobre el cuerpo K. Si las operaciones lineales de V, al restringirlas a elementos de H, confieren también a éste una estructura de espacio vectorial, diremos que H es un subespacio vectorial de V” Para ello será preciso que H sea una parte estable o cerrada para las operaciones definidas en V, y que éstas induzcan en H la misma estructura que V. Lo anterior es obvio si fuese H = {0} ó si H = V. Por tanto, todo espacio vectorial V admite al menos dos subespacios vectoriales, a saber, el trivial {0} y el mismo V. Se les denomina subespacios vectoriales impropios de V

– – –

Si S es libre y S È {v} es ligado, entonces v es combinación lineal de un número finito de vectores de S. Si 0 Î S, S es un conjunto ligado ìS' libre Þ Slibre Si S Ì S’, entonces í îS ligado Þ S' ligado

En caso contrario, de S podrá extraerse un sistema de vectores ligado; o lo que es lo mismo una combinación lineal no trivial de un número finito de vectores de S cuyo resultado sea el vector nulo 0. Entonces diremos que S es un conjunto ligado. Las cuatro propiedades anteriores son válidas para conjuntos cualesquiera de vectores:

TEOREMA: “Dado un K-espacio vectorial V y un subconjunto H Ì V (H ¹ Æ), H es subespacio vectorial de V si y sólo si se cumplen las dos condiciones siguientes: 1. " u,v Î H: u + v Î H 2. " u Î H, " l Î K : lu Î H ” " ui Î S (i = 1,2,..n) : a1u1 + a2u2, + ... + anun = 0 Þ a1 = a2 = ... = an = 0

Hasta aquí hemos considerado sólo conjuntos finitos de vectores de V. Pero el concepto de dependencia lineal puede extenderse al caso de un conjunto S infinito de vectores de V. Podemos entonces definir como libre aquel conjunto S que cumpla que todo sistema de n vectores {u1, u2, ..., un} extraído de S es linealmente independiente, es decir:

Demostración: De cumplirse ambas condiciones, está garantizada la estabilidad de H para las operaciones; es decir “+” es interna en H y “ · ” es externa en H con escalares en K. La asociatividad y la conmutatividad de la suma de vectores se verifican en H por ser subconjunto de V. Para cualquier vector u Î H, tomando el escalar –1, la condición 2. nos permite asegurar que –u = = (–1)u Î H. Asimismo, por la condición 1. se tendrá 0 = u + (–1)u Î H. Por tanto H es un subgrupo abeliano de V. Los axiomas 2, 3, 4, 5 de la definición de espacio vectorial referentes a la ley externa se cumplen en H por cumplirse para elementos de V en general. Luego las operaciones inducirían en H una estructura de espacio vectorial. Recíprocamente, si H es subespacio vectorial de V, es obvio que ambas condiciones se verifican.

“Si {u1, u2, ..., un} es un sistema libre y {u1, u2, ..., un, v} es ligado, entonces v depende linealmente de u1, u2, ..., un”

4.

“Todo sistema de vectores que contenga un subsistema ligado es también ligado”

3.

“Todo subconjunto de un sistema libre es también un sistema libre”

2.

“Todo sistema de vectores que incluya el vector 0 es ligado”

1.

Otras propiedades:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

202

Espacios vectoriales. Variedades lineales

TEOREMA: “Dado un K-espacio vectorial V y un subconjunto H Ì V (H ¹ Æ), la condición necesaria y suficiente para que H sea subespacio vectorial de V es que toda combinación lineal de cualesquiera dos vectores de H dé como resultado otro vector de H. Es decir: H subespacio vectorial de V Û " u,v Î H, " l,m Î K: lu + mv Î H” Demostración: (Þ) Es evidente por ser H estable para las operaciones lineales (Ü) Tomando l = m = 1, se obtiene la estabilidad de H para la suma. Tomando l = m = 0, queda probado que 0 Î H. Tomando l = –1 y m = 0, obtendremos que –u Î H, para cualquier u Î H. Los demás requisitos se cumplen por ser H Ì V

4.2. Intersección y suma de subespacios 4.2.1. Subespacio “intersección”: Sean H y J dos subespacios vectoriales de un K-espacio vectorial V. La intersección conjuntista H Ç J = {u Î V / u Î H y u Î J} es obviamente un subconjunto no vacío de V, pues al menos contiene al vector 0, que está tanto en H como en J. PROPOSICIÓN: “Si H y J son subespacios vectoriales de un K-espacio vectorial de V, entonces H Ç J es otro subespacio vectorial de V” En efecto, " u,v Î H Ç J y " l, m Î K tendremos, por ser H y J subespacios de V u,v Î H y l , m Î K Þ lu + mv Î Hü ý Þ lu + mv Î H Ç J u,v Î J y l , m Î K Þ lu + mv Î J þ Lo anterior puede generalizarse a una intersección de cualquier familia {Hi}iÎI de subespacios vectoriales de V . Se tendrá el subespacio intersección I Hi iÎ I

4.2.2. Subespacio “suma”: Dados dos subespacios vectoriales H y J de un K-espacio vectorial V, se define: H + J = {u Î V / u = x + y, siendo x Î H e y Î J} Se trata de un subconjunto no vacío de V, pues al menos contiene al vector 0, ya que 0 = 0 + 0, siendo 0 Î H y 0 Î J. PROPOSICIÓN: “Si H y J son subespacios vectoriales de un K-espacio vectorial de V, entonces H + J es otro subespacio vectorial de V” En efecto, " u,v Î H + J y " l, m Î K tendremos u = x + y, con x Î H, y Î J ü ý v = x'+y', con x'Î H, y Î Jþ de donde lu + mv = l(x +y) + m(x’ + y’) = (lx + mx’) + (ly + my’) Pero al ser H y J dos subespacios de V, se cumplen lx + mx’ Î H y ly + my’ Î J. Luego es lu + mv Î H + J, con lo que H + J cumple la condición necesaria y suficiente. Lo anterior puede generalizarse a cualquier familia finita {H1, H2, ..., Hn} de subespacios de V. n n ì ü La suma åHi = íu Î V/ u = åu i , con u i Î Hiý es un subespacio vectorial de V. î þ i=1 i=1 TEMARIO DE MATEMÁTICAS. PRUEBA A

203

Volumen I. Matemáticas

204

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

L (V)´ L (V) ¾ ¾® L (V)

L (V)´ L (V) ¾¾® L (V)

4.3. Variedad lineal generada por un sistema de vectores +

Ç

Denotaremos por L(V) al conjunto de todas las variedades lineales de V. Con lo probado en el epígrafe 4.2. podemos asegurar que la “suma” e “intersección” de variedades lineales son operaciones internas en L(V)

Sea S = {u1, u2, ..., un} un sistema de vectores de un K-espacio vectorial V. Designaremos por L(S) ó S al conjunto de todos los vectores de V que se obtienen mediante combinación lineal de los vectores del sistema dado. Esto es: L(S) = S = u 1,u 2 ,...,u n = {a1u1 + a2u2 + … + anun / ai Î K }

4.4. El retículo de las variedades lineales de un espacio vectorial PROPOSICIÓN: “L(S) es un subespacio vectorial de V” En efecto, si u,v Î L(S) , entonces u = a1u1 + a2u2 + ... + anun v = b1u1 + b2u2 + ... + bnun

En todo lo expuesto anteriormente hemos considerado que S es un conjunto finito o sistema de n vectores de V, pues el propio concepto de “combinación lineal” va referido a un número finito de vectores. Ahora bien, podemos generalizar al caso de un subconjunto infinito S de V. El subespacio L(S) está definido entonces como el conjunto de vectores de V que se obtienen por combinación lineal de un número finito de vectores de S. Por ejemplo, el subconjunto infinito S = {x2, x4, x6, ..., x2n, ...} de P(X) genera el subespacio L(S) constituido por los polinomios con coeficientes reales cuyos términos son de todos de grado par. Es fácil justificar que L(S) es en cualquier caso el subespacio “mínimo” de V que contiene al conjunto S. Efectivamente, si H es cualquier otro subespacio de V tal que S Ì H, entonces toda combinación lineal de los vectores de S es una combinación lineal de vectores de H, y por tanto pertenece a H por ser éste un subespacio vectorial. Tendremos, pues, que L(S) Ì H. Al subespacio L(S) suele denominarse “envolvente lineal” de S. Por otra parte, como L(S) se forma mediante las combinaciones lineales de vectores de S, también se dice que L(S) es la “variedad lineal” de V engendrada o generada por S. Decimos que S es un sistema generador del subespacio H si H = L(S). Dado un subespacio vectorial H cualquiera de V, es posible encontrar un conjunto de vectores S Ì H que genere H. Es decir, las variedades lineales y los subespacios vectoriales de V se identifican. Entonces, para cualesquiera escalares l, m Î K, se tendrá lu + mv = l(a1u1 + a2u2 + … + an un) + m(b1u1 + b2u2 + … + bnun) = = (la1 + mb1)u1 + (la2 + mb2)u2 + … + (lan + mbn)un Y por tanto lu + mv Î L(S). Ejemplos en V3:

v

u

Figura 2.

L{u} es una recta vectorial

L{u} es una recta vectorial

L{u, v} es un plano vectorial

u

L{u, v} es un plano vectorial

u

Figura 2.

u v

En todo lo expuesto anteriormente hemos considerado que S es un conjunto finito o sistema de n vectores de V, pues el propio concepto de “combinación lineal” va referido a un número finito de vectores. Ahora bien, podemos generalizar al caso de un subconjunto infinito S de V. El subespacio L(S) está definido entonces como el conjunto de vectores de V que se obtienen por combinación lineal de un número finito de vectores de S. Por ejemplo, el subconjunto infinito S = {x2, x4, x6, ..., x2n, ...} de P(X) genera el subespacio L(S) constituido por los polinomios con coeficientes reales cuyos términos son de todos de grado par. Es fácil justificar que L(S) es en cualquier caso el subespacio “mínimo” de V que contiene al conjunto S. Efectivamente, si H es cualquier otro subespacio de V tal que S Ì H, entonces toda combinación lineal de los vectores de S es una combinación lineal de vectores de H, y por tanto pertenece a H por ser éste un subespacio vectorial. Tendremos, pues, que L(S) Ì H. Al subespacio L(S) suele denominarse “envolvente lineal” de S. Por otra parte, como L(S) se forma mediante las combinaciones lineales de vectores de S, también se dice que L(S) es la “variedad lineal” de V engendrada o generada por S. Decimos que S es un sistema generador del subespacio H si H = L(S). Dado un subespacio vectorial H cualquiera de V, es posible encontrar un conjunto de vectores S Ì H que genere H. Es decir, las variedades lineales y los subespacios vectoriales de V se identifican. Y por tanto lu + mv Î L(S). Ejemplos en V3:

Entonces, para cualesquiera escalares l, m Î K, se tendrá lu + mv = l(a1u1 + a2u2 + … + an un) + m(b1u1 + b2u2 + … + bnun) = = (la1 + mb1)u1 + (la2 + mb2)u2 + … + (lan + mbn)un

PROPOSICIÓN: “L(S) es un subespacio vectorial de V” En efecto, si u,v Î L(S) , entonces u = a1u1 + a2u2 + ... + anun v = b1u1 + b2u2 + ... + bnun

L(S) = S = u 1,u 2 ,...,u n = {a1u1 + a2u2 + … + anun / ai Î K }

4.4. El retículo de las variedades lineales de un espacio vectorial Sea S = {u1, u2, ..., un} un sistema de vectores de un K-espacio vectorial V. Designaremos por L(S) ó S al conjunto de todos los vectores de V que se obtienen mediante combinación lineal de los vectores del sistema dado. Esto es:

Denotaremos por L(V) al conjunto de todas las variedades lineales de V. Con lo probado en el epígrafe 4.2. podemos asegurar que la “suma” e “intersección” de variedades lineales son operaciones internas en L(V) +

Ç

4.3. Variedad lineal generada por un sistema de vectores

L (V)´ L (V) ¾ ¾® L (V)

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

204

L (V)´ L (V) ¾¾® L (V)

Espacios vectoriales. Variedades lineales Se verifican las propiedades:

– – – –

Asociativas " H,G,F Î L(V): H + (G + F) = (H + G) + F; H Ç (G Ç F) = (H Ç G) Ç F Idempotentes " H Î L(V): H + H = H; H Ç H = H Conmutativas " H,G Î L(V): H + G = G + H; H Ç G = G Ç H Simplificativas " H,G Î L(V): H + (H Ç G) = H; H Ç (H+G) = H

Con lo anterior podemos asegurar que la terna (L(V), + , Ç) es un retículo. Pero puede llegarse a dicha estructura por el otro camino: el de la ordenación. En efecto, la relación de inclusión “Ì ” es un orden parcial en L(V). Hay que probar que para cualesquiera dos variedades lineales H, G Î L(V), el conjunto de todas las variedades lineales incluidas en ambas tiene máximo y el conjunto de todas las variedades que contienen a ambas tiene mínimo. Lo anterior es cierto, ya que son fáciles de probar: 1.

H + G = I{Jl Î L (V) / H È G Ì Jl } = min{Jl Î L(V)/H Ì Jl, G Ì Jl}= sup{H, G}

2.

H Ç G = máx{Jl Î L(V)/H Ì Jl, G Ì Jl} = inf{H, G}

l

La 1. se justifica porque, si bien H È G no es una variedad lineal de V, la variedad suma H + G es precisamente la envolvente lineal de H È G, es decir, el mínimo subespacio de V que contiene a H È G. En efecto, probemos que H + G = L(H È G):



Si u Î H + G, entonces u = u1 + u2, siendo u1 Î H y u2 Î G y por tanto u1, u2 Î H È G, con lo que u sería combinación lineal de vectores de H È G, y por tanto u Î L(H È G). Llegamos a H + G Ì L(H È G).



Si u Î L(H È G), entonces u = m1u1 + m2u2 + … + mnun, con ui Î H È G. Si reordenamos los sumandos, podemos escribir en primer lugar los miui tales que ui Î H, quedando: u = ( m1u1 + m2 u2 + .....+ mk uk) + (mk+1 uk+1+ .....+ mn un) [1] donde u1, ..., uk Î H y uk+1, ..., un Î G. Por ser H y G subespacios de V, el primer paréntesis de [1] es un vector de H y el segundo un vector de G. Luego u Î H + G, con lo que probamos que L(H È G) Ì H + G .

4.5. Suma directa. Variedades complementarias PROPOSICIÓN: “Sean dos variedades lineales H,G Î L(V), se tiene H Ç G = {0} si y sólo si todo vector w Î H + G se puede expresar de manera única como suma de un vector de H y otro de G”. Demostración: (Þ) Supongamos H Ç G = {0} y sea w Î H + G. Si fuese w = u1 + u2, con u1 Î H y u2 Î G w = v1 + v2, con v1 Î H y v2 Î G tendríamos u1 + u2 = v1 + v2 , de donde u1 – v1 = u2 – v2. Ahora bien u1 – v1 Î H y u2 – v2 Î G, y como H Ç G = {0} debe ser u1 – v1 = u2 – v2 = 0. Llegamos a u1 = v1, u2 = v2. (Ü) Supongamos que todo vector de H + G sólo puede expresarse de una manera como suma de uno de H y otro de G. Si fuese u Î H Ç G, podríamos ponerlo como u = u + 0, con u Î H y 0 Î G , o como u = 0 + u , con 0 Î H y u Î G . Pero por la unicidad propuesta se llega a u = 0. Por tanto sería H Ç G = {0}. DEFINICIÓN: “Decimos que la variedad lineal J Î L(V) es suma directa de las variedades lineales H y G (H, G Î L(V) ), y escribimos J = H Å G si se verifican: 1.

J=H+G

2.

H Ç G = {0}”

TEMARIO DE MATEMÁTICAS. PRUEBA A

205

Volumen I. Matemáticas

206

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Observación: Una posible nueva caracterización de los conjuntos ligados sería la siguiente: “S es un conjunto ligado si y sólo si existe un subconjunto propio S’ Ì S tal que L(S’) = L(S)”

– –

Según la proposición anterior, todo vector de J será una suma única de un vector de H y otro de G.

La definición anterior puede extenderse a n variedades. Decimos que J es suma directa de H1, H2, ..., Hn Î L(V) ,y escribimos J = H1 Å H2 Å ... Å Hn , si se cumple

siendo ui Î S –{u} para i = 1,2, ..., m y wj Î S –{u} para j = 1, 2, ..., k. Probamos así que S’ = S –{u}es también un conjunto generador de V. En particular si S = {u1, u2, ..., un}es un sistema generador de V, el teorema anterior permite ir reduciéndolo a otros sistemas generadores con un número cada vez menor de vectores. Este procedimiento de “exclusión sucesiva” consiste en empezar desde el último e ir suprimiendo aquellos vectores de S que sean combinación lineal de sus predecesores. Una vez eliminados todos los vectores “superfluos” de S nos quedaría otro sistema generador S’ de V, cuyos vectores son todos “imprescindibles”, pues si suprimiéramos alguno el sistema resultante ya no generaría V. El sistema generador S’ obtenido al reducir S por exclusión sucesiva al menor número posible de vectores (ninguno de ellos es combinación lineal de los restantes, pues en caso contrario podría suprimirse) es un sistema libre. Llegamos, pues, a la noción de sistema generador libre, que enlaza con el concepto de base de un espacio vectorial. J = H1 + H2 + ... + Hn, siendo Hi Ç Hj = {0} para i ¹ j, i, j Î {1,2, ..., n}. n

Equivale a que todo vector w Î J pueda obtenerse de forma única como w = åu i, con ui Î Hi. i=1

DEFINICIÓN: “Dos variedades lineales H, G Î L(V) son variedades complementarias si verifican H Å G = V ”. Denotaremos por H a la variedad complementaria de la H. Se tienen algunas consecuencias inmediatas como H = H ó V = {0}. v = l1w1 + l2w2 + … + lkwk + lk+1 (a1u1 + a2u2 +......+ amum) = = l1w1 + l2w2 + … + lkwk + lk+1a1u1 + lk+1a2u2 +......+ lk+1amum

5. SISTEMAS GENERADORES Y BASES DE UN ESPACIO VECTORIAL 5.1. Sistema generador Demostración: Suponemos que u = a1u1 + a2u2 + … + amum, con ui Î S –{u}. Por ser S un conjunto generador de V, todo vector v Î V es combinación lineal de un número finito de vectores de S. Veamos que v puede ponerse también como combinación lineal de un número finito de vectores de S –{u}. Para ello será suficiente probar que una combinación lineal de vectores de S en la que intervenga u, quedaría reducida a una combinación lineal de vectores de S, todos distintos de u. En efecto, si v = l1w1 + l2w2 + … + lkwk + lk+1u , con wj Î S –{u}, entonces bastaría sustituir y tendremos

DEFINICIÓN: “Un ‘conjunto generador’ de un espacio vectorial V es todo subconjunto S Ì V, tal que L(S) = V, es decir, tal que todo vector de V pueda obtenerse mediante combinación lineal de vectores de S”. En el caso de que S sea un subconjunto finito, es decir, S = {u1, u2, ..., um}, le denominaremos sistema generador o sistema de generadores de V, y entonces todo vector de V podrá obtenerse como combinación lineal de todos los vectores de S . Pero la definición dada es más general, pues puede extenderse al caso de que S sea un subconjunto infinito de V; entonces S genera V si todo vector de V es combinación lineal de un número finito de vectores de S.

PROPOSICIÓN: “Sea S un conjunto generador de V y sea u Î S tal que u es combinación lineal de un número finito de vectores de S distintos de u, entonces S’ = S –{u} es otro conjunto generador de V”

PROPOSICIÓN: “Sea S un conjunto generador de V y sea u Î S tal que u es combinación lineal de un número finito de vectores de S distintos de u, entonces S’ = S –{u} es otro conjunto generador de V”

En el caso de que S sea un subconjunto finito, es decir, S = {u1, u2, ..., um}, le denominaremos sistema generador o sistema de generadores de V, y entonces todo vector de V podrá obtenerse como combinación lineal de todos los vectores de S . Pero la definición dada es más general, pues puede extenderse al caso de que S sea un subconjunto infinito de V; entonces S genera V si todo vector de V es combinación lineal de un número finito de vectores de S.

Demostración: Suponemos que u = a1u1 + a2u2 + … + amum, con ui Î S –{u}. Por ser S un conjunto generador de V, todo vector v Î V es combinación lineal de un número finito de vectores de S. Veamos que v puede ponerse también como combinación lineal de un número finito de vectores de S –{u}. Para ello será suficiente probar que una combinación lineal de vectores de S en la que intervenga u, quedaría reducida a una combinación lineal de vectores de S, todos distintos de u. En efecto, si v = l1w1 + l2w2 + … + lkwk + lk+1u , con wj Î S –{u}, entonces bastaría sustituir y tendremos

DEFINICIÓN: “Un ‘conjunto generador’ de un espacio vectorial V es todo subconjunto S Ì V, tal que L(S) = V, es decir, tal que todo vector de V pueda obtenerse mediante combinación lineal de vectores de S”.

5. SISTEMAS GENERADORES Y BASES DE UN ESPACIO VECTORIAL 5.1. Sistema generador v = l1w1 + l2w2 + … + lkwk + lk+1 (a1u1 + a2u2 +......+ amum) = = l1w1 + l2w2 + … + lkwk + lk+1a1u1 + lk+1a2u2 +......+ lk+1amum

siendo ui Î S –{u} para i = 1,2, ..., m y wj Î S –{u} para j = 1, 2, ..., k. Probamos así que S’ = S –{u}es también un conjunto generador de V. En particular si S = {u1, u2, ..., un}es un sistema generador de V, el teorema anterior permite ir reduciéndolo a otros sistemas generadores con un número cada vez menor de vectores. Este procedimiento de “exclusión sucesiva” consiste en empezar desde el último e ir suprimiendo aquellos vectores de S que sean combinación lineal de sus predecesores. Una vez eliminados todos los vectores “superfluos” de S nos quedaría otro sistema generador S’ de V, cuyos vectores son todos “imprescindibles”, pues si suprimiéramos alguno el sistema resultante ya no generaría V. El sistema generador S’ obtenido al reducir S por exclusión sucesiva al menor número posible de vectores (ninguno de ellos es combinación lineal de los restantes, pues en caso contrario podría suprimirse) es un sistema libre. Llegamos, pues, a la noción de sistema generador libre, que enlaza con el concepto de base de un espacio vectorial.

Denotaremos por H a la variedad complementaria de la H. Se tienen algunas consecuencias inmediatas como H = H ó V = {0}.

DEFINICIÓN: “Dos variedades lineales H, G Î L(V) son variedades complementarias si verifican H Å G = V ”. i=1

Equivale a que todo vector w Î J pueda obtenerse de forma única como w = åu i, con ui Î Hi. n

J = H1 + H2 + ... + Hn, siendo Hi Ç Hj = {0} para i ¹ j, i, j Î {1,2, ..., n}.

La definición anterior puede extenderse a n variedades. Decimos que J es suma directa de H1, H2, ..., Hn Î L(V) ,y escribimos J = H1 Å H2 Å ... Å Hn , si se cumple

Observación: Una posible nueva caracterización de los conjuntos ligados sería la siguiente: “S es un conjunto ligado si y sólo si existe un subconjunto propio S’ Ì S tal que L(S’) = L(S)”

– –

Según la proposición anterior, todo vector de J será una suma única de un vector de H y otro de G.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

206

Espacios vectoriales. Variedades lineales

5.2. Bases de un espacio vectorial DEFINICIÓN: “Un subconjunto B de un espacio vectorial V es una base de V si B es a la vez un conjunto libre y un conjunto generador de V, o sea si B verifica:

– –

Cualquier subconjunto finito de B es un sistema libre. Todo vector de V es combinación lineal de un número finito de vectores de B (L(B) = V)”

Una base puede tener un número infinito de vectores, como en el espacio vectorial de polinomios P(X) en que una base es B = {1, x, x2, x3, x6, ...}. Sin embargo nos referiremos usualmente al caso de bases finitas. Ejemplos sencillos de éstas son las bases “canónicas” {i,j,k}, {(1,0,0), (0,1,0), (0,0,1)} y {1, i} de V3, R3 y C, respectivamente. TEOREMA: “Sea S un conjunto generador de un espacio vectorial no trivial V. Entonces existe un subconjunto S’ Ì S, tal que S’ es una base de V” Demostración: Si fuese S = {0}, entonces L(S) = V = {0}. Como hemos supuesto que V es no trivial, resulta que S debe contener al menos un vector v no nulo. Obviamente el sistema {v}es un conjunto libre. Designaremos por S a la familia de todos los subconjuntos libres de S. Es S ¹ Æ, pues según vimos {v}Î S. Tenemos que (S,Ì) es un conjunto parcialmente ordenado, que además es inductivo. En efecto, si {Si}iÎI es una cadena (subconjunto totalmente ordenado) de S, entonces la unión U Si es iÎ I otro subconjunto libre de S. En efecto, si v Î U Si es combinación lineal de un número finito de vectores de U Si – {v}, iÎ I

iÎ I

entonces v = a1v1 + a2v2 +......+ amum , donde v1 Î Si1 , v2 Î Si2 , ..., vm Î Sim , v Î Si. Por ser {Si}iÎI una cadena, existe un Sj tal que Si1 Ì Sj, Si2 Ì Sj, ..., Sim Ì Sj, Si Ì Sj , resultando que v sería un vector de Sj que es combinación lineal de vectores de Sj –{v}. Llegaríamos al absurdo de que Sj no sería libre. Por tanto el conjunto S es inductivo, que es lo mismo que decir que toda cadena de S tiene cota superior (U Si). iÎ I

Entonces el lema de Zorn asegura la existencia en S de un elemento maximal S’. Veamos que S’ es una base de V. Por construcción de la familia S , S’ es un sistema libre y es obvio además que L(S’) Ì V. Falta probar que V Ì L(S’). En efecto, si v Î S’es inmediato que v Î L(S’) y si v Î S–S’, también debe ser v combinación lineal de vectores de S’, ya que en caso contrario S’ È {v} sería un subconjunto libre de S que contendría estrictamente a S’, lo que contradice la maximalidad de S’. Llegamos a que todo vector de S es combinación lineal de vectores de S’. Llegamos por la transitividad de las combinaciones lineales a que todo vector de V, que es por hipótesis combinación lineal de vectores de S, es por ende combinación lineal de vectores de S’. Luego V Ì L(S’). COROLARIO: “Todo espacio vectorial V no trivial posee al menos una base” Basta tomar como conjunto generador el propio V (pues trivialmente es L(V) = V) y la consecuencia es inmediata. Observaciones: 1. En el caso de que S sea un sistema (conjunto finito) de generadores, no haría falta recurrir al lema de Zorn para probar el teorema, pues en este caso la familia S estaría formada por un número finito de sistemas libres y la existencia de un elemento maximal es obvia. TEMARIO DE MATEMÁTICAS. PRUEBA A

207

Volumen I. Matemáticas

208

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

u = a1–1w1 – a1–1a 2u 2 – a1–1a 3u 3 ... – a1–1a nu n

2.

Del mismo modo que la proposición del epígrafe 5.1. sugería la posibilidad de reducir un sistema generador de V a una base de V, la demostración del teorema (partiendo del propio V como generador de sí mismo) sugiere la posibilidad de “expandir” un conjunto libre a una base de V. Puede decirse que una base es tanto un conjunto generador minimal como un conjunto libre maximal. Si nos limitamos al caso finito, podríamos decir que una base es un “sistema generador de orden mínimo” o un “sistema libre de orden máximo” (se entiende por “orden” de un conjunto finito a su cardinal). Precisaremos más adelante estas ideas en sus enunciados correspondientes, cuando introduzcamos el concepto de dimensión.

Demostración: Por ser B una base, todo vector de S es combinación lineal de los vectores de B y por consiguiente w1 = a1u1 + a2u2 + … + anun [*] donde no todos los coeficientes son nulos (pues si no w1 = 0 y S no sería libre). Podemos suponer a1 ¹ 0, y entonces

PROPOSICIÓN(b): Si B = {u1, u2, ..., un } es una base de V, entonces para cualquier sistema libre S = {w1, w2, ..., wm } de V debe ser m £ n.

5.3. Teorema de la base

l De aquí obtendremos åa iv i – åa i i1 v i = 0, que no es más que una combinación lineal no trivial l11 i=2 i=2 de v1, v2, ..., vn+1, vn +2 que da el vector 0. Por tanto las n + 2 combinaciones lineales [2] son linealmente dependientes.

PROPOSICIÓN(a): “Si el sistema {u1, u2, ..., un } es libre, entonces n + 1 combinaciones lineales de los vectores de dicho sistema son siempre linealmente dependientes”. n+ 2

n+ 2

i=2

' } es ligado, y por tanto åa iv i' = 0 con algún ai ¹ 0. ma {v 2' ,v 3' ,...,v n+2

Demostración: Por inducción respecto a n. Para n = 1. Dadas l1u1 y m1u1 dos combinaciones lineales de u1, si alguno de los coeficientes es nulo, la dependencia lineal de l1u1 y m1u1 es obvia. Si fuese l1, m1 ¹ 0, entonces m1(l1u1) – l1(m1u1) = 0 es la relación de dependencia lineal. Supongámosla cierta para n vectores. Sean entonces n + 1 vectores u1, u2, ..., un,un+1 y n+2 combinaciones lineales de ellos: v1 = l11u1 + l12u2 + … + l1nun + l1,n+1un +1 v2 = l21u1 + l22u2 + … + l2nun + l2,n+1un +1 ................................................................. [2] vn+1 = ln+1,1u1 + ln+1,2u2 + … + ln+1,nun + ln+1,n+1un +1 vn+2 = ln+2,1u1 + ln+2,2u2 + … + ln+2,nun + ln+2,n+1un +1 n+ 2

son n + 1 combinaciones lineales de los n vectores u2, u3, ..., un +1. Por hipótesis de inducción el sistev 2' = v 2 –

l n+2,1 l 21 l 31 ' ' ; ; … ; v v = v v v v 3 – n+2 = v n+2 – l11 1 l11 1 3 l11 1

Para cada i Î {1, 2, 3, ..., n+2} debe ser algún lij ¹ 0, pues en caso contrario algún vi sería 0, y ya estaría probado. Supongamos que l11 ¹ 0. Entonces los vectores Demostración: Por inducción respecto a n. Para n = 1. Dadas l1u1 y m1u1 dos combinaciones lineales de u1, si alguno de los coeficientes es nulo, la dependencia lineal de l1u1 y m1u1 es obvia. Si fuese l1, m1 ¹ 0, entonces m1(l1u1) – l1(m1u1) = 0 es la relación de dependencia lineal. Supongámosla cierta para n vectores. Sean entonces n + 1 vectores u1, u2, ..., un,un+1 y n+2 combinaciones lineales de ellos: v1 = l11u1 + l12u2 + … + l1nun + l1,n+1un +1 v =l u +l u +…+l u +l u 2 21 1 22 2 2n n 2,n+1 n +1 ................................................................. [2] vn+1 = ln+1,1u1 + ln+1,2u2 + … + ln+1,nun + ln+1,n+1un +1 vn+2 = ln+2,1u1 + ln+2,2u2 + … + ln+2,nun + ln+2,n+1un +1

Para cada i Î {1, 2, 3, ..., n+2} debe ser algún lij ¹ 0, pues en caso contrario algún vi sería 0, y ya estaría probado. Supongamos que l11 ¹ 0. Entonces los vectores v '2 = v 2 –

l n+2,1 l 21 l v ; v ' = v 3 – 31 v 1; … ; v 'n+2 = v n+2 – v l11 1 l11 1 3 l11

son n + 1 combinaciones lineales de los n vectores u2, u3, ..., un +1. Por hipótesis de inducción el sisten+ 2

ma {v '2 ,v '3 ,...,v 'n+2} es ligado, y por tanto åa iv 'i = 0 con algún ai ¹ 0. i=2

n+ 2

n+ 2

PROPOSICIÓN(a): “Si el sistema {u1, u2, ..., un } es libre, entonces n + 1 combinaciones lineales de los vectores de dicho sistema son siempre linealmente dependientes”.

l De aquí obtendremos åa iv i – åa i i1 v i = 0, que no es más que una combinación lineal no trivial l11 i=2 i=2 de v1, v2, ..., vn+1, vn +2 que da el vector 0. Por tanto las n + 2 combinaciones lineales [2] son linealmente dependientes.

5.3. Teorema de la base

PROPOSICIÓN(b): Si B = {u1, u2, ..., un } es una base de V, entonces para cualquier sistema libre S = {w1, w2, ..., wm } de V debe ser m £ n.

Del mismo modo que la proposición del epígrafe 5.1. sugería la posibilidad de reducir un sistema generador de V a una base de V, la demostración del teorema (partiendo del propio V como generador de sí mismo) sugiere la posibilidad de “expandir” un conjunto libre a una base de V. Puede decirse que una base es tanto un conjunto generador minimal como un conjunto libre maximal. Si nos limitamos al caso finito, podríamos decir que una base es un “sistema generador de orden mínimo” o un “sistema libre de orden máximo” (se entiende por “orden” de un conjunto finito a su cardinal). Precisaremos más adelante estas ideas en sus enunciados correspondientes, cuando introduzcamos el concepto de dimensión.

Demostración: Por ser B una base, todo vector de S es combinación lineal de los vectores de B y por consiguiente w1 = a1u1 + a2u2 + … + anun [*] donde no todos los coeficientes son nulos (pues si no w1 = 0 y S no sería libre). Podemos suponer a1 ¹ 0, y entonces

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

208

2.

u = a1–1w1 – a1–1a 2u 2 – a1–1a 3u 3 ... – a1–1a nu n

Espacios vectoriales. Variedades lineales Como consecuencia podemos reemplazar el primer vector w1 de B por y nos quedaría una nueva base B’ = {w1, u2, u3, ..., un}de V. En efecto, que B’ es un sistema generador de V es inmediato por la transitividad de las combinaciones lineales; además B’ es libre, pues en caso contrario, al ser u2, ..., un linealmente independientes, tendríamos w1 = l2u2 + … + lnun, lo cual está en contradicción con [*], pues la expresión de un vector en una base es única. Ahora, por ser B’ base, podremos poner w2 = b1w1 + b2u2 + ... + bnun y repetir el proceso, llegando a una nueva base B’’ = {w1, w2, u3, ..., un}. Así sucesivamente, si fuese m > n podríamos reemplazar todos los ui por wi y llegaríamos a una base {w1, w2, ..., wn} “sobrándonos” aún los wn+1, wn+2, ..., wm, los cuales serían combinaciones lineales de los n anteriores, llegando a la contradicción de que el sistema S = {w1, w2, ..., wm} no sería libre. Por tanto ha de ser m £ n. PROPOSICIÓN(c): “Si en un espacio vectorial hay una base B con n vectores, entonces cualquier sistema S con más de n vectores es ligado”. Es un enunciado equivalente a la proposición anterior. TEOREMA DE STEINIZ (o de la base incompleta) “Sea B = {u1, u2, ..., un} una base del espacio vectorial V. Entonces cualquier sistema libre S = {w1, w2, ..., wm} tal que L(S) ¹ V, puede ser completado hasta una base de V” Demostración: La demostración de este teorema constituye en esencia un procedimiento de expansión de un sistema libre a una base, en el caso finito. Si suponemos S Ç B = Æ, podemos formar el conjunto S È B = {w1, w2, ..., wm, u1, u2, ..., un} que es un conjunto finito de vectores que cumple:

– – –

No contiene al vector nulo, por ser B y S sistemas libres Es ligado, pues los vectores wi se pueden poner como combinaciones lineales de los ui de la base B

Es un sistema generador de V El procedimiento de exclusión apuntado en 5.1. se puede poner ahora en marcha. Algún vector de S È B es combinación lineal de los precedentes (obviamente será alguno de los ui) y podemos excluirlo. Este proceso se puede repetir y al cabo de r pasos tendremos un sistema generador reducido a {w1, w2, ..., wm, u1’, u2’, ..., u’n-r} donde los uk’ son los vectores de B que han quedado sin excluir, aunque reordenados. A lo sumo en n–1 pasos, llegaremos a un sistema generador “mínimo”, que será libre y por tanto una base de V. Observaciones: 1. Nótese que el sistema libre S ={w1, w2, ..., wm} es una base del subespacio H = L(S) , entonces los vectores u1’, u2’, ..., u’n–m (o cualesquiera otros wm+1, wm+2, ..., wn que sirvan para expandir S a una base de V) constituyen una base de la variedad complementaria H, de modo que H Å H = V. 2. El teorema admite una versión más amplia si reemplazamos base por sistema generador. Es decir, si V admite un sistema generador finito G con n vectores, todo sistema libre S con menos de n vectores puede ser completado con vectores de G hasta obtener otro sistema generador G’ de V. En definitiva el teorema viene a decir que cualquier conjunto generador finito de V contiene al menos tantos vectores como haya en cualquier conjunto independiente de V, o, lo que es lo mismo, en un espacio vectorial de generación finita no habrá listas arbitrariamente grandes de vectores independientes. TEOREMA DE LA BASE: “El cardinal de todas las bases de un mismo espacio vectorial V es el mismo” B y B’ bases de V Þ Card(B) = Card(B’) Demostración: Si hubiese dos bases finitas con distinto número de vectores o una base finita y otra infinita, en estos casos habría contradicción con la proposición (a). Luego dadas dos bases B y B’ sólo puede ocurrir, o bien que ambas sean finitas con el mismo número de elementos, o bien que ambas sean infinitas. En este último caso puede probarse que ambas son conjuntos infinitos equipotentes. TEMARIO DE MATEMÁTICAS. PRUEBA A

209

Volumen I. Matemáticas

210

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Para el caso finito, el teorema de la base puede probarse de forma inmediata a partir de la proposición (b). Pues si B = {u1, u2, ..., un} y B’= {v1, v2, ..., vm} aplicando dicha proposición se tiene m £ n y n £ m, de donde n = m. llegamos también a que Card (B’) £ Card(B). Quedaría probado que Card (B) = Card(B’). F’ = {S’ Ì B’/S’ Ì L(S), S Ì B, Card(S’) £ Card(S)}

Por un razonamiento simétrico partiendo del conjunto

El teorema admite en el caso finito otra demostración independiente similar a la del teorema de Steiniz, que es la siguiente: De lo anterior Card (B) = Card (H) £ Card (H’) £ Card (H1’) £ Card(B’).

Si B = {u1, u2, ..., un} y B’= {v1, v2, ..., vm}son dos bases de V, entonces el sistema

{v ,v ,...,v } y resulta que H1 Ì L(H1’), H1’ Ì B’, Card(H1) £ Card(H1’), de donde H1 Ì F , lo cual entraría en contradicción con la maximalidad de H. Luego B – H = Æ y por tanto H = B. ' 2

' k

S1 = B È {vm} = {vm, u1, u2, ..., un}

' 1

i=1

åa v , con v

es un sistema generador de V por ser B base y además ligado, pues vm es combinación lineal de los vectores de la base B. Como B’ es base de V podrá ponerse v =

i

' i

' 1

Î B'. Tomamos también H1’ = H’ È

k

Si existiese un vector v Î B – H, sea H’ tal que H Ì L(H’), H’ Ì B’, Card(H) £ Card(H’). Formamos H1 = H È {v}.

Por tanto algún ui es combinación lineal de los precedentes y S1 –{ui} sigue siendo un sistema generador de V. Si añadimos ahora vm-1, formaremos un nuevo sistema generador S2 = (S1 –{ui}) È {vm-1} = {vm-1, vm, u1, ..., ui-1, ui+1, ..., un}

Que H Ì B es trivial.

Por el lema de Zorn en F hay un elemento maximal H. Vamos a probar que H = B.

que también sería ligado, pues vm-1 es combinación lineal de los vectores del sistema generador S1 y por la transitividad de las combinaciones lineales quedaría vm-1 como combinación lineal de los de S1 –{ui}. Se tiene S Ì L(S’), S’ Ì B’, Card(S) £ Card(S’) y por tanto S Î F. iÎ I

Entonces otro uj es combinación lineal de los precedentes, y de nuevo añadiríamos a S2 –{uj} el vector vm–2, formando S3, que sigue siendo un sistema generador ligado.

Consideremos el conjunto F = {S Ì B / S Ì L(S’), S’ Ì B’, Card(S) £ Card(S’)} que es no vacío, por lo dicho en el párrafo anterior. Además, como conjunto parcialmente ordenado por la relación de inclusión es inductivo, pues dada una cadena {Si}iÎI de elementos de F, dicha cadena tiene cota superior. En efecto, como Si Ì L(Si’), Si’ Ì B’, Card(Si) £ Card(Si’) " I Î I podemos formar S = U Si Ì B iÎ I y S’ = U S'i Ì B’.

Así sucesivamente, se van reemplazando vectores ui por vectores vi. Si se agotaran todos los ui quedando todavía algunos vi sobrantes, entonces éstos serían combinaciones lineales de los vectores de B’ que reemplazaron a todos los ui, con lo que B’ sería ligado, lo cual contradice que sea una base. Por tanto debe ser m £ n.

Sean B y B’ dos bases de V. Es obvio que todo vector de B es combinación lineal finita de vectores de B’ y recíprocamente todo vector de B’ lo es de vectores de B. Por tanto es obvio que un número finito de elementos de cualquiera de ambas bases está contenido en el subespacio de V generado por un subconjunto finito de la otra base.

De modo análogo se puede iniciar el razonamiento a partir de S1’ = B’ È {un} y llegaríamos a que debe ser n £ m. La demostración en el caso infinito es más delicada.

La demostración en el caso infinito es más delicada.

Sean B y B’ dos bases de V. Es obvio que todo vector de B es combinación lineal finita de vectores de B’ y recíprocamente todo vector de B’ lo es de vectores de B. Por tanto es obvio que un número finito de elementos de cualquiera de ambas bases está contenido en el subespacio de V generado por un subconjunto finito de la otra base.

De modo análogo se puede iniciar el razonamiento a partir de S1’ = B’ È {un} y llegaríamos a que debe ser n £ m.

Así sucesivamente, se van reemplazando vectores ui por vectores vi. Si se agotaran todos los ui quedando todavía algunos vi sobrantes, entonces éstos serían combinaciones lineales de los vectores de B’ que reemplazaron a todos los ui, con lo que B’ sería ligado, lo cual contradice que sea una base. Por tanto debe ser m £ n.

Consideremos el conjunto F = {S Ì B / S Ì L(S’), S’ Ì B’, Card(S) £ Card(S’)} que es no vacío, por lo dicho en el párrafo anterior. Además, como conjunto parcialmente ordenado por la relación de inclusión es inductivo, pues dada una cadena {S } de elementos de F, dicha cadena tiene cota supei iÎI rior. En efecto, como Si Ì L(Si’), Si’ Ì B’, Card(Si) £ Card(Si’) " I Î I podemos formar S = U Si Ì B iÎ I y S’ = U S'i Ì B’.

Entonces otro uj es combinación lineal de los precedentes, y de nuevo añadiríamos a S2 –{uj} el vector vm–2, formando S3, que sigue siendo un sistema generador ligado. iÎ I

Se tiene S Ì L(S’), S’ Ì B’, Card(S) £ Card(S’) y por tanto S Î F.

que también sería ligado, pues vm-1 es combinación lineal de los vectores del sistema generador S1 y por la transitividad de las combinaciones lineales quedaría vm-1 como combinación lineal de los de S1 –{ui}. Por el lema de Zorn en F hay un elemento maximal H. Vamos a probar que H = B. Que H Ì B es trivial.

S2 = (S1 –{ui}) È {vm-1} = {vm-1, vm, u1, ..., ui-1, ui+1, ..., un}

Si existiese un vector v Î B – H, sea H’ tal que H Ì L(H’), H’ Ì B’, Card(H) £ Card(H’). Formamos H1 = H È {v}.

Por tanto algún ui es combinación lineal de los precedentes y S1 –{ui} sigue siendo un sistema generador de V. Si añadimos ahora vm-1, formaremos un nuevo sistema generador k

es un sistema generador de V por ser B base y además ligado, pues vm es combinación lineal de los vectores de la base B.

åa v , con v

Como B’ es base de V podrá ponerse v =

i

' i

' 1

Î B'. Tomamos también H1’ = H’ È

i=1

{v 1',v 2' ,...,v k'} y resulta que H1 Ì L(H1’), H1’ Ì B’, Card(H1) £ Card(H1’), de donde H1 Ì F , lo cual entraría en contradicción con la maximalidad de H. Luego B – H = Æ y por tanto H = B. S1 = B È {vm} = {vm, u1, u2, ..., un}

Si B = {u1, u2, ..., un} y B’= {v1, v2, ..., vm}son dos bases de V, entonces el sistema

De lo anterior Card (B) = Card (H) £ Card (H’) £ Card (H1’) £ Card(B’).

El teorema admite en el caso finito otra demostración independiente similar a la del teorema de Steiniz, que es la siguiente: Por un razonamiento simétrico partiendo del conjunto

F’ = {S’ Ì B’/S’ Ì L(S), S Ì B, Card(S’) £ Card(S)}

Para el caso finito, el teorema de la base puede probarse de forma inmediata a partir de la proposición (b). Pues si B = {u1, u2, ..., un} y B’= {v1, v2, ..., vm} aplicando dicha proposición se tiene m £ n y n £ m, de donde n = m. llegamos también a que Card (B’) £ Card(B). Quedaría probado que Card (B) = Card(B’).

210

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales

5.4. Dimensión de un espacio vectorial Si un espacio vectorial V tiene una base finita, al número n de vectores de dicha base o de cualquier otra (que es el mismo) se denomina dimensión de V y escribimos dim V = n, diciendo en este caso que V es un espacio vectorial de dimensión finita, finito-dimensional o finitamente generado. En particular al espacio vectorial trivial le asignamos dimensión nula, es decir, dim {0}= 0. En el supuesto contrario de que todas las bases de V tengan infinitos vectores diremos que V es un espacio de dimensión infinita o infinito-dimensional. Aunque no sea del todo preciso, podemos escribir dim V = ¥ para expresar que en V no se puede encontrar una base con número finito de vectores. También se puede dar una definición de espacio vectorial de dimensión finita como sigue: “Decimos que E es un espacio vectorial de dimensión finita n o n-dimensional, si existe en V al menos un sistema libre de n vectores, pero no existe ninguno de n + 1 vectores”. En general se llama dimensión de un espacio vectorial V al cardinal de cualquiera de sus bases. Ejemplos: dim V3 = 3; dim C = 2; dim Rn = n; P(X) es un espacio vectorial infinito-dimensional. Consecuencias: En un espacio vectorial n-dimensional se verifican: a)

“El máximo número de vectores linealmente independientes es n” En efecto, una proposición anterior asegura que todo sistema con mayor número de vectores que el de una base es ligado. Esto también lo probamos prácticamente cuando vimos que n + 1 combinaciones lineales de un sistema libre son siempre linealmente dependientes, pues hemos de tener en cuenta que todo vector es combinación lineal de los vectores de una base.

b)

“Todo sistema libre que tenga exactamente n vectores es una base” En efecto, sea B = {u1, u2, ..., un} es un sistema libre; si fuese L(B) ¹ V, entonces por el teorema de Steiniz B podría completarse hasta una base con lo que en el espacio n-dimensional V habría una base con más de n vectores, lo cual es absurdo. Luego L(B) = V y B es base de V.

c)

“Cualquier sistema generador de V debe tener como mínimo n vectores” Si un sistema generador tuviera menos de n vectores, al reducirlo a una base nos llevaría a contradicción con el teorema de la base.

d)

“Todo sistema generador que tenga exactamente n vectores es una base” Sea B = {u1, u2, ..., un} un sistema generador de V. Si B fuese ligado, entonces por exclusión sucesiva podemos llegar a una base con menos de n vectores, lo cual es absurdo pues dim V = n. Luego B es libre y por tanto base de V.

5.5. Sistemas de vectores equivalentes DEFINICIÓN: “Dos subconjuntos S y T de un espacio vectorial V son conjuntos equivalentes de vectores si generan el mismo subespacio de V”. Escribiremos S ~ T Û L(S) = L(T). Ello significa que todo vector de V que sea combinación lineal de vectores de S es también combinación lineal de vectores de T y, recíprocamente, todo vector de V que sea combinación lineal de vectores de T es también combinación lineal de vectores de S. En el caso particular de un sistema S = {u1, u2, ..., un} denominaremos transformaciones elementales sobre S a aquellas operaciones con los vectores de S que convierten dicho sistema en otro equivalente. Es fácil probar que ello ocurre con las transformaciones siguientes:

– – – –

Cambiar el orden de los vectores de S Multiplicar los ui por escalares de K no nulos Suprimir algún ui que sea combinación lineal de los restantes (en particular, suprimir el vector 0 si estuviera en S) Reemplazar algún ui por una combinación lineal l1u1 + l2u2 + … + liui + ... + lnun con li ¹ 0 (en particular, reemplazar ui por ui + ljuj)

TEMARIO DE MATEMÁTICAS. PRUEBA A

211

Volumen I. Matemáticas

212

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Observación: Aunque aquí nos interesa sólo el caso finito, el teorema anterior puede enunciarse de manera más general para que englobe también el caso de espacios vectoriales infinito-dimensionales. La demostración es la misma salvo ligeros retoques.

5.6. Rango de un sistema de vectores

Sea S = {u1, u2, ..., un} un sistema de vectores de V y sea H el subespacio generado por S, es decir, H = L(S). Obviamente S es sistema generador de H, pero si S es ligado no es una base de H. Ahora bien, ordenando previamente los vectores de S, podemos proceder a la exclusión sucesiva de todos aquellos que sean combinación lineal de los precedentes, hasta reducir el sistema S a otro equivalente S’, que sería libre y por tanto una base del subespacio H. Si en S’ han quedado r de los n vectores que constituían el sistema de partida, quiere esto decir que dim H = r. Si suprimiéramos alguno de esos r vectores de S’ el sistema obtenido sería también libre pero ya sería insuficiente para generar H. Nótese que si hubiésemos partido de otra ordenación distinta de los vectores de S el sistema reducido S’ podría no ser el mismo, pero en cualquier caso tendría también r vectores. En definitiva, r sería el máximo número de vectores linealmente independientes que pueden quedar del sistema S, de modo que los restantes n–r vectores de S pudieran obtenerse como combinaciones lineales de aquellos.

Demostración: Sea B = {u1, u2, ..., un}una base de V. Dado cualquier v Î V, si fuese v = l1u1 + l2u2 + … + lnun y v = m1u1 + m2u2 + … + mnun, restando ambas expresiones llegaríamos a 0 = (l1 – m1)u1 + (l2 – m2)u2 + + … + (ln – mn)un. Ahora bien, como B es un sistema libre por ser base, necesariamente sería li – mi = 0, es decir, li = mi " i Î {1, 2, ..., n}. Por tanto v no podría ponerse de dos maneras como combinación lineal de los vectores de B. Recíprocamente, si todo vector de V es combinación lineal única de los vectores de B, es obvio que B es sistema generador de V. Además, si fuese l1u1 + l2u2 + … + lnun = 0 como también 0u1 + 0u2 + … + + 0un = 0, la unicidad garantiza que sería l1 = l2 = … = ln = 0. Por tanto B es sistema generador libre.

DEFINICIÓN: “Se denomina rango del sistema S = {u1, u2, ..., un} a la dimensión del subespacio generado por S (rg (S) = dim L(S) ), o lo que es lo mismo, el máximo número de vectores linealmente independientes que pueden extraerse de S”. Es obvio que S ~ T Þ rg (S) = rg (T), pero el recíproco no es cierto. La obtención de una base de L(S) y , por ende, la determinación del rango del sistema S, en el caso de vectores de Rn, se puede llevar a cabo por métodos prácticos más operativos que el de exclusión sucesiva. A saber, el método de Gauss, que se ejecuta de manera análoga que para reducir un sistema lineal de ecuaciones (filas de una matriz) a la forma escalonada, y que se basa en la proposición siguiente.

TEOREMA: “La condición necesaria y suficiente para que un sistema B = {u1, u2, ..., un}de vectores de un espacio vectorial V sea una base es que todo vector de V pueda expresarse de manera única como combinación lineal de los vectores de B”

6.1. Caracterización de las bases

6. COORDENADAS DE UN VECTOR RESPECTO DE UNA BASE u1 = (a11, a12, a13, ............................, a1n) u = ( 0 , a , a , ............................, a ) 2

“El sistema S

22

23

2n

u3 = ( 0 , 0 , a33, ............................, a3n) . . .. .. ur = ( 0 , 0 , 0, ......, 0, arr, ............, arn)

n

de r vectores de R , donde aii ¹ 0

" i Î {1, 2, ..., r} es libre”

ur = ( 0 , 0 , 0, ......, 0, arr, ............, arn)

u3 = ( 0 , 0 , a33, ............................, a3n) .. .. . .

" i Î {1, 2, ..., r} es libre”

“El sistema S

de r vectores de R , donde aii ¹ 0 n

u2 = ( 0 , a22, a23, ............................, a2n) u1 = (a11, a12, a13, ............................, a1n)

6. COORDENADAS DE UN VECTOR RESPECTO DE UNA BASE DEFINICIÓN: “Se denomina rango del sistema S = {u1, u2, ..., un} a la dimensión del subespacio generado por S (rg (S) = dim L(S) ), o lo que es lo mismo, el máximo número de vectores linealmente independientes que pueden extraerse de S”. Es obvio que S ~ T Þ rg (S) = rg (T), pero el recíproco no es cierto. La obtención de una base de L(S) y , por ende, la determinación del rango del sistema S, en el caso de vectores de Rn, se puede llevar a cabo por métodos prácticos más operativos que el de exclusión sucesiva. A saber, el método de Gauss, que se ejecuta de manera análoga que para reducir un sistema lineal de ecuaciones (filas de una matriz) a la forma escalonada, y que se basa en la proposición siguiente.

6.1. Caracterización de las bases

TEOREMA: “La condición necesaria y suficiente para que un sistema B = {u1, u2, ..., un}de vectores de un espacio vectorial V sea una base es que todo vector de V pueda expresarse de manera única como combinación lineal de los vectores de B”

Demostración: Sea B = {u1, u2, ..., un}una base de V. Dado cualquier v Î V, si fuese v = l1u1 + l2u2 + … + lnun y v = m1u1 + m2u2 + … + mnun, restando ambas expresiones llegaríamos a 0 = (l1 – m1)u1 + (l2 – m2)u2 + + … + (ln – mn)un. Ahora bien, como B es un sistema libre por ser base, necesariamente sería li – mi = 0, es decir, li = mi " i Î {1, 2, ..., n}. Por tanto v no podría ponerse de dos maneras como combinación lineal de los vectores de B. Recíprocamente, si todo vector de V es combinación lineal única de los vectores de B, es obvio que B es sistema generador de V. Además, si fuese l1u1 + l2u2 + … + lnun = 0 como también 0u1 + 0u2 + … + + 0un = 0, la unicidad garantiza que sería l1 = l2 = … = ln = 0. Por tanto B es sistema generador libre.

Sea S = {u1, u2, ..., un} un sistema de vectores de V y sea H el subespacio generado por S, es decir, H = L(S). Obviamente S es sistema generador de H, pero si S es ligado no es una base de H. Ahora bien, ordenando previamente los vectores de S, podemos proceder a la exclusión sucesiva de todos aquellos que sean combinación lineal de los precedentes, hasta reducir el sistema S a otro equivalente S’, que sería libre y por tanto una base del subespacio H. Si en S’ han quedado r de los n vectores que constituían el sistema de partida, quiere esto decir que dim H = r. Si suprimiéramos alguno de esos r vectores de S’ el sistema obtenido sería también libre pero ya sería insuficiente para generar H. Nótese que si hubiésemos partido de otra ordenación distinta de los vectores de S el sistema reducido S’ podría no ser el mismo, pero en cualquier caso tendría también r vectores. En definitiva, r sería el máximo número de vectores linealmente independientes que pueden quedar del sistema S, de modo que los restantes n–r vectores de S pudieran obtenerse como combinaciones lineales de aquellos.

Observación: Aunque aquí nos interesa sólo el caso finito, el teorema anterior puede enunciarse de manera más general para que englobe también el caso de espacios vectoriales infinito-dimensionales. La demostración es la misma salvo ligeros retoques.

5.6. Rango de un sistema de vectores

212

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales

6.2. Noción de coordenadas Sea V un espacio vectorial n-dimensional sobre el cuerpo K, y B = {u1, u2, ..., un} una base de dicho espacio. Establecemos un determinado orden de los vectores básicos. Para cualquier vector v Î V, el teorema anterior asegura la existencia de una n-upla única de escalares (l1, l2, ..., ln) Î Kn, tales que v = l1u1 + l2u2 + … + lnun. A dichos escalares les denominamos coordenadas del vector v respecto a la base B. En particular, con la introducción de las coordenadas, podemos decir que el estudio de cualquier espacio vectorial real de dimensión n queda reducido al estudio del espacio Rn. Ello justifica la importancia de los espacios Rn de “vectores numéricos”. Vn

R

v = l1u1+l2u2 ... lnun

n

( l1, l2, ..., ln)B

6.3. Cambio de base Sean B = {u1, u2, ..., un} y B’ = {w1, w2, ..., wn} dos bases de V. Sea un vector cualquiera v Î V, cuyas coordenadas en dichas bases denotaremos respectivamente por (x1, x2, ..., xn) y por (y1, y2, ..., yn). Entonces las expresiones de v en ambas bases son n

v = åxiu i respecto de B [3] i=1 n

v = åy jw j respecto de B [4] j=1

Supongamos conocidas las expresiones de los vectores de B en la nueva base B’, es decir: n

ui = åa ijw j (i = 1, 2, ..., n) [5] j=1

Sustituyendo en [3] n

n

n

n

n

i=1

i=1

j=1

j=1

i=1

v = åxiu i = åxi ( åa ijw j ) = å( åxa i ij )w j, resultado que debe coincidir con[4] al ser única la expresión de un vector en una base. Al identificar llegamos a las relaciones: n

yj = åxa i ij (j = 1, 2, ..., n) i=1

que pueden ser recogidas en forma matricial æa ç 11 a12 ça a 22 (y 1 y 2 ... y n ) = (x1 x2 ... xn )ç 21 ... ... ç ç èa n1 a n2

... a1n ö ÷ ... a 2n ÷ ÷Þ y = xC ... ... ÷ ÷ ... a nn ø

donde la matriz de cambio de base C = (aij)nxn tiene por filas las coordenadas de los vectores de B respecto de la B’. Nota: La ecuación matricial anterior puede ponerse utilizando vectores columna. Basta tomar matrices traspuestas y quedaría y t = Ct xt TEMARIO DE MATEMÁTICAS. PRUEBA A

213

Volumen I. Matemáticas

214

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

continuas en el intervalo [a, b].

Supongamos ahora conocidas las expresiones de los vectores de la “nueva” base B’ en la base B, es decir:



El operador integral de Riemann òa es una forma lineal sobre el espacio de las funciones reales b

n

wj = åb jiu i (j = 1, 2, ..., n)

Si E = E1 Å E2, todo vector u de E se puede poner de manera única como u = u1 + u2. Entonces las proyecciones p1 y p2 de E sobre E1 y E2 respectivamente definidas como p1(u) = u1 y p2(u) = u2 son homomorfismos de E en E. [6]

i=1

La simetría vectorial que a cada vector libre u le asocia su vector opuesto -u, es una aplicación lineal de V3 en sí mismo. n

n

n

n

j=1

j=1

i=1

i=1

j=1

La proyección ortogonal de un vector sobre un plano viene a ser una aplicación lineal entre R3 y R2.

resultado que debe coincidir con [3] llegando a

– –

n

v = åy jw j = åy j ( åb jiu i ) = å( åy jb ji )u i,



Sustituyendo en [4]

Ejemplos:

n

xi = åy jb ji (i = 1, 2, ..., n)

Las dos condiciones anteriores pueden resumirse en una sola. Así pues, es fácil probar que f: E ® F es aplicación lineal Û f(lu + mv) = lf(u) + mf(v) (" u,v Î E, " l, m Î K) En particular, si F = K (nótese que todo cuerpo es un espacio vectorial unidimensional sobre sí mismo) la aplicación f: E ® K en caso de cumplir las dos condiciones anteriores se denomina forma lineal sobre E. j=1

que en forma matricial pondremos x = yC*, donde ahora C* es la matriz cuadrada de orden n que se forma al tomar como filas las coordenadas de los vectores de B’ respecto de B. La sustitución de [6] en [5] nos lleva a: f(u + v) = f(u) + f(v) (" u,v Î E). Preservación de la suma de vectores f(lu) = l f(u) (" u Î E, " l Î K). Preservación del producto por escalares” n

n

n

n

1. 2.

n

ui = åa ijw j = åa ij ( åb jku k ) = å( åa ijb jk )u k,

DEFINICIÓN: “Dados dos espacios vectoriales E y F sobre el mismo cuerpo K, una aplicación f : E ® F es una aplicación lineal u homomorfismo entre espacios vectoriales si verifica: j=1

j=1

i=1

i=1

j=1

ì1 si i = k de donde åa ijb jk = dik = í lo que significa que C · C* = I. O sea C* = C–1 î0 si i ¹ k j=1 n

7.1. Noción de aplicación lineal

En resumen, el cambio de base es reversible, en el sentido de que la matriz de cambio de base es inversible, siendo la matriz de paso de la base B a la base B’ la inversa de la matriz de paso de la base B’ a la B.

7. APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES ¾¾® ¬¾ ¾¾ C–1 C

y = xC x = yC–1

(y1, y2, ..., yn)B’

(x1, x2, ..., xn)B

¾¾® ¬¾ ¾¾ C–1

(x1, x2, ..., xn)B

y = xC x = yC–1

(y1, y2, ..., yn)B’

C

En resumen, el cambio de base es reversible, en el sentido de que la matriz de cambio de base es inversible, siendo la matriz de paso de la base B a la base B’ la inversa de la matriz de paso de la base B’ a la B.

7. APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES

n ì1 si i = k de donde åa ijb jk = dik = í lo que significa que C · C* = I. O sea C* = C–1 î0 si i ¹ k j=1

7.1. Noción de aplicación lineal

DEFINICIÓN: “Dados dos espacios vectoriales E y F sobre el mismo cuerpo K, una aplicación f : E ® F es una aplicación lineal u homomorfismo entre espacios vectoriales si verifica: j=1

j=1

i=1

i=1

j=1

ui = åa ijw j = åa ij ( åb jku k ) = å( åa ijb jk )u k,

f(u + v) = f(u) + f(v) (" u,v Î E). Preservación de la suma de vectores f(lu) = l f(u) (" u Î E, " l Î K). Preservación del producto por escalares” n

n

n

n

n

1. 2.

que en forma matricial pondremos x = yC*, donde ahora C* es la matriz cuadrada de orden n que se forma al tomar como filas las coordenadas de los vectores de B’ respecto de B. La sustitución de [6] en [5] nos lleva a:

Las dos condiciones anteriores pueden resumirse en una sola. Así pues, es fácil probar que f: E ® F es aplicación lineal Û f(lu + mv) = lf(u) + mf(v) (" u,v Î E, " l, m Î K) En particular, si F = K (nótese que todo cuerpo es un espacio vectorial unidimensional sobre sí mismo) la aplicación f: E ® K en caso de cumplir las dos condiciones anteriores se denomina forma lineal sobre E. j=1

xi = åy jb ji (i = 1, 2, ..., n) n

Ejemplos:

resultado que debe coincidir con [3] llegando a

– –

La proyección ortogonal de un vector sobre un plano viene a ser una aplicación lineal entre R3 y R2.



Si E = E1 Å E2, todo vector u de E se puede poner de manera única como u = u1 + u2. Entonces las proyecciones p1 y p2 de E sobre E1 y E2 respectivamente definidas como p1(u) = u1 y p2(u) = u2 son homomorfismos de E en E.

j=1

j=1

i=1

i=1

j=1

v = åy jw j = åy j ( åb jiu i ) = å( åy jb ji )u i,

La simetría vectorial que a cada vector libre u le asocia su vector opuesto -u, es una aplicación lineal de V3 en sí mismo. n

n

n

n

n

Sustituyendo en [4]

i=1

wj = åb jiu i (j = 1, 2, ..., n)

[6]

El operador integral de Riemann òa es una forma lineal sobre el espacio de las funciones reales b

n



Supongamos ahora conocidas las expresiones de los vectores de la “nueva” base B’ en la base B, es decir: continuas en el intervalo [a, b].

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

214

Espacios vectoriales. Variedades lineales

7.2. Primeras consecuencias de la definición La condición 1 de la definición significa que una aplicación lineal entre espacios vectoriales es homomorfismo de los grupos aditivos (E,+) y (F,+), por tanto: PROPOSICIÓN: “Para cualquier aplicación lineal f: E ® K, se verifican: a)

f(0E) = 0F

Preservación del vector nulo

b)

f(–u) = –f(u) (" u Î E )

Preservación del vector opuesto

c)

f(u – v) = f(u) – f(v) (" u, v Î E)

Preservación de la resta de vectores”

La condición 1 de la definición significa que una aplicación lineal entre espacios vectoriales es homomorfismo de los grupos aditivos (E,+) y (F,+) , y como consecuencia se cumplen las propiedades anteriores, cuya demostración es elemental. PROPOSICIÓN (Preservación de subespacios): “Sea una aplicación lineal f: E ® F. Se cumplen: a) La imagen de un subespacio vectorial de E es subespacio vectorial de F b) La imagen recíproca de un subespacio vectorial de F es subespacio vectorial de E” Demostración: a) Sea H subespacio vectorial de E. Dados u, v Î f(H) existen x, y Î H, siendo f(x) = u, f(y) = v. Para escalares l, m Î K cualesquiera, por ser H subespacio vectorial, es lx + my Î H, y por tanto f(lx + my) Î f(H). Ahora bien, como f lineal, f(lx + my) = l f(x) + m f(y) = lu + mv. Luego lu + mv Î f(H). b)

Sea J un subespacio vectorial de F y sea f–1(J) = {x Î E / f(x) Î J}. Dados x, y Î f–1 (J) se tienen f(x), f(y) Î J. Para escalares l, m Î K cualesquiera, por ser J subespacio vectorial de F y f lineal, será l f(x) + m f(y) = f(lx + my) Î J, de donde lx + my Î f–1(J).

PROPOSICIÓN : “Sea una aplicación lineal f: E ® F. Para cualquier subconjunto S Ì E , f transforma el subespacio L(S) en el subespacio L(f(S)), es decir f(L(S)) = L(f(S))” Consecuencia: “Si G es un sistema generador de E, entonces f(G) es sistema generador de f(E)” Demostración: Si x Î L(S), existen x1, x2, ..., xn Î S, tales que x = l1x1 + l2x2 + … + lnxn. Entonces f(x) = f(l1x1 + + l2x2 + … + lnxn) = l1f(x1) + l2 f(x2) + … + ln f(xn) con f(xi) Î f(S) (i = 1, 2, ..., n). Luego f(x) Î L(f(S)) y tendremos f(L(S)) Ì L(f(S)). Recíprocamente, si v Î L(f(S)), es v = m1v1 + m2v2 + … + mmvm con vj Î f(S) (j = 1, 2, ..., m). Existen xj Î S (j = 1, 2, ..., m) tales que vj = f(xj), por lo que al ser f lineal v = m1 f(x1) + m2f(x2) + … + mm f(xm) = f(m1x1 + m2x2 + … + mnxn) y como m1x1 + m2x2 + … + mnxn Î L(S), tendremos v Î f(L(S)). Por lo que L(f(S)) Ì f(L(S)). La consecuencia es inmediata, ya que si G genera E, tendremos L(G) = E y entonces L(f(G)) = f(L(G)) = f(E) Observación: Esta proposición nos viene a decir que si conocemos la imagen de los vectores de una base de E, queda determinada la imagen de cualquier vector de E. TEMARIO DE MATEMÁTICAS. PRUEBA A

215

Volumen I. Matemáticas

216

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si f es biyectiva se denomina isomorfismo” DEFINICIÓN: “Un homomorfismo f: E ® E de un espacio vectorial E en sí mismo se llama endomorfismo. Si además es biyectivo, es decir, se trata de un isomorfismo de E en sí mismo, se llama automorfismo”

PROPOSICIÓN (Preservación de conjuntos ligados): “Toda aplicación lineal entre espacios vectoriales transforma subconjuntos ligados de E en subconjuntos ligados de F ( S ligado Þ f(S) ligado )” Demostración: Si S Ì E es ligado, existen x1, x2, ..., xn Î S y escalares no todos nulos l1, l2, ..., ln Î K, tales que l1x1 + + l2x2 + … + lnxn = 0E. Por la linealidad será 0F = f(0E) = f(l1x1 + l2x2 + … + lnxn) = l1f(x1) + l2f(x2) + … + lnf(xn) con lo que el vector nulo 0F se podría obtener mediante combinación lineal no trivial de vectores de f(S), lo que prueba que f(S) es un subconjunto ligado de F. PROPOSICIÓN: “Sea una aplicación lineal f: E ® F y S Ì E. Si f(S) es un conjunto libre, entonces S es también libre (f(S) libre Þ S libre)” Demostración: Si l1x1 + l2x2 + … + lnxn = 0E con xi Î S (i = 1, 2, ..., n), entonces f(l1x1 + l2x2 + … + lnxn) = f(0E) Þ Þ l1f(x1) + l2f(x2) + … + lnf(xn) = 0F Þ (por ser f(S) libre) l1 = l2 = … = ln = 0. PROPOSICIÓN: “La composición de aplicaciones lineales da como resultado otra aplicación lineal. (f: E ® F y g: F ® K lineales Þ g º f: E ® K lineal)” Demostración: En efecto, para cualesquiera x, y Î E y cualesquiera escalares l, m Î K, tendríamos: g º f(lx + my) = g(f(lx + my)) = g(lf(x) + mf(y)) = lg(f(x)) + mg(f(y)) = lg º f(x)) + mg º f(y))

– – –

Si f es suprayectiva se denomina epimorfismo Si f es inyectiva se denomina monomorfismo

DEFINICIÓN: “Sea f: E ® F una aplicación lineal.

7.4. Tipos de aplicaciones lineales

Sea f: E ® F una aplicación lineal entre espacios vectoriales. DEFINICIÓN: “Se llama núcleo de f , y lo denotamos por Ker f o por N(f), al subconjunto de E formado por todos aquellos vectores que se transforman mediante f en el vector nulo de F. Es decir, el núcleo es la imagen recíproca del subespacio trivial {0F}”. Ker f = N(f) = f–1 ({0F}) = {u Î E/f(u) = 0F} Ì E DEFINICIÓN: “Se llama imagen de f , y lo denotamos por Im f, al subconjunto de F formado por todos aquellos vectores que son imágenes mediante de vectores de E”. Im f = f(E) = {y Î F / $ x Î E, siendo f(x) = y} Ì F De f(0E) = 0F se desprenden 0E Î Ker f y 0F Î Imf. Además, puesto que E es subespacio vectorial de sí mismo E y {0F} es el subespacio trivial de F, la proposición relativa a preservación de subespacios nos lleva a: PROPOSICIÓN: “Para cualquier aplicación lineal f: E ® F, se tienen a) Ker f es un subespacio vectorial de E b) Im f es un subespacio vectorial de F”

7.3. Núcleo e imagen de una aplicación lineal

7.3. Núcleo e imagen de una aplicación lineal

Sea f: E ® F una aplicación lineal entre espacios vectoriales. DEFINICIÓN: “Se llama núcleo de f , y lo denotamos por Ker f o por N(f), al subconjunto de E formado por todos aquellos vectores que se transforman mediante f en el vector nulo de F. Es decir, el núcleo es la imagen recíproca del subespacio trivial {0F}”. Ker f = N(f) = f–1 ({0F}) = {u Î E/f(u) = 0F} Ì E DEFINICIÓN: “Se llama imagen de f , y lo denotamos por Im f, al subconjunto de F formado por todos aquellos vectores que son imágenes mediante de vectores de E”. Im f = f(E) = {y Î F / $ x Î E, siendo f(x) = y} Ì F De f(0E) = 0F se desprenden 0E Î Ker f y 0F Î Imf. Además, puesto que E es subespacio vectorial de sí mismo E y {0F} es el subespacio trivial de F, la proposición relativa a preservación de subespacios nos lleva a: PROPOSICIÓN: “Para cualquier aplicación lineal f: E ® F, se tienen a) Ker f es un subespacio vectorial de E b) Im f es un subespacio vectorial de F”

PROPOSICIÓN (Preservación de conjuntos ligados): “Toda aplicación lineal entre espacios vectoriales transforma subconjuntos ligados de E en subconjuntos ligados de F ( S ligado Þ f(S) ligado )” Demostración: Si S Ì E es ligado, existen x1, x2, ..., xn Î S y escalares no todos nulos l1, l2, ..., ln Î K, tales que l1x1 + + l2x2 + … + lnxn = 0E. Por la linealidad será 0F = f(0E) = f(l1x1 + l2x2 + … + lnxn) = l1f(x1) + l2f(x2) + … + lnf(xn) con lo que el vector nulo 0F se podría obtener mediante combinación lineal no trivial de vectores de f(S), lo que prueba que f(S) es un subconjunto ligado de F. PROPOSICIÓN: “Sea una aplicación lineal f: E ® F y S Ì E. Si f(S) es un conjunto libre, entonces S es también libre (f(S) libre Þ S libre)” Demostración: Si l1x1 + l2x2 + … + lnxn = 0E con xi Î S (i = 1, 2, ..., n), entonces f(l1x1 + l2x2 + … + lnxn) = f(0E) Þ Þ l1f(x1) + l2f(x2) + … + lnf(xn) = 0F Þ (por ser f(S) libre) l1 = l2 = … = ln = 0. PROPOSICIÓN: “La composición de aplicaciones lineales da como resultado otra aplicación lineal. (f: E ® F y g: F ® K lineales Þ g º f: E ® K lineal)” Demostración: En efecto, para cualesquiera x, y Î E y cualesquiera escalares l, m Î K, tendríamos: g º f(lx + my) = g(f(lx + my)) = g(lf(x) + mf(y)) = lg(f(x)) + mg(f(y)) = lg º f(x)) + mg º f(y))

7.4. Tipos de aplicaciones lineales

DEFINICIÓN: “Sea f: E ® F una aplicación lineal.

– –

Si f es inyectiva se denomina monomorfismo

Si f es suprayectiva se denomina epimorfismo

– Si f es biyectiva se denomina isomorfismo” DEFINICIÓN: “Un homomorfismo f: E ® E de un espacio vectorial E en sí mismo se llama endomorfismo. Si además es biyectivo, es decir, se trata de un isomorfismo de E en sí mismo, se llama automorfismo” 216

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales

7.5. Caracterización de monomorfismos, epimorfismos e isomorfismos PROPOSICIÓN: “Sea f : E ® F una aplicación lineal. Entonces: a)

f monomorfismo Û Ker f = {0E}

b)

f epimorfismo Û Im f = F”

La equivalencia b) es obvia por definición de aplicación suprayectiva. Probaremos sólo la a). (Þ) Si u Î Ker f, entonces f(u) = 0F = f(0E). Como es inyectiva, necesariamente u = 0E. (Ü) Si f(u) = f(v), entonces f(u – v) = f(u) – f(v) = 0F, de donde u – v Î Ker f = {0E}, y por tanto u – v = 0E, llegando a u = v. PROPOSICIÓN (Preservación de conjuntos libres): “Si f : E ® F es un monomorfismo y L es un subconjunto libre de E, entonces f(L) es un subconjunto libre de F. En consecuencia f transforma cualquier base de E en una base de Im f” Demostración: Sea L Ì E y L libre. Para cualquier sistema {y1, y2, ..., yn}de vectores de f(L), existe otro sistema {x1, x2, ..., xn} de vectores de L, tales que f(xi) = yi (i = 1, 2, ..., n). Si fuese l1y1 + l2y2 + … + lnyn = 0F, tendríamos por linealidad: l1f(x1) + l2f(x2) + … + lnf(xn) = f(l1x1 + l2x2 + … + lnxn) = 0F o sea l1x1 + l2x2 + … + lnxn Î Ker f. Ahora bien, si f es monomorfismo Ker f = {0E}, y por tanto l1x1 + l2x2 + … + lnxn = 0E. Pero como hemos supuesto que L es libre, necesariamente ha de ser l1 = l2 = ... = ln = 0. Luego f(L) es un conjunto libre. La consecuencia es inmediata. PROPOSICIÓN: “Si f: E ® F es un isomorfismo, entonces f –1: F ® E es también un isomorfismo” Demostración: Si f es biyectiva, f –1 también lo es. Luego sólo queda probar la linealidad de f –1. Dados cualesquiera u, v Î F, existen dos únicos x, y Î E tales que f(x) = u y f(y) = v. Entonces " l, m Î K: f(lx + my) = = lf(x) + mf(y) = lu + mv por ser f lineal. De aquí obtenemos f –1(lu + mv) = lx + my = lf –1(u) + mf –1(v). Luego f –1 es lineal. PROPOSICIÓN (Preservación de bases): “Una aplicación lineal f: E ® F es un isomorfismo si y sólo si f transforma bases de E en bases de F”. Demostración: Sea B una base de E. Por ser f monomorfismo f(B) es base de Im f; pero como f es también epimorfismo, se tiene Im f = F. Luego es f(B) una base de F. Supongamos que toda base B de E se transforma en una base f(B) de F. Para cualquier y Î F, puede p

p

j=1

j=1

ponerse de manera única como y = åy i f(u j ) con uj Î B, si definimos h(y) = åy i u j tendremos una aplicación h: F ® E, que cumple h º f = iE y f º h = if por lo que f tiene a h como inversa y es, por consiguiente, biyectiva. PROPOSICIÓN: “Sea f: E ® F una aplicación lineal. Entonces: a) f monomorfismo Þ dim E £ dim F b) f epimorfismo Þ dim E ³ dim F c) f isomorfismo Þ dim E = dim F ” TEMARIO DE MATEMÁTICAS. PRUEBA A

217

Volumen I. Matemáticas

218

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

f es monomorfismo Þ E @ f(E) Þ dim E = dim f(E) = dim F Þ f(E) = F Þ f es epimorfismo. O también: si B = {u1, u2, ..., un} es una base de E, entonces f(B) = {f(u1), f(u2), ..., f(un)} es un sistema libre de F con tantos vectores (todos distintos al ser f inyectiva) como dim F. Resulta que f(B) es una base de F. Para cualquier y Î F será y = l1f(u1) + l2f(u2) + … + lnf(un) = f(l1u1 + l2u2 + … + lnun) Î f(E) Luego F Ì f(E) y por tanto f(E) = F

Demostración: a) Si f es monomorfismo transforma una base B de E en una base f(B) de Im f. Como f es inyectiva será Card(B) = Card (f(B)), de donde dim E = dim (Im f). Ahora bien, al ser f(E) un subespacio de F tendremos dim (Im f) £ dim (F). Luego dim E £ dim F. b) Si f es epimorfismo Im f = F. Si B es una base de E, podemos asegurar que f(B) sistema generador de Im f, o sea de F. Por tanto dim E = Card (B) ³ Card (f(B)) ³ dim F. c) Es consecuencia de las dos anteriores, o inmediata a partir de la proposición 4. a)

Demostración:

Si existe un isomorfismo entre dos espacios vectoriales E y F sobre un mismo cuerpo K, diremos que ambos son isomorfos entre sí, y representaremos E @ F

PROPOSICIÓN: “Si E y F son dos espacios vectoriales de dimensión finita tales que dim E = dim F, se verifican las equivalencias: f es monomorfismo Û f es epimorfismo Û f es isomorfismo”

PROPOSICIÓN: “La condición necesaria y suficiente para que dos espacios vectoriales sobre un mismo cuerpo K sean isomorfos es que tengan la misma dimensión (E @ F Û dim E = dim F)” Luego Im f = F y por tanto f es epimorfismo.

Demostración: (Þ) Es trivial a partir del apartado c) de la proposición 5. (Ü) Si dim E = dim F, significa que las bases de E y de F tienen el mismo cardinal, por lo que si B y B’ son dos bases respectivas, entonces B y B’ son coordinables; esto es, existe una biyección g: B® B’. j=1

j=1

j=1

p

p

Entonces el vector x = åy j g –1( w j ) cumple f(x) = åy j g(g –1( w j )) = åy jw j = y. p

j=1

y = åy j w j

n

Todo vector de x Î E , se puede expresar de manera única x = åxiu i donde ui Î B; p

Luego Ker f = (0E) y por tanto f es monomorfismo. Además, para cualquier y Î F , existen vectores wj Î B’ (j = 1, 2, ..., p) tales que puede ponerse de manera única i=1

n

entonces definimos f(x) = åxi g(u i ). i=1

i=1

De esta manera queda establecida una aplicación f de E en F, que es lineal, como puede probarse fácilmente. Probaremos además que es biyectiva. En efecto, si f(x) = 0F

entonces åxi g(u i ) = 0F, y como g(ui) Î B’ y B’ es libre deberá ser xi = 0 (i = 1, 2, ..., n), de donde x = 0E. n

De esta manera queda establecida una aplicación f de E en F, que es lineal, como puede probarse fácilmente. Probaremos además que es biyectiva. En efecto, si f(x) = 0F n

entonces åxi g(u i ) = 0F, y como g(ui) Î B’ y B’ es libre deberá ser xi = 0 (i = 1, 2, ..., n), de donde x = 0E. i=1

i=1

Luego Ker f = (0E) y por tanto f es monomorfismo. Además, para cualquier y Î F , existen vectores wj Î B’ (j = 1, 2, ..., p) tales que puede ponerse de manera única entonces definimos f(x) = åxi g(u i ). n

i=1

Todo vector de x Î E , se puede expresar de manera única x = åxiu i donde ui Î B; p

y = åy j w j

n

Demostración: (Þ) Es trivial a partir del apartado c) de la proposición 5. (Ü) Si dim E = dim F, significa que las bases de E y de F tienen el mismo cardinal, por lo que si B y B’ son dos bases respectivas, entonces B y B’ son coordinables; esto es, existe una biyección g: B® B’. j=1

p

p

p

j=1

j=1

j=1

Entonces el vector x = åy j g –1( w j ) cumple f(x) = åy j g(g –1( w j )) = åy jw j = y. Luego Im f = F y por tanto f es epimorfismo.

PROPOSICIÓN: “La condición necesaria y suficiente para que dos espacios vectoriales sobre un mismo cuerpo K sean isomorfos es que tengan la misma dimensión (E @ F Û dim E = dim F)”

PROPOSICIÓN: “Si E y F son dos espacios vectoriales de dimensión finita tales que dim E = dim F, se verifican las equivalencias: f es monomorfismo Û f es epimorfismo Û f es isomorfismo”

Si existe un isomorfismo entre dos espacios vectoriales E y F sobre un mismo cuerpo K, diremos que ambos son isomorfos entre sí, y representaremos E @ F Demostración: a) Si f es monomorfismo transforma una base B de E en una base f(B) de Im f. Como f es inyectiva será Card(B) = Card (f(B)), de donde dim E = dim (Im f). Ahora bien, al ser f(E) un subespacio de F tendremos dim (Im f) £ dim (F). Luego dim E £ dim F. b) Si f es epimorfismo Im f = F. Si B es una base de E, podemos asegurar que f(B) sistema generador de Im f, o sea de F. Por tanto dim E = Card (B) ³ Card (f(B)) ³ dim F. Es consecuencia de las dos anteriores, o inmediata a partir de la proposición 4. 218

f es monomorfismo Þ E @ f(E) Þ dim E = dim f(E) = dim F Þ f(E) = F Þ f es epimorfismo. O también: si B = {u1, u2, ..., un} es una base de E, entonces f(B) = {f(u1), f(u2), ..., f(un)} es un sistema libre de F con tantos vectores (todos distintos al ser f inyectiva) como dim F. Resulta que f(B) es una base de F. Para cualquier y Î F será y = l1f(u1) + l2f(u2) + … + lnf(un) = f(l1u1 + l2u2 + … + lnun) Î f(E) Luego F Ì f(E) y por tanto f(E) = F CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

a)

c)

Demostración:

Espacios vectoriales. Variedades lineales b)

f es epimorfismo Þ f es monomorfismo Sea B’ = {w1, w2, ..., wn} una base de F. Por ser f epimorfismo existen ui Î E, tales que f(ui) = wi (i = 1, 2, ..., n ). Por una proposición anterior B = {u1, u2, ..., un} es un sistema libre de E y por tanto una base. Entonces dados x, y Î E tales que f(x) = f(y), tendremos f(x) = f(y) Þ f(x1u1 + x2u2 + … + x nun) = f(y1u1 + y2u2 + … + ynun) Þ Þ x1f(u1) + x2f(u2) + … + xnf(un) = y1f(u1) + y2f(u2) + … + ynf(un) Þ Þ x1w1 + x2w2 + … + xnwn = y1w1 + y2w2 + … + ynwn Þ xi = yi (i = 1, 2, ..., n) Þ x = y Luego f es inyectiva.

8. TEOREMAS DE ISOMORFÍA 8.1. Espacios cociente. Aplicación canónica de un subespacio Sea U un subespacio vectorial de E. Podemos definir en E un relación binaria como sigue: x~yÛx–yÎU Se prueba fácilmente que dicha relación es de equivalencia. Designaremos el conjunto cociente por E U.

Las clases son x = {y Î E / y = x + u, con u Î U} = x + U. En el caso particular de que x Î U, tendremos la clase nula que denotamos por 0. Definiendo la suma de clases y el producto de clases por escalares de K de la manera usual, esto es: (x + U) + (x’ + U) = (x + x’) + U a(x + U) = ax + U se dota a E U de una estructura de K-espacio vectorial. Se le denomina espacio cociente de E por U. Es cierto también que toda relación de equivalencia en E compatible con la estructura de espacio vectorial es de la forma anterior. Definiremos ahora una aplicación j: E ® E U asignando a cada vector de E su clase en el espacio cociente. O sea: j(x) = x + U, " x Î E. Se trata de una aplicación lineal u homomorfismo de espacios vectoriales, ya que para cualesquiera x, y Î E y l, m Î K se tiene j(lx + my) = (lx + my) + U = (lx + U) +(my + U) = l(x + U) + m(y + U) = lj(x) + mj(y). Obviamente j un epimorfismo, al que denominamos aplicación canónica del subespacio U ( proyección canónica o natural de E sobre E U). También es obvio que Ker j = U. En el caso particular de que U sea el subespacio trivial de E, es decir U = {0E}, entonces cada clase del espacio cociente se reduce a un solo elemento, pudiendo identificarse la clase x con el elemento x, y la proyección canónica será entonces un isomorfismo, por lo que puede escribirse E

{0 E } @ E.

f

f

f

1 2 n Una sucesión de aplicaciones lineales E1 ¾ ¾ ® E2 ¾ ¾ ® E3 ¾¾®...En ¾ ¾ ® En+1 se dice que es exacta si Im fi = Ker fi +1 (i = 1, 2, ...,n). Entonces la sucesión j

{0 E } ¾¾® U ¾¾® E ¾¾® E U ¾¾®{0 E } i

cumple lo anterior y se denomina sucesión exacta asociada al subespacio U. TEMARIO DE MATEMÁTICAS. PRUEBA A

219

Volumen I. Matemáticas

220

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

W U @ UÇ W

[8]

8.2. Descomposición canónica de un homomorfismo U+ W

SEGUNDO TEOREMA DE ISOMORFÍA: “Dados dos subespacios U y W de un K-espacio vectorial E. Entonces los espacios cociente U+ W y W U U Ç W son canónicamente isomorfos”

Dados los espacios vectoriales E y F sobre el mismo cuerpo K y una aplicación lineal entre ellos f: E ® F, podemos construir el siguiente diagrama conmutativo: f

F

Ker f @ Im f

isomorfos”

[7] j

Figura 3. E

E

i

“Para cualquier aplicación lineal f: E ® F los espacios E Ker f ® Im f son canónicamente f*

E

PRIMER TEOREMA DE ISOMORFÍA:

Ker f

Im f

La existencia y unicidad de isomorfismo f* anteriormente probadas permiten enunciar el donde i = inmersión o inyección natural (monomorfismo) f* = isomorfismo j = proyección canónica (epimorfismo)

8.3. Teoremas de isomorfía

f(x) = i º f* º j(x) = i º f*(x) de donde i º f’(x) = i º f*(x), pero como y es inyectiva f’(x) = f*(x). Luego f = f *.

A la descomposición f = i º f* º j se le denomina descomposición canónica de la aplicación lineal f. f(x) = i º f’ º j(x) = i º f’(x)

a)

La aplicación i: Im f ® F es la inclusión i(y) = y, " y Î Im f, pues Im f Ì F. Es obvio que es monomorfismo. La proyección natural j : E ® E Ker f es epimorfismo tal como probamos para un subespacio cualquiera U de E, y por tanto lo será en particular para el subespacio Ker f. La aplicación f*: E Ker f ® Im f la definimos así: f(x + Ker f) = f(x), " x Î E. Está bien definida, ya que si x + Ker f = y + Ker f entonces x – y Î Ker f, de donde f(x – y) = f(x) – f(y) = 0F , y por tanto f(x) = f(y). Además se prueba fácilmente que es lineal, siendo Ker f* = {x + Ker f / f(x) = 0F} = {x + Ker f / x Î Ker f}= {0E + Ker f} e Im f* = Im f. Luego f* es isomorfismo.

Se cumple también la unicidad del isomorfismo f* que hace conmutativo el diagrama. En efecto si f’ fuese otro isomorfismo tal que f = i º f’ º j, entonces " x Î E Ker f tenemos A la descomposición f = i º f* º j se le denomina descomposición canónica de la aplicación lineal f. La aplicación i: Im f ® F es la inclusión i(y) = y, " y Î Im f, pues Im f Ì F. Es obvio que es monomorfismo. La proyección natural j : E ® E Ker f es epimorfismo tal como probamos para un subespacio cualquiera U de E, y por tanto lo será en particular para el subespacio Ker f. La aplicación f*: E Ker f ® Im f la definimos así: f(x + Ker f) = f(x), " x Î E. Está bien definida, ya que si x + Ker f = y + Ker f entonces x – y Î Ker f, de donde f(x – y) = f(x) – f(y) = 0F , y por tanto f(x) = f(y). Además se prueba fácilmente que es lineal, siendo Ker f* = {x + Ker f / f(x) = 0F} = {x + Ker f / x Î Ker f}= {0E + Ker f} e Im f* = Im f. Luego f* es isomorfismo. c)

c)

b)

Se cumple también la unicidad del isomorfismo f* que hace conmutativo el diagrama. En efecto si f’ fuese otro isomorfismo tal que f = i º f’ º j, entonces " x Î E Ker f tenemos b) a)

f(x) = i º f’ º j(x) = i º f’(x)

f(x) = i º f* º j(x) = i º f*(x) de donde i º f’(x) = i º f*(x), pero como y es inyectiva f’(x) = f*(x). Luego f = f *.

donde i = inmersión o inyección natural (monomorfismo) f* = isomorfismo j = proyección canónica (epimorfismo)

8.3. Teoremas de isomorfía

La existencia y unicidad de isomorfismo f* anteriormente probadas permiten enunciar el Im f

Ker f

PRIMER TEOREMA DE ISOMORFÍA:

E

“Para cualquier aplicación lineal f: E ® F los espacios E Ker f ® Im f son canónicamente f*

Ker f @ Im f

[7] E

i

F

E

j

isomorfos” Figura 3.

SEGUNDO TEOREMA DE ISOMORFÍA: “Dados dos subespacios U y W de un K-espacio vectorial E. Entonces los espacios cociente U+ W y W U U Ç W son canónicamente isomorfos” f

Dados los espacios vectoriales E y F sobre el mismo cuerpo K y una aplicación lineal entre ellos f: E ® F, podemos construir el siguiente diagrama conmutativo: U+ W

W U @ UÇ W

8.2. Descomposición canónica de un homomorfismo CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

220

[8]

Espacios vectoriales. Variedades lineales Demostración: Si la aplicación canónica o proyección natural j: E ® E U la restringimos a W obtendremos otra aplicación y: W ® E U que sigue siendo lineal. – Veamos que Im y = U + W U. En efecto, si z + U Î Im y existe un x Î W tal que y(x) = z + U. Pero por la propia definición de la restricción y, también será y(x) = j(x) = x + U. Por tanto z + U = x + U, de donde z Î U + W y z + U Î U + W U. Hemos probado que Im y Ì U + W U. La inclusión en el otro sentido se prueba de manera similar.



Veamos que Ker y = U Ç W. En efecto, si x Î Ker y, es obvio que x Î W, y además y(x) = 0 + U, es decir, x + U = 0 + U, de donde x Î U. Luego x Î U Ç W, con lo que hemos probado que Ker y Ì U Ç W. La inclusión recíproca se prueba análogamente.

Ahora sólo basta aplicar el primer teorema de isomorfía y tendremos el resultado [8]. TERCER TEOREMA DE ISOMORFÍA: “Sean U1 y U2 dos subespacios vectoriales de un K- espacio vectorial V tales que U1 Ì U2, entonces los espacios E U1 E y U 2 U2 U1 son isomorfos” E U2

U1

@ EU 2

[9]

U1

Demostración: Ahora definimos la aplicación h: E U ® E U como h(x + U1) = x + U2. 1 2 Entonces h es lineal y suprayectiva, lo que tiene demostración trivial. Se tiene, pues, Im h = E U . 2 Veamos que Ker h =

U2

U1.

En efecto, si x + U1Î Ker h será h(x + U1) = x + U2 = 0 + U2, luego x Î U2 y por consiguiente x + U1 Î Hemos probado que Ker h Ì

U2

U2

U1.

U1.

Recíprocamente, U si x + U1 Î 2 U , entonces x Î U2 y será h(x + U1) = x + U2 = 0 + U2, de donde x + U1 Î Ker h, que1 U dando probado que 2 U Ì Ker h. 1 Basta aplicar el primer teorema de isomorfía y tendremos [9] TEMARIO DE MATEMÁTICAS. PRUEBA A

221

Volumen I. Matemáticas

U1 = dim W2; dim

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

8.4. Consecuencias: teoremas de la dimensión

222

quedando demostrado.

U2 = dim W2; dim

U1 = dim W2 Å W3 = dim W2 + dim W3

LEMA: “Para cada subespacio U de E se pueden encontrar de manera no canónica subespacios complementarios W tales que E = U Å W. Sin embargo, cada uno de ellos es isomorfo al espacio cociente E U. Si UÅ W1 = U Å W2 , entonces W1 es canónicamente isomorfo a W2” Demostración: Si tomamos el 2º teorema de isomorfía en el caso de que fuese E = U Å W, entonces sería, por definición de suma directa U Ç W = {0E}. Quedaría E U @ W {0 }@ W, siendo canónico el isomorfismo E entre E U y W. Para dos subespacios W1 , W2 que cumplieran lo anterior, tengamos en cuenta que si f: E ® W1 y g: E ® W2 son los respectivos isomorfismos canónicos, entonces g f –1: W1 ® W2 es º U U también isomorfismo. Luego W1 @ W2. Sólo falta probar que puede encontrarse algún W, que sea complementario del subespacio U. En efecto, si S es una base de U entonces podemos completar el sistema libre S hasta una base B = S dim

U2

U3

U3

Demostración: Por el lema anterior podemos encontrar subespacios W2 y W3 tales que U2 = U1 Å W2, U3 = U2 Å W3 y por consiguiente U3 = (U1 Å W2) Å W3 = U1 Å (W2 Å W3), teniendo entonces: dim

U3

U1 = dim

U2

U3 U1 + dim U2

COROLARIO: “Si f: E ® F es una aplicación lineal se cumple dim E = dim (Ker f) + dim (Im f)” En particular U = Ker f es un subespacio de E. Por el primer teorema de isomorfía resulta dim (Im f) = codim (Ker f), de donde dim E = dim (Ker f) + codim (Ker f) = dim (Ker f) + dim (Im f) COROLARIO: “Si U y W son subespacios vectoriales de E tales que son complementarios, es decir E = U Å W entonces: dim E = dim U + dim W”. La justificación es inmediata, pues hemos visto en el lema que W @ E U y, por lo tanto, sería dim W = codim U. TEOREMA 2: “Sean U1, U2, U3 subespacios de E tales que U1 Ì U2 Ì U3. Se verifica: ·

U T de E. Entonces U Å L(T) = L(S) Å L(T) = L(S È T) = E. Luego podemos tomar W = L(T).

DEFINICIÓN: “Para un subespacio U de un K-espacio vectorial E se llama codimensión de U a la dimensión del espacio cociente E U. Escribiremos codim U = dim E U” TEOREMA 1: “Para cualquier subespacio U de un K-espacio vectorial E se verifica: dim E = dim U + codim U”. Demostración: Es consecuencia de lema anterior.

TEOREMA 1: “Para cualquier subespacio U de un K-espacio vectorial E se verifica: dim E = dim U + codim U”. Demostración: Es consecuencia de lema anterior. Por la construcción de W tendremos dim E = dim U + dim W. Ahora bien, como W @ E U tenemos dim W = dim E U = codim U y sustituyendo queda inmediatamente probado.

Por la construcción de W tendremos dim E = dim U + dim W. Ahora bien, como W @ E U tenemos dim W = dim E U = codim U y sustituyendo queda inmediatamente probado. COROLARIO: “Si f: E ® F es una aplicación lineal se cumple dim E = dim (Ker f) + dim (Im f)” En particular U = Ker f es un subespacio de E. Por el primer teorema de isomorfía resulta dim (Im f) = codim (Ker f), de donde dim E = dim (Ker f) + codim (Ker f) = dim (Ker f) + dim (Im f) COROLARIO: “Si U y W son subespacios vectoriales de E tales que son complementarios, es decir E = U Å W entonces: dim E = dim U + dim W”. La justificación es inmediata, pues hemos visto en el lema que W @ E U y, por lo tanto, sería dim W = codim U. TEOREMA 2: “Sean U1, U2, U3 subespacios de E tales que U1 Ì U2 Ì U3. Se verifica:

DEFINICIÓN: “Para un subespacio U de un K-espacio vectorial E se llama codimensión de U a la dimensión del espacio cociente E U. Escribiremos codim U = dim E U” U T de E. Entonces U Å L(T) = L(S) Å L(T) = L(S È T) = E. Luego podemos tomar W = L(T). ·

entre E U y W. Para dos subespacios W1 , W2 que cumplieran lo anterior, tengamos en cuenta que si f: E ® W1 y g: E ® W2 son los respectivos isomorfismos canónicos, entonces g f –1: W1 ® W2 es º U U también isomorfismo. Luego W1 @ W2. Sólo falta probar que puede encontrarse algún W, que sea complementario del subespacio U. En efecto, si S es una base de U entonces podemos completar el sistema libre S hasta una base B = S E

U U U dim 3 U = dim 2 U + dim 3 U 1 1 2 Demostración: Por el lema anterior podemos encontrar subespacios W2 y W3 tales que U2 = U1 Å W2, U3 = U2 Å W3 y por consiguiente U3 = (U1 Å W2) Å W3 = U1 Å (W2 Å W3), teniendo entonces:

Demostración: Si tomamos el 2º teorema de isomorfía en el caso de que fuese E = U Å W, entonces sería, por definición de suma directa U Ç W = {0E}. Quedaría E U @ W {0 }@ W, siendo canónico el isomorfismo LEMA: “Para cada subespacio U de E se pueden encontrar de manera no canónica subespacios complementarios W tales que E = U Å W. Sin embargo, cada uno de ellos es isomorfo al espacio cociente E U. Si UÅ W1 = U Å W2 , entonces W1 es canónicamente isomorfo a W2” dim

U2

U1 = dim W2; dim

U3

U2 = dim W2; dim

U3

U1 = dim W2 Å W3 = dim W2 + dim W3

8.4. Consecuencias: teoremas de la dimensión

quedando demostrado. 222

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales

TEOREMA 3: “Sean U y W subespacios de E. Se verifica: dim (U + W) = dim U + dim W – dim (U Ç W)”. Demostración: Como U es subespacio de U + W y U Ç W subespacio de W, el teorema 1 garantiza que dimU + W U = dim (U + W) – dim U, dimW U Ç W = dim W – dim (U Ç W) Por el primer teorema de isomorfía, los dos primeros miembros de ambas igualdades son iguales, por lo que dim (U + W) – dim U = dim W – dim (U Ç W), de donde resulta lo que queremos probar. También se puede probar a partir del teorema 2, tomando U1 = {0E}, U2 = U, U3 = U + W. COROLARIO: “Si U y W son subespacios vectoriales de E, entonces se verifica: codim (U + W) = dim U + dim W – dim (U Ç W)” En efecto, codim(U + W) = dim E – dim (U + W) = dim E – dim U – dim W + dim (U Ç W) = = [dim E – dim U] + [dim E – dim W] – [dim E – dim (U Ç W)] = codim U + codim W – codim(U Ç W) También puede probarse a partir del teorema 2 si tomamos U1 = U Ç W, U2 = W y U3 = E. Observaciones: Si la dimensión de E es finita, todos los subespacios de E tienen también dimensión finita: Si al contrario dim E = ¥, nuestro interés se reduce a dos tipos de subespacios U: los de dimensión finita, o los que tienen un complementario de dimensión finita. Para estos últimos dim U = ¥, sin embargo codim U es finita, lo que aporta un significado a la “codimensión”, que nos da una idea de cuánto difiere U del espacio entero E. En cualquier caso, las relaciones obtenidas tanto en los teoremas como en los corolarios anteriores ofrecen poco interés para el caso de dimensión infinita, pues un símbolo ¥ no puede ser desplazado de un miembro a otro por sustracción. El teorema que enunciaremos a continuación es un caso particular del lema anterior, pero aquí lo enunciaremos y demostraremos explícitamente: TEOREMA: “Sean E y F dos espacios vectoriales sobre el mismo cuerpo K y f: E ® F una aplicación lineal. El subepacio Ker f puede ser completado (de manera no canónica) por un complementario E2 tal que E = Ker f Å E2 , verificándose entonces: a) f(E2) = f(E) = Im f b) La restricción g de f a E2 es un isomorfismo de E2 en Im f” Demostración: La obtención de un complementario E2 de Ker f es similar a la indicada en la demostración del lema. ·

Si S es una base de Ker f entonces podemos completar el sistema libre S hasta una base S È T de E, resultando E2 = L(T). a) De E = Ker f Å E2, tenemos que todo u Î E puede ponerse de manera única u = u1 + u2, con u1 Î Ker f y u2 Î E2. Entonces f(u) = f(u1 + u2) = f(u1) + f(u2) = 0F + f(u2) = f(u2) Î f(E2) Þ f(E) Ì f(E2) Þ f(E) = f(E2). b) Sea g = f /E2: E2 ® Im f. Es epimorfismo, pues g(E2) = f(E2) = f(E) = Im f. Además Ker g = = Ker f Ç E2 = {0E}, por lo que g es también monomorfismo. Este teorema tiene como consecuencias inmediatas algunos resultados anteriores, para una aplicación lineal cualquiera f: E ® F: 1. Como E = Ker f Å E2 siendo E2 @ Im f, deducimos dim E = dim(Ker f) + dim (Im f). 2. f monomorfismo Þ dim E £ dim F. En efecto, pues sería dim(Ker f) = dim {0E}= 0. De aquí se desprende que dim E = dim (Im f) £ dim F. 3. f epimorfismo Þ dim E ³ dim F. En efecto, es inmediato ya que f es epimorfismo si Im f = F. De aquí dim E = dim (Ker f) + dim F y por tanto dim E ³ dim F. 4. f isomorfismo Þ dim E = dim F. Se deduce inmediatamente de 2. y 3. TEMARIO DE MATEMÁTICAS. PRUEBA A

223

Volumen I. Matemáticas

224

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

PROPOSICIÓN: “Dada una base B = {ui}iÎI de E, para elementos ai Î K escogidos arbitrariamente (uno para cada i), existe una única forma j Î E*, tal que j(ui) = ai " i Î I”

9. DUALIDAD

9.1. Estructuras de Hom(E,F), End(E) y Aut(E)

Recíprocamente puede enunciarse la siguiente



Designamos por Hom(E,F) ó L(E,F) al conjunto de todas las aplicaciones lineales u homomorfismos entre dos espacios vectoriales E y F sobre el mismo cuerpo conmutativo K. Es fácil probar que la suma (usual) de aplicaciones lineales es otra aplicación lineal, al igual que ocurre con la aplicación a · f (con a Î K) si f es lineal . Por tanto es posible definir en Hom(E,F) dos leyes de composición una interna y otra externa respecto a las cuales Hom(E,F) queda dotado de estructura de K-espacio vectorial. Lo anterior muestra que j es conocida si se conocen los ai. iÎ I

iÎ I

j(x) = åxij(u i ) = åxa i i

iÎ I

Un cuerpo cualquiera K puede considerarse como un espacio vectorial bilátero sobre sí mismo. Una forma lineal es una aplicación lineal j: E ® K, considerando K espacio vectorial sobre sí mismo. Denominaremos E* al conjunto Hom(E,K) de las formas lineales. Si E es un K-espacio vectorial por la derecha, entonces E* resulta ser un K-espacio vectorial por la izquierda, y viceversa. Podemos suponer que E es bilátero y entonces E* es también un espacio vectorial bilátero sobre K , al que se llama espacio dual de E. Sea B = {ui}iÎI una base de E y una forma j Î E* tal que j (ui) = ai Î K. Para todo vector x Î E, se tiene x = åxiu i donde xi = 0 salvo para un número finito de i Î I . Entonces (Hom(E,F), + ·) espacio vectorial sobre K



Ahora bien, si es en particular E = F, entonces podemos dotar a Hom(E,F) de una estructura aún más rica. Un elemento de Hom(E,E) es un endomorfismo en E, por lo que denotaremos Hom(E,E) = End(E). Dado que la composición de dos endomorfismos es otro endomorfismo, en End(E) tenemos, además de la suma, una nueva operación interna: la composición “°”. Es fácil probar que ( End(E), °) es un semigrupo no conmutativo y unitario (la identidad iE es el neutro para la composición). Además las distributivas respecto a la suma son elementales, pues " u Î E, " f, g, f1, f2, g1, g2 Î End(E): (g1 + g2) ° f(u) = (g1 + g2) (f(u)) = g1 (f(u)) + g2 (f(u)) = g1° f(u) + g2 ° f(u) = (g1 ° f + g2 ° f)(u) g ° (f1 + f2)(u) = g((f1 + f2)(u)) = g(f1(u)) + f2(u)) = g ° f1(u) + g ° f2(u) = (g ° f1 + g ° f2)(u) Entonces resulta que (End(E), + , °) es un anillo unitario, no conmutativo con divisores de cero. En consecuencia:

9.2. Espacio dual

(Aut(E), ) es un grupo no conmutativo, al que denominamos “grupo lineal” ° y denotamos también por GL(E)

(End(E), +, ·, °) es un K-álgebra unitaria, no conmutativa y no íntegra.

El subconjunto formado por todos los elementos inversibles del semigrupo (End(E), °) estará formado por los endomorfismos f para los cuales f –1 es también un endomorfismo de E. Para ello es condición necesaria y suficiente que f sea biyectiva. Un endomorfismo biyectivo es un automorfismo. Llamaremos, pues, Aut(E) al conjunto de todos los automorfismos en E (Aut(E) Ì End(E)). Ahora todo f Î Aut(E) tiene inverso f –1 Î Aut(E). Resulta pues:





(End(E), +, ·, °) es un K-álgebra unitaria, no conmutativa y no íntegra. El subconjunto formado por todos los elementos inversibles del semigrupo (End(E), °) estará formado por los endomorfismos f para los cuales f –1 es también un endomorfismo de E. Para ello es condición necesaria y suficiente que f sea biyectiva. Un endomorfismo biyectivo es un automorfismo. Llamaremos, pues, Aut(E) al conjunto de todos los automorfismos en E (Aut(E) Ì End(E)). Ahora todo f Î Aut(E) tiene inverso f –1 Î Aut(E). Resulta pues: (Aut(E), °) es un grupo no conmutativo, al que denominamos “grupo lineal” y denotamos también por GL(E)

Ahora bien, si es en particular E = F, entonces podemos dotar a Hom(E,F) de una estructura aún más rica. Un elemento de Hom(E,E) es un endomorfismo en E, por lo que denotaremos Hom(E,E) = End(E). Dado que la composición de dos endomorfismos es otro endomorfismo, en End(E) tenemos, además de la suma, una nueva operación interna: la composición “°”. Es fácil probar que ( End(E), °) es un semigrupo no conmutativo y unitario (la identidad iE es el neutro para la composición). Además las distributivas respecto a la suma son elementales, pues " u Î E, " f, g, f1, f2, g1, g2 Î End(E): (g1 + g2) ° f(u) = (g1 + g2) (f(u)) = g1 (f(u)) + g2 (f(u)) = g1° f(u) + g2 ° f(u) = (g1 ° f + g2 ° f)(u) g ° (f1 + f2)(u) = g((f1 + f2)(u)) = g(f1(u)) + f2(u)) = g ° f1(u) + g ° f2(u) = (g ° f1 + g ° f2)(u) Entonces resulta que (End(E), + , °) es un anillo unitario, no conmutativo con divisores de cero. En consecuencia:

9.2. Espacio dual

Un cuerpo cualquiera K puede considerarse como un espacio vectorial bilátero sobre sí mismo. Una forma lineal es una aplicación lineal j: E ® K, considerando K espacio vectorial sobre sí mismo. Denominaremos E* al conjunto Hom(E,K) de las formas lineales. Si E es un K-espacio vectorial por la derecha, entonces E* resulta ser un K-espacio vectorial por la izquierda, y viceversa. Podemos suponer que E es bilátero y entonces E* es también un espacio vectorial bilátero sobre K , al que se llama espacio dual de E. Sea B = {ui}iÎI una base de E y una forma j Î E* tal que j (ui) = ai Î K. Para todo vector x Î E, se tiene x = åxiu i donde xi = 0 salvo para un número finito de i Î I . Entonces



(Hom(E,F), + ·) espacio vectorial sobre K

iÎ I

Designamos por Hom(E,F) ó L(E,F) al conjunto de todas las aplicaciones lineales u homomorfismos entre dos espacios vectoriales E y F sobre el mismo cuerpo conmutativo K. Es fácil probar que la suma (usual) de aplicaciones lineales es otra aplicación lineal, al igual que ocurre con la aplicación a · f (con a Î K) si f es lineal . Por tanto es posible definir en Hom(E,F) dos leyes de composición una interna y otra externa respecto a las cuales Hom(E,F) queda dotado de estructura de K-espacio vectorial. j(x) = åxij(u i ) = åxa i i iÎ I

iÎ I

Lo anterior muestra que j es conocida si se conocen los ai.



Recíprocamente puede enunciarse la siguiente

PROPOSICIÓN: “Dada una base B = {ui}iÎI de E, para elementos ai Î K escogidos arbitrariamente (uno para cada i), existe una única forma j Î E*, tal que j(ui) = ai " i Î I”

9.1. Estructuras de Hom(E,F), End(E) y Aut(E) 9. DUALIDAD

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

224

Espacios vectoriales. Variedades lineales En efecto, la forma definida por j(x) = åxa i i es lineal y, puesto que ui = åd iju j, se tendrá j(ui) = åd ijj(u j ) = ai. iÎ I

jÎ I

jÎ I

TEOREMA: “Se verifica siempre que dim E = dim E*.

Ø Ø

Si j(u) = 0 " u Î E, entonces j º 0. Si j(u) = 0 " j Î E*, entonces u = 0E. Si dim E = n finita, para una base {u1, u2, ..., un} de E, existe una base dual ì1 si i = j {j1, j2, ..., jn} de E* tal que ji(uj) = dij = í î0 si i ¹ j

Demostración: Si definimos para cada i la forma ji tal que ji(uj) = d ij, denotemos por E0* al subespacio de E* generado por {ji}. Todo elemento j Î E0* es una combinación lineal j = åb iji con bi ¹ 0 sólo para un iÎ I

número finito de bi. Se cumple entonces j(uj) = åb iji (u j )= åb idij = bj iÎ I

iÎ I

lo que significa que los valores bj vienen determinados unívocamente como valores de j sobre los vectores básicos. Por consiguiente la expresión j = åb iji es única y {ji}es una base de E0*. Como iÎ I

hay tantos j i como ui se tiene dim E = dim E0*. E0* puede caracterizarse como el conjunto de formas lineales sobre E tales que j(ui) ¹ 0 , salvo para un número finito de valores de i.

Ø

Si dim E es finita, es evidente entonces que E0* contiene todas las formas lineales sobre E y por tanto E0* = E*, obteniendo dim E* = dim E.

Ø

Si dim E = ¥, entonces dim E0* = ¥, y ya que E0* Ì E* tendremos dim E* = ¥ = dim E, pero E0* no es el espacio E* entero.

Si u = å l iu i ¹ 0E, se tiene lj ¹ 0 para algún j. Para este j tendremos jj(u) = lj ¹ 0. Luego si j(u) = 0 iÎ I

" j Î E*, entonces u = 0E. Además, por definición de forma lineal sabemos que sólo la forma nula toma valor 0 para todo u Î E. Hemos probado, pues, el teorema.

10. APLICACIONES LINEALES Y MATRICES 10.1. Matriz asociada a una aplicación lineal Sean E y F dos espacios vectoriales de dimensión finita sobre un mismo cuerpo K conmutativo. Supongamos que dim E = n y dim F = m, y sean B = {e1, e2, ..., en} base de E B’ = {u1, u2, ..., um} base de F Una aplicación lineal entre E y F viene determinada de manera única si se conocen los vectores f(e1), f(e2), ..., f(en), que sabemos que constituyen un sistema generador de Im f. Si las coordenadas de f(ei) en la base B’ son (ai1, ai2, ..., aim) entonces: m

f(ei) = åa iju j (i = 1, 2, ..., n) j=1

TEMARIO DE MATEMÁTICAS. PRUEBA A

225

Volumen I. Matemáticas

226

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

La imagen de cualquier vector de E, está ahora unívocamente determinada, pues para cualquier x Î E, cuyas coordenadas en la base B son (x1, x2, ..., xn) tendrá como imagen

Como conclusión, si M n · n (K) es el conjunto de matrices cuadradas de orden n sobre K y Gln(K) el subconjunto de aquel formado por las matrices cuadradas inversibles de orden n sobre K, entonces: Hom(E,F) @ M n x m(K) (isomorfismo de K-espacios vectoriales) End (E) @ M n x n (K) (isomorfismo de K-álgebras) Aut(E) @ Gln(K) (isomorfismo de grupos) i=1

i=1

n

n

n

i=1

j=1

j=1

n

m

m

f(x) = f(åxe i i ) = åxi f(e i ) = åxi åa ij u j = å( åxia ij )u j i=1

Por tanto las coordenadas (y1, y2, ..., ym) de f(x) en la base B’ serán:

Podemos decir, por tanto que Hom(E,F) y el conjunto M n x m(K) de las matrices n x m sobre el cuerpo K se pueden poner en correspondencia biyectiva. Pero además se cumplen: 1. M B'B (f + g) = M B'B (f) + M B'B (g) (" f, g Î Hom(E,F)) 2. M B'B ( af) = aM B'B (f) (" f Î Hom(E,F), " a ÎK) B' B'' 3. M B'' B (g o f) = M B (f)× M B' (g) (" f Î Hom(E,F), " g Î Hom(F,G)) B 4. M B (i E ) = In (matriz unidad de orden n) 5. Si f: E ® F es isomorfismo, entonces M BB' (f –1 ) = M B'B (f)–1 n

yj = åxia ij

(j = 1, 2, ..., m)

i=1

Las relaciones anteriores constituyen un sistema lineal de ecuaciones que puede escribirse matricialmente, tomando vectores-fila x = (x1, x2, ..., xn), y = (y1, y2, ..., ym) æ ç a11 a12 ça a 22 (y , y , ..., y ) = (x , x , ..., x )ç 21 1 2 m 1 2 n ... ç ... ç è a n1 a n2

ö ... a1m ÷ ... a 2m ÷ ÷® y = x M(f) ... ... ÷ ÷ ... a nm ø

[10]

Observaciones: Si queremos especificar las bases elegidas en E y F para expresar la matriz de la aplicación lineal, utilizaremos la notación más precisa M B'B (f). Podemos manejar vectores-columna, en cuyo caso la relación [10] por trasposición nos llevaría a y t = Mt(f) xt, donde las columnas de M t(f) son los vectores transformados de la base B. Recíprocamente, dados los K-espacios vectorales E y F y sus bases respectivas B y B’, entonces para cualquier matriz M = (aij)n · m de elementos de K, existe una única aplicación lineal f Î Hom(E,F) tal que M(f) = M. Hemos de tener en cuenta que si dim E = n y dim F = m, es E @ Kn y F @ Km. Entonces f(x) = x M es una aplicación lineal de Kn en Km. Por medio de los isomorfismos E ® Kn y F ® Km llegamos a una aplicación lineal de E en F.

donde la matriz M(f), que denominamos matriz asociada al homomorfismo f referida a las bases B y B’ de E y F respectivamente, es una matriz n · m cuyas filas son las coordenadas de los vectores f(ei) en la base B’ = {uj}j = 1, 2, ..., .n. æ ö ç... f(e1 ) ...÷ ç... f(e2 ) ...÷ M(f) = (aij)n · m =ç ÷ ... ç ÷ ç ÷ è... f(en ) ...ø

Observaciones: Si queremos especificar las bases elegidas en E y F para expresar la matriz de la aplicación lineal, utilizaremos la notación más precisa M BB' (f). Podemos manejar vectores-columna, en cuyo caso la relación [10] por trasposición nos llevaría a y t = Mt(f) xt, donde las columnas de M t(f) son los vectores transformados de la base B. Recíprocamente, dados los K-espacios vectorales E y F y sus bases respectivas B y B’, entonces para cualquier matriz M = (aij)n · m de elementos de K, existe una única aplicación lineal f Î Hom(E,F) tal que M(f) = M. Hemos de tener en cuenta que si dim E = n y dim F = m, es E @ Kn y F @ Km. Entonces f(x) = x M es una aplicación lineal de Kn en Km. Por medio de los isomorfismos E ® Kn y F ® Km llegamos a una aplicación lineal de E en F. æ... f(e1 ) ...ö ç ÷ ç... f(e2 ) ...÷ M(f) = (aij)n · m =ç ÷ ... ç ÷ ç ÷ è... f(en ) ...ø

donde la matriz M(f), que denominamos matriz asociada al homomorfismo f referida a las bases B y B’ de E y F respectivamente, es una matriz n · m cuyas filas son las coordenadas de los vectores f(ei) en la base B’ = {uj}j = 1, 2, ..., .n. æa ç 11 a12 ça a 22 (y 1, y 2 , ..., y m ) = (x1, x2 , ..., xn )ç 21 ... ç ... ç a a è n1 n2

... a1m ö ÷ ... a 2m ÷ ÷® y = x M(f) ... ... ÷ ÷ ... a nm ø

Podemos decir, por tanto que Hom(E,F) y el conjunto M n x m(K) de las matrices n x m sobre el cuerpo K se pueden poner en correspondencia biyectiva. Pero además se cumplen: 1. M BB' (f + g) = M BB' (f) + M BB' (g) (" f, g Î Hom(E,F)) 2. M BB' ( af) = aM BB' (f) (" f Î Hom(E,F), " a ÎK) 3. M BB'' (g o f) = M BB' (f)× M B'B'' (g) (" f Î Hom(E,F), " g Î Hom(F,G)) 4. M BB (i E ) = In (matriz unidad de orden n) 5. Si f: E ® F es isomorfismo, entonces M B'B (f –1 ) = M BB' (f)–1 [10]

Las relaciones anteriores constituyen un sistema lineal de ecuaciones que puede escribirse matricialmente, tomando vectores-fila x = (x1, x2, ..., xn), y = (y1, y2, ..., ym) i=1

yj = åxia ij

(j = 1, 2, ..., m)

n

Por tanto las coordenadas (y1, y2, ..., ym) de f(x) en la base B’ serán:

Como conclusión, si M n · n (K) es el conjunto de matrices cuadradas de orden n sobre K y Gln(K) el subconjunto de aquel formado por las matrices cuadradas inversibles de orden n sobre K, entonces: Hom(E,F) @ M n x m(K) (isomorfismo de K-espacios vectoriales) End (E) @ M n x n (K) (isomorfismo de K-álgebras) Aut(E) @ Gln(K) (isomorfismo de grupos) n

n

n

m

m

n

i=1

i=1

i=1

j=1

j=1

i=1

f(x) = f(åxe i i ) = åxi f(e i ) = åxi åa ij u j = å( åxia ij )u j

La imagen de cualquier vector de E, está ahora unívocamente determinada, pues para cualquier x Î E, cuyas coordenadas en la base B son (x1, x2, ..., xn) tendrá como imagen 226

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Espacios vectoriales. Variedades lineales Dichos isomorfismos están lejos de ser canónicos, pues dependen de la elección de las bases. Un cambio de base en un espacio vectorial E puede interpretarse como el automorfismo iE, que expresaremos matricialmente tomando una base B1 inicial y una base final B2, es decir iE: EB1 ® EB2 . Entonces la matriz de cambio de base de B1 a B2 es C = M BB12 (i E ). El cambio es reversible, es decir, la matriz es inversible siendo C-1 = M BB12 (i E ). Entonces, si efectuamos en E y F sendos cambios de base , la matriz de la aplicación lineal f se verá “afectada” en la forma que se indica en el diagrama siguiente: f

EB

Figura 4.

1

FB

2

iE

iF

M B'B'12 (f) = M B'B'12 (i F o f o i E ) = M BB'11 (i E )× M BB12 (f)× M BB'22 (i F )

f E B'

F B'

1

2

En caso particular de un endomorfismo de E , tendremos M B'B' (f) = C–1× M BB (f)× C, donde C es la matriz de cambio de la base B a la base B’ de E.

10.2. Ecuaciones del núcleo y de la imagen Si expresamos matricialmente la aplicación lineal en la forma f(x) = x M(f) el núcleo Ker f viene dado por el conjunto de soluciones de f(x) = 0; esto es, las soluciones del sistema lineal homogéneo: ì a11x1 + ï ïa 21x1 + í ï ... ï îa m1x1 +

a12x2 + ... + a1nxn a 22x2 + ... + a 2nxn ... ... ... a m2x2 + ... + a mnxn

= 0 = 0 ... = 0

Como sabemos, si rango(M) = r, el espacio de soluciones del SLH es de dimensión n-r. En particular, cuando rango(M) = n se tendrá dim (Ker f) = 0, de donde Ker f = {0} y entonces es un f monomorfismo.. Asimismo, el espacio Imf es el generado por lo vectores fila de la matriz M, por lo tanto su dimensión es precisamente rango(M) = r. Si fuese r = m, entonces dim (Im f) = dim F, de donde Im f = F y f sería un epimorfismo. Si r < m habría en M un menor Mr de orden r no nulo. El subespacio Im f está formado por los vectores (y1 y2 ... ym) para los cuales el sistema lineal ì a11x1 + ï ïa 21x1 + í ï ... ï îa m1x1 +

a12x2 + ... + a1nxn a 22x2 + ... + a 2nxn ... ... ... a m2x2 + ... + a mnxn

= y1 = y2 ... = ym

es compatible. Es decir, para los cuales la matriz partida (M | y) también tiene de rango r. Las ecuaciones cartesianas de Im f pueden obtenerse igualando a 0 todos los menores de orden r+1 obtenidos orlando Mr con elementos del vector genérico de términos independientes.

10.3. Rango de una aplicación lineal Se define el rango de una aplicación lineal como la dimensión del subespacio Imf que como vimos coincide con el rango de la matriz asociada M. Es decir: Rango(f) = dim (Im f) = Rango M(f) = r TEMARIO DE MATEMÁTICAS. PRUEBA A

227

Volumen I. Matemáticas

228

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Asimismo, se denomina nulidad de la aplicación lineal como la dimensión del núcleo: Nul (f) = dim (Ker f) = n – r La relación ya conocida dim (Ker f) + dim (Im f) = dim E, se traduce en Nul (f) + Rango (f) = n que se conoce como ecuación del rango para una aplicación lineal. Si f Î Hom(E,F) se cumplen las equivalencias: f monomorfismo Û Rango(f) = dim E f epimorfismo Û Rango(f) = dim F

que se conoce como ecuación del rango para una aplicación lineal. Si f Î Hom(E,F) se cumplen las equivalencias: f monomorfismo Û Rango(f) = dim E f epimorfismo Û Rango(f) = dim F La relación ya conocida dim (Ker f) + dim (Im f) = dim E, se traduce en Nul (f) + Rango (f) = n Asimismo, se denomina nulidad de la aplicación lineal como la dimensión del núcleo: Nul (f) = dim (Ker f) = n – r CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

228

TEMA

13 Polinomios. Operaciones. Fórmula de Newton. Divisibilidad de polinomios. Fracciones algebraicas

Emilio M. Pina Coronado

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

230

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN 1.1. Terminología

2.

OPERACIONES CON POLINOMIOS 2.1. Suma de polinomios 2.1.1. Propiedades de la suma de polinomios 2.2. Multiplicación de polinomios por un escalar 2.2.1. Propiedades del producto de un escalar por un polinomio 2.3. Multiplicación de polinomios 2.3.1. Propiedades del producto de polinomios 2.4. Fórmula de Newton

3.

DIVISIBILIDAD DE POLINOMIOS DESDE UNA PERSPECTIVA CLÁSICA 3.1. Propiedades de la divisibilidad de polinomios

4.

DIVISIBILIDAD DE POLINOMIOS DESDE LA PERSPECTIVA DEL MÉTODO DE LOS IDEALES 4.1. Definición de divisibilidad

5.

MÁXIMO COMÚN DIVISOR DE POLINOMIOS 5.1. Notas características sobre el máximo común divisor 5.2. Propiedades del máximo común divisor

FRACCIONES ALGEBRAICAS 9.1. Propiedades de las fracciones algebraicas

9.

6.

MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS 6.1. Polinomios primos entre sí 6.2. Teorema de Euclides 6.3. Definición de mínimo común múltiplo de polinomios 6.4. Notas características sobre el mínimo común múltiplo 6.5. Propiedades del mínimo común múltiplo

DESCOMPOSICIÓN FACTORIAL DE POLINOMIOS 8.1. Raíces de un polinomio 8.2. Raíces múltiples de un polinomio

8.

FUNCIONES RACIONALES

12.

DESCOMPOSICIÓN DE UN POLINOMIO EN FRACCIONES 11.1. Proposiciones sobre la descomposición de polinomios 11.2. Corolarios

11.

OPERACIONES CON FRACCIONES ALGEBRAICAS 10.1. Suma de fracciones algebraicas 10.2. Propiedades de la suma de fracciones algebraicas 10.3. Producto de fracciones algebraicas 10.4. Propiedades del producto de fracciones algebraicas

10.

CÁLCULO DEL MÁXIMO COMÚN DIVISOR Y MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS EMPLEANDO EL ALGORITMO DE EUCLIDES

7.

7.

CÁLCULO DEL MÁXIMO COMÚN DIVISOR Y MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS EMPLEANDO EL ALGORITMO DE EUCLIDES

8.

DESCOMPOSICIÓN FACTORIAL DE POLINOMIOS 8.1. Raíces de un polinomio 8.2. Raíces múltiples de un polinomio

MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS 6.1. Polinomios primos entre sí 6.2. Teorema de Euclides 6.3. Definición de mínimo común múltiplo de polinomios 6.4. Notas características sobre el mínimo común múltiplo 6.5. Propiedades del mínimo común múltiplo

6.

9.

FRACCIONES ALGEBRAICAS 9.1. Propiedades de las fracciones algebraicas

MÁXIMO COMÚN DIVISOR DE POLINOMIOS 5.1. Notas características sobre el máximo común divisor 5.2. Propiedades del máximo común divisor

5.

DIVISIBILIDAD DE POLINOMIOS DESDE LA PERSPECTIVA DEL MÉTODO DE LOS IDEALES 4.1. Definición de divisibilidad

4.

DIVISIBILIDAD DE POLINOMIOS DESDE UNA PERSPECTIVA CLÁSICA 3.1. Propiedades de la divisibilidad de polinomios

3.

OPERACIONES CON FRACCIONES ALGEBRAICAS 10.1. Suma de fracciones algebraicas 10.2. Propiedades de la suma de fracciones algebraicas 10.3. Producto de fracciones algebraicas 10.4. Propiedades del producto de fracciones algebraicas

2.4.

10.

OPERACIONES CON POLINOMIOS 2.1. Suma de polinomios 2.1.1. Propiedades de la suma de polinomios 2.2. Multiplicación de polinomios por un escalar 2.2.1. Propiedades del producto de un escalar por un polinomio 2.3. Multiplicación de polinomios 2.3.1. Propiedades del producto de polinomios Fórmula de Newton

2.

INTRODUCCIÓN 1.1. Terminología

1.

11.

DESCOMPOSICIÓN DE UN POLINOMIO EN FRACCIONES 11.1. Proposiciones sobre la descomposición de polinomios 11.2. Corolarios

12.

FUNCIONES RACIONALES

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

230

Polinomios. Operaciones. Fórmula de Newton

1. INTRODUCCIÓN Podemos utilizar una definición operativa de aplicación como aquella correspondencia entre dos conjuntos en la que a cada elemento del conjunto inicial le asignábamos un solo elemento del conjunto final; si ahora tenemos que tanto el conjunto inicial como el final son conjuntos numéricos a esta aplicación le damos el nombre de función. Consideremos que tanto el conjunto inicial como el final son el conjunto de los números racionales, Q, es decir f: Q ® Q, sobre el que definimos las leyes de composición adición y multiplicación, en los términos usuales, (Q, +, ·), donde (Q, +) posee la estructura algebraica de grupo aditivo abeliano, y (Q, ·) satisface las propiedades asociativa, existencia de elemento neutro y conmutativa, verificándose además la propiedad distributiva de la multiplicación con respecto a la suma. Diremos que f: Q ® Q es una función polinómica cuando transforma un número racional en otro mediante sumas, productos y potencias de exponente natural. Diferenciar entre los conceptos de función polinómica, que entenderemos como una aplicación con las características antes enunciadas, y polinomio, que es la expresión algebraica de la función polinómica. Si designamos por x la variable que puede sustituirse por cualquier número racional (indeterminada), podemos escribir: f(x) = a0 + a1x1 + a2x2 + … + anxn + 0xn+1 + 0xn+2 + …, a este tipo de expresiones se la denomina polinomios en la indeterminada x y con coeficientes en un anillo A (los ai se denominan coeficientes del polinomio y constituyen una sucesión de elementos de A que tiene todos sus términos nulos a partir de uno determinado), que se suelen representar por A(x), y podemos escribir A = (a0, a1, a2, ..., an) teniendo en cuenta que cada uno de los términos de esta expresión es un término del polinomio y que el exponente de la indeterminada es el grado del término. Hay que tener en cuenta que con dar al polinomio la función polinómica no queda determinada, esto sólo se produce cuando quedan perfectamente definidos los conjuntos sobre los que actúa. Utilizaremos polinomios de Q(x), ya que Q es un cuerpo y por lo tanto reúne todas las características de los anillos.

1.1. Terminología – – –

Grado de un polinomio: es el mayor de los grados de los términos con coeficiente no nulos.



Polinomio completo de grado n: es aquel que tiene todos sus coeficientes hasta el grado n no nulos.



Igualdad de polinomios: Dos polinomios A(x) y B(x) Î Q(x) del mismo grado se dice que son iguales si y sólo si ai = bi, " i Î N.

Polinomio nulo: aquel que tiene todos sus coeficientes iguales a cero. Polinomio ordenado creciente o decrecientemente: aquel en que las potencias de la indeterminada están ordenadas creciente o decrecientemente, según la ordenación interna de N.

2. OPERACIONES CON POLINOMIOS 2.1. Suma de polinomios Dados dos polinomios A = (a0, a1, a2, ..., an) y B = (b0, b1, b2, ..., bm) Î Q(x), la suma de ambos polinomios A(x) + B(x) ® C(x) Î Q(x) de modo que C = A + B = (a0 + b0, a1 + b1, a2 + b2, ...). En la suma de polinomios se cumple que grad(A + B) £ Max{grad(A), grad(B)}. Probémoslo: Al ser los polinomios de distinto grado, n ¹ m, supongamos que n > m, luego los bi = 0 con i Î [m+1, n] y, evidentemente, los ci = ai + bi = 0, i > n, luego, como máximo, el grado del polinomio C será n, el mayor de los grados de los polinomios sumandos.

TEMARIO DE MATEMÁTICAS. PRUEBA A

231

Volumen I. Matemáticas

232

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

grad(A · B) = grad(A) + grad(B)

2.1.1. Propiedades de la suma de polinomios

En el producto de polinomios se comprueba que el grado del polinomio producto es igual a la suma de los grados de los polinomios multiplicando y multiplicador. Así, dados dos polinomios A = (a0, a1, a2, ..., an) y B = (b0, b1, b2, ..., bm) Î Q(x) de distinto grado, n ¹ m, supongamos que n > m, atendiendo a la definición de ci antes expuesta, existirá un término de grado m + n, que será el grado del polinomio producto.

– –

Interna: La suma de dos polinomios da como resultado un y sólo un polinomio. Asociativa: " A, B, C Î Q(x) ® A + (B + C) = (A + B) + C, ya que al ser los ai, bi, ci Î Q ® ai + (bi + ci) = (ai + bi) + ci k = i+j

åa × b

Neutro: El elemento neutro para la adición es el polinomio nulo (O), de coeficientes (0, 0, 0, ...). ck =

i

j



" A Î Q(x), $ O Î Q(x) | A + O = O + A = A

Dados dos polinomios A = (a0, a1, a2, ..., an) y B = (b0, b1, b2, ..., bm) Î Q(x) el producto de ambos polinomios A(x) · B(x) ® C(x) Î Q(x) de modo que



Simétrico (opuesto): Para cada " A Î Q(x), $ A’ Î Q(x) | A + A’ = A’ + A = 0, evidentemente A’ = –A = –(a0, a1, a2, ..., an) = (–a0, –a1, –a2, ..., –an).

2.3. Multiplicación de polinomios



Conmutativa: " A, B Î Q(x) ® A + B = B + A, ya que al ser ai, bi Î Q entonces ai + bi = bi + ai

A la luz de las operaciones anteriores se prueba lo que antes enunciamos, pudiendo escribir que el conjunto de los polinomios tiene estructura de grupo aditivo conmutativo. Fijándonos en la propiedad que expone la naturaleza del opuesto, podemos definir la sustracción de polinomios como la suma del polinomio minuendo con el opuesto del polinomio sustraendo.

El conjunto de los polinomios con las operaciones suma y producto del polinomio por un escalar tiene estructura de espacio vectorial sobre Q. " A Î Q(x) Ù 1 Î Q ® 1 · A = A.

" A Î Q(x) Ù " l, m Î Q ® l (mA) = (l · m) · A.

" A, B Î Q(x) Ù " l Î Q ® l · (A + B) = lA · lB. " A Î Q(x) Ù " l, m Î Q ® (l + m) · A = lA + mA.

2.2. Multiplicación de un polinomio por un escalar

– – – –

" A, B Î Q(x) ® A – B = A + (–B) Î Q(x)

Dado el polinomio A(x) Î Q(x) y un escalar l Î Q, se establece la ley de composición externa l · A(x) ® ® Q(x) definida como:

2.2.1. Propiedades del producto de un escalar por un polinomio " A Î Q(x) Ù " l Î Q ® l · A = (la0, la1, la2, ...)

" A Î Q(x) Ù " l Î Q ® l · A = (la0, la1, la2, ...)

Dado el polinomio A(x) Î Q(x) y un escalar l Î Q, se establece la ley de composición externa l · A(x) ® ® Q(x) definida como:

2.2.1. Propiedades del producto de un escalar por un polinomio

2.2. Multiplicación de un polinomio por un escalar

" A Î Q(x) Ù " l, m Î Q ® (l + m) · A = lA + mA. " A, B Î Q(x) Ù " l Î Q ® l · (A + B) = lA · lB.

" A, B Î Q(x) ® A – B = A + (–B) Î Q(x)

– – – –

" A Î Q(x) Ù " l, m Î Q ® l (mA) = (l · m) · A.

A la luz de las operaciones anteriores se prueba lo que antes enunciamos, pudiendo escribir que el conjunto de los polinomios tiene estructura de grupo aditivo conmutativo. Fijándonos en la propiedad que expone la naturaleza del opuesto, podemos definir la sustracción de polinomios como la suma del polinomio minuendo con el opuesto del polinomio sustraendo. " A Î Q(x) Ù 1 Î Q ® 1 · A = A.

El conjunto de los polinomios con las operaciones suma y producto del polinomio por un escalar tiene estructura de espacio vectorial sobre Q.



Conmutativa: " A, B Î Q(x) ® A + B = B + A, ya que al ser ai, bi Î Q entonces ai + bi = bi + ai

2.3. Multiplicación de polinomios

A’ = –A = –(a0, a1, a2, ..., an) = (–a0, –a1, –a2, ..., –an).



Simétrico (opuesto): Para cada " A Î Q(x), $ A’ Î Q(x) | A + A’ = A’ + A = 0, evidentemente

Dados dos polinomios A = (a0, a1, a2, ..., an) y B = (b0, b1, b2, ..., bm) Î Q(x) el producto de ambos polinomios A(x) · B(x) ® C(x) Î Q(x) de modo que " A Î Q(x), $ O Î Q(x) | A + O = O + A = A

åa × b

Neutro: El elemento neutro para la adición es el polinomio nulo (O), de coeficientes (0, 0, 0, ...). i

j



ck =

k = i+j

ai, bi, ci Î Q ® ai + (bi + ci) = (ai + bi) + ci

En el producto de polinomios se comprueba que el grado del polinomio producto es igual a la suma de los grados de los polinomios multiplicando y multiplicador. Así, dados dos polinomios A = (a0, a1, a2, ..., an) y B = (b0, b1, b2, ..., bm) Î Q(x) de distinto grado, n ¹ m, supongamos que n > m, atendiendo a la definición de ci antes expuesta, existirá un término de grado m + n, que será el grado del polinomio producto.

– –

Asociativa: " A, B, C Î Q(x) ® A + (B + C) = (A + B) + C, ya que al ser los

Interna: La suma de dos polinomios da como resultado un y sólo un polinomio.

2.1.1. Propiedades de la suma de polinomios

grad(A · B) = grad(A) + grad(B)

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

232

Polinomios. Operaciones. Fórmula de Newton

2.3.1. Propiedades del producto de polinomios –

Asociativa: " A, B, C Î Q(x) ® A · (B · C) = (A · B) · C Vamos a demostrarla: Sea A = (a0, a1, a2, ..., an), B = (b0, b1, b2, ..., bm) y C = (c0, c1, c2, ..., ct) Î Q(x) y teniendo en cuenta que el producto en Q es distributivo respecto de la suma y asociativo, podemos escribir: A · (B · C) = ai ·

åb ×c j

k

m = j+k

=

i

(A · B) · C = ( åa i × b j) · ck = p = i+j

– –



åa × b ×c j

k

n = i+j+k

åa × b ×c i

j

k

n = i+j+k

Conmutativa: " A, B Î Q(x) ® A · B = B · A Neutro: El polinomio E = (1, 0, 0, ...) es el elemento neutro (unidad) para el producto de polinomios y se verifica que " A Î Q(x), $ E Î Q(x) | A · E = E · A = a E · A = (1 · a0, 1 · a1 + 0 · a0, ..., 1 · an + 0 · an–1 + … + 0 · a0, ...) = = (a0, a1, a2, ..., an, 0, 0, ...) = A Distributiva del producto respecto de la suma de polinomios: Para todo A = (a0, a1, a2, ..., an), B = (b0, b1, b2, ..., bm) y C = (c0, c1, c2, ..., ct) pertenecientes a Q(x) se verifica que A · (B + C) = = A · B + A · C. Para demostrarlo, designemos el polinomio producto A · B = (p0, p1, p2, ..., pk) y el polinomio producto A · C = (q0, q1, q2, ..., qk) y al polinomio producto de la suma como A · (B + C) = = (r0, r1, r2, ..., rk), y teniendo en cuenta que: pk = a0bk + a1bk–1 + … + akb0 qk = a0ck + a1ck–1 + … + akc0 rk = a0(bk + ck) + a1(bk–1 + ck–1) + … + ak(b0 + c0) y como los ai, bi, ci Î Q entonces rk = pk + qk Þ A · (B + C) = A · B + A · C.

Habiendo visto las propiedades anteriores podemos enunciar que el conjunto Q(x) con las operaciones de suma y producto tiene estructura algebraica de anillo conmutativo con elemento unitario. Por otra parte, si comprobamos que Q(x) no tiene divisores de cero podremos afirmar que es un dominio de integridad y esto se cumple siempre que los polinomios que utilicemos sean no nulos.

2.4. Fórmula de Newton La utilización de la fórmula de Newton nos permite el cálculo de las potencias n - ésimas de un binomio. Entendiendo por potencia n - ésima del binomio el producto de n veces el binomio por sí mismo. " a, b Î Q Ù " n Î N* se verifica que: æn ö æn ö æn ö æn ö (a + b)n =ç ÷a nb 0 +ç ÷a n–1b 0 +...+ç ÷a n– kb k +...+ç ÷a 0b k 0 1 k è ø è ø è ø èn ø Señalar que aunque la expresión anterior recibe el nombre de fórmula de Newton se debe al matemático italiano Tartaglia (s. XVI), aunque fue Newton (s. XVII) quien la generalizó para exponentes no enteros. Demostremos la fórmula de Newton, para ello procederemos por inducción completa: æ 1ö æ1ö Si n = 1, entonces (a + b)1 =ç ÷a 1b 0 +ç ÷a 0b1 = a + b è 0ø è1ø æ 2ö æ 2ö æ 2ö Si n = 2, entonces: (a + b)2 = (a + b) · (a + b) =ç ÷a 2b 0 +ç ÷a1b1 +ç ÷a 0b 2 = a2 + 2ab + b2 è 0ø è 1ø è 2ø TEMARIO DE MATEMÁTICAS. PRUEBA A

233

Volumen I. Matemáticas

234

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Llamamos polinomios equivalentes en relación a la divisibilidad a todos aquellos polinomios que pueden obtenerse a partir de uno dado multiplicándolos por elementos de Q* = Q – {0}. æ 3ö æ 3ö æ 3ö æ 3ö Si n = 3, entonces: (a + b)3 =ç ÷a 3b 0 +ç ÷a 2b1 +ç ÷a1b 2 +ç ÷a 0b 3 è 0ø è 1ø è 2ø è 3ø

Si A |B Þ $ M Î Q(x)|A × M = Bü ý Þ A ×M × N = C Þ A |C Si B|C Þ $ N Î Q(x) |N× B = C þ

Transitiva: Sean los polinomios A, B, C Î Q(x), si A | B Ù B | C Þ A | C. Probémoslo:

Lo suponemos cierto hasta k = n – 1, luego:

Reflexiva: " A Î Q(x) ® A | A, ya que $ 1 Î Q(x) | A · 1 = A.

æ n – 1ö n–1 0 æ n – 1ö n– 2 1 æ n – 1ö 0 n–1 ÷a b +ç ÷a b +...+ç ÷a b (a + b)n–1 =ç è 0 ø è 1 ø è n – 1ø

– –

éæ 2ö æ 2ö æ 2ö ù (a + b)3 = (a + b)2 · (a + b) =êç ÷a 2b 0 +ç ÷a1b1 +ç ÷a 0b 2 ú· (a + b) ëè 0ø è 1ø è 2ø û

Sean dos polinomios A, B Î Q(x), diremos que el polinomio A divide al polinomio B, (también que B es un múltiplo de A o que A es un divisor de B), y lo representaremos como A | B, si $ C Î Q(x) | A · C = B. Esto define lo que se denomina relación de divisibilidad, y es una relación que verifica las propiedades reflexiva y transitiva, por lo que se denomina relación de preorden. Enunciemos esas propiedades: y ahora lo comprobaremos para el siguiente k = n

éæ n – 1ö n–1 0 æ n – 1ö n– 2 1 æ n – 1ö 0 n–1ù ÷a b +ç ÷a b +...+ç ÷a b ú· (a + b) = (a + b)n =êç ëè 0 ø è 1 ø è n – 1ø û

3. DIVISIBILIDAD DE POLINOMIOS DESDE UNA PERSPECTIVA CLÁSICA æ n – 1ö n–1 0 æ n – 1ö n– 2 1 æ n – 1ö 0 n–1 ÷a b (a + b) +ç ÷a b (a + b)+...+ç ÷a b (a + b) = =ç è 0 ø è 1 ø è n – 1ø n æ ö n (a + b)n = åç ÷a n– kb k k k = 0è ø

æ n – 1ö n æ n – 1ö n–1 æ n – 1ö n–1 æ n – 1ö n– 2 2 æ n – 1ö 0 n ÷a b +ç ÷a b +...+ç ÷a b +ç ÷a b +...+ç ÷a b =ç è 0 ø è 0 ø è 1 ø è 1 ø è n – 1ø

y podríamos escribir que:

æn ö æn ö æn ö (a + b)n =ç ÷a nb 0 +ç ÷a n–1b1 +...+ç ÷a 0b n è 0ø è 1ø èn ø

y si ahora tenemos en cuenta la fórmula de Stiefeld

aplicándolo a la expresión anterior nos quedaría como:

aplicándolo a la expresión anterior nos quedaría como:

æ n – 1ö æ n – 1ö æ n ö ç ÷+ç ÷ =ç ÷ è k – 1ø è k ø è k ø

æ n – 1ö æ n ö æ n – 1ö æ n ö ç ÷ =ç ÷ =ç ÷ =ç ÷= 1 è 0 ø è 0 ø è n – 1ø è n ø

y que se verifica que

y que se verifica que

æ n – 1ö æ n ö æ n – 1ö æ n ö ç ÷ =ç ÷ =ç ÷ =ç ÷= 1 è 0 ø è 0 ø è n – 1ø è n ø

æ n – 1ö æ n – 1ö æ n ö ç ÷+ç ÷ =ç ÷ è k – 1ø è k ø è k ø

æn ö æn ö æn ö (a + b)n =ç ÷a nb 0 +ç ÷a n–1b1 +...+ç ÷a 0b n è 0ø è 1ø èn ø

y si ahora tenemos en cuenta la fórmula de Stiefeld

æ ö æ ö æ ö æ ö æ n – 1ö 0 n n – 1 n – 1 n – 1 n – 1 ÷a nb +ç ÷a n–1b +...+ç ÷a n–1b +ç ÷a n– 2b 2 +...+ç ÷a b =ç è 0 ø è 0 ø è 1 ø è 1 ø è n – 1ø

y podríamos escribir que:

n æn ö (a + b)n = åç ÷a n– kb k k k = 0è ø

æ n – 1ö æ n – 1ö æ n – 1ö 0 n–1 ÷a n–1b 0 (a + b) +ç ÷a n– 2b1(a + b)+...+ç ÷a b (a + b) = =ç è 0 ø è 1 ø è n – 1ø éæ n – 1ö æ n – 1ö æ n – 1ö ù ÷a n–1b 0 +ç ÷a n– 2b1+...+ç ÷a 0b n–1ú· (a + b) = (a + b)n =êç ëè 0 ø è 1 ø è n – 1ø û

3. DIVISIBILIDAD DE POLINOMIOS DESDE UNA PERSPECTIVA CLÁSICA Sean dos polinomios A, B Î Q(x), diremos que el polinomio A divide al polinomio B, (también que B es un múltiplo de A o que A es un divisor de B), y lo representaremos como A | B, si $ C Î Q(x) | A · C = B. Esto define lo que se denomina relación de divisibilidad, y es una relación que verifica las propiedades reflexiva y transitiva, por lo que se denomina relación de preorden. Enunciemos esas propiedades: y ahora lo comprobaremos para el siguiente k = n

æ ö æ ö æ n – 1ö 0 n–1 n – 1 n – 1 ÷a n–1b 0 +ç ÷a n– 2b1+...+ç ÷a b (a + b)n–1 =ç è 0 ø è 1 ø è n – 1ø

Reflexiva: " A Î Q(x) ® A | A, ya que $ 1 Î Q(x) | A · 1 = A.

Lo suponemos cierto hasta k = n – 1, luego:

Transitiva: Sean los polinomios A, B, C Î Q(x), si A | B Ù B | C Þ A | C. Probémoslo: éæ 2ö æ 2ö æ 2ö ù (a + b)3 = (a + b)2 · (a + b) =êç ÷a 2b 0 +ç ÷a1b1 +ç ÷a 0b 2 ú· (a + b) ëè 0ø è 1ø è 2ø û

– –

Si A |B Þ $ M Î Q(x)|A × M = Bü ý Þ A ×M × N = C Þ A |C Si B|C Þ $ N Î Q(x) |N× B = C þ

æ 3ö æ 3ö æ 3ö æ 3ö Si n = 3, entonces: (a + b)3 =ç ÷a 3b 0 +ç ÷a 2b1 +ç ÷a1b 2 +ç ÷a 0b 3 è 0ø è 1ø è 2ø è 3ø

Llamamos polinomios equivalentes en relación a la divisibilidad a todos aquellos polinomios que pueden obtenerse a partir de uno dado multiplicándolos por elementos de Q* = Q – {0}. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

234

Polinomios. Operaciones. Fórmula de Newton Cuando dados dos polinomios A, B Î Q(x) verifican que A | B y que B | A decimos que estos polinomios están asociados, lo que se representa por A Q* B, y esto define una relación de equivalencia cuyas propiedades serían:

– – –

Reflexiva: " A Î Q(x) ® A Q* A, ya que $ 1 Î Q* | A · 1 = A. Simétrica: Dados A, B Î Q(x) si A Q* B Þ B Q* A, ya que $ k Î Q* tal que si k · A = B Þ A = = k–1 · B. Transitiva: Dados los polinomios A, B, C Î Q(x), si A Q* B Ù B Q* C Þ A Q* C. A Q * B Þ $ m Î Q* |A × m = Bü ý Þ m× n × A = C Þ A Q * C BQ * C Þ $ n Î Q* |B× n = C þ

A los elementos del conjunto cociente Q(x)/Q* se les denomina polinomios asociados y se denotan por A, B, C,...y así una determinada clase A está formada por el polinomio A y todos sus polinomios asociados. Llamamos representante canónico de una clase A al polinomio A0 caracterizado porque el coeficiente an = 1, y este polinomio A0 siempre existe, pues lo podemos obtener dividiendo los coeficientes del polinomio entre an ¹ 0.

3.1. Propiedades de la divisibilidad de polinomios 1ª.

Si A | B y A | C entonces A | (B + C) y A | [B + (–C)]

2ª.

Si A | B entonces A | B · C, " C Î Q(x)

3ª.

Si A | B entonces A | Bn, " n Î N*

4ª.

Si A | B entonces grad(A) £ grad(B)

5ª.

n | A, " n Î Q*

4. DIVISIBILIDAD DE POLINOMIOS DESDE LA PERSPECTIVA DEL MÉTODO DE LOS IDEALES Acudiendo a la definición de ideal, vista anteriormente, podemos afirmar que todo ideal del anillo de los polinomios, Q(x), en una indeterminada, x, sobre Q, es un ideal principal. Demostrémoslo: Si I es un ideal de Q(x), entonces estará formado por múltiplos de un polinomio único, por lo que si B Î I, ambos no nulos, de modo que B tiene un grado tal que es el mínimo de los grados posibles del polinomio I, y si tomamos un cierto polinomio A Î I y efectuamos la división de A entre B obtendremos un polinomio cociente C y un polinomio resto R, verificándose, como es habitual, que A = B · C + R y despejando R tendremos que R = A – B · C. Como hemos definido A, B Î I Þ B · C Î I Þ A – B · C Î I Þ R Î I. También sabemos que grad(R) < grad(B), y como habíamos definido que el grado de B es el mínimo de los posibles esto nos lleva a que el polinomio R = 0, luego podemos escribir que A = B · C, con lo que todo polinomio I es múltiplo de B. Así, el ideal I = B está formado por un polinomio, y en consecuencia cualquier polinomio de I que tenga el mismo grado que B es un múltiplo de B, l · B, con l Î B.

4.1. Definición de divisibilidad " A, B Î Q(x) Ù A, B ¹ 0 decimos que A divide a B cuando B Ì A. Demostrémoslo: Si A | B Þ $ C Î Q(x) tal que A · C = B Þ B Î A Þ B Ì A. TEMARIO DE MATEMÁTICAS. PRUEBA A

235

Volumen I. Matemáticas

236

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Todo múltiplo de un polinomio es múltiplo de su mínimo común múltiplo. Si C Î Q(x) es un múltiplo de A, B Î Q(x), podemos escribir que A | C y B | C, entonces C Ì A Ù Ù C Ì B Þ C Ì A Ç B = M Þ M | C.

5. MÁXIMO COMÚN DIVISOR DE POLINOMIOS

Sean dos polinomios A, B Î Q(x), llamamos ideal máximo común divisor de A y B, al ideal suma D = A + B. Llamaremos máximo común divisor a la base del ideal D, única.



El mínimo común múltiplo de varios polinomios es múltiplo de cada uno de ellos. Si m.c.m. (A,B) = M Þ A Ç B = M MÌAÙMÌBÞA|MÙB|M

5.1. Notas características sobre el máximo común divisor – El máximo común divisor de varios polinomios es divisor de cada uno de ellos.

6.4. Notas características sobre el mínimo común múltiplo –

Si D = m.c.d. (A,B) Þ D = A + B, entonces: A Ì D Ù B Ì D Þ D | A Ù D | B



Cualquier divisor de dos polinomios lo es también de su máximo común divisor. Sean dos polinomios A, B Î Q(x), si existe un tercer polinomio C Î Q(x) tal que este polinomio divide a los anteriores entonces el que C | A Ù C | B Þ A Ì C Ù B Ì C Þ D = A + B Ì C Þ C | D



Relación de Bezout. Si D = m.c.d. (A,B), $ M, N Î Q(x) tales que M · A + N · B = D

Sean dos polinomios del anillo principal, A, B Î Q(x), llamaremos ideal mínimo común de A y B al ideal M = A Ç B, y llamamos mínimo común múltiplo de A y B a la base de dicho ideal.

6.3. Definición de mínimo común múltiplo de polinomios

Sean los polinomios A, B, C Î Q(x) si A | B · C y el m.c.d. (A, B) = 1, es decir, A y B son primos entre sí, entonces A | C. Vamos a demostrarlo: Partiremos de la relación de Bezout, si D = m.c.d. (A,B), $ M, N Î Q(x) tales que M · A + N · B = D, como en nuestro caso el m.c.d. (A, B) = 1, podemos escribir que M · A + N · B = 1, y si multiplicamos ambos miembros de la ecuación por el polinomio C tendremos: M · A · C + N · B · C = C y como A | M · A · C Ù A | N · B · C entonces diremos que A | (M · A · C + N · B · C) Þ A | C.

5.2. Propiedades del máximo común divisor

1ª. 2ª. 3ª.

Sean A, B Î Q(x), si D = m.c.d. (A,B), y sea C Î Q(x) y C ¹ 0 entonces el m.c.d. (A · C, B · C) = D · C Sean A, B Î Q(x), si D = m.c.d. (A,B) entonces m.c.d. (A/D, B/D) = 1 Sean A, B Î Q(x), si A | B Þ m.c.d. (A, B) = A.

6.2. Teorema de Euclides 6. MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS 6.1. Polinomios primos entre sí

Sean dos polinomios A, B Î Q(x), diremos que A y B son primos entre sí, si y sólo si, m.c.d. (A, B) = 1, lo que nos lleva a firmar que los divisores comunes de A y B son unidades de Q. Como veremos más adelante, podremos decir que dos polinomios son primos entre sí cuando su m.c.m. (A, B) = A · B.

Sean dos polinomios A, B Î Q(x), diremos que A y B son primos entre sí, si y sólo si, m.c.d. (A, B) = 1, lo que nos lleva a firmar que los divisores comunes de A y B son unidades de Q. Como veremos más adelante, podremos decir que dos polinomios son primos entre sí cuando su m.c.m. (A, B) = A · B.

6. MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS 6.1. Polinomios primos entre sí

6.2. Teorema de Euclides 1ª. 2ª. 3ª.

Sean A, B Î Q(x), si D = m.c.d. (A,B), y sea C Î Q(x) y C ¹ 0 entonces el m.c.d. (A · C, B · C) = D · C Sean A, B Î Q(x), si D = m.c.d. (A,B) entonces m.c.d. (A/D, B/D) = 1 Sean A, B Î Q(x), si A | B Þ m.c.d. (A, B) = A.

Sean los polinomios A, B, C Î Q(x) si A | B · C y el m.c.d. (A, B) = 1, es decir, A y B son primos entre sí, entonces A | C. Vamos a demostrarlo: Partiremos de la relación de Bezout, si D = m.c.d. (A,B), $ M, N Î Q(x) tales que M · A + N · B = D, como en nuestro caso el m.c.d. (A, B) = 1, podemos escribir que M · A + N · B = 1, y si multiplicamos ambos miembros de la ecuación por el polinomio C tendremos: M · A · C + N · B · C = C y como A | M · A · C Ù A | N · B · C entonces diremos que A | (M · A · C + N · B · C) Þ A | C.

5.2. Propiedades del máximo común divisor

Relación de Bezout. Si D = m.c.d. (A,B), $ M, N Î Q(x) tales que M · A + N · B = D



Cualquier divisor de dos polinomios lo es también de su máximo común divisor. Sean dos polinomios A, B Î Q(x), si existe un tercer polinomio C Î Q(x) tal que este polinomio divide a los anteriores entonces el que C | A Ù C | B Þ A Ì C Ù B Ì C Þ D = A + B Ì C Þ C | D



6.3. Definición de mínimo común múltiplo de polinomios

Sean dos polinomios del anillo principal, A, B Î Q(x), llamaremos ideal mínimo común de A y B al ideal M = A Ç B, y llamamos mínimo común múltiplo de A y B a la base de dicho ideal. Si D = m.c.d. (A,B) Þ D = A + B, entonces: A Ì D Ù B Ì D Þ D | A Ù D | B

6.4. Notas características sobre el mínimo común múltiplo – El mínimo común múltiplo de varios polinomios es múltiplo de cada uno de ellos.

5.1. Notas características sobre el máximo común divisor – El máximo común divisor de varios polinomios es divisor de cada uno de ellos.

Si m.c.m. (A,B) = M Þ A Ç B = M MÌAÙMÌBÞA|MÙB|M

Sean dos polinomios A, B Î Q(x), llamamos ideal máximo común divisor de A y B, al ideal suma D = A + B. Llamaremos máximo común divisor a la base del ideal D, única.



Todo múltiplo de un polinomio es múltiplo de su mínimo común múltiplo. Si C Î Q(x) es un múltiplo de A, B Î Q(x), podemos escribir que A | C y B | C, entonces C Ì A Ù Ù C Ì B Þ C Ì A Ç B = M Þ M | C.

5. MÁXIMO COMÚN DIVISOR DE POLINOMIOS

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

236

Polinomios. Operaciones. Fórmula de Newton

6.5. Propiedades del mínimo común múltiplo 1ª.

Sean A, B Î Q(x), si M = m.c.m. (A, B), y sea C Î Q(x) entonces el m.c.m. (A·C, B·C) = M · C.

2ª.

Sean A, B Î Q(x), si M = m.c.m. (A, B) entonces m.c.m. (M/A, M/B) = 1.

3ª.

Sean A, B Î Q(x), si A | B Þ m.c.m. (A, B) = B.

4ª.

Sean A, B Î Q(x), si M = m.c.m. (A, B) y existe C Î Q(x) tal que C | A Ù C | B, entonces m.c.m. (A/C, B/C) = M/C.

7. CÁLCULO DEL MÁXIMO COMÚN DIVISOR Y MÍNIMO COMÚN MÚLTIPLO DE POLINOMIOS EMPLEANDO EL ALGORITMO DE EUCLIDES Sean dos polinomios A, B Î Q(x), y sea el polinomio R Î Q(x) el resto de la división de los polinomios A y B, entonces m.c.d. (B, R). Como A = B · C + R, podemos afirmar que todo divisor de A y B lo es también de R. El Algoritmo de Euclides nos permite el cálculo del máximo común de dos polinomios mediante divisiones sucesivas. Veamos: A = B · C1 + R1

grad(R1) < grad(B)

B = R 1 · C2 + R2

grad(R2) < grad(R1)

R1 = R2 · C3 + R3

grad(R3) < grad(R2)

R2 = R3 · C4 + R4

grad(R4) < grad(R3)





Rn–2 = Rn–1 · Cn + Rn

grad(Rn) < grad(Rn–1)

Rn–1 = Rn · Cn+1 + Rn+1 Y apoyándonos en el teorema podemos escribir que: m.c.d. (A, B) = m.c.d. (B, R1) = m.c.d. (R1, R2) = … = m.c.d. (Rn–1, Rn) = m.c.d. (Rn, 0) = Rn desde un punto de vista práctico asumimos que el máximo común divisor es el último resto anterior a cero. C1

C2

C3

C4



Cn

A

B

R1

R2

R3



Rn–1 Rn

R1

R2

R3

R4



Rn

0

Cn+1

Ahora para calcular el mínimo común múltiplo recurriremos al siguiente teorema: Sean dos polinomios A, B Î Q(x), se cumple que m.c.d. (A, B) · m.c.m. (A, B) = A · B. Demostrémoslo: Habíamos definido D = m.c.d. (A, B) y M = m.c.m. (A, B); como D | A Ù D | B podemos escribir que existen unos polinomios A’, B’ Î Q(x) | A = A’ · D Ù B = B’ · D verificándose que m.c.d. (A’, B’) = 1. Por otra parte tenemos que M = D · A’ · B’, ya que si tomamos un cierto M’ Î Q(x), tal que M’ es un múltiplo de A y B, entonces se cumplirá que: M’ = A · U luego podremos escribir que M’ = A · U = B · V = A’ · D · U = B’ · D · V, M’ = B · V eliminando términos comunes tendremos que A’ · U = B’ · V y teniendo en cuenta que A’ y B’ son primos entre sí (habíamos definido que m.c.d. (A’, B’) = 1) tendremos que: M’ = A · U = A’ · D · U = = A’ · D · B’ · K, y el primer múltiplo común de A y B se obtiene cuando K = 1. Habíamos definido M = D · A’ · B’ Þ D · M = D · D · A’ · B’ = A · B TEMARIO DE MATEMÁTICAS. PRUEBA A

237

Volumen I. Matemáticas

238

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k )nk × P1

8. DESCOMPOSICIÓN FACTORIAL DE POLINOMIOS que existe un polinomio P1 Î Q(x) que nos permite escribir P = ( x – b k) · P1, y al ser P(bi) ¹ 0 también P1(bi) ¹ 0, luego

Sea un polinomio A Î Q(x), diremos que es un polinomio irreducible cuando su grado sea mayor que cero y no exista otro polinomio B Î Q(x) de grado menor que el de A Î Q(x) y que al dividirlo dé como resto cero. En consecuencia de lo anterior, cualquier polinomio de grado mayor que cero es divisible por un polinomio irreducible. Basándonos en las premisas anteriores podemos afirmar que cualquier polinomio A Î Q(x) de grado mayor que cero puede escribirse como: nk

Como ( x – b k) divide a P y es primo con los restantes factores , entonces dividirá también a P, por lo nk

con P(bi) ¹ 0 con i = 1, 2, ..., k–1.

A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k–1 )nk–1 × P

teniendo P la característica de que P(bi) ¹ 0 con i = 1, 2, ..., k. Vamos a demostrarlo utilizando el método de inducción completa, para ello si k = 1 estamos ante la definición de raíz múltiple, y esto lo supondremos cierto para k – 1 A = a × P1n1 × P2n2 × P3n3×...×Pkmk

donde a es el coeficiente principal del polinomio A Î Q(x), los Pi son polinomios irreducibles con coeficientes principales iguales a uno, y los mi Î N, y a la expresión anterior se le denomina descomposición factorial del polinomio. La descomposición factorial de un polinomio es única. A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k )nk × P

Generalizando el razonamiento anterior podemos afirmar si las bi son raíces distintas de un polinomio cuyo grado de multiplicidad es respectivamente ni, entonces existe un polinomio P, que nos permite escribir el polinomio A Î Q(x) como:

8.1. Raíces de un polinomio

– – –

Si n = 3 triple, y así sucesivamente.

Decimos que b Î Q es una raíz del polinomio A Î Q(x) cuando el valor numérico del polinomio en x = b es cero. En consecuencia, y conjugando esto con la noción de polinomio reducible, diremos que si b Î Q es una raíz del polinomio A Î Q(x) el resto de la división del polinomio entre (x – b) es cero o un polinomio de grado cero. Si n = 2 doble,

Si n = 1 la raíz es simple,

Decimos que b Î Q es una raíz del polinomio múltiple de orden n del polinomio A Î Q(x) cuando éste polinomio es divisible por (x – b)n y no lo es por (x – b)n+1; dependiendo del valor n, diremos que

8.2. Raíces múltiples de un polinomio

8.2. Raíces múltiples de un polinomio

Decimos que b Î Q es una raíz del polinomio múltiple de orden n del polinomio A Î Q(x) cuando éste polinomio es divisible por (x – b)n y no lo es por (x – b)n+1; dependiendo del valor n, diremos que

Decimos que b Î Q es una raíz del polinomio A Î Q(x) cuando el valor numérico del polinomio en x = b es cero. En consecuencia, y conjugando esto con la noción de polinomio reducible, diremos que si b Î Q es una raíz del polinomio A Î Q(x) el resto de la división del polinomio entre (x – b) es cero o un polinomio de grado cero.

– – –

Si n = 1 la raíz es simple, Si n = 2 doble,

Si n = 3 triple, y así sucesivamente.

8.1. Raíces de un polinomio

Generalizando el razonamiento anterior podemos afirmar si las bi son raíces distintas de un polinomio cuyo grado de multiplicidad es respectivamente ni, entonces existe un polinomio P, que nos permite escribir el polinomio A Î Q(x) como: A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k )nk × P

donde a es el coeficiente principal del polinomio A Î Q(x), los Pi son polinomios irreducibles con coeficientes principales iguales a uno, y los mi Î N, y a la expresión anterior se le denomina descomposición factorial del polinomio. La descomposición factorial de un polinomio es única.

teniendo P la característica de que P(bi) ¹ 0 con i = 1, 2, ..., k. Vamos a demostrarlo utilizando el método de inducción completa, para ello si k = 1 estamos ante la definición de raíz múltiple, y esto lo supondremos cierto para k – 1 A = a × P1n1 × P2n2 × P3n3×...×Pkmk

Sea un polinomio A Î Q(x), diremos que es un polinomio irreducible cuando su grado sea mayor que cero y no exista otro polinomio B Î Q(x) de grado menor que el de A Î Q(x) y que al dividirlo dé como resto cero. En consecuencia de lo anterior, cualquier polinomio de grado mayor que cero es divisible por un polinomio irreducible. Basándonos en las premisas anteriores podemos afirmar que cualquier polinomio A Î Q(x) de grado mayor que cero puede escribirse como: A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k–1 )nk–1 × P

con P(bi) ¹ 0 con i = 1, 2, ..., k–1.

Como ( x – b k) divide a P y es primo con los restantes factores , entonces dividirá también a P, por lo nk

que existe un polinomio P1 Î Q(x) que nos permite escribir P = ( x – b k) · P1, y al ser P(bi) ¹ 0 también P1(bi) ¹ 0, luego nk

A = (x – b1 )n1 (x – b 2 )n2 ...(x – b k )nk × P1

8. DESCOMPOSICIÓN FACTORIAL DE POLINOMIOS CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

238

Polinomios. Operaciones. Fórmula de Newton

9. FRACCIONES ALGEBRAICAS Q(x), cuerpo, es un dominio de integridad, donde (Q(x), +) satisface las propiedades características de los grupos abelianos con la operación suma, mientras que con la operación producto satisface las propiedades asociativa, existencia de elemento neutro y conmutativa; verificándose, además, la propiedad distributiva del producto con respecto a la suma, y las características usuales de la multiplicación de un escalar por un polinomio. Se define como fracción algebraica el par ordenado de polinomios A, B Î Q(x) con B no nulo que se A representan como donde A es el polinomio numerador y B el polinomio denominador. B Entre las fracciones algebraicas, Q(x) · Q*(x), se define una relación de equivalencia expresada como: (A, B) Â (C, D) Û A · D = B · C. Comprobemos que se satisfacen las propiedades características de la relación de equivalencia:



Reflexiva: (A, B) Â (A, B) Û A · B = B · A



Simétrica: (A, B) Â (C, D) Þ (C, D) Â (A, B) y se satisface ya que A · B = B · C Þ C · B = D · A



Transitiva: Si (A, B) Â (C, D) y (C, D) Â (E, F) Þ (A, B) Â (E, F). (A, B) Â (C, D) Þ A · D = B · C (C, D) Â (E, F) Þ C · F = D · E

multiplicando miembro a miembro

Þ A · D · C · F = B · C · D · E Þ A · F = B · E Þ (A, B) Â (E, F) ìA ü al conjunto cociente Q(x) · Q*(x)/ Â se le denomina conjunto de las fracciones algebraicas, denotando por í ý î Bþ A la clase de equivalencia de . B

9.1. Propiedades de las fracciones algebraicas Si multiplicamos numerador y denominador de una fracción algebraica por un polinomio no nulo obtenemos otra fracción algebraica equivalente a la primera. Así, si tenemos la fracción algebraica Probémoslo:

A y un polinomio C ¹ 0, entonces (A, B) Â (A·C, B·C). B

A A ×C Â Þ A × B× C = B× A × C Þ A × B = B× A B B× C

Si reconstruimos a la inversa este razonamiento podemos afirmar que si dada una fracción algebraica dividimos su numerador y denominador por un polinomio no nulo obtendremos otra fracción algebraica que es equivalente a la primera. Partiendo de la afirmación anterior, si dividimos numerador y denominador por un cierto polinomio D = m.c.d. (A,B) obtendremos una fracción que equivalente a la primera que se denomina fracción reducida. Sea D = m.c.d. (A,B) y los términos de la fracción entonces:

A se pueden expresar como A = A’ · D y B = B’ · D B

A A'×D A' = = , siendo esta última la fracción reducida. B B'×D B'

A la operación que nos permite encontrar la expresión reducida de una fracción le denominamos simplificar fracciones (simplificación de fracciones). TEMARIO DE MATEMÁTICAS. PRUEBA A

239

Volumen I. Matemáticas

240

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

El conjunto de propiedades definidas sobre Q(x) · Q*(x)/Â con la operación suma, confiere a este conjunto estructura de grupo aditivo abeliano.

10. OPERACIONES CON FRACCIONES ALGEBRAICAS 10.1. Suma de fracciones algebraicas

ìA ü ì A ü ì 0 ü í ý + í– ý = í ý î Bþ î Bþ îK þ

En el conjunto de las fracciones algebraicas, Q(x) · Q*(x)/Â, se define la suma de fracciones algebraicas como:



Existencia del elemento simétrico: ì Aü ìA ü Para cada fracción í ý Î Q(x) · Q*(x)/Â existe una fracción simétrica í– ý tal que î Bþ î Bþ ì A ü ì Cü ì A × E + B× Cü ý í ý+í ý =í î B þ î Eþ î B× E þ

y hay que tener en cuenta que esta operación no depende de los representantes elegidos. Vamos a demostrarlo: ìA ü ì 0 ü ìA ü í ý+ í ý= í ý î Bþ îK þ î Bþ

Sean los polinomios D = m.c.d. (A,B) y D’ = m.c.d. (C,E) entonces se comprueba que ì A ü ì Cü ì A'ü ì C'ü í ý + í ý Â í ý + í ý. î B þ î Eþ î B'þ î E'þ



Existencia de elemento neutro: ìA ü ì 0ü Para toda fracción í ý Î Q(x) · Q*(x)/Â $ í ý Î Q(x) · Q*(x)/Â tal que î Bþ îK þ

ì A ü ì A'×Dü ì A'ü ì Cü ì C'×D'ü ì C'ü ý =í ýy í ý =í ý = í ý, entonces Si í ý = í î B þ î B'×Dþ î B'þ î Eþ î E'×D'þ î E'þ

ì A ü ì C ü ì Cü ì A ü í ý+ í ý =í ý+í ý î B þ î Dþ î Dþ î B þ



ì A ü ì Cü ì A × E + B× Cü ì A'×D× E'×D'+B'×D× C'×D'ü ý =í ý= í ý+í ý =í þ î B þ î Eþ î B× E þ î B'×D× E'×D'

Conmutativa:

ì D× D'×( A'×E'+B'×C') ü ì A'× E'+ B'× C'ü ì A'ü ì C'ü ý = í ý+ í ý í ý =í D× D'×B'×E' B'× E' þ î B'þ î E'þ î þ î ì A ü éì Cü ì Eüù éì A ü ì Cüù ì Eü í ý +êí ý + í ýú =êí ý + í ýú+ í ý î Dþ î F þû ëî B þ î Dþû î F þ î Bþ ë



Asociativa:

10.2. Propiedades de la suma de fracciones algebraicas

10.2. Propiedades de la suma de fracciones algebraicas



Asociativa: ì A ü éì Cü ì Eüù éì A ü ì Cüù ì Eü í ý +êí ý + í ýú =êí ý + í ýú+ í ý î B þ ëî Dþ î F þû ëî B þ î Dþû î F þ

ì D× D'×( A'×E'+B'×C') ü ì A'× E'+ B'× C'ü ì A'ü ì C'ü ý = í ý+ í ý í ý =í D× D'×B'×E' B'× E' þ î B'þ î E'þ î þ î Conmutativa:

ü ì ü ì ü ì ü ì × × × × × × C' D' A C A E + B C A' D E' D'+B' D × × ý =í ý= í ý+í ý =í þ î B þ î Eþ î B× E þ î B'×D× E'×D'



ì A ü ì C ü ì Cü ì A ü í ý+ í ý =í ý+í ý î B þ î Dþ î Dþ î B þ

ì A ü ì A'×Dü ì A'ü ì Cü ì C'×D'ü ì C'ü ý =í ýy í ý =í ý = í ý, entonces Si í ý = í î B þ î B'×Dþ î B'þ î Eþ î E'×D'þ î E'þ



Existencia de elemento neutro: ìA ü ì 0ü Para toda fracción í ý Î Q(x) · Q*(x)/Â $ í ý Î Q(x) · Q*(x)/Â tal que î Bþ îK þ

Sean los polinomios D = m.c.d. (A,B) y D’ = m.c.d. (C,E) entonces se comprueba que ì A ü ì Cü ì A'ü ì C'ü í ý + í ý Â í ý + í ý. î B þ î Eþ î B'þ î E'þ ìA ü ì 0 ü ìA ü í ý+ í ý= í ý î Bþ îK þ î Bþ

y hay que tener en cuenta que esta operación no depende de los representantes elegidos. Vamos a demostrarlo: Existencia del elemento simétrico: ì Aü ìA ü Para cada fracción í ý Î Q(x) · Q*(x)/Â existe una fracción simétrica í– ý tal que î Bþ î Bþ ì A ü ì Cü ì A × E + B× Cü ý í ý+í ý =í î B þ î Eþ î B× E þ



En el conjunto de las fracciones algebraicas, Q(x) · Q*(x)/Â, se define la suma de fracciones algebraicas como: ìA ü ì A ü ì 0 ü í ý + í– ý = í ý î Bþ î Bþ îK þ

10.1. Suma de fracciones algebraicas

El conjunto de propiedades definidas sobre Q(x) · Q*(x)/Â con la operación suma, confiere a este conjunto estructura de grupo aditivo abeliano.

10. OPERACIONES CON FRACCIONES ALGEBRAICAS

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

240

Polinomios. Operaciones. Fórmula de Newton

10.3. Producto de fracciones algebraicas En el conjunto de las fracciones algebraicas, Q(x) · Q*(x)/Â, se define el producto de fracciones algebraicas como: ì A ü ì Cü ì A × Cü ý í ý×í ý = í î B þ î Dþ î B× Dþ Al igual que se planteaba en la suma, para el producto esta operación no depende de los representantes elegidos.

10.4. Propiedades del producto de fracciones algebraicas –

Asociativa: ì A ü éì Cü ì Eüù éì A ü ì Cüù ì Eü í ý×êí ý×í ýú =êí ý×í ýú×í ý î B þ ëî Dþ î F þû ëî B þ î Dþû î F þ



Conmutativa: ì A ü ì Cü ì Cü ì A ü í ý×í ý = í ý×í ý î B þ î Dþ î Dþ î B þ



Existencia del elemento neutro: ìA ü ì Eü Para toda fracción í ý Î Q(x) · Q*(x)/Â $ í ý Î Q(x) · Q*(x)/Â tal que î Bþ î Eþ ì A ü ì Eü ì A ü í ý· í ý= í ý î B þ î Eþ î B þ



Existencia del elemento simétrico: ìA ü ì Bü Para cada fracción í ý Î Q(x) · Q*(x)/Â existe una fracción simétrica í ý tal que î Bþ îA þ ì A ü ì B ü ì Eü í ý· í ý= í ý î B þ î A þ î Eþ



Propiedad distributiva del producto con respecto a la suma de fracciones algebraicas: ì A ü éì Cü ì Eüù éì A ü ì Cüù éì A ü ì Eüù í ý×êí ý + í ýú =êí ý×í ýú+êí ý×í ýú î B þ ëî Dþ î F þû ëî B þ î Dþû ëî B þ î F þû

A la vista de las propiedades que se satisfacen tanto para la suma como para el producto de fracciones algebraicas y de la propiedad distributiva del producto con respecto a la suma de las mismas, podemos afirmar que el conjunto (Q(x) · Q*(x)/Â, +, ·) tiene estructura algebraica de cuerpo conmutativo.

11. DESCOMPOSICIÓN DE UN POLINOMIO EN FRACCIONES A una fracción en la que el m.c.d. (A,B) = 1, fracción reB ducida, siempre podremos expresarla de forma única como: Consideremos la siguiente proposición: Sea

A A' = C+ B B donde el grad(A’) < grad(B), y si grad(A) < grad(B) entonces C (parte entera de la fracción

TEMARIO DE MATEMÁTICAS. PRUEBA A

A ) es cero. B 241

Volumen I. Matemáticas

242

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

A1B2 A 2B1 A1 A 2 + = + B1B2 B1B2 B1 B2

Demostrémoslo: Sean C y A’, respectivamente, los polinomios cociente y resto de la división de los polinomios A entre B; podremos escribir que A = B · C + A’, siendo grad(A’) < grad(B). Como sabemos que, por definición de fracción algebraica el polinomio B es no nulo, si dividimos ambos miembros de la expresión entre B obtenemos: =

A A A B + A 2B1 = 1 2 = = B B1B2 B1B2 A B× C A' A' = + = C+ B B B B

donde hemos dado a A2 el valor N2 + B2C, luego:

A = B1N2 + B2N1 = B1N2 + B2(B1C + A1) = A1B2 + A2B1 y demostremos ahora que esta expresión es única. Para ello supongamos que existe otra

Al ser B1 y B2 primos entre sí, basándonos en la igualdad de Bezont diremos que existen dos polinomios M1 y M2 que nos permiten escribir B1M2 + B2M1 = 1 y, en consecuencia, existirán también otros dos polinomios N1 y N2 de la forma N1 = M1A y N2 = M2A que nos permiten escribir B1N2 + B2N1 = A. Si llamamos C y A1, respectivamente, al cociente y al resto de la división de N1 entre B1 tendremos que N1 = B1C + A1, donde grad(A1) < grad(B1), entonces escribiremos: A A' = C1 + 1 B B

como ambas son expresiones representan la fracción

A podremos igualarlas: B

A' A' = C1 + 1 B B

en donde grad(A1) < grad(B1) y grad(A2) < grad(B2). Demostrémoslo: C+

A A1 A 2 = + B B1 B2

C – C1 =

A1' A' – Þ B(C – C1 ) = A1'–A' B B

A Sea una fracción racional reducida en la que grad(A) < grad(B) y donde el polinomio denominador B se puede expresar como B = B1 · B2, ambos primos entre sí, entonces podemos descomponer de forma úniA como: B

ca la fracción

si C – C1 ¹ 0 y al haber definido B como no nulo, entonces A1'–A' será, también, distinto de cero, y su grad(A1'–A') = grad(C – C1) + grad(B) ³ grad(B) lo que no es posible al ser grad(A’) < grad(B) y grad(A1') < grad(B). Por otra parte, si C – C1 = 0 Þ A1'–A' = 0 Þ C = C1 ¹ A1'= A', luego la descomposición es única.

Proposición 1

11.1. Proposiciones sobre la descomposición de polinomios

11.1. Proposiciones sobre la descomposición de polinomios

Proposición 1 Por otra parte, si C – C1 = 0 Þ A1'–A' = 0 Þ C = C1 ¹ A1'= A', luego la descomposición es única.

A una fracción racional reducida en la que grad(A) < grad(B) y donde el polinomio denominador B se puede expresar como B = B1 · B2, ambos primos entre sí, entonces podemos descomponer de forma úniA ca la fracción como: B A A1 A 2 = + B B1 B2 Sea

si C – C1 ¹ 0 y al haber definido B como no nulo, entonces A1'–A' será, también, distinto de cero, y su grad(A1'–A') = grad(C – C1) + grad(B) ³ grad(B) lo que no es posible al ser grad(A’) < grad(B) y grad(A1') < grad(B). C – C1 =

A1' A' – Þ B(C – C1 ) = A1'–A' B B C+

A' A' = C1 + 1 B B

en donde grad(A1) < grad(B1) y grad(A2) < grad(B2). Demostrémoslo: Al ser B1 y B2 primos entre sí, basándonos en la igualdad de Bezont diremos que existen dos polinomios M1 y M2 que nos permiten escribir B1M2 + B2M1 = 1 y, en consecuencia, existirán también otros dos polinomios N1 y N2 de la forma N1 = M1A y N2 = M2A que nos permiten escribir B1N2 + B2N1 = A. Si llamamos C y A1, respectivamente, al cociente y al resto de la división de N1 entre B1 tendremos que N1 = B1C + A1, donde grad(A1) < grad(B1), entonces escribiremos: como ambas son expresiones representan la fracción

A podremos igualarlas: B

A A' = C1 + 1 B B

y demostremos ahora que esta expresión es única. Para ello supongamos que existe otra A = B1N2 + B2N1 = B1N2 + B2(B1C + A1) = A1B2 + A2B1 A B× C A' A' = + = C+ B B B B

donde hemos dado a A2 el valor N2 + B2C, luego:

A A A B + A 2B1 = = 1 2 = B B1B2 B1B2

Demostrémoslo: Sean C y A’, respectivamente, los polinomios cociente y resto de la división de los polinomios A entre B; podremos escribir que A = B · C + A’, siendo grad(A’) < grad(B). Como sabemos que, por definición de fracción algebraica el polinomio B es no nulo, si dividimos ambos miembros de la expresión entre B obtenemos: 242

A1B2 A 2B1 A1 A 2 + = + B1B2 B1B2 B1 B2

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

=

Polinomios. Operaciones. Fórmula de Newton Probemos, ahora, que esta descomposición es única, lo haremos por reducción al absurdo y para ello A A' A' supongamos que no es única y que existe otra descomposición = 1 + 2 , igualando ambas exB B1 B2 presiones obtenemos: A1 A 2 A'1 A'2 Þ A1B2 + A 2B1 = A'1 B2 + A'2 B1 Þ + = + B1 B2 B1 B2 Þ ( A1 – A'1) B2 = ( A'2 –A 2) B1 Si A1 – A'1 ¹ 0, como B1 es, por definición, primo con B2 y divide al producto ( A'2 –A 2) B1, divide a A1 – A'1, y en consecuencia grad(A1 – A'1) < grad (B1) lo que es imposible ya que hemos acordado que grad(A1) < grad(B1) y grad(A'1) < grad(B1). Sólo nos queda, pues, la posibilidad de que A1 – A'1 = 0 Þ A'2 –A 2 = 0 Þ A1 = A'1 Ù A2 = A'2 luego la descomposición es única. Vamos a extender el razonamiento anterior a una descomposición polinómica más amplia del polinomio denominador.

Proposición 2 A una fracción racional reducida en la que grad(A) < grad(B) y donde el polinomio denominador B se puede expresar como B = B1 · B2 · … · Bn donde los polinomios Bi son primos dos a dos, entonces existiA rá una descomposición de forma única de la fracción como: B Sea

A A1 A 2 A = + +...+ n B B1 B2 Bn en la que grad(Ai) < grad(Bi) con i Î [1,n]. Lo demostraremos por inducción completa, asumiendo que si n = 1 la proposición es evidente y para n = 2 al haberlo comprobado previamente es también cierta, así, lo supondremos cierto hasta n – 1 y lo comprobaremos para n. Para n definimos B = B0 · Bn siendo B0 = B1 · B2 · … · Bn–1, y al ser B0 y Bn primos entre sí, podremos A A A escribir que = 0 + n , y teniendo en cuenta que habíamos supuesto cierta la proposición hasta n B B0 Bn – 1 entonces: A A1 A 2 A = + +...+ n Bn B B1 B2

Proposición 3 Una fracción reducida

A en la que grad(A) < grad(Bm), donde m Î Z+* se descompone de forma úniBm

ca en: A A1 A 2 A + 2 +...+ mm m = B B B B con grad(Ai) < grad(B) con i Î [1,m]. Para demostrarlo utilizaremos, una vez más, la inducción teniendo en cuenta que si m = 1 es evidente tanto la existencia como la unicidad; así, pues, lo consideraremos válido hasta m – 1 y lo comprobaremos para m. TEMARIO DE MATEMÁTICAS. PRUEBA A

243

Volumen I. Matemáticas

244

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

donde C es el cociente de la división del polinomio A entre el B y grad(Aij) < grad(Bi) para i = 1, 2, ..., n j = = 1, 2, ..., mi Llamemos C y Am, respectivamente, al cociente y al resto de la división de A entre B. A A – Si el grad(A) < grad(B) Þ C = 0 Þ m = 0 + mm con grad(Am) < grad(B). B B

compone de forma única como: A nm A1m A A A A = C + 11 + 122 +...+ m11 +...+ n1 +...+ mnn B B1 B1 B1 Bn Bn

Pero si grad(A) > grad(B) Þ C ¹ 0 y Am ¹ A, con lo que escribiremos: A = BC + Am

es decir, como una descomposición en factores irreducibles, podemos afirmar que la fracción A BC A m A C Am m = m + m Þ m = m–1 + B B B Bm B B

Sea

– A se desB

A una fracción reducida donde podemos expresar el polinomio denominador como B = aB1m1 B2m2 ...Bnmn , B

Al ser BC = A – Am y como grad(A – Am) < grad(Bm) entonces grad(C) < grad(Bm–1), y aplicando a C la hipótesis de inducción escribiremos: Bm–1

Proposición 4

A A A A m–1 = 1 + 2 +...+ m–1 B Bm–1 B B2

operando y sacando factor común B(P – Q) = (A’m – Am) y siguiendo un razonamiento análogo al empleado en las anteriores proposiciones, si (P – Q) = 0 Þ (A’m – Am) = 0, entonces P = Q Ù Am = A’m, lo que nos indicaría que la descomposición es única. Consideremos ahora la posibilidad de que (P – Q) ¹ ¹ 0 Þ (A’m – Am) ¹ 0 de lo que se deduce que grad(A’m – Am) = grad(B) + grad(P – Q) ³ grad(B), lo que es imposible ya que habíamos definido grad(Am) < grad(B) Ù grad(A’m) < grad(B). donde grad(Ai) < grad(B) con i Î [1, m–1], y en consecuencia: A A1 A 2 A m–1 A m = + +...+ m–1 + m Bm B B2 B B BP + Am = BQ + A’m

con lo que queda probada la existencia, para probar la unicidad procedemos como hemos hecho en las proposiciones anteriores suponiendo que existen descomposiciones distintas e igualando las expreA siones de m procedentes de dos de esas descomposiciones: B podremos escribir:

sacaremos factor común B y haciendo una sustitución definida como: P = A1Bm–2 + A2Bm–3 + … + Am–1 Q = A’1Bm–2 + A’2Bm–3 + … + A’m–1 A1 A 2 A A' A' A' + 2 +...+ mm = 1 + 22 +...+ mm B B B B B B

A1Bm–1 + A2Bm–2 + … + Am = A’1Bm–1 + A’2Bm–2 + … + A’m operando obtenemos:

operando obtenemos:

A1Bm–1 + A2Bm–2 + … + Am = A’1Bm–1 + A’2Bm–2 + … + A’m A A A A' A' A' 1 + 2 +...+ mm = 1 + 22 +...+ mm B B2 B B B B

sacaremos factor común B y haciendo una sustitución definida como: P = A1Bm–2 + A2Bm–3 + … + Am–1 Q = A’1Bm–2 + A’2Bm–3 + … + A’m–1

con lo que queda probada la existencia, para probar la unicidad procedemos como hemos hecho en las proposiciones anteriores suponiendo que existen descomposiciones distintas e igualando las expreA procedentes de dos de esas descomposiciones: Bm siones de

podremos escribir:

BP + Am = BQ + A’m

A A1 A 2 A m–1 A m = + +...+ m–1 + m Bm B B2 B B

operando y sacando factor común B(P – Q) = (A’m – Am) y siguiendo un razonamiento análogo al empleado en las anteriores proposiciones, si (P – Q) = 0 Þ (A’m – Am) = 0, entonces P = Q Ù Am = A’m, lo que nos indicaría que la descomposición es única. Consideremos ahora la posibilidad de que (P – Q) ¹ ¹ 0 Þ (A’m – Am) ¹ 0 de lo que se deduce que grad(A’m – Am) = grad(B) + grad(P – Q) ³ grad(B), lo que es imposible ya que habíamos definido grad(Am) < grad(B) Ù grad(A’m) < grad(B). donde grad(Ai) < grad(B) con i Î [1, m–1], y en consecuencia: A A A A m–1 = 1 + 2 +...+ m–1 Bm–1 B B2 B

Al ser BC = A – Am y como grad(A – Am) < grad(Bm) entonces grad(C) < grad(Bm–1), y aplicando a C la hipótesis de inducción escribiremos: Bm–1

Proposición 4

A una fracción reducida donde podemos expresar el polinomio denominador como B = aB1m1 Bm2 2 ...Bmn n , B A es decir, como una descomposición en factores irreducibles, podemos afirmar que la fracción se desB compone de forma única como: A1m A nm A A A A = C + 11 + 122 +...+ m11 +...+ n1 +...+ mnn B B1 B1 B1 Bn Bn A BC A A C A = + m Þ m = m–1 + mm Bm Bm Bm B B B



Sea

Pero si grad(A) > grad(B) Þ C ¹ 0 y Am ¹ A, con lo que escribiremos: A = BC + Am

Llamemos C y Am, respectivamente, al cociente y al resto de la división de A entre B. A A = 0 + mm con grad(Am) < grad(B). Bm B



Si el grad(A) < grad(B) Þ C = 0 Þ

donde C es el cociente de la división del polinomio A entre el B y grad(Aij) < grad(Bi) para i = 1, 2, ..., n j = = 1, 2, ..., mi CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

244

Polinomios. Operaciones. Fórmula de Newton

Demostrémoslo, para ello hemos de considerar que

A se descompone de forma única como B

A A' m = C + y que grad(A’) < grad(B). Como los polinomios Bi son irreducibles entonces losBmi i y Bj j B B A' son primos entre sí, por lo que podemos descomponer de forma única como: B A' A1 A 2 A = + +...+ mnn B B1m1 Bm2 2 Bn con grad(Ai) < grad(Bi), y también tenemos que: A im A i A i1 A i 2 + 2 +...+ mii mi = Bi Bi Bi Bi con grad(Aij) < grad(Bi) y, además, estas descomposiciones son únicas con lo que queda demostrada la proposición.

11.2. Corolarios a)

Cuando el cuerpo es el de los números complejos, la descomposición del polinomio divisor en fracciones irreducibles se plantea como: B = a( x – a1)

m1

( x – a 2) m ...( x – a n) m 2

n

donde tanto a como los ai son números complejos. Teniendo en cuenta esto y las proposiciones antes A puede escribirse de forma única como: B A1m1 A A11 A12 = C+ + + 2 +...+ ( x – a1) ( x – a1) B ( x – a1) m1

presentadas la fracción reducida

+

A 21

+ donde C es la parte entera de b)

+

A 22

( x – a 2) ( x – a 2) 2

+...+

A 2m2

( x – a 2) m

2

+...+

A nmn A n1 A n2 + 2 +...+ ( x – a n) ( x – a n) ( x – a n) m1 A y los Aij son números complejos (polinomios de grado cero). B

Cuando el cuerpo es el de los números reales, la descomposición del polinomio divisor en fracciones irreducibles se plantea como: B = a( x – a1) ...( x – a n) m1

mn

( x2 + b1x + c1) n ...( x2 + b sx + cs) n 1

s

donde a Î R es el coeficiente principal de B, ai, bi, ci Î R y b2 – 4ci > 0. Teniendo en cuenta esto y las proposiciones antes presentadas la fracción reducida

A puede escribirB

se de forma única como: A1m1 A nmn A A11 A12 A n1 A n2 + = C+ + + m1 +...+ 2 +...+ 2 +...+ ( x – a1) ( x – a1) ( x – a n) ( x – a n) B ( x – a1) ( x – a n) m1 + donde C es la parte entera de

Bsn x + Csns B11x + C11 +...+ 2 s ( x + b sx + c s) ( x + b sx + cs) ns 2

A y Aij, Bhk, Chk Î R. B

TEMARIO DE MATEMÁTICAS. PRUEBA A

245

Volumen I. Matemáticas

246

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

12. FUNCIONES RACIONALES A Dada una fracción racional reducida F = a las raíces del polinomio B se les denomina polos de la B fracción F, designando por K0 al conjunto de los elementos de K que no son polos de la fracción F. A partir de la fracción F podemos definir una función: F*: K0 ® K siendo F*(x) =

A(x) para cada x Î K0. B(x)

A la función F* se le denomina función racional asociada a la función F. Dos funciones racionales son iguales cuando lo son las correspondientes fracciones reducidas desde las que se definen, pero hemos de tener en cuenta que el recíproco no siempre es cierto, siéndolo sólo cuando el cuerpo K sobre el que se definen tenga infinitos elementos.

A la función F* se le denomina función racional asociada a la función F. Dos funciones racionales son iguales cuando lo son las correspondientes fracciones reducidas desde las que se definen, pero hemos de tener en cuenta que el recíproco no siempre es cierto, siéndolo sólo cuando el cuerpo K sobre el que se definen tenga infinitos elementos. siendo F*(x) =

A(x) para cada x Î K0. B(x) F*: K0 ® K

A a las raíces del polinomio B se les denomina polos de la B fracción F, designando por K0 al conjunto de los elementos de K que no son polos de la fracción F. A partir de la fracción F podemos definir una función: Dada una fracción racional reducida F =

12. FUNCIONES RACIONALES 246

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

TEMA

14 Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

248

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

ECUACIONES 2.1. Clasificación de las ecuaciones

3.

ECUACIONES ALGEBRAICAS 3.1. Ecuaciones equivalentes

4.

RESOLUCIÓN DE ECUACIONES ALGEBRAICAS DE GRADO £ 4 4.1. Ecuaciones de primer grado 4.2. Ecuaciones de segundo grado 4.3. Ecuaciones de tercer grado 4.4. Ecuaciones de cuarto grado

5.

RAÍCES ENTERAS Y RACIONALES DE UNA ECUACIÓN ALGEBRAICA

6.

RAÍCES REALES DE UNA ECUACIÓN ALGEBRAICA 6.1. Acotación de las raíces reales de una ecuación algebraica 6.1.1. Método de Laguerre 6.1.2. Método de Newton 6.2. Separación de raíces de una ecuación cualquiera 6.3. Separación de raíces de una ecuación algebraica 6.3.1. Método de Sturm 6.3.2. Teorema de Budan-Fourier 6.3.3. Teorema de Descartes

7.

APROXIMACIÓN DE RAÍCES REALES 7.1. Método de Bolzano 7.2. Método de regula falsi (falsa posición) 7.3. Método de Newton 7.4. Método mixto

APROXIMACIÓN DE RAÍCES REALES 7.1. Método de Bolzano 7.2. Método de regula falsi (falsa posición) 7.3. Método de Newton 7.4. Método mixto

7.

RAÍCES REALES DE UNA ECUACIÓN ALGEBRAICA 6.1. Acotación de las raíces reales de una ecuación algebraica 6.1.1. Método de Laguerre 6.1.2. Método de Newton 6.2. Separación de raíces de una ecuación cualquiera 6.3. Separación de raíces de una ecuación algebraica 6.3.1. Método de Sturm 6.3.2. Teorema de Budan-Fourier 6.3.3. Teorema de Descartes

6.

RAÍCES ENTERAS Y RACIONALES DE UNA ECUACIÓN ALGEBRAICA

5.

RESOLUCIÓN DE ECUACIONES ALGEBRAICAS DE GRADO £ 4 4.1. Ecuaciones de primer grado 4.2. Ecuaciones de segundo grado 4.3. Ecuaciones de tercer grado 4.4. Ecuaciones de cuarto grado

4.

ECUACIONES ALGEBRAICAS 3.1. Ecuaciones equivalentes

3.

ECUACIONES 2.1. Clasificación de las ecuaciones

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

248

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

1. INTRODUCCIÓN Las ecuaciones surgen de la necesidad de resolver problemas prácticos y geométricos desde la antigüedad. Ya en el papiro de Rhind aparecen problemas algebraicos que no se refieren a objetos concretos como el pan y la cerveza, sino que piden lo equivalente a resolver ecuaciones lineales de la forma x + ax = b o x + ax + bx = c, donde a, b, y c son números conocidos y x es desconocido. A este número desconocido o incógnita se le llama ''aha'' o montón. De hecho el problema 24 del papiro pide calcular el valor del montón si el montón y un septimo del montón es igual a 19. La solución que da el papiro no es la que podríamos encontrar hoy en día en cualquier libro de texto (ya que hasta hace poco más de cuatro siglos no se ha empleado el simbolismo algebraico actual), sino que es característica de un procedimiento que conocemos hoy como el método de la regula falsi (que veremos posteriormente en la aproximación numérica de raíces). En este método se supone un valor concreto para el montón, seguramente incorrecto, realizando con él todas las operaciones indicadas en la parte izquierda de la igualdad. A continuación se compara el resultado obtenido con el que debería darnos, y mediente el uso de proporciones se halla la respuesta correcta o más aproximada. En el problema mencionado se toma como valor de prueba para el montón el 7, de manera que x + x 7 toma el valor 8 en lugar del correcto, que debía ser 19, pero en vista de que 8 · (2 + 1 4 + 1 8) = 19, tenemos que multiplicar 7 por 2 + 1 4 + 1 8para obtener el valor correcto del montón. Ahmes halla la respuesta correcta 16 + 1 2 + 1 8 y comprueba su resultado mostrando que si a 16 + 1 2 + 1 8 le suma uno un séptimo de él mismo, es decir, 2+ 1 4 + 1 8, se obtiene efectivamente 19. El álgebra en Babilonia alcanzó un nivel mucho más alto que en Egipto. Se conocen muchos problemas que aparecen en textos del periodo babilónico antiguo que demuestran que la resolución de una ecuación completa de segundo grado no ofrecía ninguna dificultad importante para los babilonios, debido a la flexibilidad de operaciones algebraicas que habían desarrollado. Así, podían trasponer términos en una ecuación sumando igualdades, y eliminar fracciones u otros factores multiplicando ambos miembros por cantidades iguales; sumando 4ab a (a – b)2 lo podían transformar en (a + b)2, aprovechando los muchos tipos de factorizaciones simples a los que estaban acostumbrados. Al no estar inventado el alfabeto no utilizaban letras para representar las incognitas, pero las llamaban por su nombre (área, longitud, etc.) y servía perfectamente para lo que buscaban. Ya en el siglo IX, el matemático árabe Al-Khowarizmi publicó un libro que, traducido al latín, dió luego nacimiento a la palabra álgebra. En él hacía un estudio completo de la resolución de las ecuaciones de segundo grado con coeficientes enteros a los que acompañaba de comprobaciones geométricas. Cardano, en 1545, publicó Ars Magna, donde divulgaba la resolución de las ecuaciones cúbicas y de la cuártica. Hay que advertir que Cardano no fue el descubridor original de la ecuación cúbica ni de la cuartica. La solución de la cúbica la obtuvo de Niccolo Tartaglia (1500-1557), mientras que la solución de la cuártica fue descubierta por primera vez por el secretario de Cardano, Ludovico Ferrari (1522-1565). No fue ya hasta el siglo XIX cuando Abel, en 1824, publicó una memoria titulada Sobre la resolución algebraica de las ecuaciones, donde demostraba que para ecuaciones algebraicas de grado superior a cuatro no puede haber ninguna fórmula general expresada en términos de operaciones algebraicas explícitas sobre los coeficientes de la ecuación polinómica, que nos dé las raíces de la ecuación. También en este siglo Galois hizo un estudio sobre posibles soluciones expresables por radicales de ecuaciones polinómicas de grado n, pero poniendo más enfasis en la estructura algebraica general que en el manejo de casos concretos. En principio definiremos de forma general lo que es una ecuación real de variable real, pasando después a clasificar los distintos tipos de ecuaciones. Veremos con posterioridad distintos métodos de aproximación numérica de raíces para cualquier ecuación general dedicando un apartado especial a las ecuaciones algebraicas.

2. ECUACIONES DEFINICIÓN. Dada una función f: [a,b] ® R, donde [a,b] puede ser R, llamamos ecuación real de variable real a toda expresión de la forma f(x) = c, donde c es un número real cualquiera. A la variable x se le llama incógnita. DEFINICIÓN. Llamamos solución de una ecuación real de variable real al conjunto de valores reales que hacen que la ecuación se verifique. Resolver la ecuación es hallar sus soluciones. TEMARIO DE MATEMÁTICAS. PRUEBA A

249

Volumen I. Matemáticas

250

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Para x = a, tendremos que Pn(a) = 0, con lo que a será raíz de Pn(x).

2.1. Clasificación de las ecuaciones

Pn(x) = (x – a) q Pn–1(x)

Las ecuaciones de una incógnita (que son las que trataremos en el tema) se pueden clasificar en función de la naturaleza de las expresiones que aparecen en sus miembros y serán:

de donde R = 0, con lo que Pn(x) es divisible por (x – a). Si ahora suponemos que Pn(x) es divisible por (x – a), tendremos que al dividir Pn(x) entre (x – a), nos quedará que 1.

Algebraicas, si f(x) de la definición es una función polinómica.

2.

Trascendentes, si f(x) contiene al menos una función trascendente ax, ln x, cos x, etc. Pn(a) = (a – a) q Pn–1(a) + R = 0

Dentro de las algebraicas podemos distinguir:

Como a es una raíz, tendremos que Pn(a) = 0, y sustituyendo en la ecuación anterior, tendremos que Racionales, cuando la incógnita no aparece bajo el signo radical. Irracionales, en el caso contrario. Pn(x) = (x–a) q Pn–1(x) + R

a) b)

PROPOSICIÓN La condición necesaria y suficiente para que a sea una raíz de la ecuación algebraica a0 + a1x + a2x2 + ... + an–1xn–1 + anxn = 0 es que el polinomio Pn(x) = a0 + a1x + a2x2 + ... + an–1xn–1 + anxn sea divisible por (x – a). Supongamos que a es raíz de Pn(x). Si dividimos Pn(x) por (x–a), tendremos que Por último, dentro de las racionales tendremos: I) Enteras, cuando la incógnita no aparece en ningún denominador. II) Fraccionarias, cuando la incógnita aparece en algún denominador.

Así, esquemáticamente, la clasificación de las ecuaciones queda:

DEFINICIÓN. Llamamos raíz, cero o solución de dicha ecuación a los valores de la variable x que hacen que la igualdad se cumpla, es decir, todo número que sustituido en lugar de la incógnita transforma la igualdad (1) en una igualdad numérica. Si la ecuación (1) tiene n raíces iguales a r y el resto son todas diferentes de r, se dice que r es una raíz múltiple de orden de multiplicidad n. (En los casos de que n = 2, se dice raíz doble, n = 3, triple, etc.) Enteras

Racionales

Fraccionarias

Algebraicas

Irracionales

ECUACIONES

donde todos los elementos ai Î R son conocidos y se llaman coeficientes.

DEFINICIÓN. Se llama ecuación algebraica racional con una incógnita y coeficientes reales de grado n a toda expresión de la forma (1) a0 + a1x + a2x2 + ... + an–1xn–1 + anxn = 0 Trascendentes

3. ECUACIONES ALGEBRAICAS

3. ECUACIONES ALGEBRAICAS

DEFINICIÓN. Se llama ecuación algebraica racional con una incógnita y coeficientes reales de grado n a toda expresión de la forma (1) a0 + a1x + a2x2 + ... + an–1xn–1 + anxn = 0 Trascendentes

donde todos los elementos ai Î R son conocidos y se llaman coeficientes.

ECUACIONES

Irracionales

DEFINICIÓN. Llamamos raíz, cero o solución de dicha ecuación a los valores de la variable x que hacen que la igualdad se cumpla, es decir, todo número que sustituido en lugar de la incógnita transforma la igualdad (1) en una igualdad numérica. Si la ecuación (1) tiene n raíces iguales a r y el resto son todas diferentes de r, se dice que r es una raíz múltiple de orden de multiplicidad n. (En los casos de que n = 2, se dice raíz doble, n = 3, triple, etc.) Algebraicas

Fraccionarias

Racionales

Enteras

Así, esquemáticamente, la clasificación de las ecuaciones queda:

PROPOSICIÓN La condición necesaria y suficiente para que a sea una raíz de la ecuación algebraica a0 + a1x + a2x2 + ... + an–1xn–1 + anxn = 0 es que el polinomio Pn(x) = a0 + a1x + a2x2 + ... + an–1xn–1 + anxn sea divisible por (x – a). Supongamos que a es raíz de Pn(x). Si dividimos Pn(x) por (x–a), tendremos que Por último, dentro de las racionales tendremos: I) Enteras, cuando la incógnita no aparece en ningún denominador. II) Fraccionarias, cuando la incógnita aparece en algún denominador.

a) b)

Racionales, cuando la incógnita no aparece bajo el signo radical. Irracionales, en el caso contrario. Pn(x) = (x–a) q Pn–1(x) + R

Como a es una raíz, tendremos que Pn(a) = 0, y sustituyendo en la ecuación anterior, tendremos que Dentro de las algebraicas podemos distinguir:

Pn(a) = (a – a) q Pn–1(a) + R = 0

Trascendentes, si f(x) contiene al menos una función trascendente ax, ln x, cos x, etc.

2.

Algebraicas, si f(x) de la definición es una función polinómica.

1.

de donde R = 0, con lo que Pn(x) es divisible por (x – a). Si ahora suponemos que Pn(x) es divisible por (x – a), tendremos que al dividir Pn(x) entre (x – a), nos quedará que Pn(x) = (x – a) q Pn–1(x)

Las ecuaciones de una incógnita (que son las que trataremos en el tema) se pueden clasificar en función de la naturaleza de las expresiones que aparecen en sus miembros y serán:

2.1. Clasificación de las ecuaciones

Para x = a, tendremos que Pn(a) = 0, con lo que a será raíz de Pn(x).

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

250

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

COROLARIO Si x = a es raíz múltiple de orden p de la ecuación algebraica Pn(x) = 0, entonces Pn(x) = (x – a)p q Pn–p(x), donde Pn–p(a) ¹ 0, y recíprocamente. Al proceso mediante el cual es posible calcular las raíces de una ecuación algebraica se le llama resolver la ecuación. La resolución de ecuaciones algebraicas puede concretarse en dos preguntas: 1.

¿Existen raíces de las ecuaciones algebraicas?

2.

Si existen, ¿cómo calcularlas?

El teorema fundamental del álgebra, establece que toda ecuación algebraica con coeficientes complejos (en particular con coeficientes reales) tiene al menos una raíz que puede ser real o compleja. Como consecuencia del mismo, vemos la siguiente proposición PROPOSICIÓN Toda ecuación algebraica de grado n tiene exactamente n raíces (reales o complejas) contadas cada una con su orden de multiplicidad. En efecto, dada una ecuación algebraica Pn(x) = 0, donde Pn(x) = a0 + a1x + a2x2 + ... + an–1xn–1 + anxn, por el teorema fundamental existe un valor, que representaremos por x1, para el cual Pn(x1) = 0. Por la proposición anterior esto significa que Pn(x) es divisible por (x – x1), con lo que tendremos Pn(x) = (x – x1) · Pn–1(x) donde Pn–1(x) es un polinomio de grado n–1. De la misma manera si aplicamos el teorema fundamental del álgebra a Pn–1(x), este polinomio tendrá al menos una raíz que llamaremos x2. Repitiendo el proceso con este polinomio, llegamos a que Pn–1(x) = (x – x2) · Pn–2(x) con lo que Pn(x) = (x – x1) · (x – x2) · Pn–2(x) Si seguimos repitiendo el proceso hasta llegar a un polinomio de grado uno, tendremos que Pn(x) = (x – x1) · (x – x2) · (x – x3) · ... · (x – xn–1) · (anx + b) siendo la última raíz xn = –

b , lo que nos permite escribir el polinomio de la forma an

Pn(x) = an · (x – x1) · (x – x2) · (x – x3) · ... · (x – xn–1) · (x – xn) Si alguna de las raíces se repite p veces, diremos que es una raíz múltiple de orden de multiplicidad p. PROPOSICIÓN Si Pn(x) = 0 es una ecuación algebraica con coeficientes reales y tiene una raíz compleja z = a + bi (b ¹ 0), entonces su conjugada también es raíz de la ecuación. En efecto si z = a + bi es raíz de la ecuación, se verifica que a0 + a1z + a2z2 + ... + an–1zn–1 + anzn = 0 Veremos que z = a – b i es también raíz de Pn(x) = 0. Para que esto ocurra es necesario que Pn(x) sea divisible entre (x – z) y (x – z), con lo que podríamos descomponer Pn(x) = [x – (a + bi)] · [x – (a – bi)] · Pn–2(x) es decir Pn(x) = [(x – a)2 + b2] · Pn–2(x) TEMARIO DE MATEMÁTICAS. PRUEBA A

251

Volumen I. Matemáticas

252

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si elevamos los dos miembros de la ecuación a la misma potencia, resulta otra ecuación que tendrá todas las raíces de la primera y quizás alguna más.

c)

Multiplicar los dos miembros de la ecuación por un número real distinto de cero.

b)

Sumar a ambos miembros de la ecuación un mismo número (lo que conocemos como transponer términos; el que está en un miembro sumando pasa al otro restando y viceversa)

a)

con lo que Pn(x) debería ser divisible entre (x – a)2 + b2. Veremos que esto es cierto. Si dividimos Pn(x) entre (x – a)2 + b2, sea Qn–2(x) el cociente y px + q el resto, con lo que tendremos Pn(x) = Qn–2(x) · [(x – a)2 + b2] + px + q

Si en esta expresión sustituimos x por z = a + bi, observamos que Pn(z) = 0 (al ser z una raíz) y que (x – a)2 + b2 = 0, de lo que deducimos que pz + q = 0, o lo que es lo mismo p(a + bi) + q = 0. Si desarrollamos e igualamos coeficientes a cero llegamos a que

DEFINICIÓN. Dos ecuaciones algebraicas son equivalentes, cuando ambas tienen las mismas raíces con los mismos órdenes de multiplicidad. Para obtener ecuaciones equivalentes a una dada, podemos realizar las siguientes transformaciones: pa + q = 0 pb = 0

3.1. Ecuaciones equivalentes

y como b ¹ 0, ha de ser p = 0 y sustituyendo en la primera ecuación nos queda que q = 0. Así Pn(x) es divisible entre (x – a)2 + b2, con lo que z = a – b i es también una raíz de Pn(x). Resulta de lo anterior que si Pn(x) = 0 es una ecuación algebraica con coeficientes reales y de grado impar, entonces debe tener al menos una raíz real. `

En la práctica, para conocer el orden de multiplicidad de una raíz, deberemos comprobar el orden de la última derivada sucesiva que anula dicha raíz, siendo ese número menos uno el orden de multiplicidad de la misma.

PROPOSICIÓN Si a es una raíz múltiple de orden p de la ecuación algebraica Pn(x) = 0, entonces a es una raíz múltiple de orden p–1 de la ecuación algebraica Pn' ( x ) = 0, donde Pn' ( x ) es el polinomio derivado de Pn(x). En efecto si a es una raíz múltiple de orden p de la ecuación Pn(x) = 0, se verifica que Pn ( a ) = P' n ( a ) = Pn'' ( a ) =...= Pnp–1( a ) = 0 y Pnp ( a ) ¹ 0

PROPOSICIÓN Si a es una raíz múltiple de orden p de la ecuación algebraica Pn(x) = 0, se verifica Pn(x) = (x – a)p q Pn–p(x)

y al ser Q(a) ¹ 0, indica que a es una raíz múltiple de orden p–1 de Pn' ( x ). Si aplicamos la proposición reiteradas veces, podemos enunciar que

Si derivamos, tendremos

Pn' (x) = p(x – a )p–1× Pn– p (x) + (x – a )p × Pn–' p (x) =

(x – a )p–1( p × Pn– p (x) + (x – a )× Pn–' p (x)) = (x – a )p–1× Q(x)

(x – a )p–1( p × Pn– p (x) + (x – a )× Pn–' p (x)) = (x – a )p–1× Q(x) Pn' (x) = p(x – a )p–1× Pn– p (x) + (x – a )p × Pn–' p (x) =

y al ser Q(a) ¹ 0, indica que a es una raíz múltiple de orden p–1 de Pn' ( x ). Si aplicamos la proposición reiteradas veces, podemos enunciar que

Si derivamos, tendremos

Pn(x) = (x – a)p q Pn–p(x)

PROPOSICIÓN Si a es una raíz múltiple de orden p de la ecuación algebraica Pn(x) = 0, se verifica

PROPOSICIÓN Si a es una raíz múltiple de orden p de la ecuación algebraica Pn(x) = 0, entonces a es una raíz múltiple de orden p–1 de la ecuación algebraica Pn' ( x ) = 0, donde Pn' ( x ) es el polinomio derivado de Pn(x). En efecto si a es una raíz múltiple de orden p de la ecuación Pn(x) = 0, se verifica que Pn ( a ) = P' n ( a ) = Pn'' ( a ) =...= Pnp–1( a ) = 0 y Pnp ( a ) ¹ 0

`

En la práctica, para conocer el orden de multiplicidad de una raíz, deberemos comprobar el orden de la última derivada sucesiva que anula dicha raíz, siendo ese número menos uno el orden de multiplicidad de la misma.

y como b ¹ 0, ha de ser p = 0 y sustituyendo en la primera ecuación nos queda que q = 0. Así Pn(x) es divisible entre (x – a)2 + b2, con lo que z = a – b i es también una raíz de Pn(x). Resulta de lo anterior que si Pn(x) = 0 es una ecuación algebraica con coeficientes reales y de grado impar, entonces debe tener al menos una raíz real.

3.1. Ecuaciones equivalentes

pa + q = 0 pb = 0

DEFINICIÓN. Dos ecuaciones algebraicas son equivalentes, cuando ambas tienen las mismas raíces con los mismos órdenes de multiplicidad. Para obtener ecuaciones equivalentes a una dada, podemos realizar las siguientes transformaciones:

Si en esta expresión sustituimos x por z = a + bi, observamos que Pn(z) = 0 (al ser z una raíz) y que (x – a)2 + b2 = 0, de lo que deducimos que pz + q = 0, o lo que es lo mismo p(a + bi) + q = 0. Si desarrollamos e igualamos coeficientes a cero llegamos a que a)

Sumar a ambos miembros de la ecuación un mismo número (lo que conocemos como transponer términos; el que está en un miembro sumando pasa al otro restando y viceversa)

b)

Multiplicar los dos miembros de la ecuación por un número real distinto de cero.

Pn(x) = Qn–2(x) · [(x – a)2 + b2] + px + q

con lo que Pn(x) debería ser divisible entre (x – a)2 + b2. Veremos que esto es cierto. Si dividimos Pn(x) entre (x – a)2 + b2, sea Qn–2(x) el cociente y px + q el resto, con lo que tendremos 252

Si elevamos los dos miembros de la ecuación a la misma potencia, resulta otra ecuación que tendrá todas las raíces de la primera y quizás alguna más. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

c)

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

4. RESOLUCIÓN DE ECUACIONES ALGEBRAICAS DE GRADO £ 4 4.1. Ecuaciones de primer grado b Si la ecuación es de primer grado: ax + b = 0, con a ¹ 0, la solución es inmediata x = – . a

4.2. Ecuaciones de segundo grado La ecuación de segundo grado ax2 + bx + c = 0, fue ya resuelta en tiempos de la antigüedad. Veremos ahora su solución Se parte de:

ax2 + bx + c = 0

Se multiplica por 4a:

4a2x2 + 4abx + 4ac = 0

Se suma b2:

4a2x2 + 4abx + b2 + 4ac = b2

Se resta 4ac:

4a2x2 + 4abx + b2 = b2 – 4ac

Se factoriza:

(2ax + b)2 = b2 – 4ac

Por definición de

ì 2ax + b = b 2 – 4ac ï í ï 2 î2ax + b = – b – 4ac

Se despeja x:

:

ì –b + ï x1 = ï í ï –b – ïx2 = î

b 2 – 4ac 2a b 2 – 4ac 2a

En la práctica se utilizan las dos fórmulas a la vez, utilizando el símbolo ± , con lo que nos queda x=

–b ± b 2 – 4ac 2a

–b c y que x1 · x2 = . Al número b2 – 4ac se le llama discriminana a te y se representa por D. Cuando estemos en el campo real, la existencia de las soluciones de la ecuación de segundo grado vendrá determinada por el valor de D. Así, si D > 0, la ecuación tendrá dos soluciones reales, si D = 0, tendrá una única solución real (que será doble) y si D < 0 no tendrá soluciones reales. Es fácil ver que se verifica que x1 + x2 =

4.3. Ecuaciones de tercer grado Calcularemos ahora las soluciones de una ecuación algebraica de tercer grado a3y3 + a2y2 + a1y + a0 = 0, con a3 ¹ 0. Sin perder generalidad suponemos que a3 = 1, ya que si no fuera así podemos dividir toda la ecuación por a3. a Si efectuamos el cambio y = x – 2 , se anulará el término en y2, es decir, 3 (x –

a2 3 a a ) + a2(x – 2 )2 + a1(x – 2 ) + a0 = 3 3 3

a aa a2 a3 a2 a3 = x3 – 3 2 x2 + 3 2 x – 2 +a2x2 – 2 2 x + 2 + a1x – 1 2 + a0 = 3 3 9 27 3 9 TEMARIO DE MATEMÁTICAS. PRUEBA A

253

Volumen I. Matemáticas

254

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

x4 + a3x3 = –a2x2 – a1x – a0

x 3 – a 2x2 +

aa a 22 a3 a2 a3 x – 2 +a2x2 – 2 2 x + 2 + a1x – 1 2 + a0 = 3 3 27 3 9

ecuación que podemos escribir como

x4 + a3x3 + a2x2 + a1x + a0 = 0

2ö æ æ 3 ö ça1 – a 2 ÷ ÷x +ç ç 2 a 2 – a 1a 2 + a 0 ÷ ÷= 0 x3 +ç 3ø è 9 3 è ø

Las ecuaciones de cuarto grado fueron resueltas por Ferrari (1522-1565), haciendo las operaciones convenientes para transformarlas en unas de tercer grado. Sea la ecuación a4x4 + a3x3 + a2x2 + a1x + a0 = 0, con a4 ¹ 0. Sin pérdida de generalidad, supondremos que a4 = 1, ya que si así no fuera, podríamos dividir todos los coeficientes entre a4. De esta forma tendríamos ecuación que, como vemos, no lleva término en x2. Por tanto consideremos la ecuación cúbica de la forma x3 + px + q = 0

4.4. Ecuaciones de cuarto grado

Si hacemos x = u + v, tendremos

(u + v)3 + p(u + v) + q = 0 solución que se conoce como fórmula de Cardano pues fue publicada por primera vez en 1545 por él mismo en su obra Ars Magna. u3 + 3u2v + 3uv2 + v3 + p(u + v) + q = 0 u3 + v3 + 3uv(u + v) + p(u + v) + q = 0

q q 2 p3 3 q q 2 p3 + + + – – + 4 27 2 4 27 2

u3 + v3 + (3uv + p)(u + v) + q = 0

x=3 –

Esta igualdad se cumple cuando

u3 + v3 = –q

q q 2 p3 + + 2 4 27

v3 = –

q q 2 p3 – + 2 4 27

o lo que es lo mismo

y por lo tanto al ser x = u + v, tendremos que

3uv = –p

u3 = –

u3 + v3 = –q

y por tanto resolviendo la misma llegamos a que

p3 =0 27

u3v3 = –

p3 27

z2 + qz –

Si aplicamos las propiedades de suma y producto de las raíces de una ecuación de segundo grado, podemos asegurar que u3 y v3 serán las raíces de la ecuación

Si aplicamos las propiedades de suma y producto de las raíces de una ecuación de segundo grado, podemos asegurar que u3 y v3 serán las raíces de la ecuación p3 27

z2 + qz –

p3 =0 27

u3v3 = –

u3 + v3 = –q

y por tanto resolviendo la misma llegamos a que u3 = –

q q 2 p3 + + 2 4 27

y por lo tanto al ser x = u + v, tendremos que

v3 = –

q q 2 p3 – + 2 4 27

o lo que es lo mismo

3uv = –p

u3 + v3 = –q Esta igualdad se cumple cuando

x=3 –

q 2 p3 q q 2 p3 3 q + + + – – + 2 4 27 2 4 27

u3 + v3 + (3uv + p)(u + v) + q = 0

u3 + v3 + 3uv(u + v) + p(u + v) + q = 0

solución que se conoce como fórmula de Cardano pues fue publicada por primera vez en 1545 por él mismo en su obra Ars Magna. u3 + 3u2v + 3uv2 + v3 + p(u + v) + q = 0 (u + v)3 + p(u + v) + q = 0 Si hacemos x = u + v, tendremos

4.4. Ecuaciones de cuarto grado x3 + px + q = 0

Las ecuaciones de cuarto grado fueron resueltas por Ferrari (1522-1565), haciendo las operaciones convenientes para transformarlas en unas de tercer grado. Sea la ecuación a4x4 + a3x3 + a2x2 + a1x + a0 = 0, con a4 ¹ 0. Sin pérdida de generalidad, supondremos que a4 = 1, ya que si así no fuera, podríamos dividir todos los coeficientes entre a4. De esta forma tendríamos ecuación que, como vemos, no lleva término en x2. Por tanto consideremos la ecuación cúbica de la forma æ ö a 22 ö æ a 32 a 1a 2 x3 +ç + a0÷ ça1 – ÷ ÷x +ç ç2 – ÷= 0 3ø è 9 3 è ø x4 + a3x3 + a2x2 + a1x + a0 = 0

aa a 22 a3 a2 a3 x – 2 +a2x2 – 2 2 x + 2 + a1x – 1 2 + a0 = 3 3 27 3 9

x 3 – a 2x2 +

ecuación que podemos escribir como

x4 + a3x3 = –a2x2 – a1x – a0

254

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

Si sumamos a los dos miembros

a 23x2 , tendremos 4

æ 2 a 3x ö çx + ÷ è 2 ø

2

æ a 23 ö2 =ç ç – a2÷ ÷x – a1x – a 0 è4 ø

æ a xö y 2 Si volvemos a sumar a ambos miembrosç x2 + 3 ÷y + , obtendremos è 2 ø 4 2 ö 2 æ a 3y ö æ 2 a 3x y ö æ a 23 ö æy2 çx + + ÷ =ç – a1÷x +ç ç – a 2y ÷ ÷x +ç ç – a0÷ ÷ è ø è4 2 2ø è 4 ø è 2 ø

(2)

En el segundo miembro de la ecuación anterior tenemos un trinomio de segundo grado en x, cuyos coeficientes dependen de y. Elijamos y de modo que este trinomio sea el cuadrado de un binomio de primer grado (ax + b). Para que esto ocurra es necesario que el discriminante de la ecuación de segundo grado del segundo miembro de (2) sea cero, ya que Ax2 + Bx + C = (ax + b)2 implica que Ax2 + Bx + C = a2x2 + 2abx + b2 de donde A = a2

C = b2

B = 2ab a= A

b= C

(3)

2

y se verifica que B – 4AC = 0. Por lo tanto si elegimos y de forma que 2 öæ y 2 ö æ a 3y ö æ a 23 ç – a1÷ – 4ç ç – a2 + y÷ ÷ç ç – a0÷ ÷= 0 è 2 ø è4 4 øè ø

(4)

la primera parte de la ecuación (2) será el cuadrado perfecto (ax + b)2. Operando en (4) se obtiene una ecuación en y de la forma y 3 – a 22y + (a 3a1 – 4a 0 )y – [a 0 (a 32 – 4a 3a 2 ) + a12] = 0 que se puede resolver mediante la fórmula de Cardano. A pesar de haber obtenido las soluciones para una ecuación algebraica de cuarto grado, debido a la complejidad de cálculo de la misma así como de que para grados superiores a cuatro no se han encontrado fórmulas que las resuelvan (como demostraron Abel y Galois a principios del siglo XIX), se hace necesario encontrar métodos que nos aproximen las raíces de las mismas con una precisión determinada para poder resolver problemas cotidianos y científicos. De todas formas, si la ecuación tiene raíces enteras o racionales, podemos utilizar métodos para poder despejarlas, pero no en el caso de que dichas raíces sean reales.

5. RAÍCES ENTERAS Y RACIONALES DE UNA ECUACIÓN ALGEBRAICA Dado que al conocer una raíz de una ecuación algebraica reduce la resolución de la misma a una de grado inferior, es conveniente poder obtener, si es posible, algunas raíces sencillas que nos permitan ir simplificando el problema. Cuando la ecuación algebraica tiene todos sus coeficientes racionales, es posible que alguna de sus raíces sea racional. Si multiplicamos todos los coeficientes por el mínimo común múltiplo de los denominadores, obtendremos una ecuación algebraica con todos sus coeficientes enteros, que será con la que trabajemos ahora. Sea pues Pn(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, con los ai enteros. TEMARIO DE MATEMÁTICAS. PRUEBA A

255

Volumen I. Matemáticas

256

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En principio calculamos Pn(1), que puede ser o no cero. Si es cero, dividimos Pn(x) entre x – 1, para obtener un polinomio de grado n – 1. Análogamente se hace con Pn(–1). Si ninguno de los dos fuera raíz, una vez obtenidos los divisores del término independiente, antes de comprobar por sustitución directa si cumplen la ecuación se puede ver si al sumarles o restarle 1 son divisores de Pn(1) o de Pn(–1).

PROPOSICIÓN Dada la ecuación algebraica Pn(x) = 0, si Pn(0) y Pn(1) son números impares, no hay raíces enteras En efecto, si Pn(0) y Pn(1) son impares, utilizando el desarrollo de Taylor del polinomio Pn(x) en potencias de (x–a), tendremos



Pn' ( a ) P'' ( a ) Pn ( a ) (x – a) + n (x – a)2 + … + n (x – a)n 1! 2! n!

El uso de esta propiedad como criterio de exclusión es el siguiente:

Pn(x) = Pn(a) +

de donde podemos deducir lo que queríamos demostrar.

Si aplicamos este desarrollo para a = 0 y x = 0 + 2n, tendremos Pn(–1) = (–1 – a) · Pn–1(–1)

Pn(0 + 2n) = Pn(2n) = Pn(0) +

Pn' (0) P'' (0) Pn (0) 2n + n (2n)2 + … + n (2n)n 1! 2! n!

Pn(1) = (1 – a) · Pn–1(1)

Si en esta igualdad tomamos x = 1 y x = –1, tenemos

Y si ahora lo aplicamos para a = 1 y x = 1 + 2n, tendremos Pn(x) = (x – a) · Pn–1(x) Pn(1 + 2n) = Pn(1) +

Pn' (1) P'' (1) Pn (1) 2n + n (2n)2 + … + n (2n)n 1! 2! n!

PROPOSICIÓN Si a es una raíz entera de la ecuación Pn(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, entonces Pn(1) es múltiplo de a – 1 y Pn(–1) es múltiplo de a + 1. En efecto si a es raíz de Pn(x), este polinomio es divisible por x – a, de donde

expresiones que son siempre impares y no pueden anularse. Como toda raíz entera será o bien par x = 2n o bien impar x = 2n + 1, la proposición queda demostrada.

PROPOSICIÓN Si a es una raíz entera de la ecuación algebraica a0 + a1x + a2x2+ … + an–1xn–1 + anxn = 0, entonces a es divisor del término independiente a0. En efecto si a es raíz de esa ecuación se verificará que

de donde deducimos que a es divisor de a0. De aquí resulta que si la ecuación tiene alguna raíz entera esta debe ser divisor del término independiente. Por lo tanto, si ninguno de los divisores del término independiente verifica la ecuación, podemos afirmar que esta no tiene raíces enteras. a0 + a1a + a2a2 + … + an–1an–1 + anan = 0

a0 = –(a1 + a2a + … + an–1an–2 + anan–1) · a de donde

de donde a0 = –(a1 + a2a + … + an–1an–2 + anan–1) · a a0 + a1a + a2a2 + … + an–1an–1 + anan = 0

de donde deducimos que a es divisor de a0. De aquí resulta que si la ecuación tiene alguna raíz entera esta debe ser divisor del término independiente. Por lo tanto, si ninguno de los divisores del término independiente verifica la ecuación, podemos afirmar que esta no tiene raíces enteras.

PROPOSICIÓN Si a es una raíz entera de la ecuación algebraica a0 + a1x + a2x2+ … + an–1xn–1 + anxn = 0, entonces a es divisor del término independiente a0. En efecto si a es raíz de esa ecuación se verificará que

PROPOSICIÓN Si a es una raíz entera de la ecuación Pn(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, entonces Pn(1) es múltiplo de a – 1 y Pn(–1) es múltiplo de a + 1. En efecto si a es raíz de Pn(x), este polinomio es divisible por x – a, de donde

expresiones que son siempre impares y no pueden anularse. Como toda raíz entera será o bien par x = 2n o bien impar x = 2n + 1, la proposición queda demostrada. Pn(1 + 2n) = Pn(1) +

Pn' (1) P'' (1) Pn (1) 2n + n (2n)2 + … + n (2n)n 1! 2! n!

Pn(x) = (x – a) · Pn–1(x)

Y si ahora lo aplicamos para a = 1 y x = 1 + 2n, tendremos

Si en esta igualdad tomamos x = 1 y x = –1, tenemos P (0) P'' (0) Pn (0) 2n + n (2n)2 + … + n (2n)n 1! 2! n!

Pn(1) = (1 – a) · Pn–1(1)

Pn(0 + 2n) = Pn(2n) = Pn(0) +

' n

Pn(–1) = (–1 – a) · Pn–1(–1)

Si aplicamos este desarrollo para a = 0 y x = 0 + 2n, tendremos de donde podemos deducir lo que queríamos demostrar.

Pn(x) = Pn(a) +

Pn' ( a ) P'' ( a ) Pn ( a ) (x – a) + n (x – a)2 + … + n (x – a)n 1! 2! n!

El uso de esta propiedad como criterio de exclusión es el siguiente:



En principio calculamos Pn(1), que puede ser o no cero. Si es cero, dividimos Pn(x) entre x – 1, para obtener un polinomio de grado n – 1. Análogamente se hace con Pn(–1). Si ninguno de los dos fuera raíz, una vez obtenidos los divisores del término independiente, antes de comprobar por sustitución directa si cumplen la ecuación se puede ver si al sumarles o restarle 1 son divisores de Pn(1) o de Pn(–1).

PROPOSICIÓN Dada la ecuación algebraica Pn(x) = 0, si Pn(0) y Pn(1) son números impares, no hay raíces enteras En efecto, si Pn(0) y Pn(1) son impares, utilizando el desarrollo de Taylor del polinomio Pn(x) en potencias de (x–a), tendremos

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

256

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces PROPOSICIÓN p (irreducible) es una raíz racional de Pn(x) = a0 + a1x + a2x2 + … +an–1xn–1 + anxn = 0, el numeraq dor p es divisor del término independiente a0 y el denominador q es divisor del coeficiente del término de mayor grado an. Si

En efecto si

p es raíz de Pn(x) = 0, se verifica q p p2 p n–1 pn a0 + a1 + a2 2 + … + an–1 n–1 + an n = 0 q q q q

Si multiplicamos la igualdad por qn, tendremos qna0 + qn–1a1p + qn–2a2p2 + … + qan–1pn–1 + anpn = 0 de donde podemos deducir las siguientes igualdades anpn = –q · (qn–1a0 + qn–2a1p + qn–3a2p2 + … + an–1pn–1) qna0 = –p · (qn–1a1 + qn–2a2p + … + qan–1pn–2 + anpn–1) igualdades que nos dicen que al ser p y q primos entre sí, p tiene que dividir a a0 y q tiene que dividir a an. PROPOSICIÓN p Si (irreducible) es una raíz racional de Pn(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, entonces Pn(1) q es múltiplo de q – p y Pn(–1) es múltiplo de q + p. En efecto al ser

p p raíz de Pn(x), el polinomio Pn(x) es divisible por x – , de donde tenemos q q æ qx – p ö æ pö ÷ Pn (x) =ç ç ÷× Pn–1(x) çx – ÷ ÷× Pn–1(x) =ç è q ø è qø

Si tomamos los valores x = 1 y x = –1, tendremos æ Pn–1(1) ö æq – p ö ÷ ÷ Pn (1) =ç ç ÷ ç ÷× Pn–1(1) = (q – p)×ç è q ø è q ø æ Pn–1(–1) ö æ –q – p ö ÷ ÷ Pn (–1) =ç ç ÷ ç ÷× Pn–1(–1) = –(q + p)×ç è q ø è q ø que es lo que queríamos obtener.

6. RAÍCES REALES DE UNA ECUACIÓN ALGEBRAICA Hasta ahora se han visto procedimientos para calcular las raíces enteras y racionales de una ecuación algebraica con coeficientes racionales, pero en el caso de que no tenga raíces de este tipo, o que la ecuación algebraica tenga coeficientes reales, tenemos que intentar hallar las raíces reales con una aproximación determinada. Para ello daremos tres pasos: el primero consiste en la acotación, el segundo en la separación y el tercero en la aproximación de las mismas. TEMARIO DE MATEMÁTICAS. PRUEBA A

257

Volumen I. Matemáticas

258

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si tomamos a = 3 y dividimos Q(x) entre x – 3, nos da de polinomio cociente x2 + 3x + 4 y de resto 11, luego 3 es una cota superior de todas las raíces Q(x). Así –3 será una cota inferior de las raíces de P(x).



Si tomamos a = 2 y dividimos Q(x) entre x – 2, nos da de polinomio cociente x2 + 2x – 1 y de resto –3, luego 2 no es cota superior de las raíces de Q(x).



6.1. Acotación de las raíces reales de una ecuación algebraica

Acotar las raíces de una ecuación algebraica consiste en encontrar dos números reales M y m, de manera que todas las raíces de la ecuación se encuentren en el intervalo (m, M), es decir, que M sea cota superior de todas las raíces y m cota inferior de las mismas. Empezaremos por determinar la cota superior del conjunto de raíces de una ecuación algebraica para lo que existen varios métodos:

Ejemplo. Calcular una cota inferior de las raíces del polinomio P(x) = x3 – 5x + 1. Para calcular una cota inferior, hallamos una cota superior de P(–x) y la cota inferior será esta cambiada de signo. Q(x) = P(–x) = –x3 + 5x + 1. Al igualar a cero podemos hacer Q(x) = x3 – 5x – 1 = 0.

6.1.1. Método de Laguerre

Si al dividir Pn(x) por x – a, con a > 0, todos los coeficientes del polinomio cociente y el resto de la división son positivos, entonces a es cota superior de todas las raíces de Pn(x). En efecto, si dividimos por x–a, tenemos

Para cualquier número x1 > a, Pn(x1) > 0, al ser Pn(a) > 0, Pn'(a), Pn'' (a), ..., Pnn(a) > 0 y (x1 – a) > 0, por lo que x1 no puede ser raíz de Pn(x). Así, a es cota superior de todas las raíces de Pn(x). Para calcular una cota inferior de las raíces de Pn(x), lo que hacemos es sustituir x por –x, obteniendo así Pn(–x). Calculamos ahora una cota superior de las raíces de este polinomio (k), que cambiada de signo será cota inferior de las raíces de Pn(x) (–k). Pn(x) = (x – a) · Pn–1(x) + R

Pn–1(x) es un polinomio con todos sus coeficientes positivos, por lo que si tomamos un valor de x > 0, nos dará siempre positivo. Si x1 > a > 0, tendremos que (x1 – a) > 0, Pn–1(x1) > 0 y R > 0, de donde Pn(x1) > 0, por lo que x1 no puede ser raíz de Pn(x). Así a es cota superior de todas las raíces de Pn(x). Pn(x) = Pn(a) +

Pn' ( a ) P'' ( a ) Pn (x – a) + n (x – a)2 + … + n (x – a)n 1! 2! n!

Si un número a es tal que hace positivo al polinomio Pn(x) y a todas sus derivadas, dicho número es cota superior de todas las raíces de Pn(x). En efecto, si desarrollamos por Taylor Pn(x) en un entorno del punto a, tendremos Ejemplo. Calcular una cota superior de las raíces del polinomio P(x) = x3 – 5x + 1.



Si tomamos a = 2 y dividimos P(x) entre x – 2, nos da de polinomio cociente x2 + 2x – 1 y de resto –1, luego 2 no es cota superior de las raíces de P(x).



Si tomamos a = 3 y dividimos P(x) entre x – 3, nos da de polinomio cociente x2 + 3x + 4 y de resto 13, luego 2 es una cota superior de todas las raíces P(x).

6.1.2. Método de Newton

Si tomamos a = 3 y dividimos P(x) entre x – 3, nos da de polinomio cociente x2 + 3x + 4 y de resto 13, luego 2 es una cota superior de todas las raíces P(x).



Si tomamos a = 2 y dividimos P(x) entre x – 2, nos da de polinomio cociente x2 + 2x – 1 y de resto –1, luego 2 no es cota superior de las raíces de P(x).



6.1.2. Método de Newton

Si un número a es tal que hace positivo al polinomio Pn(x) y a todas sus derivadas, dicho número es cota superior de todas las raíces de Pn(x). En efecto, si desarrollamos por Taylor Pn(x) en un entorno del punto a, tendremos Ejemplo. Calcular una cota superior de las raíces del polinomio P(x) = x3 – 5x + 1.

Pn–1(x) es un polinomio con todos sus coeficientes positivos, por lo que si tomamos un valor de x > 0, nos dará siempre positivo. Si x1 > a > 0, tendremos que (x1 – a) > 0, Pn–1(x1) > 0 y R > 0, de donde Pn(x1) > 0, por lo que x1 no puede ser raíz de Pn(x). Así a es cota superior de todas las raíces de Pn(x). Pn(x) = Pn(a) +

Pn' ( a ) P'' ( a ) Pn (x – a) + n (x – a)2 + … + n (x – a)n 1! 2! n!

Para cualquier número x1 > a, Pn(x1) > 0, al ser Pn(a) > 0, Pn'(a), Pn'' (a), ..., Pnn(a) > 0 y (x1 – a) > 0, por lo que x1 no puede ser raíz de Pn(x). Así, a es cota superior de todas las raíces de Pn(x). Para calcular una cota inferior de las raíces de Pn(x), lo que hacemos es sustituir x por –x, obteniendo así Pn(–x). Calculamos ahora una cota superior de las raíces de este polinomio (k), que cambiada de signo será cota inferior de las raíces de Pn(x) (–k). Pn(x) = (x – a) · Pn–1(x) + R

Si al dividir Pn(x) por x – a, con a > 0, todos los coeficientes del polinomio cociente y el resto de la división son positivos, entonces a es cota superior de todas las raíces de Pn(x). En efecto, si dividimos por x–a, tenemos

Ejemplo. Calcular una cota inferior de las raíces del polinomio P(x) = x3 – 5x + 1. Para calcular una cota inferior, hallamos una cota superior de P(–x) y la cota inferior será esta cambiada de signo. Q(x) = P(–x) = –x3 + 5x + 1. Al igualar a cero podemos hacer Q(x) = x3 – 5x – 1 = 0.

6.1.1. Método de Laguerre

Acotar las raíces de una ecuación algebraica consiste en encontrar dos números reales M y m, de manera que todas las raíces de la ecuación se encuentren en el intervalo (m, M), es decir, que M sea cota superior de todas las raíces y m cota inferior de las mismas. Empezaremos por determinar la cota superior del conjunto de raíces de una ecuación algebraica para lo que existen varios métodos:



Si tomamos a = 2 y dividimos Q(x) entre x – 2, nos da de polinomio cociente x2 + 2x – 1 y de resto –3, luego 2 no es cota superior de las raíces de Q(x).



Si tomamos a = 3 y dividimos Q(x) entre x – 3, nos da de polinomio cociente x2 + 3x + 4 y de resto 11, luego 3 es una cota superior de todas las raíces Q(x). Así –3 será una cota inferior de las raíces de P(x).

6.1. Acotación de las raíces reales de una ecuación algebraica

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

258

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces

6.2. Separación de raíces de una ecuación cualquiera No existen métodos específicos para resolver el problema de la separación de raíces, pero si se observa y estudia la función, se podrán delimitar de forma aproximada las zonas donde esta tenga una raíz. De todas formas enunciaremos algunos métodos que nos ayudarán a ir separando las raíces. La siguiente proposición nos servirá de criterio para separar raíces, ya que nos delimita intervalos donde sólo existe una raíz. PROPOSICIÓN Sea f(x) una función continua en [a,b], tal que f(a) y f(b) tienen signos distintos. Si f es derivable en (a,b) y su derivada tiene signo constante en dicho intervalo, entonces existe un único punto c Î (a,b) tal que f(c)=0. En efecto, al ser continua en [a,b] y tomar valores de distinto signo en los extremos del intervalo, Bolzano nos asegura la existencia de al menos una raíz, c Î (a,b). Debemos comprobar que esta raíz es única. Supondremos por la hipótesis que f’(x) > 0, para todo x perteneciente al intervalo (a,b), lo que nos dice que f(x) es estrictamente creciente en dicho intervalo, por lo que f(x) < f(c) = 0 si x < c y f(x) > f(c) = 0 si x > c lo que demuestra que c es la única raíz en el intervalo (a,b). Si se supone que la derivada es negativa para todo valor del intervalo (función estrictamente decreciente), la demostración es análoga. Cuando en un intervalo la derivada no tenga signo constante, no podemos afirmar nada sobre el número de raíces que hay en él, ya que en algunos puntos la función crece y en otros decrece. Se pueden observar las figuras adjuntas, donde se ve que el signo de la derivada no es constante.

F(a) · F(b) < 0

b

b

a

a

Una raíz

Varias raíces Figura 1. Distinto signo en los extremos.

F(a) · F(b) > 0

a

a

b

Ninguna raíz

Una raíz

b

a

b

Varias raíces

Figura 2. Igual signo en los extremos.

TEMARIO DE MATEMÁTICAS. PRUEBA A

259

Volumen I. Matemáticas

260

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Sea P(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, que suponemos admite únicamente raíces simples (para que P(x) y P’(x) no tengan raíces comunes). Calculamos P’(x) y efectuamos la división euclídea, teniendo P(x) = P’(x) · Q1(x) + R1(x) También es útil para aislar raíces de una ecuación, un corolario del teorema de Rolle:

COROLARIO Dada una función f(x), continua y derivable en R, entre dos raíces consecutivas de la misma hay un número impar de raíces de la ecuación f’(x) = 0 y entre dos raíces consecutivas de la ecuación f’(x) = 0 hay a lo sumo una raíz de f(x). Otra forma de poder separar raíces es utilizando el método gráfico. Si la ecuación f(x) = 0 tiene una ecuación equivalente de la forma g(x) = h(x) y las funciones de las gráficas de g y h son fáciles de representar gráficamente, los puntos de intersección de las mismas nos darán de forma aproximada las abcisas de las raíces de f.

6.3.1. Método de Sturm

y el signo de Pn–k(a) es el mismo que el signo de Pn–k(b), ya que si fuera distinto tendría que haber en (a,b) una raíz de Pn–k(x), que también sería de Pn(x). También tenemos que (a – ai) < 0 y (b – ai) > 0, para todo valor i, de donde si el signo de Pn(a) es distinto al signo de Pn(b), nos llevaría a que el signo de (a – a1) · (a – a2) · … · (a – ak) tiene que ser distinto al signo de (b – a1) · (b – a2) · … · (b – ak), cosa que sólo ocurre cuando en ambos miembros tenemos un número impar de factores. Con el mismo razonamiento llegamos a que si el signo de Pn(a) es igual al signo de Pn(b) tenemos que tener un número par de factores o ninguno. Para aislar las raíces de una ecuación algebraica Pn(x) = 0, aplicaremos el teorema de Bolzano a Pn(x) al ser esta una función continua en toda la recta real. Una vez acotadas las mismas, encontramos un intervalo (m,M), donde se encuentran todas las raíces de la ecuación. Si Pn(m) y Pn(M) tienen el mismo signo el número de raíces contenidas en dicho intervalo será cero o par. Si tienen signos contrarios, el número de raíces contenidas en dicho intervalo será impar. Para aislar alguna de estas raíces tomamos un punto z intermedio entre m y M, y vemos el signo de Pn(z). Si este es contrario a Pn(m) o a Pn(M), el teorema de Bolzano nos asegura que en el intervalo (m,z) o en el (z,M) existe al menos una raíz. Procediendo sucesivamente de la misma forma podemos llegar a aislar dicha raíz.

6.3. Separación de raíces de una ecuación algebraica

Aparte de los métodos de separación de raíces vistos en el apartado anterior que también nos sirven para separar raíces de una ecuación algebraica, veremos algunos que son específicos para las ecuaciones algebraicas. Hasta ahora hemos visto cómo acotar las raíces de una ecuación algebraica, lo que nos permite conocer entre qué números se encuentran las posibles raíces reales de la misma. Ahora bien, nuestro objetivo es hallar dichas raíces de la forma más aproximada posible, y para ello es conveniente separarlas o aislarlas hallando intervalos de la recta de una longitud determinada donde se encuentre una raíz real para después irlas aproximando hasta un grado de precisión determinado. Pn(b) = (b – a1) · (b – a2) · … · (b – ak) · Pn–k(b)

PROPOSICIÓN Si una función polinómica Pn(x) toma valores de signo contrario en los extremos del intervalo [a,b], entonces en dicho intervalo existe un número impar de raíces de la ecuación Pn(x) = 0, y si toma valores del mismo signo entonces existe un número par de raíces (que puede ser cero). En efecto sean a1, a2, ..., ak las raíces de Pn(x) = 0 en el intervalo (a,b). Descomponiendo el polinomio, se verifica que Pn(x) = (x – a1) · (x – a2) · … · (x – ak) · Pn–k(x)

donde Pn–k(x) es distinto de cero en el intervalo (a,b). Si sustituimos x en esta expresión por a y b, tenemos Pn(a) = (a – a1) · (a – a2) · … · (a – ak) · Pn–k(a)

PROPOSICIÓN Si una función polinómica Pn(x) toma valores de signo contrario en los extremos del intervalo [a,b], entonces en dicho intervalo existe un número impar de raíces de la ecuación Pn(x) = 0, y si toma valores del mismo signo entonces existe un número par de raíces (que puede ser cero). En efecto sean a1, a2, ..., ak las raíces de Pn(x) = 0 en el intervalo (a,b). Descomponiendo el polinomio, se verifica que Pn(x) = (x – a1) · (x – a2) · … · (x – ak) · Pn–k(x)

donde Pn–k(x) es distinto de cero en el intervalo (a,b). Si sustituimos x en esta expresión por a y b, tenemos Pn(a) = (a – a1) · (a – a2) · … · (a – ak) · Pn–k(a) Pn(b) = (b – a1) · (b – a2) · … · (b – ak) · Pn–k(b)

Aparte de los métodos de separación de raíces vistos en el apartado anterior que también nos sirven para separar raíces de una ecuación algebraica, veremos algunos que son específicos para las ecuaciones algebraicas. Hasta ahora hemos visto cómo acotar las raíces de una ecuación algebraica, lo que nos permite conocer entre qué números se encuentran las posibles raíces reales de la misma. Ahora bien, nuestro objetivo es hallar dichas raíces de la forma más aproximada posible, y para ello es conveniente separarlas o aislarlas hallando intervalos de la recta de una longitud determinada donde se encuentre una raíz real para después irlas aproximando hasta un grado de precisión determinado.

y el signo de Pn–k(a) es el mismo que el signo de Pn–k(b), ya que si fuera distinto tendría que haber en (a,b) una raíz de Pn–k(x), que también sería de Pn(x). También tenemos que (a – ai) < 0 y (b – ai) > 0, para todo valor i, de donde si el signo de Pn(a) es distinto al signo de Pn(b), nos llevaría a que el signo de (a – a1) · (a – a2) · … · (a – ak) tiene que ser distinto al signo de (b – a1) · (b – a2) · … · (b – ak), cosa que sólo ocurre cuando en ambos miembros tenemos un número impar de factores. Con el mismo razonamiento llegamos a que si el signo de Pn(a) es igual al signo de Pn(b) tenemos que tener un número par de factores o ninguno. Para aislar las raíces de una ecuación algebraica Pn(x) = 0, aplicaremos el teorema de Bolzano a Pn(x) al ser esta una función continua en toda la recta real. Una vez acotadas las mismas, encontramos un intervalo (m,M), donde se encuentran todas las raíces de la ecuación. Si Pn(m) y Pn(M) tienen el mismo signo el número de raíces contenidas en dicho intervalo será cero o par. Si tienen signos contrarios, el número de raíces contenidas en dicho intervalo será impar. Para aislar alguna de estas raíces tomamos un punto z intermedio entre m y M, y vemos el signo de Pn(z). Si este es contrario a Pn(m) o a Pn(M), el teorema de Bolzano nos asegura que en el intervalo (m,z) o en el (z,M) existe al menos una raíz. Procediendo sucesivamente de la misma forma podemos llegar a aislar dicha raíz.

6.3. Separación de raíces de una ecuación algebraica

COROLARIO Dada una función f(x), continua y derivable en R, entre dos raíces consecutivas de la misma hay un número impar de raíces de la ecuación f’(x) = 0 y entre dos raíces consecutivas de la ecuación f’(x) = 0 hay a lo sumo una raíz de f(x). Otra forma de poder separar raíces es utilizando el método gráfico. Si la ecuación f(x) = 0 tiene una ecuación equivalente de la forma g(x) = h(x) y las funciones de las gráficas de g y h son fáciles de representar gráficamente, los puntos de intersección de las mismas nos darán de forma aproximada las abcisas de las raíces de f.

6.3.1. Método de Sturm

Sea P(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn = 0, que suponemos admite únicamente raíces simples (para que P(x) y P’(x) no tengan raíces comunes). Calculamos P’(x) y efectuamos la división euclídea, teniendo P(x) = P’(x) · Q1(x) + R1(x) También es útil para aislar raíces de una ecuación, un corolario del teorema de Rolle:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

260

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces Ahora llamamos P1(x) = –R1(x) y dividimos P’(x) entre P1(x), quedándonos P’(x) = P1(x) · Q2(x) + R2(x) De aquí llamamos P2(x) = –R2(x) y dividimos P1(x) entre P2(x), con lo que vamos formando una sucesión P(x), P’(x), P1(x), P2(x), … que esquemáticamente queda como sigue Cociente Dividendo/divisor Resto

P(x) –P1(x)

Q1(x) P’(x) –P2(x)

Q2(x) P1(x) –P3(x)

Q3(x) P2(x) –P4(x)

................ P3(x) ................

Necesariamente el último polinomio de la sucesión Pk(x), que es máximo común divisor de P(x) y de P’(x) tiene que ser una constante distinta de cero. No puede ser un polinomio ya que P(x) = 0 y P’(x) = 0 tienen comunes las raíces de su máximo común divisor y según la hipótesis no tienen raíces comunes. Definimos, pues, la sucesión de Sturm de la ecuación P(x) = 0, como la sucesión de polinomios P(x), P’(x), P1(x), ..., Pk(x), obtenida anteriormente donde se cumple que Pi(x) = Pi+1(x) · Qi+2(x) – Pi+2(x), para todo valor i desde 1 hasta k – 2. El teorema de Sturm, que no demostramos dice: Sea P(x) = 0 un polinomio con coeficientes reales y sin raíces múltiples. El número de raíces reales contenidas en un intervalo (a,b) en cuyos extremos no se anula el polinomio P(x) es igual a la diferencia de variaciones de signo que toma la sucesión de Sturm para los valores x = a y x = b. El método de Sturm consiste en dada una ecuación P(x) = 0: 1.

Acotar las raíces. Sean m y M las cotas inferior y superior de las raíces de P(x).

2.

Construir la sucesión de Sturm de P(x) = 0, es decir, P(x), P’(x), P1(x), ..., Pk(x) El número de raíces reales en el intervalo (m,M), viene dado por : núm. de var.[P(a), P’(a), P1(a), ..., Pk(a)] – núm. de var..[P(b), P’(b), P1(b), ..., Pk(b)] Ejemplo. Separar las raíces de P(x) = x3 – 5x + 1 por el método de Sturm.

En principio acotamos las raíces, hecho ya en los ejemplos anteriores y vemos que el intervalo donde se encuentran es el (–3,3). Generamos ahora la sucesión de Stur P(x) = x3 – 3x + 1 P’(x) = 3x2 – 3 P1(x) = 10x + 3 P2(x) = 41 Si hacemos la tabla de los signos para cada número entero del intervalo (–3,3), tenemos x

signo P(x)

signo P’(x)

signo P1(x)

signo P2(x)

Variaciones

–3



+



+

3

–2

+

+



+

2

–1

+





+

2

0

+



+

+

2

1





+

+

1

2



+

+

+

1

3

+

+

+

+

0

Así pues, en el intervalo (–3,3), P(x) tiene tres raíces repartidas en los intervalos (–3,–2), (0,1) y (2,3). TEMARIO DE MATEMÁTICAS. PRUEBA A

261

Volumen I. Matemáticas

262

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Figura 3. Método regula falsi.

6.3.2. Teorema de Budan–Fourier Dado el polinomio Pn(x) = a0 + a1x + a2x2 +…+ an–1xn–1 + anxn y un intervalo [a,b] tal que Pn(a) · Pn(b) ¹ 0, el número de raíces (contadas con su multiplicidad) de la ecuación Pn(x) = 0, es igual a V(a) – V(b) – 2k, con k perteneciente a los naturales, siendo V(x) = Var{Pn(x), Pn’(x), Pn’’(x), ..., Pnn(x)}. a

b

c

6.3.3. Teorema de Descartes El número de raíces positivas distintas de un polinomio P(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn es igual o inferior en un número par a

Consideremos la ecuación f(x) = 0, con f(x) función continua, que tiene un único cero en el intervalo (a,b) donde toma valores de signo contrario. El método consiste en aproximar la raíz de la ecuación que existe entre a y b por el punto de intersección de la cuerda que une los puntos (a,f(a)) y (b,f(b)) y el eje de abcisas. Var{an, an–1, an–2, ..., a1, a0}

7.2. Método de regula falsi (falsa posición)

7. APROXIMACIÓN DE RAÍCES REALES

Una vez separadas las raíces de una ecuación f(x) = 0,donde suponemos que f(x) es continua al menos en los intervalos de separación de raíces, tratamos de aproximar al verdadero valor de la raíz. Una aproximación a una raíz a, con un error menor que e, consistirá en encontrar un número real x, tal que |x–a| < e .

Para aproximar esa raíz, un método general es aplicar reiteradamente el teorema de Bolzano, haciendo el intervalo donde está contenida la raíz cada vez más pequeño, hasta lograr que la amplitud del mismo sea menor que el error que queremos cometer e. Para ello, una vez separada la raíz, tenemos un intervalo (a,b), de amplitud b – a donde está contenida a+b y calculamos f(c). Si f(c) > 0, hala misma. Suponemos que f(a) < 0 y f(b) > 0. Tomamos el punto c = 2 cemos a1 = a y b1 = c, y si f(c) < 0, hacemos a1 = c y b1 = b, obteniendo en cualquier caso un intervalo (a1,b1) a–b donde está contenida la raíz de f(x) = 0. Procediendo de forma reiterada iremos conside amplitud 2 guiendo intervalos cada vez más pequeños que contendrán una raíz de f(x) = 0. Cuando la amplitud del intervalo sea menor que el error que queremos cometer al aproximar la raíz, cualquier punto del intervalo podemos darlo como raíz de la ecuación con un error menor al que queríamos cometer.

7.1. Método de Bolzano

Para aproximar esa raíz, un método general es aplicar reiteradamente el teorema de Bolzano, haciendo el intervalo donde está contenida la raíz cada vez más pequeño, hasta lograr que la amplitud del mismo sea menor que el error que queremos cometer e. Para ello, una vez separada la raíz, tenemos un intervalo (a,b), de amplitud b – a donde está contenida a+b y calculamos f(c). Si f(c) > 0, hala misma. Suponemos que f(a) < 0 y f(b) > 0. Tomamos el punto c = 2 cemos a1 = a y b1 = c, y si f(c) < 0, hacemos a1 = c y b1 = b, obteniendo en cualquier caso un intervalo (a1,b1) a–b donde está contenida la raíz de f(x) = 0. Procediendo de forma reiterada iremos conside amplitud 2 guiendo intervalos cada vez más pequeños que contendrán una raíz de f(x) = 0. Cuando la amplitud del intervalo sea menor que el error que queremos cometer al aproximar la raíz, cualquier punto del intervalo podemos darlo como raíz de la ecuación con un error menor al que queríamos cometer.

7.1. Método de Bolzano

Una vez separadas las raíces de una ecuación f(x) = 0,donde suponemos que f(x) es continua al menos en los intervalos de separación de raíces, tratamos de aproximar al verdadero valor de la raíz. Una aproximación a una raíz a, con un error menor que e, consistirá en encontrar un número real x, tal que |x–a| < e .

7. APROXIMACIÓN DE RAÍCES REALES

7.2. Método de regula falsi (falsa posición)

Consideremos la ecuación f(x) = 0, con f(x) función continua, que tiene un único cero en el intervalo (a,b) donde toma valores de signo contrario. El método consiste en aproximar la raíz de la ecuación que existe entre a y b por el punto de intersección de la cuerda que une los puntos (a,f(a)) y (b,f(b)) y el eje de abcisas. Var{an, an–1, an–2, ..., a1, a0}

es igual o inferior en un número par a

P(x) = a0 + a1x + a2x2 + … + an–1xn–1 + anxn El número de raíces positivas distintas de un polinomio

6.3.3. Teorema de Descartes c

b

a

Dado el polinomio Pn(x) = a0 + a1x + a2x2 +…+ an–1xn–1 + anxn y un intervalo [a,b] tal que Pn(a) · Pn(b) ¹ 0, el número de raíces (contadas con su multiplicidad) de la ecuación Pn(x) = 0, es igual a V(a) – V(b) – 2k, con k perteneciente a los naturales, siendo V(x) = Var{Pn(x), Pn’(x), Pn’’(x), ..., Pnn(x)}. Figura 3. Método regula falsi.

6.3.2. Teorema de Budan–Fourier CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

262

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces La ecuación de la cuerda será x– a y – f(a) = b – a f(b) – f(a) Si despejamos de forma explícita, tendremos y=

f(b) – f(a) × (x – a) + f(a) b–a

El punto de intersección con el eje de abcisas, vendrá dado haciendo y=0 por x =a –

f(a)× (b – a) =c f(b) – f(a)

punto que tomaremos como aproximación de la raíz contenida en (a,b). Si la aproximación no es la que buscamos, tomamos ahora el intervalo (a,c) o (c,b) en el que se verifique la condición de tener signos distintos en los extremos y le aplicamos nuevamente el método, con lo que obtendremos una aproximación mejor. Seguimos así aplicando el método hasta obtener la aproximación deseada.

7.3. Método de Newton Este método pretende aproximar la raíz por el punto en que las tangentes a la curva en los extremos del intervalo cortan al eje de abcisas. Para ello hay que exigir a la función f(x), además de las condiciones anteriores que sea derivable en el intervalo (a,b). Puede ocurrir que al trazar las tangentes el punto de intersección con el eje de abcisas se salga del intervalo, con lo que la aproximación a la raíz es errónea, lo que nos desaconsejaría utilizar este método.

b

d a

c

Figura 4. Método de Newton. Observamos aquí que c sería una buena aproximación mientras que d al salirse de (a,b) no sería una aproximación válida. La ecuación de la tangente a f(x) en el punto (a,f(a)) es y – f(a) = f’(a) · (x – a) Su punto de intersección con el eje de abcisas será x0 = a –

f(a) =c f'(a) 1

Si aplicamos nuevamente el método de Newton al punto (c1,f(c1)), obtenemos un nuevo punto c2, que será la intersección de la tangente en ese punto con el eje de abcisas c2 = c1 –

TEMARIO DE MATEMÁTICAS. PRUEBA A

f(c1 ) f'(c1 ) 263

Volumen I. Matemáticas

264

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

y de aquí f(p) = 0, de donde p = a.

Si volvemos a aplicar sucesivamente el método, obtendremos una sucesión de puntos f(cn–1 ) cn = cn–1 – f'(cn–1 ) p =p–

f(p) f'(p)

se sigue por la continuidad de f(x) y de f’(x) que

que debería ir convergiendo a la raíz. Para garantizar esto haremos que f(x), cumpla unas determinadas hipótesis, lo que nos asegura la convergencia de la sucesión cn hacia la raíz.

Como toda sucesión monótona acotada tiene límite, tenemos que limxn existe y es £ a. Si denotamos n ®¥ ese límite por p y hacemos que n ® ¥ en la relación f(xn ) f'(xn ) xn+1 = xn –

PROPOSICIÓN Supongamos que la función f(x) está definida y es dos veces continuamente diferenciable en el intervalo [a,b], y que se satisfacen las siguientes condiciones: a)

f(a) · f(b) < 0

b)

f’(x) ¹ 0, para todo valor x Î [a,b]

c)

f’’(x) es positiva o negativa en todo el intervalo [a,b]

d)

Si c denota el extremo de [a,b] en el que |f’(x)| es más pequeño, entonces |

De esta forma f(xn+1) £ 0, y xn+2 = xn+1 – y

f(c) | £ b–a f'(c)

xn+1 = xn –

f(xn+1 ) ³ xn+1, con lo que se completa el paso inductivo. f'(xn+1 )

f(xn ) £ xn + (a – xn) = a f'(xn )

Entonces, el método de Newton converge a la solución única a de f(x) = 0, para cualquiera que sea la elección de x0 en [a,b]. La condición a) nos dice que la función tiene valores de distinto signo en los extremos del intervalo, lo que nos asegura la existencia de al menos una raíz. La b) nos dice que solamente hay una solución. La c) nos asegura que no cambia la curvatura de la gráfica en el intervalo y la d) afirma que la tangente a la curva y = f(x) en el extremo en que |f’(x)| es menor, corta al eje de abcisas dentro del intervalo [a,b]. En función de los valores de f(a), f(b) y f’’(x), se pueden plantear cuatro casos diferentes, pero reducibles el uno al otro. Para nuestra demostración, supondremos que f(a) < 0, f(b) > 0 y f’’(x) < 0. Sea a la única solución de f(x) = 0 en el intervalo (a,b). Suponemos primero que a x0 a. Como f(x0) £ 0, es claro que f(x0 ) ³0 x1 = x0 – f'(x0 ) –f(xn) £ (a – xn) · f’(xn)

donde xn £ x £ a. Como f’’(x) < 0, f’(x) es decreciente de donde f’(x) £ f’(xn). Así –f(xn) = f(a) – f(xn) = (a – xn) · f’(x)

Afirmamos que xn £ a y que xn+1 ³ xn para todos los valores de n. Como esto es cierto para n = 0, es suficiente probar el paso inductivo de n a n + 1. Si xn £ a , por el teorema del valor medio x1 = x0 –

f(x0 ) ³0 f'(x0 )

Entonces, el método de Newton converge a la solución única a de f(x) = 0, para cualquiera que sea la elección de x0 en [a,b]. La condición a) nos dice que la función tiene valores de distinto signo en los extremos del intervalo, lo que nos asegura la existencia de al menos una raíz. La b) nos dice que solamente hay una solución. La c) nos asegura que no cambia la curvatura de la gráfica en el intervalo y la d) afirma que la tangente a la curva y = f(x) en el extremo en que |f’(x)| es menor, corta al eje de abcisas dentro del intervalo [a,b]. En función de los valores de f(a), f(b) y f’’(x), se pueden plantear cuatro casos diferentes, pero reducibles el uno al otro. Para nuestra demostración, supondremos que f(a) < 0, f(b) > 0 y f’’(x) < 0. Sea a la única solución de f(x) = 0 en el intervalo (a,b). Suponemos primero que a x0 a. Como f(x0) £ 0, es claro que

Afirmamos que xn £ a y que xn+1 ³ xn para todos los valores de n. Como esto es cierto para n = 0, es suficiente probar el paso inductivo de n a n + 1. Si xn £ a , por el teorema del valor medio –f(xn) = f(a) – f(xn) = (a – xn) · f’(x)

donde xn £ x £ a. Como f’’(x) < 0, f’(x) es decreciente de donde f’(x) £ f’(xn). Así –f(xn) £ (a – xn) · f’(xn)

Si c denota el extremo de [a,b] en el que |f’(x)| es más pequeño, entonces |

d)

f’’(x) es positiva o negativa en todo el intervalo [a,b]

c)

f(xn ) £ xn + (a – xn) = a f'(xn )

f(xn+1 ) ³ xn+1, con lo que se completa el paso inductivo. f'(xn+1 ) f(a) · f(b) < 0

a)

De esta forma f(xn+1) £ 0, y xn+2 = xn+1 –

f’(x) ¹ 0, para todo valor x Î [a,b]

xn+1 = xn –

b)

f(c) | £ b–a f'(c)

y

Como toda sucesión monótona acotada tiene límite, tenemos que limxn existe y es £ a. Si denotamos n ®¥ ese límite por p y hacemos que n ® ¥ en la relación f(xn ) xn+1 = xn – f'(xn )

PROPOSICIÓN Supongamos que la función f(x) está definida y es dos veces continuamente diferenciable en el intervalo [a,b], y que se satisfacen las siguientes condiciones:

que debería ir convergiendo a la raíz. Para garantizar esto haremos que f(x), cumpla unas determinadas hipótesis, lo que nos asegura la convergencia de la sucesión cn hacia la raíz. se sigue por la continuidad de f(x) y de f’(x) que

Si volvemos a aplicar sucesivamente el método, obtendremos una sucesión de puntos f(cn–1 ) f'(cn–1 ) f(p) f'(p)

cn = cn–1 –

p =p–

y de aquí f(p) = 0, de donde p = a.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

264

Ecuaciones. Resolución de ecuaciones. Aproximación numérica de raíces Si se considera el caso en que a £ x0 £ b, la demostración es análoga, con lo cual queda probado que sea cual sea el valor x0 que tomemos en el intervalo (a,b) en las condiciones descritas, la sucesión xn converge a la raíz a.

7.4. Método mixto El método mixto es la combinación del método regula falsi con el método de Newton. Se elige el extremo donde la función y la derivada segunda tienen el mismo signo y se aplica el método de Newton, obteniendo un punto x1. A la vez aplicamos el método regula falsi y obtenemos otro punto x1’.

a

X1 X’1

b

Figura 5. Método mixto.

Si reiteramos el proceso obtenemos dos sucesiones monótonas acotadas que por lo tanto son convergentes y determinan la raíz a.

TEMARIO DE MATEMÁTICAS. PRUEBA A

265

TEMA

15 Ecuaciones diofánticas

Jesús Gómez Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

268

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

PRELIMINARES 2.1. Algoritmo de Euclides 2.2. Cumulantes 2.3. Sistema completo de números incongruentes 2.4. Igualdad de Bezout

3.

ECUACIÓN DIOFÁNTICA LINEAL CON DOS INCÓGNITAS 3.1. La ecuación Ax - By = C (A,B,C Î Z +) 3.2. La ecuación Ax + By = C (A,B,C Î Z +) 3.3. Métodos de obtención de una solución particular

4.

ECUACIÓN DIOFÁNTICA LINEAL CON N INCÓGNITAS

5.

ECUACIONES DIOFÁNTICAS NO LINEALES CON DOS INCÓGNITAS 5.1. Ecuación de primer grado respecto de una de las incógnitas 5.2. La ecuación x2 – y2 = a 5.3. La ecuación de Pell 5.4. La ecuación de Mordell 5.5. La ecuación de Thue

6.

ECUACIONES DIOFÁNTICAS NO LINEALES CON MÁS DE DOS INCÓGNITAS 6.1. La ecuación pitagórica x2 + y2 = z2 6.2. La ecuación x2 + y2 + z2 = t2 6.3. El último teorema de Fermat

ECUACIONES DIOFÁNTICAS NO LINEALES CON MÁS DE DOS INCÓGNITAS 6.1. La ecuación pitagórica x2 + y2 = z2 6.2. La ecuación x2 + y2 + z2 = t2 6.3. El último teorema de Fermat

6.

ECUACIONES DIOFÁNTICAS NO LINEALES CON DOS INCÓGNITAS 5.1. Ecuación de primer grado respecto de una de las incógnitas 5.2. La ecuación x2 – y2 = a 5.3. La ecuación de Pell 5.4. La ecuación de Mordell 5.5. La ecuación de Thue

5.

ECUACIÓN DIOFÁNTICA LINEAL CON N INCÓGNITAS

4.

ECUACIÓN DIOFÁNTICA LINEAL CON DOS INCÓGNITAS 3.1. La ecuación Ax - By = C (A,B,C Î Z +) 3.2. La ecuación Ax + By = C (A,B,C Î Z +) 3.3. Métodos de obtención de una solución particular

3.

PRELIMINARES 2.1. Algoritmo de Euclides 2.2. Cumulantes 2.3. Sistema completo de números incongruentes 2.4. Igualdad de Bezout

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

268

Ecuaciones diofánticas

1. INTRODUCCIÓN En la tablilla 322 de la colección Plimpton de la Universidad de Columbia se encuentra un precedente que data del período babilónico antiguo (1900 a 1600 a.C). Allí aparece una relación de ternas pitagóricas que sorprendentemente estaban formadas a partir de p2 – q2, 2pq, p2 + q2. Limitándose a valores de p menores que 60 y a valores correspondientes de q tales que 1 < p/q < 1+ 2, los babilonios descubrieron probablemente que había 38 pares de valores de p y q posibles y debieron de construir las 38 ternas pitagóricas correspondientes. Pero el origen de las llamadas ecuaciones diofánticas, y de ahí su denominación, hay que buscarlo en la famosa obra Arithmética, tratado que originariamente constaba de 13 libros. Su autor, el matemático griego Diofanto de Alejandría (s. III d.C), la dedicó casi exclusivamente a la determinación de soluciones particulares (racionales o enteras) de las ecuaciones algebraicas (entendiendo por tales a aquellas cuyos dos miembros son polinomios). Mientras la matemática babilónica se había ocupado principalmente de la solución aproximada de ecuaciones determinadas de grados hasta el tercero, la Arithmética de Diofanto, en lo que nos ha llegado a nosotros, está dedicada casi exclusivamente a la resolución exacta de ecuaciones determinadas e indeterminadas. Debido al énfasis con que Diofanto abordó los problemas indeterminados (con infinitas soluciones), la teoría que se ocupa de ellos, que a veces se denomina análisis indeterminado, se suele conocer con el nombre moderno de análisis diofántico. Precisamente la Arithmética no es sino una colección de 150 de estos problemas, resueltos todos en términos de ejemplos numéricos y específicos, aunque ya Diofanto se aproxima a lo que podríamos llamar un “método”. El álgebra hindú contribuyó notablemente al desarrollo del análisis indeterminado. Fueron admirables las contribuciones de Brahmagupta (s. VII). En su obra aparece una regla para la formación de ternas pitagóricas 1 m2 1 m2 . Cabe admirar más que fuera el primero, al parecer, que dio una expresada en la forma m, × , × 2 m– n 2 m+ n solución general de la ecuación diofántica lineal ax + by = c con a,b,c enteros. El mérito de Brahmagupta fue el dar todas las soluciones, mientras que Diofanto se había contentado con dar una única solución particular. El también hindú Bhaskara (1114-1185) fue probablemente el matemático más importante del siglo XII. En su tratado más conocido, el Lilavati, reunió numerosos problemas sobre ecuaciones lineales y cuadráticas indeterminadas, que constituyen buenos ejemplos de problemas diofánticos. Sorprende también su gran dominio en el tratamiento de dichos problemas. El año 1621 apareció una edición greco-latina de la Arithmética de Diofanto, la de Claude Gaspard de Bachet, que llamó fuertemente la atención de Pierre de Fermat (1601-1665), quien, inspirado en los problemas planteados por Diofanto, investigó sobre la naturaleza de tales soluciones. En particular Fermat se vio conducido a su célebre “gran teorema”, cuando intentaba generalizar uno de aquellos (el II-8): “dividir un cuadrado en dos cuadrados”. Algunos de sus teoremas los demostró por un método que él mismo llamó de “descenso infinito”, una cierta forma de inducción matemática. Podemos decir que Fermat fue sin duda alguna el verdadero iniciador del análisis diofántico. En general se llama problema diofántico a la resolución en Z de una ecuación algebraica en varias incógnitas. Así por ejemplo, la división, entera de D entre d es un problema diofántico, ya que no es más que la resolución de la ecuación D = dx + y, siendo x e y dos números naturales con la condición de que y < d. Igualmente las llamadas “ecuaciones de congruencia” ax º b (mód m) se reducen a diofánticas te·

niendo en cuenta que la relación anterior equivale a ax – b = m = my, o sea ax – my = b. Una ecuación diofántica es toda ecuación con coeficientes enteros, de la cual sólo se desean las soluciones enteras, y más particularmente las naturales. Aunque un planteamiento más general del problema puede hacerse sustituyendo Z por un anillo cualquiera, lo cierto es que nos interesa un enfoque más clásico y práctico, por lo cual prestaremos más atención a tipos particulares de ecuaciones diofánticas, como pueden ser las lineales y las pitagóricas. Una ecuación diofántica lineal con n incógnitas será de la forma: siendo xi Î Z a1x1 + a2x2 + a2x2 + ... anxn = c, En caso de c = 0, se trata de una ecuación diofántica lineal homogénea. Las ecuaciones diofánticas lineales son las únicas resueltas totalmente desde un punto de vista teórico. El caso n = 1 es trivial pues se reduce a A · x = B y sólo tendrá solución si B es múltiplo de A. Un problema diofántico no lineal puede complicarse y hasta no tener solución.

TEMARIO DE MATEMÁTICAS. PRUEBA A

269

Volumen I. Matemáticas

270

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

q–1 = a q0 = b q1 = a1b + a q2 = (a1, a2) b + (a2)a q3 = (a1, a2, a3 ) b + (a2, a3 ) a :::::::::::::::::::::::::::::::::::::::::: Probándose por recurrencia que qn = (a1, ..., an ) b + (a2, ..., a3) a

2. IDEAS PRELIMINARES 2.1. Algoritmo de Euclides

Dados a y b dos números enteros positivos, podemos realizar la sucesión de divisiones hasta obtener una con resto nulo: 0 < r1 < b a = q1b + r1 0 < r 2 < r1 b = q 2 r1 + r 2 r1 = q3r2 + r3 0 < r 3 < r2 :::::::::::::::::::::::::::::::::::::::::::::::: 0 < rn < rn-1 rn-2 = qn rn- 1 + rn rn-1 = q n+1 rn rn+1= 0

El mismo algoritmo anterior puede aplicarse si en lugar de 0 y 1 partimos de dos números enteros a y b. Se obtiene: “Dos cumulantes consecutivos son primos entre sí”. qn+1

1.

qn

m.c.d. (a,b) = m.c.d. (b, r1) = m.c.d. (r1,r2) = = m.c.d. (r 2 ,r 3 ) = … = m.c.d. (r n–1 ,r n ) = = m.c.d. (rn,rn+1) = rn (a1, a2, a3, ..., an) = (an, an-1, ..., a2, a1)



(–a1, –a2, –a3, ..., –an) = (–1)n(a1, a2, a3, ..., an)

q3

3.

q2

2.

q1

Dada una sucesión (finita o no) de números enteros a1, a2, a3, ...,an, ... podemos obtener a partir de ella otra sucesión aplicando el algoritmo de Euler: pn = pn-1 . an + pn-2, partiendo de 0 y 1. Es decir: p-1 = 0 p0 = 1 p1 = p0 a1 + p-1 = a1 p2 = p 1 a2 + p 0 = a 1 a2 + 1 p3 = p2 a3 + p1 = (a1 a2 + 1) a3 + a1 = a1 a2 a3 + a1 + a3 p4 = p3 a4 + p2 = (a1 a2 a3 + a1 + a3) a4 + a1 a2 + a1 a2 + a1 a2 + 1 :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: En general pn es la suma que tiene como primer sumando el producto a1 a2 a3 … an , y después todos los que resultan de ir suprimiendo en ese producto un par de factores consecutivos, dos pares, tres pares, etc. (se procede por inducción). Se representan por pn = (a1, a2, a3, ..., an) y se llaman cumulantes de la sucesión (ai)iÎN. Los cumulantes verifican ciertas propiedades, como las siguientes: a

b

r1

r1

r2

r3

r2



rn–2

rn–1



rn

0

rn

2.2. Cumulantes

Dada una sucesión (finita o no) de números enteros a1, a2, a3, ...,an, ... podemos obtener a partir de ella otra sucesión aplicando el algoritmo de Euler: pn = pn-1 . an + pn-2, partiendo de 0 y 1. Es decir: p-1 = 0 p0 = 1 p1 = p0 a1 + p-1 = a1 p2 = p 1 a2 + p 0 = a 1 a2 + 1 p3 = p2 a3 + p1 = (a1 a2 + 1) a3 + a1 = a1 a2 a3 + a1 + a3 p4 = p3 a4 + p2 = (a1 a2 a3 + a1 + a3) a4 + a1 a2 + a1 a2 + a1 a2 + 1 :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: En general pn es la suma que tiene como primer sumando el producto a1 a2 a3 … an , y después todos los que resultan de ir suprimiendo en ese producto un par de factores consecutivos, dos pares, tres pares, etc. (se procede por inducción). Se representan por pn = (a1, a2, a3, ..., an) y se llaman cumulantes de la sucesión (ai)iÎN. Los cumulantes verifican ciertas propiedades, como las siguientes:

2.2. Cumulantes



a



r1

b

2

1

q

q

r2

3

q



rn

rn–2

0

rn–1 n

q

rn

m.c.d. (a,b) = m.c.d. (b, r1) = m.c.d. (r1,r2) = = m.c.d. (r 2 ,r 3 ) = … = m.c.d. (r n–1 ,r n ) = = m.c.d. (rn,rn+1) = rn

(–a1, –a2, –a3, ..., –an) = (–1)n(a1, a2, a3, ..., an)

r3

2.

r2

(a1, a2, a3, ..., an) = (an, an-1, ..., a2, a1)

r1

1.

n+1

q

Dados a y b dos números enteros positivos, podemos realizar la sucesión de divisiones hasta obtener una con resto nulo: 0 < r1 < b a=qb+r 1 1 0 < r 2 < r1 b = q 2 r1 + r 2 r1 = q3r2 + r3 0 < r 3 < r2 :::::::::::::::::::::::::::::::::::::::::::::::: 0 < rn < rn-1 r =q r +r n-2 n n1 n rn-1 = q n+1 rn rn+1= 0 3.

“Dos cumulantes consecutivos son primos entre sí”.

El mismo algoritmo anterior puede aplicarse si en lugar de 0 y 1 partimos de dos números enteros a y b. Se obtiene: q–1 = a q0 = b q1 = a1b + a q2 = (a1, a2) b + (a2)a q3 = (a1, a2, a3 ) b + (a2, a3 ) a :::::::::::::::::::::::::::::::::::::::::: Probándose por recurrencia que qn = (a1, ..., an ) b + (a2, ..., a3) a

2. IDEAS PRELIMINARES 2.1. Algoritmo de Euclides

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

270

Ecuaciones diofánticas Si nos vamos ahora al algoritmo de Euclides y despejamos los restos sucesivos, tendremos: r1 = b(–q1) + a r2 = r1(–q2) + b r3 = r2(–q3) + r1 :::::::::::::::::::: rn–1 = rn –2(–qn –1) + rn –3 rn = rn –1(–qn ) + rn – 2 Resultan ser los cumulantes del algoritmo de Euler, partiendo de a y b, de la sucesión –q1, –q2, –q3, ..., –qn. De donde: D = m.c.d. (a,b) = rn = (–q1, –q2, ..., –qn)b + (–q2, –q3, ..., –qn)a o lo que es lo mismo: D = (–1)n (q1, q2, ..., qn)b + (–1)n –1 (q2, q3, ..., qn)a

[1]

2.3. Sistema completo de números incongruentes DEFINICIÓN: “Se llama sistema completo de números incongruentes (módulo a) a todo conjunto de a números cuyos restos al dividir entre a sean todos distintos”. Obviamente los propios restos 0, 1, 2, ..., a – 1 forman un sistema completo de números incongruentes. PROPOSICIÓN: “Si a,b Î Z son primos relativos, entonces para cualquier c Î Z, el conjunto {c + 0 · b, c + 1 · b, c + 2 · b, ..., c + (a – 1)b} forma un sistema completo de números incongruentes (módulo a)” En efecto, si hubiese dos números en ese conjunto con el mismo resto al dividir entre “a” para algún par · (j,k), siendo 0 £ j, k < a, se tendría: c + jb º c + kb (mód a). Entonces (c + jb) – (c + kb) = (j – k)b = a; y · como a y b son primos, se deduce que j – k = a. Llegaríamos a que j º k (mód a), lo cual es una contradicción ya que j y k son dos de los restos distintos al dividir por a. Observación: Una demostración análoga justificaría que, en las mismas condiciones, los números c – 0 · b, c – 1 · b, c – 2 · b, ..., c – (a – 1) también forman un sistema completo de números incongruentes módulo a.

2.4. Igualdad de Bezout Sea A un anillo principal (todo ideal de A es principal). Dados x1, x2, x3, ..., xn ÎA denotamos por I = (x1, x2, x3, ..., xn) al ideal generado por esos n elementos. Al ser A principal, existirá un d Î A tal que I = (d), siendo d único salvo factores inversibles. Es decir, d puede ser reemplazado por ud, donde u es cualquier elemento “inversible” o “unitario” del anillo A. Puesto que d Î (d), existirán a1, a2, a3, ..., an Î A, tales que: a1 x1+ a2 x2 + a3 x3 + ... + an xn = d En particular, el anillo Z de los números enteros es principal. Si particularizamos lo anterior para dos elementos A, B Î Z. , el ideal generado por ambos (que es el menor ideal de Z que contiene a ambos) viene a ser el ideal principal (D) generado por su m.c.d. Esto permite enunciar la propiedad siguiente: “Dados A, B Î Z, si D = m.c.d. (A,B) existen h,k Î Z tales que Ah + Bk = D” Esta última se conoce como “igualdad de Bezout”. TEMARIO DE MATEMÁTICAS. PRUEBA A

271

Volumen I. Matemáticas

272

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En resumidas cuentas, la solución de la ecuación diofántica completa queda reducida a encontrar una solución particular (x0, y0). Ahora bien, ¿podemos asegurar que exista esa solución? El teorema que sigue da una condición necesaria y suficiente.

3. ECUACIÓN DIOFÁNTICA LINEAL CON DOS INCÓGNITAS

La forma general es Ax + By = C, con A, B, C Î Z. Si fuesen nulos A ó B, entonces la ecuación se reduce a una incógnita. Si A = B = 0 tendremos casos triviales (imposible si C ¹ 0 y una identidad si C = 0). No perdemos generalidad si consideramos A Î Z+, pues en caso contrario, podremos multiplicar por –1 ambos miembros. Luego podemos considerar la ecuación en la forma Ax ± By = ± C siendo A,B,C Î Z+. Comoquiera que si (a, b) es una solución de Ax ± By = C, entonces (–a, –b) lo es de Ax ± By = –C , podemos limitarnos al caso Ax ± By = C. Por último tengamos en cuenta que si (a, b) fuese solución de Ax + By = C, el par (a, –b) sería solución de Ax – By = C. Por tanto no restamos generalidad si nos restringimos a una de las formas Ax + By = C ó Ax – By = C con A, B,C Î Z+. Concluimos que la ecuación puede ser estudiada considerando los coeficientes números enteros positivos, pues bastaría cambiar una de las incógnitas, o ambas, por las fórmulas. x = –x’ y = –y’ ì x – x0 = tb ì x = x0 + tb í Þí donde t es un entero arbitrario. îy – y 0 = ta îy = y 0 + ta

De ahí obtenemos la solución general de la ecuación de partida: ìX = tb í îY = ta

Tomando ahora como incógnitas X= x–x0 e Y = y–y0, la ecuación queda reducida a AX – BY = 0, cuya solución general es, como vimos en el apartado a): Ax – By = Cü ý Þ Restando miembro a miembro: A(x–x0) – B(y–y0) = 0. Ax0 – By 0 = Cþ

b)

Caso completo Para la ecuación lineal no homogénea Ax – By = C (A, B, C Î Z+) basta conocer una solución particular (x0, y0) para reducirla a una homogénea:

PROPOSICIÓN: “La solución general de la ecuación diofántica homogénea Ax – By = 0 , con A,B Î Z +, es: ì = x tb A B í (siendo t Î Z un valor arbitrario) donde a = y b= ” m. c. d .( A , B ) m. c. d .( A , B ) î y = ta

3.1. La ecuación Ax – By = C (A,B,C Î Z +) a)

Caso homogéneo Sea Ax – By = 0 con A,B Î Z+. Si D = m.c.d. (A,B) podemos poner A = aD y B = bD, siendo a y b primos entre sí. Luego la ecuación de partida es equivalente a ax – by = 0 donde m.c.d. (a,b) = 1. Entonces la igualdad ax = by, en virtud del teorema de Euclides de la divisibilidad, implica que el entero b debe ser divisor de x (ya que b divide al producto ax siendo primo con uno de los factores), con lo cual debe verificarse x = tb siendo t entero. Sustituyendo ahora tendremos tab – by = 0, de donde y = ta. Por tanto tenemos:

Caso homogéneo Sea Ax – By = 0 con A,B Î Z+. Si D = m.c.d. (A,B) podemos poner A = aD y B = bD, siendo a y b primos entre sí. Luego la ecuación de partida es equivalente a ax – by = 0 donde m.c.d. (a,b) = 1. Entonces la igualdad ax = by, en virtud del teorema de Euclides de la divisibilidad, implica que el entero b debe ser divisor de x (ya que b divide al producto ax siendo primo con uno de los factores), con lo cual debe verificarse x = tb siendo t entero. Sustituyendo ahora tendremos tab – by = 0, de donde y = ta. Por tanto tenemos:

PROPOSICIÓN: “La solución general de la ecuación diofántica homogénea Ax – By = 0 , con A,B Î Z +, es: ì x = tb A B í (siendo t Î Z un valor arbitrario) donde a = y b= ” m. c. d .( A , B ) m. c. d .( A , B ) î y = ta a)

3.1. La ecuación Ax – By = C (A,B,C Î Z +)

b)

Caso completo Para la ecuación lineal no homogénea Ax – By = C (A, B, C Î Z+) basta conocer una solución particular (x0, y0) para reducirla a una homogénea:

La forma general es Ax + By = C, con A, B, C Î Z. Si fuesen nulos A ó B, entonces la ecuación se reduce a una incógnita. Si A = B = 0 tendremos casos triviales (imposible si C ¹ 0 y una identidad si C = 0). No perdemos generalidad si consideramos A Î Z+, pues en caso contrario, podremos multiplicar por –1 ambos miembros. Luego podemos considerar la ecuación en la forma Ax ± By = ± C siendo A,B,C Î Z+. Comoquiera que si (a, b) es una solución de Ax ± By = C, entonces (–a, –b) lo es de Ax ± By = –C , podemos limitarnos al caso Ax ± By = C. Por último tengamos en cuenta que si (a, b) fuese solución de Ax + By = C, el par (a, –b) sería solución de Ax – By = C. Por tanto no restamos generalidad si nos restringimos a una de las formas Ax + By = C ó Ax – By = C con A, B,C Î Z+. Concluimos que la ecuación puede ser estudiada considerando los coeficientes números enteros positivos, pues bastaría cambiar una de las incógnitas, o ambas, por las fórmulas. x = –x’ y = –y’ Ax – By = Cü ý Þ Restando miembro a miembro: A(x–x0) – B(y–y0) = 0. Ax0 – By 0 = Cþ

Tomando ahora como incógnitas X= x–x0 e Y = y–y0, la ecuación queda reducida a AX – BY = 0, cuya solución general es, como vimos en el apartado a): ìX = tb í îY = ta

De ahí obtenemos la solución general de la ecuación de partida:

ì x – x0 = tb ì x = x0 + tb í Þí donde t es un entero arbitrario. îy – y 0 = ta îy = y 0 + ta

En resumidas cuentas, la solución de la ecuación diofántica completa queda reducida a encontrar una solución particular (x0, y0). Ahora bien, ¿podemos asegurar que exista esa solución? El teorema que sigue da una condición necesaria y suficiente.

3. ECUACIÓN DIOFÁNTICA LINEAL CON DOS INCÓGNITAS

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

272

Ecuaciones diofánticas

TEOREMA: “La ecuación diofántica Ax – By = C (A, B, C Î Z+) tiene solución en Z si y sólo si el máximo común divisor de A y B es también divisor de C”. Demostración: (1) Condición necesaria Si A y B son primos relativos es trivial, pues entonces m.c.d.(A,B) = 1. Supongamos que A y B no son primos relativos y sea D = m.c.d. (A,B). Si la ecuación tiene solución, existirá un par (a, b) Î Z2 tal que aA – bB = C. Entonces D es divisor del primer miembro y por tanto lo será también del segundo, es decir C = aaD – bbD = (aa – bb)D = D (2) Condición suficiente Supongamos que D = m.c.d. (A,B). Tendremos A = aD, B = bD siendo m.c.d.(a,b) = 1. Si D es divisor del segundo miembro C, será C = cD. Sustituyendo en la ecuación dada aDx – bDy = = cD, y simplificándola queda reducida a ax – by = c. Como m.c.d.(a,b) = 1, por la igualdad de Bezout existen h,k Î Z tales que ah + bk = 1. Multiplicando por cD llegamos a (ah + bk)cD = cD, que puede ponerse en la forma aDch + bDck = cD, es decir A(ch) – B(–ck) = D. Con lo cual hemos obtenido la solución (ch,–ck) de la ecuación Ax – By = C.

Análisis de las soluciones naturales Si nos vamos a la solución general, las soluciones naturales se obtendrán para los valores del paráme–x –y tro t que cumplan: x0 + tb > 0, y0 + ta > 0. Es decir t > 0 y t > 0 . Pero ello es posible para infinidad de b a valores de t. Por tanto habrá infinitas soluciones naturales de la ecuación diofántica.

3.2. La ecuación Ax + By = C (A,B,C Î Z +) Todos los resultados anteriores, salvo ligeras modificaciones, son también válidos. La solución general del caso homogéneo Ax + By = 0 vendrá dada ahora por ì x = tb í îy = – ta siendo t Î Z un valor arbitrario, y donde a y b siguen siendo los cocientes (exactos) entre A y B respectivamente y su máximo común divisor D. Para la existencia de una solución particular (x0, y0) de la ecuación completa sigue valiendo la condición necesaria y suficiente de que D = m.c.d.(A,B) divida también a C, siendo la solución general del caso completo: ì x = x0 + tb í îy = y 0 – ta La diferencia más relevante estriba ahora en lo referente a soluciones naturales, que serán las obtenidas para valores del parámetro que cumplan x0 + tb > 0, y0 – ta > 0, es decir: –x0 y c} r rr H– = {x a t x < c}

4.3. Definición de polítopo convexo Se llama polítopo convexo a todo conjunto que se puede expresar como la intersección de un número finito de semiespacios cerrados. Son conjuntos que se obtienen como la familia de soluciones de desigualdades lineales de la forma: ìar1trx £ b1 ïr t r ïa 2x £ b 2 ïr t r ía 3x £ b 3 ï ï... rt r ï îa mx £ b m ya que cada desigualdad define un semiespacio y la solución es la intersección de estos semiespacios.

4.4. Definición de poliedro Un polítopo acotado no vacío se denomina poliedro.

4.5. Definición de punto extremo Un punto x de un conjunto convexo C se denomina punto extremo de C si no existen dos puntos distintos x1 y x2 de C, tales que no se encuentran estrictamente en el segmento que une otros dos puntos del conjunto.

5. TEOREMA. EQUIVALENCIA DE PUNTOS EXTREMOS Y SOLUCIONES BÁSICAS

r Sea A Î Mm·n con rango (A)r = m, yrb un m - vector. Sea K el polítopo convexo formado por todos los r r r r n -. vectores que satisfacen Ax = b; x ³ 0, diremos que un vector xes un punto extremo de K si y sólo si xes un punto extremo de K. r Como x es una solución factible básica podemos escribir: r r r r r x1xa 1 1 + x2a 2 + x3a 3 + ... + xma m = b r r r r siendo a 1, a 2 , a 3 , ... , a m las m primeras columnas de A linealmente independientes. TEMARIO DE MATEMÁTICAS. PRUEBA A

309

Volumen I. Matemáticas

310

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

r r r r r r xpuede formularse como una combinación r r rconvexa de dos puntos de K, así x= a y + (1 – a) z conr yr¹ z, a Î (0, 1), y teniendo en cuenta que x, y, z, a son positivas, las últimas n – m componentes de y, z son cero, con lo que podemos escribir: r r r r r ì ïy 1a 1 + y 2a 2 + y 3a 3 + ... + y ma m = b í r r r r r ï îz1a 1 + z 2a 2 + z 3a 3 + ... + z ma m = b r r r r r r r pero al ser linealmente r independientes los vectores a1, a 2 , a 3 , ... , a m , llegamos a que x = y = z, lo que nos lleva a afirmar que x es un punto extremo de K. r r Veamos ahora que si x es un punto extremo de K, x será también una solución factible básica. r Supongamos que las componentes distintas de x son las k primeras, así podemos escribir: r r r r r xa 1 1 + x2a 2 + x3a 3 + ... + xka k = b r r r r tendremos que probar la independencia r rlineal r de losr vectores a 1, a 2 , a 3 , ... , a k. Lo haremos por reducción dependientes, existirá una combinaal absurdo, así si suponemos que los a1, a 2 , a 3 , ... , a k son linealmente r r r r r r ción de ellos que dé cero: y 1a1 + y 2a 2 + y 3a 3 + ... + y ka k = 0, y si definimos en - vector y = (y1, y2, y3, ..., yk, 0, 0, 0, ... 0) como los yi > 0 podemos seleccionar un l tal que: r r r r x+ ly ³ 0 x – ly ³ 0 r 1 r r 1 r r r entonces tendremos que x = (x+ ly)+ (x – ly), lo que presenta a x como una combinación convexa de 2 2 r dos vectores der K, lo que no puede ser ya que por hipótesis partimos de que xes punto extremo de K. r r r distintos r Así los a1, a 2 , a 3 , ... , a k son linealmente independientes y xes una solución factible básica, aunque si k < m será una solución factible básica degenerada. La correspondencia entre puntos extremos y soluciones factibles básicas permite obtener ciertas propiedades geométricas del polítopo convexo K que definen al conjunto de restricciones del programa lineal.

Pretende pasar de una ecuación factible básica (un punto extremo) del conjunto de restricciones del problema a otra, de modo que el valor de la función objetivo decrezca continuamente hasta encontrar su mínimo. Hay que tener en cuenta que para encontrar una ecuación factible óptima basta con tener en cuenta las ecuaciones factibles básicas. El desarrollo del método simplex se apoya en la hipótesis de suposición de no degeneración: Toda solución factible básica es una solución factible básica no degenerada (no obstante, todos los razonamientos pueden ampliarse para incluir degeneración).

6. EL MÉTODO SIMPLEX

COROLARIO 4. r r r r Si el polítopo convexo K correspondiente a Ax = b; x ³ 0, es acotado, entonces K es un poliedro convexo, es decir, se compone de puntos que son combinaciones convexas de un número finito de puntos. COROLARIO 3. r r r r El conjunto de restricción K correspondiente a Ax = b; x ³ 0, tiene un número finito de puntos extremos.

COROLARIO 2. Si existe una solución óptima finita a un problema de programación lineal, hay una solución óptima finita que es un punto extremo del conjunto de restricción. COROLARIO 1. r r r r Si el conjunto convexo K, Ax = b; x ³ 0, es no vacío tiene, al menos, un punto extremo.

COROLARIO 1.

r r r r Si el conjunto convexo K, Ax = b; x ³ 0, es no vacío tiene, al menos, un punto extremo.

r r r r r r xpuede formularse como una combinación r r rconvexa de dos puntos de K, así x= a y + (1 – a) z conr yr¹ z, a Î (0, 1), y teniendo en cuenta que x, y, z, a son positivas, las últimas n – m componentes de y, z son cero, con lo que podemos escribir: r ìy ar + y ar + y ar + ... + y ar = b ï 2 2 3 3 m m í 11 r ïz1ar1 + z 2ar 2 + z 3ar 3 + ... + z mar m = b î r r r r r r r pero al ser linealmente independientes los vectores a1, a 2 , a 3 , ... , a m , llegamos a que x = y = z, lo que nos r lleva a afirmar que x es un punto extremo de K. r r Veamos ahora que si x es un punto extremo de K, x será también una solución factible básica. r Supongamos que las componentes distintas de x son las k primeras, así podemos escribir: r r r r r xa 1 1 + x2a 2 + x3a 3 + ... + xka k = b r r r r tendremos que probar la independencia lineal de los vectores a , a , a , ... , a . Lo haremos por reducción 1 2 3 k r r r r dependientes, existirá una combinaal absurdo, así si suponemos que los a1, a 2 , a 3 , ... , a k son linealmente r r r r r r ción de ellos que dé cero: y 1a1 + y 2a 2 + y 3a 3 + ... + y ka k = 0, y si definimos en - vector y = (y1, y2, y3, ..., yk, 0, 0, 0, ... 0) como los yi > 0 podemos seleccionar un l tal que: r r r r x+ ly ³ 0 x – ly ³ 0 r 1 r r 1 r r r entonces tendremos que x = (x+ ly)+ (x – ly), lo que presenta a x como una combinación convexa de 2 2 r dos vectores der K, lo que no puede ser ya que por hipótesis partimos de que xes punto extremo de K. r r r distintos r Así los a1, a 2 , a 3 , ... , a k son linealmente independientes y xes una solución factible básica, aunque si k < m será una solución factible básica degenerada. La correspondencia entre puntos extremos y soluciones factibles básicas permite obtener ciertas propiedades geométricas del polítopo convexo K que definen al conjunto de restricciones del programa lineal.

COROLARIO 2. Si existe una solución óptima finita a un problema de programación lineal, hay una solución óptima finita que es un punto extremo del conjunto de restricción. COROLARIO 3.

r r r r El conjunto de restricción K correspondiente a Ax = b; x ³ 0, tiene un número finito de puntos extremos.

COROLARIO 4.

r r r r Si el polítopo convexo K correspondiente a Ax = b; x ³ 0, es acotado, entonces K es un poliedro convexo, es decir, se compone de puntos que son combinaciones convexas de un número finito de puntos.

6. EL MÉTODO SIMPLEX

Pretende pasar de una ecuación factible básica (un punto extremo) del conjunto de restricciones del problema a otra, de modo que el valor de la función objetivo decrezca continuamente hasta encontrar su mínimo. Hay que tener en cuenta que para encontrar una ecuación factible óptima basta con tener en cuenta las ecuaciones factibles básicas. El desarrollo del método simplex se apoya en la hipótesis de suposición de no degeneración: Toda solución factible básica es una solución factible básica no degenerada (no obstante, todos los razonamientos pueden ampliarse para incluir degeneración).

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

310

Programación lineal. Aplicaciones

6.1. Determinación del vector que deja la base r Partamos de una solución factible básica, x= (x1, x2, x3, ..., xk, 0, 0, 0, ... 0) r r r r r xa 1 1 + x2a 2 + x3a 3 + ... + xma m = b Por además que incorporamos el r r la suposición de no degeneración sabemos que xi > 0 y supongamos vector a q a la representación (q > m), así una representación de a q en función de la base actual sería: r a q = y 1qa 1 + y 2qa 2 + y 3qa 3 + ... + y mqa m si esta expresión la multiplicamos por un cierto l ³ 0 y la restamos de la anterior resulta: r r r r r (x1 – ly 1q )a 1+ (x2 – ly 2q )a 2 + ... + (xm – ly mq )a m + la q = b r lo que nos presenta a b como combinación lineal de m + 1 vectores. Si l = 0 obtenemos la solución factible básica primitiva. r Cuando l aumenta desde cero, el coeficiente a q aumenta, y para l suficientemente pequeña la expresión anterior proporciona una solución factible no básica. Los coeficientes de los otros vectores crecerán o decrecerán linealmente al incrementarse l, si alguno decrece podemos igualar l al valor correspondiente a la primera de las posiciones donde uno, o más, de los coeficientes se anulan. r r En este caso se tiene una nueva solución factible básica, con el vector a q sustituyendo al vector a p siendo p el índice minimizador. Si el valor mínimo se alcanza para más de un solo índice i, se dice que la nueva solución es degenerada y cualquiera de los vectores con componente cero se puede considerar que es el que deja la base. Si ninguno de los yiq son positivos, entonces todos los coeficientes de la representación r r r r r (x1 – ly 1q )a 1+ (x2 – ly 2q )a 2 + ... + (xm – ly mq )a m + la q = b aumentan o permanecen constantes a medida que l aumenta, y no se obtiene una nueva solución factible r r r r básica, pero en cambio se observa que hay soluciones factibles para Ax = b; x ³ 0 que tiene coeficientes r r r r arbitrariamente grandes, y esto significa que el conjunto K de soluciones factibles para Ax = b; x ³ 0 no está acotado, siendo aquí de especial importancia el método simplex. r En resumen, se ha decidido que r dada una solución factible básica y un vector arbitrario a q existe una nueva solución factible básica con a q en su base y uno de los vectores originales eliminado, o el conjunto de soluciones factibles no está acotado. Veamos cómo se pueden presentar los cálculos. r r r r Suponemos que a Ax = b; x ³ 0 corresponden, por ejemplo, las restricciones siguientes: r a1

r a2

r a3

r a4

r a5

r a6

r b

1

0

0

2

4

6

4

0

1

0

1

2

3

3

0

0

1

-1

2

1

1

r r r r con bases a1, a 2 , a 3 , que producen la solución factible básica x= (4, 3, 1, 0, 0, 0) si queremos incorpo4 r rar a 4 a la base, para determinar qué elemento es el pivote adecuado calculamos las tres razones: = 2; 2 3 1 = 3; = –1, seleccionado el menor no negativo obtendremos una nueva tabla: 1 –1 r a1

r a2

r a3

r a4

r a5

r a6

1/2 -1/2 1/2

0 1 0

0 0 1

1 0 0

2 0 4

3 0 4

TEMARIO DE MATEMÁTICAS. PRUEBA A

r b 2 1 3

311

Volumen I. Matemáticas

312

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

r siendo ahora la solución factible básica x = (0, 1, 3, 2, 0, 0). La deducción del método de selección del pivote en una columna dad que dará lugar a una nueva sor r r r lución factible se basa en la interpretación vectorial de la ecuación Ax = b; x ³ 0 . Si se decide pivotar sobre ypq, dividimos la p - ésima fila (o columna) entre el elemento pivote ypq, para hacerlo unitario. Para que el nuevo ypo siga siendo positivo hemos de tener ypq > 0. A continuación se restan múltiplos de la p- ésima a las otras filas para obtener ceros en la q - ésima columna. En este proceso los nuevos elementos de la última columna deben ser no negativos, si se eligió el pivote adecuadamente. Toda la operación consiste en restar y iq veces la p-ésima fila a la i-ésima. Esto da una solución nueva obtenida directamente de la última columna: y pq

r El valor de la función objetivo correspondiente a cualquier solución x es: z = c1x1 + c2x2 + ... + cnxn rr r por lo que el valor correspondiente a la solución básica es: z0 = cBtxB , donde cBt = (c1, c2 , ... , cm ). Aunque lo normal es utilizar la solución básica, evidentemente si se asignan valores arbitrarios a xm+1, xm+2, ..., xn podemos despejar las restantes variables como sigue: n ü x1 = y 10 – åy 1jxj ï j=m+1 ï n ï x2 = y 20 – åy 2jxj ï ý j=m+1 ï ... ï n ï xï þ j=m+1

åy

xm = y m0 –

xi , con lo que volvemos a la conclusión de que y iq

0

... 1

1

0

...

...

0

...

0

...

r am

...

ym,m+1

...

...

...

y2,m+1

ymn ...

y2n

ym 0 ... y20

6.2. Determinación de una solución factible mínima

...

1

xpq

x se selecciona como el índice que maximiza a i . y iq

<

...

xp

xp

y pq

0

y para que esto sea no negativo debe cumplirse que

y iq

0

mj j

xi = xi –

y1,m+1

...

y1n

y10

La base del método simplex es seleccionar la columna de modo que la nueva solución factible básica resultante produzca un valor para la función objetivo menor que el anterior. Podemos determinar, como se expone a continuación, qué vector deberá incorporarse a la base para que el valor del objetivo disminuya, así como determinar qué vector debe salir para conservar la factibilidad. Supongamos que tenemos una solución factible básica: r r (xB ,0) = (y 10 , y 20 , ... , y 30 , 0, 0, ... 0) r a1

r a2

r a m+1

r an

r b

en la siguiente tabla aparece una matriz identidad en las m primeras columnas:

La base del método simplex es seleccionar la columna de modo que la nueva solución factible básica resultante produzca un valor para la función objetivo menor que el anterior. Podemos determinar, como se expone a continuación, qué vector deberá incorporarse a la base para que el valor del objetivo disminuya, así como determinar qué vector debe salir para conservar la factibilidad. Supongamos que tenemos una solución factible básica: r r (xB ,0) = (y 10 , y 20 , ... , y 30 , 0, 0, ... 0) en la siguiente tabla aparece una matriz identidad en las m primeras columnas: r a1

r a2

...

r am

r a m+1

1

0

...

0

y1,m+1

0

1

...

...

...

0

0

...

r an

r b

y1n

y10

6.2. Determinación de una solución factible mínima 0

y2,m+1

y2n

y20

...

...

...

...

...

...

...

1

ym,m+1

...

ymn

ym 0

se selecciona como el índice que maximiza a

xi . y iq

r El valor de la función objetivo correspondiente a cualquier solución x es: z = c1x1 + c2x2 + ... + cnxn rr r por lo que el valor correspondiente a la solución básica es: z0 = cBtxB , donde cBt = (c1, c2 , ... , cm ). Aunque lo normal es utilizar la solución básica, evidentemente si se asignan valores arbitrarios a xm+1, xm+2, ..., xn podemos despejar las restantes variables como sigue: n ü x1 = y 10 – åy 1jxj ï j=m+1 ï n ï x2 = y 20 – åy 2jxj ï ý j=m+1 ï ... ï n ï xm = y m0 – åy mjxjï þ j=m+1 y para que esto sea no negativo debe cumplirse que

xpq p

x

xi = xi –

<

y pq y iq

xi , con lo que volvemos a la conclusión de que y iq xp

y pq

r siendo ahora la solución factible básica x = (0, 1, 3, 2, 0, 0). La deducción del método de selección del pivote en una columna dad que dará lugar a una nueva sor r r r lución factible se basa en la interpretación vectorial de la ecuación Ax = b; x ³ 0 . Si se decide pivotar sobre ypq, dividimos la p - ésima fila (o columna) entre el elemento pivote ypq, para hacerlo unitario. Para que el nuevo ypo siga siendo positivo hemos de tener ypq > 0. A continuación se restan múltiplos de la p- ésima a las otras filas para obtener ceros en la q - ésima columna. En este proceso los nuevos elementos de la última columna deben ser no negativos, si se eligió el pivote adecuadamente. Toda la operación consiste en restar y iq veces la p-ésima fila a la i-ésima. Esto da una solución nueva obtenida directamente de la última columna:

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

312

Programación lineal. Aplicaciones y mediante ello podemos eliminar x1, x2, ..., xm de la expresión general z = c1x1 + c2x2 + ... + cnxn, obteniendo así: rr z = c t x = z0 + (cm+1 – zm+1)xm+1 + (cm+2 – zm+2)xm+2 + ... + (cn – zn)xn donde zj = y1jc1 + y2jc2 + ... + ymjcm; m + 1 £ j £ n, que es la relación fundamental para determinar la columna pivote. r r r r Esta ecuación da los valores de la función objetivo z para cualquier solución Ax = b; x ³ 0, en función de las variables xm+1, xm+2, ..., xn, de donde se puede determinar si representa alguna ventaja cambiar la solución básica introduciendo una de las variables no básicas.

6.3. Teorema. Mejora de la solución factible básica “Dada una solución factible básica no degenerada con valor objetivo correspondiente a zo, supóngase que para r alguna j se cumple cj – zj < 0, entonces hay una solución factible con valor objetivo z < z0. Si la columna a j se puede sustituir para un vectorrde la base original y generar una nueva solución factible básica, esta nueva solución tendrá z < z0, pero si a j no se puede sustituir para generar una solución factible básica, entonces el conjunto solución K no está acotado y la función objetivo puede hacerse arbitrariamente pequeña (tendiendo a – ¥)” Demostrémoslo: Sea (x1, x2, ..., xm, 0, 0, ... 0) una solución factible básica con un valor objetivo z0, y suponiendo que cm+1 – zm+1 < 0, siempre podremos construir nuevas soluciones factibles de la forma (x1', x2', ..., x'm, x'm+1, 0, 0, ... 0) con x'm+1 > 0. Si sustituimos esta solución en la expresión: rr z = c t x = z0 + (cm+1 – zm+1)xm+1 + (cm+2 – zm+2)xm+2 + ... + (cn – zn)xn tenemos: z – z0 = (cm+1 – zm+1) x'm+1 < 0 de donde z < z0 para cualquiera de esas soluciones. Como queremos que xm+1 sea lo más grande posible, al hacerlo aumentar las demás componentes aumentan, permanecen constantes o disminuyen. Así xm+1 puede aumentar hasta que una xi = 0, i £ m, en cuyo caso se obtiene una solución factible básica o si ninguna de las xi disminuye entonces xm+1 puede aumentar sin ninguna cota que indique un conjunto solución no acotado y un valor objetivo sin cota inferior. Si se produce que cj – zj < 0, entonces xj se puede hacer positiva y disminuir la función objetivo. Quedaría por ver si cj – zj ³ 0 para cualquier j implica optimalidad.

6.4. Teorema de la condición de optimalidad “Si existe una solución factible básica cj – zj ³ 0, " j, entonces esa solución es óptima”. Lo podemos demostrar directamente de la expresión: rr z = c t x = z0 + (cm+1 – zm+1)xm+1 + (cm+2 – zm+2)xm+2 + ... + (cn – zn)xn pues cualquier otra solución factible debe tener xi ³ 0, " i con lo que el valor z de la función objetivo satisfará que z – z0 ³ 0.

7. APLICACIONES A continuación se presentan tres tipos de problema clásicos que son característicos de la aplicación de la programación lineal en situaciones de la vida real.

7.1. El problema de la dieta Se trata de determinar la dieta más económica que satisfaga las necesidades nutritivas requeridas para una buena salud.

TEMARIO DE MATEMÁTICAS. PRUEBA A

313

Volumen I. Matemáticas

314

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Se supone que en el mercado hay n alimentos diferentes cada uno de los cuales se vende a un determinado precio ci la unidad. Por otra parte existen m elementos nutritivos básicos, de los que en una dieta equilibrada un individuo debe recibir como mínimo b unidades de cada uno de ellos diariamente. Finalmente se supone que cada unidad del alimento i de la dieta contiene aji unidades del j - ésimo elemento nutritivo. Llamando xi al número de unidades del alimento i de la dieta, el problema consiste en seleccionar los xi de modo que se minimice el costo total. Definimos una función de costo, C = c1x1 + c2x2 + ... + cnxn. Las restricciones nutritivas vendrían dadas por: xij ³ 0 i=1

åx = b ; j= 1, 2, ..., n ij

i

m

j=1

åx = a ; i = 1, 2, ..., m ij

i

n

a11x1 + a12x2 + ... + a1nxn ³ b1

j=1 i=1

Así el problema de programación lineal consistiría en minimizar ååcijxij ,sujeto a las restricciones: a21x1 + a22x2 + ... + a2nxn ³ b2

n

m

...

costo del transporte sea mínima.

j=1 i=1

am1x1 + am2x2 + ... + amnxn ³ bm y las restricciones de no negatividad x1 ³ 0, x2 ³ 0, ..., xm ³ 0 en las cantidades de los alimentos.

i-ésima fila sea ai, la suma de la j - ésima columna sea bj y la suma ponderada ååcijxij que representa el n

m

La i- ésima fila de esta matriz define las variables asociadas al origen i- ésimo, mientras que la j- ésima columna de la matriz define las variables asociadas al j - ésimo destino. El problema consiste en situar variables no negativas, xij, en la matriz de modo que la suma de la

7.2. El problema del transporte

Las cantidades a1, a2, ..., am de un cierto producto se tienen que enviar desde m lugares y se recibirán en cantidades b1, b2, ..., bn en n destinos diferentes. Se asocia con el envío de una unidad del producto desde el origen i hacia el destino j un costo de envío unitario de cij. Se desean determinar las cantidades xij a enviar entre cada par origen - destino de modo que se satisfagan las necesidades de envío y se minimice el costo total de transporte. Disponemos de la siguiente matriz: x11

x12

...

x2n

... ...

...

x1n

a2 a1

b1

...

...

xm1

x22

...

...

x21

...

am

...

...

xmn

...

...

...

...

x22

xm2

b3

...

x21

...

xm1

...

...

b2

x12

b1

x11

x1n

a1

...

x2n

a2

...

...

...

...

xm2

...

...

xmn

am

b2

...

...

b3

Las cantidades a1, a2, ..., am de un cierto producto se tienen que enviar desde m lugares y se recibirán en cantidades b1, b2, ..., bn en n destinos diferentes. Se asocia con el envío de una unidad del producto desde el origen i hacia el destino j un costo de envío unitario de cij. Se desean determinar las cantidades xij a enviar entre cada par origen - destino de modo que se satisfagan las necesidades de envío y se minimice el costo total de transporte. Disponemos de la siguiente matriz:

7.2. El problema del transporte

La i- ésima fila de esta matriz define las variables asociadas al origen i- ésimo, mientras que la j- ésima columna de la matriz define las variables asociadas al j - ésimo destino. El problema consiste en situar variables no negativas, xij, en la matriz de modo que la suma de la am1x1 + am2x2 + ... + amnxn ³ bm y las restricciones de no negatividad x1 ³ 0, x2 ³ 0, ..., xm ³ 0 en las cantidades de los alimentos. n

m

i-ésima fila sea ai, la suma de la j - ésima columna sea bj y la suma ponderada ååcijxij que representa el j=1 i=1

costo del transporte sea mínima.

... n

m

Así el problema de programación lineal consistiría en minimizar ååcijxij ,sujeto a las restricciones: j=1 i=1

a21x1 + a22x2 + ... + a2nxn ³ b2

a11x1 + a12x2 + ... + a1nxn ³ b1 n

åx = a ; i = 1, 2, ..., m

Se supone que en el mercado hay n alimentos diferentes cada uno de los cuales se vende a un determinado precio ci la unidad. Por otra parte existen m elementos nutritivos básicos, de los que en una dieta equilibrada un individuo debe recibir como mínimo b unidades de cada uno de ellos diariamente. Finalmente se supone que cada unidad del alimento i de la dieta contiene aji unidades del j - ésimo elemento nutritivo. Llamando xi al número de unidades del alimento i de la dieta, el problema consiste en seleccionar los xi de modo que se minimice el costo total. Definimos una función de costo, C = c1x1 + c2x2 + ... + cnxn. Las restricciones nutritivas vendrían dadas por: ij

i

j=1 m

åx = b ; j= 1, 2, ..., n ij

i

i=1

xij ³ 0

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

314

Programación lineal. Aplicaciones m

n

i=1

j=1

para que las restricciones sean consistentes hay que dar por supuesto que åa i = åb j , lo que nos indica que la cantidad total enviada es igual a la cantidad total recibida.

7.3. El problema del almacenamiento Se trata de plantear la situación de dirección de un almacén, con compra y venta de existencias de cierta mercancía, a fin de maximizar el beneficio en un período determinado de tiempo. El almacén tiene una capacidad fija C y existe un costo r por unidad almacenada durante un período de tiempo. Sabemos que el valor de la mercancía varía en determinados períodos de tiempo y que en un período cualquiera de tiempo se mantiene tanto el precio de compra como el de venta. Inicialmente el almacén está vacío y al finalizar el último período también habrá de estar vacío. Para formular este problema se introducen variables para cada período de tiempo, así por ejemplo sea xi el nivel de existencias en el almacén al iniciarse el período i, sea ui la cantidad comprada durante el período i, y sea si la cantidad vendida durante el mismo período i. Suponiendo que tratamos con n períodos, el problema consistirá en maximizar: n

å(p s

i i

– rxi )

i=1

sujeto a las restricciones: xi+j = xi + ui – si; i = 1, 2, ..., n – 1 0 = xn + un – sn xi + z i = C x1 = 0, xi ³ 0, ui ³ 0, si ³ 0, zi ³ 0

TEMARIO DE MATEMÁTICAS. PRUEBA A

315

TEMA

18 Matrices. Álgebra de matrices. Aplicaciones a las ciencias sociales y a la naturaleza

Jorge Navarro Camacho

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

318

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

SUMA Y PRODUCTO POR UN ESCALAR. ESPACIO VECTORIAL DE LAS MATRICES

3.

PRODUCTO. ANILLO DE LAS MATRICES CUADRADAS

4.

EQUIVALENCIA DE MATRICES. RANGO DE UNA MATRIZ

5.

CÁLCULO DEL RANGO Y DE LA INVERSA DE UNA MATRIZ

6.

DIAGONALIZACIÓN DE MATRICES CUADRADAS

7.

APLICACIONES A LAS CIENCIAS SOCIALES Y LA NATURALEZA

APLICACIONES A LAS CIENCIAS SOCIALES Y LA NATURALEZA

7.

DIAGONALIZACIÓN DE MATRICES CUADRADAS

6.

CÁLCULO DEL RANGO Y DE LA INVERSA DE UNA MATRIZ

5.

EQUIVALENCIA DE MATRICES. RANGO DE UNA MATRIZ

4.

PRODUCTO. ANILLO DE LAS MATRICES CUADRADAS

3.

SUMA Y PRODUCTO POR UN ESCALAR. ESPACIO VECTORIAL DE LAS MATRICES

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

318

Matrices

1. INTRODUCCIÓN La matrices son, posiblemente, una de las herramientas matemáticas que se utilizan en los más diversos contextos, desde el análisis numérico o la estadística, a la economía o la física. Las matrices fueron introducidas por Hamilton en 1853 en su obra Lectures on Quaternions, como extensión del concepto de determinante, aunque el cálculo matricial fue desarrollado algo más tarde, en 1858, por Cayley. Comenzaremos introduciendo formalmente el concepto de matriz sobre un cuerpo K y analizando sus principales estructuras (espacio vectorial y anillo) definiendo las operaciones mediante su relación (isomorfía) con las aplicaciones lineales entre dos espacios vectoriales sobre el cuerpo K. Tras analizar algunos conceptos de gran importancia como el rango o la inversa de una matriz, veremos algunas de sus aplicaciones. DEFINICIÓN. Dados dos conjuntos finitos I = {1, 2, ..., m} y J = {1, 2, ..., n}, llamaremos matriz de dimensión m x n sobre el cuerpo K a una aplicación. A: IxJ®K (i, j) ® ai,j Representaremos mediante Mm,n(K) al conjunto de todas las matrices de dimensión m x n sobre el cuerpo K. Habitualmente el cuerpo suele ser el de los números reales (K = R) y la matriz se representa en forma de caja rectangular con m filas y n columnas: æ a11 ... a 1n ö ç ÷ A = ç ... ... ... ÷ ç ÷ èa m1 ... a mn ø Algunas veces las matrices se representan mediante A = (aij) donde el elemento aij se encuentra en la fila i -ésima y en la columna j -ésima. Diremos que dos matrices son iguales si tienen la misma dimensión y todos sus elementos coinciden (es decir, si como aplicaciones son iguales). Comentaremos algunos tipos particulares de matrices: 1.

Matriz cuadrada será aquella que tiene el mismo número de filas que de columnas (es decir m = n). Denotaremos Mn,n(K) mediante Mn(K).

2.

Matriz fila será aquella en la que m = 1.

3.

Matriz columna será aquella en la que n = 1.

4.

Matriz diagonal será aquella en la que aij = 0 si i ¹ j; es decir, todos sus elementos son cero exceptuando los elementos situados en la diagonal principal (aii).

5.

Matriz escalar es aquella matriz diagonal que tiene todos los elementos de la diagonal iguales (aii = l¸ para todo i).

6.

Matriz triangular superior (inferior) es aquella en la que son cero todos los elementos situados debajo (encima) de la diagonal principal, es decir aij = 0 para todo i < j (i > j).

7.

Matriz traspuesta A' de A es aquella que se obtiene cambiando las filas por las columnas en A (es decir A' = (aji) o, como aplicaciones, la que verifica A'(j, i) = A(i, j)).

8.

Matriz simétrica es aquella matriz cuadrada en la que aij = aji (es decir A' = A).

9.

Matriz antisimétrica (o hesimétrica) es aquella matriz cuadrada en la que aij = – aji (es decir A' = – A).

2. SUMA Y PRODUCTO POR UN ESCALAR. ESPACIO VECTORIAL DE LAS MATRICES De forma sencilla se pueden definir en el conjunto Mm,n(K) una suma y un producto exterior por un escalar de K que lo convierten en un espacio vectorial de dimensión mn sobre K. Las definiciones son similares a las de las operaciones que convierten a Kn en un espacio vectorial de dimensión n. Así, por ejemplo, se define la suma de dos matrices de la misma dimensión (de Mm,n(K)) mediante A + B = (aij) + (bij) = (aij + bij)

TEMARIO DE MATEMÁTICAS. PRUEBA A

319

Volumen I. Matemáticas

320

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En efecto, si definimos S = (A + A')/2 y H = (A – A')/2, S es simétrica (S' = S), H es antisimétrica (H' = – H) y se verifica A = S + H. Además, como si A = S + H, entonces A' = S – H, por lo que (A + A')/2 = S y (A – A') / 2 = H, se tiene la unicidad de la descomposición. es decir, se suman los elementos situados en la misma fila y columna,

æ a +b æa ... a + b ö ... a ö æ b ... b ö 11 11 1n 1n 1n 1n ç ÷ ç 11 ÷ ç 11 ÷ ... ... ÷ ç ... ... ... ÷ + ç ... ... ... ÷ = ç ... ç ÷ ç ÷ ç ÷ èa m1+ b m1 ... a mn + b mn ø èa m1 ... a mn ø è b m1 ... b mn ø

Demostración.

PROPOSICIÓN. Si A es una matriz cuadrada, entonces existe una matriz simétrica S y otra antisimétrica H tales que A = S + H y la descomposición es única.

Con esta definición, es inmediato que Mm,n(K) es un grupo abeliano cuyo elemento neutro (matriz cero) es la matriz cuyos elementos son todos nulos, es decir, para todas las matrices de la misma dimensión se verifican las propiedades siguientes:

Los conjuntos formados por las matrices diagonales, escalares, triangulares superiores, inferiores, simétricas, y antisimétricas son subespacios vectoriales. Además, los dos últimos son suplementarios, es decir, toda matriz cuadrada se puede poner, de forma única, como suma de una matriz simétrica y otra antisimétrica. M1. (A + B) + C = A + (B + C)

Nótese que, por convenio, la transposición es prioritaria frente a las operaciones suma y producto exterior, por lo que, por ejemplo, - A' representa - (A'). M2. A + 0 = 0 + A = A para 0 = (0ij) (0 es elemento neutro de la suma en K)

M3. A + (– A) = 0 para – A = (– aij) (matriz opuesta de A)

T4. (– A)' = – A'

M4. A + B = B + A

T3. (lA)' = lA'

De forma similar, si l¸ es un escalar de K y A una matriz, se define el producto exterior mediante

T2. (A + B)' = A' + B'

lA = (laij)

T1. (A')' = A

es decir, multiplicando todos los elementos de la matriz A.

De forma sencilla puede comprobarse que, para la transposición de matrices se verifican las propiedades siguientes:

Con esta operación el conjunto de las matrices de dimensión m x n se convierte en un espacio vectorial sobre K; ya que se verifican las propiedades siguientes:

Además, la dimensión del espacio es mn ya que, si llamamos 1ij a la matriz que tienen todos los elementos nulos excepto el elemento (i, j) que es un 1, entonces {111, 112, ..., 1mn} es una base de Mm,n(K) (base natural). M5. l(A + B) = lA + lB

M6. (l + m)A = lA + mA M7. l(mA) = (lm)A

M8. 1A = A (1 es el elemento neutro del producto en K)

M8. 1A = A (1 es el elemento neutro del producto en K)

M7. l(mA) = (lm)A M6. (l + m)A = lA + mA

Además, la dimensión del espacio es mn ya que, si llamamos 1ij a la matriz que tienen todos los elementos nulos excepto el elemento (i, j) que es un 1, entonces {111, 112, ..., 1mn} es una base de Mm,n(K) (base natural). M5. l(A + B) = lA + lB

Con esta operación el conjunto de las matrices de dimensión m x n se convierte en un espacio vectorial sobre K; ya que se verifican las propiedades siguientes:

De forma sencilla puede comprobarse que, para la transposición de matrices se verifican las propiedades siguientes: es decir, multiplicando todos los elementos de la matriz A. lA = (laij)

T1. (A')' = A T2. (A + B)' = A' + B'

De forma similar, si l¸ es un escalar de K y A una matriz, se define el producto exterior mediante

T3. (lA)' = lA'

M4. A + B = B + A

T4. (– A)' = – A'

M3. A + (– A) = 0 para – A = (– aij) (matriz opuesta de A)

Nótese que, por convenio, la transposición es prioritaria frente a las operaciones suma y producto exterior, por lo que, por ejemplo, - A' representa - (A'). M2. A + 0 = 0 + A = A para 0 = (0ij) (0 es elemento neutro de la suma en K) M1. (A + B) + C = A + (B + C)

Los conjuntos formados por las matrices diagonales, escalares, triangulares superiores, inferiores, simétricas, y antisimétricas son subespacios vectoriales. Además, los dos últimos son suplementarios, es decir, toda matriz cuadrada se puede poner, de forma única, como suma de una matriz simétrica y otra antisimétrica.

Con esta definición, es inmediato que Mm,n(K) es un grupo abeliano cuyo elemento neutro (matriz cero) es la matriz cuyos elementos son todos nulos, es decir, para todas las matrices de la misma dimensión se verifican las propiedades siguientes:

PROPOSICIÓN. Si A es una matriz cuadrada, entonces existe una matriz simétrica S y otra antisimétrica H tales que A = S + H y la descomposición es única. æ a11+ b11 ... a1n + b1n ö æ a11 ... a1n ö æ b11 ... b1n ö ç ÷ ç ÷ ç ÷ ... ... ÷ ç ... ... ... ÷ + ç ... ... ... ÷ = ç ... ç ÷ ç ÷ ç ÷ b ... b a b ... a + b + a ... a è m1 è m1 è m1 mn ø m1 mn mn ø mn ø

Demostración.

En efecto, si definimos S = (A + A')/2 y H = (A – A')/2, S es simétrica (S' = S), H es antisimétrica (H' = – H) y se verifica A = S + H. Además, como si A = S + H, entonces A' = S – H, por lo que (A + A')/2 = S y (A – A') / 2 = H, se tiene la unicidad de la descomposición. es decir, se suman los elementos situados en la misma fila y columna,

320

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Matrices

3. PRODUCTO. ANILLO DE LAS MATRICES CUADRADAS Para introducir el producto de dos matrices es conveniente señalar la isomorfía existente entre el espacio de las matrices y las aplicaciones lineales. Aunque esta relación no ha sido necesaria para introducir (de forma natural) las operaciones suma y producto exterior, veremos como éstas también son equivalentes a las correspondientes operaciones dentro del conjunto de aplicaciones lineales. Si V y V* son dos espacios vectoriales sobre un cuerpo K y f es una aplicación lineal f : V ® V*, entonces fijadas dos bases B = {u1, ..., um} y B* = {v1, ..., vn} de ambos espacios vectoriales, f queda unívocamente determinada por las imágenes de los elementos de la base B, es decir, por sus coordenadas en la base B*, f(u1) = a11v1 + ... + an1vn f(u2) = a12v1 + ... + an2vn ...

[1]

f(um) = a1mv1 + ... + anmvn De esta forma, a f se le puede asociar una matriz F(f) n x m que contiene toda la información sobre la aplicación lineal, definida mediante: æa11 ... a1m ö ç ÷ F(f) = ç ... ... ... ÷ ç ÷ èa n1 ... a nm ø pudiendo calcular la imagen de un vector cualquiera x = (x1, ..., xm)B = åxju j , mediante j

æ ö ÷ f(x) = åxj f(u j ) = ååv i a ij xj = åç ç åa ij xj ÷v i ø j j i i è j Recíprocamente, dada una matriz A = (aij) de Mn,m(K); dos espacios vectoriales V y V* sobre K de dimensiones m y n, respectivamente, y dos bases B y B* de los mismos, podemos definir una única aplicación lineal fA; tal que fA(uj) = åa iju i. i

De esta forma, fijadas las bases, se obtiene una biyección entre las matrices y las aplicaciones lineales, verificándose: F(f) + F(g) = F(f + g) y lF(f) = F(lf); con lo que ambos espacios vectoriales son equivalentes (isomorfos). Ahora usaremos esta relación para definir el producto de dos matrices. DEFINICIÓN. Sean A y B dos matrices sobre K de dimensiones n x m y p x n; respectivamente, y sean fA: V ® V* y fB: V* ® V** las aplicaciones lineales asociadas a ellas fijadas las correspondientes bases B, B* y B**. Entonces, llamaremos matriz producto BA a la matriz asociada a la composición de ambas aplicaciones lineales, es decir, BA = F(fB o fA) Nótese que para que se pueda definir el producto de dos matrices es necesario que coincida el número de columnas de la primera con el número de filas de la segunda. Si A = (aij) y B = (bjk), y fijamos las bases B = {u1, ..., um}, B* = {u*1, ..., u*n}, B** = {u1**, ..., up**}, entonces (fB o fA)(ui)

= fB(fA (ui)) = = fB(åa jiu *j ) = j

= åa jifB (u *j ) = j

= åa ji åb kju *k* j

TEMARIO DE MATEMÁTICAS. PRUEBA A

k

321

Volumen I. Matemáticas

322

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

es decir si BA = (cki), entonces cik (la coordenada k – ésima en B** de fB o fA(ui)) verifica

T6. A es regular si A' es regular y (A–1)' = (A')–1 T5. (AB)' = B'A'

cki = åb kja ji j

El recíproco de R2 es cierto (si una matriz no es divisora de cero, es regular) pero la demostración es un poco más complicada. Con relación a la transposición de matrices se tienen las propiedades siguientes:

Esta relación, además de poder ser utilizada para calcular el producto de dos matrices, demuestra que éste está bien definido, ya que no depende de las bases elegidas. Además, las coordenadas en la base B* de la imagen de un vector v con coordenadas u = (x1, ..., xm)'B en la base B, se pueden calcular usando el producto de matrices mediante R1. Si A y B son regulares, entonces AB es regular y (AB)–1 = B–1 A–1. R2. Si A es regular y AB = 0 ó BA = 0 entonces B = 0 (es decir, las matrices regulares no son divisoras de cero). æ y 1 ö æa11 ... a 1m öæ x1 ö ç ÷ ç ÷ç ÷ fA ( u ) = ç ... ÷ =ç ... ... ... ÷ç ... ÷ = Au ç ÷ ç ÷ç ÷ è y n øB* èa n1 ... a nm øè xm øB

DEFINICIÓN. Llamaremos matrices inversibles o regulares a aquellas matrices cuadradas para las que existe una matriz inversa (que representaremos mediante A–1) tal que AA–1 = A–1 A = In Las matrices cuadradas no inversibles se llaman matrices singulares. Debido a la isomorfía de las matrices cuadradas con los endomorfismos, una matriz será inversible si, y sólo si, el correspondiente endomorfismo es inversible, lo que es equivalente a que la dimensión del espacio Imf sea igual a la dimensión del espacio vectorial. Veamos algunas propiedades de las matrices regulares sencillas de demostrar:

Las propiedades de la composición de aplicaciones lineales se trasladan al producto de matrices, verificándose:

M9. (AB)C = A(BC) M10. (A + B)C = AC + BC M11. C(A + B) = CA + CB Además, si AÎMm,n(K) e Ik es la matriz escalar de dimensión k formada poniendo en la diagonal principal la unidad de K (y ceros fuera de la diagonal), entonces: M12. AIn = ImA = A Llamaremos a In matriz unidad de dimensión n. Si tomamos la misma base en el espacio vectorial origen y en el imagen (B = B*), entonces la matriz identidad es la matriz asociada al endomorfismo identidad definido por f(u) = u para todo u. En general, (Mn(K), ·) tampoco es un grupo, es decir, no todas la matrices tienen una inversa. æ 1 2öæ1 ç ÷ç è 3 4 øè1 æ1 2öæ 1 ç ÷ç è1 2øè 3

2ö æ 3 6 ö ÷ ÷= ç 2ø è 7 14 ø 2ö æ 7 10ö ÷= ç ÷ 4 ø è 7 10ø

El producto de matrices es una operación interna en el conjunto de matrices cuadradas, siendo (Mn(K), +, ·) un anillo isomorfo al de las aplicaciones lineales de Kn en sí mismo (endomorfismos). El producto de matrices (igual que la composición de aplicaciones) en general, no es conmutativo. Por ejemplo,

El producto de matrices es una operación interna en el conjunto de matrices cuadradas, siendo (Mn(K), +, ·) un anillo isomorfo al de las aplicaciones lineales de Kn en sí mismo (endomorfismos). El producto de matrices (igual que la composición de aplicaciones) en general, no es conmutativo. Por ejemplo, æ 1 2öæ1 2ö æ 3 6 ö ÷ ç ÷ç ÷= ç è 3 4 øè1 2ø è 7 14 ø æ1 2öæ 1 2ö æ 7 10ö ç ÷ç ÷= ç ÷ è1 2øè 3 4 ø è 7 10ø

M9. (AB)C = A(BC) M10. (A + B)C = AC + BC M11. C(A + B) = CA + CB Además, si AÎMm,n(K) e Ik es la matriz escalar de dimensión k formada poniendo en la diagonal principal la unidad de K (y ceros fuera de la diagonal), entonces: M12. AIn = ImA = A Llamaremos a In matriz unidad de dimensión n. Si tomamos la misma base en el espacio vectorial origen y en el imagen (B = B*), entonces la matriz identidad es la matriz asociada al endomorfismo identidad definido por f(u) = u para todo u. En general, (Mn(K), ·) tampoco es un grupo, es decir, no todas la matrices tienen una inversa.

DEFINICIÓN. Llamaremos matrices inversibles o regulares a aquellas matrices cuadradas para las que existe una matriz inversa (que representaremos mediante A–1) tal que AA–1 = A–1 A = In Las matrices cuadradas no inversibles se llaman matrices singulares. Debido a la isomorfía de las matrices cuadradas con los endomorfismos, una matriz será inversible si, y sólo si, el correspondiente endomorfismo es inversible, lo que es equivalente a que la dimensión del espacio Imf sea igual a la dimensión del espacio vectorial. Veamos algunas propiedades de las matrices regulares sencillas de demostrar:

Las propiedades de la composición de aplicaciones lineales se trasladan al producto de matrices, verificándose: æ y ö æa ... a 1m öæ x1 ö ç 1 ÷ ç 11 ÷ç ÷ fA ( u ) = ç ... ÷ =ç ... ... ... ÷ç ... ÷ = Au ç ÷ ç ÷ç ÷ è y n øB* èa n1 ... a nm øè xm øB

R1. Si A y B son regulares, entonces AB es regular y (AB)–1 = B–1 A–1. R2. Si A es regular y AB = 0 ó BA = 0 entonces B = 0 (es decir, las matrices regulares no son divisoras de cero).

Esta relación, además de poder ser utilizada para calcular el producto de dos matrices, demuestra que éste está bien definido, ya que no depende de las bases elegidas. Además, las coordenadas en la base B* de la imagen de un vector v con coordenadas u = (x1, ..., xm)'B en la base B, se pueden calcular usando el producto de matrices mediante

El recíproco de R2 es cierto (si una matriz no es divisora de cero, es regular) pero la demostración es un poco más complicada. Con relación a la transposición de matrices se tienen las propiedades siguientes: j

cki = åb kja ji

T5. (AB)' = B'A'

T6. A es regular si A' es regular y (A–1)' = (A')–1

es decir si BA = (cki), entonces cik (la coordenada k – ésima en B** de fB o fA(ui)) verifica CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

322

Matrices La relación T5 es consecuencia de que si AB = (cik) y B'A' = (dki); entonces de (18.3.2), se tiene d ki = åb'kj a'ji= åb jka ij = c ik j

j

La demostración de T6 es consecuencia de T5 y T1, ya que A'(A–1)' = [A–1 (A')']' = [A–1 A]' = I'n = In Análogamente se prueba que (A–1)'A' = In.

4. EQUIVALENCIA DE MATRICES. RANGO DE UNA MATRIZ En la sección anterior hemos comprobado como el isomorfismo entre las aplicaciones lineales y las matrices permite introducir (de forma natural) el producto de dos matrices. Sin embargo, como hemos señalado anteriormente, a una aplicación lineal se le pueden asociar distintas matrices, según se elijan las bases en los correspondientes espacios vectoriales. Así, por ejemplo si permutamos dos vectores en la base del espacio imagen, se producirá un cambio en las filas de la matriz asociada (ver [1]). Esto nos conduce a definir la siguiente relación de equivalencia. DEFINICIÓN. Dos matrices A y B de la misma dimensión serán equivalentes (A ~ B) si son las matrices asociadas a una misma aplicación lineal para diferentes bases. Esta relación es una relación de equivalencia ya que se verifican E1. A ~ A E2. A ~ B Û B ~ A E3. Si A ~ B y B ~ C, entonces A ~ C. Así, por ejemplo, las matrices inversibles son todas equivalentes a la matriz identidad (ya que la Imf será una base) y, por tanto, equivalentes entre sí. Por lo tanto las matrices regulares representan los endomorfismos correspondientes a cambios de base (inversibles). Concretamente, un cambio de base en el espacio origen supone la composición de la aplicación lineal con un endomorfismo inversible, por lo que la nueva matriz asociada se multiplica por la derecha por una matriz inversible: F(fA o fcambio) = AP Análogamente, un cambio de base en el espacio imagen supone multiplicar por la izquierda a la matriz asociada por una matriz inversible: QA = F(fcambio o fA) De esta forma, se obtiene la equivalencia siguiente. PROPOSICIÓN. Dos matrices de la misma dimensión son equivalentes A ~ B si, y sólo si, existen dos matrices regulares P y Q tales que A = PBQ. A continuación introduciremos el concepto de rango de una matriz y lo usaremos para caracterizar a las clases de la relación de equivalencia anterior. DEFINICIÓN. Llamaremos rango de una matriz A (rango(A)) de Mn,m(K) a la dimensión del espacio imagen de la correspondiente aplicación lineal Im(fA). La definición no depende de las bases elegidas y, evidentemente, el rango(A) £ n ya que Imf Í V* y dim(V*) = n. Además, se tiene el siguiente resultado: PROPOSICIÓN. Dos matrices son equivalentes si, y sólo si tienen el mismo rango. Para demostrar este resultado veremos que una matriz A tiene rango k si, y sólo si, es equivalente a la matriz que tiene los k primeros elementos de la diagonal principal unos, y el resto de los elementos ceros, es decir, æ Ik 0ö ÷ A ~ Lk = ç è 0 0ø

TEMARIO DE MATEMÁTICAS. PRUEBA A

323

Volumen I. Matemáticas

324

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Antes de ver un ejemplo, señalaremos que el paso 4 (ó el 3) no es estrictamente necesario, ya que si no lo realizamos, el rango será el número de vectores fila (columna) no nulos.

Para lo cual basta tener en cuenta que se pueden encontrar una base B = {u1, ..., um} tal que BIm = {fA(u1), ..., fA(uk)} es una base de ImfA y fA(uj) = 0 para j > k. De esta forma, si completamos BIm hasta obtener una base B* de V*, entonces la matriz asociada a fA en estas nuevas bases es Lk.

Paso 5. Aplicar los pasos 1, 2, 3 y 4 a la matriz que se obtiene tachando las primeras fila y columna, hasta que la matriz que se obtenga tenga todos los elementos nulos.

De esta forma, la relación de equivalencia divide Mn,m(K) en min(m,n)+1 clases de equivalencia cuyos representantes son L0, L1, ..., Lmin(m,n) (por convenio L0 = 0). En particular, una matriz cuadrada de dimensión n es regular si, y sólo si, tiene rango n. (*) Paso 4. Usando operaciones columnas hacer cero los elementos situados a la derecha del pivote. Paso 3. Usando operaciones fila hacer cero los elementos situados bajo el pivote.

De la definición de F se deduce que el espacio ImfA es el espacio engendrado por los vectores columnas de la matriz A, por lo que el rango será el mayor número de vectores filas independientes contenidos en A. Veamos que también es mayor número de vectores fila independientes (o la dimensión del espacio engendrado por los vectores columna).

Paso 2. Haciendo operaciones fila o columna, conducir este elemento hasta la posición superior izquierda (1,1). Paso 1. Buscar un elemento no nulo (llamado pivote) en A.

TEOREMA. Para toda matriz el rango por filas es igual al rango por columnas (es decir rango(A) = rango(A')).

El Método del pivote (o de Gauss) que también se utiliza para la resolución de sistemas lineales, permite la transformación de A en una de estas matrices, mediante los siguientes pasos:

Para demostrarlo, tendremos en cuenta que si r es el rango por filas y s el rango por columnas, entonces por la proposición anterior A ~ L y A' ~ L , es decir, existen matrices inversibles P y Q tales que r s A' = PLsQ por lo que A'' = Q'LsP'. Como P' y Q' serán también inversibles, A ~ Ls y s = r.

Por lo tanto, al hacer operaciones fila o columna en una matriz el rango permanece constante y, por consiguiente, si hacemos operaciones fila y operaciones columna en A hasta trasformarla en una matriz Lr, el rango será r. Como estas operaciones mantienen la dimensión, transformarán bases en bases. De esta forma, dada una aplicación lineal con matriz asociada A, si en la base origen hacemos una operación elemental, la nueva matriz asociada se obtiene realizando la misma operación elemental en las columnas de A. Análogamente, las operaciones elementales en la base del espacio imagen producen operaciones elementales en las filas de A (ver [1]).

5. CÁLCULO DEL RANGO Y DE LA INVERSA DE UNA MATRIZ

1.

Permutar dos vectores entre sí.

2.

Sustituir un vector ui por ui + luj (l Î K).

3.

Multiplicar ui por un escalar no nulo.

Para calcular el rango y la inversa de una matriz introduciremos el concepto de operaciones elementales en una matriz basándonos en las correspondientes operaciones elementales para vectores. Conviene señalar que tanto el rango, como la inversa pueden calcularse también usando determinantes (ver tema 19). Dado un conjunto de vectores {u1, ..., un}, las siguientes operaciones mantienen la dimensión del espacio engendrado por dichos vectores:

Dado un conjunto de vectores {u1, ..., un}, las siguientes operaciones mantienen la dimensión del espacio engendrado por dichos vectores: Multiplicar ui por un escalar no nulo.

3.

Sustituir un vector ui por ui + luj (l Î K).

2.

Permutar dos vectores entre sí.

1.

Para calcular el rango y la inversa de una matriz introduciremos el concepto de operaciones elementales en una matriz basándonos en las correspondientes operaciones elementales para vectores. Conviene señalar que tanto el rango, como la inversa pueden calcularse también usando determinantes (ver tema 19). Como estas operaciones mantienen la dimensión, transformarán bases en bases. De esta forma, dada una aplicación lineal con matriz asociada A, si en la base origen hacemos una operación elemental, la nueva matriz asociada se obtiene realizando la misma operación elemental en las columnas de A. Análogamente, las operaciones elementales en la base del espacio imagen producen operaciones elementales en las filas de A (ver [1]).

5. CÁLCULO DEL RANGO Y DE LA INVERSA DE UNA MATRIZ

Para demostrarlo, tendremos en cuenta que si r es el rango por filas y s el rango por columnas, entonces por la proposición anterior A ~ Lr y A' ~ Ls, es decir, existen matrices inversibles P y Q tales que A' = PLsQ por lo que A'' = Q'LsP'. Como P' y Q' serán también inversibles, A ~ Ls y s = r.

Por lo tanto, al hacer operaciones fila o columna en una matriz el rango permanece constante y, por consiguiente, si hacemos operaciones fila y operaciones columna en A hasta trasformarla en una matriz Lr, el rango será r.

El Método del pivote (o de Gauss) que también se utiliza para la resolución de sistemas lineales, permite la transformación de A en una de estas matrices, mediante los siguientes pasos:

TEOREMA. Para toda matriz el rango por filas es igual al rango por columnas (es decir rango(A) = rango(A')). Paso 1. Buscar un elemento no nulo (llamado pivote) en A.

De la definición de F se deduce que el espacio ImfA es el espacio engendrado por los vectores columnas de la matriz A, por lo que el rango será el mayor número de vectores filas independientes contenidos en A. Veamos que también es mayor número de vectores fila independientes (o la dimensión del espacio engendrado por los vectores columna).

Paso 2. Haciendo operaciones fila o columna, conducir este elemento hasta la posición superior izquierda (1,1). Paso 3. Usando operaciones fila hacer cero los elementos situados bajo el pivote.

De esta forma, la relación de equivalencia divide Mn,m(K) en min(m,n)+1 clases de equivalencia cuyos representantes son L0, L1, ..., Lmin(m,n) (por convenio L0 = 0). En particular, una matriz cuadrada de dimensión n es regular si, y sólo si, tiene rango n. (*) Paso 4. Usando operaciones columnas hacer cero los elementos situados a la derecha del pivote.

Paso 5. Aplicar los pasos 1, 2, 3 y 4 a la matriz que se obtiene tachando las primeras fila y columna, hasta que la matriz que se obtenga tenga todos los elementos nulos.

Para lo cual basta tener en cuenta que se pueden encontrar una base B = {u1, ..., um} tal que BIm = {fA(u1), ..., fA(uk)} es una base de ImfA y fA(uj) = 0 para j > k. De esta forma, si completamos BIm hasta obtener una base B* de V*, entonces la matriz asociada a fA en estas nuevas bases es Lk.

Antes de ver un ejemplo, señalaremos que el paso 4 (ó el 3) no es estrictamente necesario, ya que si no lo realizamos, el rango será el número de vectores fila (columna) no nulos. 324

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Matrices EJEMPLO. Para calcular el rango de æ1 2 3 ö ÷ ç A =ç5 6 7 ÷ ÷ ç è 6 8 10ø haciendo operaciones fila se obtiene: æ1 2 3 ö æ1 2 3 ö æ1 2 3 ö ÷ ÷ ç ÷ ç ç ç 5 6 7 ÷ ~ç 0 –4 –8÷ ~ç 0 –4 –8÷ ÷ ÷ ç ÷ ç ç è 6 8 10ø è 0 –4 –8ø è 0 0 0 ø y, por lo tanto, su rango es 2. Nótese, que si seguimos haciendo operaciones columna se puede obtener æ 1 2 3 ö æ 1 0 0ö ÷ ÷ ç ç ç 5 6 7 ÷ ~ç 0 1 0÷ ÷ ÷ ç ç è 6 8 10ø è 0 0 0ø Para calcular la inversa de una matriz regular A tendremos en cuenta que al hacer operaciones fila es equivalente a multiplicar por la izquierda por una matriz inversible. De esta forma, haciendo operaciones fila transformamos A en la identidad, se tiene PA = I por lo que, si realizamos las mismas operaciones fila sobre la matriz identidad, al final obtendremos PI = P. Para aplicar este método se parte de la matriz de dos cajas (A ÷ I) formada uniendo A y la identidad I aplicándole operaciones fila hasta transformar A en I. Cuando esto ocurra, la matriz situada en la otra caja será la inversa de A. Para transformar A en la identidad se utiliza el método del pivote sin usar operaciones columna. EJEMPLO. Para calcular la inversa de æ 1 2 3ö ÷ ç A = ç 1 1 1÷ ÷ ç è 0 1 1ø partimos de æ 1 2 3 1 0 0ö ÷ ç ç 5 6 7 0 1 0÷ ÷ ç è 7 8 9 0 0 1ø hasta conseguir, mediante operaciones fila, la matriz æ 1 0 0 0 1 –1ö ÷ ç ç 0 1 0 –1 1 2 ÷ ÷ ç è 0 0 1 1 –1 –1ø por lo tanto æ 0 1 –1ö ÷ ç A = ç –1 1 2 ÷ ÷ ç è 1 –1 –1ø –1

6. DIAGONALIZACIÓN DE MATRICES CUADRADAS DEFINICIÓN. Llamaremos valor propio de una matriz real (sobre K) cuadrada A de dimensión n (o de una aplicación lineal L sobre un mismo e.u.) a un número real (de K) l para el que exista un vector u (n x 1) no nulo tal que Au = lu (L(u) = lu). En este caso v será un vector propio de A (de L) asociado al valor propio l.

TEMARIO DE MATEMÁTICAS. PRUEBA A

325

Volumen I. Matemáticas

326

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

æ1 –1öæ x ö 2 ÷ç ÷= x + y 2 L ( x y) = ( x y) ç è1 1 øè y ø

Para el cálculo de los valores propios suele utilizarse la propiedad siguiente: PROPOSICIÓN. l es un valor propio de A si, y sólo si, l es una raíz real del polinomio pA(x) = ÷A – xIn÷. Al polinomio pA se le suele denominar polinomio característico de A. La demostración es sencilla, ya que l es un valor propio de A si, y sólo si, el sistema homogéneo de ecuaciones lineales asociado a la matriz A – lIn tiene una solución no nula, lo que ocurre sólo cuando ÷ A – lIn ÷ = 0 (ver tema 16). Evidentemente el núcleo de la aplicación lineal (Ker(L) = {u : L(u) = 0}) es el conjunto de vectores propios asociados al valor propio l = 0. Puede probarse fácilmente que el conjunto de vectores propios asociados a un mismo valor propio forman un subespacio vectorial, y que los vectores propios obtenidos de diferentes valores propios son independientes. De esta forma, si tomamos una base en cada uno de los subespacios correspondientes a los distintos valores propios de L, y la completamos a una base del espacio vectorial, entonces la matriz asociada a L en esta nueva base será de la forma æD 0 ö ÷ M =ç è 0 Bø También las formas cuadráticas se pueden representar mediante matrices. Por ejemplo, æ x ö æcos a sin a öæ x ö ÷ç ÷ fç ÷= ç è y ø èsin a – cos a øè y ø

o el giro de ángulo a mediante

æ x ö æ1 1 öæ x ö ÷ç ÷ fç ÷= ç è y ø è1 –1øè y ø

Geometría. Aplicaciones lineales. Formas cuadráticas. Como hemos señalado durante todo el tema, las matrices son una forma de codificar las aplicaciones lineales. Así, por ejemplo, la transformación en el plano f(x, y) = (x + y, x – y) puede representarse usando vectores columna mediante

donde D es una matriz diagonal (dij = 0 si i ¹ j) que contiene a todos los valores propios de M. Además, puede probarse que la dimensión de los espacios vectoriales asociados a los valores propios coincide con la multiplicidad de dichos valores propios como raíces del polinomio pA(x), con lo que la dimensión de D coincide con el número de raíces reales de pA(x). De esta forma, si pA tiene todas sus raíces reales, entonces M = D y A se dirá diagonalizable, ya que si P y P–1 son las matrices del cambio de base (es decir, P está formada por los vectores columna de las coordenadas de los vectores propios en la base inicial), entonces P–1 AP = D Cuando la matriz A sea simétrica, entonces los espacios vectoriales asociados a valores propios distintos son ortogonales, ya que si Au = lu y Au = mu, entonces u'A'u = lu'u = mu'u, lo que implica u'u = 0. En este caso puede demostrarse el resultado siguiente. 1.

Como comentamos en la introducción es complicado encontrar un concepto matemático que tenga tantas y tan diversas aplicaciones como las matrices desde la discusión y resolución de los sistemas lineales a la hojas de cálculo o la codificación de imágenes en ordenadores. Aquí solamente comentaremos algunas de las aplicaciones, a nuestro juicio, más representativas.

7. APLICACIONES A LAS CIENCIAS SOCIALES Y LA NATURALEZA

TEOREMA. (Espectral). Si A es una matriz real y simétrica, entonces existe una matriz ortogonal P (su inversa es igual a su traspuesta) tal que P–1 AP es diagonal.

TEOREMA. (Espectral). Si A es una matriz real y simétrica, entonces existe una matriz ortogonal P (su inversa es igual a su traspuesta) tal que P–1 AP es diagonal.

donde D es una matriz diagonal (dij = 0 si i ¹ j) que contiene a todos los valores propios de M. Además, puede probarse que la dimensión de los espacios vectoriales asociados a los valores propios coincide con la multiplicidad de dichos valores propios como raíces del polinomio pA(x), con lo que la dimensión de D coincide con el número de raíces reales de pA(x). De esta forma, si pA tiene todas sus raíces reales, entonces M = D y A se dirá diagonalizable, ya que si P y P–1 son las matrices del cambio de base (es decir, P está formada por los vectores columna de las coordenadas de los vectores propios en la base inicial), entonces P–1 AP = D Cuando la matriz A sea simétrica, entonces los espacios vectoriales asociados a valores propios distintos son ortogonales, ya que si Au = lu y Au = mu, entonces u'A'u = lu'u = mu'u, lo que implica u'u = 0. En este caso puede demostrarse el resultado siguiente.

7. APLICACIONES A LAS CIENCIAS SOCIALES Y LA NATURALEZA

Como comentamos en la introducción es complicado encontrar un concepto matemático que tenga tantas y tan diversas aplicaciones como las matrices desde la discusión y resolución de los sistemas lineales a la hojas de cálculo o la codificación de imágenes en ordenadores. Aquí solamente comentaremos algunas de las aplicaciones, a nuestro juicio, más representativas. 1.

Geometría. Aplicaciones lineales. Formas cuadráticas. Como hemos señalado durante todo el tema, las matrices son una forma de codificar las aplicaciones lineales. Así, por ejemplo, la transformación en el plano f(x, y) = (x + y, x – y) puede representarse usando vectores columna mediante

PROPOSICIÓN. l es un valor propio de A si, y sólo si, l es una raíz real del polinomio pA(x) = ÷A – xIn÷. Al polinomio pA se le suele denominar polinomio característico de A. La demostración es sencilla, ya que l es un valor propio de A si, y sólo si, el sistema homogéneo de ecuaciones lineales asociado a la matriz A – lIn tiene una solución no nula, lo que ocurre sólo cuando ÷ A – lIn ÷ = 0 (ver tema 16). Evidentemente el núcleo de la aplicación lineal (Ker(L) = {u : L(u) = 0}) es el conjunto de vectores propios asociados al valor propio l = 0. Puede probarse fácilmente que el conjunto de vectores propios asociados a un mismo valor propio forman un subespacio vectorial, y que los vectores propios obtenidos de diferentes valores propios son independientes. De esta forma, si tomamos una base en cada uno de los subespacios correspondientes a los distintos valores propios de L, y la completamos a una base del espacio vectorial, entonces la matriz asociada a L en esta nueva base será de la forma æD 0 ö ÷ M =ç è 0 Bø æ x ö æ1 1 öæ x ö ÷ç ÷ fç ÷= ç è y ø è1 –1øè y ø

o el giro de ángulo a mediante

æ x ö æcos a sin a öæ x ö ÷ç ÷ fç ÷= ç è y ø èsin a – cos a øè y ø

También las formas cuadráticas se pueden representar mediante matrices. Por ejemplo, æ1 –1öæ x ö 2 ÷ç ÷= x + y 2 L ( x y) = ( x y) ç è1 1 øè y ø

Para el cálculo de los valores propios suele utilizarse la propiedad siguiente: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

326

Matrices 2.

3.

Discusión y resolución de sistemas lineales de ecuaciones. Un sistema de ecuaciones lineales puede representarse usando matrices mediante Ax = b donde A es la matriz de coeficientes del sistema, x es el vector columna formado por las incógnitas y b es el vector columna formado con los términos independientes. El concepto de rango permite la discusión (ver si es resoluble y cuál es la dimensión del espacio de soluciones) y el método del pivote (Gauss) su resolución analítica. Otra forma de resolución (Cramer) utiliza el concepto de determinante de una matriz (ver tema19). Si la matriz de coeficientes es regular, también se podría resolver usando (calculando) la matriz inversa y la solución sería x = A–1b, aunque, en la práctica, este método no se utiliza, ya que el cálculo de la inversa conlleva un mayor número de operaciones que su resolución por uno de los métodos anteriores (Gauss o Cramer). Cálculo numérico. También en el cálculo numérico las matrices son una herramienta indispensable, por ejemplo, para el cálculo de máximos y mínimos o el desarrollo de Taylor de una función f : Rn ® R, mediante el æ¶ ö análisis de la matriz de columna de derivadas parcialesç ç f÷ ÷(vector gradiente) y su matriz Hesè ¶xi ø æ¶ ¶ ö ÷ siana H = ç ç ¶x ¶x f ÷(ver, por ejemplo, Pita (1995)). è i j ø También se utilizan las matrices en la resolución de sistemas ecuaciones diferenciales lineales que se aplican, por ejemplo, en Biología al estudiar el crecimiento de poblaciones en sistemas ecológicos o en Química, al estudiar reacciones en la que intervienen varios reactivos. Por ejemplo, el sistema x' = ax – by y' = cx + dy donde x e y son funciones (a, b, c, d > 0), es equivalente a æ x'ö æa –b öæ x ö ç ÷= ç ÷ç ÷ è y'ø èc d øè y ø

4.

5.

en forma matricial, y puede representar el crecimiento de dos especies siendo el crecimiento de la primera (especie presa) más grande cuanto mayor sea el número de individuos de su especie x y cuanto menor sea el de la segunda especie y (especie depredadora). Por el contrario, el crecimiento de la especie depredadora es mayor cuanto mayor sea su número y el número de presas. La resolución de este tipo de sistemas se basa en el análisis espectral (cálculo de los valores propios) de la matriz asociada. Programación lineal. La mayoría de los problemas de programación lineal se formulan usando ecuaciones matriciales y muchos métodos de resolución como, por ejemplo, el método del simplex, se basan en algoritmos aplicados a matrices numéricas (matrices de vértices en este caso). También en la teoría de grafos es fundamental el uso de matrices, de conexión o de distancia entre los distintos vértices del grafo, que, por ejemplo, se utilizan para representar redes de carreteras o problemas de tráfico aéreo. Otras veces se estudia cómo se deben abastecer m tiendas (clientes) desde n almacenes (servidores), y la solución consiste en una matriz m x n que establece qué cantidad de producto sirve cada almacén a cada tienda, a la que usando la matriz que establece el coste unitario de transporte entre cada almacén y cada tienda, se le asocia un coste total que debe ser minimizado. Probabilidad y Estadística. También en la estadística las matrices son fundamentales, por ejemplo, cuando en estadística descriptiva se representan los datos (o variables) medidos para diversos individuos. En este sentido, las hojas de cálculo también pueden considerarse como matrices cuando se eliminen las columnas que no sean numéricas. En probabilidad el estudio de las relaciones lineales existentes entre distintas variables se realiza mediante la matriz de covarianzas S = (sij) (con sij = E[(Xi – E(Xi))(Xj – E(Xj))]) equivalente al concepto de varianza para una variable, o mediante la matriz de correlaciones lineales R = (rij) (con rij = sij / s iis jj ). Además, las matrices son fundamentales en el desarrollo del Modelo lineal, en los procesos

TEMARIO DE MATEMÁTICAS. PRUEBA A

327

Volumen I. Matemáticas

328

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

6.

de Markov (matrices de transición), en la regresión multivariante, en el análisis de componentes principales, en el análisis factorial, el análisis discriminate, etc. Física. En primer lugar señalaremos las aplicaciones consecuencia de los resultados mencionados anteriormente en Geometría o en Cálculo numérico, como, por ejemplo, el cálculo de las nuevas coordenadas al cambiar de sistema de referencia o el significado del gradiente y el Hessiano en los mapas isobáricos usados en Meteorología. Las matrices también se utilizan en la estadística física, por ejemplo, al describir el movimiento de una partícula en el espacio mediante un tipo especial de Procesos Estocásticos denominados Movimientos Brownianos. Economía. La mayoría de los modelos económicos que tratan de modelar el comportamiento de un mercado provienen de la Teoría de Juegos y se construyen usando matrices numéricas. Un ejemplo son los modelos de Leontiev basados en las matrices input-output que le valieron el premio Nobel de Economía. Varios. Ya hemos mencionado cómo las hojas de cálculo pueden considerarse matrices numéricas. De esta forma, si en las columnas de una matriz (hoja de cálculo) tenemos información sobre la antigüedad, número de horas extras, etc., sobre los empleados de una empresa (cada línea representa un empleado), mediante operaciones columnas podemos calcular la nóminas de cada uno de ellos. También señalaremos cómo la imagen en una pantalla de ordenador (o un televisor) es una matriz numérica que indica dónde hay un punto (blanco y negro, 0/1) o de qué color es ese punto (colores = números). Así, las nuevas cámaras fotográficas digitales lo que hacen es convertir un imagen en una matriz de numérica mediante un código que asigna a cada color un número. El ordenador decodifica esta información convirtiendo la matriz en una imagen en la pantalla. La resolución (calidad de la imagen) está relacionada con la dimensión de la matriz utilizada (número de puntos). Por lo tanto, las imágenes de una película o un juego serán una sucesión de matrices numéricas. Por ejemplo, si jugamos a los barcos (hundir la flota) la información sobre la situación de la flota de cada jugador es una imagen que puede representarse mediante una matriz 8 x 8:

Una posición en ajedrez también es una matriz, si establecemos códigos para cada una de las piezas (rey blanco=1, rey negro=-1, etc.). En arquitectura, las matrices se utilizan, por ejemplo, para el cálculo de la resistencia de estructuras arquitectónicas e industriales. En resumen, podemos decir que las matrices son una herramienta fundamental para un científico actual. de Markov (matrices de transición), en la regresión multivariante, en el análisis de componentes principales, en el análisis factorial, el análisis discriminate, etc. Física. En primer lugar señalaremos las aplicaciones consecuencia de los resultados mencionados anteriormente en Geometría o en Cálculo numérico, como, por ejemplo, el cálculo de las nuevas coordenadas al cambiar de sistema de referencia o el significado del gradiente y el Hessiano en los mapas isobáricos usados en Meteorología. Las matrices también se utilizan en la estadística física, por ejemplo, al describir el movimiento de una partícula en el espacio mediante un tipo especial de Procesos Estocásticos denominados Movimientos Brownianos. Economía. La mayoría de los modelos económicos que tratan de modelar el comportamiento de un mercado provienen de la Teoría de Juegos y se construyen usando matrices numéricas. Un ejemplo son los modelos de Leontiev basados en las matrices input-output que le valieron el premio Nobel de Economía. Varios. Ya hemos mencionado cómo las hojas de cálculo pueden considerarse matrices numéricas. De esta forma, si en las columnas de una matriz (hoja de cálculo) tenemos información sobre la antigüedad, número de horas extras, etc., sobre los empleados de una empresa (cada línea representa un empleado), mediante operaciones columnas podemos calcular la nóminas de cada uno de ellos. También señalaremos cómo la imagen en una pantalla de ordenador (o un televisor) es una matriz numérica que indica dónde hay un punto (blanco y negro, 0/1) o de qué color es ese punto (colores = números). Así, las nuevas cámaras fotográficas digitales lo que hacen es convertir un imagen en una matriz de numérica mediante un código que asigna a cada color un número. El ordenador decodifica esta información convirtiendo la matriz en una imagen en la pantalla. La resolución (calidad de la imagen) está relacionada con la dimensión de la matriz utilizada (número de puntos). Por lo tanto, las imágenes de una película o un juego serán una sucesión de matrices numéricas. Por ejemplo, si jugamos a los barcos (hundir la flota) la información sobre la situación de la flota de cada jugador es una imagen que puede representarse mediante una matriz 8 x 8: æ1 ç ç0 ç1 ç ç1 ç1 ç ç0 ç1 ç è1

1 1 1 0 0 0 0ö ÷ 0 0 0 0 0 0 0÷ 0 1 0 0 0 0 1÷ ÷ 0 0 0 0 1 0 1÷ 0 0 0 0 0 0 0÷ ÷ 0 1 0 1 0 0 1÷ 0 1 0 0 1 0 1÷ ÷ 0 1 0 0 0 0 0ø

8.

1 1 1 0 0 0 0ö ÷ 0 0 0 0 0 0 0÷ 0 1 0 0 0 0 1÷ ÷ 0 0 0 0 1 0 1÷ 0 0 0 0 0 0 0÷ ÷ 0 1 0 1 0 0 1÷ 0 1 0 0 1 0 1÷ ÷ 0 1 0 0 0 0 0ø

8.

æ1 ç ç0 ç1 ç ç1 ç1 ç ç0 ç1 ç è1

7.

Una posición en ajedrez también es una matriz, si establecemos códigos para cada una de las piezas (rey blanco=1, rey negro=-1, etc.). En arquitectura, las matrices se utilizan, por ejemplo, para el cálculo de la resistencia de estructuras arquitectónicas e industriales. En resumen, podemos decir que las matrices son una herramienta fundamental para un científico actual. 7. 6.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

328

TEMA

19 Determinantes. Propiedades. Aplicación al cálculo del rango de una matriz

Emilio M. Pina Coronado

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

330

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

DEFINICIÓN DE DETERMINANTE

3.

PROPIEDADES DE LOS DETERMINANTES

4.

RANGO DE UNA MATRIZ 4.1. Definición de rango de una matriz 4.2. Transformaciones elementales de una matriz 4.3. Teorema: constancia del rango de una matriz en las transformaciones elementales

RANGO DE UNA MATRIZ 4.1. Definición de rango de una matriz 4.2. Transformaciones elementales de una matriz 4.3. Teorema: constancia del rango de una matriz en las transformaciones elementales

4.

PROPIEDADES DE LOS DETERMINANTES

3.

DEFINICIÓN DE DETERMINANTE

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

330

Determinantes. Propiedades

1. INTRODUCCIÓN Entendemos por determinante de orden n una cierta función de n2 cantidades dispuestas formando cuadrado; con la palabra determinante nos referimos tanto al símbolo como al desarrollo que indica.

det (A) = |A| = |aij| =

a11 a21

a12 a22





an1

an2

… … … …

a1n a2n

… ann

a las cantidades aij que aparecen en el determinante las denominaremos elementos, a la disposición en horizontal de los elementos se le denomina fila y a la disposición vertical se denomina columna, y así la notación aij denota que el elemento se encuentra en la fila i y en la columna j (en principio aij ¹ aji), mientras a la línea formada por los elementos que van desde el a11 hasta el ann se le denomina diagonal principal. El determinante |B| formado por los b2 elementos comunes de cualesquiera b filas y columnas de un determinante |A| de grado n, es el menor de orden b de |A|; y al determinante de orden n – b formado por los elementos que quedan cuando se quitan de |A| las b filas y columnas que contienen un menor |B| constituye lo que se denomina menor complementario de |B|. Si los números de las filas y columnas de |A| que contienen un menor de orden b son, respectivamente, i1, i2,..., ib y j1, j2, ..., jb entonces (–1)i1+i2+...+ib+j1+j2+...+jb veces el menor complementario de |B| recibe el nombre de complemento algebraico de |B|. Los menores de primer orden de |A| son, lógicamente, todos los elementos de |A|. Los menores complementarios se suelen denominar simplemente menores y a los complementos algebraicos se les denomina adjuntos, expresándose el menor del elemento aij por Bij y su adjunto por Aij, luego Aij = (1)i + j Mij.

2. DEFINICIÓN DE DETERMINANTE Dada una matriz cuadrada de orden n, cuyos elementos pertenecen al cuerpo K, es decir A Î Mn (K), se denomina determinante de A, |A|, al número definido por: n

n

j=1

i=1

|A|= åa ijA ij = åa ijA ij es decir, por la suma de los productos de los elementos de una fila o una columna por sus respectivos adjuntos. Esto nos indica una dependencia de un determinante de orden n de n determinantes de orden n – 1, cada uno de los cuales depende, a su vez, de n – 1 determinantes de orden n – 2 y continuando este razonamiento tenemos que en el desarrollo final sólo determinantes de orden 2 o de orden 3 que pueden fácilmente resolverse por los procedimientos que más adelante se exponen. Demostremos que se llega al mismo desarrollo independientemente de la fila o columna que se haya escogido, lo que viene planteado por el siguiente teorema: Si los elementos de una fila o una columna se multiplican por sus respectivos adjuntos y después se suman, el resultado es el mismo para todas las filas y para todas las columnas. Utilizaremos el método de inducción aplicándola a filas y por un razonamiento análogo lo podríamos hacer aplicándolo a columnas. a11 a12 y desarrollamos por El teorema es cierto cuando n = 2, ya que si partimos del determinante a 21 a 22 los elementos de la primera fila y sus adjuntos se obtiene: a11 a22 + a12 (–a21) y si desarrollamos por los elementos de la segunda fila y sus adjuntos obtendríamos: a21 (–a12) + a22 a11 como puede apreciarse ambas expresiones son idénticas. Supongamos que la afirmación del teorema es cierta hasta el determinante de orden n – 1 y comprobaremos que también es cierto para los determinantes de orden n; para ello desarrollaremos por dos filas arbitrarias i y j. |A| = |aij| TEMARIO DE MATEMÁTICAS. PRUEBA A

331

Volumen I. Matemáticas

332

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

den obtener una de la otra mediante una trasposición de términos, por lo que su paridad es distinta, luego su signo es distinto, y, en consecuencia, todo término del |A| aparece en el |A1| con el signo cambiado, y en conclusión |A| = – |A1|. Si estudiamos el intercambio de filas hemos de trabajar con los determinantes transpuestos |At| y |A1t| aplicando análogo tratamiento al que realizamos en las columnas. Como corolario de esta propiedad podemos afirmar que “Un determinante que tiene dos filas o dos columnas idénticas es igual a cero”. La demostración la haremos cambiando entre sí las filas o las co-

Así, un término típico del desarrollo de |A| según los elementos de la fila i es aik Aik = (–1)i+k aik Mik que contiene a todos los productos en que interviene aik en el desarrollo completo. Por otra parte, la fila (j – 1)-ésima de Mik contiene n – 1 elementos de la fila j de |A| y en consecuencia Mik puede desarrollarse en función de estos elementos, al haber supuesto que nuestra afirmación era válida para los determinantes de orden n – 1. Como término típico del desarrollo de M según los elementos de la fila j de |A| tenemos: ik aji · (adjunto de ajl en Mlk); l ¹ k que contiene productos en donde aparece ajl en el desarrollo de Mlk que podremos sustituir en la expresión anterior obteniendo: (–1)j+l ajl · [aik · (adjunto aik en Mjl)]; k ¹ l Dado que las expresiones anteriores son idénticas queda demostrado por inducción que todos los desarrollos de |A| por filas son idénticos, dado que aik ajl(k ¹ l) es el producto típico de un elemento de la fila i y un elemento de la fila j, y cada término del desarrollo de |A| en función de la fila i o de la fila j debe contener un producto semejante y sólo uno. será a i11a i2 2...a iqq ...a ipp...a inn y su signo viene dado por (–1) y su signo vendrá dado por (–1)

[ i1 i2 ...iq ...ip ...in ]

[ i1 i2 ...ip ...iq ...in ]

. Las dos potencias de (–1) se pue-

, mientras que el desarrollo de estre mismo término en |A|

como puede observarse, todo término del |A| es también un término del |A1| aunque están colocados en distintas columnas. Tomemos un término cualquiera del |A| a i11a i2 2...a ipp...a iqq ...a inn

3. PROPIEDADES DE LOS DETERMINANTES

a11 a12 a 21 a 22 |A1| = ... ... a n1 a n2

... a 1q ... a 2q

... a 1p ... a 1n ... a 2p ... a 2n

... ... ... a nq

... ... ... ... ... a np ... a nn

Propiedad 1. “El determinante de una matriz cuadrada es igual al determinante de su transpuesta” Todo término del |A| es un término del desarrollo del |At| ya que los factores de |A| siguen permaneciendo en el |At| en distintas filas y en distintas columnas y, recíprocamente, todo término del |At| es al mismo tiempo un elemento del |A|. Luego, ambos determinantes representan la suma algebraica de los mismos productos y con el mismo signo y por tanto son iguales. a 11 a12 a 21 a 22 Sea el |A| = ... ... a n1 a n2

... a 1p ... a 2p ... ... ... a np

... a 1q ... a 2q ... ... ... a nq

... a 1n ... a 2n , si intercambiamos las columnas p y q, obtendremos: ... ... ... a nn

Propiedad 2. “Si se intercambian dos filas o dos columnas de un determinante, el determinante cambia sólo de signo, manteniendo constante su valor absoluto”. a 11 a12 a 21 a 22 Sea el |A| = ... ... a n1 a n2

... a 1p ... a 2p ... ... ... a np

... a 1q ... a 2q ... ... ... a nq

... a 1n ... a 2n , si intercambiamos las columnas p y q, obtendremos: ... ... ... a nn

Propiedad 2. “Si se intercambian dos filas o dos columnas de un determinante, el determinante cambia sólo de signo, manteniendo constante su valor absoluto”.

Propiedad 1. “El determinante de una matriz cuadrada es igual al determinante de su transpuesta” Todo término del |A| es un término del desarrollo del |At| ya que los factores de |A| siguen permaneciendo en el |At| en distintas filas y en distintas columnas y, recíprocamente, todo término del |At| es al mismo tiempo un elemento del |A|. Luego, ambos determinantes representan la suma algebraica de los mismos productos y con el mismo signo y por tanto son iguales. |A1| =

a11 a12 ... a 1q a 21 a 22 ... a 2q

... ... ... ... a n1 a n2 ... a nq

... a 1p ... a 1n ... a 2p ... a 2n

... ... ... ... ... a np ... a nn

3. PROPIEDADES DE LOS DETERMINANTES

como puede observarse, todo término del |A| es también un término del |A1| aunque están colocados en distintas columnas. Tomemos un término cualquiera del |A| a i11a i2 2...a ipp...a iqq ...a inn

Así, un término típico del desarrollo de |A| según los elementos de la fila i es aik Aik = (–1)i+k aik Mik que contiene a todos los productos en que interviene aik en el desarrollo completo. Por otra parte, la fila (j – 1)-ésima de Mik contiene n – 1 elementos de la fila j de |A| y en consecuencia Mik puede desarrollarse en función de estos elementos, al haber supuesto que nuestra afirmación era válida para los determinantes de orden n – 1. Como término típico del desarrollo de Mik según los elementos de la fila j de |A| tenemos: aji · (adjunto de ajl en Mlk); l ¹ k que contiene productos en donde aparece ajl en el desarrollo de Mlk que podremos sustituir en la expresión anterior obteniendo: (–1)j+l ajl · [aik · (adjunto aik en Mjl)]; k ¹ l Dado que las expresiones anteriores son idénticas queda demostrado por inducción que todos los desarrollos de |A| por filas son idénticos, dado que aik ajl(k ¹ l) es el producto típico de un elemento de la fila i y un elemento de la fila j, y cada término del desarrollo de |A| en función de la fila i o de la fila j debe contener un producto semejante y sólo uno. [ i1 i2 ...ip ...iq ...in ]

y su signo vendrá dado por (–1)

, mientras que el desarrollo de estre mismo término en |A| [ i1 i2 ...iq ...ip ...in ]

será a i11a i2 2...a iqq ...a ipp...a inn y su signo viene dado por (–1)

. Las dos potencias de (–1) se pue-

den obtener una de la otra mediante una trasposición de términos, por lo que su paridad es distinta, luego su signo es distinto, y, en consecuencia, todo término del |A| aparece en el |A1| con el signo cambiado, y en conclusión |A| = – |A1|. Si estudiamos el intercambio de filas hemos de trabajar con los determinantes transpuestos |At| y |A1t| aplicando análogo tratamiento al que realizamos en las columnas. Como corolario de esta propiedad podemos afirmar que “Un determinante que tiene dos filas o dos columnas idénticas es igual a cero”. La demostración la haremos cambiando entre sí las filas o las co-

332

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Determinantes. Propiedades lumnas del determinante y, como hemos visto en esta propiedad, deben tener signo contrario quedaría que |A| = – |A|, lo que nos lleva a afirmar que el |A| = 0. Propiedad 3. “Si en un determinante multiplicamos todos los elementos de una fila o de una columna por un cierto valor constante l, el valor del determinante queda multiplicado por ese valor l”. Sea a 11 a12 ... a 1k ... a 1n |A|=

a 21 a 22 ... a 2k ... a 2n ... ... ... ... ... ... a n1 a n2 ... a nk ... a nn

si multiplicamos por l una columna tendremos a 11 a 12 ... la 1k a 21 a 22 ... la 2k |A1|= ... ... ... ... a n1 a n2 ... la nk |A1| =

ås( s )a

sÎ Pn

i1 1

... a1n ... a 2n ... ... ... a nn

a i2 2 ... ( la ikk ) ... a inn =

entonces: = l ås( s )a i11 a i2 2 ... a ikk ... a inn = l|A| sÎ Pn

si queremos estudiarlo por filas habremos de trabajar con transpuestos. De esta propiedad podemos extraer dos corolarios: COROLARIO 1: Un factor común de todos los elementos de una fila (o de una columna) de un determinate puede ser extraído como un factor multiplicador del determinante. COROLARIO 2: Un determinante con dos filas o dos columnas proporcionales es igual a cero. Si extraemos el factor de proporcionalidad, aplicando la propiedad 3, nos encontramos con un determinante con dos filas o dos columnas iguales y, considerando la propiedad 2, este determinante es nulo. Propiedad 4. “Si en un determinante una de sus filas o columnas puede expresarse como la suma de dos sumandos, el determinante será igual a la suma de los determinantes constituidos con cada uno de los sumandos que constituyen la fila o columna”. a11 a12 a 21 a 22 |A|= ... ... a n1 a n2 a 11 a 12 a 21 a 22 = ... ... a n1 a n2

... b1k ... b 2k ... ... ... b nk

TEMARIO DE MATEMÁTICAS. PRUEBA A

... b1k + c1k ... b 2k + c2k ... ... ... b nk + cnk

... a1n ... a 2n = ... ... ... a nn

... a1n a11 a12 ... a 2n a 21 a 22 + ... ... ... ... ... a nn a n1 a n2

... c1k ... c2k ... ... ... cnk

... a 1n ... a 2n ... ... ... a nn 333

Volumen I. Matemáticas

334

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Nota: Sobre las transformaciones elementales ya se han planteado desarrollos en páginas anteriores. La demostración es evidente:

Suma a los elementos de una fila de los componentes de otra fila multiplicados por un escalas (análogamente con columnas).

ås( s )a

sÎ Pn

i1 1

a i2 2 ... (b ikk + cikk ) ... a inn =

Multiplicación de los elementos de una fila o de una columna por un escalar no nulo.

ås( s )a

sÎ Pn

i1 1

a i2 2 ... b ikk ... a inn +

ås( s )a

i1 1

a i2 2 ... cikk ... a inn =

Intercambio de filas o intercambio de columnas.

=

sÎ Pn

– – – –

|A|=

Transposición de la matriz.

Si generalizamos diciendo que si todo elemento de cualquier fila o columna puede descomponerse como una suma de sumandos, el valor del determinante puede obtenerse como la suma de los determinantes constituidos considerando individualmente cada uno de los sumandos. De esta propiedad se puede extraer un corolario que nos indica que el valor de un determinante no varía si a todos los elementos de una fila o columna se le suman los elementos correspondientes de una fila o columna multiplicados por un mismo número. a11 a12 ... a1p ... a 1q ... a 1n a 21 a 22 ... a 2p ... a 2q ... a 2n |A| = ... ... ... ... ... ... ... ... a n1 a n2 ... a np ... a nq ... a nn

Se llaman transformaciones elementales de una matriz a aquellas que podemos realizar entre sus filas y sus columnas de modo que el rango de la matriz permanezca inalterable. Las transformaciones elementales son las siguientes:

4.2. Transformaciones elementales de una matriz

Dada una matriz A Î Mmxn y tomemos una submatriz de K filas y K columnas (K £ m; K £ n) que constituye un determinante de orden k, al que llamaremos menor de orden K de la matriz A, definiendo el rango de la matriz como el orden del mayor de sus menores no nulos.

4. RANGO DE UNA MATRIZ 4.1. Definición de rango de una matriz

si sumamos los elementos de la columna q multiplicados por un escalar l a los de la columna p obtenemos: a11 a12 ... a1p + la1q ... a1q ... a1n a 21 a 22 ... a 2p + la 2q ... a 2q ... a 2n |A1| = ... ... ... ... ... ... ... ... a n1 a n2 ... a np + la nq ... a nq ... a nn

ya que el valor del segundo determinante es cero puesto que contiene dos columnas proporcionales. ... ... ... a nn

+

... ... ... a nq

... ... ... ... a n1 a n2 ... la nq

... a1q ... a 2q

a11 a12 ... la1q a 21 a 22 ... la 2q

a11 a12 ... la1q a 21 a 22 ... la 2q + ... ... ... ... ... ... ... a nn a n1 a n2 ... la nq

a n1 a n2 ... a np + la nq

... a1q ... a 2q

... a1n ... a 2n

... ... ... a nq

... ... ... a nn

|A1| =

a11 a12 ... a1p + la1q a 21 a 22 ... a 2p + la 2q ... ... ... ...

... ... ... a nn ... a1n ... a 2n

... ... ... ... ... a np ... a nq

... a 1n ... a 2n

... a 1n ... a 2n

a11 a12 ... a 1p ... a 1q a 21 a 22 ... a 2p ... a 2q

... a 1p ... a 1q ... a 2p ... a 2q

=

... ... ... ... ... ... a n1 a n2 ... a np ... a nq

... ... ... a nq ... a1q ... a 2q

... a 2n ... ... ... a nn

= |A|

a11 a12 a 21 a 22 = ... ... a n1 a n2

= |A|

ya que el valor del segundo determinante es cero puesto que contiene dos columnas proporcionales. ... a1n

si sumamos los elementos de la columna q multiplicados por un escalar l a los de la columna p obtenemos:

4. RANGO DE UNA MATRIZ 4.1. Definición de rango de una matriz ... ... ... a nn

... ... ... ... ... ... a n1 a n2 ... a np ... a nq

... a 2n

a 21 a 22 ... a 2p ... a 2q

Dada una matriz A Î Mmxn y tomemos una submatriz de K filas y K columnas (K £ m; K £ n) que constituye un determinante de orden k, al que llamaremos menor de orden K de la matriz A, definiendo el rango de la matriz como el orden del mayor de sus menores no nulos. |A| =

Si generalizamos diciendo que si todo elemento de cualquier fila o columna puede descomponerse como una suma de sumandos, el valor del determinante puede obtenerse como la suma de los determinantes constituidos considerando individualmente cada uno de los sumandos. De esta propiedad se puede extraer un corolario que nos indica que el valor de un determinante no varía si a todos los elementos de una fila o columna se le suman los elementos correspondientes de una fila o columna multiplicados por un mismo número. a11 a12 ... a1p ... a 1q ... a 1n

4.2. Transformaciones elementales de una matriz

Se llaman transformaciones elementales de una matriz a aquellas que podemos realizar entre sus filas y sus columnas de modo que el rango de la matriz permanezca inalterable. Las transformaciones elementales son las siguientes: Transposición de la matriz.

sÎ Pn

ås( s )a

i1 1

sÎ Pn

Intercambio de filas o intercambio de columnas.

=

a i2 2 ... b ikk ... a inn +

ås( s )a

i1 1

a i2 2 ... cikk ... a inn =

Multiplicación de los elementos de una fila o de una columna por un escalar no nulo. sÎ Pn

ås( s )a

Suma a los elementos de una fila de los componentes de otra fila multiplicados por un escalas (análogamente con columnas). |A|=

i1 1

a i2 2 ... (b ikk + cikk ) ... a inn =

– – – –

La demostración es evidente:

Nota: Sobre las transformaciones elementales ya se han planteado desarrollos en páginas anteriores. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

334

Determinantes. Propiedades

4.3. Teorema: constancia del rango de una matriz en las transformaciones elementales El rango de una matriz no varía en las transformaciones elementales. Demostración:



Con respecto a la transposición de la matriz, todo menor de la matriz transpuesta es igual a uno de los menores de la matriz original y viceversa.



Con respecto al intercambio de filas o intercambio de columnas, si intercambiamos dos filas o dos columnas la nueva matriz difiere de la original como máximo en el signo de uno de los menores, pero el rango continúa siendo el mismo.



Con respecto a la multiplicación de los elementos de una fila o de una columna por un escalar no nulo, vemos que la nueva matriz mantiene fijos algunos de los menores, mientras que existen otros que quedan multiplicados por la constante, y dado que hemos fijado la condición de que la constante sea no nula el rango continuará siendo el mismo.



Con respecto a la suma a los elementos de una fila de los componentes de otra fila multiplicados por un escalas (análogamente con columnas), consideremos las matrices: æ a11 a 12 ç ç a 21 a 22 (A) =ç ... ... ç ça è m1 a m2 æ a 11 a 12 ç ç a 21 a 22 (A1) =ç ... ... ç ça è m1 a m2

... a 1q ... a 2q

... a 1p ... a 2p

... ... ... a mq

... ... ... a mp

... a 1n ö ÷ ... a 2n ÷ = ... ... ÷ ÷ ... a mn ÷ ø

... a1p + la 1q ... a 2p + la 2q ... ...

... a1q ... a 2q

... a mp + la mq

... a mq

...

...

... a1n ö ÷ ... a 2n ÷ ... ... ÷ ÷ ... a mn ÷ ø

Si el r(A) = r, vamos a demostrar que r (A1) £ r. Para ello hay que probar que cualquier menor de orden mayor que r de la matriz A1 es nulo; tomaremos un menor B de la matriz A1. Si B no contiene entre sus elementos ninguno de la columna p -ésima, este menor será igual al posible B obtenido de la matriz A y será igual a cero, ya que el orden del mayor menor de A no nulo es r. Si B contiene elementos de la columna p - ésima y de la columna q - ésima, teniendo en cuenta que si en un determinante una de sus filas o columnas puede expresarse como la suma de dos sumandos, el determinante será igual a la suma de los determinantes constituidos con cada uno de los sumandos que constituyen la fila o columna (propiedad 4 vista anteriormente), entonces también coincide con el menor correspondiente de la matriz A y por tanto será igual a cero, ya que el orden del mayor menor de A no nulo es r. Si B contiene elementos de la columna p - ésima pero no de la columna q - ésima, también en virtud de la propiedad 4 vista anteriormente podremos escribir |B| = |B1| + |B2|, en donde uno de ellos es igual al correspondiente de la matriz A y el otro difiere del de A en que está multiplicado por el escalar l, por lo que |B1| = |B2| = 0. En conclusión r (A) = r (A1).

TEMARIO DE MATEMÁTICAS. PRUEBA A

335

TEMA

20 El lenguaje algebraico. Símbolos y números. Importancia de su desarrollo y problemas que resuelve. Evolución histórica

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

338

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

EL LENGUAJE ALGEBRAICO. SÍMBOLOS Y NÚMEROS

3.

IMPORTANCIA DE SU DESARROLLO Y PROBLEMAS QUE RESUELVE

4.

EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA 4.1. Egipto y Mesopotamia 4.2. Periodo helénico 4.3. China e India 4.4. Los árabes 4.5. La Edad Media 4.6. El Renacimiento 4.7. Matemática moderna 4.8. Álgebra abstracta

EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA 4.1. Egipto y Mesopotamia 4.2. Periodo helénico 4.3. China e India 4.4. Los árabes 4.5. La Edad Media 4.6. El Renacimiento 4.7. Matemática moderna 4.8. Álgebra abstracta

4.

IMPORTANCIA DE SU DESARROLLO Y PROBLEMAS QUE RESUELVE

3.

EL LENGUAJE ALGEBRAICO. SÍMBOLOS Y NÚMEROS

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

338

El lenguaje algebraico. Símbolos y números

1. INTRODUCCIÓN El concepto de matemáticas puede ser enfocado desde distintos puntos de vista, y por esto se han dado de las matemáticas muchas definiciones diferentes. Según Descartes, es la ciencia generalísima del orden y la medida, pero esta definición expresa sólo una opinión personal, aunque sea la de un matemático tan importante como Descartes. Así, muchos matemáticos han dado su propia definición de las matemáticas, que más que decirnos lo que realmente son las matemáticas nos hace ver cómo dichos matemáticos las veían. Una definición menos subjetiva dice que es la ciencia que estudia, mediante un razonamiento deductivo, las propiedades de los entes abstractos, tales como los números, las figuras geométricas, etc., así como las relaciones que dichos entes guardan entre sí. Pero tampoco se puede decir que esta definición sea totalmente válida, pues en un principio la matemática era inductiva e intuitiva, no deductiva como se dice en esta definición, y aun ahora la intuición es muy importante en el estudio y desarrollo de las matemáticas. Para manifestar nuestras ideas o introducir aspectos de la realidad en nuestra mente, abstraerlos o transformarlos en ideas, tenemos que usar un artificio que las sustituya; por ello la humanidad ha creado una inmensa variedad de elementos de comunicación que llamamos símbolos. Empleando los símblolos se han creado estructuras de comunicación más complejas que han generado las diferentes gamas de lenguaje que utilizamos hoy en día. Entre esta gama de lenguajes se encuentra la matemática, que constituye uno de los elementos de comunicación, expresión y comprensión más poderoso que ha inventado el hombre. La enseñanza-aprendizaje del álgebra es un núcleo esencial en la comunicación y expresión de las matemáticas y debe ser introducida como una parte útil que facilita los procedimiento empíricos inductivos frente al tradicional planteamiento formal y deductivo. Algunos problemas y dificultades que encontramos en la enseñanza-aprendizaje de las matemáticas no son en realidad inherentes a ellas, sino que constituyen problemas de nuestro lenguaje, ya que el conocimiento del mismo no basta para resolver los problemas que plantean las matemáticas, al tener estas un lenguaje propio. Así las palabras distancia, recta, punto, etc. tienen en matemáticas un significado muy específico que difiere del que podemos atribuirles en nuestro lenguaje ordinario. De esta insuficiencia nace la necesidad de las matemáticas de generar sus propias palabras y reglas para lograr decir aquello que le compete y que en el lenguaje habitual no es posible decir, o cuando lo es, resulta muy complicado y complejo. Así, analizaremos la importancia del lenguaje algebraico, los símbolos utilizados y veremos las diferentes etapas que, a lo largo de la historia, se han ido sucediendo en el desarrollo del álgebra.

2. EL LENGUAJE ALGEBRAICO. SÍMBOLOS Y NÚMEROS En general, un lenguaje es todo sistema que emplea el hombre para comunicar a sus semejantes sus sentimientos o ideas por medio de un conjunto de símbolos. Un lenguaje formal, en matemáticas, utiliza un alfabeto constituido por un conjunto de elementos denominados signos o símbolos y que pueden ser correctores, cuantificadores, un símbolo de igualdad, una colección infinita numerable de letras llamadas variables y signos de puntuación. La palabra álgebra se debe al matemático árabe Al-Khowarizmi, que debió morir algo antes del año 850. A través del título de su obra más importante Al-jabr wa'l muqabalah nos transmitió el término al-jabr, del que se deriva la palabra álgebra, cuyo significado podía ser algo así como restauración o completación y parece referirse a la transposición de términos que están restados al otro lado de la ecuación, sumándolos. Por otra parte, la palabra muqabalah parece referirse a reducción o compensación, es decir, a la cancelación de términos iguales en los dos miembros de la ecuación. Actualmente se entiende por álgebra la parte de las matemáticas que trata de la cantidad en general, valiéndose para representarla de letras y símbolos. El lenguaje que se utiliza en esta parte de las matemáticas recibe el nombre de lenguaje algebraico. El uso de las letras como variables procede de la geometría griega, aunque en el álgebra su empleo es más tardío. El modelo algebraico nace como generalización del modelo numérico. Si para trabajar con un modelo aritmético tenemos que aprender a realizar cálculos con números, para hacer lo mismo con un modelo algebraico debemos de aprender a trabajar en cálculos con variables. Todo cálculo algebraico se construye a partir de las cinco propiedades características del sistema numérico: conmutativa de la suma, asociativa de la suma, conmutativa del producto, asociativa del producto y distributiva del producto respecto de la suma. El principio de permanencia de las formas equivalentes inTEMARIO DE MATEMÁTICAS. PRUEBA A

339

Volumen I. Matemáticas

340

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

En general la resolución de ecuaciones lineales y cuadráticas y de sistemas de ecuaciones utilizan estos procesos.

troducido por George Peacock afirma que todas las reglas anteriores que se verifican en los números naturales siguen verificándose para todos los demás números u objetos representados por letras. Parece así evidente que los problemas propios de la aritmética se trasladen al álgebra y que al ser ésta una generalización de aqueélla, le surjan problemas propios e inherentes. Analizaremos a continuación dos aspectos a tener en cuenta en el sentido anterior: el signo de la igualdad y la sustitución formal. El signo de igualdad. En aritmética el signo igual se entiende como una acción física; unas veces sirve para relacionar una operación con su resultado numérico (5 + 3 =) y otras permite relacionar dos procesos que dan el mismo resultado (4 x 2 = 2 + 2 + 2 + 2). En el álgebra la presencia del signo igual como señal de acción no tiende a desaparecer [a2 + 2ab + b2 = = (a + b)2]. De este modo las expresiones algebraicas son reducidas, pero esta reducción no se limita exclusivamente a expresiones algebraicas tautológicas, sino más bien a ecuaciones para resolverlas, donde los distintos pasos dados para la resolución son justificados mediante el signo igual. En otros casos relaciona la secuencia de pasos intermedios de un proceso que conducen a un mismo resultado, donde cada eslabón de la cadena de igualdades expresa una simplificación o cambio en la forma de su predecesor, es decir, una reducción [3 · (6 – 2) + 8] = (3 · 4 + 8) = 12 + 8 = 20. Aparece así un cambio importante en el sentido del signo igual en su paso de la aritmética al álgebra. Su sentido se conserva cuando trabajamos con tautologías algebraicas pero no con expresiones como 2x + 4 = x + 7, que es verdadera solamente para x = 3, ya que las ecuaciones no son afirmaciones universalmente verdaderas, pues el signo igual en una ecuación no conexiona expresiones equivalentes, aunque sí condiciona el valor de la incógnita. La sustitución formal. Se produce cuando variables de una expresión son sustituidas por expresiones más complejas, que son nuevas variables. La sustitución formal es un instrumento de cálculo algebraico importante a causa de su amplio campo de aplicaciones, que se manifiesta en distintos procesos matemáticos tales como i= 1

Ejemplo: Verificar que åi = n

n(n + 1) 2

Particularización: Cuando las variables son reemplazadas por números para verificar ciertas expresiones.



Complicación estructural: Cuando en una expresión las variables son reemplazadas por expresiones dadas. Ejemplo: Para resolver la ecuación x3 + p · x = q, si sustituimos x = u – v y considerando u · v = p/3, nos queda u3 – v3 = q.

– – –

Simplificación: Cuando en una expresión dada, expresiones parciales son reemplazadas por variables. Ejemplo: 2x4 – 5x2 + 4 se simplifica si sustituimos x2 por z y nos quedaría 2z2 – 5z + 4 Eliminación: Cuando variables implicadas en una sustitución son eliminadas. Por ejemplo, la resolución de sistemas de ecuaciones por el método de igualación. i=1

å(2i – 1) = n

2

n

1 + 3 + 5 = 32 1 + 3 + 5 + 7 = 42



Generalización: Cuando términos numéricos son reemplazados por variables o cuando modelos o esquemas obtenidos en situaciones concretas, en general numéricas, son extendidos. Ejemplos: 3 · (4 – 5) = 3 · 4 – 3 · 5 x · (y – z) = x · y – x · z 3 · (4 – 5) = 3 · 4 – 3 · 5 x · (y – z) = x · y – x · z



Generalización: Cuando términos numéricos son reemplazados por variables o cuando modelos o esquemas obtenidos en situaciones concretas, en general numéricas, son extendidos. Ejemplos: 1 + 3 + 5 = 32 1 + 3 + 5 + 7 = 42 n

troducido por George Peacock afirma que todas las reglas anteriores que se verifican en los números naturales siguen verificándose para todos los demás números u objetos representados por letras. Parece así evidente que los problemas propios de la aritmética se trasladen al álgebra y que al ser ésta una generalización de aqueélla, le surjan problemas propios e inherentes. Analizaremos a continuación dos aspectos a tener en cuenta en el sentido anterior: el signo de la igualdad y la sustitución formal. El signo de igualdad. En aritmética el signo igual se entiende como una acción física; unas veces sirve para relacionar una operación con su resultado numérico (5 + 3 =) y otras permite relacionar dos procesos que dan el mismo resultado (4 x 2 = 2 + 2 + 2 + 2). En el álgebra la presencia del signo igual como señal de acción no tiende a desaparecer [a2 + 2ab + b2 = = (a + b)2]. De este modo las expresiones algebraicas son reducidas, pero esta reducción no se limita exclusivamente a expresiones algebraicas tautológicas, sino más bien a ecuaciones para resolverlas, donde los distintos pasos dados para la resolución son justificados mediante el signo igual. En otros casos relaciona la secuencia de pasos intermedios de un proceso que conducen a un mismo resultado, donde cada eslabón de la cadena de igualdades expresa una simplificación o cambio en la forma de su predecesor, es decir, una reducción [3 · (6 – 2) + 8] = (3 · 4 + 8) = 12 + 8 = 20. Aparece así un cambio importante en el sentido del signo igual en su paso de la aritmética al álgebra. Su sentido se conserva cuando trabajamos con tautologías algebraicas pero no con expresiones como 2x + 4 = x + 7, que es verdadera solamente para x = 3, ya que las ecuaciones no son afirmaciones universalmente verdaderas, pues el signo igual en una ecuación no conexiona expresiones equivalentes, aunque sí condiciona el valor de la incógnita. La sustitución formal. Se produce cuando variables de una expresión son sustituidas por expresiones más complejas, que son nuevas variables. La sustitución formal es un instrumento de cálculo algebraico importante a causa de su amplio campo de aplicaciones, que se manifiesta en distintos procesos matemáticos tales como

å(2i – 1) = n

2

i=1





Simplificación: Cuando en una expresión dada, expresiones parciales son reemplazadas por variables. Ejemplo: 2x4 – 5x2 + 4 se simplifica si sustituimos x2 por z y nos quedaría 2z2 – 5z + 4 Eliminación: Cuando variables implicadas en una sustitución son eliminadas. Por ejemplo, la resolución de sistemas de ecuaciones por el método de igualación.



Complicación estructural: Cuando en una expresión las variables son reemplazadas por expresiones dadas. Ejemplo: Para resolver la ecuación x3 + p · x = q, si sustituimos x = u – v y considerando u · v = p/3, nos queda u3 – v3 = q.



Particularización: Cuando las variables son reemplazadas por números para verificar ciertas expresiones. n n(n + 1) Ejemplo: Verificar que åi = 2 i= 1 En general la resolución de ecuaciones lineales y cuadráticas y de sistemas de ecuaciones utilizan estos procesos. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

340

El lenguaje algebraico. Símbolos y números

3. IMPORTANCIA DE SU DESARROLLO Y PROBLEMAS QUE RESUELVE El álgebra que partió del cálculo práctico sobre los números y los problemas de aritmética elemental, se liberó de sus orígenes desarrollándose en dos direcciones: 1.

Sustitución de los números por letras.

2.

Paso del cálculo de las fórmulas a la resolución de ecuaciones. Además accedió a una autonomía plena gracias a un doble movimiento de ampliación:



Vinculándose a conjuntos bien definidos además de los números usuales y constituidos por elementos que no se encuentran en la aritmética, tales como objetos geométricos, funciones, probabilidad, combinatoria, etc.



Sustituyendo el empleo de operaciones corrientes por el de leyes o reglas de composición definidas por axiomas. Las combinaciones de estas leyes de composición constituyen estructuras algebraicas: grupos, anillos, ideales, cuerpos, espacios vectoriales, etc. Esta asociación de estructuras algebraicas con conjuntos puede ser disociada, quedando el estudio de las mismas como el único objeto fundamental del álgebra.

El álgebra se caracteriza en primer lugar por sus métodos, que implican el uso de letras y expresiones literales sobre las cuales se realizan operaciones con propiedades dadas. La importancia del método algebraico en la matemática moderna ha aumentado en las décadas recientes. En primer lugar las crecientes demandas de la tecnología obligan a reducir a resultados numéricos las soluciones de difíciles problemas del análisis matemático y esto sólo es factible después de la algebraización de los mismos. En segundo lugar, ciertos problemas del análisis no resultan claros y comprensibles hasta que han sido abordados por métodos algebraicos basados en una generalización profunda de la teoría de los sistemas de ecuaciones de primer grado. Finalmente las partes más avanzadas del álgebra han encontrado aplicación en la física contemporánea. En nuestros días, al mismo tiempo que las estructuras algebraicas propiamente dichas continúan siendo estudiadas intensivamente (por ejemplo la teoría de grupos), el término de álgebra se ha extendido a asociaciones con estructuras no algebraicas (de orden, combinatorias, topológicas), donde el álgebra domina fuertemente como la teoría de las funciones, espacios vectoriales topológicos, las álgebras topológicas, álgebras homológicas, teoría de modelos, las categorías, etc.

4. EVOLUCIÓN HISTÓRICA DEL ÁLGEBRA 4.1. Egipto y Mesopotamia Los datos más antiguos que se conservan de conocimientos matemáticos proceden de Egipto y Mesopotamia. Los papiros egipcios, que han logrado sobrevivir cerca de cuatro milenios, nos proporcionan información de los conocimientos matemáticos de los egipcios en aquella época. El más extenso y famoso de todos ellos es el papiro de Rhind (nombre del anticuario escocés que lo compró en 1858 en una ciudad comercial de Nilo), también llamado papiro de Ahmes, en honor del escriba que lo copió hacia el año 1650 antes de Cristo. La mayoría de problemas planteados en dicho papiro son de carácter aritmético, utilizando sobre todo el cálculo de fracciones y la manipulación de las proporciones equivalente a lo que hoy suele llamarse regla de tres. No obstante algunos de ellos pueden llamarse específicamente algebraicos, ya que no se refieren a objetos concretos y específicos, como el pan o la cerveza, ni tampoco piden resultados de operaciones con números conocidos, sino que piden el equivalente a resolver ecuaciones de la forma x + ax = b o x + ax + bx = c, donde a, b y c son números conocidos y x desconocido. A este número desconocido se le llama aha o montón. El problema 24 por ejemplo pide calcular el valor del montón si el montón y un séptimo del montón es igual a 19. La solución que da no es la misma que aplicaríamos nosotros en la actualidad sino que se basa en el método de regula falsi, que consiste en tomar una solución para la incógnita, que probablemente no será la correcta, se hacen las operaciones mencionadas y se compara el resultado con el que debía haberse obtenido. Posteriormente y utilizando proporciones se halla la respuesta correcta. En dicho papiro para el problema an1 terior toma como solución de aproximación o valor de la incógnita el 7; operando vemos que 7 + × 7 = 8, en 7 1 1 lugar de llegar a la solución correcta que sería 19. Ahmes halla la respuesta correcta 16 + + y comprueba 2 8 TEMARIO DE MATEMÁTICAS. PRUEBA A

341

Volumen I. Matemáticas

342

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Se supone que el escriba se refería a un problema muy conocido, ya que en cada una de las siete casas hay siete gatos, cada uno de los cuales se come siete ratones, cada uno de los cuales se habría comido siete espigas de grano, cada una de las cuales habría producido a su vez siete medidas de grano. El cuarto milenio antes de nuestra era fue un periodo de gran desarrollo cultural, que trajo consigo el uso de la escritura, de la rueda y de los metales. Al igual que en Egipto durante la primera dinastía, que comenzó a finales de este milenio, también en el valle de Mesopotamia había ya por esa época un alto nivel de civilización. El modelo de escritura cuneiforme que habían desarrollado los sumerios durante el cuarto milenio, puede haber sido la primera forma de comunicación escrita, puesto que es probablemente anterior a la escritura geroglífica egipcia, que pudo haberse derivado de ella. En particular , el uso generalizado de la escritura cuneiforme impuso un fuerte lazo unificador: leyes, listas de impuestos, cuentos, lecciones escolares, cartas personales, etc. Estos y otros muchos documentos se imprimían con una varilla en tablillas de arcilla blanda, y estas tablillas se endurecían después en hornos o dejándolas simplemente secar al sol. Estos documentos fueron así mucho menos vulnerables que los papiros egipcios, por lo que hoy disponemos de mayor información sobre la matemática mesopotámica que sobre la egipcia. El sistema decimal, tan corriente en la mayoría de las civilizaciones tanto antiguas como modernas, quedó sumergido en Mesopotamia bajo un sistema de notación en el que la base fundamental era 60. Se ha escrito mucho sobre los posibles motivos para este cambio, argumentando desde motivos de tipo astronómico, hasta motivos de metrología, ya que 60 puede dividirse de manera exacta en dos, tres, cuatro, cinco, seis, doce, quince o veinte partes iguales, lo que permite diez posibles subdivisiones exactas. Además utilizaron un sistema de notación posicional para poder representar números grandes, dándoles a sus signos diferentes valores que dependían de la posición que ocupaban, con lo que la raíz de dos puede expresarse como 1;24,51,10, donde el punto y coma representa la separación entre la parte entera y la parte decimal y las comas se utilizan para separar las sucesivas posiciones sexagesimales. El mayor problema con el que se encontraron era el no haber sido capaces, al principio, de inventar una manera clara de representar una posición vacía en un numeral, es decir, no dispusieron de un símbolo para el cero en su sentido no cardinal, sino posicional. A veces para solucionar el problema dejaban un espacio un poco mayor en el lugar en el que debería ir el cero, pero a veces se generaban confusiones entre representaciones de dos números distintos. Sin embargo, hacia la época de la conquista de Alejandro Magno, se inventó un símbolo especial, que consistía en un par de cuñas pequeñas situadas oblicuamente, para indicar la posición en la que faltaba una cifra o un lugar vacío. No obstante este signo se utilizaba para representar posiciones vacías intermedias entre las cifras significativas de un numeral, pero no se ha conservado ninguna tablilla en la que aparezca el símbolo cero en posición terminal de un número, por lo que podemos afirmar que los babilonios no llegaron a tener nunca un sistema posicional completo. El álgebra alcanzó en Mesopotamia un nivel mucho más alto que en Egipto. Se conocen muchos problemas que aparecen en textos del periodo babilónico antiguo que demuestran que la resolución de una ecuación completa de segundo grado no ofrecía ninguna dificultad para los babilonios, dada la flexibilidad de las operaciones algebraicas que habían desarrollado. Así, podían trasponer términos en una ecuación sumando igualdades, y eliminar fracciones u otros factores multiplicando ambos miembros por cantidades iguales. No utilizaban letras para representar cantidades incógnitas, porque no estaba inventado aún el alfabeto, pero las palabras mismas, tales como longitud, área, volumen, servían para este fin. Además realizaron tablas de potencias sucesivas, que les servían para resolver ecuaciones cúbicas. Una tabla que usaban mucho era una tabulación de valores de n3 + n2, para valores naturales de n y que jugó un papel esencial en el álgebra babilónica.

1 1 su resultado mostrando que si a 16 + + le suma un séptimo de ella misma, se obtiene efectivamente 19. 2 8 Aunque Ahmes usaba generalmente el método de falsa posición en los problemas análogos al anterior, en el 2 1 1 número 30, en el que la ecuación x + x + x + x = 37, lo resuelve factorizando el primer miembro y divi3 2 7 1 1 1 2 1 1 diendo después 37 por 1 + + + , lo que da como resultado 16 + . + + 56 679 776 3 2 7 Muchos de los cálculos de aha en el papiro de Rhind eran evidentemente ejercicios para que practicasen los jovenes estudiantes, y así, aunque una gran parte de ellos era de tipo práctico, en algunos casos parece claro que el escriba tenía en la mente rompecabezas o pasatiempos matemáticos al escribirlos. Así en el problema 79 se dice solamente: Siete casas, cuarenta y nueve gatos, trescientos cuarenta y tres ratones, dos mil cuatrocientas una espigas de trigo, dieciséis mil ochocientas siete medidas de grano.

Se supone que el escriba se refería a un problema muy conocido, ya que en cada una de las siete casas hay siete gatos, cada uno de los cuales se come siete ratones, cada uno de los cuales se habría comido siete espigas de grano, cada una de las cuales habría producido a su vez siete medidas de grano. El cuarto milenio antes de nuestra era fue un periodo de gran desarrollo cultural, que trajo consigo el uso de la escritura, de la rueda y de los metales. Al igual que en Egipto durante la primera dinastía, que comenzó a finales de este milenio, también en el valle de Mesopotamia había ya por esa época un alto nivel de civilización. El modelo de escritura cuneiforme que habían desarrollado los sumerios durante el cuarto milenio, puede haber sido la primera forma de comunicación escrita, puesto que es probablemente anterior a la escritura geroglífica egipcia, que pudo haberse derivado de ella. En particular , el uso generalizado de la escritura cuneiforme impuso un fuerte lazo unificador: leyes, listas de impuestos, cuentos, lecciones escolares, cartas personales, etc. Estos y otros muchos documentos se imprimían con una varilla en tablillas de arcilla blanda, y estas tablillas se endurecían después en hornos o dejándolas simplemente secar al sol. Estos documentos fueron así mucho menos vulnerables que los papiros egipcios, por lo que hoy disponemos de mayor información sobre la matemática mesopotámica que sobre la egipcia. El sistema decimal, tan corriente en la mayoría de las civilizaciones tanto antiguas como modernas, quedó sumergido en Mesopotamia bajo un sistema de notación en el que la base fundamental era 60. Se ha escrito mucho sobre los posibles motivos para este cambio, argumentando desde motivos de tipo astronómico, hasta motivos de metrología, ya que 60 puede dividirse de manera exacta en dos, tres, cuatro, cinco, seis, doce, quince o veinte partes iguales, lo que permite diez posibles subdivisiones exactas. Además utilizaron un sistema de notación posicional para poder representar números grandes, dándoles a sus signos diferentes valores que dependían de la posición que ocupaban, con lo que la raíz de dos puede expresarse como 1;24,51,10, donde el punto y coma representa la separación entre la parte entera y la parte decimal y las comas se utilizan para separar las sucesivas posiciones sexagesimales. El mayor problema con el que se encontraron era el no haber sido capaces, al principio, de inventar una manera clara de representar una posición vacía en un numeral, es decir, no dispusieron de un símbolo para el cero en su sentido no cardinal, sino posicional. A veces para solucionar el problema dejaban un espacio un poco mayor en el lugar en el que debería ir el cero, pero a veces se generaban confusiones entre representaciones de dos números distintos. Sin embargo, hacia la época de la conquista de Alejandro Magno, se inventó un símbolo especial, que consistía en un par de cuñas pequeñas situadas oblicuamente, para indicar la posición en la que faltaba una cifra o un lugar vacío. No obstante este signo se utilizaba para representar posiciones vacías intermedias entre las cifras significativas de un numeral, pero no se ha conservado ninguna tablilla en la que aparezca el símbolo cero en posición terminal de un número, por lo que podemos afirmar que los babilonios no llegaron a tener nunca un sistema posicional completo. El álgebra alcanzó en Mesopotamia un nivel mucho más alto que en Egipto. Se conocen muchos problemas que aparecen en textos del periodo babilónico antiguo que demuestran que la resolución de una ecuación completa de segundo grado no ofrecía ninguna dificultad para los babilonios, dada la flexibilidad de las operaciones algebraicas que habían desarrollado. Así, podían trasponer términos en una ecuación sumando igualdades, y eliminar fracciones u otros factores multiplicando ambos miembros por cantidades iguales. No utilizaban letras para representar cantidades incógnitas, porque no estaba inventado aún el alfabeto, pero las palabras mismas, tales como longitud, área, volumen, servían para este fin. Además realizaron tablas de potencias sucesivas, que les servían para resolver ecuaciones cúbicas. Una tabla que usaban mucho era una tabulación de valores de n3 + n2, para valores naturales de n y que jugó un papel esencial en el álgebra babilónica.

Siete casas, cuarenta y nueve gatos, trescientos cuarenta y tres ratones, dos mil cuatrocientas una espigas de trigo, dieciséis mil ochocientas siete medidas de grano.

1 1 + le suma un séptimo de ella misma, se obtiene efectivamente 19. 2 8 Aunque Ahmes usaba generalmente el método de falsa posición en los problemas análogos al anterior, en el 2 1 1 número 30, en el que la ecuación x + x + x + x = 37, lo resuelve factorizando el primer miembro y divi3 2 7 1 1 1 2 1 1 diendo después 37 por 1 + + + , lo que da como resultado 16 + . + + 56 679 776 3 2 7 Muchos de los cálculos de aha en el papiro de Rhind eran evidentemente ejercicios para que practicasen los jovenes estudiantes, y así, aunque una gran parte de ellos era de tipo práctico, en algunos casos parece claro que el escriba tenía en la mente rompecabezas o pasatiempos matemáticos al escribirlos. Así en el problema 79 se dice solamente: su resultado mostrando que si a 16 +

342

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

El lenguaje algebraico. Símbolos y números El álgebra egipcia se había centrado casi exclusivamente en las ecuaciones lineales, pero los babilonios las consideraban demasiado elementales como para prestarles mucha atención. En un cierto problema x 1 x se pide el peso x de una piedra si (x + ) + (x + ) es igual a una mina; la respuesta se da diciendo simple7 11 7 mente que x es 48;7,30 gin, siendo 60 gin una mina. En otro problema nos encontramos con un sistema de dos ecuaciones lineales simultáneas en dos incógnitas, llamadas respectivamente el primer anillo de plata y el segundo anillo de plata. Si llamamos x e y a estas incógnitas las ecuaciones en notación actual son x y + =1 7 11 6x 10y = 7 11 y la solución viene dada por medio de la regla x 11 1 = + 7 7 + 11 72 y 7 1 = – 11 7 + 11 72 En otro sistema de ecuaciones se incluye en el texto parte del método de resolución; las ecuaciones son en este caso 1 anchura + longitud = 7 manos y longitud + anchura = 10 manos. 4 La solución se halla en primer lugar reemplazando cada mano por 5 dedos, y observando a continuación que una anchura de 20 dedos y una longitud de 30 dedos satisfarían las dos ecuaciones. A partir de esta comprobación se calcula la solución. No obstante, por un método alternativo equivalente al de eliminación por medio de una combinación lineal, expresando todas las dimensiones en términos de manos y llamando x e y respectivamente a la longitud y a la anchura, las ecuaciones se convierten en y + 4x = 28 y x + y = 10; si restamos la segunda de la primera nos queda 3x = 18, es decir, x = 6 manos ó 30 dedos e y = 20 dedos. La resolución de ecuaciones cuadráticas completas superó en mucho la capacidad algebraica de los egipcios, ya que tales ecuaciones habían sido manejadas con gran soltura en algunos de los textos más antiguos conocidos. Por ejemplo, hay un problema en el que se pide hallar el lado de un cuadrado si su área menos el lado es igual a 14,30. La solución de este problema es equivalente a la de la ecuación x2 – x = 870 y viene explicada por el escriba de la forma siguiente: Toma la mitad de 1, que es 0;30, y multiplica 0;30 por 0;30, que es 0;15. Suma este número a 14,30, lo que da 14,30;15. Este es el cuadrado de 29;30. Ahora suma 0;30 a 29;30, cuyo resultado es 30, que es el lado del cuadrado. æpö p La solución babilónica es equivalente a la que se obtiene aplicando la fórmula x = ç ç ÷ ÷ +q + , 2 èq ø que nos da una de las raíces de la ecuación x2 + px = q y que es la fórmula que utilizamos hoy en día. En otro texto reducen la ecuación 11x2 + 7x = 6;15 a la forma canónica x2 + px = q, multiplicando primero por 11 los dos miembros para convertirla en la (11x)2 + 7(11x) = 1,8;45, a la que, aplicándole la formula anterior, se obtiene el valor de la incógnita que en este caso es 11x. La solución de las ecuaciones cuadráticas completas de la forma x2 + px + q = 0, donde p y q son números positivos hubo de esperar hasta la época moderna ya que dicha ecuación no tiene raíces positivas. Así pues, en la época antigua y medieval, las ecuaciones cuadráticas se clasificaron en tres tipos, que, reducidos a sus formas canónicas, son: 2

x2 + px = q x2 = px + q x2 + q = px y todos estos tipos se encuentran en los antiguos textos babilónicos de hace 4000 años. TEMARIO DE MATEMÁTICAS. PRUEBA A

343

344

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

La reducción babilónica de una ecuación cuadrática de la forma ax2 + bx = c, a su forma normal y2 + by = ac, mediante el cambio y = ax, muestra el alto grado de flexibilidad que alcanzó el álgebra mesopotámica, que unido al sistema de computación posicional explica la superioridad del álgebra babilónica respecto a la egipcia. De hecho en Egipto no existe ningún testimonio de resolución de ecuaciones cúbicas mientras que en Mesopotamia se conocen muchos ejemplos. Los babilonios resolvían las ecuaciones cúbicas puras tales como x3 = 0;7,30, consultando directamente en las tablas en las que aparecía la solución y para aquellos valores que no estaban en las tablas se hacía una interpolación lineal. Las cúbicas mixtas de la forma x3 + x2 = a se resolvían de manera análoga consultando las tablas disponibles en las que aparecían los valores de la suma n3 + n2 para valores enteros de n desde 1 hasta 30. Para los casos más generales usaban el método de sustitución utilizado en las ecuaciones cuadráticas. Así, por ejemplo para resolver la ecuación 144x3 + 12x2 = 21 multiplicaban ambos miembros por 12 y después haciendo la sustitución y = 12x, la ecuación se transforma en y3+ ‘y2 = 4,12, que utilizando las tablas nos da el valor y = 6, de donde x = 0;30. Las cúbicas de la forma ax3 + bx2 = c se pueden reducir a la forma canónica multiplicando ambos 3 2 æ ax ö æ ax ö ca 2 ax a2 miembros por 3 , obteniendoseç ÷ +ç ÷ = 3 , que ya es una cúbica canónica con la incógnita . No èbø èbø b b b existe ninguna documentación que nos permita asegurar que los babilónicos llegaron a reducir la cúbica general ax3 + bx2 + cx = d a su forma canónica, aunque es bastante probable que lo consiguieran. El álgebra babilónica alcanzó un nivel de abstracción tan grande que las ecuaciones ax4 + bx2 = c y ax8 + bx4 = c fueron consideradas correctamente como simples ecuaciones cuadráticas disfrazadas, es decir, como ecuaciones cuadráticas en x2 y en x4, respectivamente. A pesar de que casi toda la matemática prehelénica fue en general completamente utilitaria, cabe preguntarse ¿qué situación de la vida real pudo conducir en la antigua Babilonia a problemas en los que aparecieran la suma de un número y su inverso o la diferencia entre un área y una longitud? Algunos documentos, como la tablilla 322, sugieren que pudo haber muy bien existido una cierta tolerancia, sino un estímulo hacia la matemática cultivada por sí misma. La tablilla data del periodo babilónico antiguo (1900 a 1600 a.C.) y en un estudio exhaustivo de la misma, que contiene quince ternas pitagóricas. Hay un cierto número de deficiencias en la matemática prehelénica. Todos los documentos que han llegado hasta nosotros contienen únicamente problemas concretos sin ningún tipo de formulación general y cabría preguntarse si estas civilizaciones primitivas se dieron cuenta de los principios unificadores de la matemática. Un estudio más profundo de los cientos de problemas que han aparecido en las tablillas cuneiformes nos hace ver que el hecho de que no se haya conservado ninguna formulación de las reglas que llevaban a la resolución de dichos problemas no significa necesariamente que no existiera en el pensamiento antiguo conciencia de la generalidad de dichas reglas. Si no hubiera una regla general subyacente, sería muy difícil de explicar la analogía entre los distintos problemas del mismo tipo, ya que tan extensas colecciones de problemas no pudieron ser el resultado del azar.

La historia de los orígenes de la matemática griega se tiene que centrar necesariamente en las llamadas escuelas jónica y pitagórica, y sobre todo en Tales y Pitágoras, representantes principales de cada una de ellas, aunque la reconstrucción de su pensamiento se basa solamente en informaciones fragmentarias y en tradiciones elaboradas durante los siglos posteriores. No nos ha quedado ningún documento matemático ni científico anterior a la época de Platón en el siglo IV a.C. Sin embargo, durante la segunda mitad del siglo V la actividad matemática floreció a lo largo y ancho del Mediterráneo. En el mundo griego la matemática estaba más estrechamente relacionada con la filosofía que con los problemas prácticos de la vida ordinaria, contrastando esto grandemente con la matemática prehelénica. Durante mucho tiempo se creyó que el elemento deductivo había sido introducido en la matemática por Tales aunque recientemente se ha atacado esta tesis argumentando que la matemática en los siglos VI y V a.C. era todavía primitiva para dar una contribución de este tipo tan fundamental. Se han formulado diferentes hipótesis para explicar la transformación que nos lleva desde las reglas matemáticas empíricas de la matemática prehelénica a la estructura deductiva formal que aparece por primera vez en Grecia. Algunos han sugerido que Tales en sus viajes percibió las discrepancias que aparecían en las diferentes reglas de la matemática prehelénica, como, por ejemplo, las diferentes formas de calcular el área del círculo en Egipto y Mesopotamia, y en consecuencia vio la necesidad de utilizar un método estrictamente racional. Otros prefieren situar los orígenes de la forma deductiva de la matemática más tarde, a comienzos del siglo IV a.C., a conti-

4.2. Periodo helénico

La reducción babilónica de una ecuación cuadrática de la forma ax2 + bx = c, a su forma normal y2 + by = ac, mediante el cambio y = ax, muestra el alto grado de flexibilidad que alcanzó el álgebra mesopotámica, que unido al sistema de computación posicional explica la superioridad del álgebra babilónica respecto a la egipcia. De hecho en Egipto no existe ningún testimonio de resolución de ecuaciones cúbicas mientras que en Mesopotamia se conocen muchos ejemplos. Los babilonios resolvían las ecuaciones cúbicas puras tales como x3 = 0;7,30, consultando directamente en las tablas en las que aparecía la solución y para aquellos valores que no estaban en las tablas se hacía una interpolación lineal. Las cúbicas mixtas de la forma x3 + x2 = a se resolvían de manera análoga consultando las tablas disponibles en las que aparecían los valores de la suma n3 + n2 para valores enteros de n desde 1 hasta 30. Para los casos más generales usaban el método de sustitución utilizado en las ecuaciones cuadráticas. Así, por ejemplo para resolver la ecuación 144x3 + 12x2 = 21 multiplicaban ambos miembros por 12 y después haciendo la sustitución y = 12x, la ecuación se transforma en y3+ ‘y2 = 4,12, que utilizando las tablas nos da el valor y = 6, de donde x = 0;30. Las cúbicas de la forma ax3 + bx2 = c se pueden reducir a la forma canónica multiplicando ambos 3 2 æ ax ö æ ax ö ca 2 ax a2 miembros por 3 , obteniendoseç ÷ +ç ÷ = 3 , que ya es una cúbica canónica con la incógnita . No èbø èbø b b b existe ninguna documentación que nos permita asegurar que los babilónicos llegaron a reducir la cúbica general ax3 + bx2 + cx = d a su forma canónica, aunque es bastante probable que lo consiguieran. El álgebra babilónica alcanzó un nivel de abstracción tan grande que las ecuaciones ax4 + bx2 = c y ax8 + bx4 = c fueron consideradas correctamente como simples ecuaciones cuadráticas disfrazadas, es decir, como ecuaciones cuadráticas en x2 y en x4, respectivamente. A pesar de que casi toda la matemática prehelénica fue en general completamente utilitaria, cabe preguntarse ¿qué situación de la vida real pudo conducir en la antigua Babilonia a problemas en los que aparecieran la suma de un número y su inverso o la diferencia entre un área y una longitud? Algunos documentos, como la tablilla 322, sugieren que pudo haber muy bien existido una cierta tolerancia, sino un estímulo hacia la matemática cultivada por sí misma. La tablilla data del periodo babilónico antiguo (1900 a 1600 a.C.) y en un estudio exhaustivo de la misma, que contiene quince ternas pitagóricas. Hay un cierto número de deficiencias en la matemática prehelénica. Todos los documentos que han llegado hasta nosotros contienen únicamente problemas concretos sin ningún tipo de formulación general y cabría preguntarse si estas civilizaciones primitivas se dieron cuenta de los principios unificadores de la matemática. Un estudio más profundo de los cientos de problemas que han aparecido en las tablillas cuneiformes nos hace ver que el hecho de que no se haya conservado ninguna formulación de las reglas que llevaban a la resolución de dichos problemas no significa necesariamente que no existiera en el pensamiento antiguo conciencia de la generalidad de dichas reglas. Si no hubiera una regla general subyacente, sería muy difícil de explicar la analogía entre los distintos problemas del mismo tipo, ya que tan extensas colecciones de problemas no pudieron ser el resultado del azar.

4.2. Periodo helénico

La historia de los orígenes de la matemática griega se tiene que centrar necesariamente en las llamadas escuelas jónica y pitagórica, y sobre todo en Tales y Pitágoras, representantes principales de cada una de ellas, aunque la reconstrucción de su pensamiento se basa solamente en informaciones fragmentarias y en tradiciones elaboradas durante los siglos posteriores. No nos ha quedado ningún documento matemático ni científico anterior a la época de Platón en el siglo IV a.C. Sin embargo, durante la segunda mitad del siglo V la actividad matemática floreció a lo largo y ancho del Mediterráneo. En el mundo griego la matemática estaba más estrechamente relacionada con la filosofía que con los problemas prácticos de la vida ordinaria, contrastando esto grandemente con la matemática prehelénica. Durante mucho tiempo se creyó que el elemento deductivo había sido introducido en la matemática por Tales aunque recientemente se ha atacado esta tesis argumentando que la matemática en los siglos VI y V a.C. era todavía primitiva para dar una contribución de este tipo tan fundamental. Se han formulado diferentes hipótesis para explicar la transformación que nos lleva desde las reglas matemáticas empíricas de la matemática prehelénica a la estructura deductiva formal que aparece por primera vez en Grecia. Algunos han sugerido que Tales en sus viajes percibió las discrepancias que aparecían en las diferentes reglas de la matemática prehelénica, como, por ejemplo, las diferentes formas de calcular el área del círculo en Egipto y Mesopotamia, y en consecuencia vio la necesidad de utilizar un método estrictamente racional. Otros prefieren situar los orígenes de la forma deductiva de la matemática más tarde, a comienzos del siglo IV a.C., a contiCUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

344

El lenguaje algebraico. Símbolos y números nuación del descubrimiento de los inconmensurables. Existen también opiniones que encuentran el origen de esta transformación fuera de la matemática, considerando por ejemplo que el desarrollo sociopolítico de las ciudades-estado griegas dio lugar al nacimiento de la dialéctica como método intelectual y, en consecuencia, a la necesidad de una base racional tanto para la matemática como para otro tipo de estudios. Sea como fuere, no cabe la menor duda de que en la época de Platón la matemática griega había sufrido grandes cambios. La dicotomía abierta entre número y magnitud continua exigía un nuevo planteamiento del álgebra babilónica. Los viejos problemas en los que dada la suma y el producto de los lados de un rectángulo se pedía hallar dichos lados, tendrían que ser tratados de una manera distinta a los algoritmos numéricos de los babilonios. Había que construir un álgebra geométrica que generalizase y ocupase el lugar de la antigua álgebra aritmética, habiendo de ahora en adelante una homogeneidad de los términos en las ecuaciones, no pudiendo sumar, por ejemplo, áreas con volúmenes. Además las formas canónicas mesopotámicas x·y=A x±y=b deberían ser interpretadas geométricamente. Así la conclusión a la que se llega es que eliminando y hay que construir sobre un segmento b un rectángulo cuya altura desconocida x debe ser tal que el área del rectángulo en cuestión exceda del área dada A en el cuadrado de lado x o (en el caso del signo menos de la segunda ecuación) se quede corto con respecto al área A en un cuadrado de lado x (ver figura adjunta). b

b

x

A

x

A

x

x

Figura 1.

Así, los griegos consiguieron resolver las ecuaciones cuadráticas por medio de procedimientos conocidos como aplicación de áreas, parte del álgebra geométrica que aparece tratada de una forma muy completa en los Elementos de Euclides. El álgebra geométrica griega resulta artificial y difícil para un lector moderno, pero para aquellos que la utilizaron y que llegaron a manejar sus operaciones con soltura debió de parecer una herramienta muy cómoda. La propiedad distributiva a · (b + c + d) = a · b + a · c + a · d, tuvo que resultar mas obvia para un escolar griego que para un estudiante actual que aborda el álgebra por primera vez, ya que el primero podía dibujar fácilmente las áreas de los rectángulos que aparecen en la propiedad, la cual afirma que el área del rectángulo determinado por a y la suma de b, c y d, es igual a la suma de los rectángulos determinados por a y por cada uno de los segmentos b, c y d, tal como se aprecia en la figura. b c d

a

ab

ac

ad

Figura 2. 2

De la misma manera son demostradas otras identidades como (a + b) = a + 2ab + b y a2 – b2 = (a + b) · · (a – b). Tampoco la representación o construcción de las raíces cuadradas ofrece dificultad en el álgebra geométrica, ya que si queremos construir un segmento x tal que x2 = a · b, simplemente hay que trazar un semicircunferencia de diámetro AC, de modo que AC sea la suma de los segmentos AB = a y BC = b, y posteriormente se levanta en B la perpendicular al segmento AC, que determina en la semicircunferencia un punto P. El segmento BP es el buscado. El libro II de los Elementos de Euclides es uno de los más cortos con sólo 14 proposiciones, ninguna de las cuales juega un papel importante en la matemática moderna; sin embargo en aquella época este libro TEMARIO DE MATEMÁTICAS. PRUEBA A

2

2

345

Volumen I. Matemáticas

346

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Las civilizaciones de China y de la India son muchos más antiguas que las de Grecia y Roma, aunque no más que las que surgieron en los valles de Mesopotamia y del Nilo, pero sus registros cronológicos son menos fiables que los que tenemos para Egipto y Babilonia. Una de sus obras más antiguas, quizás la que mayor influencia ejerció entre todos los libros matemáticos chinos es el Chui-chang suan-shu, o los Nueve Capítulos sobre el Arte Matemático. Este libro incluye 246 problemas sobre agrimensura, agricultura, compañía, ingeniería, impuestos, cálculo, resolución de ecuaciones y propiedades de los triángulos rectán-

tuvo una gran importancia. Esta diferencia entre los puntos de vista antiguo y moderno es fácil de explicar: hoy nosotros tenemos un álgebra simbólica y una trigonometría que han reemplazado a sus equivalentes geométricos griegos. Por ejemplo, la proposición 1 del libro II nos dice: Si tenemos dos líneas rectas y cortamos una de ellas en un número cualquiera de segmentos, entonces el rectángulo contenido por las dos líneas rectas es igual a los rectángulos contenidos por la línea recta que no fue cortada y cada uno de los segmentos anteriores.

4.3. China e India

Este teorema no es otra cosa que la formulación geométrica de una propiedad aritmética que hoy se conoce con el nombre de propiedad distributiva de la multiplicación respecto a la suma y que hemos visto con anterioridad. En los libros V y VI de los Elementos, encontramos demostraciones de las propiedades conmutativa y asociativa de la multiplicación. En nuestra álgebra moderna representamos las magnitudes por letras, sobreentendiendose que éstas son números (conocidos o desconocidos), con las cuales operamos siguiendo las reglas algorítmicas del álgebra, en los tiempos de Euclides las magnitudes se representaban como segmentos de línea recta, obedeciendo a los axiomas y teoremas de la geometría. A veces se dice que los griegos no tenían álgebra, pero esta afirmación es falsa, ya que el libro II de los Elementos nos expone un álgebra geométrica que les servía más o menos para los mismos fines que nuestra álgebra simbólica. Una razón de que los griegos hicieran un álgebra geométrica en vez de un álgebra aritmética era la de que la primera parecía más general que la segunda, en vista de la falta del concepto de número real. Además, un estudio minucioso de la matemática griega parece suministrar una cierta evidencia de que bajo el barniz geométrico había un mayor interés por el cálculo y las aproximaciones numéricas de lo que dan a entender los tratados clásicos existentes. La matemática griega no se mantuvo uniformemente a un nivel alto, sino que después del siglo III a.C. en el que brilló bastante tuvo una época de decadencia, que no se recuperó de manera efectiva en torno al siglo que va del 250 al 350, conocido también como la Edad Alejandrina Tardía. Es aquí donde nos encontramos con el más importante de los algebristas griegos, Diofanto de Alejandría, también llamado padre del álgebra. Diofanto vuelve a la tradición iniciada por los egipcios y babilonios de dar importancia al cálculo sin tener en cuenta las representaciones geométricas de los números y desarrolla las reglas del cálculo abstracto, enuncia la regla de los signos y utiliza por primera vez un símbolo literal para representar una incógnita de una ecuación. Se conocen 6 libros de la Aritmética de Diofanto, aunque en el prefacio aparece que habían 13. No aparecen teoremas ni proposiciones, sino problemas entre números abstractos y en el último de los libros los datos y las incógnitas son elementos de triángulos. Aparecen ecuaciones de primer grado con una incógnita, cálculo de dos números conociendo sus suma y su diferencia, sistemas lineales, ecuaciones de segundo grado, sistemas indeterminados, etc. Entre los problemas indeterminados que nos encontramos en la Arithmetica hay algunos que conducen a ecuaciones tales como x2 = 1 + 30y2, o bien x2 = 1 + 26y2, que son casos particulares de la llamada ecuación de Pell x2 = 1 + py2, y aquí de nuevo Diofanto da una única solución, ya que lo que intentaba era resolver problemas, no ecuaciones. Además Diofanto está interesado únicamente en soluciones racionales exactas al contrario que sus predecesores egipcios y babilónicos, de ahí que las ecuaciones cúbicas raramente aparecen en su obra. Poco se sabe de la vida de Diofanto, aparte de una tradición antigua que ha quedado reflejada en una colección de problemas que data de los siglos V o VI y que se conoce con el nombre de Antología griega y que dice: Dios le concedió el ser un muchacho durante una sexta parte de su vida, y añadiendo a esto una doceava parte, El pobló de vello sus mejillas. Le iluminó con la luz del matrimonio después de una sétima parte, y cinco años después de su matrimonio le concedió un hijo. Pero ¡ay! infeliz niño nacido tarde, después de alcanzar la mitad de la medida de la vida de su padre, el frío destino se lo llevó. Después de consolar sus penas con la ciencia de los números durante cuatro años más, finalizó su vida. Si este acertijo es históricamente correcto, Diofanto vivió 84 años.

Dios le concedió el ser un muchacho durante una sexta parte de su vida, y añadiendo a esto una doceava parte, El pobló de vello sus mejillas. Le iluminó con la luz del matrimonio después de una sétima parte, y cinco años después de su matrimonio le concedió un hijo. Pero ¡ay! infeliz niño nacido tarde, después de alcanzar la mitad de la medida de la vida de su padre, el frío destino se lo llevó. Después de consolar sus penas con la ciencia de los números durante cuatro años más, finalizó su vida.

Este teorema no es otra cosa que la formulación geométrica de una propiedad aritmética que hoy se conoce con el nombre de propiedad distributiva de la multiplicación respecto a la suma y que hemos visto con anterioridad. En los libros V y VI de los Elementos, encontramos demostraciones de las propiedades conmutativa y asociativa de la multiplicación. En nuestra álgebra moderna representamos las magnitudes por letras, sobreentendiendose que éstas son números (conocidos o desconocidos), con las cuales operamos siguiendo las reglas algorítmicas del álgebra, en los tiempos de Euclides las magnitudes se representaban como segmentos de línea recta, obedeciendo a los axiomas y teoremas de la geometría. A veces se dice que los griegos no tenían álgebra, pero esta afirmación es falsa, ya que el libro II de los Elementos nos expone un álgebra geométrica que les servía más o menos para los mismos fines que nuestra álgebra simbólica. Una razón de que los griegos hicieran un álgebra geométrica en vez de un álgebra aritmética era la de que la primera parecía más general que la segunda, en vista de la falta del concepto de número real. Además, un estudio minucioso de la matemática griega parece suministrar una cierta evidencia de que bajo el barniz geométrico había un mayor interés por el cálculo y las aproximaciones numéricas de lo que dan a entender los tratados clásicos existentes. La matemática griega no se mantuvo uniformemente a un nivel alto, sino que después del siglo III a.C. en el que brilló bastante tuvo una época de decadencia, que no se recuperó de manera efectiva en torno al siglo que va del 250 al 350, conocido también como la Edad Alejandrina Tardía. Es aquí donde nos encontramos con el más importante de los algebristas griegos, Diofanto de Alejandría, también llamado padre del álgebra. Diofanto vuelve a la tradición iniciada por los egipcios y babilonios de dar importancia al cálculo sin tener en cuenta las representaciones geométricas de los números y desarrolla las reglas del cálculo abstracto, enuncia la regla de los signos y utiliza por primera vez un símbolo literal para representar una incógnita de una ecuación. Se conocen 6 libros de la Aritmética de Diofanto, aunque en el prefacio aparece que habían 13. No aparecen teoremas ni proposiciones, sino problemas entre números abstractos y en el último de los libros los datos y las incógnitas son elementos de triángulos. Aparecen ecuaciones de primer grado con una incógnita, cálculo de dos números conociendo sus suma y su diferencia, sistemas lineales, ecuaciones de segundo grado, sistemas indeterminados, etc. Entre los problemas indeterminados que nos encontramos en la Arithmetica hay algunos que conducen a ecuaciones tales como x2 = 1 + 30y2, o bien x2 = 1 + 26y2, que son casos particulares de la llamada ecuación de Pell x2 = 1 + py2, y aquí de nuevo Diofanto da una única solución, ya que lo que intentaba era resolver problemas, no ecuaciones. Además Diofanto está interesado únicamente en soluciones racionales exactas al contrario que sus predecesores egipcios y babilónicos, de ahí que las ecuaciones cúbicas raramente aparecen en su obra. Poco se sabe de la vida de Diofanto, aparte de una tradición antigua que ha quedado reflejada en una colección de problemas que data de los siglos V o VI y que se conoce con el nombre de Antología griega y que dice: Si este acertijo es históricamente correcto, Diofanto vivió 84 años.

4.3. China e India

tuvo una gran importancia. Esta diferencia entre los puntos de vista antiguo y moderno es fácil de explicar: hoy nosotros tenemos un álgebra simbólica y una trigonometría que han reemplazado a sus equivalentes geométricos griegos. Por ejemplo, la proposición 1 del libro II nos dice: Si tenemos dos líneas rectas y cortamos una de ellas en un número cualquiera de segmentos, entonces el rectángulo contenido por las dos líneas rectas es igual a los rectángulos contenidos por la línea recta que no fue cortada y cada uno de los segmentos anteriores.

Las civilizaciones de China y de la India son muchos más antiguas que las de Grecia y Roma, aunque no más que las que surgieron en los valles de Mesopotamia y del Nilo, pero sus registros cronológicos son menos fiables que los que tenemos para Egipto y Babilonia. Una de sus obras más antiguas, quizás la que mayor influencia ejerció entre todos los libros matemáticos chinos es el Chui-chang suan-shu, o los Nueve Capítulos sobre el Arte Matemático. Este libro incluye 246 problemas sobre agrimensura, agricultura, compañía, ingeniería, impuestos, cálculo, resolución de ecuaciones y propiedades de los triángulos rectánCUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

346

El lenguaje algebraico. Símbolos y números gulos. Al contrario que los griegos de esta misma época, que escribían tratados expositivos sistemáticos, ordenados de una manera lógica, los chinos se dedicaban a repetir la vieja costumbre de los egipcios y babilónicos de coleccionar conjuntos de problemas concretos. Los Nueve Capítulos, también nos recuerdan el método de la falsa posición, usado por los egipcios, pero parece evidente que tanto este método como el origen y desarrollo de la matemática china carece de toda influencia occidental. Dentro de este libro hay algunos problemas que están resueltos por reglas de tres, y en otros encontramos raíces cuadradas e incluso cúbicas. El capítulo ocho tiene importancia por la resolución de problemas que conducen a sistemas de ecuaciones lineales, utilizando números positivos y negativos; el último problema de este capítulo plantea la resolución de un sistema de cuatro ecuaciones con cinco incógnitas y el tema de las ecuaciones indeterminadas va a quedar ya como uno de los favoritos de los pueblos orientales. La época más brillante de la matemática china tuvo lugar en el siglo XIII, coincidiendo con la última parte del periodo Sung. El último y a la vez más importante de los matemáticos Sung fue Chu Shih-Chieh, que floreció hacia los años 1280-1303. Se ganaba la vida enseñando matemáticas de forma errante. Uno de sus tratados más famosos es el Ssu-yüan yü-Chien o Espejo Precioso de los Cuatro Elementos, escrito en 1303. Los cuatro elementos a los que se refiere el título son el cielo, la tierra, el hombre y la materia y representan las cuatro incógnitas de una ecuación. Este libro marca la cota más alta que alcanzó el desarrollo del álgebra china y en él se estudian tanto sistemas de ecuaciones simultáneas como ecuaciones individuales de grados tan altos como 14. Chu Shih-Chieh explica en este libro un método de transformación para ecuaciones que él llama fan fa, método que suele conocerse en Occidente con el nombre de método de Horner, matemático que vivió 500 años después. Por ejemplo, para resolver la ecuación x2 + 252x – 5292 = 0, se obtiene en primer lugar por tanteo la aproximación x = 19, lo cual significa que la ecuación tiene una raíz entre 19 y 20, y a continuación se utiliza el fan fa, en este caso la transformación y = x – 19, para obtener la ecuación y2 + 290y – 143 = 0, con una raíz entre 0 y 1. El valor aproximado de la raíz buscada de esta última 143 143 es y = , por lo que el correspondiente de la x, será x = 19 . En algunos casos Chu Shih-Chieh ob1+ 290 291 tiene aproximaciones decimales de las raíces. La cronología de la matemática hindú es muy insegura y presenta problemas históricos difíciles de resolver, ya que los autores hindúes raramente mencionan a sus predecesores, a la vez que muestran una sorprendente independencia en sus planteamientos matemáticos. Brahmagupta vivió en la India central hacia el año 600. Su obra es una mezcla indiscriminada de resultados correctos e incorrectos. El resultado quizás mas bello de su obra es la generalización de la fórmula de Herón para calcular el área de un cuadrilátero: S = (s – a)× (s – b)× (s – c)× (s – d) donde a, b, c y d son los lados del cuadrilátero y s el semiperímetro. Esta fórmula lleva su nombre, pero este descubrimiento queda un tanto empañado al darse cuenta que esta fórmula sólo es correcta en el caso de un cuadrilátero cíclico. Para uno arbitrario la fórmula es S = (s – a)× (s – b)× (s – c)× (s – d) – abcd ×cos 2a donde a es la semisuma de dos ángulos opuestos en el cuadrilátero. Las contribuciones de Brahmagupta al álgebra son mucho más importantes que sus reglas para el cálculo de áreas, ya que resuelve ecuaciones generales cuadráticas incluyendo las dos raíces aun en el caso de que una de ellas sea negativa. Los hindúes avanzaron respecto a la matemática griega interpretando la nada como un número(cero), además de considerar igualmente números a las raíces irracionales de otros números, lo que supuso una enorme ayuda para el álgebra. Brahmagupta hizo varias contribuciones al desarrollo de análisis indeterminado, encontrándonos en una de sus obras con una regla para la formación de ternas pitagóricas, expresada de la forma: 1 m2 1 m2 m, × , × 2 m – n 2 m+ n aunque esta sólo sea una forma modificada de la vieja regla babilónica que Brahmagupta pudo muy bien conocer. También fue él el primero que dio una solución general de la ecuación diofántica lineal ax + by = c, con a, b y c enteros. Para que esta ecuación tenga soluciones enteras, el máximo común divisor de a y b TEMARIO DE MATEMÁTICAS. PRUEBA A

347

348

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

debe dividir a c, y Brahmagupta sabía que si a y b son primos entre sí, entonces todas las soluciones de la ecuación vienen dadas por las fórmulas x = p + mb, y = q – ma donde m es un entero arbitrario. En 1114 nace Bhaskara el matemático más importante del siglo XII, que completó algunos de los huecos de la obra de Brahmagupta, como hizo al enfrentarse con el problema de la división por cero. Es en su libro Vija-Ganita, donde por primera vez nos encontramos con la afirmación de que al dividir un número por cero nos da infinito: 3 Proposición: Dividendo 3. Divisor 0. Cociente la fracción . Esta fracción de la que el denomi0 nador es cifra se llama cantidad infinita. En esta cantidad que consiste en lo que tiene cifra como divisor, no hay alteración posible por mucho que se añada o se extraiga, lo mismo que no hay cambio en Dios infinito e inmutable.

Por la época en que Brahmagupta escribía sus tratados matemáticos la península arábiga se encontraba sumida en una profunda crisis. Arabia estaba habitada en su mayor parte por nómadas del desierto, conocidos con el nombre de beduinos, que no sabían leer ni escribir, y en este marco nació hacia el año 570 el profeta Mahoma, que con el transcurso de los años se convirtió en un líder militar a la vez que religioso y consiguió formar un estado mahometano cuyo centro era La Meca. Después de su muerte sus seguidores invadieron los territorios fronterizos y el imperio islámico se extendió por el norte de Africa, España, parte de Asia y Europa Occidental. Al principio los árabes no manifestaron ningún interés intelectual y contaban con un escaso bagaje cultural, pero poco a poco se empiezan a mostrar ávidos de conocimientos. En el siglo VIII comienzan a traducir textos griegos, los mercaderes de oriente vienen con su nuevo sistema de numeración y el califa Al-Mamun (809-833) fundó en Bagdag la Casa de la Sabiduría, comparable al antiguo Museo de Alejandría. Entre los miembros de esta especie de Universidad estaba el matemático y astrónomo Mohammed ibn-Musa Al-Khowarizmi (del cual deriva la palabra algoritmo). Su obra más importante, Al-jabr wa'l muqabalah, nos ha transmitido el término álgebra, cosa natural si se tiene en cuenta que fue el libro del que aprendió más tarde Europa la rama de la matemática que lleva ese nombre. Es verdad que en dos aspectos esta obra representa un retroceso respecto a Diofanto: es de un nivel más elemental y carece de la simplicidad de nomenclatura utilizada incluso por Brahmagupta. No obstante viene a estar más próxima al álgebra elemental moderna que las obras de Diofanto y Brahmagupta, ya que este libro no trata de difíciles problemas de análisis indeterminado, sino de la exposición directa y elemental de la resolución de ecuaciones, especialmente de las de segundo grado. A los árabes les gustaba seguir una argumentación lógica correcta y clara de las premisas a la conclusión así como una argumentación sistemática,cosa que no ocurría ni con los griegos ni con los hindúes. La palabra al-jabr significa probablemente algo así como restauración o completación y parece referirse a la trasposición de términos que están restados al otro miembro de la ecuación, sumándolos. La palabra muqabalah parece referirse a la reducción o compensación, es decir la cancelación de términos iguales en los dos miembros de la ecuación. Las influencias árabes quedan patentes en España largo tiempo después de Al-Khowarizmi, ya que en El Quijote se utiliza la palabra algebrista para denominar a un curandero que arregla las articulaciones óseas desajustadas, es decir, un restaurador. La traducción latina del álgebra comienza con una breve introducción acerca del principio de notación posicional para los números, y a continuación se expone, en seis breves capítulos, la solución de los seis tipos de ecuaciones que resultan al considerar simultáneamente los tres posibles tipos de cantidades: números, cuadrados y raíces (es decir x2, x y números). El capítulo I cubre, en tres breves párrafos, el caso de los cuadrados igual a raíces que podemos expresar x2 = 4x y 5x2 = 10x, ecuaciones para las que se dan las soluciones x = 5, 3 en notación moderna como x2 = 5x,

Esta proposición suena muy prometedora, pero a continuación se revela una falta de entendimiento a claro de la situación por parte de Bhaskara al afirmar que · 0 = a. 0 Su obra más importante, el Lilavati, contiene numerosos problemas que tratan ecuaciones lineales y cuadráticas tanto determinadas como indeterminadas, simples problemas de medida de áreas, progresiones aritméticas y geométricas, raíces, ternas pitagóricas y otros.

4.4. Los árabes

Por la época en que Brahmagupta escribía sus tratados matemáticos la península arábiga se encontraba sumida en una profunda crisis. Arabia estaba habitada en su mayor parte por nómadas del desierto, conocidos con el nombre de beduinos, que no sabían leer ni escribir, y en este marco nació hacia el año 570 el profeta Mahoma, que con el transcurso de los años se convirtió en un líder militar a la vez que religioso y consiguió formar un estado mahometano cuyo centro era La Meca. Después de su muerte sus seguidores invadieron los territorios fronterizos y el imperio islámico se extendió por el norte de Africa, España, parte de Asia y Europa Occidental. Al principio los árabes no manifestaron ningún interés intelectual y contaban con un escaso bagaje cultural, pero poco a poco se empiezan a mostrar ávidos de conocimientos. En el siglo VIII comienzan a traducir textos griegos, los mercaderes de oriente vienen con su nuevo sistema de numeración y el califa Al-Mamun (809-833) fundó en Bagdag la Casa de la Sabiduría, comparable al antiguo Museo de Alejandría. Entre los miembros de esta especie de Universidad estaba el matemático y astrónomo Mohammed ibn-Musa Al-Khowarizmi (del cual deriva la palabra algoritmo). Su obra más importante, Al-jabr wa'l muqabalah, nos ha transmitido el término álgebra, cosa natural si se tiene en cuenta que fue el libro del que aprendió más tarde Europa la rama de la matemática que lleva ese nombre. Es verdad que en dos aspectos esta obra representa un retroceso respecto a Diofanto: es de un nivel más elemental y carece de la simplicidad de nomenclatura utilizada incluso por Brahmagupta. No obstante viene a estar más próxima al álgebra elemental moderna que las obras de Diofanto y Brahmagupta, ya que este libro no trata de difíciles problemas de análisis indeterminado, sino de la exposición directa y elemental de la resolución de ecuaciones, especialmente de las de segundo grado. A los árabes les gustaba seguir una argumentación lógica correcta y clara de las premisas a la conclusión así como una argumentación sistemática,cosa que no ocurría ni con los griegos ni con los hindúes. La palabra al-jabr significa probablemente algo así como restauración o completación y parece referirse a la trasposición de términos que están restados al otro miembro de la ecuación, sumándolos. La palabra muqabalah parece referirse a la reducción o compensación, es decir la cancelación de términos iguales en los dos miembros de la ecuación. Las influencias árabes quedan patentes en España largo tiempo después de Al-Khowarizmi, ya que en El Quijote se utiliza la palabra algebrista para denominar a un curandero que arregla las articulaciones óseas desajustadas, es decir, un restaurador. La traducción latina del álgebra comienza con una breve introducción acerca del principio de notación posicional para los números, y a continuación se expone, en seis breves capítulos, la solución de los seis tipos de ecuaciones que resultan al considerar simultáneamente los tres posibles tipos de cantidades: números, cuadrados y raíces (es decir x2, x y números). El capítulo I cubre, en tres breves párrafos, el caso de los cuadrados igual a raíces que podemos expresar x2 en notación moderna como x2 = 5x, = 4x y 5x2 = 10x, ecuaciones para las que se dan las soluciones x = 5, 3

4.4. Los árabes

Esta proposición suena muy prometedora, pero a continuación se revela una falta de entendimiento a claro de la situación por parte de Bhaskara al afirmar que · 0 = a. 0 Su obra más importante, el Lilavati, contiene numerosos problemas que tratan ecuaciones lineales y cuadráticas tanto determinadas como indeterminadas, simples problemas de medida de áreas, progresiones aritméticas y geométricas, raíces, ternas pitagóricas y otros.

debe dividir a c, y Brahmagupta sabía que si a y b son primos entre sí, entonces todas las soluciones de la ecuación vienen dadas por las fórmulas x = p + mb, y = q – ma donde m es un entero arbitrario. En 1114 nace Bhaskara el matemático más importante del siglo XII, que completó algunos de los huecos de la obra de Brahmagupta, como hizo al enfrentarse con el problema de la división por cero. Es en su libro Vija-Ganita, donde por primera vez nos encontramos con la afirmación de que al dividir un número por cero nos da infinito: 3 Proposición: Dividendo 3. Divisor 0. Cociente la fracción . Esta fracción de la que el denomi0 nador es cifra se llama cantidad infinita. En esta cantidad que consiste en lo que tiene cifra como divisor, no hay alteración posible por mucho que se añada o se extraiga, lo mismo que no hay cambio en Dios infinito e inmutable.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

348

El lenguaje algebraico. Símbolos y números x = 12 y x = 2, respectivamente (la raíz x = 0 no se reconoce como tal). El capítulo II cubre el caso de los cuadrados igual a números, y el capítulo III resuelve el caso de las raíces igual a números. En los capítulos IV, V y VI se resuelven los tres casos clásicos que presentan las ecuaciones cuadráticas completas: cuadrado y raíces igual a números (x2 + 10x = 39), cuadrados y números igual a raíces (x2 + 21 = 10x), y raíces y números igual a cuadrados (3x + 4 = x2). Las soluciones consisten en recetas para completar el cuadrado perfecto, dando en cada uno de los casos la solución positiva. Al-khowarizmi llama la atención sobre el hecho de que lo que nosotros llamamos discriminante debe ser positivo: Debes comprender también que cuando tomas la mitad de las raíces en esta forma de la ecuación y multiplicas esa mitad por ella misma, si lo que resulta u obtienes de la multiplicación es menor que las unidades mencionadas anteriormente que acompañan al cuadrado, entonces tienes realmente una ecuación. La exposición de Al-khowarizmi era tan sistemática y exhaustiva que sus lectores no debieron encontrar ninguna dificultad en dominar el método de resolución Así podría dársele con propiedad mejor que a Diofanto el nombre de padre del álgebra. En el capítulo VI dice: Ya hemos dicho lo suficiente, en lo que se refiere a los números, acerca de los seis tipos de ecuaciones. Ahora es necesario, sin embargo, que demostremos geométricamente la verdad de los mismos problemas que hemos explicado con números. Es probable que Al-Khowarizmi sea uno de los más típicos ejemplos del eclecticismo árabe. Lo más seguro es que sus sistema de numeración provenga de la India, su solución algebraica sistemática de las ecuaciones de segundo grado puede haber sido un desarrollo procedente de Mesopotamia, y el marco geométrico y lógico con que justifica sus soluciones tiene su origen evidente en Grecia. En el Algebra de Al-Khowarizmi nos encontramos también reglas para operar con expresiones binómicas, incluyendo productos tales como (10 + 2) · (10 – 1) y (10 + x) · (10 – x); aunque los árabes rechazaban las raíces negativas y, en general, todo tipo de magnitudes absolutas negativas, sin embargo, estaban familiarizados con las reglas que rigen las operaciones con los números enteros positivos y negativos. Nos encontramos también con demostraciones geométricas alternativas de los seis casos de resolución de ecuaciones y una amplia variedad de problemas. Por ejemplo en el capítulo V se plantea el problema de: Dividir diez en dos partes tales que la suma de los productos obtenidos multiplicando cada parte por sí misma sea igual a 58. La versión original árabe incluye también una detallada discusión de problemas herenciales como el siguiente: Muere un hombre dejando dos hijos y legando un tercio de su capital a un extraño. El hombre deja unas propiedades que valen diez dirharms y una reclamación de deuda de diez dirhams a uno de sus hijos La respuesta correcta a las partes que corresponderían a cada heredero no es la que se podría esperar, ya que el extraño obtiene cinco dirhams. La razón es que, según la ley árabe, un hijo que debe a su padre una cantidad mayor que su porción de herencia puede retener la suma total que debía, siendo considerada en ella su porción de herencia y el resto como un regalo de su padre. En cierta medida parecen haber sido las complicadas leyes que regían la herencia lo que estimuló el estudio del álgebra en Arabia. Se suele admitir que el Algebra de Al-Khowarizmi es cronológicamente la primera obra árabe sobre el tema, pero recientemente se ha publicado en Turquía un libro sobre el manuscrito de una obra escrita por Abd Al-Hamid Ibn-Turk titulada Sobre las necesidades lógicas en las ecuaciones mixtas, publicado en la misma época que el de Al-Khowarizmi o incluso antes. En un capítulo llamado Necesidades lógicas se dan exactamente las mismas demostraciones geométricas que en el Algebra, y en un caso incluso se presenta el mismo ejemplo x2 + 21 = 10x. En al menos un aspecto la exposición es más completa, ya que demuestra por medio de figuras geométricas que una ecuación cuadrática no tiene solución si el discriminante es negativo. Las analogías entre ambas obras parecen indicar que el desarrollo del álgebra en su época no era tan reciente como se había supuesto sino que dicha materia había sobrepasado ampliamente su etapa juvenil formativa, máxime cuando los sucesores de Al-Khowarizmi reducían los problemas a la forma de ecuación y después decían opérese ahora según las leyes del álgebra y de la almucabala. Otro matemático árabe importante fue Abu'l-Wefa, que tradujo del griego la Arithmetica de Diofanto. Su sucesor, Al-Karkhi, que vivió aproximadamente la primera mitad del siglo XI, (período muy brillante en la historia de la cultura árabe), debió de utilizar esa traducción para convertirse en un discípulo árabe

TEMARIO DE MATEMÁTICAS. PRUEBA A

349

Volumen I. Matemáticas

350

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

El tratamiento que da a la ecuación cúbica, permite entender su relación entre algoritmo y lógica: Para resolver la ecuación x3 + 2x2 + 10x = 20 demuestra en primer lugar que es imposible una raíz en el sentido euclídeo tal como una razón de enteros o un número de la forma a + b, siendo a y b núme-

de Diofanto. A él se le atribuye la primera resolución numérica (considerando, como siempre, sólo las raíces positivas) de ecuaciones de la forma: ax2n + bxn = c. Contemporáneo de Al-Karkhi, vivió Al-Biruni (973-1048), que a pesar de no ser básicamente matemático le corresponde el mérito de haber familiarizado a los árabes con la matemática y la cultura hindúes por medio de su libro La India. Nos dice que Arquímedes conocía la fórmula de Herón y da una demostración de esta fórmula y de la análoga de Brahmagupta para el cuadrilátero, insistiendo en que esta última sólo se aplica a los cuadriláteros cíclicos. Para resolver el problema de inscribir un polígono regular de nueve lados en una circunferencia, lo reduce a resolver la ecuación x3 = 1 + 3x, por medio de la fórmula trigonométrica del cos 30, y para esta ecuación de la solución aproximada en forma de fracción sexagesimal 1;52,15,17,13, lo que supone una aproximación decimal de más de seis cifras. Omar Khayyam (1050-1123) escribió un álgebra que extendía la clásica de Al-Khowarizmi hasta incluir ecuaciones cúbicas. Siguiendo la tradición de sus predecesores árabes, da los dos tipos de soluciones, aritméticas y geométricas, para las ecuaciones cuadráticas. Para las ecuaciones cúbicas, en general, creyó (equivocadamente, como se demostraría más tarde en el siglo XVI) que no era posible dar soluciones aritméticas y da sólo soluciones geométricas. Las ecuaciones de grado superior a tres no intentó resolverlas geométricamente por la sencilla razón de que el espacio no tiene más que tres dimensiones. A continuación vamos a resolver, usando notación algebraica, la ecuación cúbica: x3 + ax2 + b2x + c3 = 0. Sustituimos x2 por 2py y obtenemos 2pxy + 2apy + b2x + c3 = 0, que es la ecuación de la una hipérbola, mientras que la ecuación de la sustitución x2 = 2py representa una parábola. Las raíces de la ecuación cúbica dada son las abcisas de los puntos de intersección de la hipérbola y de la parábola. n ®¥

lim

u –1 = un n

5–1 2

Cuando a partir del siglo XI la cultura árabe comienza a mostrar signos de decadencia, el mundo cristiano experimenta un despertar cultural, influenciado por los árabes a través del Mediterráneo, Sicilia y España. Se inicia una era de transmisión del saber por medio de traducciones, y, sin duda, Toledo es el centro de este trabajo que pone a disposición de los sabios occidentales el saber griego y el saber árabe. De los traductores que trabajaron en España, uno de los más importantes fue Gerardo de Cremona (1114-1187), que vino a España para aprender árabe y estudiar a Ptolomeo, pero después dedicó el resto de su vida a hacer traducciones del árabe. En 1175 tradujo el Almagesto, y fue por esta traducción como se llegó a conocer a Ptolomeo en Occidente. Entre sus obras está una adaptación latina del Algebra de Al-Khowarizmi, pero ya había una traducción anterior y más popular del Algebra hecha en 1145 por Roberto de Chester, que puede considerarse el comienzo del álgebra europea. La Europa occidental comenzó a mirar la matemática árabe de una manera mucho más favorable de lo que lo había hecho nunca con la geometría griega. Quizás la razón sea el nivel tan elemental del álgebra árabe. El Liber abaci (1228) es la obra más conocida del algebrista Fibonacci. A pesar de que la mayoría de los problemas que contiene son del tipo de transacciones comerciales, utilizando para ello un complicado sistema de fracciones para calcular los cambios de moneda, también se recogen problemas muy parecidos a los que ya figuraban en el papiro de Ahmes: Siete viejas van a Roma; cada vieja tiene siete mulas; cada mula lleva siete sacos; cada saco contiene siete hogazas, con cada hogaza van siete cuchillos, y cada cuchillo lleva siete vainas. Pero el problema recogido en el Liber abaci que más ha inspirado a los matemáticos posteriores es el siguiente: ¿Cuántas parejas de conejos se producirán en un año, comenzando con una pareja única, si cada mes cualquier pareja engendra otra pareja, que se produce a su vez desde el segundo mes? Este famoso problema es el que da lugar a la llamada sucesión de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, ..., un, ..., donde un = un–1 + un–2 para n ³ 3. Entre las propiedades interesantes de esta sucesión se puede demostrar que dos términos sucesivos cualesquiera son primos entre sí y que el límite que viene a continuación existe y se llama razón áurea:

4.5. La Edad Media

Cuando a partir del siglo XI la cultura árabe comienza a mostrar signos de decadencia, el mundo cristiano experimenta un despertar cultural, influenciado por los árabes a través del Mediterráneo, Sicilia y España. Se inicia una era de transmisión del saber por medio de traducciones, y, sin duda, Toledo es el centro de este trabajo que pone a disposición de los sabios occidentales el saber griego y el saber árabe. De los traductores que trabajaron en España, uno de los más importantes fue Gerardo de Cremona (1114-1187), que vino a España para aprender árabe y estudiar a Ptolomeo, pero después dedicó el resto de su vida a hacer traducciones del árabe. En 1175 tradujo el Almagesto, y fue por esta traducción como se llegó a conocer a Ptolomeo en Occidente. Entre sus obras está una adaptación latina del Algebra de Al-Khowarizmi, pero ya había una traducción anterior y más popular del Algebra hecha en 1145 por Roberto de Chester, que puede considerarse el comienzo del álgebra europea. La Europa occidental comenzó a mirar la matemática árabe de una manera mucho más favorable de lo que lo había hecho nunca con la geometría griega. Quizás la razón sea el nivel tan elemental del álgebra árabe. El Liber abaci (1228) es la obra más conocida del algebrista Fibonacci. A pesar de que la mayoría de los problemas que contiene son del tipo de transacciones comerciales, utilizando para ello un complicado sistema de fracciones para calcular los cambios de moneda, también se recogen problemas muy parecidos a los que ya figuraban en el papiro de Ahmes: Siete viejas van a Roma; cada vieja tiene siete mulas; cada mula lleva siete sacos; cada saco contiene siete hogazas, con cada hogaza van siete cuchillos, y cada cuchillo lleva siete vainas. Pero el problema recogido en el Liber abaci que más ha inspirado a los matemáticos posteriores es el siguiente: ¿Cuántas parejas de conejos se producirán en un año, comenzando con una pareja única, si cada mes cualquier pareja engendra otra pareja, que se produce a su vez desde el segundo mes? Este famoso problema es el que da lugar a la llamada sucesión de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, ..., un, ..., donde un = un–1 + un–2 para n ³ 3. Entre las propiedades interesantes de esta sucesión se puede demostrar que dos términos sucesivos cualesquiera son primos entre sí y que el límite que viene a continuación existe y se llama razón áurea:

4.5. La Edad Media

de Diofanto. A él se le atribuye la primera resolución numérica (considerando, como siempre, sólo las raíces positivas) de ecuaciones de la forma: ax2n + bxn = c. Contemporáneo de Al-Karkhi, vivió Al-Biruni (973-1048), que a pesar de no ser básicamente matemático le corresponde el mérito de haber familiarizado a los árabes con la matemática y la cultura hindúes por medio de su libro La India. Nos dice que Arquímedes conocía la fórmula de Herón y da una demostración de esta fórmula y de la análoga de Brahmagupta para el cuadrilátero, insistiendo en que esta última sólo se aplica a los cuadriláteros cíclicos. Para resolver el problema de inscribir un polígono regular de nueve lados en una circunferencia, lo reduce a resolver la ecuación x3 = 1 + 3x, por medio de la fórmula trigonométrica del cos 30, y para esta ecuación de la solución aproximada en forma de fracción sexagesimal 1;52,15,17,13, lo que supone una aproximación decimal de más de seis cifras. Omar Khayyam (1050-1123) escribió un álgebra que extendía la clásica de Al-Khowarizmi hasta incluir ecuaciones cúbicas. Siguiendo la tradición de sus predecesores árabes, da los dos tipos de soluciones, aritméticas y geométricas, para las ecuaciones cuadráticas. Para las ecuaciones cúbicas, en general, creyó (equivocadamente, como se demostraría más tarde en el siglo XVI) que no era posible dar soluciones aritméticas y da sólo soluciones geométricas. Las ecuaciones de grado superior a tres no intentó resolverlas geométricamente por la sencilla razón de que el espacio no tiene más que tres dimensiones. A continuación vamos a resolver, usando notación algebraica, la ecuación cúbica: x3 + ax2 + b2x + c3 = 0. Sustituimos x2 por 2py y obtenemos 2pxy + 2apy + b2x + c3 = 0, que es la ecuación de la una hipérbola, mientras que la ecuación de la sustitución x2 = 2py representa una parábola. Las raíces de la ecuación cúbica dada son las abcisas de los puntos de intersección de la hipérbola y de la parábola. lim n ®¥

un – 1 = un

5–1 2

El tratamiento que da a la ecuación cúbica, permite entender su relación entre algoritmo y lógica: Para resolver la ecuación x3 + 2x2 + 10x = 20 demuestra en primer lugar que es imposible una raíz en el sentido euclídeo tal como una razón de enteros o un número de la forma a + b, siendo a y b númeCUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

350

El lenguaje algebraico. Símbolos y números ros racionales. Después da un valor aproximado de la raíz positiva en forma de fracción sexagesimal 1;22,7,42,33,4,40 con más de seis cifras exactas.

4.6. El Renacimiento La mayor parte de los matemáticos de comienzos del Renacimiento eran alemanes e italianos, pero en 1484 apareció en Francia un manuscrito que fue el mas notable desde la publicación tres siglos antes del Liber abaci; esta obra fue Triparty en la science des nombres, escrito por Nicolás Chuquet, acerca del cual sabemos muy poco, salvo que nació en París, se hizo bachiller en medicina y ejerció en Lyon. La obra está escrita en un estilo retórico, pero con importantes sincopaciones y las principales cuatro operaciones vienen representadas por las palabras plus, moins, multiplier par y partyr par, de las cuales las dos primeras aparecen a veces abreviadas a la manera medieval como p y m. La primera parte del mismo trata de las operaciones aritméticas racionales con números, incluyendo una explicación del sistema de numeración hindú-árabe (la décima figura no tiene o significa ningún valor). En la segunda parte trata el cálculo con raíces de números y en la última parte, con mucho la más importante, se refiere a la Regle des premiers, es decir, la regla de las incógnitas, o lo que nosotros llamaríamos álgebra. Durante los siglos XV y XVI se utilizaron diversos nombres para la cosa desconocida, tales como res en latín, chose en francés, cosa en italiano o coss en alemán. La palabra premier que utiliza Chuquet es completamente inusual. La segunda mitad de la última parte de la obra está dedicada a la resolución de ecuaciones, recogiendo problemas que ya habían resuelto sus Predecesores, pero expresando también por primera vez un número negativo aislado en una ecuación algebraica. Chuquet no admitía en general el 0, pero al menos en una ocasión observa que este es el número buscado. Al estudiar ecuaciones de la forma axm + bxm+n = cxm+2n con coeficientes y exponentes positivos, se encontró con que en algunos casos habría raíces imaginarias, limitándose a añadir en estos casos que tel nombre est ineperible. Si bien es cierto que el primer libro de álgebra del Renacimiento, el de Chuquet, fue escrito por un francés, el más conocido se publicó diez años más tarde en Italia: Summa de arithmetica, geométrica, proportioni et proportionalita, del fraile Luca Pacioli (1224-1514), que tuvo tal repercusión que las historias antiguas del álgebra solían pasar del Liber abaci de 1202 a la Summa de 1494, sin mencionar ni la obra de Chuquet, ni ninguna otra intermedia. Durante el Renacimiento el desarrollo de matemático se caracterizó especialmente por el desarrollo del álgebra continuando así la tradición medieval. La parte relativa al álgebra incluye las soluciones usuales de las ecuaciones lineales y cuadráticas. Hay un uso creciente de abreviaturas: p y m para representar la suma y la resta, co, ce y ae para cosa (incógnita), censo (el cuadrado de la incógnita) y cece (cuadrado del cuadrado). Entre las numerosas álgebras germánicas está la de Die Coss (1524), escrita por el famoso Rechenmeister alemán Adam Riese (1492-1559) y la Arithmetica integra (1544) de Stifel (1487-1567) que es, sin duda, el álgebra germánica más importante del siglo XVI. Su importancia se debe al tratamiento de los números negativos, las raíces y las potencias. Mediante el uso de coeficientes negativos, Stifel redujo los seis casos de ecuaciones cuadráticas a una forma única, sin embargo sorprende que él tampoco admita los números negativos como raíces de una ecuación, y de hecho los llama numeri absurdi, aun conociendo perfectamente sus propiedades. Popularizó los signos + y – en lugar de la notación italiana p y m. Stifel daba en su obra numerosos ejemplos que conducían a ecuaciones cuadráticas, pero ninguno desembocaba en una ecuación cúbica porque tampoco sabía resolverlas. El año 1545 se divulgó la solución no sólo de la ecuación cúbica, sino también de la cuártica, gracias a la publicación del Ars magna de Jerónimo Cardano (1501-1576). Un avance tan grande como este produjo un impacto tan grande que se suele considerar 1545 como el año de comienzo del periodo moderno en la matemática. Hay que advertir que la resolución de la ecuación cúbica partió de Tartaglia (1500-1557) y la de la cuártica del antiguo secretario de Cardano, Ludovico Ferrari (1522-1565). Aunque Cardano estudia siempre ecuaciones numéricas, sigue la costumbre de Al-Khowarizmi de razonar geométricamente. Por ejemplo, como x3 es un volumen; 6x, en la ecuación que estudiamos a continuación, debe considerarse también como un volumen, y por lo tanto el número 6 debe tener las dimensiones de un área, lo que sugiere el tipo de sustitución que hace Cardano. TEMARIO DE MATEMÁTICAS. PRUEBA A

351

Volumen I. Matemáticas

352

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

La solución de las ecuaciones cúbica y cuártica fue probablemente la mayor contribución al álgebra desde que los babilonios, casi cuatro milenios antes, habían aprendido a completar el cuadrado para resolver las ecuaciones cuadráticas. Ahora parecía natural intentar generalizar estos resultados a ecuaciones po-

Cardano consideraba a sus ecuaciones con coeficientes numéricos concretos como representantes de tipos generales, de modo que cuando escribe: Sea el cubo y seis veces el lado igual a 20 está pensando en todas aquellas que presentan el cubo y la cosa igual a un número x3 + px = q. Veamos la solución de la ecuación x3 + 6x = 20, que ocupa un par de páginas en estilo retórico: Llegamos a una ecuación cuadrática en x, que debemos resolver.

6.

Sustituir en el punto 2. un valor de y y tómese la raíz cuadrada de los dos miembros.

5.

Sustituimos x por u – v de modo que u y v están relacionadas de forma que su producto sea igual a un tercio del coeficiente de x en la ecuación, es decir, u · v = 2. Haciendo la sustitución obtenemos como resultado u3 – v3 = 20, y eliminando v, tenemos la ecuación u6 = 20u3 + 8 , ecuación de segundo grado en u3 ~ y, por lo tanto: 1 1 1 1 y = 3 287 + 80449 + 3 287 – 80449 – 5 2 2 2 2 u3 = 108 + 10

El resultado del apartado anterior es una ecuación cúbica en y: y3 + 15y2 + 36y = 450 (cúbica resolvente de la ecuación cuártica) cuya solución es:

4.

Elegir y de tal manera que el trinomio del segundo miembro sea un cuadrado perfecto. Esto se consigue igualando el discriminante a cero, antigua y conocida receta, que en nuestro caso equivale a hacer 602 – 4 · (2y + 6) · (y2 + 12y) = 0.

3.

u3 – v3 = 20

v3 = 108 – 10

x = u – v = 3 108 + 10 – 3 108 – 10

(x2 + 6 + y)2 = 6x2 + 60x + y2 + 12y + 2yx2 = (2y + 6) · x2 + 60x + (y2 + 12y)

Una vez terminado todo el proceso termina Cardano dando una formulación verbal para la solución de la ecuación x3 + px = q

Añádanse ahora a los dos miembros de la ecuación términos en los que aparezca una nueva incógnita y, de tal manera que el primer miembro siga siendo un cuadrado perfecto tal como (x2 + 6 + y)2. La ecuación se convierte entonces en

2.

Añadir suficientes cuadrados y números a ambos miembros de la ecuación para convertir el primer miembro en un cuadrado perfecto: x4 + 12x2 + 36 = (x2 + 6)2

1.

æ pö æqö q æ pö æqö q x = 3 ç ÷ +ç ÷ + – 3 ç ÷ +ç ÷ – è 3 ø è 2ø 2 è 3 ø è 2ø 2 3

2

3

2

Si se aplica esta regla a la ecuación x3 = 15x + 4, llegamos a

Cardano sabía muy bien que no existía la raíz cuadrada de un número negativo y también que esta ecuación tiene como solución x = 4 , de manera que no podía entender qué sentido tenía su regla en esta situación. Así, a estas raíces cuadradas de números negativos las denominó sofísticas, concluyendo que en este caso su resultado era tan sutil como inútil. Hay que apuntar entre los méritos de Cardano que prestara atención a una situación tan desconcertante. Cardano en el Ars magna dice que la regla para resolver ecuaciones cuárticas se debe a mi antiguo secretario Luigi Ferrari, que la inventó a petición mía. Ya sabía como eliminar el término de grado 3 en caso de que apareciera, aumentando o disminuyendo las raíces en un cuarto del coeficiente cúbico. Entonces las sucesivas etapas en la solución de x4 + 6x2 + 36 = 60x, las presenta Cardano como sigue: x = 3 2+ –121 + 3 2 – –121

Cardano sabía muy bien que no existía la raíz cuadrada de un número negativo y también que esta ecuación tiene como solución x = 4 , de manera que no podía entender qué sentido tenía su regla en esta situación. Así, a estas raíces cuadradas de números negativos las denominó sofísticas, concluyendo que en este caso su resultado era tan sutil como inútil. Hay que apuntar entre los méritos de Cardano que prestara atención a una situación tan desconcertante. Cardano en el Ars magna dice que la regla para resolver ecuaciones cuárticas se debe a mi antiguo secretario Luigi Ferrari, que la inventó a petición mía. Ya sabía como eliminar el término de grado 3 en caso de que apareciera, aumentando o disminuyendo las raíces en un cuarto del coeficiente cúbico. Entonces las sucesivas etapas en la solución de x4 + 6x2 + 36 = 60x, las presenta Cardano como sigue: x = 3 2+ –121 + 3 2 – –121

Si se aplica esta regla a la ecuación x3 = 15x + 4, llegamos a

1.

Añadir suficientes cuadrados y números a ambos miembros de la ecuación para convertir el primer miembro en un cuadrado perfecto: x4 + 12x2 + 36 = (x2 + 6)2

2.

Añádanse ahora a los dos miembros de la ecuación términos en los que aparezca una nueva incógnita y, de tal manera que el primer miembro siga siendo un cuadrado perfecto tal como (x2 + 6 + y)2. La ecuación se convierte entonces en

æ pö æqö q æ pö æqö q x = 3 ç ÷ +ç ÷ + – 3 ç ÷ +ç ÷ – è 3 ø è 2ø 2 è 3 ø è 2ø 2 3

2

3

2

Una vez terminado todo el proceso termina Cardano dando una formulación verbal para la solución de la ecuación x3 + px = q (x2 + 6 + y)2 = 6x2 + 60x + y2 + 12y + 2yx2 = (2y + 6) · x2 + 60x + (y2 + 12y) x = u – v = 3 108 + 10 – 3 108 – 10

3.

Elegir y de tal manera que el trinomio del segundo miembro sea un cuadrado perfecto. Esto se consigue igualando el discriminante a cero, antigua y conocida receta, que en nuestro caso equivale a hacer 602 – 4 · (2y + 6) · (y2 + 12y) = 0.

4.

El resultado del apartado anterior es una ecuación cúbica en y: y3 + 15y2 + 36y = 450 (cúbica resolvente de la ecuación cuártica) cuya solución es:

v3 = 108 – 10 u3 – v3 = 20

u3 = 108 + 10

Sustituimos x por u – v de modo que u y v están relacionadas de forma que su producto sea igual a un tercio del coeficiente de x en la ecuación, es decir, u · v = 2. Haciendo la sustitución obtenemos como resultado u3 – v3 = 20, y eliminando v, tenemos la ecuación u6 = 20u3 + 8 , ecuación de segundo grado en u3 ~ y, por lo tanto: 1 1 1 1 y = 3 287 + 80449 + 3 287 – 80449 – 5 2 2 2 2

5.

Sustituir en el punto 2. un valor de y y tómese la raíz cuadrada de los dos miembros.

Cardano consideraba a sus ecuaciones con coeficientes numéricos concretos como representantes de tipos generales, de modo que cuando escribe: Sea el cubo y seis veces el lado igual a 20 está pensando en todas aquellas que presentan el cubo y la cosa igual a un número x3 + px = q. Veamos la solución de la ecuación x3 + 6x = 20, que ocupa un par de páginas en estilo retórico: 6.

Llegamos a una ecuación cuadrática en x, que debemos resolver.

La solución de las ecuaciones cúbica y cuártica fue probablemente la mayor contribución al álgebra desde que los babilonios, casi cuatro milenios antes, habían aprendido a completar el cuadrado para resolver las ecuaciones cuadráticas. Ahora parecía natural intentar generalizar estos resultados a ecuaciones poCUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

352

El lenguaje algebraico. Símbolos y números linómicas de grado mayor que cuatro, lo que iba a producir mucha y muy buena matemática, pero llevaría inevitablemente a una conclusión negativa. Otra consecuencia de la resolución de la cúbica es que condujo a las primeras consideraciones significativas acerca de un nuevo tipo de número: los números irracionales que ya habían sido aceptados en la época de Cardano, al poderlos aproximar por números racionales. Los números negativos producían más dificultades aunque Cardano los utilizó llamándolos numero ficti. Según la resolución de una ecuación cúbica, siempre que existan tres raíces reales no nulas, la fórmula empleada conduce a raíces cuadradas de números negativos. El algebrista italiano Bombelli (1526-1573), tuvo lo que él mismo llamó una idea loca, puesto que todo el asunto parecía basarse en sofística. Los dos radicandos bajo las raíces cúbicas, sólo difieren en un signo, que para la ecuación x3 = 15x + 4 nos da x = 3 2+ –121 + 3 2 – –121 mientras que la única raíz positiva de la ecuación es x = 4. Bombelli tuvo la feliz idea de imaginar que los radicales mismos podrían estar relacionados entre sí de la misma manera que lo están los radicandos, anticipándose así al estudio de los números complejos.

4.7. Matemática moderna La transición del Renacimiento al mundo moderno se hizo a través de un considerable número de figuras matemáticas intermedias, como, por ejemplo, Galileo Galilei (1564-1642), Bonaventura Cavalieri (1598-1647), Henry Briggs (1561-1639), Thomas Harriot (1560-1621), John Napier (1550-1617), Johann Kepler (1571-1630), Albert Girad (1590-1633), etc. Pero la figura central y más brillante de la transición fue sin duda el francés François Viéte. Viéte (1540-1603), a pesar de no ser un matemático profesional, ya que en su juventud estudió derecho, que más tarde ejerció, llegando a ser miembro del Parlamento de Bretaña, hizo importantes contribuciones a la matemática moderna. Poco podía avanzar una teoría algebraica, mientras la preocupación principal fuera la de hallar la cosa en una ecuación con coeficientes numéricos concretos. La matemática consiste en una forma de razonamiento y no en un conjunto de trucos para resolver situaciones específicas, como los que ofrecía Diofanto. Viéte propuso utilizar una vocal para representar una cantidad que en álgebra se supone desconocida o indeterminada, y una consonante para representar una magnitud o un número que se supone conocido o dado. Esto supone, por primera vez, una distinción clara entre el concepto de parámetro y la idea de incógnita. Si Viéte hubiera adoptado otros simbolismos que ya existían en su época, podría haber escrito todas las ecuaciones cuadráticas bajo la forma única BA2 + CA + D = 0, siendo A la incógnita y B, C y D los parámetros, que es lo que perseguían los algebristas de la época, poder escribir una ecuación general de cualquier grado que las incluyera a todas al igual que un geómetra podía designar cualquier triángulo de la forma ABC. Desgraciadamente Viéte sólo era moderno en algunos sentidos y antiguo en otros. Su álgebra es básica, más sincopada que simbólica, ya que, a pesar de haber adoptado los símbolos germánicos para la suma y la resta y utilizar símbolos diferentes para los parámetros y las incógnitas, el resto de su álgebra consistía en palabras y abreviaturas. Por ejemplo, la tercera potencia de la incógnita no se representaba por A3, ni por AAA (tal como lo hacía Stifel), sino por A cubus. Viéte propuso un nuevo enfoque para resolver la ecuación cúbica: una vez reducida a la forma canónica del tipo x3 + 3ax = b, introducía una nueva incógnita y relacionada con la x por medio de la ecuación y2 + xy = a. Este cambio transforma una ecuación cúbica en x en una ecuación cuadrática en y3, cuya solución se obtiene fácilmente. Comprobó que si la ecuación x3 + b = 3ax tiene dos raíces positivas x1 y x2, entonces 3a = x12 + x1x2 + x22 y b = x1x22 + x2x12. Fue no obstante Girard en su obra Invention nouvelle en l'algebré quien formulara de forma clara y precisa las relaciones entre raíces y coeficientes admitiendo no sólo raíces positivas, como Viéte, sino también negativas e imaginarias, ya que también cumplen los principios generales de formación de la ecuación a partir de sus raíces. Girard se anticipó de alguna manera a la idea de la recta numérica, ya que decía que las raíces negativas vienen a estar dirigidas en un sentido contrario al de los números positivos y fue el primero en constatar que una ecuación puede tener tantas raíces como indique su grado. Descubrimientos muy parecidos los hizo Harriot, incluso antes que Girard, pero no aparecieron publicados hasta diez años después de su muerte en 1621. En materia de notación, se le deben avances importantes como los signos > y < para el mayor que y menor que. TEMARIO DE MATEMÁTICAS. PRUEBA A

353

354

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

El siglo XIX merece ser llamado la Edad de Oro de la Matemática. Los progresos hechos en la matemática durante estos 100 años superan con mucho en calidad y cantidad la producción reunida de todas las épocas anteriores. El momento decisivo para la matemática inglesa tuvo lugar en 1815, cuando se constituyó la Analytical Society en el Trinity College de Cambrigde, fundada por tres jóvenes cantabrigenses: el algebrista George Peacock (1791-1858), el astrónomo John Herschel (1792-1871) y Charles Babbage (1792-1871), famoso por sus máquinas calculadoras. Peacock no produjo ningún resultado nuevo de importancia destacada en matemáticas, pero tuvo gran importancia en el proceso de reforma de esta ciencia en Inglaterra, en especial del álgebra. En su obra Treatise on Algebra, formula las leyes fundamentales de la aritmética: conmutativa, asociativa de la suma y el producto y distributiva del producto respecto a la suma, aunque no utiliza estos nombres modernos. Este planteamiento señala los comienzos del pensamiento axiomático aplicado a la aritmética y al álgebra. Peacock encontró apoyo en la obra de Augustus de Morgan (1806-1871), que en cierto modo se le unió en la constitución de lo que podría llamarse Escuela Inglesa. En el álgebra de Peacock los símbolos se entendían en general como números o magnitudes, pero De Morgan los consideraba ya de manera abstracta, dejando sin significado concreto no sólo a las letras que utilizaba sino también a los símbolos que representaban operaciones. Así las letras A, B y C podían significar virtudes y vicios y + y – podían representar premio y castigo. Hamilton (1805-1865) introdujo un álgebra formal de parejas de números reales cuyas reglas de combinación son precisamente las que se utilizan hoy para el sistema de los números complejos. Introdujo así el concepto de número complejo como un par ordenado de números reales. A mediados del siglo XIX los matemáticos alemanes sobresalían por encima de los de otros países en análisis y geometría. Sin embargo el álgebra fue, durante mucho tiempo, casi un monopolio inglés con el Trinity College de Cambridge en primera línea y el Cambrídge Mathematical Journal como principal medio de expresión. Peacock y De Morgan fueron miembros del Trinity, como lo era también Cayley (1821-1895), prolífico investigador en álgebra y geometría. Fue uno de los primeros en estudiar las matrices y determinantes lo que constituye otro ejemplo del peculiar interés inglés por la forma y estructura del álgebra.

En muchos aspectos la obra de Viéte se ha visto escandalosamente subvalorada, pero en un caso es posible que se le haya atribuido indebidamente un método que ya se había utilizado mucho antes en China, el método de Horner; un método para la resolución aproximada de ecuaciones, que publicó en una de sus obras tardías De numerosa potestatum... resolutione (1600). Una de las bellezas del método consiste en que es aplicable a toda ecuación polinómica de coeficientes reales y con una raíz real. Hoy en día, geometría cartesiana es sinónimo de geometría analítica, pero la finalidad principal que perseguía Descartes (1596-1650) estaba muy lejos de la que persiguen los libros de texto moderno. La meta perseguida es una construcción geométrica, y no necesariamente la reducción de la geometría al álgebra. En La Géométrie de Descartes el único símbolo arcaico que se utiliza es el de ¥ en lugar del = para la igualdad. El uso por parte de Descartes de las primeras letras del alfabeto para los parámetros o constantes y de las últimas para las incógnitas o variables, adoptando para ellas la notación exponencial y la utilización de los símbolos germánicos + y –, hacen, combinando todos estos elementos, que la notación algebraica de Descartes se parezca mucho a la nuestra. De hecho, La geómétrie, de Descartes, es el primer texto matemático que un estudiante de álgebra actual puede leer sin dificultades de notación. No obstante hay una diferencia importante, ya que donde nosotros consideramos a los parámetros e incógnitas números, Descartes los considera como segmentos. Su libro contiene un sistema para resolver ecuaciones cuadráticas, pero no en el sentido algebraico de los antiguos babilonios, sino geométricamente, algo así como lo que hacían los griegos en la antigüedad. El objetivo de su método es doble: 1. Liberar en lo posible a la geometría, a través de métodos algebraicos del uso de las figuras. 2. Darle un significado concreto a las operaciones del álgebra por medio de su interpretación geométrica. Descartes acusaba a la geometría de apoyarse excesivamente en diagramas y figuras que llegan a fatigar la imaginación y a la vez acusaba al álgebra de ser un método confuso y oscuro que desconcierta a la mente. De ahí que el objetivo de su método fuese doble. Su manera de proceder en La géométrie era la de comenzar con el estudio de un problema puramente geométrico para traducirlo a continuación al lenguaje de una ecuación algebraica y entonces, una vez simplificada todo lo posible, resolverla de forma geométrica análoga a como lo había hecho con las ecuaciones cuadráticas.

4.8. Álgebra abstracta

4.8. Álgebra abstracta

En muchos aspectos la obra de Viéte se ha visto escandalosamente subvalorada, pero en un caso es posible que se le haya atribuido indebidamente un método que ya se había utilizado mucho antes en China, el método de Horner; un método para la resolución aproximada de ecuaciones, que publicó en una de sus obras tardías De numerosa potestatum... resolutione (1600). Una de las bellezas del método consiste en que es aplicable a toda ecuación polinómica de coeficientes reales y con una raíz real. Hoy en día, geometría cartesiana es sinónimo de geometría analítica, pero la finalidad principal que perseguía Descartes (1596-1650) estaba muy lejos de la que persiguen los libros de texto moderno. La meta perseguida es una construcción geométrica, y no necesariamente la reducción de la geometría al álgebra. En La Géométrie de Descartes el único símbolo arcaico que se utiliza es el de ¥ en lugar del = para la igualdad. El uso por parte de Descartes de las primeras letras del alfabeto para los parámetros o constantes y de las últimas para las incógnitas o variables, adoptando para ellas la notación exponencial y la utilización de los símbolos germánicos + y –, hacen, combinando todos estos elementos, que la notación algebraica de Descartes se parezca mucho a la nuestra. De hecho, La geómétrie, de Descartes, es el primer texto matemático que un estudiante de álgebra actual puede leer sin dificultades de notación. No obstante hay una diferencia importante, ya que donde nosotros consideramos a los parámetros e incógnitas números, Descartes los considera como segmentos. Su libro contiene un sistema para resolver ecuaciones cuadráticas, pero no en el sentido algebraico de los antiguos babilonios, sino geométricamente, algo así como lo que hacían los griegos en la antigüedad. El objetivo de su método es doble: 1. Liberar en lo posible a la geometría, a través de métodos algebraicos del uso de las figuras. 2. Darle un significado concreto a las operaciones del álgebra por medio de su interpretación geométrica. Descartes acusaba a la geometría de apoyarse excesivamente en diagramas y figuras que llegan a fatigar la imaginación y a la vez acusaba al álgebra de ser un método confuso y oscuro que desconcierta a la mente. De ahí que el objetivo de su método fuese doble. Su manera de proceder en La géométrie era la de comenzar con el estudio de un problema puramente geométrico para traducirlo a continuación al lenguaje de una ecuación algebraica y entonces, una vez simplificada todo lo posible, resolverla de forma geométrica análoga a como lo había hecho con las ecuaciones cuadráticas.

El siglo XIX merece ser llamado la Edad de Oro de la Matemática. Los progresos hechos en la matemática durante estos 100 años superan con mucho en calidad y cantidad la producción reunida de todas las épocas anteriores. El momento decisivo para la matemática inglesa tuvo lugar en 1815, cuando se constituyó la Analytical Society en el Trinity College de Cambrigde, fundada por tres jóvenes cantabrigenses: el algebrista George Peacock (1791-1858), el astrónomo John Herschel (1792-1871) y Charles Babbage (1792-1871), famoso por sus máquinas calculadoras. Peacock no produjo ningún resultado nuevo de importancia destacada en matemáticas, pero tuvo gran importancia en el proceso de reforma de esta ciencia en Inglaterra, en especial del álgebra. En su obra Treatise on Algebra, formula las leyes fundamentales de la aritmética: conmutativa, asociativa de la suma y el producto y distributiva del producto respecto a la suma, aunque no utiliza estos nombres modernos. Este planteamiento señala los comienzos del pensamiento axiomático aplicado a la aritmética y al álgebra. Peacock encontró apoyo en la obra de Augustus de Morgan (1806-1871), que en cierto modo se le unió en la constitución de lo que podría llamarse Escuela Inglesa. En el álgebra de Peacock los símbolos se entendían en general como números o magnitudes, pero De Morgan los consideraba ya de manera abstracta, dejando sin significado concreto no sólo a las letras que utilizaba sino también a los símbolos que representaban operaciones. Así las letras A, B y C podían significar virtudes y vicios y + y – podían representar premio y castigo. Hamilton (1805-1865) introdujo un álgebra formal de parejas de números reales cuyas reglas de combinación son precisamente las que se utilizan hoy para el sistema de los números complejos. Introdujo así el concepto de número complejo como un par ordenado de números reales. A mediados del siglo XIX los matemáticos alemanes sobresalían por encima de los de otros países en análisis y geometría. Sin embargo el álgebra fue, durante mucho tiempo, casi un monopolio inglés con el Trinity College de Cambridge en primera línea y el Cambrídge Mathematical Journal como principal medio de expresión. Peacock y De Morgan fueron miembros del Trinity, como lo era también Cayley (1821-1895), prolífico investigador en álgebra y geometría. Fue uno de los primeros en estudiar las matrices y determinantes lo que constituye otro ejemplo del peculiar interés inglés por la forma y estructura del álgebra. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

354

El lenguaje algebraico. Símbolos y números Mientras los matemáticos de los Trinity Hamilton y Cayley (el primero de Dublín y el segundo de Cambridge) desarrollaban sus dos tipos de álgebra nuevos, otro matemático inglés estaba inventando un tercer tipo de álgebra radicalmente diferente a las anteriores. Se trataba de George Boole (1815-1864). Publicó en 1847 un librito titulado The Mathematical Analisys of Logic, que De Morgan consideró de las que marcan una época. La historia de la lógica, haciendo un exceso de simplificación la podemos dividir en tres etapas: 1.

La lógica griega.

2.

La lógica escolástica.

3.

La lógica matemática.

Mientras que en las dos primeras etapas los problemas lógicos se derivaban del lenguaje usual, en la tercera etapa la lógica procede al contrario: primero construye un sistema puramente formal y luego busca una interpretación en el lenguaje diario. La obra de Boole insistía en que la lógica debe estar asociada a la matemática. Así protestó sobre la definición de matemática que se admitía como ciencia del número y de la magnitud. Boole construyó tanto la lógica formal como un nuevo tipo de álgebra que hoy conocemos bajo el nombre de álgebra de Boole y que es a la vez el álgebra de los conjuntos y el álgebra de la lógica. Boole utilizaba las letras del alfabeto para representar objetos de un subconjunto de cosas (números, puntos, ideas, etc.), seleccionándolas de un conjunto universal que representaba por el símbolo o número 1. El símbolo número 0 lo tomó para representar el conjunto vacío, que no contiene ningún elemento del conjunto universal. El signo + representaba la unión de dos subconjuntos, el signo x la intersección y el signo = la relación de identidad. Es inmediato comprobar que las cinco leyes fundamentales del álgebra se verifican para toda álgebra de Boole de conjuntos, es decir x + y = y + x, etc. La gran variedad de tipos de álgebras inventadas en el siglo XIX podrían haber producido en la matemática una tendencia centrífuga de no haber sido por el desarrollo simultáneo de ciertos conceptos estructurales básicos. Uno de los más importantes fue el concepto de grupo, que en álgebra es sin duda el que ha ejercido la fuerza de cohesión más importante, a la vez que fue uno de los factores esenciales que promovieron la aparición de los conceptos abstractos. Ningún matemático concreto puede considerarse como el responsables del origen de la idea de grupo, pero la figura más importante en este contexto que dio su nombre a este concepto fue Evariste Galois (1811-1832). El objeto principal de las investigaciones de Galois había sido el de determinar cuándo son resolubles por radicales las ecuaciones polinómicas. Así, da criterios para la resolubilidad de la ecuación a0 + a1x + a2x2 + … an–1xn–1 + anxn = 0 en términos de operaciones racionales y de raíces enésimas sobre los coeficientes. Su planteamiento del problema que hoy se conoce como teoría de Galois fue otra de las contribuciones completamente originales en el siglo XIX al álgebra. Galois también descubrió que una ecuación algebraica irreducible es soluble por radicales si y sólo si su grupo, es decir, el grupo simétrico del conjunto de sus raíces es resoluble. La teoría de Galois nos puede proporcionar un algoritmo para calcular de manera efectiva las raíces de una ecuación cuando estas son expresables por radicales. Galois estaba próximo a las posiciones modernas del álgebra aunque tuvo dificultades para expresarlas, ya que fue incapaz para hacerse entender por los matemáticos de su época. El concepto de cuerpo estaba implícito en la obra de Galois, pero Dedeking (1831-1916) parece haber sido el primero en dar en 1879 una definición explícita de un cuerpo de números: Un conjunto de números que forma un grupo abeliano respecto a la suma y la multiplicación (excepto en lo que se refiere al inverso del cero) y tal que la multiplicación es distributiva con respecto a la suma. Otro matemático contemporáneo, Eduard Kummer (1810-1893), y Dedeking introdujeron en la aritmética el concepto de ideal, basado en la idea de anillo. Un conjunto R de elementos sobre el que están definidas dos operaciones llamadas suma y producto, se dice que es anillo si 1) es un grupo abeliano con respecto a la suma y 2) la multiplicación es asociativa y distributiva con respecto a la suma. Por lo tanto, un anillo en el que la multiplicación es conmutativa, que tiene elemento unidad y que no tiene divisores de cero, es un dominio de integridad. Así, un ideal es un subconjunto I del anillo R tal que: a)

es un grupo para la suma.

b)

siempre que x pertenezca a R e y pertenezca a I, xy e yx pertenecen a I.

TEMARIO DE MATEMÁTICAS. PRUEBA A

355

Volumen I. Matemáticas

356

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

El conjunto de los números enteros pares, por ejemplo, es un ideal del anillo de los enteros. Ocurre que en el anillo R (dominio de integridad) de los enteros algebraicos, cualquier ideal I de R se puede expresar de manera única (excepto en el orden de los factores) como un producto de ideales primos, es decir, que la unicidad en la factorización puede salvarse a través de la teoría de ideales. Italia había tomado una parte algo menos activa en el desarrollo del álgebra abstracta que Francia, Alemania e Inglaterra, pero durante los últimos años del siglo XIX hubo varios matemáticos italianos que se interesaron profundamente por la lógica matemática. El más conocido de ellos fue Giuseppe Peano (1858-1932), cuyo nombre ha quedado asociado a los llamados axiomas de Peano, sobre los que se han apoyado tantas construcciones rigurosas del álgebra y del análisis. Para la fundamentación de la aritmética, Peano eligió tres conceptos primitivos: cero, número (es decir, número natural o entero no negativo) y la relación binaria es el sucesor de, que verifican los cinco postulados siguientes: 1.

Cero es un número.

2.

Si ''a'' es un número, entonces el sucesor de ''a'' también es un número.

3.

Cero no es el sucesor de ningún número.

4.

Si los sucesores de dos números son iguales entre sí, entonces los números también son iguales.

5.

Si un conjunto S contiene el cero y también el sucesor de todo número que pertenezca a S, entonces todo número pertenece a S.

La última condición es el axioma de inducción completa. Para terminar diremos que una de las lecciones que enseña claramente la historia de la matemática es que la investigación en pos de soluciones a problemas todavía sin resolver, sean estos solubles o no, conduce casi invariablemente a descubrimientos importantes en el camino.

La última condición es el axioma de inducción completa. Para terminar diremos que una de las lecciones que enseña claramente la historia de la matemática es que la investigación en pos de soluciones a problemas todavía sin resolver, sean estos solubles o no, conduce casi invariablemente a descubrimientos importantes en el camino. Si un conjunto S contiene el cero y también el sucesor de todo número que pertenezca a S, entonces todo número pertenece a S.

5.

Si los sucesores de dos números son iguales entre sí, entonces los números también son iguales.

4.

Cero no es el sucesor de ningún número.

3.

Si ''a'' es un número, entonces el sucesor de ''a'' también es un número.

2.

Cero es un número.

1.

El conjunto de los números enteros pares, por ejemplo, es un ideal del anillo de los enteros. Ocurre que en el anillo R (dominio de integridad) de los enteros algebraicos, cualquier ideal I de R se puede expresar de manera única (excepto en el orden de los factores) como un producto de ideales primos, es decir, que la unicidad en la factorización puede salvarse a través de la teoría de ideales. Italia había tomado una parte algo menos activa en el desarrollo del álgebra abstracta que Francia, Alemania e Inglaterra, pero durante los últimos años del siglo XIX hubo varios matemáticos italianos que se interesaron profundamente por la lógica matemática. El más conocido de ellos fue Giuseppe Peano (1858-1932), cuyo nombre ha quedado asociado a los llamados axiomas de Peano, sobre los que se han apoyado tantas construcciones rigurosas del álgebra y del análisis. Para la fundamentación de la aritmética, Peano eligió tres conceptos primitivos: cero, número (es decir, número natural o entero no negativo) y la relación binaria es el sucesor de, que verifican los cinco postulados siguientes: CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

356

TEMA

21 Funciones reales de variable real. Funciones elementales; situaciones reales en las que aparecen. Composición de funciones

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

358

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN FUNCIONES ELEMENTALES 8.1. La proporcionalidad como función: la función lineal 8.2. La recta como gráfica de una función: la función afín 8.3. Otras funciones lineales 8.4. La función de proporcionalidad inversa y la función cuadrática 8.5. La función polinómica

8.

COMPOSICIÓN DE FUNCIONES 7.1. Función compuesta o función de función 7.2. Función identidad 7.3. Función inversa

7.

OTRAS PROPIEDADES DE LAS FUNCIONES REALES DE VARIABLE REAL 6.1. Función par 6.2. Función impar 6.3. Función inyectiva 6.4. Función suprayectiva 6.5. Función biyectiva 6.6. Función periódica 6.7. Función creciente 6.8. Función decreciente 6.9. Función acotada superiormente 6.10. Función acotada inferiormente 6.11. Función acotada

6.

CAMPO DE EXISTENCIA DE UNA FUNCIÓN 5.1. Función definida en un punto 5.2. Función definida en un intervalo 5.3. Campo de existencia 5.4. Campo de existencia de la función suma 5.5. Campo de existencia de la función producto de un número por una función 5.6. Importancia del campo 5.6.1. Función con variable acotada superiormente 5.6.2. Función con variable acotada inferiormente 5.6.3. Variable acotada 5.6.4. Extremo superior 5.6.5. Máximo 5.6.6. Extremo inferior 5.6.7. Mínimo

5.

2. 3.

4.

5.

6.

DEFINICIÓN DE FUNCIÓN REAL DE VARIABLE REAL

REPRESENTACIÓN GRÁFICA 3.1. Traslación en la gráfica de una función 3.1.1. Traslación horizontal de una función 3.1.2. Traslación vertical de una función

ESTRUCTURA DEL CONJUNTO DE LAS FUNCIONES REALES DE VARIABLE REAL 4.1. Suma de funciones 4.1.1. Propiedades de la suma de funciones 4.2. Producto de una función por un escalar 4.2.1. Propiedades del producto de una función por un escalar 4.3. Producto de funciones CAMPO DE EXISTENCIA DE UNA FUNCIÓN 5.1. Función definida en un punto 5.2. Función definida en un intervalo 5.3. Campo de existencia 5.4. Campo de existencia de la función suma 5.5. Campo de existencia de la función producto de un número por una función 5.6. Importancia del campo 5.6.1. Función con variable acotada superiormente 5.6.2. Función con variable acotada inferiormente 5.6.3. Variable acotada 5.6.4. Extremo superior 5.6.5. Máximo 5.6.6. Extremo inferior 5.6.7. Mínimo OTRAS PROPIEDADES DE LAS FUNCIONES REALES DE VARIABLE REAL 6.1. Función par 6.2. Función impar 6.3. Función inyectiva 6.4. Función suprayectiva 6.5. Función biyectiva 6.6. Función periódica 6.7. Función creciente 6.8. Función decreciente 6.9. Función acotada superiormente 6.10. Función acotada inferiormente 6.11. Función acotada 4.3.

ESTRUCTURA DEL CONJUNTO DE LAS FUNCIONES REALES DE VARIABLE REAL 4.1. Suma de funciones 4.1.1. Propiedades de la suma de funciones 4.2. Producto de una función por un escalar 4.2.1. Propiedades del producto de una función por un escalar Producto de funciones

4.

REPRESENTACIÓN GRÁFICA 3.1. Traslación en la gráfica de una función 3.1.1. Traslación horizontal de una función 3.1.2. Traslación vertical de una función

3.

DEFINICIÓN DE FUNCIÓN REAL DE VARIABLE REAL

2.

INTRODUCCIÓN

1.

7.

COMPOSICIÓN DE FUNCIONES 7.1. Función compuesta o función de función 7.2. Función identidad 7.3. Función inversa

8.

FUNCIONES ELEMENTALES 8.1. La proporcionalidad como función: la función lineal 8.2. La recta como gráfica de una función: la función afín 8.3. Otras funciones lineales 8.4. La función de proporcionalidad inversa y la función cuadrática 8.5. La función polinómica

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

358

Funciones reales de variable real

1. INTRODUCCIÓN Aunque la noción de función que actualmente manejamos empezó a gestarse en el siglo XIV con los filósofos escolásticos medievales, es en los siglos XVIII y XIX cuando el concepto de función se desarrolla ampliamente. Es sobre todo a finales del XIX al observarse que las funciones podían sumarse, restarse, etc., cuando surgió el Análisis Funcional, uno de los campos de mayor actuación dentro de la Matemática actual. Leibniz empezó a utilizar la palabra función en un sentido parecido al actual, aunque no usó la notación funcional moderna, ya que fue Euler quien la definió aproximándose a la definición actual. En este tema definiremos función real de variable real y las operaciones que lleva aparejada. Continuaremos con el estudio de las funciones más usuales o elementales: lineal, cuadrática, polinómica función inversa, completando el estudio de ellas poniendo especial énfasis en las situaciones reales en las que aparecen. Por último, hablaremos de la composición de funciones y de los casos más usuales de ella.

2. DEFINICIÓN DE FUNCIÓN REAL DE VARIABLE REAL DEFINICIÓN 1. Una función real de variable real es una aplicación f de un subconjunto no vacío D de R. (D\subset R.) en R, es decir, f: D ® R El subconjunto D se llama dominio de definición de f y se escribe Dom(f), es decir, el conjunto de los elementos que tienen una y solo una imagen Dom(f) = {x Î R / $! f(x) Î R} El recorrido de una función es el subconjunto de R formado por las imágenes de lo elementos del dominio Rec(f) = {f(x) / x Î D} El número x representa un elemento arbitrario del dominio de la función y se llama variable independiente. Al número y asociado por la función al valor de x se le llama variable dependiente.

3. REPRESENTACIÓN GRÁFICA Un sistema de coordenadas cartesianas en el plano es un par ordenado de dos ejes perpendiculares entre sí. Al eje horizontal se le llama eje de abcisas y se designa con OX, mientras el vertical se llama de ordenadas y se designa con OY. Si tomamos el sistema de referencia con base canónica (los vectores de la base tiene de módulo 1), un punto cualquiera del plano P vendrá representado por los coeficientes de la combinación lineal que expresa el vector OP en función de los vectores de la base, que numéricamente representan las proyecciones del vector OP sobre los ejes cartesianos. Así, el punto P se expresaría como (x0,y0), tal y como aparece en la figura 1. Al valor x0 se le llama abcisa de P y al y0 ordenada. Existen otros sistemas de representación en el plano, como el sistema de coordenadas polares, pero nosotros por generalización y comodidad nos referiremos al cartesiano.

P(x0y0)

y0

j

Figura 1.

TEMARIO DE MATEMÁTICAS. PRUEBA A

O

i

x0

359

Volumen I. Matemáticas

360

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Figura 3.

Una vez definido el sistema en el que vamos a emplear, definimos la gráfica de una función f(x) como el lugar geométrico de los puntos del plano cuyas coordenadas verifican la ecuación y = f(x). Un ejemplo está representado en la figura 2. Dicha función será simétrica respecto del eje OY, si para todo punto que contenga (x,y), también contiene al (–x,y); si así lo fuera se diría que es una función par. Y será simétrica respecto del origen si para todo punto que contenga (x,y) también contiene al (–x,–y); si así lo fuera se diría que es una función impar. f(x) = (x–1)

3

f(x) = (x+2)

3

f(x) = x

y = f(x)

3

Para trasladar la gráfica de una rfunción f(x) horizontalmente, lo que hacemos es sumar a todos los puntos de la gráfica de f(x) el vector u = ( k,0), con lo que obtenemos la gráfica de otra función g(x), que viene expresada en función de la primera por la relación g(x) = f(x – k). En función del valor de k la gráfica quedará desplazada hacia la derecha (positivo) o hacia la izquierda (negativo). En la figura 3 hemos dibujado las gráficas de las funciones f(x) = (x – k)3 para valores de k – 2, 0 y 1. Figura 2.

3.1.1. Traslación horizontal de una función 3.1. Traslaciones en la gráfica de una función

Una vez representada la gráfica de una función es posible representar las de otras más complicadas a partir de una simple traslación vertical, horizontal o mezcla de ambas. Veremos las condiciones que cumplen las gráficas de funciones trasladadas.

Una vez representada la gráfica de una función es posible representar las de otras más complicadas a partir de una simple traslación vertical, horizontal o mezcla de ambas. Veremos las condiciones que cumplen las gráficas de funciones trasladadas.

3.1. Traslaciones en la gráfica de una función

3.1.1. Traslación horizontal de una función Figura 2.

Para trasladar la gráfica de una rfunción f(x) horizontalmente, lo que hacemos es sumar a todos los puntos de la gráfica de f(x) el vector u = ( k,0), con lo que obtenemos la gráfica de otra función g(x), que viene expresada en función de la primera por la relación g(x) = f(x – k). En función del valor de k la gráfica quedará desplazada hacia la derecha (positivo) o hacia la izquierda (negativo). En la figura 3 hemos dibujado las gráficas de las funciones f(x) = (x – k)3 para valores de k – 2, 0 y 1. y = f(x)

f(x) = x

3

3

f(x) = (x+2)

3

f(x) = (x–1)

Una vez definido el sistema en el que vamos a emplear, definimos la gráfica de una función f(x) como el lugar geométrico de los puntos del plano cuyas coordenadas verifican la ecuación y = f(x). Un ejemplo está representado en la figura 2. Dicha función será simétrica respecto del eje OY, si para todo punto que contenga (x,y), también contiene al (–x,y); si así lo fuera se diría que es una función par. Y será simétrica respecto del origen si para todo punto que contenga (x,y) también contiene al (–x,–y); si así lo fuera se diría que es una función impar. Figura 3.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

360

Funciones reales de variable real

3.1.2. Traslación vertical de una función Para trasladar la gráfica de una función f(x) verticalmente, lo que hacemos es sumar a todos los puntos de la gráfica de f(x) el valor de k, con lo que obtenemos la gráfica de otra función g(x), que viene expresada en función de la primera por la relación g(x) = f(x) + k. En función del valor de k la gráfica quedará desplazada hacia abajo (negativo) o hacia arriba (positivo). En la figura 4 hemos dibujado las gráficas de las funciones f(x) = x2 + k para valores de k – 2, 0 y 1. 2

f(x) = x +1

2

f(x) = x

2

f(x) = x –2

Figura 4.

4. ESTRUCTURA DEL CONJUNTO DE LAS FUNCIONES REALES DE VARIABLE REAL Sea F(D, R) = F el conjunto de las funciones reales de D en R. Definiremos en este conjunto la igualdad de funciones y veremos que dicha definición es una relación de equivalencia. A cada una de las clases la llamaremos función real de dominio D. DEFINICIÓN 2. Dos funciones f y g pertenecientes a F son iguales si y sólo si f(x) = g(x), para todo valor x perteneciente a D. Veremos que esta definición binaria es una relación de equivalencia al cumplir las propiedades reflexiva, simétrica y transitiva. 1. Reflexiva: para toda función f perteneciente a F, se verifica que f = f. En efecto, para todo valor de x perteneciente a D se cumple que f(x) = f(x) por la propiedad reflexiva de la igualdad de números reales. 2. Simétrica: si f = g, entonces g = f. En efecto, si f = g, se verifica que f(x) = g(x) para todo valor x perteneciente a D. Y por la propiedad simétrica de la igualdad de los números reales se cumplirá que g(x) = f(x), o lo que es lo mismo, g = f. 3. Transitiva: si f = g y g = h entonces f = h. La demostración de esta propiedad es trivial basándonos en la propiedad transitiva de la igualdad de los números reales. Así, esta relación es de equivalencia, con lo que generará clases de equivalencia que estarán constituidas por las funciones iguales y un conjunto cociente que coincidirá con el propio conjunto F.

4.1. Suma de funciones Dadas dos funciones f y g de F llamamos función suma y la denotamos por s = f + g a la función que cumple s(x) = (f + g)(x) = f(x) + g(x) "x Î D Esta definición cumple la propiedad uniforme que dice que para cualesquiera funciones f y g que pertenezcan a F, su suma también pertenece a F y además es única. TEMARIO DE MATEMÁTICAS. PRUEBA A

361

Volumen I. Matemáticas

362

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

4.1.1. Propiedades de la suma de funciones

Podemos así llegar a una conclusión importante: el conjunto F con las operaciones suma y producto por un escalar definidas con anterioridad es un espacio vectorial sobre el cuerpo de los números reales. Para cualesquiera funciones f y g pertenecientes a F, se cumplen las siguientes propiedades:

Compatibilidad entre la igualdad de funciones y la multiplicación de un escalar por una función. Si f = f' y k Î R, entonces k · f = k · f'. La demostración es trivial basándonos en las definiciones de igualdad, multiplicación de una función por un escalar y en las propiedades de las operaciones de los números reales. 1.

Asociativa: (f + g) + h = f + (g + h).

2.

Conmutativa: f + g = g + f.

3.

Elemento neutro. Para toda función f que pertenezca a F existe una función que llamaremos 0 (cero y que definiremos 0(x) = 0 para todo x de D), tal que f + 0 = 0 + f = f.

5.

Todas estas propiedades se demuestran fácilmente basándonos en las propiedades de las operaciones en el conjunto de los números reales. 4.

Elemento simétrico. Para toda función f de F existe una función que llamaremos opuesta de f y que denotaremos por –f, tal que f + (–f) = (–f) + f = 0. Dicha función quedará definida por (–f)(x) = –f(x). La demostración de estas propiedades es bastante sencilla basándonos en las propiedades análogas que tiene la suma de números reales. Compatibilidad entre la definición de igualdad y la suma de funciones. Si f = f' y g = g', entonces f + g = f' + g'. En efecto, si f = f', se verifica que f(x) = f'(x) y si g = g', también se verifica que g(x) = g'(x) para todo valor de x. Al ser f(x), g(x), f'(x) y g'(x) números reales, verifican en R dicha compatibilidad entre la igualdad y la adición, por lo que

Potencia del elemento neutro: 1 · f = f · 1 = f, siendo 1 el elemento neutro de la multiplicación en el conjunto de los números reales.

4.

Asociatividad mixta: (k · k') · f = k · (k' · f).

3.

Distributividad respecto a la suma de escalares: (k + k') · f = k · f + k' · f.

2.

Distributividad respecto a la suma de funciones: k · (f + g) = k · f + k · g.

1.

5.

Para cualesquiera funciones f y g pertenecientes a F, y cualesquiera k y k' pertenecientes al conjunto de los números reales se cumplen las siguientes propiedades:

4.2.1. Propiedades del producto de una función por un escalar f(x) + g(x) = f'(x) + g'(x)

por lo que basándonos en la definición de la función suma, tenemos que f + g = f' + g'. Con todas las propiedades anteriores respecto de la suma podemos afirmar que el conjunto F con la operación suma tiene estructura de grupo abeliano.

Esta definición cumple la propiedad uniforme que dice que para cualquier función f que pertenezca a F y para cualquier número real k, el producto de k por f también pertenece a F y además es único. p(x) = (k · f)(x) = k · f(x) "x Î D Dada una función f perteneciente a F y cualquier número k perteneciente a R, definimos el producto de una función por un escalar y la denotamos como p = k · f a la función

4.2. Producto de una función por un escalar

Dada una función f perteneciente a F y cualquier número k perteneciente a R, definimos el producto de una función por un escalar y la denotamos como p = k · f a la función

4.2. Producto de una función por un escalar

p(x) = (k · f)(x) = k · f(x) "x Î D Esta definición cumple la propiedad uniforme que dice que para cualquier función f que pertenezca a F y para cualquier número real k, el producto de k por f también pertenece a F y además es único.

Con todas las propiedades anteriores respecto de la suma podemos afirmar que el conjunto F con la operación suma tiene estructura de grupo abeliano. por lo que basándonos en la definición de la función suma, tenemos que f + g = f' + g'. f(x) + g(x) = f'(x) + g'(x)

4.2.1. Propiedades del producto de una función por un escalar Elemento simétrico. Para toda función f de F existe una función que llamaremos opuesta de f y que denotaremos por –f, tal que f + (–f) = (–f) + f = 0. Dicha función quedará definida por (–f)(x) = –f(x). La demostración de estas propiedades es bastante sencilla basándonos en las propiedades análogas que tiene la suma de números reales. Compatibilidad entre la definición de igualdad y la suma de funciones. Si f = f' y g = g', entonces f + g = f' + g'. En efecto, si f = f', se verifica que f(x) = f'(x) y si g = g', también se verifica que g(x) = g'(x) para todo valor de x. Al ser f(x), g(x), f'(x) y g'(x) números reales, verifican en R dicha compatibilidad entre la igualdad y la adición, por lo que

5.

Elemento neutro. Para toda función f que pertenezca a F existe una función que llamaremos 0 (cero y que definiremos 0(x) = 0 para todo x de D), tal que f + 0 = 0 + f = f.

3.

Conmutativa: f + g = g + f.

2.

Asociativa: (f + g) + h = f + (g + h).

1.

Para cualesquiera funciones f y g pertenecientes a F, y cualesquiera k y k' pertenecientes al conjunto de los números reales se cumplen las siguientes propiedades: 1.

Distributividad respecto a la suma de funciones: k · (f + g) = k · f + k · g.

2.

Distributividad respecto a la suma de escalares: (k + k') · f = k · f + k' · f.

3.

Asociatividad mixta: (k · k') · f = k · (k' · f).

4.

Potencia del elemento neutro: 1 · f = f · 1 = f, siendo 1 el elemento neutro de la multiplicación en el conjunto de los números reales. 4.

Todas estas propiedades se demuestran fácilmente basándonos en las propiedades de las operaciones en el conjunto de los números reales.

5.

Compatibilidad entre la igualdad de funciones y la multiplicación de un escalar por una función. Si f = f' y k Î R, entonces k · f = k · f'. La demostración es trivial basándonos en las definiciones de igualdad, multiplicación de una función por un escalar y en las propiedades de las operaciones de los números reales. Para cualesquiera funciones f y g pertenecientes a F, se cumplen las siguientes propiedades:

Podemos así llegar a una conclusión importante: el conjunto F con las operaciones suma y producto por un escalar definidas con anterioridad es un espacio vectorial sobre el cuerpo de los números reales.

4.1.1. Propiedades de la suma de funciones

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

362

Funciones reales de variable real

4.3. Producto de funciones Dadas dos funciones f y g de F, llamamos función producto y la denotamos por P = f · g a la función que cumple P(x) = (f · g)(x) = f(x) · g(x) "x Î D Esta definición cumple la propiedad uniforme que dice que para cualesquiera funciones f y g que pertenezcan a F, su producto también pertenece a F y además es único.

Propiedades del producto de funciones Para cualesquiera funciones f, g y h pertenecientes a F se cumplen las siguientes propiedades: Asociativa: (f · g) · h = f · (g · h). Conmutativa: f · g = g · f. Elemento neutro: 1 · f = f · 1 = f. La función 1 estará definida como 1(x) = 1 para todo x perteneciente a D. 4. Distributiva respecto a la suma: f · (g + h) = f · g + f · h La demostración de estas propiedades se hace basándonos en las propiedades de la suma y producto de números reales. Con estas propiedades el conjunto F con la operación producto tiene estructura de un anillo conmutativo con elemento unidad. Así, F con las operaciones de suma, multiplicación y multiplicación por un escalar tiene estructura de un R-álgebra conmutativa con elemento unidad. Con la operación producto no todas las funciones son inversibles. Dada una función f perteneciente a F se puede definir su inversa respecto al producto como g, cumpliéndose que f · g = g · f = 1, es decir, a la función que cumpla (f · g)(x) = f(x) · g(x) = 1 "x Î E 1 , por lo que no puede existir ningún valor del dominio donde la funAsí, esta función será g(x) = f(x) ción f se anule. (Esta es la condición que debe cumplir una función para tener inversa respecto a la operación producto de funciones).

1. 2. 3.

5. CAMPO DE EXISTENCIA DE UNA FUNCIÓN Aunque ya hemos definido Dom(f) pasamos ahora a profundizar en dicho concepto.

5.1. Función definida en un punto Sea f(x) una función real de variable real, se dice que f(x) está definida en el punto x = a cuando existe f(a). E1 valor f(a), cuando existe, se obtiene sustituyendo x por a en la expresión de la ley de f(x). Desde un punto de vista conjuntista, f está definida en x = a, cuando para x = a existe imagen. Gráficamente si el punto representativo del par (a,f(a)) pertenece al grafo.

5.2. Función definida en un intervalo Una función f(x) real de variable real está definida en un intervalo I cuando está definida en todos y cada uno de sus puntos. Puede ocurrir que una función esté definida en todo R.

5.3. Campo de existencia Se dice campo de existencia, o campo de definición de una función real de variable real f(x), al conjunto de todos los números (puntos) para los que está definida dicha función. Puede ser todo R (en caso de funciones suprayectivas) o parte de R. TEMARIO DE MATEMÁTICAS. PRUEBA A

363

Volumen I. Matemáticas

364

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Cuando el extremo superior de la variable x pertenece al campo de existencia decimos que es accesible, llamando máximo al extremo superior accesible. En caso contrario se dice inaccesible.

5.4. Campo de existencia de la función suma

Sean f(x) y g(x) dos funciones reales de variable real, se considera la función suma: s(x) = f(x) + g(x). Dicha función está definida en aquellos puntos x en los que esté definida para la f(x) y para la g(x) , ya que la suma de funciones, supone, para cada valor x, la suma de dos números reales f(x) y g(x) que por la propiedad uniforme sólo es posible cuando existan ambos números. Desde un punto de vista conjuntista, el campo de existencia de la función suma es la intersección de los campos de existencia de cada función. Son, pues, los puntos comunes.

5.6.5. Máximo

Nótese que las palabras extremo superior tienen el significado de elemento supremo en un conjunto parcialmente ordenado. Dado M' < M, $x > M.

2.

"x, x £ M.

1.

Una variable acotada superiormente puede carecer de valor máximo. Se define como extremo superior M de una variable acotada superiormente al menor de los números no superados por ella, es decir:

Sea f(x) una función real de variable real con campo de existencia D, se considera un número real k de R. Se determina la función producto de k por f como:

5.6.4. Extremo superior

p(x) = (k · f)(x) = k · f(x)

Dicha función está definida en todos los puntos en los que lo esté la función f(x), ya que la multiplicación de un número real k por una función f(x) supone, para cada valor x, el producto de dos números reales k, y f(x), que por la propiedad uniforme es posible cuando existan ambos números.

Se dice que la variable real x está acotada cuando está acotada superior e inferiormente, es decir, "x Î D, existen k y K tal que x £ K y x ³ k. A K y k se les llama cotas superior e inferior, respectivamente.

5.6.3. Variable acotada 5.6. Importancia del campo Se dice que la variable real x está acotada inferiormente si sus valores superan o igualan a un número fijo k, es decir: "x Î D, x ³ k. Al número fijo k se le llama cota inferior.

Las consideraciones siguientes nos muestran la importancia que tiene, en el estudio de las funciones reales de variable real, el campo de existencia de las mismas, lo que justifica estudiar el comportamiento de una variable real x.

5.6.2. Función con variable acotada inferiormente

5.6.1. Función con variable acotada superiormente

Se dice que la variable real x está acotada superiormente si sus valores no superan a un número fijo K, es decir: "x Î D, x £ K. Al número fijo K se le llama cota superior.

Se dice que la variable real x está acotada superiormente si sus valores no superan a un número fijo K, es decir: "x Î D, x £ K. Al número fijo K se le llama cota superior.

5.6.1. Función con variable acotada superiormente

5.6.2. Función con variable acotada inferiormente

Las consideraciones siguientes nos muestran la importancia que tiene, en el estudio de las funciones reales de variable real, el campo de existencia de las mismas, lo que justifica estudiar el comportamiento de una variable real x.

Se dice que la variable real x está acotada inferiormente si sus valores superan o igualan a un número fijo k, es decir: "x Î D, x ³ k. Al número fijo k se le llama cota inferior.

5.6. Importancia del campo 5.6.3. Variable acotada Dicha función está definida en todos los puntos en los que lo esté la función f(x), ya que la multiplicación de un número real k por una función f(x) supone, para cada valor x, el producto de dos números reales k, y f(x), que por la propiedad uniforme es posible cuando existan ambos números.

Se dice que la variable real x está acotada cuando está acotada superior e inferiormente, es decir, "x Î D, existen k y K tal que x £ K y x ³ k. A K y k se les llama cotas superior e inferior, respectivamente. p(x) = (k · f)(x) = k · f(x)

5.6.4. Extremo superior

Sea f(x) una función real de variable real con campo de existencia D, se considera un número real k de R. Se determina la función producto de k por f como:

Una variable acotada superiormente puede carecer de valor máximo. Se define como extremo superior M de una variable acotada superiormente al menor de los números no superados por ella, es decir:

5.5. Campo de existencia de la función producto de un número por una función "x, x £ M.

2.

Dado M' < M, $x > M.

Sean f(x) y g(x) dos funciones reales de variable real, se considera la función suma: s(x) = f(x) + g(x). Dicha función está definida en aquellos puntos x en los que esté definida para la f(x) y para la g(x) , ya que la suma de funciones, supone, para cada valor x, la suma de dos números reales f(x) y g(x) que por la propiedad uniforme sólo es posible cuando existan ambos números. Desde un punto de vista conjuntista, el campo de existencia de la función suma es la intersección de los campos de existencia de cada función. Son, pues, los puntos comunes.

Nótese que las palabras extremo superior tienen el significado de elemento supremo en un conjunto parcialmente ordenado.

5.6.5. Máximo

Cuando el extremo superior de la variable x pertenece al campo de existencia decimos que es accesible, llamando máximo al extremo superior accesible. En caso contrario se dice inaccesible.

5.4. Campo de existencia de la función suma

364

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

'

1.

'

5.5. Campo de existencia de la función producto de un número por una función

Funciones reales de variable real

5.6.6. Extremo inferior Análogamente, se define como extremo inferior m de una variable x acotada inferiormente al mayor de los números que no superan a ningún valor de x. Nótese que las palabras extremo inferior tiene, el significado de elemento ínfimo en un conjunto parcialmente ordenado.

5.6.7. Mínimo Cuando el extremo inferior de la variable x pertenece al campo de existencia decimos que es accesible, llamando mínimo al extremo inferior. En caso contrario se dice inaccesible.

6. OTRAS PROPIEDADES DE LAS FUNCIONES REALES DE VARIABLE REAL 6.1. Función par Una función real de variable real y = f(x) es par si y solo si a valores opuestos de x les corresponde el mismo valor de la y, es decir, f(–x) = f(x). La gráfica de una función par es simétrica respecto al eje de ordenadas, ya que si contiene al punto (x, y), también contiene al (–x, y).

6.2. Función impar Una función real de variable real y = f(x) es impar si y solo si a valores opuestos de x les corresponde valores opuestos de la y, es decir, f(–x) = –f(x). La gráfica de una función par es simétrica respecto al origen de coordenadas, ya que si contiene al punto (x, y), también contiene al (–x, –y). En el caso de los polinomios la función será par si sólo contiene términos de grado par, y será impar si sólo los contiene de grado impar. No será par ni impar si contiene de ambos grados.

6.3. Función inyectiva Una función real de variable real y = f(x) es inyectiva si y solo si a valores iguales de la variable independiente le corresponden valores iguales de la variable dependiente, es decir, x = x' Û f(x) = f(x')

"x,x' Î D

6.4. Función suprayectiva Una función real de variable real y = f(x) es suprayectiva si y solo si para cualquier elemento y de R existe algún elemento x del dominio tal que su imagen es y, es decir, "y Î R,

$x Î D, tal que f(x) = y

6.5. Función biyectiva Una función real de variable real y = f(x) es biyectiva si es a la vez inyectiva y suprayectiva.

6.6. Función periódica Una función real de variable real y = f(x) es periódica si existe un número real no nulo t, tal que para cualquier valor x perteneciente al dominio se verifica que f(x + t) = f(x). De la propia definición se deduce que todo múltiplo n · t de un periodo es también un periodo. Un teorema de fácil demostración dice que si f(x) es una función periódica que no se reduce a una constante, sus periodos son múltiplos enteros del menor periodo positivo p, y sólo ellos. TEMARIO DE MATEMÁTICAS. PRUEBA A

365

Volumen I. Matemáticas

366 2

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA A ese número K lo llamamos cota superior. La menor de las cotas superiores será extremo superior y si la función toma ese valor será un máximo. A ese número K lo llamamos cota inferior. La mayor de las cotas inferiores será extremo inferior y si la función toma ese valor será un mínimo.

6.7. Función creciente

Una función real de variable real y = f(x) es creciente si para todo par de valores de la variable independiente x1 < x2 se verifica que f(x1) £ f(x2). En el caso de que sólo se verifique la desigualdad se dice que la función es estrictamente creciente. 1

x®y

6.8. Función decreciente

p

R ® R ®R x®u®y

Una función real de variable real y = f(x) es decreciente si para todo par de valores de la variable independiente x1 < x2, se verifica que f(x2) £ f(x1). En el caso de que sólo se verifique la desigualdad se dice que la función es estrictamente decreciente.

y se la acostumbra a simbolizar p = (g ° f) Este concepto coincide con el clásico de función de función. Efectivamente, en virtud de la generalización de símbolos, podemos considerar las funciones dadas: u = f(x), y = g(u), con lo que tendríamos el siguiente diagrama: g f

6.9. Función acotada superiormente

Una función real de variable real y = f(x) está acotada superiormente si existe un número real K, tal que f(x) £ K para todo valor x perteneciente al dominio D1. que se obtiene aplicando primero la función f y posteriormente la función g: p(x) = g(f(x)) R®R p

6.10 Función acotada inferiormente

Sean las funciones reales de variable real: y = f(x), e y = g(x). Se define como función compuesta o función producto o función de función a una función real de variable real p:

Una función real de variable real y = f(x) está acotada superiormente si existe un número real k, tal que f(x) £ k para todo valor x perteneciente al dominio D2.

7.1. Función compuesta o función de función 6.11. Función acotada

7. COMPOSICIÓN DE FUNCIONES

Una función real de variable real y = f(x) está acotada si lo está superior e inferiormente. Una función real de variable real y = f(x) está acotada si lo está superior e inferiormente.

7. COMPOSICIÓN DE FUNCIONES

6.11. Función acotada

7.1. Función compuesta o función de función Una función real de variable real y = f(x) está acotada superiormente si existe un número real k, tal que f(x) £ k para todo valor x perteneciente al dominio D2.

Sean las funciones reales de variable real: y = f(x), e y = g(x). Se define como función compuesta o función producto o función de función a una función real de variable real p:

6.10 Función acotada inferiormente

p

R®R

que se obtiene aplicando primero la función f y posteriormente la función g: p(x) = g(f(x))

Una función real de variable real y = f(x) está acotada superiormente si existe un número real K, tal que f(x) £ K para todo valor x perteneciente al dominio D1. y se la acostumbra a simbolizar

p = (g ° f) Este concepto coincide con el clásico de función de función. Efectivamente, en virtud de la generalización de símbolos, podemos considerar las funciones dadas: u = f(x), y = g(u), con lo que tendríamos el siguiente diagrama: g f R ® R ®R x®u®y

6.9. Función acotada superiormente

Una función real de variable real y = f(x) es decreciente si para todo par de valores de la variable independiente x1 < x2, se verifica que f(x2) £ f(x1). En el caso de que sólo se verifique la desigualdad se dice que la función es estrictamente decreciente.

6.8. Función decreciente

p

x®y

Una función real de variable real y = f(x) es creciente si para todo par de valores de la variable independiente x1 < x2 se verifica que f(x1) £ f(x2). En el caso de que sólo se verifique la desigualdad se dice que la función es estrictamente creciente. 366

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

2

A ese número K lo llamamos cota superior. La menor de las cotas superiores será extremo superior y si la función toma ese valor será un máximo. A ese número K lo llamamos cota inferior. La mayor de las cotas inferiores será extremo inferior y si la función toma ese valor será un mínimo.

6.7. Función creciente

1

Funciones reales de variable real Para que esta función tenga sentido es necesario que los valores f(x) pertenezcan al dominio de la función g(x). Se puede comprobar fácilmente que la composición de funciones posee la propiedad asociativa pero no la conmutativa, ya que es posible que al conmutar la composición las funciones resultantes ni siquiera tengan el mismo dominio.

7.2. Función identidad Se llama función identidad a la correspondencia de los reales en los reales definida por i(x) = x tal que a todo elemento le asocia el mismo. Su dominio y recorrido es toda la recta real y su representación gráfica coincide con la bisectriz del primer y tercer cuadrante. La composición de la función identidad consigo misma nos da la propia función identidad, y la composición con cualquier función nos da dicha función, es decir, i ° i = i y i ° f = f.

7.3. Función inversa Dada una función real de variable real f que sea inyectiva, se puede definir la función f–1 tal que (f ° f)(x) = (f ° f–1)(x) = i(x) = x Para que exista la función inversa es necesario que la misma esté definida en el recorrido de la original. Si representamos las gráficas de dos funciones inversas entre sí, podemos observar que son simétricas respecto a la bisectriz del primer cuadrante. Por ejemplo, si f(x) = x2, su dominio es toda la recta real; es una función inyectiva y su recorrido es el conjunto de los números reales positivos. Su función inversa será f–1 que cumpla (f–1 ° f)(x) = x, de donde –1

(f–1 ° f)(x) = f–1(f(x)) = f–1(x2) = x por lo que vemos f–1(x) = x Si representamos ambas funciones observaremos que son simétricas respecto de la recta y = x (bisectriz del primer cuadrante).

8. FUNCIONES ELEMENTALES Las funciones elementales se clasifican según el siguiente cuadro en: ì ì ìEnteras ïRacionalesí ï îFraccionarias ïAlgebraicasí ï ï îIrracionales ï ìExponenciales FUNCIONES ELEMENTALES í ï ï ïLogarítmicas ï Trascendentesí ï ïTrigonométricas ï ï îHiperbólicas î Aquí estudiaremos las funciones elementales algebraicas.

8.1. La proporcionalidad como función: la función lineal Nos referimos en este apartado a la proporcionalidad en cuanto a un modelo de función. Nuestro objetivo es precisar qué significado tiene la frase una cierta magnitud es directamente proporcional a otra, es decir, qué características tiene una función que admita esta expresión, en cada uno de los lenguajes en que pueda expresarse. TEMARIO DE MATEMÁTICAS. PRUEBA A

367

Volumen I. Matemáticas

368

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Para K = 0: la recta coincide con el eje de abcisas. Cuando K aumenta, la inclinación de la recta respecto a la horizontal hace lo propio.

Tomemos un par de situaciones funcionales: altura de un árbol y longitud de la sombra, por un lado, y por otro el precio de un determinado número de fotocopias de un mismo ejemplar. x Altura de un árbol (m) y Longitud sombra (m)

1 1,5

2 3

4 6

5 7,5

9 13,5

12 18

Para K < 0: la recta pasa por el segundo y cuarto cuadrante. Para K > 0: la recta pasa por el primer y tercer cuadrante.

x Número de copias y Precio en pesetas

1 5,5

5 27,5

10 50

25 125

50 240

– – –

100 450

La constante de proporcionalidad K es la tangente del ángulo que forma la recta con el eje horizontal y recibe el nombre de pendiente de la recta. Recíprocamente, cada una de las rectas que pasan por el origen, a excepción del eje de ordenadas, es una función lineal que tiene un determinado ángulo de inclinación al que podemos hacer corresponder un número real, la tangente de este ángulo. Se observa que: Las dos propiedades que caracterizan a la llamada función lineal son: f(k · x) = k · f(x)

f(x1 + x2) = f(x1) + f(x2)

El primer ejemplo es un caso de función de proporcionalidad, en los que se observa además que si (x1,y1), (x2,y2) ... (xn,yn) son n pares de valores correspondientes de una función de proporcionalidad, se tiene: Figura 5.

y y y 1 = 2 = ...= n = K x1 x2 xn K=1/2

(constante de proporcionalidad)

o dicho de otro modo, que yi = K · xi. Esta última propiedad es la que no sólo caracteriza a la función de proporcionalidad, sino que, además, nos da su auténtico significado. La representación gráfica de la función de proporcionalidad nos permite poner de manifiesto otras características: mientras para el primer ejemplo los puntos representados aparecen siempre alineados y están sobre una recta que contiene al origen de coordenadas, para el segundo esto no es así. Podemos, por tanto, afirmar que para las funciones de proporcionalidad si la función es de variable real, su representación cartesiana es una recta que pasa por el origen. Si y = K · x representa la forma analítica de una función de proporcionalidad, su representación gráfica, para distintos valores de K es: K=2

K=1

o dicho de otro modo, que yi = K · xi. Esta última propiedad es la que no sólo caracteriza a la función de proporcionalidad, sino que, además, nos da su auténtico significado. La representación gráfica de la función de proporcionalidad nos permite poner de manifiesto otras características: mientras para el primer ejemplo los puntos representados aparecen siempre alineados y están sobre una recta que contiene al origen de coordenadas, para el segundo esto no es así. Podemos, por tanto, afirmar que para las funciones de proporcionalidad si la función es de variable real, su representación cartesiana es una recta que pasa por el origen. Si y = K · x representa la forma analítica de una función de proporcionalidad, su representación gráfica, para distintos valores de K es: K=1

K=2

y1 y 2 y = = ...= n = K x1 x2 xn K=1/2

(constante de proporcionalidad)

El primer ejemplo es un caso de función de proporcionalidad, en los que se observa además que si (x1,y1), (x2,y2) ... (xn,yn) son n pares de valores correspondientes de una función de proporcionalidad, se tiene: Figura 5.

La constante de proporcionalidad K es la tangente del ángulo que forma la recta con el eje horizontal y recibe el nombre de pendiente de la recta. Recíprocamente, cada una de las rectas que pasan por el origen, a excepción del eje de ordenadas, es una función lineal que tiene un determinado ángulo de inclinación al que podemos hacer corresponder un número real, la tangente de este ángulo. Se observa que: f(x1 + x2) = f(x1) + f(x2) f(k · x) = k · f(x)

Las dos propiedades que caracterizan a la llamada función lineal son: 1 1,5

2 3

4 6

x Número de copias y Precio en pesetas

1 5,5

5 27,5

10 50

25 125

50 240

100 450

Para K > 0: la recta pasa por el primer y tercer cuadrante. 5 7,5

9 13,5

12 18

– –

x Altura de un árbol (m) y Longitud sombra (m)

Para K < 0: la recta pasa por el segundo y cuarto cuadrante.

– Para K = 0: la recta coincide con el eje de abcisas. Cuando K aumenta, la inclinación de la recta respecto a la horizontal hace lo propio.

Tomemos un par de situaciones funcionales: altura de un árbol y longitud de la sombra, por un lado, y por otro el precio de un determinado número de fotocopias de un mismo ejemplar. 368

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones reales de variable real Las rectas de pendientes K y 1/K resultan simétricas respecto de la bisectriz y = x (K = 1). Como resumen podemos decir que el modelo dado por la función lineal o función de proporcionalidad directa queda caracterizado, ya sea por las propiedades f(K · x) = K · f(x) f(x1 + x2) = f(x1) + f(x2) ya sea por su expresión algebraica y = K · x o por su gráfica cartesiana, una recta que pasa por el origen de coordenadas. Por ello, podemos decir que toda recta que pasa por el origen (a excepción del eje de ordenadas) es la gráfica de una función lineal.

8.2. La recta como gráfica de una función: la función afín La función lineal tiene como representación gráfica una recta por el origen, como acabamos de ver. E1 paso siguiente, que nos lleva a un nuevo modelo, la función afín, que incluye al anterior, consiste en plantearse a qué situaciones corresponde, qué propiedades verifica y cómo se expresa con los otros lenguajes una función cuya gráfica es una recta cualquiera, excluyendo el caso particular de las rectas paralelas al eje de ordenadas, es decir, las de ecuación x = k. Para empezar, fijémonos en una recta como la siguiente: Y

y=2x+1

O

X

Figura 6. Si determinamos una tabla de valores correspondientes a dicha recta: x –2 –1 0 1 y –3 –1 1 3

2 5

se observa que, a diferencia del caso anterior, no podemos hablar de un cociente constante entre pares de valores correspondientes, pero sí de algo parecido, pues existe una relación constante entre los incrementos de las variables, de forma que cuando x aumenta (o disminuye) una unidad, y aumenta (o disminuye) dos unidades. Análogamente, si x aumenta en dos unidades y lo hace en cuatro, etc, de manera que los incrementos se comportan como si se tratara de una función lineal. Podríamos volver a escribir la tabla de la siguiente forma: x

–2

–1

0

1

2

y –4 + 1 –2 + 1 0+1 2+1 4+1 lo que nos permite observar que nuestra función tiene todos los valores de una variable dependiente (y) aumentados en una unidad con respecto a una función de proporcionalidad de constante dos. Gráficamente podemos hablar de una recta asociada a nuestra recta inicial, que tiene la misma pendiente, pero que a diferencia de esta no pasa por el origen de coordenadas. Esta constante aditiva que diferencia la ecuación de una recta cualquiera de la ecuación de una recta que pasa por el origen, o que nos permite considerar esta última como un caso particular de aquella en el que la constante es cero, coincide con el valor de la variable dependiente cuando x vale cero, es decir, corresponde gráficamente al valor de y en el punto de corte de la recta al eje de las ordenadas, por lo que recibe el nombre de ordenada en el origen. Así, con la ayuda de la tabla anterior, es posible determinar la ecuación de la recta inicial que será y = 2x + 1. TEMARIO DE MATEMÁTICAS. PRUEBA A

369

Volumen I. Matemáticas

370

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Figura 7.

En general, a una recta cualquiera le corresponderá una ecuación de la forma y = k · x + b, donde el parámetro k es la pendiente de la recta y b la ordenada en el origen, parámetro que, como ya hemos indicado, representa el desplazamiento o traslación en sentido vertical de la recta asociada, y = k · x, que pasa por el origen de coordenadas y tiene la misma pendiente. Recíprocamente, dado que toda ecuación de primer grado es reducible a una ecuación del tipo y = k · x + b, su gráfica será siempre una recta. Como en el caso de las funciones lineales, existen numerosas situaciones del mundo real cuyo comportamiento corresponde al modelo de la función afín, es decir, magnitudes que mantienen una relación proporcional pero con un valor constante añadido. Sirvan como ejemplo de dichas situaciones los siguientes problemas: a)

Las últimas lecturas de un contador de teléfono fueron: 12532 pasos (1 de abril), 12741 pasos (1 de mayo) y 13017 pasos (1 de junio). El importe de las facturas pagadas fue de 1922 ptas. para el mes de abril y 2458 ptas. para el mes de mayo. Sabiendo que pagamos una cantidad al mes en concepto de alquiler del aparato y una cantidad por cada paso, determina dichas cantidades y estudia la función que da el coste mensual del teléfono según el número de pasos consumidos, representándola gráficamente.

b)

El coste de impresión de un determinado folleto depende del número de ejemplares, de acuerdo con la siguiente tabla: n (número de ejemplares) 100 200 300 500 C (coste en pesetas) 900 1300 1700 2500

Su representación viene en la figura 7.

ì x si x £ 0 | x|= í î – x si x> 0

Existen funciones que son mezcla de funciones lineales, constantes y afines. Son las funciones definidas a trozos. Por ejemplo, la función valor absoluto de x se definirá de la siguiente manera:

– –

Calcula el coste de impresión de l000 y 5000 ejemplares.

– – –

¿Qué interpretación tienen en este problema la pendiente de la recta y la ordenada en el origen?

Determina la ecuación de la función f: n ® C que nos permita conocer el coste de un número cualquiera de ejemplares y represéntala gráficamente en unos ejes cartesianos.

8.3. Otras funciones lineales

Halla la ecuación y representa esta nueva función que nos permite conocer, dado el número de ejemplares, el coste medio por ejemplar.

¿Cuál es el coste medio por ejemplar si se editan l00, 200 ó 1000? ¿Y si se editan n ejemplares?

– – –

Halla la ecuación y representa esta nueva función que nos permite conocer, dado el número de ejemplares, el coste medio por ejemplar.

– –

¿Cuál es el coste medio por ejemplar si se editan l00, 200 ó 1000? ¿Y si se editan n ejemplares? ¿Qué interpretación tienen en este problema la pendiente de la recta y la ordenada en el origen? Determina la ecuación de la función f: n ® C que nos permita conocer el coste de un número cualquiera de ejemplares y represéntala gráficamente en unos ejes cartesianos.

8.3. Otras funciones lineales

Existen funciones que son mezcla de funciones lineales, constantes y afines. Son las funciones definidas a trozos. Por ejemplo, la función valor absoluto de x se definirá de la siguiente manera: Calcula el coste de impresión de l000 y 5000 ejemplares.

El coste de impresión de un determinado folleto depende del número de ejemplares, de acuerdo con la siguiente tabla: n (número de ejemplares) 100 200 300 500 C (coste en pesetas) 900 1300 1700 2500

b)

Las últimas lecturas de un contador de teléfono fueron: 12532 pasos (1 de abril), 12741 pasos (1 de mayo) y 13017 pasos (1 de junio). El importe de las facturas pagadas fue de 1922 ptas. para el mes de abril y 2458 ptas. para el mes de mayo. Sabiendo que pagamos una cantidad al mes en concepto de alquiler del aparato y una cantidad por cada paso, determina dichas cantidades y estudia la función que da el coste mensual del teléfono según el número de pasos consumidos, representándola gráficamente.

a)

ì x si x £ 0 | x|= í î – x si x> 0

Su representación viene en la figura 7.

En general, a una recta cualquiera le corresponderá una ecuación de la forma y = k · x + b, donde el parámetro k es la pendiente de la recta y b la ordenada en el origen, parámetro que, como ya hemos indicado, representa el desplazamiento o traslación en sentido vertical de la recta asociada, y = k · x, que pasa por el origen de coordenadas y tiene la misma pendiente. Recíprocamente, dado que toda ecuación de primer grado es reducible a una ecuación del tipo y = k · x + b, su gráfica será siempre una recta. Como en el caso de las funciones lineales, existen numerosas situaciones del mundo real cuyo comportamiento corresponde al modelo de la función afín, es decir, magnitudes que mantienen una relación proporcional pero con un valor constante añadido. Sirvan como ejemplo de dichas situaciones los siguientes problemas: Figura 7.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

370

Funciones reales de variable real La función parte entera de x es otra función que va definida a trozos, ya que para cada valor nos da solamente su valor truncado a un número entero (es el mayor número entero menor o igual que x). Es una función constante a trozos, ya que cambia alrededor de cada número entero. Se llama función escalonada. Otro ejemplo de función escalonada es la que nos da las tarifas de correos en función del peso de los paquetes que vamos a mandar, o el coste de una llamada telefónica en función del tiempo cuando la tarifa sea por pasos.

8.4. La función de proporcionalidad inversa y la función cuadrática Tanto el modelo lineal como el afín tienen como característica diferencial el hecho que la variación de la función es constante, lo cual, como acabamos de ver, equivale a una gráfica cuyos puntos están alineados. Cuando el crecimiento de la función no es constante, la gráfica correspondiente es una curva del plano. En este apartado vamos a estudiar las características de algunos de estos modelos, los más elementales, como la función de proporcionalidad inversa y la función cuadrática. a)

Las funciones de proporcionalidad inversa. E1 trabajo con un determinado modelo debe contemplar siempre la comparación con otros, ya que uno de los objetivos es determinar si una situación corresponde o no al modelo estudiado. Así, dentro del estudio de las funciones lineales deben aparecer situaciones que no lo sean, especialmente aquellas que en principio y antes de una pequeña reflexión pueden parecerlo. Este es el caso de las llamadas funciones de proporcionalidad inversa. Muchas veces, al plantear una cuestión como la siguiente –¿si 10 personas realizan un trabajo en 10 horas, cuánto tiempo tardarán 20 personas en realizar el mismo trabajo?– la respuesta rápida, casi automática, de muchos alumnos ha sido decir que tardarán 20 horas. Una pequeña pero necesaria reflexión nos llevará a ver que no se trata de una situación de proporcionalidad directa, puesto que cuando la primera variable aumenta (se dobla o se multiplica por n), la segunda disminuye (se divide por dos o por n). Podemos hacer una tabla de valores de las dos variables. Número de personas

10

20

5

2

1

25

50

Número de horas

10

5

20

50

100

4

2

El análisis de los valores de la tabla nos permite inducir el modelo que corresponde a esta situación: llamando x al número de personas e y al tiempo en horas, siempre se cumple que x · y = 100. En general, una función de proporcionalidad inversa es aquella cuya expresión algebraica es del tipo x · y = k o bien y = k/x. La representación gráfica corresponde a una curva llamada hipérbola equilátera, curva simétrica respecto a la bisectriz del primer y tercer cuadrante si k es positivo y del segundo y 2 cuarto si k es negativo. En la figura 8, representamos x · y = 2, o lo que es lo mismo, y = x

Figura 8. Hay ejemplos de funciones de proporcionalidad inversa, como el precio que debe pagar cada chico de un determinado grupo para comprar un balón en función del número de personas del grupo, o el valor de los lados de un rectángulo de área dada. Existen, sin duda, muchas otras situaciones que responden TEMARIO DE MATEMÁTICAS. PRUEBA A

371

Volumen I. Matemáticas

372

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Así, a partir de una ecuación del tipo y = ax2 podemos obtener cualquier parábola por lo que a su forma se refiere. Cualquier otra parábola, cuyo eje de simetría sea paralelo al eje de ordenadas, podrá obtenerse por traslación de una parábola cuyo vértice sea el origen de coordenadas. En efecto, veamos cómo la introducción de otros parámetros en la ecuación anterior nos da parábolas cuyo vértice no se encuentra ya en el origen de coordenadas. Consideremos en primer lugar ecuaciones del tipo y = x2 + c y representemos, por ejemplo, las funciones y = x2 + 2, y = x2 + 5/2, y = x2 – 1, y = x2 – 4. Todas estas parábolas tienen la misma abertura y el mismo eje de simetría

al mismo modelo de función, por ejemplo, del campo de la física, como la ley de la palanca (el valor de la fuerza por longitud del brazo es constante), la ley de Boyle–Mariotte (a una cierta temperatura, la presión por el volumen es constante) o el estudio de situaciones de proporcionalidad directa en las que tomamos una de las variables como constante y la constante como variable (relación espacio/velocidad para un tiempo dado, o tiempo/velocidad para un espacio dado). Antes de acabar este punto es necesario resaltar que el término proporcional aplicado a dos magnitudes que dependen una de otra se usa en un sentido más amplio que para designar una función de proporcionalidad. Así, decimos que el espacio recorrido por un cuerpo al caer es directamente proporcional al cuadrado del tiempo, o que la fuerza de atracción de dos cuerpos es inversamente proporcional al cuadrado de la distancia. En ambos casos se entiende que, tomando en lugar de las variables tiempo y distancia sus cuadrados, la relación entre las nuevas magnitudes es de proporcionalidad, directa en el primer caso e inversa en el segundo, cuando en realidad se trata de las funciones cuyas ecuaciones son del tipo e = k · t2 y F = k/d2 respectivamente. Figura 9.

a=–2

b)

Las funciones cuadráticas. Hemos visto que a las funciones cuya gráfica es una recta les corresponde una expresión algebraica que es una ecuación de primer grado y recíprocamente. Siguiendo un proceso análogo, pero partiendo en este caso de la fórmula de la función, vamos a ver que a todas las funciones cuya expresión algebraica es una ecuación cuadrática les corresponde un mismo tipo de curva, que llamamos parábola. Empecemos por la ecuación más simple y = x2. Su gráfica nos da una curva simétrica respecto al eje de ordenadas, por el hecho de que al elevar al cuadrado un determinado valor de x y su opuesto, el resultado es siempre el mismo. Además, los valores que toma la variable dependiente (y) son siempre positivos, a excepción del punto de corte al eje de simetría que es el origen de coordenadas, punto que recibe el nombre de vértice de la parábola. ¿Qué sucede cuando variamos el único parámetro de la anterior ecuación? La construcción de las gráficas para distintos valores del parámetro a de la ecuación y = ax2, por ejemplo, para los casos y = 2x2, y = 3x2, y = 1/2x2, y = 1/3x2, y = –2x2, y = –3x2, nos muestra (figura 9) que, en comparación con la curva inicial, la de la función y = x2, la parábola que se obtiene es más cerrada al aumentar el valor de a, y más abierta cuando éste disminuye, considerando valores de a positivos. Para valores de a negativos se obtiene una parábola con la misma abertura que la de sus correspondiente opuestos, es decir, con la misma plantilla pero invertida, puesto que ahora todos los valores de y son negativos. Se mantienen, no obstante, las dos características iniciales, es decir, todas las parábolas tienen el mismo vértice y el mismo eje de simetría. a=1/2

a=2

a=1

Las funciones cuadráticas. Hemos visto que a las funciones cuya gráfica es una recta les corresponde una expresión algebraica que es una ecuación de primer grado y recíprocamente. Siguiendo un proceso análogo, pero partiendo en este caso de la fórmula de la función, vamos a ver que a todas las funciones cuya expresión algebraica es una ecuación cuadrática les corresponde un mismo tipo de curva, que llamamos parábola. Empecemos por la ecuación más simple y = x2. Su gráfica nos da una curva simétrica respecto al eje de ordenadas, por el hecho de que al elevar al cuadrado un determinado valor de x y su opuesto, el resultado es siempre el mismo. Además, los valores que toma la variable dependiente (y) son siempre positivos, a excepción del punto de corte al eje de simetría que es el origen de coordenadas, punto que recibe el nombre de vértice de la parábola. ¿Qué sucede cuando variamos el único parámetro de la anterior ecuación? La construcción de las gráficas para distintos valores del parámetro a de la ecuación y = ax2, por ejemplo, para los casos y = 2x2, y = 3x2, y = 1/2x2, y = 1/3x2, y = –2x2, y = –3x2, nos muestra (figura 9) que, en comparación con la curva inicial, la de la función y = x2, la parábola que se obtiene es más cerrada al aumentar el valor de a, y más abierta cuando éste disminuye, considerando valores de a positivos. Para valores de a negativos se obtiene una parábola con la misma abertura que la de sus correspondiente opuestos, es decir, con la misma plantilla pero invertida, puesto que ahora todos los valores de y son negativos. Se mantienen, no obstante, las dos características iniciales, es decir, todas las parábolas tienen el mismo vértice y el mismo eje de simetría. a=2

a=1

a=1/2

b)

al mismo modelo de función, por ejemplo, del campo de la física, como la ley de la palanca (el valor de la fuerza por longitud del brazo es constante), la ley de Boyle–Mariotte (a una cierta temperatura, la presión por el volumen es constante) o el estudio de situaciones de proporcionalidad directa en las que tomamos una de las variables como constante y la constante como variable (relación espacio/velocidad para un tiempo dado, o tiempo/velocidad para un espacio dado). Antes de acabar este punto es necesario resaltar que el término proporcional aplicado a dos magnitudes que dependen una de otra se usa en un sentido más amplio que para designar una función de proporcionalidad. Así, decimos que el espacio recorrido por un cuerpo al caer es directamente proporcional al cuadrado del tiempo, o que la fuerza de atracción de dos cuerpos es inversamente proporcional al cuadrado de la distancia. En ambos casos se entiende que, tomando en lugar de las variables tiempo y distancia sus cuadrados, la relación entre las nuevas magnitudes es de proporcionalidad, directa en el primer caso e inversa en el segundo, cuando en realidad se trata de las funciones cuyas ecuaciones son del tipo e = k · t2 y F = k/d2 respectivamente. a=–2

Figura 9.

Así, a partir de una ecuación del tipo y = ax2 podemos obtener cualquier parábola por lo que a su forma se refiere. Cualquier otra parábola, cuyo eje de simetría sea paralelo al eje de ordenadas, podrá obtenerse por traslación de una parábola cuyo vértice sea el origen de coordenadas. En efecto, veamos cómo la introducción de otros parámetros en la ecuación anterior nos da parábolas cuyo vértice no se encuentra ya en el origen de coordenadas. Consideremos en primer lugar ecuaciones del tipo y = x2 + c y representemos, por ejemplo, las funciones y = x2 + 2, y = x2 + 5/2, y = x2 – 1, y = x2 – 4. Todas estas parábolas tienen la misma abertura y el mismo eje de simetría CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

372

Funciones reales de variable real que y = x2, pero el vértice queda desplazado al punto (0,c), con lo cual obtenemos parábolas trasladadas en la dirección del eje de ordenadas.

Figura 10. Representemos ahora ecuaciones del tipo y = (x – p)2, como por ejemplo, y = (x – 2)2, y = (x + 3)2, y = 2 · (x + 3/2)2, y = 2 · (x – 7/4)2. Las gráficas de estas funciones corresponden a parábolas trasladadas en la dirección del eje de las abcisas, cuyo vértice es el punto (p,0). En realidad, lo que hemos hecho con la introducción de estos parámetros no es más que un cambio de variable, puesto que, para el primer caso si escribimos la ecuación y = x2 + c en la forma y – c = x2 y llamamos y' a y – c, la nueva variable no es más que la inicial, restándole el valor de la constante c. Análogamente, las funciones del tipo y = (x – p)2 pueden reducirse a la forma y = x’2 haciendo x = x – p, con lo cual tienen el mismo gráfico que ésta, pero trasladado p unidades en el sentido positivo o negativo (según el valor de p) del eje de las x. El caso general, es decir, una parábola de vértice un punto cualquiera (p, q) puede obtenerse mediante una composición de dos traslaciones del tipo anterior, cada una a lo largo de uno de los ejes de coordenadas. Esta forma de expresar la ecuación de la parábola tiene la ventaja de que cada uno de los parámetros que en ella aparecen tiene un significado gráfico concreto, cosa que no sucede con la expresión general de una función cuadrática y = a · x2 + b · x + c. El problema de la representación gráfica de funciones cuadráticas cualesquiera radica en la determinación del vértice y del eje de simetría. Una vez conocida la coordenada x del vértice basta con tomar valores de la x próximos a aquella, superiores e inferiores, y construir una tabla hallando los correspondientes valores de la variable dependiente. La principal dificultad consiste, por tanto, en expresar una ecuación cuadrática general de la forma y = a · x2 + b · x + c en otra equivalente de la forma y = a · (x – p)2 + q, en la cual, como hemos visto, los parámetros p y q nos dan las coordenadas del vértice. Desarrollando esta última ecuación resulta y = a · x2 – 2 · a · p · x + a · p2 + q, de donde se obtienen las coordenadas del vértice en función de los parámetros a, b y c, que son: b –b 2 + 4 ×a ×c y q= p= – 2a 4a Para trabajar esta parte, que implica conocer el desarrollo de sumas y diferencias al cuadrado en sentido directo e inverso, conviene previamente realizar ejercicios de desarrollo de expresiones como (x + 2)2, (x – 1)2, (x – b)2, (x + 1/2)2 y análogamente, en sentido inverso, transformar en un cuadrado expresiones como: x2 + 4x + 4, x2 – 6x + 9, 9x2 + 30x + 25. Posteriormente, podremos pasar ya a ejercicios del tipo: a) Añade un número a las expresiones x2 + 2x + ... X2 – 3x + ... x2 + 0,4x + ... para formar un cuadrado perfecto. b)

Transforma las siguientes expresiones en forma de cuadrado perfecto, tal como se hace en el ejemplo: y = x2 + 2x + 1 + 3; y = (x + 1)2 + 3 y = x2 + 2x + 4; 2 2 y = x – 1/2x + 3/4 y = x – 3x + 4;

TEMARIO DE MATEMÁTICAS. PRUEBA A

373

Volumen I. Matemáticas

374

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

El método expuesto para representar una función cuadrática resuelve totalmente el problema, dando al mismo tiempo un significado gráfico a los parámetros de la ecuación, pero presenta dificultades de tipo didáctico por las necesarias manipulaciones algebraicas. Existen otras formas para determinar el vértice de la parábola, pero el que hemos expuesto nos parece el más interesante. En cualquier caso, es preciso mostrar que para representar una función cuadrática es necesario, ante todo, determinar su vértice.

8.5. La función polinómica Ya hemos visto la función lineal, la afín, la cuadrática, que son funciones polinómicas de grado 1 y 2. En general, una función polinómica de grado n es de la forma y = a0 + a1 · x + ... + an · xn Una función constante y = b (b ¹ 0) es una función polinómica de grado cero y su representación gráfica es una recta paralela a OX que dista de él b unidades. El estudio sistemático de una función polinómica de grado n nos lleva a calcular las raíces reales de dicho polinomio, que son los puntos de corte con el eje OX. Nos podemos encontrar los siguientes casos:



Si n es impar, al menos hay una raíz real, pues las raíces complejas aparecen por pares (una y su conjugada).



Si n es par, tendrá 0 o un número par de raíces reales por la misma razón.

La importancia de estas funciones y su representación gráfica se estudiará en el tema de interpolación, pues tablas en las que aparecen pares de valores se ajustan mediante una función polinómica.

La importancia de estas funciones y su representación gráfica se estudiará en el tema de interpolación, pues tablas en las que aparecen pares de valores se ajustan mediante una función polinómica. Si n es par, tendrá 0 o un número par de raíces reales por la misma razón.



Si n es impar, al menos hay una raíz real, pues las raíces complejas aparecen por pares (una y su conjugada).



Una función constante y = b (b ¹ 0) es una función polinómica de grado cero y su representación gráfica es una recta paralela a OX que dista de él b unidades. El estudio sistemático de una función polinómica de grado n nos lleva a calcular las raíces reales de dicho polinomio, que son los puntos de corte con el eje OX. Nos podemos encontrar los siguientes casos: y = a0 + a1 · x + ... + an · xn Ya hemos visto la función lineal, la afín, la cuadrática, que son funciones polinómicas de grado 1 y 2. En general, una función polinómica de grado n es de la forma

8.5. La función polinómica El método expuesto para representar una función cuadrática resuelve totalmente el problema, dando al mismo tiempo un significado gráfico a los parámetros de la ecuación, pero presenta dificultades de tipo didáctico por las necesarias manipulaciones algebraicas. Existen otras formas para determinar el vértice de la parábola, pero el que hemos expuesto nos parece el más interesante. En cualquier caso, es preciso mostrar que para representar una función cuadrática es necesario, ante todo, determinar su vértice. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

374

TEMA

22 Funciones exponenciales y logarítmicas. Situaciones reales en las que aparecen

Fulgencio García Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

376

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

DEFINICIÓN DE LOGARITMO NATURAL

3.

GRÁFICA DEL LOGARITMO NATURAL

4.

FUNCIÓN EXPONENCIAL 4.1. El número e 4.2. Otras propiedades de la función exponencial

5.

FUNCIÓN ax 5.1. Propiedades de la función ax

6.

GRÁFICA DE LA FUNCIÓN EXPONENCIAL

7.

FUNCIONES EXPONENCIALES Y LOGARÍTMICAS EN SITUACIONES REALES 7.1. Función de crecimiento ilimitado 7.1.1. Crecimiento de la población 7.1.2. Crecimiento vegetativo 7.1.3. Interés compuesto 7.2. Función de decrecimiento limitado 7.2.1. Desintegración radiactiva 7.2.2. Depreciación de un automómivl 7.2.3. Cantidad de carbono 14 7.3. Función de crecimiento limitado 7.3.1. Pruebas de memoria 7.3.2. Expresiones físicas 7.4. Expresiones logarítmicas 7.4.1. Seísmos 7.4.2. Fórmulas químicas 7.4.3. Economía 7.4.4. Física

FUNCIONES EXPONENCIALES Y LOGARÍTMICAS EN SITUACIONES REALES 7.1. Función de crecimiento ilimitado 7.1.1. Crecimiento de la población 7.1.2. Crecimiento vegetativo 7.1.3. Interés compuesto 7.2. Función de decrecimiento limitado 7.2.1. Desintegración radiactiva 7.2.2. Depreciación de un automómivl 7.2.3. Cantidad de carbono 14 7.3. Función de crecimiento limitado 7.3.1. Pruebas de memoria 7.3.2. Expresiones físicas 7.4. Expresiones logarítmicas 7.4.1. Seísmos 7.4.2. Fórmulas químicas 7.4.3. Economía 7.4.4. Física

7.

GRÁFICA DE LA FUNCIÓN EXPONENCIAL

6.

FUNCIÓN ax 5.1. Propiedades de la función ax

5.

FUNCIÓN EXPONENCIAL 4.1. El número e 4.2. Otras propiedades de la función exponencial

4.

GRÁFICA DEL LOGARITMO NATURAL

3.

DEFINICIÓN DE LOGARITMO NATURAL

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

376

Funciones exponenciales y logarítmicas

1. INTRODUCCIÓN En las tablillas que datan de la época babilónica se encuentran algunas tablas que contienen las potencias sucesivas de un número dado, análogas a nuestras modernas tablas de logaritmos, o mejor dicho de antilogaritmos. Se han encontrado tablas en las que aparecen las diez primeras potencias para las bases 9, 16, 1,40 y 3,45. La diferencia fundamental con las actuales es que no utilizaban ningún número concreto sistemáticamente como una base fija y que los huecos o saltos de las entradas eran muy grandes, a pesar de lo cual los matemáticos babilónicos interpolaban proporcionalmente. Sin embargo fue ya en el siglo XVI, cuando ocurrió la invención real de los logaritmos, al objeto de simplificar cálculos aritméticos, sobre todo en las engorrosas multiplicaciones, divisiones y raíces de números de muchas cifras con las que se encontraban en especial los astrónomos. El concepto, aunque no el nombre de logaritmo, aparece en la Arithmetica integra de Michael Stifel en 1544, utilizándose antes que la exponenciación. Nacieron sobre todo debido a la exigencia práctica de los calculistas del siglo XVI, y lo hicieron por obra de dos autores distintos y de forma independiente: el escocés John Napier (o Neper) y el suizo Bürgui, que publican sus tablas a comienzos del siglo XVII con pocos años de diferencia: Mirifici logarithmorum canonis descriptio de Napier en 1614 (donde dio la tabla que no es de logaritmos de números sino de logaritmos de senos, sin explicaciones sobre su construcción, obra que aparecería póstuma en 1619 como Mirifici logarithmorum canonis constructio) y las Progress-Tabulen de Bürgui en 1620. Se debe a Napier el nombre de logaritmo (palabra de origen griego: logos = tratado, arithmos = números), como número de razones. Su preocupación por los cálculos numéricos se manifestó mediante la invención de unos dispositivos elementales llamados ''bastoncillos de Napier'', que eran unas varillas en las que aparecían impresas tablas de multiplicar. En 1615 , el matemático inglés Henry Briggs visitó a Napier y le sugirió la idea de utilizar como base de los logaritmos el número 10. A Napier le agradó la idea y se comprometieron a elaborar tablas de los logaritmos decimales. Napier muere al cabo de dos años y se queda Briggs con la tarea. En 1618, Briggs publicó su obra Logarithmorum chilias prima, primer tratado sobre los logaritmos en base 10, de los números 1 al 1000 con catorce cifras decimales. En 1624 en su Arithmetica logarithmica, extendió su tabla hasta incluir los números del 1 al 20.000 y del 90.000 al 100.000, siempre con catorce cifras decimales. Ya se podía trabajar con los logaritmos igual que hoy, pues las tablas de Briggs gozan de las propiedades usuales de los logaritmos. En este libro aparece ya la palabra ''característica'', ya que la palabra ''mantisa'' fue utilizada por primera vez por Wallis en 1693. Mientras, Speidell calculaba los logaritmos naturales (o neperianos) de las funciones trigonométricas publicándolos en su obra New Logarithmes en 1619. Raramente, un descubrimiento tan nuevo ha ''pegado'' tan rápidamente como el invento de los logaritmos y el resultado de ello fue la inmediata aparición de tablas de logaritmos que eran más que suficientes para la época. El concepto de función es tan extenso y general que no es sorprendente encontrar una inmensa variedad de funciones que se presentan en la naturaleza. Si es, sin embargo, sorprendente que un número pequeño de funciones especiales rijan una multitud de fenómenos naturales totalmente diferentes. En este tema estudiaremos dos de estas funciones, las logarítmicas y las exponenciales, que tienen una peculiaridad importante: una de ellas es la inversa de la otra. Esta circunstancia hace que se pueda comenzar el estudio por la función exponencial, para, después, definir como inversa de ella la logarítmica o, recíprocamente, empezar estudiando la función logarítmica para posteriormente definir, como inversa, la función exponencial. Nosotros haremos esto último.

2. DEFINICIÓN DE LOGARITMO NATURAL Para ciertas funciones una definición preliminar presenta dificultades. Consideremos por ejemplo la función f(x) =bx Esta función está definida para todo número real y posee una inversa, definida para valores positivos la cual es el ''logaritmo de base 10'' (o decimal) definida por f–1(x) = u = logbx El problema que nos surge en esta definición es saber qué entendemos por bx, cuando x es irracional. Por ejemplo, ¿como se definirá 10 3 ? Aunque se llegue a obtener una definición satisfactoria de bx, se preTEMARIO DE MATEMÁTICAS. PRUEBA A

377

Volumen I. Matemáticas

378

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

para valores de y distintos de cero.

sentan otras dificultades para llegar a considerar la definición de arriba como una buena definición de logaritmo: habrá que demostrar que para cada x > 0, existe un u tal que x = bu; y además que la ley de los exponentes bu · bv se verifica para todos los exponentes reales. Se puede hacer todo esto pero el método es largo y pesado. De todas maneras es posible hacer el estudio de los logaritmos por un camino distinto: primero se introduce la función logaritmo y después se usa esa función para definir bx. El logaritmo es un concepto matemático que puede ser definido por muchos caminos distintos. Cuando intentamos formular una definición de un concepto, tenemos que estudiar una serie de propiedades que cumple este concepto. Examinando estas propiedades llegamos frecuentemente a una fórmula o proceso simple que sirve como definición y a partir del cual van surgiendo estas propiedades como deducciones lógicas. Veremos cómo mediante este proceso llegamos a la definición de logaritmo. Una de las propiedades que deseamos que tenga el logaritmo es que el logaritmo del producto sea igual a la suma de logaritmos. Si suponemos el logaritmo como una función f, la propiedad queda expresada por la fórmula f(x · y) = f(x) + f(y) (1) f’(y) =

por lo que

Si tomamos x = 1, tendremos que

f'(1) y

y · f’(y) = f’(1)

Supongamos ahora que la función f tiene una derivada f’(x) en cada x ¹ 0. Si derivamos la expresión (1) respecto a x, dejando y fijo, tenemos: y · f’(x · y) = f’(x) al ser f(–1) = 0. Por esto cualquier solución de (1) es necesariamente una función par. f(–x) = f(x)

de donde

f((–1) · x) = f(–1) + f(x)

donde x, y, y x · y, pertenecen al dominio de la función. Una ecuación como la anterior que expresa una relación entre los valores de una función en uno o más puntos se llama ecuación funcional. Nosotros intentaremos buscar solamente las soluciones diferenciables de la ecuación funcional (1), aunque previamente veremos algunas consecuencias que se derivan de la misma, sin imponer ningún tipo de restricción. Una solución de (1) es la función que es cero en todo R. En efecto, sea f una función que satisfaga la ecuación (1). Si 0 pertenece al dominio, para cualquier otro valor x del dominio, tendremos Por último si dejamos cualquier valor de x y tomamos el valor y = –1, tenemos f(–1) = 0

de donde

f(1) = 2f(–1)

Si tomamos ahora x = y = –1, en la expresión (1), tendremos f(1) = 0

f(x · 0) = f(0) = f(x) + f(0)

de donde

de donde f(x) = 0, sea cual sea x, perteneciente al dominio, con lo que la función f es nula en todo su dominio. Así, una solución de (1), no nula, no puede estar definida en 0. Toda solución de (1), es necesariamente una función par. Supongamos que f es una solución de (1), donde los puntos 1, –1, x y –x, pertenecen al dominio. Si tomamos x = y = 1 en la expresión (1), tenemos que f(1) = 2f(1)

de donde f(x) = 0, sea cual sea x, perteneciente al dominio, con lo que la función f es nula en todo su dominio. Así, una solución de (1), no nula, no puede estar definida en 0. Toda solución de (1), es necesariamente una función par. Supongamos que f es una solución de (1), donde los puntos 1, –1, x y –x, pertenecen al dominio. Si tomamos x = y = 1 en la expresión (1), tenemos que f(1) = 2f(1)

f(x · 0) = f(0) = f(x) + f(0)

de donde

f(1) = 0

donde x, y, y x · y, pertenecen al dominio de la función. Una ecuación como la anterior que expresa una relación entre los valores de una función en uno o más puntos se llama ecuación funcional. Nosotros intentaremos buscar solamente las soluciones diferenciables de la ecuación funcional (1), aunque previamente veremos algunas consecuencias que se derivan de la misma, sin imponer ningún tipo de restricción. Una solución de (1) es la función que es cero en todo R. En efecto, sea f una función que satisfaga la ecuación (1). Si 0 pertenece al dominio, para cualquier otro valor x del dominio, tendremos Si tomamos ahora x = y = –1, en la expresión (1), tendremos f(1) = 2f(–1)

de donde

f(–1) = 0

Por último si dejamos cualquier valor de x y tomamos el valor y = –1, tenemos f((–1) · x) = f(–1) + f(x)

sentan otras dificultades para llegar a considerar la definición de arriba como una buena definición de logaritmo: habrá que demostrar que para cada x > 0, existe un u tal que x = bu; y además que la ley de los exponentes bu · bv se verifica para todos los exponentes reales. Se puede hacer todo esto pero el método es largo y pesado. De todas maneras es posible hacer el estudio de los logaritmos por un camino distinto: primero se introduce la función logaritmo y después se usa esa función para definir bx. El logaritmo es un concepto matemático que puede ser definido por muchos caminos distintos. Cuando intentamos formular una definición de un concepto, tenemos que estudiar una serie de propiedades que cumple este concepto. Examinando estas propiedades llegamos frecuentemente a una fórmula o proceso simple que sirve como definición y a partir del cual van surgiendo estas propiedades como deducciones lógicas. Veremos cómo mediante este proceso llegamos a la definición de logaritmo. Una de las propiedades que deseamos que tenga el logaritmo es que el logaritmo del producto sea igual a la suma de logaritmos. Si suponemos el logaritmo como una función f, la propiedad queda expresada por la fórmula f(x · y) = f(x) + f(y) (1) de donde

f(–x) = f(x)

al ser f(–1) = 0. Por esto cualquier solución de (1) es necesariamente una función par.

Supongamos ahora que la función f tiene una derivada f’(x) en cada x ¹ 0. Si derivamos la expresión (1) respecto a x, dejando y fijo, tenemos: y · f’(x · y) = f’(x) Si tomamos x = 1, tendremos que

y · f’(y) = f’(1)

por lo que

f’(y) =

f'(1) y

para valores de y distintos de cero.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

378

Funciones exponenciales y logarítmicas Aquí se observa que f’ es monótona y por tanto integrable en cualquier intervalo cerrado que no contenga al cero. Como también es continua en cada uno de esos intervalos, podemos aplicarle el teorema fundamental del cálculo integral, con lo que tendremos x x1 f(x) – f(c) = òc f'(t)dt = f'(1)òc dt t Si x > 0, esta ecuación es válida para cada c > 0, y si x < 0 es válida para cada c negativo. Eligiendo c = 1, al ser f(1) = 0, tenemos si x es positivo x1 f(x) = f'(1)ò1 dt t Si x es negativo, –x es positivo y como f es función par, tenemos f(x) = f'(1)ò1

–x

1 dt t

Estas dos fórmulas podemos expresarlas en una sola haciendo la única salvedad de que x sea distinto de cero. Así tendremos | x| 1 (2) f(x) = f'(1)ò1 dt t Así, si existe una solución de (1), con derivada en cada punto distinto de cero, esta solución vendrá dada por (2). En el caso de que f’(1) = 0, f(x) = 0, que coincide con la solución idénticamente nula. Así, si f no es idénticamente nula, podemos dividir ambos miembros por f’(1), con lo que tendríamos para valores de x distintos de cero | x| 1 g(x) = ò1 dt t siendo g(x) = f(x)/f’(1), otra solución de (1). Hasta ahora no hemos demostrado que la función g sea solución de (1) , ya que hemos partido de la hipótesis de que existía al menos una solución distinta de la identicamente nula. Lo que haremos es a partir de (2), donde hemos definido la función g, seguir el camino contrario y comprobar que esta función satisface la igualdad (1). Razonando así, tomaríamos como definición de logaritmo la función g, pero al ser función par dos números distintos tendrían el mismo logaritmo. En atención a consideraciones posteriores es preferible que esto no ocurra, por lo que definiremos la función logaritmo solamente para los números positivos. DEFINICION 1. Si x es un número real positivo, definimos el logaritmo natural de x, designado como log x, como la integral. x1 log x = ò1 dt t Cuando x > 1, log x puede interpretarse geométricamente como el área sombreada en la figura 1. Si x > 1, log x > 0 y si 0 < x < 1, log x < 0, ya que se cumple una propiedad de la integral definida

ò

x

1

11 1 dt = – òx dt < 0 t t

Para valores de x menores o iguales que cero, no puede aplicarse esta 1 definición de logaritmo, ya que la función f(t) = , no está acotada en el t intervalo [x,1].

f(t) = 1/t log(x)

Figura 1. TEMARIO DE MATEMÁTICAS. PRUEBA A

379

Volumen I. Matemáticas

380

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

log (2n) = n · log 2

(y log 2 > 0)

TEOREMA 2. La función logaritmo tiene las siguientes propiedades:

Para representar la gráfica de la función logaritmo, nos podemos basar, sin hacer casi ningún cálculo en las propiedades mencionadas, en el anterior teorema. Por ejemplo, vemos que la función es estrictamente creciente puesto que su derivada siempre es positiva. Además conforme va creciendo x, la derivada se hace cada vez más pequeña y en consecuencia la función crece cada vez más despacio. También se observa que la derivada es muy grande y tiende hacia infinito cuando x tiende a cero. Puesto que log 1 = 0, la gráfica está si1 tuada por encima del eje X si x > 1 y por debajo si 0 < x < 1. La derivada segunda es log’’(x) = – 2 que es nex gativa para todo x, por lo que log x es una función convexa. No se observa claramente si la función está acotada tanto superior como inferiormente, pero vemos que para cualquier número natural n tenemos que log’(x) =

b)

log (1) = 0.

a)

c)

1 para todo x > 0. x

log (ab) = log a + log b.

En efecto, la demostración de a) es trivial basándonos en las propiedades de la integral definida ya que cualquier integral definida que tenga iguales sus límites de integración vale 0. Para demostrar b), basta con darnos cuenta que la definición de logaritmo se basa en una integral definida de una función continua, con lo que basta aplicarle el teorema fundamental del cálculo integral. Para demostrar la propiedad c) nos basamos en la propiedad aditiva de la integral definida, ya que tenemos:

3. GRÁFICA DEL LOGARITMO NATURAL

log(ab) = ò1

ab

a1 ab 1 1 dt = ò1 dt + òa dt t t t

(3)

æ xö æx ö Esto se ve, ya que log x = logç ç ÷ ÷+ logy , de donde se verifica lo anterior. ç ×y ÷ ÷= logç èy ø èy ø

t Si nos fijamos, la primera integral es log a y para resolver la segunda hacemos la sustitución u = de a æ xö logç ç ÷ ÷= logx – logy èy ø

donde dt = a · du, con lo que

ò

ab 1 b 1 b 1 dt = ò1 a ×du =ò1 du =log b t a ×u u

a

es una de las mayores bondades de la función logarítmica, al transformar una potencia en un producto, siendo la base de la derivación logarítmica, utilizada para derivar funciones de la forma [f(x)]g(x). Análogamente si x, y > 0, entonces Así la expresión (3), queda reducida a

log (ab) = log a + log b log (xn) = n · log x

De esta última propiedad, si la aplicamos de forma reiterada, podemos ver que para todo número natural n, se verifica que

De esta última propiedad, si la aplicamos de forma reiterada, podemos ver que para todo número natural n, se verifica que log (xn) = n · log x

log (ab) = log a + log b

es una de las mayores bondades de la función logarítmica, al transformar una potencia en un producto, siendo la base de la derivación logarítmica, utilizada para derivar funciones de la forma [f(x)]g(x). Análogamente si x, y > 0, entonces Así la expresión (3), queda reducida a a

ab

b 1 b 1 1 dt = ò1 a ×du =ò1 du =log b t a ×u u

æ ö ç x÷ ÷= logx – logy logç èy ø

ò

t Si nos fijamos, la primera integral es log a y para resolver la segunda hacemos la sustitución u = de a donde dt = a · du, con lo que æ ö æ ö ç x÷ ÷+ logy , de donde se verifica lo anterior. ç x ×y ÷ ÷= logç Esto se ve, ya que log x = logç èy ø èy ø log(ab) = ò1

ab

a1 ab 1 1 dt = ò1 dt + òa dt t t t

(3)

En efecto, la demostración de a) es trivial basándonos en las propiedades de la integral definida ya que cualquier integral definida que tenga iguales sus límites de integración vale 0. Para demostrar b), basta con darnos cuenta que la definición de logaritmo se basa en una integral definida de una función continua, con lo que basta aplicarle el teorema fundamental del cálculo integral. Para demostrar la propiedad c) nos basamos en la propiedad aditiva de la integral definida, ya que tenemos:

3. GRÁFICA DEL LOGARITMO NATURAL

Para representar la gráfica de la función logaritmo, nos podemos basar, sin hacer casi ningún cálculo en las propiedades mencionadas, en el anterior teorema. Por ejemplo, vemos que la función es estrictamente creciente puesto que su derivada siempre es positiva. Además conforme va creciendo x, la derivada se hace cada vez más pequeña y en consecuencia la función crece cada vez más despacio. También se observa que la derivada es muy grande y tiende hacia infinito cuando x tiende a cero. Puesto que log 1 = 0, la gráfica está si1 tuada por encima del eje X si x > 1 y por debajo si 0 < x < 1. La derivada segunda es log’’(x) = – 2 que es nex gativa para todo x, por lo que log x es una función convexa. No se observa claramente si la función está acotada tanto superior como inferiormente, pero vemos que para cualquier número natural n tenemos que a)

log (1) = 0.

b)

log’(x) =

c)

log (ab) = log a + log b.

1 para todo x > 0. x

TEOREMA 2. La función logaritmo tiene las siguientes propiedades:

log (2n) = n · log 2 380

(y log 2 > 0)

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones exponenciales y logarítmicas de donde se deduce que log x no está acotada superiormente. Análogamente æ1ö logç n ÷= log 1 – log 2n = –n · log 2 è2 ø æ1ö k por lo que para todo valor k > 0, logç n ÷< –k si n > , llegando así a la conclusión de que la función log x è2 ø log2 no está acotada inferiormente. Además, al ser continua, toma todos los valores de R, lo que podemos expresar en el siguiente teorema log(x)

1

Figura 2. TEOREMA 3. Para cada número real y, existe un número real positivo x, tal que log x = y. Y , de donde log (2n) > y. En efecto si y > 0, tomamos un número cualquiera entero n que cumpla n > log2 Si aplicamos el teorema del valor medio a la función log x en el intervalo [1,2n], al ser log (1) = 0 y 0 < y < < log (2n), existirá por lo menos un x perteneciente a dicho intervalo tal que log (x) = y. Además este valor será único ya que si existiera otro valor x’ ¹ x, tal que log (x’) = y, esto contradice la propiedad de función estrictamente creciente que tiene la función logaritmo. æ 1ö Si y < 0, la demostración es análoga utilizando la propiedad de logç ÷= – log x. è xø En particular existe un único número cuyo logaritmo natural vale 1, y al igual que el número p aparece repetidamente en muchas fórmulas matemáticas, por lo que Leonardo Euler (1707-1783) adoptó para el el símbolo especial de e. Así log (e) = 1. Con todo esto hemos visto que log (x) es una biyección de R+ sobre R , por lo que existe su función inversa log–1(x) cuyo dominio es el conjunto de todos los números reales.

4. FUNCIÓN EXPONENCIAL El teorema anterior demuestra que para todo número real x existe uno y solo un número real positivo y, tal que log (y) = x. Por ello podemos aplicar el proceso de inversión para definir y como función de x. La función inversa resultante se denomina función exponencial o antilogaritmo y se representa por exp(x). Así: DEFINICION 4. La función exponencial exp(x) es la inversa de la función log (y), o, lo que es lo mismo, para cualquier número real x, definimos exp(x) como aquel número y cuyo logaritmo es x. El dominio de la función exponencial es todo el eje real y su recorrido son los reales positivos al ser este conjunto el dominio de la función logaritmo. Al ser inversas la función exponencial y logarítmica la TEMARIO DE MATEMÁTICAS. PRUEBA A

381

Volumen I. Matemáticas

382

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

exp’(x) = exp(x)

gráfica de la función exponencial podemos conseguirla mediante una simetría respecto a la recta y = x de la función logaritmo, quedándonos como indica la figura 3. con lo que

y = exp(x)

y=x

k ®0

lim

log(k + 1) log(k + 1) – log(1) = lim = log'(1) = 1 k ® 0 k k

Como k = exp(h) – 1, cuando h ® 0, k ® 0. Así si calculamos (0,1)

exp(h) – 1 k = h log(k + 1) y = log(x)

exp(h) – 1 = 1para terminar de demostrar b). Para ello pondremos esta exh presión en función del logaritmo. Sea k = exp(h) – 1 de donde k + 1 = exp(h). Así log (k + 1) = h y el cociente nos queda h ®0

(1,0)

Basta, pues, probar que lim h ®0

exp' x = lim

exp(x+ h) – exp(x) exp(x)×exp(h) – exp(x) exp(h) – 1 = lim = exp(x)× lim h ® 0 h ® 0 h h h

Figura 3.

Para demostrar b) recurriremos a la definición de función derivada. Así

Por ser funciones inversas cada gráfica de la función logarítmica puede traducirse en una de la función exponencial y por lo tanto exp(x + y) = x’ · y’ = exp(x) · exp(y)

TEOREMA 5. La función exponencial tiene las siguientes propiedades:

x + y = log(x’) + log(y’) = log(x’ · y’), de donde

En efecto, la parte a) la deducimos de las igualdades log (1) = 0 y log (e) = 1. Seguidamente demostraremos c) para, apoyándonos en ello, demostrar b). Dados x e y, supongamos que exp(x) = x’ y exp(y) = y’, con lo que x = log(x’) e y = log(y’). Así, exp(0) = 1 y exp(1) = e.

exp(x + y) = exp(x) · exp(y) para todos x e y.

a)

c)

exp’(x) = exp(x) para todo x.

exp’(x) = exp(x) para todo x.

b)

b)

exp(x + y) = exp(x) · exp(y) para todos x e y.

exp(0) = 1 y exp(1) = e.

c)

a)

En efecto, la parte a) la deducimos de las igualdades log (1) = 0 y log (e) = 1. Seguidamente demostraremos c) para, apoyándonos en ello, demostrar b). Dados x e y, supongamos que exp(x) = x’ y exp(y) = y’, con lo que x = log(x’) e y = log(y’). Así, TEOREMA 5. La función exponencial tiene las siguientes propiedades:

x + y = log(x’) + log(y’) = log(x’ · y’), de donde exp(x + y) = x’ · y’ = exp(x) · exp(y)

Por ser funciones inversas cada gráfica de la función logarítmica puede traducirse en una de la función exponencial y por lo tanto Para demostrar b) recurriremos a la definición de función derivada. Así Figura 3.

exp' x = lim h ®0

exp(x+ h) – exp(x) exp(x)×exp(h) – exp(x) exp(h) – 1 = lim = exp(x)× lim h ®0 h ®0 h h h

exp(h) – 1 Basta, pues, probar que lim = 1para terminar de demostrar b). Para ello pondremos esta exh ®0 h presión en función del logaritmo. Sea k = exp(h) – 1 de donde k + 1 = exp(h). Así log (k + 1) = h y el cociente nos queda (1,0)

y = log(x)

exp(h) – 1 k = h log(k + 1)

(0,1)

Como k = exp(h) – 1, cuando h ® 0, k ® 0. Así si calculamos lim k ®0

log(k + 1) log(k + 1) – log(1) = lim = log'(1) = 1 k ®0 k k y=x

y = exp(x)

con lo que

gráfica de la función exponencial podemos conseguirla mediante una simetría respecto a la recta y = x de la función logaritmo, quedándonos como indica la figura 3. exp’(x) = exp(x)

382

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones exponenciales y logarítmicas

4.1. El número e Por la propiedad a) del teorema anterior hemos definido el número e = exp(1), es decir, e1 1 = log e = ò1 dt t

Ahora bien, según se puede ver en la figura 4

ò

2

1

1 dt < 1 t

1 ya que 1 · (2 – 1) = 1 es una suma superior para la función f(t) = en el intervalo [1,2]. t 41 1 1 1 Además ò1 dt > 1, ya que · (2 – 1) + · (4 – 2) = 1 es una suma inferior para la función f(t) = en el t 2 4 t intervalo [1,4]. Así pues 21 e1 41 ò1 t dt < ò1 t dt < ò1 t dt de donde tendremos que 2 < e b y n > 3, tendremos

a 1 1 = 1+ 1+ +...+ + R n b 2! n! TEMARIO DE MATEMÁTICAS. PRUEBA A

383

Volumen I. Matemáticas

384

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

La condición de que a > 0 es necesaria para que exista log a.

de donde

n!×a n! n! = n!+ n!+ +...+ + n!× R n b 2! n! resultando que todos los términos de la igualdad hasta el penúltimo son enteros, por lo que el último también debe ser entero. Así n! · Rn debe ser entero. Pero como 3 0 < Rn < (n + 1)! ax = ex · log a

Si a > 0 y x es cualquier número real definimos

5. FUNCIÓN ax

De la misma manera se puede definir exp(x) = ex, para cada número real x, al cumplirse las propiedades de la función exponencial. tendremos

0 < n! · Rn <

3 3 < 0, implica sacando raíces èn ø è n ø n

de donde

exp(–x) =

1 exp(x)

para todo entero n positivo. En particular si x = 1, tenemos exp(n) = en

Si tomamos ahora y = x, y = 2x, ..., y = (n – 1)x, en el apartado b) del teorema anterior tendemos exp(2x) = (exp(x))2, exp(3x) = (exp(x))3 y en general exp(nx) = (exp(x))n

Si tomamos ahora y = x, y = 2x, ..., y = (n – 1)x, en el apartado b) del teorema anterior tendemos exp(2x) = (exp(x))2, exp(3x) = (exp(x))3 y en general exp(nx) = (exp(x))n para todo entero n positivo. En particular si x = 1, tenemos exp(n) = en

exp(–x) =

1 exp(x)

æ 1ö æ 1 ö Si tomamos x = 1/n, obtendremos exp(1) =çexp( )÷ . Puesto que expç ÷> 0, implica sacando raíces èn ø è n ø enésimas que æ 1ö 1 expç ÷= e n = n e èn ø n

de donde

Para ello tomaremos primero y = –x y le aplicaremos el apartado b) del teorema anterior, teniendo exp(0) = exp(x + (–x)) = exp(x) · exp(–x) Basándonos en el teorema anterior, demostraremos ahora que, sea cual sea el racional r, se cumple que exp(r) = er

y en general

n æ n ö æ æ 1 öö expç ÷=çexpç ÷÷ = e m è m ø è è m øø n

4.2. Otras propiedades de la función exponencial

para m y n enteros positivos cualesquiera. Así hemos demostrado (3) para cualquier número racional posi1 tivo. Como exp(–r) = = e–r, dicha expresión también será valida para cualquier racional negativo. exp(r) lo cual no puede ser cierto para un número entero. Así, el número e es irracional. 0 < n! · Rn <

3 3 < 0 y x es cualquier número real definimos

ax = ex · log a

La condición de que a > 0 es necesaria para que exista log a.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

384

Funciones exponenciales y logarítmicas

5.1. Propiedades de la función ax La función ax tiene las siguientes propiedades: a)

log (ax) = x · log a

b)

(a · b)x = ax · bx

c)

ax · ay = ax+y

d)

(ax)y = (ay)x = ax · y

La demostración de a) es trivial basándonos en que la función exponencial y la logarítmica son funciones inversas. Para demostrar b), partamos de la definición, teniendo (a · b)x = ex · log (a · b) = ex · (log a + log b) = ex · log a + x · log b = ex · log a · ex · log b = ax · bx La demostración de c) será ax · ay = ex · log a · ey · log a = ex · log a + y · log a = e(x + y) · log a = ax + y La de d) será x× loga

( a x )y = ey×log( a ) = ey×log(e x

)

= ey · x · log a = ax · y

6. GRÁFICA DE LA FUNCIÓN EXPONENCIAL La figura 5 muestra la gráfica de la función exponencial f(x) = ax, para diferentes valores de a. El comportamiento de la misma depende de que a sea mayor, menor o igual a 1. Si a = 1, entonces f(x) = 1x = 1, con lo que tenemos una función constante. Si a > 1, como log a > 0, si x < y, entonces x · log a < y · log a, por lo que ex · log a < ey · log a, de donde ax < ay. Así pues la función ax es creciente. Si por el contrario 0 < a < 1, tenemos que log a < 0 y siguiendo el mismo razonamiento llegamos a que la función ax es decreciente. x x f(x) = (1/10) f(x) = 10

x

f(x) = e x

f(x) = (1/e)

f(x) = 1

x

Figura 5. Puesto que la función f(x) = ax con a ¹ 1 toma todos los valores positivos, su función inversa f–1 está definida para todos los números positivos y toma todos los valores reales (su recorrido es la recta real). Dicha función inversa se designa como loga(x). Del mismo modo que ax puede expresarse en términos de exp, también loga puede expresarse en términos de log. Es lo que se conoce como el cambio de base en la función logarítmica. TEMARIO DE MATEMÁTICAS. PRUEBA A

385

Volumen I. Matemáticas

386

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si una persona ingresa en el banco un capital C0 a un interés compuesto r, al cabo del primer año tendrá un capital total de C1 = C0 · (1 + r). Al pasar t años su capital final será Ct = C0 · (1 + r)t. Si y = log x, entonces x = ay = ey · log a, de modo que log x = y · log a o, lo que es lo mismo, a logx loga y=

1 2

2 4

3 8

logx loga

0 1

4 5 16 32

… …

n 2n

es decir, logax =

7.1.3. Interés compuesto

Número de periodos transcurridos Número de células

Si tenemos otra base cualquiera b, tendremos de forma análoga que logbx =

logx , por lo que para palogb

Muchos tipos de seres vivos unicelulares se reproducen por bipartición. El tiempo que media entre dos particiones depende del tipo de célula y del medio en el que se encuentra. Si tomamos como unidad de tiempo el periodo correspondiente a unas ciertas condiciones y empezamos con una célula, tendremos sar de una base a otra tendremos

logbx = logax · y como

loga logb

7.1.2. Crecimiento vegetativo

Pt = (1 + r’)t · P0 loga = logba logb

En un país se determina mediante estudios que el crecimiento anual de la población más o menos constante es de un r%. Si la población actual es P0, ¿cuál será la población al cabo de t años? r · P0 = (1 + r’) · P0, siendo r’ el tanto por uno. Al año, tendremos P1 = P0 + 100 En el segundo año tendremos P2 = P1 + r’ · P1 = (1 + r’) · P1 = (1 + r’)2 · P0. Si seguimos procediendo de la misma manera al cabo de t años, tendremos tendremos

logbx = logax · logba

quedando así reducido un cambio de base a un cambio de escala en el eje de ordenadas.

7. FUNCIONES EXPONENCIALES Y LOGARÍTMICAS EN SITUACIONES REALES

7.1.1. Crecimiento de la población

Muchas de las situaciones de la vida real se expresan mediante funciones exponenciales o logarítmicas. Dentro de las exponenciales veremos algunos ejemplos, según se ajusten a diferentes ecuaciones exponenciales. Su ecuación viene dada por f(x) = a · bcx, con a > 0, b > 1 y c > 0. Podemos poner algunos ejemplos:

7.1. Función de crecimiento ilimitado

7.1. Función de crecimiento ilimitado

Muchas de las situaciones de la vida real se expresan mediante funciones exponenciales o logarítmicas. Dentro de las exponenciales veremos algunos ejemplos, según se ajusten a diferentes ecuaciones exponenciales. Su ecuación viene dada por f(x) = a · bcx, con a > 0, b > 1 y c > 0. Podemos poner algunos ejemplos:

7. FUNCIONES EXPONENCIALES Y LOGARÍTMICAS EN SITUACIONES REALES

7.1.1. Crecimiento de la población

En un país se determina mediante estudios que el crecimiento anual de la población más o menos constante es de un r%. Si la población actual es P0, ¿cuál será la población al cabo de t años? r · P0 = (1 + r’) · P0, siendo r’ el tanto por uno. Al año, tendremos P1 = P0 + 100 En el segundo año tendremos P2 = P1 + r’ · P1 = (1 + r’) · P1 = (1 + r’)2 · P0. Si seguimos procediendo de la misma manera al cabo de t años, tendremos quedando así reducido un cambio de base a un cambio de escala en el eje de ordenadas. logbx = logax · logba

tendremos

loga = logba logb

Pt = (1 + r’)t · P0 loga logb

7.1.2. Crecimiento vegetativo

y como

logbx = logax ·

Muchos tipos de seres vivos unicelulares se reproducen por bipartición. El tiempo que media entre dos particiones depende del tipo de célula y del medio en el que se encuentra. Si tomamos como unidad de tiempo el periodo correspondiente a unas ciertas condiciones y empezamos con una célula, tendremos sar de una base a otra tendremos

Si tenemos otra base cualquiera b, tendremos de forma análoga que logbx = 0 1

1 2

2 4

3 8

4 5 16 32

logx loga

logx , por lo que para palogb

Número de periodos transcurridos Número de células

… …

n 2n

es decir, logax =

Si y = logax, entonces x = ay = ey · log a, de modo que log x = y · log a o, lo que es lo mismo, logx y= loga

7.1.3. Interés compuesto

Si una persona ingresa en el banco un capital C0 a un interés compuesto r, al cabo del primer año tendrá un capital total de C1 = C0 · (1 + r). Al pasar t años su capital final será Ct = C0 · (1 + r)t. 386

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones exponenciales y logarítmicas

7.2. Función de decrecimiento limitado Su ecuación viene dada por f(x) = a · bcx, con a > 0, b > 1 y c < 0. Podemos poner algunos ejemplos:

7.2.1. Desintegración radiactiva La fórmula de decaimiento de un elemento radiactivo, es decir, la forma en que disminuye el número de átomos radiactivos presentes en una muestra viene dada por Nt = N0 · e–dt donde N0 es el número de átomos radiactivos iniciales, Nt el número de átomos en el momento t, d es la constante de desintegración del elemento y t el tiempo transcurrido.

7.2.2. Depreciación de un automóvil La fórmula que nos da el precio de un automóvil en función de los años transcurridos desde su adquisición como nuevo tiene también una expresión exponencial de este tipo.

7.2.3. Cantidad de carbono 14 La cantidad de carbono 14 presente en un organismo vivo permanece sensiblemente constante. A partir del momento de la muerte, sin embargo, va disminuyendo por desintegración según una función exponencial Q = Q0 · e–1238×10

–8

t

Es así posible, analizando la cantidad de carbono 14 encontrada en cualquier fósil, determinar su edad.

7.3. Función de crecimiento limitado Su ecuación viene dada por f(x) = a · (1 – e–bx), con a > 0. Podemos poner algunos ejemplos:

7.3.1. Pruebas de memoria En un experimento sicológico con niños y niñas de 6 años se les mostraba una serie de objetos durante un tiempo de x minutos y pedirles, inmediatamente después de retirarlos, que los distingan dentro de un conjunto mucho más amplio. Este experimento se plasma en la función n = n0 · (1 – e–0,2x), donde n es el número de objetos que pueden recordar y x el número de minutos que se les muestran.

7.3.2. Expresiones físicas La ecuación de la velocidad de un cuerpo que cae a través de un medio que resiste a su paso de forma viscosa y lineal es kt – w × (1– e m ) k donde v es la velocidad, m es la masa del cuerpo, w el peso del cuerpo, t el tiempo y k un coeficiente experimental de la resistencia dependiente de la geometría del cuerpo, de la densidad y viscosidad del medio en que se desplaza, etc.

v=

7.4. Expresiones logarítmicas 7.4.1. Seísmos La magnitud de un seísmo en la escala de Richter es M = 0,67 · log (0,37E) + 1,46 donde E es la energía del seísmo en Kw hora. TEMARIO DE MATEMÁTICAS. PRUEBA A

387

Volumen I. Matemáticas

388

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

7.4.2. Fórmulas químicas En Química, el pH sirve para expresar el carácter ácido, básico o neutro de las disoluciones. Fue Sorensen quien introdujo el pH como el logaritmo decimal del inverso de la concentración de iones H3O+, expresada en moles por litro debido a que expresar dicha concentración era realmente incómodo. Así definió el pH como æ 1 ö + ÷ pH = logç ç [H O+ ] ÷= –log [H3O ] è 3 ø

7.4.3. Economía El gabinete de estudios fiscales del Ministerio de Economía y Hacienda proyecta una reforma del IRPF. Si x es la base imponible en millones de pesetas, e y el tipo de gravamen a aplicar, este se calcula a partir de la fórmula y = a · log(bx) donde a y b son dos coeficientes que se calculan teniendo en cuenta que a dos millones de pesetas le corresponde un gravamen del 20% y a cinco uno del 30%, siendo el máximo gravamen sea cual sea la base del 46%.

7.4.4. Física La ley de Weber-Fechner afirma que el nivel de intensidad b de una onda sonora viene dado por b = 10× log

I I0

siendo I la intensidad física del sonido e I0 la intensidad de referencia (o lo que es lo mismo la intensidad mínima para que ese sonido sea percibido) que equivale a 10–16w/cm2 para una frecuencia de 1000 Hz. siendo I la intensidad física del sonido e I0 la intensidad de referencia (o lo que es lo mismo la intensidad mínima para que ese sonido sea percibido) que equivale a 10–16w/cm2 para una frecuencia de 1000 Hz. b = 10× log

I I0

La ley de Weber-Fechner afirma que el nivel de intensidad b de una onda sonora viene dado por

7.4.4. Física donde a y b son dos coeficientes que se calculan teniendo en cuenta que a dos millones de pesetas le corresponde un gravamen del 20% y a cinco uno del 30%, siendo el máximo gravamen sea cual sea la base del 46%. y = a · log(bx) El gabinete de estudios fiscales del Ministerio de Economía y Hacienda proyecta una reforma del IRPF. Si x es la base imponible en millones de pesetas, e y el tipo de gravamen a aplicar, este se calcula a partir de la fórmula

7.4.3. Economía æ ö ç 1 ÷= –log [H O+ ] pH = logç 3 + ÷ è [H3O ] ø En Química, el pH sirve para expresar el carácter ácido, básico o neutro de las disoluciones. Fue Sorensen quien introdujo el pH como el logaritmo decimal del inverso de la concentración de iones H3O+, expresada en moles por litro debido a que expresar dicha concentración era realmente incómodo. Así definió el pH como

7.4.2. Fórmulas químicas CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

388

TEMA

23 Funciones circulares e hiperbólicas y sus recíprocas. Situaciones reales en las que aparecen

Jesús Gómez Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

390

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

FUNCIONES CIRCULARES 2.1. Ángulos orientados 2.2. Definición de “seno” y “coseno” 2.3. Definición de las demás funciones circulares 2.4. Propiedades inmediatas 2.5. Periodicidad. 2.6. Continuidad y derivabilidad de las funciones circulares 2.7. Gráficas de las funciones circulares. 2.7.1. Gráficas de las funciones seno y coseno 2.7.2. Gráficas de las funciones tangentes y cotangentes 2.7.3. Gráficas de las funciones secante y cosecante

3.

FUNCIONES INVERSAS DE LAS CIRCULARES: FUNCIONES CICLOMÉTRICAS

4.

FUNCIONES HIPERBÓLICAS 4.1. Definición 4.2. Propiedades inmediatas 4.3. Gráficas de las funciones hiperbólicas

5.

FUNCIONES INVERSAS DE LA HIPERBÓLICAS

6.

SIMILITUDES ENTRE LAS FUNCIONES CIRCULARES Y LAS HIPERBÓLICAS 6.1. Una interpretación geométrica análoga 6.2. Definición a partir de la exponencial 6.3. Tabla de derivadas de las funciones circulares e hiperbólicas y de sus inversas

SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES HIPERBÓLICAS

8.

SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES CIRCULARES

7.

SIMILITUDES ENTRE LAS FUNCIONES CIRCULARES Y LAS HIPERBÓLICAS 6.1. Una interpretación geométrica análoga 6.2. Definición a partir de la exponencial 6.3. Tabla de derivadas de las funciones circulares e hiperbólicas y de sus inversas

6.

FUNCIONES INVERSAS DE LA HIPERBÓLICAS

5.

FUNCIONES HIPERBÓLICAS 4.1. Definición 4.2. Propiedades inmediatas 4.3. Gráficas de las funciones hiperbólicas

4.

FUNCIONES INVERSAS DE LAS CIRCULARES: FUNCIONES CICLOMÉTRICAS

3.

FUNCIONES CIRCULARES 2.1. Ángulos orientados 2.2. Definición de “seno” y “coseno” 2.3. Definición de las demás funciones circulares 2.4. Propiedades inmediatas 2.5. Periodicidad. 2.6. Continuidad y derivabilidad de las funciones circulares 2.7. Gráficas de las funciones circulares. 2.7.1. Gráficas de las funciones seno y coseno 2.7.2. Gráficas de las funciones tangentes y cotangentes 2.7.3. Gráficas de las funciones secante y cosecante

2.

INTRODUCCIÓN

1.

7. 8.

SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES CIRCULARES SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES HIPERBÓLICAS

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

390

Funciones circulares e hiperbólicas y sus recíprocas

1. INTRODUCCIÓN Las funciones circulares fueron introducidas por la vía geométrica a partir de la trigonometría plana. Los musulmanes ya disponían de grandes avances en este campo. Así pues, Al Habas (770?-870?) introduce la función trigonométrica de tangente y confecciona tablas de sen y tg, que luego perfeccionarían Abul-Wafa (940-998) y Al-Biruni (973-1048). A comienzos del siglo XVI la trigonometría estaba aún vinculada a la astronomía. De hecho en la obra de Copérnico titulada De revolutionibus orbium coelestium, tres capítulos están dedicados a las funciones circulares. Dos de esos capítulos habían aparecido ya en 1542, año anterior al de la publicación de la obra de Copérnico, en un escrito de su editor Georg Joachim, llamado Rhaeticus, a quien se debe el estudio sistemático de las seis funciones circulares en 1551, apareciendo por primera vez en Europa definidas sobre la circunferencia fundamental. Fuera del seno y del coseno Rhaeticus no dio nombre especial a ninguna de las otras. Los nombres de tangente y secante aparecen en una obra de Thomas Fincke de 1583. En el Barroco temprano se producen nuevas contribuciones. Así pues, los continuadores de Rhaeticus (Otto, Pitiscus, ...) construyeron tablas con precisión asombrosa de tales funciones. La vinculación con otros problemas como la cuadratura del círculo y la aproximación del número p hace que el estudio de las funciones circulares cobre vigor, sobresaliendo la figura de Viète (1540-1603), quien, entre otras muchas aportaciones, ideó un método de biparticiones para obtener valores tabulados de las funciones circulares y empezó a desarrollar los teoremas fundamentales. Más tarde, el desarrollo de los métodos infinitesimales permitió un enfoque nuevo basado en las series. Así por ejemplo, hay contribuciones diversas (Pascal, Fermat, Wallis, Newton, Leibniz, Bernouilli, etc.) motivadas por el polémico estudio de la cicloide, que originó la aparición de su compañera, la sinuoide. Un manejo eficaz de esta curva se debe a Roverbal en su método de los indivisibles para determinar el área de la cicloide y el volumen del cuerpo engendrado por su revolución. Por su parte Huygens se ocupó del estudio de la catenaria, donde intervienen la funciones hiperbólicas, mientras que Gregory estudió las funciones circulares inversas. Aunque las funciones hiperbólicas fueron introducidas en 1757 por Ricatti, Lambert les da en 1769 la misma importancia que a las trigonométricas y calcula una tabla para aquellas. Se ocupó del estudio de las funciones hiperbólicas en conexión con la teoría de las paralelas y demostró la irracionalidad de p partiendo del desarrollo en fracción continua de tg x. Pero probablemente sea Euler, el matemático más relevante del siglo XVIII, el que más aportó al conocimiento de las funciones trascendentes. A él se debe la relación entre las funciones circulares e hiperbólicas con las exponenciales. En su obra Introductio in analysin infinitorum hace un tratamiento estrictamente analítico (y no geométrico) de las funciones trigonométricas. El seno de un ángulo, por ejemplo, ya no es un segmento, sino simplemente un número, la ordenada de un punto de la circunferencia z3 z5 z7 unidad, o bien la suma de la serie z – + – + ... para algún valor de z. 3! 5! 7! Cabe destacar por último al francés Fourier, que, en su estudio de las funciones analíticas, aportó con las llamadas series trigonométricas una extensión del concepto euleriano de función. Podemos decir que las funciones que se van a estudiar en el presente tema han sido objeto de estudio a lo largo de la historia, en conexión tanto otras parcelas de la matemática, como la geometría o el álgebra, pero también motivado por la investigación en otros campos de la ciencia y de la técnica, como la astronomía, la mecánica o la electrónica.

2. FUNCIONES CIRCULARES 2.1. Ángulos orientados S2

Partiremos de la noción intuitiva de “ángulo orientado” (o “dirigido”), como par ordenado (s1,s2) de semirrectas con un origen común. O

Figura 1.

TEMARIO DE MATEMÁTICAS. PRUEBA A

S1

391

Volumen I. Matemáticas

392

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Si tomamos en el plano un sistema de referencia OXY ortonormal (ejes rectangulares), podemos considerar como semirrecta inicial s1 la mitad positiva del eje de abcisas (OX+), y entonces el ángulo orientado vendrá dado por la semirrecta terminal, más concretamente por el ángulo barrido por ésta al girar con centro O. De esa manera puede considerarse un ángulo orientado como un ángulo de giro, se puede generalizar la noción de ángulo admitiendo ángulos superiores a una vuelta y se pueden establecer dos sentidos de giro (usualmente como positivo el contrario al de las agujas del reloj).

Observación: Sabido es que podríamos haber tomado una circunferencia de radio r cualquiera y las definiciones seu v rían cos j= , sen j= . Es fácil probar la independencia de tales definiciones con respecto al radio r r elegido, con lo cual tomamos r = 1 (circunferencia goniométrica), sin restar generalidad. Tratamos de que las definiciones dadas nos permitan construir dos funciones reales de variable real. Pero para ello es preciso que un ángulo orientado j quede identificado mediante un número real x. En realidad no nos interesa tanto la perspectiva geométrica como la del análisis real, y en ese sentido hay otras formas de llegar a x longitud las funciones que pretendemos, si recurrir siquiera a la noción de ángulo. No obstante, la introducción del radián puede ser, al menos en primera aproximación, una manera de solventar la cuestión. En efec1 to, con la definición clásica lo que hacemos es asignar valor 1 al ángulo dirigido en sentido contrario al de las agujas del reloj y tal que la longitud del arco es 1, es decir, al ángulo central cuyo arco correspondiente tiene la misma longitud que el radio. Figura 4.

Figura 2.

2.2. Definición de seno y coseno

Tomemos ahora la circunferencia de centro O y radio unidad C = {(u, v) / u2 + v 2= 1}

Figura 3.

Está claro que toda semirrecta con origen en O determina un único punto P(u,v) de C. Ello significa que para cada ángulo orientado j, situado sobre el sistema de referencia OXY de la forma establecida, obtendremos un punto P(u,v) cumpliendo u2 + v2 = 1. Entonces definiremos coseno y seno de j como las coordenadas del punto P. O sea: O

A (1, 0)

u

v

cos j = u sen j = v

j

P P

v

j cos j = u sen j = v

Está claro que toda semirrecta con origen en O determina un único punto P(u,v) de C. Ello significa que para cada ángulo orientado j, situado sobre el sistema de referencia OXY de la forma establecida, obtendremos un punto P(u,v) cumpliendo u2 + v2 = 1. Entonces definiremos coseno y seno de j como las coordenadas del punto P. O sea: O

u

A (1, 0)

Figura 3.

C = {(u, v) / u2 + v 2= 1}

Tomemos ahora la circunferencia de centro O y radio unidad

2.2. Definición de seno y coseno

Observación: Sabido es que podríamos haber tomado una circunferencia de radio r cualquiera y las definiciones seu v rían cos j= , sen j= . Es fácil probar la independencia de tales definiciones con respecto al radio r r elegido, con lo cual tomamos r = 1 (circunferencia goniométrica), sin restar generalidad. Tratamos de que las definiciones dadas nos permitan construir dos funciones reales de variable real. Pero para ello es preciso que un ángulo orientado j quede identificado mediante un número real x. En realidad no nos interesa tanto la perspectiva geométrica como la del análisis real, y en ese sentido hay otras formas de llegar a x longitud las funciones que pretendemos, si recurrir siquiera a la noción de ángulo. No obstante, la introducción del radián puede ser, al menos en primera aproximación, una manera de solventar la cuestión. En efec1 to, con la definición clásica lo que hacemos es asignar valor 1 al ángulo dirigido en sentido contrario al de las agujas del reloj y tal que la longitud del arco es 1, es decir, al ángulo central cuyo arco corresponFigura 4. diente tiene la misma longitud que el radio. Figura 2.

Si tomamos en el plano un sistema de referencia OXY ortonormal (ejes rectangulares), podemos considerar como semirrecta inicial s1 la mitad positiva del eje de abcisas (OX+), y entonces el ángulo orientado vendrá dado por la semirrecta terminal, más concretamente por el ángulo barrido por ésta al girar con centro O. De esa manera puede considerarse un ángulo orientado como un ángulo de giro, se puede generalizar la noción de ángulo admitiendo ángulos superiores a una vuelta y se pueden establecer dos sentidos de giro (usualmente como positivo el contrario al de las agujas del reloj).

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

392

Funciones circulares e hiperbólicas y sus recíprocas De esta manera el ángulo orientado j definido por P se identifica con la longitud x del arco AP tomando como unidad el radio de la circunferencia, si para ir de A a P hay que seguir el sentido contrario de las agujas del reloj. Si para ir de A a P vamos en sentido de las agujas del reloj entonces identificaremos j con el número –x. Decimos en cada caso que la medida de j es x radianes o –x radianes. Cuando recorremos la circunferencia completa partiendo desde A(1,0) en sentido positivo hasta volver a A de nuevo, el ángulo dirigido en que ambas semirrectas inicial y terminal son OA corresponde entonces a la longitud total de la circunferencia unidad, que es 2p. De ese modo, si nos ceñimos a tan sólo la primera vuelta obtendremos una biyección entre los puntos del círculo unidad C y el intervalo de números reales [0,2p]

p/2

0

p

3p/2

2

Figura 5.

Hay otra forma de interpretar la asignación de un número real a un ángulo orientado. Teniendo en cuenta la proporcionalidad directa entre el área de un sector del círculo unidad y el arco correspondiente, la razón de dicha proporcionalidad viene dada por P

área círculo p 1 = = long . circunferencia 2p 2

x S

A

O

x Para un sector de arco x, el área será . Es decir, a un ángulo dirigido 2 positivo de la primera vuelta, le asignamos como medida un número real x Figura 6. entre 0 y 2p, que viene a ser el doble del área del sector S correspondiente. Supongamos ahora un ángulo generalizado superior a una vuelta. El arco contado a partir de A es ahora superior a 2p (y lo mismo ocurre con el doble del área del sector barrido). Es como si el arco se fuera arrollando sobre el círculo unidad. Resultaría, pues, que el ángulo de x radianes y el de x + 2p radianes corresponderían al mismo punto P sobre el círculo unidad, y lo mismo ocurriría con el de x + 4p, x + 6p, ... radianes. Si vamos arrollando al revés, es decir, en sentido de las agujas del reloj, tendríamos que los ángulos de x – 2p, x – 4p, x – 6p, … radianes también corresponden al mismo punto P. Si llamamos w: R ® C a la función de arrollamiento, tendríamos que w (x + 2pk) = w(x) = P(u,v) para todo k Î Z C 1 v

0 –5p/2

–2p

–3p/2

–p

–p/2

0 u

Figura 7.

w

R p/2

p

3p/2

2p

5p/2

3p

Nuestra definición dada de seno y coseno, se traduce ahora en: Para todo x Î (–¥,+¥) es: cos x = abcisa de w (x) = u sen x = ordenada de w (x) = v TEMARIO DE MATEMÁTICAS. PRUEBA A

393

Volumen I. Matemáticas

394

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Figura 9.

Como consecuencias: 1.

cos (x + 2pk) = cos x, sen (x + 2pk) = sen x, para cualquier k Î Z.

2.

cos2 x + sen2 x = u2 + v2 = 1, pues P(u,v) está sobre la circunferencia unidad.

T Q

P

P

O

A O

O

A

T

A Q

Q

2.3. Definición de las demás funciones circulares A partir de sen x y cos x , definimos:

P

T

sen x cos x

Tangente

tg x =

Cotangente

cotg x =

En este caso, todos los valores son positivos por serlo u y v. Para los restantes cuadrantes se puede hacer una interpretación similar, pero hay que tener en cuenta los signos correspondientes. Así pues, para sen x, cos x y tgx , las líneas trigonométricas serían: cos x 1 = sen x tg x

1 OP ON ON = = = = ON v PQ OB 1

cosec x = sec x =

1 OP OT OT = = = = OT u OQ OA 1

cotg x =

1 sen x

OA = OB = OP = r = 1

1 cos x

cosec x =

Cosecante

Figura 8.

sec x =

Secante

u NB NB = = = NB v OB 1

Puede darse un significado geométrico sobre el círculo unidad C a tales funciones, enlazando con la definición anterior de las funciones cos x y sen x, como las coordenadas (u,v) del punto w(x) = P. Si supop nemos 0 < x < , la longitud del arco será menor que un cuarto de circunferencia y estaremos en el primer 2 cuadrante. La semejanza de triángulos nos da: Q

u

A

tg x =

v

P

T

v TA TA = = = TA u OA 1

cos x = u = OQ

N

sen x = v = PQ

sen x = v = PQ

B

N

O

B

cos x = u = OQ

T

Puede darse un significado geométrico sobre el círculo unidad C a tales funciones, enlazando con la definición anterior de las funciones cos x y sen x, como las coordenadas (u,v) del punto w(x) = P. Si supop nemos 0 < x < , la longitud del arco será menor que un cuarto de circunferencia y estaremos en el primer 2 cuadrante. La semejanza de triángulos nos da: A

cotg x =

cotg x =

cosec x =

Figura 8.

Cotangente

OA = OB = OP = r = 1

1 OP OT OT = = = = OT u OQ OA 1 1 cos x

sec x =

u NB NB = = = NB v OB 1

sec x =

Q

Secante

u

v TA TA = = = TA u OA 1

1 sen x

O

tg x =

cosec x =

v

Cosecante

P

1 OP ON ON = = = = ON v PQ OB 1

cos x 1 = sen x tg x

En este caso, todos los valores son positivos por serlo u y v. Para los restantes cuadrantes se puede hacer una interpretación similar, pero hay que tener en cuenta los signos correspondientes. Así pues, para sen x, cos x y tgx , las líneas trigonométricas serían: Tangente

tg x =

sen x cos x

T

P

A partir de sen x y cos x , definimos:

2.3. Definición de las demás funciones circulares Q

Q

O

A

A

O

cos2 x + sen2 x = u2 + v2 = 1, pues P(u,v) está sobre la circunferencia unidad.

T

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

394

P

Como consecuencias:

Figura 9.

P

cos (x + 2pk) = cos x, sen (x + 2pk) = sen x, para cualquier k Î Z.

T

1.

Q

A

2.

O

Funciones circulares e hiperbólicas y sus recíprocas

2.4. Propiedades inmediatas 1. sen 0 = 0, sen

p 3p = –1 = 1, sen p = 0, sen 2 2

2. cos 0 = 1, cos

p 3p =0 = 0, cos p = –1, sen 2 2

3. La función seno es impar: sen (–x) = –sen x, " x Î R 4. La función coseno es par: cos (–x) = cos x, " x Î R 5. sen (x +

p p ) = cos x, cos (x + ) = –sen x 2 2

6. sen (x + p) = –sen x, cos (x + p) = –cos x 7. sen (x + 8. sen (

3p 3p ) = cos x, cos (x + ) = –sen x 2 2

p p – x) = cos x, cos ( – x) = sen x 2 2

9. sen (p – x) = sen x, cos (p – x) = –cos x 10. sen(

3p 3p – x) = –cos x, cos( – x) = –sen x 2 2

11. sen (x + 2kp) = sen x, " k Î Z 12. cos (x + 2p) = cos x, " k Î Z 13. tg (x + kp) = tg x, " k Î Z 14. cotg (x + kp) = tg x, " k Î Z 15. sen (x + y) = sen x · cos y + cos x · sen y 16. cos (x + y) = cos x · cos y – sen x · sen y 17. sen (x – y) = sen x · cos y – cos x · sen y 18. cos (x – y) = cos x · cos y + sen x · sen y 19. sen 2x = 2sen x · cos x 20. cos 2x = cos2 x – sen2 x 21. cos2 x + sen2 x = 1 22. 1 + tg2 x = sec2 x 23. cotg2 x + 1 = cosec2 x 24. sen2 x =

1– cos 2x 2

25. cos2 x =

1+ cos 2x 2

æ x+ y ö æx– y ö ÷· cosç ÷ 26. sen x + sen y = 2 senç è 2 ø è 2 ø æ x+ y ö æx– y ö ÷· senç ÷ 27. sen x – sen y = 2 cosç è 2 ø è 2 ø TEMARIO DE MATEMÁTICAS. PRUEBA A

395

Volumen I. Matemáticas

396

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Figura 10.

æ x+ y ö æx– y ö ÷· cosç ÷ 28. cos x + cos y = 2 cosç è 2 ø è 2 ø

|cos a – cos b| w(b)

|sen a – sen b|

æ x+ y ö æx– y ö ÷· senç ÷ 29. cos x – cos y = –2 senç è 2 ø è 2 ø

Las propiedades anteriores se pueden justificar geométricamente, en consonancia con nuestra introducción de las funciones circulares a partir de ángulos orientados sobre el círculo unidad. Otras construcciones más formales por la vía analítica, que no se basan tanto en la noción de ángulo, exigen otro tipo de demostraciones, como veremos adelante. w(a) = (cos a, sen a) w(b) = (cos b, sen b)

w(a)

2.5. Periodicidad Es esta una característica fundamental de las funciones circulares, que las hace sumamente importantes para el tratamiento de multitud de fenómenos (ondas, vibraciones, oscilaciones,...) Dada una función f(x) definida en un dominio D, un “período” es todo número p que cumple: a) x Î D Þ x + p Î D b) f(x + p) = f(x), " x Î D

Se utilizará de nuevo aquí la notación inicial introducida en la sección 2.2. Así pues, el círculo unidad es C = {(u, v) / u2 + v2 = 1} y w(x) la función de arrollamiento de R en C, que a cada número real x asocia el punto P(cos x, sen x) de C, siendo x la longitud del arco desde A(1,0) al punto P. Sea I = [a,b] un intervalo de R con amplitud suficientemente pequeña. Puesto que al arrollar I sobre C no se produce estiramiento, tendremos un arco de longitud |a – b| entre w(a) y w(b).

2.6. Continuidad y derivabilidad de las funciones circulares

Si existe algún número con las condiciones anteriores a f(x) se le denomina “función periódica”. Se verifican: Todo múltiplo de un período es también un período, es decir: f(x + kp) = f(x), " x Î D.

análogamente para la cotangente.

En el caso de la tangente el período primitivo es T = p, ya que tg ( x + p) =

– – –

sen (x+ p ) –sen x = = tg x, y cos (x+ p ) –cos x

La diferencia de dos períodos es otro período.

Si f(x) es una función periódica, no constante, sus períodos son los múltiplos del menor período positivo, y sólo ellos. Al menor período positivo le llamaremos T (período primitivo).

Las seis funciones circulares son periódicas. En el caso del seno, coseno, secante y cosecante el período primitivo es T = 2p.

Las seis funciones circulares son periódicas. En el caso del seno, coseno, secante y cosecante el período primitivo es T = 2p. sen (x+ p ) –sen x En el caso de la tangente el período primitivo es T = p, ya que tg ( x + p) = = = tg x, y cos (x+ p ) –cos x análogamente para la cotangente.

– – –

Si f(x) es una función periódica, no constante, sus períodos son los múltiplos del menor período positivo, y sólo ellos. Al menor período positivo le llamaremos T (período primitivo). La diferencia de dos períodos es otro período.

Todo múltiplo de un período es también un período, es decir: f(x + kp) = f(x), " x Î D.

Si existe algún número con las condiciones anteriores a f(x) se le denomina “función periódica”. Se verifican:

2.6. Continuidad y derivabilidad de las funciones circulares

Es esta una característica fundamental de las funciones circulares, que las hace sumamente importantes para el tratamiento de multitud de fenómenos (ondas, vibraciones, oscilaciones,...) Dada una función f(x) definida en un dominio D, un “período” es todo número p que cumple: a) x Î D Þ x + p Î D b) f(x + p) = f(x), " x Î D

Se utilizará de nuevo aquí la notación inicial introducida en la sección 2.2. Así pues, el círculo unidad es C = {(u, v) / u2 + v2 = 1} y w(x) la función de arrollamiento de R en C, que a cada número real x asocia el punto P(cos x, sen x) de C, siendo x la longitud del arco desde A(1,0) al punto P. Sea I = [a,b] un intervalo de R con amplitud suficientemente pequeña. Puesto que al arrollar I sobre C no se produce estiramiento, tendremos un arco de longitud |a – b| entre w(a) y w(b).

2.5. Periodicidad w(a)

w(a) = (cos a, sen a) w(b) = (cos b, sen b)

Las propiedades anteriores se pueden justificar geométricamente, en consonancia con nuestra introducción de las funciones circulares a partir de ángulos orientados sobre el círculo unidad. Otras construcciones más formales por la vía analítica, que no se basan tanto en la noción de ángulo, exigen otro tipo de demostraciones, como veremos adelante. 396

Figura 10.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

|cos a – cos b|

æ x+ y ö æx– y ö ÷· cosç ÷ 28. cos x + cos y = 2 cosç è 2 ø è 2 ø

w(b)

æ x+ y ö æx– y ö ÷· senç ÷ 29. cos x – cos y = –2 senç è 2 ø è 2 ø

|sen a – sen b|

Funciones circulares e hiperbólicas y sus recíprocas La longitud de la cuerda que une w(a) y w(b) es menor que el arco que la subtiende, y en consecuencia (cos a – cos b)2 + (sen a – sen b)2 £ |a – b| Son obvias las inigualdades (cos a – cos b)2 £ (cos a – cos b)2 + (sen a – sen b)2 (sen a – sen b)2 £ (cos a – cos b)2 + (sen a – sen b)2 que combinadas con la anterior nos llevan a |cos a – cos b| £ |a – b| |sen a – sen b| £ |a – b| Ahora podemos utilizar estos resultados para probar la continuidad de la funciones seno y coseno en cualquier punto x0. En efecto, dado cualquier e > 0 existe d = e, tal que si |x – x0| < d, entonces |cos x – cos x0| £ |x – x0| < e |sen x – sen x0| £ |x – x0| < e Resulta, pues, que: Las funciones reales f(x) = cos x y g(x) = sen x son continuas en todo R (la continuidad es además uniforme). Para las demás funciones circulares vale el teorema relativo a la continuidad de la función cociente de dos funciones continuas. Esto es, la función cociente es continua salvo en aquellos puntos donde la del denominador se anula. Así pues:



ü ì (2k – 1)p Las funciones tg x y sec x son continuas en R – í ,k Î Zý þ î 2



Las funciones cotg x y cosec x son continuas en R – {kp / k Î Z}

Veamos ahora la derivabilidad. La demostración clásica de que las funciones seno y coseno son derivables en todo R se basa en las fórmulas de adición (propiedades 15. y 16. de la sección 2.4.) y en el límite sen h lim = 1. h ®0 h p Para probar dicho límite, consideraremos |h| < , pues nos va a interesar lo que ocurre para h pequeño. Si 2 p es 0 < h < , podemos recurrir a la figura y poner: 2 T Área (D OAP) £ Área (Sector OAP) £ Área (D OAT)

P(cos h,sen h)

1 1 1 sen h £ h £ tg h 2 2 2 Dividiendo entre sen h: 1 £

h 1 £ sen h cos h

Tomando inversos: cos h £

sen h £1 h

1

O

(*)

Q

A(1,0)

Figura 11.

p sen (–h) < h< 0 tomando – h > 0 tendríamos cos (–h) £ £ 1, y como cos (–h) = cos h, 2 –h sen (–h) = –sen h, queda de nuevo (*). Si fuese –

Ahora basta tomar límites en (*) y aplicar la regla del sandwich. TEMARIO DE MATEMÁTICAS. PRUEBA A

397

Volumen I. Matemáticas

398

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Además

De cos2 x + sen2 x = 1 se desprenden |cos x| £ 1, |sen x| £ 1, " x Î R. Es decir, son funciones acotadas sobre R, siendo –1 £ cos x £ 1, –1 £ sen x £ 1, " x Î R. p 3p = cos p = –1, se tendrá que –1 y +1 son los valores máximo y Puesto que sen = cos 0 = 1 y sen = 2 2 mínimo absolutos de tales funciones y por tanto, el recorrido de ambas funciones es el intervalo [–1,+1]. El período de ambas funciones es 2p, como ya vimos. Además, son continuas y derivables en todo R, siendo (sen x)’ = cos x, (cos x)’ = –sen x. sen 2 h sen h 1 cos h – 1 (cos h – 1)(cos h + 1) cos 2 h – 1 =– =– × ×sen h = = h(cos h + 1) h cos h + 1 h h(cos h + 1) h(cos h + 1)

y al pasar al límite tendremos: lim h ®0

cos h – 1 = 0. h

Entonces:

h ®0

æ sen h ö æ cos h – 1ö sen (x + h) – sen x ÷+ sen xç lim ÷= cos x = cos xç lim è x®0 h ø è x®0 ø h h

2.7.1. Gráficas de las funciones seno y coseno

D sen x = lim

æ cos h – 1ö æ sen h ö cos (x + h) – cos x ÷– sen xç lim ÷= –sen x = cos xç lim h ®0 è x®0 ø è x®0 h ø h h

D cos x = lim

Figura 12.

y = cos x

p –– p –– 4 2

3p –– 2

Las derivadas de las demás funciones circulares se obtienen aplicando las conocidas reglas de derivación. 1 0

–1

p

2p

–¥

X

y = tg x –2

2.7. Gráficas de las funciones circulares La gráfica de una función periódica se da, por lo general, solamente en un período. Como la gráfica se repite a intervalos regulares de amplitud T, bastaría deslizar la porción dada en ambas direcciones siguiendo el eje OX, para obtener la gráfica completa. Por otro lado, la interpretación geométrica de las funciones circulares en el intervalo [0,2p], permite construir la gráfica en dicho intervalo de cada una viendo cómo varía la línea trigonométrica correspondiente (ver epígrafe 2.3.) al recorrer el círculo unidad una vuelta. Acompañaremos dicha construcción con una síntesis de las propiedades más relevantes que se reflejan en la gráfica. –1

Y

0

p –– p –– 4 2

3p –– 2

p

2p

X

y = sen x

–1

1

p –– p –– 4 2

0

p

3p –– 2

1

2p

X

2

–¥ +¥

Y

–¥ +¥

Y

Y

Y

La gráfica de una función periódica se da, por lo general, solamente en un período. Como la gráfica se repite a intervalos regulares de amplitud T, bastaría deslizar la porción dada en ambas direcciones siguiendo el eje OX, para obtener la gráfica completa. Por otro lado, la interpretación geométrica de las funciones circulares en el intervalo [0,2p], permite construir la gráfica en dicho intervalo de cada una viendo cómo varía la línea trigonométrica correspondiente (ver epígrafe 2.3.) al recorrer el círculo unidad una vuelta. Acompañaremos dicha construcción con una síntesis de las propiedades más relevantes que se reflejan en la gráfica. 1

0

–1

p –– p –– 4 2

p

3p –– 2

2

X

2p

1

y = sen x

X

0

Y

p –– p –– 4 2

p

3p –– 2

2p

–1

2.7. Gráficas de las funciones circulares –2

–1 1 0

p –– p –– 4 2

p

X 3p –– 2

y = tg x

–¥

2p

Las derivadas de las demás funciones circulares se obtienen aplicando las conocidas reglas de derivación. æ ö æ sen h ö cos (x + h) – cos x cos h – 1 ÷– sen xç lim ÷= –sen x = cos xç lim è x®0 ø è x®0 h ø h h

D cos x = lim

æ sen h ö æ cos h – 1ö sen (x + h) – sen x ÷+ sen xç lim ÷= cos x = cos xç lim è x®0 h ø è x®0 ø h h

D sen x = lim

h ®0

y = cos x

Figura 12.

h ®0

2.7.1. Gráficas de las funciones seno y coseno

De cos2 x + sen2 x = 1 se desprenden |cos x| £ 1, |sen x| £ 1, " x Î R. Es decir, son funciones acotadas sobre R, siendo –1 £ cos x £ 1, –1 £ sen x £ 1, " x Î R. p 3p = cos p = –1, se tendrá que –1 y +1 son los valores máximo y Puesto que sen = cos 0 = 1 y sen = 2 2 mínimo absolutos de tales funciones y por tanto, el recorrido de ambas funciones es el intervalo [–1,+1]. El período de ambas funciones es 2p, como ya vimos. Además, son continuas y derivables en todo R, siendo (sen x)’ = cos x, (cos x)’ = –sen x. Entonces:

h ®0

y al pasar al límite tendremos: lim

cos h – 1 = 0. h

sen 2 h sen h 1 cos h – 1 (cos h – 1)(cos h + 1) cos 2 h – 1 =– =– × ×sen h = = h(cos h + 1) h cos h + 1 h h(cos h + 1) h(cos h + 1)

Además

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

398

Funciones circulares e hiperbólicas y sus recíprocas De ahí que los puntos singulares de ambas funciones (donde presentan los máximos y mínimos loca(2k – 1)p = 0 y sen kp = 0, para todo k Î Z. Tendríamos que los punles) se obtienen de las relaciones cos 2 (2k – 1)p , mientras que la función tos críticos o estacionarios de la función seno se obtienen para x = 2 coseno los presenta para x = kp. Las gráficas extendidas a todo R son las siguientes: y

y = sen x

Figura 13. 1

–p/2 –2p

x

–p

p/2 p

0 –1

2p

y

y = cos x

1

3p/2

p/2 –2p

–p

0

3p

p

x 2p

–1

Figura 14.

2.7.2. Gráficas de las funciones tangente y cotangente El período de las funciones es ahora p, presentando discontinuidades de salto infinito en los puntos en (2k – 1)p (" k Î Z), mientras que anulan cos x y sen x. Así pues, la función y = tg x es discontinua en x = 2 que la función y = cotg x lo es en x = kp (" k Î Z). Las gráficas tienen asíntotas verticales en tales puntos. p p Podemos tomar para y = tg x el período comprendido entre – y , y para la función y = cotg x el 2 2 comprendido entre 0 y p. Las gráficas completas se obtienen por repetición a intervalos regulares a izquierda y derecha del de partida. y

y

p

–p –p/2

0

p/2

x

p/2

–p/2 –3p/2

y = tg x

–p

0

x p

3p/2

y = cotg x

Figura 15. TEMARIO DE MATEMÁTICAS. PRUEBA A

399

Volumen I. Matemáticas

400

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

PROPOSICIÓN: Si f: [a,b] ® R es estrictamente creciente/decreciente y continua, entonces define una biyección de [a,b] en [f(a),f(b)] y su recíproca f-1 es también continua y estrictamente creciente/decreciente. p p Los intervalos elegidos para la restricción a una función uno a uno son el [– , ] para el caso de las 2 2 funciones seno y tangente, y el [0,p] para el caso de coseno y cotangente. Obtenemos así las restricciones biyectivas: p p p p sen: [– , ] ® [–1,+1] tg: [– , ] ® ]–¥,+¥[ 2 2 2 2 cos: [0,p] ® [–1,+1] cotg: [0,p] ® ]–¥,+¥[

2.7.3. Gráficas de las funciones secante y cosecante

A partir de las propiedades de coseno y seno son inmediatas las siguientes consideraciones acerca de las funciones y = sec x e y = cosec x

– – –

El recorrido de ambas es ]–¥, –1] È [+1,¥[



La función y = cosec x presenta discontinuidades (asíntotas verticales) en los puntos donde se anula sen x, o sea, en x = kp ("kÎZ) y y Figura 16.

El período de ambas es 2p

La función y = sec x presenta discontinuidades (asíntotas verticales) en los puntos donde se anu(2k – 1)p la cos x, o sea, en x = (" k Î Z) 2

La función sen: R ® [–1,+1] no es uno a uno, pues sen x = sen (x + 2kp). Ni siquiera si nos ceñimos a la primera vuelta, o sea, para x Î [0,2p], ya que para un mismo valor del intervalo [–1,+1], salvo para -1 y +1 , hay dos números de [0,2p] cuyo seno tiene dicho valor. Sin embargo, si restringimos el dominio de la función seno a un intervalo conveniente podemos construir una función uno a uno f que tendrá una recíproca f-1. Existen muchas maneras de hacerlo. Algunos p p p 3p 3p 5p dominios posibles son: [– , ], [ , ], [ , ], etc., y en realidad cualquiera de ellos se puede elegir in2 2 2 2 2 2 p p distintamente. Se acostumbra, sin embargo, a elegir el intervalo [– , ]. 2 2 Podemos hacer uso de un enunciado general, que es consecuencia inmediata del teorema de Darboux o de valores intermedios para una función continua en un intervalo cerrado y acotado. 1

1

x

p

–p/2

p/2

0

2p x

p

3p/2

p/2

0

–1

3p/2

–1

3. FUNCIONES INVERSAS DE LAS CIRCULARES: FUNCIONES CICLOMÉTRICAS

y = sec x

y = cosec x

y = sec x

y = cosec x

3. FUNCIONES INVERSAS DE LAS CIRCULARES: FUNCIONES CICLOMÉTRICAS

La función sen: R ® [–1,+1] no es uno a uno, pues sen x = sen (x + 2kp). Ni siquiera si nos ceñimos a la primera vuelta, o sea, para x Î [0,2p], ya que para un mismo valor del intervalo [–1,+1], salvo para -1 y +1 , hay dos números de [0,2p] cuyo seno tiene dicho valor. Sin embargo, si restringimos el dominio de la función seno a un intervalo conveniente podemos construir una función uno a uno f que tendrá una recíproca f-1. Existen muchas maneras de hacerlo. Algunos p p p 3p 3p 5p dominios posibles son: [– , ], [ , ], [ , ], etc., y en realidad cualquiera de ellos se puede elegir in2 2 2 2 2 2 p p distintamente. Se acostumbra, sin embargo, a elegir el intervalo [– , ]. 2 2 Podemos hacer uso de un enunciado general, que es consecuencia inmediata del teorema de Darboux o de valores intermedios para una función continua en un intervalo cerrado y acotado. –1

–p/2

0

–1

3p/2

p/2

p

1



0

3p/2

p/2

p

x

2p x

1

La función y = cosec x presenta discontinuidades (asíntotas verticales) en los puntos donde se anula sen x, o sea, en x = kp ("kÎZ) y y Figura 16.

PROPOSICIÓN: Si f: [a,b] ® R es estrictamente creciente/decreciente y continua, entonces define una biyección de [a,b] en [f(a),f(b)] y su recíproca f-1 es también continua y estrictamente creciente/decreciente. p p Los intervalos elegidos para la restricción a una función uno a uno son el [– , ] para el caso de las 2 2 funciones seno y tangente, y el [0,p] para el caso de coseno y cotangente. Obtenemos así las restricciones biyectivas: p p p p sen: [– , ] ® [–1,+1] tg: [– , ] ® ]–¥,+¥[ 2 2 2 2 cos: [0,p] ® [–1,+1] cotg: [0,p] ® ]–¥,+¥[

La función y = sec x presenta discontinuidades (asíntotas verticales) en los puntos donde se anu(2k – 1)p (" k Î Z) 2 la cos x, o sea, en x =

– – –

El período de ambas es 2p

El recorrido de ambas es ]–¥, –1] È [+1,¥[

A partir de las propiedades de coseno y seno son inmediatas las siguientes consideraciones acerca de las funciones y = sec x e y = cosec x

2.7.3. Gráficas de las funciones secante y cosecante

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

400

Funciones circulares e hiperbólicas y sus recíprocas cuyas gráficas son: y y = sen x

1

x –p/2

p/2

0

y

–1 1 –p/2

x 0 –1

p/2

y y = cos x 1 y = tg x

x

p/2

p

0 –1

Figura 17.

Haciendo uso de la proposición anterior podemos definir las funciones recíprocas de las anteriores: sen–1, cos–1, tg–1 y cotg–1. Usualmente se denominan respectivamente arco seno, arco coseno, arco tangente y arco cotangente: p p arcsen: [–1,+1] ® [– , ] 2 2

p p arctg: ]–¥,+¥[ ® [– , ] 2 2

arccos: [–1,+1] ® [0,p]

arccotg: ]–¥,+¥[ ® [0,p]

Las gráficas correspondientes se obtienen de las anteriores tomando las simétricas respecto a la recta y = x, con lo que resultan las siguientes: y

y

p/2

p

y

y = arccos x

p/2

y = sen x

0

x –1

p/2

y = arctg x –p/2

1

0

–p/2

x

x –1

TEMARIO DE MATEMÁTICAS. PRUEBA A

0

1

Figura 18. 401

Volumen I. Matemáticas

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

sh 0 = 0 ch 0 = 1 El seno hiperbólico es una función impar: sh(–x) = –sh x para cualquier x Î R. El coseno hiperbólico es una función par: ch(–x) = ch x para cualquier x Î R. sh x > 0 para cualquier x Î R+.

En el caso de las funciones secante y cosecante puede elegirse respectivamente los dominios p p p p [0, [È] ,p] y [– ,0[È]0, ] 2 2 2 2 y obtendremos las funciones inversas p p arcsec: ]–¥,–1]È[+1,+¥[ ® [0, [È] ,p] 2 2 p p ,0[È]0, ] 2 2

402

1. 2. 3. 4. 5.

4.2. Propiedades inmediatas

arccosec: ]–¥,–1]È[+1,+¥[ ® [–

Se trata de funciones reales de variable real cuyo dominio de definición o campo de existencia es todo R en el caso de sh, ch, th y sech, mientras que coth y cosech están definidas en el dominio es R –{0}.

Omitiremos las gráficas de las mismas. Para obtener las derivadas de las funciones anteriores (llamadas también ciclométricas) nos basamos en las reglas de derivación de la función recíproca. A partir de las anteriores también pueden definirse las siguientes 1 ch x Cotangente hiperbólica coth x = = th x sh x 1 Secante hiperbólica sech x = ch x 1 Cosecante hiperbólica cosech x = sh x

Ejemplo:

æ ö dy ç dx 1 1 ÷ = 1 = = =ç ÷ dx è dy ø cos y 1– sen 2 y 1– x2 –1

Si y = arcsen x, entonces x = sen y, teniendo y’ = Tomamos la raíz cuadrada positiva ya que –

p p < y < y, por tanto, cos y > 0 2 2

Coseno hiperbólico

ch x =

ex + e–x 2

Tangente hiperbólica

th x =

sh x ex – e–x = ch x ex + e–x

4. FUNCIONES HIPERBÓLICAS 4.1. Definición

A partir de la función exponencial de variable real exp: R ®: R definimos las funciones: sh x =

ex – e–x 2

Seno hiperbólico

Seno hiperbólico

sh x ex – e–x = ch x ex + e–x

th x =

ex + e–x 2

ch x =

ex – e–x 2

sh x =

A partir de la función exponencial de variable real exp: R ®: R definimos las funciones:

4. FUNCIONES HIPERBÓLICAS 4.1. Definición

Coseno hiperbólico Tangente hiperbólica

p p < y < y, por tanto, cos y > 0 2 2

A partir de las anteriores también pueden definirse las siguientes 1 ch x Cotangente hiperbólica coth x = = th x sh x 1 Secante hiperbólica sech x = ch x 1 sh x

Tomamos la raíz cuadrada positiva ya que –

Si y = arcsen x, entonces x = sen y, teniendo y’ =

dy æ dx ö 1 1 1 = = =ç ç ÷ ÷ = dx è dy ø cos y 1– sen 2 y 1– x2 –1

Ejemplo:

Omitiremos las gráficas de las mismas. Para obtener las derivadas de las funciones anteriores (llamadas también ciclométricas) nos basamos en las reglas de derivación de la función recíproca. Cosecante hiperbólica

cosech x =

Se trata de funciones reales de variable real cuyo dominio de definición o campo de existencia es todo R en el caso de sh, ch, th y sech, mientras que coth y cosech están definidas en el dominio es R –{0}. En el caso de las funciones secante y cosecante puede elegirse respectivamente los dominios p p p p [0, [È] ,p] y [– ,0[È]0, ] 2 2 2 2 y obtendremos las funciones inversas p p arcsec: ]–¥,–1]È[+1,+¥[ ® [0, [È] ,p] 2 2 p p arccosec: ]–¥,–1]È[+1,+¥[ ® [– ,0[È]0, ] 2 2

4.2. Propiedades inmediatas 1. 2. 3. 4. 5.

sh 0 = 0 ch 0 = 1 El seno hiperbólico es una función impar: sh(–x) = –sh x para cualquier x Î R. El coseno hiperbólico es una función par: ch(–x) = ch x para cualquier x Î R. sh x > 0 para cualquier x Î R+.

402

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones circulares e hiperbólicas y sus recíprocas 6. ch x > 0 para cualquier x Î R. 7. sh (x + y) = sh x ch y + ch x sh y 8. ch (x + y) = ch x ch y + sh x sh y 9. sh (x – y) = sh x ch y – ch x sh y 10. ch (x – y) = ch x ch y – sh x sh y 11. sh 2x = 2 sh x ch x 12. ch 2x = ch2 x + sh2 x 13. ch2 x – sh2 x = 1 14. th2 x + sech2 x = 1 15. coth2 x – cosech2 x = 1 ch 2x+ 1 16. ch2 x = 2 ch 2x – 1 2 17. sh x = 2 18. (ch x + sh x)n = ch nx + sh nx (para n entero) La justificación de las propiedades 1, 2, 3 y 4 es elemental. Asimismo 6 es trivial, pues los valores de ex y de e–x son positivos para cualquier x real. ex (ex – e–x ) e2x – 1 y tener en cuenta que si x > 0, la exponencial Para probar 5 basta poner sh x = = 2ex 2ex 2x e toma valores superiores a la unidad. Las fórmulas de adición 7 y 8 se obtienen operando. Así por ejemplo, la 7: ex – e–x e y + e –y e x + e –x e y – e –y sh x ch y + ch x sh y = × + × = 2 2 2 2 1 1 = (e x+y + e x– y – e–x+y – e –x– y )+ (e x+y – ex– y + e–x+y – e–x– y )= 4 4 1 e x+y – e –(x+y) = (2ex+y – 2e–x– y ) = = sh (x+ y) 4 2 La 8. se obtiene de manera análoga. Si ponemos sh (x – y) = sh [x + (– y)] y ch (x – y) = ch [x + (– y)], desarrollamos en virtud de 7 y 8, y tenemos en cuenta que sh es impar y ch es par, llegamos a 9 y 10. Las propiedades 11 y 12 salen de particularizar 7 y 8 cuando x = y. Asimismo, si ponemos x = y en 10 obtenemos 1 = ch 0 = ch (x – x) = ch x ch x – sh x sh x = ch2 x – sh2 x lo que prueba 13. Las 14 y 15 resultan inmediatamente de 13 dividiendo por ch2 x y por sh2 x, respectivamente. Las 16 y 17 salen asimismo sumando y restando respectivamente 12 y 13. La 18 es parecida a la fórmula de Moivre (cos x + i sen x)n = cos nx + i sen nx, y se prueba fácilmente: æ ex + e–x ex – e–x ö enx + e–nx enx – e–nx nx ÷ + = ch nx+ sh nx (ch x+ sh x)n = ç + ç ÷ =e = 2 2 2 ø è 2 n

Observación: Pueden obtenerse asimismo fórmulas de adición a partir de las anteriores para th y coth, fórmulas para la conversión de sumas en productos y fórmulas para el argumento mitad. TEMARIO DE MATEMÁTICAS. PRUEBA A

403

Volumen I. Matemáticas

404

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA x ®+¥

x ®+¥

lim(ch x) = lim

e x + e –x (+¥ ) + 0 = = +¥ 2 2

4.3. Gráficas de las funciones hiperbólicas

Procederemos a un estudio analítico de las funciones anteriores con el objeto de dibujar sus gráficas x ®– ¥

x ®– ¥

lim (ch x) = lim

ex + e–x 0 + (+¥ ) = = +¥ 2 2

a) y = sh x – El dominio de la función es todo R, como ya se vio. Además no corta a los ejes coorde– Como sh 0 = 0, la gráfica pasa por el origen de coordenadas. x –x – –

No tiene asíntotas, siendo

Al ser una función par, la gráfica es simétrica respecto del eje OY. de ch x son siempre estrictamente positivos.

nados en ningún otro punto, ya que: y = 0 Û e = e Û x = –x Û x = 0.

b) y = ch x – El dominio de la función es todo R. – Como ch 0 = 1 , la gráfica pasa por el punto (0,1). Además, no corta al eje OX, ya que los valores – –

Al ser una función impar, la gráfica es simétrica respecto de (0,0). No tiene asíntotas, siendo

ex – e –x 0 – (+¥ ) = = –¥ x ®– ¥ x ®– ¥ 2 2 ex – e–x (+¥ ) – 0 lim (sh x) = lim = = +¥ x ®+¥ x ®+¥ 2 2 lim (sh x) = lim



Es una función continua y derivable en todo R, por serlo ex y e–x, y además d d æ ex – e –x ö ex + e–x ÷ y'= (sh x) = ç = ch x ç ÷= dx dxè 2 ø 2



Como ch x > 0 para cualquier x real, resulta que la función seno hiperbólico es estrictamente creciente en toda la recta real. No tiene, por tanto, puntos singulares.

0

x

sh x

Figura 19. Figura 19. sh x

Como ch x > 0 para cualquier x real, resulta que la función seno hiperbólico es estrictamente creciente en toda la recta real. No tiene, por tanto, puntos singulares. y'=



d d æ ex – e –x ö ex + e–x ç ÷ (sh x) = ç = = ch x ÷ dx dxè 2 ø 2 0



x

Es una función continua y derivable en todo R, por serlo ex y e–x, y además No tiene asíntotas, siendo ex – e –x 0 – (+¥ ) lim (sh x) = lim = = –¥ x ®– ¥ x ®– ¥ 2 2 ex – e–x (+¥ ) – 0 = = +¥ 2 2 x ®+¥

x ®+¥

lim (sh x) = lim

b) y = ch x – El dominio de la función es todo R. – Como ch 0 = 1 , la gráfica pasa por el punto (0,1). Además, no corta al eje OX, ya que los valores – –

Al ser una función impar, la gráfica es simétrica respecto de (0,0).

nados en ningún otro punto, ya que: y = 0 Û e = e Û x = –x Û x = 0.

de ch x son siempre estrictamente positivos.

a) y = sh x – El dominio de la función es todo R, como ya se vio. Además no corta a los ejes coorde– Como sh 0 = 0, la gráfica pasa por el origen de coordenadas. x –x – –

Al ser una función par, la gráfica es simétrica respecto del eje OY. No tiene asíntotas, siendo

ex + e–x 0 + (+¥ ) = = +¥ x ®– ¥ 2 2

lim (ch x) = lim

x ®– ¥

Procederemos a un estudio analítico de las funciones anteriores con el objeto de dibujar sus gráficas e x + e –x (+¥ ) + 0 = = +¥ x ®+¥ 2 2

404

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

x ®+¥

4.3. Gráficas de las funciones hiperbólicas

lim(ch x) = lim

Funciones circulares e hiperbólicas y sus recíprocas





Es una función continua y derivable en todo R, por serlo ex y e–x, y además d d æ ex + e–x ö ex – e–x ÷ y'= (ch x) = ç = sh x ç ÷= dx dxè 2 ø 2 ì< 0para x < 0 1 Como sh x = e–x (e2x – 1)í resulta ahora que la función es estrictamente decre2 î> 0para x > 0 ciente en el intervalo (–¥, 0) y estrictamente creciente en (0, +¥). En consecuencia, el punto (0,1) es el único punto singular, donde la función presenta un mínimo local. ch x

Figura 20. 1 x

0

c) y = th x – – – – –

El dominio de la función es todo R. sh 0 0 Como th 0 = = = 0, la gráfica pasa por el punto (0,0) y no corta a los ejes coordenados en ch 0 1 ningún otro punto. sh (–x) sh x Es una función impar, ya que th (–x) = = = –th x, por lo que su gráfica es simétrich (–x) ch x ca respecto del origen de coordenadas. ex (e x – e –x ) e 2x – 1 Como podemos poner th x = x x –x = 2x , se desprende que |th x| £ 1 para cualquier x; o e (e + e ) e + 1 sea, se trata de una función acotada entre –1 y +1. Sí tiene asíntotas, pues e 2x – 1 0 – 1 = = –1 2x x ®– ¥ e +1 0+1

lim (th x) = lim

x ®– ¥

e2x – 1 2e2x = lim 2x = 1 2x x ®+¥ x ®+¥ e + 1 x®+¥ 2e (En el segundo límite hemos aplicado L’Hôpital) Por consiguiente las rectas y = -1 e y = +1 son asíntotas horizontales. lim(th x) = lim



Es una función continua y derivable en todo R, por serlo sh x y ch x , y además d d æ sh x ö ch 2 x – sh 2 x 1 ÷= y'= (th x) = ç = 2 = sec2 x > 0 dx dxè ch x ø ch 2 x ch x th x

Lo cual significa que la función th es estrictamente creciente en todo su dominio y no presenta puntos singulares.

+1 x 0

Figura 21.

TEMARIO DE MATEMÁTICAS. PRUEBA A

–1

405

Volumen I. Matemáticas

406

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

argch x = ln (x+ x2 – 1)

(x ³ 1)

A partir de las tres gráficas obtenidas podemos construir las de las restantes funciones hiperbólicas, ya que 1 1 1 cosech x = ; sech x = ; cth x = sh x ch x th x

Hemos de tener en cuenta que y Î R+, por lo que ey > 1. Ello conlleva que debemos optar por ey = = x+ x2 – 1 . Tomando logaritmos llegaremos a: 2x± 4x2 – 4 = x± x2 – 1 2 sech x

z=

cosech x

cth x

+1

+1

Haciendo e y = z, la ecuación anterior se reduce ahora a z2 – 2xz + 1 = 0. Al resolverla obtenemos: ey + e–y Û ey – 2x + e–y = 0 Û e2y – 2x ey + 1 = 0. 2 0

x

y = argch x Û x = ch y =

0

0

x

x

La función y = ch x tiene de dominio R y recorrido [1,+¥), pero no es inyectiva, pues es una función par. Sin embargo la restricción ch: R+ ® [1,+¥) sí es una biyección, cuya recíproca ch–1: [1,+¥) ® R+ denominamos argumento coseno hiperbólico y denotamos por argch. De manera análoga a la anterior: –1

Figura 22.

argsh x = ln (x+ x2 + 1)

(–¥ < x < +¥)

5. FUNCIONES INVERSAS DE LAS HIPERBÓLICAS

Por tanto:

y = ln (x+ x2 + 1)

Como la función y = sh x es estrictamente creciente y continua en todo R, y no está acotada ni superior ni inferiormente, resulta ser una biyección de R en R. Por lo tanto existe la función recíproca sh–1 a la que denominamos argumento seno hiperbólico y denotamos por argsh. Vamos a obtener su expresión analítica Pero, como ey debe ser siempre positivo, tendremos ey = x+ x2 + 1 y tomando logaritmos z=

2x± 4x2 + 4 = x± x2 + 1 2

y = argsh x Û x = sh y =

ey – e–y Û ey – 2x – e–y = 0 Û e2y – 2x ey – 1 = 0. 2

Haciendo ey = z, la ecuación anterior se reduce a la de 2º grado z2 – 2xz – 1 = 0, que resuelta nos da: Haciendo ey = z, la ecuación anterior se reduce a la de 2º grado z2 – 2xz – 1 = 0, que resuelta nos da: y = argsh x Û x = sh y =

ey – e–y Û ey – 2x – e–y = 0 Û e2y – 2x ey – 1 = 0. 2 z=

2x± 4x2 + 4 = x± x2 + 1 2

Como la función y = sh x es estrictamente creciente y continua en todo R, y no está acotada ni superior ni inferiormente, resulta ser una biyección de R en R. Por lo tanto existe la función recíproca sh–1 a la que denominamos argumento seno hiperbólico y denotamos por argsh. Vamos a obtener su expresión analítica Pero, como ey debe ser siempre positivo, tendremos ey = x+ x2 + 1 y tomando logaritmos y = ln (x+ x2 + 1)

Por tanto:

5. FUNCIONES INVERSAS DE LAS HIPERBÓLICAS argsh x = ln (x+ x2 + 1)

(–¥ < x < +¥)

La función y = ch x tiene de dominio R y recorrido [1,+¥), pero no es inyectiva, pues es una función par. Sin embargo la restricción ch: R+ ® [1,+¥) sí es una biyección, cuya recíproca ch–1: [1,+¥) ® R+ denominamos argumento coseno hiperbólico y denotamos por argch. De manera análoga a la anterior:

Figura 22.

–1

0

x

0

x

0

y = argch x Û x = ch y =

ey + e–y Û ey – 2x + e–y = 0 Û e2y – 2x ey + 1 = 0. 2

x

Haciendo e y = z, la ecuación anterior se reduce ahora a z2 – 2xz + 1 = 0. Al resolverla obtenemos: +1

+1

2x± 4x2 – 4 = x± x2 – 1 2 sech x

cosech x

1 ; sh x

z=

1 ; ch x

cth x

1 th x

Hemos de tener en cuenta que y Î R+, por lo que ey > 1. Ello conlleva que debemos optar por ey = = x+ x2 – 1 . Tomando logaritmos llegaremos a: cosech x =

sech x =

cth x =

A partir de las tres gráficas obtenidas podemos construir las de las restantes funciones hiperbólicas, ya que argch x = ln (x+ x2 – 1) (x ³ 1)

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

406

Funciones circulares e hiperbólicas y sus recíprocas La función y = th x es una biyección de R en (–1,+1), por lo cual la función recíproca th–1: (–1,+1) ® R es también biyectiva. La simbolizaremos por argth y la denominaremos argumento tangente hiperbólica. Entonces: 1+ x ey – e–y e2y – 1 . Û x(e2y + 1) = e2y – 1 Û e2y = y = argth x Û x = th y = y –y = 2y 1– x e +e e +1 1 1+ x . Por lo tanto Al tomar logaritmos neperianos llegamos a y = ln 2 1– x argch x = ln

1+ x 1– x

(–1 < x < +1)

Para las gráficas de las funciones anteriores, tomaremos las simétricas respecto de y = x, de las de sh x, ch x y th x. argth x

argch x

argsh x

0

x x

0

1

x



0

+

Figura 23. También son válidas las relaciones: argcoth x = ln

æ 1ö 1+ x = argthç ÷, |x| > 1 è xø 1– x

æ 1+ 1– x2 ö 1ö ÷= argchæ ç ÷, 0 < x £ 1 argsech x = lnç ç ÷ è x xø è ø æ1 1+ x2 ö 1ö ÷= argshæ ç ÷, x ¹ 0 argcosech x = lnç + çx ÷ è xø x ø è

6. SIMILITUDES ENTRE LAS FUNCIONES CIRCULARES Y LAS HIPERBÓLICAS Puede apreciarse un paralelismo grande entre unas y otras funciones en lo que se refiere a las fórmulas obtenidas para unas y otras. Aparte de ello, pretendemos destacar aquí algunas razones que justifican un estudio compartido de ambas.

6.1. Una interpretación geométrica análoga La identidad fundamental cos2 x + sen2 x = 1 es la consecuencia de que se hayan definido el coseno y el seno como coordenadas de un punto sobre la circunferencia fundamental. Así pues, las ecuaciones ì x = cos t í , para 0 £ t £ 2p, representan una parametrización de la circunferencia unidad, de ecuación îy = sen t cartesiana x2 + y2 = 1. Vimos que el área del sector OAP es t/2, si O es el origen de coordenadas, A el punto (1,0) y P el punto (cos t,sen t). Entonces el parámetro t representa el doble del área del sector OAP La identidad ch2x – sh2x = 1 sugiere una interpretación similar a la de cos2x + sen2x = 1. TEMARIO DE MATEMÁTICAS. PRUEBA A

407

Volumen I. Matemáticas

408

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ìx = ch t En efecto, las ecuaciones paramétricas í corresponden a una hipérbola equilátera, que en carteîy = sh t sianas vendría dada por la ecuación reducida x2 – y2 = 1 (donde los semiejes real e imaginario son a = b = 1). Como ch t > 0 , las ecuaciones paramétricas anteriores sólo representan la rama de la derecha de la hipérbola.

Lo anterior explica que lim (th x) = ±1, pues el radio vector OM tiende a confundirse con una u otra x®±¥ asíntota y AT con el semieje imaginario. th x =

sh x AT AT = = = AT chx OA 1

Al verificar el punto A la ecuación de la hipérbola x2 – y2 = 1, tendremos OA = 1. Por semejanza de triángulos es y

ch t sh t 1 t ch t sh t 1é sh 2t ù t – tú = – ò (ch 2t – 1)dt = – ê û0 2 2 2ë 2 2 20 (cos t,sen t)

x

xy x ch t sh t t ch t sh t t – ò ydx = – ò sh t d(ch t) = – ò sh 2 t dt = 2 2 2 0 1

0

En efecto

2

(cosh t,senh t)

Área AOM=

t

x

=

y

2

2

2

x –y =1

x +y =1

Figura 24.

Esto justifica la denominación de funciones circulares e hiperbólicas ch t

Si ahora consideramos sobre la hipérbola el punto M(cht, sht), podemos ver que el parámetro “t” nos da también el doble del área del sector AOM (con el signo de y) O

A

t 2

x

sh t y

Figura 25. M

T T

M

Figura 25.

y

sh t t 2

x

Si ahora consideramos sobre la hipérbola el punto M(cht, sht), podemos ver que el parámetro “t” nos da también el doble del área del sector AOM (con el signo de y) O

A

ch t

Esto justifica la denominación de funciones circulares e hiperbólicas Figura 24. x +y =1

x –y =1

2

2

2

Área AOM=

2

En efecto

xy x ch t sh t t ch t sh t t 2 – ò ydx = – ò sh t d(ch t) = – ò sh t dt = 2 2 2 1 0 0 x

t

ch t sh t 1 t ch t sh t 1é sh 2t ù t – tú = – ò (ch 2t – 1)dt = – ê û0 2 2 20 2 2ë 2 (cos t,sen t)

x

=

(cosh t,senh t)

Al verificar el punto A la ecuación de la hipérbola x2 – y2 = 1, tendremos OA = 1. Por semejanza de triángulos es y

y

ìx = ch t En efecto, las ecuaciones paramétricas í corresponden a una hipérbola equilátera, que en carteîy = sh t sianas vendría dada por la ecuación reducida x2 – y2 = 1 (donde los semiejes real e imaginario son a = b = 1). Como ch t > 0 , las ecuaciones paramétricas anteriores sólo representan la rama de la derecha de la hipérbola. th x =

sh x AT AT = = = AT chx OA 1

Lo anterior explica que lim (th x) = ±1, pues el radio vector OM tiende a confundirse con una u otra x®±¥ asíntota y AT con el semieje imaginario. CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

408

Funciones circulares e hiperbólicas y sus recíprocas En general las ecuaciones paramétricas ìx = a cos t í îy = b sen t

ìx = a ch t í îy = b sh t

representan respectivamente una elipse y una hipérbola cuyas ecuaciones reducidas son x2 y 2 + = 1, a 2 b2

x2 y 2 – =1 a 2 b2

6.2. Definición a partir de la exponencial Sumando y restando las expresiones de ch x y sh x, obtenemos: (1) ch x + sh x = ex

y

(2) ch x – sh x = e-x

ch x

La primera expresa la exponencial a partir de las funciones hiperbólicas. La segunda explica que las gráficas de ch x y sh x tienden a juntarse en el infinito, ya que x ®+¥

x ®+¥

¥

¥

sh x =

1 –x —e 2 x

n

x tiene radio de convergenn = 0 n! cia infinito y es el desarrollo en serie de potencias de la función exponencial de variable real ex. Si cambiamos x por –x , obtenemos el desarrollo de e–x . Nuestra definición de seno y coseno hiperbólicos se traduce en En el campo real la serie å

1

1 x —e 2

lim (ch x – sh x) = lim e –x = 0

1 x –x x2n+1 (e – e ) = å 2 n = 0 (2n + 1)!

sh x

Figura 26. ¥

ch x =

1 x x2n (e + e–x) = å 2 n = 0 (2n)!

que son también series convergentes en todo R. Veamos ahora que las funciones circulares seno y coseno también pueden introducirse de una manera similar. ¥

zn es absolutamente convergente en C. La suma de esa serie es pren = 0 n! cisamente la definición de la función exponencial ez de variable compleja. En particular si z = ix , con x Î R, tendremos: En el campo complejo la serie å

2n ö æ (ix)n æ x2 x x3 x2n+1 ö n x n ÷ ÷ =ç ÷+ iç ç1– + ...+(–1) ç – + ...+(–1) ÷ (2n)!ø è 1! 3! (2n + 1)!ø è 2! n = 0 n! ¥

eix =

å

donde las dos series que aparecen en el segundo miembro son convergentes con radio de convergencia infinito. La fórmula anterior muestra que e–ix es imaginario conjugado de eix, de donde el cuadrado del módulo es la unidad, es decir: |eix|2 = eix · e–ix = 1 Ello significa que el afijo de eix está sobre la circunferencia unidad U. Los números complejos de módulo 1 forman un grupo multiplicativo y la aplicación x ® eix es un homomorfismo del grupo aditivo (R,+) TEMARIO DE MATEMÁTICAS. PRUEBA A

409

Volumen I. Matemáticas

410

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

en el grupo multiplicativo (U, ×). Se puede probar que el núcleo de dicho homomorfismo está constituido por los múltiplos enteros de un número real positivo, que por definición se denota por 2p. Las funciones seno y coseno de variable real se pueden definir a partir de eix como:

D arg coth x = D arg th x =

1 (|x| ³1) 1– x2

1 (|x| < 1) 1– x2

cos x = Re{eix} =

¥

eix + e–ix x2n = å(–1)n 2 (2n)! n= o

x –1 2

¥

D arg ch x =

eix – e–ix x2n+1 = å(–1)n 2i (2n + 1)! n= o

–1 1+ x2

1 1+ x2 2

–1 2

sen x = Im{eix} =

D arc cotg x = D arc tg x =

1– x D arc cos x =

1– x D arc sen x =

1

x +1 2

D arg sh x =

Tras esta definición queda eix = cos x + i sen x (identidad de Euler), que se corresponde con la ex = = ch x + sh x.

1

1

D cos x = – sen x

D ch x = sh x

D tg x = 1 + tg2x

D th x = 1 – th2x

D cotg x = 1 + cotg2x

D coth x = 1 – coth2x

Se prueban ahora fácilmente las correspondientes propiedades de las funciones seno y coseno, a partir de propiedades de las exponenciales. Así pues, podemos ver algunos ejemplos:

sen (–x) =



e0 = 1 Þ cos 0 = 1, sen 0 = 0



ei(–x) – e–i(–x) ei– x – eix) = = –sen x 2i 2i

D sen x = cos x

D sh x = ch x

cos (



cos (x + y) = Re(ei(x + y)) = Re(eix eiy) = Re((cos x + i sen x) (cos y + i sen y)) = = cos x cos y - sen x sen y



Puede apreciarse también en la tabla siguiente el paralelismo entre unas y otras funciones en lo referente a sus derivadas: p p p + x) = Re(ei( 2 + x)) = Re(ei 2 · eix) = Re(ieix) = Re(i cos x – sen x) = –sen x 2

6.3. Tabla de derivadas de las funciones circulares e hiperbólicas y de sus inversas sen (x + 2kp) = Im(ei(x + 2kp)) = Im(eix · e2kpi) = Im(eix) = sen x

cos (



sen (x + 2kp) = Im(ei(x + 2kp)) = Im(eix · e2kpi) = Im(eix) = sen x





p p p + x) = Re(ei( 2 + x)) = Re(ei 2 · eix) = Re(ieix) = Re(i cos x – sen x) = –sen x 2

6.3. Tabla de derivadas de las funciones circulares e hiperbólicas y de sus inversas



e0 = 1 Þ cos 0 = 1, sen 0 = 0



sen (–x) =



cos (x + y) = Re(ei(x + y)) = Re(eix eiy) = Re((cos x + i sen x) (cos y + i sen y)) = = cos x cos y - sen x sen y

Puede apreciarse también en la tabla siguiente el paralelismo entre unas y otras funciones en lo referente a sus derivadas: ei(–x) – e–i(–x) ei– x – eix) = = –sen x 2i 2i

D sen x = cos x

D sh x = ch x

D cos x = – sen x

D ch x = sh x

D tg x = 1 + tg2x

D th x = 1 – th2x

Se prueban ahora fácilmente las correspondientes propiedades de las funciones seno y coseno, a partir de propiedades de las exponenciales. Así pues, podemos ver algunos ejemplos:

D cotg x = 1 + cotg2x

D coth x = 1 – coth2x

Tras esta definición queda eix = cos x + i sen x (identidad de Euler), que se corresponde con la ex = = ch x + sh x.

1

D arc sen x =

D arg sh x =

1– x2 –1 1– x2

D arg ch x =

¥

D arc cos x =

eix – e–ix x2n+1 = å(–1)n 2i (2n + 1)! n= o eix + e–ix x2n = å(–1)n 2 (2n)! n= o

1 1+ x2

¥

D arc tg x =

1

x2 +1

sen x = Im{eix} =

1

x2 – 1 1 (|x| < 1) 1– x2

cos x = Re{eix} =

D arg th x =

en el grupo multiplicativo (U, ×). Se puede probar que el núcleo de dicho homomorfismo está constituido por los múltiplos enteros de un número real positivo, que por definición se denota por 2p. Las funciones seno y coseno de variable real se pueden definir a partir de eix como:

D arc cotg x =

–1 1+ x2

D arg coth x =

410

1 (|x| ³1) 1– x2

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones circulares e hiperbólicas y sus recíprocas

7. SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES CIRCULARES Las funciones circulares están íntimamente ligadas a todos aquellos fenómenos reales en donde hay repetición cíclica, es decir, a fenómenos periódicos tales como las vibraciones, el osciloscopio, el movimiento pendular o la propagación de ondas. Por ello el estudio de las funciones sinusoidales o cosinuidales de los tipos generales y = a sen (wx + j) ó y = a cos (wx + j) es muy importante. Las constantes a, w y j se llaman respectivamente amplitud, pulsación y fase inicial. Tomaremos a > 0 y w > 0. El 2p período de tales funciones es T= como puede probarse w fácilmente, y su recorrido del intervalo [–a,+a]. En realidad bastaría considerar sinusoides, ya que:

y y=a j –— w

x

y = –a

p a cos (wx + j) = a sen (wx + j + ) Figura 27. 2 Es también fácil probar que la suma de varias funciones sinusoidales del mismo período es otra función periódica del mismo período (no necesariamente sinusoidal). Hay muchos campos de la Ciencia y la Técnica (Acústica, Electrónica, etc.) en los que encuentra aplicación el manejo de la funciones circulares, interviniendo éstas en muchos fenómenos (batimiento, resonancia, sincronía,etc.). Vamos a destacar aquí tres de las situaciones en que intervienen tales funciones. x=0 Oscilador armónico simple. El ejemplo más sencillo es el de una partícula material de masa m que vibra con respecto a una posición de equilibrio bajo la influencia de una fuerza restauradora F que es directamente proporcional a la distancia a la posición de x equilibrio. Podemos modelizar esto con un hipotético resorEstirado te elástico sin fricción sobre una superficie horizontal, con la masa m fija en un extremo. Tomamos el origen en la posición de equilibrio (x = 0) y suponemos que el movimiento se efectúa en el eje de las x. F La fuerza restauradora es directamente proporcional a la x elongación x y va dirigida siempre hacia la posición de equilibrio, con lo cual F = –Kx (Ley de Hooke). Aplicando la seComprimido gunda ley de Newton de la Dinámica, podemos sustituir la 2 d x F fuerza por ma = m 2 , con lo cual llegamos a la ecuación didt 2 d x Figura 28. ferencial: m 2 + Kx = 0. dt Para encontrar la posición de la partícula en función del tiempo necesitamos una función x(t) cuya derivada segunda sea igual y de signo contrario a ella , salvo el factor constante K m. Esta propiedad la verifican

a)

las funciones seno y coseno. De ahí que la solución de la ecuación diferencial se pueda expresar en la forma x(t) = A sen (wt + j) que es la ecuación del movimiento vibratorio armónico simple (MAS). La velocidad y la aceleración también se expresan en función del tiempo T mediante funciones circulares: v(t) =

dx = Aw cos (wt + j); dt

a(t) =

d 2x = –Aw2 cos (wt + j) dt 2

Como puede apreciarse la fase inicial en las funciones x(t), v(t) y a(t) es la misma. Lo único que cambia es la amplitud.

TEMARIO DE MATEMÁTICAS. PRUEBA A

411

Volumen I. Matemáticas

412

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Z

b) Ondas. El movimiento ondulatorio supone la perturbación de un punto a otro sin transporte neto de materia. Si y = f(x) es una función cuya gráfica es la de la figura, al sustituir x por x- d , la forma de la curva no varía, sino que se desplaza hacia la derecha o hacia la izquierda según que d sea positivo o negativo. Admitiendo que al cabo de un tiempo t el desplazamiento es d = vt , obtendremos la ecuación de una perturbación viajera, o sea, de una onda y(x, t) = f(x-vt) X

y

y

t=0 f(x)

vt

x

B

f(x–vt)

E

Figura 30.

x

Y

Figura 29. La constante v se denomina velocidad de propagación del tren de ondas. Un caso particular es el de los trenes de ondas armónicas que tienen por ecuación y(x,t) = A sen k(x – vt) Cada partícula realiza un movimiento armónico simple en torno a una posición de equilibrio, movimiento que se transmite a las partículas colindantes. La longitud de onda l es la distancia entre dos puntos consecutivos que están en el mismo estado de perturbación, por lo cual 2p A sen k(x – vt) = A sen k(x – vt + l) Þ k(x – vt) = k(x – vt + l) + 2p Þ l = k 2p La constante k = se llama número de onda y es el número de longitudes de onda que hay el la disl l tancia 2p. Como además el tren de ondas es periódico de período T, se tiene v = , con lo cual la ecuación T

Como vemos, las ondas armónicas son doblemente periódicas. Por un lado la ecuación tiene un período espacial caracterizado por la longitud de onda, pues y(x + l, t) = y(x,t). Por otra parte T es un período temporal, ya que 2p l · T] = y(x,t + T) = A sen k[x – v(t + T)] = A sen [k(x – vt) – kvT] = A sen [k(x – vt) – l T = A sen [k(x – vt) – 2p] = A sen k(x – vt) = y(x,t) En particular Maxwell descubrió las ondas electromagnéticas. Los campos eléctrico y magnético en una de tales ondas que se propague siguiendo el eje X , varían en el tiempo según las ecuaciones E = E0 sen k(x-ct) B = B0 sen k(x-ct) donde la constante c coincide con la velocidad de la luz en el vacío. de onda puede ponerse en la forma

Figura 29. La constante v se denomina velocidad de propagación del tren de ondas. Un caso particular es el de los trenes de ondas armónicas que tienen por ecuación y(x,t) = A sen k(x – vt) Cada partícula realiza un movimiento armónico simple en torno a una posición de equilibrio, movimiento que se transmite a las partículas colindantes. La longitud de onda l es la distancia entre dos puntos consecutivos que están en el mismo estado de perturbación, por lo cual 2p A sen k(x – vt) = A sen k(x – vt + l) Þ k(x – vt) = k(x – vt + l) + 2p Þ l = k 2p La constante k = se llama número de onda y es el número de longitudes de onda que hay el la disl l tancia 2p. Como además el tren de ondas es periódico de período T, se tiene v = , con lo cual la ecuación T de onda puede ponerse en la forma æx t ö y(x,t) = A sen 2pç – ÷ è l Tø

æx t ö y(x,t) = A sen 2pç – ÷ è l Tø

Como vemos, las ondas armónicas son doblemente periódicas. Por un lado la ecuación tiene un período espacial caracterizado por la longitud de onda, pues y(x + l, t) = y(x,t). Por otra parte T es un período temporal, ya que 2p l · T] = y(x,t + T) = A sen k[x – v(t + T)] = A sen [k(x – vt) – kvT] = A sen [k(x – vt) – l T = A sen [k(x – vt) – 2p] = A sen k(x – vt) = y(x,t) En particular Maxwell descubrió las ondas electromagnéticas. Los campos eléctrico y magnético en una de tales ondas que se propague siguiendo el eje X , varían en el tiempo según las ecuaciones E = E0 sen k(x-ct) B = B0 sen k(x-ct) donde la constante c coincide con la velocidad de la luz en el vacío. Y

E

Figura 30.

x

f(x) t=0

y

y

x

f(x–vt)

vt

Ondas. El movimiento ondulatorio supone la perturbación de un punto a otro sin transporte neto de materia. Si y = f(x) es una función cuya gráfica es la de la figura, al sustituir x por x- d , la forma de la curva no varía, sino que se desplaza hacia la derecha o hacia la izquierda según que d sea positivo o negativo. Admitiendo que al cabo de un tiempo t el desplazamiento es d = vt , obtendremos la ecuación de una perturbación viajera, o sea, de una onda y(x, t) = f(x-vt) X

B

b)

Z

412

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

Funciones circulares e hiperbólicas y sus recíprocas c)

Circuitos de corriente alterna. Una corriente alterna se genera, en virtud de la ley de Faraday-Henry, cuando se hace girar una bobina con velocidad angular constante w en el seno de un campo magnético B. El flujo de campo magnético a través de la bobina varía con el tiempo según la relación f = NBScos wt donde N = nº de espiras, B = intensidad de campo magnético, S = superficie de la bobina

Figura 31.

S

N

Entonces la fuerza electromotriz inducida será df e= = NBSw sen wt = e0 sen wt dt Resulta pues que la f.e.m. instantánea es una función sinusoidal del tiempo. Esta variación periódica con el tiempo es lo que precisamente caracteriza a las corrientes alternas. Su estudio está muy relacionado con las propiedades de las funciones armónicas. Los circuitos de corriente alterna están constituidos básicamente por un generador de corriente alterna (alternador) y los elementos pasivos: resistencia óhmica R, bobina de autoinducción L y condensador de capacidad C. Se suele llamar circuito RLC a un circuito como el del esquema adjunto.

e0 e

I0

~ R

I C

t –I0

L

e

e0

Figura 32. La ley de Ohm generalizada conduce a una ecuación diferencial que al resolverla nos da e = e0 sen wt I = I0 sen (wt + j) donde las constantes e0 y I0 son los valores máximos de la f.e.m. y de la intensidad de corriente y “j“ es el ángulo de fase entre la f.e.m. y la intensidad, que depende de los elementos del circuito. Así pues:

– –

Para circuitos con sólo resistencia óhmica:



Para circuitos con sólo capacidad:

Para circuitos con sólo inducción:

TEMARIO DE MATEMÁTICAS. PRUEBA A

j=0 j=– p2 j=p2 413

Volumen I. Matemáticas

414

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Como puede apreciarse, en los resultados obtenidos intervienen las funciones seno y coseno hiperbólicos. La relación [2] es concretamente la ecuación de una catenaria.

8. SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES HIPERBÓLICAS

x æ x ö x é xù x y – a = ò sh dx = aêch ú = açch – 1÷Þ y = a ch ë a û0 è a ø a a 0

[2]

Una de las aplicaciones reales más típicas de las funciones hiperbólicas está relacionada con la técnica. Se trata del estudio de los cables suspendidos entre dos puntos y que cuelgan libremente por su propio peso. Dichos cables se presentan frecuentemente en las obras de ingeniería como estructuras o elementos que forman parte de sistemas mecánicos. x

Integrando entre C(0,c) y D(x, y):

dy W ws x Þ dy = tgq dx = dx = dx = sh dx dx T0 wa a

y

B

A

Si suponemos que la carga del cable AB (que puede ser su propio peso) se encuentra uniformemente distribuida sobre su arco, entonces el cable adopta la configuración de una catenaria, curva cuya ecuación se expresa mediante funciones hiperbólicas. Si w es la carga por unidad de longitud y T0 la tensión en el punto más bajo C, tomaremos como T constante a = 0 . w Entonces podemos colocar los ejes coordenados como se indica en la figura, de modo que el punto más bajo sea C(0,a). tgq =

Para la ecuación de la curva que adopta el cable suspendido tenemos: D(x,y)

é x sù s ds = aêarg sh ú = a arg sh Þ s = a sh 2 2 ë û a a 0 a a +s a

[1]

s

C

x

s

T0 wa a ds = ds = ds Þ 2 2 2 T w a +s a +s 2 a

0

Þò

dx = ds cosq =

donde s es la longitud del arco OD. Si queremos obtener la longitud del arco s en función de la abcisa del punto D, procederemos como sigue: O

Figura 33.

T = T02 + W 2 = (wa)2 + (ws)2 = w a 2 + s 2

T

O

Para cualquier punto D(x,y), se puede raplicar de cuerpo libre al trozo de cable OD (de r elrdiagrama r peso W), teniendo como condición estática T+ T0 + W = 0, lo cual se traduce escalarme en T

ds

w = ws

dy

O

S

Figura 34.

w

dx

T0

T0

w

dx

Figura 34.

S

O w = ws

Para cualquier punto D(x,y), se puede raplicar de cuerpo libre al trozo de cable OD (de r elrdiagrama r peso W), teniendo como condición estática T+ T0 + W = 0, lo cual se traduce escalarme en T

dy

ds

O

T

T = T02 + W 2 = (wa)2 + (ws)2 = w a 2 + s 2

Una de las aplicaciones reales más típicas de las funciones hiperbólicas está relacionada con la técnica. Se trata del estudio de los cables suspendidos entre dos puntos y que cuelgan libremente por su propio peso. Dichos cables se presentan frecuentemente en las obras de ingeniería como estructuras o elementos que forman parte de sistemas mecánicos. Si suponemos que la carga del cable AB (que y B puede ser su propio peso) se encuentra uniformemente distribuida sobre su arco, entonces el cable adopta A la configuración de una catenaria, curva cuya ecuación se expresa mediante funciones hiperbólicas. D(x,y) Si w es la carga por unidad de longitud y T0 la tensión en el punto más bajo C, tomaremos como C T constante a = 0 . a w x Entonces podemos colocar los ejes coordenados como se indica en la figura, de modo que el punto O más bajo sea C(0,a). Figura 33.

donde s es la longitud del arco OD. Si queremos obtener la longitud del arco s en función de la abcisa del punto D, procederemos como sigue: dx = ds cosq =

s

Þò 0

a T wa 0 ds = ds = ds Þ T w a 2 +s 2 a 2 +s 2 s

a

a 2 +s 2

é x sù s ds = aêarg sh ú = a arg sh Þ s = a sh ë a a û0 a

[1]

Para la ecuación de la curva que adopta el cable suspendido tenemos: tgq =

ws x dy W Þ dy = tgq dx = dx = dx = sh dx dx T0 wa a

Integrando entre C(0,c) y D(x, y):

x æ x ö x é xù x y – a = ò sh dx = aêch ú = açch – 1÷Þ y = a ch ë a û0 è a ø a a 0 x

[2]

8. SITUACIONES REALES EN QUE INTERVIENEN LAS FUNCIONES HIPERBÓLICAS

Como puede apreciarse, en los resultados obtenidos intervienen las funciones seno y coseno hiperbólicos. La relación [2] es concretamente la ecuación de una catenaria. 414

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

TEMA

24 Funciones dadas en forma de tabla. Interpolación polinómica. Interpolación y extrapolación de datos

Jesús Gómez Gómez

Cuerpo de Profesores de Enseñanza Secundaria

Volumen I. Matemáticas

416

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

ÍNDICE SISTEMÁTICO 1.

INTRODUCCIÓN

2.

EL PROBLEMA DE LA INTERPOLACIÓN Y EXTRAPOLACIÓN DE DATOS

3.

INTERPOLACIÓN POLINÓMICA. EXISTENCIA Y UNICIDAD DEL POLINOMIO INTERPOLADOR

4.

INTERPOLACIÓN ENTRE VALORES CUALESQUIERA 4.1. Fórmula de interpolación de Lagrange 4.2. Algoritmo de Aitken-Neville. 4.3. Método de aproximaciones sucesivas 4.4. Método de Newton 4.5. Diferencias divididas

5.

INTERPOLACIÓN ENTRE VALORES EQUIDISTANTES 5.1. Operadores en diferencias finitas 5.2. Diferencias sucesivas 5.3. Polinomios de interpolación de Newton 5.4. Polinomios factoriales 5.5. Fórmulas de Newton-Gregory 5.6. Interpolación por diferencias centrales

6.

ERROR EN LA INTERPOLACIÓN

7.

EXTRAPOLACIÓN DE DATOS

EXTRAPOLACIÓN DE DATOS

7.

ERROR EN LA INTERPOLACIÓN

6.

INTERPOLACIÓN ENTRE VALORES EQUIDISTANTES 5.1. Operadores en diferencias finitas 5.2. Diferencias sucesivas 5.3. Polinomios de interpolación de Newton 5.4. Polinomios factoriales 5.5. Fórmulas de Newton-Gregory 5.6. Interpolación por diferencias centrales

5.

INTERPOLACIÓN ENTRE VALORES CUALESQUIERA 4.1. Fórmula de interpolación de Lagrange 4.2. Algoritmo de Aitken-Neville. 4.3. Método de aproximaciones sucesivas 4.4. Método de Newton 4.5. Diferencias divididas

4.

INTERPOLACIÓN POLINÓMICA. EXISTENCIA Y UNICIDAD DEL POLINOMIO INTERPOLADOR

3.

EL PROBLEMA DE LA INTERPOLACIÓN Y EXTRAPOLACIÓN DE DATOS

2.

INTRODUCCIÓN

1.

ÍNDICE SISTEMÁTICO CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

416

Funciones dadas en forma de tabla

1. INTRODUCCIÓN Antes de descubrirse el cálculo infinitesimal, ya surgió la necesidad de confeccionar tablas de funciones trigonométricas, logarítmicas, exponenciales, etc. Los primeros resultados de la interpolación aparecen en la obra de Briggs, Arithmetica logaríthmica en el año 1624. Tanto el desarrollo de la interpolación, como el cálculo de diferencias finitas, así como su exposición sistemática, surge en el siglo XVIII mediante los trabajos de Leibnitz, Taylor y Newton entre otros. Concretamente Newton estaba ya familiarizado con una de las fórmulas de interpolación, que expresó, de un modo muy conveniente para el cálculo práctico, por medio de los llamados “cocientes de diferencias”. Euler y Lagrange estudiaron la interpolación trigonométrica, cuyas aplicaciones a la Mecánica y a la Astronomía se realizaron a lo largo del siglo XIX, destacando sobre todo las obras de Gauss, Delambre, Laplace y Fourier. En la actualidad el estudio de tales problemas no sólo no ha decaído, sino que se ha incrementado, debido sobre todo a la utilización de los computadores, lo que exige realizar estudios teóricos sobre los procedimientos de mejor aproximación. La teoría actual de la aproximación emanó del trabajo del gran matemático ruso Chebyshev, quien en un estudio relacionado con la construcción de mecanismos introdujo el concepto de “aproximación óptima”. De esa manera, los polinomios de Chebyshev, que convergen uniformemente a la función que los engendra, responden adecuadamente al problema de elegir los nodos de la interpolación para minimizar el error de los polinomios de Lagrange y para poder rebajar el grado del polinomio interpolador a costa de una pérdida mínima de precisión. Además de las profundas ideas de Chebyshev, desarrolladas más extensamente por sus discípulos (Zolotarev y Markov, entre otros), un importante descubrimiento de finales del XIX a cargo del alemán Weierstrass contribuyó al avance en la moderna teoría de la aproximación. Este último demostró la posibilidad de aproximar una función continua arbitraria por medio de un polinomio algebraico con cualquier grado de exactitud, es decir, con un error prefijado.

2. EL PROBLEMA DE LA INTERPOLACIÓN Y EXTRAPOLACIÓN DE DATOS Sea una función y = f(x) de la que se conocen los valores de la variable dependiente para un número discreto de valores de la variable independiente, es decir, conocemos un conjunto finito (o infinito numerable) de puntos (x0, y0), (x1, y1) , ..., (xn, yn) de su gráfica. Interesa a veces reemplazar la función teórica f(x) por otra F(x) de un tipo determinado que coincida con ella en los n + 1 puntos (xi, yi) y que nos sirva para hallar los valores de f(x’) en puntos x’ distintos de los dados, pudiendo calcular una cota del error cometido f(x’) - F(x’). Pero aparte del motivo teórico antes apuntado hay un motivo experimental. En las ciencias no matemáticas una situación análoga se da con frecuencia cuando se observa un fenómeno, con la correspondiente toma de datos o se realizan mediciones experimentales en el laboratorio con el propósito de relacionar dos variables. Normalmente los registros se suelen disponer en forma de tabla empírica xi

x0

x1

x2 ... xn

yi

y0

y1

y2 ... yn

Se suele llamar argumentos o nodos de interpolación a los valores x0 , x1 , x2 , ..., xn y supondremos que x0 < x1 < x2 < ... < xn, o sea, son todos distintos y están ordenados de menor a mayor. Con los datos anteriores el problema de la interpolación consiste en hallar el valor de f(x) en cualquier punto nuevo x, tal que x0 < x < xn, empleando únicamente los datos de la tabla y sin recurrir a la expresión de la función, que puede ser desconocida. El problema de la extrapolación es análogo, sólo que ahora es x < x0 ó x > xn.

TEMARIO DE MATEMÁTICAS. PRUEBA A

417

Volumen I. Matemáticas

418

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Pn (x) = a0 + a1x + a2 x2 + … + an xn con la eventualidad de que alguno de sus coeficientes, y en particular an, pueda ser nulo.

En cualquiera de los casos el problema queda resuelto si encontramos una curva, lo más sencilla posible, cuya gráfica pase por todos los puntos obtenidos. O dicho de otro modo, se trata de construir otra función F(x) tal que F(xi) = f(xi) para 0 £ i £ n , y que aproxime el resto de valores de f(x) con el menor error posible. Planteado así, el problema está indeterminado, pues se puede justificar que hay infinidad de funciones cuya gráfica pase por los x0 x1 puntos (x0, y0), (x1, y1) , ..., (xn yn), ya que si F(x) es una función que xn verifica las condiciones anteriores, cualquier otra del tipo Figura 1. y = F(x) + (x - x0) (x - x1) ... (x - xn) j(x) donde j(x) es una función arbitraria, también las satisface. Para que el problema quede determinado hay que prefijar el tipo de función. Así, por ejemplo, una sinuoide de ecuación y = A sen (wx + c) puede hacerse pasar por tres puntos dados, ya que son tres constantes a determinar: A, w y c. Podemos también exigir ciertos requisitos a la función f(x), como, por ejemplo, la continuidad y la derivabilidad, para que la interpolación sea un procedimiento numérico satisfactorio. No obstante, las funciones que se toman de ordinario para interpolar son las algebraicas, y, en particular, las funciones polinómicas, que presentan entre otras las siguientes ventajas:

Si se conocen n +1 pares de valores {(xi, yi) / i = 0,1,2....n } se trata de buscar una función polinómica P (x) cuya gráfica pase por esos puntos, es decir, P (xi) = yi " i Î{0, 1, 2, ... n} [1] Como tenemos n +1 condiciones, pensaremos en un polinomio de grado n que presenta n +1 coeficientes a determinar. Tomaremos pues:

3. INTERPOLACIÓN POLINÓMICA. EXISTENCIA Y UNICIDAD DEL POLINOMIO INTERPOLADOR

De cualquier manera el resultado de una interpolación o de una extrapolación es tanto más fiable cuanto mayor sea el número de puntos empíricos de que se dispone y cuanto más cerca está la abcisa del nuevo punto de las abcisa de los puntos anteriores. Veremos a continuación algunos métodos generales de interpolación. Aunque la separación entre los argumentos no está sujeta a ninguna restricción, en casos particulares, cuando el investigador puede manipular la variable x, es posible obtener registros empíricos yi para valores xi equidistantes, es decir, igualmente separados: x – x0 xi – xi–1 = h = cte = n , para i = 1, 2, ... n n Figura 2. Dicho de otro modo, cuando los valores x0, x1, x2, ..., xn forman una progresión aritmética se habla de interpolación/extrapolación en tablas de intervalo constante. Encontraremos fórmulas de interpolación específicas de este caso. Si el número de puntos es muy grande, la interpolación puede resultar muy engorrosa. Además, si los puntos se obtienen por medidas experimentales sujetas a errores, es cuestionable que se pretenda que la función que buscamos pase por todos ellos. x0 x1 xn Pero el problema planteado como la obtención de una curva sencilla que se adapte lo mejor posible a los puntos dados es un problema diferente al que aquí se plantea. Es decir, no hay que confundir la interpolación con el ajuste mediante líneas de regresión.

– – –

Sus valores son fáciles de calcular. Sus derivadas y primitivas son también polinómicas. Una función polinómica de grado n queda unívocamente determinada por n +1 puntos.

De cualquier manera el resultado de una interpolación o de una extrapolación es tanto más fiable cuanto mayor sea el número de puntos empíricos de que se dispone y cuanto más cerca está la abcisa del nuevo punto de las abcisa de los puntos anteriores. Veremos a continuación algunos métodos generales de interpolación. Aunque la separación entre los argumentos no está sujeta a ninguna restricción, en casos particulares, cuando el investigador puede manipular la variable x, es posible obtener registros empíricos yi para valores xi equidistantes, es decir, igualmente separados: x – x0 xi – xi–1 = h = cte = n , para i = 1, 2, ... n n Figura 2. Dicho de otro modo, cuando los valores x0, x1, x2, ..., xn forman una progresión aritmética se habla de interpolación/extrapolación en tablas de intervalo constante. Encontraremos fórmulas de interpolación específicas de este caso. Si el número de puntos es muy grande, la interpolación puede resultar muy engorrosa. Además, si los puntos se obtienen por medidas experimentales sujetas a errores, es cuestionable que se pretenda que la función que buscamos pase por todos ellos. x0 x1 xn Pero el problema planteado como la obtención de una curva sencilla que se adapte lo mejor posible a los puntos dados es un problema diferente al que aquí se plantea. Es decir, no hay que confundir la interpolación con el ajuste mediante líneas de regresión.

– – –

Sus valores son fáciles de calcular. Sus derivadas y primitivas son también polinómicas. Una función polinómica de grado n queda unívocamente determinada por n +1 puntos.

En cualquiera de los casos el problema queda resuelto si encontramos una curva, lo más sencilla posible, cuya gráfica pase por todos los puntos obtenidos. O dicho de otro modo, se trata de construir otra función F(x) tal que F(xi) = f(xi) para 0 £ i £ n , y que aproxime el resto de valores de f(x) con el menor error posible. Planteado así, el problema está indeterminado, pues se puede justificar que hay infinidad de funciones cuya gráfica pase por los x0 x1 puntos (x0, y0), (x1, y1) , ..., (xn yn), ya que si F(x) es una función que xn verifica las condiciones anteriores, cualquier otra del tipo Figura 1. y = F(x) + (x - x0) (x - x1) ... (x - xn) j(x) donde j(x) es una función arbitraria, también las satisface. Para que el problema quede determinado hay que prefijar el tipo de función. Así, por ejemplo, una sinuoide de ecuación y = A sen (wx + c) puede hacerse pasar por tres puntos dados, ya que son tres constantes a determinar: A, w y c. Podemos también exigir ciertos requisitos a la función f(x), como, por ejemplo, la continuidad y la derivabilidad, para que la interpolación sea un procedimiento numérico satisfactorio. No obstante, las funciones que se toman de ordinario para interpolar son las algebraicas, y, en particular, las funciones polinómicas, que presentan entre otras las siguientes ventajas:

3. INTERPOLACIÓN POLINÓMICA. EXISTENCIA Y UNICIDAD DEL POLINOMIO INTERPOLADOR

Si se conocen n +1 pares de valores {(xi, yi) / i = 0,1,2....n } se trata de buscar una función polinómica P (x) cuya gráfica pase por esos puntos, es decir, P (xi) = yi " i Î{0, 1, 2, ... n} [1] Como tenemos n +1 condiciones, pensaremos en un polinomio de grado n que presenta n +1 coeficientes a determinar. Tomaremos pues: Pn (x) = a0 + a1x + a2 x2 + … + an xn con la eventualidad de que alguno de sus coeficientes, y en particular an, pueda ser nulo.

CUERPO DE PROFESORES DE ENSEÑANZA SECUNDARIA

Volumen I. Matemáticas

418

Funciones dadas en forma de tabla A un polinomio de grado £ n que cumpla las condiciones se le llama polinomio interpolador correspondiente a los n +1 pares de valores (xi, yi). 1.

Existencia: Las condiciones [1] nos conducen a un sistema de n +1 ecuaciones lineales en las incógnitas a0, a1, a2, ..., an: ìa 0 + a1x0 + a 2x02 + ... + a nx0n = y 0 ï ïa 0 + a1x1+ a 2x12 + ... + a nx1n = y 1 í ï::::::::::::::::::::::::::::::::::::::::::::::::: ïa + a x + a x2 + ...+ a xn = y î 0 1 n 2 n n n n cuyo determinante de coeficientes es de Vandermonde 1 x0 ... x0n 1 x1 ... x1n ... ... ... ... 1 xn ... xnn

2.

= Õ (xj – xi ) ¹ 0 i
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF