Fundamentos de Relatividad General
March 24, 2017 | Author: elpluto | Category: N/A
Short Description
Download Fundamentos de Relatividad General...
Description
Fundamentos de Relatividad General Conceptos y recursos matemáticos de relatividad restringida y general
Armando Martínez
Fundamentos de Relatividad General
Prof. Armando Martínez
Prologo
Página 1
Fundamentos de Relatividad General
Prologo
Indice de contenidos Prologo .................................................................................. 4 Movimiento absoluto ........................................................... 18 Un descubrimiento sorprendente ........................................ 26 La física es parada de cabeza ............................................... 34 Las consecuencias directas de la teoría................................ 50 El experimento que antecedió a la teoría .............................. 68 Los diagramas espacio-tiempo de Minkowski ....................... 80 Las transformaciones de Lorentz ....................................... 104 Representaciones matriciales............................................. 122
Prof. Armando Martínez
Página 2
Fundamentos de Relatividad General
Prof. Armando Martínez
Prologo
Página 3
Fundamentos de Relatividad General
Prologo
Prologo Surge este trabajo ante una ausencia de texto alguno en español acerca de la Teoría de la Relatividad que abarque no sólo la aplicación de las fórmulas fundamentales (que es algo a lo que se limitan muchos libros de texto) sino la filosofía fundamental sobre lo que es realmente la Teoría de la Relatividad, cómo se fueron desarrollando las ideas hasta llegar a ella. Resulta lamentable que muchos libros de texto sobre este tema se limitan a reproducir algunas fórmulas aplicando dichas fórmulas a unos cuantos ejemplos particulares, dejándole al estudiante muchas dudas e inclusive cierto grado de perplejidad ante lo que parecen ser efectos sacados de un baúl de trucos de magia y paradojas aparentes que hacen dudar sobre las bases de la teoría. Aunado a lo anterior se enfrenta el obstáculo de que los efectos físicos que son consecuencia directa de la Teoría de la Relatividad no son apreciables en nuestra experiencia cotidiana dado que tales efectos sólo salen a relucir a velocidades comparables a la velocidad de la luz, la cual es extraordinariamente alta (300 mil kilómetros por segundo). Si la velocidad de la luz fuese de unos 2 mil kilómetros por segundo, seguramente estaríamos acostumbrados a sus efectos y la Teoría Especial de la Relatividad sería comprendida en sus efectos hasta por un niño de primaria por la familiaridad diaria con sus consecuencias. La ausencia de un buen libro introductorio en español e inclusive en inglés que le permita al lector no sólo comprender lo que es la relatividad sino que además le permita llevar a cabo la resolución de problemas numéricos o inclusive problemas generalizados es notoria. Así tenemos libros introductorios escritos para el público en general como el libro “The Relativity Explosion” de Martin Gardner, el cual intenta describir de manera detallada las filosofías que están detrás de las conclusiones y descubrimientos de la Teoría de la Relatividad, pero el cual por su ausencia de fórmulas y números aplicados sobre dichas fórmulas a casos particulares deja a sus lectores funcionalmente iletrados en lo que es la relatividad. Después de leer en su totalidad tal libro lo más seguro es que no podrán resolver ni siquiera un solo problema así sea sencillo que involucre fenómenos relativistas. Por otro lado, tenemos libros de texto universitarios como el libro “Foundations of Modern Physics” de Paul A. Tipler, el cual en las 51 páginas de las que consta el primer capítulo del libro enseña de manera concisa a sus lectores a resolver problemas simbólicos y Prof. Armando Martínez
Página 4
Fundamentos de Relatividad General
Prologo
numéricos relacionados con la Teoría Especial de la Relatividad, pero no recurre para nada a los diagramas espacio-tiempo concebidos originalmente por Hermann Minkowski, tan esenciales para poder obtener una perspectiva geométrica sobre los fenómenos relativistas. La didáctica utilizada por Tipler es una didáctica puramente algebraica, y al prescindir por completo de los diagramas espacio-tiempo limita las perspectivas de entendimiento de sus lectores, sobre todo en asuntos que involucran la simultaneidad, un fenómeno que se puede captar claramente en un diagrama espacio-tiempo. Por si esta deficiencia fuese poca, el libro de Tipler no da ni siquiera la más remota pista a sus lectores acerca de lo que trata la Teoría General de la Relatividad. Los diagramas espacio-tiempo sí son utilizados en el libro “Física” (en su versión en Español) de los autores Francis W. Sears y Mark W. Zemansky, lo cual da una buena perspectiva geométrica a los lectores sobre la interpretación de los fenómenos relativistas, pero lo que por un lado generosamente dan con los diagramas espaciotiempo (a los cuales llaman diagramas Brehme) por el otro lado lo quitan al omitir (seguramente por la naturaleza introductoria del libro aunque se trate de un texto universitario) totalmente no sólo la derivación de las fórmulas de transformación Lorentz-Fitzgerald sino toda la filosofía básica que subyace a los postulados básicos de la Teoría de la Relatividad, como tampoco hacen mención alguna a lo más elemental que yace detrás de la Teoría General de la Relatividad. De este modo, la perspectiva filosófica y la perspectiva algebraica son sacrificadas en aras de la perspectiva geométrica. Por otro lado, el libro “Space, Time and Gravity” de Robert M. Wald no lleva a cabo ni siquiera una introducción decente a los diagramas espaciotiempo en menos de las cinco páginas que le dedica a tal cosa, para luego saltar directamente hacia la Teoría General de la Relatividad presentando un conjunto de fórmulas que los lectores no tienen ni siquiera la más remota idea de dónde pudieron haber salido. Los materiales propios requeridos para el estudio de la Teoría de la Relatividad se encuentran tan dispersos que inclusive en el venerable libro “Mathematical Methods for Physicists” de George Arfken (tercera edición, 1985), el importantísimo tensor de Riemann tan fundamental para la geometría diferencial y el estudio del espacio-tiempo curvo, en vez de cubrirse en una sección dedicada única y exclusivamente a dicho tema, es relegado a uno de varios problemas en el capítulo 3.2 del libro, sin hablarse después más del asunto. ¡Y este es precisamente el libro de texto convencional usado por años en las universidades para educar a los físicos en el uso de las herramientas matemáticas que todo físico necesita para poder continuar adelante con estudios más especializados! Y si no les enseñan en este libro mucho sobre el tema, ¿entonces en dónde esperan que lo puedan aprender si no es que por cuenta propia? El libro “Física Moderna” de Ronald Gautreau y William Savin (de la Serie de Compendios Schaum) podría haber sido una buena opción, excepto que no da una génesis coherente sobre el desarrollo de las ideas que condujeron a la Teoría Especial de la Relatividad, ni habla en lo absoluto acerca de los diagramas de Minkowski ni toca para nada el tema de la Teoría General de la Relatividad. Y el libro “Física para estudiantes de Ciencias e Ingeniería” de Robert Resnick y David Halliday es todavía peor en el sentido de que simplemente se limita a reproducir varias de las fórmulas propias de la relatividad, sin entrar en detalle sobre los orígenes filosóficos de la teoría y sin incluir mención alguna acerca de la existencia de los diagramas espacio-tiempo. Enfatiza la aplicación de las fórmulas a los Prof. Armando Martínez
Página 5
Fundamentos de Relatividad General
Prologo
ejemplos numéricos sobre los cuales se pueden aplicar directamente las fórmulas sin explicar realmente lo que está sucediendo. Lo cual tiene la desventaja de que hay muchos problemas sencillos que se pueden postular en un curso introductorio que no pueden ser resueltos con la mera aplicación de fórmulas aprendidas como dogmas traídos por un ser superior, problemas para los cuales es necesario comprender exactamente lo que está sucediendo. No se puede tratar de resolverlo todo o inclusive una ínfima parte del todo simplemente multiplicando o dividiendo por: √1 −
𝑣2 𝑐2
Como acostumbran a hacerlo muchos principiantes. Si no se sabe cómo fue obtenida una fórmula, menos se sabrá como modificar la fórmula para aquellos casos en los que el problema sea alterado un poco. Esta metodología para lo único que es buena es para memorizar, no para comprender, y ha sido la causante de que muchos estudiantes que simplemente se limitan a aplicar las fórmulas terminen con la impresión equivocada de que la relatividad es algo repleto de efectos casi mágicos, posibles ilusiones ópticas, o finalmente que se trata de una teoría equivocada. Y muchos, que frustrados, tratan de aprender por cuenta propia lo que es la Teoría de la Relatividad y se en las pocas bibliotecas técnicas que hay en México con libros en los que es tema es tratado de una manera rigurosa e inclusive pedante en la cual se obscurecen conceptos esenciales con formalismos notacionales que no ilustran mucho lo que se está estudiando. De este modo, en lugar del estilo relajado utilizado por matemáticos como Henri Poincaré que se explayaban en sus trabajos dando todo tipo de ejemplos ilustrativos, esforzándose por hacerle entender a sus lectores las ideas que les quería transmitir. Lo que se tiene en muchos casos son textos que adoptan un rigorismo axiomático en el cual no se proporciona un solo ejemplo ilustrativo y que sólo se limitan a la derivación de teoremas a partir de los axiomas y definiciones que se van dando, siguiendo el método moderno para la publicación de trabajos científicos inspirado por el grupo Bourbaki con el cual se elimina todo lo que no es considerado estricta y absolutamente indispensable. Eliminándose muchos pasos intermedios que se suponen “obvios”, aunque ello implique dejar a los lectores con muchas dudas. Si antes se tenía un formalismo moderado con el cual se dificultaba captar la naturaleza esencial de las ideas transmitidas, con el formalismo axiomático riguroso de hoy en día en muchos casos no se tiene ni siquiera la más remota idea de las posibles aplicaciones o la posible trascendencia de aquello de lo que se está hablando. En el camino de forjar una teoría generalizada en grado extremo, abstracta por excelencia, con un conjunto mínimo de axiomas y postulados, definiendo algunos términos básicos, derivando teoremas y empleando estrictamente las reglas de la lógica simbólica, obtener resultados y corolarios y continuar derivando teoremas sin un solo ejemplo ilustrativo e inclusive sin recurrir a un solo diagrama, puede dejar la impresión en muchos de que en ese largo recorrido se están pasando por alto o se están perdiendo ideas importantes. Prof. Armando Martínez
Página 6
Fundamentos de Relatividad General
Prologo
Los rigoristas de hoy han olvidado que si no se le puede poner números a aquello de lo que se está hablando en realidad se sabe muy poco o tal vez no se sepa nada acerca de lo que se está hablando, y a ellos se les podría recordar la máxima de Lord Kelvin quien señaló: “Yo digo frecuentemente que cuando uno puede medir aquello de lo cual se está hablando, y expresarlo en números, entonces uno sabe algo acerca de ello”. - Lord Kelvin Y procediendo de una manera rigurosamente axiomática, formalista, bastarían tan sólo unas dos o tres páginas para decirle al lector que todo lo que tenga que ver con la Teoría General de la Relatividad se puede derivar de tan sólo dos ecuaciones: 𝑇𝑢𝑣 = 8𝜋 ⋅ 𝑇𝑢𝑣 𝛽
𝑥̈ 𝛽 + Γ𝜎𝛽 ∙ 𝑥̇ 𝛼 ∙ 𝑥̇ 𝛽 Lo cual es cierto. E inclusive, adentrándonos en el rigorismo, podríamos comenzar postulando a la siguiente cantidad conocida como la “acción”, (el integrando es un concepto físico importante conocido como el Lagrangiano) como punto de partida de la Teoría General de la Relatividad: 𝑆[𝑔] = ∫
1 ∙ 𝑅 √−𝑔 𝑑 4 𝑥 2𝑘
Habido el hecho de que a partir de la “extremización” de la acción (con la ayuda del cálculo de variaciones que es esencialmente un refinamiento del procedimiento para obtener máximos y mínimos mediante el cálculo infinitesimal) se pueden derivar axiomáticamente las ecuaciones de campo de Einstein de la Relatividad General. Pero nadie en su sano juicio esperaría que algún lector sin experiencia previa en el asunto empiece a resolver de buenas a primeras problemas a partir de los anteriores enunciados matemáticos como lo haría alguien que haya tomado un buen curso previo sobre la materia. Se pueden tomar las ecuaciones anteriores como postulados, y con unas cuantas definiciones que se vayan agregando en el camino, se pueden ir derivando teoremas, lemas y corolarios con los cuales se pueden seguir derivando más teoremas, y más lemas y más corolarios, y así la cosa hasta el infinito. Pero... ¿realmente se entiende aquello de lo que se está hablando? La derivación mecánica de resultados aplicando las reglas de la lógica es algo que, estrictamente hablando, lo puede hacer cualquier máquina programada para ello. Aunque hasta la fecha son pocos, inclusive los más optimistas en el campo de la inteligencia artificial, los que esperan realmente que de una máquina, aplicando a ciegas las leyes de la derivación lógica, pueda salir una idea nueva. Otro obstáculo en el estudio independiente de la Teoría de la Relatividad lo constituye el hecho de que un mismo símbolo es usado frecuentemente para representar conceptos totalmente diferentes, como la letra griega delta minúscula Prof. Armando Martínez
Página 7
Fundamentos de Relatividad General
Prologo
𝛿 que es usada para representar el símbolo delta de Kronecker 𝛿𝑖𝑗 , y es usada también para denotar la derivada absoluta, y es usada también para denotar la función delta de Dirac, y en el cálculo de variaciones se utiliza para representar la variación de una integral a ser extremizada. Esto desde luego podría ser solventado inventando una cantidad creciente de nuevos símbolos que a fin de cuentas sólo reemplazarían una complejidad por otra (la primera opción, retener un mismo símbolo para representar cosas distintas, parece ser mejor que la segunda). La contraparte son las definiciones matemáticas para las cuales no hay una convención universalmente aceptada, como el hecho de que en muchos libros los componentes de los vectores covariantes son representados con índices subscriptos (sub-índices) y los componentes de los vectores contravariantes son representados con índices superscritos (superíndices), mientras que en muchos otros libros se lleva a cabo precisamente lo contrario representando los componentes de los vectores covariantes con índices superscriptos y los componentes de los vectores contravariantes con índices subscriptos; o como ocurre con los símbolos de Christoffel que no sólo son representados con la notación usual gamma 𝛤𝑖𝑗𝑘 y 𝛤𝑗𝑘𝑖 sino que también son representados con paréntesis rectangulares [𝑖𝑗, 𝑘] y con notación de corchetes { }, lo cual sólo aumenta la confusión en los iniciados al ir de un texto a otro. Un libro muy bueno que tal vez sea una excepción a la regla de los libros pedantes, fanfarrones o incompletos sobre el tema de la Teoría General de la Relatividad es el libro “Relativity” de Bernard F. Schütz, el cual tiene la enorme ventaja de que incluye al final del libro pistas y soluciones a los ejercicios de práctica propuestos en el libro, con los cuales el estudiante autodidacta puede ver por sí mismo qué tan bien ha comprendido el material. Desafortunadamente, este libro es un libro en inglés, que aún (2009) no ha sido traducido al español, que no está disponible en la gran mayoría de las bibliotecas técnicas y universitarias de la República Mexicana, y de que se trata de un libro impreso no en los Estados Unidos sino en Inglaterra o Australia o algún otro país miembro del Commonwealth, dificulta obtener el libro. Otro problema en intentar comprender realmente de lo que trata la Teoría de la Relatividad frecuentemente es que la tarea es complicada por maestros que no saben explicar bien aquello de lo cual saben mucho, o peor aún que saben dar explicaciones perfectamente claras acerca de cosas sobre las cuales saben y entienden muy poco. Estoy convencido de que la única razón por la cual una persona se resigna a perder miles de horas de su corta vida calentando pupitres, sin aprender mucho o inclusive nada de aquellos malos maestros de los cuales debería de estar aprendiendo muchas ideas nuevas, privándose a la vez de otras satisfacciones que podría obtener de la vida, es porque tiene que cumplir con un requisito obligatorio aplicado por igual a todos los estudiantes. Aguantar a esos malos maestros como un mal necesario de la vida ante el cual solo queda resignarse, mientras los cursos académicos felizmente lleguen a su fin. Otro estorbo en la difusión de las ideas fundamentales que hay detrás de la Teoría de la Relatividad es la formidable (e injustificada) reputación de que se trata de una teoría extremadamente complicada para la cual se necesita ser un genio para poder
Prof. Armando Martínez
Página 8
Fundamentos de Relatividad General
Prologo
comprenderla. Una anécdota que viene al caso es una entrevista realizada al Profesor Arthur Stanley Eddington, en la cual el entrevistador pregunta: “Profesor Eddington, ¿es cierto que sólo hay tres personas en el mundo que entienden la teoría de Einstein?”, a lo cual supuestamente Eddington le responde: “¿quién es la tercera?” Como si todo lo que ya se ha señalado no fuesen suficientes intimidaciones, obstáculos e impedimentos para dificultarle al principiante el tratar de aprender por cuenta propia los aspectos relevantes de la Teoría de la Relatividad, otro problema con el que nos topamos es, que no sólo hay autores que omiten pasos de desarrollo que tal vez para ellos serán muy obvios pero que no son nada obvios para quien está tratando de entender cada paso, sino que inclusive incurren en lo que parecen ser errores sin dar justificación alguna a la lógica empleada por ellos para asentar tales errores dándolos como hechos ciertos e incontestables. Un ejemplo entre muchos lo podemos tomar del reverenciado libro “A First Course in General Relativity” del muy respetado y alabado autor Bernard F. Schütz, en donde podemos leer en la sección 10.7 de su libro titulada “Realistic stars and gravitational collapse” una derivación del momentum de Fermi que invoca al principio de incertidumbre de Heisenberg para afirmar que para un electrón encerrado en una caja de volumen 𝑉, el momentum de dicho electrón es incierto por una cantidad del orden de (ecuación 10.71 en el libro): 𝛥𝑝 = ℎ𝑉 −1/3 Qué viene siendo lo mismo que: 𝛥𝑝 · 𝑉 3 = ℎ En donde ℎ es la constante de Planck: ℎ = 6.626 · 10−34 𝐽𝑜𝑢𝑙𝑒 · 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 ℎ = 4.136 · 10−15 𝑒𝑉 · 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Lo primero que salta a la vista es que la ecuación dada por Schütz es dimensionalmente incorrecta. No existe forma alguna en la cual se puedan compaginar las unidades. Ello deriva del hecho de que la relación usual de la incertidumbre de Heisenberg es una fórmula unidimensional: ∆𝑝 ∙ ∆𝑥 ≥
ℎ 4𝜋
El principio de incertidumbre de Heisenberg puede ser extendido rigurosamente, desde luego, de una dimensión a tres dimensiones. Pero la fórmula así obtenida no se asemeja a la fórmula dada por Schütz. En una ciencia en la que hasta diferencias numéricas minúsculas - después de la tercera o la cuarta cifras significativas - en las masas de dos elementos distintos son importantes para calcular la enorme cantidad de energía liberada mediante el proceso de conversión de masa a energía. Estas omisiones en las que con toda la naturalidad del mundo una potencia lineal es reemplazada por una potencia cúbica o viceversa son francamente imperdonables. Y si el lector intenta justificar por sí mismo la fórmula dada por Prof. Armando Martínez
Página 9
Fundamentos de Relatividad General
Prologo
Schütz, encontrará que el 99 por ciento de los libros que pueda consultar le darán la fórmula de Heisenberg en su versión unidimensional, no en su versión tridimensional. Y cuando se la dan es probable que se la den como parte de un ejercicio puesto al final del libro para el cual no se da solución alguna dentro del libro. Complicando aún más las cosas está el hecho de que la derivación dada por Schütz ni siquiera es la derivación usual que se da al momentum de Fermi, ya que mientras que Schütz parte del principio de incertidumbre de Heisenberg, la derivación usual de la fórmula que se da en la gran mayoría de los libros de Mecánica Cuántica para el momentum de Fermi recurre a la especificación de niveles energéticos extendidos a lo que llamamos una esfera de Fermi encerrada dentro de una superficie de Fermi: http://en.wikipedia.org/wiki/Fermi_energy Por lo que podemos ver, la derivación dada por Schütz es una derivación muy sui generis, partiendo de una base que para él parece estar totalmente justificada y que no requiere mayores explicaciones al lector, y si lo que Schütz omitió en su libro resulta ser muy claro para él entonces se supone que debe ser también muy claro para todos sus lectores y para los maestros que adopten su libro como libro de texto, aunque desafortunadamente esto no sea el caso. Otro punto de contención que se puede formular en contra de muchos textos “clásicos” es el hecho de que asumen demasiadas cosas por enseñadas o explicadas en otros textos considerados más elementales. Un ejemplo lo podemos ver en la segunda edición del libro “Classical Electromagnetic Radiation” de Jerry B. Marion y Mark A. Heald en el Apéndice C “Fundamental Constants”, en donde para la carga eléctrica 𝑒 del electrón se proporciona un valor de 4.803 × 10−10 𝑠𝑡𝑎𝑡𝑐𝑜𝑢𝑙𝑜𝑚𝑏𝑠, y debajo de dicho valor proporciona un valor de 𝑒² = 1.440 × 10−13 𝑀𝑒𝑉 · 𝑐𝑚 sin dar mayores explicaciones al respecto, lo cual puede dejar perplejo al lector. Pero no sólo no proporciona explicación alguna en dicho apéndice sobre el por qué o la forma en la cual se llevó a cabo esta conversión. Tampoco dentro del libro hace mención alguna al respecto, suponiendo que la razón para esto seguramente fue enseñada en otros textos más elementales. Y además la gran mayoría de los textos considerados más elementales, no hace tampoco mención alguna sobre el origen de esto, suponiendo que tal cosa será cubierta en mayor detalle en textos considerados más avanzados como el de Marion-Heald. Y lo peor del caso es que en los textos considerados más elementales el sistema de unidades utilizado es el SI del cual la unidad de carga eléctrica statcoulomb no forma parte (el valor que utilizan es el de 1.6 × 10−19 𝑐𝑜𝑢𝑙𝑜𝑚𝑏, el cual está relacionado con el statcoulomb mediante la conversión 1 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 = 3 × 109 𝑠𝑡𝑎𝑡𝑐𝑜𝑢𝑙𝑜𝑚𝑏𝑠). Esto puede confundir y desesperar a cualquier principiante que se encuentra a sí mismo perdiendo una gran parte de su tiempo enfrascado en la conversión de unidades, algo en lo que no debería haber problema alguno. Y como éste caso se pueden citar millares de ejemplos en los cuales, en textos considerados autosuficientes, se utiliza información para la cual se dan muchas cosas por conocidas previamente aunque no haya razón para suponer que tales cosas fueran enseñadas previamente en la mayoría de los cursos considerados más elementales. Prof. Armando Martínez
Página 10
Fundamentos de Relatividad General
Prologo
Una razón utilizada por muchos autores para no entrar en detalles aclaratorios sobre cosas que ameritan una mayor explicación es el argumento (yo lo llamaría más bien excusa, pretexto) de “la falta de espacio”. Afortunadamente, en Internet no se trabaja con tales limitaciones, y es posible explayarse de un modo que muchas casas editoras no lo permitirían. Naturalmente, si muchos libros en el mercado resultan demasiado crípticos para el lector ordinario por todas aquellas cosas omitidas por “la falta de espacio”, siempre existe la posibilidad de que tales libros eventualmente sean desplazados y pierdan una buena parte del mercado. Reemplazados por materiales de mayor extensión que se pueden encontrar en Internet, inclusive de manera gratuita. Soy de la opinión de que el énfasis en rigorismo y en invención continua de notación matemática cada vez más elaborada y compleja tiene que ver directamente con el hecho de que en la actualidad no se estén dando ya los espectaculares avances que se estaban dando a principios del siglo XX en las ciencias básicas. A cambio de tanto rigorismo y tanto formalismo aplicado casi a ciegas lo que estamos obteniendo son teorías sumamente complejas como la teoría de las supercuerdas (string theory) que no han servido para proponer ni siquiera un solo experimento con el cual se pueda descubrir algo nuevo y confirmar así la teoría. En contraste con las ecuaciones originales de James Clerk Maxwell y de Albert Einstein a partir de las cuales se predijeron muchos efectos que posteriormente fueron confirmados en los laboratorios. No sé si haya un libro en inglés que subsane todas las deficiencias que han sido señaladas anteriormente. Si lo hay, no tengo conocimiento del mismo. Pero ciertamente tal libro no parece estar disponible para su venta en español, al menos yo no he visto un libro tal en las librerías dedicadas a la venta de textos universitarios y temas de índole técnica. Es por ello que, aprovechando la facilidad de poder llegar a través de Internet a un auditorio amplio, he decidido recopilar los materiales que se encuentran dispersos aquí y allá para presentarlos de una manera coherente y entendible. He tratado de mantener los materiales agrupados y seleccionados de modo tal que puedan ser comprensibles con un mínimo de estudios matemáticos. Pero no he tratado de incluirlo todo. Debe tomarse en cuenta que un curso completo sobre la Teoría de la Relatividad requeriría de un libro como el libro “Gravitation” de más de 1,200 páginas:
Prof. Armando Martínez
Página 11
Fundamentos de Relatividad General
Prologo
Ilustración 1
De Charles W. Misner, Kip S. Thorne y John Archibald Wheeler (considerado por los estudiosos como la “Biblia” de la Relatividad General y conocido también entre la comunidad científica como el “Directorio Telefónico” por su grosor), siendo éste un libro que se utiliza a nivel de estudios de Doctorado en Física. No es el propósito de esta obra ser enciclopédica cubriéndolo absolutamente todo. Sin embargo, con los materiales que he incluido, al menos los que no son especialistas en el tema tendrán cierta idea sobre aquello de lo cual están hablando estos libros de texto avanzados, y tal vez hasta podrán entender algunas cosas en dichos libros. Lo cual siempre es mejor que no entender absolutamente nada y no tener la menor idea sobre aquello de lo cual trata una de las teorías más revolucionarias de nuestros tiempos. Tal vez haya frases o comentarios dentro de este trabajo que a algunos lectores les parecerán demasiados obvias e inclusive superfluas. Por ejemplo, en varias partes el lector tal vez encontrará una referencia a cierto objeto moviéndose todo el tiempo en la misma dirección y sentido, y al ver esto tal vez se dirá a sí mismo: “¿Por qué se habla aquí de un objeto que se está moviendo en la misma dirección y sentido? ¿Es que acaso un objeto puede moverse en cierta dirección pero en diferente sentido?”. La respuesta que a veces sorprende a muchos está ejemplificada en el siguiente diagrama:
Prof. Armando Martínez
Página 12
Fundamentos de Relatividad General
Prologo
Ilustración 2
En este caso, tenemos un cuerpo 𝐴 que está moviéndose siguiendo una dirección hacia la derecha. Pero el sentido en el que está moviéndose dicho cuerpo es realmente hacia donde lo está jalando el cuerpo 𝐵, que es hacia abajo. Al hablar de un cuerpo que está moviéndose en la misma dirección y sentido, se está hablando de un cuerpo que se está moviendo en la misma dirección y en el mismo sentido, literalmente hablando. Existen también otras def0iniciones con diferencias sutiles que desafortunadamente muchos maestros omiten señalar ya sea por olvido o por ignorancia, como el hecho de que utilizamos la palabra área cuando nos referimos al espacio comprendido dentro de una figura geométrica plana y utilizamos la palabra superficie cuando nos referimos al mismo espacio comprendido dentro de los bordes de una figura geométrica tridimensional (como lo es el caso de la superficie de una pelota); o como el hecho de que no es lo mismo velocidad que rapidez, ya que para definir la velocidad de un objeto generalmente la damos señalando la dirección hacia la cual se está desplazando dicho objeto o por lo menos le asignamos un signo positivo o negativo (por ejemplo un signo positivo cuando se trata de un cuerpo moviéndose hacia la derecha o un signo negativo cuando se trata del mismo cuerpo moviéndose en sentido contrario, hacia la izquierda) pero para definir la rapidez del mismo objeto simplemente damos la magnitud de la velocidad (por ejemplo, 5 metros por segundo) sin hacer referencia alguna a la dirección hacia la cual se está moviendo el objeto. Hay aún otras definiciones cuyo uso puede causar confusión en quienes adolecen de una mala enseñanza en sus estudios de secundaria y bachillerato, como la diferencia entre el concepto de masa y el concepto de peso (la masa es algo intrínseco, invariable, medido en kilogramos, propio de un objeto cualesquiera que ocupe un lugar en el espacio y que inclusive pueda estar flotando en el espacio, mientras que el peso es la atracción ejercida por la gravedad sobre una masa, de forma tal que una masa de una tonelada puede tener un peso igual a cero al estar flotando fuera del sistema solar, mientras que una masa de unos cuantos gramos puede tener un peso considerable sobre la superficie de un planeta como Júpiter). Y así como éstos hay otros detalles y expresiones similares empleadas aquí que vistas a fondo no son tan superfluas. En donde lo he considerado conveniente, he metido problemas de ejercicios de práctica que el lector puede intentar resolver por sí mismo antes de irse un poco más abajo del mismo para ver su solución. En ningún caso he incluido problema o ejercicio para el que yo no dé solución alguna, porque es mi objetivo no dejar con dudas a los lectores. Y esto aplica a toda la obra. Prof. Armando Martínez
Página 13
Fundamentos de Relatividad General
Prologo
He tratado también de recurrir a todo el arsenal disponible de elementos didácticos y pedagógicos para poder mantener centrada la atención del lector sobre el tema que se está discutiendo, incluyendo numerosas figuras y diagramas así como el uso de colores en donde tal cosa sea conveniente para resaltar la importancia de algo en específico; y del mismo modo me he permitido agregar pasos extra en la derivación de resultados que frecuentemente son omitidos en los textos impresos. Aunque en una cadena de razonamientos hay muchas explicaciones y muchos pasos que son más que obvios para el maestro o para el especialista, pasos que son omitidos en la publicación de trabajos científicos. Muchas veces hay cosas que no son tan obvias para los que están iniciando por vez primera el estudio de una rama nueva del conocimiento, y es aquí en donde cualquier explicación adicional o comentarios extra pueden ser de gran ayuda para ayudarle al lector a comprender mejor una idea sin dejarle dudas sobre la misma, y de esto es de lo que trata a fin de cuentas todo el esfuerzo que se ha estado llevando a cabo en esta obra. La obligación del maestro no es dar explicaciones elegantes, su obligación es dar explicaciones entendibles, su obligación es enseñar, y en la medida en que el maestro pueda lograr esto habrá cumplido (o fracasado) en su misión fundamental que consiste en la transmisión de conocimientos. Las explicaciones elegantes, concisas, abstractas, rigurosas (y de preferencia poco entendibles) se pueden dejar para la publicación de trabajos científicos para cuya lectura se supone que los lectores están familiarizados e inclusive son expertos en el tema. Se ha hecho lo posible por hacer esta obra autosuficiente, proporcionando dentro de la misma las herramientas necesarias para poder avanzar sin necesidad de tener que estar buscando en las bibliotecas y en las librerías otros libros de texto de difícil obtención que recurren incluso a notación diferente que puede resultar confusa. Los materiales de referencia externos, cuando son citados aquí, son materiales que se pueden obtener rápidamente con una conexión a Internet. Como será obvio conforme el lector se adentre en el estudio de la materia, Einstein no formuló por cuenta propia todo lo que tiene que ver con la Teoría de la Relatividad, se tuvo que apoyar en los trabajos de otros científicos de primer nivel como Bernhard Riemann (el matemático que asentó sobre bases firmes la geometría diferencial y formalizó el estudio de las geometrías no-euclideanas), James Clerk Maxwell (el padre del electromagnetismo), Gregorio Ricci y su alumno Tullio LeviCivita (creadores del cálculo tensorial) y Hermann Minkowski (descubridor de la interpretación geométrica de la Teoría de la Relatividad a través de los diagramas espacio-tiempo), y la labor ha tenido que ser continuada por científicos de la talla de Stephen Hawking y Roger Penrose. Pero el mérito de haber utilizado todas las herramientas disponibles en su tiempo para consolidar una de las teorías más brillantes del siglo XX es indiscutiblemente suyo, y ese es un mérito que nadie le va a negar. Aunque al tratar sobre el tema de la Teoría Especial de la Relatividad se ha tratado de hacer el menor uso posible de las herramientas propias del cálculo infinitesimal, la transición hacia la Teoría General de la Relatividad requiere forzosamente de Prof. Armando Martínez
Página 14
Fundamentos de Relatividad General
Prologo
algunos conocimientos básicos del cálculo infinitesimal, y no sólo del cálculo infinitesimal sino de otra rama de las matemáticas conocida como el cálculo tensorial (cuyos fundamentos son cubiertos en esta obra). Esta es la naturaleza de la bestia. De cualquier modo, hay mucho material que puede ser entendido aún por quienes no cuentan con estas herramientas matemáticas, se ha hecho aquí un esfuerzo adicional por lograrlo. Como corresponde a una obra de esta extensión, se ha suministrado al final de la misma una Bibliografía que incluye textos que van desde los más elementales hasta los que suelen considerarse más avanzados. También dentro de la Bibliografía, y reflejando el impacto que está teniendo la enciclopedia universal virtual Wikipedia, se ha proporcionado la lista de enlaces en los cuales los lectores pueden encontrar otras referencias de apoyo a los materiales condensados en esta obra. Dicha lista ha sido puesta acomodando los enlaces siguiendo un orden similar al cual se van tratando los temas dentro de esta obra. En dicha lista los lectores encontrarán tanto enlaces Wikipedia en Español como enlaces Wikipedia en Inglés, esto en virtud de que los enlaces Wikipedia en Inglés por lo general tienen información más actualizada o están algo más completos que los enlaces Wikipedia en Español sobre los mismos temas, especialmente tratándose de temas en ciencia y tecnología, e inclusive hay ciertos temas que aparecen publicados en los enlaces Wikipedia en Inglés pero que no aparecen aún en los enlaces Wikipedia en Español. Siendo la Wikipedia una base de datos en proceso continuo de evolución, al igual que el mismo Internet, vale la pena tener todas las referencias y enlaces posibles de la misma tanto en español como en inglés para poder buscar así en uno algo que no se pueda encontrar en otro. La Wikipedia tiene otra ventaja adicional que la pone por encima de otros enlaces que se pudieran facilitar: persistencia. ¿En cuántas ocasiones el lector no se llegó a encontrar con la desagradable sorpresa de que después de encontrar un enlace interesante regresó tiempo después solo para descubrir que dicho enlace ya no existía y que posiblemente hasta el sitio en el que se encontraba alojado el enlace tampoco existe, habiendo sido borrada toda la información junto con todas las imágenes? Esta es la principal razón por la cual me he abstenido en esta obra de citar enlaces cuya duración a largo plazo no esté garantizada. Como una muestra de la revolución informática que está ocurriendo desde que Internet irrumpió en la vida del hombre del Tercer Milenio, en algunas partes de esta obra se hace referencia a un nuevo medio de diseminación de trabajos científicos que está adquiriendo cada día mayor renombre. Se trata de arXiv, administrado por la Universidad de Cornell y financiado en parte por la National Science Foundation. Dados los costos involucrados en el pago de la compra o descarga vía Internet de papeles científicos publicados por las organizaciones profesionales establecidas, los cuales pueden irse acumulando rápidamente poniendo en aprietos los bolsillos de los académicos e investigadores que no son precisamente gente rica (un contrasentido considerando que en su gran mayoría los autores que envían sus trabajos para ser publicados en estos medios no lo hacen con fines de lucro), aunado a la lentitud con la cual puede tardar en aparecer publicado algún resultado importante mientras el trabajo es revisado por un equipo de colegas (proceso conocido como revisión por pares conocido en inglés como peer review), todo esto está motivando a que la preferencia hacia los medios clásicos de Prof. Armando Martínez
Página 15
Fundamentos de Relatividad General
Prologo
publicación vaya menguando y que la atención se esté trasladando cada vez con mayor frecuencia a recursos más modernos en Internet tales como arXiv. En muchos campos de las matemáticas y la física, casi todos los artículos científicos de importancia se están colocando ya en arXiv. A la fecha de septiembre de 2007, arXiv contenía más de 440.000 trabajos imprimibles, lo que supone que miles de ellos son añadidos cada mes. Su existencia fue uno de los factores que condujo a que se precipitara la actual revolución en la forma en que se efectúan las publicaciones científicas, conocido como el “movimiento de libre acceso”, con la posibilidad de una eventual desaparición de las revistas científicas tradicionales que pueden terminar siguiendo el camino recorrido por los dinosaurios en su extinción. Los matemáticos profesionales y los científicos cargan regularmente sus artículos en arXiv.org para que haya un acceso mundial y algunas veces para que se revise antes de que sean publicadas en revistas. Aunque la falta de revisión por pares suscita alguna preocupación, no se considera un obstáculo para los usuarios de arXiv, ya que muchos autores son cuidadosos con sus contribuciones, y la mayoría de los e-prints también se envían a revistas científicas para que sean publicadas, pero algunos trabajos, incluidos algunos artículos influyentes, se quedan solo como e-prints y jamás son publicados en una revista científica. Un ejemplo bien conocido de esto último es una prueba de la conjetura de la geometrización de Thurston que resuelve finalmente la famosa conjetura de Poincaré como caso particular, enviada por Grigori “Grisha” Perelman el 11 de noviembre de 2002 bajo el título “The entropy formula for the Ricci flow and its geometric applications”. Perelman parecía satisfecho de renunciar a una publicación tradicional revisada por pares, alegando que “Si alguien está interesado en mi forma de resolver los problemas, está todo ahí (refiriéndose a arXiv), dejemos que entren y lo lean”. En las entradas en esta obra en donde se trata el tema de la electrodinámica relativista, en lugar de la extensión del sistema de unidades 𝑀𝐾𝑆 hacia el área del electromagnetismo convencionalizado conocido todo en conjunto como el sistema de unidades 𝑆𝐼, se ha escogido al sistema Gaussiano de unidades. Aunque la gran mayoría de los lectores seguramente han sido expuestos al sistema 𝑀𝐾𝑆 de unidades de uso tan común en la resolución de problemas prácticos de ingeniería, cuyas unidades son de un orden de magnitud que resulta útil en la discusión de efectos medibles a la escala de laboratorio (volts, amperes, webers/m², etc.), en el estudio de la interacción de la radiación electromagnética con los constituyentes elementales de la materia (átomos, fotones, etc.) resulta más conveniente adoptar el sistema Gaussiano de unidades. Una consecuencia en la adopción del sistema Gaussiano de unidades es que fórmulas que le resultan familiares a muchos estudiantes como la fórmula 𝐵 = 𝜇𝐻 en el sistema Gaussiano se tome simplemente como la igualdad 𝐵 = 𝐻 sin que se vea a la constante de permeabilidad magnética 𝜇 presente. Pero la ausencia de 𝜇 en esta fórmula en el sistema Gaussiano de unidades se debe a la forma en la cual ha sido definido dicho sistema de unidades. Aún otra consecuencia es que la familiar fórmula que define al vector de Poynting como el producto cruz 𝑆 = 𝐸 · 𝐻 se convierte en la fórmula 𝑆 = (𝑐/4𝜋)𝐸 · 𝐻, haciendo que entre en el panorama la constante que simboliza a la velocidad de la luz. Sin embargo, este factor multiplicativo de 𝑐/4𝜋 resulta conveniente en los desarrollos que son llevados a cabo en el estudio de la electrodinámica clásica. (De cualquier forma, para convertir una fórmula del Prof. Armando Martínez
Página 16
Fundamentos de Relatividad General
Prologo
sistema de unidades 𝑆𝐼 al sistema Gaussiano de unidades basta reemplazar la permisividad eléctrica del espacio libre 𝜀0 con 1/4𝜋 y la permeabilidad magnética 𝜇0 con 4𝜋.) Otra razón que justifica la adopción del sistema Gaussiano de unidades al tratar el tópico de la electrodinámica relativista es que una gran cantidad de libros de texto a nivel universitario y a nivel postgrado adoptan el sistema Gaussiano de unidades, y el adoptar aquí el sistema 𝑀𝐾𝑆 puede causar confusión posterior al estar consultando varios textos, y esta sea tal vez la mejor razón de todas para no tratar de desviarse de algo que se ha convertido en una costumbre extendida. Se han incluido como parte de los apéndices de esta obra tanto el texto completo (en inglés) del primer trabajo que le fue publicado a Einstein en 1905 con el cual dio a conocer al mundo la Teoría Especial de la Relatividad, así como las copias más relevantes de su cuaderno de apuntes en el cual fue desarrollando a lo largo de dos años en forma manuscrita sus ideas principales acerca de la Teoría General de la Relatividad, que fue publicada en octubre de 1915. Se ha relegado también a los apéndices material importante que complementa las ideas expuestas en el interior de la obra o que expande el material expuesto hacia nuevos horizontes pero que no es indispensable para poder dar continuidad a lo que se está leyendo cuando se está siguiendo el orden de las entradas puestas en esta obra. Parafraseando a Jimmy Wales, el fundador de Wikipedia, este trabajo es una pequeña contribución al ambicioso objetivo de un mundo en el que todas las personas y cualquier persona tengan libre acceso a la suma total de los conocimientos de la humanidad. Aprovecho la ocasión para expresar mi más profundo agradecimiento a Roger Cortesi, quien generosamente proporcionó los medios para la generación automatizada a través de LaTeX de la tipografía requerida para la construcción de fórmulas matemáticas que hasta la fecha no pueden ser generadas automáticamente por ninguno de los navegadores de Internet (browsers) convencionales. IMPORTANTE: Este es un trabajo construcción, y sólo se considerará terminado cuando este último párrafo no aparezca aquí haciendo esta advertencia. Los huecos que aparezcan aquí y allá a espera de ser llenados en esta obra son la consecuencia inevitable de ser algo que está siendo elaborado simultáneamente en partes diferentes. Aunque conforme se van acumulando los materiales están siendo sometidos a un proceso de revisión continua, es inevitable que en una obra de esta magnitud surjan equivocaciones, errores tipográficos e inclusive fallos de lógica, por lo que agradeceré cualquier observación que se me haga llegar al respecto así como cualquier sugerencia para mejorías.
Prof. Armando Martínez
Página 17
Fundamentos de Relatividad General
Movimiento absoluto
Movimiento absoluto Empezamos nuestra disertación con un viajero que se acaba de subir a un tren de pasajeros en una estación de ferrocarriles y se acaba de acomodar en su asiento el cual está justo a un lado de una ventana que da una vista hacia afuera. Una vez que el porter se ha asegurado de que todos los pasajeros le han entregado sus boletos de viaje y que están ya en sus lugares asignados, el tren se pone en movimiento enfilándose hacia su destino: El viajero se da cuenta de que el vagón de ferrocarril en el que viaja está en movimiento porque la vista que recibe del exterior le muestra que todo lo que observa de afuera, casas, praderas, edificios, llanos, granjas, etc., parece crear la ilusión de estarse desplazando todo junto en una dirección contraria a la dirección hacia la cual se está moviendo el ferrocarril. Al caer la noche, los pasajeros bajan las cortinas de las ventanas para poder dormir, y todo lo que se siente es el vaivén del ferrocarril conforme avanza sobre las vías de acero. Es aquí cuando el viajero se percata de que al estar cerradas las cortinas, al no tener una vista directa desde el vagón hacia el exterior, ha perdido su punto de referencia visual con el cual podía darse cuenta sin el menor asomo de duda que el vagón de pasajeros en el que viaja estaba en movimiento sobre las vías del tren. De cualquier manera, él sabe que el pesado tren está en movimiento porque se está meciendo de un lado a otro produciendo vibraciones sensibles no sólo al oído sino al tacto, clara señal de que el tren mantiene cierto tipo de movimiento. Ahora llevaremos a cabo un experimento gedanken, un experimento realizado por completo dentro de la tranquilidad de nuestro pensamiento pero que no por ello deja de tener repercusiones completamente válidas para el mundo real en que vivimos como las podría tener un experimento llevado a cabo con instrumentos y aparatos costosos. Vamos a suponer que todas las ventanas del tren han sido selladas herméticamente de modo tal que será imposible tener la menor pista de que el tren está en movimiento por alguna señal visual llegada del exterior. El interior del tren se encuentra perfectamente iluminado por el sistema de energía eléctrica autónomo del convoy de ferrocarriles, pero no es posible ver hacia afuera porque el vagón es en efecto una caja herméticamente sellada.
Prof. Armando Martínez
Página 18
Fundamentos de Relatividad General
Movimiento absoluto
¿Entonces cómo podremos saber que nos estamos moviendo junto con el vagón que nos transporta? Lo primero que se nos ocurre es la confirmación que nos da el vaivén del vagón meciéndose de un lado a otro. Esto nos confirma que estamos en movimiento. Pero esta confirmación se debe a las imperfecciones de las vías del ferrocarril que no están situadas sobre una superficie horizontal perfectamente plana. En nuestro experimento gedanken, imaginaremos que las vías del ferrocarril están colocadas sobre una superficie extensa perfectamente plana de modo tal que el vagón no tiene por qué mecerse de un lado a otro, e imaginaremos también que el tren se mueve siempre hacia adelante sin virar en lo más mínimo ni hacia la derecha ni hacia la izquierda. De este modo el convoy de vagones se mueve sin mecerse de un lado a otro, y así hemos perdido otra pista que nos indicaba que estamos en movimiento. Pero aún nos queda el ruido estridente que producen las ruedas de acero del ferrocarril tallando sobre las vías de acero en las que se mueve. Sin embargo esto se puede solucionar sellando acústicamente el vagón de ferrocarril de modo tal que no sea posible percibir ruido alguno llegado del exterior, con lo cual estaremos viajando en un tren perfectamente blindado en contra de ruidos (si el viajero es sordo, tal blindaje acústico no será necesario). Tal vez se nos ocurra hacer trampa con un amigo situado en el exterior que a través de un teléfono celular nos llame del exterior y nos confirme que el tren está en movimiento. Pero supondremos que no contamos con tal ayuda. Supongamos que el tren es un tren bala de diseño ultramoderno que está viajando a una velocidad extremadamente elevada con respecto al suelo, digamos a unos 500 kilómetros por hora. Se nos podría ocurrir otra cosa; se nos podría ocurrir saltar hacia arriba dentro del vagón de ferrocarril para no tener contacto alguno con el piso del mismo por algunos segundos, en la creencia de que al estar separados del piso por ese breve lapso de tiempo suspendidos en el aire el vagón continuará con su movimiento rápido de 500 kilómetros por segundo mientras que nosotros iremos quedando atrás, y al caer tocando nuevamente el piso estaremos en una posición más retrasada que la posición desde la cual habíamos saltado. Sin embargo, al hacer esto, descubrimos que esto no funcionará tampoco, caeremos exactamente en el mismo sitio desde el cual saltamos hacia arriba. Esto se debe a que si bien el tren se está moviendo a una rapidez elevada, a 500 kilómetros por hora, nosotros con los pies puestos firmemente sobre el piso del vagón también nos estaremos moviendo a los mismos 500 kilómetros por hora, y al despegarnos del piso del tren seguiremos moviéndonos a la misma velocidad de 500 kilómetros por hora, porque en un vagón perfectamente blindado no hay nada que nos haga perder nuestra velocidad de 500 kilómetros por hora. Esto es algo que nos garantiza una de las leyes de Newton, que nos dice que todo cuerpo permanece en estado de reposo o en su movimiento rectilíneo mientras no intervenga una fuerza externa que modifique dicho estado de reposo o de movimiento rectilíneo. Y en un vagón perfectamente sellado no hay fuerza horizontal alguna actuando en contra nuestra que nos haga perder nuestra velocidad de 500 kilómetros por hora. Si el vagón estuviera al descubierto, sin techo y sin paredes, entonces al saltar hacia arriba la fuerza del aire exterior actuando como un viento en contra de nosotros nos haría caer más atrás, pero esto se debe a que al saltar y despegarnos del piso del vagón por breves Prof. Armando Martínez
Página 19
Fundamentos de Relatividad General
Movimiento absoluto
instantes el vagón ya no nos puede seguir arrastrando con la misma velocidad al no tener nosotros ya el momento del tren para vencer a la resistencia del aire. En un vagón perfectamente sellado, no hay corrientes de aire que nos puedan mover de un lado a otro cuando saltamos, así que un brinco hacia arriba nos hará caer en el mismo punto del cual saltamos. Esta es una experiencia que tal vez muchos habrán compartido cuando al estar viajando dentro de un camión de pasajeros circulando por la carretera saltaron hacia arriba creyendo que iban a caer un poco más atrás y cayeron en el mismo lugar del cual saltaron. Al fallar lo anterior, nuevamente, volvemos a formularnos la pregunta de antes: ¿Entonces cómo podremos saber que nos estamos moviendo junto con el vagón que nos transporta? Si hemos sido raptados, anestesiados, y despertamos después en un vagón de ferrocarril perfectamente sellado del exterior, lo primero que desearíamos saber es si el tren en el que viajamos está en movimiento. Pero sin pista visual alguna y sin pista acústica alguna, tal cosa se antoja problemática. Es entonces cuando tratamos de recurrir a la física, cuando tratamos de recurrir a cierto experimento mecánico que nos permita darnos cuenta de que estamos en movimiento. Aquí vale de todo, sacar balanzas, agujas colgando de hilos delgados, medidores de presión barométrica, en fin, todos los instrumentos y aparatos que se nos puedan ocurrir. Sin embargo, conforme hacemos experimento tras experimento, encontramos que no hay absolutamente nada de índole mecánica que nos confirme que nos estamos moviendo, por la sencilla razón de que todos nuestros instrumentos y aparatos mecánicos están en reposo frente a nosotros moviéndose exactamente a la misma velocidad a la cual nos estamos desplazando con el tren. Adentro del vagón perfectamente blindado, todo se encuentra en un reposo tan perfecto como el reposo en el que nos encontraríamos afuera en un laboratorio escolar. Aquí seguramente habrá críticos que dirán que esta es una situación altamente hipotética, altamente idealizada, de un experimento imposible de llevarse a cabo. Sin embargo, esto no es así, ya que para llegar a las mismas conclusiones todo lo que tenemos que hacer es subirnos a una nave espacial y salir fuera de la órbita terrestre. Estamos en la nave espacial, y de repente al asomarnos por una de las ventanas de la misma vemos pasar un asteroide a gran velocidad muy cerca de nosotros el cual casi se estrella contra nuestra nave. Aquí decimos: “Qué rápido se está moviendo el asteroide”. Pero un náufrago espacial varado en el asteroide muy bien nos podría decir “Qué rápido se está moviendo esa nave espacial”. Tanto nosotros como el náufrago espacial varado en el asteroide podríamos enfrascarnos en un debate diciendo que es el otro el que se está moviendo a gran velocidad. ¿Pero cuál de los dos tiene la razón? En realidad, ninguno, no a menos de que exista un experimento mecánico que permita determinar de modo absoluto quién es el que se está moviendo. Y para que la respuesta sea válida, tendría que existir algún punto de referencia absoluto, algo que por su misma naturaleza pudiéramos clasificar en un estado de reposo absoluto, con respecto al cual tanto nosotros como el náufrago espacial podríamos dirimir el asunto sobre quién es el que realmente se está moviendo. Porque podría muy bien suceder que si bien nosotros y el náufrago espacial varado en el asteroide nos estamos viendo el uno al otro moviéndonos en Prof. Armando Martínez
Página 20
Fundamentos de Relatividad General
Movimiento absoluto
direcciones opuestas a gran velocidad el uno con respecto al otro, ninguno de los dos realmente está en reposo con respecto a otro punto de referencia absoluto si es que pudiera existir una cosa así. En base a lo anterior, los siguientes tres puntos de vista para dos naves espaciales que se encuentran en el espacio viajando en direcciones opuestas producirán los mismos resultados numéricos para cualquier tipo de experimento mecánico que se pueda llevar a cabo.
Ilustración 3
En el primer caso, la nave inferior se considera a sí misma que está parada flotando en el espacio, mientras que ve pasar por encima de ella a otra nave espacial viajando a una velocidad de 500 metros por segundo, a la cual el tripulante de la nave inferior le dice “yo estoy parado flotando en el espacio, eres tú el que se está moviendo”. En el segundo caso, el tripulante de la nave que pasa por arriba, le contesta: “eso no es cierto, yo soy el que está detenido flotando en el espacio, eres tú el que se está moviendo a una velocidad de 500 metros por segundo. Y en el tercer caso, con respecto a un tercer observador externo a ambas naves, las dos se están moviendo en sentidos opuestos cada una con una velocidad de 250 metros por segundo. ¿Quién tiene la razón? Todos, y a la vez ninguno. Todos tienen la razón porque al no poder detectarse el movimiento absoluto los tres anteriores supuestos son igualmente válidos. Y todos están equivocados si insisten en afirmar cada uno que su punto de vista es el correcto y los demás están en el error. Por lo pronto, y regresando a nuestro vagón blindado de ferrocarril en la tierra, tenemos que aceptar querámoslo o no que no existe experimento alguno de índole mecánica que nos permita saber si nos estamos moviendo. Esto era algo que ya se sabía desde los tiempos de Galileo y que fue formalizado tiempo después por Newton con sus leyes con las cuales dio inicio a la mecánica clásica tal y como la conocemos hoy en día.
Prof. Armando Martínez
Página 21
Fundamentos de Relatividad General
Movimiento absoluto
“No existe ningún experimento de índole mecánica que nos pueda indicar que estamos en movimiento.” Lo que acabamos de enunciar tiene alcances y repercusiones mucho más profundas que lo muchos pudieran suponer. Regresemos al viajero que está en un vagón del ferrocarril en movimiento. Un observador estacionario situado a un lado de las vías del ferrocarril que tenga sus pies plantados firmemente sobre la Tierra podría sentirse tentado a decirle en voz alta al viajero: “Indudablemente que tú eres el que se está moviendo. No puedes argumentar que el ferrocarril está parado y que son las vías del ferrocarril las que se están moviendo en sentido contrario junto con todo lo que tú estás viendo moverse a través de tu ventana de observación, incluyendo los árboles, las casas, los edificios, las montañas, las praderas, todo incluyéndome a mí. Yo soy el que está parado, y tú indudablemente eres el que se está moviendo”. El argumento anterior podría parecer razonable a primera vista. Sin embargo, es una falacia. Supongamos que hemos construido un ferrocarril cuyas vías han sido colocadas siguiendo la ruta del ecuador de la Tierra. Supongamos ahora que el ferrocarril se pone en movimiento en sentido contrario al sentido de rotación de la Tierra. La Tierra, en virtud de su movimiento de rotación alrededor de su eje, movimiento que da origen a los días y las noches, da un giro completo en 24 horas. Usando radianes como medida de desplazamiento angular, la velocidad angular 𝜔 de rotación de la Tierra será entonces: 𝜔 = 2𝜋 𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠/24 ℎ𝑜𝑟𝑎𝑠 𝜔 = 72.722 × 10−6 𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Por otro lado, la velocidad tangencial 𝑣𝑡 en la superficie de un cuerpo en rotación que está girando a una velocidad angular 𝜔 a una distancia 𝑟 del eje de rotación de dicho cuerpo está dada por: 𝜔 =
𝑣𝑡 𝑟
Suponiendo para la Tierra un radio medio en su ecuador de 𝑟 = 6.37 × 106 𝑚𝑒𝑡𝑟𝑜𝑠, la velocidad tangencial 𝑣𝑡 en la superficie del ecuador de la Tierra con respecto a su eje de rotación será entonces: 𝑣𝑡 = 𝜔𝑟 𝑣𝑡 = (72.722 × 10−6 𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜)(6.37 × 106 𝑚𝑒𝑡𝑟𝑜𝑠) 𝑣𝑡 = 463.24 𝑚𝑒𝑡𝑟𝑜𝑠 / 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Si el ferrocarril se pone en marcha en sentido contrario al movimiento de rotación de la Tierra a una velocidad de 463.24 metros por segundo, y si empieza el viaje al Prof. Armando Martínez
Página 22
Fundamentos de Relatividad General
Movimiento absoluto
mediodía con el Sol directamente encima, entonces el Sol parecerá estacionario sin moverse un solo milímetro. Para alguien flotando en el espacio encima del ferrocarril, la bóveda celeste parecerá estacionaria, y todo lo demás fuera del ferrocarril parecerá estarse moviendo, incluyendo las vías sobre las cuales está montado el ferrocarril, los árboles, las casas, los edificios, las montañas, las praderas, los lagos, incluyendo desde luego al observador estacionario en la Tierra que le decía al viajero que era él quien estaba en reposo absoluto. Fuera del ferrocarril, para todos, amanecerá y anochecerá, los días transcurrirán como siempre, mientras que para el viajero dentro del ferrocarril el Sol seguirá puesto encima de él sin moverse para nada. De repente, el viajero en el ferrocarril parece haberse convertido en el observador privilegiado que se siente tentado a decir que él sí está en estado de reposo absoluto. Siguiendo un impulso egocentrista, podríamos sentirnos tentados a afirmar que la Tierra es el centro del cosmos, dándole a la Tierra una condición de reposo absoluto y negando el movimiento de traslación de la Tierra alrededor del Sol. Esta fue precisamente la cuestión por la cual el físico italiano Galileo Galilei fue acosado por la Santa Inquisición, en tiempos en los que por motivos religiosos se consideraba al hombre como el centro de la Creación, el centro del cosmos, con la bóveda celeste girando en torno suyo certificando su posición privilegiada como criatura predilecta de Dios. Lo único que pudo hacer Galileo después de ser obligado a negar el movimiento de rotación de la Tierra fue exclamar en voz baja: “Y sin embargo se mueve” – (Galileo Galilei). Sin embargo, ni aún compensando por el movimiento de rotación de la Tierra con un ferrocarril construido siguiendo la ruta del ecuador le sería posible a un el viajero dentro del ferrocarril considerarse a sí mismo como un observador privilegiado en reposo absoluto, en virtud de que la Tierra no sólo tiene un movimiento de rotación en torno a su eje sino que además tiene un movimiento de traslación alrededor del Sol, precisamente el movimiento que da origen a las estaciones del año. Fracasando en nuestros intentos por encontrar en la Tierra un punto de referencia absoluto con respecto al cual el movimiento absoluto se pueda medir, podríamos sentirnos tentados a asignarle al Sol un papel privilegiado, considerándolo como el centro del Universo. De esto es de lo que trata la creencia en la teoría heliocéntrica (el Sol es el centro del cosmos) sostenida inclusive por los astrónomos Copérnico y Kepler que se encargaron de darle la puntilla a la teoría geocéntrica (la Tierra es el centro del cosmos). Pero esto a la postre resulta ser también una ilusión, por el hecho de que el Sol no es más que una estrella más dentro de nuestra galaxia, la Vía Láctea, habiendo muchas otras estrellas albergando otros sistemas solares, los cuales resultan estar también en movimiento dentro de la Vía Láctea. El anterior fracaso podría llevar a algunos a intentar proclamar a la Vía Láctea, nuestra propia galaxia, como el centro del Universo. Pero nuestra galaxia no es la única galaxia del Universo. En nuestra mira de observación con la ayuda de Prof. Armando Martínez
Página 23
Fundamentos de Relatividad General
Movimiento absoluto
nuestros instrumentos actuales hay billones y billones de otras galaxias, a ninguna de las cuales puede asignársele una posición privilegiada por el hecho de que todas las galaxias se están separando la una de la otra debido a la expansión continua del Universo. Y esta es una expansión que tampoco tiene un “centro de origen”, un centro de la explosión inicial que hoy conocemos como el “Big Bang”. Parece que hemos agotado todas las posibilidades de poder detectar el movimiento absoluto recurriendo a referencias astronómicas además de tratar de recurrir a experimentos de índole mecánica. Sin embargo, a principios del siglo XX, había una esperanza basada en un descubrimiento sobre otro tipo de fenómenos físicos, un descubrimiento que llevó a físicos de primera línea a postular la existencia de una substancia universal conocida como el éter, con respecto al cual debería ser posible en principio determinar el movimiento absoluto no por medios mecánicos, sino por medios ópticos, usando rayos de luz.
Prof. Armando Martínez
Página 24
Fundamentos de Relatividad General
Prof. Armando Martínez
Movimiento absoluto
Página 25
Fundamentos de Relatividad General
Un descubrimiento sorprendente
Un descubrimiento sorprendente Descartada totalmente la posibilidad de poder determinar por medio de algún experimento propio de la mecánica si algo está en estado de movimiento con respecto a algún punto de referencia que pudiera considerarse absoluto, en cierto momento renació la esperanza de que tal cosa pudiera lograrse no por medios mecánicos sino por medios ópticos llevados a cabo dentro de un vagón de ferrocarril perfectamente blindado. Es aquí cuando entra en el panorama el físico matemático James Clerk Maxwell, el cual asentó firmemente sobre bases matemáticas los principios básicos del electromagnetismo, enunciados desde los tiempos de Faraday, enunciando las cuatro ecuaciones básicas del electromagnetismo con las cuales ganó para sí mismo la inmortalidad en la comunidad científica: ⃗ =𝜌 ∇·𝐷 ⃗ =0 ∇·𝐵 ∇ · 𝐸⃗ = −
⃗ 𝜕𝐵 𝜕𝑡
⃗ =𝐽+ ∇·𝐻
⃗ 𝜕𝐷 𝜕𝑡
Estas cuatro fórmulas están elaboradas en notación vectorial (las cantidades D, B, E, H y J son vectores, o mejor dicho campos vectoriales en analogía con las líneas de fuerza que representan un campo gravitacional, y como tales son cantidades que tienen dirección y sentido de forma similar al viento que sopla en las praderas), lo cual simplifica enormemente el pronunciamiento de las mismas debido a que el enunciado es independiente del tipo de coordenadas (Cartesianas, polares, cilíndricas, esféricas, etc.) que se utilicen en el estudio de algún fenómeno electromagnético particular. La primera ecuación nos dice esencialmente que el flujo neto (divergencia) de las líneas de fuerza eléctrica que salen (o entran) de cualquier recipiente cerrado depende de la densidad de la carga eléctrica ρ que encierra dicho recipiente (para un recipiente dentro del cual no hay carga eléctrica alguna almacenada en su interior, el flujo neto de las líneas de fuerza eléctrica sobre toda la superficie del recipiente es cero); la segunda ecuación nos dice que todas las Prof. Armando Martínez
Página 26
Fundamentos de Relatividad General
Un descubrimiento sorprendente
líneas de fuerza de un campo magnético (como las de un imán) forman siempre un bucle cerrado (no existen monopolos magnéticos, esto es, una partícula de la cual salgan líneas de fuerza de un campo magnético correspondientes al polo Norte de un imán, y otra partícula de la cual salgan líneas de fuerza de un campo magnético correspondientes al polo Sur del imán) y por lo tanto la divergencia de las líneas del campo magnético es siempre cero (el flujo neto de las líneas de fuerza del campo magnético que entren a cualquier recipiente cerrado restado del flujo de las líneas de fuerza del campo magnético que salgan del mismo recipiente será exactamente igual a cero en todos los casos); mientras que la tercera y la cuarta ecuación nos dicen que todo campo eléctrico que varíe con el tiempo producirá campos magnéticos rotacionales del mismo modo que todo campo magnético que varíe con el tiempo producirá a su vez campos eléctricos rotacionales. Se puede demostrar a partir de las ecuaciones del campo electromagnético de Maxwell, como el mismo Maxwell lo descubrió por vez primera, que la velocidad de una onda electromagnética en el vacío que consta de un campo eléctrico 𝐸⃗ y un ⃗ perpendiculares el uno al otro y alternantes sinusoidalmente campo magnético 𝐵 en el tiempo:
Ilustración 4
Depende única y exclusivamente de la permisividad eléctrica del vacío 𝜀0 y de la permeabilidad magnética del vacío 𝜇0 , y la velocidad para dicha onda electromagnética debe ser: 𝑣=
1 √𝜇0 𝜀0
Los valores experimentales para estos parámetros ya eran conocidos en los tiempos de Maxwell, de modo tal que no fue para él ningún problema llevar a cabo una substitución de dichos valores para poder saber cuál era la velocidad de una onda electromagnética propagándose en el vacío.
PROBLEMA: En el sistema de unidades SI (MKS) se aceptan generalmente como válidos los siguientes valores experimentales para la permisividad eléctrica y para la permeabilidad magnética del vacío:
𝜀0 = 8.854 × 10−12 𝑓𝑎𝑟𝑎𝑑/𝑚 𝜇0 = 12.5664 × 10−7 ℎ𝑒𝑛𝑟𝑦/𝑚
Prof. Armando Martínez
Página 27
Fundamentos de Relatividad General
Un descubrimiento sorprendente
Determínese, a partir de estos valores experimentales, la velocidad de una onda electromagnética propagándose en el vacío. Puesto que las unidades SI del farad y el henry son algo crípticas para quienes no están familiarizados con estas unidades, las pondremos en una forma más convencional acorde con las unidades que se utilizan en la Mecánica. Empezaremos con la unidad del farad. De la teoría básica del campo eléctrico, la capacitancia 𝐶 de un condensador es igual a la carga eléctrica 𝑄 almacenada por el condensador dividida entre el voltaje 𝑉 que hay entre las terminales del condensador, según la fórmula 𝐶 = 𝑄/𝑉. Esto significa que, dimensionalmente, un farad es igual a un coulomb de carga eléctrica dividido entre un volt: 1 (𝑓𝑎𝑟𝑎𝑑) = 1 (
𝑐𝑜𝑢𝑙𝑜𝑚𝑏 ) 𝑣𝑜𝑙𝑡
Entonces la unidad de la permisividad eléctrica es: 1(
𝑓𝑎𝑟𝑎𝑑 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 )= 1 ( ) · 𝑚𝑒𝑡𝑟𝑜 𝑚𝑒𝑡𝑟𝑜 𝑣𝑜𝑙𝑡
Pero el voltaje 𝑉 se define como el trabajo 𝑊 hecho sobre una unidad de carga 𝑄 para moverla de un punto con un potencial 𝑉1 a otro punto con un potencial 𝑉2, dividido entre el valor de la carga, o sea 𝑉 = 𝑊/𝑄. Y el trabajo mecánico se define como el producto de la fuerza aplicada (medida en newtons) por la distancia recorrida (medida en metros). Entonces, dimensionalmente hablando, una unidad de voltaje es igual a: 1 (𝑣𝑜𝑙𝑡) = 1 (𝑛𝑒𝑤𝑡𝑜𝑛 ·
𝑚𝑒𝑡𝑟𝑜 ) 𝑐𝑜𝑢𝑙𝑜𝑚𝑏
Entonces podemos escribir la unidad dimensional de la permisividad eléctrica del modo siguiente:
O sea:
1(𝑐𝑜𝑢𝑙𝑜𝑚𝑏) 𝑚𝑒𝑡𝑟𝑜 (1 𝑛𝑒𝑤𝑡𝑜𝑛 · ) · 𝑚𝑒𝑡𝑟𝑜 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 𝑓𝑎𝑟𝑎𝑑 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 2 1( )= 1 ( ) 𝑚𝑒𝑡𝑟𝑜 𝑛𝑒𝑤𝑡𝑜𝑛 · 𝑚𝑒𝑡𝑟𝑜2
De este modo: 𝜀0 = 8.854 × 10−12 (
𝑐𝑜𝑢𝑙𝑜𝑚𝑏 2 ) 𝑛𝑒𝑤𝑡𝑜𝑛 · 𝑚𝑒𝑡𝑟𝑜2
Ahora trabajaremos con la unidad del henry. El henry es la unidad utilizada para medir la inductancia eléctrica 𝐿 de una bobina, de acuerdo con la fórmula:
Prof. Armando Martínez
Página 28
Fundamentos de Relatividad General
Un descubrimiento sorprendente
ε= −𝐿
𝑑𝑖 𝑑𝑡
De modo que, dimensionalmente hablando: 𝑎𝑚𝑝𝑒𝑟𝑒 1 (𝑣𝑜𝑙𝑡) = 1 (ℎ𝑒𝑛𝑟𝑦 · ( )) 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Pero un ampere de corriente eléctrica es por definición igual a un coulomb por segundo de carga eléctrica 𝑄 atravesando una superficie imaginaria: 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 1 (𝑎𝑚𝑝𝑒𝑟𝑒) = 1 ( ) 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Entonces: 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 1 (𝑣𝑜𝑙𝑡𝑖𝑜) = 1 ℎ𝑒𝑛𝑟𝑦 · ( ) 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Despejando para la unidad del henry: 1 (ℎ𝑒𝑛𝑟𝑦) = 1 (𝑣𝑜𝑙𝑡𝑖𝑜 ·
𝑠𝑒𝑔𝑢𝑛𝑑𝑜2 ) 𝑐𝑢𝑙𝑜𝑚𝑏𝑖𝑜
Entonces la unidad dimensional SI para la permeabilidad magnética 𝜇0 puede escribirse en la siguiente forma igualmente válida: ℎ𝑒𝑛𝑟𝑦 𝑣𝑜𝑙𝑡 · 𝑠𝑒𝑔𝑢𝑛𝑑𝑜2 1( )= 1 ( ) 𝑚𝑒𝑡𝑟𝑜 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 · 𝑚𝑒𝑡𝑟𝑜 De este modo, utilizando el equivalente “mecánico” del volt obtenido en el caso de la permisividad eléctrica, podemos escribir la permeabilidad magnética del modo siguiente: s𝑒𝑔𝑢𝑛𝑑𝑜2 𝜇0 = 12.5664 × 10 𝑛𝑒𝑤𝑡𝑜𝑛 · 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 2 −7
Podemos proceder a la aplicación de la fórmula de Maxwell para la velocidad de una onda electromagnética verificando al mismo tiempo la correcta cancelación y simplificación de unidades: 𝜇0 𝜀0 = (12.5664 × 10−7 𝑛𝑒𝑤𝑡𝑜𝑛 ·
𝑠𝑒𝑔2 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 2 −12 ) × (8.854 × 10 · 𝑚𝑒𝑡𝑟𝑜2 ) 𝑐𝑜𝑢𝑙𝑜𝑚𝑏 2 𝑛𝑒𝑤𝑡𝑜𝑛
𝜇0 𝜀0 = 1.1126 × 10
−17
𝑠𝑒𝑔𝑢𝑛𝑑𝑜2 ( ) 𝑚𝑒𝑡𝑟𝑜2
Finalmente:
Prof. Armando Martínez
Página 29
Fundamentos de Relatividad General
𝜈2 = Y 𝜈=
Un descubrimiento sorprendente
1 1 𝑚𝑒𝑡𝑟𝑜2 = ( ) 𝜇0 𝜀0 1.1126 × 10−17 𝑠𝑒𝑔𝑢𝑛𝑑𝑜2
1 √𝜇0 𝜀0
=
𝑣=
𝑚𝑒𝑡𝑟𝑜2 ( ) √1.1126 × 10−17 𝑠𝑒𝑔𝑢𝑛𝑑𝑜2 1
1 𝑚𝑒𝑡𝑟𝑜 ( ) −9 3.356 × 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜
𝑣 = 299.795.638 (
𝑚𝑒𝑡𝑟𝑜𝑠 ) 𝑠𝑒𝑔𝑢𝑛𝑑𝑜
Este resultado seguramente habrá llamado de inmediato la atención de Maxwell, porque esta es precisamente la velocidad de la luz en el vacío. Y puesto que la luz viaja en el vacío a esta velocidad, Maxwell concluyó de inmediato que la luz puede ser considerada como una onda electromagnética que consta de campos eléctrico y magnético alternantes. A la velocidad de la luz se le identifica comúnmente en la actualidad con la letra c, de modo tal que la conclusión de Maxwell puede ser enunciada de la siguiente manera con el significado filosófico que ello conlleva: 𝑐=
1 √𝜇0 𝜀0
= 2.99792458 × 108 𝑚/𝑠
Este descubrimiento sorprendente presentó casi de inmediato un problema fundamental. Siempre que hablamos de la velocidad de algo lo hacemos tomando otra cosa como referencia para medir dicha velocidad. Si decimos que algo, por ejemplo un avión, tiene una velocidad de 10 metros por segundo, entonces debe de estarse moviendo a 10 metros por segundo con respecto a otra cosa, en el caso del avión, con respecto al suelo. No tiene sentido ni lógica alguna hablar acerca de la velocidad de algo utilizando ese algo como su propia referencia del mismo modo que no tiene sentido alguno hablar acerca de una línea paralela cuando no existe otra línea recta con respecto a la cual se pueda compararla para decir que es paralela. Del mismo modo que no podemos decir que algo se encuentra “arriba” cuando no hay nada “abajo” de ese algo. Y el resultado obtenido no es algo que podamos reinterpretar a nuestro antojo, ya que la permisividad eléctrica y la permeabilidad magnética del vacío son atributos propios universales del mismo vacío que darán los mismos valores en cualquier parte del Universo en donde nos encontremos. Lo interesante de la fórmula de Maxwell es que la velocidad de la luz aparecía como un valor único, constante, invariable. ¿Pero con respecto a qué? Los físicos clásicos entrenados en la filosofía del universo clásico de Newton, presionados a proponer alguna salida al dilema sobre qué exactamente significaba esa velocidad de la luz considerada como una onda electromagnética no tardaron en inventar el medio en el cual se transmitía dicha onda, y la respuesta natural dada en aquél entonces fue que esa era la velocidad de la luz con respecto al éter (la palabra aquí no Prof. Armando Martínez
Página 30
Fundamentos de Relatividad General
Un descubrimiento sorprendente
tiene ninguna relación con el compuesto químico óxido de etilo del mismo nombre con fórmula química (𝐶2𝐻2)2𝑂 que es utilizado como anestésico por los doctores, sino con la idea de lo que es etéreo, celestial, algo llenando a la bóveda celeste de confín a confín). Para formular tal proposición se tomó en cuenta que, si de acuerdo con el resultado obtenido por Maxwell, la luz es una onda electromagnética, entonces para poder propagarse de un lado a otro tenía que hacerlo sobre el medio en el cual supuestamente estaba vibrando, del mismo modo en que los sonidos que escuchamos todos los días no son más que ondas acústicas formadas por compresiones y enrarecimientos del aire sumamente rápidas (en el vacío del espacio exterior en donde no hay aire, tampoco hay sonido alguno); del mismo modo en que ocurre en una “ola” de gente en cuya producción participan espontáneamente miles de aficionados presentes en un partido de futbol levantándose de sus asientos por breves instantes cuando les toca ser parte de la “ola”. Sin la presencia de los aficionados en las gradas, esas “olas” no se dan, del mismo modo que sin la presencia del aire no es posible que se produzca sonido alguno. Siendo la luz una onda electromagnética, el concepto del éter parecía una suposición lógica y natural. La postulación de la existencia del éter no sólo era deseable para suponer al éter como el medio a través del cual se propagan las ondas magnéticas luminosas, también era deseable desde el punto de vista filosófico e inclusive religioso, ya que permite evadir el tema del vacío total, ese vasto espacio entre los planetas, entre los sistemas solares y entre las galaxias en el cual a nuestra vista no parece haber absolutamente nada. Desde tiempos de la antigüedad, el vacío total ha sido una idea cuya sola mención ha causado angustia e inclusive espanto entre filósofos y religiosos de renombre, porque el vacío total representa la nada, la ausencia de todo. El omnipresente éter, invisible a nuestros ojos, era la solución científica ideal con la cual la ciencia podía reconfortar a los preocupados por tal cuestión haciéndoles saber que el vacío total, el vacío absoluto, era algo que no existía. Porque las vastas regiones del cosmos, en donde no parecía haber nada de materia estaban repletas de éter, así que siempre había algo que llenaba “los espacios vacíos”. El éter, aunque debía ser capaz de poder “vibrar” (para poder transmitir las ondas electromagnéticas luminosas), debía permanecer completamente inmóvil con respecto a todos los objetos materiales, más bien debían ser los objetos materiales los que se movieran a través de él, como el movimiento de una coladera a través del agua. Aunque el éter fuese una substancia invisible, incorpórea, una substancia que no puede ser vista directamente, escuchada, tocada, olida o paladeada, el movimiento absoluto de los planetas con respecto al éter debía ser detectable recurriendo a experimentos hechos con rayos de luz. Al éter se le suponía como algo completamente rígido, indeformable de confín a confín del Universo. Sus propiedades no podían ser menos que fantásticas. Tenía que poseer una rigidez extraordinaria para poder dar apoyo a ondas electromagnéticas de una frecuencia tan elevada como la poseída por los colores de la luz del espectro visible. En las guitarras y en todos los instrumentos de cuerda, para producir los sonidos más agudos, los de mayor frecuencia, la tensión de la cuerda que los produce tiene que ser mayor que la tensión de la cuerda requerida Prof. Armando Martínez
Página 31
Fundamentos de Relatividad General
Un descubrimiento sorprendente
para producirlos sonidos graves, en virtud de que la velocidad de las ondas en una cuerda tensa es directamente proporcional a la raíz cuadrada de la tensión de la cuerda. Pero pese a esta extraordinaria rigidez el éter no parecía tener efecto alguno sobre el movimiento de los planetas alrededor del Sol cuyas órbitas se podían predecir clásicamente con un buen nivel de precisión usando las fórmulas de Newton para la atracción gravitacional entre el Sol y los planetas, ignorando en dichas fórmulas cualquier efecto de retardo que el éter pudiese producir en los movimientos de los planetas. A diferencia del agua en los océanos de la Tierra, en los cuales se forman corrientes internas, en el éter cósmico no había tales “corrientes de éter”. El éter era uno solo, inamovible, como si fuese un bloque infinitamente grande de hielo, de modo que si algún observador privilegiado pudiera situarse en estado de reposo absoluto con respecto al éter en cualquier ciudad de la Tierra, podía tener la seguridad de que también estaba en reposo absoluto con respecto al éter en cualquier parte del Universo. El éter era el marco de referencia ideal con respecto al cual se podía medir el movimiento absoluto, y aparentemente también era inmune a los cambios de temperatura así como químicamente inerte, ya que no parecía haber substancia alguna conocida con la cual el éter pudiera reaccionar químicamente. Pero no sólo era el éter algo completamente rígido, a través del universo entero, inmune a los cambios de temperatura y químicamente inerte, también era completamente poroso y permeable, estaba metido dentro de todo, inclusive dentro de las cajas fuertes de los bancos suizos o en vagones sellados de ferrocarriles en movimiento. El éter podía estar en cualquier parte en donde pudiera producirse un rayo de luz. El mismo Maxwell determinó para el éter una densidad específica de 9.36 · 10 − 19, un coeficiente de rigidez de 842.8, y una estimación de que la densidad del aire a una distancia infinita de la Tierra era 1.8 · 10327 veces menor que la densidad por él estimada del éter. Pero no había científico alguno que se atreviera a aventurar una hipótesis sobre cuál era la substancia de la cual pudiera estar constituido el éter, ya que en la química de aquellos tiempos no se conocía elemento alguno que pudiera tener tan fantásticas propiedades. En realidad, la única razón de ser del éter era servir como medio universal de conducción para las ondas electromagnéticas del mismo modo que el aire sirve como medio de conducción para las ondas acústicas. La universalidad y absoluta rigidez del éter permitió suponer que la velocidad de la luz con respecto al éter tal vez pudiera utilizarse como el punto de referencia absoluto para la determinación del movimiento absoluto que no se había podido encontrar por medios puramente mecánicos hasta entonces. Aquél cuya velocidad fuera igual que la velocidad 𝑐 de 300 mil kilómetros por segundo podría considerarse a sí mismo en estado de reposo absoluto con respecto al éter, mientras que todo aquél cuya velocidad fuese mayor o menor que la velocidad de la luz podría considerarse a sí mismo en estado de movimiento con respecto al nuevo estándar de referencia, el éter. Y de este modo habría también una manera de determinar quién o quiénes están en estado de reposo o en estado de movimiento con respecto a este nuevo parámetro. Volviendo nuevamente a la nave espacial con forma de vagón de ferrocarril perfectamente blindado que vimos en el capítulo anterior. Sin necesidad de ver hacia el exterior bastaría con que alguien echara mano de una linterna encendiéndola Prof. Armando Martínez
Página 32
Fundamentos de Relatividad General
Un descubrimiento sorprendente
para enviar un rayo de luz de un extremo a otro de la nave, y si la velocidad de ese rayo de luz medida de alguna manera resultara ser igual a la velocidad de la luz obtenida mediante las ecuaciones de Maxwell, entonces el ocupante de la nave espacial podría dar por hecho el encontrarse por alguna maravillosa casualidad en un estado de reposo absoluto. Por otro lado, si para una persona exterior a la nave espacial, tal como un viajero varado en un asteroide, dicha nave espacial pasara a gran velocidad junto a ella, la velocidad de la luz disparada desde la linterna dentro de la nave espacial tendría que ser necesariamente diferente según el náufrago viajando en el asteroide. Aunque este se moviese rápidamente con respecto a la nave espacial en la misma dirección o en dirección contraria al haz saliendo de la linterna dentro de la nave espacial. En caso de moverse con una velocidad 𝑣 en dirección contraria a la dirección del haz que sale de la linterna dentro de la nave espacial con una velocidad 𝑐, el náufrago espacial en el asteroide debería ver al rayo de luz moverse con una rapidez todavía mayor igual a 𝑐 + 𝑣, mientras que en caso de moverse con una velocidad 𝑣 en la misma dirección del haz que sale de la linterna con una velocidad 𝑐 debería ver al rayo de luz moverse con una rapidez menor igual a 𝑐 − 𝑣 (moviéndose a una velocidad 𝑣 igual a 𝑐, el náufrago espacial estaría avanzando a la par con el rayo de luz que le parecería estático). Y en principio podría estar moviéndose tan rápido que inclusive hasta podría dejar atrás al rayo de luz después de alcanzarlo. Por fin había una forma de poder determinar experimentalmente quién se estaba moviendo y con respecto a qué se estaba moviendo, todo en base a un simple rayo de luz, todo en base a cualquier experimento óptico que pudiese utilizar rayos de luz para la determinación del movimiento absoluto con respecto a la nueva vara de medición. Todo gracias al éter. El problema de la determinación del movimiento absoluto parecía resuelto. Al menos en apariencia.
Prof. Armando Martínez
Página 33
Fundamentos de Relatividad General
La física es parada de cabeza
La física es parada de cabeza Clásicamente, antes del advenimiento de la Teoría Especial de la Relatividad, el mundo basado en los conceptos del tiempo absoluto, que marcha por igual en todo el Universo, invariable, y el espacio absoluto, también invariable, siendo ambos conceptos completamente independientes el uno del otro, era un mundo mucho más sencillo. En este mundo, para ubicar a un objeto puntual en el espacio tridimensional utilizando coordenadas Cartesianas para ello, bastaba con especificar tres números para que la posición del objeto puntual quedara identificada de modo unívoco, como el siguiente punto 𝑃 especificado por las coordenadas (𝑥, 𝑦, 𝑧) = (2, 3, 5) medidas a partir de un origen de referencia con coordenadas (𝑥, 𝑦, 𝑧) = (0, 0, 0):
Ilustración 5
Con esta convención, si el objeto ubicado en el punto 𝑃 empezaba a desplazarse a lo largo de uno de los ejes, digamos el eje 𝑦, a una velocidad constante 𝑣, digamos de unos 4 𝑚/𝑠, su posición nueva medida a partir de un tiempo 𝑡 = 0 se podía obtener fácilmente simplemente sumando la cantidad 𝑣𝑡 al valor original en dicha coordenada. De este modo, al haber transcurrido un tiempo de 𝑡 = 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠, el objeto se habría desplazado una distancia de 𝑣𝑡 = 12 𝑚𝑒𝑡𝑟𝑜𝑠, y sus nuevas coordenadas serían: 𝑥′ = 2 𝑚𝑒𝑡𝑟𝑜𝑠 (𝑝𝑒𝑟𝑚𝑎𝑛𝑒𝑐𝑒 𝑖𝑔𝑢𝑎𝑙) Prof. Armando Martínez
Página 34
Fundamentos de Relatividad General
La física es parada de cabeza
𝑦′ = 𝑦 + 𝑣𝑡 = 3 𝑚𝑒𝑡𝑟𝑜𝑠 + (4 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜) (3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) = 15 𝑚𝑒𝑡𝑟𝑜𝑠 𝑧′ = 5 𝑚𝑒𝑡𝑟𝑜𝑠 (𝑝𝑒𝑟𝑚𝑎𝑛𝑒𝑐𝑒 𝑖𝑔𝑢𝑎𝑙) (Obsérvese cómo se cancelan las dimensiones de las unidades, para dar siempre en la respuesta final las unidades correctas. Añadir todas las unidades desde un principio en la solución de cualquier problema matemático, cancelándolas según se requiera, es una buena forma de darse cuenta de que no se están cometiendo errores; llevando la contabilidad correcta de las dimensiones. Si en la respuesta final de un problema un estudiante obtiene metros/segundo cuando esperaba obtener kilogramos/metro cúbico ello le indicará que hubo un error, el cual puede ser corregido de inmediato con sólo ver en dónde las unidades se salieron fuera de control.) De este modo, considerando a dos observadores distintos moviéndose uno con respecto al otro a una velocidad constante 𝑣, un observador 𝑂 en reposo en su propio sistema de coordenadas rectangulares (𝑥, 𝑦, 𝑧) a cuyo marco de referencia 𝑙𝑎𝑚𝑎𝑟𝑒𝑚𝑜𝑠 𝑆 y otro observador 𝑂’ en movimiento junto con su propio sistema de coordenadas rectangulares (𝑥’, 𝑦’, 𝑧’) al que llamaremos 𝑆’, para pasar de un sistema de coordenadas al otro simplemente echábamos mano de las transformaciones de Galileo deducidas como se hizo en el ejemplo de arriba recurriendo a la lógica elemental. Si el movimiento relativo se lleva a cabo a lo largo de un eje común entre ambos, digamos el eje 𝑥, y si suponemos que el marco de referencia 𝑆’ es el que se está moviendo de izquierda a derecha:
Ilustración 6
Entonces es fácil ver que las transformaciones de Galileo para pasar las coordenadas de un punto fijo situado en el marco de referencia 𝑆’ a las coordenadas que le corresponden en el marco de referencia 𝑆 deben ser: 𝑥 = 𝑥’ + 𝑣𝑡’ 𝑦 = 𝑦’ 𝑧 = 𝑧’ Aunque nos parezca superfluo, por completitud introduciremos el tiempo universal 𝑡 como un cuarto componente en el conjunto ordenado de componentes de cada Prof. Armando Martínez
Página 35
Fundamentos de Relatividad General
La física es parada de cabeza
sistema de coordenadas. Así, para el observador 𝑂 un punto cualquiera en su sistema de coordenadas estará especificado como (𝑥, 𝑦, 𝑧, 𝑡), y para el observador 𝑂’ otro punto cualquiera en su sistema de coordenadas estará especificado como (𝑥’, 𝑦’, 𝑧’, 𝑡’), y el conjunto completo de transformaciones de Galileo para llevar a cabo la conversión de un punto cualquiera en 𝑆’ a las coordenadas que le corresponden en 𝑆 serán: 𝑥 = 𝑦 𝑧 𝑡
𝑥’ = = =
+ 𝑣𝑡’ 𝑦’ 𝑧’ 𝑡’
Hemos supuesto que ambos observadores están provistos de metros y relojes de forma tal que pueden medir las coordenadas de los eventos o acontecimientos que les toque presenciar. Hemos supuesto también que ambos ajustan sus relojes de modo tal que cuando pasen el uno frente al otro en 𝑥 = 𝑥’ = 0 la lectura en sus relojes será 𝑡 = 𝑡’ = 0. El uso de las transformaciones de Galileo quedará más claro con la resolución de los siguientes problemas.
PROBLEMA: Las coordenadas de un punto fijo en el marco de referencia móvil S’ son
(𝑥’, 𝑦’, 𝑧’, 𝑡’) = (4,7,2,0). ¿Cuáles serán las coordenadas del mismo punto evaluadas en el marco de referencia estacionario 𝑆 para un tiempo 𝑡 = 3 segundos y para un tiempo 𝑡 = 5 segundos si la velocidad relativa entre ambos marcos de referencia es igual a 𝑣 = 4 metros/segundo?
Para un tiempo de 𝑡′ = 3 segundos, las coordenadas en 𝑆 se obtienen como: 𝑥 = 𝑥’ + 𝑣𝑡’ = 4 𝑚𝑒𝑡𝑟𝑜𝑠 + (4 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜)(3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) = 16 𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 = 𝑦’ = 7 𝑚𝑒𝑡𝑟𝑜𝑠 𝑧 = 𝑧’ = 2 𝑚𝑒𝑡𝑟𝑜𝑠 𝑡 = 𝑡’ = 3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Las coordenadas en 𝑆 serán entonces: (𝑥, 𝑦, 𝑧, 𝑡) = (16,7,2,3). Para un tiempo de 𝑡′ = 5 segundos, las coordenadas en 𝑆 se obtienen como: 𝑥 = 𝑥’ + 𝑣𝑡’ = 4 𝑚𝑒𝑡𝑟𝑜𝑠 + (4 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜)(5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) = 24 𝑚𝑒𝑡𝑟𝑜𝑠 𝑦 = 𝑦’ = 7 𝑚𝑒𝑡𝑟𝑜𝑠 𝑧 = 𝑧’ = 2 𝑚𝑒𝑡𝑟𝑜𝑠 𝑡 = 𝑡’ = 5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Las coordenadas en 𝑆 serán entonces: (𝑥, 𝑦, 𝑧, 𝑡) = (16, 7, 2, 3)
Prof. Armando Martínez
Página 36
Fundamentos de Relatividad General
La física es parada de cabeza
Obviamente, conforme avanza el tiempo, la posición del punto fijo en 𝑆’ se va desplazando más y más hacia la derecha. Las coordenadas en el eje 𝑦 y en el eje 𝑧 se mantienen iguales puesto que no hay movimiento alguno fuera del que se lleva a cabo a lo largo del eje 𝑥𝑥. Hemos considerado en la resolución del problema anterior que el marco de referencia 𝑆’ es el que se está moviendo de izquierda a derecha (en el sentido positivo del eje 𝑥) a velocidad 𝑣, pero la resolución del problema hubiera sido exactamente la misma si hubiéramos considerado al observador 𝑂’ fijo y al marco de referencia 𝑆 moviéndose de derecha a izquierda en el sentido del eje 𝑦:
Ilustración 7
Para pasar del marco de referencia 𝑆 al marco de referencia 𝑆’, las transformaciones de Galileo serán: 𝑥’ = 𝑥 – 𝑣𝑡 𝑦’ = 𝑦 𝑧’ = 𝑧 𝑡’ = 𝑡 Obsérvese el cambio de signo que se tuvo que hacer, ya que esta es una transformación inversa a la anterior. PROBLEMA: Las coordenadas de un punto fijo en el marco de referencia móvil 𝑆 son: (𝑥, 𝑦, 𝑧, 𝑡) = (3,1,8,0). ¿Cuáles serán las coordenadas del mismo punto evaluadas en el marco de referencia estacionario 𝑆’ para un tiempo 𝑡 = 5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 y para un tiempo 𝑡 = 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 si la velocidad relativa entre ambos marcos de referencia es igual a 𝑣 = 2 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜?
El punto fijo se encuentra ahora en el marco de referencia 𝑆. Para un tiempo de 𝑡 = 5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠, las coordenadas en 𝑆 se obtienen como: 𝑥’ = 𝑥 − 𝑣𝑡 = 3 𝑚𝑒𝑡𝑟𝑜𝑠 − (2 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜)(5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) = −7 𝑚𝑒𝑡𝑟𝑜𝑠 𝑦’ = 𝑦 = 1 𝑚𝑒𝑡𝑟𝑜 𝑧’ = 𝑧 = 8 𝑚𝑒𝑡𝑟𝑜𝑠 𝑡’ = 𝑡’ = 5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Prof. Armando Martínez
Página 37
Fundamentos de Relatividad General
La física es parada de cabeza
Las coordenadas en 𝑆 serán entonces: (𝑥, 𝑦, 𝑧, 𝑡) = (−7,1,8,5) Para un tiempo de 𝑡 = 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠, las coordenadas en 𝑆 se obtienen como: 𝑥’ = 𝑥 − 𝑣𝑡 = 3 𝑚𝑒𝑡𝑟𝑜𝑠 − (2 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜)(10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) = −17 𝑚𝑒𝑡𝑟𝑜𝑠 𝑦’ = 𝑦 = 1 𝑚𝑒𝑡𝑟𝑜 𝑧’ = 𝑧 = 8 𝑚𝑒𝑡𝑟𝑜𝑠 𝑡’ = 𝑡 = 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Las coordenadas en S serán entonces: (𝑥, 𝑦, 𝑧, 𝑡) = (−17,1,8,10) Obviamente, conforme avanza el tiempo, la posición del punto fijo en 𝑆 se va desplazando más y más hacia la izquierda, en el sentido negativo del eje 𝑥. PROBLEMA: Un pasajero de un tren que se mueve a 20 metros/segundo para frente a un hombre que se encuentra en la plataforma de la estación en un tiempo que para ambos es 𝑡 = 𝑡’ = 0. Diez segundos después de que el tren lo pasa, el hombre de la plataforma encuentra que un pájaro que vuela a lo largo de la vía y en la misma dirección del tren está a 500 metros de distancia. ¿Cuáles son las coordenadas del pájaro determinadas por el pasajero?
Las coordenadas asignadas al pájaro por el hombre en la plataforma de la estación son: (𝑥, 𝑦, 𝑧 , 𝑡) = (500 𝑚𝑒𝑡𝑟𝑜𝑠, 0, 0, 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠). Pasando del sistema de referencia 𝑆 al sistema de referencia 𝑆’ y de acuerdo con las transformaciones de Galileo, la distancia 𝑥 del pájaro al pasajero, medida por éste es: 𝑥’ = 𝑥 − 𝑣𝑡 = 500 𝑚𝑒𝑡𝑟𝑜𝑠 − (20 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜) (10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) 𝑥’ = 300 𝑚𝑒𝑡𝑟𝑜𝑠 Entonces las coordenadas del pájaro determinadas por el pasajero son: (𝑥’, 𝑦’, 𝑧’ , 𝑡’ ) = (300 𝑚𝑒𝑡𝑟𝑜𝑠, 0, 0, 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) Al pasar del marco de referencia 𝑆 al marco de referencia 𝑆’, las transformaciones de velocidad, según Galileo, basadas en incrementos 𝛥 de las coordenadas, serán: 𝛥𝑥’ = 𝛥𝑥 − 𝛥(𝑣𝑣𝑡) = ∆𝑥 − 𝑣∆𝑡 ∆𝑥 ′ ∆𝑥 𝑣∆𝑡 =( − ) 𝑑𝑖𝑣𝑖𝑑𝑖𝑒𝑛𝑑𝑜 𝑒𝑛𝑡𝑟𝑒 ∆𝑡 ∆𝑡 ∆𝑡 ∆𝑡
Prof. Armando Martínez
Página 38
Fundamentos de Relatividad General
La física es parada de cabeza
∆𝑥 ′ 𝑐𝑜𝑚𝑜 ∆𝑡 = ∆𝑡 ′ ∆𝑡 Y del mismo modo:
𝑢’𝑥 = 𝑢𝑥 − 𝑣𝑣 𝛥𝑦’ 𝛥𝑦 𝛥𝑦’ 𝛥𝑦 = ; = 𝛥𝑡 𝛥𝑡 𝛥𝑡′ 𝛥𝑡 𝑢’𝑦 = 𝑢𝑦 ∆z 𝛥𝑧 𝛥𝑧’ 𝛥𝑧 = ; = ∆t 𝛥𝑡 𝛥𝑡 ′ 𝛥𝑡 𝑢’𝑧 = 𝑢𝑧
Por otra parte, al pasar del marco de referencia 𝑆 al marco de referencia 𝑆’, las transformaciones de aceleración, según Galileo, basadas en incrementos 𝛥 de las velocidades con respecto a incrementos iguales de tiempo, serán (la velocidad relativa 𝑣 entre ambos marcos de referencia permanece constante y no cambia con respecto al tiempo transcurrido): 𝛥𝑢’𝑥 𝛥𝑢𝑥 𝛥𝑣 = − 𝛥𝑡 𝛥𝑡 𝛥𝑡 𝛥𝑢’𝑥 𝛥𝑢𝑥 ’ = 𝛥𝑡 𝛥𝑡 𝑎’𝑥 = 𝑎𝑥 𝑎’𝑦 = 𝑎𝑦 𝑎’𝑧 = 𝑎𝑧 El hecho de que la aceleración de un cuerpo medida clásicamente tanto por un observador estacionario como por un observador móvil sea la misma implica que las leyes de Newton basadas en la fórmula (𝐹 = 𝑚𝑎) permanecerán las mismas en todos los marcos de referencia al pasar de un marco de referencia a otro, y por lo tanto los experimentos basados en las leyes de la mecánica clásica que a su vez se basan en los conceptos del espacio absoluto y el tiempo absoluto no nos sirven para detectar el movimiento absoluto, confirmando lo que ya habíamos visto al principio de esta obra. “El movimiento absoluto no se puede detectar a través de experimentos mecánicos. “ Pero se suponía que se podía detectar a través de experimentos ópticos usando rayos de luz. Para eso estaba el éter, para darnos un marco de referencia universal e inmóvil con respecto al cual era posible concebir el movimiento absoluto. De este Prof. Armando Martínez
Página 39
Fundamentos de Relatividad General
La física es parada de cabeza
modo, la velocidad de la luz, predicha teóricamente mediante las fórmulas del electromagnetismo de James Clerk Maxwell, parecía zanjar de una vez por toda la cuestión sobre el asunto del movimiento absoluto.
PROBLEMA: Considérese una masa 𝑀 atada a un resorte que se mueve sobre una superficie horizontal sin rozamiento, y la cual cuando el resorte no está estirado ni comprimido se encuentra a una distancia 𝑥0 de la pared a la que está anclado el otro extremo del resorte. Clásicamente, la fuerza de tensión 𝐹 ejercida por el resorte sobre la masa M cuando es estirado a una distancia x de la pared está dada por la relación que nos dice que dicha fuerza es directamente proporcional a la distancia 𝑥 − 𝑥0 :
𝐹 = −𝑘(𝑥 − 𝑥0 ) Esta fuerza cuando está desbalanceada produce una aceleración sobre la masa M que está dada por la ley de Newton 𝐹 = 𝑀 · 𝑎 (fuerza igual a masa por aceleración). Demostrar que esta fórmula es invariante bajo las transformaciones de Galileo.
Ilustración 8
Considerando el movimiento de la masa 𝑀 a lo largo del eje 𝑥, la ecuación del movimiento de la masa determinada por un observador en reposo con respecto a la superficie es: 𝐹 = Ma − k(x − x0 ) = Max Usando las transformaciones de Galileo para determinar la ecuación del movimiento encontrada por un segundo observador moviéndose a una velocidad 𝑣 con respecto al primero: 𝑥 = 𝑥’ + 𝑣𝑡’ 𝑥-0 = 𝑥’0 + 𝑣𝑡’ 𝑎𝑥 = 𝑎’𝑥 Obtenemos la siguiente ecuación del movimiento para el segundo observador: −𝑘(𝑥’ − 𝑥’0) = 𝑀𝑎’ · 𝑥 Puesto que la ecuación del movimiento para el segundo observador tiene la misma forma que la ecuación del movimiento para el primer observador, la ecuación del Prof. Armando Martínez
Página 40
Fundamentos de Relatividad General
La física es parada de cabeza
movimiento es invariante bajo las transformaciones de Galileo. Esto confirma que no se puede detectar el movimiento absoluto haciendo experimentos mecánicos con resortes. En general, se dice que hay invariancia en una ecuación cuando esta presenta la misma forma al ser determinada por dos observadores distintos moviéndose el uno con respecto al otro. En la teoría clásica se supone que las medidas de espacio y tiempo obtenidas por dos observadores están relacionadas por las transformaciones de Galileo. PROBLEMA: Suponiendo que los sistemas de referencia 𝑆 y 𝑆’ además de estarse moviendo a una velocidad relativa 𝑣𝑥 el uno con respecto al otro en el sentido de los ejes 𝑥, 𝑥’ se están moviendo también a una velocidad relativa 𝑣𝑦 el uno con respecto al otro en el sentido de los ejes 𝑦, 𝑦’ y a una velocidad relativa 𝑣𝑧 el uno con respecto al otro en el sentido de los ejes 𝑧, 𝑧’, ¿cuáles serán las transformaciones de las coordenadas? ¿Cuáles serán las transformaciones de velocidad? ¿Cuáles serán las transformaciones de aceleración?
Puesto que el movimiento relativo 𝑣𝑥 es independiente de los movimientos relativos 𝑣𝑦 y 𝑣𝑧 , del mismo modo que el movimiento relativo 𝑣𝑦 es independiente del movimiento relativo 𝑣𝑧 , la extensión natural de las transformaciones de Galileo hacia un espacio de tres dimensiones será: 𝑥 = 𝑥’ + 𝑣𝑥 𝑡’ 𝑦 = 𝑦’ + 𝑣𝑦 𝑡’ 𝑧 = 𝑧’ + 𝑣𝑧 𝑡’ 𝑡 = 𝑡’ Diferenciando con respecto al tiempo las transformaciones anteriores obtenemos las transformaciones de velocidad: 𝑢𝑥 = 𝑢’𝑥 + 𝑣𝑥 𝑢𝑦 = 𝑢’𝑦 + 𝑣𝑦 𝑢𝑧 = 𝑢’𝑧 + 𝑣𝑧 Diferenciando con respecto al tiempo las transformaciones de velocidad obtenemos las transformaciones de aceleración: 𝑎𝑥 = 𝑎’𝑥 𝑎𝑦 = 𝑎’𝑦 𝑎𝑧 = 𝑎’𝑧 PROBLEMA: Suponiendo que las coordenadas de un punto 𝑃’ en 𝑆’ son (𝑥’, 𝑦’, 𝑧’) = (7, 4, 9) en un tiempo 𝑡 = 𝑡’ = 0, y que (𝑣’𝑥 , 𝑣’𝑦 , 𝑣’𝑧 ) = (3, 5, −2), ¿cuáles serán las coordenadas de dicho punto en un tiempo 𝑡’ = 6?
Prof. Armando Martínez
Página 41
Fundamentos de Relatividad General
La física es parada de cabeza
Las coordenadas en el sistema de referencia 𝑆 de tres dimensiones serán de acuerdo con los resultados anteriores: 𝑥 = 𝑥’ + 𝑣𝑥 𝑡’ = 7 + (3) (6) = 25 𝑦 = 𝑦’ + 𝑣𝑦 𝑡’ = 4 + (5) (6) = 34 𝑧 = 𝑧’ + 𝑣𝑧 𝑡’ = 9 + (−2) (6) = −3 Las coordenadas del punto 𝑃 en el sistema de referencia 𝑆 serán entonces: (𝑥, 𝑦, 𝑧, 𝑡) = (25, 34, −3, 6) La mecánica clásica, construída sobre las columnas del espacio absoluto y el movimiento absoluto, invariante bajo las transformaciones de Galileo, daba lugar a que las ecuaciones de Newton permanecieran iguales al pasar de un sistema de referencia a otro. Era un entorno cómodo, consistente, con el que todos estaban contentos. El único “pero” que se le podía poner a este esquema era que al intentar extender los conceptos de la mecánica clásica al estudio de los fenómenos propios del electromagnetismo (del cual no se sabía casi nada en los tiempos de Galileo y Newton) empezaban a surgir inconsistencias y asimetrías que no se habían visto en el estudio de la mecánica Newtoniana. Si se suponía que era posible medir el movimiento absoluto de todos los objetos del universo con respecto a un simple rayo de luz, el asunto matemático de repente se había vuelto extraordinariamente complejo. Uno de los primeros en darse cuenta de las complejidades matemáticas que se habían venido encima con la suposición del movimiento absoluto basado en el concepto del éter fue un físico alemán de nombre Albert Einstein. Suponiendo el movimiento absoluto como válido, las mismas fórmulas del electromagnetismo de Maxwell tenían que ser revisadas y modificadas para tomar en cuenta los diferentes resultados experimentales que podrían esperar obtener diferentes observadores en movimiento relativo el uno con respecto al otro y por lo tanto en movimientos diferentes con respecto a un rayo de luz. La revisión requería introducir asimetrías en las fórmulas de Maxwell para dar cabida en ellas a observadores privilegiados cuyo estado de reposo absoluto se encontrase en concordancia exacta con la dirección y la velocidad teórica de un rayo de luz. Estas asimetrías no existían en las fórmulas de Maxwell, puesto que dichas fórmulas no situaban a ningún observador en un plano preferencial con respecto al otro, las fórmulas tal y como estaban dadas por Maxwell eran igualmente válidas para todos los observadores sin cambio alguno. Pero con la velocidad de la luz fijada como una vara de medición absoluta con respecto al éter, las fórmulas de Maxwell habían dejado de ser universales, habían dejado de ser simétricas. Uno de los ejemplos más claros de ello lo es la ecuación de onda electromagnética, obtenida de las ecuaciones de Maxwell de la teoría electromagnética y representada en su forma más compacta por la siguiente fórmula: 𝛻2𝜑 =
1𝜕 2 𝜑 𝑐 2 𝜕𝑡 2
Esta fórmula en la que el operador Laplaciano (𝛻) actuando sobre la onda electromagnética φ representa de manera concisa lo siguiente: Prof. Armando Martínez
Página 42
Fundamentos de Relatividad General
La física es parada de cabeza
𝜕2 𝜕2 𝜕2 𝛻 = 2+ 2+ 2 𝜕𝑥 𝜕𝑦 𝜕𝑧 2
Se puede expresar en forma más explícita como: 𝜕 2 𝜑 𝜕 2 𝜑 𝜕 2 𝜑 1𝜕 2 𝜑 + + − =0 𝜕𝑥 2 𝜕𝑦 2 𝜕𝑧 2 𝑐 2 𝜕𝑡 2 No es difícil demostrar que al aplicar las transformaciones de Galileo a la fórmula anterior, la ecuación toma el siguiente aspecto (se ha utilizado la sobre-línea encima de cada variable en lugar de la comilla para simplificar la notación): 𝜕 2𝜑 𝜕 2 𝜑 𝜕 2 𝜑 1𝜕 2 𝜑 1 𝜕 2𝜑 𝜕 2𝜑 2 + ′2 + ′2 − 2 ′2 + 2 (2𝑣 ′ ′ − 𝑣 )=0 𝜕𝑥 ′2 𝜕𝑦 𝜕𝑧 𝑐 𝜕𝑡 𝑐 𝜕𝑥 𝜕𝑡 𝜕𝑥 ′ Claramente, esta fórmula es más compleja que la fórmula original. La única manera en la cual ésta fórmula puede simplificarse es haciendo la velocidad 𝑣 = 0, lo cual significa regresar a la fórmula original válida para un observador que está en reposo con respecto al éter. El observador que está en reposo con respecto al éter siempre tendrá la fórmula más sencilla de todas; es un observador privilegiado. Todos los demás obtendrán fórmulas diferentes. Y esto cubre apenas las asimetrías con las que nos topamos al manipular la ecuación de onda electromagnética. Cualquier otra situación en la que estén involucradas fórmulas en las que basamos experimentos llevados a cabo con rayos de luz (o con ondas electromagnéticas de teléfonos celulares, radio y televisión) adquirirán asimetrías al pasar de un marco de referencia a otro. Por más que intentó restaurar con parches las ecuaciones de Maxwell que anteriormente mostraban una simetría perfecta, Albert Einstein lo único que encontró en cada nuevo intento fueron más asimetrías y más asimetrías. Simple y sencillamente no había forma alguna de restaurar las ecuaciones de Maxwell a su condición original como ecuaciones independientes del movimiento del observador. Esto llevó a Einstein a cuestionar las mismas bases de lo que entendemos por movimiento absoluto. En su esencia básica, todo movimiento, medido experimentalmente como una velocidad, definida como la distancia recorrida entre el tiempo empleado en recorrer dicha distancia: 𝑽𝒆𝒍𝒐𝒄𝒊𝒅𝒂𝒅 =
𝑫𝒊𝒔𝒕𝒂𝒏𝒄𝒊𝒂 𝑻𝒊𝒆𝒎𝒑𝒐
Presupone necesariamente que tanto la distancia como el tiempo son parámetros físicos absolutos, invariables. Pero, ¿realmente podemos considerar la distancia entre dos objetos como algo invariable, absoluto? La lógica nos dice que sí, que dos personas que estén paradas la una frente a la otra medirán la misma longitud de un metro. ¿Y dos personas que se están moviendo la una con respecto a la otra, también medirán la misma longitud de un metro para la vara? El fundador mismo de la mecánica clásica, Isaac Newton, Prof. Armando Martínez
Página 43
Fundamentos de Relatividad General
La física es parada de cabeza
nos había afirmado que sí, y esto se había tomado casi como un dogma indiscutible por muchas décadas en reconocimiento al enorme calibre intelectual de Newton, algo que no era fácil de poner en entredicho en base a lo que nos sugiere nuestra propia intuición. Pero Newton fue más allá al afirmar que eso que nosotros llamamos tiempo también es algo absoluto, universal, en el sentido de que dos personas con relojes diferentes en sus manos y en reposo la una frente a la otra medirán el mismo lapso del tiempo que les marcan los relojes que si se ponen en movimiento la una frente a la otra inclusive hasta alcanzar velocidades extraordinariamente altas. Para Newton, la marcha del tiempo era algo universal, invariable, y si la marcha del tiempo era medida con relojes iguales sincronizados con elevada precisión el uno con respecto al otro, ambos deberían obtener los mismos lapsos de tiempo. Esto, el concepto del tiempo absoluto, aunque un poco menos obvio que el concepto de la longitud absoluta, también era tan obvio a nuestra intuición que simple y sencillamente no había razones para cuestionarlo. Pero el problema de aferrarnos a los conceptos de la longitud absoluta y del tiempo absoluto con su consecuencia directa que es el movimiento absoluto se traducía directamente en la destrucción de la simetría universal mostrada por las ecuaciones básicas del electromagnetismo de Maxwell. Podemos, si así lo deseamos, aferrarnos a los conceptos de la longitud absoluta y del tiempo absoluto, y toparnos con las mismas ecuaciones asimétricas para la teoría del electromagnetismo que Einstein trató de remendar inútilmente. O podemos, aunque nos cueste mucho trabajo hacerlo, y aunque vaya en contra de nuestro más elemental sentido común, prescindir por completo de los conceptos de la longitud absoluta y del espacio absoluto, y con ello del movimiento absoluto. Esto, desde luego, nos lleva nuevamente a la misma situación en la cual nos encontrábamos desde la perspectiva de la mecánica Newtoniana, de que no es posible determinar quién es el que se está moviendo, definido el movimiento como algo contra lo que se pudiera decir que nos estamos moviendo. Pero tiene una consecuencia matemática extraordinariamente apetecible: todas las asimetrías que habían surgido en las ecuaciones de Maxwell desaparecen casi como por arte de magia, las ecuaciones básicas de la teoría del electromagnetismo retoman su carácter sencillo y universal. Pero para que esto ocurra, es necesario también que uno de los descubrimientos más sorprendentes de Maxwell, la constancia de la velocidad de la luz considerada como una onda electromagnética, permanezca invariable para distintos observadores aunque estén en movimiento relativo el uno con respecto al otro. En pocas palabras, dos o más observadores que se estén moviendo en direcciones diferentes ambos medirán para un mismo rayo de luz la misma velocidad, siendo esta precisamente la velocidad predicha por las ecuaciones de Maxwell. Convencido de que esta era la única salida posible para el enredo, Albert Einstein formuló los dos principios básicos sobre los cuales descansa la Teoría Especial de la Relatividad, conocida también como Teoría Restringida de la Relatividad o simplemente Teoría Restringida por estar limitada a fenómenos físicos en los cuales no hay aceleraciones entre dos observadores distintos sino únicamente movimientos relativos entre el uno y el otro llevándose a cabo a velocidad constante:
Prof. Armando Martínez
Página 44
Fundamentos de Relatividad General
La física es parada de cabeza
1. El movimiento absoluto no puede ser detectado, porque tal cosa no existe. 2. La velocidad de la luz es la misma para distintos observadores. El primer postulado nos confirma que el movimiento absoluto no sólo no puede ser detectado por medios mecánicos, lo cual ya se sabía desde los tiempos de Newton y Galileo, tampoco puede ser detectado por medios ópticos que involucren a la misma luz así como experimentos de índole eléctrica y magnética, y de hecho no puede ser detectado por medio alguno, no puede ser determinado por ningún tipo de experimento de índole alguna que a alguien se le pueda ocurrir ahora o en el futuro. Y el segundo postulado es irónico porque a la vez que descarta la existencia de la longitud absoluta y del tiempo absoluto, sube a un pedestal privilegiado a un nuevo absoluto de la física, la velocidad de la luz, la cual será la misma e invariable en cualquier parte del universo para cualquier observador. Estos dos postulados sobre los cuales descansa la Teoría Especial de la Relatividad, tan sencillos como parecen, tienen repercusiones amplias y profundas, siendo causantes de una de las revoluciones intelectuales más profundas e importantes del siglo XX. Uno de los primeros triunfos inmediatos de la nueva teoría fue que la ecuación de onda electromagnética permanecía invariante al pasar de un sistema de referencia 𝑆 a otro sistema de referencia 𝑆’ o viceversa; o sea que si la ecuación original en el sistema S era: 𝜕 2𝜑 𝜕 2φ 𝜕 2𝜑 1 𝜕 2𝜑 + + − · =0 𝜕𝑥 2 ∂y 2 𝜕𝑧 2 𝑐 2 𝜕𝑡 2 Entonces en el sistema 𝑆’ la fórmula obtenida era: 𝜕 2𝜑 𝜕 2φ 𝜕 2𝜑 1 𝜕 2𝜑 + + − · =0 𝜕𝑥 −2 ∂y −2 𝜕𝑧 −2 𝑐 2 𝜕𝑡 −2 ¡Simetría total, por fin! Obviamente, las transformaciones requeridas para llevar a cabo la conversión de un marco de referencia a otro no podían estar basadas en las transformaciones de Galileo. Se requería un nuevo tipo de transformaciones incorporando los principios de los dos postulados de la Teoría Especial de la Relatividad. Esto se verá posteriormente con mayor detalle. De este modo, al llevar a cabo experimentos de óptica con rayos de luz, desaparecía la posibilidad de poder detectar el movimiento absoluto con respecto al éter, y con ello desaparecía la necesidad de creer en la existencia del éter, al mismo tiempo que desaparecía el concepto del observador privilegiado. Pero había que pagar un costo por todo esto. De pronto las transformaciones de Galileo perdieron su carácter universal y sólo eran aproximadamente válidas a bajas velocidades (en comparación Prof. Armando Martínez
Página 45
Fundamentos de Relatividad General
La física es parada de cabeza
con la velocidad de la luz). La cinemática clásica tuvo que ser revisada a fondo y puesta al día. Y la dinámica basada en las leyes de Newton era insostenible en caso de no ser modificada adaptándola a los nuevos conceptos. En su trabajo original, publicado en 1905 en el tomo 17 de la publicación científica Annalen der Physik, cuya página frontal tenemos a continuación:
Ilustración 9
Y en cuyo interior tenemos el trabajo “Zur Elektrodynamik bewegter Korper” (Sobre la electrodinámica de los cuerpos en movimiento) cuya introducción es:
Prof. Armando Martínez
Página 46
Fundamentos de Relatividad General
La física es parada de cabeza
Ilustración 10
Podemos leer lo siguiente: “Es conocido que la electrodinámica de (James Clerk) Maxwell -como usualmente se entiende en el tiempo presente- cuando se aplica a los cuerpos en movimiento, conduce a asimetrías que no parecen ser inherentes en los fenómenos. Tómese, por ejemplo, la acción electrodinámica recíproca de un imán y un conductor. El fenómeno observable aquí depende únicamente del movimiento relativo del conductor y el imán, mientras que el punto de vista acostumbrado hace una distinción aguda entre los dos casos en los cuales el uno o el otro de estos cuerpos están en movimiento... “Ejemplos de este tipo, junto con los intentos infructuosos para descubrir cualquier movimiento de la tierra relativo al “medio de luz” (aquí Einstein está haciendo una clara referencia al éter que supuestamente servía como medio de transporte para la luz) sugieren que los fenómenos de la electrodinámica, así como los de la mecánica, no poseen propiedades que correspondan a la idea del reposo absoluto (si el reposo absoluto no puede ser detectado, tampoco el movimiento absoluto). Estos sugieren que, como ya se ha demostrado al primer orden para cantidades pequeñas, las mismas leyes de electrodinámica y óptica serán válidas para todos los marcos de referencia para los cuales las ecuaciones de la mecánica son sostenidas como válidas. Elevaremos esta conjetura (que será llamada de aquí en adelante el “Principio de Relatividad”) a la categoría de un postulado, introduciendo también otro postulado, que es irreconciliable sólo en apariencia con el anterior, que la luz es propagada siempre en el espacio vacío con una velocidad definida 𝑐 que es independiente del estado de movimiento del cuerpo emisor. Estos dos postulados son suficientes para la realización de una teoría simple y consistente de la electrodinámica de cuerpos en movimiento basada en la teoría de Maxwell para cuerpos estacionarios.”
Prof. Armando Martínez
Página 47
Fundamentos de Relatividad General
La física es parada de cabeza
Para beneficio e interés de los lectores, se ha reproducido íntegramente al final de esta obra la traducción inglesa del trabajo original con el cual Einstein dio a conocer al mundo desde Alemania la Teoría Especial de la Relatividad, puesto en el Apéndice I bajo el título “El papel original de Einstein de 1905”. Bastan pues tan solo dos postulados sencillos, enunciados en unos cuantos renglones, para construir todo nuestro castillo de conocimientos sobre el tema de la Teoría Especial de la Relatividad (Einstein no utilizó el adjetivo “Especial” en su primer trabajo sobre el tema, esto lo incluiría posteriormente). Aquí tal vez podría preguntarse alguien, ¿y por qué razón Einstein hizo referencia posterior a esta teoría como la Teoría Especial de la Relatividad? ¿Acaso estaba concebida para formar parte de un esquema más amplio? ¿Acaso la Teoría Especial de la Relatividad iba a formar parte de una teoría de mayor cobertura, una Teoría General de la Relatividad? ¿Qué es entonces lo que está ausente de la Teoría Especial de la Relatividad? En efecto, cuando Einstein concibió la Teoría de la Relatividad en su primer formato, supo desde un principio que esta teoría tendría que formar parte necesariamente de un esquema más amplio, sabía que la Teoría de la Relatividad que había formulado no abarcaba algo que había quedado pendiente y que por lo tanto tendría que ser considerada como una Teoría Especial de la Relatividad. Para saber qué es lo que había quedado ausente, trasladémonos de nuevo al vagón de ferrocarril herméticamente sellado en el que nuestro viajero se encontraba viajando y en el cual trataba de concebir infructuosamente alguna forma experimental con la cual pudiera saber si se estaba moviendo o no. En base a la Teoría Especial de la Relatividad, no existe experimento alguno que le pueda decir al viajero si se está moviendo o no, porque el movimiento absoluto no existe, siempre fue una quimera a la cual fuimos llevados por la forma tan simplificada en la cual opera nuestro sentido común:
Ilustración 11
Sin embargo, si el tren se acelera o decelera, por muy blindado que esté el tren por dentro el viajero sabe de inmediato que el tren ha cambiado de velocidad por las fuerzas que experimenta de súbito en el interior. Si lleva un reloj de bolsillo consigo colgando de una cadena y el reloj está suelto, la ligera elevación del reloj le indicará claramente que el vagón está experimentando un cambio de velocidad, un cambio susceptible de ser medido experimentalmente con instrumentos de medición:
Prof. Armando Martínez
Página 48
Fundamentos de Relatividad General
La física es parada de cabeza
Ilustración 12
Esto parecería darle al ocupante del vagón de ferrocarril la condición de ser un observador privilegiado con respecto a todos los demás observadores externos al tren que lo ven pasar rápidamente sobre las vías del ferrocarril, porque mientras los observadores externos se pueden considerar en estado de reposo el viajero en el vagón blindado se puede dar cuenta de cuándo el vagón está cambiando de velocidad. De lo que no puede darse cuenta es si el vagón se está moviendo a una velocidad constante cuando se está moviendo a una velocidad constante, pero indudablemente que sí se puede dar cuenta de cuándo el vagón ha variado la velocidad de su marcha. Esto parece restaurar cierto status de observador privilegiado al viajero que va dentro del vagón. Pero este es un asunto que involucra aceleraciones, cambios de velocidad, no velocidades constantes. Einstein dejó este asunto pendiente por algún tiempo mientras formulaba esa teoría más general que tomara en cuenta el caso de los cambios de velocidad, esa teoría que llegaría a ser conocida como la Teoría General de la Relatividad de la cual la Teoría Especial de la Relatividad es, perdonando la redundancia, un caso especial.
Prof. Armando Martínez
Página 49
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
Las consecuencias directas de la teoría Si tomamos como ciertos los dos postulados básicos de la Teoría Especial de la Relatividad y nos aferramos a ellos sin cuestionarlos, las consecuencias suelen tomar un carácter dramático para la forma de pensar a la cual estábamos acostumbrados. En realidad, para muchos puede resultar un verdadero shock. Empezaremos con el siguiente ejemplo que es tal vez uno de los ejemplos más simples que podamos concebir, en el cual tenemos a un experimentador viajando en un tren sin paredes y sin techo, con la plataforma descubierta, a una velocidad extremadamente alta de 100 mil kilómetros por segundo con respecto a las vías del tren, el cual con una linterna acciona un rayo de luz que en el dibujo podemos ver que viaja de izquierda a derecha:
Ilustración 13
En la tierra tenemos un observador que ve pasar rápidamente al vagón a la velocidad de 100 mil kilómetros por segundo. El viajero que va en el tren con la plataforma al descubierto y el cual tiene una linterna reposando en sus manos, ve salir al rayo de luz de la linterna con una velocidad de 300 mil kilómetros por segundo. Si tiene instrumentos a bordo esto es lo que él medirá. ¿Y qué velocidad medirá para el mismo rayo de luz el observador que ve pasar el vagón a una velocidad de 100 mil kilómetros por segundo? Nuestro sentido común nos dice que la velocidad del rayo de luz de 300 mil kilómetros por segundo se sumará a la velocidad del vagón de 100 mil kilómetros por segundo resultándole en una velocidad de 400 mil kilómetros por segundo. Pero la Teoría de la Relatividad nos dice que él también medirá una velocidad de 300 mil kilómetros por segundo para el rayo de luz. Ambos miden para el mismo rayo de luz una velocidad de 300 mil Prof. Armando Martínez
Página 50
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
kilómetros por segundo. ¿Entonces qué es lo que está sucediendo? Lo que está sucediendo es que la distancia que recorre el rayo de luz para el experimentador que viaja en el vagón y el tiempo que tarda en recorrer dicha distancia son diferentes del tiempo y de la distancia que el observador en tierra mide experimentalmente. En efecto, las distancias y los tiempos han dejado de ser unidades de medición absolutas. Lo único que no ha cambiado y que permanece invariable como una constante universal es ese rayo de luz. Consideremos ahora otro experimento hipotético, en el cual tenemos un ferrocarril que se mueve a una velocidad extremadamente rápida, dentro del cual hay un pasajero A que tiene una linterna en su mano y que en un momento dado enciende y apaga su linterna con el objeto de enviar un pulso luminoso hacia un espejo que puede estar situado ya sea en el techo del vagón en el que viaja o en la pared contraria, siempre y cuando el pulso luminoso no sea enviado en la misma dirección en la cual se está moviendo el tren o en dirección contraria, sino en una dirección perpendicular al sentido del movimiento del tren.
Ilustración 14
Supondremos también que hay un observador externo B situado a un lado de las vías del ferrocarril que se ha puesto de acuerdo previamente con el viajero A en el tren en que el observador externo B es el que está en reposo y que el tren se está moviendo a una velocidad 𝑣 de 0.6 𝑚𝑒𝑡𝑟𝑜𝑠 𝑝𝑜𝑟 𝑠𝑒𝑔𝑢𝑛𝑑𝑜. Puesto que la velocidad de la luz es extremadamente alta, para fines didácticos consideraremos una velocidad de la luz 𝑐 = 1 𝑚/𝑠, lo cual no altera las conclusiones básicas que estamos buscando. Es ya costumbre “encajonar” al viajero que se traslada en la plataforma móvil dentro de lo que llamamos un marco de referencia (la palabra inglesa es reference frame) como si estuviese contenido dentro del marco de un cuadro en el cual está todo lo que se mueve junto con el viajero incluyendo al tren, su linterna, el aire que respira, el espacio tridimensional en el que está situado, en fin, todo incluyéndolo a él; como también es ya costumbre denotar dicho marco de referencia con la letra 𝑆′. Por otro lado, es ya costumbre “encajonar” el observador situado a un lado de las vías del ferrocarril y al cual consideramos en reposo dentro de su propio marco de referencia como también es ya costumbre denotar dicho marco de referencia con la letra 𝑆. El viajero A lleva consigo dentro de su marco de referencia (que llamaremos 𝑆′ siguiendo la costumbre usual) un reloj electrónico de alta precisión con el cual mide el tiempo total de ida y vuelta que el pulso luminoso tarda en recorrer la distancia D de la linterna hasta el espejo junto con el tiempo que tarda en regresar a su punto Prof. Armando Martínez
Página 51
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
de origen. El tiempo que transcurre entre dos eventos que ocurren dentro de un mismo marco de referencia en el cual el observador está en reposo es conocido como tiempo propio (y también como tiempo local). Para fines ilustrativos usando números, supondremos que la distancia D del viajero hasta el espejo que tiene frente a él es de 4 metros. Entonces el pulso luminoso recorrerá un total de 8 metros en su trayecto de ida y vuelta:
Ilustración 15
Entonces el tiempo propio 𝛥𝑡′ que mide el viajero con su reloj entre la salida del pulso de luz de la linterna y el retorno del pulso después de haber sido reflejado por el espejo será igual a: 𝑐 = 2 · 𝐷 / 𝛥𝑡′ 𝛥𝑡 ′ = 2 · 𝐷 / 𝑐 𝛥𝑡′ = 8 𝑚𝑒𝑡𝑟𝑜𝑠 / 1 𝑚𝑒𝑡𝑟𝑜 𝑝𝑜𝑟 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝛥𝑡′ = 8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Sin embargo, lo que observa el viajero dentro de su marco de referencia 𝑆′ no es lo mismo que lo que observa la persona que está fuera del ferrocarril a un lado de las vías del tren en un marco de referencia que llamaremos 𝑆, la cual verá al pulso de luz recorrer una longitud mayor que la que ve el viajero dentro del vagón:
Ilustración 16
Si el ferrocarril se está trasladando a una velocidad 𝑣 igual a 0.6 metros por segundo, entonces la distancia 𝐿 recorrida por el pulso luminoso será indudablemente mayor para el observador estacionario en el marco de referencia 𝑆 que la distancia 2𝐷 que el viajero ve que el pulso luminoso recorre en su marco de referencia 𝑆′. Sin embargo, por el segundo postulado de la Teoría Especial de la Relatividad, ambos deben medir la misma velocidad 𝑐 para ese pulso luminoso. Prof. Armando Martínez
Página 52
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
Entonces, ¿cómo puede el observador estacionario obtener la misma velocidad 𝑐 para el pulso luminoso siendo que la longitud de recorrido que él mide es mayor que la longitud de recorrido para el viajero dentro del vagón? Pues midiendo un tiempo mayor de recorrido 𝛥𝑡 para el pulso luminoso que el tiempo 𝛥𝑡′ medido por el viajero A. Este es un fenómeno relativista conocido como la dilatación del tiempo. Usando el Teorema de Pitágoras, el recorrido del rayo de luz se puede descomponer en una componente vertical y una componente horizontal:
Ilustración 17
Veamos ahora las cosas desde la perspectiva del observador externo B, en el marco de referencia 𝑆, medidas en el tiempo propio del observador externo B. Para el observador B, el rayo de luz hace un recorrido triangular que, dentro de su marco de referencia, transcurre en un tiempo total 𝛥𝑡 que necesariamente debe ser mayor que el tiempo propio 𝛥𝑡′ del viajero A para que así ambos puedan medir para el rayo de luz la misma velocidad 𝑐. En algo en lo que ambos viajero y observador externo están completamente de acuerdo, además del hecho de que los dos miden para el pulso luminoso la misma velocidad c, es que el tren se está desplazando a la misma velocidad 𝑣 de 0.6 metros por segundo. En su tiempo 𝛥𝑡, entre ambos eventos del disparo y retorno del rayo de luz a su punto de origen, para el observador B el tren habrá avanzado una distancia total 𝑣 · 𝛥𝑡. Entonces la distancia que habrá avanzado el tren desde que el rayo de luz es disparado por el viajero A hasta que llega al espejo situado en el lado contrario al viajero será la mitad, o sea (𝑣 · 𝛥𝑡)/2. También, en su marco de referencia 𝑆, el observador B medirá para la distancia total recorrida por el rayo de luz desde que es disparado por el viajero A hasta que regresa a su punto de origen una longitud total de 𝑐 · 𝛥𝑡. Entonces la distancia que habrá recorrido el rayo de luz desde que es disparado por el viajero A hasta que llega al espejo situado en el lado contrario al viajero será la mitad de la trayectoria total, o sea (𝑐 · 𝛥𝑡)/2). Podemos ver que la relación de longitudes, de acuerdo con el teorema de Pitágoras, estará dada en base al siguiente triángulo:
Prof. Armando Martínez
Página 53
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
Ilustración 18
Y será: 𝑐 · 𝛥𝑡 2 𝑣 · 𝛥𝑡 2 2 ( ) = 𝐷 + ( ) 2 2 Entonces, despejando para 𝛥𝑡: 𝛥𝑡 = 2 ··
𝐷 √2
𝛥𝑡 = (8 𝑚𝑒𝑡𝑟𝑜𝑠)/√(1 𝑚𝑒𝑡𝑟𝑜/𝑠𝑒𝑔)² − (0.6 𝑚𝑒𝑡𝑟𝑜/𝑠𝑒𝑔)² 𝛥𝑡 = 8/0.8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 𝛥𝑡 = 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Así pues, para el observador B, el rayo de luz tarda 10 segundos en recorrer el trayecto total de ida y vuelta. El tiempo que mide el viajero A se ha dilatado (expandido) en B, ya que el viajero B mide 8 segundos entre ambos eventos. Al usar la palabra “dilatación”, no la estamos utilizando en el sentido de “retraso”, sino en el sentido de “aumento”. Usando exactamente el mismo procedimiento que el que utilizamos para resolver este problema numérico, podemos obtener una fórmula general para la dilatación del tiempo (en la derivación de la fórmula se prescindirá del símbolo 𝛥 al sobreentenderse que el tiempo 𝑡 es una diferencia de tiempo transcurrido entre dos eventos): 2 2 1 1 ( 𝑐𝑡) = ( 𝑣𝑡) + 𝐷2 2 2
𝑐 2 𝑡 2 = 𝑣 2 𝑡 2 + 4 · 𝐷2 𝑡 2 (𝑐 2 − 𝑣 2 ) = 4 · 𝐷2 4𝐷2 𝑡 = 2 𝑐 − 𝑣2 2
Prof. Armando Martínez
Página 54
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
2𝐷
𝑡=
√𝑐 2 (1 −
𝑣2 ) 𝑐2
2𝐷 𝑐
𝑡=
√(1 −
𝑣2 ) 𝑐2
Pero ya vimos que 2𝐷/𝑐 es el tiempo 𝑡′ que mide el viajero A entre ambos eventos. Entonces: 𝑡=
𝑡′ 2
√1 − 𝑣2 𝑐
Usando los valores del numéricos del ejemplo, con 𝑣 = 0.6 metros/segundo y 𝛥𝑡′ = 8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠, encontramos que el tiempo del viajero A se dilata a un tiempo 𝛥𝑡 𝑑𝑒 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠, lo cual nos verifica la fórmula. Supongamos ahora que tenemos en tierra espaciados a distancias iguales una serie de relojes sincronizados que están en reposo cada uno de ellos con respecto a todos los demás:
Ilustración 19
Al referirnos a estos relojes como relojes sincronizados estamos hablando de relojes que no sólo marcan todos ellos la misma hora para el observador en reposo situado en tierra sino que también avanzan a la par cada uno de ellos con respecto a los demás sin adelantarse ni retrasarse. Si repetimos los cálculos que hemos hecho arriba manteniendo constante (igual) la velocidad 𝑣 usando trayectorias de recorrido más largas, comprobaremos que el tiempo dilatado 𝛥𝑡 aumentará en forma directamente proporcional al tiempo propio 𝛥𝑡′ medido dentro del vagón. O sea que si el reloj 𝛥𝑡′ marca 8 segundos justo cuando un reloj del observador enfrente de él marca un tiempo 𝛥𝑡 de 10 segundos, entonces si el reloj 𝛥𝑡′ marca 16 segundos (el doble) entonces otro reloj en tierra que se encuentre directamente enfrente de él al tomarse la lectura estará marcando un tiempo 𝛥𝑡 de 20 segundos, y si el reloj 𝛥𝑡′ marca 24 segundos (el triple) entonces otro reloj en tierra que se encuentre directamente enfrente de él al tomarse la lectura estará marcando un tiempo 𝛥𝑡 de 30 segundos, en una forma sugerida por las siguientes figuras (los relojes sincronizados puestos a lo largo del Ilustración 20 sistema de referencia del observador en reposo se Prof. Armando Martínez
Página 55
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
mantienen sincronizados en todo momento para el observador en reposo; sin embargo y como lo veremos posteriormente, todos esos relojes aparecerán desincronizados para el observador en movimiento, al ocurrir una pérdida relativista de la simultaneidad absoluta con la cual lo que es simultáneo en un marco de referencia deja de serlo al ser visto desde otro marco de referencia. Todo esto nos indica que el factor de corrección (que en este caso es igual a 𝛥𝑡/𝛥𝑡′ = 10/8 = 1.25) que debemos aplicar para obtener el tiempo en el marco de referencia en tierra 𝛥𝑡 cuando conocemos el tiempo 𝛥𝑡′ dentro del vagón es una cantidad constante, y por lo tanto la transformación matemática requerida para pasar del marco de referencia del vagón al marco de referencia en tierra (o viceversa) debe ser una transformación lineal. Haremos uso de esta observación cuando posteriormente llevemos a cabo la derivación de fórmulas de carácter general para poder movernos de un marco de referencia a otro. Analicemos ahora el ejemplo desde la perspectiva del viajero A estando ambos todavía de acuerdo en que el viajero A es el que se está desplazando a una velocidad 𝑣 y el observador B está en reposo. El viajero A mide para el rayo de luz en su plataforma móvil con su reloj en mano una velocidad de c = 1 metro por segundo al recorrer dentro de su marco de referencia una distancia total (ida y vuelta) de 8 metros en 8 segundos. Pero al ser reflejado el rayo de luz y llegar a su punto de origen, encuentra que en ese mismo punto en el que ambos coinciden por un instante mientras el tren prosigue con su movimiento el reloj del observador B marca 10 segundos. Ambos siguen en completo acuerdo en que el tren se está moviendo a la misma velocidad 𝑣 con respecto a ambos. La única forma posible en la que el viajero A pueda seguirle asignando al observador B una velocidad 𝑣 de 0.6 metros por segundo (en dirección opuesta) es que el viajero A determine desde su punto de vista una longitud menor para el observador B entre ambos eventos, ya que de no ser así le estaría midiendo una velocidad errónea igual a: 6 𝑚𝑒𝑡𝑟𝑜𝑠 / 8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 0.75 𝑚𝑒𝑡𝑟𝑜𝑠 / 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Entonces el viajero A también necesita un factor de corrección para compensar por la contracción de longitud que está detectando. ¿Y de cuánto tiene que ser ese factor de corrección? Para poder seguirle midiendo al observador B una velocidad de 0.6 metros por segundo en ocho segundos, la distancia entre ambos eventos en la plataforma de B según el viajero A, debe ser: 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 = 𝑡𝑖𝑒𝑚𝑝𝑜 𝑥 𝑣𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 = (8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) 𝑥 (0.6 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔𝑢𝑛𝑑𝑜) 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 = 4.8 𝑚𝑒𝑡𝑟𝑜𝑠 ¡Para el viajero A, una longitud de 6 metros del observador B parece haberse contraído a 4.8 metros! El factor de corrección para la contracción de longitud debe ser entonces: 4.8 𝑚𝑒𝑡𝑟𝑜𝑠 / 6 𝑚𝑒𝑡𝑟𝑜𝑠 = 0.8
Prof. Armando Martínez
Página 56
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
El factor de corrección utilizado por el viajero móvil A para medir la contracción de la longitud en B resulta ser exactamente el inverso del factor de corrección utilizado por el observador B para poder determinar la dilatación del tiempo de A, lo cual era de esperarse y no debe causarnos ningún asombro. Lo que para un observador es un fenómeno físico de dilatación del tiempo para el otro observador refiriéndose a los mismos eventos es un fenómeno físico de contracción de longitud. En la cinemática relativista, la contracción de la longitud es un corolario de la dilatación del tiempo, y viceversa. Ambas cosas siempre van de la mano. El factor de corrección: 1 2
√1 − 𝑣2 𝑐
Aparece con tanta frecuencia en problemas propios de la Teoría Especial de la Relatividad, que con fines de simplificación notacional es representado con el símbolo γ (letra griega gamma): 𝛾=
1 2
√1 − 𝑣2 𝑐
Con esto tenemos la siguiente relación simplificada para obtener la dilatación del tiempo al pasar del marco de referencia a otro: ∆𝑡 = 𝛾∆𝑡′ Si simbolizamos al tiempo propio (tiempo local) del observador en reposo con la letra griega 𝜏 (tau), entonces la fórmula toma el siguiente aspecto que resulta más familiar para quienes estudian ciertos aspectos más avanzados de la Teoría de la Relatividad: ∆𝑡 = 𝛾∆𝜏 Del mismo modo, con el factor de corrección γ podemos escribir la siguiente relación simplificada para obtener la contracción de longitud al pasar de un marco de referencia a otro: 𝐿′ =
𝐿 𝛾
Por otra parte, la cantidad 𝑣/𝑐 aparece también en el análisis de problemas de relatividad con tanta frecuencia que es común que sea abreviada con el símbolo β (letra griega beta): 𝛽 = 𝑣/𝑐
Prof. Armando Martínez
Página 57
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
Hagamos el cálculo de la velocidad del rayo de luz tal y como es medida tanto por el viajero A como por el observador B. Desde la perspectiva del viajero A, el rayo de luz recorre dentro de su marco de referencia 𝑆′ ocho metros 2𝐷 en ocho segundos 𝛥𝑡′. Entonces él mide una velocidad de: 𝑐 =
2𝐷 2𝛥𝑡 ′
𝑐 = (8 𝑚𝑒𝑡𝑟𝑜𝑠) / (8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠) 𝑐 = 1 𝑚𝑒𝑡𝑟𝑜/𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Desde su perspectiva, el observador B ve que el rayo de luz recorre una distancia dentro del marco de referencia del viajero A tanto en su trayectoria de ida como en su trayectoria de regreso una distancia que podemos obtener del triángulo de las distancias básicas:
Ilustración 21
Podemos ver que para el observador B el rayo en su trayectoria de ida recorre 5 metros, o sea que en su trayectoria total de ida y vuelta recorre 10 metros. Entonces para el observador B el rayo de luz tiene una velocidad de: 𝑐 = 10 𝑚𝑒𝑡𝑟𝑜𝑠 / 𝛥𝑡 𝑐 = 10 𝑚𝑒𝑡𝑟𝑜𝑠 / 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 𝑐 = 1 𝑚𝑒𝑡𝑟𝑜/𝑠𝑒𝑔𝑢𝑛𝑑𝑜 Ambos viajero A y observador B miden para el rayo de luz la misma velocidad, como era de esperarse. Como hemos visto, la parte matemática del problema no es tan difícil de resolver. Lo duro viene al considerar la parte filosófica. Cuando hablamos de contracción de longitud, ¿de qué estamos hablando realmente? ¿Se comprime una vara de medir conforme pasa volando a gran velocidad frente a nosotros? ¿Qué la comprime?. En realidad, la vara de medir en sí no se comprime. Es todo el espacio que viaja en ella y en torno a ella el que se achica. Se achica el espacio entre los átomos de la vara de medir, se achica longitudinalmente el cuerpo del observador B, absolutamente todo se achica, y es precisamente por ello que el observador B no
Prof. Armando Martínez
Página 58
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
percibe cambio alguno en su marco de referencia dentro del cual para él todo sigue igual sin contracción alguna. De las fórmulas obtenidas, podemos ver que entre mayor sea la velocidad 𝑣 del viajero A tanto mayor será la contracción de longitud que el viajero a detecta en todo lo que corresponde al espacio del observador estacionario B. Si le fuera posible al viajero moverse a la velocidad de la luz, entonces de acuerdo con la fórmula todo el espacio del observador B desaparecería longitudinalmente, desaparecería del Universo, lo cual ciertamente no va a ocurrir. Ningún objeto material sólido puede moverse a una velocidad igual o mayor que la velocidad de la luz. Sólo la luz puede moverse a la velocidad de la luz, y la luz no es ningún objeto material sólido, es energía electromagnética pura. Es importante enfatizar que lo que hemos visto no es una cuestión de ilusiones ópticas. Se trata de fenómenos reales que están ocurriendo en el mundo real. No nos damos cuenta de ello porque siendo la velocidad de la luz extremadamente alta, el factor 𝑣²/𝑐² y con ello el factor de corrección sólo se vuelve importante para situaciones que se acercan a la velocidad de la luz. Pero los efectos son medibles. Un caso que ocurre cotidianamente tiene que ver con las partículas cósmicas que constantemente están bombardeando la Tierra. Al chocar contra la atmósfera de la Tierra, cada una de las partículas cósmicas produce una estela de otras partículas subatómicas. En el siguiente dibujo podemos ver una representación de las partículas subatómicas que una partícula cósmica produce tras su choque con la atmósfera terrestre:
Ilustración 22
Entre todas estas partículas subatómicas hay una que nos interesa, el muón 𝜇 + , producido por el decaimiento del mesón 𝜋 + a su vez producido por el choque de las partículas cósmicas con la atmósfera terrestre. Por experimentos llevados a cabo en laboratorios en la Tierra, se sabe que los muones cuando están reposo tienen un tiempo de vida medio de tan sólo 2 microsegundos, un tiempo extremadamente corto. Puesto que los muones son producidos a gran altura, muy pocos de ellos deberían llegar al nivel del mar. Sin embargo, los muones que se observan son Prof. Armando Martínez
Página 59
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
muchos (esto se puede confirmar utilizando una cámara de niebla de Wilson). Un muón viajando a una velocidad de 0.99 veces la velocidad de la luz (0.99c) alcanzaría a recorrer únicamente unos 600 metros en sus 2.2 microsegundos de vida. Sin embargo, en virtud de que el muón viaja a una velocidad muy cercana a la velocidad de la luz, en el marco de referencia del muón el tiempo avanza mucho más lentamente. Su vida media de 2.2 microsegundos se ve incrementada en el marco de referencia de la Tierra por un factor de corrección de 16 (para una velocidad de 0.998c), aumentando hasta 16 microsegundos, y un muón viajando a la velocidad de 0.99c alcanza a recorrer 4,800 metros en este lapso de tiempo:
Ilustración 23
Sin embargo, desde la perspectiva del muón, viajando a un lado suyo, su vida media sigue siendo de 2.2 microsegundos. Lo que pasa es que la distancia que recorre el muón es menor por los efectos de la contracción relativista de la longitud. El muón no recorre los 4,800 metros, recorre únicamente 600 metros:
Ilustración 24
Nuevamente, lo que para un observador se trata de una dilatación del tiempo, para el otro observador se trata de una contracción de longitud.
PROBLEMA: En su primer papel en el cual dio a conocer al mundo su Teoría Especial de la Relatividad, Einstein escribió lo siguiente: “Si en los puntos A y B de K hay relojes estacionarios que, vistos desde un sistema estacionario, están sincronizados, y si el reloj en A es movido con velocidad 𝑣 a lo largo de la línea AB hacia B, entonces a su llegada a B los dos relojes no sincronizarán, el reloj movido de A hacia B estará
Prof. Armando Martínez
Página 60
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
detrás del otro que permaneció estacionario por ½𝑡𝑣²/𝑐² (hasta magnitudes de orden cuatro y mayor), siendo 𝑡 el tiempo ocupado en la jornada de A hacia B.” Demostrar el enunciado anterior.
Al estar en la posición A, ambos relojes que llamaremos el reloj 1 y el reloj 2 coinciden en un mismo tiempo 𝑡1 = 𝑡2 . Al llegar el reloj viajero 1 de A a B, ambos relojes habrán acumulado tiempos diferentes 𝑡1 ≠ 𝑡2 , y la diferencia 𝛥𝑡 acumulada entre ambos estará dada por la fórmula para la dilatación del tiempo: 𝛥𝑡’
𝛥𝑡 =
√(1 −
𝑣2 ) 𝑐2 −
𝑣2 𝛥𝑡 = 𝛥𝑡’ · (1 − 2 ) 𝑐
1 2
Podemos llevar a cabo la expansión por series de la expresión anterior recurriendo al teorema del binomio que en su forma más general es enunciado de la siguiente manera: (𝑎 + 𝑥)𝑛 = 𝑎𝑛 + 𝑛𝑎𝑛 − 1𝑥 + {
𝑛(𝑛 − 1) 𝑛 𝑛(𝑛 − 1)(𝑛 − 2) 𝑛 } 𝑎 − 2𝑥 2 + { } 𝑎 − 3𝑥 3 + … 2! 3!
Haciendo 𝑎 = 1 y tomando el exponente 𝑛 como el exponente fraccionario negativo −½, tenemos la serie infinita: 1
(1 − 𝑥)−2 = 1 +
1 𝑥 + … __𝑝𝑎𝑟𝑎 𝑥 ≤ 1 2
Con la cual: 𝛥𝑡 = 𝛥𝑡’ { 1 +
1 𝑣 2 𝑣 4 ( ) + 𝑂( ) } 2 𝑐 𝑐
En donde 𝑂(𝑣⁄𝑐 )4 significa “los Otros términos residuales de la serie infinita sobre v/c de orden 4 o mayor”. Entonces, despreciando esos otros términos residuales de la serie: 1 𝑣 2 𝛥𝑡 = 𝛥𝑡’ (1 + ( ) ) 2 𝑐 𝛥𝑡 = 𝛥𝑡’ + 𝛥𝑡’
Prof. Armando Martínez
1 𝑣 2 ( ) 2 𝑐
Página 61
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
𝛥𝑡 − 𝛥𝑡’ =
1 𝑣2 𝛥𝑡’ ( 2 ) 2 𝑐
Pero 𝛥𝑡 − 𝛥𝑡’ es precisamente la diferencia entre los lapsos de tiempos 𝛥𝑡 y 𝛥𝑡’ transcurridos entre los dos relojes, y como el lapso de tiempo 𝛥𝑡’ corresponde al reloj que se movió, vemos que esto será igual a la expresión dada por Einstein en su papel original.
PROBLEMA: En el mismo papel elaborado por Einstein en donde aparece lo anterior, Einstein agregó lo siguiente: “Entonces concluimos que un reloj de balanza puesto en el Ecuador deberá correr más lentamente, por una cantidad muy pequeña, que un reloj precisamente similar situado en uno de los polos bajo condiciones de otra manera idénticas.” Calcúlese la diferencia de tiempos entre los dos relojes después de un siglo. En medidas angulares, la Tierra gira sobre su propio eje 2π radianes en 24 horas. Su velocidad angular ω será entonces:
𝜔 = 2𝜋 𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠
24 ℎ𝑜𝑟𝑎𝑠
𝜔 = 72.722 · 10−6
𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠 𝑠𝑒𝑔
Tomando el radio medio de la Tierra como 𝑟 = 6.37 · 106 𝑚𝑒𝑡𝑟𝑜𝑠, podemos estimar una velocidad tangencial en su ecuador igual a: 𝑣 = 𝜔𝑟 𝑣 = (72.722 · 10−6 𝑟𝑎𝑑𝑖𝑎𝑛𝑒𝑠/𝑠𝑒𝑔)(6.37 · 106 𝑚𝑒𝑡𝑟𝑜𝑠) 𝑣 = 463.24 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔 El retardo de tiempo acumulado después de un siglo por el reloj que avanza a la anterior velocidad 𝑣 será: 𝑡 =
1 𝑣2 1 𝑣 2 𝑡’ ( 2 ) = 𝑡’ ( ) 2 𝑐 2 𝑐
𝑡 =
1 (100 𝑎ñ𝑜𝑠)( )2 2
𝑡 = 3.8 × 10−3 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 Esta es una diferencia de tiempos muy pequeña que en los tiempos de Einstein era indetectable. Sin embargo, en los tiempos de hoy en los que contamos con relojes Prof. Armando Martínez
Página 62
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
de precisión atómica, el experimento se puede llevar a cabo en cualquier momento subiendo a una persona a un avión llevando consigo un reloj de alta precisión. El experimento ya se ha efectuado, y los resultados son precisamente los que predice la Teoría de la Relatividad. Fue llevado a cabo por vez primera en 1971 por Joseph C. Hafele y R. Keating, los cuales se subieron con cuatro relojes atómicos de cesio a bordo de aviones comerciales dándole la vuelta a la Tierra primero en dirección Este y después haciendo otro viaje redondo en dirección Oeste, comparándose las lecturas de los mismos con la lectura de otro reloj idéntico en Tierra en la ciudad de Washington sincronizado inicialmente con los relojes viajeros. Al comparar las lecturas de los relojes atómicos después del viaje, los del avión y el de la Tierra, ya no estaban sincronizados. Los relojes atómicos que habían volado estaban ligeramente retrasados (muy ligeramente pero medible con dichos relojes, la diferencia de tiempos era de unas pocas centésimas de milésima de millonésima de segundo). Tras descontar ciertos efectos gravitatorios secundarios, y asumiendo que no hubo ningún error de medida, lo cual se comprobó controlando las condiciones y repitiendo el experimento varias veces, se concluyó que la única explicación posible venía por la Teoría de la Relatividad. A un costo de 8.000 dólares por el experimento, de los cuales 7.600 dólares fueron empleados para pagar los pasajes, la edición de septiembre de 1972 de la revista Scientific American lo llamó la prueba más económica que se haya hecho sobre la relatividad. De hecho, son tantas las pruebas experimentales que se han llevado a cabo ya de diversas maneras confirmando las predicciones teóricas de la Teoría de la Relatividad, que un resultado negativo causaría en estos momentos una verdadera conmoción entre la comunidad científica. En tiempos recientes, los efectos relativistas de la dilatación del tiempo ocasionados por una rotación alrededor de la Tierra tienen que ser tomados en cuenta para hacer las correcciones numéricas necesarias para poder mantener sincronizados con la Tierra a los 24 satélites utilizados por el Sistema de Posicionamiento Global o Global Positioning System (GPS), cada uno de los cuales da una vuelta completa a la Tierra cada 12 horas:
Ilustración 25
En virtud de que dichos satélites, al estarse moviendo en el espacio en relación con los relojes atómicos que están en reposo en la Tierra, registran un tiempo que camina con mayor lentitud. El sistema de localización GPS requiere para su buen funcionamiento que los satélites estén sincronizados a un elevado nivel de precisión, Prof. Armando Martínez
Página 63
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
lo cual es absolutamente necesario para permitirles a las personas en la Tierra que tengan receptores GPS (cada vez incorporados con mayor frecuencia como una función en teléfonos celulares de alto costo):poder ubicar sus coordenadas geográficas con la exactitud requerida en base a las distancias de cada uno de los satélites cuyas señales alcanzan a llegar a un receptor de señales GPS. Aunque el efecto relativista es relativamente pequeño, los relojes atómicos son lo suficientemente precisos como para ser afectados por el efecto de la dilatación del tiempo, y las correcciones numéricas que se tienen que hacer son precisamente las que predice la Teoría de la Relatividad.
PROBLEMA: Una vara en movimiento de longitud L forma un ángulo θ con respecto a la horizontal. Si la vara se mueve a una velocidad V a lo largo de la dirección con respecto a la cual forma dicho ángulo, ¿cuál será la longitud de la vara y cuál será el ángulo que forma la vara con respecto a la horizontal para un observador en reposo que los ve pasar?
Ilustración 26
Puesto que las dimensiones de un objeto experimentan una contracción relativista por un factor √(1 − 𝑣 2 /𝑐 2 ) en la dirección del movimiento, para un observador en reposo la componente horizontal de la vara habrá quedado reducida a una longitud de: 𝐿 cos(𝜃) √1 −
𝑣2 𝑐2
Mientras que la componente de la vara perpendicular a la dirección del movimiento, que es 𝐿𝑠𝑒𝑛(𝜃), permanecerá inalterada en ambos marcos de referencia. Por lo tanto, para el observador en reposo en el marco de referencia 𝑆, por el teorema de Pitágoras la longitud de la vara 𝐿 en su marco de referencia será igual a la raíz cuadrática de la suma de los cuadrados de la componente vertical y de la componente horizontal contraída: 𝐿2 = 𝐿2 sin(𝜃)2 + (1 −
Prof. Armando Martínez
𝑣2 ) (𝐿2 cos(𝜃)2 ) 𝑐2
Página 64
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
𝐿 = 𝐿 √sin(𝜃)2 +
cos(𝜃)2 𝛾2
Y en lo que al ángulo respecta, el ángulo 𝜃 medido por el observador en 𝑆 estará dado de: tan 𝜃 =
𝐿 sin 𝜃 2
𝑣 𝐿 cos 𝜃 · (√1 − 2 ) 𝑐
tan 𝜃 = 𝛾 · tan 𝜃 𝜃 = 𝑡𝑎𝑛 − 1[𝛾 · tan 𝜃]
PROBLEMA: Dos observadores en los sistemas de referencia 𝑆 y 𝑆’ sincronizan sus relojes para que den las mismas lecturas de 𝑡 = 0 en sus orígenes cuando coinciden el uno frente al otro. El observador en 𝑆 lee la lectura del reloj en 𝑆’ a través de un telescopio. ¿Cuál es el tiempo que lee del reloj en 𝑆’ cuando su reloj marca 20 minutos si 𝑣² = (8/9) 𝑐² ?
Este problema ilustra una complicación adicional que tenemos que tomar en cuenta en la resolución de ciertos problemas que tiene que ser agregada a los efectos propios de la relatividad: el tiempo finito empleado por la luz en llegar de un lugar a otro. Si nosotros desde la Tierra vemos con un telescopio un reloj en el planeta Marte sincronizado con el nuestro cuando los planetas están más cercanos, podemos tener la seguridad de que la lectura que veremos en el reloj de Marte con la ayuda de nuestro telescopio no será igual a la de nuestro reloj ya que la distancia que tiene que recorrer viajando a la velocidad de la luz la imagen del reloj es de unos 100 millones de kilómetros, y puesto que esa imagen no nos llega instantáneamente sino que es una imagen que tarda (100,000,000 Km)/(300,000 Km/seg) = 333 segundos = 6 minutos, la lectura que veremos es una imagen del pasado, de algo que nos fue enviado 6 minutos antes y que tardó 6 minutos en llegarnos. De hecho, todo, pero absolutamente todo lo que vemos, son imágenes del pasado. No hay imagen alguna de nada que vemos con nuestros ojos que nos llegue instantáneamente, inclusive de objetos cercanos a nosotros al alcance de nuestras manos, en virtud de la velocidad finita de la principal portadora de información, la luz. Vivimos en la ilusión de que todo lo que tenemos ante nosotros cerca de nosotros lo vemos justo cuando está ocurriendo, pero ello es una ilusión encubierta por el hecho de que las diferencias en los tiempos involucrados son tan pequeñas que para fines prácticos pueden ser consideradas despreciables, pero no son despreciables. Afortunadamente, aunque la velocidad de la luz es finita, también es bastante elevada, de modo tal que no nos damos cuenta de que las imágenes que vemos en torno nuestro son imágenes de un pasado tanto mayor cuanto mayor sea la distancia que nos separa de lo que estamos viendo. En estos momentos vemos con nuestros telescopios, incluido el telescopio espacia Hubble, las imágenes de estrellas que ya no existen, que se apagaron hace millones de años. En el tiempo en que
Prof. Armando Martínez
Página 65
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
tardaron las imágenes de esas estrellas en llegarnos tales estrellas desaparecieron y ya no existen hoy. Regresando al problema que nos ocupa, podemos ver que ocurren tres eventos: 1) Los dos observadores 𝑆 y 𝑆’ están el uno frente al otro sincronizando sus relojes a un tiempo 𝑡 = 𝑡 = 0.
Ilustración 27
2) El observador viajero 𝑆’ llega a cierto punto en su recorrido desde donde le envía una imagen de su reloj al observador en 𝑆.
Ilustración 28
3) La imagen del reloj de 𝑆’ le llega al telescopio al observador en 𝑆 a la vez que 𝑆’ continúa su recorrido.
Ilustración 29
Nótese que el tiempo de 𝑆’ que lee el observador en 𝑆 no es la lectura que está marcando el reloj de 𝑆’ cuando le llega la imagen del reloj a 𝑆 a los 20 minutos. Desde la perspectiva del observador en reposo, el tiempo de 20 minutos en el cual el observador en 𝑆 recibe la imagen del reloj de 𝑆’ debe ser igual al tiempo 𝑡1 (= 𝐿/𝑣) que tarda el viajero en 𝑆’ en llegar hasta el punto desde el cual le envía a 𝑆 la imagen de su reloj, más el tiempo 𝑡2 (= 𝐿/𝑐) que tarda en llegarle dicha imagen a 𝑆, siendo 𝐿 la distancia propia medida por 𝑆: 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 = 𝑡1 + 𝑡2 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 = 𝐿/𝑣 + 𝐿/𝑐 = (1/𝑣 + 1/𝑐) 𝐿’ = (√9/8 + 1) 𝐿/𝑐 = (2.06) 𝐿/𝑐
𝐿 =
(1,200 𝑠𝑒𝑔) · (3 × 108
Prof. Armando Martínez
2.06
𝑚𝑒𝑡𝑟𝑜𝑠 𝑠𝑒𝑔 )
= 1.747 × 1011 𝑚𝑒𝑡𝑟𝑜𝑠
Página 66
Fundamentos de Relatividad General
Las consecuencias directas de la teoría
Esta es la distancia que ha recorrido 𝑆’ medida por 𝑆 cuando el primero le envía la imagen de su reloj a 𝑆. Sin embargo, para 𝑆’ esta distancia de está contraída por un factor √1 −
𝑣2 8 1 √ = 1 − ( ) = 𝑐2 9 3
O sea que, desde su perspectiva, 𝑆’ ha recorrido una distancia de 𝐿’ = 0.582 × 1011 metros. Entonces el tiempo 𝑡’ que 𝑆 tiene acumulado en su reloj al recorrer dicha distancia viajando a una velocidad de: 8 𝑣 = √ 𝑐 9 Es: 𝑡’ = 𝐿’/𝑣 = (0.582 · 1011 𝑚𝑒𝑡𝑟𝑜𝑠) / (0 2.8284 · 108 𝑚𝑒𝑡𝑟𝑜𝑠/𝑠𝑒𝑔) 𝑡 = 205.8 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = 3.43 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
Prof. Armando Martínez
Página 67
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
El experimento que antecedió a la teoría “¿Qué es el tiempo?” - en alguna ocasión se le llegó a preguntar a Einstein, quizá para meterlo en un aprieto filosófico. “Es lo que medimos con el reloj” - contestó.
Es interesante el hecho de que la primera confirmación experimental de la Teoría Especial de la Relatividad se dio en 1881 cuando aún no existía dicha teoría e inclusive cuando Einstein apenas tenía dos años de edad (nació en 1879). La Teoría Especial de la Relatividad sería publicada 24 años después, en 1905, y cuando Einstein desde Europa dio a conocer al mundo su teoría ni siquiera parecía haber estado bien enterado de los resultados obtenidos en aquél famoso experimento llevado a cabo por vez primera en los Estados Unidos por el físico Albert Michelson 24 años atrás. Cuando Einstein elaboró su teoría no la concibió con la finalidad de explicar los resultados obtenidos por Michelson, la elaboró con el fin de liberar de asimetrías las ecuaciones básicas del electromagnetismo descubiertas por Maxwell. Cuando Michelson llevó a cabo su ahora ya famoso experimento, la intención de Michelson era determinar la rapidez con la cual se estaba moviendo la Tierra en el espacio en relación con ese medio estático, invisible y universal que se suponía que servía como medio de conducción para la transmisión de las señales luminosas, el éter, el cual había sido postulado por varios físicos de prestigio como la gran referencia cósmica con respecto a la cual el movimiento absoluto podía ser detectado. Michelson esperaba poder detectar desde su laboratorio no sólo la velocidad a la cual se estaba moviendo la Tierra con respecto al éter, sino inclusive la dirección hacia la cual o de la cual se estaba acercando o alejando del éter en un momento dado al girar la Tierra en torno al Sol. El aparato original de Michelson cuando fue utilizado por vez primera tenía el siguiente aspecto:
Prof. Armando Martínez
Página 68
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
Ilustración 6-1
Este aparato trabajaba sobre el siguiente esquema simplificado:
Ilustración 6-2
Todo el aparato estaba montado sobre una enorme piedra caliza montada sobre madera suave flotando a su vez en una piscina de mercurio líquido con el fin de disminuir las vibraciones del instrumento. Sobre la plataforma había una fuente de luz de la cual emanaba un haz que, con la ayuda de un espejo semireflectante, era dividido en dos caminos diferentes, dirigiéndose parte del haz por transmisión directa a través del espejo semireflectante hacia un espejo opuesto hacia la fuente de luz (situado a la derecha del dibujo), y dirigiéndose la otra parte del haz por reflexión directa hacia otro espejo (situado en la parte superior del dibujo). Ambos haces eran reflejados por los espejos, y al combinarse los haces separados nuevamente lograban pasar por el espejo semireflectante hacia un detector que consistía básicamente en un telescopio graduado. Puesto que uno de los haces de la combinación seguía una trayectoria más larga que el otro, al juntarse nuevamente Prof. Armando Martínez
Página 69
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
ambos haces se producía un patrón de interferencia propio de las ondas que llegan fuera de fase. A continuación tenemos un bosquejo del efecto que se obtenía del aparato:
Ilustración 6-3
El objetivo de la rueda que flotaba sobre la piscina de mercurio líquido era girar todo el instrumental (fuente de luz, espejos, telescopio) situado sobre la plataforma, para dejar que el movimiento con respecto al éter alterara las franjas de interferencia observadas en el telescopio y a través de la alteración determinar la velocidad del aparato (y por lo tanto de la Tierra sobre la cual estaba puesto el aparato) con respecto al éter. Obviamente, para poder obtener un patrón de interferencia entre dos haces de luz de una misma fuente pero arribando con una diferencia de longitud en sus trayectorias, era necesario utilizar un haz luminoso monocromático, de un solo color (y por lo tanto de una sola frecuencia):
Ilustración 6-4
El experimento estaba diseñado sobre una premisa muy fácil de entender: si existe el éter absoluto, inamovible, que permea todo el espacio, medio usado por las ondas electromagnéticas incluida la luz misma para propagarse, entonces si un rayo luminoso es lanzado directamente hacia un espejo el tiempo total de ida y vuelta del rayo luminoso será diferente si dicho rayo de luz es lanzado en una dirección que coincide con la dirección en la cual está “soplando” el viento del éter que el tiempo total de ida y vuelta si dicho rayo de luz es lanzado en una dirección perpendicular a la dirección en la cual está “soplando” el viento del éter, suponiéndose que este “viento del éter” se debe al movimiento combinado de rotación y traslación de la Tierra en el cosmos. En el aparato de Michelson, aunque no sepamos ni podamos ver en qué dirección está “soplando” el viento del éter, nos basta con ir girando la Prof. Armando Martínez
Página 70
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
rueda sobra la cual está montada todo el instrumental para poder obtener una diferencia de tiempos la cual, aunque minúscula, debe poder ser detectada a partir de los patrones de interferencia formados en el telescopio detector. Cuando un rayo de luz es lanzado hacia un espejo, a lo largo de una misma dirección con respecto a la cual se está efectuando el movimiento del laboratorio con respecto al éter, si la velocidad del laboratorio moviéndose en contra del estático éter es 𝑣𝑙𝑎𝑏 la velocidad del rayo luminoso se verá disminuída de 𝑐 a (𝑐 − 𝑣𝑙𝑎𝑏 ) en su viaje de ida, y se verá aumentada a (𝑐 + 𝑣𝑙𝑎𝑏 ) en su viaje de retorno. (Obsérvese que bajo la hipótesis del éter, al no ser la velocidad de la luz la misma para todos los marcos de referencia en movimiento absoluto con respecto al éter no existe impedimento alguno para que los objetos materiales puedan moverse a velocidades mayores que la velocidad de la luz):
Ilustración 6-5
Llamando 𝐿 a la distancia entre la fuente de luz y el espejo reflector, el tiempo total de ida y vuelta del haz luminoso será la suma del tiempo de ida: 𝑡𝑖𝑑𝑎 = 𝐿 / (𝑐 − 𝑣𝑙𝑎𝑏 ) a la del tiempo de vuelta: 𝑡𝑣𝑢𝑒𝑙𝑡𝑎 = 𝐿 / (𝑐 + 𝑣𝑙𝑎𝑏 )
o sea:
𝑡𝑡𝑜𝑡𝑎𝑙 = 𝑡𝑖𝑑𝑎 + 𝑡𝑣𝑢𝑒𝑙𝑡𝑎 1 1 𝑡𝑡𝑜𝑡𝑎𝑙 = 𝐿 ( + ) 𝑐 − 𝑣𝑙𝑎𝑏 𝑐 + 𝑣𝑙𝑎𝑏 𝑡𝑡𝑜𝑡𝑎𝑙 = 𝐿 (
𝑡𝑡𝑜𝑡𝑎𝑙
𝑐 + 𝑣𝑙𝑎𝑏 𝑐 − 𝑣𝑙𝑎𝑏 2 + 2 2 ) 𝑐 2 − 𝑣𝑙𝑎𝑏 𝑐 − 𝑣𝑙𝑎𝑏
2𝐿𝑐 2𝑐 𝐿 · 2𝑐 𝑐2 = 𝐿( 2 2 ) ; 𝑡𝑡𝑜𝑡𝑎𝑙 = 2 2 ; 𝑡𝑡𝑜𝑡𝑎𝑙 = 2 2 𝑐 − 𝑣𝑙𝑎𝑏 𝑐 − 𝑣𝑙𝑎𝑏 𝑐 − 𝑣𝑙𝑎𝑏 𝑐2
Prof. Armando Martínez
Página 71
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
𝑡𝑡𝑜𝑡𝑎𝑙
2𝐿 𝑐 = 𝑣2 1 − 𝑙𝑎𝑏 𝑐2
El caso en el cual el rayo de luz es lanzado en una dirección perpendicular a la dirección en la cual está “soplando” el viento del éter se puede comparar mediante una analogía con un avión en el aire. Un avión que vuela de Sur a Norte a una velocidad de 20 metros por segundo tardará diez segundos en recorrer una distancia de 200 metros volando de Sur a Norte cuando no está soplando viento alguno, pero si el avión es arrastrado al mismo tiempo de Este a Oeste por el viento a una velocidad de 12 metros por segundo, tardará más tiempo en recorrer los mismos 200 metros de Sur a Norte ya que su velocidad efectiva en dicha dirección habrá disminuido a 16 metros por segundo. Tardará 12.5 segundos en lugar de diez en recorrer esos 200 metros de Sur a Norte:
Ilustración 6-6
Esto lo podemos deducir con una simple substracción vectorial de velocidades llamando 𝑣𝑎 a la velocidad del avión en un día tranquilo sin viento alguno, 𝑣𝑖 la velocidad con la cual empieza a soplar el viento, y 𝑣𝑠𝑛 la velocidad efectiva del avión de sur a norte: 𝑣𝑠𝑛 = 𝑣𝑛𝑠 − 𝑣𝑖
Vectorialmente, la velocidad 𝑣𝑛𝑠 del avión es disminuida en su sentido de norte a sur de 20 metros por segundo a una velocidad efectiva 𝑣𝑠𝑛 de 16 metros por segundo por el “soplo del viento” (el avión sigue manteniendo su misma velocidad de acuerdo a lo que le marcan al piloto los instrumentos). La magnitud de la velocidad efectiva la obtenemos con la simple aplicación de teorema de Pitágoras:
Prof. Armando Martínez
Página 72
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
2 2 𝑣𝑛𝑠 = 𝑣𝑖2 + 𝑣𝑠𝑛
(20
𝑚 2 𝑚 2 2 ) = (12 ) + 𝑣𝑠𝑛 𝑠𝑒𝑔 𝑠𝑒𝑔
2 𝑣𝑠𝑛 = (20
2 𝑣𝑠𝑛
𝑚 2 𝑚 2 ) − (12 ) 𝑠𝑒𝑔 𝑠𝑒𝑔 𝑚2 = 256 𝑠𝑒𝑔2
𝑣𝑠𝑛 = 16 𝑚/𝑠𝑒𝑔 Esto mismo lo podemos generalizar para obtener una expresión para el tiempo total de ida y vuelta del rayo luminoso cuando es lanzado en una dirección perpendicular a la dirección del “viento del éter”.
PROBLEMA: Suponiendo la existencia del éter, obtener una expresión general para calcular el tiempo total de ida y vuelta de un haz luminoso cuando el rayo de luz es lanzado hacia un espejo en una dirección perpendicular con respecto a la cual se está efectuando el movimiento del haz en relación al éter, siendo L la distancia entre la fuente luminosa y el espejo reflector.
La resolución de este problema consiste simplemente en generalizar con símbolos lo que acabamos de ver en el ejemplo de arriba. El tiempo de ida 𝑡𝑖 del haz en una dirección perpendicular con respecto a la cual se está efectuando el movimiento del haz en relación al éter será igual al tiempo de regreso 𝑡𝑣 del haz al punto de donde fue lanzado, siendo este tiempo igual a: 𝑡𝑖 = y por lo tanto el tiempo total será:
𝐿 √𝑐 2 − 𝑣 2
𝑡𝑡𝑜𝑡𝑎𝑙 =
𝑡𝑡𝑜𝑡𝑎𝑙
2𝐿 √𝑐 2 − 𝑣 2
2𝐿 (𝑐) = 2 √1 − 𝑣2 𝑐
Obsérvese que este tiempo es diferente del tiempo total de recorrido que se obtiene cuando el haz luminoso es lanzado en una dirección paralela (en la misma dirección) a la dirección del “viento del éter” en vez de ser lanzado en una dirección perpendicular a dicho viento.
Prof. Armando Martínez
Página 73
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
PROBLEMA: Suponiendo la existencia del éter, obtener una expresión general aproximada para calcular la diferencia de tiempos en un aparato en el cual se lanza un rayo de luz recorriendo una distancia 𝐿 hacia el espejo reflector en su trayecto de ida y vuelta cuando el rayo de luz viaja en una dirección paralela a la dirección en la cual está soplando el “viento del éter”, y el tiempo total de ida y vuelta medido en el mismo aparato cuando el rayo de luz es lanzado viajando en una dirección perpendicular a la dirección en la cual está soplando el “viento del éter”. ¿Cómo se comparan estos dos tiempos con el tiempo medido por un observador privilegiado que esté en reposo absoluto con respecto al éter?
Para el caso en el cual el haz luminoso es lanzado a lo largo de la misma dirección en la cual está soplando el “viento del éter”, la expresión del tiempo total 𝑡𝑡𝑜𝑡𝑎𝑙 de ida y vuelta es: 𝑡𝑡𝑜𝑡𝑎𝑙
𝑡𝑡𝑜𝑡𝑎𝑙
2𝐿 (𝑐) = 𝑣2 1 − 2 𝑐
2𝐿 𝑣2 = ( ) (1 − 2 ) 𝑐 𝑐
−1
Podemos llevar a cabo la expansión de esta expresión mediante una serie infinita recurriendo al teorema del binomio que en su forma más general es enunciado de la siguiente manera: (𝑎 + 𝑥)𝑛 = 𝑎𝑛 + 𝑛𝑎𝑛 − 1𝑥 + {
𝑛(𝑛 − 1) 𝑛 𝑛(𝑛 − 1)(𝑛 − 2) 𝑛 } 𝑎 − 2𝑥² + { } 𝑎 − 3𝑥 3 + . . . 2! 3!
Cuando 𝑎 = 1 y cuando el exponente 𝑛 es −1 por tratarse de un inverso, el teorema del binomio se reduce a: (1 − 𝑥)−1 = 1 + 𝑥 + 𝑥² + 𝑥 3 + 𝑥 4 + 𝑥 5 + . . . __𝑝𝑎𝑟𝑎 𝑥 ≤ 1 (La condición 𝑥 ≤ 1 se cumple aquí porque suponemos que el aparato está viajando a una velocidad 𝑣 menor que la velocidad de la luz 𝑐 sin suponer efecto relativista alguno.) Con esta expansión tenemos: −1
𝑣2 (1 − 2 ) 𝑐
𝑣2 𝑣 2 = 1 + 2 + 𝑂( ) 𝑐 𝑐
en donde 𝑂(𝑣⁄𝑐)2 significa “los Otros términos residuales de la serie obtenidos con exponentes de orden 2 y mayor”. Por lo tanto el tiempo de ida y vuelta será aproximadamente igual a:
Prof. Armando Martínez
Página 74
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
𝑡𝑡𝑜𝑡𝑎𝑙(1) ≈ (
2𝐿 𝑣2 ) (1 + 2 ) 𝑐 𝑐
Para el caso en el cual el haz luminoso es lanzado en una dirección perpendicular a la dirección en la cual está soplando el “viento del éter”, la expresión del tiempo 𝑡𝑡𝑜𝑡𝑎𝑙 de ida y vuelta es 𝑡𝑡𝑜𝑡𝑎𝑙(2)
2𝐿 (𝑐) = 2 √1 − 𝑣2 𝑐 −
𝑡𝑡𝑜𝑡𝑎𝑙(2)
2𝐿 𝑣2 = ( ) · (1 − 2 ) 𝑐 𝑐
1 2
Usamos nuevamente el teorema del binomio haciendo a = 1 cuando el exponente es 1 el exponente fraccionario negativo − 2, con lo cual tenemos: (1 − 𝑥)
−
1 2
= 1 +
1 𝑥 + 𝑂(𝑥)2 ; ∀𝑥 ≤ 1 2
Por lo tanto el tiempo total de ida y vuelta para el caso perpendicular será: 𝑡𝑡𝑜𝑡𝑎𝑙(2) ≈ (
2𝐿 1 𝑣2 ) (1 + ( 2 )) 𝑐 2 𝑐
La diferencia entre 𝑡𝑡𝑜𝑡𝑎𝑙(1) y 𝑡𝑡𝑜𝑡𝑎𝑙(2) es entonces (obsérvese que 𝑡𝑡𝑜𝑡𝑎𝑙(1) es mayor que 𝑡𝑡𝑜𝑡𝑎𝑙(2) ): 𝛥𝑡 ≈ 𝑡𝑡𝑜𝑡𝑎𝑙(1) − 𝑡𝑡𝑜𝑡𝑎𝑙(2) 2𝐿 𝑣2 2𝐿 1 𝑣2 𝛥𝑡 ≈ ( ) (1 + 2 ) − ( ) (1 + ( 2 )) 𝑐 𝑐 𝑐 2 𝑐 Simplificando: 𝛥𝑡 ≈
𝐿𝑣 2 𝑐3
Un observador privilegiado que se encuentre en absoluto reposo con respecto al éter tendrá una velocidad 𝑣 igual a cero, y el tiempo total de ida y vuelta será 𝑡𝑝𝑟𝑖𝑣 = 2𝐿/𝑐. Puesto que esta relación es diferente de las relaciones obtenidas por otro experimentador que está en movimiento con respecto al éter, hay una asimetría entre el observador privilegiado y todos los demás observadores. Esta asimetría se verá reflejada en diferencias medibles entre experimentos llevados a cabo con el mismo aparato por distintos observadores. Prof. Armando Martínez
Página 75
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
Comparando los tres tiempos a un primer orden de aproximación: 𝑡𝑡𝑜𝑡𝑎𝑙(1)
2𝐿 𝑣2 ≈ ( ) (1 + 2 ) 𝑐 𝑐
𝑡𝑡𝑜𝑡𝑎𝑙(2) ≈ (
2𝐿 1 𝑣2 ) (1 + ( 2 )) 𝑐 2 𝑐
𝑡𝑝𝑟𝑖𝑣 = 2𝐿/𝑐 Comprobamos que, en todos los casos, el menor tiempo posible de recorrido será precisamente el que mida un observador privilegiado que esté en absoluto reposo con respecto al éter en cuyo caso por tener 𝑣 = 0 tanto 𝑡𝑡𝑜𝑡𝑎𝑙(1) como 𝑡𝑡𝑜𝑡𝑎𝑙(2) se reducen a 2𝐿/𝑐. Esto, en principio, nos dá una forma teórica y experimental de poder saber si estamos en reposo absoluto con respecto al hipotético éter. Michelson supuso, al igual que otros científicos de su tiempo, que la Tierra por sus movimientos de rotación y traslación alrededor del Sol no estaba permanentemente en reposo con respecto al éter, y si acaso lo estaba ello sería por un instante brevísimo. Debía ser posible detectar el desplazamiento de la Tierra a través del éter. El aparato que diseño se basó precisamente en la diferencia de tiempos 𝛥𝑡 que esperaba obtener entre dos rayos de luz, uno arrojado en la posible dirección paralela al “soplo del viento del éter” y el otro arrojado en una dirección perpendicular, juntando dichos haces de luz para detectar la variación producida en un patrón de interferencia luminosa. Dada la enorme dificultad en hacer las dos trayectorias (la paralela y la perpendicular) de la misma longitud L a la precisión requerida, el patrón de interferencia producida por los dos haces luminosos al llegar desfasados al detector era observada y entonces el aparato completo era girado 90 grados. Esta rotación debería de producir para cada haz luminoso la diferencia de tiempo dada por: 𝛥𝑡 ≈
𝐿𝑣 2 𝑐3
Esta diferencia de tiempo 𝛥𝑡 es equivalente a una diferencia de trayectoria de 2𝑐 · 𝛥𝑡. De acuerdo con los principios de la óptica ondulatoria, las franjas de interferencia observadas en la primera orientación de la mesa giratoria deberían recorrerse en el detector por una cantidad 𝛥𝑛 de franja igual a: 𝛥𝑛 = 2𝑐 ·
Prof. Armando Martínez
𝛥𝑡 𝜆
Página 76
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
𝐿𝑣 2 3 𝐿𝑣 2 𝐿𝑣 2 2𝐿 · 𝑣 2 𝑐 ∆𝑛 = 2𝑐 · = 2𝑐 · 3 = 2 · 2 = 𝜆 𝑐 𝜆 𝑐 𝜆 𝜆 · 𝑐2 2𝐿 𝑣2 𝛥𝑛 = ( ) · ( 2 ) 𝜆 𝑐 En donde 𝜆 es la longitud de onda de la fuente luminosa monocromática. Cuando llegó el día de llevar a cabo la primera realización del experimento en 1881, la distancia 𝐿 en la mesa giratoria era de unos 𝟏. 𝟐 𝒎𝒆𝒕𝒓𝒐𝒔 y la longitud de onda de la señal luminosa utilizada era de 𝝀 = 𝟓. 𝟗 × 𝟏𝟎−𝟕 𝒅𝒆 𝒎𝒆𝒕𝒓𝒐. Tomando la velocidad orbital de la Tierra alrededor del Sol para una primera aproximación de la velocidad 𝑣 con respecto al éter, obtenemos una velocidad de unos 30 𝑘𝑚/𝑠 que viene siendo igual a 10−4 𝑐, con lo cual 𝑣²/𝑐² es un factor de 10−8, y se esperaba que 𝛥𝑛 fuese igual a un 0.04 de franja. Desafortunadamente, se estimaba que las incertidumbres experimentales eran de un orden de magnitud similar. De cualquier manera, al efectuar el experimento y en un resultado que lo sorprendió, Michelson no encontró cambio alguno en los patrones de interferencia por más que girase la mesa rotatoria hacia uno y otro lado, con lo cual concluyó que esto era una evidencia de que la Tierra no se estaba moviendo con respecto al éter, aunque el resultado negativo del experimento llevado a cabo por Michelson fue tomado, inicialmente por muchos, como un fracaso debido a la falta de precisión de los instrumentos utilizados en aquella época en la que no existía ni siquiera la radio comercial. Tiempo después, en 1887, Michelson repitió el mismo experimento con Edward W. Morley, usando un sistema mejorado para girar la mesa circular del aparato sin introducir un desplazamiento en las franjas de interferencia luminosas causadas por tensiones mecánicas en el aparato, y la longitud efectiva de la trayectoria fue elevada de los 1.2 𝑚𝑒𝑡𝑟𝑜𝑠 originales a unos 11 𝑚𝑒𝑡𝑟𝑜𝑠 recurriendo a una serie de reflexiones múltiples. Este es el aparato que tenemos descrito arriba. Para este intento, se había calculado que 𝑛 debería tener un valor de 0.4 de franja, unas 20 ó 40 veces más que el mímino que era posible observar. Y de nueva cuenta, no se encontró corrimiento alguno en las franjas de interferencia al girar la mesa rotatoria hacia uno y otro lado, y en esta ocasión había la certeza de que no se debían a error experimental alguno. Desde entonces, el mismo experimento ha sido repetido innumerables ocasiones alrededor del mundo, y jamás se ha encontrado corrimiento alguno en las franjas de interferencia. En un esfuerzo por explicar los resultados negativos obtenidos por Michelson y Morley, el físico holandés Hendrik Antoon Lorentz formuló conjuntamente con el físico irlandés George Francis Fitzgerald una explicación teórica hecha “justo a la medida”, argumentando que al igual que una masa suave que se mueve en el aire o bajo el agua sufre una ligera deformación por la resistencia que le ofrece el medio en el cual se está desplazando, también la vara de medición que se estuviera moviendo en contra del éter estático sufriría una contracción que por una maravillosa y casi milagrosa coincidencia era justo lo que se necesitaba para compensar, con una longitud menor, la diferencia de tiempos de traslado que se Prof. Armando Martínez
Página 77
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
hubiera esperado detectar a través de los patrones de interferencia observados en el telescopio y explicando con ello los resultados negativos obtenidos en los experimentos. Matemáticamente expresado, la contracción debida al “empuje del viento del éter” reduciría la longitud original 𝐿0 de la vara de medición a una longitud menor 𝐿 dada por: 𝐿 = 𝐿0 √1 −
𝑣2 𝑐2
En donde 𝑣 vendría siendo la velocidad de la regla al estarse moviendo en contra del éter. De acuerdo con ésta fórmula, poniendo números, una vara de medición moviéndose en contra del éter a una velocidad igual a las tres cuartas partes de la velocidad de la luz sería “comprimida” a un 66 por ciento de su longitud original. Esta contracción fue llamada desde que fue propuesta como la contracción LorentzFitzgerald. La principal objeción que podemos ponerle a esta teoría es que predice una compresión igual en todas las varas de medición independientemente del material del que estén hechas, ya sea de acero inoxidable rígido o de caucho, lo cual por sí solo presiona demasiado los límites de nuestra credibilidad. Pero otra objeción más dura aún a la fórmula de contracción de longitud de una vara de medición dada por Lorentz y Fitzgerald era que carecía de una teoría que justificase la fórmula, se trataba de una fórmula semi-empírica, era simplemente un artificio matemático concebido para explicar los resultados negativos del experimento Michelson-Morley. Fué solo hasta 1905 cuando Einstein dió a conocer su Teoría Especial de la Relatividad que los resultados negativos del experimento Michelson-Morley tuvieron una explicación teórica rigurosa y satisfactoria. Al no existir el éter y por lo tanto al no existir forma alguna de poder detectar el movimiento absoluto de la Tierra con respecto a algo que no fuese su rotación alrededor del Sol y ni siquiera así. La Tierra podía tomarse como un cuerpo en estado de reposo, y al ser tomada como un cuerpo en estado de reposo la velocidad del éter en las fórmulas utilizadas por Michelson y Morley era 𝑣𝑒 = 0, con lo cual los resultados negativos del experimento se vuelven inevitables. En el problema anterior, tenemos tres expresiones diferentes para los tiempos de viaje que obtendríamos para un rayo de luz usando el mismo aparato experimental, 𝑡𝑡𝑜𝑡𝑎𝑙(1) , 𝑡𝑡𝑜𝑡𝑎𝑙(2) y 𝑡𝑝𝑟𝑖𝑣 , tiempos de viaje predichos teóricamente sobre la base de la existencia del éter y capaces de ser confirmados experimentalmente. Y de las tres expresiones anteriores, la más sencilla de todas, la que nos dá 𝑡 = 2𝐿/𝑐, es la que obtendría un observador privilegiado que estuvierse en reposo absoluto con respecto al éter. Esto es algo de naturaleza general. Las leyes de la física adquieren su forma más sencilla posible para un observador privilegiado que esté en reposo absoluto con respecto al éter, un observador para el cual 𝑣𝑒𝑡𝑒𝑟 = 0. Para todos los demás observadores, las leyes tendrán fórmulas más complejas como lo acabamos de ver. Prof. Armando Martínez
Página 78
Fundamentos de Relatividad General
El experimento que antecedió a la teoría
A este tipo de asimetrías era a las que se refería Einstein en su papel original. La única forma de deshacerse de estas asimetrías es rechazar la hipótesis de la existencia del éter y del movimiento absoluto, que fue precisamente lo que hizo Einstein.
Prof. Armando Martínez
Página 79
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Los diagramas espacio-tiempo de Minkowski La Teoría Especial de la Relatividad, tal y como fue enunciada por vez primera por Einstein, era una teoría puramente algebraica, sin referencia alguna a ningún tipo de geometría. Se debe a Hermann Minkowski la proeza de haberla convertido en una teoría geométrica llevando a cabo de paso la unificación de dos conceptos que en la mecánica clásica habían sido considerados completamente independientes y separados el uno del otro, como espacio y tiempo. Gracias a Minkowski, el espacio y el tiempo fueron unificados en un solo concepto básico e indivisible bajo una sola palabra, el espacio-tiempo (aquí lo llamaremos espaciotiempo en el entendido de que ambos conceptos han sido fusionados en uno solo), de modo tal que no era posible hablar ya del espacio como entidad individual y del tiempo como entidad individual también, separados el uno del otro. Pero aquí nos estamos adelantando a nuestra historia. Considerando para fines ilustrativos una velocidad de la luz de 𝑐 = 1 𝑚/𝑠, el diagrama espacio-tiempo para un rayo de luz es el siguiente:
Diagrama 7-1
Sobre el mismo diagrama, la especificación de la coordenada 𝑥 de una partícula material que nos indica la posición en la cual se encuentra la partícula y del tiempo 𝑡 al que corresponde esta coordenada, determina un evento o un suceso. Si representamos la posición 𝑥 en el eje de las abscisas (eje horizontal) y el tiempo 𝑡 en las ordenadas (eje vertical), cada punto del plano (𝑥, 𝑡) corresponde a un posible Prof. Armando Martínez
Página 80
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
evento. En un diagrama así podemos representar dos eventos distintos vistos por un mismo observador, trátese de dos eventos distintos que ocurren en el mismo lugar en tiempos diferentes, dos eventos distintos que ocurren al mismo tiempo en distintos lugares, o dos eventos distintos que ocurren en tiempos diferentes en lugares diferentes, como es el siguiente caso:
Diagrama 7-2
El lugar en un plano (∆𝑥, ∆𝑡) de los eventos que representan las coordenadas apareadas de una partícula en varios instantes se conoce en los estudios de la relatividad como línea del mundo (world line) y también como línea del universo. En la Teoría Especial de la Relatividad, la línea del mundo es siempre una línea recta como la línea azul que tenemos en el diagrama de arriba porque la partícula material viaja siempre en movimiento rectilíneo en una misma dirección, recorriendo distancias iguales en tiempos iguales. Si en el instante 𝑡1 la coordenada de una partícula móvil es 𝑥1 , entonces las magnitudes 𝑥1 y 𝑡1 determinan el evento 𝐸1 . Análogamente, 𝑥2 y 𝑡2 determinan el evento 𝐸2 . Los eventos para un mismo y único observador están separados en el espacio por una distancia (𝛥𝑥 = 𝑥2 − 𝑥1 ) , y en el tiempo por una distancia (𝛥𝑡 = 𝑡2 − 𝑡1 ). En los estudios sobre la relatividad, no se acostumbra revolver peras con manzanas, no se acostumbra revolver metros con segundos al medir sobre coordenadas rectangulares. Para que en un diagrama espacio-tiempo tanto el eje horizontal como el eje vertical usen el mismo tipo de unidades, se acostumbra multiplicar el tiempo en el eje vertical que corresponde al tiempo por la constante universal absoluta que es la velocidad de la luz 𝑐, ya que con ello 𝑐𝑡 se convierte en una distancia que está medida en metros, no en segundos. De este modo, no mezclamos peras con manzanas, al medir tanto en el eje vertical como en el eje horizontal lo estamos haciendo en metros. En todos los diagramas espacio-tiempo que serán utilizados aquí, la ordenada vertical estará en dimensiones de metros, o sea multiplicada por 𝑐, representado en la ordenada vertical como 𝑐𝑡. Aunque aparezca 𝑡 en lugar de 𝑐𝑡, se sobreentenderá que siempre nos estamos refiriendo a 𝑐𝑡. Además, para fines de simplificación, le seguiremos dando a 𝑐 el valor de 1 𝑚/𝑠. Sin embargo, para fines de cálculo numérico, estamos en libertad de regresar a las mediciones en segundos sobre el eje vertical.
Prof. Armando Martínez
Página 81
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
En la última gráfica de arriba, tenemos representados dos eventos distintos, uno ocurriendo en la posición 𝑥1 en un tiempo representado en la posición 𝑐𝑡1 , y el otro evento ocurriendo en la posición 𝑥2 en un tiempo representado en la posición 𝑐𝑡2 . Poniendo números y usando una velocidad de la luz igual a 𝑐 = 1 𝑚/𝑠, las coordenadas respectivas de cada evento y la distancia entre ambos eventos es: 𝑥1 = 1 𝑚𝑒𝑡𝑟𝑜 𝑥2 = 2 𝑚𝑒𝑡𝑟𝑜𝑠 𝑐𝑡1 = 1 𝑚𝑒𝑡𝑟𝑜 𝑐𝑡2 = 3 𝑚𝑒𝑡𝑟𝑜𝑠 𝛥𝑥 = 𝑥2 − 𝑥1 = 2 𝑚𝑒𝑡𝑟𝑜𝑠 − 1 𝑚𝑒𝑡𝑟𝑜 = 1 𝑚𝑒𝑡𝑟𝑜 𝑐𝛥𝑡 = 𝑐𝑡2 − 𝑐𝑡1 = 3 𝑚𝑒𝑡𝑟𝑜𝑠 − 1 𝑚𝑒𝑡𝑟𝑜 = 2 𝑚𝑒𝑡𝑟𝑜𝑠 PROBLEMA: Una vara de medir de tres metros de largo se encuentra en reposo en el marco de referencia del observador O, y sus extremos coinciden con las coordenadas x 1 = 2 metros y x2 = 5 metros. Trazar las líneas del mundo de los extremos de la vara de medir en un diagrama espaciotiempo del observador O.
El diagrama espacio-tiempo pedido es el siguiente:
Diagrama 7-3
No es un requisito indispensable que en la construcción de un diagrama del espacio-tiempo se utilicen ejes ortogonales (perpendiculares, puestos en ángulos rectos el uno con respecto al otro). Es factible e inclusive deseable por razones que pronto serán obvias construir el diagrama espacio-tiempo utilizando ejes que no son perpendiculares. A continuación tenemos un diagrama en el cual los ejes principales no son perpendiculares:
Prof. Armando Martínez
Página 82
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-4
Obsérvese la manera de leer las coordenadas de un punto cualesquiera en este tipo de diagrama, trazando desde el punto líneas paralelas a uno de los ejes principales hasta topar con el eje principal de la otra coordenada. Y a continuación tenemos otro diagrama espacio-tiempo en el cual los ejes principales tampoco son perpendiculares:
Diagrama 7-5
Para un mismo observador, el anterior diagrama espacio-tiempo nos da la distancia 𝛥𝑥 que separa dos eventos 𝐸1 y 𝐸2 , y nos da también la distancia 𝑐𝛥𝑡 que separa a dichos eventos. Pero este diagrama espacio-tiempo describe la situación de un solo observador. El diagrama espacio-tiempo para un observador solitario no nos es de mucha utilidad en la resolución de problemas propios de la relatividad. Es necesario juntar de alguna manera los diagramas espacio-tiempo de dos observadores que están en movimiento relativo el uno con respecto al otro en uno solo. Lo que estamos buscando es algo que geométricamente nos permita visualizar en un mismo diagrama la situación de dos observadores. Esto se logra con un procedimiento que nos fue dado por el matemático Hermann Minkowski que será dado a continuación.
Prof. Armando Martínez
Página 83
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Procedimiento para construir un diagrama espacio-tiempo: 1) Supondremos que la velocidad de la luz tiene un valor de 𝑐 = 1 metro/segundo. Empezamos trazando dos coordenadas perpendiculares que representan el diagrama espacio-tiempo de un observador al cual llamaremos 𝑂 y que se considera a sí mismo en estado de reposo en su marco de referencia 𝑆, con la coordenada horizontal asignada a la representación de la posición de un objeto en el eje-x y con la coordenada vertical asignada a la representación del tiempo en el cual el objeto está en cierta posición. Diagrama 7-6
2) El diagrama espacio-tiempo más elemental que combina a dos observadores es el diagrama trivial en el cual ambos observadores está reposo el uno frente al otro en el mismo lugar (𝑥 = 𝑥’) y tienen sus relojes sincronizados al mismo tiempo (𝑡 = 𝑡’), lo que permite que los orígenes de ambos sistemas de referencia 𝑆 y 𝑆’ coincidan en un mismo punto. En forma similar a como sucede para el observador 𝑂, el eje 𝑐𝑡’ es el lugar de los puntos tales que los eventos que ocurren a lo largo de dicho eje ocurren en el mismo lugar 𝑥’ = 0 pero en tiempos distintos para un observador 𝑂. Diagrama 7-7
3) Para trazar un diagrama espacio-tiempo combinado juntando a dos observadores diferentes que están en movimiento relativo el uno con respecto al otro a una velocidad 𝑣, trazamos primero el eje 𝑡’ del marco de referencia 𝑆’ sobre el diagrama espaciotiempo del observador en reposo usando para ello la velocidad relativa entre ambos observadores. No es necesario que los orígenes de los diagramas espacio-tiempo del observador 𝑂 y del observador 𝑂’ coincidan, esto es mera cuestión de conveniencia. Construiremos un diagrama en el que ambos orígenes coinciden. Suponiendo que la velocidad relativa entre Diagrama 7-8 ambos marcos de referencia es de 𝑣 = 0.4𝑐 (𝑜. 4 𝑚/𝑠) entonces para moverse una distancia 𝑥 = 1 𝑚𝑒𝑡𝑟𝑜 el observador 𝑂’ debe de haberse movido en un tiempo 𝑡 = 𝑥/𝑣 = 2.5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 con respecto al origen, y para moverse una distancia 𝑥 = 2 𝑚𝑒𝑡𝑟𝑜𝑠 el observador 𝑂’ debe de haberse movido en un tiempo 𝑡 = 𝑥/𝑣 = 5 segundos. Todos estos puntos están conectados con una línea recta, la cual trazamos sobre el diagrama como se muestra arriba. Esta recta corresponde al tiempo 𝑡’ del marco de referencia 𝑆’. Obsérvese que entre menor sea la velocidad relativa 𝑣 más y más cercana estará la línea que hemos trazado a la vertical que corresponde a 𝑡, hasta que ambas llegan a coincidir cuando la Prof. Armando Martínez
Página 84
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
velocidad relativa entre los dos observadores es cero. Para mayor simplicidad, prescindiremos de las graduaciones que hemos puesto en las coordenadas de ambos ejes del observador 𝑂:
4) A continuación trazamos sobre el diagrama espaciotiempo la ruta que corresponde a la trayectoria de un rayo de luz con una velocidad 𝑐 = 1 𝑚/𝑠:
Diagrama 7-9
Diagrama 7-10
5) Ahora vamos a trazar la coordenada de 𝑥’ sobreponiéndola en el mismo diagrama. Para poder localizarla en dicho diagrama, considérese primero un rayo de luz lanzado en el marco de referencia del observador 𝑂’ en un tiempo (medido en metros) 𝑐𝑡’ = −𝑎 desde la coordenada 𝑥’ = 0, un evento al que llamaremos 𝐸, el cual es reflejado en sentido opuesto en un tiempo 𝑐𝑡 = 0 por un espejo en un evento al que llamaremos 𝑃, para regresar nuevamente a la coordenada 𝑥’ = 0 en un evento al que llamaremos 𝑅 ocurriendo en el tiempo 𝑐𝑡 ′ = +𝑎 (podemos imaginar lo que ocurre como una descripción geométrica en el espacio-tiempo del experimento llevado a cabo por el viajero en el ferrocarril al que vimos en el capítulo “La física es parada de cabeza” cuando nos encontramos por vez primera el efecto relativista de la Diagrama 7-11 dilatación del tiempo):Desde la perspectiva del observador estacionario 𝑂, la situación del rayo de luz que fue reflejado en el marco de referencia de 𝑂’ es la del diagrama 7-6: Tanto en el marco de referencia del observador 𝑂’ como en el marco de referencia del observador 𝑂 la luz sigue teniendo la misma velocidad, como lo enuncia el segundo postulado de la Teoría Especial de la Relatividad. Por lo Prof. Armando Martínez
Página 85
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
tanto, el rayo de luz que es lanzado en el marco de referencia de 𝑂’ también tendrá la misma pendiente de 45 grados en el marco de referencia de 𝑂. En el diagrama de arriba ubicamos arbitrariamente sobre el eje 𝑐𝑡’ el evento 𝐸 en el punto 𝑐𝑡’ = −𝑎, y trazamos desde dicho punto una trayectoria de 45 grados que corresponde al rayo de luz que es lanzado por el observador 𝑂’. Por otro lado, ubicamos sobre el eje 𝑡’ el evento 𝑅 en el punto 𝑐𝑡’ = +𝑎, y trazamos desde allí la trayectoria que representa el rayo de luz reflejado por el espejo desde el punto que debe representar al evento P, una línea recta también de 45 grados (en concordancia Diagrama 7-12 con el segundo postulado de la Teoría Especial de la Relatividad) pero yendo de derecha a izquierda, extendiendo dicha línea hasta que se cruce con la otra línea que habíamos trazado. Esto nos da unívocamente en el diagrama la localización del evento 𝑃. Por último, trazamos una línea punteada que conecta el origen común de ambos observadores hasta el punto que representa al evento 𝑃. Esta es la línea que corresponde a la coordenada de 𝑥’. No tardamos en descubrir que el ángulo que forma la coordenada 𝑥 con la coordenada 𝑥’ es el mismo ángulo que el que forma la coordenada 𝑐𝑡 con la coordenada 𝑐𝑡’. Con esto, hemos terminado esencialmente con la construcción del diagrama. Una cosa que resalta del diagrama espacio-tiempo final es el hecho de que los dos eventos identificados con cuadritos rojos y con los números 1 y 2 que son simultáneos para el observador 𝑂’ (ambos ocurren en su tiempo 𝑡’ = 0) no ocurren al mismo tiempo en el marco de referencia del observador 𝑂. Esta es nuestra perspectiva geométrica del verdadero origen de los fenómenos relativistas de dilatación del tiempo y contracción de longitud: la simultaneidad deja de ser absoluta. En el universo de los absolutos, en la física pre-relativista, si dos eventos ocurrían al mismo tiempo para un observador estacionario, también ocurrían al mismo tiempo para otro observador en movimiento, lo cual deja de ser válido en la Teoría Especial de la Relatividad. Una cosa que no hemos hecho y la cual dejaremos pendiente por el momento es graduar (marcar con divisiones igualmente espaciadas) las coordenadas (𝑥, 𝑡) del observador 𝑂 y las coordenadas (𝑥’, 𝑡’) del observador 𝑂’ de modo tal que podamos resolver gráficamente un problema relativista obteniendo aproximaciones numéricas al igual que como lo hacen los ingenieros que utilizan papel gráfico para la resolución aproximada de problemas de otra índole (el Smith Chart utilizado para la resolución de problemas eléctricos de líneas de transmisión, y el diagrama de humedad o carta psicométrica usada para la resolución de problemas de humedad relativa y punto de rocío). Esta graduación es conocida también como la calibración de los ejes, y se puede llevar a cabo mediante cálculos numéricos con las ecuaciones
Prof. Armando Martínez
Página 86
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
de transformación de Lorentz que veremos posteriormente o con el procedimiento geométrico de la hipérbola invariante. Así pues, nuestro principal medio de trabajo para el análisis geométrico de los problemas de la Teoría Especial de la Relatividad es el diagrama espacio-tiempo de Minkowski:
Diagrama 7-13
El diagrama 7-8 muestra el diagrama espacio-tiempo desde la perspectiva del observador 𝑂 en reposo. Si queremos, podemos dibujar también el diagrama espacio-tiempo (diagrama 7-9) desde la perspectiva del observador 𝑂’ cuando este se considera en reposo y cuando ve al observador 𝑂 en movimiento hacia la izquierda.
Diagrama 7-14
En esencia, lo que hemos hecho ha sido tomar el diagrama básico para un observador 𝑂 en reposo en un marco de referencia 𝑆, trazando sobre el mismo la línea que marca la trayectoria de un rayo de luz con una pendiente de 45º que corresponde a una velocidad 𝑐 de 1 𝑚/𝑠:
Prof. Armando Martínez
Página 87
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-15
Y sobre este diagrama, usando como referencia común la bisectriz que ambos diagramas deben tener identificando en el mismo la línea del mundo de un rayo de luz común a ambos observadores 𝑂 y 𝑂’ en los marcos de referencia 𝑆 y 𝑆’, hemos agregado al diagrama del observador estacionario 𝑂 el siguiente diagrama espaciotiempo de 𝑂’ (nos queda pendiente el asunto de cómo se lleva a cabo la graduación o calibración de los ejes 𝑥’ y 𝑡’):
Diagrama 7-16
Para así tener el siguiente diagrama espacio-tiempo combinando a ambos observadores desde la perspectiva del observador estacionario 𝑂:
Diagrama 7-17
Prof. Armando Martínez
Página 88
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
PROBLEMA: Representar en un diagrama espacio-tiempo cuatro eventos distintos cuyas coordenadas son las siguientes: 𝐸1 (𝑥1 , 𝑐𝑡1 ) = (1, 2) 𝐸2 (𝑥2 , 𝑐𝑡2 ) = (2, 5) 𝐸3 (𝑥1′ , 𝑐𝑡1′ ) = (4, 1) 𝐸4 (𝑥2′ , 𝑐𝑡2′ ) = (2, 2)
Los eventos 𝐸1 y 𝐸2 están especificados sobre las coordenadas del observador en reposo 𝑂 en su marco de referencia 𝑆, y en el diagrama espacio-tiempo combinado estarán ubicados en las siguientes posiciones (se han representado los dos eventos en el diagrama con unos cuadritos de color púrpura):
Diagrama 7-18
Los eventos 𝐸3 y 𝐸4 están especificados sobre las coordenadas del observador en movimiento O’ en su marco de referencia S’, y en el diagrama espacio-tiempo combinado estarán ubicados en las siguientes posiciones (se han representado los dos eventos en el diagrama con unos cuadritos de color verde):
Diagrama 7-19
Cuanta más alta sea la velocidad relativa 𝑣 entre dos marcos de referencia acercándose o alejándose a una velocidad cada vez más cercana a la velocidad de la luz, tanto más se irán cerrando los ejes que corresponden al marco de referencia en
Prof. Armando Martínez
Página 89
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
movimiento 𝑆’ como podemos apreciarlo en el siguiente diagrama espacio-tiempo:
Diagrama 7-20
En el diagrama espacio-tiempo de arriba, tenemos sobrepuestos a tres observadores, el observador que consideramos estacionario, el observador 𝑂’ que se está moviendo a una velocidad relativa 𝑣 con respecto al observador 𝑂, y un tercer observador 𝑂’’ que se está moviendo a una velocidad todavía mayor con respecto al observador 𝑂. Nótese cómo se van cerrando cada vez más y más los ejes coordenados 𝑥 y 𝑡 de un observador móvil conforme va aumentando su velocidad 𝑣 con respecto al observador estacionario. Cuando se prescinde de un diagrama espacio-tiempo como el caso en el que se vaya a efectuar un cálculo numérico, para la especificación completa de un mismo evento 𝐸 cualquiera se deben especificar cuatro coordenadas, las coordenadas (𝑥, 𝑡) del evento en el marco de referencia 𝑆, y las coordenadas (𝑥’, 𝑡’) del evento en el marco de referencia 𝑆’, de modo tal que un evento quedará registrado como 𝐸(𝑥, 𝑡, 𝑥’, 𝑡’) en forma completa. Esto es válido para cualquier evento. El único evento que tendrá las mismas coordenadas tanto para 𝑆 como para 𝑆 será el que ocurra en el punto común de origen, o sea 𝐸(𝑥, 𝑡, 𝑥’, 𝑡’) = (0,0,0,0). En todos los demás casos las coordenadas diferirán. Sin embargo, al hablar de un evento se está hablando de un mismo y único evento visible para todos los observadores. Cuando un carro choca contra otro, ya sea visto por un observador estacionario o por un observador móvil, no existen dos marcos de referencia distintos en los cuales uno de los carros choque y el otro no. Distintos observadores siempre se podrán poner de acuerdo en un evento específico, cada uno asignándole sus propias coordenadas. En lo que no se podrán poner de acuerdo es en la duración del lapso de tiempo entre dos eventos distintos 𝐸1 y 𝐸2 y en la distancia espacial que separe a dos eventos distintos. Un observador dirá que el lapso de tiempo entre dos eventos 𝐸1 y 𝐸2 fue 𝛥𝑡 mientras que el otro dirá que fue 𝛥𝑡’. Un observador dirá que la distancia espacial entre dos eventos fue 𝛥𝑥 mientras que el otro dirá que fue 𝛥𝑥’, y en los diagramas de arriba podemos ver por qué no podrán ponerse de acuerdo jamás, a menos de que tomen en cuenta las correcciones relativistas. Dado un evento 𝐸 cualquiera situado en un diagrama espacio-tiempo que involucre a dos observadores en movimiento relativo el uno con respecto al otro, se pueden obtener las coordenadas del mismo tanto en un marco de referencia como en el otro trazando desde el evento líneas paralelas a cada uno de los ejes
Prof. Armando Martínez
Página 90
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
coordenados respectivos de cada observador, como lo muestra el siguiente diagrama:
Diagrama 7-21
En el diagrama espacio-tiempo de arriba tenemos un evento 𝐴. Trazando una línea horizontal hacia la izquierda hasta llegar al eje vertical 𝑐𝑡 podemos obtener el valor de 𝑐𝑡 con lo cual podemos obtener el tiempo, y trazando una línea vertical hacia abajo podemos obtener la coordenada de la distancia 𝑥. Del mismo evento 𝐴 podemos hacia la línea 𝑐𝑡’ una línea paralela a la coordenada 𝑥’ con lo cual obtenemos el valor de 𝑐𝑡’, y podemos trazar hacia abajo otra línea paralela a 𝑐𝑡 con lo cual obtenemos el valor de 𝑥’. PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista de la dilatación del tiempo.
El análisis se llevará a cabo considerando a nuestro proverbial viajero dentro de un vagón de ferrocarril que arroja un rayo de luz hacia arriba desde una linterna, el cual es reflejado por un espejo regresando al punto de partida. Mientras un observador sentado a un lado de las vías del ferrocarril observa al rayo de luz recorrer una trayectoria mayor. En la construcción de cualquier diagrama espacio-tiempo se vuelve necesario identificar claramente los eventos que ocurren. En este caso, nos basta con identificar sobre el diagrama espacio-tiempo dos eventos: el primer evento que llamaremos 𝐸1 ocurre cuando el rayo de luz sale de la linterna, y el segundo evento que llamaremos 𝐸2 ocurre cuando el rayo de luz regresa reflejado por el espejo al punto desde donde fue lanzado. Ambos eventos ocurren en el mismo lugar para el observador viajero 𝑂’, al cual le asignaremos la coordenada 𝑥’ = 0, pero en tiempos diferentes 𝑡1′ y 𝑡2′ . Una vez localizados ambos eventos en el sistema de referencia 𝑆’ del observador 𝑂’, nos basta con trazar dos líneas horizontales desde las coordenadas (𝑥’, 𝑡1′ ) y (𝑥’, 𝑡2′ ) Diagrama 7-22 hacia el eje de tiempos del observador 𝑂 para obtener las Prof. Armando Martínez
Página 91
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
coordenadas correspondientes en el marco de referencia de 𝑂 de los dos eventos. Darse cuenta de que efectivamente hay una dilatación del tiempo, requiere que pongamos sobre los ejes del diagrama espacio-tiempo divisiones graduadas en los ejes de los tiempos, o sea que llevemos a cabo la calibración de los ejes, lo cual se verá en una entrada posterior. Obsérvese que a diferencia de como sucede con el observador O’, los eventos E1 y E2 no sólo ocurren en tiempos diferentes t1 y t 2 sino que también ocurren en lugares diferentes x1 y x2 . PROBLEMA: Ilustrar mediante un diagrama espacio-tiempo el fenómeno de la contracción de longitud sobre una vara de medición, suponiendo que: a) El observador en reposo 𝑂 es el que tiene la vara de medir y el observador 𝑂’ es el que la ve pasar frente a él. b) El observador en movimiento 𝑂’ es el que lleva consigo la vara de medir y el observador en reposo 𝑂 es el que la ve pasar frente a él.
En caso (a), si el observador en reposo es el que tiene una vara de medir de longitud 𝐿0 , las líneas del mundo de los dos extremos de la vara de medir se mantendrán como dos líneas verticales paralelas proyectadas hacia arriba como lo muestra el siguiente diagrama espacio-tiempo:
Diagrama 7-23
En este caso, el observador estacionario 𝑂 mide para la vara en el instante t = 0 de su tiempo propio una longitud L0 . Pero el observador móvil 𝑂’ mide la coordenada de cada extremo de la vara en tiempos diferentes y concluye que hubo una contracción en la longitud de la vara. b) En el segundo caso, si el observador en movimiento 𝑂’ es el que lleva consigo la vara de medir de longitud 𝐿0 , las líneas del mundo de los dos extremos de su vara de medir se mantendrán como dos líneas paralelas las cuales a su vez serán paralelas a su eje vertical 𝑐𝑡’ como lo muestra el siguiente diagrama espacio-tiempo:
Prof. Armando Martínez
Página 92
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-24
En este caso, el observador 𝑂’ mide para su vara en el instante 𝑡’ = 0 de su tiempo propio una longitud L0 . Pero el observador 𝑂 mide la coordenada de cada extremo de la vara en tiempos diferentes y concluye por su parte que hubo una contracción en la longitud de la vara. Hemos visto una forma convencional del diagrama espacio-tiempo de Minkowski, pero no es la única manera de construir un diagrama espacio-tiempo. Otra forma de lograrlo es recurriendo a un truco. El truco consiste en que sobre un mismo diagrama, usando el mismo origen para dos observadores distintos que se están moviendo a una velocidad relativa 𝑣 el uno con respecto al otro, se tracen dos ejes de espacios correspondiendo a los espacios propios medidos por cada observador, y además se tracen dos ejes de tiempos correspondiendo a los tiempos propios medidos por cada observador, de modo tal que el eje de tiempos de un observador sea perpendicular al eje de espacios del otro observador y que el eje de espacios de dicho observador sea perpendicular al eje de tiempos del otro observador. Esto es lo que nos produce esencialmente lo que se llama un diagrama espacio-tiempo de Loedel, así llamado en referencia a su creador, el físico latinoamericano Enrique Loedel Palumbo:
Diagrama 7-25
Prof. Armando Martínez
Página 93
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
El diagrama de Loedel es una modificación con fines didácticos del diagrama espacio-tiempo que fue concebido por Hermann Minkowski. Ahora veremos con mayor detalle el asunto de la simultaneidad, visto desde la óptica de la Teoría Especial de la Relatividad. El primer contacto que tienen muchos estudiantes con la explicación de la pérdida de la simultaneidad absoluta se basa en un ejemplo como el siguiente en el cual tenemos a nuestro proverbial pasajero de ferrocarril colocado justo a la mitad de los dos extremos del convoy de vagones. En el marco de referencia 𝑆 del observador situado a un lado de las vías del ferrocarril justo a la mitad de dos torres de luz se activan en forma sincronizada (al mismo tiempo) dos pulsos luminosos emanados de las dos torres de luz usando relojes sincronizados en el marco de referencia de S para lanzar los pulsos luminosos, de tal forma que el estallido de uno de los pulsos luminosos coincidirá justo con el extremo delantero del ferrocarril y el estallido del otro pulso luminoso coincidirá justo con el extremo trasero del ferrocarril:
Diagrama 7-26
El observador estático situado a un lado de las vías del ferrocarril en el marco de referencia 𝑆 recibe los dos pulsos luminosos al mismo tiempo, y por lo tanto concluye que ambos eventos fueron simultáneos dentro de su marco de referencia. Por su parte, en virtud de que la luz tiene una velocidad finita y en virtud de que el pasajero del ferrocarril está en movimiento rápido, uno de los pulsos luminosos le llega primero que el otro, y el pasajero concluye que los destellos no ocurrieron al mismo tiempo, que no fueron simultáneos, dada la diferencia de tiempos en que tardan en llegarle los dos rayos de luz a su plataforma móvil, y por lo tanto para él los eventos no son simultáneos en su marco de referencia 𝑆’. La anterior es una explicación simplista y en cierta forma errónea porque no toma en cuenta para nada los efectos relativistas de la dilatación del tiempo y la contracción de longitud. La pérdida en la simultaneidad se debe, según la explicación anterior, a la velocidad finita de la luz. Si no hubiese dilatación del tiempo ni contracción de longitud, si no hubiese relatividad, si existiesen el tiempo absoluto y el espacio absoluto, la pérdida en la simultaneidad sería meramente una Prof. Armando Martínez
Página 94
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
ilusión, una pérdida de simultaneidad aparente. La situación actual es más complicada que la descrita en el ejemplo anterior precisamente porque hay efectos relativistas de dilatación del tiempo y contracción de longitud. Efectivamente, hay una diferencia de tiempos en la llegada de los dos pulsos luminosos al viajero en el ferrocarril, pero también hay una pérdida de simultaneidad real que no es ocasionada por la velocidad finita de la luz sino por efectos de índole relativista. Y es en este caso en donde los diagramas espacio-tiempo de Minkowski resultan de una ayuda invaluable para entender lo que está sucediendo, permitiéndonos ir más allá de la anterior explicación simplista. Para entender lo que está sucediendo, es necesario identificar a los dos eventos que ocurren simultáneamente en el marco de referencia 𝑆 como 𝐸1 y 𝐸2 y ver las coordenadas (𝑥’, 𝑡’) de cada uno de dichos eventos en el marco de referencia 𝑆’. Si dos eventos ocurren al mismo tiempo en el mismo lugar se puede afirmar sin lugar a dudas que ambos eventos son simultáneos. Cuando dos aviones chocan en el aire, no existe marco alguno de referencia en el cual la colisión de ambos aviones no sea simultánea. Pero entre mayor sea la distancia entre dos eventos que ocurren en distintos lugares tanto mayor será la dificultad para los observadores en decidir por cuenta propia el asunto de la simultaneidad. Considérese el siguiente diagrama espacio-tiempo de Minkowski que ilustra la situación de eventos que son simultáneos en un marco de referencia 𝑆 del observador 𝑂 y que no son simultáneos en un marco de referencia 𝑆’ del observador 𝑂’, así como eventos que son simultáneos en un marco de referencia 𝑆’ pero que no son simultáneos en el marco de referencia 𝑆:
Diagrama 7-27
En este diagrama, los eventos A y B ocurren simultáneamente a un mismo tiempo en el marco de referencia S en dos lugares distintos que podemos identificar como x1 y x2 . Pero resulta claro que, relativísticamente hablando, los mismos eventos A y B ocurren en tiempos diferentes en el marco de referencia de S’, los cuales podemos ubicar en los tiempos t1′ y t ′2 . Los dos eventos 𝐴 y 𝐵 ocurren en tiempos diferentes en lugares diferentes para un observador situado en 𝑆’. Aquí lo que es simultáneo para 𝑆 no es simultáneo para 𝑆’. Por otro lado, los eventos 𝐶 y 𝐷 ocurren simultáneamente a un mismo tiempo en el marco de referencia 𝑆’ en dos lugares Prof. Armando Martínez
Página 95
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
distintos que podemos identificar como 𝑥3′ y 𝑥4′ Pero resulta claro que, relativísticamente hablando, los mismos eventos C y D ocurren en tiempos diferentes en el marco de referencia de S, los cuales podemos ubicar en los tiempos 𝑡3 y 𝑡4 . Los dos eventos 𝐶 y 𝐷 ocurren en tiempos diferentes en lugares diferentes para un observador situado en 𝑆. Aquí lo que es simultáneo para 𝑆’ no es simultáneo para 𝑆. Y en cuanto a los eventos 𝐸 y 𝐹, tales eventos no son simultáneos ni para 𝑆 ni para 𝑆’. Todo esto lo podemos ver claramente tal como es en los diagramas espacio-tiempo de Minkowski. Desafortunadamente, aunque estos gráficos son de gran ayuda, no se prestan para cálculos numéricos de precisión, para lo cual tendremos que recurrir a una herramienta algebraica conocida como las ecuaciones de transformación de Lorentz. A continuación tenemos otro diagrama espacio-tiempo que nos ilustrará la falta de simultaneidad dentro de la Teoría Especial de la Relatividad:
Diagrama 7-28
En este diagrama espacio-tiempo, para el observador en el marco de referencia 𝑆 cuyas coordenadas son (𝑥, 𝑐𝑡), dos eventos son simultáneos cuando de acuerdo con su reloj ocurren al mismo tiempo 𝑡 = 𝑡0 en dos lugares diferentes que podemos identificar simplemente como 𝑥1 y 𝑥2 , marcados por los puntos obscuros que están puestos sobre la línea horizontal que corresponde a un tiempo 𝑡 = 𝑡0 . Sin embargo, para el otro observador cuyas coordenadas son (𝑥’, 𝑐𝑡’), los dos eventos no ocurren simultáneamente, ocurre primero uno y después ocurre el otro. En su reloj un evento ocurre primero en el tiempo 𝑡1′ y el otro evento ocurre después en el tiempo 𝑡2′ . Esta anomalía relativista en la simultaneidad es precisamente la que ocasiona los efectos físicos de la dilatación del tiempo y la contracción de longitud. Todas las dificultades para comprender las aparentes paradojas que están detrás de la Teoría Especial de la Relatividad surgen de nuestra renuencia a rechazar de manera definitiva el falso concepto de la simultaneidad absoluta. Si hubiera simultaneidad absoluta, no habría dilatación relativista del tiempo ni contracción de longitud, aunque ello requeriría necesariamente la aceptación del movimiento absoluto, lo cual a estas alturas ya hemos descartado por completo. Prof. Armando Martínez
Página 96
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista de la contracción de longitud.
Si en lugar de un diagrama espacio-tiempo trazado sobre una hoja hacemos un esfuerzo extra por representar dos coordenadas de la posición (𝑥, 𝑦) y la coordenada del tiempo (𝑐𝑡) apuntando esta última hacia arriba, podemos dibujar algo que se conoce como superficies de simultaneidad tanto para el observador 𝑂 en reposo en el marco de referencia 𝑆 como el observador en movimiento 𝑂’ en el marco de referencia 𝑆’:
Diagrama 7-29
En el diagrama de la izquierda, tenemos dos eventos representados con puntitos rojos que ocurren al mismo tiempo, simultáneamente, en el marco de referencia 𝑆 del observador 𝑂. Y tenemos otros dos eventos representados con puntitos amarillos que ocurren en tiempos diferentes en el marco de referencia 𝑆’ del observador 𝑂’. Pero en el diagrama de la izquierda, los dos eventos representados con puntitos amarillos sí ocurren al mismo tiempo, simultáneamente, en el marco de referencia 𝑆’ del observador 𝑂’, aunque los eventos representados con puntitos rojos y que eran simultáneos en el marco de referencia 𝑆 del observador 𝑂 han dejado de ser simultáneos para el observador 𝑂’. La limitante de que ningún objeto puede viajar a una velocidad mayor que la velocidad de la luz se refleja no tan sólo en un cuadrante del diagrama espaciotiempo, se refleja en los cuatro cuadrantes, y el “origen” del observador puede no necesariamente coincidir con el origen del diagrama espacio-tiempo que está situado en 𝑥 = 0 y 𝑐𝑡 = 0, en virtud de que la fijación de las coordenadas es una mera cuestión de conveniencia: En el diagrama 7-25, tenemos a un cuerpo que al moverse del punto 𝐴 al punto 𝐵 se ha movido en línea recta de 𝑥1 = 0.5 metros y 𝑥2 = 0.75 metros a partir de un tiempo 𝑡1 = 0.5 segundos a un tiempo 𝑡1 = 1.75 segundos, siendo por lo tanto su velocidad igual a 𝑣 = 0.2 𝑐. Puesto que el avance natural del tiempo es siempre hacia arriba, el cuerpo sólo puede desplazarse también junto con el tiempo de abajo hacia arriba, en cualquier trayectoria rectilínea cuya pendiente no exceda la velocidad de la luz, lo cual está marcado por el área punteada. Del punto 𝐵 hay un conjunto de puntos que marcan el futuro de la posición del cuerpo en el diagrama espaciotiempo, y hay también un conjunto de puntos que marcan el pasado de la posición del cuerpo en el diagrama espacio-tiempo. Prof. Armando Martínez
Página 97
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-30
No es necesario limitarnos a un diagrama espacio-tiempo de tan sólo dos dimensiones. Podemos agregar una dimensión adicional, como correspondería a la coordenada 𝑦 en un plano Cartesiano 𝑥, 𝑦, para tener lo que parece ser un cono dentro del cual están circunscritas las trayectorias posibles de un objeto, llamado cono de luz:
Diagrama 7-31
De este modo, podemos tener las siguientes dos trayectorias rectilíneas posibles en el siguiente diagrama espacio-tiempo tridimensional:
Prof. Armando Martínez
Página 98
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-32
Antes del advenimiento de la Teoría Especial de la Relatividad, podíamos hablar acerca de un “ahora” universal, podíamos hablar acerca de un “pasado” común universal y acerca de un “futuro” común universal, comunes a todos los que habitamos en este Universo, puesto que el tiempo absoluto marchaba al unísono por igual en todo el Universo, sin retrasarse ni adelantarse en ninguno de sus confines. Pero a partir del advenimiento de la Teoría Especial de la Relatividad, para cada observador hay un “pasado”, un “presente” y un “futuro”, delimitados por el cono de luz. En este último diagrama, la línea del mundo (de color verde) corresponde a un observador que está en reposo. El punto en el que se tocan los dos conos de luz que corresponden al “pasado” y al “futuro” del observador viene siendo el “ahora” del observador. Puesto que ningún objeto puede Diagrama 7-34 moverse a una velocidad mayor que la velocidad de la luz, la única forma de poder llegar al “ahora” desde el pasado (suponiendo una línea del mundo con un movimiento rectilíneo) es haciéndolo dentro del cono de luz inferior. Y la única forma de poder llegar a cierto punto del diagrama espacio-tiempo en el “futuro” es estando dentro del cono de luz superior. Las regiones de espacio-tiempo de color gris en el diagrama de arriba son, por lo tanto, regiones de espacio-tiempo a las que el observador no tiene acceso. Esto fija de manera unívoca todas las relaciones que pueda haber de causa-efecto entre dos observadores. Los únicos eventos que pueden cambiar el estado de un observador o de un objeto en su posición actual en el Diagrama 7-33 espacio-tiempo deben estar situados en o dentro del cono de luz que corresponde a su “pasado”. Y los únicos eventos que pueden ser influenciados por eventos en los que participe un observador o un objeto deben estar situados dentro del cono de luz que corresponde a su “futuro”. De este modo, en el siguiente diagrama espacio-tiempo:
Prof. Armando Martínez
Página 99
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
Diagrama 7-35
El evento que tuvo lugar en el punto 𝐶 pudo muy bien haber cambiado lo que está sucediendo en el “ahora” del observador que se encuentra en el punto 𝐴, y el observador 𝐴 puede hacer algo para intervenir sobre lo que sucede en el evento que tiene lugar en el punto 𝐵. Pero no puede hacer nada para modificar lo que ocurra en los eventos 𝐸 y 𝐷 porque están fuera de su alcance al no poder establecer una comunicación con ellos debido a la limitante absoluta de la velocidad de la luz. Los puntos 𝐸 y 𝐷 están en regiones prohibidas. Cabe aclarar que la línea en el diagrama que corresponde a la coordenada 𝑥 no está inclinada como parece estarlo; es una línea perfectamente horizontal como puede comprobarlo el lector en el monitor de su computadora con la ayuda de una hoja de papel. Se trata de una ilusión óptica, como lo es la ilusión del concepto de la simultaneidad absoluta que tanto trabajo les cuesta a muchos estudiantes sepultar. ¿Entonces ya no podemos hablar de un pasado común y un futuro común a todos los habitantes del Universo como se acostumbraba hacerlo antes? Sí, pero desde la perspectiva relativista. En el siguiente diagrama espacio-tiempo tenemos los conos de luz que corresponden no a uno sino a dos eventos 𝐴 y 𝐵:
Diagrama 7-36
En este diagrama, el “ahora” del evento 𝐴 no puede tener efecto alguno sobre el “ahora” del evento 𝐵 porque ello requeriría atravesar la zona gris que le está vedada a ambos eventos. Para poder tener efecto alguno sobre el “ahora” de 𝐵, el “ahora” del Prof. Armando Martínez
Página 100
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
evento 𝐴 debería ser capaz de poder transmitir información al “ahora” del evento 𝐵 a una velocidad mayor que la velocidad de la luz, lo cual es imposible. Sin embargo, ambos conos de luz tienen dos zonas en común, las zonas en las cuales se solapan los dos conos de luz. La zona común en la cual se solapan los pasados de ambos, de color rosa, es la zona en la cual ambos eventos pueden intercambiar información que sea capaz de cambiar el “ahora” de cada uno de ellos, es la zona denominada pasado común. Y la zona común en la cual se solapan los futuros de ambos, de color azul cielo, es la zona en la cual ambos eventos podrán intercambiar información en su futuro (a menos de que ocurra un cambio en la línea del mundo de uno de ellos o de ambos), es la zona denominada futuro común. De cualquier manera, y hablando del Universo como un todo, sí podemos hablar de un “ahora” universal que sin embargo no es un “ahora” absoluto, porque en la infinitud de las regiones locales de las que está hecho el universo habrá variaciones en la marcha del tiempo como las que predice la Teoría de la Relatividad. En los diagramas espacio-tiempo que hemos visto, sólo hemos considerado objetos que mantienen una trayectoria rectilínea a velocidad constante sobre la cual se pueden aplicar los principios propios de la Teoría Especial de la Relatividad. Pero también podemos trazar en un diagrama espacio-tiempo la trayectoria de un objeto que no mantiene una trayectoria rectilínea, que está cambiando constantemente de dirección. Un diagrama tal tendría un aspecto como el siguiente:
Diagrama 7-37
En esta trayectoria tenemos a un viajero que se ha trasladado del punto 𝑃 al punto 𝑄 en un lapso de tiempo 𝛥𝑡 medido en el reloj con el que va viajando el viajero. Este es precisamente el tipo de movimientos que deben caer bajo el ámbito de una teoría extendida para analizar movimientos no-rectilíneos o acelerados, una Teoría General de la Relatividad. La trayectoria de un cuerpo que no avanza en línea recta dentro del cono de luz debe ser tal que la velocidad de la luz nunca debe ser excedida, o sea que la tangente de la curva nunca debe apartarse más de 45 grados
Prof. Armando Martínez
Página 101
Fundamentos de Relatividad General
Los diagramas espacio-tiempo de Minkowski
del eje vertical que representa a la coordenada del tiempo. A continuación tenemos un ejemplo de un recorrido válido y un recorrido inválido:
Diagrama 7-38
Obsérvese en el diagrama anterior izquierdo cómo el cono de luz es algo que viaja junto con el observador móvil, el cual puede definir en cualquier momento cuál será el instante en que su reloj sea ajustado para marcar el “pasado”, el “futuro” y el “presente” (el instante a partir del cual se empieza a tomar el tiempo para llevar las cuentas de una sucesión de eventos). Partiendo de sus dos postulados, Einstein dedujo correctamente las nuevas leyes para las transformaciones llevadas a cabo entre dos marcos de referencia distintos, formalizadas algebraicamente con las ecuaciones de transformación de Lorentz, pero fue Herman Minkowski el que demostró que si dejábamos de ver a las tres dimensiones del espacio y a la dimensión del tiempo como entidades separadas y las uníamos geométricamente en un espacio-tiempo de cuatro dimensiones, entonces las transformaciones relativistas podían ser vistas como correspondiendo a rotaciones llevadas a cabo en este espacio-tiempo cuatridimensional, lo cual fue una enorme simplificación creando una nueva perspectiva acerca del espacio y del tiempo. Al principio Einstein no dio mucha importancia a la interpretación geométrica de Minkowski, tomándola meramente como una formalidad matemática sin significado físico real, pero eventualmente cambió su actitud adoptando el punto de vista cuatridimensional geométrico que después emplearía para la postulación de la Teoría General de la Relatividad.
Prof. Armando Martínez
Página 102
Fundamentos de Relatividad General
Prof. Armando Martínez
Los diagramas espacio-tiempo de Minkowski
Página 103
Fundamentos de Relatividad General
Las transformaciones de Lorentz
Las transformaciones de Lorentz Conforme nos vamos familiarizando más y más con las consecuencias de los postulados de Einstein, se vuelve deseable obtener fórmulas de carácter general que nos permitan obtener toda la información que describa los eventos analizados por dos observadores en movimiento relativo el uno con respecto al otro, dos observadores situados en dos marcos de referencia distintos S y S' (se acostumbra denotar al observador en reposo como un observador colocado en el marco de referencia S mientras que el observador móvil desplazándose a una velocidad 𝑣 está puesto en el marco de referencia designado como S’):
Diagrama 8-1
Tales ecuaciones de transformación de carácter general de un marco de referencia a otro fueron enunciadas por vez primera no por Einstein, sino por el físico Lorentz, razón por la cual reciben el nombre de ecuaciones de transformación de Lorentz. Para la derivación de las ecuaciones de transformación, en ambos marcos de referencia se centrará la atención sobre un evento común descrito por ambas personas, el cual tendrá coordenadas (𝑥, 𝑦, 𝑧, 𝑡) en el marco de referencia S y coordenadas (𝑥’, 𝑦’, 𝑧’, 𝑡’) en el marco de referencia S’:
Prof. Armando Martínez
Página 104
Fundamentos de Relatividad General
Las transformaciones de Lorentz
Diagrama 8-2
Por simplicidad en la derivación de las ecuaciones de transformación, ambos marcos de referencia son seleccionados de modo tal que sus orígenes (el punto 𝑂 en el marco de referencia de 𝑆 y el punto 𝑂’ en el marco de referencia de 𝑆’) coincidan en los tiempos 𝑡 = 0 𝑦 𝑡’ = 0. Supóngase que cuando los orígenes de ambos marcos de referencia coinciden se dispara un pulso de luz en el origen común de ambos. Por el segundo postulado de la Teoría Especial de la Relatividad, este pulso de luz se propagará con la misma velocidad tanto dentro del marco de referencia S como dentro del marco de referencia S’. Este es precisamente el punto clave para poder obtener la transformación de un marco de referencia a otro, el hecho de que la velocidad de la luz c que debe ser la misma en ambos marcos de referencia, tanto para el marco de referencia S: 𝑐 =
𝑥 𝑡
𝑥 = 𝑐𝑡 Como para el marco de referencia 𝑆’: 𝑥′ 𝑐 = ′ 𝑡 𝑥’ = 𝑐𝑡′ ¿Cuál es el tipo de transformación que estamos buscando? Si recordamos la derivación de los resultados preliminares sobre los fenómenos de la dilatación del tiempo y la contracción de longitud, resulta claro que las transformaciones que estamos buscando deben ser transformaciones lineales. Suponiendo fija la velocidad 𝑣 a la cual se desplaza el marco de referencia 𝑆’, por la dilatación del tiempo medido en 𝑆’ cuanto se mide en 𝑆 requiere de la aplicación de un factor de corrección constante (esto es, si la velocidad 𝑣 es tal, que cuando un lapso de tiempo medido en 𝑆’ es de 10 segundos equivale a un lapso de tiempo medido en 𝑆 de 15 segundos, con lo cual al mantenerse constante el factor de corrección entonces un lapso de tiempo de 20 segundos medido en 𝑆’ equivaldrá a un lapso de tiempo de 30 segundos medido en 𝑆, del mismo modo que un lapso de Prof. Armando Martínez
Página 105
Fundamentos de Relatividad General
Las transformaciones de Lorentz
tiempo de 30 segundos medido en 𝑆’ equivaldrá a un lapso de tiempo de 45 segundos medido en 𝑆) el factor de corrección debe ser una simple constante multiplicativa cuyo valor depende únicamente de la velocidad relativa 𝑣 entre ambos marcos de referencia, la cual suponemos constante. Si el factor de corrección no fuera constante, si la dilatación del tiempo de un marco de referencia a otro no aumentara en forma directamente proporcional entre ellos, entonces la transformación que requeriríamos sería una transformación de carácter no-lineal. Esto en lo que concierne a la dilatación del tiempo. Y en lo que concierne a la contracción de longitud, también allí al descubrir el fenómeno de la contracción de longitud, encontramos que el factor de corrección requerido era una constante multiplicativa. En ambos casos, necesitamos de transformaciones lineales. Si las transformaciones no fuesen lineales, una longitud 𝑥2 − 𝑥1 medida en el marco de referencia 𝑆 dependería de la selección del origen del marco de referencia, y un intervalo de tiempo 𝑡2 − 𝑡1 dependería de cuándo el tiempo fue seleccionado para tener un valor de cero; en cierta forma la no-linealidad nos llevaría de regreso hacia los conceptos del tiempo absoluto y la distancia absoluta. Por otro lado, puesto que el movimiento relativo entre ambos marcos de referencia 𝑆 y 𝑆’ ocurre únicamente en la dirección de los ejes 𝑥 y 𝑥′, las coordenadas 𝑦 y 𝑧 deben permanecer iguales, o sea 𝑦 = 𝑦’ y 𝑧 = 𝑧’. Cuando ocurre el evento en el cual el pulso luminoso (disparado cuando los orígenes 𝑂 y 𝑂’ de ambos marcos de referencia coincidían) llega al punto 𝑃, de acuerdo con la perspectiva del observador en 𝑆 el marco de referencia móvil 𝑆’ se ha desplazado hacia la derecha una distancia de 𝑣𝑡 en un tiempo 𝑡 medido por el observador en 𝑆. Pero también desde la perspectiva del observador en 𝑆, una vara de medir llevada consigo por 𝑆’ a lo largo del eje 𝑥′ se ha contraído por un factor de corrección constante que llamaremos 𝑎. Para el observador fijo, por lo tanto, la relación entre su marco de referencia y el marco de referencia móvil debe ser: 𝑥 = 𝑎𝑥’ + 𝑏𝑡’ Y factorizando, sería igual a: 𝑏 𝑥 = 𝑎 (𝑥 ′ + ) 𝑡’ 𝑎 En donde a y b son simples constantes multiplicativas (factores lineales que son independientes de 𝑥’ y 𝑡’). Así como los fenómenos de la relatividad se vuelven cada vez más evidentes a velocidades cercanas a la velocidad de la luz, algo que también debe ser cierto es que a bajas velocidades las ecuaciones de transformación que hemos escrito arriba se deben reducir a los resultados clásicos que ya conocemos, las transformaciones de Galileo basadas en la noción del tiempo absoluto y el espacio absoluto: 𝑥 = 𝑥′ − 𝑣𝑡
Prof. Armando Martínez
Página 106
Fundamentos de Relatividad General
Las transformaciones de Lorentz
En otras palabras, para valores bajos de 𝑣, 𝑎 debe acercarse a 1 y 𝑏/𝑎 debe acercarse a 𝑣, la transformación relativista se debe reducir a la transformación clásica para bajas velocidades de 𝑣. Esto nos permite escribir la transformación relativista como: 𝑥 = 𝑎(𝑥’ + 𝑣𝑡’) La transformación inversa debe tener la misma forma, excepto por el cambio de signo involucrado por el hecho de que el marco de referencia 𝑆 se está desplazando hacia la izquierda mientras que el marco de referencia 𝑆’ permanece estático. 𝑥’ = 𝑎(𝑥 − 𝑣𝑡) Pero ya se había señalado que, por el segundo postulado de la Teoría de la Relatividad: 𝑥 = 𝑐𝑡 𝑥’ = 𝑐𝑡’ Sustituyendo estas dos relaciones tanto en la transformación de 𝑆’ a 𝑆 como en la transformación inversa de 𝑆 a 𝑆’, obtenemos lo siguiente: 𝑐𝑡 = 𝑎 ( 𝑐𝑡’ + 𝑣𝑡’ ) 𝑐𝑡 = 𝑎 (𝑐 + 𝑣) 𝑡’
𝑐𝑡’ = 𝑎 (𝑐𝑡 − 𝑣𝑡) y
𝑐𝑡’ = 𝑎 (𝑐 − 𝑣) 𝑡
Eliminando 𝑡 de ambas ecuaciones obtenemos lo siguiente: 𝑎 (𝑐 + 𝑣)𝑡’ 𝑐𝑡’ = 𝑎 (𝑐 − 𝑣) ∙ ( ) 𝑐 𝑐 2 𝑡′ = (𝑎 (𝑐 − 𝑣) ∙ 𝑎(𝑐 + 𝑣))𝑡′ 𝑐 2 𝑡 ′ = 𝑎2 ((𝑐 − 𝑣)(𝑐 + 𝑣))𝑡′ 𝑐² 𝑡’ = 𝑎² (𝑐² − 𝑣² ) 𝑡’ 𝑐 2 = 𝑎2 (𝑐 2 − 𝑣 2 ) De lo cual obtenemos lo siguiente:
Prof. Armando Martínez
Página 107
Fundamentos de Relatividad General
Las transformaciones de Lorentz
𝑎2 =
𝑐2 𝑐2 − 𝑣2 1
𝑎2 =
1 − 𝑎 =
𝑣2 𝑐2
1 2
√1 − 𝑣2 𝑐
Este resultado nos debería de ser ya familiar, 𝑎 es el mismo factor de corrección γ que habíamos obtenido anteriormente. En pocas palabras 𝑎 = 𝛾. Con esto: 𝑥 = 𝛾(𝑥’ + 𝑣𝑡’) Podemos obtener la ecuación de transformación para el tiempo de la ecuación 𝑥’ = 𝑎(𝑥 − 𝑣𝑡) Usando 𝑥 = 𝑎(𝑥’ + 𝑣𝑡’) 𝑝𝑜𝑟 𝑠𝑢𝑠𝑡𝑖𝑡𝑢𝑐𝑖ó𝑛 Para t: 𝑥’ = 𝑎 [ 𝑎 (𝑥’ + 𝑣𝑡’) − 𝑣𝑡] De lo cual: 1 𝑥′ 𝑡 = 𝑎𝑡’ + (𝑎 − ) ( ) 𝑎 𝑣 𝑡 = 𝑎 (𝑡’ +
𝑣𝑥’ ) 𝑐2
Resumiendo, y empleando el símbolo γ en lugar de 𝑎, para cambiar del marco de referencia 𝑆’ que se está moviendo de izquierda a derecha a una velocidad 𝑣 al marco de referencia 𝑆 del observador estacionario, las ecuaciones de transformación de Lorentz son: 𝑥 = 𝛾(𝑥′ + 𝑣𝑡′) Prof. Armando Martínez
Página 108
Fundamentos de Relatividad General
Las transformaciones de Lorentz
_𝑦 = 𝑦′ _𝑧 = 𝑧′ _𝑡 = 𝛾(𝑡′ + 𝑣𝑥′/𝑐²)
Podemos obtener la transformación inversa para cambiar del marco de referencia 𝑆 al marco de referencia 𝑆’ directamente de las anteriores ecuaciones. De la primera ecuación y de la cuarta ecuación, podemos reescribirlas en forma tal que tanto la variable 𝑥’ como la variable 𝑡’ puedan ser despejadas por medio de ecuaciones simultáneas (por medio de determinantes aplicando la regla de Cramer o cualquier otra técnica matemática del gusto del estudiante): 𝑥 ′ + 𝑣𝑡 ′ =
𝑥 𝛾
𝑣 𝑡 ( 2) 𝑥′ + 𝑡 ′ = 𝑐 𝛾 Es así como obtenemos el siguiente conjunto de ecuaciones: ____𝑥′ = 𝛾(𝑥 − 𝑣𝑡) ____𝑦′ = 𝑦 ____𝑧′ = 𝑧 𝑡 ′ = 𝛾 (𝑡 −
𝑣𝑥 ) 𝑐2
Obsérvese que, exceptuando por la diferencia entre los signos “+” y “-” entre la primera y la cuarta ecuación de ambas transformaciones, ambas transformaciones son completamente simétricas. La diferencia en el signo simplemente indica que mientras que para el observador en 𝑆 la persona en 𝑆’ se está moviendo en una dirección positiva (hacia la derecha), para la persona en 𝑆’ el observador en 𝑆 se está moviendo en sentido contrario, en una dirección negativa (hacia la izquierda). En virtud de que se requiere algo de práctica para poder adquirir cierta destreza en el empleo de las transformaciones de Lorentz para la resolución de problemas, a continuación veremos algunos ejercicios que nos darán una familiaridad en la transformación de coordenadas de un sistema de referencia a otro. Se observará que estas transformaciones de coordenadas no son muy diferentes a las transformaciones (clásicas) de coordenadas de Galileo, excepto que las fórmulas que empleamos aquí se basan en la validez de los dos postulados de la Teoría Especial de la Relatividad. Prof. Armando Martínez
Página 109
Fundamentos de Relatividad General
Las transformaciones de Lorentz
PROBLEMA: Para un observador O un destello de luz sale del punto 𝑥 = 100 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠, 𝑦 = 20 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠, 𝑧 = 30 𝑘𝑖𝑙ó𝑚𝑒𝑡𝑟𝑜𝑠 en un tiempo 𝑡 = 0.0005 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠. ¿Cuáles son las coordenadas del evento para un segundo observador 𝑂 que se mueve con respecto al primero a lo largo del eje común 𝑥 − 𝑥’ a una velocidad de 𝑣 = −0.8 𝑐.?
El factor de corrección en este caso es: 𝛾 =
1 2
√1 − 𝑣2 𝑐
=
1 √1 − (−0.8)2
=
1 = 1.667 0.6
De las transformaciones de Lorentz para pasar del sistema de referencia 𝑆 al sistema de referencia 𝑆′ tenemos entonces lo siguiente: ____𝑥′ = 𝛾(𝑥 – 𝑣𝑡) = (1.667)[100 𝐾𝑚 – (−0.8)(3 · 108 𝑚/𝑠)(5 · 10−4 𝑠)] = 367 𝐾𝑚 ____𝑦′ = 𝑦 = 20 𝐾𝑚 ____𝑧′ = 𝑧 = 30 𝐾𝑚 𝑡 ′ = 𝛾 (𝑡 −
(−0.8𝑐)(100 𝐾𝑚 ) 𝑣𝑥 ) = 1.667 (5 · 10−4 𝑠𝑒𝑔 − ) = 12.8 · 10−4 𝑠𝑒𝑔 2 𝑐 𝑐2
De esta manera, el evento tiene las siguientes coordenadas: 𝐸𝑛 𝑆 (𝑥, 𝑦, 𝑧, 𝑡) = (100 𝐾𝑚, 20 𝐾𝑚, 30 𝐾𝑚, 5 · 10−4 𝑠𝑒𝑔) 𝐸𝑛 𝑆′ (𝑥’, 𝑦’, 𝑧’, 𝑡’) = (367 𝐾𝑚, 20 𝐾𝑚, 30 𝐾𝑚, 12.8 · 10−4 𝑠𝑒𝑔) En la mayoría de los problemas relativistas, más que obtener las coordenadas de un mismo evento visto en dos marcos de referencia distintos, en lo que realmente estamos interesados es en obtener la diferencia entre las coordenadas de dos eventos distintos y comparar dicha diferencia de un marco a otro.
Prof. Armando Martínez
Página 110
Fundamentos de Relatividad General
Las transformaciones de Lorentz
PROBLEMA: Derivar, empleando las transformaciones de Lorentz, la fórmula para la dilatación del tiempo, especificando las coordenadas de cada evento involucrado en el análisis.
Es suficiente considerar únicamente dos eventos para la resolución de este problema. El primer evento es aquél en el cual los relojes de 𝑆 y 𝑆’ están el uno frente al otro, sincronizados:
Ilustración 8-1
El segundo evento es aquél en el cual, de acuerdo con el observador en el sistema 𝑆, el reloj en 𝑆’ se ha movido de una posición 𝑥1 a una posición 𝑥2 en su eje de coordenadas:
Ilustración 8-2
Obsérvese que para el reloj viajero la coordenada posición 𝑥’ dentro de su marco de referencia 𝑆’ no cambia en lo absoluto, ya que viaja a una velocidad 𝑣 (con respecto al sistema de referencia 𝑆) llevando consigo su sistema de referencia. Sea 𝛥𝑡’ = 𝑡2′ − 𝑡1′ el intervalo de tiempo propio medido dentro del marco de referencia 𝑆’ en un mismo punto fijo 𝑥0′ dentro del marco de referencia 𝑆’. El intervalo de tiempo 𝛥𝑡 entre los dos eventos que corresponde al marco de referencia 𝑆 puede ser obtenido de las ecuaciones de transformación de Lorentz: 𝑡2 = 𝛾 (
𝑣𝑥2′ 𝑣𝑥0′ ′ + 2 ) = 𝛾 ( 𝑡2 + 2 ) 𝑐 𝑐
𝑡2′
𝑡1 = 𝛾 ( 𝑡1′ +
𝑣𝑥1′ 𝑣𝑥0′ ′ ) = 𝛾 ( 𝑡 + ) 1 𝑐2 𝑐2
𝛥𝑡 = 𝑡2 − 𝑡1 𝛥𝑡 = 𝛾 (
𝑡2′
𝑣𝑥0′ 𝑣𝑥0′ ′ + 2 ) − 𝛾 ( 𝑡1 + 2 ) 𝑐 𝑐
𝛥𝑡 = 𝛾(𝑡2′ − 𝑡1′ ) 𝛥𝑡 = 𝛾𝛥𝑡’
Prof. Armando Martínez
Página 111
Fundamentos de Relatividad General
Las transformaciones de Lorentz
Este es el fenómeno relativista de la dilatación del tiempo. Hemos obtenido directamente a partir de las transformaciones de Lorentz la relación para la dilatación del tiempo de un reloj. La resolución del problema requirió determinar los eventos sobre los cuales se llevaría a cabo la transformación de las coordenadas. Una vez que se han logrado determinar los eventos, el problema está prácticamente resuelto.
PROBLEMA: Derivar, empleando las transformaciones de Lorentz, la fórmula para la contracción de longitud.
Considérese una vara de medición cuyos extremos en el marco de referencia 𝑆’ están identificados como 𝑥1′ y 𝑥2′ . La longitud propia 𝐿0 de la vara de medición dentro del marco de referencia 𝑆’ será: 𝐿0 = 𝑥2′ − 𝑥1′ La longitud de esta vara de medición, medida en el marco de referencia 𝑆 con ambos extremos medidos en el mismo tiempo 𝑡0 , en 𝑆 será: 𝐿 = 𝑥2 − 𝑥1 Usando las relaciones de transformación de Lorentz, tenemos lo siguiente: 𝑥2′ = 𝛾(𝑥2 − 𝑣𝑡2 ) = 𝛾(𝑥2 − 𝑣𝑡0 ) 𝑥1′ = 𝛾(𝑥1 − 𝑣𝑡1 ) = 𝛾(𝑥1 − 𝑣𝑡0 ) Por lo tanto: 𝑥2′ − 𝑥1′ = 𝛾(𝑥2 − 𝑣𝑡0 ) − 𝛾(𝑥1 − 𝑣𝑡0 ) 𝑥2′ − 𝑥1′ = 𝛾(𝑥2 − 𝑥1 ) 𝑥2 − 𝑥1 = (𝑥2′ − 𝑥1′ ) /𝛾 𝐿0 𝛾 Este es el fenómeno relativista de la contracción de longitud. 𝐿 =
Las transformaciones de Lorentz nos preparan para un nuevo efecto relativista que no habíamos encontrado previamente: la desincronización relativista de los relojes. PROBLEMA: Considérense dos relojes sincronizados que están puestos en lugares diferentes x’1 y x2′ dentro del marco de referencia S’ al cual consideramos el marco de referencia móvil. ¿Cuáles serán los tiempos dados por dichos relojes en el tiempo 𝑡0 dentro del marco de referencia S?
Prof. Armando Martínez
Página 112
Fundamentos de Relatividad General
Las transformaciones de Lorentz
En los problemas anteriores, teníamos puestos dos o más relojes sincronizados en el marco de referencia fijo 𝑆, pero teníamos puesto un solo reloj en el marco de referencia móvil 𝑆. Ahora vamos a complicar un poco más esa situación, con dos relojes colocados en el marco de referencia móvil en lugares diferentes. Supongamos que hay un reloj A puesto en la coordenada 𝑥1′ del marco de referencia móvil y otro reloj B puesto en la coordenada 𝑥2′ del mismo marco de referencia. De las ecuaciones de transformación de Lorentz tenemos lo siguiente para dos relojes diferentes puestos en el marco de referencia móvil 𝑆’: 𝑡’(𝐴) = 𝛾 ( 𝑡0 +
𝑣𝑥1 ) 𝑐2
𝑡’(𝐵) = 𝛾 ( 𝑡0 +
𝑣𝑥2 ) 𝑐2
Entonces los tiempos de los relojes desincronizados dentro el marco de referencia 𝑆, relojes de 𝑆 que están sincronizados en 𝑆, estarán relacionados de la manera siguiente: 𝑣 𝑡’(𝐴) − 𝑡’(𝐵) = 𝛾(𝑥2 − 𝑥1 ) ( 2 ) 𝑐 𝑡’(𝐴) − 𝑡’(𝐵) =
𝐿0 𝑣 𝑐2
En donde 𝐿0 = 𝛾(𝑥2 − 𝑥1 ) = 𝑥2′ − 𝑥1′ es la distancia propia entre los dos relojes situados dentro del marco de referencia 𝑆’. Este resultado que acabamos de obtener tiene implicaciones mucho más profundas de lo que aparentan a primera vista. Dos relojes separados por una distancia 𝐿0 y sincronizados dentro del marco de referencia en el que se encuentran se verán desincronizados en un marco de referencia 𝑆’ en el que se estén moviendo a una velocidad 𝑣, con el reloj perseguidor retrasado por un tiempo 𝐿0 𝑣/𝑐². Esto significa que dos eventos diferentes que ocurran a un mismo tiempo en un marco de referencia S’ ocurrirán en tiempos diferentes para en un marco de referencia S. En efecto, dos eventos diferentes que sean simultáneos dentro de un marco de referencia S no serán simultáneos para un observador que viaje en un marco de referencia 𝑆’ del mismo modo que dos eventos diferentes que sean simultáneos dentro de un marco de referencia 𝑆’ no serán simultáneos para un observador que viaje en un marco de referencia 𝑆. Esto nos confirma algebraicamente lo que ya habíamos visto geométricamente en nuestra introducción a los diagramas espaciotiempo de Minkowski, el hecho de que, relativistamente hablando, no existe la simultaneidad absoluta. La falta plena de entendimiento de este hecho es lo que da pie a falsos razonamientos que conducen a paradojas y confusiones entre quienes empiezan sus estudios de relatividad por vez primera.
Prof. Armando Martínez
Página 113
Fundamentos de Relatividad General
Las transformaciones de Lorentz
Los problemas relativistas de contracción de longitud en los que todo se resuelve con la simple aplicación de la fórmula: 𝑣2
𝐿 = 𝐿0 · √1 – 𝑐 2
Son problemas sencillos que involucran meramente una separación espacial de las coordenadas, mientras que los problemas relativistas en los que simplemente se busca una dilatación del tiempo son problemas sencillos que involucran meramente una separación temporal de las coordenadas. Es importante establecer claramente la diferencia profunda entre el concepto de la “separación espacial de las coordenadas” y “longitud”. Un error común en la solución de problemas consiste en simplemente multiplicar o dividir un determinado intervalo espacial por el término √(1 − 𝑣²/𝑐²). Esta aproximación es válida si se trata de hallar relaciones entre longitudes, entendiéndose por longitud algo como 𝑥2 − 𝑥1 . Sin embargo, si se trata de un intervalo espacial entre dos acontecimientos que no tienen lugar simultáneamente, la respuesta se obtiene utilizando la técnica de substracción en coordenadas de Lorentz y no multiplicando o dividiendo la expresión espacial original por √(1 − 𝑣²/𝑐²). Del mismo modo, si los observadores 𝑂 y 𝑂’ miden la separación temporal entre dos acontecimientos que para ambos observadores tienen lugar en diferentes sitios, estas separaciones temporales no se relacionan simplemente multiplicando o dividiendo por √(1 − 𝑣²/𝑐²). La resolución de los siguientes problemas hará más claro lo que se acaba de afirmar, y será obvio que no basta con simplemente multiplicar o dividir por el término √(1 − 𝑣²/𝑐²) para resolver problemas relativistas. Es necesario aplicar las transformaciones de Lorentz. PROBLEMA: Para un observador 𝑂, dos acontecimientos están separados en el espacio y en el tiempo por 600 𝑚𝑒𝑡𝑟𝑜𝑠 y por 8 × 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 ¿Con qué velocidad debe moverse un observador 𝑂’ con respecto a 𝑂 para que los acontecimientos aparezcan simultáneos a 𝑂’?
Establecemos la diferencia de tiempos de acuerdo con la transformación de Lorentz: 𝑡’ = 𝛾 (𝑡 −
𝑣𝑥 ) 𝑐2
La diferencia de tiempos será: 𝑡2′ − 𝑡1′ = 𝛾 (𝑡2 −
𝑣𝑥2 𝑣𝑥1 ) − 𝛾 (𝑡1 − 2 ) 2 𝑐 𝑐
Para que los dos acontecimientos aparezcan simultáneos, se requiere que 𝑡2′ = 𝑡1′. Entonces: 0 = 𝛾 (𝑡2 −
Prof. Armando Martínez
𝑣𝑥2 𝑣𝑥1 ) − 𝛾 (𝑡 − ) 1 𝑐2 𝑐2
Página 114
Fundamentos de Relatividad General
Las transformaciones de Lorentz
𝑡2 − 𝑡1 =
𝑐 2 (𝑥2
𝑣 − 𝑥1 )
𝑣 600 (𝑚𝑒𝑡𝑟𝑜𝑠) 8 × 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 = ( ) · ( 𝑚 ) 𝑐 3 × 108 𝑠𝑒𝑔 𝑣 = 0.4 𝑐 𝑣 = 0.4 𝑐 PROBLEMA: Un tren de media milla de longitud (medida por un observador que viaja dentro del tren) se mueve a 100 𝑚𝑖𝑙𝑙𝑎𝑠/ℎ𝑜𝑟𝑎. Dos destellos de luz inciden simultáneamente en los extremos del tren para un observador en tierra. ¿Cuál es la diferencia de tiempo entre estos eventos para un observador 𝑂’ que viaja en el tren?
Supongamos que para el observador 𝑂 en tierra se asignan las coordenadas (𝑥1 , 𝑡1 ) y (𝑥2 , 𝑡2 ) a los dos eventos, mientras que para el viajero 𝑂’ que va en el tren las coordenadas correspondientes de los dos eventos son (𝑥1′ , 𝑡1′ ) y (𝑥2′ , 𝑡2′ ). Entonces la situación es la siguiente:
Ilustración 8-3
Convertimos primero las millas por hora a millas por segundo tanto para la velocidad del tren como para la velocidad de la luz tomando en cuenta que una milla equivale a 1609 metros: 𝑚𝑖𝑙𝑙𝑎𝑠 1 ℎ𝑜𝑟𝑎 𝑚𝑖𝑙𝑙𝑎𝑠 𝑣 = 100 ( )· ( ) = 2.78 × 10−2 ( ) ℎ𝑜𝑟𝑎 3600 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 𝑠𝑒𝑔𝑢𝑛𝑑𝑜
Prof. Armando Martínez
Página 115
Fundamentos de Relatividad General
Las transformaciones de Lorentz
𝑚𝑒𝑡𝑟𝑜 ) 𝑚𝑖𝑙𝑙𝑎𝑠 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 = 1.86 · 105 1 𝑚𝑖𝑙𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 1609 (𝑚𝑒𝑡𝑟𝑜)
3 × 108 ( 𝑐 =
Para este problema: 𝑚𝑖𝑙𝑙𝑎𝑠 𝑣 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 = = 1.495 · 10−7 𝑚𝑖𝑙𝑙𝑎𝑠 𝑐 5 1.86 × 10 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 2.78 × 10−2
y el factor 𝛾 = 1 / √(1 − 𝑣²/𝑐²) para fines prácticos lo podemos tomar como igual a la unidad. Establecemos ahora la diferencia de tiempos de acuerdo con la transformación de Lorentz para pasar del sistema de referencia 𝑆’ al sistema de referencia 𝑆: 𝑡 = 𝛾(𝑡’ + 𝑣𝑥’ /𝑐²) La diferencia de tiempos entre los dos acontecimientos (los dos destellos de luz) de acuerdo con el observador 𝑆 será: 𝑡2 − 𝑡1 = 𝛾 (
𝑡2′
𝑣𝑥2′ 𝑣𝑥1′ ′ + 2 ) − 𝛾 ( 𝑡1 + 2 ) 𝑐 𝑐
𝑣 𝑡2 − 𝑡1 = (𝑡2′ − 𝑡1′ ) + ( 2 ) (𝑥2′ − 𝑥1′ ) 𝑐 Si los dos destellos inciden simultáneamente en los extremos del tren para un observador en tierra (ocurriendo al mismo tiempo) entonces 𝑡1 = 𝑡2 y: 𝑚𝑖𝑙𝑙𝑎𝑠 2.78 × 10−2 𝑠𝑒𝑔 0 = (𝑡2′ − 𝑡1′ ) + · (0.5 𝑚𝑖𝑙𝑙𝑎𝑠) 𝑚𝑖𝑙𝑙𝑎𝑠 2 5 {(1.86 × 10 𝑠𝑒𝑔 ) } 𝑡2′ − 𝑡1′ = − 4.02 × 10−3 𝑠𝑒𝑔___(¡ Obsérvese el signo menos!) El signo menos obtenido en la respuesta nos indica que para el observador viajero que va en el tren el acontecimiento 1 (en el punto A en la figura) ocurre después que el acontecimiento 2 (en el punto B en la figura). Anteriormente al estudiar los diagramas espacio-tiempo de Minkowski ya habíamos hablado acerca de la introducción típica con la que varios textos presentan la ausencia de simultaneidad entre dos eventos, con un marco de referencia 𝑆 de un observador situado a un lado de las vías del ferrocarril justo a la mitad de dos torres de luz que se activan en forma sincronizada (al mismo tiempo) emitiendo dos pulsos luminosos de las dos torres de luz usando relojes
Prof. Armando Martínez
Página 116
Fundamentos de Relatividad General
Las transformaciones de Lorentz
sincronizados en el marco de referencia de 𝑆 para lanzar los pulsos luminosos en forma tal que el estallido de uno de los pulsos luminosos coincide justo con el extremo delantero del ferrocarril y el estallido del otro pulso luminoso coincidirá justo con el extremo trasero del ferrocarril:
Ilustración 8-4
De acuerdo con la explicación que dan en dichos libros, el observador en tierra situado a un lado de las vías del ferrocarril en el marco de referencia 𝑆 recibe los dos pulsos luminosos al mismo tiempo, y por lo tanto concluye que ambos eventos fueron simultáneos dentro de su marco de referencia. Pero a causa de la velocidad finita de la luz y en virtud de que el pasajero del ferrocarril está en movimiento, uno de los pulsos luminosos le llega primero que el otro, y el pasajero concluye que los destellos no ocurrieron al mismo tiempo, que no fueron simultáneos, dada la diferencia de tiempos en que tardan en llegarle los dos rayos de luz a su plataforma móvil. Y por lo tanto para él los eventos no son simultáneos en su marco de referencia 𝑆’. Sin embargo, ya se había señalado que esta explicación es una explicación simplista y en cierta forma errónea porque no toma en cuenta para nada los verdaderos efectos relativistas de pérdida de simultaneidad que hemos visto arriba, y como acabamos de ver en los problemas que se han resuelto la pérdida en la simultaneidad no se debe simplemente a la velocidad finita de la luz. Efectivamente, hay una diferencia de tiempos en la llegada de los dos pulsos luminosos al observador viajero que está en el ferrocarril, pero también hay una pérdida de simultaneidad real que no es ocasionada por la velocidad finita de la luz sino por efectos de índole relativista, y para poder calcular numéricamente ésta pérdida relativista de simultaneidad es necesario identificar a los dos eventos que ocurren simultáneamente en el marco de referencia 𝑆 y calcular las coordenadas (𝑥’, 𝑡’) de cada uno de dichos eventos (o mejor dicho, las diferencias entre las coordenadas) para 𝑆’ de acuerdo con las transformaciones de Lorentz. Si queremos agregarle a todo esto lo que el viajero situado a la mitad de los vagones del ferrocarril ve, entonces tenemos que llevar a cabo cálculos adicionales en base a la velocidad finita de la luz, lo cual viene a complicar el problema. Si el viajero pudiese estar mágicamente al mismo tiempo en ambos extremos del tren por algún milagro de ubicuidad (como el que se le atribuye a algunos santos) de modo que la luz de ambos destellos no tenga que recorrer ni siquiera un milímetro para Prof. Armando Martínez
Página 117
Fundamentos de Relatividad General
Las transformaciones de Lorentz
que el viajero los vea justo cuando ocurren frente a él, vería de cualquier manera a un destello ocurrir antes que el otro, y la diferencia de tiempos entre ambos acontecimientos sería la misma predicha por las transformaciones de Lorentz. Esto ya no tiene nada que ver con el tiempo finito de la velocidad de la luz sino con el hecho de que relojes que están sincronizados en un marco de referencia se salen fuera de sincronía en otro marco de referencia porque el tiempo no es absoluto. Hay una distinción bastante clara entre ver un acontecimiento y medir las coordenadas del mismo, del mismo modo que hay una distinción bastante clara entre ver dos acontecimientos que nos parecen o no nos parecen ser simultáneos y medir la pérdida de simultaneidad a causa de los efectos relativistas. PROBLEMA: (a) Un observador 𝑂’ se mueve con una velocidad 𝑣 = 0.8𝑐 respecto a otro observador 𝑂. Los relojes se ajustan de tal manera que 𝑡 = 𝑡’ = 0 en 𝑥 = 𝑥’ = 0. Si para 𝑂 un destello de luz sale en 𝑥 = 50 𝑚𝑒𝑡𝑟𝑜𝑠 y 𝑡 = 2 × 10−7 segundo, ¿cuál es el tiempo de este acontecimiento medido por 𝑂’ ? (b) Si un segundo destello aparece en 𝑥’ = 10 𝑚𝑒𝑡𝑟𝑜𝑠 y 𝑡 = 2 × 10−7 segundo para el observador 𝑂’, ¿cuál será el intervalo de tiempo entre los dos acontecimientos medido por 𝑂? (c) ¿Cuál es la separación espacial entre los dos acontecimientos medida por 𝑂’? (d) ¿Cuál es la separación espacial entre los dos acontecimientos medida por 𝑂? La parte (a) del problema involucra una transformación a una coordenada de tiempo 𝑡’ que se lleva a cabo en forma directa con una de las ecuaciones de transformación de Lorentz:
𝑡’ = 𝛾 (𝑡 − La evaluación de γ nos dá: 𝛾 = Entonces:
1 2
√1 − 𝑣2 𝑐
=
1 √1 − (0.8)
𝑣𝑥 ) 𝑐2
=
1 √0.36
𝑡’ = 1.667 · (2 × 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 −
=
1 = 1.667 0.6
(0.8𝑐)(50 𝑚𝑒𝑡𝑟𝑜𝑠) ) 𝑐2
𝑡’ = 1.667 · (2 × 10−7 𝑠𝑒𝑔 − 1.333 × 10−7 𝑠𝑒𝑔) = 1.11 × 10−7 𝑠𝑒𝑔 (b) Para un segundo destello de luz, identificamos sus coordenadas en 𝑆’ como (𝑥2′ , 𝑡2′ ) = (10 𝑚, 2 × 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠). El intervalo de tiempo 𝑡2 − 𝑡1 entre los dos acontecimientos medido por 𝑂 estará dado por: 𝑡2 − 𝑡1 = 𝛾 ( 𝑡2′ +
𝑣𝑥2′ 𝑣𝑥1′ ′ ) − 𝛾 ( 𝑡 + ) 1 𝑐2 𝑐2
𝑣 𝑡2 − 𝑡1 = 𝛾(𝑡2′ − 𝑡1′ ) + 𝛾 ( 2 ) (𝑥2′ − 𝑥1′ ) 𝑐
Prof. Armando Martínez
Página 118
Fundamentos de Relatividad General
Las transformaciones de Lorentz
𝑣 𝑡2 − 𝑡1 = 𝛾 {(𝑡2′ − 𝑡1′ ) + ( 2 ) (𝑥2′ − 𝑥1′ )} 𝑐 Tenemos el tiempo 𝑡1′ del primer acontecimiento (destello) medido por 𝑂’ que es el que acabamos de obtener arriba,1 × 11 · 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜, y tenemos la coordenada espacial 𝑥2′ del segundo acontecimiento. Pero no tenemos aún la coordenada espacial 𝑥1′ del primer acontecimiento, la cual tenemos que calcular antes de poder seguir adelante: 𝑥1′ = 𝛾 (𝑥1 − 𝑣𝑡1 ) 𝑥1′ = 1.667 · (50 𝑚𝑒𝑡𝑟𝑜𝑠 − (0.8𝑐)(2 × 10−7 𝑠𝑒𝑔𝑢𝑛𝑑𝑜)) 𝑥1′ = 1.667 · (50 𝑚𝑒𝑡𝑟𝑜𝑠 − 48 𝑚𝑒𝑡𝑟𝑜𝑠) 𝑥1′ = 3.33 𝑚𝑒𝑡𝑟𝑜𝑠 Tenemos ya todos los datos que requerimos para seguir adelante: 𝑡2 − 𝑡1 = 1.667 ((2 × 10−7 𝑠𝑒𝑔 − 1.11 × 10−7 𝑠𝑒𝑔) + (1.667) (0.8/𝑐) (10 𝑚𝑒𝑡𝑟𝑜𝑠 − 3.33 𝑚𝑒𝑡𝑟𝑜𝑠)) 𝑡2 − 𝑡1 = 1.48 × 10−7 𝑠𝑒𝑔 + 0.296 × 10−7 𝑠𝑒𝑔 𝑡2 − 𝑡1 = 1.78 × 10−7 𝑠𝑒𝑔 (c) Teniendo 𝑥1′ y 𝑥2′ , la evaluación de 𝑥2′ − 𝑥1′ es directa: 𝑥2′ − 𝑥1′ = 10 𝑚𝑒𝑡𝑟𝑜𝑠 − 3.33 𝑚𝑒𝑡𝑟𝑜𝑠 = 6.67 𝑚𝑒𝑡𝑟𝑜𝑠 (d) Recurrimos nuevamente a las transformaciones de Lorentz para encontrar la diferencia entre las coordenadas espaciales de los dos acontecimientos en 𝑆 cuando se conoce la diferencia entre las coordenadas espaciales de los dos acontecimientos en 𝑆’: 𝑥2 − 𝑥1 = 𝛾 (𝑥2′ + 𝑣𝑡2′ ) − 𝛾 (𝑥1′ + 𝑣𝑡1′ ) 𝑥2 − 𝑥1 = 𝛾 (𝑥2′ − 𝑥1′ ) + 𝑣 (𝑡2′ − 𝑡1′ ) 𝑥2 − 𝑥1 = 1.667 · {6.67 𝑚 + (0.8) (3 × 108
𝑚 ) (2 × 10−7 𝑠𝑒𝑔 − 1.11 × 10−7 𝑠𝑒𝑔)} 𝑠𝑒𝑔
𝑥2 − 𝑥1 = 11.11 𝑚𝑒𝑡𝑟𝑜𝑠 + 35.60 𝑚𝑒𝑡𝑟𝑜𝑠 = 46.7 𝑚𝑒𝑡𝑟𝑜𝑠 Repasando la relación: 𝑣 𝑡2 − 𝑡1 = 𝛾(𝑡2′ − 𝑡1′ ) + 𝛾 ( 2 ) (𝑥2′ − 𝑥1′ ) 𝑐 Prof. Armando Martínez
Página 119
Fundamentos de Relatividad General
Las transformaciones de Lorentz
Se concluye que si dos acontecimientos son simultáneos para 𝑂 (lo cual requiere 𝑡1 = 𝑡2) no pueden ser simultáneos para 𝑂’; esto es imposible. Y si dos acontecimientos son simultáneos para 𝑂’ (lo cual requiere 𝑡1′ = 𝑡2′ ) no pueden ser simultáneos para 𝑂. Esto ya lo habíamos visto geométricamente al estudiar los diagramas espacio-tiempo de Minkowski, y lo comprobamos ahora algebraicamente con las ecuaciones de transformación de Lorentz. Las ecuaciones de transformación de Lorentz, aplicadas bajo el contexto de la Teoría Especial de la Relatividad, aparecen publicadas en el primer trabajo de Einstein en el que expuso los conceptos de dicha teoría (el cual es reproducido en su versión inglesa en un apéndice puesto al final de esta obra):
Ilustración 8-5
Posiblemente haya quien se pregunte aquí por qué son llamadas ecuaciones de transformación de Lorentz y no ecuaciones de transformación de Einstein. Esto se debe a que, si bien fue Einstein quien generalizó estas ecuaciones de transformación derivándolas de los dos postulados sobre los cuales está fundada la Teoría Especial de la Relatividad, el holandés Hendrik Antoon Lorentz se le adelantó publicándolas primero, pero no aplicadas a los fenómenos propios de la mecánica sino de la electrodinámica, y ello sin suponer efectos relativistas, sino meramente como un esquema ingenioso de simplificación matemática para hacer valer las ecuaciones de Maxwell dándoles cierta cualidad de invariancia. El mérito de Einstein fue el haberles dado a estas ecuaciones de transformación un carácter universal, general, aplicable no sólo a la electrodinámica sino a toda la mecánica, derivándolas no de consideraciones hechas sobre fenómenos propios de la teoría del electromagnetismo, sino de los dos postulados básicos. En la resolución de muchos problemas propios de la Teoría Especial de la Relatividad, conviene resolverlos tanto algebraicamente con las ecuaciones de transformación de Lorentz como representarlos geométricamente con los diagramas espacio-tiempo de Minkowski, conviene recurrir a ambos métodos que se complementan formidablemente el uno al otro y nos dan una mejor idea de lo que está sucediendo.
Prof. Armando Martínez
Página 120
Fundamentos de Relatividad General
Prof. Armando Martínez
Las transformaciones de Lorentz
Página 121
Fundamentos de Relatividad General
Representaciones matriciales
Representaciones matriciales Las transformaciones de Lorentz, siendo transformaciones lineales, se prestan admirablemente para ser manejadas a través de las herramientas más fundamentales del álgebra lineal, las matrices, esos arreglos rectangulares de números: 4 2 𝐴=[ 4 6 −2 2
2 8] 4
Que resumen la transformación que será llevada a cabo de un sistema de coordenadas a otro. Primero que nada, empecemos por visualizar a las cuatro variables (𝑥, 𝑦, 𝑧, 𝑡) como un vector en cuatro dimensiones. Este vector tendría una representación en la forma de un vector fila como la siguiente: [𝑥
𝑦
𝑧
𝑡]
En realidad, este vector es una matriz que consta de una fila y cuatro columnas, o sea es una matriz 1x4. La representación matricial anterior dada a las cuatro variables de las ecuaciones de transformación de Lorentz adolece de un defecto: revuelve peras con manzanas. En efecto, las coordenadas 𝑥, 𝑦, 𝑧 son longitudes medidas en metros, mientras que la cuarta coordenada es una dimensión medida en segundos. Pero esto tiene un remedio fácil, ya que todo lo que tenemos que hacer es multiplicar la cuarta coordenada por la constante universal absoluta que es la velocidad de la luz 𝑐, con lo cual obtenemos la coordenada 𝑐𝑡 que también está expresada en metros. De este modo, tenemos un vector fila en el que todos sus componentes son peras (o manzanas): [𝑥
𝑦
𝑧
𝑐𝑡]
Repasemos ahora las ecuaciones de transformación de Lorentz: 𝑥 = 𝛾(𝑥’ + 𝑣𝑡’) 𝑦 = 𝑦’ Prof. Armando Martínez
Página 122
Fundamentos de Relatividad General
Representaciones matriciales
𝑧 = 𝑧’ 𝑡 = 𝛾 (𝑡’ +
𝑣𝑥’ ) 𝑐2
A continuación reescribiremos estas ecuaciones de transformación con el fin de preparar el sistema para su representación matricial, multiplicando la cuarta coordenada (la del tiempo) por la constante absoluta universal que es la velocidad de la luz 𝑐 con la finalidad de que el vector de cuatro componentes al ser transformado de un sistema de referencia a otro contenga las cuatro coordenadas en dimensiones de metros: 𝑣 𝑥 = 𝛾𝑥’ + 0𝑦’ + 0𝑧’ + 𝛾 ( ) 𝑐𝑡’ 𝑐 𝑣 𝑦 = 0𝛾𝑥’ + 1𝑦’ + 0𝑧’ + 0 ( ) 𝑐𝑡’ 𝑐 𝑣 𝑧 = 0𝛾𝑥’ + 0𝑦’ + 1𝑧’ + 0 ( ) 𝑐𝑡’ 𝑐 𝑣 𝑐𝑡 = 𝛾 ( ) 𝑥’ + 0𝑐𝑦’ + 0𝑐𝑧’ + 𝛾𝑐𝑡’ 𝑐 Para aquellos con alguna experiencia previa en matrices el arreglo rectangular de la representación matricial requerida casi salta a la vista, ya que lo que queremos es convertir el vector [𝑥’, 𝑦’, 𝑧’, 𝑐𝑡’] al vector [𝑥, 𝑦, 𝑧, 𝑐𝑡], o sea: [𝑥’, 𝑦’, 𝑧’, 𝑐𝑡’] → [𝑥, 𝑦, 𝑧, 𝑐𝑡] Si hacemos las siguientes designaciones: 𝐴 = [𝑥, 𝑦, 𝑧, 𝑐𝑡] ⃗⃗⃗ 𝐴′ = [𝑥’, 𝑦’, 𝑧’, 𝑐𝑡’] Entonces lo que estamos buscando es un operador 𝜆 que aplicado sobre el vector 𝐴 lo transforme al vector ⃗⃗⃗ 𝐴′. En notación matricial (el operador usualmente se escribe a la izquierda del operando sobre el cual actúa, aunque hay algunos textos en los que por la falta de una convención universal se escribe primero el operando que va a ser transformado e inmediatamente después el operador que llevará a cabo la transformación) esto se representa con la siguiente ecuación: ⃗⃗⃗ 𝐴 = 𝜆𝐴’ Obsérvese que para representar al operador matricial propio de las transformaciones de Lorentz estamos utilizando la letra griega 𝜆 cuyo equivalente latino es la letra 𝐿.
Prof. Armando Martínez
Página 123
Fundamentos de Relatividad General
Representaciones matriciales
Tomando en cuenta la forma en la cual se lleva a cabo la multiplicación de dos matrices 𝐴 y 𝐵 (cada elemento en la fila 𝑖 y en la columna 𝑗 de la matriz resultante 𝐶 se puede obtener de la suma de los productos apareados respectivos de los elementos de la matriz 𝐴 del lado izquierdo a los cuales apunta horizontalmente el dedo índice de la mano izquierda en la fila 𝑖 por los elementos de la matriz 𝐵 del lado derecho a los cuales apunta verticalmente el dedo índice de la mano derecha en la columna 𝑗): 2 [ 7
2 3 (2 · 1 + 5 · 5 + 6 · 1) 5 6 ] × [5 −4] = [ (7 · 2 + 8 · 5 + 4 · 1) 8 4 1 0
(2 · 3 + 5 · −4 + 6 · 0) 33 −14 ]=[ ] (7 · 3 + 8 · −4 + 4 · 0) 58 −15
Determinamos de inmediato que las operaciones matriciales de transformación, representando a los vectores 𝐴 y 𝐴’ como vectores columna, están indicadas por la siguiente ecuación matricial: 𝛾 𝑥 𝑦 0 [ ]= 𝑧 0 𝑣 𝑐𝑡 [( 𝑐 ) 𝛾
0 0 1 0 0 1 0 0
𝑣 ( ) 𝛾 𝑥′ 𝑐 𝑦′ 0 [ ] 0 𝑧′ 𝑐𝑡′ 𝛾 ]
Con un simple intercambio en el orden de las filas y en la posición de unas variables en las ecuaciones de transformación de Lorentz: 𝑣 𝑥 = 𝛾𝑥’ + + 𝛾 ( ) 𝑐𝑡’ + 0𝑦’ + 0𝑧’ 𝑐 𝑣 𝑐𝑡 = 𝛾 ( ) 𝑥’ + 𝛾𝑐𝑡’ + 0𝑐𝑦’ + 0𝑐𝑧’ 𝑐 𝑣 𝑦 = 0𝛾𝑥’ + 0 ( ) 𝑐𝑡’ + 1𝑦’ + 0𝑧’ 𝑐 𝑣 𝑧 = 0𝛾𝑥’ + 0 ( ) 𝑐𝑡’ + 0𝑦’ + 1𝑧’ 𝑐 Podemos obtener la siguiente ecuación matricial que es un poco más reveladora: 𝛾 𝑥 𝑣 𝑐𝑡 [ ] = ( )𝛾 𝑦 𝑐 0 𝑧 [ 0
𝑣 ( )𝛾 𝑐 𝛾 0 0
0 0
𝑥′ 𝑐𝑡 ′ 0 0 [ ′] 𝑦 1 0 𝑧′ 0 1]
Tenemos, en efecto, una submatriz, la cual transforma las coordenadas (𝑥’, 𝑐𝑡’) a las coordenadas (𝑥, 𝑐𝑡) dejando intactas a las coordenadas (𝑦) y (𝑧) en virtud de que entre los sistemas de referencia 𝑆’ y 𝑆 no hay un movimiento relativo en los ejes (𝑦) y en los ejes (𝑧), el único movimiento es en el eje (𝑥). Entresacando dicha submatriz de la matriz general, obtenemos la matriz que verdaderamente proporciona la Prof. Armando Martínez
Página 124
Fundamentos de Relatividad General
Representaciones matriciales
transformación en el eje (𝑥), una transformación conocida como un boost (empuje) en la dirección del eje (𝑥): 𝑣 ( )𝛾 𝑐 ] [ 𝑥′ ] 𝑐𝑡 ′ 𝛾
𝛾 𝑥 [ ]=[ 𝑣 𝑐𝑡 ( )𝛾 𝑐
No se requiere de mucha imaginación para darse cuenta de que en caso de que el marco de referencia móvil 𝑆 se esté moviendo a lo largo del 𝑒𝑗𝑒(𝑦), en lugar de moverse a lo largo del 𝑒𝑗𝑒(𝑥), las ecuaciones de transformación serán: 𝑥 = 1𝑥’ + 0𝑦’ + 0𝑧’ + 0𝑐𝑡’ 𝑣 𝑦 = 0𝑥’ + 𝛾𝑦’ + + 0𝑧’ + 𝛾 ( ) 𝑐𝑡’ 𝑐 𝑧 = 0𝑥’ + 0𝑦’ + 1𝑧’ + 0𝑐𝑡’ 𝑣 𝑐𝑡 = 0𝑥’ + 𝛾 ( ) 𝑦’ + 0𝑧’ + 𝛾𝑐𝑡’ 𝑐 La representación matricial de este sistema de ecuaciones lineales es la siguiente: 𝛾 0 𝑥 0 𝛾 𝑦 [ ]= 𝑧 0 0 𝑣 𝑐𝑡 [0 ( 𝑐 ) 𝛾
0
0 𝑣 𝑥′ 0 ( ) 𝛾 𝑦′ 𝑐 [ ′] 1 0 𝑧 ′ 0 1 ] 𝑐𝑡
Y cuando el movimiento relativo entre ambos marcos de referencia se esté dando en el 𝑒𝑗𝑒(𝑧), las ecuaciones de transformación serán: 𝑥 = 1𝑥’ + 0𝑦’ + 0𝑧’ + 0𝑐𝑡’ 𝑦 = 0𝑥’ + 1𝑦’ + + 0𝑧’ + 0𝑐𝑡’ 𝑣 𝑧 = 0𝑥’ + 0𝑦’ + 𝛾𝑧’ + 𝛾𝑐𝑡’ 𝑐 𝑣 𝛾𝑧’ + 𝛾𝑐𝑡’ 𝑐 La representación matricial de este sistema de ecuaciones lineales es la siguiente: 𝑐𝑡 = 0𝑥’ + 0𝑦’ +
1 0 𝑥 0 1 𝑦 [ ]= 0 0 𝑧 𝑐𝑡 [0 0
Prof. Armando Martínez
0 0 𝛾 𝑣 ( )𝛾 𝑐
0 𝑥′ 0 𝑣 𝑦′ ( )𝛾 [ ′ ] 𝑐 𝑧 ′ 𝛾 ] 𝑐𝑡
Página 125
Fundamentos de Relatividad General
Representaciones matriciales
Obsérvese que, en cada caso, podemos entresacar una submatriz, la cual será siempre la misma cuando el movimiento ocurre a velocidad 𝑣 a lo largo de solo uno de los ejes coordenados. Esta matriz es conocida como la matriz simple de Lorentz. Utilizando el símbolo 𝛽 definido como 𝛽 = 𝑣/𝑐, obtenemos una representación más compacta de la matriz simple de Lorentz: Λ=[
𝛾 𝛽𝛾
βγ ] 𝛾
Por razones de conveniencia que pronto serán obvias, haremos el cambio notacional 𝑎 = 𝛾, 𝑏 = 𝛽𝛾, con lo cual nuestra matriz de Lorentz adquiere el siguiente aspecto: Λ=[
𝑎 𝑏
b ] 𝑎
Consideremos ahora las ecuaciones de la transformación inversa de Lorentz, utilizadas para efectuar el cambio de las coordenadas (𝑥, 𝑦, 𝑧, 𝑐𝑡) del marco de referencia 𝑆, a las coordenadas (𝑥’, 𝑦’, 𝑧’, 𝑐𝑡’) del marco de referencia 𝑆’: 𝑥’ = 𝛾(𝑥 − 𝑣𝑡) 𝑦’ = 𝑦 𝑧’ = 𝑧 𝑡’ = 𝛾(𝑡 − 𝑣𝑥/𝑐²) Para poder obtener la submatriz que nos interesa, podemos ignorar las dos transformaciones intermedias que en realidad son transformaciones triviales, concentrándonos únicamente sobre las transformaciones que realmente nos interesan: 𝑣 𝑥’ = 𝛾𝑥 − 𝛾 ( ) 𝑐𝑡 𝑐 𝑣 𝑐𝑡’ = − 𝛾 ( ) 𝑥 + 𝛾𝑐𝑡 𝑐 No cuesta trabajo darse cuenta de que para la transformación inversa la submatriz será: ̅=[ 𝑎 Λ −𝑏
−𝑏 ] 𝑎
En notación matricial compacta, si 𝐴 = [𝑥, 𝑐𝑡] entonces para obtener 𝐴’ = [𝑥’, 𝑐𝑡’] la operación matricial estará representada por la siguiente ecuación; ̅𝐴 𝐴’ = Λ ̅ es la transformación matricial que usamos para convertir las Puesto que Λ coordenadas del sistema de referencia 𝑆 al sistema de referencia 𝑆’, y Λ es la transformación matricial que usamos para convertir las coordenadas del sistema de Prof. Armando Martínez
Página 126
Fundamentos de Relatividad General
Representaciones matriciales
referencia 𝑆’ al sistema de referencia 𝑆, si aplicamos a un vector A primero la operación 𝛬 y después la operación 𝛬̅ debemos obtener el mismo vector A con el que habíamos comenzado originalmente: 𝛬̅𝛬𝐴’ = 𝛬̅ (𝛬𝐴’) = 𝛬̅ 𝐴 = 𝐴’ (𝛬̅𝛬) 𝐴’ = 𝐴’ Esto solo puede ser cierto si el producto matricial 𝛬̅𝛬 es igual a la matriz identidad 𝐼: 1 0 𝐼= 0 ⋮ [0
0 1 0 ⋮ 0
0 1 1 ⋮ 0
… … … … …
0 0 0 ⋮ 1]
Se recuerda, por si se ha olvidado, o se informa, por si no se sabe, que por lo general la multiplicación de dos matrices no es una operación conmutativa, el orden de los factores sí altera el producto. El producto de dos matrices 𝑄1 y 𝑄2 , tomado en el orden 𝑄1 × 𝑄2 , producirá una matriz diferente a la que producen las mismas matrices tomadas en el orden 𝑄2 × 𝑄1 : 0 −1 0 0 0 1 𝑄1 = [1 0 0] ; 𝑄2 = [ 0 1 0] 0 0 1 −1 0 0 0 −1 0 0 𝑄1 × 𝑄2 = [ 1 0 0] ≠ 𝑄2 × 𝑄1 = [1 −1 0 0 0
0 1 0 0] 1 0
Cuando son conmutativas, el producto de ambas resulta ser la matriz identidad 𝐼, ya que una de las matrices es la inversa de la otra. Todo lo anterior nos conduce a concluir que 𝛬̅ tiene que ser la matriz inversa de la matriz 𝛬, lo cual representamos notacionalmente como 𝛬̅ = 𝛬−1. Siendo así, entonces se debe cumplir la condición 𝛬𝛬−1 = 𝐼: [
𝑎 𝑏
𝑏 𝑎 ]×[ 𝑎 −𝑏
1 0 −𝑏 ]=[ ] 0 1 𝑎
Llevando a cabo la multiplicación matricial del lado izquierdo de la igualdad e igualando componente a componente con la matriz del lado derecho, además de obtener la obvia condición trivial 𝑎𝑏 = 𝑏𝑎 obtenemos otra condición que no es trivial: 𝑎² − 𝑏² = 1 Esto nos permite definir, formalmente y de modo riguroso, a una matriz simple de Lorentz: como toda aquella matriz que tenga el aspecto Prof. Armando Martínez
Página 127
Fundamentos de Relatividad General
Representaciones matriciales
𝑎 [ 𝑏
𝑏 ] 𝑎
O el aspecto [
𝑎 −𝑏
−𝑏 ] 𝑎
Para la cual se cumpla la condición 𝑎² − 𝑏² = 1 El interés que podamos tener en las propiedades de las representaciones matriciales de las transformaciones de Lorentz va más allá de la afición que pueda haber en nosotros hacia las curiosidades de las matemáticas. Las transformaciones de Lorentz tienen un aspecto casi único, distintivo, característico de lo que llamamos un espacio-tiempo plano propio de la Teoría Especial de la Relatividad. Eventualmente llegará el momento de dar el salto hacia marcos de referencia noinerciales, acelerados, en los cuales el espacio-tiempo no es plano sino que adquiere una curvatura. Y las matrices de transformación volverán a aparecer nuevamente pero bajo un aspecto más elaborado, propio de la Teoría General de la Relatividad. Pero tales matrices características de un espacio-tiempo curvo se reducen a las matrices características de las transformaciones de Lorentz cuando el marco de referencia acelerado que corresponde a los campos gravitacionales se pueda considerar en una región pequeña del espacio como Lorentziano. Existe otra forma de representar lo mismo que lo que representan las matrices cuadradas (rectangulares, de orden 2) en cuatro dimensiones, renombrando a las cuatro coordenadas bajo un esquema conocido como coordenadas generalizadas (𝑥1, 𝑥2, 𝑥3, 𝑥4) y prescindiendo de matrices usando en lugar de ello sumatorios y dobles sumatorios, pero esto quedará pospuesto para cuando se lleve a cabo una discusión sobre el cálculo tensorial. De antemano se señala aquí que ambas formas de representación son completamente equivalentes, están representando lo mismo, y cada una de ellas tiene sus propias ventajas. PROBLEMA: Determinar si la siguiente matriz es una matriz de Lorentz.
1.25 0 [ 0 . 75
0 1 0 0
0 0 1 0
. 75 0 ] 0 1.25
Extraemos primero la submatriz que nos interesa eliminando las filas y las columnas que contienen únicamente unos y ceros: [
1.25 . 75 ] . 75 1.25
Haciendo 𝑎 = 1.25 𝑦 𝑏 = .75, la matriz dada ciertamente tiene la configuración de una matriz Lorentziana. Sin embargo, falta ver si se cumple la condición principal:
Prof. Armando Martínez
Página 128
Fundamentos de Relatividad General
Representaciones matriciales
𝒂𝟐 − 𝒃𝟐 = (𝟏. 𝟐𝟓)𝟐 − (. 𝟕𝟓)𝟐 = 𝟏. 𝟓𝟔𝟐𝟓 − 𝟎. 𝟓𝟔𝟐𝟓 𝒂𝟐 − 𝒃𝟐 = 𝟏 Se concluye que la matriz es Lorentziana, y en los lugares en donde esta matriz aplica se cumplirán los postulados de la Teoría Especial de la Relatividad. Al tratar el tema de las transformaciones de Lorentz, para derivar dichas ecuaciones de transformación se supuso, como se ha hecho desde un principio, que el movimiento relativo entre los dos marcos de referencia usuales 𝑆 y 𝑆’ se lleva a cabo con uno de los marcos moviéndose a una velocidad constante 𝑣 a lo largo del 𝑒𝑗𝑒(𝑥). Esto se hace con fines de simplificación. Los marcos de referencia pueden estarse moviendo el uno con respecto al otro en tal forma que no sólo haya un movimiento relativo entre ambos marcos a lo largo del 𝑒𝑗𝑒(𝑥), sino también que haya un movimiento relativo entre ambos a lo largo del 𝑒𝑗𝑒(𝑦), e inclusive a lo largo del 𝑒𝑗𝑒(𝑧). De este modo, podríamos hablar de tres componentes de velocidad, 𝑣𝑥 , 𝑣𝑦 y 𝑣𝑧 en lugar de una sola. En la situación clásica en donde utilizamos las transformaciones de Galileo, esto no presenta problema alguno porque allí las componentes de velocidad a lo largo de cada eje son independientes la una de la otra por completo. De este modo, si las transformaciones clásicas de un marco de referencia a otro cuando el movimiento relativo entre ambos marcos ocurre sólo a lo largo del 𝑒𝑗𝑒(𝑥) son las siguientes: 𝑥 = 𝑥’ + 𝑣𝑡’ 𝑦 = 𝑦’ 𝑧 = 𝑧’ Cuando el movimiento relativo entre ambos marcos ocurre a lo largo de los tres ejes las transformaciones de Galileo serán simplemente: 𝑥 = 𝑥’ + 𝑣𝑥 𝑡’ 𝑦 = 𝑦’ + 𝑣𝑦 𝑡’ 𝑧 = 𝑧’ + 𝑣𝑧 𝑡’ Desafortunadamente, en el caso de la Teoría Especial de la Relatividad, el asunto de ampliar la cobertura cuando el movimiento relativo entre ambos marcos ocurre a lo largo de los tres ejes en lugar de uno solo no es un asunto tan sencillo en virtud del requerimiento estricto del segundo postulado de la Teoría Especial de la Relatividad que nos dice que la velocidad de la luz medida por observadores situados en ambos marcos debe seguir siendo exactamente la misma. De este modo un rayo de luz, que tendrá tres componentes de velocidad proyectados sobre cada uno de los ejes en ambos marcos de referencia, debe tener el mismo valor constante por dondequiera que se le mire. La transformación general de Lorentz para esta Prof. Armando Martínez
Página 129
Fundamentos de Relatividad General
Representaciones matriciales
situación, recurriendo a la ayuda de matrices con el fin de simplificar la notación, es la siguiente (recordemos que habíamos convenido que: 𝛽 = 𝑣/𝑐 ): 𝛾 −𝛽𝑥 𝛾 𝑐𝑡 ′ 𝑥′ [ ′] = 𝑦 −𝛽𝑦 𝛾 𝑧′ [
−𝛽𝑧 𝛾
−𝛽𝑥 𝛾 1 + (𝛾 −
𝛽𝑥2 1) 2 𝛽
𝛽𝑦 𝛽𝑥 𝛽2 𝛽𝑧 𝛽𝑥 (𝛾 − 1) 2 𝛽
(𝛾 − 1)
−𝛽𝑦 𝛾 𝛽𝑥 𝛽𝑦 (𝛾 − 1) 2 𝛽 𝛽𝑦2 1 + (𝛾 − 1) 2 𝛽 𝛽𝑧 𝛽𝑦 (𝛾 − 1) 2 𝛽
−𝛽𝑧 𝛾 𝛽𝑧 𝛽𝑦 (𝛾 − 1) 2 𝑐𝑡 𝛽 𝑥 𝛽𝑦 𝛽𝑧 · [ ] 𝑦 (𝛾 − 1) 2 𝛽 𝑧 𝛽𝑧2 1 + (𝛾 − 1) 2 𝛽 ]
Como es de esperarse, la obtención de la transformación general de Lorentz es un asunto laborioso al que sólo se recurre cuando algún maestro que disfruta de su fama de “cruel” lo deja como tarea a sus alumnos (algo así como el draconiano Profesor Charles W. Kingsfield que aparece en la película “The Paper Chase”, protagonizado por John Houseman). El lector no deberá tener dificultad alguna en verificar la transformación general de Lorentz que se ha dado arriba tomando en cuenta que la designación de las coordenadas es un asunto arbitrario, haciendo por ejemplo 𝛽𝑦 = 𝛽𝑧 = 0 con lo cual se debe obtener como caso especial la transformación de Lorentz cuando el movimiento relativo ocurre únicamente a lo largo del 𝑒𝑗𝑒(𝑥), tras lo cual se puede hacer 𝛽𝑥 = 𝛽𝑧 = 0 para comprobar el segundo caso (movimiento relativo a lo largo del 𝑒𝑗𝑒(𝑦)), y finalmente 𝛽𝑥 = 𝛽𝑦 = 0 (movimiento relativo a lo largo del 𝑒𝑗𝑒(𝑧)). En realidad, si estamos realmente interesados en derivar las relaciones que corresponden a la transformación general de Lorentz cuando los marcos de referencia están en movimiento relativo el uno con respecto al otro a través de tres ejes coordenados en lugar de uno solo, la demostración se puede simplificar enormemente si recurrimos a notación vectorial clásica denotando como el vector posición 𝑋 a la ubicación de un punto en el sistema coordenado 𝑆: 𝑋 = (𝑥, 𝑦, 𝑧) Y denotando la ubicación del mismo punto en el sistema coordenado 𝑆’ como: ⃗⃗⃗ 𝑋’ = (𝑥’, 𝑦’, 𝑧’) Simbolizando asimismo a la velocidad relativa 𝑣 que hay entre los dos marcos de ⃗ con componentes relativos en cada uno de los tres ejes referencia como un vector 𝑉 Cartesianos: ⃗ = (𝑣𝑥 , 𝑣𝑦 , 𝑣𝑧 ) 𝑉 Lo anterior lo hacemos en conjunción con la notación vectorial del producto punto o producto escalar entre dos vectores: ⃗ = (𝑥, 𝑦, 𝑧) × (𝑣𝑥 , 𝑣𝑦 , 𝑣𝑧 ) = 𝑥𝑣𝑥 + 𝑦𝑣𝑦 + 𝑧𝑣𝑧 𝑋× 𝑉 Prof. Armando Martínez
Página 130
Fundamentos de Relatividad General
Representaciones matriciales
Con esta notación, la transformación general de Lorentz que estamos buscando tanto para las componentes espaciales como para la componente temporal se puede resumir vectorialmente en las siguientes dos fórmulas: ⃗ 𝑋·𝑉 ⃗⃗⃗⃗ ⃗ ·[ (𝛾 − 1) − 𝛾𝑡] 𝑋′ = 𝑋 + 𝑉 𝑣2 𝑡 ′ = 𝛾 [𝑡 −
⃗ 𝑋·𝑉 ] 𝑐2
Resta decir que para la derivación de estas dos fórmulas debemos aferrarnos estrictamente de principio a fin al manejo matemático vectorial que se acostumbra darle a los problemas típicos de la mecánica clásica en los que se manejan cantidades vectoriales. Habiendo visto una representación matricial para la transformación generalizada de Lorentz, no debe causarnos ningún asombro el hecho de que la siguiente matriz también sea una matriz de Lorentz: √3 √2 √6 1 2 √6 1 2 [0
0
0 0 1 1 2 2 1 1 − − 2 2 √2 √2 − − ] 2 2
Esto nos debe dejar en claro cuál es la diferencia entre una matriz simple de Lorentz como las que vimos arriba, y una matriz de Lorentz ordinaria. Determinar si una matriz 4x4 como la de arriba es una matriz de Lorentz no es un asunto complicado. Ello requiere derivar primero tres relaciones generales a partir de lo que vendría siendo la invariancia de la ecuación del cono de luz (en referencia a los diagramas de Minkowski). Pero para ello tenemos que tener en claro cuál es esa invariancia a la que nos estamos refiriendo, razón por la cual este asunto debe quedar pospuesto hasta que no haya sido desarrollado dicho tema. La multiplicación de dos matrices A y B tiene desde luego una definición más formal que la definición intuitiva que se ha dado arriba, y es la siguiente: 𝑘=𝑛
𝑐𝑖𝑗 = ∑ 𝑎𝑖𝑘 𝑏𝑘𝑗 𝑘=1
𝑐𝑖𝑗 = 𝑎𝑖1 𝑏1𝑗 + 𝑎𝑖2 𝑏2𝑗 + 𝑎𝑖3 𝑏3𝑗 + ⋯ Este enunciado nos dice que para dos matrices 𝐴 = (𝑎𝑝𝑞 ) 𝑦 𝐵 = (𝑏𝑟𝑠 ), siendo 𝐴 una matriz de p filas y q columnas, y siendo 𝐵 una matriz de r filas y s columnas, Prof. Armando Martínez
Página 131
Fundamentos de Relatividad General
Representaciones matriciales
el producto de las mismas definido en el orden 𝐴𝐵 es tal que cada elemento 𝑐𝑖𝑗 de la matriz resultante deberá ser obtenido de acuerdo a la relación anterior, para lo cual es requisito indispensable que el número de columnas de la matriz 𝐴 sea igual al número de filas de la matriz 𝐵, o sea 𝑞 = 𝑟. En la definición formal que se acaba de dar para el producto de dos matrices, obsérvese un detalle interesante: el sumatorio se lleva a cabo sobre el subíndice que está repetido, en este caso k. Si alguien borrara el símbolo 𝛴 del sumatorio en la expresión de arriba, no tendríamos dificultad alguna para reestablecerlo junto con el índice que fue borrado. Tan sólo tendríamos que fijarnos en el subíndice que aparece repetido. PROBLEMA: Escribir la expresión para evaluar el elemento c47 resultante del producto AB de dos matrices A y B si la matriz A es una matriz de cinco filas y nueve columnas (representado como 5x9), y la matriz B es una matriz de nueve filas y ocho columnas (representado como 9x8).
En este caso, el producto matricial está definido, puesto que el número de columnas de la matriz 𝐴 es igual al número de filas de la matriz 𝐵, o sea: [5 × 9] [9 × 8] Podemos ver también aquí que el sumatorio deberá correr desde 𝑛 = 1 hasta 𝑛 = 9 y que la matriz resultante será una matriz 5 × 8. Utilizando la definición formal dada arriba, el elemento 𝑐47 estará dado por el siguiente sumatorio: 𝑘=9
𝑐47 = ∑ 𝑎4𝑘 𝑏𝑘7 𝑘=1
𝑐47 = 𝑎41 𝑏17 + 𝑎42 𝑏27 + 𝑎43 𝑏37 + 𝑎44 𝑏47 + 𝑎45 𝑏57 + 𝑎46 𝑏67 + 𝑎47 𝑏77
PROBLEMA: Si multiplicamos una matriz A cuyo tamaño es 5x4 por una matriz B cuyo tamaño es 4x7, y el producto resultante los multiplicamos por otra matriz C cuyo tamaño es 7x3, ¿cuál será el tamaño de la matriz resultante?
[5 × 4] · [4 × 7] · [7 × 3] Podemos ver que la matriz resultante será una matriz 5 × 3. PROBLEMA: La siguiente cantidad (𝑐𝛥𝑡² − 𝑥² − 𝑦² − 𝑧²), resulta ser de gran utilidad en el análisis de problemas propios de la Teoría Especial de la Relatividad. Representar dicha cantidad en forma matricial. Formando un vector fila [ 𝑐𝛥𝑡, 𝑥, 𝑦, 𝑧 ] y tomando la transpuesta del mismo para formar el vector columna correspondiente, la cantidad: 𝑐𝛥𝑡² − 𝑥² − 𝑦² − 𝑧² Prof. Armando Martínez
Página 132
Fundamentos de Relatividad General
Representaciones matriciales
Quedaría representada matricialmente por el siguiente producto matricial entre una matriz que consta de una fila y cuatro columnas (1 × 4) y una matriz que consta de una columna y cuatro filas (4 × 1):
[𝑐∆𝑡
∆𝑥
∆𝑦
𝑐∆𝑡 ∆𝑧] · [ ∆𝑥 ] ∆𝑦 ∆𝑧
Pero queremos además la selección de signos que se nos han indicado. Esto se logra injertando entre las dos matrices de arriba una matriz intermedia:
[𝑐∆𝑡
∆𝑥
∆𝑦
𝑐∆𝑡 1 0 0 0 ∆𝑥 0 ∆𝑧] · [0 −1 0 ]·[ ] ∆𝑦 0 0 −1 0 0 0 0 −1 ∆𝑧
En notación matricial más compacta y haciendo 𝑋 = [ 𝑐𝛥𝑡, 𝑥, 𝑦, 𝑧 ], lo anterior se puede escribir como 𝑋 · 𝐴 · 𝑋 𝑇 en donde 𝐴 es la matriz intermedia y 𝑋 𝑇 es la transpuesta de la matriz 𝑋. Llevando a cabo el producto matricial ya sea en el orden (𝑋𝐴)𝑋 𝑇 multiplicando primero las dos matrices de la izquierda y multiplicando la matriz resultante por la matriz a la derecha, o en el orden 𝑋(𝐴𝑋 𝑇 ) multiplicando primero las dos matrices de la derecha y multiplicando la matriz resultante por la matriz de la izquierda, podemos ver que esta representación matricial nos produce la expresión deseada. La matriz intermedia A del problema representa los 16 componentes de un objeto que se conoce como el tensor métrico de un espacio-tiempo plano (Lorentziano), el cual se representa en forma abreviada ya sea como 𝑔 = (𝑔𝑖𝑗 ) usando subíndices o como 𝑔 = (𝑔𝑖𝑗 ) usando superíndices. El concepto del tensor métrico es generalizado hacia un espacio-tiempo curvo en la Teoría General de la Relatividad. ⃗ de tres elementos: Llevaremos ahora a cabo la multiplicación de un vector fila ⃗𝑼 ⃗ = [𝑎1 𝑈
𝑎2
𝑎3 ]
Por una matriz cuadrada 𝑔 de tamaño 3 × 3: 𝑔11 𝑔 𝑔 = [ 21 𝑔31
𝑔12 𝑔22 𝑔32
𝑔13 𝑔23 ] 𝑔33
⃗ de tres elementos: Multiplicado todo por un vector de una columna 𝑉 𝑏1 ⃗ = [𝑏2 ] 𝑉 𝑏3 ⃗ 𝒈𝑽 ⃗ de la manera siguiente: Procedemos a formar el producto matricial ⃗𝑼
Prof. Armando Martínez
Página 133
Fundamentos de Relatividad General
⃗ 𝑔𝑉 ⃗ = [𝑎1 𝑈
Representaciones matriciales
𝑎2
𝑔11 𝑎3 ] · [𝑔21 𝑔31
𝑔12 𝑔22 𝑔32
𝑔13 𝑏1 𝑔23 ] · [𝑏2 ] 𝑔33 𝑏3
Llevaremos a cabo la multiplicación de estas tres cantidades multiplicando primero la segunda por la tercera siguiendo la regla para la multiplicación de matrices dada arriba: ⃗ 𝑔𝑉 ⃗ = [𝑎1 𝑈
𝑎2
𝑔11 𝑏1 𝑎3 ] · [𝑔21 𝑏1 𝑔31 𝑏1
𝑔12 𝑏2 𝑔22 𝑏2 𝑔32 𝑏2
𝑔13 𝑏3 𝑔23 𝑏3 ] 𝑔33 𝑏3
⃗ 𝒈𝑽 ⃗ resulta ser una sola cantidad, la cual viene El resultado final de la operación ⃗𝑼 siendo evaluada a fin de cuentas de la siguiente manera: ⃗⃗ 𝒈𝑽 ⃗ = 𝑎1 𝑔11 𝑏1 + 𝑎1 𝑔12 𝑏2 + 𝑎1 𝑔13 𝑏3 + 𝑎2 𝑔21 𝑏1 + 𝑎2 𝑔22 𝑏2 + 𝑎2 𝑔23 𝑏3 + 𝑎3 𝑔31 𝑏1 + 𝑎3 𝑔32 𝑏2 + 𝑎3 𝑔33 𝑏3 𝑼
La evaluación de esta cantidad la podemos obtener representaciones gráficas con la ayuda de dos sumatorios:
sin
ayuda
de
𝑝=3 𝑞=3
∑ ∑ 𝑎𝑝 𝑔𝑝𝑞 𝑏𝑞 𝑝=1 𝑞=1
No cuesta mucho trabajo convencerse de que, si llevamos a cabo los dos ⃗ 𝒈𝑽 ⃗ . No importa que sumatorios, obtendremos el resultado final del producto triple ⃗𝑼 se lleve a cabo primero el sumatorio sobre p y después el sumatorio sobre q, o bien al revés, porque es cosa fácil comprobar el hecho, de que en un sumatorio múltiple el orden en que se llevan a cabo los sumatorios no altera el resultado final. ⃗⃗ 𝒈𝑽 ⃗ , empezamos con dos vectores y una matriz, y Al llevar a cabo el producto 𝑼 terminamos al final con un solo número. ¿Significa esto que hubo una metamorfosis en la cual terminaron perdiéndose los paréntesis cuadrados? Bueno, no precisamente. Podemos ver simbólicamente que el resultado de estos productos será una matriz 1 × 1: [𝑛1
𝑛2
𝑛11 𝑛3 ] × [𝑛21 𝑛31
𝑛12 𝑛22 𝑛32
𝑛13 𝑛1 𝑛23 ] × [𝑛2 ] 𝑛33 𝑛3
Ilustración 6
Prof. Armando Martínez
Página 134
Fundamentos de Relatividad General
Representaciones matriciales
⃗ 𝒈𝑽 ⃗ el resultado final será: En pocas palabras, para la matriz ⃗𝑼 [1 × 3] · [3 × 3] · [3 × 1] = [1 × 1] De este modo, el número solitario que llamamos escalar en realidad sigue siendo una matriz, una matriz que consta de una solo fila y una sola columna, una matriz de tamaño 1 × 1 que consta de un solo elemento, pero al fin y al cabo una matriz. Naturalmente, si este elemento representa una temperatura o una frecuencia, prescindimos de la formalidad simbólica y utilizamos a dicho elemento en cálculos posteriores como si fuese un número cualesquiera. Pero no hay que olvidar que, formalmente, todas las operaciones llevadas a cabo con vectores y matrices siempre terminan produciendo otros vectores y matrices. ⃗ cómo lo que verdaderamente es, Ahora bien, vamos a considerar al vector fila 𝑈 una matriz que consta de una fila y tres columnas, o sea, una matriz 1 × 3. En tal caso, podemos formalizar la representación de cada elemento agregando un 1 a cada subíndice, de modo tal que el elemento 𝑎11 es el elemento que corresponde a la primera y única fila en la primera columna de la matriz, el elemento 𝑎12 es el elemento que corresponde a la primera fila en la segunda columna de la matriz, y el elemento 𝑎13 es el elemento que corresponde a la primera fila en la tercera columna de la matriz: ⃗ = [𝑎11 𝑎12 𝑎13 ] 𝑈 ⃗ , lo vamos a considerar Haremos también algo similar con el vector columna 𝑉 como lo que verdaderamente es, una matriz que consta de tres filas y una columna, o sea, una matriz [3 × 1]. En tal caso, podemos formalizar la representación de cada elemento poniendo un 1 después de cada cada subíndice, de modo tal que el elemento 𝑏11 es el elemento que corresponde a la primera fila en la primera (y única) columna de la matriz, el elemento 𝑏21 es el elemento que corresponde a la segunda fila en la primera columna de la matriz, y el elemento 𝑏31 es el elemento que corresponde a la tercera fila en la primera columna de la matriz: 𝑏11 ⃗ = [𝑏21 ] 𝑉 𝑏31 ⃗ 𝒈𝑽 ⃗ se escribe en notación Con este ligero cambio notacional, el producto ⃗𝑼 matricial de la siguiente manera: ⃗ 𝑔𝑉 ⃗ = [𝑎11 𝑈
𝑎12
𝑔11 𝑎13 ] · [𝑔21 𝑔31
𝑔12 𝑔22 𝑔32
𝑔13 𝑏11 𝑔23 ] · [𝑏21 ] 𝑔33 𝑏31
La representación del producto matricial triple mediante un doble sumatorio será entonces:
Prof. Armando Martínez
Página 135
Fundamentos de Relatividad General
Representaciones matriciales
𝑝=3 𝑞=3
∑ ∑ 𝑎1𝑝 𝑔𝑝𝑞 𝑏𝑞1 𝑝=1 𝑞=1
⃗ de tamaño [1 × 3] Un momento de reflexión nos revela que si en lugar del vector 𝑈 ⃗ de tamaño [3 × tenemos una matriz de tamaño [𝑖 × 3], y que si en lugar del vector 𝑉 1] tenemos una matriz de tamaño [3 × 𝑗], entonces el resultado final del producto de las tres matrices será una matriz 𝑀 = (𝑚𝑖𝑗 ) de tamaño [𝑖 × 𝑗], y para calcular el valor de cada elemento 𝑚𝑖𝑗 de dicha matriz todo lo que tenemos que hacer en el doble sumatorio de arriba es reemplazar el primer subíndice 1 en la variable 𝑎 por 𝑖, y reemplazar el segundo subíndice 1 en la variable 𝑏 por 𝑗, obteniendo la siguiente relación: 𝑛
𝑛
𝑚𝑖𝑗 = ∑ ∑ 𝑎𝑖𝑝 𝑔𝑝𝑞 𝑏𝑞𝑗 𝑝=1 𝑞=1
Lo que se acaba de hacer aquí es la obtención de la definición formal del producto de tres matrices. Obsérvese que en los límites superiores de los sumatorios para esta definición que acabamos de obtener el tamaño intermedio ya no está limitado hasta 𝑝 = 𝑞 = 3, podemos utilizar matrices del tamaño que queramos siempre y cuando dichos tamaños estén en concordancia con la definición de compatibilidad que se ha dado para productos matriciales (no podemos multiplicar una matriz [4 × 3] por una matriz [2 × 5] en ningún orden). Obsérvese también otro detalle interesante. Si alguien borrara los símbolos ∑ de los sumatorios en la expresión de arriba, no tendríamos dificultad alguna en reestablecerlos. Tan sólo tendríamos que fijarnos en los subíndices que están repetidos. De este modo, si lo que vemos escrito es lo siguiente: 𝑎𝑖𝑝 𝑔𝑝𝑞 𝑏𝑞𝑗 Entonces con tan sólo mirar los subíndices que están repetidos (en este caso los subíndices p y q) podemos volver a poner los sumatorios en el orden que queramos (que al fin y al cabo el orden en el cual se lleven a cabo los sumatorios no altera el resultado final de la suma). Esto será de utilidad posteriormente cuando entremos en el estudio del análisis tensorial que a su vez es requerido para formular los principios y resolver los problemas que corresponden a la Teoría General de la Relatividad. Mientras tanto, en base a lo que acabamos de ver, podemos hacer unívocamente la siguiente afirmación sin temor a equivocarnos: El resultado final de todo producto matricial múltiple (involucrando dos o más matrices) puede ser representado no sólo gráficamente mediante matrices sino también con la definición formal basada en el uso de los sumatorios. De este modo, contamos ya con dos representaciones distintas para la misma cosa.
Prof. Armando Martínez
Página 136
Fundamentos de Relatividad General
Representaciones matriciales
Tomando en cuenta que el producto de dos matrices no es una operación conmutativa salvo en casos especiales, esta es una buena ocasión para señalar que para que un sumatorio múltiple pueda ser representada en forma alterna como el producto de varias matrices, cuando tal cosa sea posible, ayuda mucho el acomodar los factores del sumatorio de modo tal que la conversión a la representación matricial se pueda llevar a cabo directamente. A modo de ejemplo, en el siguiente sumatorio múltiple: 3
3
3
3
∑ ∑ ∑ ∑ 𝑔𝑟𝑠 𝜆𝑟𝑖 𝜆𝑠𝑗 𝑥𝑖 𝑥𝑗 𝑟=0 𝑠=0 𝑖=0 𝑗=0
No resulta nada claro cuál podría ser la representación matricial correspondiente. Pero si reacomodamos los factores del sumatorio de la siguiente manera usando como guía el requerimiento de que los subíndices tienen que estar apareados conforme son leídos de izquierda a derecha en el sumatorio ya transformado: 3
3
3
3
∑ ∑ ∑ ∑ 𝑥𝑖 𝜆𝑖𝑟 𝑔𝑟𝑠 𝜆𝑠𝑗 𝑥𝑗 𝑟=0 𝑠=0 𝑖=0 𝑗=0
La representación matricial salta a la vista casi de inmediato, la cual en notación matricial compacta resulta ser: 𝑋 𝑇 · ΛT · 𝐺 · Λ · 𝑋 Obsérvese cuidadosamente que para poder lograr esta representación matricial, tomando en cuenta que el sumatorio múltiple debe producir al final un número (que matricialmente viene siendo una matriz que consta de una sola fila y de una sola columna, algo que tenemos que saber de antemano para evitarnos mucho trabajo), la necesidad de emparejar los subíndices nos obligó a tomar la transpuesta de la matriz 𝛬, la cual representamos de color rojo como 𝛬𝑇 ; y también nos obligó a usar la representación del vector columna 𝑋 como el vector fila tomando la transpuesta de 𝑋 y representándolo como 𝑋 𝑇 . Esto significa que en el sumatorio múltiple preparada para su representación matricial en donde aparecen 𝑋 𝑇 y 𝛬𝑇 de color rojo como corresponde a las transpuestas, si bien en lo que respecta al componente 𝑥𝑖 dentro del sumatorio el cambio no tiene efecto alguno, el componente 𝜆𝑖𝑟 en caso de llevarse a cabo el sumatorio sobre esa expresión tiene que ser interpretado no como el elemento dentro de la matriz 𝛬 que está en la fila i y la columna r sino como el elemento dentro de la matriz que está dentro de la fila r y la columna i.
Prof. Armando Martínez
Página 137
Fundamentos de Relatividad General
Prof. Armando Martínez
Representaciones matriciales
Página 138
View more...
Comments