Relatividad (Lorenzo de la Torre).pdf

December 17, 2019 | Author: Anonymous | Category: Relatividad especial, Luz, Velocidad de la luz, Ondas, Velocidad

Share Embed Donate

Report this link

Short Description

Download Relatividad (Lorenzo de la Torre).pdf...

Description

Prefacio

Este libro presenta los elementos de la teor´ıa de la relatividad. El texto se dirige especialmente a estudiantes de pregrado; pensando en ellos, he intentado presentar la teor´ıa as´ı como yo habr´ıa deseado leerla cuando la estudié por vez primera, hace a˜ nos. La primera parte del libro se dedica a la relatividad especial, y la segunda parte a la general. La fundamentaci´ on de la teor´ıa especial, en el primer cap´ıtulo, se apoya fuertemente en el experimento de Michelson y Morley. Esta ruta es probablemente cuestionable desde un punto de vista histórico, pero tiene la ventaja de aprovechar las ense˜ nanzas y sugerencias que se derivan de ese experimento, y lo hacen pedagógicamente valioso. Para algunos la esencia de la relatividad especial está en las transformaciones de Lorentz, y la covariancia de las ecuaciones de Maxwell resulta al final, como una virtud de las transformadas. Este punto de vista tiene ventajas pedagógicas, y por eso lo he seguido en los primeros cap´ıtulos, que se dedican a mostrar la estructura de la teor´ıa. Pero también se puede pensar que la esencia del proyecto relativista es el empe˜ no por extender el principio de la relatividad al electromagnetismo: que las ecuaciones de Maxwell sean las mismas para todos los observadores inerciales; en busca de este objetivo se encuentran, como un paso intermedio, las transformaciones de Lorentz y la constancia de la velocidad de la luz. Me gusta este punto de vista, aunque admito que tiene dificultades didácticas. El lector interesado puede ir al apéndice, donde se ejecutan en detalle los pasos correspondientes. Los cap´ıtulos 5 y 9 dan los fundamentos del cálculo tensorial que se usa en la relatividad especial, y en la general, respectivamente. Si bien la teor´ıa especial puede estudiarse sin tensores, la general se entiende con el uso dei

cidido del cálculo tensorial. El cap´ıtulo 11 es crucial, y desarrolla la idea de que la gravitaci´ on puede entenderse como un hecho geométrico. El 12 construye la ecuación de los campos gravitacionales, de Hilbert-Einstein, y el cap´ıtulo 13 está dedicado a la solución de Schwarzschild. En este u ´ltimo cap´ıtulo se enfatiza el asunto de las part´ıculas en ca´ıda libre, que siguen trayectorias geodésicas. As´ı se justifica que se haya dedicado antes todo un cap´ıtulo, el 10, al estudio de las l´ıneas geodésicas. La teor´ıa de la relatividad es la gloria de la f´ısica teórica. Si hay un lector que, iniciándose en el camino de esa teor´ıa, encuentra que este libro es de alguna ayuda, yo sentiré que mi trabajo ha sido bien pagado. Lorenzo de la Torre Medell´ın, diciembre de 2006

ii

´ Indice General

Prefacio

I

1. El origen de la relatividad 1.1. Corp´ usculos y ondas . . . . . . . . . . 1.2. El éter . . . . . . . . . . . . . . . . . . 1.3. El experimento de Michelson y Morley 1.4. La transformación de Galileo . . . . . 1.5. La constancia de la velocidad de la luz 1.6. El principio de la relatividad . . . . . 1.7. Homogeneidad del espacio y el tiempo 1.8. El concepto de observador . . . . . . . 1.9. Transformaciones de coordenadas . . . 1.10. Las transformaciones de Lorentz . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

2. Propiedades del espaciotiempo 2.1. Las separaciones espacial y temporal son relativas . 2.2. El intervalo es absoluto . . . . . . . . . . . . . . . 2.3. Clases de intervalos . . . . . . . . . . . . . . . . . . 2.4. La simultaneidad es relativa . . . . . . . . . . . . . 2.5. Tiempo propio . . . . . . . . . . . . . . . . . . . . 2.6. Longitud propia . . . . . . . . . . . . . . . . . . . . 2.7. Comparación de longitud propia y tiempo propio . 2.8. Un caso de simultaneidad . . . . . . . . . . . . . . 2.9. La adición de velocidades . . . . . . . . . . . . . . 2.10. La adición de aceleraciones . . . . . . . . . . . . . 2.11. Gráficos . . . . . . . . . . . . . . . . . . . . . . . . 2.12. Más gráficos . . . . . . . . . . . . . . . . . . . . . . iii

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

1 3 5 8 11 12 13 14 15 17 20

. . . . . . . . . . . .

31 32 32 33 36 37 41 44 44 45 49 50 53

3. Mec´ anica 3.1. La conservaci´ on del momentum . . . 3.2. Las nuevas cantidades dinámicas . . 3.3. La energ´ıa en la relatividad especial 3.4. E = mc2 . . . . . . . . . . . . . . . . 3.5. La velocidad l´ımite . . . . . . . . . . 3.6. Las transformaciones de p , E , m , F 3.7. Masa y potencial electrostático . . . 3.8. La aceleración . . . . . . . . . . . . . 3.9. Movimiento circular . . . . . . . . . 4. El campo electromagn´ etico 4.1. Transformación de los campos E y B 4.2. Dos cantidades invariantes . . . . . . 4.3. El campo electromagnético total . . 4.4. Una carga con velocidad uniforme . 4.5. Un alambre recto con corriente . . . 4.6. Anulando el campo menor . . . . . . 4.7. La corriente eléctrica . . . . . . . . . 4.8. Covariancia de la electrodinámica .

. . . . . . . . .

. . . . . . . .

. . . . . . . . .

. . . . . . . .

5. Tensores en la relatividad especial 5.1. Sub´ındices y super´ındices . . . . . . . . 5.2. Los vectores . . . . . . . . . . . . . . . . 5.3. Otros tensores . . . . . . . . . . . . . . . 5.4. Matrices . . . . . . . . . . . . . . . . . . 5.5. Ecuaciones tensoriales . . . . . . . . . . 5.6. El principio de la relatividad . . . . . . 5.7. Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ 5.8. Aberración de la luz y efecto Doppler . 6. La electrodin´ amica manifiestamente covariante 6.1. El cuadripotencial Aµ . . . . . . 6.2. Las dos ecuaciones de Maxwell . 6.3. La fuerza de Lorentz . . . . . . . 6.4. El tensor electromagnético . . . . 6.5. La transformación de los campos 6.6. Dos escalares . . . . . . . . . . . iv

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

61 62 65 69 73 75 76 82 83 85

. . . . . . . .

. . . . . . . .

93 93 99 101 102 104 108 110 111

. . . . . . . .

119 . 119 . 123 . 128 . 135 . 137 . 139 . 140 . 143

. . . . . .

147 . 148 . 150 . 152 . 155 . 158 . 159

. . . . . . . . .

7. Las 7.1. 7.2. 7.3. 7.4. 7.5. 7.6.

leyes de conservaci´ on La nube de part´ıculas . . . . . . . Otras corrientes . . . . . . . . . . . El tensor de energ´ıa y momentum . µν µν ∂µ Tmec = 0 , ∂µ Tmec 6= 0 . . . . . La corriente de momentum angular Generalización . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

8. Din´ amica lagrangiana 8.1. Teor´ıa lagrangiana para una part´ıcula . . . . . . . . 8.2. Teor´ıa lagrangiana para coordenadas continuas . . . 8.3. El tensor energ´ıa-momentum . . . . . . . . . . . . . 8.4. Formulación lagrangiana del campo electromagnético 9. Transformaciones generales de coordenadas 9.1. Sub´ındices y super´ındices . . . . . . . . . . . . . 9.2. Transformaciones generales . . . . . . . . . . . . 9.3. Los vectores . . . . . . . . . . . . . . . . . . . . 9.4. Otros tensores . . . . . . . . . . . . . . . . . . . 9.5. La derivada . . . . . . . . . . . . . . . . . . . . . 9.6. Matrices . . . . . . . . . . . . . . . . . . . . . . 9.7. Coordenadas esféricas . . . . . . . . . . . . . . . 9.8. La relatividad especial . . . . . . . . . . . . . . . 9.9. Ecuaciones tensoriales . . . . . . . . . . . . . . . 9.10. Covariancia general . . . . . . . . . . . . . . . . 9.11. El elemento invariante de volumen . . . . . . . . 9.12. El s´ımbolo de Christoffel . . . . . . . . . . . . . 9.13. La derivada covariante . . . . . . . . . . . . . . 9.14. El tensor de Riemann . . . . . . . . . . . . . . . 9.15. Plano y curvo . . . . . . . . . . . . . . . . . . . 9.16. Coordenadas adaptadas . . . . . . . . . . . . . . 9.17. Las identidades de Bianchi . . . . . . . . . . . . 9.18. El tensor de Riemann es el u ńico . . . . . . . . . 9.19. Obligar a gµν a que tome el valor que queramos 9.20. Dos transformaciones sucesivas . . . . . . . . . . 9.21. Un ejemplo . . . . . . . . . . . . . . . . . . . . . v

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

161 . 161 . 164 . 165 . 166 . 172 . 173

. . . .

177 . 177 . 185 . 188 . 193

. . . . . . . . . . . . . . . . . . . . .

199 . 199 . 202 . 203 . 207 . 210 . 213 . 214 . 217 . 218 . 220 . 221 . 222 . 226 . 230 . 233 . 236 . 238 . 240 . 244 . 246 . 248

10. Las geod´ esicas 10.1. La ecuación diferencial . . . . . . 10.2. Parámetros afines . . . . . . . . . 10.3. Constantes del movimiento . . . 10.4. Las ecuaciones algebraicas . . . . 10.5. Derivada a lo largo de una curva 10.6. Rαβµν y la curvatura . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

253 . 253 . 256 . 258 . 260 . 267 . 269

11. El principio de equivalencia 11.1. El postulado de las geodésicas 11.2. El principio de Galileo . . . . . 11.3. Coordenadas geodésicas . . . . 11.4. El principio de equivalencia . . 11.5. El acople m´ınimo . . . . . . . 11.6. Ejemplos . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

273 274 275 276 277 281 282

12. La ecuaci´ on del campo gravitatorio 12.1. El l´ımite newtoniano . . . . . . . . . . . . . 12.2. Los 10 potenciales gµν . . . . . . . . . . . . 12.3. El potencial g00 en coordenadas cartesianas 12.4. La ecuación de Hilbert-Einstein . . . . . . . 12.5. Las coordenadas . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

287 288 288 290 292 298

. . . . . . . . . . . . . . . .

301 . 301 . 307 . 308 . 311 . 316 . 317 . 319 . 320 . 323 . 324 . 328 . 332 . 335 . 336 . 338 . 339

. . . . . .

13. La soluci´ on de Schwarzschild 13.1. Campo isótropo estático . . . . . . . 13.2. La geometr´ıa del espaciotiempo . . . 13.3. Subespacios . . . . . . . . . . . . . . 13.4. Relojes . . . . . . . . . . . . . . . . . 13.5. Corrimiento hacia el rojo . . . . . . . 13.6. Constantes del movimiento . . . . . . 13.7. Una tercera constante del movimiento 13.8. J y D en términos de r, v y vϕ . . . . 13.9. Las cuatro variables t, T, τ y λ . . . . 13.10. La ca´ıda vertical . . . . . . . . . . . 13.11. Potencial efectivo . . . . . . . . . . . 13.12. Puntos de retorno . . . . . . . . . . . 13.13. Eliminación del parámetro af´ın λ . . 13.14. La variable u . . . . . . . . . . . . . 13.15. Deflexión de un rayo de luz . . . . . 13.16. La precesión anómala del perihelio de vi

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mercurio

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

13.17. 13.18. 13.19. 13.20.

Coordenadas temporaloides y espacialoides El cono de la luz . . . . . . . . . . . . . . Singularidades . . . . . . . . . . . . . . . . Las coordenadas de Kruskal-Szekeres . . .

A. La constancia de la velocidad de la luz A.1. El principio de la relatividad . . . . . A.2. Transformaciones . . . . . . . . . . . . A.3. La velocidad de la luz . . . . . . . . . A.4. Las transformaciones de Lorentz . . . A.5. Regreso al campo . . . . . . . . . . . . A.6. Conclusiones . . . . . . . . . . . . . . Bibliograf´ıa

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . .

. . . .

344 345 347 349

. . . . . .

357 . 358 . 360 . 361 . 366 . 367 . 369 373

vii

viii

Cap´ıtulo 1

El origen de la relatividad

En este primer cap´ıtulo nos proponemos construir las primeras bases de la teor´ıa especial de la relatividad. Comenzamos mostrando algunas de las dificultades en que se hallaba la f´ısica a fines del siglo XIX; es all´ı, en la crisis del electromagnetismo, donde se encuentra el origen histórico de la relatividad. Antes de revisar las dificultades de la f´ısica en esa época, conviene que presentemos un recuento breve de la polémica ondas-corp´ usculos que acompa˜ naba a la óptica desde siglos atrás. Para darle fundamento a la teor´ıa ondulatoria de la luz, los cient´ıficos de los siglos XVIII y XIX se apoyaron en aquella otra onda que conoc´ıan bien, el sonido, en un intento por sacar de all´ı los elementos conceptuales que pudieran servirles para la luz. Ellos ten´ıan muy claro que la onda ac´ ustica se propaga en medios elásticos como el aire, el agua, los cuerpos sólidos, etc., y que, sin el medio, la onda no puede propagarse. Para trasladar este concepto al estudio de la luz, era necesario aceptar la existencia de un medio (al que llamaron éter) que soportara la propagación de la onda luminosa. El concepto del éter penetró con dificultad en la f´ısica teórica; para ajustarlo al conocimiento de la época, los cient´ıficos tuvieron que admitir que él deb´ıa tener un conjunto de propiedades extra˜ nas, absurdas y contradictorias. A´ un as´ı, los f´ısicos se aferraron a su creencia en el éter, ese medio curioso que cumpl´ıa una doble función: de un lado, supuestamente soportaba a las ondas electromagnéticas, y de otro lado era como una corporización del espacio absoluto en que se apoyaba la mecánica newtoniana. Era importante que la idea del éter tuviera un respaldo experimental, y el instrumental óptico de fines del siglo XIX contaba ya con la precisión suficiente para medir la velocidad v que nuestro planeta supuestamente ten´ıa respecto al éter. El experimento de Michelson y Morley dio un resultado sorpresivo: v debe ser 1

cero. Este resultado no es ilógico, pero s´ı es incre´ıble. Nuestra presentación se basa fuertemente en el experimento de Michelson y Morley. Hemos preferido esta ruta didáctica porque el análisis del experimento trae unas ventajas pedagógicas que no podemos despreciar. Tal como veremos, el estudio de este experimento dispara una variedad de ideas sugestivas que se conectan con el principio de la constancia de la velocidad de la luz y con el principio de la relatividad. No se nos escapa que nuestra presentación es cuestionable, en cuanto los historiadores aceptan1 que el experimento no fue decisivo en las motivaciones que tuvo el joven Einstein en aquellos a˜ nos de creación de la teor´ıa. El principio de la relatividad, que dice que lo que ocurre para un observador inercial también puede ocurrir para cualquier otro observador inercial, lo aceptaron los cient´ıficos desde el siglo XVIII, cuando se dieron las bases de la ciencia. Pero lo aceptaban u ńicamente para experiencias de mecánica, como las que se realizan con resortes, péndulos, planos inclinados, etc. Hab´ıa otro conjunto de experiencias para las cuales no cre´ıan que valiera el principio de la relatividad: las de la electricidad y el magnetismo. ¿Por qué los cient´ıficos anteriores a 1905 pensaban que el Principio no se aplica a los fenómenos electromagnéticos? Porque ellos cre´ıan, equivocadamente, que el espacio y el tiempo tienen una estructura galileana. La teor´ıa de la relatividad encuentra la verdadera estructura y demuestra que, dentro de esta estructura, el principio de la relatividad s´ı abarca los fenómenos del electromagnetismo, asuntos que estudiaremos en los cap´ıtulos 4 y 6. Se puede pensar que la parte fuerte de la teor´ıa de la relatividad es encontrar la estructura verdadera del espaciotiempo y que, después, la teor´ıa electromagnética resulta válida para todos los observadores inerciales; este es el punto de vista que se sigue en el cap´ıtulo presente. Pero también se 1

Einstein conoci´ o antes de 1905 los resultados del experimento de Michelson y Morley. Decimos esto porque se sabe que él hab´ıa estudiado el art´ıculo [1] de Lorentz de 1895 en el que el f´ısico holandés discut´ıa en detalle los resultados del experimento. El experimento impresion´ o a muchos, pero no a Einstein. ¿Por qué no? Porque él ya sab´ıa que el resultado del experimento ten´ıa que ser nulo, simple y llanamente porque el éter era, para él, inexistente. El Michelson-Morley no fue lo que condujo a Einstein hacia la relatividad. Cuando, a˜ nos después, le preguntaron a Einstein sobre las motivaciones que hab´ıa tenido para formular la relatividad especial, respondi´ o que la aberraci´ on y el experimento de Fizeau le mostraron el camino, y que ellos dos “fueron suficientes”. Estas dos palabras de Einstein son, seg´ un Pais, “la declaraci´ on m´ as crucial que Einstein jam´ as hiciera acerca de los or´ıgenes de la teor´ıa de la relatividad”[?].

2

puede pensar que la parte fuerte de la teor´ıa es su motivaci´ on: que las leyes electromagnéticas sean válidas para todos los observadores inerciales; y que para darle cumplimiento a esa motivaci´ on es necesario averiguar cuál es la estructura verdadera del espaciotiempo. Este segundo punto de vista se sigue en el apéndice.

1.1

Corp´ usculos y ondas

La óptica moderna nació en el siglo XVII, cuando los cient´ıficos lograron controlar, en el laboratorio, los fenómenos básicos de la luz. Animados por el esp´ıritu experimental, estudiaron la propagación rectil´ınea de un rayo de luz, la descomposición espectral, la polarización, difracción e interferencia. Esta fase inicial de la óptica se dio dentro de un debate intenso respecto a la naturaleza de la luz, ya que unos cre´ıan que la luz estaba compuesta de corp´ usculos, mientras otros prefer´ıan pensar a la luz como un fenómeno ondulatorio. La interpretación ondulatoria mostró su eficacia al explicar los fenómenos de difracción y de interferencia en láminas delgadas. La base teórica de la visión ondulatoria está en el principio de Huygens, seg´ un el cual todo punto de un frente de onda origina una onda esférica secundaria, y el frente de onda est´ a formado por la envolvente de las ondas secundarias emitidas por el frente anterior. La potencia explicativa de este principio se manifestó rápidamente, porque condujo a una visión cuantitativa y exacta de la interferencia y la difracción, y permitió deducir, con argumentos elementales, la ley de refracción de Snell. La interpretaci´ on ondulatoria de la luz tuvo numerosos adeptos, aunque se debe tener en cuenta que la palabra onda no significaba lo mismo para todos. Huygens, por ejemplo, no conceb´ıa la onda como una perturbación continua, con longitud de onda, sino más bien como pulsos de duración finita. Los primeros seguidores de la interpretaci´ on ondulatoria se encontraron con un escollo que no pudieron vencer, que es la polarización de la luz. La teor´ıa ondulatoria inicial, con ondas longitudinales, no pudo explicar la polarización, ya que ésta pone de manifiesto unas propiedades perpendiculares a la dirección de propagación. En cambio, los seguidores de la interpretaci´ on corpuscular s´ı ten´ıan al menos un intento de explicación, propuesto por Newton: “la luz tiene lados”, enunciado que hoy se interpreta como si él hubiera querido decir que los corp´ usculos luminosos son ovalados y se pueden ajustar 3

as´ı a las exigencias de las placas de polarización. Que la teor´ıa ondulatoria inicial fuera incapaz de explicar la polarización de la luz incomodaba a muchos, y fue lo que condujo a Newton a preferir la teor´ıa corpuscular. Es justo anotar, sin embargo, que él nunca tomó partido decidido por ninguna de las dos teor´ıas de la luz, y por eso carece de fundamento la creencia, altamente generalizada, de que Newton fuera el padre de la teor´ıa corpuscular. Uno de los seguidores más importantes de la interpretaci´ on corpuscular fue Bradley quien, con una serie de observaciones astronómicas, descubrió la aberración de la luz de las estrellas. Interpretando la luz como corp´ usculos, el inglés explicó este efecto, midió la velocidad de la luz y demostró, por primera vez, que la Tierra se mueve anualmente alrededor del Sol. Estas observaciones astronómicas y la explicación subsecuente aportada por Bradley, se dieron en un per´ıodo dominado por la interpretaci´ on corpuscular. En efecto, ésta se impuso durante casi todo el siglo XVIII. Pero en los primeros a˜ nos del XIX resurgió vigorosamente la idea ondulatoria, debido, en parte, a la gran precisión, nunca antes vista, que se estaba logrando en los experimentos de interferencia y difracción. A Young se le ocurre una idea que habr´ıa de cambiar radicalmente el rumbo de la óptica: la polarización se entiende fácilmente si las ondas de la luz no son longitudinales, sino transversales. Fresnel toma esta idea y en poco tiempo reconstruye toda la teor´ıa de interferencia, difracción, refracción y polarización a partir de ondas transversales. Renovada, la teor´ıa ondulatoria fue capaz de explicar una gran variedad de fenómenos de interferencia y difracción, y también pudo hacer predicciones, como por ejemplo esta: Si un haz de luz que ha pasado por un agujero bien peque˜ no se dirige hacia un disco opaco, como una moneda por ejemplo, entonces detrás del disco, en el eje óptico, no todo es obscuridad, sino que en cierto lugar deberá aparecer un punto brillante; en la zona de la sombra debe aparecer un punto brillante. Una predicción de estas, tan puntual y precisa, no puede pasar desapercibida a los rivales de la teor´ıa ondulatoria, entre los que se contaba Poisson. Este matemático y f´ısico francés piensa que no puede haber un punto brillante en la región de las sombras y que, por consiguiente, la predicción debe estar equivocada. La teor´ıa undulatoria substituyó a la corpuscular tan s´ ubitamente, que podr´ıamos decir que el cambio se efectuó “de un d´ıa para otro”. Fresnel presen4

ta su teor´ıa ondulatoria a la Academia Francesa en 1815. Poisson se opone a esta teor´ıa y, para atacarla, trae a cuento la predicción del punto brillante en la sombra de la moneda. Arago recibe la objeción de Poisson como un reto y se dispone a montar un experimento para establecer si tal punto brillante verdaderamente existe o no; y mostró a los académicos pasmados, en una escena memorable de la historia de la f´ısica, el puntico brillante en medio de la sombra. La teor´ıa ondulatoria fue acatada desde ese momento.

1.2

El ´ eter

Anotamos arriba que el sonido era bien conocido y se le entend´ıa, correctamente, como las vibraciones longitudinales de un medio material, bien sea gaseoso, l´ıquido o sólido. También apuntamos que los primeros ópticos partidarios de la teor´ıa ondulatoria trasladaron a la luz las propiedades conocidas del sonido: la luz debe de ser una vibración longitudinal. Pero, ¿qué es lo que vibra en los fenómenos luminosos? Hoy por hoy se acepta que lo que vibra es el campo electromagnético, y que esta ondulación puede darse en el vac´ıo, pero en la cultura de los siglos anteriores la idea del vac´ıo era dif´ıcil de aceptar. Que el espacio entre los astros pueda estar vac´ıo era inadmisible, porque los hombres ten´ıan horror a la idea del vac´ıo. Prefirieron pensar en una substancia que rellena tal espacio, un medio a través del cual viajan los astros y la luz: estas son las caracter´ısticas principales de lo que se ha denominado2 el éter3 . No hay una definición precisa4 de en qué consiste este medio transmisor de la luz, el éter, pero podemos rese˜ nar algunas de sus propiedades. El éter debe invadir todo el universo, porque de lo contrario no podr´ıamos recibir la luz que proviene de las estrellas. Debe ser suficientemente r´ıgido para transmitir las ondas con una velocidad tan grande. Un medio con estas caracter´ısticas debe causar rozamiento en los planetas, motivando as´ı un frenado, un retardo en sus trayectorias. Sin embargo, un frenado acumulado ser´ıa fácilmente 2

La palabra éter tiene varios significados. El que estamos discutiendo es el éter lumin´ıfero. Este se debe distinguir del éter et´ılico, que es un gas usado en medicina como antiespasm´ odoco y anestésico. 3 La teor´ıa corpuscular se basa en la supuesta existencia de las part´ıculas lumin´ıferas; dado que éstas podr´ıan perfectamente propagarse en el vac´ıo, la teor´ıa corpuscular no necesita éter. Pero la ondulatoria es hermana del éter. 4 El Diccionario de la Real Academia Espa˜ nola de 1780 trae esta definici´ on de éter: /La esfera, ´ o cielo del fuego/Se toma tambien muy freq¨ uentemente por la substancia celeste y pura desde la atm´ osfera arriba, por la cual caminan los astros.

5

detectable en las observaciones astronómicas y, dado que los astrónomos no han notado el más m´ınimo indicio de frenado, se concluye que el éter debe ser un gas delgad´ısimo, muy sutil: cuando los astros viajan en el espacio no lo notan, porque el éter se cuela a través de ellos libremente, as´ı “como la brisa fluye entre los árboles con poca o ninguna oposición”. Mientras la luz sea ondas longitudinales, el éter como un gas sutil no está mal; pero, tal como hemos mencionado, la teor´ıa ondulatoria pasó de ondas longitudinales a transversales y aqu´ı hay un problema, ya que los gases no transmiten ondas transversas. Para que el éter transmita las nuevas ondas transversas de la luz, debe ser un sólido. Y como la velocidad de la luz es tan alta, el sólido debe ser muy elástico y muy r´ıgido. En conclusión, el éter lumin´ıfero es una substancia que no atrae ni es atra´ıda gravitacionalmente, inmóvil, transparente, sólida, r´ıgida, elástica y se cuela entre los objetos móviles sin rozarlos. Debemos entender que un medio transmisor tan contradictorio se presta a m´ ultiples interpretaciones. Se propusieron toda clase de explicaciones. Fresnel5 dice que un medio óptico de ´ındice de refracción n, cuando se mueve con velocidad v, arrastra parcialmente al éter consigo y le imparte6 una velocidad (1 − n−2 )v. Para Stokes el éter es completamente arrastrado por un cuerpo en movimiento. Lorentz propone que no hay arrastre de éter, sino que hay un parámetro temporal efectivo dado por t0 = t−vx/c2 . Planck dice que probablemente el éter es compresible y se acumula con gran densidad alrededor de los cuerpos grandes. En el siglo XIX se dan los grandes avances del electromagnetismo, no sólo en el lado experimental, sino además en el teórico. A fines de ese siglo se produce una compilación de la teor´ıa electromagnética, una reunión expresada en las cuatro ecuaciones de Maxwell. Estas ecuaciones hacen una predicción definitiva: debe haber ondas electromagnéticas, y éstas tienen una velocidad c que es la misma en todas las direcciones. Con esto queremos decir que la velocidad c de un pulso de luz tiene una magnitud c que no depende de la dirección del vector c. En pocas palabras, la velocidad de la luz es isótropa. Pero hay un detalle crucial acerca de esta isotrop´ıa, y es que como las ecuaciones de Maxwell se consideraban válidas u ńicamente para un observador inercial O en reposo respecto al éter, la velocidad de la luz se consideraba, 5

Fresnel fue quien m´ as empe˜ no puso en fundamentar el concepto del medio transmisor de la onda luminosa, y se le considera el padre de la hip´ otesis etérea. Es él quien introduce la idea del éter en reposo absoluto en 1818, y quien hace los esfuerzos iniciales para someterlo a la observaci´ on experimental. 6 Véase la ecuaci´ on (2.31).

6

también, que era isótropa u ńicamente respecto a O: se pensaba que para los otros observadores inerciales la velocidad de la luz no pod´ıa ser isótropa. Veamos esto. Consideremos un observador inercial O0 que se mueve con velocidad v respecto a O. Llamaremos c 0 a la velocidad del pulso de luz respecto a O0 . Quizás no sea equivocado pensar que c0 = c − v

(1.1)

c02 = c2 + v 2 − 2vc cos θ ,

(1.2)

Esta ecuación implica que:

donde θ es el ángulo que se forma entre c y v . La Figura 1.1 muestra los vectores c, v y c 0 , el ángulo θ, y el ángulo θ0 que se forma entre c 0 y v . En esta figura se ve claramente que c cos θ = v + c0 cos θ0 . Remplazando este valor en el lado derecho de (1.2) se llega a: c02 = c2 + v 2 − 2v(v + c0 cos θ0 ) c02 + 2v cos θ0 c0 − (c2 − v 2 ) = 0 Esta u ´ltima es una ecuación de segundo grado, y sus dos soluciones son "

v c = c − cos θ0 ± c

r

v2 1 − 2 sen2 θ0 c

0

#

La solución con el signo inferior da una c0 negativa, y por eso es inaceptable. Queda la solución del signo superior: "

v c0 = c − cos θ0 + c

r

v2 1 − 2 sen2 θ0 c

# (1.3)

Nótese que c0 depende expl´ıcitamente de θ0 : la velocidad c0 de la luz es 7

anisótropa. En O se cumplen las ecuaciones de Maxwell y por consiguiente la velocidad de la luz es isótropa. En O0 la velocidad de la luz es anisótropa, o sea que para ese observador no se deben cumplir las ecuaciones de Maxwell. Hemos llegado a una idea importante: si la f´ ormula (1.1) es v´ alida, las ecuaciones de Maxwell se cumplen u ńicamente para un observador inercial. Este observador es especial, privilegiado. Ser´ıa interesante averiguar la velocidad v de la Tierra respecto a O. Si decimos que O0 es un laboratorio fijo en la Tierra, la ecuación (1.1) podr´ıa utilizarse para medir v: la anisotrop´ıa de la velocidad c0 indicar´ıa la magnitud de v. La gran dificultad experimental se centra en el hecho de que en (1.1) ocurre la fracción v/c que, presumiblemente, es muy peque˜ na. En efecto, las velocidades involucradas con nuestro planeta son muy bajas en comparación con c; por ejemplo, la velocidad de la Tierra respecto al Sol es tan sólo 30 km/s, es decir, 104 veces más peque˜ na que c. Se necesitar´ıa un instrumental sumamente fino para averiguar la v de la Tierra a través de la fórmula (1.1). Ocurr´ıa, felizmente, que a fines del siglo XIX los instrumentos ópticos ya hab´ıan alcanzado un nivel de precisión suficiente.

1.3

El experimento de Michelson y Morley

El interferómetro de Michelson está capacitado para mostrar la supuesta anisotrop´ıa de la velocidad c0 . La luz incide sobre un espejo semitransparente P colocado a 45o , de modo que en P emergen dos rayos perpendiculares. Uno de los rayos va hacia el punto A, donde hay un espejo; el otro rayo va hacia el punto B, donde hay otro espejo. Los rayos reflejados en los espejos A y B se re´ unen finalmente en una pantalla de observaci´ on, como muestra la Figura 1.2. En la pantalla se observa la interferencia de las se˜ nales que provienen de los espejos que hay en A y B. Llamemos t0P AP al tiempo total que tarda la luz para recorrer el trayecto P AP , y t0P BP para el trayecto P BP . La interferencia en la pantalla depende del retardo t0P AP − t0P BP de una se˜ nal respecto a la otra. Si t0P AP − t0P BP es un n´ umero entero de per´ıodos, hay interferencia constructiva y la pantalla muestra mucho brillo, alta intensidad. Y si t0P AP − t0P BP es un n´ umero impar de semiper´ıodos, se observa interferencia destructiva: cero intensidad y pantalla opaca. En el experimento se usa un interferómetro cuyos brazos P A y P B tienen la misma longitud L. Si la velocidad c0 de la luz fuera la misma en todas las direcciones, la luz demor8

ar´ıa el mismo tiempo recorriendo los trayectos P AP y P BP , y se observar´ıa interferencia constructiva en la pantalla. Pero la fórmula (1.3) afirma que c0 es anisótropa y, en consecuencia, el retardo t0P AP − t0P BP también debe ser anisótropo: esto significa que el grado de interferencia en la pantalla debe depender de la orientación que se le dé al interfer´ ometro. Veamos el análisis que hace un observador en reposo respecto a la Tierra. Llamamos α al ángulo formado por v y la dirección P A, como muestra la Figura 1.2. Para el recorrido P A hacemos θ0 = α en la fórmula (1.3): "

v c0 = c − cos α + c

r

v2 1 − 2 sen2 α c

#

El tiempo que demora la luz en este trayecto es L/c0 :

t0P A

L = c

"

v − cos α + c

r

v2 1 − 2 sen2 α c

#−1

Para el trayecto AP hacemos θ0 = α + π en la fórmula (1.3). Para el trayecto P B hacemos θ0 = α + π/2 y para BP se tiene θ0 = α − π/2. Llegamos a

t0AP

L = c

t0P B

L = c

t0BP

L = c

"

v + cos α + c

r

v2 1 − 2 sen2 α c

#−1

"

r

#−1

"

r

#−1

v + sen α + c

v − sen α + c

v2 1 − 2 cos2 α c

v2 1 − 2 cos2 α c

El retardo t0P AP − t0P BP es la diferencia (t0P A + t0AP ) − (t0P B + t0BP ): t0P AP

−

t0P BP

2L/c = 1 − v 2 /c2

"r

v2 1 − 2 sen2 α − c 9

r

v2 1 − 2 cos2 α c

# (1.4)

Al mirar esta ecuación, concentremos nuestra atención en tres de las variables que en ella participan: t0P AP − t0P BP corresponde al grado de interferencia, α es la orientaci´ on que se le da al interfer´ ometro y v es la velocidad de la Tierra. Escogiendo un α y midiendo el grado de interferencia, deber´ıamos ser capaces de deducir el valor de v. El problema es que el grado de interferencia no es una cantidad fácil de medir. Por tal motivo, no es aconsejable que se use un sólo valor de α, sino permitir que α tome todos los valores dentro de un rango continuo. En tal caso nos interesa tomar la derivada de t0P AP − t0P BP respecto a α: d 0 (t − t0P BP ) = dα P AP −





 (Lv 2 /c3 ) sen 2α  1 1 r  + r   2 2 2 2 1 − v /c v v 1 − 2 sen2 α 1 − 2 cos2 α c c

(1.5)

Podr´ıamos utilizar esta ecuación si α cambiara a medida que pasa el tiempo, es decir, si el interfer´ ometro, como un todo, se hiciera rotar continuamente. En tales circunstancias el patrón de interferencia deber´ıa ir cambiando a medida que pasa el tiempo. Michelson y Morley efectivamente montaron el interferómetro sobre un “lago” de mercurio, lo que les permitió rotarlo suave y continuamente. ¿Qué esperaban ellos? Ellos esperaban que, a medida que rotaran el espectrómetro, el patrón de interferencia fuera cambiando paulatinamente. Pero, para su sorpresa, el patrón de interferencia permaneció inmutable, sin mostrar ning´ un cambio paulatino. Esto significa que la derivada (1.5) tiene que ser cero para todos los valores del ángulo α. Haciendo (1.5) igual a cero se llega a: r v

2

v2 1 − 2 cos2 α = −v 2 c

r 1−

v2 sen2 α c2

(1.6)

Esta ecuación corresponde al resultado experimental. Hay dos posibilidades: La primera es v = 0. La segunda posibilidad es v 6= 0; pero si v 6= 0 la ecuación (1.6) es absurda; no puede ser válida, porque implica que una cantidad positiva iguale a una cantidad negativa. La u ńica implicación válida de (1.6) es v = 0. Esta conclusión dice que 10

la Tierra estar´ıa en reposo respecto al éter; la Tierra ser´ıa ese u ńico y privilegiado observador en el que se cumplen las ecuaciones de Maxwell, ese observador en el que la velocidad de la luz es isótropa. Eso es incre´ıble. Como el análisis de los resultados del experimento conduce a una conclusión incre´ıble, nos vemos impulsados a pensar que alguna de las suposiciones en que se basa el análisis está probablemente equivocada. Volviendo sobre los pasos del estudio recién hecho, nos damos cuenta de que la suposición (1.1) es el paso débil, el que podemos abandonar. De ahora en adelante vamos a pensar que (1.1) es falsa. En nuestro haber tenemos un hecho experimental y una gu´ıa teórica: El hecho experimental: la velocidad de la luz es isótropa respecto a la Tierra. La gu´ıa te´ orica: la ecuación (1.1) es falsa. El hecho experimental trae consigo una pregunta inmediata: ¿acaso el planeta Tierra es el u ńico observador respecto al cual la velocidad de la luz es isótropa? Nos parece prudente responder de esta manera: No vemos ninguna razón que nos lleve a pensar que este planeta es especial; si la velocidad de la luz es isótropa respecto al observador inercial O0 , se espera que también sea isótropa respecto a todos los otros observadores inerciales O00 , O000 , ...etc: todas las velocidades c, c0 , c00 , c000 , ... etc. deben ser isótropas. Demos un salto adicional: supongamos que c = c0 = c00 = c000 ... El salto, en palabras, dice que la velocidad de la luz es la misma para todos los observadores inerciales. Este enunciado es El Principio de la Constancia de la Velocidad de la Luz. De otro lado, la frase escrita en bastardilla en la página 8 se˜ nala que la ecuación (1.1) es un impedimento; si ahora adoptamos la gu´ıa te´ orica recién mencionada, desaparece el impedimento y se nos abre un camino interesante: la posibilidad de que las ecuaciones de Maxwell sean v´ alidas para todos los observadores inerciales.

1.4

La transformaci´ on de Galileo

El siguiente conjunto de ecuaciones: t0 = t r0 = r − v t 11

(1.7)

recibe el nombre de la transformaci´ on de Galileo 7 . Tomando una derivada temporal se llega a la fórmula galileana para la adición de velocidades: u0 = u − v ,

(1.8)

y tomando otra derivada temporal: a0 = a

(1.9)

Estas ecuaciones son tradicionales en la f´ısica clásica. Han tenido gran prestigio por dos razones: primero, porque la ecuación (1.8) es cercana a nuestra intuición, nos parece “natural” y razonable; y segundo, porque la teor´ıa de la mecánica newtoniana es invariante bajo las transformaciones (1.7). Nótese de paso que haciendo u = c y u 0 = c 0 , la ecuación (1.8) se convierte en (1.1). Esto muestra que en el fondo de (1.1) está (1.8); dado que queremos abandonar (1.1), lo que verdaderamente queremos abandonar es la transformación de Galileo (1.8). La teor´ıa de la relatividad repudia la transformación de Galileo. Queremos substituir la transformación de Galileo por otra que esté de acuerdo con la isotrop´ıa de u 0 que resulta en el experimento de Michelson y Morley. Para encontrar la nueva transformación nos basaremos en estos tres postulados: 1) El Principio de la Constancia de la Velocidad de la Luz. 2) El Principio de la Relatividad.

(1.10)

3) El Principio de la Homogeneidad del Espacio y el Tiempo. Las próximas secciones están dedicadas a la descripción de estos tres postulados.

1.5

La constancia de la velocidad de la luz

La velocidad de la luz en el vac´ıo es la misma para todos los observadores inerciales: éste es el principio de la constancia de la velocidad de la luz. 7

As´ı la llam´ o Philipp Frank en 1909.

12

El sentido de este principio se puede entender con el siguiente ejemplo. Supongamos que alguien apunta una linterna hacia el norte, la prende, y un instante después la apaga; de este modo se forma un pulso de luz que viaja hacia el norte. La velocidad de este pulso es 300.000 km/s. Pensemos en un observador inercial que también viaja hacia el norte en un cohete de alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene 300.000 km/s. Pensemos en otro observador inercial que viaja hacia el sur en un cohete de alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene 300.000 km/s. Pensemos a´ un en otro observador inercial que viaja hacia el oriente; si mide la velocidad del pulso de luz, obtiene 300.000 km/s. Todos los observadores inerciales, los lentos, los veloces, los que viajan en esta dirección, los que viajan en esa otra dirección, todos ellos registran que la velocidad del pulso de luz es 300.000 km/s. Cualquiera que sea el estado de movimiento del observador inercial, él siempre registra que la velocidad del pulso es 300.000 km/s. Si el observador persigue al pulso con intención de darle alcance, nunca lo logra, porque el pulso se aleja con velocidad 300.000 km/s. Y si el observador huye del pulso de luz, de nada le vale viajar muy rápido porque el pulso siempre tendrá velocidad 300.000 km/s. El principio que estamos discutiendo afirma que la velocidad de la luz es independiente de la velocidad relativa entre el observador y la fuente de luz. Si este principio es válido, el resultado del experimento de Michelson y Morley no presenta ninguna paradoja y es enteramente entendible: la luz tiene la misma velocidad en los dos brazos del interfer´ ometro y por consiguiente tarda lo mismo en recorrer ambas rutas, o sea que las franjas de interferencia no tienen por qué mostrar variaciones. No hay tal cosa como “la velocidad de la luz respecto al éter”, éste queda devaluado y se puede incluso considerar la posibilidad de erradicarlo de la f´ısica.

1.6

El principio de la relatividad

La experiencia de viajar en automóvil en l´ınea recta y a velocidad constante es muy simple: no se siente nada especial. Uno puede comer, tomar café y recoger un lápiz que se cayó, del mismo modo como se realizan esas actividades en casa. En realidad las experiencias en el carro y en casa son iguales. Estamos poniendo de manifiesto una de las observaciones más importantes de la f´ısica, al establecer que todos los observadores inerciales son equivalentes. Esto, que ning´ un observador inercial es preferido, es lo que afirma el 13

Principio de la Relatividad: lo que ocurre para un observador inercial también puede ocurrir para cualquier otro observador inercial. Las leyes de la f´ısica son las mismas para todos los sistemas inerciales. ¿Cómo se aplica este principio, de qué modo se implementa en las ecuaciones de la f´ısica? Para responder esta pregunta presentemos un ejemplo: la ley de la conservación del momentum debe ser válida en todos los sistemas inerciales. Esta ley de conservaci´ on se expresa mediante una ecuación; lo que el principio de la relatividad afirma es que tal ecuación se cumple para todos los observadores inerciales. Más concretamente, pensemos en el choque de dos part´ıculas, llamando pa al momentum total antes del choque, y pd al momentum total después del choque. La ley de la conservaci´ on del momentum dice que pa = pd

(1.11)

Esto es lo que registra un observador inercial O. Ahora introducimos otro observador inercial O0 . El nuevo observador registra que el momentum antes del choque es p0a , y después p0d ; este observador también registra que se conserva el momentum: p0a = p0d

(1.12)

Nótese que las ecuaciones (1.11) y (1.12) tienen la misma forma. La ecuación que expresa la ley de conservaci´ on tiene la misma forma para todos los observadores inerciales. Este ejemplo del choque de dos part´ıculas nos ha servido para ver la manera como se expresa, formalmente, el principio de la relatividad: las ecuaciones que representan las leyes de la f´ısica tienen la misma forma para todos los observadores inerciales.

1.7

Homogeneidad del espacio y el tiempo

La observación directa nos permite afirmar que la Luna da una vuelta alrededor de la Tierra en 28 d´ıas, y ésta da una vuelta alrededor del Sol en 365 d´ıas. Si el sistema solar en pleno se trasladara a otro lugar B del universo, allá funcionar´ıa como funciona aqu´ı, sin ninguna modificación: la “nueva” Luna tomar´ıa 28 d´ıas para darle una vuelta a la “nueva” Tierra, y ésta dar´ıa una vuelta alrededor del “nuevo” Sol en 365 d´ıas. Pensamos que el sistema solar funcionar´ıa lo mismo en un lugar A y en otro B. Respecto al tiempo 14

tenemos una idea similar: si el sistema solar se trasladara en pleno al futuro o al pasado, funcionar´ıa como funciona ahora, sin ninguna modificación. Conviene anotar que las ideas recién expresadas se basan en la suposición de que el sistema solar está aislado del exterior, o al menos suficientemente aislado. En general, cualquier sistema aislado funcionar´ıa lo mismo si se le trasladara en el espacio, y también funcionar´ıa lo mismo si se le trasladara en el tiempo. Dicho de otra manera, todos los puntos del espacio son equivalentes, y todos los instantes son equivalentes: éste es el principio de la homogeneidad del tiempo y el espacio. Las interacciones que se dan entre los objetos f´ısicos que pueblan el universo hacen que en un lugar ocurran fenómenos diferentes de los que ocurren en otro lugar: no es lo mismo pararse en la superficie de la Luna y pararse en la superficie de la Tierra. La diferencia entre estos dos lugares no indica que esos puntos del espacio sean inequivalentes; la diferencia proviene de las interacciones que se dan entre los objetos f´ısicos que hay en el universo.

1.8

El concepto de observador

Las coordenadas (x, y, z) de los puntos del espacio se pueden establecer con relojes y pulsos de luz, como explicaremos enseguida. En un punto del espacio tenemos un reloj; enviamos un pulso de luz a otro punto donde hay un espejo, y esperamos a que el pulso regrese al punto inicial. Registramos el tiempo ∆t que toma el pulso en el viaje total de ida y vuelta, y finalmente decimos que la distancia entre los dos puntos es 12 c∆t. De esta manera se establecen las distancias entre todos los puntos y podemos calibrar o marcar las escalas de los tres ejes cartesianos. Todo punto en el espacio se caracteriza por medio de sus tres coordenadas (x, y, z). Ahora suponemos que en todo punto del espacio hay un reloj en reposo, formándose as´ı una gran red tridimensional, r´ıgida e infinita. A esta gran malla r´ıgida de relojes se le llama observador. Si suponemos que todos los relojes son igualmente construidos, podemos afirmar que marchan a la misma frecuencia. A pesar de que tengan la misma frecuencia, los relojes podr´ıan estar descuadrados, es decir, podr´ıa ser que marquen horas diferentes por haber comenzado a marchar en diferentes instantes. Es preciso sincronizarlos. Para sincronizar dos relojes, el reloj uno env´ıa un pulso de luz hacia el reloj dos, y mide el tiempo ∆t que tarda el pulso en ir y regresar. Supong15

amos que ∆t = 6 minutos. Más tarde, cuando en el reloj uno sean las 3:57 p.m., el reloj uno env´ıa otra se˜ nal luminosa hacia el reloj dos con la siguiente instrucción: “en el instante en que reciba esta se˜ nal, cuadre las manecillas de su reloj en la hora 4:00 p.m.”. De esta manera se pueden sincronizar todos los relojes de un observador inercial. En lo sucesivo, siempre que hablemos de observador inercial, hemos de entender que sus relojes están sincronizados. Veamos de qué manera este observador registra el vuelo de una part´ıcula puntual. A medida que transcurre el tiempo, la part´ıcula visita un punto, y otro, y otro, y los relojes de los puntos visitados registran a qué hora fueron visitados. Luego se recogen todos los registros y se reconstruye la trayectoria: la part´ıcula pasó por tal punto en tal instante, pasó por aquel otro punto en este otro instante, etc. As´ı se establece la posición de la part´ıcula como función del tiempo. Nótese que los relojes no necesitan enviar datos a un computador central ni hay un reloj principal: el observador no es un ser humano que usa la vista, sino que es un látice infinito con un reloj en cada punto. Llamemos O a un observador inercial, y O0 a otro observador inercial que se mueve con cierta velocidad (constante) v respecto a O. Nos imaginamos dos mallas de relojes, una para O y otra para O0 ; las dos mallas se cuelan una a través de la otra, y cada una de ellas tiene su propio sistema de coordenadas. En cada punto del espacio hay dos relojes, uno pertenece a O y el otro pertenece O0 , de manera que el de O0 se desplaza con velocidad v respecto al de O. Podemos pensar que hay un n´ umero infinito de observadores inerciales, y cada uno es una malla r´ıgida de relojes; estas mallas se cuelan unas entre las otras; en cada punto del espacio hay un n´ umero infinito de relojes que pertenecen a todos los observadores inerciales. Todos los observadores inerciales son igualmente dignos, no hay ninguno preferido, todos registran las mismas leyes de la f´ısica: las ecuaciones que expresan las leyes de la f´ısica tienen la misma forma para todos estos observadores. Como todos los observadores inerciales están en un plano de igualdad, no habiendo ninguno que sea especial, desaparecen las nociones de espacio y tiempo absolutos. Cada observador tiene pleno derecho a medir distancias y tiempos, y los resultados de sus mediciones son distancias verdaderas y tiempos verdaderos. Aqu´ı se establece una diferencia radical con la f´ısica preeinsteiniana. En esa f´ısica la variable t se refiere al tiempo absoluto, ese flujo imperturbable dentro del cual se supon´ıa que las cosas del mundo f´ısico 16

están inscritas. En la relatividad especial t es lo que marca un reloj. Nota. Antes de concluir esta sección queremos hacer un comentario acerca de la velocidad que puede tener un observador inercial respecto a otro. El lector notará, obviamente, que esta nota desubicada introduce un elemento de desorden, pero a´ un as´ı queremos presentarla desde ya, porque pronto nos será u ´til. Supongamos que deseamos acelerar una part´ıcula masiva con el propósito de que adquiera la velocidad de la luz c. Tal como veremos en la sección 3.5, cuando estudiemos la dinámica relativista, para realizar este proceso habr´ıa que darle a la part´ıcula una energ´ıa infinita, y por eso es imposible: no se puede acelerar una part´ıcula masiva hasta darle la velocidad c. Esta afirmación está de acuerdo con el hecho de que no se observan part´ıculas masivas que viajen a la velocidad de la luz. Los laboratorios (los laboratorios constan de objetos masivos como relojes) tienen velocidades que son menores que c: la velocidad relativa entre dos observadores inerciales es siempre menor que c.

1.9

Transformaciones de coordenadas

Un evento es un punto en el espaciotiempo. Un evento no es un suceso, no es algo que ocurre, sino que es un simple punto en el cuadriespacio. En un evento pueden ocurrir fenómenos, como por ejemplo la desintegraci´ on de una part´ıcula. Para caracterizar un evento, el observador O usa cuatro n´ umeros (t, x, y, z) de la manera siguiente; supongamos que una part´ıcula se desintegra en el evento (9,2,4,6); esto quiere decir que el fenómeno ocurre en aquel lugar cuyas coordenadas espaciales son (2,4,6) y que el reloj que se encuentra en ese punto marca t = 9 en el instante de la desintegraci´ on. As´ı como en la sección anterior, pensemos en dos observadores inerciales O y O0 tales que el segundo se mueve respecto al primero con cierta velocidad (constante) v . Un evento cualquiera, genérico, tiene coordenadas (t, x, y, z) en el sistema O y tiene coordenadas (t0 , x0 , y 0 , z 0 ) en el sistema O0 . Con t y t0 queremos decir que en el sitio y en el instante del evento hay dos relojes que pertenecen a O y O0 . (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son las coordenadas de un mismo evento para dos observadores diferentes. Debe existir una manera de averiguar las cuatro coordenadas (t0 , x0 , y 0 , z 0 ) cuando se conocen v y las cuatro coordenadas (t, x, y, z). Pero, y aqu´ı radica la importancia, no se trata de encontrar 17

las fórmulas de conexión para un evento particular, sino las fórmulas de conexión para todos los eventos; en términos matemáticos, se debe reconocer que (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son variables algebraicas. Las coordenadas primadas deben ser funciones de las no primadas: t0 = t0 (v , t, x, y, z) x0 = x0 (v , t, x, y, z) y 0 = y 0 (v , t, x, y, z)

(1.13)

z 0 = z 0 (v , t, x, y, z) A cualquier conjunto de cuatro ecuaciones como (1.13) se le llama transformaci´ on de coordenadas. Hay, por supuesto, un n´ umero infinito de transformaciones de coordenadas, pero sólo una es verdadera. Es decir, hay sólo una transformación que verdaderamente corresponde a los registros de las dos mallas infinitas de relojes (la red primada y la no primada). En las próximas secciones concentraremos el esfuerzo en encontrar la transformación verdadera. Ese es nuestro propósito a corto plazo. No podemos olvidar, sin embargo, el propósito a largo plazo, el gran objetivo del proyecto relativista: que se cumpla el principio de la relatividad: que las leyes de la f´ısica se expresen mediante ecuaciones que tengan la misma forma para todos los observadores inerciales. Por ejemplo, para los observadores O y O0 la ecuación de Maxwell ∇ · B = 0 se escribe ∂By ∂Bz ∂Bx + + ∂x ∂y ∂z

= 0

∂By0 ∂Bx0 ∂Bz0 + + ∂x0 ∂y 0 ∂z 0

= 0

Debemos ser capaces de pasar de una ecuación a la otra: que las dos ecuaciones sean equivalentes. Para que se pueda ejecutar la conversi´ on de una de las ecuaciones en la otra, la teor´ıa de la relatividad debe suministrar: 1) La fórmula que permita averiguar las variables (Ex0 , Ey0 , Ez0 , Bx0 , By0 , Bz0 ) cuando se conocen las (Ex , Ey , Ez , Bx , By , Bz ) (a esa fórmula se le dice “la transformación del campo electromagnético”, y la deduciremos en el cap´ıtulo 4).

18

µ ¶ ∂ ∂ ∂ 2) La fórmula que permita averiguar las variables , , cuan∂x0 ∂y 0 ∂z 0 ¶ µ ∂ ∂ ∂ do se conocen las , , . Más precisamente, la fórmula que permite ∂x ∂y ∂z averiguar las variables (t0 , x0 , y 0 , z 0 ) cuando se conocen las (t, x, y, z); esta fórmula se llama “la transformación verdadera de las coordenadas”, y la deduciremos enseguida. El propósito 2) de encontrar la transformación verdadera de coordenadas es válido de por s´ı; pero ese propósito cobra una gran importancia cuando se inscribe dentro del principio de la relatividad 1), que pide que las ecuaciones que expresan las leyes de la f´ısica sean las mismas para todos los observadores inerciales (que las ecuaciones sean invariantes). La transformación verdadera de coordenadas deja invariantes las ecuaciones que describen las leyes de la f´ısica. Hay dos métodos para encontrar la transformación verdadera de coordenadas: Método a): Acudir a las ecuaciones que expresan las leyes de la f´ısica y averiguar la transformación de coordenadas que las deja invariantes (esta ruta se explora en el apéndice). Método b): Establecer un conjunto de primeros principios, como por ejemplo (1.10), deducir una transformación de coordenadas a partir de ellos y luego estudiar si las ecuaciones de las leyes f´ısicas son covariantes: si lo son, entonces la transformación es muy probablemente la transformación verdadera de coordenadas. En la próxima sección seguiremos el método b) y encontraremos:

v t− 2 x c t0 = p 1 − v 2 /c2 x − vt x0 = p 1 − v 2 /c2 y0 = y z0 = z 19

(1.14)

Einstein dedujo estas transformaciones en su célebre art´ıculo [2] de 1905 en el que funda la relatividad especial. Ellas son quizá las ecuaciones más importantes de la f´ısica del siglo XX, y se conocen como las transformaciones de Lorentz. El origen de este nombre es curioso, porque las ecuaciones (1.14) ya hab´ıan sido obtenidas, usando el método a), por Hendrik Antoon Lorentz [4] unos meses antes, cuando el holandés probó la covariancia de los campos eléctrico y magnético bajo la transformación (1.14) (sin embargo, por un error de cálculo, sólo pudo probar la covariancia hasta primer orden en v/c). Einstein, que no conoc´ıa este trabajo de Lorentz, dedujo independientemente las transformaciones (1.14). Lorentz no le dio al t0 de estas ecuaciones la importancia que luego habr´ıa de lograr en la relatividad; en efecto, Lorentz pensaba en 1904 que mientras t es el tiempo verdadero, la variable t0 era simplemente una cantidad auxiliar.

1.10

Las transformaciones de Lorentz

Einstein [2] se basa en los tres principios (1.10) para derivar las transformaciones de Lorentz. Aqu´ı seguiremos la presentaci´ on de Resnick [6] que nos parece más ordenada y pedagógica. As´ı como en las secciones anteriores, suponemos que la velocidad de separación v es paralela al eje com´ un xx0 . Comencemos el estudio demostrando que las ecuaciones (1.13) deben ser lineales. Para tal efecto consideremos dos eventos que son iguales en todo, excepto en la coordenada x; en estas condiciones podemos decir que los dos eventos son (t, x, y, z) y (t, x + δx, y, z). Asumiendo que δx es infinitesimal nos preguntamos cuál es la separación δx0 de acuerdo con el observador O0 . Tomando diferenciales δ en la segunda de las ecuaciones (1.13) escribimos: δx0 =

∂x0 ∂x0 ∂x0 ∂x0 δt + δx + δy + δz, ∂t ∂x ∂y ∂z

pero δt = δy = δz = 0, entonces δx0 =

∂x0 δx ∂x

(1.15)

La homogeneidad del espacio nos permite afirmar que, para un δx dado, el 20

valor δx0 debe ser igual en todas las regiones del espacio, o sea que ∂x0 /∂x debe ser independiente de x, y, z. As´ı mismo, la homogeneidad del tiempo dice que δx0 debe ser igual en todas las épocas, o sea que ∂x0 /∂x es independiente del tiempo. En conclusión, la derivada ∂x0 /∂x es una constante. Consideraciones parecidas, invocando la homogeneidad del espacio y del tiempo, nos llevan a afirmar que ∂x0 /∂t, ∂x0 /∂y, ∂x0 /∂z son también constantes. La segunda función (1.13) debe ser: x0 = a10 t + a11 x + a12 y + a13 z,

(1.16)

con a10 , a11 , a12 , a13 constantes. Se puede repetir este razonamiento para las otras tres funciones de (1.13), con resultados similares a (1.16): t0

=

a00 t

+

a01 x

+

a02 y

+

a03 z

(1.17)

0

x

=

a10 t

+

a11 x

+

a12 y

+

a13 z

(1.18)

y

0

=

a20 t

+

a21 x

+

a22 y

+

a23 z

(1.19)

z

0

=

a30 t

+

a31 x

+

a32 y

+

a33 z

(1.20)

Aqu´ı los 16 coeficientes aµν son constantes. Ahora procedemos a averiguar los valores de estos coeficientes utilizando los tres principios (1.10). Primero vamos a averiguar los ocho coeficientes de las dos u ´ltimas ecuaciones (1.19) y (1.20), y luego atacaremos las dos primeras ecuaciones (1.17) y (1.18). Los puntos que pertenecen al eje x (los que tienen y = z = 0) también pertenecen al eje x0 , es decir, tienen y 0 = z 0 = 0. Formalmente, las condiciones {y = z = 0} y {y 0 = z 0 = 0} se implican mutuamente: {y = z = 0}

⇔

{y 0 = z 0 = 0}

De aqu´ı podemos concluir que a20 = a21 = a30 = a31 = 0. Los puntos que pertenecen al plano xy (los que tienen z = 0) también pertenecen al plano x0 y 0 , es decir, tienen z 0 = 0. Formalmente: z=0

⇔ 21

z0 = 0

De aqu´ı se deduce que a32 = 0. Un razonamiento similar (con el plano xz) nos lleva a que a23 = 0 . Vamos a probar que a22 = 1 al comparar estas dos situaciones: Situaci´ on 1: En t = 0 hay una varilla en reposo respecto a O parada en el eje y, con sus extremos en los puntos y = 0 y y = L; o sea que los dos extremos tienen coordenadas no primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos de qué manera el observador O0 registra este objeto: claramente se trata de una varilla que viaja hacia la izquierda y cuyos extremos tienen, de acuerdo con (1.19), coordenadas primadas y 0 = 0 y y 0 = a22 L. Situaci´ on 2: En t0 = 0 hay una varilla en reposo respecto a O0 parada en el eje y 0 , con sus extremos en los puntos y 0 = 0 y y 0 = L; o sea que los dos extremos tienen coordenadas primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos de qué manera el observador O registra este objeto: claramente se trata de una varilla que viaja hacia la derecha y cuyos extremos tienen, de acuerdo con (1.19), coordenadas no primadas y = 0 y y = L/a22 . De acuerdo con el principio de la relatividad (1.10), la Situaci´ on 1 y la Situaci´ on 2 son equivalentes. Entonces a22 L = L/a22 , de donde a22 = 1. Un análisis parecido nos permitirá concluir que a33 = 1. Ya hemos averiguado los ocho coeficientes de las ecuaciones (1.19) y (1.20), ecuaciones que ahora se escriben: y0 = y ,

z0 = z

(1.21)

Nos falta estudiar las ecuaciones (1.17) y (1.18). Comencemos considerando dos eventos (t, x, y, z) y (t, x, −y, z). Por la homogeneidad del espacio, ambos eventos deben tener la misma coordenada temporal t0 . En vista de (1.17) concluimos que a02 = 0. Un análisis parecido nos conduce a que a03 = 0. Hasta el momento la ecuación (1.17) se ha convertido en t0 = a00 t + a01 x

(1.22)

Pensemos en los eventos del plano x = 0; de acuerdo con la ecuación (1.22), los eventos de este plano cumplen la ecuación t0 = a00 t. Para estos eventos la condición t > 0 debe implicar que t0 > 0, o sea que a00 debe ser positiva: 22

a00 > 0

(1.23)

Sean (T, X, Y, Z) las coordenadas no primadas de un evento cualquiera en el plano x0 = 0. Haciendo x0 = 0 en (1.18) escribimos: a10 T + a11 X + a12 Y + a13 Z = 0

(1.24)

Si hacemos T = X = 0 en (1.24) se obtiene a12 Y + a13 Z = 0 Como esta u ´ltima ecuación debe cumplirse para todos los (arbitrarios) valores de Y y de Z, entonces a12 = a13 = 0. Con este resultado regresamos a (1.24) para escribir a10 T + a11 X = 0

(1.25)

No olvidemos que (T, X, Y, Z) pertenece al plano x0 = 0, cuyos puntos cumplen la condición X = vT ; claramente la ecuación (1.25) dice que a10 T + a11 v T = 0, de donde a10 = −va11 . Hasta el momento la ecuación (1.18) se ha convertido en x0 = a11 (x − vt)

(1.26)

Demostraremos enseguida que a11 debe ser positiva. Para tal efecto consideremos aquellos eventos que están a la derecha del origen de O0 ; esos eventos cumplen las condiciones x0 > 0 y x > vt. En otras palabras, x > vt ⇒ x0 > 0. Al poner esto en (1.26) encontramos: a11 > 0 Hagamos un resumen de lo que hemos averiguado hasta el momento: 23

(1.27)

t0 = a00 t + a01 x x0 = a11 (x − vt) y0 = y

(1.28)

z0 = z Hasta aqu´ı se llega usando los principios de la relatividad y de la homogeneidad del espacio y del tiempo. Pero todav´ıa hay tres coeficientes desconocidos a00 , a01 , a11 , o sea que (1.28) no es una transformación particular, sino una familia de transformaciones. Para individualizar una transformación particular es necesario dar los valores de a00 , a01 y a11 , lo que se logra imponiendo alguna condición suplementaria. Por ejemplo, la transformación de Galileo (1.7) pertenece a la familia de transformaciones (1.28). Para obtener Galileo a partir de (1.28) se impone la condición suplementaria a01 = 0, a00 = a11 = 1. La transformación de Lorentz también pertenece a la familia de transformaciones (1.28). Einstein obtiene la transformación de Lorentz usando, como condición suplementaria, el principio de la constancia de la velocidad de la luz. En efecto, tal como veremos enseguida, al implementar este principio quedan un´ıvocamente determinados los tres coeficientes a00 , a11 , a01 . Supongamos que un pulso de luz sale del origen de coordenadas cuando los or´ıgenes de O y O0 coinciden. Un tiempo después, este pulso llega a un evento E. Las coordenadas no primadas de E son (t, x, y,pz), y las primadas 2 2 2 son (t0 , x0 , y 0 , z 0 ). Para O la velocidad del p pulso es c = x + y + z /t, y 2 2 2 para O0 la velocidad del pulso es c0 = x0 + y 0 + z 0 /t0 . Pero c0 = c, por el principio de la constancia de la velocidad de la luz: c = c =

p x2 + y 2 + z 2 t p 2 0 x + y02 + z02 t0

Estas dos ecuaciones pueden escribirse as´ı: c2 t2 − (x2 + y 2 + z 2 ) = 0 2

2

2

2

c2 t0 − (x0 + y 0 + z 0 ) = 0 24

(1.29) (1.30)

Usar ahora las cuatro ecuaciones (1.28) en (1.30) para que (1.30) quede en términos de cantidades no primadas: (c2 a200 − v 2 a211 )t2 − (a211 − c2 a201 )x2 − y 2 − z 2

(1.31)

+ 2 (c2 a00 a01 + va211 ) xt = 0

Vamos a comparar, término a término, las ecuaciones (1.29) y (1.31); igualando los coeficientes correspondientes se llega a: c2 a200 − v 2 a211 = c2 a211 − c2 a201 = 1 c2 a00 a01 + va211 = 0 Este es un sistema de tres ecuaciones para las tres incógnitas a00 , a01 , a211 . Hay dos soluciones: Primera soluci´ on: a211 =

1 , 1 − v 2 /c2

v/c2 a01 = p , 1 − v 2 /c2

1

a00 = − p

1 − v 2 /c2

Segunda soluci´ on: a211 =

1 , 1 − v 2 /c2

v/c2

a01 = − p

1−

v 2 /c2

,

1

a00 = p

1 − v 2 /c2

En vista de (1.23), la primera soluci´ on está descartada. Adoptamos entonces la segunda soluci´ on, utilizando (1.27) al tomar la ra´ız cuadrada de a211 : 1

a11 = a00 = p

1 − v / c2

,

v/c2

a01 = − p

1 − v / c2

p He aqu´ı el factor 1/ 1 − v 2 /c2 , que aparece innumerables veces en la relatividad. Tradicionalmente se le conoce como γ: 25

γ = p

1 1 − v 2 /c2

(1.32)

Los tres coeficientes son, entonces, a11 = a00 = γ, a01 = −γv/c2 y el resultado final de las transformaciones queda: v x) c2 x0 = γ (x − vt) t0 = γ (t −

y0 = y ,

(1.33)

z0 = z

Estas son las transformaciones de Lorentz. Las hemos presentado como una consecuencia directa de los tres postulados de la relatividad, y en este sentido ellas son del ámbito de la f´ısica teórica. Lo importante es que ellas también son del ámbito de la f´ısica experimental: innumerables experimentos realizados durante el siglo XX han confirmado, una y otra vez, y sin ninguna excepción, que las transformaciones de Lorentz son buenas. Anotemos que las transformaciones de Lorentz se confunden con las de Galileo a bajas velocidades. En efecto, las ecuaciones (1.33) se convierten en (1.7) cuando v ¿ c. Esta observaci´ on deja en claro que la relatividad especial abarca al pensamiento newtoniano, y que este u ´ltimo es un caso l´ımite del pensamiento relativista. El espaciotiempo relativista es diferente del newtoniano para todos los valores de v, pero la diferencia es notoria u ńicamente a altas velocidades. Si queremos expresar las coordenadas no primadas en términos de las primadas, podemos resolver estas cuatro ecuaciones simult´ aneas y despejar t, x, y, z. Pero hay otra manera más simple, que consiste en lo siguiente: en cada una de las cuatro ecuaciones se cambia v por −v y se intercambian coordenadas primadas y no primadas: v 0 x) c2 x = γ (x0 + vt0 ) t = γ (t0 +

y = y0 ,

(1.34)

z = z0

Generalizaci´ on. Hemos asumido que O0 se mueve, respecto a O, con una velocidad v que apunta en la dirección del eje com´ un x x0 . Enseguida escribimos el caso [7] general, cuando v apunta en cualquier dirección: 26

1 t0 = γ(t − 2 v · r) µc ¶ γ−1 0 r =r+ v · r − γt v v2

(1.35)

1 t = γ(t0 + 2 v · r0 ) ¶ µc γ−1 0 0 0 v · r + γt v r=r + v2

(1.36)

Los diferenciales. En diferenciales, las dos primeras ecuaciones (1.33) son: v ∆x) c2 = γ(∆x − v∆t)

∆t0 = γ(∆t −

(1.37)

∆x0

(1.38)

Y las inversas proceden de (1.34): v ∆x0 ) c2 ∆x = γ(∆x0 + v∆t0 ) ∆t = γ(∆t0 +

(1.39) (1.40)

También podemos escribir las ecuaciones (1.35) en diferenciales: 1 ∆t0 = γ(∆t − 2 v · ∆r) µc ¶ γ−1 0 ∆r = ∆r + v · ∆r − γ∆t v v2

(1.41) (1.42)

Las derivadas: A partir de las transformaciones (1.33) calculamos estas seis derivadas: ∂t0 ∂x0 = = γ, ∂t ∂x ∂x0 = −γv, ∂t

∂t0 γv =− 2, ∂x c 0 ∂y ∂z 0 = =1 ∂y ∂z

Ahora, la regla de la derivación en cadena dice que 27

(1.43)

∂ ∂t0 ∂ ∂x0 ∂ ∂y 0 ∂ ∂z 0 ∂ = + + + , 0 0 0 ∂t ∂t ∂t ∂t ∂x ∂t ∂y ∂t ∂z 0 entonces, utilizando las derivadas (1.43): ∂ ∂ ∂ = γ 0 − γv 0 , ∂t ∂t ∂x que escribimos cortamente ∂t = γ ∂t0 − γv ∂x0 . De la misma manera se calculan ∂x , ∂y , y ∂z : ∂t = γ ∂t0 − γv ∂x0 γv ∂x = γ ∂x0 − 2 ∂t0 c ∂y = ∂y0 ∂z = ∂z 0

c

c'

Luz

q'

q

(1.44)

a v

Figura 1.1 Las velocidades c, v y c 0 tales que c = v + c 0

Figura 1.2 Interfer´ ometro de Michelson. En P la luz se reparte hacia A y B. Después de reflejarse en los espejos, los haces se encuentran de nuevo en P y de all´ı salen juntos hacia el detector.

28

y x

y'

z x' z'

Figura 1.3 Definición de los sistemas coordenados. Los ejes x y x0 coinciden, los ejes y y y 0 son paralelos y los ejes z y z 0 también son paralelos. La velocidad de separación v apunta en direcci´ on x.

29

30

Cap´ıtulo 2

Propiedades del espaciotiempo En este cap´ıtulo nos proponemos estudiar las consecuencias más directas de las transformaciones de Lorentz. La más importante se refiere a dos eventos que son simultáneos para un observador: para otros observadores, en general, esos dos eventos no son simult´ aneos. Directamente conectado con esto aparece otro efecto curioso: la longitud de un objeto cualquiera depende, en general, del estado de movimiento del observador que la registra. Las implicaciones de estos dos resultados son inmediatas. Surge un conjunto de definiciones y efectos de primera importancia: el tiempo propio, la longitud propia, el modo como se adicionan velocidades y como se adicionan aceleraciones. Estos asuntos están cobijados por la idea central de la relatividad, la gran idea que revolucionó el pensamiento cient´ıfico: el espacio y el tiempo no son independientes uno del otro, sino que forman un todo espaciotemporal. Consideremos dos eventos E1 y E2 . El observador O registra que estos dos eventos tienen coordenadas (t, r) y (t + ∆t, r + ∆r), respectivamente. Para O0 las coordenadas1 de E1 y E2 son (t0 , r0 ) y (t0 + ∆t0 , r0 + ∆r0 ). La conexión entre ∆t, ∆r, ∆t0 y ∆r0 está dada por las fórmulas (1.41) y (1.42). Supongamos que para O la separación entre los dos eventos es puramente espacial, es decir, ∆t = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos eventos tienen separaciones espacial y temporal. As´ı mismo, supongamos que para O la separación entre los dos eventos es puramente temporal, es decir, ∆r = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos eventos tienen separaciones espacial y temporal. Vemos as´ı que el espacio y el tiempo no son independientes uno del otro. Cada observador inercial puede establecer un corte, un lindero, entre su espacio y su tiempo, pero el 1 Estamos mencionando cuatro relojes: los dos relojes de O marcan t y t + ∆t, y los dos relojes de O0 marcan t0 y t0 + ∆t0 .

31

lindero que establece O es diferente al que establece O0 .

2.1

Las separaciones espacial y temporal son relativas

Las ecuaciones (1.41) y (1.42) muestran que, en general, ∆t0 6= ∆t; por esto decimos que la separación temporal entre dos eventos es relativa. As´ı mismo, en general ∆r0 6= ∆r: la separación espacial también es relativa. El adjetivo relativo se aplica a cualquier cantidad que, registrada por diferentes observadores, da resultados diferentes. También decimos que una cantidad es absoluta cuando, al registrarla diferentes observadores, todos obtienen el mismo resultado. Acabamos de probar que en la relatividad especial las separaciones espacial y temporal no son absolutas, sino relativas. Comparando, las transformaciones de Galileo (1.7) dan t02 − t01 = t2 − t1 y x02 −x01 6= x2 −x1 . En palabras: en Galileo la separación temporal es absoluta y la separación espacial es relativa.

2.2

El intervalo es absoluto

A pesar de que las separaciones espacial y temporal son relativas, hay una función de ∆t y ∆r que resulta absoluta. Definamos: ∆s2 = c2 (∆t)2 − (∆r)2 ∆s0

2

(2.1)

= c2 (∆t0 )2 − (∆r0 )2

En palabras: el cuadrado de la separación temporal menos el cuadrado de la separación espacial. Enseguida probaremos que ∆s02 = ∆s2 . Para tal efecto se eleva al cuadrado cada uno de los lados en las ecuaciones (1.41) y (1.42), obteniéndose: c2 (∆t0 )2 = γ 2 c2 (∆t)2 + −(∆r0 )2 = −(∆r)2 −

γ2 (v · ∆r)2 − 2γ 2 ∆t(v · ∆r) c2

γ2 (v · ∆r)2 + 2γ 2 ∆t(v · ∆r) − γ 2 v 2 (∆t)2 c2

Ahora sumar lado a lado estas dos ecuaciones: 32

c2 (∆t0 )2 − (∆r0 )2 = c2 (∆t)2 − (∆r)2

(2.2)

∆s02 = ∆s2

(2.3)

Es decir,

A ∆s2 se le llama intervalo. El intervalo es la separación espaciotemporal. La separación espacial es relativa; la separación temporal es relativa; la separación espaciotemporal es absoluta. En las geometr´ıas euclidianas la definición de distancia involucra u ńicamente signos +. Esto tiene una consecuencia importante: la distancia entre dos puntos diferentes es siempre positiva; o sea que que si la distancia entre dos puntos es cero es porque se trata, no de dos puntos, sino del mismo punto. La geometr´ıa del espaciotiempo no es euclidiana, porque el intervalo tiene un signo − que es crucial. En el espaciotiempo la cantidad ∆s2 puede ser positiva, negativa o cero; el intervalo entre dos eventos diferentes puede ser cero.

2.3

Clases de intervalos

Cuando ∆s2 es positivo, cero o negativo, el intervalo es temporaloide, luminoide o espacialoide, respectivamente. Vamos a estudiar por separado cada uno de estos casos. Intervalos temporaloides. Para que ∆s2 sea positivo debe cumplirse la siguiente desigualdad: c|∆t| > |∆r|

(2.4)

Este intervalo tiene dos propiedades interesantes: a) Un observador inercial que recorra el espacio ∆r en el lapso ∆t, debe registrar que los dos eventos ocurren en el mismo punto del triespacio. Escribamos la velocidad de este observador inercial: v = 33

∆r ∆t

(2.5)

Para verificar que esto es cierto, notemos que al colocar el valor v = ∆r/∆t en (1.42) se obtiene ∆r0 = 0. b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son simultáneos? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene v·

∆r = c2 ∆t

(2.6)

Sin embargo, la combinaci´ on de (2.4) y (2.6) implica que v tendr´ıa que ser mayor que c, lo que es imposible (ver la frase en bastardilla en la página 17). En conclusión: si dos eventos tienen intervalo temporaloide, ning´ un observador registra que son simult´ aneos. Intervalos espacialoides. Para que ∆s2 sea negativo debe cumplirse la siguiente desigualdad: |∆r| > c|∆t|

(2.7)

Este intervalo tiene dos propiedades interesantes: a) Los observadores inerciales que cumplen la condición v·

∆r = c2 ∆t

registran que los dos eventos son simult´ aneos. Podemos convencernos de que esto es cierto de la manera siguiente: al poner v · (∆r/∆t) = c2 en (1.41) se obtiene ∆t0 = 0. b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos ocurren en el mismo punto r0 ? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condición ∆r0 = 0 en (1.42) se obtiene µ ∆r +

¶ γ−1 v · ∆r − γ∆t v = 0 v2 34

∆r = − ∆t

µ

¶ γ−1 ∆r v · − γ v v2 ∆t

(2.8)

Multiplicar escalarmente ambos lados de esta ecuación por el vector v : ∆r v· ∆t

µ ¶ ∆r 2 = − (γ − 1) v · − γv ∆t

0 = −v ·

∆r + v2 ∆t

(2.9)

El lado izquierdo de la ecuación (2.8) es un vector en dirección ∆r/∆t y el lado derecho es un vector en dirección v ; para que la ecuación sea válida es necesario que esos dos vectores sean paralelos o antiparalelos, o sea que v · ∆r/∆t = ±|v||∆r/∆t|. Al poner este valor en la ecuación (2.9) se obtiene |v| = ± |∆r/∆t|. El signo − es inadmisible, porque permitir´ıa que una cantidad positiva fuera igual a una negativa. Escogemos el signo +: ¯ ¯ ¯ ∆r ¯ ¯ ¯ |v| = ¯ ∆t ¯

(2.10)

El problema es que la combinaci´ on de (2.7) y (2.10) implica que |v| tendr´ıa que ser mayor que c, lo que es imposible (de nuevo, la frase escrita en bastardilla en la página 17). En conclusión: si dos eventos tienen intervalo espacialoide, ning´ un observador registra que ocurren en el mismo punto del triespacio. Intervalos luminoides. El intervalo entre dos eventos es cero si c|∆t| = |∆r|

(2.11)

Hay dos preguntas interesantes: a) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son simultáneos? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condición ∆t0 = 0 en (1.41) se obtiene (2.6). Sin embargo, la combinación de (2.6) y (2.11) implica que v tendr´ıa que mayor que c, lo que es imposible. 35

b) ¿Existe un observador inercial O0 para el cual los dos eventos ocurren en el mismo punto r0 ? Al imponer la condición ∆r0 = 0 en (1.42) se obtiene la ecuación (2.10). El problema es que la combinaci´ on de (2.10) y (2.11) implica que v tendr´ıa que ser igual c, lo que es imposible. En conclusión, cuando el intervalo entre dos eventos es luminoide, ning´ un observador registra que son simult´ aneos y ning´ un observador registra que ocurren en el mismo punto del triespacio.

2.4

La simultaneidad es relativa

Consideremos dos eventos que aparecen simult´ aneos para el observador O. Haciendo ∆t = 0 en (1.41) encontramos ∆t0 = −

γ v · ∆r c2

(2.12)

Si v · ∆r 6= 0, entonces ∆t0 6= 0, lo que constituye una propiedad de primera importancia: dos eventos que aparecen simult´ aneos para O pueden aparecer simultáneos o no simult´ aneos para O0 , dependiendo de la dirección de la velocidad v . Aparecen simult´ aneos para todos los observadores O0 que tengan v perpendicular a ∆r, y aparecen no simult´ aneos a todos los O0 cuya v no sea perpendicular a ∆r. Vemos as´ı que la simultaneidad no es absoluta, sino relativa. Desincronizaci´ on de relojes. También se puede entender la fórmula (2.12) en términos de desincronización de relojes, valiéndonos de la nota escrita al pie de la página 31. Los dos relojes de O están marcando la misma hora; por ejemplo t = 3:29 a.m. Pero los dos relojes de O0 est´ an marcando horas diferentes; por ejemplo, el reloj primado en el primer evento marca t01 = 3:27 a.m., y el reloj primado en el segundo evento marca t02 = 3:31 a.m. El observador O dice que todos sus relojes (los no primados) están de acuerdo, es decir, están sincronizados; el observador O0 también dice que todos sus relojes (los primados) están sincronizados. Pero O registra que los relojes de O0 están desincronizados, y O0 registra que los relojes de O están desincronizados. 36

2.5

Tiempo propio

Al estudiar los intervalos temporaloides vimos que la separación espacial aparece nula para aquel observador O0 que tiene una velocidad dada por (2.5). Veamos ahora cuál es la separación temporal ∆t0 que registra ese observador O0 . Utilizando el resultado (2.5) en (1.41) se obtiene ∆t0 = 1 γ(∆t − 2 v · v ∆t) = γ(1 − v 2 /c2 )∆t. Este ∆t0 se llama tiempo propio y c se denota por medio del s´ımbolo ∆τ. En conclusión: ∆r0 = 0 ∆τ

(2.13)

= ∆t

p 1 − v 2 /c2

< ∆t

(2.14) (2.15)

La ecuación (2.2) se reescribe as´ı: c2 ∆τ 2 = c2 (∆t)2 − (∆r)2 + (∆r0 )2 En el lado derecho tenemos ∆r0 = 0 y (∆r)2 > 0, y esto implica necesariamente que ∆τ 2 < ∆t2 : el tiempo propio es el menor de los tiempos. Las fórmulas (2.13), (2.14) y (2.15), que son de primera importancia, dan pie a las siguientes dos observaciones: 1) El tiempo propio τ es un concepto que se aplica u ńicamente a intervalos temporaloides. Dado un intervalo temporaloide, existe un observador que registra que los dos eventos ocurren en el mismo tripunto y con una separación temporal ∆τ. Otros observadores registran, en general, que los dos eventos ocurren en lugares diferentes y con una separación temporal mayor que ∆τ : el tiempo propio es el menor de los tiempos. 2) Regresemos a la nota al pie de la página 31. En general se trata de cuatro relojes, pero el caso del tiempo propio es especial, ya que O0 usa solamente un reloj. Es claro que para el observador primado los dos eventos ocurren en un punto fijo del triespacio, y los dos tiempos t0 y t0 + ∆t0 los registra aquel reloj primado que ocupa el tripunto. Llegamos as´ı a una clave que puede ser u ´til en momentos de confusión: el tiempo propio τ lo mide un solo reloj. 37

Medici´ on de τ . Supongamos que los relojes se construyen con dos espejos paralelos separados una distancia δ, y un pulso de luz que se refleja una y otra vez en los espejos, como muestra la Figura 2.1. En cada tripunto de O0 se encuentra, fijo, un reloj de estos. De acuerdo con O0 , el tiempo que el pulso de luz tarda en regresar a uno de los espejos es ∆t0 =

2δ c

Suponemos que este reloj tiene sus espejos paralelos al plano z 0 x0 . Para O el viaje del pulso de luz es como en punteada de la Figura 2.2; el qla l´ınea ¡1 ¢2 recorrido total es dos hipotenusas: 2 δ 2 + 2 v∆t , o sea que ∆t viene dado por: q ¡ ¢2 2 δ 2 + 12 v∆t ∆t = c Despejar (∆t)2 para obtener µ

(∆t)2 =

∆t =

¶ 2δ 2 c 1 − v 2 /c2 ∆t0 p 1 − v 2 /c2

Los dos eventos (salida y regreso del pulso) se registran de manera diferente por los dos observadores. Para O los dos eventos ocurren en puntos diferentes, o sea que los registran relojes diferentes. Para O0 los dos eventos ocurren en el mismo punto, o sea que los registra el mismo reloj: tiempo propio. Part´ıcula libre. Veremos en la sección 3.5 que las part´ıculas masivas tienen velocidades inferiores a c; por eso los eventos de sus trayectorias tienen intervalos temporaloides y, en consecuencia, se les aplica el concepto de tiempo propio τ. ¿Cómo se mide el τ de estos intervalos? Para responder esta pregunta supongamos el más simple de los casos, que es el de una part´ıcula masiva libre. Pensamos en un reloj atado a la part´ıcula, que la 38

acompa˜ na en todo instante: el tiempo que marca este reloj es τ. Obsérvese que este tiempo propio lo mide un sólo reloj. Hay un sistema coordenado inercial para el cual la part´ıcula está siempre en reposo; en estas coordenadas el intervalo entre dos puntos de la trayectoria es puro tiempo, y es c2 τ 2 . Llegamos as´ı a una fórmula de gran utilidad en el estudio de las trayectorias de las part´ıculas libres: ds2 = c2 dτ 2 ,

(2.16)

siendo τ el tiempo que marca un reloj que acompa˜ na a la part´ıcula2 . Para un observador que acompa˜ na a una part´ıcula masiva, τ es un parámetro que sirve para caracterizar los eventos de la trayectoria. Pero otros observadores que no acompa˜ nan a la part´ıcula también pueden utilizar a τ para caracterizar los puntos de la trayectoria de la part´ıcula, de la manera siguiente. Sean (T, X, Y, Z) las coordenadas de los eventos de la trayectoria de una part´ıcula libre, seg´ un los registra un observador inercial cualquiera. La idea es que cada una de las cuatro coordenadas (T, X, Y, Z) se puede considerar como función de τ (que, como hemos dicho, es el tiempo que marca un reloj atado a la part´ıcula). Escribimos entonces T = T (τ ), X = X(τ ), Y = Y (τ ) y Z = Z(τ ). Supongamos que, cuando τ = 23, la part´ıcula ocupó el evento (5, 6, 7, 8). Decimos entonces que T (23) = 5, X(23) = 6, Y (23) = 7 y Z(23) = 8. El fotón viaja con velocidad c, y por esta razón los eventos de su trayectoria tienen intervalos luminoides, para los cuales no se aplica el concepto de tiempo propio: el concepto de tiempo propio no se aplica a part´ıculas de masa cero. Tiempo de vida media. Un electrón solo y aislado sigue siendo electrón indefinidamente, y por esto decimos que es estable. Otro ejemplo de part´ıcula estable es el protón. Pero la estabilidad es una propiedad escasa, ya que casi todas las part´ıculas tienden a desintegrarse. El tiempo de vida media se define como el tiempo que tarda una población de part´ıculas idénticas en reducirse a la mitad3 . Nos interesa en este momento resaltar que el enunciado “tiempo que tarda...” es ambiguo, porque es relativo. Deber´ıa definirse el 2

Esta f´ ormula, que hemos encontrado para part´ıcula libre, es también v´ alida cuando la part´ıcula no es libre, como veremos en la ecuaci´ on (8.1). 3 En verdad, y debido a la incertidumbre esencial que asiste al proceso cu´ antico de la desintegraci´ on, deber´ıamos decir “aproximadamente la mitad”.

39

tiempo de vida media en términos absolutos, no relativos. Se ha convenido en que “el tiempo que tarda una población en reducirse a la mitad, aproximadamente” significa lo siguiente: el que registra un observador en reposo respecto a las part´ıculas. Veamos por ejemplo los piones no neutros, que el 99.98770 % de las veces se desintegran as´ı: π + → µ+ νµ π − → µ− ν¯µ τ

=

con

2.6 × 10−8 s :

Vida media

El significado de τ, desde un punto de vista experimental es el siguiente. Supongamos un conjunto de 700 piones que se encuentran en reposo respecto a un observador O0 ; cuando en los relojes de este observador hayan transcurrido 2.6 × 10−8 segundos, la población de piones será 350 aproximadamente. Supongamos ahora que este grupo de piones tiene una velocidad de 0.99c respecto al laboratorio, y nos preguntamos: seg´ un el reloj del laboratorio, ¿cuánto tiempo t (el que marca un reloj del laboratorio) se demora la población de piones para pasar de 700 a 350? Para responder esta pregunta utilizamos la ecuación (2.14): 2.6 × 10−8 s = √ = 18.43 × 10−8 s 2 2 2 1 − 0.99 1 − v /c

t = p

τ

El trayecto recorrido por los piones antes de desintegrarse es vt: v t = 0.99 ct = 54.74 m :

Relatividad

Si, en vez de usar las transformaciones de Lorentz, se usan las de Galileo, el resultado es bien diferente. De acuerdo con las ecuaciones (1.7), las cantidades ∆t y ∆t0 ser´ıan iguales, y el trayecto recorrido por los piones antes de desintegrarse ser´ıa v ∆t0 = 7.72 m :

Galileo,

muy diferente a 54.74 m. En el laboratorio el experimento da 54.74 m y no 7.72 m: la relatividad especial confirmada. 40

2.6

Longitud propia

Para medir fotográficamente la longitud de un avi´ on volando se debe tener en cuenta que el diafragma de la cámara fotográfica se abra por muy poco tiempo; porque si se abre durante mucho tiempo, la fotograf´ıa queda corrida o borrosa, y no sirve: en general, para medir la longitud de un objeto se deben registrar los dos extremos simult´ aneamente. En el caso especial en que el avión está en reposo, los registros de los dos extremos no tienen que ser simultáneos. Supongamos pues que el avi´ on está en reposo en O0 , y llamemos L0 = |∆r0 | a su longitud para O0 . Esta L0 recibe el nombre de longitud propia. La ecuación (2.2) se escribe: c2 (∆t0 )2 − L20 = c2 (∆t)2 − (∆r)2

(2.17)

Ahora utilizar la ecuación (1.41): µ ¶2 1 c γ ∆t − 2 v · ∆r − L20 = c2 (∆t)2 − (∆r)2 c 2 2

Queremos que |∆r| sea L, la longitud del avi´ on seg´ un la registra O. Tal como acabamos de explicar, para medir esta L se deben registrar los dos extremos en el mismo valor de t, es decir, ∆t = 0. Entonces: µ 2 2

c γ

¶2 1 v · L − L20 = −L2 c2

O sea que L20 = L2 +

γ2 (v · L)2 2 c

(2.18)

Esta fórmula sirve en general, cualquiera que sea el ángulo formado por el avión L y la velocidad de separación v . La estudiaremos en dos casos: cuando L y v son perpendiculares, y cuando L y v son paralelos. Si son perpendiculares, se cumple la ecuación v · L = 0 y en consecuencia L = L0 : las longitudes perpendiculares a v no sufren ning´ un cambio. De otro lado, si L y v son paralelos, la fórmula (2.18) da 41

p L0 = L/ 1 − v 2 /c2 > L

(2.19) (2.20)

La ecuación (2.17) se reescribe as´ı: L20 = (∆r)2 − c2 (∆t)2 + c2 (∆t0 )2 No olvidemos que ∆t = 0 y (∆t0 )2 > 0, lo que implica necesariamente que L20 > (∆r)2 : la longitud propia es la mayor de las longitudes. Volumen propio. Dado que las longitudes perpendiculares a vq no sufren cambios, y que las longitudes paralelas a v se afectan por un factor 1 − v 2 /c2 , la forma de los objetos tridimensionales depende del estado de movimiento del observador que los registra: la forma es relativa. Presentemos un ejemplo de esta deformación, suponiendo que en O0 hay, en reposo, un cubo con sus aristas paralelas a los ejes x0 , y 0 y z 0 , respectivamente. Llamemos L0 a la longitud de las aristas, seg´ un O0 . Nos preguntamos en seguida de qué manera registra O a este cuerpo; claramente, las aristas paralelas a los ejes y y z son de longitud q L0 , pero las aristas paralelas al eje x tienen una longitud

contra´ıda L0 1 − v 2 /c2 . Vemos as´ı que para O no se trata de un cubo, sino de un paralelep´ q ıpedo recto rectangular -i.e.: un “cubo achatado”- de aristas L0 , L0 , L0

1 − v 2 /c2 .

Esto repercute en q el volumen, ya que mientras el volumen es L30 para O0 , el volumen es L30 1 − v 2 /c2 para O. Ahora supongamos un cuerpo de cualquier forma; es claro que O0 lo puede considerar como la yuxtaposición de muchos cubitos, y cada uno de estos cubitos aparece deformado para O. Lo importante es que q todos los cubitos se ven afectados por el mismo factor de deformación vol´ umenes es

1 − v 2 /c2 , y en consecuencia la relación entre los V = V0

q 1 − u2 /c2 ,

(2.21)

donde V0 = L30 . En esta ecuación estamos hablando de cualquier cuerpo tridimensional que tiene velocidad u respecto a O. La cantidad V0 es el volumen propio, es decir, el que registra un observador para el cual el cuerpo está en reposo. 42

Densidad propia. Consideremos una nube de part´ıculas. El observador O registra que en un punto r y en un instante t la velocidad de la nube es u. Pensemos en un peque˜ no volumen V alrededor de r, que en el instante t tiene la misma velocidad u: claramente este volumen V est´ a acompa˜ nando a las part´ıculas. Si dentro de V hay n part´ıculas, entonces la densidad de part´ıculas por unidad de volumen es n/V. Y si cada part´ıcula tiene una carga eléctrica q, entonces para el observador O la densidad de carga por unidad de volumen es ρ(r, t) =

nq V

(2.22)

Seguidamente estudiaremos lo que registra otro observador inercial O0 que, en el instante t, tiene velocidad u: es claro que para este observador el volumen mencionado en el párrafo anterior está en reposo, y en vez de ser V, es V0 , de acuerdo con la ecuación (2.21). El volumen V0 también contiene n part´ıculas de carga q, o sea que para el nuevo observador4 la densidad de carga por unidad de volumen es:

ρ0 (r, t) =

nq V0

(2.23)

La cantidad ρ0 recibe el nombre de densidad propia de carga por unidad de volumen. En vista de la ecuación (2.21):

ρ =

=

ρ0 q 1 − u2 /c2

(2.24)

nq q V0 1 − u2 /c2

(2.25)

La ecuación (2.24) dice que ρ0 < ρ: la densidad propia es la menor de las densidades. 4

La carga eléctrica q es la misma para todos los observadores inerciales. En efecto, se han realizado suficientes pruebas experimentales que muestran confiablemente [8] que q no depende de la velocidad de la part´ıcula: la carga eléctrica es invariante bajo las transformaciones de la relatividad especial.

43

2.7

Comparaci´ on de longitud propia y tiempo propio

Hemos dicho que el concepto de tiempo propio sólo se aplica a intervalos temporaloides. De la misma manera, el concepto de longitud propia sólo se aplica a intervalos espacialoides. Vemos as´ı que estos dos conceptos son esencialmente diferentes y nunca se aplican al mismo intervalo. Hay sin embargo cierto parecido formal entre ellos, como veremos en seguida. La ecuación fundamental es la invariancia del intervalo (2.2): +c2 (∆t0 )2 − (∆r0 )2 = +c2 (∆t)2 − (∆r)2

(2.26)

Los signos + y − en esta ecuación son cruciales: el tiempo propio ∆t0 es el menor de los tiempos, porque resulta de hacer ∆r0 = 0 en esta ecuación; as´ı mismo, la longitud propia |∆r0 | es la mayor de las longitudes, porque resulta de hacer ∆t = 0 en (2.26). En otras palabras: ∆t > ∆τ porque O registra los dos eventos en tripuntos diferentes; as´ı mismo, L0 > L porque O0 registra los dos eventos en instantes diferentes.

2.8

Un caso de simultaneidad

La dilatación del tiempo, la contracci´ on de la longitud y la relatividad de la simultaneidad son los efectos más dramáticos de la relatividad. En las dos u ´ltimas secciones vimos cómo se miden el tiempo propio y la longitud propia, y es justo dedicarle también a la simultaneidad un ejemplo y una discusión. Sean A y B dos puntos en reposo5 en el sistema O0 , como en la Figura 2.3. En el punto medio se emite un pulso de luz. Para O0 , las dos se˜ nales llegan a A y B en los instantes t0A y t0B , respectivamente. Pensemos en otro observador O que se desplaza con una velocidad v respecto a O0 , y la dirección de esta velocidad es hacia la izquierda. O registra que las dos se˜ nales luminosas llegan a A y B en los instantes tA y tB , respectivamente. La fórmula (1.39) da

tB − tA 5

v (t0B − t0A ) + 2 (x0B − x0A ) c p = 1 − v 2 /c2

A y B no son eventos, sino puntos en el espacio tridimensional.

44

Ahora, es claro que t0B = t0A , o sea que

tB − tA

v 0 (xB − x0A ) 2 c = p 6= 0 1 − v 2 /c2

Vemos as´ı que la llegada de las dos se˜ nales a A y B es registrada de manera muy diferente por los dos observadores ya que, mientras O0 afirma que son simultáneas, para O no son simult´ aneas. Este análisis relativista puede parecer, como todo en la relatividad, un poco complejo. Pero debemos admitir que tiene un elemento muy simple: no hemos tenido necesidad de aclarar si la fuente de luz se está moviendo o no, respecto a ninguno de los dos observadores. Hemos utilizado el principio de la constancia de la velocidad de la luz (1.10), que afirma que la velocidad de la luz es independiente del estado de movimiento de la fuente de luz. La simplicidad del análisis relativista está ausente en el análisis prerrelativista; en efecto, en el prerrelativista es necesario decir cómo se mueve la fuente de luz, o de lo contrario faltan datos para resolver el problema.

2.9

La adici´ on de velocidades

Consideremos un punto móvil, que tiene velocidad u respecto a O, y tiene velocidad u0 respecto a O0 . De acuerdo con la f´ısica galileana (1.7) se tiene: u = u0 + v

(2.27)

Veremos enseguida que en relatividad especial la regla de adición de velociv dades no es tan simple como (2.27). La ecuación (1.39) es dt = γ(dt0 + 2 dx0 ); c en el lado derecho se saca dt0 como factor com´ un, para obtener µ ¶ vu0x dt = γ 1 + 2 dt0 c 1 dt

=

1 γ −1 0 vu dt0 1 + 2x c 45

(2.28)

Repitamos el proceso µ 0 para¶la coordenada x. La ecuación (1.40) es dx = dx 0 0 γ(dx + vdt ) = γ + v dt0 : dt0 dx = γ(u0x + v)dt0

(2.29)

Ahora multiplicar lado a lado las ecuaciones (2.28) y (2.29) para obtener

ux =

u0x + v vu0 1 + 2x c

(2.30)

Observaciones: 1. Notemos que u0x = c ⇒ ux = c: un punto matemático que tenga velocidad c para O0 , también tendrá velocidad c para todos los otros observadores O. Esta es una generalización del postulado (1.10) de la constancia de la velocidad de la luz. 2. Si u0x ¿ c o v ¿ c, el denominador de (2.30) es aproximadamente 1, y entonces ux ≈ u0x + v, que es la transformación de Galileo (2.27): la teor´ıa relativista abarca a la galileana. 3. Podemos expandir el lado derecho de (2.30) como un polinomio en potencias de v : ux = (u0x + v)(1 + vu0x /c2 )−1 = (u0x + v)(1 − vu0x /c2 + · · ·) 2 = u0x + v − vu02 x /c + · · · 2 ≈ u0x + v − vu02 x /c ,

es decir: ux ≈

u0x

¶ µ u02 x + 1 − 2 v, c 46

y haciendo n = c/u0x : ux ≈

u0x

µ ¶ 1 + 1− 2 v n

(2.31)

Esta es la célebre fórmula que Fresnel derivó en 1818, cuando estaba investigando la velocidad de la luz en medios móviles. Ya hab´ıamos mencionado esta ecuación en la página 6. La fórmula (2.30) es la ley de la adición de las velocidades paralelas u0x y v. Todav´ıa nos queda la tarea de deducir las fórmulas que expresan a las velocidades transversas uy y uz en términos de velocidades primadas. Para tal efecto tomamos diferenciales en ambos lados de la ecuación y = y 0 , 1 dy = dy 0 , lo que se escribe obteniéndose dy = dy 0 , es decir dt dt uy = dy 0

1 dt

Ahora usar (2.28): p uy =

1 − v 2 /c2 0 uy vu0 1 + 2x c

Similarmente se deduce que p 1 − v 2 /c2 0 uz = uz vu0 1 + 2x c En resumen, la adición relativista de velocidades es as´ı: ux =

uy =

u0x + v vu0 1 + 2x p c 1 − v 2 /c2 0 uy vu0x 1+ 2 c 47

(2.32)

(2.33)

p uz =

1 − v 2 /c2 0 uz vu0x 1+ 2 c

(2.34)

Estas tres fórmulas son complicadas, y cuando rastreamos los pasos que condujeron a ellas, nos damos cuenta de que (2.32) es más complicada que (2.33) y (2.34). Para ver esto anotemos que (2.33) es complicada u ńicamente por la transformación temporal (2.28). En cambio (2.32) es complicada, no sólo por la transformación temporal (2.28), sino además por la transformación espacial (2.29). Las transformaciones inversas se obtienen, a partir de (2.32), (2.33) y (2.34), cambiando v por −v e intercambiando velocidades primadas y no primadas: u0x = u0y = u0z =

ux − v vux 1− 2 p c 1 − v 2 /c2 vux uy 1− 2 c p 1 − v 2 /c2 vux uz 1− 2 c

(2.35)

(2.36)

(2.37)

Las ecuaciones (2.32), (2.33) y (2.34) sirven cuando la velocidad de separación v es en dirección del eje com´ un xx0 . Debemos ahora generalizar para cuando v es en cualquier dirección. Claramente (2.28) se convierte en 1 = dt

p 1 − v 2 /c2 1 , v · u0 dt0 1+ 2 c

(2.38)

y la adición de velocidades (2.32), (2.33) y (2.34) se generaliza as´ı: uk =

u⊥ =

u0k + v v · u0 1+ 2 c p 1 − v 2 /c2 0 u v · u0 ⊥ 1+ 2 c 48

(2.39)

(2.40)

2.10

La adici´ on de aceleraciones

Tomar diferenciales en ambos lados de la ecuación (2.39): µ ¶ v · u0 v · du0 1+ 2 du0k − (u0k + v) 2 1 − v 2 /c2 c c 0 duk = = µ ¶ µ ¶2 duk 2 0 0 v ·u v ·u 1+ 2 1+ 2 c c Ahora usar la ecuación (2.38): 0 duk (1 − v 2 /c2 )3/2 duk = µ , ¶ dt v · u0 3 dt0 1+ 2 c

es decir: (1 − v 2 /c2 )3/2 0 ak = µ ¶ ak v · u0 3 1+ 2 c

(2.41)

Esta es la manera como transforman las aceleraciones paralelas. Pasamos ahora a deducir la transformación de las aceleraciones perpendiculares, tomando diferenciales en ambos lados de (2.40):

du⊥

p ½µ ¶ ¾ 0 1 − v 2 /c2 v · u0 0 0 v · du = µ 1+ 2 du ⊥ − u ⊥ ¶ c c2 v · u0 2 1+ 2 c

Se multiplican, lado a lado, esta ecuación y la ecuación (2.38):

a⊥

1 − v 2 /c2 = µ ¶ v · u0 3 1+ 2 c

½ ¾ ¤ 1 £ 0 0 0 0 0 a⊥+ 2 v ·u a⊥−v ·a u⊥ c

(2.42)

El término v · u0 a0 ⊥ − v · a0 u0 ⊥ que aparece en el lado derecho de esta ecuación se trata de la manera siguiente: 49

v · u0 a0 ⊥ − v · a0 u0 ⊥ = v · u0 (a0 − a0 k ) − v · a0 (u0 − u0 k ) = v · u0 a0 − v · a0 u0 + v · a0 u0 k − v · u0 a0 k El lado derecho de esta ecuación tiene cuatro términos. Los dos primeros6 suman v × (a0 × u0 ) y los dos u ´ltimos suman7 cero; entonces: v · u0 a0 ⊥ − v · a0 u0 ⊥ = v × (a0 × u0 ), y (2.42) queda:

a⊥

2.11

1 − v 2 /c2 = µ ¶ v · u0 3 1+ 2 c

¾ ½ 1 0 0 0 a ⊥ + 2 v × (a × u ) c

(2.43)

Gr´ aficos

Ahora estudiaremos el método gráfico de Minkowski [10]. Consideramos puntos que se mueven u ńicamente en el eje x. Las coordenadas x y t tienen dimensiones de metro y segundo, respectivamente. Conviene usar variables de espacio y tiempo que tengan las mismas dimensiones, y por eso vamos a usar la variable ct en vez de t. La variable ct significa tiempo, pero con dimensiones de longitud. Las transformaciones de Lorentz (1.33) toman una forma simétrica entre x y ct:

x0 =

(ct)0 =

v x − ct c p 1 − v 2 /c2 v ct − x c p , 1 − v 2 /c2

(2.44)

(2.45)

o las inversas: 6

Recordar la identidad A × (B × C) = A · C B − A · B C Como u0 k y a0 k apuntan en la direcci´ on de v , es claro que v · a0 u0 k − v · u0 a0 k es un vector en direcci´ on de v . La magnitud de este vector es va0k u0k − vu0k a0k = 0. 7

50

v x0 + (ct)0 x= p c 1 − v 2 /c2 v (ct)0 + x0 c ct = p 2 1 − v /c2

(2.46)

Se grafica el eje ct vertical y el eje x horizontal. Un punto en reposo mantiene constante su coordenada x, y su trayectoria se representa por medio de una l´ınea recta vertical. Estudiemos ahora un punto móvil cuya velocidad es u = dx/dt: d(ct) c = dx u Llamando “pend” a la pendiente de la curva, esta ecuación es pend =

c u

(2.47)

La cantidad u es positiva si el punto viaja hacia la derecha, y negativa si va hacia la izquierda, y en estos casos pend es positiva o negativa. Tomar valor absoluto: c |pend| = (2.48) |u| Si se trata de una part´ıcula masiva, la velocidad es infralum´ınica, y por consiguiente |u| < c; la ecuación (2.48) dice que |pend| tiene que ser >1 en todos los instantes. En el caso importante de un pulso de luz, la trayectoria es una l´ınea recta con |pend| = 1: la trayectoria es la bisectriz del ángulo formado por los ejes ct y x. La Figura 2.4 muestra cuatro trayectorias: La l´ınea recta de 45o de inclinación es para un pulso de luz. Las otras tres curvas representan trayectorias de part´ıculas masivas: la recta vertical corresponde a part´ıcula en reposo; la recta con inclinación >45o es para part´ıcula libre, y la l´ınea curva para part´ıcula forzada. Es importante notar que en esta u ´ltima trayectoria la pendiente es >1 en todos los instantes. Minkowski escribe con grandilocuencia. A la totalidad t, x, y, z la llama el mundo. Al principio de la relatividad (1.10) le dice el principio del mundo absoluto, un evento (t, x, y, z) es un punto en el mundo y la trayectoria de 51

una part´ıcula es una l´ınea en el mundo. Es él quien introduce en la f´ısica las palabras luminoide, espacialoide, temporaloide y cono de la luz. La visión geométrica de Minkowski está llena de contenido conceptual, aunque no siempre se apreció as´ı. El mismo Einstein tardó a˜ nos en reconocer su importancia. En un principio consideró que el trabajo de Minkowski era redundante y carec´ıa de profundidad; finalmente, en 1912, llegó al convencimiento de que la relatividad general deb´ıa ser planteada en términos geométricos, y pudo apreciar el trabajo de su antiguo profesor. La causalidad. La Figura 2.5 muestra un evento E1 y las l´ıneas en el mundo de dos pulsos de luz que pasan por E1 : uno viaja hacia la izquierda y el otro hacia la derecha. La trayectoria del pulso que va hacia la derecha tiene pendiente 1, y la trayectoria del pulso que va hacia la izquierda tiene pendiente −1. La unión de las dos rectas se llama el cono de la luz del evento E1 . Las dos rectas que pasan por E1 cortan al mundo en cuatro partes: izquierda, derecha, pasado y futuro. Las partes izquierda y derecha están fuera del cono de la luz; el futuro y el pasado están dentro del cono de la luz; también decimos que los eventos que están en las dos rectas están dentro del cono de la luz. Las se˜ nales energéticas son part´ıculas, bien sea de masa cero como el fotón, o de masa diferente de cero; sus trayectorias tienen |pend| ≥ 1, de donde concluimos que las trayectorias de las se˜ nales energéticas que pasan por un evento E1 están completamente dentro del cono de la luz de E1 . Einstein pensaba que si un suceso (que ocurre en el evento E1 ) es causa eficiente de otro suceso (que ocurre en el evento E2 ,) es porque hay una se˜ nal energética que va desde E1 hasta E2 . Como esta se˜ nal está dentro del cono de la luz de E1 , es claro que también E2 tiene que estar dentro del cono de la luz de E1 . En conclusión: Lo que ocurre dentro del cono de la luz de E1 puede tener una conexión causal con lo que ocurre en E1 . Lo que ocurre en la región del futuro puede ser efecto de lo que ocurre en E1 . Lo que ocurre en la región del pasado puede ser causa de lo que ocurre en E1 . Lo que ocurre en la región del futuro puede ser efecto de lo que ocurre en la región del pasado. La causalidad einsteiniana es una conexión entre el pasado y el futuro8 . 8

Bohr pensaba que la causalidad einsteiniana no es la u ńica posible; él admit´ıa la posibilidad de que hubiera también unas correlaciones cu´ anticas que no est´ an mediadas por se˜ nales energéticas. El danés cre´ıa que dos sucesos en E1 y E2 pueden estar correlacionados sin necesidad de una se˜ nal energética que viaje desde un evento hasta el otro. Bohr y Einstein ten´ıan que chocar, y as´ı lo hicieron en un debate que dur´ o treinta a˜ nos.

52

Clases de intervalos: Supongamos dos eventos cuyo intervalo es temporaloide. Trazamos una recta que pase por los dos eventos; entonces, de acuerdo con la desigualdad (2.4), esta recta tiene |pend| > 1. As´ı mismo, utilizando las fórmulas (2.7) y (2.11) llegamos a que la recta que une dos eventos con intervalo espacialoide tiene |pend| < 1, y la recta que une dos eventos con intervalo luminoide tiene |pend| = 1. La Figura 2.6 muestra cuatro eventos A, E, T, y L. El intervalo AE es espacialoide, el intervalo AT es temporaloide y el intervalo AL es luminoide. El cono de la luz corta en cuatro partes al espaciotiempo. En general, los eventos con intervalo espacialoide están fuera del cono de la luz, los que tienen intervalo temporaloide están dentro del cono de la luz y los que tienen intervalo luminoide están justo en el cono de la luz.

2.12

M´ as gr´ aficos

Ya que hemos construido los ejes ct y x del mundo de O, procedemos a dibujar los ejes ct0 y x0 del mundo de O0 : queremos trazar los ejes (ct0 , x0 ) en el plano (ct, x). Es claro que la condición x0 = 0 identifica al eje ct0 ; haciendo x0 = 0 en (2.44) encontramos: ct =

c x, v

(2.49)

que es una l´ınea recta con pendiente c/v > 1. Vemos as´ı que el eje ct0 se representa por medio de una recta que pasa por el origen, y que hace con el eje ct un ángulo v registran que T está a la izquierda de A. Aprendemos as´ı algo interesante: cualquier evento que esté dentro del cono de la luz aparece a la derecha para unos observadores y a la izquierda para otros observadores. O sea que para estos eventos la relación izquierda-derecha no es absoluta, sino relativa. ultimo párrafo Relaciones absolutas. Regresando al evento E del pen´ anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un observador inercial para el cual E aparezca a la izquierda del origen. Es decir, los eventos que están fuera del cono de la luz tienen una relación izquierda-derecha absoluta. Similarmente, en referencia al evento T del pen´ ultimo párrafo anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un observador inercial para el cual T ocurra antes que el origen. Aprendemos as´ı que los eventos que están dentro del cono de la luz tienen una relación pasado-futuro absoluta. Los nombres izquierda, derecha, pasado y futuro que les hemos dado a las cuatro regiones, son adecuados: los eventos de estas regiones están, respecto al vértice del cono, absolutamente a la izquierda, absolutamente a la derecha, absolutamente en el pasado y absolutamente en el futuro.

56

d

Figura 2.1 Un reloj se construye con dos espejos paralelos y un pulso de luz que se refleja en ellos repetidamente. Este dibujo representa el registro hecho por un observador O0 que está en reposo respecto al reloj.

Figura 2.2 El mismo reloj de la Figura 2.1, seg´ un lo registra otro observador O que se mueve respecto al reloj.

ct

A

B

x

Figura 2.3 Para el observador O0 los puntos A y B están en reposo. Desde el punto medio se env´ıan dos se˜ nales luminosas hacia A y B.

Figura 2.4 Trayectorias de cuatro part´ıculas. De izquierda a derecha: part´ıcula masiva libre, part´ıcula en reposo, pulso de luz y part´ıcula forzada.

57

T

L E

Futuro Izquierda

A

Derecha E1 Pasado

Figura 2.5 El cono de luz está comprendido entre dos pulsos de luz; uno viaja hacia la izquierda y el otro hacia la derecha.

Figura 2.6 Los intervalos AE, AT y AL son espacialoide, temporaloide y luminoide, respectivamente

ct

ct

ct'

ct'

4 3 3 x'

2 2

arctan

v/c

x'

3 1 c arctan v/

1 2 1

x

1

Figura 2.7 El observador O0 se mueve respecto a O con velocidad v = 3c/8.

x 2

3

4

Figura 2.8 Para O0 , la distancia OP es 1. Replicamos esta medida a lo largo del eje x0 para marcar aquellos eventos cuyas coordenadas primadas son (0,2), (0,3), (0,4), etc.

58

ct ct'

3 x' 2 1 2 1

x

Figura 2.9 Para averiguar la coordenada ct0 de un evento se traza una l´ınea paralela al eje x0 : all´ı donde esta paralela corta al eje ct0 queda marcada la coordenada ct0 del evento.

Figura 2.10 La l´ınea punteada vertical es la trayectoria de una part´ıcula que está en reposo respecto al observador O. La otra l´ınea punteada es para una part´ıcula que está en reposo respecto a O0 .

x'

C A

2

B

x 2

Figura 2.11 Los eventos A y B son simultáneos para O; sin embargo, O0 registra que B ocurre antes que A. As´ı mismo, B y C son simultáneos para O0 , pero O registra que B ocurre antes que C.

Figura 2.12 El trazo grueso representa una varilla en reposo en O0 ; seg´ un este observador, ella mide 2 metros. Para O la longitud es menor que 2.

59

ct ct' x'

x' 2

2

2 x 2

Figura 2.13 El trazo grueso representa una varilla en reposo en O; seg´ un este observador, ella mide 2 metros. Para O0 la longitud es menor que 2.

Figura 2.14 El trazo punteado es la l´ınea en el mundo de un reloj en reposo en el origen de O. Este reloj marca un tiempo (propio) de 2. Para O0 el tiempo transcurrido es mayor que 2.

ct ct

ct' ct'

2

2

x

x'

x

Figura 2.16 El observador O0 se mueve hacia la izquierda respecto a O. Comparar con la Figura 2.7: en ambas gráficas el eje ct0 apunta hacia el futuro, y el eje x0 apunta hacia la derecha.

Figura 2.15 El trazo punteado es la trayectoria de un reloj en reposo en el origen de O0 . Este reloj marca un tiempo (propio) de 2. Para O el tiempo transcurrido es mayor que 2.

60

Cap´ıtulo 3

Mec´ anica Si la relatividad ha cambiado nuestro entendimiento del espaciotiempo, debemos estar preparados para indagar y asimilar los efectos de esos cambios. Se espera que, una vez aceptadas las nuevas propiedades del espaciotiempo, tengamos que introducir modificaciones en los estudios de la dinámica, la mecánica ondulatoria, etc. Este cap´ıtulo explora la primera de las repercusiones, que es el efecto de la relatividad en la dinámica. Veremos que la nueva dinámica trae sutilezas teóricas y efectos sorprendentes que la separan de la vieja mecánica1 newtoniana. El momentum es el primero de los conceptos que la relatividad reforma. De acuerdo con el principio de la relatividad, la ley de la conservaci´ on del momentum debe ser válida en todos los sistemas de referencia inerciales. Pero la relatividad muestra, para nuestra sorpresa, que si se mantiene la definición de momentum p = mu con m constante, la ley de la conservaci´ on del momentum no se cumple para todos los observadores inerciales, violándose as´ı el principio de la relatividad. Hay tres caminos para salir de esta crisis: abandonar el principio de la relatividad (no queremos abandonarlo), o abandonar la ley de la conservaci´ on del momentum (tampoco queremos abandonarla), o modificar la vieja definición de momentum p = mu. En la sección 3.1 tomaremos el tercer camino; propondremos p = m(u)u, donde m(u) es alguna función desconocida de la magnitud de la velocidad u, nos preguntaremos cómo debe ser la función desconocida m(u) para que la conservación del momentum sea válida en todos p los sistemas de referencia inerciales, y descubriremos que m(u) = m(0)/ 1 − u2 /c2 . 1

Cuando decimos “mec´ anica newtoniana” nos referimos, no s´ olo a la mec´ anica que Newton formul´ o, sino adem´ as a los aportes que los f´ısicos hicieron en los dos siglos siguientes: las formulaciones lagrangiana y hamiltoniana, las aplicaciones a los cuerpos celestes, etc.

61

El nuevo concepto de masa conduce a uno de los hallazgos más importantes de la relatividad, que es la asociación masa-energ´ıa, expresada en la ecuación E = mc2 . Esta fórmula dice que el contenido de masa de un objeto es una medida de su energ´ıa total. La sección 3.4 trae una discusión de este asunto y luego, en la sección 3.5 mostramos que una part´ıcula masiva no puede llegar a tener la velocidad c. La sección 3.9 trata, como un caso particularmente interesante, el movimiento circular.

3.1

La conservaci´ on del momentum

Nos proponemos estudiar [6] la colisión elástica de dos part´ıculas de igual masa. La Figura 3.1 muestra el choque seg´ un lo registra un observador O que está en reposo respecto al centro de masa. La part´ıcula A va de derecha a izquierda y la part´ıcula B de izquierda a derecha. La figura incluye las cantidades positivas ux y uy , que tienen el siguiente significado: La part´ıcula B tiene una velocidad horizontal ux hacia la derecha en todo instante; pero su velocidad vertical es uy hacia abajo antes del choque, y es uy hacia arriba después. En forma similar, la velocidad horizontal de A es ux hacia la izquierda en todo instante; y su velocidad vertical pasa de ser uy hacia arriba antes del choque, a ser uy hacia abajo después. Con una mirada a la Figura nos damos cuenta de que, para el observador O, el momentum total es cero. Lo que más nos interesa por el momento es que el momentum total se conserva: el momentum ganado por la part´ıcula B es igual al perdido por A . De hecho, las cantidades escritas en la Figura fueron expresamente definidas para que, en O, se cumpla la ley de la conservación del momentum. Ahora, por el Principio de la Relatividad, queremos que la ley de la conservaci´ on del momentum también se cumpla en los otros observadores inerciales. Nos proponemos analizar la colisión de estas dos part´ıculas desde el punto de vista de otro observador inercial O0 que se mueve, respecto a O, con una velocidad v hacia la derecha: vamos a exigir que en O0 se cumpla la ley de la conservaci´ on del momentum. Uno podr´ıa, de entrada, definir el momentum de una part´ıcula (intentar por ejemplo la definición newtoniana mu) y luego indagar si la conservaci´ on del momentum se cumple en todos los observadores inerciales. Nosotros vamos a seguir la ruta contraria: exigir que la conservaci´ on del momentum valga en todos los sistemas de referencia inerciales y, a partir de esta exigencia, averiguar cómo se debe definir el momentum de una part´ıcula. Comence62

mos con una propuesta bien general; digamos que si una part´ıcula tiene velocidad u , entonces su momentum es m(u)u , donde m(u) es una función desconocida de la magnitud de la velocidad u . Vamos a exigir que la ley de la conservación del momentum se cumpla en todos los observadores inerciales. Veremos que esta exigencia es suficiente para averiguar la función desconocida m(u) . La Figura 3.2 muestra de qué manera el observador O0 registra el choque de las dos part´ıculas. Para la part´ıcula B el momentum vertical después del choque es m(u0B )u0By y antes del choque es −m(u0B )u0By . Entonces el moq 2 + u0 2 , mentum vertical ganado por B es 2m(u0B )u0By . Ahora, u0B = u0Bx By ³q ´ 0 2 + u0 2 entonces el momentum vertical ganado por B es 2m u0Bx By uBy . ³q ´ 0 2 + u0 2 As´ı mismo, el momentum vertical perdido por A es 2m u0Ax Ay uAy . La ley de la conservación del momentum dice que el momentum vertical perdido por una part´ıcula es igual al ganado por la otra:

m

´ ³q ´ ³q 0 0 2 + u0 2 0 2 + u0 2 u0Ax u = m u Ay Ay Bx By uBy

(3.1)

En este momento debemos expresar las cuatro variables u0Ax , u0Ay , u0Bx y u0By en términos de las cantidades nos primadas ux , uy y v, y esto se hace con las fórmulas de la adición relativista de velocidades. Téngase en cuenta que las ecuaciones (2.35) y (2.36) no pueden usarse directamente, porque hay una confusión en la notación: en las fórmulas (2.35) y (2.36) las ux , uy son variables algebraicas (que pueden tomar valores positivos o negativos), en cambio en la presente sección las ux , uy , u0Ax , u0By , ... son cantidades positivas. Con esta advertencia en mente procedemos a usar, para la part´ıcula B, las ecuaciones (2.35) y (2.36): u0Bx = u0By =

ux − v vux 1− 2 p c 1 − v 2 /c2 vux uy 1− 2 c

As´ı mismo, para la part´ıcula A las ecuaciones (2.35) (2.36) dan: 63

−ux − v v(−ux ) 1− c2 p 1 − v 2 /c2 u v(−ux ) y 1− c2

−u0Ax =

u0Ay =

Al colocar estas cuatro ecuaciones en (3.1) se llega a:  q (ux + v)2 + (1 − v 2 /c2 )u2y  m vux 1+ 2 c q  vux 1+ 2 (ux − v)2 + (1 − v 2 /c2 )u2y c  = m vux vux 1− 2 1− 2 c c Llevemos esta ecuación al l´ımite uy → 0: 

   vux 1+ 2 |u + v| |u − v| x c  = m x  m vux vux vux 1+ 2 1− 2 1− 2 c c c De todos los observadores inerciales, escojamos aquel que tiene v = ux : µ m

2v 1 + v 2 /c2

¶ = m(0) =

1 + v 2 /c2 1 − v 2 /c2 m(0)

s

µ 1−

2v/c 1 + v 2 /c2

¶2

Esta es la respuesta que buscábamos. Para simplificar su escritura hagamos 2v estos dos cambios en la notación: m(0) → m0 y →u : 1 + v 2 /c2 m0 m(u) = q 1 − u2 /c2 64

(3.2)

Esta es la ecuación más importante de la mecánica en la teor´ıa especial de la relatividad. La masa de una part´ıcula no es una constante, sino que es función de la velocidad u de la part´ıcula; he aqu´ı una modificación esencial en el concepto de masa. Nota: Releamos las palabras que siguen a la ecuación (3.1). Si en vez de usar la adición relativista de velocidades hubiéramos empleado la adición galileana (2.27) ¿adónde habr´ıamos llegado? Para responder esta pregunta apliquemos la fórmula (2.27) a las part´ıculas A y B, con lo que llegamos a: −u0Ax = −ux − v , u0Bx = ux − v , u0Ay = uy y u0By = uy . Al poner estas cuatro ecuaciones en la fórmula (3.1) se obtiene ³q m

(ux + v)2 + u2y

´ =m

³q ´ (ux − v)2 + u2y

Si esta ecuación ha de cumplirse para valores arbitrarios de ux , uy y v, se concluye que m no puede ser una función, sino que tiene que ser una constante. De esta manera hemos llegado a un viejo resultado de la f´ısica newtoniana: cuando se usan las transformaciones de Galileo, y se define p = mu con m constante, entonces la ley de la conservaci´ on del momentum es válida para todos los observadores inerciales.

3.2

Las nuevas cantidades din´ amicas

En la f´ısica newtoniana el momentum, la fuerza, el trabajo y la energ´ıa R cinética se definen as´ı: p = mu, F = dp/dt, Trabajo = F · dr, Energ´ıa cinética = el trabajo que se realiza para llevar a la part´ıcula desde el reposo hasta velocidad u. La dinámica relativista conserva estas definiciones, pero todas con la nueva masa m(u). En general, siempre que escribamos m, debe entenderse m(u): p = mu =

(3.3) m0 u

q

1 − u2 /c2

F = 65

dp dt

(3.4)

(3.5)

Z Trabajo =

Z F · dr =

Z

dp · dr = dt

dr dp · = dt

Z d(mu) · u ,

o sea que Z Trabajo =

(m du · u + dm u2 )

(3.6)

De otro lado, elevando al cuadrado ambos lados de la ecuación (3.2) se obtiene: ³ u · u´ = m20 m2 1 − 2 c Tomar diferenciales en ambos lados: 2m dm − 2m dm u2 /c2 − 2m2

u · du = 0, c2

de donde: m u · du + dm u2 = c2 dm Esto en la ecuación (3.6) da: Z 2

Trabajo = c

dm

(3.7)

Esta fórmula establece una nueva interpretaci´ on del trabajo: en la relatividad el trabajo es el cambio de masa. La energ´ıa cinética K (que es, por definición, la energ´ıa que hay que invertir para llevar una part´ıcula desde el reposo hasta velocidad u) es un trabajo muy especial: el que se necesita para cambiar la masa desde m0 hasta m: Z K = c2

m

dm m0

K = mc2 − m0 c2 66

(3.8)

De la ecuación (3.8) se sigue que K + m0 c2 = mc2

(3.9)

La energ´ıa mecánica total de la part´ıcula, que representamos mediante la letra E , es la suma K + m0 c2 : E = m0 c2 + K = mc2

(3.10) (3.11)

¿Por qué llamar energ´ıa a la cantidad mc2 ? A primera vista parece apresurado llamar energ´ıa a una cantidad recién encontrada; ya tendremos ocasión de justificar este nombre en la sección 3.3. Si usamos la ecuación (3.2) en la (3.11) escribimos: m0 c2 E=q 1 − u2 /c2

(3.12)

Esta ha sido una presentación rápida de las cuatro cantidades dinámicas m, p, K, y E , tal como quedan redefinidas en la relatividad especial. Las Figuras 3.3, 3.4, 3.5 y 3.6 muestran cualitativamente estas curvas einsteinianas marcadas con la letra e ; se deben comparar con las curvas newtonianas que aparecen marcadas con la letra n. Claramente las cuatro cantidades dinámicas E, K, p, u son redundantes, si m0 está dada: conocida una cualquiera de ellas se puede averiguar las otras tres. Hallemos por ejemplo algunas de esas relaciones. Para expresar u en términos de p, podemos elevar al cuadrado cada uno de los lados de la ecuación (3.4), y despejar u2 /c2 : u2 /c2 = 1 − 67

m20 c2 m20 c2 + p2

(3.13)

Para expresar u en términos de E, podemos elevar al cuadrado cada uno de los lados de la ecuación (3.12), y despejar u2 /c2 :

u2 /c2 = 1 −

m20 c4 E2

(3.14)

Para expresar E en términos de p, igualamos los lados derechos de las ecuaciones (3.13) y (3.14): E 2 = m20 c4 + p2 c2

(3.15)

En forma similar se encuentran todas las conexiones entre las cuatro variables: E = m0 c2 + K = K = E − m0 c2 =

p m0 c2 (m0 c2 )2 + p2 c2 = p 1 − u2 /c2 p

(m0 c2 )2 + p2 c2 − m0 c2 = p

m0 c2 1−

u2 /c2

− m0 c2

1p m0 u 1p 2 E − (m0 c2 )2 = (m0 c2 + K)2 − (m0 c2 )2 = p c c 1 − u2 /c2 s s µ ¶2 µ ¶−2 m0 c2 K c =c 1− 1+ u = c 1− =s 2 µ ¶ E m0 c m0 c 2 1+ p p =

Masa cero: Para part´ıculas de masa cero, como el fotón, el momentum se denota por medio de la letra k, y su magnitud es k. Las fórmulas anteriores se simplifican considerablemente: k = E/c

para masa cero.

(3.16)

p Bajas velocidades: El factor 1/ 1 − u2 /c2 se puede expandir usando la fórmula del binomio de Newton: 68

p 1 1/ 1 − u2 /c2 = r 1−

u2 c2

µ ¶− 12 u2 1 u2 3 u4 = 1− 2 = 1+ + +··· c 2 c2 8 c4

Si la velocidad es suficientemente baja podemos despreciar los términos del p u4 1 u2 orden de 4 . En este caso 1/ 1 − u2 /c2 → 1 + . Con este resultado c 2 c2 llegamos a: 1 m0 u2 2 ¶ µ u2 → m0 m → m0 1 + 2 2c µ ¶ u2 p → m0 u 1 + 2 → m0 u 2c µ ¶ u2 2 E → m0 c 1+ 2 → m0 c2 2c

K →

3.3

La energ´ıa en la relatividad especial

El momentum newtoniano es m0 u, y el relativista es mu. La redefinición m0 u → mu se hace con el propósito expreso de que la ley de la conservaci´ on del momentum se cumpla para todos los observadores inerciales. De la misma manera, la energ´ıa relativista se define como en (3.10) para que la ley de la conservación de la energ´ıa se cumpla absolutamente. Esta presentaci´ on podr´ıa parecer extra˜ na, pero es sana: en vez de probar que el momentum y la energ´ıa se conservan absolutamente, vamos a definir momentum y energ´ıa de una manera que garantice que las dos leyes de conservaci´ on sean absolutamente válidas. En la sección 3.1 vimos que el momentum se conserva absolutamente si se define como p = mu ; el propósito de esta sección es probar que la energ´ıa se conserva absolutamente si se define como E = m0 c2 + K . Estudiemos [6] la colisión de dos objetos que tienen la misma masa en reposo m0 . Pensemos que uno de los objetos es una piedra y el otro es de alg´ un material blando como barro; los objetos se escogen as´ı para que la colisión sea completamente inelástica seg´ un un observador O que está en reposo respecto al centro de masa. La Figura 3.7 muestra, seg´ un O, las situaciones antes y después del choque: los dos cuerpos, llamados A y B, tienen velocidad u 69

antes del choque. Como resultado del choque queda, al final, un sólo cuerpo, en reposo, cuya masa en reposo es M0 . Nótese que como este cuerpo final queda en reposo para O, este observador registra que la energ´ıa cinética se ha perdido por completo: para O la colisión es completamente inelástica. Ahora consideremos otro observador O0 que se mueve, respecto a O, con velocidad u hacia la derecha. Es claro que para O0 la part´ıcula A está en reposo antes del choque; la part´ıcula B tiene una velocidad que llamaremos u0 . La Figura 3.8 muestra las situaciones para O0 , antes y después del choque: claramente el cuerpo final M0 tiene velocidad u. Veamos cuál es, seg´ un O0 , el momentum total antes del choque: m0 u0 mu0 = q , 2 1 − u0 /c2 y el momentum después, también seg´ un O0 : M0 u

Mu = q

1 − u2 /c2

Para O0 la ley de la conservaci´ on del momentum dice que M0 u

q

1 − u2 /c2

M0

m u0 q 0 2 1 − u0 /c2 q 0 1 − u2 /c2 u = m0 q u 2 1 − u0 /c2 =

(3.17)

Queremos expresar u0 en términos de u, para que en la ecuación (3.17) aparezca una sola velocidad u. Notemos que el objeto B tiene velocidad u seg´ un O, y tiene velocidad u0 respecto a O0 ; como estas u y u0 se refieren al mismo cuerpo, deben satisfacer la ecuación (2.35). Haciendo u0x = −u0 , ux = −u y v = u, la ecuación (2.35) es: (−u0 ) =

(−u) − u , u(−u) 1− c2 70

de donde

u0 =

2u 1 + u2 /c2

Al poner este valor de u0 en la ecuación (3.17), se llega a 2m0 M0 = q 1 − u2 /c2

(3.18)

Este resultado es novedoso: ya que M0 6= 2m0 , la masa en reposo total no se conserva. El cambio de la masa en reposo es: 



1 M0 − 2m0 = 2m0  q − 1 2 2 1 − u /c

(3.19)

Calculemos ahora el cambio en la energ´ıa cinética, de acuerdo con un observador inercial cualquiera O00 que se mueve, respecto a O , con una velocidad arbitraria ω. Para el observador O00 los cuerpos A y B tienen velocidades u00A y u00B , y el cuerpo final de masa M0 tiene velocidad U 00 . Para la transformación entre los observadores O y O00 usamos la fórmula de adición de velocidades (2.35): u00A =

u−ω uω ; 1− 2 c

u00B =

−u − ω uω ; 1+ 2 c

U 00 =

0−ω = −ω 1−0

(3.20)

Calculemos, seg´ un O00 , cuánto es la energ´ıa cinética perdida en la colisión. Utilizamos la ecuación (3.8) para calcular la energ´ıa cinética antes y después del choque: 00 00 00 Kantes = KA + KB

= (m00A c2 − m0 c2 ) + (m00B c2 − m0 c2 ) 

 c2



 c2

m0 m0 = q − m0 c2  +  q − m0 c2  00 2 2 00 2 2 1 − uA /c 1 − uB /c 71



 1

00 00 2 2 2 q Kdespu´ es = M c − M0 c = M0 c

1−U

00 2

2

− 1

/c

00 00 Entonces el cambio de energ´ıa cinética ∆K 00 = Kdespu´ es − Kantes es:



 1

00 00 2 q Kdespu´ − 1 es − Kantes = M0 c 1 − U 00 2 /c2









(3.21)

m0 c2 m0 c2 − m0 c2  −  q − m0 c2  − q 00 2 2 00 2 2 1 − uA /c 1 − uB /c Al poner las ecuaciones (3.20) en la ecuación (3.21) se obtiene 



1 − 1 Kdespués − Kantes = −2m0 c2  q 2 2 1 − u /c

(3.22)

Nótese que en el lado derecho de esta ecuación no aparece la velocidad ω del observador O00 , lo que quiere decir que el cambio en la energ´ıa cinética es el mismo para todos los observadores inerciales: es absoluto; por esta razón hemos borrado la doble prima en K 00 . Si multiplicamos ambos lados de la ecuación (3.19) por c2 encontramos: 

 1

− 1 (M0 − 2m0 ) c2 = 2m0 c2  q 2 2 1 − u /c Ahora, al sumar lado a lado las ecuaciones (3.22) y (3.23) se obtiene: Kdespués − Kantes + (M0 − 2m0 )c2 = 0 2m0 c2 + Kantes = M0 c2 + Kdespués 72

(3.23)

Escribamos la u ´ltima ecuación sugestivamente: (m0 c2 + KA, antes ) + (m0 c2 + KB, antes ) = M0 c2 + Kdespués

(3.24)

Consideremos un conjunto de cuerpos que chocan. En cualquier instante el conjunto consta de cuerpos con masas en reposo m0,1 , m0,2 , m0,3 , · · · y energ´ıas cinéticas K1 , K2 , K3 , · · · . La fórmula (3.24) dice que la cantidad X

(m0,i c2 + Ki )

(3.25)

i

es una constante del movimiento. Queremos recalcar que la velocidad ω del observador O00 , no aparece en (3.24), o sea que la ley de conservaci´ on (3.24) no es relativa, sino absoluta. En otras palabras, (3.24) cumple el principio de la relatividad (1.10), y podemos afirmar que la cantidad conservada (3.25) debe ser importante. La llamamos energ´ıa total o también energ´ıa mec´ anica. La energ´ıa total de una part´ıcula es su energ´ıa cinética más su masa en reposo multiplicada por c2 . As´ı justificamos, a posteriori, que a la cantidad (3.10) le hubiéramos dado el nombre de energ´ıa.

3.4

E = mc2

La palabra inercia se usa para denotar aquella oposición que presentan los cuerpos cuando se intenta acelerarlos. De una manera gráfica podemos decir que la inercia de un cuerpo corresponde a la presión que sentimos en las manos cuando lo empujamos; al empujar una naranja o un camión sentimos muy diferentes grados de presión en nuestras manos, y decimos en consecuencia que el camión tiene más inercia que una naranja. Siguiendo una tradición de muchos siglos, la cantidad f´ısica asociada a la inercia de un cuerpo es la masa. Respecto al choque inelástico que estudiamos en la sección anterior, el aumento de masa en reposo M0 −2m0 es un aumento de la energ´ıa total interna. En efecto, M0 − 2m0 es igual a la energ´ıa cinética perdida; en el choque esta energ´ıa cinética se ha convertido en movimiento rotacional y vibracional de las moléculas, es decir, calor. Todo este calor es energ´ıa interna, es masa, es inercia. Un cuerpo puede contener, albergar, muchas clases de energ´ıa: masa 73

en reposo de las part´ıculas que lo componen, energ´ıa cinética de ellas y toda clase de energ´ıas de interacci´ on entre ellas. La suma de todas estas energ´ıas internas se manifiesta como masa; la masa del cuerpo es una medida de la suma de todas esas energ´ıas internas. La relación entre masa y energ´ıa, dada por la ecuación (3.11), fue, en palabras de Einstein, “el pensamiento más feliz de mi vida”. El art´ıculo en el que publicó este resultado [3] tiene una extensión de menos de tres páginas, y él lo presenta como una continuaci´ on del art´ıculo principal [2] de la relatividad. Para deducir la relación entre masa y energ´ıa, calcula la energ´ıa cinética de un cuerpo que emite dos pulsos de luz. Esta es, claramente, una referencia a la masa inercial del cuerpo; habr´ıan de pasar seis a˜ nos para que se diera cuenta de que cuando un cuerpo sufre un cambio en su masa inercial, también sufre un cambio en su masa gravitacional, y que ambos cambios tienen exactamente la misma magnitud. Conviene recalcar que aunque la masa y la energ´ıa están conectadas por una relación tan simple como E = mc2 , esto no significa que masa y energ´ıa sean conceptos idénticos. De hecho, puede haber la segunda sin que haya la primera: el fotón tiene energ´ıa, mas no masa. Afirmamos arriba que la masa de un sistema f´ısico es una medida de su energ´ıa interna. En términos de mecánica cuántica, la masa es mayor cuando el sistema ocupa un estado excitado que cuando ocupa el estado básico. Para ilustrar lo que estamos mencionando, supongamos una molécula formada por dos átomos idénticos; si los dos átomos están en el mismo estado cuántico, podemos afirmar que tienen la misma masa y por consiguiente el centro de masa de la molécula está en el punto medio de la l´ınea que los une; pero si uno de los átomos está en un estado excitado y el otro no, el primero tiene mayor masa que el segundo y en consecuencia el centro de masa de la molécula no queda en el punto medio de la l´ınea que los une.

Energ´ıa de enlace. Cuando Einstein publicó su ecuación E = mc2 , dijo claramente que “la radiación transporta inercia”. Decenios de experimentación en f´ısica nuclear y en part´ıculas elementales habr´ıan de corroborar la validez de esta afirmación. Para verlo con claridad introducimos a continuación el concepto de energ´ıa de enlace, valiéndonos de un ejemplo de la f´ısica nuclear. El deuterón es una part´ıcula formada por un protón y un neutrón. Las masas en reposo de estas tres part´ıculas son 74

mp = 938.27 MeV/c2

(3.26)

mn = 939.57 MeV/c2

(3.27)

md = 1875.61

MeV/c2

(3.28)

Rápidamente nos damos cuenta de que mp + mn 6= md . La energ´ıa de enlace es, en este caso, (mp + mn )c2 − md c2 = 2.23 MeV. Cuando un fotón incide sobre un deuterón, puede desintegrarlo, produciéndose un protón y un neutrón. Para que esto ocurra, la energ´ıa del fotón debe ser igual o mayor que 2.23 MeV. As´ı mismo, un protón y un neutrón libres pueden formar un deuterón; cuando esto ocurre se emite un fotón de energ´ıa 2.23 MeV. Lo que hemos mencionado para el deuterón también ocurre fácilmente con otros n´ ucleos livianos: n´ ucleo liviano 1 + n´ ucleo liviano 2 → n´ ucleo 3 + fotón

(3.29)

Ya que el fotón porta energ´ıa, es claro que la masa en reposo del n´ ucleo 3 tiene que ser menor que la suma de las masas en reposo de los n´ ucleos 1 y 2. El proceso general (3.29) se llama fusi´ on nuclear y es lo que ocurre en el Sol, donde dos hidrógenos se pueden fusionar para producir un fotón y un átomo de helio. De otro lado, en los n´ ucleos pesados es frecuente la reacción: n´ ucleo pesado → n´ ucleo1 + n´ ucleo 2 + fotón

(3.30)

Ya que el fotón porta energ´ıa, la masa en reposo del n´ ucleo pesado tiene que ser mayor que la suma de las masas en reposo de los n´ ucleos 1 y 2. El proceso general (3.30) se llama fisi´ on nuclear, y es lo que ocurre en las plantas de energ´ıa nuclear.

3.5

La velocidad l´ımite

p La ecuación K = m0 c2 / 1 − u2 /c2 − m0 c2 que aparece en la página 68 dice claramente que K → ∞ cuando u → c . En palabras, para llevar un objeto masivo desde el reposo hasta que tenga la velocidad de la luz, es necesario a˜ nadirle una cantidad infinita de energ´ıa. Como es imposible usar una cantidad infinita de energ´ıa, concluimos que ning´ un objeto masivo se puede llevar 75

hasta la velocidad de la luz. Un sistema de referencia es un cuerpo de reglas y relojes y, por consiguiente, no puede ser llevado desde el reposo hasta c . Esta es la razón por la que escribimos la frase en bastardilla en la página 17. Debemos tener en cuenta que el espaciotiempo de la relatividad especial tiene un intervalo estático; en efecto, dados un ∆t y un ∆r, el intervalo (2.1) es constante, no cambia en el tiempo. Cuando se estudien condiciones que se salen del marco de la relatividad especial, no puede sorprendernos que ocurran cosas diferentes a las que hemos discutido. Por ejemplo, si el espacio está explotando, como afirma la teor´ıa del big-bang, el intervalo entre dos eventos fijos no es constante, y en consecuencia[?] algunas galaxias pueden tener, respecto a nosotros, velocidades mayores que c.

3.6

Las transformaciones de p , E , m , F

Consideremos una part´ıcula de masa en reposo m0 sobre la cual se ejerce una fuerza. Las cantidades f´ısicas que registra O son p , E , m , F , y las de O0 son p0 , E 0 , m0 , F0 . Nos proponemos encontrar las ecuaciones que expresan las cantidades primadas en términos de las no primadas. Antes de ejecutar esta tarea es conveniente que demostremos la fórmula: vu0x 1 c2 p p =p 2 2 0 2 2 1 − u /c 1 − u /c 1 − v 2 /c2 1+

(3.31)

Esta ecuación será utilizada varias veces a lo largo de esta sección. Para deducir la ecuación (3.31) elevamos al cuadrado cada uno de los lados de las ecuaciones (2.32) , (2.33) y (2.34), obteniéndose: u2x

(u0 + v)2 =µ x ¶ ; vu0x 2 1+ 2 c

u2y

¡ ¢ 1 − v 2 /c2 u0y2 = µ ¶ ; vu0x 2 1+ 2 c

u2z

¡ ¢ 1 − v 2 /c2 u0z2 = µ ¶ vu0x 2 1+ 2 c

Ahora sumamos, lado a lado, estas tres ecuaciones: £ 0 ¡ ¢¡ 02 ¢¤ 1 2 2 2 u2x + u2y + u2z = µ uy + u0z2 ¶2 (ux + v) + 1 − v /c 0 vu 1 + 2x c 76

En el lado izquierdo identificamos u2x + u2y + u2z = u2 ; en el lado derecho identificamos u0y2 + u0z2 = u0 2 − u0x2 : u

2

=

=

¡ ¢¡ ¢ (u0x + v)2 + 1 − v 2 /c2 u0 2 − u0x2 µ ¶ vu0 2 1 + 2x c µ 0 ¶2 vux v 2 u0 2 v 2 + u0 2 − 2 + + 2vu0x c c µ ¶ vu0x 2 1+ 2 c

Observemos los dos u ´ltimos términos del numerador; si sumamos c2 se completa el cuadrado: v2 2

u

+

u0 2

=

=

µ ¶ v 2 u0 2 vu0x 2 2 2 − 2 −c +c 1+ 2 c c µ ¶2 0 vu 1 + 2x c

v 2 u0 2 v 2 + u0 2 − 2 − c2 c + c2 µ ¶ vu0x 2 1+ 2 c

c2 − u2 =

=

v 2 u0 2 −v 2 − u0 2 + 2 + c2 c µ ¶ vu0x 2 1+ 2 c c2 (1 − v 2 /c2 )(1 − u0 2 /c2 ) µ ¶ vu0x 2 1+ 2 c

Ahora dividir ambos lados por c2 : 1 − u2 /c2 =

(1 − v 2 /c2 )(1 − u0 2 /c2 ) , µ ¶ vu0x 2 1+ 2 c 77

y de aqu´ı se sigue la fórmula (3.31), que es lo que quer´ıamos demostrar. Ya estamos en condición de calcular la transformación del momentum. Comencemos con px que es m0 ux px = p 1 − u2 /c2 En el numerador usamos la ecuación (2.32) y en el denominador usamos la ecuación (3.31):

px =

=

Ã

1

p 1 − v 2 /c2

m0 u0x

m0 c2

v p +p 02 2 02 2 c 1 − u /c 1 − u /c 2

!

vE 0 p0x + 2 c p 1 − v 2 /c2

Con procedimientos similares se encuentra que py = p0y y que pz = p0z . Ataquemos ahora la transformación de la energ´ıa: E=p

m0 c2 1 − u2 /c2

En el denominador usamos la ecuación (3.31): 1

E =

p 1 − v 2 /c2

=

E 0 + vp0x p 1 − v 2 /c2

Ã

m0 c2

m0 u0x

!

p +v p 1 − u02 /c2 1 − u02 /c2

Reunamos las transformaciones obtenidas hasta el momento: E = γ (E 0 + vp0x ) ³ v ´ px = γ p0x + 2 E 0 c 0 py = py , pz = p0z 78

(3.32) (3.33) (3.34)

A partir de estas cuatro ecuaciones se obtienen las transformaciones inversas cambiando v por −v e intercambiando variables primadas con no primadas: E 0 = γ (E − vpx ) ³ v ´ p0x = γ px − 2 E c p0y = py ,

(3.35)

p0z = pz

Dedujimos las transformaciones de E y p estudiando una part´ıcula cualquiera, de masa m0 . Debemos anotar, sin embargo, que estas transformaciones tienen validez general, ya que se aplican a cualquier sistema f´ısico. Pensemos que las u ´ltimas ocho ecuaciones son las fórmulas de transformación de la energ´ıa y el momentum de cualquier sistema (una nube, un planeta, etc.). Las cuatro ecuaciones (3.35) son como las cuatro ecuaciones (1.33), si se admite la correspondencia E/c ↔ ct, px ↔ x, py ↔ y, pz ↔ z. Más concisamente: µ

¶ E ,p c

↔

(ct , r)

(3.36)

La asociación (3.36) se dice, en palabras, as´ı: (E/c , p) transforma como (ct , r); as´ı se definen los vectores, asunto que trataremos en detalle en el cap´ıtulo 5, dedicado a los tensores de la relatividad especial. De otro lado, estamos a un paso de definir el momentum del fotón y deducir las fórmulas de la aberración de la luz y del efecto Doppler; pero aplazamos esta tarea hasta la sección 5.8. La transformación de la masa se obtiene muy fácilmente si reescribimos la ecuación (3.32) de la manera siguiente: mc2 = γ (m0 c2 + m0 vu0x ) , de donde: ¶ µ vu0x m0 m = γ 1+ 2 c ³ vux ´ m0 = γ 1 − 2 m c 79

(3.37) (3.38)

Nos queda por calcular la transformación de la fuerza. Comencemos con Fx . dpx Escribimos Fx = y usamos la ecuación (2.28): dt Fx =

γ −1 d px vu0x dt0 1+ 2 c

Ahora utilizamos la fórmula (3.33): 1 Fx = vu0 1 + 2x c

µ

dp0x v dE 0 + dt0 c2 dt0

En el paréntesis del lado derecho reconocemos que m0 c2 ; entonces Fx =

dp0x = Fx0 y que E 0 = dt0

1 dm0 0 (F + v ) vu0x x dt0 1+ 2 c

Ahora, la ecuación (3.47) dice que

Fx =

¶

dm0 1 = 2 F0 · u0 , o sea que 0 dt c

1 v (Fx0 + 2 F0 · u0 ) 0 vu c 1 + 2x c

Repitamos este análisis para Fy :

Fy =

Pero py = p0y y

d γ −1 py vu0x dt0 1+ 2 c

dpy0 = Fy0 , entonces Fy = dt0

resultado similar. En conclusión: 80

γ −1 F 0 , y para Fz un vu0x y 1+ 2 c

Fx =

Fy =

Fz =

v 0 0 u ·F c2 vu0 1 + 2x c −1 γ F0 vux0 y 1+ 2 c −1 γ F0 vux0 z 1+ 2 c Fx0 +

(3.39)

(3.40)

(3.41)

Estas ecuaciones dicen claramente que F0 = 0 ⇔ F = 0: si una part´ıcula aparece en equilibrio (en otras palabras, la part´ıcula es libre) para un observador, también aparece en equilibrio para todos los otros observadores inerciales. Además F0 6= 0 ⇔ F 6= 0: si una part´ıcula no aparece en equilibrio para un observador, entonces todos los otros observadores inerciales registran que la part´ıcula no está en equilibrio. En otras palabras: la condición de equilibrio es absoluta, y la situación de desequilibrio también es absoluta. Las rec´ıprocas de las u ´ltimas tres ecuaciones son

Fx0 = Fy0 = Fz0 =

v u·F c2 vux 1− 2 c −1 γ vux Fy 1− 2 c −1 γ vux Fz 1− 2 c Fx −

(3.42)

(3.43)

(3.44)

¦¦¦¦¦¦¦¦¦¦¦¦¦ Ya hemos sentado las bases de la nueva mecánica, relativista. En este momento el cap´ıtulo cambia el rumbo que tra´ıa, para dedicarse al estudio de ejemplos y casos particulares. Comenzamos con el estudio de una part´ıcula cargada que viaja en una región donde hay un potencial electrostático; luego planteamos el problema general de la aceleración relativista y finalmente aplicamos este estudio al caso importante de la part´ıcula cargada que, por la acción de un campo magnético, describe una trayectoria circular. Es 81

bien sabido que las cargas eléctricas aceleradas emiten radiación electromagnética, y todo estudio riguroso deber´ıa tener en cuenta esta pérdida de momentum y energ´ıa. El análisis detallado de esta radiación es intrincado y, de seguirlo, podr´ıa distraernos de nuestro propósito principal, que es describir la ideas esenciales de la mecánica relativistas. Por este motivo, para simplificar los cálculos, nos olvidaremos de la radiación. Sabemos que de esta manera se cometen errores esenciales, pero lo hacemos en aras de enfatizar los aspectos relativistas de la mecánica.

3.7

Masa y potencial electrost´ atico

Estudiemos el movimiento de una part´ıcula cargada que se mueve en una región donde hay un potencial electrostático V . Para simplificar el análisis supongamos que el movimiento de la part´ıcula es en la dirección x. El campo eléctrico es −dV /dx, la fuerza es −q dV /dx y el trabajo que realiza el campo cuando la part´ıcula se desplaza dx es (−q dV /dx) dx = −q dV. Escribamos el trabajo total cuando la part´ıcula pasa de un punto donde el potencial es Vi , a otro punto donde el potencial es Vf : Z Trabajo = −q

Vf

Vi

dV = −q(Vf − Vi ) ≡ −q∆V

(3.45)

Obsérvese que si q es positiva y ∆V es negativo, entonces el trabajo es positivo: la carga positiva gana velocidad a medida que desciende en el potencial electrostático. Gana energ´ıa cinética, es decir gana masa. La masa que gana la part´ıcula es −q∆V /c2 . ¿Es la masa ganada −q∆V grande o peque˜ na? Para responder esta pregunta debemos comparar −q∆V con alguna otra masa, y lo más natural es compararla con m0 . El problema es altamente relativista si −q∆V À m0 c2 , y el problema no es relativista si −qV ¿ m0 c2 . Por ejemplo, en el caso del electrón se tiene m0 c2 = 0.511 MeV; el régimen altamente relativista es e∆V À 0.5 MeV, es decir: ∆V À 0.5 MV. Esto significa que para llevar un electrón al régimen altamente relativista se necesita que la diferencia ∆V sea mucho mayor que 0.5 megavoltios. As´ı mismo, cuando ∆V sea mucho menor que 0.5 megavoltios, podremos confiadamente pensar que el régimen no es relativista. De aqu´ı se saca una ense˜ nanza: Cuando la energ´ıa cinética de una part´ıcula es mucho mayor 82

que su masa en reposo, el régimen es altamente relativista. Y si la energ´ıa cinética es mucho menor que la masa en reposo, el régimen no es relativista, es decir, no se notan lo efectos relativistas. Apliquemos el criterio establecido en el u ´ltimo párrafo al caso del electrón en el átomo de hidrógeno. Las energ´ıas t´ıpicas del átomo son electronvoltios; esto quiere decir que la energ´ıa cinética es del orden de 1 eV. Para comparar esta energ´ıa cinética con la masa en reposo formamos el cociente as´ı: eV ≈ 10−5 0.5 MeV Como 10−5 es bastante menor que 1, podemos afirmar que en el átomo de hidrógeno no son prominentes los efectos relativistas. Por eso la solución no relativista que Schroedinger le dio a este átomo en 1926 funciona bien. Debemos apuntar, sin embargo, que los efectos relativistas en este átomo, aunque peque˜ nos, pueden notarse con instrumentos de alta precisión.

3.8

La aceleraci´ on

Averiguar la trayectoria de una part´ıcula es llegar a una expresión del vector posición r como función del tiempo t . Claramente, u = dr/dt y a = du/dt, o sea que para averiguar la trayectoria se puede partir de la aceleración a , e integrar dos veces. Ahora, para partir de la aceleración es necesario conocer la fuerza F. En conclusión, para averiguar la trayectoria de una part´ıcula es necesario precisar cómo se averigua a cuando se conoce F. Usamos las ecuaciones (3.3) y (3.5) para escribir: F =

d du dm (mu) = m +u dt dt dt = ma

+u

dm dt

(3.46)

Esta fórmula dice que, cuando la masa var´ıa con el tiempo, la fuerza no es simplemente ma. Es interesante anotar que la ecuación (3.46) es válida tanto en la mecánica newtoniana (un cometa pierde agua por evaporación cuando se acerca al Sol, y en consecuencia dm/dt 6= 0) como en la mecánica relativista (cuando la part´ıcula gana u su masa aumenta y en consecuencia 83

dm/dt 6= 0); el hecho, seg´ un (3.46), de que a no sea en general paralela a F, no es un resultado exclusivo de la relatividad especial, sino que ya era posible en la mecánica newtoniana. Para calcular dm/dt en el caso relativista usamos las ecuaciones (3.10) y (3.11): dm 1 dE 1 d 1 dK = 2 = 2 (m0 c2 + K) = 2 dt c dt c dt c dt Ahora, dK es un diferencial de trabajo F · dr: dm dt

=

1 dr F· 2 c dt

=

1 F·u c2

(3.47)

Colocando esta ecuación en (3.46) escribimos: F = ma + a =

F·u u, c2

es decir:

F·u F − u m mc2

(3.48) (3.49)

Vemos as´ı que en la relatividad especial la aceleración no es, en general, paralela a la fuerza. Se presentan sin embargo dos situaciones excepcionales en las que fuerza y aceleración s´ı son paralelas: cuando F es paralela a u, y cuando F es perpendicular a u. Si F es paralela a u la ecuación (3.49) da: F F uu − m mc2 ¡ ¢F = 1 − u2 /c2 m 3 ¡ ¢ F = 1 − u2 /c2 2 m0

a =

para F k u

Ahora, si F y u son perpendiculares, la ecuación (3.49) da: a =

F m 84

(3.50)

=

¡ ¢ F 1 − u2 /c2 m0

para F ⊥ u

(3.51)

La fórmula (3.50) se usa en el caso de los aceleradores lineales. La fórmula (3.51) se usa en los ciclotrones y, en general, siempre que una carga eléctrica se mueva en un lugar donde hay un campo magnético uniforme.

3.9

Movimiento circular

Estudiemos el movimiento de una part´ıcula en un plano en coordenadas polares (r, θ). El vector unitario 1r apunta en dirección de r, y el vector 1θ es perpendicular a r. Es bien sabido [?] que: dθ dr + 1θ r dt dt Ã µ µ ¶2 ! ¶ dr dθ d2 r d2 θ dθ + 1θ 2r +r 2 a = 1r −r dt2 dt dt dt dt

u = 1r

Si colocamos este resultado en la ecuación general (3.49) se obtiene Ã 1r

d2 r −r dt2

µ

dθ dt

¶2 !

µ ¶ dr dθ d2 θ F·u F + 1θ 2r +r 2 = − u dt dt dt m mc2

(3.52)

Pensemos ahora que se presentan estas condiciones: E = 0, B es uniforme y una part´ıcula ingresa con una velocidad u que es perpendicular a B. La u fuerza sobre la part´ıcula es q × B. Esta fuerza es perpendicular a u y la c ecuación (3.49) dice que la aceleración también es perpendicular a u. En conclusión, la fuerza ocasiona un cambio constante en la dirección de u sin que cambie u, resultando as´ı un movimiento circular uniforme. Es claro que dr d2 r d2 θ = 2 = 2 = 0, y la ecuación (3.52) queda: dt dt dt µ −1r r µ r

dθ dt dθ dt

¶2 =

q u×B mc

=

|q|Bu mc

¶2

85

Ahora, r

dθ = u, entonces dt u2 r

=

r =

|q|Bu mc muc |q|B

(3.53)

Part´ıcula preparada en un filtro de velocidades. La fórmula (3.53) se puede escribir: r=

m0 c u q |q|B 1 − u2 /c2

(3.54)

Esta fórmula es u ´til si u es dado. Tal es el caso cuando, antes de entrar en el campo B, la part´ıcula es preparada en un filtro de velocidades. Sabemos [?] que un filtro de velocidades se construye con campos E1 y B1 perpendiculares. Una part´ıcula de carga q y velocidad u experimenta una fuerza dada 1 1 por q(E1 + u1 × B1 ). Esta fuerza es cero si E1 + u1 × B1 = 0, es decir, c c si u1 × B1 = −E1 . Las u ńicas part´ıculas cargadas que siguen derecho, sin desviarse, son aquellas que ingresan al filtro con una velocidad cuya magnitud es c E1 /B1 y cuya dirección es perpendicular a E1 y a B1 . Pensemos en una part´ıcula que emerge de este filtro de velocidades y luego entra en la región donde existe el campo B. Hacemos entonces u = cE1 /B1 en la ecuación (3.54):

r=

E1 /B1 m0 c2 p : |q|B 1 − (E1 /B1 )2

Cálculo relativista

(3.55)

En este momento nos preguntamos cuál ser´ıa el radio si hiciéramos el cálculo de acuerdo con la f´ısica prerrelativista. Para contestar esta pregunta basta que tomemos en la ecuación (3.55) la aproximaci´ on u2 /c2 ¿ 1, es decir, 2 (E1 /B1 ) ¿ 1:

r=

m0 c2 E1 : |q|BB1

Cálculo prerrelativista 86

(3.56)

Part´ıcula preparada en un acelerador. De acuerdo con la fórmula (3.53): r=

pc |q|B

(3.57)

p De otro lado, traigamos de la página 68 la fórmula pc = (m0 c2 + K)2 − (m0 c2 )2 . Si usamos este valor de pc en la ecuación (3.57) encontramos r=

1 p (m0 c2 + K)2 − (m0 c2 )2 |q|B

(3.58)

Esta fórmula es u ´til cuando K es dado. Tal es el caso si, antes de entrar en el campo B, la part´ıcula es preparada en un acelerador. Supongamos que una part´ıcula de carga q es acelerada a través de una diferencia de potencial ∆V ; de acuerdo con la ecuación (3.45) se tiene K = −q∆V = |q∆V |, entonces: r =

=

1 p (m0 c2 + |q∆V |)2 − (m0 c2 )2 |q|B s p 2m0 c2 |q∆V | |q∆V | 1+ |q|B 2m0 c2

(3.59)

Nos preguntamos de nuevo cuál habr´ıa sido r si hubiéramos hecho el cálculo usando la f´ısica prerrelativista. Basta que en la ecuación (3.59) se haga la |q∆V | aproximación u2 /c2 ¿ 1, es decir, ¿1: m0 c2 p 2m0 c2 |q∆V | r= : |q|B

Cálculo prerrelativista

(3.60)

Ejemplo. Considere un filtro de velocidades construido con un campo magnético de 2000 gauss y un campo eléctrico de 1800 statvolt/cm. Un electrón emerge de este filtro y entra en una región donde hay un campo magnético de 1500 gauss (al entrar en esta región la velocidad del electrón es perpendicular al campo de 1500 gauss). Calcule el radio del c´ırculo descrito por el electrón de dos maneras: usando la teor´ıa de la relatividad y usando la f´ısica prerrelativista. Las cantidades f´ısicas de este problema son: 87

m0 c2 = 0.511 MeV,

|q| = 4.8 × 10−10 esu

E1 = 1800 statvolt/cm,

B1 = 2000 gauss,

B = 1500 gauss

(3.61)

La fórmula (3.55) da, en este caso,

r =

0.511 MeV 1800/2000 s −10 µ ¶ 4.8 × 10 × 1500 dina 1800 2 1− 2000

Ahora, eV = 1.6 × 10−12 ergio, o sea que eV/dina = 1.6 × 10−12 cm

(3.62)

r = 2.35 cm

(3.63)

Cálculo relativista.

Para el cálculo prerrelativista usamos la ecuación (3.56), y se obtiene: r = 1.02 cm

Cálculo prerrelativista.

(3.64)

La comparación entre las ecuaciones (3.63) y (3.64) muestra que el resultado relativista es mayor que el prerrelativista. La causa de esto no es dif´ıcil de rastrear; en efecto, la diferencia entre los dos cálculos está en la ra´ız cuadrada en el denominador de la ecuación (3.55), que es justamente el que causa el crecimiento de la masa de una part´ıcula en la teor´ıa de la relatividad. Se esperaba que el resultado del cálculo relativista fuera mayor que el prerrelativista, porque en el primero la part´ıcula es más masiva que en el segundo, y esto debe notarse como una ampliación del c´ırculo. Ejemplo. Un protón se acelera desde el reposo a través de una diferencia de potencial de 5 MV y luego ingresa en una región donde hay un campo magnético de 30000 gauss. Calcular el radio del c´ırculo de acuerdo con la teor´ıa de la relatividad, y luego usando la f´ısica prerrelativista. La masa del protón es 938 MeV/c2 . Las cantidades f´ısicas de este problema son: 88

m0 c2 = 938 MeV,

|q| = 4.8 × 10−10 esu

B = 30000 gauss,

|q∆V | = 5 MeV

Con estas cantidades la fórmula (3.59) es: p

2 × 938 × 5 × (MeV)2 r = 4.8 × 10−10 × 30000 dina

r 1+

5 2 × 938

Usar la fórmula (3.62): √ r = 10.76 1 + 0.0027 cm = 10.77 cm

(3.65)

El cálculo prerrelativista se hace con la ecuación (3.60). El resultado da como en la ecuación (3.65), pero sin la ra´ız cuadrada: r = 10.76 cm :

Cálculo prerrelativista.

(3.66)

De nuevo, el resultado (3.65) es mayor que (3.66) porque la part´ıcula tiene mayor masa en la relatividad especial.

ux B

uy ux

uy

A uy

ux uy

ux

Figura 3.1 El choque de dos part´ıculas seg´ un lo registra un observador O que está en reposo respecto al centro de masa. La part´ıcula A va de derecha a izquierda y la part´ıcula B de izquierda a derecha. ux y uy son cantidades positivas.

89

u'By

u'Bx u'Bx

u'By

u'Ay

u'Ax u'Ax

u'Ay

Figura 3.2 El mismo choque de la Figura 3.1, seg´ un lo registra otro observador O0 que viaja hacia la derecha con velocidad v.

m

p

e

e

n

n

u

u

c

c

Figura 3.3 La masa como función de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Figura 3.4 El momentum como función de la velocidad. La versión newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

90

K

e

E e

n

n

u

u

c

c

Figura 3.5 Energ´ıa cinética en funci´ on de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Figura 3.6 La energ´ıa total como función de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Después

Antes mo

mo u

M0, reposo

u

A

B

Figura 3.7 El choque de dos part´ıculas de masas iguales, de acuerdo con un observador O que está en reposo respecto al centro de masa. Antes del choque las part´ıculas tienen velocidad u . El choque deja como resultado un cuerpo final en reposo de masa M0 . Claramente la energ´ıa cinética final es cero: para O la colisión es completamente inelástica.

Después

Antes Reposo u' A

u

M0

B

Figura 3.8 El mismo choque de la Figura 3.7, pero ahora desde el punto de vista de un observador O0 que se mueve hacia la derecha con velocidad u . Para O0 , antes del choque el cuerpo A está en reposo y el cuerpo B tiene velocidad u0 hacia la izquierda. Después del choque el cuerpo final M0 tiene velocidad u hacia la izquierda.

91

92

Cap´ıtulo 4

El campo electromagn´ etico En los cap´ıtulos anteriores discutimos algunas consecuencias del principio de la relatividad. De un lado, nos vimos poco menos que obligados a generalizar los conceptos newtonianos de masa, momentum, energ´ıa, etc. Y de otro lado, cuando dos observadores inerciales toman medidas de longitud, tiempo, fuerza, etc., el principio de la relatividad nos mostró de qué manera se establece una comparación entre las dos mediciones. El cap´ıtulo presente se refiere a la segunda clase de consecuencias: estudiaremos cómo se comparan los campos eléctrico y magnético que registra un observador, con los registros de otro observador. El tema es de primera importancia, como lo demuestra el hecho de que el mismo Einstein, en el primer párrafo del art´ıculo [2] en que publica su relatividad especial, presenta as´ı la motivaci´ on, la idea central de su trabajo: las leyes del electromagnetismo deben ser, en el fondo, las mismas para todos los observadores inerciales1 . Concentraremos nuestra atención en la transformación del campo electromagnético, y presentaremos dos ejemplos interesantes: la carga móvil y el alambre que porta una corriente. Finalmente veremos que la electrodinámica cumple el principio de la relatividad, es decir, que las ecuaciones de Maxwell y la ley de fuerza de Lorentz son covariantes bajo las transformaciones de Lorentz.

4.1

Transformaci´ on de los campos E y B

De acuerdo con el observador O, las componentes del campo electromagnético son E, B. El mismo campo electromagnético tiene, para O0 , componentes 1 El art´ıculo lleva por t´ıtulo Sobre la electrodin´ amica de cuerpos en movimiento. La palabra cuerpo quiere decir observador inercial.

93

E0 , B0 . Nos proponemos encontrar la transformación entre E, B y E0 , B0 ; es decir, vamos a encontrar las fórmulas que nos permiten escribir las componentes E0 , B0 en términos de las componentes E, B. Para hallar las fórmulas de la transformación del campo electromagnético asumiremos que las ecuaciones de Maxwell representan fielmente a las leyes f´ısicas del electromagnetismo. De acuerdo con el principio de la relatividad (1.10), la forma de estas ecuaciones debe ser la misma para todos los observadores inerciales. Tomemos dos de las ecuaciones de Maxwell: 1 ∂E c ∂t 1 ∂B c ∂t

= ∇×B

(4.1)

= −∇ × E

(4.2)

As´ı son para el observador O. Siguiendo el principio de la relatividad, afirmamos que para O0 : 1 ∂E0 c ∂t0 1 ∂B0 c ∂t0

= ∇0 × B0

(4.3)

= −∇0 × E0

(4.4)

1 ∂t Ey = ∂z Bx − ∂x Bz c

(4.5)

La parte y de la ecuación (4.1) es:

As´ı mismo, la parte z de (4.2) y la parte z de (4.1) son: 1 ∂t Bz = ∂y Ex − ∂x Ey c 1 ∂t Ez = ∂x By − ∂y Bx c

(4.6) (4.7)

Las ecuaciones de O0 que corresponden a (4.5), (4.6) y (4.7) son: 1 ∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 c 94

(4.8)

1 ∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 c 1 ∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 c

(4.9) (4.10)

Ahora ponemos las cuatro derivadas (1.44) en las ecuaciones (4.5)-(4.7) para obtener: ³ 1 ∂t0 γ Ey − c ³ 1 ∂t0 γ Bz − c ³ 1 ∂t0 γ Ez + c

³ v ´ v ´ = ∂z 0 Bx − ∂x0 γ Bz − Ey Bz c c ´ ³ v v ´ Ey = ∂y0 Ex − ∂x0 γ Ey − Bz c c ³ ´ ´ v v By = ∂x0 γ By + Ez − ∂y0 Bx c c

(4.11) (4.12) (4.13)

Al comparar las ecuaciones (4.8) y (4.11) vemos que Ey0 debe ser proporcional v a γ(Ey − Bz ), que Bx0 debe ser proporcional a Bx , y que Bz0 debe ser c v proporcional a γ(Bz − Ey ). Llamemos f al factor de proporcionalidad. c Esta f debe ser independiente de t, x, y, z, pero puede, en principio, ser función de v: ³ v ´ Ey0 = f (v)γ Ey − Bz c Bx0 = f (v)Bx ³ v ´ Bz0 = f (v)γ Bz − Ey c

(4.14) (4.15) (4.16)

De la misma manera, la comparación de las ecuaciones (4.9) y (4.12) da: ³ v ´ Bz0 = g(v)γ Bz − Ey c Ex0 = g(v)Ex ³ v ´ Ey0 = g(v)γ Ey − Ez , c

(4.17) (4.18) (4.19)

donde g(v) es alg´ un factor de proporcionalidad. Finalmente, introduciendo otro factor h(v), la comparación de las ecuaciones (4.10) y (4.13) da: 95

³ v ´ Ez0 = h(v)γ Ez + By c ³ v ´ By0 = h(v)γ By + Ez c Bx0 = h(v)Bx

(4.20) (4.21) (4.22)

Las ecuaciones (4.16) y (4.17) dicen que g = f , y las ecuaciones (4.15) y (4.22) dicen que h = f . De este modo vemos que las seis componentes del campo electromagnético transforman as´ı : Ex0 = f (v)Ex ³ Ey0 = f (v)γ Ey − ³ Ez0 = f (v)γ Ez +

Bx0 = f (v)Bx ³ By0 = f (v)γ By + ³ Bz0 = f (v)γ Bz −

´

v Bz c v ´ By c

´

v Ez c v ´ Ey c

(4.23) (4.24) (4.25)

(4.26) (4.27) (4.28)

Nos queda por averiguar la función desconocida f (v). Anticip´ andonos al resultado final, afirmamos que f (v) es igual a 1. Para probar esto seguiremos tres pasos: primero probaremos que f (v) = f (−v), luego probaremos que f (v) = ±1, y finalmente escogeremos el signo superior +. Supongamos por un momento que Ey = 0; en este caso la ecuación (4.28) da: Bz0 = f (v)γBz

(4.29)

Ahora pensemos en un tercer observador O00 que se mueve, respecto a O, con velocidad v en dirección −x. En vista de la ecuación (4.29): Bz00 = f (−v)γBz 96

(4.30)

Claramente Bz0 y Bz00 deben ser iguales, entonces la comparación de las ecuaciones (4.29) y (4.30) da: f (−v) = f (v)

(4.31)

Pasemos ahora a escribir las rec´ıprocas de las ecuaciones (4.24) y (4.28). Para tal efecto intercambiamos variables primadas con no primadas y cambiamos v por −v: ³ Ey = f (−v)γ Ey0 + ³ Bz = f (−v)γ Bz0 +

v 0´ B c z v 0´ E , c y

y en vista de (4.31): ³ Ey = f (v)γ Ey0 + ³ Bz = f (v)γ Bz0 +

v 0´ B c z v 0´ E c y

Entonces, colocando estas expresiones de Ey y Bz en el lado derecho de (4.24) encontramos: h³ v ´ v³ 0 v í Ey0 + Bz0 − Bz + Ey0 c c c µ ¶ v2 = f 2 γ 2 1 − 2 Ey0 , c

Ey0 = f 2 γ 2

o sea que f 2 = 1: f = ±1

(4.32)

Las ecuaciones (4.23) y (4.32) dicen que Ex0 = ±Ex . El signo inferior, −, expresa una inversión del campo, que es incre´ıble. Entonces en la ecuación (4.32) debemos escoger el signo superior, f = 1, y las ecuaciones (4.23)(4.28) son, finalmente: 97

Ex0 = Ex ³ Ey0 = γ Ey − ³ 0 Ez = γ Ez + Bx0 = Bx ³ By0 = γ By + ³ Bz0 = γ Bz −

´

v Bz c v ´ By c ´

v Ez c v ´ Ey c

(4.33) (4.34) (4.35) (4.36) (4.37) (4.38)

Estas seis ecuaciones de transformación se pueden escribir de un modo más general, as´ı: v ×B c v = B + (γ − 1)B⊥ − γ × E c

E0 = E + (γ − 1)E⊥ + γ

(4.39)

B0

(4.40)

La ecuación (4.39) dice que el campo E0 se construye con dos aportes: de un v lado, el campo E, y del otro lado el campo inducido (γ − 1)E⊥ + γ × B. c As´ı mismo, la ecuación (4.40) dice que el campo B0 se construye con dos aportes: de un lado, el campo B, y del otro lado el campo inducido (γ − v 1)B⊥ − γ × E . Fijemos nuestra atención en los campos inducidos. c Lo primero que debemos notar es que el campo inducido depende crucialmente de la velocidad v, ya que es cero cuando v es cero, y es una función monótonamente creciente de v. Por esto debemos acostumbrarnos a pensar que el campo inducido es inducido por v: es el movimiento de O0 lo que hace aparecer un campo inducido en O0 . Pero no basta que O0 se esté moviendo respecto a O. Se requiere además que en O haya campos perpendiculares B⊥ o E⊥ , seg´ un se lee en las ecuaciones (4.39) y (4.40). Son los campos perpendiculares en O los que inducen campos en O0 . Los campos paralelos Ek y Bk no inducen campos en O0 . Las seis ecuaciones (4.33)-(4.38) expresan a los campos primados en términos de los no primados. Las ecuaciones rec´ıprocas se obtienen intercambiando variables primadas y no primadas, y cambiando v por −v: 98

Ex = Ex0 ³ Ey = γ Ey0 + ³ Ez = γ Ez0 −

v 0 B c z v 0´ B c y

Bx = Bx0 ³ By = γ By0 − ³ Bz = γ Bz0 +

v 0´ E c z v 0´ E c y

´

(4.41) (4.42) (4.43) (4.44) (4.45) (4.46)

Escribimos también las rec´ıprocas de las ecuaciones (4.39) y (4.40): v × B0 c v B = B0 + (γ − 1)B0⊥ + γ × E0 c E = E0 + (γ − 1)E0⊥ − γ

4.2

(4.47) (4.48)

Dos cantidades invariantes

En esta sección nos proponemos demostrar que las cantidades E·B y E 2 −B 2 son invariantes, es decir, que: E · B = E0 · B0

(4.49)

E 2 − B 2 = E 02 − B 02

(4.50)

Para probar la ecuación (4.49) comenzamos escribiendo el producto E0 ·B0 en la forma Ex0 Bx0 +Ey0 By0 +Ez0 Bz0 . Ahora procedemos a expresar esta cantidad en términos de variables no primadas, para lo cual utilizamos las seis ecuaciones (4.33)-(4.38): E0 · B0 = Ex0 Bx0 + Ey0 By0 + Ez0 Bz0 ³ v ´ v ´³ = Ex Bx + γ 2 Ey − Bz By + Ez c c 99

³ v ´³ v ´ +γ 2 Ez + By Bz − Ey c c = Ex Bx + Ey By + Ez Bz = E·B De la misma manera se prueba la ecuación (4.50): comenzamos escribiendo E 02 − B 02 en la forma Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 , y luego procedemos a expresar esta cantidad en términos de variables no primadas, para lo cual utilizamos las seis ecuaciones (4.33)-(4.38): E 02 − B 02 = Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 =

³ ³ v ´2 Ex2 + γ 2 Ey − Bz + γ 2 Ez + c ³ ³ v ´2 −Bx02 − γ 2 By + Ez − γ 2 Bz − c

v ´2 By c v ´2 Ey c

= E2 − B2 Usaremos las cantidades E = |E| y B = |B|; es claro que E y B son mayores o iguales a cero. La ecuación (4.50) tiene varias consecuencias interesantes: E < B ⇐⇒ E 0 < B 0

(4.51)

B < E ⇐⇒ B 0 < E 0

(4.52)

E = B ⇐⇒ E 0 = B 0

(4.53)

Estas tres implicaciones, en palabras, rezan: Si uno de los campos (bien sea el eléctrico o el magnético) es menor que el otro en un sistema de referencia, lo será también en todos los otros sistemas de referencia. Si los dos campos son de igual magnitud para un observador, serán de igual magnitud para todos los observadores.

100

La existencia de dos cantidades invariantes, E·B y E 2 −B 2 , no es accidental, sino que responde a la existencia de simetr´ıas de fondo, como veremos en la sección 6.6.

4.3

El campo electromagn´ etico total

Supongamos que para el observador O0 el campo electromagnético aparece puramente eléctrico, es decir, B0 = 0. ¿Cómo aparece el campo electromagnético para otro observador O que se mueve, respecto a O0 , con velocidad −v ? La respuesta se obtiene haciendo B0 = 0 en las fórmulas (4.47) y (4.48):

E = E0k + γE0⊥ B = γ

v × E0⊥ c

(4.54) (4.55)

La ecuación (4.55) muestra que para O existe, en general, campo magnético. Vemos as´ı que un campo electromagnético que es puramente eléctrico para un observador aparece, a otros observadores, en general, como una mezcla de campos eléctrico y magnético. Del mismo modo, cuando un campo electromagnético es puramente magnético para un observador, otros observadores registran un campo magnético y además un campo eléctrico. Esto nos recuerda los primeros párrafos del Cap´ıtulo 2, donde considerábamos dos eventos con separación puramente espacial o puramente temporal, para un observador. Apuntábamos en esa ocasión que para otros observadores los eventos aparecen, en general, con separaciones espacial y temporal. Y conclu´ıamos entonces que el espacio y el tiempo no son entidades independientes, sino que forman un todo. Del mismo modo nosotros, ahora hablando del campo electromagnético, afirmamos que los campos eléctrico y magnético no son independientes uno del otro, sino que forman un todo electromagnético que es irreductible. Cada observador inercial puede establecer un corte, un lindero, entre su campo eléctrico y su campo magnético, pero el lindero que establece O es diferente al que establece O0 . 101

4.4

Una carga con velocidad uniforme

Para mostrar una aplicación de la transformación (4.41)-(4.46), queremos resolver un problema clásico de electromagnetismo, que consiste en averiguar los campos eléctrico y magnético que produce una carga que tiene velocidad rectil´ınea uniforme u . Este problema se puede resolver [9] por medio de los potenciales de Liénard-Wiechert, en los que se tiene en cuenta que la se˜ nal electromagnética toma cierto tiempo para viajar desde la part´ıcula hasta el punto de observación, lo que hace necesario que se usen tiempos retardados. Este modo de atacar el problema es complicado. En esta sección lo resolveremos muy fácilmente, utilizando nuestros conocimientos de relatividad. La estrategia es resolver inicialmente el problema de acuerdo con un observador inercial O0 en reposo respecto a la part´ıcula; una vez obtenidos E0 , B0 , utilizamos las seis ecuaciones (4.41)-(4.46) para averiguar los campos E, B que registra otro observador que se mueve, respecto al anterior, con velocidad constante −u . Para O0 el fenómeno es muy simple. Como la carga está en reposo, no hay campo magnético B0 , y el campo eléctrico E0 es el de Coulomb: B0 = 0 E0 =

(4.56)

q 1r0 r02

Aqu´ı, 1r0 es un vector unitario que apunta en la dirección de r0 . Claramente r0 qr0 1r0 = 0 y el campo eléctrico es E0 = 03 . Las tres componentes cartesianas r r de este campo son: Ex0 =

qx0 ; r03

Ey0 =

qy 0 ; r03

Ez0 =

qz 0 r03

(4.57)

Tal como hemos indicado, O0 se mueve respecto a O con velocidad u . N´ otese que esta u está jugando el papel que siempre le hemos asignado a v , lo que quiere decir que el γ de la ecuación (1.32) ahora quiere decir 1

γ=p

1 − u2 /c2

102

(4.58)

En este momento suponemos que el eje x est´ a orientado paralelo a la velocidad u de la part´ıcula, y podemos colocar los campos primados (4.56) y (4.57) en las seis ecuaciones (4.41)-(4.46) para obtener: qx0 r03 γqy 0 Ey = 03 r γqz 0 Ez = 03 r

Ex =

Bx = 0 quγ z 0 c r03 quγ y 0 Bz = c r03

By = −

Estos son los campos para el observador O. Debemos, sin embargo, pulir estas expresiones para que contengan u ńicamente variables no primadas, utilizando las transformaciones de Lorentz (1.33). Al ejecutar esta tarea se debe recordar que r03 = (x02 + y 02 + z 02 )3/2 = [γ 2 (x − ut)2 + y 2 + z 2 ]3/2 : qγ(x − ut) − ut)2 + y 2 + z 2 ]3/2 qγy Ey = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2 qγz Ez = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2

Ex =

[γ 2 (x

(4.59)

Bx = 0 quγ z c By = − 2 [γ (x − ut)2 + y 2 + z 2 ]3/2 quγ y c By = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2

(4.60)

La Figura 4.1 muestra el campo E para u = 0; nótese que E es radial e isotrópico. La Figura 4.2 es para u 6= 0: el campo E es radial (respecto a la posición de la part´ıcula) pero no es isotrópico. El flujo de energ´ıa. La densidad de energ´ıa por unidad de volumen es ¢ 1 ¡ (campo eléctrico)2 + (campo magnético)2 de donde vemos que tanto 8π 103

para O0 como para O, hay energ´ıa electromagnética. Ahora, como para O0 la carga está en reposo, la energ´ıa electromagnética también está en reposo. Sin embargo, para O la part´ıcula se mueve y este observador deber´ıa registrar que la energ´ıa electromagnética fluye. La cantidad adecuada para describir el flujo de la energ´ıa electromagnética es el vector de Poynting: S=

c E×B 4π

(4.61)

S es la cantidad de energ´ıa electromagnética que, por unidad de tiempo, cruza la unidad de área perpendicular. Utilizando las seis ecuaciones (4.59) y (4.60) obtenemos:

S=

q 2 uγ 2 (y 2 + z 2 )1x − (x − ut)(y1y + z1z ) 4π [γ 2 (x − ut)2 + y 2 + z 2 ]3

Podemos especializar esta fórmula en z = 0:

S=

4.5

q 2 uγ 2 y 2 1x − (x − ut)y1y 4π [γ 2 (x − ut)2 + y 2 ]3

(4.62)

Un alambre recto con corriente

A continuación vamos a estudiar [6] lo que ocurre con un alambre recto que porta una corriente, desde el punto de vista de la relatividad. Llegaremos a un resultado interesante: si el alambre aparece neutro para un observador, entonces aparece cargado para otros observadores. Para comprender este efecto es importante que nos demos cuenta del modo como están repartidas las part´ıculas cargadas dentro de un metal. Los iones positivos forman una red aproximadamente inmóvil, y algunos electrones forman un fluido que viaja, que se cuela a través de la malla r´ıgida, cuando hay una diferencia de potencial. La Figura 4.3 muestra un modelo para entender la corriente en un alambre recto, de acuerdo con un observador O que se encuentra en reposo respecto a los iones positivos. Los electrones se mueven hacia la derecha con una velocidad u, o sea que la corriente eléctrica va hacia la izquierda. 104

Supongamos que para O el alambre es neutro. Esto quiere decir que las cargas positivas y negativas son equidistantes. Sin embargo, el fenómeno debe aparecer diferente a otro observador O0 que se mueve con velocidad u hacia la derecha, seg´ un muestra la Figura 4.4. En esta figura aparecen, en l´ıneas punteadas, las trayectorias de los iones y de los electrones. Nótese que para O0 la distancia entre electrones es mayor que la distancia entre iones positivos. Esto quiere decir que, para O0 , la densidad de carga positiva por unidad de longitud es mayor que la densidad negativa: el alambre que es neutro para O es cargado para O0 . Estudio formal. Veamos de qué manera las ecuaciones de la teor´ıa de la relatividad dan cuenta del fenómeno que acabamos de describir cualitativamente. Llamemos d0+ y d − a las densidades de carga positiva y negativa, seg´ un el observador O. Nótese el sub´ındice cero en la densidad positiva, acentuando que para O las cargas positivas están en reposo. Claramente, d0+ > 0 , d − < 0

(4.63)

Para el observador O0 los electrones están en reposo y forman una densidad de carga d0− , y los iones positivos tienen una velocidad u y forman una densidad de carga d + . Claramente, d0− < 0 , d + > 0

(4.64)

Para O la densidad neta es: d = d0+ + d −

(4.65)

mientras que la densidad neta para O0 es d0 = d + + d0− Ahora, de acuerdo con2 la ecuación (2.24): 2

Aqu´ı también γ est´ a dada por la ecuaci´ on (4.58).

105

(4.66)

d + = γd0+

(4.67)

d − = γd0− ,

(4.68)

entonces las ecuaciones (4.65) y (4.66) son: d = d0+ + γd0−

(4.69)

d0 = γd0+ + d0−

(4.70)

d0 = d + (γ − 1)(d0+ − d0− )

(4.71)

Nótese que

Recordemos, de acuerdo con las fórmulas (4.63) y (4.64), que d0+ y −d0− son cantidades positivas, entonces la ecuación (4.71) dice que d0 > d: la densidad de carga por unidad de longitud es mayor para O0 que para O. Si d = 0, entonces la ecuación (4.69) da d0− = −d0+ /γ, y las ecuaciones (4.68) y (4.71) se convierten en: d − = −d0+

(4.72)

d0 = (γ − γ −1 )d0+

(4.73)

Los campos. Pasemos ahora a calcular los campos eléctrico y magnético. Pensemos en el problema general de un alambre recto que tiene cierta carga por unidad de longitud; es bien sabido que el campo eléctrico a una distancia R del alambre está dado por: campo eléctrico =

2 × carga por unidad de longitud R

(4.74)

y si el alambre porta una corriente se usa la ley de Biot-Savart: campo magnético =

2 × corriente cR

Apliquemos las fórmulas (4.74) y (4.75) al observador O: 106

(4.75)

E = 0

(4.76)

B = −

2ud − cR

,

donde hemos puesto el signo − para que la magnitud B resulte positiva. En vista de la ecuación (4.72): B=

2ud0+ cR

(4.77)

También podemos usar las fórmulas (4.74) y (4.75) para el observador O0 : E0 = B0 =

2d0 R 2ud + , cR

y en vista de las ecuaciones (4.73) y (4.67):

E0 = B0 =

2(γ − γ −1 )d0+ R + 2γud0 cR

(4.78) (4.79)

Finalmente, conviene anotar que las ecuaciones (4.76), (4.77), (4.78) y (4.79) satisfacen las reglas de transformación (4.34) y (4.38). Esta es una peque˜ na prueba de consistencia de nuestra teor´ıa relativista del electromagnetismo. Circuitos. Hemos estudiado un alambre recto que, para O, es neutro y porta una corriente eléctrica hacia la izquierda; para O0 el alambre aparece cargado positivamente. As´ı mismo, si para O la corriente es hacia la izquierda, entonces para O0 el alambre aparece cargado negativamente. Pensemos ahora en un circuito rectangular que porta una corriente eléctrica, como en la Figura 4.5. Para O0 , el lado CD est´ a cargado positivamente y el lado AB negativamente, dando como resultado [?] un momento dipolar eléctrico que apunta hacia arriba. El observador O0 puede leg´ıtimamente concluir que los circuitos eléctricos que se mueven tienen momento dipolar eléctrico. 107

4.6

Anulando el campo menor

Hemos visto que los valores de los campos eléctrico y magnético dependen del estado de movimiento del observador. Nos preguntamos ahora si para alg´ un observador se vuelve cero alguno de los dos campos. Si para alg´ un observador el campo eléctrico (magnético) es cero, decimos que el campo eléctrico (magnético) es anulable. Rápidamente nos damos cuenta de qué condiciones se deben cumplir para que un campo sea anulable. Supongamos por ejemplo que el campo magnético es anulable y llamemos O0 al observador que registra que el campo magnético es cero: B0 = 0. Esta ecuación implica que E0 · B0 = 0 y que B 0 < E 0 . Pero, de acuerdo con (4.49) y (4.52), estas dos propiedades son invariantes, de donde podemos concluir que, para cualquier observador, el producto escalar de los dos campos es cero y el campo magnético es menor que el eléctrico. Un resultado similar se obtiene cuando el campo eléctrico es anulable. También abordaremos el asunto importante de identificar al observador O0 para el cual uno de los dos campos es nulo. Para identificar a O0 basta decir cuál es la velocidad v que O0 tiene respecto a O . Anulaci´ on del campo magn´ etico. Suponiendo que para O0 el campo magnético se anula, podemos escribir B0 = 0 y la ecuación (4.40) queda as´ı: B + (γ − 1)B⊥ − γ

v ×E = 0 c

(4.80)

En ambos lados de esta ecuación multiplicamos escalarmente con v : v · B + (γ − 1)v · B⊥ − γv ·

v ×E = 0 c

Esta ecuación es v · B + 0 − 0 = 0, o sea que v es perpendicular a B. Entonces B⊥ = B, y la ecuación (4.80) se simplifica: B =

v ×E c

(4.81)

B =

vE sen α c

(4.82)

108

v sen α = c

B E

(4.83)

Aqu´ı α es el ángulo entre E y v . La Figura 4.6 muestra los campos E y B perpendiculares, y además al vector v que es perpendicular a B. Claramente existe un n´ umero infinito de vectores v que satisfacen la ecuación (4.83). Esto quiere decir que cuando B < E y E es ortogonal a B, hay un n´ umero infinito de observadores inerciales para los cuales el campo magnético se anula. on del campo eléctrico es Anulaci´ on del campo el´ ectrico. La anulaci´ muy parecida a la del campo magnético. Suponiendo que para O0 el campo eléctrico se anula, podemos escribir E0 = 0 y la ecuación (4.39) queda as´ı: E + (γ − 1)E⊥ + γ

v ×E = 0 c

(4.84)

En ambos lados de esta ecuación multiplicamos escalarmente con v : v · E + (γ − 1)v · E⊥ + γv ·

v ×B = 0 c

Esta ecuación es v · E + 0 − 0 = 0, o sea que v es perpendicular a E. Entonces E⊥ = E, y la ecuación (4.80) se simplifica: v ×B c

(4.85)

vB sen β c

(4.86)

E B

(4.87)

E = − E = v sen β = c

Aqu´ı β es el ángulo entre B y v . La Figura 4.7 muestra los campos E y B perpendiculares, y además al vector v que es perpendicular a E. Claramente existe un n´ umero infinito de vectores v que satisfacen la ecuación (4.87). Esto quiere decir que cuando E < B y E es ortogonal a B, hay un n´ umero infinito de observadores inerciales para los cuales el campo eléctrico se anula. 109

Conclusi´ on. La anulaci´ on de un campo puede darse cuando se cumplen estas dos condiciones: que sean perpendiculares entre s´ı y que no tengan la misma magnitud; de los dos campos, el menor es anulable y el otro no. Si E es anulable, v tiene que ser perpendicular a E ; as´ı mismo, si B es anulable, v tiene que ser perpendicular a B . En resumen, v debe ser perpendicular al campo menor. La luz no es anulable. Una de las peculiaridades de la luz es que, en todo punto r y en cualquier instante t, los campos eléctrico y magnético tienen la misma magnitud. Como B ≮ E, el campo magnético no es anulable, y como E ≮ B, el campo eléctrico tampoco es anulable.

4.7

La corriente el´ ectrica

Estudiábamos en la página 43 una nube de part´ıculas cargadas, y llamábamos u a la trivelocidad promedio de una peque˜ na porción de la nube. El trivector J se define as´ı: J = ρu ,

(4.88)

y en vista de (2.25): J =

V0

nqu

p

1 − u2 /c2

(4.89)

La magnitud de J es la cantidad de carga que, por unidad de tiempo, cruza una unidad de área perpendicular a u. Llamemos r al vector posición del peque˜ no volumen de nube que estamos estudiando. Claramente u = dr/dt, y en consecuencia la ecuación (4.89) queda as´ı: J =

nq p dr V0 dt 1 − u2 /c2

(4.90)

De otro lado, multiplicando ambos lados de la ecuación (2.25) por c llegamos a nq q ρc = cdt (4.91) V0 dt 1 − u2 /c2 En los denominadores de las dos u ´ltimas ecuaciones reconocemos el tiempo propio dτ : 110

ρc =

nq cdt , V0 dτ

nq dr V0 dτ

J =

nq es un escalar. Esto es V0 dτ importante porque indica que las cuatro cantidades (cρ, J) transforman, bajo un cambio de coordenadas, as´ı como transforman los cuatro diferenciales (cdt, dr). Más concretamente, podemos utilizar las ecuaciones (1.34) para escribir Notemos que en estas expresiones el quebrado

4.8

ρ =

v ρ0 + 2 Jx0 c p 1 − v 2 /c2

(4.92)

Jx =

J 0 + vρ0 px 1 − v 2 /c2

(4.93)

Jy = Jy0

(4.94)

Jz = Jz0

(4.95)

Covariancia de la electrodin´ amica

Tenemos confianza en que las ecuaciones de Maxwell y la ley de Fuerza de Lorentz representan leyes de la naturaleza. Entonces, de acuerdo con el principio de la relatividad (1.10), las ecuaciones de Maxwell y la ley de fuerza de Lorentz deben ser covariantes cuando se pasa de un observador inercial a otro. En esta sección probaremos tal covariancia. Comenzaremos con las ecuaciones de Maxwell, que son: ∇×E+

1 ∂B c ∂t

= 0

∇×B−

1 ∂E c ∂t

=

4π J c

(4.96) (4.97)

∇·B = 0

(4.98)

∇ · E = 4πρ,

(4.99)

y luego seguiremos con la fuerza de Lorentz: ³ ´ u F=q E+ ×B c 111

(4.100)

Covariancia de las ecuaciones de Maxwell. Para el observador O0 las ecuaciones de Maxwell son: ∇0 × E0 +

1 ∂B0 c ∂t0

= 0

∇0 × B0 −

1 ∂E0 c ∂t0

=

4π 0 J c

(4.101) (4.102)

∇0 · B0 = 0

(4.103)

∇0 · E0 = 4πρ0

(4.104)

Para probar la covariancia debemos demostrar que las ecuaciones (4.96)(4.99) implican las ecuaciones (4.101)-(4.104). Comencemos separando, en (4.96) y (4.97), las partes que son paralelas y perpendiculares a v : ¶ µ 1 ∂B = 0 ∇×E+ c ∂t ⊥ µ ¶ 1 ∂E 4π ∇×B− − J = 0 c ∂t c ⊥ µ ¶ 1 ∂B ∇×E+ = 0 c ∂t k ∇·B = 0 µ ¶ 1 ∂E 4π ∇×B− − J = 0 c ∂t c k ∇ · E = 4πρ

(4.105) (4.106) (4.107) (4.108) (4.109) (4.110)

Para realizar los cálculos concretamente, usamos coordenadas cartesianas y llamamos x a la dirección de v . Las ocho ecuaciones (4.105)-(4.110) son: 1 ∂z Ex − ∂x Ez + ∂t By = 0 c 1 ∂x Ey − ∂y Ex + ∂t Bz = 0 c 4π 1 Jy ∂z Bx − ∂x Bz − ∂t Ey = c c 112

(4.111) (4.112) (4.113)

1 ∂x By − ∂y Bx − ∂t Ez = c

4π Jz c

(4.114)

1 ∂y Ez − ∂z Ey + ∂t Bx = 0 c

(4.115)

∂x Bx + ∂y By + ∂z Bz = 0

(4.116)

1 ∂y Bz − ∂z By − ∂t Ex = c

4π Jx c

∂x Ex + ∂y Ey + ∂z Ez = 4πρ

(4.117) (4.118)

Las ocho ecuaciones primadas correspondientes son: 1 ∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 c 1 ∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 c 1 ∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 c 1 ∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 c

= 0

(4.119)

= 0

(4.120)

= =

4π 0 J c y 4π 0 J c z

(4.121) (4.122)

1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = 0 c

(4.123)

∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 = 0

(4.124)

1 ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 = c

4π 0 J c x

∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 = 4πρ0

(4.125) (4.126)

En las ocho ecuaciones (4.111)-(4.118) vamos a cambiar todas las variables no primadas por variables primadas, utilizando: las cuatro ecuaciones (1.44), las seis ecuaciones (4.41)-(4.46), y las cuatro ecuaciones (4.92)-(4.95). Se obtienen estas ocho ecuaciones que proceden, una a una, de las ocho ecuaciones (4.111)-(4.118): 1 ∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 c 113

(4.127)

1 ∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 c 1 4π 0 ∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J c c y 1 4π 0 ∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J c c z 1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = c 1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = c

v c c v

(4.128) (4.129) (4.130)

¡ ¢ ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0

(4.131)

¡ ¢ ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0

(4.132)

¢ v¡ 1 ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 c c 4π 0 v = Jx + 4πρ0 c c ¡ ¢ 1 c ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 c v c 4π 0 J + 4πρ0 = c x v

(4.133)

(4.134)

Obsérvese que las ecuaciones (4.119) y (4.127) son iguales, que (4.120) y (4.128) son iguales, que (4.121) y (4.129) son iguales y que (4.122) y (4.130) son iguales. Obsérvese que (4.123) y (4.131) no son iguales y que (4.124) y (4.132) no son iguales. Pero el conjunto de las dos ecuaciones (4.131), (4.132) implica el conjunto de las dos ecuaciones (4.123), (4.124). As´ı mismo (4.125) y (4.133) no son iguales; (4.126) y (4.134) no son iguales. Pero el conjunto de las dos ecuaciones (4.133), (4.134) implica el conjunto de las dos ecuaciones (4.125), (4.126). En conclusión, las ecuaciones de Maxwell no primadas implican el conjunto de las ecuaciones primadas. O sea que las ecuaciones de Maxwell son covariantes bajo el grupo de las transformaciones de la relatividad especial, satisfaciéndose as´ı el principio de la relatividad. Covariancia de la fuerza de Lorentz. Ahora pasamos a demostrar la covariancia de la fuerza de Lorentz, ecuación (4.100). Para el observador O0 se debe cumplir que: µ ¶ u0 0 0 0 F =q E + ×B (4.135) c 114

Podemos desplegar las tres partes de esta ecuación: µ ¶ 1 0 0 1 0 0 0 = q Ex + uy Bz − uz By c c µ ¶ 1 1 Fy0 = q Ey0 + u0z Bx0 − u0x Bz0 c c µ ¶ 1 0 0 1 0 0 0 0 Fz = q Ez + ux By − uy Bx c c

Fx0

(4.136) (4.137) (4.138)

As´ı mismo las tres partes de la ecuación (4.100) son: µ ¶ 1 1 Fx = q Ex + uy Bz − uz By c c µ ¶ 1 1 Fy = q Ey + uz Bx − ux Bz c c µ ¶ 1 1 Fz = q Ez + ux By − uy Bx c c

(4.139) (4.140) (4.141)

Debemos probar que las tres ecuaciones (4.136)-(4.138) implican las ecuaciones (4.139)-(4.141), y para tal efecto debemos expresar las tres primeras ecuaciones en términos de variables no primadas. Utilicemos entonces las tres ecuaciones (2.35)-(2.37), las tres3 ecuaciones (3.42)-(3.44) y las seis ecuaciones (4.33)-(4.38). Entonces la ecuación (4.136) se convierte en (4.139), la ecuación (4.137) deviene (4.140) y la ecuación (4.138) se vuelve (4.141). Queda as´ı demostrada la covariancia de la fuerza de Lorentz.

3

Al utilizar la ecuaci´ on (3.42) se debe tener en cuenta que ³ ´ u u · F = u · q E + × B = qu · E c

115

ut

Figura 4.1 El campo eléctrico para un observador que está en reposo respecto a una carga positiva. Las l´ıneas del campo son radiales e isótropas.

Figura 4.2 El campo eléctrico de una carga que tiene velocidad constante. Las l´ıneas del campo son radiales, mas no isótropas.

ct'

x'

x

Figura 4.3 Un alambre recto que porta corriente eléctrica, seg´ un un observador en reposo respecto a los iones positivos. Los electrones se mueven hacia la derecha.

Figura 4.4 L´ıneas en el mundo de los iones positivos (trazos punteados verticales) y de los electrones (trazos punteados inclinados). Para O, la distancia entre electrones contiguos es igual a la distancia entre iones positivos contiguos. Para O0 , la distancia entre electrones es mayor que la distancia entre iones.

116

+ + + +

C

D

i

B

A

Figura 4.5 Un circuito eléctrico. Para un observador que viaje hacia la derecha, el lado CD está cargado positivamente y el lado AB negativamente, dando como resultado un momento dipolar eléctrico que apunta hacia arriba.

E

E a

v v

b B

B

Figura 4.6 Campos E y B perpendiculares, con B < E . Otro observador O0 tiene velocidad v con inclinación α . Las variables v y α se pueden ajustar de modo que B 0 sea cero.

Figura 4.7 Campos E y B perpendiculares, con E < B . Otro observador O0 tiene velocidad v con inclinación β . Las variables v y β se pueden ajustar de modo que E 0 sea cero.

117

118

Cap´ıtulo 5

Tensores en la relatividad especial El propósito de este cap´ıtulo es darle a la relatividad especial una presentación formal, tensorial. Hemos visto que el espacio y el tiempo se unen para formar un ente mayor, el espaciotiempo; y los campos eléctrico y magnético no son objetos separados, sino que forman una totalidad electromagnética. En este cap´ıtulo expresaremos estas uniones, y otras también, en una notación condensada que se adec´ ua a las necesidades y exigencias de la f´ısica teórica. Debemos advertir, sin embargo, que en este tratamiento hay algo más que notación compacta y elegante: hay, sobre todo, una visión profunda y geométrica de la relatividad especial.

5.1

Sub´ındices y super´ındices

Tal como hemos descrito varias veces, el observador O consta de una malla tridimensional de relojes, uno en cada punto. Suponemos además que este observador erige un sistema cartesiano de coordenadas, de modo que cada evento tiene cuatro coordenadas xµ , as´ı: (x0 , x1 , x2 , x3 ) = (ct, x, y, z) Los ´ındices griegos, como por ejemplo µ, van de cero a tres: µ = 0, 1, 2, 3 . En algunas escasas ocasiones desearemos ir u ńicamente de uno a tres, y entonces usaremos ´ındices latinos, como por ejemplo a = 1, 2, 3 . Siempre seguiremos la convención de Einstein: cuando en un mismo término aparece dos veces un ´ındice, se supone que hay una suma sobre los cuatro (o tres) valores que puede tomar ese ´ındice. Pensemos ahora en el intervalo que hay entre el origen de coordenadas 119

(0,0,0,0) y el evento (x0 , x1 , x2 , x3 ) . De acuerdo con la definición (2.1) este intervalo viene dado por: (∆s)2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2

(5.1)

Si definimos la matriz 

ηµν

1

   0  =   0   0

0 −1

0 0

0

−1

0

0

0



  0     0   

(5.2)

−1

la ecuación (5.1) se escribe: (∆s)2 = ηµν xµ xν

(5.3)

Ahora definimos η µν como la inversa de ηµν : η µλ ηλν = δ µ ν

(5.4)

Claramente esta inversa es 

η µν

1

   0  =   0   0

0

0

−1

0

0

−1

0

0

0



  0     0   

(5.5)

−1

A partir de las cuatro cantidades xµ y la matriz ηµν definimos otras cuatro cantidades xµ de la manera siguiente: 120

xµ = ηµλ xλ

(5.6)

Escribamos en detalle las cuatro componentes xµ y las cuatro componentes xµ : xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z)

(5.7)

xµ = (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z)

(5.8)

xµ = η µλ xλ

(5.9)

Nótese que

Las ecuaciones (5.6) y (5.9) dicen que ηµλ sirve para bajar un super´ındice y η µλ sirve para subir un sub´ındice. Ahora, a η µλ también se le puede bajar el super´ındice λ , para lo cual basta multiplicarlo por ηλν :

η µλ ηλν = η µ ν Comparando esto con la ecuación (5.4) llegamos a ηµν = δµν

(5.10)

Consideremos ahora este conjunto de 16 cantidades: (−Bx , 0, Ez , −Bz , 0, Ex , −By , 0, −Ey , Bx , −Ex , By , −Ez , 0, Bz , Ey ) , el cual organizamos en este arreglo cuadrado: 

F

µν

0

   Ex  =   Ey   Ez

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

121

−Ez



  By     −Bx    0

(5.11)

Si queremos bajar el super´ındice µ multiplicamos por ηλµ , as´ı: Fλ ν = ηλµ F µν : 

Fλ ν

1

   0  =    0   0

0

0

0

−1

0

0

−1

0

0 



0

−Ex −Ey

   0    Ex    0    Ey  Ez

−1

0

−Ex −Ey

   −Ex 0   =   −Ey −Bz   −Ez

Bz 0

By

0

−Bz

Bz

0

−By

Bx

−Ez

−Ez



  By     −Bx    0



  −By     Bx   

−Bx

0

Si además queremos bajar el super´ındice ν multiplicamos Fλ ν por ηρν , as´ı: Fλρ = ηρν Fλ ν = ηνρ Fλ ν = Fλ ν ηνρ . Ejecutemos pues el producto Fλ ν ηνρ : 

Fλρ

0

−Ex −Ey

   −Ex 0  =    −Ey −Bz   −Ez

0 −Bx 0

   −Ex  =    −Ey   −Ez



1

0

   −By   0    Bx   0 

Bz

By 

−Ez

0

0

Ex

Ey

0

−Bz

Bz

0

−By

Bx

122

Ez

−1

0

0

−1

0

0



  By     −Bx    0

0

0



  0     0    −1

El asunto de subir y bajar ´ındices no tiene complicación. Por ejemplo: Aα β γ

= ηνβ Aανγ

Aαβγ

= η νβ Aα ν γ

∂ µ = η µν ∂ν ∂ν

= ηµν ∂ µ

dxµ = ηµν dxν Cuando un ´ındice aparece una sola vez en un término, decimos que es libre. Por ejemplo, en B µ Cν los ´ındices µ y ν son libres. Si una misma letra aparece dos veces en un término, como super´ındice y como sub´ındice, decimos que se trata de ´ındices contra´ıdos. Por ejemplo, en B µ Cµ los ´ındices µ est´ an contra´ıdos. Reunamos las formas diferentes que conocemos de escribir la ecuación del intervalo (5.1): (∆s)2 = (∆x0 )2 − (∆x1 )2 − (∆x2 )2 − (∆x3 )2 = η µν ∆xµ ∆xν = ηµν ∆xµ ∆xν =

5.2

∆xµ ∆xµ

Los vectores

El observador O0 consta de otra malla infinita de relojes primados y erige otro sistema de ejes cartesianos. Diremos que un evento que tiene coordenadas xµ para el observador O , tiene coordenadas x0µ para el observador O0 : (x00 , x01 , x02 , x03 ) = (ct0 , x0 , y 0 , z 0 ) Pensamos que O0 tiene velocidad constante v respecto a O y que, en cierto 123

instante, los or´ıgenes de O y O0 coinciden. En el instante de la coincidencia se cuadran en t = 0 y t0 = 0 , respectivamente, los dos relojes que están en los or´ıgenes de O y O0 . Los ejes cartesianos de O y O0 se orientan de modo que los ejes x y x0 son siempre paralelos, los y y y 0 son siempre paralelos y también los ejes z y z 0 . Cada una de las coordenadas primadas x0µ debe ser función de las no primadas xν : x0µ = x0µ (xν )

(5.12)

p Llamemos β = v/c y γ = 1/ 1 − β 2 y supongamos que el desplazamiento es a lo largo del eje com´ un x x0 ; de acuerdo con las ecuaciones (1.33), las coordenadas primadas y no primadas están conectadas por las transformaciones de Lorentz: x00 = γ(x0 − βx1 ) x01 = γ(x1 − βx0 ) x02 = x2

(5.13)

x03 = x3 Calculemos las diez y seis derivadas ∂x0µ /∂xν ; diez de estas derivadas son cero, y las seis no nulas son: ∂x00 /∂x0 = ∂x01 /∂x1 = γ , ∂x00 /∂x1 = ∂x01 /∂x0 = −γβ , ∂x02 /∂x2 = ∂x03 /∂x3 = 1 . Es muy importante que reconozcamos que todas las diez y seis derivadas son constantes, propiedad1 que usaremos crucialmente más tarde, en el paso de (5.42) a (5.43). Por el momento tomemos diferenciales en ambos lados de (5.12) para obtener dx0µ =

∂x0µ ν dx ∂xν

Ahora integrar, teniendo en cuenta que 1

(5.14)

∂x0µ es constante: ∂xν

Debemos dejar claro que las diez y seis derivadas son constantes no s´ olo en la transformaci´ on particular (5.13), sino en cualquier transformaci´ on de Lorentz. En efecto, un vistazo a las ecuaciones (1.35) nos muestra que las derivadas son constantes, en general, para cualquier transformaci´ on de Lorentz.

124

x0µ =

∂x0µ ν x . ∂xν

xµ =

∂xµ 0ν x ∂x0ν

As´ı mismo:

(5.15) (5.16)

Pensemos enseguida en un conjunto de cuatro cantidades que en las coordenadas no primadas aparecen como Aµ , mientras que en las coordenadas primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que A0µ =

∂x0µ ν A , ∂xν

(5.17)

entonces decimos que A es un vector. Comparando (5.17) con (5.15) nos damos cuenta de que A transforma como x, porque en ambas ecuaciones ∂x0µ se usan los mismos coeficientes . Las cuatro cantidades xµ constituyen, ∂xν por definición, el vector prototipo. Decimos que A es un vector porque transforma como el vector prototipo (obsérvese que uno no prueba que x es un vector). El concepto de vector aparece inseparablemente ligado al concepto de las transformaciones de coordenadas. Que A sea un vector no es una propiedad intr´ınseca de A; no podemos decir que A es un vector por s´ı sólo, sino que el carácter vectorial de A es una propiedad que tiene A en referencia a la transformación de coordenadas xµ → x0µ . No cualquier conjunto de cuatro cantidades, aunque se rotulen con ´ındices, es un vector. Si la velocidad del observador O0 respecto a O es v , la transformación del vector debe ser como en las fórmulas (1.35): µ ¶ 1 0 A =γ A − v ·A c µ ¶ γ−1 γ 0 0 A =A+ v ·A− A v v2 c 00

(5.18)

Las cuatro cantidades xµ se llaman las componentes contravariantes del vector x , y xµ se llaman las componentes covariantes. El concepto de vector es más abstracto que el concepto de componentes, y decimos que el vector x se puede representar de dos maneras; bien sea por medio de sus componentes 125

contravariantes xµ , o por medio de sus componentes covariantes xµ . Del mismo modo, el vector A se caracteriza por medio de sus componentes contravariantes Aµ , o por medio de sus componentes covariantes Aµ . As´ı como en las fórmulas (5.7) y (5.8), escribimos ahora Aµ = (A0 , A1 , A2 , A3 ) =

(A0 , Ax , Ay , Az )

= (A0 , A)

(5.19)

Aµ = (A0 , A1 , A2 , A3 ) = (A0 , −Ax , −Ay , −Az ) = (A0 , −A) (5.20) Transformaci´ on de las componentes Aµ . Ya que sabemos que las componentes contravariantes Aµ transforman seg´ un (5.17), pasemos a averiguar de qué manera transforman las componentes covariantes Aµ . Pero para llevar a efecto esa tarea es preciso deducir antes una identidad importante. Lo primero es reescribir la ecuación (2.2) en nuestra notación compacta: µ

ηµν xµ xν = ηµν x0 x0

ν

(5.21)

Esta ecuación dice que, para calcular intervalos, todos los observadores inerciales usan la misma matriz ηµν . La ecuación (5.21) es, obviamente: ηµν xµ xν

λ

ρ

= ηλρ x0 x0 . = ηλρ

Utilizar (5.15):

∂x0λ ∂x0ρ µ ν x x ; ∂xµ ∂xν

reunir todo en el lado izquierdo: µ ¶ ∂x0λ ∂x0ρ ηµν − ηλρ xµ xν = 0 ∂xµ ∂xν Como esta ecuación debe ser válida para todos los eventos, la cantidad dentro del paréntesis debe ser cero:

ηλρ

∂x0λ ∂x0ρ = ηµν ∂xµ ∂xν 126

(5.22)

Ahora multiplicar ambos lados de esta ecuación por η νπ y utilizar la ecuación (5.10): ∂x0ρ ∂x0λ νπ η η = δµ π λρ ∂xµ ∂xν

(5.23)

Como las coordenadas xη son independientes, podemos afirmar que ∂xπ = δµ π ∂xµ

(5.24)

Ahora, de acuerdo con la regla de la derivaci´ on en cadena, ∂xπ ∂x0λ ∂xπ = , ∂xµ ∂xµ ∂x0λ o sea que la ecuación (5.24) es: ∂x0λ ∂xπ = δµ π ∂xµ ∂x0λ

(5.25)

Igualemos entonces los lados izquierdos de las ecuaciones (5.23) y (5.25): ∂x0λ νπ ∂x0ρ ∂x0λ ∂xπ η η = , λρ ∂xµ ∂xν ∂xµ ∂x0λ y multipliquemos ambos lados de esta ecuación por

∂xµ : ∂x0ω

∂xµ ∂x0λ νπ ∂x0ρ ∂xµ ∂x0λ ∂xπ η ηλρ = 0ω µ ν ∂x ∂x ∂x ∂x0ω ∂xµ ∂x0λ En ambos lados de esta ecuación aparece el factor la derivación en cadena dice que ecuación (5.26) es

(5.26)

∂xµ ∂x0λ ; la regla de ∂x0ω ∂xµ

∂xµ ∂x0λ ∂x0λ = = δω λ , o sea que la ∂x0ω ∂xµ ∂x0ω 127

δω λ η νπ ηλρ

∂x0ρ ∂xν

= δω λ

η νπ ηωρ

∂x0ρ ∂xν

=

∂xπ ∂x0λ

∂xπ ∂x0ω

(5.27)

Esta es la ecuación importante que quer´ıamos deducir. Ahora multiplicar ambos lados por Aπ : ηωρ

∂x0ρ ν ∂xπ A = Aπ ∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuación (5.17) para obtener: ηωρ A0ρ =

∂xπ Aπ ∂x0ω

Ya hab´ıamos indicado, justo después de la ecuación (5.21), que todos los observadores inerciales usan la misma matriz η , lo que quiere decir que O0 utiliza a η para subir y bajar ´ındices. De aqu´ı vemos que ηωρ A0ρ debe ser A0ω , y la u ´ltima ecuación es, finalmente: A0ω =

∂xπ Aπ ∂x0ω

(5.28)

Este es el modo como transforman las componentes covariantes de cualquier vector A . Por supuesto que las componentes xµ transforman de la misma manera: x0ω =

5.3

∂xπ xπ ∂x0ω

(5.29)

Otros tensores

Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De acuerdo con la regla de transformación (5.17), las componentes contravariantes de A y B transforman as´ı: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β . Multipliquemos lado a lado estas dos ecuaciones para obtener: 128

∂x0µ ∂x0ν α β A B ∂xα ∂xβ

A0µ B 0ν =

Los tensores de rango 2 se definen por comparación con la u ´ltima ecuación: T es un tensor de rango 2 si ∂x0µ ∂x0ν αβ T ∂xα ∂xβ

T 0µν =

(5.30)

Las componentes contravariantes de T transforman como Aµ B ν ; de la misma manera, las componentes covariantes de T transforman como Aµ Bν : 0 Tµν =

∂xα ∂xβ Tαβ , ∂x0µ ∂x0ν

(5.31)

y las componentes mixtas transforman como Aµ Bν : T 0µ ν =

∂x0µ ∂xβ α T β, ∂xα ∂x0ν

(5.32)

T0 µ ν =

∂xα ∂x0ν Tα β ∂x0µ ∂xβ

(5.33)

y como Aµ B ν :

Generalizamos diciendo que los tensores de rango j tienen j ´ındices, es decir, 4j cantidades. Los tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se llaman vectores. Algunas de las componentes de un tensor C de rango 3 transforman as´ı: C 0 µνδ =

∂x0µ ∂x0ν ∂x0δ αβγ C ∂xα ∂xβ ∂xγ

C 0 µνδ =

∂xα ∂xβ ∂xγ Cαβγ ∂x0µ ∂x0ν ∂x0δ

C0 µ ν δ =

∂xα ∂x0ν ∂xγ Cα β γ ∂x0µ ∂xβ ∂x0δ 129

Finalmente, un tensor de rango 4: A0µνσ ρ =

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ A γ ∂xα ∂xβ ∂xλ ∂x0ρ

(5.34)

En este momento es conveniente que hagamos una pausa y reconsideremos la ∂x0ν notación que estamos usando. El uso de las derivadas recarga, sin duda, ∂xβ la escritura, y podemos preguntarnos si vale la pena toda esta complicación. La pregunta está justificada, ya que todas estas derivadas son constantes en este cap´ıtulo y uno podr´ıa reducir la notación. No queremos reducirla, porque nuestro deseo es que el presente cap´ıtulo sirva de preámbulo al cap´ıtulo 9: all´ı las derivadas no serán constantes. Las transformaciones inversas. Hasta el momento hemos presentado la manera de averiguar las componentes primadas de un tensor en términos de las no primadas. El camino inverso -las no primadas en términos de las primadas- es muy fácil. Multipliquemos ambos lados de la ecuación (5.17) ∂xα por , con lo que se llega a: ∂x0µ ∂xα 0µ ∂xα ∂x0µ ν A = A = δ α ν Aν = Aα ∂x0µ ∂x0µ ∂xν Hemos obtenido: Aµ =

∂xµ 0ν A . ∂x0ν

Aµ =

∂x0ν 0 A ∂xµ ν

As´ı mismo:

Esto para tensores de rango 1. Para los de rango 2: T µν

=

∂xµ ∂xν 0αβ T ∂x0α ∂x0β

Tµν

=

∂x0α ∂x0β 0 T ∂xµ ∂xν αβ 130

Tµ ν

=

∂xµ ∂x0β 0α T β ∂x0α ∂xν

ν

=

∂x0α ∂xν 0 β T ∂xµ ∂x0β α

T

µ

Y los de rango 3:

C µνδ =

∂xµ ∂xν ∂xδ 0αβγ C ∂x0α ∂x0β ∂x0γ

C µνδ =

∂x0α ∂x0β ∂x0γ 0 C ∂xµ ∂xν ∂xδ αβγ

Cµνδ =

∂x0α ∂xν ∂x0γ 0 β C γ ∂xµ ∂x0β ∂xδ α

La importancia del vector xµ . Gran parte de la estructura de los tensores se fundamenta en el vector prototipo xµ . En efecto: 1) En la ecuación (5.17) hemos definido los vectores, en general, por comparación con xµ y, 2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a partir de vectores. En general, un tensor de rango j > 0 transforma como transforma el producto de j vectores. Contracci´ on de ´ındices. Estudiemos la estructura Aµ Bµ , cuando A y B son vectores. Usando las reglas de transformación (5.17) y (5.28) escribimos

A0µ B 0 µ =

∂x0µ ∂xβ α A Bβ ∂xα ∂x0µ

∂x0µ ∂xβ ∂xβ Ahora, la regla de la derivación en cadena dice que = , en∂xα ∂x0µ ∂xα tonces: A0µ B 0 µ =

∂xβ α A Bβ = δα β Aα Bβ = Aα Bα ∂xα

O sea que A0µ B 0 µ = Aµ Bµ 131

(5.35)

En palabras, el producto Aµ Bµ es, en general, invariante y el intervalo xµ xµ es un caso particular. Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un tensor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (5.34) obtenemos ∂x0ρ ∂xγ ∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ A . Pero = δλ γ , entonces A0µνρ ρ = γ ∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ A0µνρ ρ =

∂x0µ ∂x0ν αβλ A λ, ∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con la ecuación (5.30). En general, la contracci´ on de dos ´ındices en un tensor de rango j produce un tensor de rango j − 2. δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen∂x0ν zamos escribiendo δµ0 ν = y luego usamos la regla de la derivaci´ on en ∂x0µ cadena: ν

δµ0 =

∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α = = δβ , ∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de acuerdo con ecuación (5.33). El tensor m´ etrico. Probemos ahora que η es un tensor. Para tal efecto recordemos que todos los observadores inerciales usan la misma η , o sea que, 0 en vez de η en la ecuación (5.22), podemos escribir ηλρ λρ :

ηµν =

∂x0λ ∂x0ρ 0 η , ∂xµ ∂xν λρ

y ésta es justamente la forma como transforman los tensores de segundo rango. Este es un tensor de primera importancia y recibe el nombre de tensor métrico, ya que, de acuerdo con la ecuación (5.3), es el que ejecuta la distancia entre dos eventos. Una cosa es un espacio formado por una simple acumulación de puntos. Un espacio métrico tiene además una prescripción, 132

una regla, para establecer la distancia entre dos puntos, y el tensor métrico es el encargado de suministrar tal regla. Por esta razón decimos que el tensor métrico contiene toda la información acerca de la estructura geométrica de un espacio. El tensor de Levi-Civita. El tensor de Levi-Civita se define as´ı:

²αβγδ

 on par de 0123  +1 si αβγδ es una permutaci´ −1 si αβγδ es una permutaci´ on impar de 0123 =  0 si dos ´ındices son iguales

(5.36)

La prueba de que ²αβγδ es verdaderamente un tensor se encuentra fácilmente en la literatura [11]. Cantidades sim´ etricas y antisim´ etricas. Sea S µν = S νµ , y sea Aµν = νµ −A . En palabras, S es simétrico bajo la permutaci´ on µ À ν y A es µν antisimétrico. Consideremos la contracci´ on total S Aµν = −S νµ Aνµ = αβ −S Aαβ : S µν Aµν = −S αβ Aαβ

(5.37)

Si cambiamos α → µ y β → ν, el lado derecho de (5.37) se convierte en −S µν Aµν . La ecuación (5.37) es entonces S µν Aµν = −S µν Aµν , es decir, S µν Aµν = 0

(5.38)

En palabras: la contracción total de una cantidad simétrica con otra antisimétrica da cero. Esta afirmación es verdadera en general, sin necesidad de exigir que S y A sean tensores. La derivada. Para la derivada se usa una notación compacta: ¶ ∂ = ,∇ c ∂t µ ¶ µ ¶ ∂ ∂ ∂ ∂ ∂ = ,− ,− ,− = , −∇ c ∂t ∂x ∂y ∂z c ∂t

∂µ =

∂ = ∂xµ

∂µ =

∂ ∂xµ

µ

∂ ∂ ∂ ∂ , , , c ∂t ∂x ∂y ∂z

133

¶

µ

(5.39)

(5.40)

El producto ∂ µ ∂µ = ∂ 0 ∂0 + ∂ a ∂a es: ∂ µ ∂µ =

1 ∂2 − ∇2 c2 ∂t2

(5.41)

Probemos que si φ es un escalar, entonces ∂µ φ es un vector. Comenzamos ∂ escribiendo ∂µ0 φ = φ y luego usamos la regla de la derivaci´ on en cadena: ∂x0µ ∂µ0 φ =

∂ ∂xν ∂ ∂xν φ = φ = ∂ν φ, ∂x0µ ∂x0µ ∂xν ∂x0µ

que es verdaderamente la manera como transforman los vectores, de acuerdo con la ecuación (5.28). La derivada de un tensor es un tensor; para probarlo tomemos por ejem∂ plo ∂µ0 A0ν = A0ν y usemos la regla de la derivaci´ on en cadena: ∂x0µ ∂µ0 A0ν =

∂ ∂xα ∂ ∂xα 0ν 0ν A = A = ∂α A0ν ; ∂x0µ ∂x0µ ∂xα ∂x0µ

ahora usamos la ecuación (5.17): ∂µ0 A0ν = No olvidemos que las

∂xα ∂x0ν β ∂ A α ∂x0µ ∂xβ

(5.42)

∂x0ν son constantes, entonces ∂xβ ∂µ0 A0ν =

∂xα ∂x0ν ∂α Aβ ; ∂x0µ ∂xβ

(5.43)

pero ésta, seg´ un la ecuación (5.33), es la manera como transforman los tensores de rango 2. Hemos probado as´ı que la derivada de un tensor es otro tensor2 . 2 M´ as tarde, en el cap´ıtulo 9, vamos a abandonar las transformaciones de Lorentz para estudiar las transformaciones generalizadas de coordenadas. En las transformaciones gen-

134

5.4

Matrices

Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ´ındices, respectivamente, es muy cómoda la notación matricial. Definamos la matriz cuadrada Λµ ν =

∂x0µ ∂xν

(5.44)

Con Λ podemos reescribir las ecuaciones (5.17) y (5.30): A0 µ = Λµ ν Aν F 0 µν

= Λµ α F αβ Λν β = Λµ α F αβ ΛT

β

ν

O más concisamente: A0 µ = Λ Aν

F 0 µν = Λ F αβ ΛT

Ocurre sin embargo que Λ resulta ser simétrica (ver (5.48)), entonces A0 µ = Λ Aν F 0 µν

(5.45)

= Λ F αβ Λ

(5.46)

Calculemos la matriz Λ para el caso particular de la transformación (5.13): 

γ

   −γβ  Λ=   0   0

−γβ

0

γ

0

0

1

0

0

0



  0     0   

(5.47)

1

erales los coeficientes ∂x0ν /∂xβ no son constantes, y por consiguiente el paso de (5.42) a (5.43) es inv´ alido: véase el paso de la ecuaci´ on (9.29) a (9.30).

135

Esta matriz corresponde a las transformaciones (5.13), en las que la velocidad v es en la dirección del eje x. Para la transformación más general (1.35) se obtiene: 

γ

    −γβx    Λ=   −γβ y      −γβz

−γβx 1 + (γ −

−γβy

β2 1) x2 β

(γ − 1)

βy βx β2

(γ − 1)

βz βx β2

(γ − 1)

βx βy β2

1 + (γ − 1)

(γ − 1)



−γβz

βy2 β2

βz βy β2

(γ − 1)

βx βz β2

(γ − 1)

βy βz β2

1 + (γ − 1)

              

βz2 β2 (5.48)

Tal como anunciamos arriba, esta matriz es simétrica. El diferencial de volumen: Para cualquier clase de transformación de coordenadas (x, y, z, ...) → (u, v, w, ...) los diferenciales de volumen satisfacen [12] la ecuación dx dy dz · ·· = J du dv dw · ··, donde J es el jacobiano de la transformación, que es el determinante de la matriz formada con las derivadas ∂x/∂u , ∂x/∂v, etc. En nuestro caso el jacobiano es el determinante de Λ, entonces dx00 dx01 dx02 dx03 = (det Λ) dx0 dx1 dx2 dx3 . Ocurre que el determinante de Λ es 1 para todas las transformaciones de Lorentz. Esto se ve fácilmente en la matriz (5.47) que corresponde a una velocidad v en dirección x. Para una v en cualquier dirección, la Λ viene dada por (5.48). El lector puede verificar que el determinante de (5.48) también es 1 . Concluimos entonces que para todas las transformaciones de Lorentz se cumple que dx00 dx01 dx02 dx03 = dx0 dx1 dx2 dx3 , lo que cortamente se escribe: d4 x0 = d4 x En palabras: el diferencial de volumen d4 x es un escalar.

136

(5.49)

Una cantidad invariante: Que el determinante de la matriz Λ sea 1 tiene otra consecuencia interesante: el determinante de F µν es invariante bajo el grupo de las transformaciones de Lorentz. Para probarlo tomemos determinante en ambos lados de la ecuación (5.46), as´ı: det F 0 = det(ΛF Λ) = (det Λ)(det F )(det Λ)= det F : det F 0µν = det F µν

5.5

(5.50)

Ecuaciones tensoriales

En esta sección vamos a ver algunas propiedades importantes de las ecuaciones entre tensores. a) La más importante es que las ecuaciones tensoriales son automáticamente covariantes, es decir, tienen la misma forma en todos los observadores inerciales. Para ver esto consideremos por ejemplo la ecuación Aµ ν = B µ Cν

(5.51)

Si A, B y C son tensores, podemos reemplazar Aµ ν = Bµ =

∂xµ ∂x0β 0α A β , ∂x0α ∂xν

∂xµ 0α ∂x0β 0 B y C = C en la ecuación (5.51) para escribir ν ∂x0α ∂xν β ∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0 A = B Cβ β ∂x0α ∂xν ∂x0α ∂xν

Multiplicar ambos lados de esta ecuación por

∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α 0 B Cβ ∂xµ ∂x0α ∂x0ρ ∂xν

δ σ α δ β ρ A0α β = δ σ α δ β ρ B 0α Cβ0 A0σ ρ = B 0σ Cρ0 137

(5.52)

Comparando (5.52) con (5.51) nos damos cuenta de que tienen la misma forma: (5.51) es una ecuación covariante porque es la igualdad de dos tensores. Si queremos que se cumpla el principio de la relatividad, debemos expresar las leyes de la f´ısica mediante ecuaciones tensoriales. b) Supongamos que una ecuación es válida en todos los sistemas inerciales. Pensemos que esta ecuación tiene n elementos (factores o sumandos) y supongamos que n − 1 de ellos son tensores; entonces el otro elemento también tiene que ser tensor. Para mostrar que esto es cierto supongamos que la ecuaciones (5.51) y (5.52) son verdaderas y que A y C son tensores; probaremos que B también es tensor. ∂xµ ∂x0β 0α ∂x0β 0 Reemplazando Aµ ν = A , y C = C en (5.51) escribiν β ∂x0α ∂xν ∂xν β mos: ∂xµ ∂x0β 0α ∂x0β µ 0 A = B Cβ β ∂x0α ∂xν ∂xν Multiplicar ambos lados de esta ecuación por ∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν δ σ α δ β ρ A0α β = A0σ ρ =

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xν ∂x0β µ 0 B Cβ ∂xµ ∂x0ρ ∂xν ∂x0σ β δ ρ B µ Cβ0 ∂xµ ∂x0σ µ 0 B Cρ ∂xµ

Comparando la u ´ltima ecuación con (5.52) vemos que B 0σ =

∂x0σ µ B , ∂xµ

que es la forma como transforman los vectores: B es un vector, que es lo que nos propusimos demostrar. c) Las transformaciones de Lorentz (5.13) han sido corroboradas miles de 138

veces durante todo un siglo. Esto quiere decir que cuando se comparan las mediciones que O0 hace con sus reglas y relojes, con las mediciones que O hace con sus reglas y relojes, esas dos mediciones cumplen las relaciones (5.13). d) Si multiplicamos ambos lados de la ecuación (5.51) por ηµσ obtenemos Aσν = Bσ Cν . As´ı mismo, al multiplicar ambos lados de (5.51) por η νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de Aµσ = B µ C σ por ηµν se obtiene Aν σ = Bν C σ . En conclusión, todas estas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y Aµ ν = Bµ C ν . Vemos as´ı que dos ´ındices libres e iguales en ambos lados de una ecuación se pueden subir o bajar.

5.6

El principio de la relatividad

Este principio afirma que las leyes de la f´ısica deben ser las mismas en todos los sistemas inerciales. En otras palabras, todos los observadores inerciales son equivalentes. Este es un principio profundo, lleno de motivaci´ on filosófica y valor estético, pero debe ser traducido a términos prácticos para que sea u ´til. Admitiendo que las transformaciones de Lorentz (TL) son, verdaderamente, las encargadas de relacionar las observaciones de dos sistemas de referencia inerciales, decimos que, de acuerdo con el Principio, las leyes de la f´ısica deben ser enunciados invariantes bajo las TL. Acabamos de ver que las ecuaciones tensoriales son automáticamente covariantes bajo las TL. Entonces terminamos en esta conclusión: el principio de la relatividad se satisface si las leyes de la f´ısica se expresan mediante ecuaciones tensoriales. El Principio no se reduce simplemente a la frase “las leyes de la f´ısica son ecuaciones tensoriales”, pero s´ı podemos afirmar que él gu´ıa el trabajo de la f´ısica al indicar el camino y el método que se debe seguir: utilizar ecuaciones tensoriales. Las cantidades f´ısicas deben ser componentes de tensores. Por ejemplo el campo eléctrico hace parte del tensor electromagnético Fµν y la energ´ıa de una part´ıcula hace parte del cuadrivector momentum pµ . Ahora, hemos visto que los tensores de rango j tienen 4j componentes, lo que quiere decir que los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos as´ı que toda cantidad f´ısica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · miembros. Los 139

n´ umeros 1, 4, 16, 64 · · · son muy importantes para la f´ısica, porque indican los u ńicos tama˜ nos que las familias pueden tener: no hay familias de 10, 15, 63 miembros.

5.7

Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ

Durante todo este cap´ıtulo nos hemos dedicado básicamente a estudiar las propiedades tensoriales del grupo de las transformaciones lineales de coordenadas. Queremos ahora presentar, como ejemplos, los escalares y los tensores más importantes en problema del movimiento de una part´ıcula masiva. un la mide La masa en reposo. m0 es la masa de una part´ıcula, seg´ un observador para el cual la part´ıcula está en reposo. Esta constante es claramente un escalar. El vector posici´ on. Llamamos x a un evento de la trayectoria de una µ part´ıcula y x = (ct, x, y, z) a las coordenadas del evento x. Nótese que estamos cambiando la notación, ya que antes hab´ıamos usado x para denotar, en general, los eventos del espaciotiempo. El lector se acostumbrar´ a a distinguir por el contexto cuándo xµ son las coordenadas de un evento cualquiera o de un evento de una l´ınea en el mundo. p ηµν dxµ dxν es el intervalo a lo largo de la trayecEl tiempo propio dτ . toria de la part´ıcula. En caso de que la part´ıcula sea libre su velocidad es constante, y en consecuencia hay un observador inercial para el cual la part´ıcula está siempre en reposo; para p este observador el intervalo es puro tiempo, es el tiempo propio: c2 dτ 2 = ηµν dxµ dxν . Pero si la part´ıcula tiene aceleración, un sistema de coordenadas que la acompa˜ ne permanentemente ser´ıa no inercial y, por lo tanto, no podr´ıa usarse en pla relatividad especial. Sin embargo vamos a ver que la fórmula c2 dτ 2 = ηµν dxµ dxν sigue siendo válida si el s´ımbolo dτ adquiere un significado ligeramente diferente del que ten´ıa hace un par de renglones. Pensamos en una porción infinitesimal de trayectoria durante la cual la velocidad se puede considerar aproximadamente constante. En esa porción infinitesimal de trayectoria hay un observador inercial para el cual la part´ıcula está aproximadamente en reposo. Para este observador la porción de trayectoria es puramente temporaloide, y dura un tiempo propio p que llamaremos dτ . Claramente c2 dτ 2 = ηµν dxµ dxν . En conclusión, esta fórmula es válida para part´ıculas libres y aceleradas; aqu´ı dτ es el tiempo 140

propio que registra un observador inercial que acompa˜ na moment´ aneamente a la part´ıcula; dτ es un escalar. La velocidad. Una vez aclarado el significado de dτ pasamos a definir la velocidad: Uµ =

dxµ dτ

(5.53)

Ya que dxµ y dτ son tensores, concluimos que U µ es también un tensor. Sus componentes son: µ ¶ c dt dx dy dz µ U = , , , dτ dτ dτ dτ p Pero dτ = dt 1 − u2 /c2 , entonces Ã µ

U =

p

c 1 − u2 /c2

u

, p

! (5.54)

1 − u2 /c2

De acuerdo con la ecuación (5.35) la cantidad U µ Uµ es escalar. Averig¨ uemos cuánto vale: U µ Uµ = U 0 U0 − U a Ua = c2

(5.55)

El momentum. Ahora definimos el momentum de una part´ıcula: pµ = m0 U µ

(5.56)

Obviamente es un tensor, ya que es el producto de dos tensores. Calculemos pµ pµ = m20 U µ Uµ usando (5.55): pµ pµ = (m0 c)2

(5.57)

Con (5.54) y (5.56) podemos escribir las componentes de pµ : Ã p

µ

=

p

m0 c 1 − u2 /c2 141

, p

m0 u 1 − u2 /c2

!

= (mc , mu)

(5.58)

= (E/c , p)

(5.59)

Utilizamos esta ecuación para calcular el producto pµ pµ : pµ pµ = E 2 /c2 − p2

(5.60)

Al igualar los lados derechos de (5.57) y (5.60) escribimos, finalmente, E=

p

(m0 c2 )2 + (pc)2

(5.61)

Esta es la misma ecuación (3.15). Queremos presentar una u ´ltima fórmula que combina la velocidad, la energ´ıa y el momentum. Las ecuación (5.56) dice que pν = m dxν /dt; pero m = E/c2 , entonces pν = (E/c2 ) (dxν /dt), o sea que c2 ν dxν = p dt E

(5.62)

Esta fórmula, aunque es una mezcla inusual de vectores y cantidades no tensoriales, mostrará su utilidad cuando veamos las corrientes en el cap´ıtulo 7. El momentum del fot´ on. Para part´ıculas de masa cero, como el fotón, el momentum se denomina k ν . Si se trata de un pulso de luz que se propaga en dirección del vector unitario n, escribimos k = |k| n. Las ecuaciones de pν se simplifican considerablemente: k µ kµ = 0 |k| = E/c kµ =

E (1, n) c

142

(5.63) (5.64) (5.65)

La corriente el´ ectrica. Ya hab´ıamos demostrado en la página 111 que (ρc, J) transforma como un vector, al que llamaremos J µ : J µ = (ρc, J)

5.8

(5.66)

Aberraci´ on de la luz y efecto Doppler

Pensemos en un pulso de luz. Respecto al observador O tiene energ´ıa E y se propaga en dirección del vector unitario n. Respecto a O la energ´ıa es E 0 y se propaga en dirección n0 . La ecuaciones (5.18) son, en este caso: k

00

k0

µ ¶ 1 0 = γ k − v ·k c ¶ µ γ−1 γ 0 = k+ v ·k− k v v2 c

En vista de (5.65), estas dos ecuaciones quedan as´ı: ³ v · n´ E 0 = Eγ 1 − c · µ ¶ ¸ γ−1 γ 0 0 E n = E n+ v v ·n− v2 c

(5.67)

Para aislar la variable n0 basta dividir lado a lado estas dos ecuaciones: µ

γ−1 γ n+ v ·n− 2 v c ³ n0 = v · n´ γ 1− c

¶ v (5.68)

Aberraci´ on: La ecuación (5.68) es general, pero debemos admitir que no es simple. Para apreciar el significado de la aberración supongamos que v es en dirección x y que n es paralela al plano xy y hace un ángulo θ con el eje x. Escribimos entonces nx = cos θ, ny = sen θ. Las componentes de n0 se averiguan fácilmente con la fórmula (5.68): n0x =

cos θ − v/c v cos θ 1− c 143

n0y =

1 γ

sen θ v cos θ 1− c

Vamos a dividir, lado a lado, estas dos ecuaciones. Al cociente n0y /n0x lo llamamos tan θ0 : tan θ0 =

sen θ 1 γ cos θ − v/c

(5.69)

Esta es la ecuación de la aberración estelar que Bradley dedujo en el siglo XVIII. Recuperar esta fórmula centenaria es uno de los hallazgos de la relatividad. No es dif´ıcil entender la causa de la aberración de la luz desde un punto de vista ondulatorio. Recordemos que, por definición, un frente de onda es el lugar geométrico de todos los puntos que, en cierto instante dado, tienen la misma fase. El frente de onda es un objeto extendido en el espacio, en cierto instante. En otras palabras, es un conjunto de eventos simult´ aneos que ocupan una región extendida en el espacio. Ya hemos advertido que la simultaneidad es relativa: un objeto extenso que aparece simult´ aneo a un observador, en general no aparece simult´ aneo a otros observadores. En nuestro caso decimos que los eventos que constituyen un frente de onda para O no son, en general, simult´ aneos para O0 . Vemos as´ı que los eventos de un frente de onda para O no forman un frente de onda para O0 . De esta manera llegamos a una conclusión importante: en una onda luminosa, los frentes de onda para O no son frentes de onda para O0 . Cada observador inercial registra sus propios frentes de onda3 . Ahora, como la dirección de propagación de la onda es perpendicular a los frentes de onda, concluimos que la dirección de propagación para O es diferente a la dirección de propagación para O0 . Doppler: Si suponemos que en la luz la energ´ıa es proporcional a la frecuencia (E = hν, por ejemplo) la ecuación (5.67) queda: ³ v · n´ ν 0 = νγ 1 − c 3

(5.70)

Consideremos un frente de onda para O y un frente de onda para O0 ; la intersecci´ on de esos dos planos es una l´ınea recta; los eventos de esa l´ınea son simult´ aneos para O y también son simult´ aneos para O0 .

144

Hay tres casos particularmente claros: cuando n y v son paralelos (⇒), cuando son antiparalelos (¿), y cuando son perpendiculares (→↑). En estos casos la fórmula (5.70) da: s ⇒

ν0 = ν s

¿ →↑

ν

0

= ν

ν 0 = γν

1 − v/c 1 + v/c

(5.71)

1 + v/c 1 − v/c

(5.72) (5.73)

La fórmula (5.71) vale cuando la luz y O0 viajan en la misma dirección, (5.72) para direcciones opuestas y (5.73) para direcciones perpendiculares. Las dos primeras fórmulas, conocidas como efecto Doppler longitudinal, ya se conoc´ıan antes de 1905. El efecto Doppler transverso, fórmula (5.73), era desconocido hasta 1905, y se constituye como una novedad de la teor´ıa especial de la relatividad.

145

146

Cap´ıtulo 6

La electrodin´ amica manifiestamente covariante La electrodinámica está formalmente contenida en las ecuaciones de Maxwell y en la fuerza de Lorentz:

∇×E+

∇×B−

∇·B = 0

(6.1)

1 ∂B c ∂t

(6.2)

= 0

∇ · E = 4πρ

(6.3)

1 ∂E c ∂t

(6.4)

dp dt

4π J c ³ ´ u = q E+ ×B c =

(6.5)

Hemos visto que la relatividad especial le da al electromagnetismo una apariencia interesante, porque unifica los campos eléctrico y magnético. Sin embargo, es justo advertir que la relatividad no afecta esencialmente la estructura formal de la teor´ıa electromagnética. Dicho en otras palabras, la electrodinámica es covariante bajo las transformaciones entre observadores inerciales, tal como tuvimos ocasión de probar en la sección 4.8. No olvidemos sin embargo que esa sección es larga y engorrosa: las cuatro ecuaciones de Maxwell y la fuerza de Lorentz son covariantes, pero esa covariancia es dif´ıcil de ver. Por este motivo decimos que la covariancia de las cinco ecuaciones, aunque es verdadera e indudable, no es manifiesta. Conviene formular la electrodinámica utilizando otras ecuaciones, equivalentes a las cinco mencionadas, que sean manifiestamente covariantes. Ya vimos en la 147

sección 5.5 que las ecuaciones tensoriales son automáticamente covariantes, entonces nuestro proyecto es este: convertir a las cinco ecuaciones en ecuaciones tensoriales.

6.1

El cuadripotencial Aµ

Los campos E y B son enteramente suficientes para describir el campo electromagnético. Sin embargo, para darle a la electrodinámica una escritura manifiestamente covariante, podemos abandonar los campos E y B , expresándolos en términos de otros campos φ y A , de la manera siguiente: B = ∇×A

(6.6)

E = −∇φ −

1 ∂A c ∂t

(6.7)

Sin embargo, y aqu´ı viene un asunto de primera importancia, la relación entre (E, B) y (φ, A) no es uno a uno, ya que para describir a (E, B) hay un n´ umero infinito de opciones (φ, A) . Esto es lo que se espera, ya que los campos (E, B) se producen como derivadas de los campos (φ, A) , o sea que a los (φ, A) se les pueden agregar términos sin afectar sus derivadas. En efecto, utilizando cualquier función derivable χ se pueden producir unos nuevos campos (φ0 , A0 ) equivalentes a los viejos (φ, A) , as´ı: φ0 = φ −

1 ∂χ c ∂t

(6.8)

A0 = A + ∇χ

(6.9)

Podemos rápidamente verificar que los campos (φ0 , A0 ) y los campos (φ, A) son equivalentes, al darnos cuenta de que ∇ × A0 = ∇ × A −∇φ0 −

1 ∂A0 c ∂t

= −∇φ −

1 ∂A , c ∂t

es decir, los campos (E, B) se pueden calcular, bien sea con (φ, A) , o con (φ0 , A0 ) . Esto indica que para describir una realidad (E, B) no estamos 148

obligados a usar unos (φ, A) determinados, sino que tenemos una cierta libertad en la escogencia, que recibe el nombre de libertad gauge. La Figura 6.1 muestra que para describir un campo electromagnético se puede usar las variables (E, B) o las variables (φ, A) . Pero a cada punto en el plano (E, B) le corresponde en el plano (φ, A) , no un punto, sino un conjunto infinito de puntos que denotamos D. La libertad gauge es poder usar cualquier punto del conjunto D. Ahora, podemos escoger, dentro de D, un subconjunto, el subconjunto de todos los campos (φ, A) que cumplen alguna condición que nos parezca conveniente. Es usual escoger dentro de D el subconjunto de campos (φ, A) que cumplen una ecuación subsidiaria que recibe el nombre de condici´ on de gauge. Las condiciones de gauge más conocidas son la de Coulomb y la de Lorentz: ∇ · A = 0 es la condición de gauge de Coulomb. Una de las ense˜ nanzas de la relatividad especial es la unión del espacio y el tiempo, y una ecuación que sea relativistamente válida debe tratar al espacio y al tiempo en un plano de igualdad. Si una ecuación menciona el espacio sin mencionar el tiempo, no puede ser covariante, y tal es el caso con la ecuación ∇ · A = 0. El hecho de que la condición de Coulomb no sea covariante la hace inapropiada cuando se desea formular covariantemente una teor´ıa. Si queremos una formulaci´ on manifiestamente covariante de la electrodinámica, no debemos usar el gauge de Coulomb. Esto no quiere decir que esta condición gauge sea in´ util. A bajas velocidades, y en muchos problemas de f´ısica atómica y estado sólido, una formulación relativista resulta excesiva y torpe. En esos problemas no se aspira a usar una formulación covariante, y el gauge de Coulomb es apropiado. Como queremos una expresión manifiestamente covariante de la electrodinámica, debemos buscar una condición de gauge covariante. Investiguemos la condición de gauge de Lorentz: 1 ∂φ +∇·A=0 c ∂t

(6.10)

A primera vista esta ecuación no parece covariante, pero si definimos Aµ = (φ, A) , la ecuación (6.10) se escribe muy cortamente: 149

(6.11)

∂µ Aµ = 0

(6.12)

Como ∂µ es un operador vectorial, la ecuación (6.12) dice que en el gauge de Lorentz Aµ es un vector. En general, cuando se necesite una formulaci´ on manifiestamente covariante se puede usar el gauge de Lorentz. A lo largo de todo este cap´ıtulo supondremos que el potencial Aµ cumple la condición ∂µ Aµ = 0. Queremos expresar las cinco ecuaciones (6.1)-(6.5) en términos del potencial Aµ , y aqu´ı encontramos una de las ventajas del nuevo tratamiento: cuando se usa Aµ , las dos ecuaciones homogéneas de Maxwell se satisfacen automáticamente. En efecto, es evidente que con las definiciones (6.6) y (6.7) se cumplen automáticamente las ecuaciones homogéneas (6.1) y (6.2). Esta es una simplificación, ya que los campos Aµ quedan regidos, no por cuatro ecuaciones (de Maxwell), sino por dos apenas: las inhomogéneas (6.3) y (6.4). Esta es una ense˜ nanza, una gu´ıa práctica: cuando se usa Aµ , uno no piensa en cuatro ecuaciones de Maxwell, sino en dos. Expresemos pues las dos ecuaciones inhomogéneas (6.3) y (6.4) y la fuerza de Lorentz (6.5) en términos del tensor Aµ . Esto es lo que haremos en las próximas dos secciones.

6.2

Las dos ecuaciones de Maxwell

Al colocar las definiciones (6.6) y (6.7) en las ecuaciones inhomogéneas (6.3) y (6.4) se obtiene fácilmente 1∂ (∇ · A) + ∇2 φ = −4πρ c ∂t µ ¶ 1 ∂2A 1 ∂φ 4π 2 −∇ A+∇ +∇·A = J 2 2 c ∂t c ∂t c

(6.13) (6.14)

En estas dos ecuaciones las variables φ y A est´ an acopladas de una manera complicada. Pero ellas se pueden desacoplar muy fácilmente; en efecto, si utilizamos el gauge de Lorentz (6.10) las dos ecuaciones (6.13) y (6.14) quedan as´ı: 1 ∂2φ − ∇2 φ = 4πρ c2 ∂t2 150

(6.15)

1 ∂2A − ∇2 A = c2 ∂t2

4π J c

(6.16)

La ganancia es considerable: ahora las ecuaciones de movimiento de φ y A están desacopladas y, además, tienen una simetr´ıa evidente. En vista de la fórmula (5.41) las ecuaciones (6.15) y (6.16) se escriben muy cortamente: ∂µ ∂ µ φ = 4πρ ∂µ ∂ µ A =

4π J c

(6.17)

De otro lado, la ecuación (5.66) nos ense˜ n´ o que las cantidades (ρc, J) forman un cuadrivector: J µ = (ρc, J) ,

(6.18)

entonces las ecuaciones (6.11) y (6.18) en (6.17) dan: ∂µ ∂ µ Aν =

4π ν J c

(6.19)

Esta fórmula expresa las dos ecuaciones inhomogéneas de Maxwell de una manera manifiestamente covariante. Operando con ∂ν en ambos lados de esta ecuación se obtiene 4π ∂ν J ν = ∂µ ∂ µ ∂ν Aν c Ahora, el lado derecho de esta ecuación es cero, debido a la condición (6.12), entonces ∂ν J ν = 0

(6.20)

Esta es la ecuación de continuidad. Antes de concluir esta sección anotemos que en ausencia de cargas y corrientes la teor´ıa de Maxwell admite la existencia de ondas electromagnéticas. En efecto, sino hay cargas ni corrientes, los lados derechos de las ecuaciones (6.15) y (6.16) son cero, y en consecuencia: 151

¶ 1 ∂2 2 −∇ φ = 0 c2 ∂t2 µ ¶ 1 ∂2 2 −∇ A = 0 c2 ∂t2 µ

Estas son ecuaciones de ondas. Si hacemos cero los lados derechos de las ecuaciones (6.17) se llega a ∂µ ∂ µ Aν = 0

(6.21)

Esta es la ecuación de ondas en una forma manifiestamente covariante.

6.3

La fuerza de Lorentz

Al desplegar las ecuaciones (6.6) y (6.7) en todas sus componentes llegamos a: Ex = −(∂ 0 A1 − ∂ 1 A0 )

Bx = −(∂ 2 A3 − ∂ 3 A2 )

Ey = −(∂ 0 A2 − ∂ 2 A0 )

By = −(∂ 3 A1 − ∂ 1 A3 )

Ez =

−(∂ 0 A3

−

∂ 3 A0 )

Bz =

−(∂ 1 A2

−

(6.22)

∂ 2 A1 )

Ya estamos en condición de atacar la fuerza de Lorentz. Las ecuaciones (4.139)-(4.141) son: dpx dt

=

q [cEx + uy Bz − uz By ] c

(6.23)

dpy dt

=

q [cEy + uz Bx − ux Bz ] c

(6.24)

dpz dt

=

q [cEz + ux By − uy Bx ] c

(6.25)

Modifiquemos la escritura de la primera ecuación; la ecuación (5.54) dice que c = γ −1 U 0 , uy = γ −1 U 2 , uz = γ −1 U 3 , entonces γ

¤ q£ 0 dpx = U Ex + U 2 Bz − U 3 By dt c 152

De otro lado, γ

dpx dp1 = : dt dτ ¤ dp1 q£ 0 = U Ex + U 2 Bz − U 3 By dτ c

También usamos tres de las ecuaciones (6.22) para obtener: ¤ dp1 q£ 1 0 = (∂ A − ∂ 0 A1 )U 0 − (∂ 1 A2 − ∂ 2 A1 )U 2 − (∂ 1 A3 − ∂ 3 A1 )U 3 , dτ c es decir: ¤ dp1 q£ 1 0 = (∂ A − ∂ 0 A1 )U0 + (∂ 1 A2 − ∂ 2 A1 )U2 + (∂ 1 A3 − ∂ 3 A1 )U3 dτ c Nótese que esta ecuación se puede escribir dpa q = (∂ a Aν − ∂ ν Aa )Uν dτ c

(6.26)

En esto se ha convertido la ecuación (6.23). Es fácil darse cuenta de que también (6.24) y (6.25) corresponden a la ecuación (6.26). Ahora damos un salto interesante; en vez de la ecuación (6.26) proponemos: dpµ q = (∂ µ Aν − ∂ ν Aµ )Uν dτ c

(6.27)

En conclusión: con la condición (6.12), las ecuaciones de la electrodinámica manifiestamente covariantes son (6.19) y (6.27). La conexión entre Aµ y los campos E y B está en (6.6) y (6.7). Las ecuaciones homogéneas (6.1) y (6.2) no constituyen un resultado adicional (ver página 150). Nota: El salto de las tres ecuaciones (6.26) a las cuatro ecuaciones (6.27) es una generalización, porque agrega una cuarta ecuación, para µ = 4 : q dp0 = (∂ 0 Aν − ∂ ν A0 )Uν dτ c 153

¿Qué significa esta ecuación, hemos descubierto algo nuevo, esto ya lo sab´ıamos? Para responder estas preguntas notemos que esta ecuación se puede escribir as´ı:

γ

dp0 dτ

=

dp0 dt

q = γ (∂ 0 Aa − ∂ a A0 )ua c

dp0 dt

=

q 0 a (∂ A − ∂ a A0 )Ua c

q q (Ea )ua = E · u c c

Ahora, p0 es la componente cero del cuadrivector momentum: p0 = Energ´ıa/c = E/c, entonces dE = qE·u dt En el lado derecho de esta ecuación podemos sumar u × B · u = 0 : dE dt

= q [E +

u × B] · u c

= F·u

Esta ecuación es Potencia = F · u , que es una ecuación ampliamente conocida en la mecánica. En otras palabras, la ecuación (6.27) unifica la fuerza de Lorentz con la ecuación de potencia. No es esta la primera vez, ni será la u ´ltima, en que la relatividad unifica. Lo que acabamos de ver ocurre a menudo cuando uno quiere convertir una ecuación no covariante en otra ecuación que s´ı sea covariante. Por lo general este proceso incluye una generalización (como el paso de (6.26) a (6.27)), y es aqu´ı donde aparece información adicional, ecuaciones adicionales. Estas ecuaciones adicionales pueden ser información ya conocida, o pueden ser información nueva. En el primer caso la generalización aporta unificación, que es algo de por s´ı valioso. En el segundo caso, la generalización aporta nueva f´ısica y abre las puertas a la observaci´ on de fenómenos insospechados. 154

6.4

El tensor electromagn´ etico

La teor´ıa electrodinámica está escrita de modo manifiestamente covariante en las ecuaciones (6.12), (6.19), y (6.27). Lograr esta escritura covariante era uno de los objetivos principales de este cap´ıtulo; pero conviene además que presentemos un nuevo tensor F µν que trae ventajas en el estudio de las leyes de conservación y la formulaci´ on lagrangiana, asuntos que veremos en los cap´ıtulos 7 y 8. Para comenzar anotemos que las ecuaciones (6.22) y (6.27) sugieren decididamente que definamos la cantidad F µν = ∂ µ Aν − ∂ ν Aµ

(6.28)

La derivada ∂ µ es un operador vectorial y Aµ es un vector en el gauge de Lorentz; entonces F µν es un tensor en el gauge de Lorentz, y se le conoce como el tensor electromagnético. F µν es de rango 2, y por tanto tiene 16 componentes; pero es antisimétrico, entonces tiene solamente 6 componentes libres, que son justamente las tres componentes de E y las tres componentes de B. Las ecuaciones (6.22) muestran que Ex = F 10 ,

Ey = F 20 ,

Ez = F 30

Bx = F 32 ,

By = F 13 ,

Bz = F 21

(6.29)

O, en forma matricial: 

F µν

0

   Ex  =   Ey   Ez

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

−Ez



  By     −Bx   

(6.30)

0

Ahora pasamos a expresar las ecuaciones de la electrodinámica en términos del nuevo tensor F µν . Primero veremos las ecuaciones inhomogéneas de Maxwell, luego las homogéneas y por u ´ltimo la fuerza de Lorentz. 155

´ Las ecuaciones inhomog´ eneas de Maxwell. Estas se expresan mediante (6.19): 4π ν J c

= ∂µ (∂ µ Aν ) = ∂µ (∂ µ Aν − ∂ ν Aµ + ∂ ν Aµ ) = ∂µ (∂ µ Aν − ∂ ν Aµ ) + ∂ ν ∂µ Aµ

El u ´ltimo término del lado derecho es cero por la condición de Lorentz, 4π ν entonces queda J = ∂µ (∂ µ Aν − ∂ ν Aµ ), es decir c ∂µ F µν =

4π ν J c

(6.31)

Las ecuaciones homog´ eneas de Maxwell. Por la definición del tensor µν α µν F es claro que ∂ F + ∂ ν F αµ + ∂ µ F να = ∂ α (∂ µ Aν − ∂ ν Aµ ) + ∂ ν (∂ α Aµ − ∂ µ Aα ) + ∂ µ (∂ ν Aα − ∂ α Aν ). Fácilmente vemos que el lado derecho de esta ecuación es cero, o sea que ∂ α F µν + ∂ ν F αµ + ∂ µ F να = 0 En la ecuación (6.32) hacer α = 1 , µ = 2 y ν = 3 : ∂ 1 F 23 + ∂ 3 F 12 + ∂ 2 F 31 = 0 En la ecuación (6.32) hacer α = 0 , µ = 3 y ν = 2 : ∂ 0 F 32 + ∂ 2 F 03 + ∂ 3 F 20 = 0 En la ecuación (6.32) hacer α = 0 , µ = 1 y ν = 3 : ∂ 0 F 13 + ∂ 3 F 01 + ∂ 1 F 30 = 0 En la ecuación (6.32) hacer α = 0 , µ = 2 y ν = 1 : ∂ 0 F 21 + ∂ 1 F 02 + ∂ 2 F 10 = 0 156

(6.32)

En estas cuatro ecuaciones haremos dos cosas: primero, cambiar las componentes F µν por las entradas de la matriz (6.30) y, segundo, substituir ∂ 0 , ∂ 1 , ∂ 2 , ∂ 3 por ∂0 , −∂1 , −∂2 , −∂3 , respectivamente. Se obtiene entonces estas cuatro ecuaciones: ∂1 Bx + ∂3 Bz + ∂2 By = 0 ∂0 Bx + ∂2 Ez − ∂3 Ey = 0 ∂0 By + ∂3 Ex − ∂1 Ez = 0 ∂0 Bz + ∂1 Ey − ∂2 Ex = 0 Estas ecuaciones son, claramente, las dos ecuaciones homogéneas (6.1) y (6.2). En conclusión, la ecuación (6.32) es una escritura manifiestamente covariante de las dos ecuaciones inhomogéneas de Maxwell. La fuerza de Lorentz. En la ecuación (6.27) reconocemos la definición del tensor electromagnético: q dpµ = F µν Uν dτ c

(6.33)

El problema de part´ıcula libre ocurre cuando q = 0 o cuando no hay campo electromagnético. En ambos casos el lado derecho de esta ecuación es cero: dpµ dτ d2 xµ dτ 2

= 0

Part´ıcula libre

(6.34)

= 0

Part´ıcula libre

(6.35)

Para concluir digamos que la formulaci´ on covariante de la electrodinámica es as´ı: con la definición (6.28) y la condición (6.12), las ecuaciones de la electrodinámica son (6.31) y (6.33). La conexión entre F µν y los campos E y B está en (6.29). Las ecuaciones homogéneas, contenidas en (6.32) no constituyen un resultado adicional (ver página 150). 157

6.5

La transformaci´ on de los campos

En la sección 4.1 encontramos las reglas de transformación de los campos E y B. Recuérdese, sin embargo, que el camino seguido en esa ocasión fue largo y dispendioso. En este momento queremos deducir de nuevo esas reglas con las herramientas que nos suministra la notación covariante. Como en esta notación no se usan E, B, sino F µν , lo que hacemos primero es encontrar la transformada del tensor electromagnético. Para esto utilizamos las ecuaciones (5.46) , (5.47) y (6.30), as´ı: 

γ

−γβ

   −γβ     0   0

0

γ

0

0

1

0

0

0



0

   0    Ex    0    Ey  Ez

1

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

−Ez



γ

   By    −γβ    −Bx   0  0

0

−γβ

0

γ

0

0

1

0

0

Obtenemos esta expresión de F 0 µν : 

F 0 µν

0

−Ex

−γ(Ey − βBz ) −γ(Ez + βBy )

    Ex 0 −γ(Bz − βEy )   =  γ(E − βB ) γ(B − βE ) 0  y z z y   γ(Ez + βBy ) −γ(By + βEz ) Bx

Comparando con 

F

0 µν

0

  0  Ex  =   E0  y  Ez0

−Ex0 −Ey0 0

−Bz0

Bz0

0

−By0

Bx0

identificamos: 158

−Ez0



    ,  0 −Bx    By0

0



   γ(By + βEz )      −Bx    0

0



  0     0    1

Ex0 = Ex

Bx0 = Bx

Ey0 = γ(Ey − βBz )

By0 = γ(By + βEz )

Ez0 = γ(Ez + βBy )

Bz0 = γ(Bz − βEy )

Estas son las mismas reglas de transformación de la sección (4.1).

6.6

Dos escalares

Con F µν y el tensor ²αβγδ de Levi-Civita (ver la ecuación (5.36)) se puede construir otro, que se llama el tensor electromagnético dual: F αβ ≡ 12 ²αβγδ Fγδ . 

F αβ

0

−Bx −By −Bz

   Bx 0  =   By −Ez   Bz

Ey

Ez 0 −Ex





0

Bx

By

      −Bx −Ey  0  ; Fαβ =     −By −Ez Ex      0

−Bz

Ey

Ez 0 −Ex

Bz



  −Ey     Ex    0

Con los tensores F µν y F αβ se puede construir tres cantidades escalares, que son F αβ Fαβ , F αβ Fαβ y F αβ Fαβ . Al desarrollar estos productos matriciales se obtiene F αβ Fαβ = −4E · B :

escalar (6.36)

F αβ Fαβ = −F αβ Fαβ = 2(E 2 − B 2 ) :

escalar

Estas son las dos cantidades invariantes que vimos en las ecuaciones (4.49) y (4.50). Los escalares (6.36) son cuadráticos en los campos, es decir, son productos de dos campos. Con productos de cuatro campos también se puede construir un escalar (ver la ecuación (5.50)) que es el determinante de F αβ . El resultado es det F αβ = (E · B)2 :

159

escalar

E, B

D

f, A

Figura 6.1 La relación entre (E , B) y (φ , A) no es biun´ıvoca: a unos valores dados de (E , B) les corresponde todo un conjunto D de valores (φ , A) .

160

Cap´ıtulo 7

Las leyes de conservaci´ on

Ha llegado el momento de estudiar las corrientes, el tensor energ´ıa-momentum y las leyes de conservación. Para tal efecto nos valdremos de un sistema f´ısico, la nube de part´ıculas, que es suficientemente simple para admitir un tratamiento matemático sencillo, pero tiene además una complejidad suficiente para mostrar las sutilezas de las leyes de conservaci´ on. Después de presentar estos temas concluimos el cap´ıtulo con la corriente del momentum angular.

7.1

La nube de part´ıculas

Al estudiar la nube de part´ıculas en la sección 4.7 supon´ıamos que a un peque˜ no volumen de la nube se le pod´ıa asignar una velocidad u. Nuestro propósito ahora es hacer un tratamiento más refinado, atendiendo a la contribución que cada part´ıcula individual aporta a la densidad y a la corriente. Pensamos en un conjunto de part´ıculas en los puntos x1 (t), x2 (t), x3 (t), ... La densidad ρpar de part´ıculas y la densidad Jpar de corriente se definen as´ı:

ρpar (x, t) =

X

δ 3 (x − xn (t))

(7.1)

n

Jpar (x, t) =

X

δ 3 (x − xn (t))

n

161

dxn (t) , dt

(7.2)

donde el ´ındice n = 1, 2, 3, ... recorre1 todas las part´ıculas de la nube2 . ∂ a Tomemos ahora la divergencia ∇ · Jpar = J ; se obtiene: ∂xa par ¶ a Xµ ∂ dxn (t) ∂ dxan (t) 3 3 δ (x − x (t)) + δ (x − x (t)) n n ∂xa dt ∂xa dt n Ahora, tonces:

(7.3)

dxan (t) ∂ dxan (t) depende u ńicamente de t, o sea que es cero, endt ∂xa dt

∇ · Jpar =

X dxa (t) ∂ n δ 3 (x − xn (t)) a dt ∂x n

= −

X dxa (t) ∂ n δ 3 (x − xn (t)) a dt ∂x n n

= −

X ∂ ∂ δ 3 (x − xn (t)) = − ρpar ∂t ∂t n

De donde vemos que ∂ρpar + ∇ · Jpar = 0 ∂t

(7.4)

Esta es la célebre ecuación de continuidad (véase la ecuación (6.20)). Es muy importante, porque trae consigo la conservaci´ on del n´ umero de part´ıculas, tal como veremos enseguida. El n´ umero N de part´ıculas es: Z N=

Tomar la derivada

d3 x ρpar (x, t)

(7.5)

dN y usar la ecuación (7.4) dt

1 La ventaja de este tratamiento, tomado de Weinberg [11], radica en el hecho de que aunque la nube est´ a compuesta de part´ıculas en posiciones discretas, las cantidades ρpar (x, t) y Jpar (x, t) son campos que dependen de las coordenadas continuas (x, t). 2 Los f´ısicos le dicen polvo a un conjunto de part´ıculas tal que todas ellas est´ an en reposo respecto a alg´ un observador inercial. Lo que queremos estudiar en este cap´ıtulo no es una nube de polvo.

162

dN = dt

Z

∂ρpar (x, t) = − ∂t

d3 x

Z d3 x ∇ · Jpar (x, t)

El lado derecho es un integral de volumen que, seg´ un el teorema de Gauss, es igual a una integral en la superficie que cubre al volumen. Si este volumen es suficientemente grande para abarcar todas las part´ıculas, la corriente J es cero en la superficie y el integral es cero. Vemos as´ı que dN =0 dt

(7.6)

En conclusión, la ecuación de continuidad (7.4) implica que el n´ umero total de part´ıculas de la nube se conserva. Es importante que escribamos la corriente en notación covariante. Si llamamos x0n (t) = ct, el evento (ct, xn (t)) que ocupa la part´ıcula n se puede escribir (x0n (t), xn (t)) ; o más cortamente, xµn (t). Las ecuaciones (7.1) y (7.2) son X

cρpar (x, t) =

δ 3 (x − xn (t))

dx0n (t) dt

δ 3 (x − xn (t))

dxan (t) dt

n

X

a Jpar (x, t) =

n

0 = cρ Para unificar estas dos ecuaciones definimos Jpar par , de modo que µ Jpar = (cρpar , Jpar ) µ Jpar

=

X n

(7.7)

dxµn (t) δ (x − xn (t)) dt 3

(7.8)

µ Vamos a probar que Jpar es un Rvector, para lo cual multiplicamos el lado derecho de la ecuación (7.8) por dx0 δ(x0 − x0n ) = 1:

µ Jpar =

XZ

dx0 δ(x0 − x0n )δ 3 (x − xn (t))

n

163

dxµn (t) dt

=

XZ

dx0 δ 4 (x − xn )

n

= c

XZ

dxµn dt

δ 4 (x − xn )dxµn

(7.9)

n

R De otro lado, la función δ 4 satisface la ecuación δ 4 (x − xn )d4 x = 1, o sea que δ 4 (x − xn )d4 x es un escalar; como d4 x es un escalar (ver la ecuación (5.49)), concluimos que δ 4 (x − xn ) es un escalar. Hecha esta observaci´ on, regresamos al lado derecho de la ecuación (7.9). Como dxµn y δ 4 (x − xn ) son µ tensores, entonces Jpar es un vector. La ecuación de continuidad (7.4) se escribe también: µ ∂µ Jpar (x) = 0

7.2

(7.10)

Otras corrientes

La n-ésima part´ıcula de la nube tiene carga eléctrica qn y momentum pνn . En el lado derecho de la ecuación (7.8) podemos multiplicar cada sumando por qn o por pνn , y de esta manera se obtienen otras dos corrientes: ν Jelec (x) =

X

qn δ 3 (x − xn (t))

n

Jpνµ (x) =

X

dxνn (t) dt

pµn (t) δ 3 (x − xn (t))

n

dxνn (t) dt

(7.11) (7.12)

dxµn (t) En la ecuación (7.11) podemos interpretar que qn δ 3 (x − xn (t)) es dt la densidad de corriente eléctrica que aporta la n-ésima part´ıcula para la µ construcción de la densidad total de corriente eléctrica Jelec . As´ı mismo, la ecuación (7.12) da la ν-ésima componente de la densidad de corriente de µ momentum µ. Nótese que, como qn es un escalar, la corriente Jelec es un µ ν vector; de la misma manera, como pn (t) es un vector, Jpµ es un tensor de segundo rango. Cada part´ıcula de la nube tiene una l´ınea en el mundo, una trayectoria en el espaciotiempo. Esa trayectoria crea varias corrientes: la eléctrica, la de momentum µ, etc. Con los aportes de todas las part´ıculas se obtienen las corrientes totales de la nube. Lo interesante es que existen varias corrientes ν , J ν , J ν , etc. simultáneamente: Jpart pµ elec 164

Vamos a demostrar que corriente eléctrica3 se conserva. Al tomar la divergencia en la ecuación (7.11) tenemos en cuenta que la carga q es invariante (ver página 43), o sea que sus derivadas son cero y se llega limpiamente a una ecuación como (7.4): ∂µ J µ (x) = 0

(7.13)

Este es un resultado importante: la corriente eléctrica satisface la ecuación de continuidad. En consecuencia, la carga eléctrica total de la nube permanece constante a medida que transcurre el tiempo.

7.3

El tensor de energ´ıa y momentum

La densidad de corriente del momentum µ que presentamos en (7.12) se µν escribe usualmente Tmec : X

µν Tmec (x) =

pµn (t) δ 3 (x − xn (t))

n

dxνn (t) dt

(7.14)

o como en la ecuación (7.9): µν Tmec (x)

=c

XZ

pµn δ 4 (x − xn ) dxµn

(7.15)

n

La fórmula (7.14) puede transformarse usando la ecuación (5.62): µν Tmec (x) = c2

X pµn pν

n

n

En

δ 3 (x − xn (t))

(7.16)

Esta ecuación muestra que el tensor se construye con las propiedades mecánicas de las part´ıculas, que son los momentos pµn ; por esta razón escribimos el µν sub´ındice “mec” en Tmec . Veremos más tarde que hay otros tensores de 3

De ahora en adelante omitiremos el sub´ındice “elec” que aparece en (7.11), de modo que la corriente eléctrica se llamar´ a simplemente J ν . As´ı la hemos llamado en cap´ıtulos anteriores.

165

energ´ıa y momentum: para el campo electromagnético, para el campo gravµν itatorio, etc. Esos otros tensores no son de naturaleza mecánica como Tmec . µν De otro lado, la ecuación (7.16) también dice que Tmec es simétrico: µν νµ Tmec (x) = Tmec (x)

(7.17)

0µ Las cuatro componentes Tmec son especialmente importantes: 00 Tmec (x) =

X

En δ 3 (x − xn (t))

(7.18)

n 0a Tmec (x) = c

X

pan δ 3 (x − xn (t))

(7.19)

n 00 (x) es la densidad de energ´ 0a (x) es Estas ecuaciones dicen que Tmec ıa y Tmec µν c veces la densidad de momentum en dirección a. Por esta razón Tmec (x) recibe el nombre de tensor de energ´ıa y momentum.

7.4

µν ∂µ Tmec =0,

µν ∂µ Tmec 6= 0

Es importante que nos detengamos a estudiar lo que ocurrir´ıa si la diverµν gencia de Tmec fuera cero, es decir, si µν µν ∂µ Tmec = Tmec ,µ = 0

(7.20)

Esta ecuación implica que ∂ 0ν ∂ aν T = −c a Tmec ∂t mec ∂x Z Z ∂ ∂ aν 3 0ν 3 Tmec d x = −c T d x ∂t ∂xa mec De acuerdo con el teorema de Gauss, el lado derecho de esta ecuación es igual a un integral en la superficie que cubre al volumen. Pensamos que este volumen es mayor que el volumen ocupado por la nube de part´ıculas, aν y sus derivadas valen cero en la superficie. En estas de manera que Tmec condiciones el lado derecho de la u ´ltima ecuación es cero y 166

d dt

Z 0ν Tmec (x) d3 x = 0

(7.21)

R 0ν 3 O sea que las cuatro cantidades Tmec d x son constantes. En vista de que estas cuatro cantidades son la energ´ıa total y el momentum total, podemos µν afirmar que cuando ∂µ Tmec = 0 se conservan la energ´ıa total y el momentum total de la nube. Acabamos de llegar a una conclusión importante, cual es que las leyes de conservación de momentum y energ´ıa están expresadas en la ecuación µν µν ∂µ Tmec = 0. Pero ¿verdaderamente se cumple la ecuación ∂µ Tmec = 0 en las nubes?, ¿en toda clase de nubes?, ¿en cuáles s´ı y en cuáles no? Para responder estas preguntas vayamos en detalle a los términos que conforman µν µν µ0 µa la divergencia de Tmec . Esta divergencia es ∂ν Tmec = ∂0 Tmec + ∂a Tmec : µν µ0 ∂ν Tmec = ∂0 Tmec +

µ0 = ∂0 Tmec +

∂ X µ dxan (t) 3 δ (x − xn (t)) p (t) ∂xa n n dt X

pµn (t)

dxan (t) ∂ 3 δ (x − xn (t)) dt ∂xa

pµn (t)

∂xan ∂ 3 δ (x − xn (t)) ∂t ∂xan

pµn (t)

∂ 3 δ (x − xn (t)) ∂t

n µ0 = ∂0 Tmec −

X n

µ0 = ∂0 Tmec −

X n

(7.22)

El u ´ltimo término del lado derecho es de la forma p

∂ 3 ∂ ∂p 3 δ = (p δ 3 ) − δ , ∂t ∂t ∂t

o sea que la ecuación (7.22) es µν µ0 ∂ν Tmec = ∂0 Tmec −

X dpµn ∂ X µ 3 pn δ (x − xn (t)) + δ 3 (x − xn (t)) ∂t n dt n

µ0 µ0 = ∂0 Tmec − ∂0 Tmec +

X dpµn n

dt

167

δ 3 (x − xn (t)) ,

es decir: X dpµn δ 3 (x − xn (t)) dt n

µν ∂ν Tmec (x) =

(7.23)

Esta ecuación establece que la energ´ıa y el momentum de la nube se conserP dpµn 3 van si se cumple la condición δ (x − xn ) = 0. Veremos que hay unas n dt nubes que satisfacen esta condición, y otras que no la cumplen. a) Part´ıculas libres. En este caso las part´ıculas no interact´ uan entre s´ı ni con el exterior; como no hay choques, las part´ıculas tienen movimiento recdpµn til´ıneo uniforme, las derivadas son cero, y en consecuencia la fórmula dt µν (7.23) da ∂µ Tmec = 0. Se conservan la energ´ıa y el momentum. b) Choques puntuales. Pensemos ahora que la nube no interact´ ua con el exterior, pero las part´ıculas chocan, interact´ uan en forma instant´ anea: varias part´ıculas coinciden en un evento e intercambian energ´ıa y momentum en un proceso instant´ aneo. Bajo estas condiciones regresamos al lado dpµn difieren de derecho de la ecuación (7.23) y notamos que las derivadas dt cero u ńicamente durante los choques. Denotando por R el punto donde ocurre un choque, la fórmula (7.23) es: µν ∂ν Tmec (x) =

XX R

δ 3 (x − R(t))

n0

dpµn0 dt

Aqu´ı hay una suma sobre todos los choques R, y el ´ındice n0 recorre u ńicamente las part´ıculas que intervienen en el choque en R. µν ∂ν Tmec (x) =

X

δ 3 (x − R(t))

R

La sumatoria

P n0

d X µ p 0 dt 0 n n

pµn0 es el momentum total, sumado, de todas las part´ıculas

que intervienen en la colisión en R. Este momentum es constante, o sea que d X µ µν p 0 es cero. En este caso la ecuación (7.23) es ∂ν Tmec = 0. Se conserdt 0 n n van la energ´ıa y el momentum. 168

c) La nube de part´ıculas cargadas. Para la part´ıcula n-ésima la fuerza de Lorentz (6.33) es: dpµn dτn

Multiplicar ambos lados por

=

qn µ F α (xn )Unα c

=

qn µ dxα F α (xn ) n c dτn

dτn : dt

dpµn qn µ dxα = F α (xn ) n , dt c dt y esto en la ecuación (7.23) da: µν ∂ν Tmec (x) =

X qn n

=

X qn n

=

c c

F µ α (xn ) F µ α (x)

dxαn 3 δ (x − xn (t)) dt

dxαn 3 δ (x − xn (t)) dt

X dxα 1 µ qn n δ 3 (x − xn (t)) F α (x) c dt n

Con (7.11) reconocemos la densidad de corriente eléctrica: µν ∂ν Tmec (x) =

1 µ F α (x)J α (x) c

(7.24)

Los casos a), b) y c) que acabamos de rese˜ nar indican cuáles son las condiµν ciones dinámicas que se deben cumplir para que la divergencia ∂ν Tmec sea µν cero. La clave está en reconocer en qué casos el tensor Tmec se refiere a un sistema f´ısico aislado. En el caso a) la nube está aislada del exterior y del interior: la energ´ıa 169

y el momentum total de la nube se forman exclusivamente con las contribuµν ciones mecánicas. Es decir, Tmec menciona la totalidad de un sistema f´ısico; no puede sorprendernos que se conserven la energ´ıa y el momentum; no µν puede sorprendernos que ∂ν Tmec sea cero. En el caso c) existe el campo electromagnético creado por las mismas part´ıculas cargadas que forman la nube, y este campo tiene energ´ıa y momentum. Hay un sistema total que tiene dos subsistemas: 1) las part´ıculas, que µν tienen una energ´ıa-momentum enteramente mecánica descrita por Tmec y 2) el campo electromagnético. Estos dos subsistemas interact´ uan, intercambian momentum-energ´ıa, o sea que ninguno de los dos conserva energ´ıaµν momentum. El tensor Tmec se refiere apenas a uno de los subsistemas y µν por eso no se espera que ∂ν Tmec sea cero. El sistema total part´ıculas-campo s´ı está aislado del exterior, y portanto la energ´ıa y el momentum totales s´ı se deben conservar. Debe existir otro tensor θµν que de cuenta de la enµν erg´ıa-momentum del campo, de modo que la suma (Tmec + θµν ) exprese la µν totalidad, y en consecuencia tenga divergencia nula: ∂ν (Tmec + θµν ) = 0. El caso c) aclara lo que ocurre cuando entre las part´ıculas de la nube hay interacciones a distancia. Las interacciones a distancia denotan la presencia de un campo, campo que también tiene energ´ıa y momentum. La totalidad part´ıculas-campo debe tener un tensor total de energ´ıa- momentum cuya µν µν divergencia sea nula. Ese tensor total no es Tmec , y por eso ∂ν Tmec 6= 0. Algo muy diferente ocurre en el caso b); all´ı no hay interacciones a distancia, no µν µν hay campo, Tmec s´ı expresa un sistema total y por eso ∂ν Tmec = 0. De regreso al caso c) que nos ocupaba hace un par de párrafos, detengámonos en el tensor energ´ıa-momentum del campo electromagnético. Veremos en la ecuación (8.59) que este tensor es θµν = Tomar la derivada θµν ,ν = =

1 µν 1 µα ν F Fα + η Fαβ F αβ 4π 16π

∂ : ∂xν

1 µα ν 1 µα 1 F Fα ,ν + F ,ν Fα ν + 2η µν Fαβ F αβ ,ν 4π 4π 16π 1 µα ν 1 1 F Fα ,ν + Fαν F µα,ν + Fαβ F αβ ,µ 4π 4π 8π 170

(7.25)

Partir en dos el segundo término del lado derecho: θµν ,ν =

1 µα ν 1 1 1 F Fα ,ν + Fαν F µα,ν + Fαν F µα,ν + Fαβ F αβ ,µ 4π 8π 8π 8π

El tercer término del lado derecho es 1 1 1 1 Fαν F µα,ν = Fβν F µβ ,ν = Fβα F µβ ,α = Fαβ F βµ,α 8π 8π 8π 8π Entonces: θµν ,ν

=

1 µα ν 1 1 1 F Fα ,ν + Fαβ F µα,β + Fαβ F βµ,α + Fαβ F αβ ,µ 4π 8π 8π 8π

=

1 µα ν 1 F Fα ,ν + Fαβ (F µα,β + F βµ,α + F αβ ,µ ) 4π 8π

En el lado derecho de esta ecuación usamos la ecuación de Maxwell (6.32) para obtener: θµν ,ν =

1 µα ν F Fα ,ν 4π

Ahora, ya que F µν = −F νµ la ecuación de Maxwell (6.31) es 4π ν J , c

(7.26)

1 θµν ,ν = − F µα Jα c

(7.27)

F νµ ,µ = − es decir, Fα ν ,ν = −

4π Jα . Entonces c

En este momento sumamos lado a lado las ecuaciones (7.24) y (7.27) para obtener: µν (Tmec + θµν ),ν = 0

171

(7.28)

Más expl´ıcitamente, usando las ecuaciones (7.16) y (7.25): Ã c2

X pµn pν

n

n

En

1 µα ν 1 µν δ 3 (x − xn ) + F Fα + η Fαβ F αβ 4π 16π

! =0 ,ν

µν La ecuación (7.28) dice que la energ´ıa y el momentum contenidos en Tmec + µν θ se conservan.

7.5

La corriente de momentum angular

En las ecuaciones (7.11) y (7.12) definimos las corrientes asociadas a q y pµ . Las part´ıculas también tienen momentum angular L y quisiéramos definir la densidad de corriente que le corresponde. Un primer intento ser´ıa imitar lo de (7.11) y (7.12): X

Ln (t) δ 3 (x − xn (t))

n

dxνn (t) dt

Pero esta cantidad tiene un defecto grave: no es un tensor, porque L no es un tensor. Entonces esta cantidad no puede ser una corriente en un tratamiento covariante. Debemos buscar otra manera de producir una corriente de momentum angular que s´ı sea tensorial. Más espec´ıficamente, buscamos un tensor tal que una de sus componentes sea la densidad de momentum angular en dirección x, otra componente sea la densidad de momentum angular y y otra componente sea la densidad de momentum angular z. Proponemos este tensor: µνδ µν µδ Mmec (x) = Tmec (x)xδ − Tmec (x)xν µ ν ¶ X dxδn ν 3 µ dxn δ = δ (x − xn (t)) pn x − x dt dt n

(7.29) (7.30)

1 032 La densidad de momentum angular en dirección x es Mmec . As´ı mismo, c 1 021 1 013 Mmec es la densidad en dirección y, y Mmec es la densidad del momentum c c angular en dirección z. Estas identificaciones indican que la escogencia (7.29) es adecuada. 172

7.6

Generalizaci´ on

Llegó el momento de abandonar la nube de part´ıculas que tanto nos ha servido para establecer los conceptos de corrientes y conservaciones. De ahora en adelante nos referiremos, en general, a cualquier tensor de energ´ıa y µν momentum T µν (x). Ejemplos concretos de este tensor son Tmec y θµν . El T µν que mencionamos es general, y no tenemos que decidir de antemano si T µν = T νµ o T µν 6= T νµ , ni necesitamos comprometernos con que ∂ν T µν = 0 o ∂ν T µν 6= 0, ni tenemos que decidir desde ya si T µν se refiere a una parte o a la totalidad de un sistema f´ısico. As´ı como en las ecuaciones (7.18) y (7.19), la componente T 00 (x) es la densidad de energ´ıa y T 0a (x) es c veces la densidad de momentum en dirección a. Asociado a la energ´ıa-momentum contenidas en T µν hay un M µνδ que se define en forma similar a (7.29): M µνδ (x) = T µν (x)xδ − T µδ (x)xν

(7.31)

1 La densidad de momentum angular en dirección x es M 032 . As´ı mismo, c 1 013 1 021 M es la densidad en dirección y, y M es la densidad del momenc c µνδ tum angular en dirección z. El tensor M es antisimétrico bajo el intercambio de los ´ındices νδ. Para saber cuántas componentes independientes tiene, analicemos la estructura Aµ B νδ , con B νδ = −B δν . Como B νδ tiene 6 componentes independientes, entonces M µνδ tiene 24 componentes independientes. Leyes de conservaci´ on. La ecuación (7.20) se generaliza as´ı: ∂µ T µν = T µν ,µ = 0

(7.32)

Esta ecuación expresa la conservaci´ on de la energ´ıa y el momentum. Veamos ahora qué ocurrir´ıa si la divergencia de M µνδ fuera cero: ∂µ M µνδ = 0 Esta ecuación dice que ∂0 M 0νδ = −∂a M aνδ , es decir 173

(7.33)

∂ ∂ 0νδ M = −c a M aνδ ∂t ∂x Z Z d ∂ 0νδ 3 M aνδ d3 x M d x = −c dt ∂xa El lado derecho de la u ´ltima ecuación es un integral de volumen; de acuerdo con el teorema de Gauss, es igual a un integral en la superficie que envuelve al volumen. Pensemos que esta superficie cubre completamente al sistema f´ısico, de manera que M aνδ y sus derivadas son, all´ı, cero. Entonces el integral es cero y queda Z d M 0νδ (x)d3 x = 0 (7.34) dt R O sea que lasZ10 cantidades M 0νδ d3 x son constantes del movimiento. En 1 particular, M 032 d3 x , que es el momentum angular total en dirección c x, se conserva. También Z son constantesZlas componentes en dirección y y en 1 1 dirección z, que son M 013 d3 x y M 021 d3 x, respectivamente. c c Lo que acabamos de ver es ya rutina: una divergencia nula corresponde a una ley de conservaci´ on. Lo interesante es aclarar bajo qué condiciones se anula la divergencia de M µνδ , es decir, qué se necesita para que se conserve el momentum angular. Para responder esta pregunta colocamos (7.31) en (7.33): 0 = ∂µ (T µν xδ − T µδ xν ) = (∂µ T µν )xδ − (∂µ T µδ )xν + T µν ηµ δ − T µδ ηµ ν = (∂µ T µν )xδ − (∂µ T µδ )xν + T δν − T νδ

(7.35)

Esta ecuación se cumple si ∂µ T µν = 0 y T δν = T νδ . En conclusión, el momentum angular se conserva cuando se cumplen estas dos condiciones: ∂µ T µν = 0 y T µν = T νµ . Resumen: la ecuación ∂µ T µν = 0 expresa la conservaci´ on de la energ´ıa y el momentum; si T µν = T νµ , la ecuación ∂µ T µν = 0 expresa la conservaci´ on de la energ´ıa, el momentum y el momentum angular. 174

Buscaremos siempre tensores de energ´ıa-momentum que sean simétricos por dos razones: 1) Para que que la ecuación ∂µ T µν = 0 exprese no solamente la conservación de la energ´ıa-momentum, sino también la conservaci´ on del momentum angular. 2) Para que la ecuación del campo gravitatorio no sea inconsistente (véanse los comentarios acerca de la simetr´ıa del tensor energ´ıa-momentum que aparecen en la página 298).

175

176

Cap´ıtulo 8

Din´ amica lagrangiana

Cuando a una part´ıcula se le imponen unas condiciones iniciales, ella sigue cierta trayectoria. Y si, repitiendo el experimento, a la part´ıcula se le imponen de nuevo las mismas condiciones iniciales, ella repite la trayectoria del primer experimento. Es como si la part´ıcula estuviera obligada a seguir esa trayectoria. ¿Qué tiene especial esa trayectoria, qué la distingue? Para responder esta pregunta los f´ısicos han elaborado la idea de trayectorias variadas: otras rutas que la part´ıcula no sigue. Las trayectorias variadas no son rutas verdaderas, sino imaginadas. Del conjunto total formado por la trayectoria verdadera y las imaginadas, la verdadera se distingue por la siguiente caracter´ıstica: en ella se minimiza la acción. En general, todos los sistemas f´ısicos, al evolucionar, toman aquella ruta en la que se minimiza la acción. El presente cap´ıtulo desarrolla estas ideas en una formulaci´ on manifiestamente covariante.

8.1

Teor´ıa lagrangiana para una part´ıcula

Parametrizaci´ on de una curva. Continuamos con la notación habitual, en la que xµ son las coordenadas de un evento cualquiera del espaciotiempo y ηµν dxµ dxν es el intervalo entre dos eventos cercanos. Vamos a estudiar el movimiento de una part´ıcula masiva. Para ganar generalidad suponemos que el movimiento es acelerado, y la part´ıcula libre será un caso particular de nuestro estudio. Pensemos, as´ı como en la la sección 5.7, que la trayectoria total de la part´ıcula está compuesta de muchos fragmentos infinitesimales. Escojamos uno cualquiera de ellos y démonos cuenta de que existe un observador inercial respecto al cual la part´ıcula está aproximadamente en reposo. Un poco de tiempo después, y debido a la aceleración de la part´ıcula, ésta 177

ya no estará en reposo respecto al primer observador inercial, el cual se ha vuelto obsoleto y debe ser substituido por otro observador para el próximo fragmento de trayectoria. Vemos as´ı que diferentes observadores, todos inerciales, se relevan para acompa˜ nar a la part´ıcula en fragmentos infinitesimales sucesivos. Cada uno de los observadores registra un dτ dado por: c dτ =

p ηµν dxµ dxν

en la trayect. de la part´ıcula

(8.1)

R y el tiempo propio se define como τ = dτ . Ya que cada dτ es un invariante, un escalar, concluimos que τ es también un escalar. Llamaremos trayectoria verdadera a la l´ınea en el mundo que verdaderamente sigue la part´ıcula que estamos estudiando. Esta trayectoria es el resultado de las fuerzas que sobre ella operan y de las condiciones iniciales. A cada punto x ¯ de la trayectoria verdadera le corresponde un valor de τ ; en otras palabras, las x ¯µ son funciones del parámetro escalar τ , dependencia que escribimos en la forma habitual x ¯µ = x ¯µ (τ ). Por ejemplo, si en τ = 3.7 las coordenadas de la part´ıcula son (22, 33, 44, 55), podemos escribir x ¯0 (3.7) = 22, x ¯1 (3.7) = 33, x ¯2 (3.7) = 44, x ¯3 (3.7) = 55. Curvas variadas. Pensemos ahora en otra curva imaginaria, diferente a la trayectoria verdadera; esta “trayectoria virtual” se construye punto a punto de la manera siguiente: el punto x ¯µ (τ ) se corre una cantidad δxµ (τ ) , o sea que las coordenadas del nuevo punto serán x ¯µ (τ ) + δxµ (τ ) . Vemos as´ı que todos los puntos de la trayectoria verdadera y todos los puntos de la nueva curva son funciones del mismo parámetro escalar τ . Sean E1 y E2 dos eventos de la trayectoria verdadera, en los cuales el tiempo propio vale τ1 y τ2 , respectivamente. Consideramos curvas virtuales arbitrarias, pero con la condición de que pasen por E1 y E2 . Esto quiere decir que las variaciones δxµ deben ser cero en los extremos E1 y E2 , lo que se escribe δxµ (τ1 ) = δxµ (τ2 ) = 0

(8.2)

El c´ alculo de variaciones. Ahora pensamos que la trayectoria verdadera se distingue de las variadas porque en la primera se minimiza el integral de l´ınea de una función L: 178

Z

τ2

δ

L dτ = 0

en la trayectoria verdadera

(8.3)

τ1

Si L es dada, la condición (8.3) se encarga de determinar cuál es la curva verdadera que pasa por E1 y E2 . Si la curva verdadera es dada, la condición (8.3) se encarga de determinar cuál es la función L. Pasemos a desarrollar (8.3): Z

τ2

0 =

δL dτ

(8.4)

³ ∂L δxα + ∂xα

(8.5)

τ1

Z

∂L dxα ´ δ dτ dxα dτ τ1 ∂ dτ Z τ2 ³ ∂ L dδxα ´ ∂L α dτ = δx + dxα dτ ∂xα τ1 ∂ dτ =

τ2

(8.6)

El u ´ltimo término del lado derecho se integra por partes, as´ı: Z

¯τ2   ¯ Z τ2 ¯ α dδx  ∂L  d ∂L  α α ¯ dτ =  −  δx dτ  α δx ¯ dx ¯ dτ dτ dxα τ1 ¯ ∂ ∂ dτ dτ τ1 

τ2

τ1

∂L dxα ∂ dτ

En esta ecuación el primer término del lado derecho es cero debido a (8.2), y la fórmula (8.6) queda: Z

 τ2

0 = τ1



d ∂L  α  ∂L  α −  δx dτ ∂x dτ dxα ∂ dτ

Finalmente, como esta ecuación debe ser válida para valores arbitrarios de δxα , es necesario que el integrando sea cero: ∂L d ∂L = 0 − α ∂x dτ dxα ∂ dτ 179

(8.7)

Estas son las célebres ecuaciones de Euler y Lagrange. El principio variacional (8.3) se expresa mediante la ecuación diferencial (8.7). En verdad, las ecuaciones de Euler-Lagrange no suelen ser muy u ´tiles en problemas prácticos. La importancia del método lagrangiano radica, primero, en que las (8.7) son invariantes bajo transformaciones generales de coordenadas y, segundo, por el impacto que tienen en amplias áreas de la f´ısica teórica. Usualmente uno conoce la ecuación de la trayectoria verdadera y desea averiguar cuál es la función L adecuada. Se propone tentativamente una L de prueba, y seguidamente se procede a desarrollar las ecuaciones (8.7) correspondientes; si estas ecuaciones coinciden con la ecuación conocida de la trayectoria verdadera, entonces la L de prueba es buena. Debemos tener presente que el cálculo variacional utiliza, en el fondo, los dos primeros términos de una serie de Taylor. En efecto, esto es lo que se entiende al pasar de la ecuación (8.4) a la (8.5). As´ı como en toda serie de Taylor, las derivadas se calculan en el punto de referencia (en la trayectoria verdadera), o sea que la ecuación (8.7) se puede escribir más claramente as´ı: ·

∂L ∂xα



¸ − Verdadera



d  ∂L  = 0   dxα dτ ∂ dτ Verdadera

(8.8)

dxα y τ . Escribimos entonces L = L es en general una función de xα , dτ µ ¶ α dx L xα , , τ . La lagrangiana L y la acción A se definen as´ı: dτ

L =

1 L γ Z τ2

A =

lagrangiana L dτ

Acción

(8.9) (8.10)

τ1

p Aqu´ı, 1/γ = 1 − u2 /c2 , y u es la trivelocidad de la part´ıcula. La acción debe ser un escalar, lo que implica que L también es escalar. Pero la lagrangiana L no es escalar. Hay otra manera de escribir la acción, que se obtiene combinando las ecuaciones (2.14), (8.9) y (8.10): 180

Z

t2

L dt

A =

(8.11)

t1

Part´ıcula libre. Como una aplicación sencilla de la formulaci´ on lagrangiana recién vista, estudiemos el caso de la part´ıcula libre. De acuerdo con la dpα dUα ecuación (6.34) podemos escribir = m0 = 0, o sea que: dτ dτ dUα = 0 dτ

(8.12)

Buscamos una función L tal que su ecuación (8.7) de Euler-Lagrange coincida con (8.12). Proponemos: ¶ r µ α dxµ dxν α dx = ηµν L x , dτ dτ dτ

(8.13)

Para desarrollar las ecuaciones (8.7) procedemos a calcular los términos ∂L d ∂L y : α ∂x dτ dxα ∂ dτ ∂L ∂xα ∂L dxα ∂ dτ

= 0 =

=

(8.14)

· ¸ ∂ dxµ dxν η dxα µν dτ dτ ∂ dτ · ¸ ν 1 dxµ ν µ dx ηµν η α + ηµν η α 2L dτ dτ 1 2L

=

1 dxν 2ηνα 2L dτ

(8.15)

=

1 dxα L dτ

(8.16)

La ecuación (8.8) exige que evaluemos (8.14) y (8.16) en la trayectoria verdadera. Comencemos aclarando cuánto vale L en la trayectoria verdadera. De acuerdo con la ecuación (8.13) podemos escribir 181

"r [ L ]Verdadera =

dxµ dxν ηµν dτ dτ

# Verdadera

De otro lado la ecuación (8.1) dice que "r

dxµ dxν ηµν dτ dτ

# =c Verdadera

Combinando las dos u ´ltimas ecuaciones resulta [ L ]Verdadera = c, y al evaluar (8.16) en la trayectoria verdadera se obtiene: 



· ¸ 1 dxα  ∂L  =  dxα  c dτ Verdadera ∂ dτ Verdadera La ecuación (8.8) da, finalmente, · ¸ 1 d2 xα − = 0 c dτ 2 Verdadera Esta ecuación coincide con (8.12), lo que nos permite concluir que la escogencia (8.13) es apropiada. Con (8.9) se sigue que un lagrangiano para part´ıcula libre es r 1 dxµ dxµ L= (8.17) γ dτ dτ El método lagrangiano no determina un´ıvocamente la función L. Por ejemplo, cualquier m´ ultiplo de (8.17) es también bueno para part´ıcula libre. Pronto usaremos este: r m0 c dxµ dxµ L=− (8.18) γ dτ dτ Part´ıcula en un campo Aµ . Después de estudiar la part´ıcula libre, pasemos al próximo nivel de complejidad estudiando la part´ıcula sometida a una fuerza. Veamos el caso de una part´ıcula de carga q en un campo electromagnético Aµ . Sabemos que la ecuación de movimiento está dada por la fuerza de Lorentz (6.33): 182

q dpα = F αβ Uβ dτ c

(8.19)

Seguiremos la rutina habitual, que consiste en proponer un L. Si su ecuación (8.7) de Euler-Lagrange coincide con (8.19), entonces el L escogido es bueno. El L buscado debe ser (8.18) más un término que exprese la interacci´ on part´ıcula-campo: m0 c L∼− γ

r

dxµ dxµ + término de interacci´ on dτ dτ

La forma prerrelativista L = T − V = T − qφ sugiere que el término de interacción es parecido a −qφ : m0 c L∼− γ

r

dxµ dxµ − qφ , dτ dτ

y en vista de (8.9): r L ∼ −m0 c

dxµ dxµ − qγφ dτ dτ

Ahora, como E = mc2 = γm0 c2 , tenemos γ = φ = A0 , entonces: r L ∼ −m0 c

E p0 . Además = m0 c2 m0 c

q 0 dxµ dxµ − p A0 dτ dτ m0 c

Sin embargo L debe ser un escalar, lo que sugiere que intentemos cambiar p0 A0 por pµ Aµ : r dxµ dxµ q µ L = −m0 c − p Aµ (8.20) dτ dτ m0 c ¿Es este L bueno? Para responder esta pregunta debemos averiguar si la ecuación (8.7) de Euler-Lagrange de este L coincide con (8.19). Veremos enseguida que efectivamente (8.20) es una buena escogencia. Para demostrarlo calculemos todas la derivadas que intervienen en (8.7): 183

q µ ∂L =− p Aµ,α α dx m0 c

∂L ∂ = − m c dxα dxα 0 ∂ ∂ dτ dτ

r

dxµ dxµ q − dτ dτ m0 c

(8.21)

∂ pµ Aµ dxα ∂ dτ

El primer término del lado derecho ya fue calculado en (8.16); escribimos entonces: ∂L dxα ∂ dτ

=

−r

=

−r

=

−r

m0 c dxµ dxµ dτ dτ m0 c dxµ

dxµ dτ dτ m0 c

dxµ

dxµ dτ dτ

dxα q − Aµ dτ c

∂ dxµ dxα dτ ∂ dτ

dxα q − Aµ ηα µ dτ c dxα q − Aα dτ c

(8.22)

Ya podemos colocar (8.21) y (8.22) en (8.7):

−

m c q d q µ d dxα r 0 − Aα = − p Aµ,α µ dτ dx dxµ dτ c dτ m0 c dτ dτ

(8.23)

Recordemos, una vez más, lo que dec´ıamos respecto a la ecuación (8.8): todos los términos en (8.23) deben calcularse en la trayectoria verdadera. Entonces, de acuerdo con la fórmula (8.1), la ra´ız cuadrada que aparece en el lado izquierdo de (8.23) es c: q d d pα + Aα = dτ c dτ dpα q dxµ ∂Aα + dτ c dτ ∂xµ 184

=

q µ p Aµ,α m0 c q µ U Aµ,α c

dxµ De nuevo, la derivada debe evaluarse en la trayectoria verdadera, dando dτ µ dx = U µ: dτ q q dpα + U µ Aα,µ = U µ Aµ,α dτ c c ¢ dpα q¡ q = Aµ,α − Aα,µ U µ = Fαµ U µ , dτ c c que coincide con (8.19). Vemos as´ı que (8.20) es una buena escogencia. Detengámonos un momento para mirar hacia atrás. Primero estudiamos el problema más simple, que es part´ıcula libre; para L propusimos (8.13) y mostramos que, efectivamente, la ecuación de Euler-Lagrange coincide con la ecuación de movimiento (8.12). Después pasamos al siguiente nivel de complejidad, que es la part´ıcula sometida a las fuerzas del campo electromagnético; para L propusimos (8.20) y mostramos que, efectivamente, la ecuación de Euler-Lagrange coincide con la ecuación de movimiento (8.19). En estos dos niveles iniciales hemos podido describir el movimiento de la part´ıcula. Queremos ahora atacar el próximo nivel, que es describir el movimiento del campo; es decir, las ecuaciones de evoluci´ on del campo, que son las ecuaciones de Maxwell. El campo Aµ (x) juega el papel de coordenada generalizada. Como hay infinitos eventos x que forman un continuo, hay también un n´ umero infinito de coordenadas Aµ (x) que forman un continuo. Es necesario que desarrollemos la teor´ıa lagrangiana para coordenadas continuas, asunto que atacaremos enseguida.

8.2

Teor´ıa lagrangiana para coordenadas continuas

La formulación lagrangiana no se reduce al estudio de las trayectorias de las part´ıculas, sino que además se aplica a los campos, que son aquellas cantidades f´ısicas que son funciones continuas del espacio y del tiempo. Llamemos ω(t, r) al campo que queremos estudiar: ésta es una función continua de las coordenadas (t, r) de los eventos del espaciotiempo. Para un r fijo, el campo ω es una función u ńicamente de t, función a la que llamamos “la trayectoria verdadera del campo ω en el punto fijo r”. Al compendiar todos los puntos r del espacio se crea el concepto de “la trayectoria verdadera de ω en todo el 185

espacio”. Alrededor de ésta podemos imaginar variaciones, trayectorias que no ocurren realmente. Pensemos ahora en una porción del espaciotiempo comprendida entre t1 y t2 , y en un volumen V bordeado por una superficie S. Imaginemos trayectorias variadas, con unas variaciones δω(t, r) que cumplen estas condiciones de frontera: δω(t1 , r) = δω(t2 , r) = 0 δω(t, r) = 0

para todo r

(8.24)

en S, para todo t

(8.25)

El lagrangiano L es el integral de volumen de una densidad lagrangiana L: Z L d3 x

L =

(8.26)

V

L = L(ω(x), ∂µ ω(x))

(8.27)

La acción (8.11) es entonces: Z

t2

Z

Z 3

A =

L dt d x = t1

L d4 x

(8.28)

V

El principio de Hamilton dice que δA = 0 en la trayectoria verdadera. En vista de (8.28) escribimos: ZZ 0 =

δL dt d3 x

¶ ∂L ∂L δω + δω,µ dt d3 x = ∂ω ∂ω,µ ¶ ZZ µ ∂L ∂L ∂ δω + δω dt d3 x = ∂ω ∂ω,µ ∂xµ

(8.29)

ZZ µ

En el lado derecho reconocemos que · ¸ ∂L ∂ ∂ ∂L ∂ ∂L δω = δω − δω µ , µ µ ∂ω,µ ∂x ∂x ∂ω,µ ∂x ∂ω,µ 186

(8.30)

o sea que (8.30) es: µ

ZZ δω

∂ ∂L ∂L − µ ∂ω ∂x ∂ω,µ

¶

ZZ 3

dt d x = −

· ¸ ∂ ∂L δω dt d3 x ∂xµ ∂ω,µ

(8.31)

Llamemos LD al lado derecho de esta ecuación. Este lado derecho es una suma de cuatro términos, seg´ un µ recorre los valores 0,1,2,3: Z Z

t2

LD = − V

t1

· ¸ · ¸ Z t2 Z ∂ ∂ ∂L ∂L 3 δω dtd x − δω d3 x dt a ∂ω c ∂t ∂ω,0 ∂x ,a t1 V (8.32)

En el primer término de (8.32) se ejecuta la integraci´ on temporal y (8.24) dice que el resultado es cero. Del mismo modo, en el segundo término de (8.32) se ejecuta la integración espacial y (8.25) dice que el resultado es cero. Vemos as´ı que LD es cero y (8.31) queda: µ

ZZ δω

∂ ∂L ∂L − µ ∂x ∂ω,µ ∂ω

¶ dt d3 x = 0

Como las variaciones δω son arbitrarias, la cantidad entre paréntesis debe ser cero: ∂ ∂L ∂L = ∂xµ ∂ω,µ ∂ω

(8.33)

Esta es la ecuación de Euler-Lagrange para un campo ω. Supongamos que se conoce la ecuación de movimiento de un campo. Para hacer la formulación lagrangiana se comienza proponiendo una L, en base a la cual se desarrolla la ecuación (8.33) de Euler-Lagrange. Si el resultado de ese desarrollo coincide con la ecuación de movimiento del campo, decimos que la escogencia de L fue apropiada. As´ı se hace para formular lagrangianamente una ecuación de movimiento dada. En otras ocasiones se desea construir una teor´ıa que tenga ciertas propiedades y se debe comenzar proponiendo de entrada una L con la simetr´ıa deseada. Aqu´ı hay cierta dosis 187

de libertad; pero al proponer una densidad lagrangiana se debe verificar que la L propuesta sea verdaderamente un escalar1 .

8.3

El tensor energ´ıa-momentum

La formulación lagrangiana conduce a la formulaci´ on hamiltoniana y al tensor energ´ıa-momentum. A continuaci´ on veremos que este tensor surge naturalmente en el estudio de las translaciones en el espaciotiempo. Para tal efecto debemos demostrar primero que bajo una translación infinitesimal δaµ el campo ω y su derivada ∂µ ω sufren unas variaciones dadas por δω = (∂ν ω)δaν y δ∂µ ω = (∂µ ∂ν ω)δaν . El grupo de las translaciones en el espaciotiempo. Sean p1 y p2 dos puntos del espacio xyz, y sea b = p2 − p1 . En estos dos puntos, el campo ω adopta los valores ω(p1 ) y ω(p2 ). Ahora vamos a pensar en una translación activa de un sistema f´ısico aislado: el sistema f´ısico (el campo), se translada una cantidad b, mientras permanecen fijos los ejes coordenados y los puntos p1 y p2 : El valor del campo en p1 antes de la translación es ω(p1 ). El valor del campo en p2 antes de la translación es ω(p2 ). El valor del campo en p2 después de la translación es ω(p1 ). El valor del campo en p2 ha sufrido un cambio: ω(p2 ) → ω(p1 ) = ω(p2 − b).

En general :

ω(r) → ω(r − b) Para una translación infinitesimal b = −δa: ω(r) → ω(r + δa) En este momento hacemos una generalización a cuatro dimensiones. Cuando 1 Ya vimos que A es escalar; adem´ as la ecuaci´ on (5.49) dice que el diferencial de volumen dt d3 x es escalar; la ecuaci´ on (8.28) dice entonces que L es escalar.

188

el sistema f´ısico se translada una cantidad constante −δaµ , el valor del campo en el evento xµ sufre un cambio: ω(xµ ) → ω(xµ + δaµ ) , o sea que δω(x) = ω(xµ + δaµ ) − ω(xµ ) =

∂ω δaν . Más cortamente: ∂xν

δω = (∂ν ω)δaν

(8.34)

Esta es la fórmula que nos propusimos demostrar. Ella dice cómo var´ıa el campo bajo la translación; ahora veamos cómo var´ıa la derivada del campo. Tomar derivada ∂µ en ambos lados de(8.34): ∂µ δω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν δ∂µ ω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν

(8.35)

Como δaν es constante, queda finalmente: δ∂µ ω = (∂µ ∂ν ω)δaν

(8.36)

Concluye as´ı la tarea preliminar que nos hab´ıamos propuesto de calcular las variaciones δω y δ∂µ ω. El tensor can´ onico de energ´ıa y momentum. Enseguida procedemos a calcular la variación δL ocasionada por una translación infinitesimal δaν . Calculamos esta δL de dos maneras. La primera es: δL =

∂L ν δa ∂xν

(8.37)

y la segunda manera es con la regla de la derivaci´ on en cadena: δL =

∂L ∂L δω + δ∂µ ω ∂ω ∂∂µ ω 189

(8.38)

En el primer término del lado derecho utilizar la ecuación (8.33): µ ¶ ∂L ∂L δL = ∂µ δω + δ∂µ ω ∂∂µ ω ∂∂µ ω

Ahora usamos (8.34) y (8.36): ·µ ¶ ¸ ∂L ∂L δL = ∂µ ∂ν ω + ∂µ ∂ν ω δaν ∂∂µ ω ∂∂µ ω µ

¶ ∂L = ∂µ ∂ν ω δaν ∂∂µ ω ¶ µ ∂L ω,ν δaν = ∂µ ∂ω,µ

(8.39)

Igualamos los lados derechos de (8.37) y (8.39): µ ∂µ Es decir:

·

µ ∂µ

¶ ∂L ω,ν δaν = (∂ν L) δaν ∂ω,µ

∂L ω,ν ∂ω,µ

¶

¸ −η

µ

ν ∂µ L

δaν = 0

Ahora, como las δa son arbitrarias, la cantidad entre paréntesis debe ser cero: µ

∂µ

¶ ∂L ω,ν − η µ ν ∂µ L = 0 ∂ω,µ µ ¶ ∂L µ ∂µ ω,ν − η ν L = 0 ∂ω,µ µ ¶ ∂L ,ν µν ∂µ ω −η L = 0 ∂ω,µ 190

(8.40)

La u ´ltima ecuación se escribe µν ∂µ Tcan = 0,

(8.41)

con µν Tcan (x) =

∂L ,ν ω − η µν L ∂ω,µ

(8.42)

Este T µ ν se llama el tensor can´ onico de energ´ıa-momentum, y por esta razón escribimos el sub´ındice “can”. La ecuación (7.21) nos indicó cuáles son las cuatro cantidades que se conservan cuando la divergencia del tensor energ´ıa-momentum es cero. En nuestro caso el tensor canónico también tiene divergencia cero, y en consecuencia las cuatro cantidades conservadas son: Z 0ν Tcan (x) d3 x

Las cuatro cantidades que hay dentro del integrando dan las densidades de energ´ıa y de momentum: ∂L ω˙ − L ∂ ω˙

H =

00 Tcan

→ − P =

→ 1 0a ∂L − Tcan = − ∇ω c ∂ ω˙

=

Aqu´ı, ω˙ = ∂ω/∂t. La conservación de energ´ıa-momentum es consecuencia del aislamiento del sistema. Para un sistema que interact´ ua con el exterior, la L no es como en (8.27), sino L = L(x, ω, ω,µ ). Que L dependa expl´ıcitamente de x agrega algunos términos en las ecuaciones que hemos escrito, y al final, en vez de la ecuación (8.40) resulta: µ ∂µ

¶ ∂L µ ω,ν − η ν L 6= 0 , ∂ω,µ 191

o sea que no hay divergencia nula ni conservaciones. Pero regresemos al sistema aislado, para el cual la divergencia del tensor canónico es cero (se conservan la energ´ıa y el momentum). Tensor sim´ etrico, tensor asim´ etrico. Nótese en la definición (8.42) que los ´ındices µ y ν intervienen disparejamente, o sea que el tensor canónico µν Tcan no es necesariamente simétrico bajo el intercambio de µ y ν. De heµν νµ cho, en algunos problemas ocurre que Tcan = Tcan y en otros ocurre que µν νµ Tcan 6= Tcan . Esto es preocupante ya que, como dec´ıamos en la página 175, necesitamos tensores energ´ıa-momentum que sean simétricos. En aquellos µν νµ µν problemas felices en los que Tcan = Tcan , el Tcan es satisfactorio. Pero si en µν νµ µν alg´ un problema resulta que Tcan 6= Tcan , entonces Tcan es insatisfactorio y se µν µν necesita encontrar otro tensor θ que s´ı sea satisfactorio. El Tcan asimétrico µν debe ser “simetrizado”. Se trata de apoyarse en Tcan para construir otro tensor de energ´ıa-momentum θµν que sea satisfactorio, es decir, que cumpla estas dos condiciones: ∂µ θµν = 0 θµν = θνµ

(8.43)

µν ¿Cómo construir θµν a partir de Tcan ? No hay una regla que sirva para µν todos los casos; pero en un primer intento podemos sumarle a Tcan un nuevo tensor, aun desconocido, que llamamos B µν : µν θµν = Tcan + B µν

(8.44)

Se trata de averiguar el tensor desconocido B µν . Para tal efecto vamos a colocar la θµν de la ecuación (8.44) en las dos ecuaciones (8.43). Al poner µν (8.44) en la primera de las condiciones (8.43) se obtiene ∂µ Tcan + ∂µ B µν = 0 y, en vista de (8.41) concluimos que ∂µ B µν = 0

(8.45)

Ahora, utilizando la ecuación (8.44) en la segunda de las condiciones (8.43) µν νµ llegamos a Tcan + B µν = Tcan + B νµ , es decir: 192

νµ µν B µν − B νµ = Tcan − Tcan

(8.46)

µν En conclusión: cuando Tcan resulta asimétrico, debemos construir un nuevo µν tensor energ´ıa-momentum θ satisfactorio, es decir, un θµν que cumpla las µν condiciones (8.43). Se propone θµν = Tcan + B µν . La incógnita B µν debe cumplir las ecuaciones (8.45) y (8.46). La próxima sección muestra cómo se µν simetriza el Tcan del campo electromagnético.

8.4

Formulaci´ on lagrangiana del campo electromagn´ etico

El campo electromagnético nos ofrece una oportunidad para ilustrar con un ejemplo las ideas que hemos desarrollado acerca de la formulaci´ on lagrangiana de los campos. Comenzamos, como es costumbre, proponiendo una densidad lagrangiana L tal que sus ecuaciones de Euler-Lagrange coincidan con las ecuaciones de movimiento, que en este caso son las cuatro ecuaciones de Maxwell (6.1-6.2). Ya vimos sin embargo, en la página 150, que la definición Fµν = Aν ,µ − Aµ,ν garantiza que las dos ecuaciones homogéneas de Maxwell se satisfagan automáticamente. Entonces la u ńica tarea que debe cumplir L es reproducir a las dos ecuaciones inhomogéneas, condensadamente escritas en la fórmula (6.31). Proponemos: L=−

1 1 Fαβ F αβ − Jα Aα 16π c

(8.47)

Calculemos los términos que intervienen en la ecuación (8.33) de EulerLagrange. El campo es Aσ : ∂L 1 ∂ =− F αβ Fαβ ∂Aσ,µ 16π ∂Aσ,µ µ ∂Fαβ 1 =− F αβ + 16π ∂Aσ,µ µ ∂Fαβ 1 =− F αβ + 16π ∂Aσ,µ =−

1 αβ ∂Fαβ F 8π ∂Aσ,µ 193

∂F αβ Fαβ ∂Aσ,µ

¶

∂Fαβ αβ F ∂Aσ,µ

¶

∂L ∂Aσ,µ

∂L ∂Aσ,µ

= −

1 αβ ∂ F (Aβ ,α − Aα,β ) 8π ∂Aσ,µ

= −

1 αβ σ µ F (η β η α − η σ α η µ β ) 8π

= −

1 (F µσ − F σµ ) 8π

= −

1 µσ F 4π

(8.48)

De otro lado: 1 ∂L = − J σ, ∂Aσ c entonces la ecuación (8.33) de Euler-Lagrange es:

−

1 1 ∂µ F µσ = − J σ , 4π c

(8.49)

que coincide con la ecuación (6.31) que quer´ıamos obtener. Vemos as´ı que (8.47) es una buena densidad lagrangiana. Nos interesa particularmente el campo de radiación en el vac´ıo, donde Jα es cero; en este caso la ecuación (8.47) da L=−

1 Fαβ F αβ : 16π

radiación libre

(8.50)

µν El tensor can´ onico Tcan . Vamos a calcular el tensor canónico de energ´ıamomentum, usando la fórmula (8.42), que en nuestro caso es:

µν Tcan =

∂L Aσ ,ν − η µν L ∂Aσ,µ

(8.51)

En el lado derecho usamos (8.48) y (8.50): µν Tcan =−

1 µν 1 µ σ,ν F σA + η Fαβ F αβ 4π 16π 194

(8.52)

Por las razones que expusimos en la página 175 es importante que invesµν tiguemos si Tcan es simétrico o asimétrico; esto se resuelve calculando la νµ µν diferencia entre Tcan y Tcan : νµ µν Tcan − Tcan =

1 µ σ,ν 1 ν σ,µ F σA − F σA 6= 0 4π 4π

(8.53)

O sea que el tensor canónico es asimétrico. Vamos a remediar este defecto µν a˜ nadiéndole a Tcan una cantidad B µν , como en (8.44). La nueva cantidad debe cumplir las condiciones (8.45) y (8.46). Detengámonos inicialmente en la condición (8.46), que en vista de (8.53) es: B µν − B νµ = = = =

1 µ σ,ν 1 ν σ,µ F σA − F σA (8.54) 4π 4π 1 ν 1 µ F σ (Aσ,ν − Aν ,σ + Aν ,σ ) − F σ (Aσ,µ − Aµ,σ + Aµ,σ ) 4π 4π 1 µ 1 ν F σ (F νσ + Aν ,σ ) − F σ (F µσ + Aµ,σ ) 4π 4π 1 µ ν ,σ 1 ν µ,σ F σA − F σA (8.55) 4π 4π

Esto sugiere que probemos, tentativamente, la siguiente propuesta: B µν

= =

1 µ ν ,σ F σA 4π 1 µσ 1 1 F ∂σ Aν = ∂σ (F µσ Aν ) − (∂σ F µσ )Aν 4π 4π 4π

(8.56)

En el u ´ltimo término del lado derecho usar la ecuación (7.26): B µν =

1 1 ∂σ (F µσ Aν ) + J µ Aν 4π c

(8.57)

1 ∂σ (F µσ Aν ) 4π

(8.58)

y en el vac´ıo se tiene J µ = 0: B µν =

195

Esto es lo que se obtiene al imponer la condición (8.46). Debemos todav´ıa ponerle atención a la condición (8.45). El intento (8.56) es bueno si esa B µν cumple la condición (8.45). Veamos que efectivamente la cumple, aplicando la derivada ∂µ en ambos lados de (8.58):

∂µ B µν =

1 ∂µ ∂σ (F µσ Aν ) 4π

El lado derecho es cero, porque es la contracci´ on total de un tensor simétrico con otro antisimétrico (véase la ecuación (5.38)). Es claro entonces que la escogencia (8.56) es adecuada. Ya estamos en condición de colocar (8.52) y (8.56) en (8.44):

θµν

1 µ σ,ν 1 µν 1 µ ν ,σ F σA + η Fαβ F αβ + F σA 4π 16π 4π 1 µ 1 µν η Fαβ F αβ − F σ (Aσ,ν − Aν ,σ ) 16π 4π 1 µν 1 µ νσ η Fαβ F αβ − F σF 16π 4π

= − = =

He aqu´ı la respuesta final:

θµν

=

1 µσ ν 1 µν η Fαβ F αβ − F F σ 16π 4π

θµ ν

=

1 µ 1 µσ η ν Fαβ F αβ − F Fνσ 16π 4π

En forma matricial, los tensores θµν y θµ ν son: 196

(8.59)



θµν

+ B2)

     (E × B)x      1   = 4π   (E × B)y        (E × B)z  



θµ ν

1 2 2 (E

1 2 2 (E

+ B2)

     (E × B)x      1   = 4π   (E × B)y        (E × B)z  

(E × B)x

(E × B)y

(E × B)z



−Bx By

1 2 (E + B 2 ) 2 −Ey2 − By2

−Ex Ez

−Ey Ez

−Bx Bz

−By Bz

    −Ex Ez   −Bx Bz       −Ey Ez   −By Bz     1 2 2  (E + B )   2  2 2  −Ez − Bz

−(E × B)y

−(E × B)z

1 2 (E + B 2 ) 2 −Ex2 − Bx2 −Ex Ey

−(E × B)x 1 − (E 2 + B 2 ) 2 +Ex2 + Bx2 Ex Ey +Bx By

−Ex Ey −Bx By

Ex Ey +Bx By 1 − (E 2 + B 2 ) 2 +Ey2 + By2

Ex Ez

Ey Ez

+Bx Bz

+By Bz

197



    Ex Ez   +Bx Bz       Ey Ez   +By Bz      1 2 − (E + B 2 )   2  2 2  +Ez + Bz

198

Cap´ıtulo 9

Transformaciones generales de coordenadas Cuando dedujimos las transformaciones de Lorentz nos dimos cuenta de que, si quer´ıamos usar coordenadas cartesianas (t, x, y, z), las ecuaciones deb´ıan ser lineales, y as´ı lo establecimos en la página 21. Para el estudio de la relatividad general es necesario salirse de las ecuaciones lineales y abordar las transformaciones generales de coordenadas. Este cap´ıtulo, que a eso se dedica, pretende dar las bases matemáticas necesarias para la formulaci´ on de la teor´ıa general de la relatividad, de Einstein. Comenzamos definiendo los espacios de Riemann. Decimos que un espacio (con coordenadas xµ ) es riemanniano si se cumplen las siguientes tres condiciones: • Existe una forma fundamental gµν dxµ dxν que es invariante bajo transformaciones generalizadas de coordenadas. • Todas las segundas derivadas de gµν existen y son continuas. • El determinante de gµν no es cero.

9.1

Sub´ındices y super´ındices

La forma fundamental gµν dxµ dxν se llama intervalo, y la denotamos (ds)2 : (ds)2 = gµν dxµ dxν ,

(9.1)

donde los n2 coeficientes gµν son, en general, funciones de las coordenadas xα . Estos coeficientes forman una matriz n×n que es simétrica. Para probar que es simétrica notemos que si en (9.1) intercambiamos los nombres de los ´ındices mudos µ y ν obtenemos (ds)2 = gνµ dxν dxµ = gνµ dxµ dxν . Al 199

comparar esto con (9.1) concluimos que gµν = gνµ . Hay otra matriz muy importante que es la identidad, que denotamos por medio del s´ımbolo δ µ ν . Ahora definimos la matriz g µα como la inversa de gαν : g µα gαν = δ µ ν

(9.2)

A partir de las n cantidades dxν y la matriz gµν definimos otras n cantidades dxµ de la manera siguiente: dxµ = gµν dxν

(9.3)

Ahora, si multiplicamos ambos lados de esta ecuación por g ξµ y utilizamos la ecuación (9.2) encontramos g ξµ dxµ = δ ξ ν dxν , es decir: dxξ = g ξµ dxµ

(9.4)

Las ecuaciones (9.3) y (9.4) indican que g µν sirve para “subir” un sub´ındice y gµν sirve para“bajar” un super´ındice. Los ´ındices se pueden bajar y subir no sólo en dxα y en dxα , sino además en cualquier otra cantidad, como por ejemplo: Cµ = gµν C ν

C µ = g µν Cν

Aα β γ = gνβ Aανγ

Aαβγ = g νβ Aα ν γ

Claramente podemos usar a g µα para subir un ´ındice en gαν , as´ı: g µα gαν = gµν = δµν : gµν = δµν

gµ ν = δµ ν

Cuando un ´ındice aparece una sola vez en un término, decimos que es libre. Por ejemplo, en B µ Cν los ´ındices µ y ν son libres. Si una misma letra aparece dos veces en un término, como super´ındice y como sub´ındice, decimos que se trata de ´ındices contra´ıdos. Por ejemplo, en B µ Cµ los ´ındices µ están contra´ıdos. Si multiplicamos ambos lados de la ecuación Aµ ν = B µ Cν por gµσ obtenemos Aσν = Bσ Cν . As´ı mismo, al multiplicar ambos lados de Aµ ν = B µ Cν 200

por g νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de Aµσ = B µ C σ por gµν se obtiene Aν σ = Bν C σ . En conclusión, todas estas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y Aµ ν = Bµ C ν . Vemos as´ı que dos ´ındices libres e iguales en ambos lados de una ecuación se pueden subir o bajar. Reunamos las formas diferentes que conocemos de escribir la ecuación del intervalo (9.1): (ds)2 = g µν dxµ dxν = gµν dxµ dxν = dxµ dxµ Ejemplo: En el plano podemos usar coordenadas cil´ındricas (r, ϕ) , que llamaremos (x1 , x2 ) . El intervalo es (ds)2 = (dx1 )2 + r2 (dx2 )2 , que escribimos sugestivamente as´ı: (ds)2 = dx1 dx1 + (x1 )2 dx2 dx2 + 0 dx1 dx2 + 0 dx2 dx1

y al comparar esto con (9.1) identificamos las cuatro entradas de la matriz gαβ : " # 1 0 gαβ = (9.5) 0 (x1 )2 Fácilmente calculamos el inverso de esta matriz, y la llamamos g αβ : " g αβ =

1

0

0

¡ ¢2 1/x1

# (9.6)

Finalmente, las componentes (x1 , x2 ) se calculan usando las fórmulas (9.3) y (9.5), para obtener (x1 , (x1 )2 x2 ) = (r, r2 ϕ) La derivada tiene una notación muy compacta:

∂µ =

∂ = gµν ∂ ν ∂xµ

∂µ = 201

∂ = g µν ∂ν ∂xµ

9.2

Transformaciones generales

Hemos dicho que xν son las coordenadas de un punto del espacio en un sistema de coordenadas no primado. Ahora, si se usa otro sistema de coordenadas, el mismo punto tendrá coordenadas x0ν . Cada una de las coordenadas primadas x0µ debe ser función de las no primadas xν : x0µ = x0µ (xν )

(9.7)

¿Son estas funciones lineales o no lineales? Para responder esta pregunta continuemos el ejemplo de la sección anterior, pensando ahora en la transformación que lleva de coordenadas cil´ındricas (r, ϕ) a coordenadas cartesianas (x, y) . Llamando (x1 , x2 ) a las coordenadas cil´ındricas y (x01 , x02 ) a las cartesianas, podemos escribir la transformación entre los dos sistemas coordenados: x01 = x1 cos x2 ;

x02 = x1 sen x2

(9.8)

Notemos que ∂x01 /∂x1 = cos x2 , ∂x01 /∂x2 = −x1 sen x2 , ∂x02 /∂x1 = sen x2 , y ∂x02 /∂x2 = x1 cos x2 . Queremos resaltar un asunto de primera importancia: las derivadas ∂x0µ /∂xν no son constantes, lo que marca una diferencia fundamental con las transformaciones lineales discutidas en la sección 5.2. Este ejemplo pone de presente la importancia de las transformaciones no lineales. Las transformaciones no lineales son interesantes desde un punto de vista matemático, pero también desde un punto de vista f´ısico, asunto que se hace evidente cuando se desea generalizar la relatividad especial, como veremos enseguida: En la relatividad especial se trata de observadores inerciales. Si queremos generalizar esta teor´ıa debemos pensar en la transformación que lleva de un observador inercial a otro observador acelerado. Pensemos en un observador primado que tiene aceleración a en dirección z respecto al no primado; en relatividad galileana y en notación standard, la transformación ser´ıa: 1 z 0 = z − (v0 t + at2 ) , 2 de donde vemos que ∂z 0 /∂t = −v0 − at 6= constante. Esto muestra que a´ un 202

para generalizar la más simple de las relatividades, como es la de Galileo, es preciso utilizar transformaciones no lineales, i.e., aquellas en las que las derivadas ∂x0µ /∂xν no son constantes. Vemos as´ı plenamente justificado este cap´ıtulo, dedicado a las transformaciones generales de coordenadas. En este contexto de las transformaciones generalizadas de coordenadas se definen los vectores:

9.3

Los vectores

Tomando diferenciales en ambos lados de la ecuación (9.7) encontramos dx0µ =

∂x0µ ν dx ∂xν

(9.9)

Una de las piezas más importantes en la teor´ıa de transformaciones generalizadas de coordenadas es el vector dxµ . Entre dos puntos infinitamente próximos la diferencia de coordenadas no primadas es dxµ y la diferencia de coordenadas primadas es dx0µ . Lo importante es que conociendo las componentes no primadas del vector (que son las dxµ ) podemos llegar a conocer las componentes primadas del vector (que son las dx0µ ) por medio de la fórmula (9.9). Pensemos enseguida en un conjunto de cuatro cantidades que en las coordenadas no primadas aparecen como Aµ , mientras que en las coordenadas primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano cuál es la relación entre las A0µ y las Aµ . Pero si ocurre que A0µ =

∂x0µ ν A , ∂xν

(9.10)

entonces decimos que A es un vector. dxµ es, por definición, el vector prototipo. Comparando (9.10) con (9.9) nos damos cuenta de que A transforma como dx , porque en ambas ecua∂x0µ ciones se usan los mismos coeficientes . Decimos que A es un vector ∂xν porque transforma como el vector prototipo (obsérvese que uno no prueba que dx es un vector). El concepto de vector aparece inseparablemente ligado al concepto de las transformaciones de coordenadas. Que A sea un vector 203

no es una propiedad intr´ınseca de A; no podemos decir que A es un vector por s´ı sólo, sino que el carácter vectorial de A es una propiedad que tiene A en referencia a la transformación de coordenadas xµ → x0µ . No cualquier conjunto de n cantidades, aunque se rotulen con ´ındices, es un vector. Invitamos al lector a regresar a la sección 5.2, y en particular al paso que se da entre las ecuaciones (5.14) y (5.15). Ese paso es inv´ alido en las transformaciones generales, o sea que, en vez de las ecuación (5.15), debemos ahora escribir: x0µ 6=

∂x0µ ν x ∂xν

Transf. generales

(9.11)

Comparando las ecuaciones (9.9) y (9.11) nos damos cuenta de que xν no transforma como el vector prototipo dxν . Entonces xν no es un vector bajo el grupo de las transformaciones generales de coordenadas. Aunque s´ı es vector bajo el grupo de las transformaciones lineales. Vemos que un conjunto de n cantidades puede ser vector respecto a un grupo de transformaciones, y no serlo respecto a otro grupo; de esta manera confirmamos la afirmación que hicimos arriba, en el sentido de que el carácter vectorial de una cantidad no es una propiedad exclusiva de esa cantidad, en s´ı misma, sino que además se refiere a un grupo de transformaciones. El vector dx se caracteriza por sus n componentes contravariantes dx0 , dx1 , dx2 , dx3 · ··, pero también se puede caracterizar por sus n componentes covariantes dx0 , dx1 , dx2 , dx3 · · · . La fórmula (9.3) dice cómo se construyen las cantidades dxµ , y también cómo se construyen las cantidades Aµ : Aµ = gµν Aν Decimos entonces que todo vector A se caracteriza por sus n componentes contravariantes A0 , A1 , A2 , A3 · ··, y también se puede caracterizar por sus n componentes covariantes A0 , A1 , A2 , A3 · · · . Transformaci´ on de las componentes Aµ . Hemos visto que las componentes contravariantes Aµ transforman seg´ un (9.10), y debemos averiguar de qué manera transforman las componentes covariantes Aµ . Para tal efecto es preciso deducir antes una identidad importante. Hemos dicho que el intervalo (ds)2 es un escalar, es decir, da lo mismo en todos los sistemas 204

0 dx0 µ dx0 ν . coordenados; entonces la ecuación (9.1) dice que gµν dxµ dxν = gµν Esta ecuación es, obviamente, λ

0 gµν dxµ dxν = gλρ dx0 dx0

ρ

(9.12)

Entonces, utilizando la ecuación (9.9): 0 gµν dxµ dxν = gλρ

∂x0λ ∂x0ρ µ ν dx dx ; ∂xµ ∂xν

reunir todo en el lado izquierdo: µ ¶ 0λ 0ρ 0 ∂x ∂x gµν − gλρ dxµ dxν = 0 ∂xµ ∂xν Como esta ecuación debe ser válida para todos los valores de dxµ , la cantidad dentro del paréntesis debe ser cero: 0 gλρ

∂x0λ ∂x0ρ = gµν ∂xµ ∂xν

(9.13)

Ahora multiplicar ambos lados de esta ecuación por g νπ y utilizar la ecuación (9.2): ∂x0λ νπ 0 ∂x0ρ g gλρ = δµ π ∂xµ ∂xν

(9.14)

De otro lado es claro que, como las coordenadas xπ son independientes, entonces ∂xπ /∂xµ = δµ π . Ahora, la regla de la derivaci´ on en cadena dice que esta ecuación es igual a: ∂x0λ ∂xπ = δµ π ∂xµ ∂x0λ

(9.15)

Igualemos entonces los lados izquierdos de las ecuaciones (9.14) y (9.15): ∂x0λ νπ 0 ∂x0ρ ∂x0λ ∂xπ g g = , λρ ∂xµ ∂xν ∂xµ ∂x0λ 205

y multipliquemos ambos lados de esta ecuación por

∂xµ : ∂x0ω

∂xµ ∂x0λ νπ 0 ∂x0ρ ∂xµ ∂x0λ ∂xπ g g = λρ ∂x0ω ∂xµ ∂xν ∂x0ω ∂xµ ∂x0λ En ambos lados de esta ecuación aparece el factor la derivación en cadena dice que ecuación (9.16) es

(9.16)

∂xµ ∂x0λ ; la regla de ∂x0ω ∂xµ

∂xµ ∂x0λ ∂x0λ = = δω λ , o sea que la ∂x0ω ∂xµ ∂x0ω

0 δω λ g νπ gλρ

∂x0ρ ∂xν

= δω λ

0 g νπ gωρ

∂x0ρ ∂xν

=

∂xπ ∂x0λ

∂xπ ∂x0ω

(9.17)

Esta es la ecuación importante que quer´ıamos deducir. Ahora multiplicar ambos lados por Aπ : 0 gωρ

∂xπ ∂x0ρ ν A = Aπ ∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuación (9.10) para obtener: 0 gωρ A0ρ =

∂xπ Aπ , ∂x0ω

o sea que, finalmente: A0ω =

∂xπ Aπ ∂x0ω

(9.18)

Este es el modo como transforman las componentes covariantes de cualquier vector A . Por supuesto que las componentes dxµ transforman de la misma manera: dx0ω =

∂xπ dxπ ∂x0ω

206

(9.19)

9.4

Otros tensores

Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De acuerdo con la regla de transformación (9.10), las componentes contravariantes de A y B transforman as´ı: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β . Multipliquemos lado a lado estas dos ecuaciones para obtener: ∂x0µ ∂x0ν α β A B ∂xα ∂xβ

A0µ B 0ν =

Comparando con esta fórmula, pasamos a definir lo que es un tensor de rango 2, de este modo: T es un tensor de rango 2 si ∂x0µ ∂x0ν αβ T ∂xα ∂xβ

T 0µν =

(9.20)

Las componentes contravariantes de T transforman como Aµ B ν ; de la misma manera, las componentes covariantes de T transforman como Aµ Bν :

0 Tµν =

∂xα ∂xβ Tαβ , ∂x0µ ∂x0ν

(9.21)

y las componentes mixtas transforman como Aµ Bν : T 0µ ν =

∂x0µ ∂xβ α T β, ∂xα ∂x0ν

(9.22)

∂xα ∂x0ν Tα β ∂x0µ ∂xβ

(9.23)

y como Aµ B ν : T0 µ ν =

Generalizamos diciendo que los tensores de rango j tienen j ´ındices. Los tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se llaman vectores. Algunas de las componentes de un tensor C de rango 3 transforman as´ı: 207

C 0 µνδ =

∂x0µ ∂x0ν ∂x0δ αβγ C ∂xα ∂xβ ∂xγ

C 0 µνδ =

∂xα ∂xβ ∂xγ Cαβγ ∂x0µ ∂x0ν ∂x0δ

C0 µ ν δ =

∂xα ∂x0ν ∂xγ Cα β γ ∂x0µ ∂xβ ∂x0δ

Finalmente, un tensor de rango 4: A0µνσ ρ =

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ A γ ∂xα ∂xβ ∂xλ ∂x0ρ

(9.24)

Las transformaciones inversas: Hasta el momento hemos presentado la manera de averiguar las componentes primadas de un tensor en términos de las no primadas. El camino inverso -las no primadas en términos de las primadas- es muy fácil. Multiplicando ambos lados de la ecuación (9.10) por ∂xα se llega a: ∂x0µ ∂xα 0µ ∂xα ∂x0µ ν ∂xα ν A = A = A = δ α ν Aν = Aα ∂x0µ ∂x0µ ∂xν ∂xν Reescribamos esto: Aµ =

∂xµ 0ν A . ∂x0ν

Aµ =

∂x0ν 0 A ∂xµ ν

As´ı mismo:

Esto para tensores de rango 1. Para los de rango 2: T µν

=

∂xµ ∂xν 0αβ T ∂x0α ∂x0β

Tµν

=

∂x0α ∂x0β 0 T ∂xµ ∂xν αβ

Tµ ν

=

∂xµ ∂x0β 0α T β ∂x0α ∂xν 208

(9.25)

T

µ

ν

∂x0α ∂xν 0 β T ∂xµ ∂x0β α

=

Y los de rango 3: C µνδ =

∂xµ ∂xν ∂xδ 0αβγ C ∂x0α ∂x0β ∂x0γ

C µνδ =

∂x0α ∂x0β ∂x0γ 0 C ∂xµ ∂xν ∂xδ αβγ

Cµνδ =

∂x0α ∂xν ∂x0γ 0 β C γ ∂xµ ∂x0β ∂xδ α

La importancia del vector dxµ : Gran parte de la estructura de los tensores se fundamenta en el vector prototipo dxµ . En efecto: 1) En la ecuación (9.10) hemos definido los vectores, en general, por comparación con dxµ y, 2) en esta sección hemos construido tensores de rangos 0, 2, y 3 a partir de vectores. En general, un tensor de rango j > 0 transforma as´ı como transforma el producto de j vectores. Contracci´ on de ´ındices: Estudiemos la estructura Aµ Bµ , cuando A y B son vectores. Usando las reglas de transformación (9.10) y (9.18) escribimos A0µ B 0 µ =

Ahora,

∂x0µ ∂xβ α A Bβ , ∂xα ∂x0µ

∂x0µ ∂xβ = δα β , entonces ∂xα ∂x0µ A0µ B 0 µ = Aµ Bµ

(9.26)

En palabras, el producto Aµ Bµ es, en general, invariante. El ejemplo más importante es el intervalo dxµ dxµ . Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un tensor de rango 2. En efecto, si hacemos σ = ρ en la ecuación (9.24) obtenemos ∂x0ρ ∂xγ ∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ A . Pero = δλ γ , entonces A0µνρ ρ = γ ∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ 209

A0µνρ ρ =

∂x0µ ∂x0ν αβλ A λ, ∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con la ecuación (9.20). En general, la contracci´ on de dos ´ındices en un tensor de rango j produce un tensor de rango j − 2. δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen∂x0ν zamos escribiendo δµ0 ν = y luego usamos la regla de la derivaci´ on en ∂x0µ cadena: ν

δµ0 =

∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α = = δβ , ∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de acuerdo con ecuación (9.23). El tensor m´ etrico. Al comparar las ecuaciones (9.13) y (9.25) nos damos cuenta de que gµν transforma como un tensor. Esto significa que gµν es un tensor. Se llama el tensor métrico y es de primera importancia porque contiene toda la información acerca de la geometr´ıa del espacio. Tensores sim´ etricos y antisim´ etricos: Con la ecuación (9.20) se prueba fácilmente que si T µν es un tensor simétrico en unas coordenadas, también será simétrico en cualquier otro sistema coordenado. Y si F µν es antisimétrico en unas coordenadas, también será antisimétrico en todos los otros sistemas coordenados:

9.5

T µν = T νµ

⇔

T 0µν = T 0νµ

F µν = −F νµ

⇔

F 0µν = −F 0νµ

(9.27)

La derivada

Veamos la derivada del vector A0µ ; empezamos usando la regla de la derivaci´ on en cadena y luego utilizamos la ecuación (9.10): ∂A0ν ∂x0µ

=

∂xα ∂ A0ν ∂x0µ ∂xα 210

(9.28)

=

∂xα ∂ ∂x0ν β A ∂x0µ ∂xα ∂xβ

=

∂xα ∂x0ν ∂Aβ ∂xα ∂ 2 x0ν + Aβ ∂x0µ ∂xβ ∂xα ∂x0µ ∂xα ∂xβ

(9.29)

Escribamos de nuevo la u ´ltima ecuación con notación ∂µ : ∂µ0 A0ν =

∂xα ∂x0ν ∂xα ∂ 2 x0ν β ∂ A + Aβ α ∂x0µ ∂xβ ∂x0µ ∂xα ∂xβ

(9.30)

Observemos bien el lado derecho de esta ecuación. Si el segundo término fuera cero, quedar´ıa claramente la ley de transformación de los tensores de rango dos, de acuerdo con la ecuación (9.23). Pero en el grupo de las transformaciones generalizadas de coordenadas ese segundo término no es cero, de donde concluimos que la derivada de un vector no es un tensor: En general, la derivada ∂µ no es una operación covariante

(9.31)

Esta regla (9.31) tiene dos excepciones importantes: La primera es cuando el tensor es de rango 0; en este caso ∂µ s´ı es covariante. En efecto, sigamos de nuevo los pasos que llevaron de (9.28) a (9.30), pero esta vez con un escalar φ , para obtener ∂µ φ = ∂µ0 φ0 : La derivada de un escalar s´ı es una operación covariante

(9.32)

La segunda excepción de la regla (9.31) ocurre con las transformaciones lin∂ 2 x0ν eales. Es claro que en este caso las segundas derivadas son cero y, en ∂xα ∂xβ consecuencia el segundo término en el lado derecho de (9.30) es cero, quedando limpiamente la transformación de los tensores de rango 2, de acuerdo con (9.23). La más importante de las transformaciones lineales es la de Lorentz y, tal como se recuerda, all´ı la derivada de un tensor s´ı era un tensor (véase el paso de la ecuación (5.42) a la (5.43)).

211

Existe una notación concisa para la derivada, y es a través de la coma. El uso se aclara con los siguientes ejemplos: Aµ,ν =

∂Aµ ∂xν

A0µ,ν =

∂A0µ ∂x0ν

F αβ ,ν =

∂F αβ ∂xν

Para mostrar que la derivada de un vector no es una operación covariante hemos seguido unos cálculos similares a los de la página 134, y lo hemos hecho as´ı para mostrar el contraste entre las transformaciones lineales y las generales. Pero la falta de covariancia radica en un nivel más profundo: es el diferencial dAµ el que carece de covariancia. Para ver esto en detalle, y corriendo el riesgo de repetir un argumento que se ha presentado ya, usemos de nuevo la regla de la derivaci´ on en cadena para calcular dA0µ , as´ı: dA0µ = Es decir, dA0µ =

∂A0µ 0σ ∂A0µ ∂xν ∂A0µ ν 0σ dx = dx = dx ∂x0σ ∂xν ∂x0σ ∂xν

∂A0µ ν dx : ∂xν

dA0µ = =

∂ (A0µ ) dxν ∂xν µ 0µ ¶ ∂ ∂x π A dxν ∂xν ∂xπ

=

∂ 2 x0µ ∂x0µ ∂Aπ ν π ν A dx + dx ∂xν ∂xπ ∂xπ ∂xν

=

∂ 2 x0µ ∂x0µ π ν A dx + dAπ ∂xν ∂xπ ∂xπ

Si, en el u ´ltimo renglón, las segundas derivadas

∂ 2 x0µ fueran cero, quedar´ıa ∂xν ∂xπ

∂x0µ dA0µ = dAπ , que es la regla de transformación de los vectores: en ∂xµπ tal caso dA ser´ıa un vector. Pero esas segundas derivadas no son cero en las transformaciones generalizadas de coordenadas, y concluimos que en las transformaciones generales el diferencial dAµ no es un vector: en general, el diferencial de un tensor no es un tensor.

212

La derivada es una operación de primera importancia en la f´ısica, como lo muestra el hecho de que las ecuaciones de movimiento son ecuaciones diferenciales. Nosotros quisiéramos escribir esas ecuaciones de modo tensorial, para que sean covariantes. El problema es que la derivada ∂µ y el diferencial d no son operaciones covariantes y, en consecuencia, es preciso que tengamos mucho cuidado cuando queramos utilizarlas. Debemos construir otras operaciones que se parezcan a ∂µ y d, que s´ı sean covariantes: estas nuevas operaciones s´ı pueden ser usadas tranquilamente en las ecuaciones de la f´ısica. En las secciones 9.13 y 10.5 presentaremos esas nuevas operaciones que se parecen a ∂µ y a d, y que s´ı son covariantes.

9.6

Matrices

Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ´ındices, respectivamente, es muy cómoda la notación matricial. Definamos la matriz cuadrada Λµ ν =

∂x0µ ∂xν

(9.33)

Con Λ podemos reescribir las ecuaciones (9.10) y (9.20): A0 µ = Λµ ν Aν F 0 µν

= Λµ α F αβ Λν β = Λµ α F αβ ΛT

β

ν

O más concisamente: A0 µ = Λ Aν F 0 µν

= Λ F αβ ΛT

(9.34) (9.35)

Estamos desarrollando una teor´ıa general que puede aplicarse a transformaciones cuadridimensionales en el espaciotiempo, como las que ocurren en la gravitación einsteiniana. Pero nuestra teor´ıa general de transformaciones también puede usarse para resolver problemas sencillos tridimensionales, que no involucran el tiempo, como son los simples cambios entre coordenadas cartesianas, cil´ındricas, parabólicas, etc. Como ejemplo veamos la transformación de coordenadas cartesianas a esféricas. 213

9.7

Coordenadas esf´ ericas

Antes de ejecutar esta transformación, detengámonos brevemente para recordar un asunto del cálculo vectorial en el triespacio (x, y, z). Un trivector cualquiera V se puede expresar en componentes cartesianas y también en ˆ x Vx + 1 ˆ y Vy + 1 ˆ z Vz y la componentes esféricas. La primera manera es V = 1 ˆ ˆ ˆ segunda es V = 1r Vr + 1θ Vθ + 1ϕ Vϕ . Igualemos estas dos expresiones: ˆ x Vx + 1 ˆ y Vy + 1 ˆ z Vz = 1 ˆ r Vr + 1 ˆ θ Vθ + 1 ˆ ϕ Vϕ 1

(9.36)

ˆx, 1 ˆy , 1 ˆ z ) y (1 ˆr , 1 ˆθ , 1 ˆ ϕ ) son Las relaciones entre los vectores unitarios (1 ˆr = 1 ˆ x sen θ cos ϕ + 1 ˆ y sen θ sen ϕ + 1 ˆ z cos θ 1 ˆθ = 1 ˆ x cos θ cos ϕ + 1 ˆ y cos θ sen ϕ − 1 ˆ z sen θ 1

(9.37)

ˆ ϕ = −1 ˆ x sen ϕ + 1 ˆ y cos ϕ 1 Al colocar estas tres ecuaciones en el lado derecho de la ecuación (9.36) se encuentran las relaciones que existen entre las componentes cartesianas (Vx , Vy , Vz ) y las esféricas (Vr , Vθ , Vϕ ) : Vx = Vr sen θ cos ϕ + Vθ cos θ cos ϕ − Vϕ sen ϕ Vy = Vr sen θ sen ϕ + Vθ cos θ sen ϕ + Vϕ cos ϕ

(9.38)

Vz = Vr cos θ − Vθ sen θ O, en forma equivalente: Vr = Vx sen θ cos ϕ + Vy sen θ sen ϕ + Vz cos θ Vθ = Vx cos θ cos ϕ + Vy cos θ sen ϕ − Vz sen θ

(9.39)

Vϕ = −Vx sen ϕ + Vy cos ϕ Ya estamos en condición de ejecutar la transformación de coordenadas cartesianas a esféricas. Las primeras son (x0 , x1 , x2 , x3 ) = (ct, x, y, z), y las segundas son (x00 , x01 , x02 , x03 ) = (ct, r, θ, ϕ). La transformación es: 214

x00 = x0 p x01 = (x1 )2 + (x2 )2 + (x3 )2 x3 x02 = arc cos p (x1 )2 + (x2 )2 + (x3 )2 x2 x03 = arctan 1 x

(9.40)

Procedemos a calcular las entradas de la matriz Λ, de acuerdo con (9.33), para obtener 

1

0

   0 sen θ cos ϕ    Λ=  0 cos θ cos ϕ  r    sen ϕ 0 − r sen θ

0

0



  sen θ sen ϕ cos θ     cos θ sen ϕ sen θ   − r r     cos ϕ 0 r sen θ

(9.41)

El intervalo (2.1) en coordenadas cartesianas es ds2 = c2 dt2 − dx2 − dy 2 − dz 2

(9.42)

Cartesianas Al comparar esta ecuación con (9.1) identificamos la matrix diagonal gµν = diag (1, −1, −1, −1, −1). La inversa de esta matriz es: µν gCartesianas = diag (1, −1, −1, −1, −1)

(9.43)

Esta es claramente la métrica de Minkowski que utilizamos en el cap´ıtulo 5 de la relatividad especial. Pasamos ahora a calcular el tensor métrico en µν coordenadas esféricas, por medio de la fórmula (9.35), que es gEsf´ ericas = αβ Λ gCartesianas ΛT . Usamos entonces (9.41) y (9.43) para ejecutar el producto de las tres matrices, y obtenemos: µν −2 −2 gEsf´ ericas = diag (1, −1, −r , −(r sen θ) )

215

(9.44)

La matriz inversa de (9.44) es: Esf´ ericas gµν = diag (1, −1, −r2 , −r2 sen2 θ)

(9.45)

Esta fórmula dice que ds2 = dt2 − dr2 − r2 dθ2 − r2 sen2 θ dϕ2 ,

(9.46)

que es el mismo intervalo (9.42), escrito ahora en coordenadas esféricas. Calculemos ahora las componentes de un vector cualquiera en coordenadas esféricas. Tomaremos como ejemplo el vector densidad de la fórmula (6.18), µ que es JCartesianas = (ρc, Jx , Jy , Jz ). Utilizando estas componentes y la matriz Λ en la ecuación (9.34) se obtienen las componentes contravariantes en coordenadas esféricas: 

µ JEsf´ ericas

1

0

   0 sen θ cos ϕ    =  0 cos θ cos ϕ  r    sen ϕ 0 − r sen θ 

0

0



ρc



      sen θ sen ϕ cos θ   J    x      cos θ sen ϕ sen θ     −   r r   Jy        cos ϕ 0 Jz r sen θ ρc

  J sen θ cos ϕ + J sen θ sen ϕ + J cos θ y z  x   =  Jx cos θ cos ϕ Jy cos θ sen ϕ Jz sen θ  + −  r r r   Jx sen ϕ Jy cos ϕ − + r sen θ r sen θ

          

(9.47)

Comparando las tres u ´ltimas filas de (9.47) con las formas generales (9.39), reconocemos las componentes Jr , Jθ y Jϕ , o sea que 216



µ JEsf´ ericas

    =    

ρc Jr Jθ r Jϕ r sen θ

         

(9.48)

Calculemos finalmente el tensor electromagnético en coordenadas esféricas, αβ µν T por medio de la fórmula (9.35), que es FEsf´ ericas = Λ FCartesianas Λ . Usamos entonces (9.41) y (6.30) para ejecutar el producto de las tres matrices. El resultado es una matriz complicada que contiene las seis componentes cartesianas (Ex , Ey , Ez , Bx , By , Bz ). Tal matriz se simplifica considerablemente al expresar esas seis componentes cartesianas en términos de las componentes esféricas, para lo cual utilizamos fórmulas del tipo (9.38). Se llega a: 

µν FEsf´ ericas

9.8

       =      

0

−Er

Er

0

Eθ r

Bϕ r

Eϕ r sen θ

−

Eθ − r −

Bϕ r 0

Bθ r sen θ

Br r2 sen θ

 Eϕ − r sen θ     Bθ  r sen θ     Br  − 2 r sen θ     0

(9.49)

La relatividad especial

Este es un momento oportuno para presentar un ejemplo con transformaciones tetradimensionales. Una de las más sencillas de todas, y no por eso trivial, es la transformación de Lorentz (ct, x, y, z) → (ct0 , x0 , y 0 , z 0 ) que escribimos en las ecuaciones (5.13). La matriz Λ ya fue calculada en (5.47). El tensor métrico en las coordenadas no primadas η µν está dado por la ecuación (9.43). La fórmula (9.35) dice que η 0 µν = Λη αβ ΛT . Ejecutamos el producto de las tres matrices para llegar a 217



η 0 µν

1

  0  =   0  0

0

0

−1

0

0

−1

0

0

0



 0     0   −1

En palabras: la métrica de Minkowski es invariante bajo transformaciones de Lorentz. Esto ya lo hab´ıamos elaborado anteriormente, en particular en los comentarios que siguen a la ecuación (5.21). Por lo general, las componentes de los tensores sufren grandes modificaciones cuando se hace un cambio de unas coordenadas a otro, como puede verse comparando (6.30) con (9.49), o comparando (9.43) con (9.44). Esta regla tiene dos excepciones notables: 1) los escalares, por definición, no cambian bajo ninguna transformación de coordenadas, y 2) la métrica de Minkowski η es invariante bajo las transformaciones de Lorentz.

9.9

Ecuaciones tensoriales

En esta sección veremos algunas propiedades importantes de las ecuaciones entre tensores. a) La más importante es que las ecuaciones tensoriales son automáticamente covariantes, es decir, tienen la misma forma en todos los sistemas coordenados. Para ver esto consideremos por ejemplo la ecuación Aµ ν = B µ Cν

(9.50)

Si A, B y C son tensores, podemos reemplazar Aµ ν = Bµ =

∂xµ ∂x0β 0α A β , ∂x0α ∂xν

∂x0β 0 ∂xµ 0α B y C = C en la ecuación (9.50) para escribir ν ∂x0α ∂xν β ∂xµ ∂x0β 0α 0 ∂xµ ∂x0β 0α A = B Cβ β ∂x0α ∂xν ∂x0α ∂xν

Multiplicar ambos lados de esta ecuación por 218

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν

∂x0σ ∂xµ ∂xν ∂x0β 0α 0 B Cβ ∂xµ ∂x0α ∂x0ρ ∂xν

g σ α g β ρ A0α β = g σ α g β ρ B 0α Cβ0 A0σ ρ = B 0σ Cρ0

(9.51)

Comparando (9.51) con (9.50) nos damos cuenta de que tienen la misma forma: (9.50) es una ecuación covariante porque es la igualdad de dos tensores. Las ecuaciones tensoriales son automáticamente covariantes. b) Supongamos que una ecuación es válida en todos los sistemas coordenados. Pensemos que esta ecuación tiene k elementos (factores o sumandos) y supongamos que k − 1 de ellos son tensores; entonces el otro elemento también tiene que ser tensor. Para mostrar que esto es cierto supongamos que la ecuaciones (9.50) y (9.51) son verdaderas y que A y C son tensores; probaremos que B también es tensor. ∂xµ ∂x0β 0α ∂x0β 0 Reemplazando Aµ ν = A , y C = C en (9.50) escribiν β ∂x0α ∂xν ∂xν β mos: ∂xµ ∂x0β 0α ∂x0β µ 0 A = B Cβ β ∂x0α ∂xν ∂xν Multiplicar ambos lados de esta ecuación por ∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν g σ α g β ρ A0α β = A0σ ρ =

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xν ∂x0β µ 0 B Cβ ∂xµ ∂x0ρ ∂xν ∂x0σ β g ρ B µ Cβ0 ∂xµ ∂x0σ µ 0 B Cρ ∂xµ

Comparando la u ´ltima ecuación con (9.51) vemos que B 0σ =

∂x0σ µ B , ∂xµ 219

que es la forma como transforman los vectores: B es un vector, que es lo que nos propusimos demostrar. c) Hay dos maneras de establecer si un conjunto de n cantidades A0 , A1 , A2 , · · · es un vector. La primera es invocando una ecuación en la que aparezcan esas cantidades, como en la nota b) hace un par de párrafos. La segunda es emp´ıricamente: en las coordenadas xµ se miden las cantidades A0 , A1 , A2 , · · · y en las coordenadas x0µ se miden las cantidades A00 , A01 , A02 , · · ·. Si las cantidades f´ısicamente medidas Aµ y A0µ satisfacen la ecuación (9.34), entonces Aµ es un vector. El mismo pensamiento se aplica para establecer si un conjunto de n2 cantidades es un tensor de rango 2: bien sea invocando una ecuación en la que aparezca el conjunto en cuestión, o de manera emp´ırica usando la condición (9.35). d) Mencionábamos en la página 213 la necesidad de utilizar otras versiones de ∂µ y d que sean covariantes.

9.10

Covariancia general

Podemos pensar que las leyes de la f´ısica se ubican por encima de los sistemas coordenados. Por supuesto que para utilizar numéricamente una ley es necesario erigir antes un sistema coordenado particular, pero podemos pensar que las leyes son, de alguna manera, independientes de los sistemas coordenados. Más concretamente, las leyes deben expresarse por medio de enunciados que sean invariantes bajo el grupo de las transformaciones generalizadas de coordenadas. Este es el Principio de la Covariancia General. Acabamos de ver que las ecuaciones tensoriales son automáticamente covariantes bajo el grupo de las transformaciones generalizadas de coordenadas, lo que nos lleva a concluir que el Principio se satisface si las leyes de la f´ısica se expresan mediante ecuaciones tensoriales. El Principio indica un método y una gu´ıa: al formular una teor´ıa f´ısica se deben buscar ecuaciones tensoriales. Las cantidades f´ısicas deben ser componentes de tensores. Por ejemplo el campo eléctrico hace parte del tensor electromagnético Fµν y la energ´ıa de una part´ıcula hace parte del cuadrivector momentum pµ . Ahora, hemos visto que los tensores de rango j tienen 4j componentes, lo que quiere decir que los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos as´ı que toda cantidad 220

f´ısica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · elementos. Los n´ umeros 1, 4, 16, 64 · · · son muy importantes para la f´ısica, porque indican los u ńicos tama˜ nos que las familias pueden tener: no hay familias de 10, 15, 63 miembros. Supongamos que queremos saber si determinada ecuación tensorial es válida: si la ecuación se cumple en un sistema coordenado, entonces tiene que cumplirse en todos los sistemas de coordenadas. O sea que que para demostrar la validez de una ecuación covariante basta probar que la ecuación

(9.52)

se cumple en un sistema coordenado. Si una ecuación tiene forma covariante y es válida en un sistema coordenado, entonces es válida en

(9.53)

todos los sistemas coordenados.

9.11

El elemento invariante de volumen

La fórmula (9.35) dice que g 0 µν = Λg αβ ΛT . Tomemos determinante en ambos lados de esta ecuación: det g 0 µν = det Λ det g αβ det ΛT = (det Λ)2 det g αβ , es decir:

p | det g 0 µν | | det Λ| = p | det g αβ |

De otro lado, tomando determinante en ambos lados de la ecuación (9.2) 1 vemos que det g αβ = , de donde: det gαβ p | det gαβ | | det Λ| = q 0 | | det gµν 0 . Entonces: Llamar g ≡ det gαβ y g 0 ≡ det gµν

221

p |g| | det Λ| = p |g 0 |

(9.54)

| det Λ| se llama el Jacobiano de la transformación. El Teorema Principal del Cálculo Integral dice que los vol´ umenes n-dimensionales dn x0 y dn x cumplen la condición dn x0 = | det Λ| dn x ; = p

|g 0 | dn x0 =

p |g| n p d x, |g 0 |

usar (9.54): o sea que:

p |g| dn x

(9.55)

p Esto es importante: |g| d4 x es un escalar, y se puede tomar como el elemento diferencial de volumen. Es claro entonces que: Z ·

9.12

¸ · ¸ Alg´ un tensor p Otro tensor |g| d4 x = de rango j de rango j

(9.56)

El s´ımbolo de Christoffel

El s´ımbolo de Christoffel Γµ αβ se define de la manera siguiente: 1 Γµ αβ = g µν (gνα,β + gβν,α − gαβ,ν ) 2

(9.57)

Lo primero que debemos notar es que el s´ımbolo de Christoffel es simétrico bajo el intercambio de los dos sub´ındices: Γµ αβ = Γµ βα . Contemos cuántas componentes independientes tiene Γµ αβ utilizando un argumento similar al que empleamos en la sección 7.5 cuando quer´ıamos calcular el n´ umero de componentes del tensor M αβδ . Para tal efecto comparemos la estructura de Γµ αβ con la estructura de Aµ Bαβ , suponiendo que Bαβ = Bβα . La cantidad Bαβ , como es de dos ´ındices, tiene n2 componentes, pero además es simétrica, entonces sólo tiene n(n + 1)/2 componentes independientes; entonces Aµ Bαβ tiene n2 (n + 1)/2 componentes independientes. As´ı mismo, el s´ımbolo de Christoffel tiene n2 (n + 1)/2 componentes independientes. De otro 222

lado el tensor métrico gµν , por ser simétrico, tiene n(n + 1)/2 componentes independientes, o sea que hay n2 (n + 1)/2 derivadas gµν ,α independientes. Vemos pues que n2 (n+1)/2 es el n´ umero de s´ımbolos Γµ αβ independientes y 2 n (n+1)/2 es el n´ umero de derivadas gαβ,ν independientes. En el fondo estos dos conjuntos son equivalentes: de un lado, (9.57) determina totalmente las derivadas gµν ,α en términos de los s´ımbolos Γ, y de otro lado las ecuaciones (9.65) determinan totalmente los s´ımbolos Γ en términos de las derivadas gµν ,α : los s´ımbolos Γ son como las primeras derivadas del tensor métrico. Si todos los s´ımbolos de Christoffel son cero, entonces todas las primeras derivadas gµν ,α

(9.58)

son cero; y viceversa. El conjunto de los s´ımbolos Γ es como

(9.59)

el conjunto de las primeras derivadas de gµν . Γµ αβ no es un tensor. En notación obvia:

Γµ αβ =

Γ0µ αβ =

=

=

     ν→β ν→α 1 µν  ∂gνα  g + α → ν  −  α → β  , 2 ∂xβ β→α β→ν      ν→β ν→α 0 1 0µν  ∂gνα  g + α → ν  −  α → β  . 2 ∂x0β β→α β→ν µ ¶ ∂ ∂xσ ∂xρ 1 0µν g gσρ + [ ] − [ ] 2 ∂x0β ∂x0ν ∂x0α 1 0µν g 2

µ

∂xσ ∂xρ ∂ gσρ + [ ] − [ ] ∂x0ν ∂x0α ∂x0β

1 + g 0µν gσρ 2

µ

y con primas:

Usar (9.21):

¶

∂ h ∂xσ ∂xρ i +[ ]−[ ] ∂x0β ∂x0ν ∂x0α

¶

Para facilitar los cálculos escribamos este u ´ltimo resultado as´ı: Γ0µ αβ = M + N

(9.60) 223

M

=

N

=

¶ ∂xσ ∂xρ ∂ g + [ ] − [ ] σρ ∂x0ν ∂x0α ∂x0β µ ¶ ∂ h ∂xσ ∂xρ i 1 0µν g gσρ + [ ] − [ ] 2 ∂x0β ∂x0ν ∂x0α

1 0µν g 2

µ

Desarrollemos por separado cada uno de los términos M y N . El término M es 1 M = g 0µν 2

µ

¶ ∂xσ ∂xρ ∂xω gσρ,ω + [ ] − [ ] ∂x0ν ∂x0α ∂x0β

1 ∂x0µ ∂x0ν ξη g gσρ,ω = 2 ∂xξ ∂xη =

µ

∂xσ ∂xρ ∂xω +[ ]−[ ] ∂x0ν ∂x0α ∂x0β

¶

1 ∂x0µ ξη ∂x0ν h ∂xσ ∂xρ ∂xω ∂xσ ∂xρ ∂xω g g + 0β σρ,ω ξ η 0ν 0α 0β 2 ∂x ∂x ∂x ∂x ∂x ∂x ∂x0ν ∂x0α −

∂xσ ∂xρ ∂xω i ∂x0α ∂x0β ∂x0ν

=

h ρ ω σ ∂xω σ ∂xρ i 1 ∂x0µ ξη σ ∂x ∂x ρ ∂x ω ∂x g g g + g − g σρ,ω η η η 2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

=

1 ∂x0µ ξη h ∂xρ ∂xω ∂xσ ∂xω ∂xσ ∂xρ i g g + g − g ηρ,ω ση,ω σρ,η 2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

=

∂x0µ ∂xρ ∂xω 1 ξη g (gηρ,ω + gωη,ρ − gρω,η ) ∂xξ ∂x0α ∂x0β 2

Con (9.57) reconocemos Γξ ρω :

M=

∂x0µ ∂xρ ∂xω ξ Γ ρω ∂xξ ∂x0α ∂x0β

Ahora ataquemos el término N , que es: 224

(9.61)

µh σ ¶ 1 0µν ∂x ∂ 2 xρ ∂xρ ∂ 2 xσ i N = g gσρ + 0α +[ ]−[ ] 2 ∂x0ν ∂x0α ∂x0β ∂x ∂x0β ∂x0ν La operación [ ] − [ ] es un poco tediosa, pero no tiene ninguna dificultad especial. Cuatro términos se cancelan mutuamente y al final se obtiene: N

=

1 0µν ∂xσ ∂ 2 xρ g gσρ 2 2 ∂x0ν ∂x0α ∂x0β

= gσρ g ξη = gσρ g ξη = gσρ g ξη =

∂x0µ ∂x0ν ∂xσ ∂ 2 xρ ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β µ ¶ ∂x0µ ∂x0ν ∂xσ ∂ 2 xρ ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β ∂x0µ ∂ 2 xρ σ (g ) η ∂xξ ∂x0α ∂x0β

∂x0µ ∂ 2 xρ ∂xρ ∂x0α ∂x0β

(9.62)

Al colocar (9.61) y (9.62) en (9.60) llegamos finalmente a: Γ0µ αβ =

∂x0µ ∂xρ ∂xω ξ ∂x0µ ∂ 2 xρ Γ + ρω ∂xξ ∂x0α ∂x0β ∂xρ ∂x0α ∂x0β

(9.63)

Nos será u ´til una versión de Γ0µ αβ ligeramente diferente de (9.63), que se obtiene muy fácilmente. Es claro que ∂x0µ /∂x0 α = gα µ = δα µ ; como esto es una constante, sus derivadas son cero: 0=

∂ ∂x0µ ∂ ∂x0µ ∂xρ ∂x0µ ∂ 2 xρ ∂xρ ∂ ∂x0µ = = + ∂x0β ∂x0α ∂x0β ∂xρ ∂x0α ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xρ

Aislar el primer término del lado derecho: ∂xν ∂ ∂x0µ ∂xν ∂xσ ∂ 2 x0µ ∂x0µ ∂ 2 xρ = − = − ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xν ∂x0α ∂x0β ∂xν ∂xσ Entonces (9.63) se convierte en 225

Γ0µ αβ =

∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ Γ − στ ∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν

(9.64)

Si el segundo término del lado derecho fuera cero, tendr´ıamos la ley de transformación de un tensor de rango tres con un ´ındice contravariante y dos covariantes. Pero, en general, el segundo término del lado derecho de (9.64) no es cero: El s´ımbolo de Christoffel Γµ αβ no es un tensor1 . Es oportuno hacer un comentario acerca de la notación. Al escribir las componentes de los tensores hemos sido muy cuidadosos de no poner un super´ındice encima de un sub´ındice; por ejemplo, nunca hemos escrito Tαµ . Siguiendo esta costumbre, hemos escrito Γµ αβ aunque Γ no es un tensor. Debemos aclarar, sin embargo, que en la mayor´ıa de los libros aparece Γµαβ . Esta escritura Γµαβ no debe causar confusión. De otro lado, en algunas escasas ocasiones es preciso usar las cantidades Γµαβ , las cuales se deben entender como el resultado de multiplicar a gµξ por Γξ αβ . Se define entonces Γµαβ ≡ gµξ Γξ αβ . Hay dos identidades u ´tiles que se prueban con facilidad a partir de la definición (9.57):

9.13

gαβ , γ

= Γαβγ + Γβαγ

(9.65)

g αβ

= −g µβ Γα µγ − g µα Γβ µγ

(9.66)

,γ

La derivada covariante

Dec´ıamos en la página 213 que necesitamos una operación derivada que tenga carácter tensorial, es decir, que al actuar sobre un tensor produzca un tensor. El propósito de esta sección es construir esta derivada tensorial. Aunque Γµ αβ no es un tensor, s´ı sirve para construir la derivada covariante que necesitamos. Comencemos escribiendo: ∂A0µ + Γ0µ αβ A0α = V + W , ∂x0β donde V =

(9.67)

∂A0µ y W = Γ0µ αβ A0α . Desarrollemos el término V utilizando ∂x0β

1

Sin embargo Γµ αβ s´ı es un tensor bajo el subgrupo de las transformaciones lineales, ∂ 2 x0µ son cero y entonces también es cero el u ´ltimo pues en éstas las segundas derivadas ∂xσ ∂xν término del lado derecho de (9.64).

226

la regla de la derivación en cadena: V

=

∂xρ ∂ A0µ ; ∂x0β ∂xρ

=

∂xρ ∂x0µ ∂Aσ ∂xρ ∂ 2 x0µ σ ∂xρ ∂ ∂x0µ σ A = + A (9.68) ∂x0β ∂xρ ∂xσ ∂x0β ∂xσ ∂xρ ∂x0β ∂xρ ∂xσ

utilizar (9.10):

Pasemos a desarrollar el término W usando la ecuación (9.10): W = Γ0µ αβ A0α = Γ0µ αβ

∂x0α ξ A ∂xξ

Ahora utilizar la ecuación (9.64): µ W

= µ =

=

∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ Γ − στ ∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν σ ∂ 2 x0µ ∂x0µ σ ∂xτ ν ν ∂x g Γ − g στ ξ ξ ∂xν ∂x0β ∂x0β ∂xσ ∂xν

¶

∂x0α ξ A ∂xξ

¶ Aξ

∂x0µ ∂xτ ν ∂xσ ∂ 2 x0µ ν σ Γ A − A στ ∂xν ∂x0β ∂x0β ∂xσ ∂xν

(9.69)

Ya estamos en condición de poner (9.68) y (9.69) en (9.67) para obtener finalmente: · ¸ ∂A0µ ∂x0µ ∂xρ ∂Aν 0µ 0α ν σ + Γ αβ A = + Γ σρ A ∂x0β ∂xν ∂x0β ∂xρ Pero este es, seg´ un la regla (9.22), el modo como transforman los tensores de rango 2. En conclusión, ∂Aν + Γν ρσ Aσ ∂xρ

(9.70)

es un tensor de rango 2. Es muy importante, y se llama Derivada Covariante. ∂Aν Aunque y Γν ρσ Aσ no son tensores, la derivada covariante s´ı lo es. ∂xσ 227

Aµ ; β = Aµ , β + Γµ βα Aα

(9.71)

Aqu´ı estamos usando una notación muy cómoda: la coma quiere decir derivada corriente y el punto y coma quiere decir derivada covariante. La expresión (9.71) es la derivada covariante de un vector contravariante. Para las componentes covariantes se escoge: Aµ ; β = Aµ ,β − Γα µβ Aα

(9.72)

Hemos probado que las componentes Aµ ; β transforman como un tensor de segundo rango. De manera independiente se puede probar que las Aµ ; β también transforman como un tensor de rango 2. Acabamos de ver que la derivada covariante de un vector es un tensor de rango 2. En general, la derivada covariante de un tensor de rango j es un tensor de rango j + 1 . La derivada covariante de tensores de rango mayor que 0 introduce un s´ımbolo de Christoffel por cada ´ındice: F µν ; β = F µν , β + Γµ βα F αν + Γν βα F µα

(9.73)

Fµν ; β = Fµν , β − Γα µβ Fαν − Γα νβ Fµα

(9.74)

F µν σ ; β = F µν σ , β + Γµ βτ F τ ν σ + Γν βτ F µτ σ − Γτ σβ F µν τ Esta es la regla para tomar la derivada covariante de tensores de rango mayor que 0, pero ¿qué hacer para tomar la derivada covariante de un escalar? Para resolver esta dificultad recordemos el enunciado (9.32), seg´ un el cual la derivada corriente de un escalar es una operación covariante; no hay motivo de preocupación, y podemos definir la derivada covariante de un escalar como su derivada corriente: φ; α = φ, α En conclusión, la derivada covariante convierte tensores en tensores, y por eso es buena para las ecuaciones tensoriales, de acuerdo con la necesidad que mencionábamos en la página 213 de utilizar operaciones covariantes. La ecuación (9.73) dice que 228

(C µ Dν ) ; β = C µ ; β Dν + C µ Dν ; β

(9.75)

o sea que la derivada covariante cumple la regla usual de la derivada del producto de dos factores. En general la derivada covariante se maneja con tranquilidad, con soltura, debido a la propiedad (9.75). La u ńica advertencia, muy importante, es que, a diferencia de las derivadas simples, las derivadas covariantes no conmutan: Aα ; ν ; µ = (Aα ; ν ) ; µ = (Aα ; ν ) , µ + Γα τ µ Aτ ; ν − Γτ νµ Aα ; τ = (Aα , ν + Γα τ ν Aτ ), µ + Γα τ µ (Aτ , ν + Γτ βν Aβ ) − Γτ νµ Aα ; τ Para Aα ; µ ; ν basta intercambiar los ´ındices ν y µ. El conmutador es: Aα ; µ ; ν − Aα ; ν ; µ = Rα βµν Aβ ,

(9.76)

donde Rα βµν = Γα βµ , ν − Γα βν , µ − Γσ βν Γα σµ + Γσ βµ Γα σν

(9.77)

As´ı mismo: Aα ; µ ; ν − Aα ; ν ; µ = −Rβ αµν Aβ

(9.78)

Antes de concluir esta sección presentamos una identidad importante: gµν ; α = 0,

g µν

;α

= 0

(9.79)

En palabras, la derivada covariante del tensor métrico es cero. Esta identidad se prueba fácilmente a partir de las ecuaciones (9.73) y (9.74). 229

9.14

El tensor de Riemann

Detengámonos un momento en la ecuación (9.78): Debido a que las cantidades Aµ ; α ; β , Aµ ; β ; α y Aν son tensores, podemos afirmar que Rν µαβ también es un tensor: se llama tensor de Riemann. Que éste sea un tensor significa que bajo una transformación general de coordenadas xµ → x0µ ocurre lo siguiente: R0 αβµν =

∂x0α ∂x0β ∂x0µ ∂x0ν ρσπδ R ∂xρ ∂xσ ∂xπ ∂xδ

(9.80)

El tensor de Riemann, por su origen en las ecuaciones (9.76) y (9.78), expresa la no conmutatividad de las derivadas covariantes. Una contracci´ on de ´ındices produce el tensor de Ricci Rβµ , y con otra contracci´ on se obtiene el escalar de curvatura R: Rβµ ≡ Rα βµα = Rµβ R ≡ Rµ µ

(9.81) (9.82)

Los tensores (9.77),(9.81) y (9.82) satisfacen cinco ecuaciones: tres algebraicas y dos diferenciales: Rλµνκ = Rνκλµ

(9.83)

Rλµνκ = −Rµλνκ = −Rλµκν = Rµλκν

(9.84)

Rλµνκ + Rλκµν + Rλνκµ = 0

(9.85)

Rα βµν ; σ + Rα βσµ ;ν + Rα βνσ ; µ = 0

(9.86)

1 (Rµ ν − g µ ν R); µ = 0 2

(9.87)

Nos disponemos a probar la validez de las identidades algebraicas (9.83), (9.84) y (9.85). Para tal efecto debemos bajar el ´ındice contravariante de Rα βµν , lo que se logra multiplicando ambos lados de la ecuación (9.77) por gλα : Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − gλσ Γσ µκ , ν − gλη Γσ µκ Γη σν 230

(9.88)

En el lado derecho de esta ecuación los dos u ´ltimos términos se obtienen intercambiando los ´ındices κ y ν en los dos primeros términos: Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − (ν κ)

(9.89)

Desarrollemos el primer término del lado derecho de esta ecuación: £ ¡ ¢¤ 1 gλσ Γσ µν , κ = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ 2 ¡ ¢ 1 = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ 2 ¢ 1¡ gηµ , ν + gνη , µ − gµν , η gλσ g ση , κ + 2 Ahora, con (9.66) se prueba fácilmente que gλσ g ση , κ = −g ση (gλξ Γξ σκ + gσξ Γξ λκ ). Entonces: ¢ ¡ 1 gλσ Γσ µν , κ = gλ η gηµ , ν + gνη , µ − gµν , η , κ 2 ¢ ¡ 1 − g ση gηµ , ν + gνη , µ − gµν , η (gλξ Γξ σκ + gσξ Γξ λκ ) 2 ¢ 1 η¡ = gλ gηµ , ν + gνη , µ − gµν , η , κ − Γσ µν (gλξ Γξ σκ + gσξ Γξ λκ ) 2 ¢ 1 η¡ = gλ gηµ , ν + gνη , µ − gµν , η , κ − gσξ Γξ λκ Γσ µν − gλξ Γσ µν Γξ σκ 2 Nótese que el u ´ltimo término del lado derecho cancela exactamente al segundo término de la ecuación (9.89). Entonces (9.89) queda finalmente as´ı: Rλµνκ =

1 (gνλ , µ , κ − gκλ , µ , ν − gµν , λ , κ + gµκ , λ , ν ) 2 σ

+ gσξ (Γ

ξ

µκ Γ λν

−Γ

σ

(9.90)

ξ

µν Γ λκ )

Por inspección, es clara la validez de las ecuaciones (9.83) y (9.84). También es clara la validez de la ecuación (9.85). Vemos as´ı que las ecuaciones (9.83), (9.84) y (9.85) son correctas. (9.83) y (9.84). Luego, en la sección 9.17, tendremos ocasión de probar la validez de las otras dos identidades (9.86) y (9.87). 231

La ecuaci´ on (9.85): En la ecuación (9.85) vamos a hacer ν = µ (no sumar ´ındices repetidos): Rλµµκ + Rλκµµ + Rλµκµ = 0

(9.91)

El segundo término de esta ecuación es cero (debido a (9.84)) y la suma del primero y el tercero da cero (debido a (9.84)). Vemos as´ı que (9.91) no aporta nada nuevo. Se puede verificar, en general, que cuando en (9.85) hay dos ´ındices repetidos se obtiene una ecuación que redunda con (9.83) y (9.84). En conclusión, la ecuación (9.85) suministra información nueva cuando los cuatro ´ındices toman valores diferentes. Por ejemplo, para un espacio de dimensión 4 la u ńica información novedosa contenida en (9.85) es: R0123 + R0312 + R0231 = 0

(9.92)

Rαβµν tiene n2 (n2 −1)/12 componentes independientes. En un espacio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes independientes. No probaremos esto en general, pero s´ı lo verificaremos en el caso particular n = 4. En seguida vamos a comprobar que en una geometr´ıa de dimensión 4 el tensor de Riemann tiene 20 componentes independientes. Como Rαβµν tiene cuatro ´ındices, y cada ´ındice adopta cuatro valores, Rαβµν tiene 44 = 256 componentes. Demostremos que las fórmulas (9.84) reducen a 36 el n´ umero de componentes independientes. En Rαβµν la pareja αβ es antisimétrica, o sea que hay sólo 6 parejas αβ independientes; escogemos estas seis: αβ : 010203121323 As´ı mismo hay sólo seis parejas µν independientes. Escogemos: µν : 010203121323

Escribamos estas 36 componentes de Rαβµν que son, hasta el momento, independientes: 232

R0101 R0201 R0301 R1201 R1301 R2301

R0102 R0202 R0302 R1202 R1302 R2302

R0103 R0203 R0303 R1203 R1303 R2303

R0112 R0212 R0312 R1212 R1312 R2312

R0113 R0213 R0313 R1213 R1313 R2313

R0123 R0223 R0323 R1223 R1323 R2323

Ahora, la ecuación (9.84) dice que este arreglo cuadrado, o matriz, es simétrico. Una matriz 6 × 6 simétrica sólo tiene 21 entradas independientes (por ejemplo, las de la diagonal y las que se encuentran por encima de ésta). Finalmente, la ecuación (9.92) reduce a 20 el n´ umero de componentes independientes. Hemos verificado, en el caso particular n=4, que en un espacio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes independientes.

9.15

Plano y curvo

Decimos que un espacio es plano en un punto dado, si en ese punto el tensor de Riemann vale cero; es decir, si todas las componentes del tensor de Riemann son cero. Decimos que un espacio es curvo si no es plano: un espacio es curvo en un punto dado, si en ese punto el tensor de Riemann no es cero; es decir, si al menos una de las componentes del tensor de Riemann difiere de cero. Ejemplo. Consideremos una geometr´ıa en tres dimensiones, con un intervalo ds2 = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 . El tensor métrico es 

1

0

0



  2  0 g [3] µν =   0 r  2 2 0 0 r sen θ Para esta geometr´ıa todas las componentes del tensor de Riemann son cero, o sea que el espacio es plano. El diferencial de longitud es la ra´ız cuadrada del intervalo: p ds = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta 233

circunferencia tienen θ = π/2, dθ = 0, r = a, dr = 0. A lo largo de la circunferencia el elemento R Rde longitud es ds = adϕ, y la longitud total de la circunferencia es ds = a dϕ = 2πa. Ahora calculemos el radio. La l´ınea radial pasa por el centro y tiene θ = π/2, dθ = dϕ = 0, y la R de coordenadas R longitud del radio es ds = dr = a. Al dividir circunferencia sobre radio se obtiene 2πa/a = 2π, que es el mismo resultado de la geometr´ıa euclidiana. Inmersos en este espacio tridimensional plano puede haber subespacios bidimensionales curvos, como el que estudiaremos enseguida. Consideremos un espacio bidimensional con intervalo ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . Para esta geometr´ıa el tensor métrico es " g

[2]

µν

=

a2

0

0

a2 sen2 θ

# (9.93)

El tensor de Riemann tiene una componente que difiere de cero: R[2] 1212 = a2 sen2 θ; por esta razón podemos afirmar que el espacio bidimensional es curvo. El diferencial de longitud es la ra´ız cuadrada del intervalo: ds =

p a2 dθ2 + a2 sen2 θ dϕ2

Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta circunferencia tienen θ = π/2, dθ = 0. A lo largo de la circunferencia el elemento deR longitud es ds = adϕ, y la longitud total de la circunferencia R es ds = a dϕ = 2πa. Ahora calculemos el radio. La l´ınea radial pasa por el polo norte o por el polo sur, o sea que la longitud del radio es la cuarta parte de la longitud de la circunferencia, es decir πa/2. Al dividir circunferencia sobre radio se obtiene 2πa/(πa/2) = 4, que es diferente al resultado de la geometr´ıa euclidiana. Cuando, al estudiar un espacio, descubrimos que se puede trazar un c´ırculo tal que el cociente de circunferencia sobre radio no es 2π, podemos asegurar que el espacio no es euclidiano y que es curvo. Terminado este ejemplo, regresemos a las consideraciones generales sobre curvatura en un espacio de Riemann. Rαβ y R no son indicadores de curvatura; el u ńico indicador de curvatura es Rα βµν . Pensemos en un espacio curvo; aunque algunas componentes Rα βµν sean diferentes de cero, puede ocurrir que todas las Rαβ sean cero y, en consecuencia, R también sea cero: en este caso, aunque el tensor de Ricci y el escalar de curvatura sean cero, es espacio es curvo: 234

R = 0 ; espacio plano Todas las Rαβ = 0 ; espacio plano

(9.94)

Todas las Rα βµν = 0 ⇒ espacio plano R 6= 0 ⇒ espacio curvo Alguna Rαβ 6= 0 ⇒ espacio curvo Alguna R

α

βµν

(9.95)

6= 0 ⇒ espacio curvo

La curvatura es una propiedad intr´ınseca de un espacio. Con la palabra intr´ınseca queremos decir que la curvatura no depende de cuál es el sistema de coordenadas usado. Si el tensor de Riemann es cero en unas coordenadas, será cero en todos los sistemas coordenados; es decir, si un espacio aparece plano en unas coordenadas, aparecerá plano en todos los sistemas coordenados: un espacio plano no se puede curvar con ning´ un cambio de coordenadas. Un espacio curvo no se puede aplanar con ning´ un cambio de coordenadas. La curvatura es una propiedad local. El tensor de Riemann es un campo, es decir, una cantidad que cambia de punto a punto del espacio. As´ı mismo, la curvatura es una propiedad local. Un espacio puede ser curvo en unos puntos y plano en otros. En varias secciones de este libro nos dedicaremos a estudiar una propiedad importante que tienen los espacios de Riemann, curvos o planos. Se escoge un punto cualquiera E. Se puede adaptar un sistema de coordenadas de manera que el tensor métrico, al evaluarse en E, sea diag(±1, ±1, ±1, · · ·). Más aun, podremos escoger estas coordenadas de modo que todas las primeras derivadas del tensor métrico, al evaluarse en E, den cero: gµν (E) = diag(±1, ±1, ±1, · · ·), gµν ,α (E) = 0. En vista del enunciado (9.59), podemos decir que gµν (E) = diag(±1, ±1, ±1, · · ·),

Γα µν (E) = 0

(9.96)

Al escribir (E) estamos enfatizando que las condiciones (9.96) se cumplen u ńicamente en el punto E escogido. En general, en otros puntos del espacio, el tensor métrico no será diag(±1, ±1, ±1, · · ·) ni los s´ımbolos de Christoffel serán cero. Demostraremos que (9.96) es posible en todos los casos: si en el punto E el espacio es curvo, o si es plano. La demostración no es dif´ıcil, pero s´ı es larga, y nos tomará las secciones 9.16, 9.20, 9.21 y 11.3. 235

9.16

Coordenadas adaptadas

Teorema. Es posible [13] erigir un sistema adaptado de coordenadas tal que, en alg´ un punto E del espaciotiempo, todos los s´ımbolos de Christoffel valgan cero. Sea xµ un sistema general, cualquiera, de coordenadas, sin ninguna restricción, y sea E un evento cualquiera. Vamos a construir en E un sistema de coordenadas adaptadas, que llamaremos x ˜µ , y que tiene la siguiente peculiaridad: en las coordenadas x ˜µ , todos los s´ımbolos de Christoffel valen cero cuando se eval´ uan en E. Para demostrar el teorema propondremos un cambio de coordenadas xµ → x ˜µ y enseguida demostraremos que en las nuevas ˜ dan cero cuando se les eval´ coordenadas los s´ımbolos Γ ua en E. Empecemos pues proponiendo este cambio de coordenadas: x ˜µ = (xµ − xµE ) +

1 µ Γ αβ (xα − xαE )(xβ − xβE ) 2

(9.97)

Debemos ahora transformar los s´ımbolos de Christoffel a las nuevas coordenadas x ˜µ , para lo cual utilizamos la fórmula (9.64): ˜µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x ˜µ ˜ µ αβ = ∂ x Γ Γ − στ ∂xν ∂ x ˜α ∂ x ˜β ∂x ˜α ∂ x ˜β ∂xσ ∂xν

(9.98)

Para desarollar esta fórmula se toma la derivada en ambos lados de la ecuación (9.97): 1 ∂x ˜µ = gν µ + Γµ αβ , ν (xα − xαE )(xβ − xβE ) + Γµ αβ (xα − xαE )gν β ν ∂x 2 2 µ ∂ x ˜ 1 = Γµ αβ , ν , σ (xα − xαE )(xβ − xβE ) + Γµ αβ , ν (xα − xαE )gσ β σ ν ∂x ∂x 2 + Γµ αν , σ (xα − xαE ) + Γµ αν gσ α Ya que debemos evaluar estas derivadas en E, hacemos xα = xαE : ¯ ∂x ˜µ ¯¯ = gν µ ∂xν ¯E

¯ ∂2x ˜µ ¯¯ = Γµ σν |E ∂xσ ∂xν ¯E 236

(9.99)

¯ ¯ µ ˜ Cuando ponemos estos valores en (9.98) se obtiene Γ αβ ¯ = 0, que es lo E que quer´ıamos demostrar. Veamos cómo transforman las componentes de los tensores cuando se hace el cambio de coordenadas xµ → x ˜µ . Tomemos un tensor cualquiera (llamarµν lo T , por ejemplo); de acuerdo con la regla general de transformaciones (9.20) podemos escribir ∂x ˜µ ∂ x ˜ν αβ T˜µν = T ∂xα ∂xβ Esta fórmula dice que en un punto cualquiera, arbitrario, del espacio, T˜µν no es igual a T µν . Pero en el punto E las derivadas son deltas de Kronecker, seg´ un (9.99), y en consecuencia T˜Eµν = g µ α g ν β TEαβ = TEµν . En palabras: en el punto E, las componentes de los tensores en coordenadas xµ son iguales a las componentes en coordenadas x ˜µ . Como casos particulares de este resultado general mencionemos el tensor métrico y el tensor de Riemann: µν µν g˜E = gE

˜ αβµν = Rαβµν R E E

(9.100)

Ya que en el punto E y en coordenadas adaptadas x ˜µ los s´ımbolos de Christoffel son cero, la derivada covariante (;) es igual a la derivada corriente (,), lo que representa una simplificación considerable. Esto nos mueve a trazar una estrategia general de simplificación de los procesos matemáticos. Pensemos por ejemplo que queremos demostrar la validez de una ecuación que tiene una derivada covariante. Si queremos demostrar la ecuación en cualquier sistema coordenado xµ , la derivada covariante nos obliga a calcular los Γµ αβ , y esto es dispendioso. La idea es escoger un punto, llamarlo ¯ Ey µ µ ˜ αβ ¯¯ = 0 erigir un sistema de coordenadas adaptadas x ˜ . Hemos visto que Γ E

y, en consecuencia, la derivada covariante (;) se reduce a la derivada corriente (,), que es más fácil de manejar. Si logramos demostrar la ecuación en coordenadas x ˜µ , la fórmula (9.52) nos asegura que la prueba será válida también en cualquier otro sistema de coordenadas xµ . En la próxima sección usaremos esta estrategia para demostrar la validez de la primera identidad de Bianchi (9.86). Finalmente, en vista de (9.58), el teorema de esta sección dice que es posible 237

erigir un sistema adaptado de coordenadas x ˜µ tal que, en alg´ un punto E del ∂ g˜αβ sean cero. espaciotiempo, todas las primeras derivadas g˜αβ , µ = ∂x ˜µ

9.17

Las identidades de Bianchi

Ya estamos en condición de demostrar las identidades de Bianchi (9.86) y (9.87). Comenzaremos con la primera, (9.86). Montamos un sistema coordenado x ˜µ adaptado al punto E. En estas nuevas coordenadas el tensor de ˜α ˜α Riemann y el s´ımbolo de Christoffel se escriben con tilde: R βµν y Γ βµ . De acuerdo con la definición (9.77) : ˜α ˜α ˜α ˜σ ˜α ˜σ ˜α R βµν = Γ βµ , ν − Γ βν , µ − Γ βν Γ σµ + Γ βµ Γ σν ˜ Evaluar esta ecuación en el evento E, donde los s´ımbolos de Christoffel Γ son cero: ¯ ³ ´¯ ¯ ˜ α ¯¯ = Γ ˜α ˜α R − Γ (9.101) βµν βµ , ν βν , µ ¯ E

Tomar la derivada

∂ : ∂x ˜σ

¯ ¯ ˜α R = βµν , σ ¯ E ¯ ¯ ˜α R = βσµ , ν ¯ E ¯ ¯ ˜α R = βνσ , µ ¯ E

E

³ ´¯ ¯ ˜α ˜α Γ − Γ βµ , ν , σ βν , µ , σ ¯ . E ³ ´¯ ¯ ˜α ˜α Γ βσ , µ , ν − Γ βµ , σ , ν ¯ E ³ ´¯ ¯ α α ˜ ˜ Γ βν , σ , µ − Γ βσ , ν , µ ¯

As´ı también:

E

Sumar lado a lado estas tres ecuaciones para obtener ³

´¯ ¯ ˜α ˜α ˜α R + R + R βµν , σ βσµ , ν βνσ , µ ¯ = 0 E

Como en estas coordenadas adaptadas las derivadas corriente y covariante coinciden, podemos cambiar los signos (,) por los signos (;): ³

´¯ ¯ ˜α ˜α ˜α R βµν ; σ + R βσµ ; ν + R βνσ ; µ ¯ = 0 E

238

Esta ecuación covariante es válida en un sistema de coordenadas x˜µ . La fórmula (9.53) asegura que también es válida en cualquier otro sistema xµ : ¡ α ¢¯ R βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ ¯E = 0 La escritura enfatiza que la ecuación es válida en el punto E. Pero lo que hicimos para E también se puede hacer para cualquier otro punto, o sea que la ecuación es válida en todos los puntos del espacio: Rα βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ = 0

(9.102)

Hemos probado as´ı la primera identidad de Bianchi (9.86). Demostremos ahora la segunda. En (9.102) hacer µ = α: Rα βαν ; σ + Rα βσα ; ν + Rα βνσ ; α = 0 ↓ −R

α

βνα ; σ

↓

↓

Rσβ ; ν

g αρ Rρβνσ ; α

↓

↓ g αρ Rνσρβ ; α

−Rβν ; σ La ecuación queda entonces:

−Rβν ; σ + Rσβ ; ν + g αρ Rνσρβ ; α = 0 Multiplicar por g βν y utilizar la propiedad (9.79): −R; σ + Rν σ ; ν + g αρ g βν Rνσρβ ; α = 0 −R; σ + Rν σ ; ν + Rα σ ; α = 0 Es decir 1 Rα σ ; α − R;σ = 0 2 239

(9.103)

1 (Rα σ − g α σ R); α = 0 2 Quedan entonces demostradas las identidades de Bianchi. Esta u ´ltima identidad la queremos presentar en una forma ligeramente diferente, que nos será u ´til más tarde. Multiplicando la ecuación (9.103) por g µσ escribimos αµ R ; α = 12 g µσ R;σ , y como Rαµ = Rµα tenemos Rµα ; α = 12 g µσ R;σ , es decir: 1 Rµν ; ν = g µν R;ν 2

(9.104)

Esta fórmula es equivalente a la identidad de Bianchi. Ahora ataquemos el problema de demostrar que

9.18

El tensor de Riemann es el u ´ nico

que contiene linealmente las primeras derivadas del s´ımbolo de Christoffel Γ. Lo demostraremos [13] siguiendo este derrotero: calcular las derivadas Γα µν , δ , averiguar cómo transforman ( y darse cuenta de que no son tensores), proponer una combinaci´ on lineal de derivadas Γα µν , δ que s´ı transforma como un tensor (al que llamaremos Rρ ξη , σ ), probar que este tensor Rρ ξη , σ es igual al tensor de Riemann Rρ ξη , σ y, finalmente, demostrar que siempre se llega al tensor Rρ ξη , σ y no a otro. Multiplicar ambos lados de (9.63) por

∂xσ : ∂x0µ

∂xρ ∂xω σ ∂ 2 xσ ∂xσ 0µ Γ = Γ + ρω αβ ∂x0µ ∂x0α ∂x0β ∂x0α ∂x0β Tomemos la derivada

∂ en ambos lados de esta ecuación: ∂x0κ

∂ 2 xσ ∂xρ ∂xω ∂Γσ ρω ∂xσ ∂Γ0µ αβ 0µ + Γ = αβ ∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ µ ρ ¶ ∂ ∂x ∂xω ∂ 3 xσ σ + Γ ρω + ∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β 240

∂Γσ ρω ∂xη ∂Γσ ρω En el primer término del lado derecho hacemos = , y la ∂x0κ ∂x0κ ∂xη ecuación queda: ∂ 2 xσ ∂xρ ∂xω ∂xη ∂Γσ ρω ∂xσ ∂Γ0µ αβ 0µ + Γ = αβ ∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ ∂xη µ ρ ¶ ∂ ∂x ∂xω ∂ 3 xσ σ + Γ ρω + ∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β Multiplicar ambos lados por

∂x0λ y reordenar términos: ∂xσ

∂Γ0λ αβ ∂x0λ ∂xρ ∂xω ∂xη Γσ ρω ∂x0λ ∂ 3 xσ = + ∂x0κ ∂xσ ∂x0α ∂x0β ∂x0κ ∂xη ∂xσ ∂x0κ ∂x0α ∂x0β µ ¶ ∂xρ ∂xω ∂x0λ ∂ 2 xσ ∂x0λ ∂ 0µ − Γ + Γσ ρω αβ ∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ Y en notación con comas: ∂x0λ ∂xρ ∂xω ∂xη σ ∂x0λ ∂ 3 xσ Γ + ρω , η ∂xσ ∂x0α ∂x0β ∂x0κ ∂xσ ∂x0κ ∂x0α ∂x0β µ ¶ ∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ 0µ + Γσ ρω − Γ αβ ∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ

Γ 0λ αβ , κ =

Observemos bien esta ecuación. Si en el lado derecho hubiera u ńicamente el primer término, podr´ıamos decir que Γλ αβ , κ es un tensor. Pero el lado derecho tiene más términos, y por eso las derivadas Γλ αβ , κ no son tensores. En seguida veremos que hay una combinaci´ on lineal de estas derivadas que s´ı es tensor. Cambiemos ahora la notación: escribimos x ˜µ en vez de xµ , y escribimos x ˜0µ en vez de x0µ : ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ˜0λ ∂ x ˜ 0λ αβ , κ = ∂ x Γ + Γ ∂x ˜σ ∂ x ˜0α ∂ x ˜0κ ρω , η ˜0β ∂ x µ ρ ¶ ∂x ˜ ∂x ˜ω ∂x ˜0λ ∂ σ ˜ − + Γ ρω ∂x ˜σ ∂ x ˜0κ ∂ x ˜0α ∂ x ˜0β 241

∂x ˜0λ ∂3x ˜σ ∂x ˜σ ∂ x ˜0κ ∂ x ˜0α ∂ x ˜0β ˜σ ˜0λ ∂ 2 x ˜ 0µ ∂ x Γ αβ ∂ x ˜σ ∂ x ˜0κ ∂ x ˜0µ

Supongamos en este momento que tanto las x ˜µ como las x ˜0µ son coordenadas adaptadas al punto E. Vamos a evaluar la u ´ltima ecuación en E, recordando ˜=Γ ˜ 0 = 0: que en ese punto Γ ¯ ¯ ¯ ¯ ¯ ∂x ˜0λ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂3x ˜σ ¯ 0λ ˜ ¯ ¯ Γ αβ , κ ¯ = Γ ρω , η ¯ + ¯ σ 0α 0β 0κ σ 0κ 0α 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂ x ˜ ∂ x ˜ ∂ x ˜ ∂ x ˜ E E E (9.105) Sea G el grupo de todas las transformaciones de coordenadas, y sea G 0 el subgrupo de las transformaciones que llevan de unas coordenadas adaptadas a otras adaptadas. Observemos la ecuación (9.105). Si en el lado derecho ˜ 0λ αβ , κ es un hubiera u ńicamente el primer término, podr´ıamos decir que Γ 0 tensor bajo el subgrupo G . Pero el lado derecho tiene otro término, y por eso ˜ 0λ αβ , κ no es un tensor bajo el subgrupo G 0 . En seguida veremos que hay Γ una combinación lineal de estas derivadas que s´ı es tensor bajo el subgrupo G 0 . Se trata de erradicar al segundo término del lado derecho de (9.105), y esto no es dif´ıcil. En efecto, notemos que el segundo término del lado derecho de (9.105) es simétrico bajo la permutaci´ on κ ® β ; entonces, si en ambos lados de (9.105) restamos la permutaci´ on κ ® β , debe desaparecer el término incómodo: ³ ´¯ ˜ 0λ αβ , κ − Γ ˜ 0λ ακ , β ¯¯ Γ E

µ =

¶¯ ¯ ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂x ˜0λ ∂ x Γ ρω , η − Γ ρω , η ¯¯ σ 0α 0β 0κ σ 0α 0κ 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E

En el segundo término del lado derecho intercambiar los nombres de los ´ındices η y ω: ³ ´¯ ˜ 0λ αβ , κ − Γ ˜ 0λ ακ , β ¯¯ Γ E

µ =

=

¶¯ ¯ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ˜ρ ∂ x ˜η ∂ x ˜ω ˜ σ ∂x ˜0λ ∂ x Γ ρω , η − Γ ρη , ω ¯¯ σ 0α 0κ σ 0α 0κ 0β 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E

´¯¯ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ³ ˜ σ σ ˜ Γ ρω , η − Γ ρη , ω ¯¯ ∂x ˜σ ∂ x ˜0α ∂ x ˜0β ∂ x ˜0κ E

Definiendo 242

¯ ³ ´¯ ¯ λ ˜ ˜ λ αβ , κ − Γ ˜ λ ακ,β ¯¯ , R αβκ ¯ = Γ

(9.106)

¯ ¯ ρ ∂x ω ∂x η 0λ ∂ x ¯ ˜ ˜ ˜ ∂ x ˜ ¯ σ ˜ ρωη ¯ ˜ αβκ ¯ = R R ¯ σ 0α 0β 0κ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E E

(9.107)

E

E

podemos escribir 0λ

˜ λ αβκ transforma como Esta ecuación dice que, en el punto E, la cantidad R un tensor bajo el grupo G 0 . Por el momento comparemos las ecuaciones (9.101) y (9.106) para afirmar que ¯ ¯ ˜ λ αβκ ¯¯ = R ˜ λ αβκ ¯¯ R E

E

(9.108)

˜ λ αβκ coincide En palabras: en el punto E y en coordenadas adaptadas, R λ ˜ con el tensor de Riemann. ¯ Pero R αβκ es tensor bajo G, entonces la ecuación ¯ ˜ λ αβκ ¯ también es tensor bajo G. (9.108) dice que R E

Ahora, si dos tensores son iguales en un sistema coordenado,¯ también será¯ n ˜ λ αβκ ¯¯ = R ˜ λ αβκ ¯¯ iguales en otro sistema coordenado, lo que se escribe R E E ¯ ¯ ⇒ R λ αβκ ¯E = R λ αβκ ¯E . Anotemos finalmente que lo hecho para el punto E también se puede hacer para cualquier otro punto; esto nos permite afirmar que en todos los puntos del espacio se cumple la igualdad R λ αβκ = R λ αβκ . Nuestro interés ha sido construir un tensor que contenga linealmente las primeras derivadas del s´ımbolo de Christoffel, y hemos encontrado que ese tensor es el tensor de Riemann. Debemos además probar que fuera del tensor de Riemann no hay otro tensor que contenga linealmente las primeras derivadas del s´ımbolo de Christoffel. Esto es fácil. Cuando rastreamos hacia atrás el camino recorrido encontramos que hay otra ruta posible: para erradicar el término incómodo de (9.105) nosotros restamos la permutaci´ on κ ® β ; pero el término incómodo también se puede erradicar restando la permutación κ ® α ; en tal caso terminamos, no en R λ αβκ , sino en R λ βακ . Claramente, esta segunda ruta produce otra componente del tensor de Riemann, pero no produce un tensor diferente al de Riemann. En conclusión, las dos rutas llegan al mismo tensor. En vista de (9.59) podemos afirmar que 243

R λ αβκ es el u ńico tensor en el que: 1) Aparecen las derivadas gµν ,α y gµν ,α,β 2) Las gµν ,α,β aparecen linealmente.

(9.109)

Rµν y R tambi´ en son u ´ nicos: Veamos que cuando se contraen dos ´ındices en el tensor de Riemann, siempre se produce el tensor de Ricci. Analicemos en detalle las posibles contracciones de Rαβµν para producir un tensor de rango dos: Contraer α y ν :

g να Rαβµν = Rβµ

Contraer α y µ :

g µα Rαβµν = −g µα Rαβνµ = −Rβν

Contraer α y β :

g αβ Rαβµν = 0

Contraer β y µ :

g βµ Rαβµν = g βµ Rβανµ = Rαν

Contraer β y ν :

g βν Rαβµν = −g βν Rβαµν = −Rαµ

Vemos as´ı que siempre se termina en el tensor de Ricci. De otro lado, es claro que con Rµν hay una sóla contracci´ on posible, que es R. En conclusión: El u ńico tensor de rango dos que se puede obtener a partir de R λ αβκ es Rµν , y el u ńico escalar es R .

9.19

(9.110)

Obligar al tensor m´ etrico a que, en cierto evento, tome alg´ un valor que nosotros queramos

Teorema: Es posible erigir un sistema de coordenadas x ¯µ de tal manera que el tensor métrico tome, en alg´ un punto E del espacio, cualquier valor que nosotros arbitrariamente queramos. Para demostrar este teorema supongamos que tenemos un sistema de coordenadas xµ , con métrica g αβ . Vamos a hacer una transformación a otro sistema coordenado x ¯µ ; pero no una transformación cualquiera, sino lineal: x ¯µ = bµ ν xν , 244

(9.111)

con bµ ν constante. Derivando dos veces se encuentra: ∂2x ¯µ =0 ∂xσ ∂xν

(9.112)

Ahora usamos la ecuación (9.20) para calcular el tensor métrico en las nuevas coordenadas: g¯µν =

∂x ¯µ ∂ x ¯ν αβ g , ∂xα ∂xβ

y utilizando (9.111): g¯µν = bµ α bν β g αβ

(9.113)

Esta ecuación es válida en todos los puntos del espacio. En particular, en el punto E : g¯µν (E) = bµ α bν β g αβ (E)

(9.114)

Asignemos a las componentes g¯µν (E) cualesquiera valores que nosotros arbitrariamente queramos darles. La cuestión importante es esta: ¿Acaso estamos construyendo un g¯µν (E) contradictorio, sin consistencia interna? ¿Tenemos realmente plena libertad para asignar a las componentes g¯µν (E) los valores que caprichosamente queramos? La pregunta se concreta de la manera siguiente: ¿existe el conjunto de coeficientes bµ ν capaz de llevar del g µν (E) inicial al g¯µν (E) caprichoso? Veremos que s´ı existe el conjunto de coeficientes bµ ν , es decir, que los datos (que son g µν (E) y g¯µν (E)) admiten la existencia de los coeficientes bµ ν . Para demostrar que los datos son compatibles con los coeficientes bµ ν , tomamos a estos bµ ν como si fueran incógnitas, y nos preguntamos si acaso hay suficientes ecuaciones para averiguar las n2 las incógnitas. Como el tensor métrico es de dos ´ındices, tiene n2 componentes; pero además es simétrico, entonces sólo tiene (n2 +n)/2 componentes independientes. Esto nos permite afirmar que (9.114) es un conjunto de (n2 + n)/2 ecuaciones independientes. Tenemos pues (n2 + n)/2 ecuaciones y n2 inc´ ognitas; pero n2 >(n2 + n)/2 , es 245

decir, hay más incógnitas que ecuaciones: el sistema de ecuaciones está subdeterminado, y por consiguiente hay un n´ umero infinito de soluciones para las incógnitas bµ α . En conclusión, s´ı es posible asignar a las componentes g¯µν (E) los valores que nosotros arbitrariamente queramos darles2 . Pensando en una matriz b cuyas entradas son bµ α , la ecuación 9.114) se escribe concisamente de la manera siguiente: g¯µν (E) = b g αβ (E) bT

(9.115)

Como hay un n´ umero infinito de soluciones para la matriz b , no podemos aspirar a deducirla. Esta matriz b se averigua por inspección directa de la ecuación (9.115): en esta fórmula las variables g¯µν (E) y g µν (E) son datos. Podemos escoger las componentes de g¯µν (E) arbitrariamente, o las de g¯µν (E 0 ), o las de g¯µν (E 00 ) ... Pero no podemos escoger arbitrariamente las de g¯µν (E) y las de g¯µν (E 0 ) y las de g¯µν (E 00 )...Esto es claro, ya que para obtener g¯µν (E) se necesita hacer una transformación de coordenadas (un conjunto de coeficientes bµ ν ) y para obtener g¯µν (E 0 ) se necesita otra transformación. Escribamos de qué manera quedan el tensor métrico y el de Riemann después de esta transformación de coordenadas, siguiendo las fórmulas (9.113) y (9.80): g¯µν = bµ ρ bν σ g ρσ

9.20

¯ αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ R

(9.116)

Dos transformaciones sucesivas

Ahora vamos a considerar dos transformaciones: xµ → x ˜µ → x ¯µ . La primera transformación sigue al teorema de la sección 9.16 y la segunda sigue al teorema de la sección 9.19. Más precisamente: en las coordenadas xµ el tensor métrico es g µν y los s´ımbolos de Christoffel son Γα µν . En coordenadas x ˜µ el tensor métrico es g˜µν y los s´ımbolos de Christoffel, evaluados en E , son cero. En coordenadas x ¯µ el tensor métrico es g¯µν y los s´ımbolos de Christoffel, evaluados en E , siguen siendo cero. El tensor g¯µν , evaluado en E , tiene cualesquiera componentes que nosotros queramos. 2

Algo similar ocurre en la teor´ıa newtoniana de la gravitaci´ on. El potencial gravitacional Φ puede ser subido o bajado a nuestro ama˜ no para que Φ adopte, en un punto dado, cualquier valor que nosotros queramos darle.

246

Uno podr´ıa poner en duda que en las u ´ltimas coordenadas x¯ los s´ımbo¯ (E) sigan siendo cero. Esta duda es justificada porque, los de Christoffel Γ ˜ sabido que los Γ(E) se volvieron cero en la primera transformación, ¿cómo garantizamos que siguen siendo cero después de la segunda transformación de coordenadas? En otras palabras: ¿cómo garantizamos que las x¯ sean coordenadas adaptadas? Pues as´ı ocurre, verdaderamente; en efecto, utilizando la fórmula (9.64) para escribir la transformación x ˜→x ¯ encontramos: ¯µ ∂ x ˜σ ∂ x ˜τ ˜ ν ∂x ˜ν ∂ x ˜σ ∂ 2 x ¯µ ¯ µ αβ = ∂ x Γ Γ − στ ∂x ˜ν ∂ x ¯α ∂ x ∂x ¯α ∂ x ˜σ ∂ x ˜ν ¯β ¯β ∂ x ¯ µ αβ no es, en general, cero; Esta ecuación es válida en todo el espacio, y Γ pero en E s´ı es cero. En efecto, en E ambos términos del lado derecho son ˜ ν στ (E) = 0, y el segundo término por cero: el primer término porque Γ ˜ = 0 , también Γ ¯=0. (9.112). En conclusión, en el punto E no sólo Γ La segunda transformación x ˜→x ¯ es, de acuerdo con las fórmulas (9.111) y (9.116), as´ı: x ¯µ = bµ ρ x ˜ρ ,

g¯µν = bµ ρ bν σ g˜ρσ ,

¯ αβµν = bα ρ bβ σ bµ δ bν π R ˜ ρσδπ , R

y en vista de (9.97) y (9.100): x ¯µ = bµ ρ (xρ − xρE ) + g¯µν ¯ αβµν R

1 µ ρ b ρ Γ δπ (xδ − xδE )(xπ − xπE ) (9.117) 2

= bµ ρ bν σ g ρσ

(9.118)

= bα ρ bβ σ bµ δ bν π Rρσδπ

(9.119)

Hagamos una breve recopilación de la doble transformación: Se escoge un punto E . Se conoce la métrica g µν en las coordenadas iniciales xµ . Uno quiere que la métrica final, evaluada en el punto E , sea g¯µν (E) . O sea que E , g µν y g¯µν (E) son datos. La pregunta es ¿cómo son las coordenadas finales x ¯µ y cómo son las componentes de los tensores en estas coordenadas finales? Para resolver esta pregunta se siguen los siguientes 247

pasos: Se escribe la ecuación (9.115) y, por inspección, se averigua la matriz b . Conocidos los coeficientes bα ρ , uno ejecuta las tres ecuaciones (9.117)(9.119). Debe resaltarse que estas tres ecuaciones son válidas en todos los puntos del espacio. Finalmente, nótese que en estas ecuaciones no aparecen ˜ αβµν , que corresponden a las coordenadas incantidades del tipo x ˜µ , g˜µν ni R termedias; en otras palabras, estas ecuaciones muestran una transformación directa xµ → x ¯µ , sin vestigios de la transformación intermedia xµ → x ˜µ .

9.21

Un ejemplo

A continuación traemos un ejemplo de la doble transformación. En la sección 13.1 tendremos ocasión de estudiar un problema de primera importancia, que es el campo gravitatorio ocasionado por una masa puntual M . Veremos que el tensor métrico está dado por la matriz (13.14); en esa expresión la variable s , que se llama el radio de Schwarzschild, quiere decir 2GM/c2 . O sea que aunque s tiene unidades de longitud, representa a la masa M , de modo que el l´ımite del espacio plano, que corresponde a M = 0 , se obtiene haciendo s = 0 en la ecuación (13.14), lo que da como resultado la ecuación (9.44). También veremos, en la sección 13.2, las componentes no nulas de los s´ımbolos de Christoffel y del tensor de Riemann. En las coordenadas iniciales xµ = (ct, r, θ, ϕ) el evento E tiene coordenadas xµE = (ctE , rE , θE , ϕE ) y el tensor métrico está dado por (13.14). Este tensor, evaluado en E , es:      µν g (E) =     

(1 − s/rE )−1

0

0

−(1 − s/rE )

0

0

0

0

−2 −rE

0

0

0

0

0

0

         

−(rE sen θE )−2 (9.120)

De otro lado, queremos que en las coordenadas finales x¯µ el tensor métrico, al evaluarse en E , sea (9.44): 248



1

0

0

0

   0 −1 0  µν g¯ (E) =    0 0 −r−2  E  0

0

0 0

         

(9.121)

−(rE sen θE )−2

0

Para averiguar la matriz b debemos poner las matrices (9.120) y (9.121) en la ecuación (9.115). Al hacerlo nos damos cuenta, por simple inspección, de que una b posible es la siguiente matriz diagonal:

b = bT = diag

Ã p

1

!

1 − s/rE , p ,1,1 1 − s/rE

(9.122)

¯ αβµν del tensor Conocida la matriz b , es muy fácil calcular las componentes R de Riemann en las coordenadas finales x ¯µ . Para tal efecto se ponen las vieρσδπ jas componentes R (de la sección 13.2) y la matriz (9.122) en la fórmula (9.119), obteniéndose: ¯ 0101 = R ¯ 1010 = −R ¯ 1001 = −R ¯ 0110 = R

s r3

¯ 0202 = R ¯ 2020 = −R ¯ 2002 = −R ¯ 0220 = R

s(1 − s/rE ) 2r5 (1 − s/r) s(1 − s/rE ) − 5 2r (1 − s/r) sin2 θ s(1 − s/r) 2r5 (1 − s/rE ) s(1 − s/r) 2r5 (1 − s/rE ) sin2 θ s − 7 2 r sin θ

¯ 0303 = R ¯ 3030 = −R ¯ 3003 = −R ¯ 0330 = R ¯ 1212 = R ¯ 2121 = −R ¯ 2112 = −R ¯ 1221 = R ¯ 1313 = R ¯ 3131 = −R ¯ 3113 = −R ¯ 1331 = R ¯ 2323 = R ¯ 3232 = −R ¯ 3223 = −R ¯ 2332 = R

−

Para calcular el tensor métrico g¯µν en las coordenadas finales x ¯µ debemos colocar las matrices (13.14) y (9.122) en la fórmula (9.118) para obtener: 249



µν

g¯

1 − s/rE  1 − s/r      0 =     0   0

 0

−

0

0

0

0

0

−r−2

0

0

0

−(r sen θ)−2

1 − s/r 1 − s/rE

            

(9.123)

¯ αβµν y los g¯µν sin necesiEs interesante apuntar que pudimos calcular los R dad de averiguar antes las coordenadas finales x ¯µ . No sobra, sin embargo, que presentemos estas coordenadas finales. Para calcularlas se utilizan los términos de Christoffel de la sección 13.2 y la matriz (9.122) en la fórmula (9.117), llegándose a: x ¯0 =

p 1 − s/rE (ct − ctE )

h 1 s(1 − s/r)(ct − ctE )2 s(r − rE )2 x ¯1 = p 2(r − rE ) + − 2 2 2r 2r (1 − s/r) 2 1 − s/rE − r(1 − s/r)(θ − θE )2 − r(1 − s/r)(sen θ)2 (ϕ − ϕE )2

i

1 1 x ¯2 = θ − θE + (r − rE )(θ − θE ) − sen θ cos θ(ϕ − ϕE )2 r 2 1 x ¯3 = ϕ − ϕE + (r − rE )(ϕ − ϕE ) + cot θ (θ − θE )(ϕ − ϕE ) r El espacio no es plano en el evento E . En el evento E ocurren dos cosas interesantes: 1) la métrica (9.121) es la misma (9.44) del espaciotiempo plano; y 2) los s´ımbolos de Christoffel son cero, como ocurre en el espaciotiempo plano. En vista de estas dos propiedades uno podr´ıa precipitarse a afirmar que en E el espaciotiempo es plano, pero esta afirmación es falsa, ya que el espaciotiempo descrito por (9.123) no es plano ni en E ni en ning´ un otro evento. Ya hemos visto que lo que indica si un espacio es plano o curvo es el tensor de Riemann: acabamos de demostrar que algunas componentes de este tensor difieren de cero, y por eso el espaciotiempo descrito por (9.123) es curvo. El ejemplo que acabamos de estudiar, aunque se refiere a un espacio particular de dimensión 4, pone de presente una propiedad general: en todo espacio 250

de Riemann, de cualquier dimensión n, es posible construir un sistema de coordenadas adaptadas a un punto (llamémoslo E), de modo que en E la métrica y los s´ımbolos de Christoffel sean como los de un espacio plano. A primera vista se podr´ıa creer que el espacio se ha aplanado en E , pero ese pensamiento es erróneo: la curvatura o planitud del espacio en E es una propiedad intr´ınseca de la geometr´ıa, tal como hab´ıamos mencionado en la página 235. Damos por terminada la tarea que nos hab´ıamos planteado en la página 235: demostrar que es posible adaptar al punto E un sistema de coordenadas de modo que se cumplan las dos condiciones (9.96). Esto nos dota de herramientas suficientes para construir una teor´ıa general de la relatividad, asunto que nos ocupará a partir del cap´ıtulo 11.

251

252

Cap´ıtulo 10

Las geod´ esicas Pensemos en dos puntos P1 y P2 en la superficie de una esfera. Existe un n´ umero infinito de curvas que pasan por ambos puntos, a lo largo de las cuales se puede medir la distancia P1 P2 . Nos preguntamos ahora en cuál de las curvas la distancia P1 P2 resulta m´ınima, y la respuesta es bien conocida: en el arco menor del c´ırculo máximo que pasa por ambos puntos. El cálculo elemental nos ense˜ na que una función se minimiza cuando se anula una primera derivada, es decir, cuando la función es estacionaria. En nuestro caso decimos que a lo largo del arco menor la distancia es estacionaria: el cálculo de la distancia arroja el mismo resultado bien sea que se ejecute a lo largo del arco menor o a lo largo de cualquier otra curva, muy cercana al arco menor, que pase por P1 y P2 . Para cualquier geometr´ıa, en general, la geodésica se define como aquella curva en la que la distancia total es estacionaria (en vez de estacionaria se puede usar también la palabra extremal). Este es un concepto variacional que se refiere a la geodésica y a todas las curvas arbitrarias cercanas a ella. Nos proponemos desarrollar el cálculo variacional para encontrar la geodésica.

10.1

La ecuaci´ on diferencial de las geod´ esicas

Consideremos un espacio de Riemann con coordenadas xµ e intervalo ds2 = gµν dxµ dxν . Sean E1 y E2 dos puntos en ese espacio. Pensemos ahora en una curva R E2 pque pasa por estos dos puntos y llamemos longitud total al integral gµν dxµ dxν ejecutado a lo largo de esa curva. Sin embargo, esta curva E1 no es la u ńica que pasa por E1 y E2 ya que, en efecto, hay un n´ umero 253

infinito de curvas, y cada una tiene su propia longitud. Dentro del infinito n´ umero de curvas que conectan a E1 con E2 hay una muy especial, llamada la geodésica, en la que se extremaliza la longitud total: Z

E2

δ E1

p gµν dxµ dxν = 0

en la geodésica.

(10.1)

p Hemos cometido una ligereza al tomar la ra´ız cuadrada gµν dxµ dxν , cosa que sólo puede hacerse cuando el intervalo no es negativo. Por el momento vamos a suponer que los intervalos son positivos y aplazamos para la sección 10.2 el estudio de los intervalos nulos y negativos. Parametrizaci´ on. Llamamos (dλ)2 al intervalo a lo largo de la geodésica: ·q ¸ µ ν dλ = gµν (x) dx dx

(10.2) Geod´ esica

R La integral λ = E1 dλ es la longitud parcial de la geodésica desde E1 hasta un punto cualquiera de ella. El parámetro λ es propiedad de la geodésica y sirve para caracterizar los puntos que a ella pertenecen. Más expl´ıcitamente, denotando por x ¯ a los puntos de la geodésica, escribimos x ¯=x ¯(λ) ; las coµ µ ordenadas de x ¯ también son funciones de λ, es decir, x ¯ =x ¯ (λ) . Pensemos ahora en otra curva diferente a la geodésica, que se construye punto a punto de la manera siguiente: el punto x ¯(λ) se corre una cantidad δx(λ) , o sea que las coordenadas del nuevo punto serán x ¯µ (λ) + δxµ (λ) . Vemos as´ı que todos los puntos de la geodésica y todos los puntos de la nueva curva son funciones del parámetro escalar λ . Las variaciones δxµ son infinitesimales y arbitrarias, pero deben ajustarse a la condición de que la curva variada x ¯µ + δxµ también pase por E1 y E2 : δxµ = 0

en E1 y en E2

(10.3)

Las ecuaciones de Euler-Lagrange. El problema variacional contenido en la ecuación (10.1) es matemáticamente igual al de la ecuación (8.3), si se hace el cambio L → L, con la lagrangiana L definida as´ı: r L ≡

gµν

dxµ dxν dλ dλ

254

(10.4)

Nos ahorramos los pasos que llevan de (8.3) a (8.8), y simplemente escribimos las ecuaciones de Euler-Lagrange (8.8) con L en vez de L: ·

∂L ∂xα



¸ − Geod´ esica



d  ∂L  = 0   dxα dλ ∂ dλ Geodésica

(10.5)

Los parecidos con el Cap´ıtulo 8 no cesan aqu´ı. En efecto, el lector podrá reconocer que el problema que queremos atacar es muy parecido al que resolvimos en los pasos que llevan de la ecuación (8.13) a la (8.16). Pero hay una diferencia importante: en esa ocasión la métrica ηµν era constante, en cambio en el problema que ahora nos ocupa ocurre que gµν es variable. Concretamente, en vez de (8.14) debemos ahora escribir dxµ dxν ∂L 1 g = µν ,α ∂xα 2L dλ dλ La análoga de (8.15) es ∂L dxν 1 gνα α = dx L dλ ∂ dλ Pongamos ahora las dos u ´ltimas ecuaciones en (10.5): ·

1 dxµ dxν gµν ,α 2L dλ dλ

¸

· ¸ d 1 dxν − gνα =0 dλ L dλ Geod Geod

Ahora, la ecuación (10.2) afirma que [ L ]Geod = 1, entonces (10.6) es: 1 dxµ dxν d gµν ,α − 2 dλ dλ dλ

µ ¶ dxν gνα =0 dλ

Procedemos a transformar la apariencia de esta ecuación: 0 =

dxµ dxν d ³ dxµ ´ 1 gµν ,α − gµα 2 dλ dλ dλ dλ 255

(10.6)

= =

´ dxµ 1 dxµ dxν ³ d d2 xµ gµν ,α − gµα − gµα 2 dλ dλ dλ dλ dλ2 h1 2

gµν ,α − gµα,ν

i dxµ dxν d2 xµ − gµα dλ dλ dλ2

Multiplicar ambos lados por g σα : 0 =

¡ ¢ dxµ dxν d2 xσ 1 + g σα 2gαµ , ν − gµν , α 2 dλ 2 dλ dλ

=

¢ dxµ dxν d2 xσ 1 σα ¡ + g g + g − g + g − g αµ , ν να , µ µν , α αµ , ν να , µ dλ2 2 dλ dλ

=

¢ dxµ dxν d2 xσ 1 σα ¡ dxµ dxν σ + g g − g + Γ αµ , ν αν , µ µν dλ2 dλ dλ 2 dλ dλ

(10.7)

¢ ¡ on µ À ν, Se observa que gαµ , ν − gαν , µ es antisimétrico bajo la permutaci´ µ ν mientras que dx dx es simétrico; entonces, de acuerdo con la ecuación (5.38), la contracción total es cero. Vemos as´ı que el u ´ltimo término del lado derecho de la ecuación (10.7) es cero, o sea que: d2 xσ dxµ dxν σ = 0 + Γ µν dλ2 dλ dλ

(10.8)

Esta es la ecuación diferencial de las geodésicas. Ella es, en el fondo, la ecuación de Euler-Lagrange asociada a la L de (10.4). Conviene apuntar que aunque en el lado izquierdo de (10.8) ninguno de los dos términos es tensor, la suma s´ı da el tensor cero. En otras palabras, (10.8) es una ecuación tensorial, lo que significa que es covariante bajo el grupo de las transformaciones generales de coordenadas.

10.2

Par´ ametros afines

λ recibe el nombre de par´ ametro af´ın. La definición inicial (10.2) aclara cuál 2 es el significado de dλ : es el intervalo a lo largo de la geodésica. En la ecuación diferencial de las geodésicas (10.8) aparece λ como el parámetro importante, la variable independiente. En este momento damos un giro a 256

la presentación, para definir al parámetro af´ın en base a la ecuación de las geodésicas: si la ecuación de una geodésica es (10.8), entonces λ es un parámetro af´ın de esa geodésica. Ahora, si λ es un parámetro af´ın de una geodésica, entonces aλ + b también es parámetro af´ın (a y b constantes). En efecto, llamando λ0 = aλ + b, la ecuación (10.8) se convierte en dxµ dxν d2 xσ σ + Γ = 0 µν dλ02 dλ0 dλ0 Como esta ecuación es de la forma (10.8), podemos afirmar que λ0 = aλ + b también es un parámetro af´ın. Hagamos una pausa para ver un ejemplo u ´til de lo que puede ser un parámetro af´ın. En el caso particular del espaciotiempo, consideremos el tiempo propio dτ de una part´ıcula masiva. De acuerdo con la ecuación (8.1): ds2 = c2 dτ 2

(10.9)

Si esta part´ıcula sigue una trayectoria geodésica, entonces ds2 = dλ2 . Hay dos parámetros afines importantes, que son s y τ : d2 xσ dxµ dxν σ + Γ µν ds2 ds ds

= 0

part´ıcula masiva

(10.10)

d2 xσ dxµ dxν σ + Γ µν dτ 2 dτ dτ

= 0

part´ıcula masiva

(10.11)

Después de definir el parámetro af´ın en base a la ecuación de la geodésica, estamos en condición de abordar el asunto de los intervalos nulos y negativos. Recordemos que justo antes de escribir la ecuación (10.1) supusimos que el intervalo ds2 era positivo y, basados en esa suposición, dedujimos la ecuación de las geodésicas (10.8). A primera vista podr´ıamos afirmar que (10.8) es válida u ńicamente para geodésicas de intervalos positivos, pero tal afirmación es apresurada: (10.8) es, en general, la ecuación de todas las geodésicas, sean éstas de intervalos positivos, nulos o negativos. Decimos que, en general ds2 = ² dλ2 , 257

(10.12)

donde ² = 0, ±1. El valor ² = 0 es para intervalos nulos, mientras que ² = ±1 para intervalos positivos o negativos. En todos los casos dλ2 es una cantidad positiva. Para intervalos positivos, es claro que dλ2 es directamente el intervalo, y para intervalos negativos dλ2 es el negativo del intervalo. Para intervalos nulos no hay una regla general que se aplique a todos los casos; lo que usualmente ocurre es que la misma ecuación de la geodésica indica cuál es el parámetro af´ın λ que se debe emplear; el lector interesado puede dirigirse a la ecuación (13.45), donde encontrar´ a un ejemplo de cómo las geodésicas ayudan a determinar el parámetro af´ın. El intervalo entre dos puntos cualesquiera del espacio es gµν dxµ dxν = ds2 . Si esos dos puntos pertenecen a la geodésica, ds2 = ²dλ2 , o sea que gµν dxµ dxν = ²dλ2 . De aqu´ı se sigue que gµν

dxµ dxν =² dλ dλ

(10.13)

Esta es la ecuación del intervalo entre dos puntos de la geodésica.

10.3

Constantes del movimiento

Si llamamos V σ ≡

dxσ , la ecuación de las geodésicas (10.8) es: dλ d σ V = −Γσ µν V µ V ν dλ

Multiplicar ambos lados de esta ecuación por gασ : gασ

d σ V = −gασ Γσ µν V µ V ν dλ

d d (gασ V σ ) − V σ gασ = −gασ Γσ µν V µ V ν dλ dλ Es decir: d d (gασ V σ ) = V σ gασ − gασ Γσ µν V µ V ν dλ dλ 258

(10.14)

= Vσ

dxη gασ,η − gασ Γσ µν V µ V ν dλ

= V σ V η gασ,η − = V σ V η gασ,η − =

1 gασ g σρ (gρµ,ν + gνρ,µ − gµν ,ρ ) V µ V ν 2 1 (gαµ,ν + gνα,µ − gµν ,α ) V µ V ν 2

1 1 gµν ,α V µ V ν + (gαµ,ν − gνα,µ ) V µ V ν 2 2

Obsérvese que el u ´ltimo término del lado derecho es la contracci´ on total de un factor simétrico con otro antisimétrico, y por (5.38) es cero. Queda entonces 1 d (gασ V σ ) = gµν , α V µ V ν dλ 2

Esta ecuación dice claramente que

gµν ,α = 0

⇒

gασ

dxσ dλ

es constante

(10.15)

Este es el modo de identificar las “constantes del movimiento”: si la métrica es independiente de la coordenada xα , entonces gασ dxσ /dλ es una constante del movimiento. Decimos que una coordenada xα es c´ıclica si xα no aparece en el tensor métrico gµν . La fórmula (10.15) dice, entonces, que a toda coordenada c´ıclica le corresponde una constante del movimiento. De otro lado, un vistazo a la definición (10.4) muestra que las coordenadas c´ıclicas tampoco aparecen en la lagrangiana, o sea que a toda coordenada xα que no aparezca en la lagrangiana se le asocia una constante del movimiento. En mecánica clásica se usa exactamente el mismo enunciado. Es importante que se reconozca que gασ dxσ /dλ = constante proviene de las ecuaciones (10.8), lo que significa que, en total, las n ecuaciones (10.8) y la ecuación gασ dxσ /dλ = constante forman un conjunto redundante. 259

10.4

Las ecuaciones algebraicas de las geod´ esicas

En el caso general disponemos de la ecuación del intervalo (10.13) y de las n ecuaciones diferenciales (10.8). Como las (10.8) son ecuaciones de segundo grado, su solución puede presentar dificultades. En comparación, la (10.13) tiene derivadas de primer grado, y por esto puede ser más tratable que las (10.8). Como recomendación general, uno debe utilizar la (10.13). Se presentan ocasionalmente casos felices, en los que hay constantes del movimiento; en estas situaciones, además de las (10.8) y de las (10.13), uno dispone de una o varias ecuaciones (10.15). A continuaci´ on veremos algunos ejemplos; en todos ellos el parámetro af´ın λ será erradicado por completo, o sea que podremos escribir la ecuación de la l´ınea geodésica sin que aparezca λ. Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la siguiente geometr´ıa: ds2 = dr2 + r2 dθ2 . Para la geometr´ıa dada el intervalo es positivo y podemos escoger el parámetro af´ın λ igual a s. Es decir, ² = 1. El tensor métrico es · gµν =

1 0 0 r2

¸ (10.16)

La constante del movimiento: La métrica es claramente independiente de la dθ = gθθ θ˙ = r2 θ˙ variable θ, entonces, de acuerdo con (10.15), la cantidad gθθ dλ es constante del movimiento. La llamaremos K: K = r2 θ˙

θ˙−2

(10.17)

= Constante r4 = K2

(10.18) (10.19) µ

La ecuaci´ on del intervalo: Como ² = 1 , la ecuación (10.13) es µ ¶2 dθ r2 = 1 , que ahora escribimos cortamente as´ı: dλ 260

dr dλ

¶2 +

µ

dr dλ

¶2

+ r2 θ˙2 = 1

(10.20)

dr dr dθ dr ˙ θ = = dλ dθ dλ dθ

(10.21)

Truco:

µ Entonces (10.20) queda

dr dθ

¶2

µ

θ˙2 + r2 θ˙2 = 1 , de donde:

dr dθ

¶2

+ r2 = θ˙−2

(10.22)

Desenlace: Al colocar la ecuación (10.19) en (10.22) obtenemos: ³ dr ´2 dθ

+ r2 =

r4 K2

(10.23)

Todav´ıa queda la tarea de resolver esta ecuación, asunto que se facilita si la dr K dr/r2 reescribimos de la manera siguiente: dθ = p = p . r4 /K 2 − r2 1 − (K/r)2 Entonces, llamando z = K/r: dz dθ = − √ 1 − z2 Integrar desde z = 1: Z

Z

θ

dθ = − θ0

1

z

dz √ 1 − z2

θ − θ0 = arc cos(z) O sea que r cos(θ − θ0 ) = K 261

(10.24)

Esta es la ecuación de la l´ınea recta que está a una distancia K del origen y que forma un ángulo π/2 + θ0 con el eje x. Recopilación: 1. En una geometr´ıa de n dimensiones hay n ecuaciones diferenciales del tipo (10.8). Estas ecuaciones tienen dos desventajas: primero, desarrollarlas puede ser laborioso, porque hay que calcular todos los s´ımbolos de Christoffel; y, segundo, por ser ecuaciones diferenciales de segundo grado, ellas pueden ser dif´ıciles de resolver o manipular. 2. Además de las n ecuaciones diferenciales del tipo (10.8), tenemos la ecuación del intervalo (10.13). Esta ecuación del intervalo tiene dos ventajas: primero, ella usualmente hace parte de los datos de un problema y, segundo, es una ecuación diferencial de primer grado, lo que la hace comparativamente fácil de integrar y manipular. 3. Si hay constantes del movimiento, la solución del problema se facilita enormemente, porque además de (10.8) y (10.13) disponemos de las ecuaciones adicionales (10.15). En estos casos podemos aspirar a que la solución final, como (10.24), no contenga a la variable λ . En alg´ un momento del análisis es preciso erradicar al parámetro incómodo λ. En el ejercicio que acabamos de resolver, pudimos desembarazarnos de dλ utilizando combinadamente: a) la constante del movimiento y, b) el truco dr/dλ = (dr/dθ)(dθ/dλ). Aqu´ı vemos la utilidad de las constantes del movimiento: usándolas hemos logrado averiguar las l´ıneas geodésicas sin emplear directamente las ecuaciones (10.8) de las geodésicas. 4. Es preciso aclarar que aunque no hemos usado las (10.8) directamente, s´ı las hemos usado indirectamente, ya que la identificaci´ on de las constantes del movimiento (10.15) se ejecuta a través de la ecuación diferencial de las geodésicas (10.14). De otro lado, la ecuación diferencial de las geodésicas no es independiente de la ecuación del intervalo; en efecto, para la construcción de (10.8) es preciso usar los s´ımbolos de Christoffel, los cuales provienen del tensor métrico, el cual proviene de la ecuación del intervalo ds2 = gµν dxµ dxν . 5. Se dispone de un conjunto de elementos de información: la ecuación diferencial de las geodésicas, la ecuación del intervalo, y las constantes del movimiento. Este conjunto de elementos de información es redundante, por 262

las anotaciones consignadas en el numeral 4. 6. Las geodésicas existen en el espacio antes de que nosotros tracemos sobre éste alg´ un sistema de coordenadas. As´ı mismo, las constantes del movimiento existen o no existen, independientes del sistema coordenado usado. Otro asunto es si somos capaces de darnos cuenta de si en cierto espacio hay constantes del movimiento. Para apreciar esto regresemos al caso feliz recién visto, que es el de un espacio plano bidimensional. Si en vez de (r, θ) usáramos coordenadas (x, y), el intervalo se escribir´ıa ds2 = dx2 + dy 2 y el tensor métrico no ser´ıa (10.16) sino: ·

1 0 0 1

¸

Es claro que el nuevo tensor métrico es independiente de x y de y, y por consiguiente hay dos constantes del movimiento. Cuando se usan coordenadas cartesianas (x, y) nos damos cuenta de que hay dos constantes del movimiento; cuando usamos coordenadas cil´ındricas (r, θ) nos damos cuenta de que hay una constante, pero no nos damos cuenta fácilmente de que hay una segunda constante del movimiento. Para que nos demos cuenta de la existencia de alguna constante del movimiento se debe escoger un sistema coordenado adecuado. Si en un espacio hay m constantes del movimiento, existe un sistema coordenado x¯µ en el que el tensor métrico g¯µν es independiente de m coordenadas. Si el espacio es de dimensión n entonces, obviamente, m ≤ n. Si m = n, el espacio es plano; en efecto, en este caso existe un sistema coordenado x¯µ en el que el tensor métrico g¯µν es independiente de todas las coordenadas; este tensor métrico es constante ⇒ su tensor de Riemann es cero ⇒ el espacio es plano. Ejemplo: Averiguar las ecuaciones algebraicas de las geodésicas de la siguiente geometr´ıa: ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . La constante del movimiento: Para la geometr´ıa dada el intervalo es positivo y podemos simplemente escoger el parámetro af´ın λ igual a s. Es decir, ² = 1. La métrica, dada en la ecuación (9.93), es claramente independiente de dϕ la variable ϕ. Entonces, de acuerdo con (10.15), la cantidad gϕϕ = gϕϕ ϕ˙ dλ 2 2 = a ϕ˙ sen θ es constante del movimiento. Introducimos una constante κ: 263

a ϕ˙ sen2 θ =

1 √ , κ

de donde:

(a ϕ) ˙ −2 = κ sen4 θ

(10.25)

La ecuaci´ on del intervalo: Como ² = 1, la ecuación (10.13) es a2 a2

³ dθ ´2 dλ ³ dθ ´2 dλ

+ a2 sen2 θ

³ dϕ ´2 dλ

= 1

+ a2 sen2 θ ϕ˙ 2 = 1

(10.26)

Truco: dθ dϕ dθ dθ = = ϕ˙ dλ dϕ dλ dϕ

(10.27)

Entonces (10.26) queda as´ı: a2

³ dθ ´2

µ

dϕ dθ dϕ

¶2

ϕ˙ 2 + a2 sen2 θ ϕ˙ 2 = 1 ,

de donde:

+ sen2 θ = (a ϕ) ˙ −2

(10.28)

Desenlace: Al colocar la ecuación (10.25) en (10.28) obtenemos: dθ dϕ

= ± sen θ

Z ±

Z dϕ =

p

κ sen2 θ − 1 .

Integrar:

dθ √ sen θ κ sen2 θ − 1

Las tablas de integrales [14] traen esta integral para κ > 1: cos θ tan(ϕ + ϕ0 ) = ∓ √ κ sen2 θ − 1 No es dif´ıcil convertir esta fórmula en algo más manejable. Para tal efecto 264

dibujemos esta fórmula en un triángulo rectángulo, de tal manera que uno de los ángulos agudos sea ϕ + ϕ√0 , el cateto opuesto cos θ, el cateto adyacente √ κ sen2 θ − 1 y la hipotenusa κ − 1 sen θ. De ese dibujo leemos el seno del ángulo ϕ + ϕ0 : cos θ sen(ϕ + ϕ0 ) = √ κ − 1 sen θ y expandimos sen(ϕ + ϕ0 ) = sen ϕ0 cos ϕ + cos ϕ0 sen ϕ: cos θ sen ϕ0 cos ϕ + cos ϕ0 sen ϕ = √ κ − 1 sen θ 1 sen ϕ0 (a sen θ cos ϕ) + cos ϕ0 (a sen θ sen ϕ) = √ (a cos θ) κ−1 Hasta el momento las coordenadas (θ, ϕ) son signos abstractos, carentes de significado. Sin embargo, si pensamos que ellas son coordenadas esféricas, entonces las tres expresiones entre paréntesis en la u ´ltima ecuación representan las coordenadas cartesianas X, Y y Z de los puntos que pertenecen a una superficie esférica de radio a: 1 Z sen ϕ0 X + cos ϕ0 Y = √ κ−1 Esta ecuación es de la forma AX + B Y + C Z = 0

Aqu´ı reconocemos claramente la ecuación de un plano que pasa por el centro de la esfera, es decir, X, Y y Z son las coordenadas de los puntos que pertenecen a ese plano; pero como esos puntos también pertenecen a la superficie esférica, ellos configuran la intersecci´ on entre el plano y la superficie esférica. Ahora, esa intersección es un c´ırculo máximo. Conclusión: a través de dos puntos cualesquiera de la esfera pasa un c´ırculo máximo; este c´ırculo tiene dos arcos, que son las geodésicas. 265

El problema inverso. Consideremos el siguiente problema para un esdy pacio bidimensional en coordenadas (x, y): dada la pendiente p(x) = dx de una geodésica, averiguar una métrica. Para resolver este problema basta seguir de atrás hacia adelante alguno de los dos ejemplos recién vistos. No es dif´ıcil verificar que una solución es: ³ ´ ds2 = a f 2 (x) − f (x) p2 (x) (dx)2 + f (x) (dy)2 , es decir:

 ³  gµν = 

´ a f 2 (x) − f (x) p2 (x) 0

(10.29)

 0

 

(10.30)

f (x)

Aqu´ı, a es una constante y f (x) es cualquier función de x. No aspiramos a encontrar la fórmula general de la métrica que corresponde a la pendiente p(x) dada. La propuesta (10.30) es particular: una métrica diagonal e independiente de la coordenada y. En esta métrica, a−1/2 es la constante del movimiento asociada a la coordenada y. Para probar que (10.30) verdaderamente soluciona el problema, encontremos las geodésicas de (10.30): Reescribir la ecuaci´ on (10.29): Combinando las ecuaciones (10.13) y (10.29) escribimos ³

2

´

µ 2

a f (x) − f (x) p (x)

dx dλ

¶2

µ + f (x)

dy dλ

¶2 = ²

(10.31)

La constante del movimiento: La métrica (10.30) es claramente independidy ente de la variable y, entonces, de acuerdo con (10.15), la cantidad gyy dλ = gyy y˙ = f (x) y˙ es constante del movimiento. Introducimos una constante a: f (x) y˙ =

p ²/a ,

de donde:

²(y) ˙ −2 = a f 2 La ecuaci´ on del intervalo: La ecuación (10.31) es 266

(10.32)

µ ¶2 ³ ´ dx 2 2 a f (x) − f (x) p (x) + f (x) (y) ˙ 2=² dλ

(10.33)

Truco: dx dx dy dx = = y˙ dλ dy dλ dy Entonces la ecuación (10.33) queda as´ı: ³

2

´

µ 2

a f − f p (x) ³

2

´

µ 2

a f − f p (x)

dx dy dx dy

¶2

y˙ 2 + f y˙ 2 = ² ,

¶2

de donde:

+ f = ²y˙ −2

Desenlace: En el lado derecho de la u ´ltima ecuación usamos la ecuación (10.32), para obtener: ³

2

´

µ 2

a f − f p (x) µ

dx dy

¶2

dx dy

¶2

+ f = af 2 ,

es decir:

a f2 − f ´ =³ , a f 2 − f p2 (x)

¶ 1 dx 2 , que es la hipótesis inicial de este problema. = 2 o sea que dy p (x) Concluimos entonces que la métrica de la fórmula (10.29) es verdaderamente una solución. µ

10.5

Derivada a lo largo de una curva

Apuntábamos en la página 213 que el diferencial d no es una operación covariante. Ha llegado el momento de definir otra operación, que denotaremos con la letra may´ uscula D, que s´ı es covariante. Consideremos una curva cualquiera, no necesariamente geodésica, cuyos puntos están caracterizados por medio del parámetro escalar Λ (no hemos querido llamarlo λ, porque el s´ımbolo λ lo reservamos exclusivamente para denotar el parámetro af´ın de las geodésicas). Supongamos que en la región del espacio donde ella está, 267

también hay un campo vectorial Aµ . Un concepto importante es la rata de cambio del campo a medida que se recorren los diferentes puntos de la curva. Queremos asignarle a este concepto una cantidad matemática, y como estamos en el contexto de las transformaciones de coordenadas, deseamos que tal cantidad sea un tensor bajo el grupo de las transformaciones generalizadas de coordenadas. Nuestro primer intento ser´ıa proponer dAµ /dΛ, pero esta cantidad no es un tensor. Motivados por dAµ /dΛ, pasamos a definir un tensor que se llama la derivada a lo largo de una curva: DAµ dxν = Aµ ; ν DΛ dΛ

(10.34)

Nótese que este es verdaderamente un tensor (un vector), porque es producto de los tensores Aµ ; ν , dxν y dΛ . Ahora, Aµ ; ν = Aµ , ν + Γµ αν Aα , entonces DAµ DΛ

=

ν ∂Aµ dxν µ α dx + Γ A αν ∂xν dΛ dΛ

=

dxν dAµ + Γµ αν Aα dΛ dΛ

(10.35)

En las ecuaciones (10.34) y (10.35), y en lo que sigue, se entiende que xν son las coordenadas de un punto genérico de la curva. Al vector (10.35) se le puede tomar de nuevo la derivada a lo largo de la curva: µ ¶ D2 Aµ D DAµ = DΛ2 DΛ DΛ µ ¶ µ ¶ d DAµ DAσ dxρ = + Γµ σρ dΛ DΛ DΛ dΛ Coloquemos (10.35) en la u ´ltima ecuación: D2 Aµ DΛ2

=

2 β d2 Aµ d Γµ αβ α dxβ dAα dxβ µ µ α d x + A + Γ + Γ A αβ αβ dΛ2 dΛ dΛ dΛ dΛ dΛ2

+ Γµ σρ

dxβ dxρ dAσ dxρ + Γµ σρ Γσ αβ Aα dΛ dΛ dΛ dΛ 268

=

ν β d2 Aµ dAα dxβ µ α dx dx µ + Γ A + 2Γ αβ , ν αβ dΛ2 dΛ dΛ dΛ dΛ

+ Γµ αβ Aα

β ρ d2 xβ µ σ α dx dx + Γ Γ A σρ αβ dΛ2 dΛ dΛ

Esta expresión vale para cualquier curva. Ahora pensemos que la curva es una geodésica. Escojamos que Λ sea el parámetro af´ın λ: ν β D2 Aµ d2 Aµ dAα dxβ µ α dx dx µ = + Γ A + 2Γ αβ , ν αβ Dλ2 dλ2 dλ dλ dλ dλ β ρ d2 xβ µ σ α dx dx + Γ Γ A + Γµ αβ Aα σρ αβ dλ2 dλ dλ

(10.36)

Como es una geodésica, se cumple la ecuación (10.8): d2 xβ dxκ dxλ β = −Γ κλ dλ2 dλ dλ y usamos esto en el pen´ ultimo término de la ecuación (10.36): β ν dAα dxβ D2 Aµ d2 Aµ µ µ α dx dx + 2Γ = + Γ A αβ αβ , ν Dλ2 dλ2 dλ dλ dλ dλ

(10.37)

dxβ dxρ dxκ dxλ + Γµ σρ Γσ αβ Aα − Γµ αβ Γβ κλ Aα dλ dλ dλ dλ

10.6

Rαβµν y la curvatura

En esta sección veremos por qué Rαβµν se llama el tensor de curvatura. Comenzaremos estudiando la rata a la que se separan o acercan dos geodésicas y de all´ı extraeremos el verdadero significado de la curvatura de un espacio. Se hará evidente que Rαβµν es el que indica si el espacio es plano o curvo. Desviaci´ on geod´ esica. La noción de curvatura se capta fácilmente al analizar lo que ocurre con dos geodésicas. Es razonable suponer que en un espacio plano las dos curvas se separan (o se acercan) a ritmo constante. 269

Pero en un espacio curvo el ritmo de separación (o de acercamiento) no es constante. Para determinar si un espacio es curvo en una región, uno puede estudiar dos geodésicas y determinar si se juntan (o se separan) “aceleradamente”. Pensemos en dos geodésicas, llamando xµ a los puntos de una de ellas y X µ a los puntos de la otra. Para ambas geodésicas usamos el mismo parámetro λ, de modo que las xµ son funciones de λ, as´ı: xµ = xµ (λ), y también X µ = X µ (λ). A continuaci´ on definimos las funciones ξ µ (λ) de la manera siguiente: ξ µ (λ) = X µ (λ) − xµ (λ)

(10.38)

Usemos la fórmula (10.8) para escribir las ecuaciones de las dos geodésicas: d2 xµ dλ2

+ Γµ αβ (x)

dxα dxβ = 0 dλ dλ

d2 X µ dλ2

+ Γµ αβ (X)

(10.39)

dX α dX β = 0 dλ dλ

(10.40)

Ponemos (10.38) en (10.40): d2 xµ d2 ξ µ + + Γµ αβ (x + ξ) dλ2 dλ2

µ

dxα dξ α + dλ dλ

¶µ

dxβ dξ β + dλ dλ

¶ = 0

(10.41)

La cantidad Γµ αβ (x + ξ) se expande en serie de Taylor: Γµ αβ (x + ξ) = Γµ αβ (x) +

∂ µ Γ αβ (x)ξ σ + · · · ∂xσ

Ahora suponemos que las dos geodésicas son muy cercanas, de modo que en la serie de Taylor tomamos u ńicamente los dos primeros términos: Γµ αβ (x + ξ) ' Γµ αβ (x) + Γµ αβ , σ (x)ξ σ Colocamos esto en (10.41) y expandimos conservando términos hasta primer orden en ξ: 270

α β d2 xµ d2 ξ µ dxα dxβ µ µ σ dx dx + + Γ + Γ ξ αβ αβ , σ dλ2 dλ2 dλ dλ dλ dλ µ

+ 2Γ

αβ

dξ α dxβ = 0 dλ dλ

(10.42)

Ahora restamos, lado a lado, la ecuación (10.42) menos la ecuación (10.39): α β d2 ξ µ dξ α dxβ µ σ dx dx µ = − Γ ξ − 2 Γ αβ , σ αβ dλ2 dλ dλ dλ dλ

(10.43)

D2 ξ µ . Para esto colocamos (10.43) en (10.37), tras lo Queremos calcular Dλ2 cual se obtiene: α β D2 ξ µ µ µ ω µ ω µ σ dx dx = −(Γ − Γ + Γ Γ − Γ Γ ) ξ ωσ ωα βα , σ βσ , α βα βσ Dλ2 dλ dλ

En la expresión dentro del paréntesis reconocemos la definición (9.77) del tensor de Riemann: D2 ξ µ Dλ2

D2 ξ µ Dλ2

= −Rµ βασ ξ σ

dxβ dxα ; dλ dλ

= Rµ βσα ξ σ

dxβ dxα dλ dλ

= Rµ ασβ ξ σ

dxα dxβ dλ dλ

usar (9.84):

(10.44)

Anotamos arriba que la curvatura de un espacio se manifiesta en la “acelD2 ξ µ eración” a la que se separan (o se acercan) dos geodésicas. La ecuación Dλ2 (10.44) dice claramente que la curvatura (la “aceleración”) es una función del tensor de Riemann Rµ ασβ . En aquellos lugares donde Rµ ασβ = 0 el espacio es plano, y en los lugares donde Rµ ασβ 6= 0 el espacio es curvo. Por esta razón Rµ ασβ se llama el tensor de curvatura.

271

272

Cap´ıtulo 11

El principio de equivalencia

La idea central de la teor´ıa de la gravitaci´ on de Einstein es la siguiente: la gravitación afecta al tensor métrico gµν . El intervalo entre dos eventos cercanos, dado por ds2 = gµν dxµ dxν , depende del tensor métrico, y como éste depende del campo gravitacional, podemos afirmar que las distancias ds2 dependen del campo gravitatorio. En otras palabras, la presencia del campo afecta las distancias entre los eventos. Para captar esta idea pensemos en el espacio que ocupa el sistema solar. El campo gravitatorio en cada punto de ese espacio, y en cada instante, está determinado por las trayectorias del Sol, los planetas y todos los otros objetos del sistema solar. Este campo gravitacional tiene una magnitud que depende de la constante G de la gravitaci´ on universal. Imaginemos ahora un proceso matemático (no f´ısico) que consiste en “prender” o “apagar” la gravitación. Apagarla es anular paulatinamente la constante G → 0, y prenderla es el proceso opuesto. A medida que el campo se va apagando, gµν se modifica gradualmente y, cuando G llega al valor 0, el tensor gµν llega al valor que tiene en el espaciotiempo plano de la relatividad especial. Después de apagar la gravitación comencemos a prenderla de nuevo: a medida que G crece el campo se instala en el espaciotiempo, y eso se manifiesta como una modificación paulatina de los gµν . No olvidemos que el intervalo entre dos eventos, dado por ds2 = gµν dxµ dxν , depende expl´ıcitamente de gµν , y en consecuencia ds2 va variando a medida que G se prende o se apaga. Este ejemplo imaginario aclara la idea importante que queremos establecer: el campo gravitatorio afecta los intervalos ds2 , es decir, la gravitaci´ on se manifiesta como un hecho geométrico. Una vez captada la idea central, se plantean los dos problemas básicos de la relatividad general: de qué manera la gravitaci´ on afecta las ecuaciones que 273

expresan las leyes fundamentales de la f´ısica y, de otro lado, de qué manera los astros, las nubes de galaxias, la energ´ıa en general, determinan al tensor métrico. En este cap´ıtulo atacamos el primer problema y reservamos el segundo problema para el próximo cap´ıtulo.

11.1

El postulado de las geod´ esicas

La gravitación influye sobre la geometr´ıa del espaciotiempo, y esta geometr´ıa influye en los fenómenos f´ısicos. En otras palabras, la gravitaci´ on influye en los fenómenos a través de la geometr´ıa del espaciotiempo. La gravitaci´ on se manifiesta en los fenómenos de una manera indirecta: lo que ella hace es alterar las propiedades geométricas del espacio y el tiempo, y estas alteraciones afectan el desarrollo de los fenómenos. Se dice que una part´ıcula está en ca´ıda libre cuando está sometida u ńicamente a la interacción gravitatoria. ¿De qué manera el campo gravitatorio afecta la trayectoria de una part´ıcula en ca´ıda libre? La respuesta de esta pregunta se encuentra en el Postulado de las Geodésicas, seg´ un el cual las part´ıculas en ca´ıda libre siguen l´ıneas geodésicas en el espaciotiempo. En la dinámica newtoniana el campo gravitacional afecta la trayectoria de la part´ıcula, y esta influencia se describe mediante la ecuación a = F/m; eso lo conocemos muy bien: la fuerza gravitacional produce una aceleración en la part´ıcula. Pero la dinámica einsteiniana no utiliza el concepto de fuerza: el campo gravitatorio afecta al s´ımbolo de Christoffel Γµ αβ y éste1 a su vez influye en la ecuación de las geodésicas. En vez del concepto newtoniano de fuerza gravitacional, la teor´ıa de Einstein propone que la influencia gravitatoria se expresa geométricamente: eso es “geometrizar” la fuerza gravitacional. Una vez que se acepta el postulado de las geodésicas, hay serias razones para pensar que el espaciotiempo es probablemente curvo, y que la gravitación es la causa de la curvatura. Supongamos que una part´ıcula se suelta desde el piso 14 de un edificio, y que en el mismo instante se suelta otra desde el piso 15. Llamemos r1 y r2 a las posiciones de las part´ıculas en cualquier instante t. Si suponemos que no hay atmósfera, debemos admitir que están 1

Tomemos por ejemplo el s´ımbolo Γr θθ en coordenadas (ct, r, θ, ϕ). En el espaciotiempo vac´ıo, plano, de la relatividad especial, se tiene Γr θθ = −r. Sin embargo, si hay una masa M en el origen de coordenadas, se tiene Γr θθ = −r + 2GM/c2 . Véase la secci´ on 13.2.

274

en ca´ıda libre. Las aceleraciones de las dos part´ıculas se pueden averiguar usando la f´ısica newtoniana, y están dadas por GM/r12 y GM/r22 , o sea que la aceleración de una respecto a la otra es GM (1/r12 − 1/r22 ) 6= 0: La aceleración relativa entre las part´ıculas en ca´ıda libre no es cero. Entonces, de acuerdo con el postulado de las geodésicas, la aceleración relativa entre las geodésicas no es cero: he aqu´ı la desviación geodésica que estudiamos en la sección 10.6. Vimos en esa sección que la desviación geodésica es el indicador de curvatura, lo que nos lleva a la conclusión final: las dos part´ıculas se mueven en un espaciotiempo curvo. Lo más razonable es pensar que la Tierra ocasiona esa curvatura. Cualquier proyecto teórico que adopte el postulado geodésico se compromete con la posibilidad de que el espaciotiempo sea curvo, y que esta curvatura se debe al campo gravitacional.

11.2

El principio de Galileo

Hemos dicho que un cuerpo está en ca´ıda libre cuando sobre él act´ ua u ńicamente la fuerza gravitacional. Los planetas, por ejemplo, están en ca´ıda libre; as´ı mismo, si la atmósfera no existiera, un cuerpo que se soltara desde lo alto de un edificio caer´ıa libremente. Modernamente entendemos estos fenómenos a la luz del principio de Galileo, que afirma que todos los cuerpos en ca´ıda libre caen de igual manera. En la mecánica newtoniana el principio de Galileo se organiza al combinar la segunda ley de Newton y la ley de la gravitación universal, que escribimos a continuaci´ on en la forma tradicional: F = Gmg Mg /r2

F = mi a,

(11.1)

Es importante advertir que la masa inercial mi es la que aparece en la segunda ley de Newton, mientras la masa gravitacional mg figura en la fuerza gravitacional. Para la ca´ıda libre igualamos las dos ecuaciones (11.1), obteniendo: a=

mg GMg mi r2

(11.2)

El principio de la ca´ıda de los cuerpos afirma que, para Mg y r dados, la aceleración a es la misma para todos los cuerpos; en vista de la ecuación (11.2) podemos afirmar entonces que el cociente mg G/mi es igual para todos los cuerpos. La constante gravitacional G se define de manera que mg y mi sean numéricamente iguales: 275

mi = mg De muchas maneras se puede someter el enunciado mi = mg a la prueba experimental. La más inmediata es dejar caer objetos de diferentes substancias para ver si en todos los casos se obtiene mi =pmg . Otra forma es con p péndulos simples; como el per´ıodo es mi /mg 2π L/g, se pueden hacer pruebas con diferentes materiales (aluminio, vidrio, madera, hielo, etc) para ver si mi = mg en todos los casos. Con experimentos en los que intervienen fuerzas ficticias también se puede cuestionar si mi es verdaderamente igual a mg para objetos de diferente composición qu´ımica. Esto fue lo que hizo Eötvös a fines del siglo XIX, obteniendo |mg /mi −1| < 10−9 , y experimentos más recientes llegan a |mg /mi − 1| < 10−11 . Conviene recalcar que cuando se determina que mi = mg para un objeto dado no se logra gran cosa ya que, como hemos anotado, el valor de la constante gravitacional G se ajusta precisamente para que eso ocurra. Lo importante es que mi = mg resulte válido para todo objeto, cualquiera que sea su composición qu´ımica. Pensemos en un conjunto C de part´ıculas en ca´ıda libre que coinciden en alg´ un evento E, y supongamos adicionalmente que entre ellas no hay interacción ni choques. De acuerdo con el principio de Galileo, en el evento E todas las part´ıculas de C tienen la misma aceleración y en consecuencia la aceleración relativa entre cualesquiera dos part´ıculas de C es cero. Más a´ un, si un observador registra que todas las part´ıculas de C tienen aceleraci´ on cero respecto a él, entonces ese observador también est´ a en ca´ıda libre en E.

11.3

Coordenadas geod´ esicas

El proceso de dos transformaciones sucesivas que vimos en la sección 9.20 tiene un caso especial, y es cuando se desea que el tensor métrico final, evaluado en E , sea el de Minkowski ηµν : Corolario: Es posible [13] erigir unas coordenadas tales que en un evento E: a) la métrica sea ηαβ , y b) todos los s´ımbolos de Christoffel sean cero. El sistema coordenado en el que se satisfacen las condiciones de este corolario se llama coordenadas geodésicas. Estas coordenadas son expresamente construidas para el evento E . Por supuesto que las coordenadas geodésicas abarcan todo el espaciotiempo, pero son construidas deliberadamente para que en el evento E la métrica tome el valor ηµν y los s´ımbolos de Christoffel 276

se vuelvan cero. El tensor métrico, en cualquier evento del espaciotiempo, será una matriz 4 × 4 complicada, pero esta matriz se vuelve ηµν en el evento E; as´ı mismo, los s´ımbolos de Christoffel, en otros eventos, no son en general cero, pero se vuelven cero en el evento E. En todo el espaciotiempo el sistema coordenado geodésico es, en general, curvil´ıneo y no ortogonal; pero en E ocurre algo [15] especial: las coordenadas geodésicas se cruzan ortogonalmente, formando un sistema de ejes cartesianos. El corolario pone de manifiesto que la métrica gµν tiene cierto grado de arbitrariedad. No es muy importante el valor que adopta gµν en un evento dado (valor que podemos hacer igual a ηµν con una simple transformación de coordenadas). Tampoco son muy importantes sus primeras derivadas gµν ,α (que se pueden anular en cualquier punto con una transformación de coordenadas, como vimos al final de la sección 9.16). Lo que s´ı es muy importante es el conjunto de las segundas derivadas gµν ,α,β , pues es en ellas donde radica la información acerca de la curvatura. En efecto, ya hemos visto que con las segundas derivadas de la métrica se construye el tensor de Riemann, que es el que representa a la curvatura. Decimos entonces, en paralelo con nuestros comentarios en la página 235, que en un espacio curvo es imposible [16], con un cambio de coordenadas, volver cero todas las segundas derivadas de la métrica. Cuando un espacio es curvo, no existe ning´ un sistema coordenado en el que todas las segundas derivadas sean cero. Y si es plano, existen sistemas coordenados en los que todas las segundas derivadas de la métrica son cero.

11.4

El principio de equivalencia

Ahora procedemos a combinar las ideas principales de las tres u ´ltimas secciones. Una part´ıcula en ca´ıda libre cumple la ecuación diferencial de las geodésicas (10.11). Esta ecuación es válida en todos los sistemas coordenados, y ahora nos conviene escribirla utilizando coordenadas geodésicas: d2 x ¯α xµ d¯ xν ¯ α d¯ = 0 + Γ µν dτ 2 dτ dτ Supongamos que esta part´ıcula pasa por el evento E. Esto significa que podemos evaluar en E todos los términos de la u ´ltima ecuación, obteniendo ¯ ¯ d¯ xµ d¯ d2 x ¯ α ¯¯ xν ¯¯ α ¯ + Γ µν (E) = 0 dτ 2 ¯E dτ dτ ¯E 277

¯ α (E) = 0, entonces Pero Γ µν ¯ d2 x ¯ α ¯¯ = 0 dτ 2 ¯E

(11.3)

No olvidemos, tal como vimos en la sección 11.3, que en E las coordenadas geodésicas se cruzan ortogonalmente formando un sistema de ejes cartesianos. Esto indica claramente que (11.3) es la ecuación más conocida de la f´ısica elemental: (11.3) es la ecuación de la trayectoria de una part´ıcula en equilibrio. Vemos as´ı que para un observador que erija un sistema de coordenadas geodésicas centradas en E, las part´ıculas en ca´ıda libre que pasan por E tienen, respecto a ese sistema de referencia, aceleración cero. Entonces, invocando la frase escrita en bastardilla en la página 276, podemos afirmar que ese observador también está en ca´ıda libre. Digámoslo as´ı: un observador en ca´ıda libre en E registra que las part´ıculas en ca´ıda libre que pasan por E tienen, respecto a ese observador, aceleración cero. Hay dos situaciones diferentes: 1) De un lado, la part´ıcula libre en la relatividad especial, estudiada en coordenadas cartesianas. 2) De otro lado, la part´ıcula en ca´ıda libre estudiada por un observador en ca´ıda libre que usa coordenadas geodésicas. Al primer problema le corresponde la ecuación (6.35) y al segundo la ecuación (11.3). La misma ecuación se aplica a dos situaciones diferentes. Uno podr´ıa pensar que las dos situaciones, aunque diferentes, son, de alguna manera, equivalentes. En conclusión, un observador en ca´ıda libre en E que use coordenadas geodésicas, registra que las part´ıculas en ca´ıda libre que pasan por E cumplen la misma ecuaci´ on que satisfac´ıan las part´ıculas libres en ausencia de gravitaci´ on, en la relatividad especial, en coordenadas cartesianas. Pero la ecuación de part´ıcula libre no es la u ńica ecuación diferencial importante en la f´ısica. También hay otras ecuaciones diferenciales importantes, como por ejemplo (6.31), (6.32) y (7.32). En este punto hacemos una suposición crucial: asumir que la equivalencia recién mencionada se aplica, no sólo a la ecuación de part´ıcula libre, sino además a todas las ecuaciones tensoriales que expresan leyes f´ısicas en la relatividad especial en coordenadas cartesianas: para un observador en ca´ıda libre en E que use coordenadas geodésicas, las ecuaciones que expresan las leyes de la f´ısica son las mismas que se cumpl´ıan en ausencia de gravitaci´ on, en la relatividad especial, en coordenadas cartesianas. Este es el Principio de Equivalencia. Con el propósito de dar un 278

ejemplo de la utilización de este Principio, tomemos las tres ecuaciones tensoriales mencionadas (6.31), (6.32) y (7.32); de acuerdo con el Principio de Equivalencia: ¯ ¯ F¯ µν,µ ¯

E

¯ 4π ¯ν ¯¯ = J ¯ c E

¢¯ ¡ F¯µν ,α + F¯αµ,ν + F¯να,µ ¯E = 0 ¯ ¯ T¯µν,ν ¯ = 0 E No olvidemos que en coordenadas geodésicas, y en E, los s´ımbolos de Christoffel valen cero. Esto implica que en coordenadas geodésicas, y en E, la operación coma (,) coincide con la operación punto y coma (;). O sea que en las tres u ´ltimas ecuaciones podemos escribir (;) en vez de (,): ¯ ¯ 4π ¯ν ¯¯ ¯ F ;µ ¯ = J ¯ c E E ¢¯ ¡ F¯µν ;α + F¯αµ;ν + F¯να;µ ¯E = 0 ¯ µν ¯ ¯ T ;ν ¯ = 0 ¯ µν

E

Estas ecuaciones tensoriales están escritas de manera manifiestamente covariante; por esta razón, como son válidas en coordenadas geodésicas, también han de ser válidas en cualquier otro sistema de coordenadas: ¯ ¯ 4π ν ¯¯ F µν ;µ ¯E = J ¯ c E ¡ ¢¯ Fµν ;α + Fαµ;ν + Fνα;µ ¯E = 0 ¯ T µν ;ν ¯E = 0 Estas ecuaciones son válidas en el evento E. Pero, como E no es un evento especial, ecuaciones similares deben cumplirse en cualquier otro evento. En consecuencia, podemos eliminar el sub´ındice E: 279

F µν ;µ =

4π ν J c

Fµν ;α + Fαµ;ν + Fνα;µ = 0

(11.4)

T µν ;ν = 0

La regla (,) → (;) El paso de las ecuaciones (6.31)-(6.32)-(7.32) a las ecuaciones (11.4) se hace cambiando la derivada simple (,) por la derivada covariante (;). Esta regla, en general, dice que para escribir la ecuación diferencial de un campo en presencia del campo gravitatorio se siguen dos pasos: el primero es escribir la ecuación diferencial tal como se la conoce familiarmente en la relatividad especial, en coordenadas cartesianas; el segundo paso es cambiar (,) por (;). Esta fórmula se conoce como la regla cambiar coma por punto y coma. La regla se expresa en palabras tan simples que uno corre el riesgo de creer, equivocadamente, que el paso de unas ecuaciones a las otras es simple. En realidad el paso dista de ser simple, como puede apreciarse en la siguiente observaci´ on: En las ecuaciones (6.31)-(6.32)-(7.32) las coordenadas son cartesianas, no hay campo gravitatorio y las cantidades xµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones de Lorentz. En cambio, en las ecuaciones (11.4) las coordenadas son generales, hay campo gravitatorio y las cantidades dxµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones generales de coordenadas. Con esta observación queremos resaltar que (,) → (;) es una regla estrictamente simbólica, visual.

La ecuaci´ on T µν;ν = 0. Veamos en detalle los pasos que conducen de (7.32) a la u ´ltima de las ecuaciones (11.4). Ante todo, el tensor T µν de la ecuación (7.32) representa todas las formas de energ´ıa-momentum (calor´ıfica, potencial, masas en reposo, etc.) excepto la energ´ıa-momentum del campo gravitatorio. Esto es claro, porque en la relatividad especial no hay campo gravitacional. Ahora, al usar la regla (,) → (;) se llega a la u ´ltima de las ecuaciones (11.4). En esta u ´ltima ecuación T µν significa lo mismo que significaba en (7.32): todas las formas de energ´ıa-momentum, excepto la energ´ıa-momentum del campo gravitatorio. Consignemos esta idea en una frase corta que será importante en la construcción de la ecuación del campo gravitatorio en el cap´ıtulo 12: si T µν es el tensor que recoge todas las formas de energ´ıa-momentum que no son gravitatorias, este tensor cumple la ecuaci´ on T µν;ν = 0 en presencia de un campo gravitacional. 280

11.5

El acople m´ınimo

Vamos a ver el principio de equivalencia desde otra perspectiva [11]. Para tal efecto nos planteamos el siguiente ejercicio interesante: tomar las ecuaciones de la relatividad especial escritas en coordenadas cartesianas y, para a˜ nadir los efectos de la gravitación, sumarles a esas ecuaciones algunos otros términos que contengan altas derivadas del tensor métrico. Tomemos por ejemplo la ecuación (6.31) para sumarle términos que contengan primeras, segundas, terceras,... derivadas de gµν : F µν ,µ =

4π ν J + [1g] + [2g] + [3g] + · · · c

El s´ımbolo [3g] quiere decir “términos que contienen linealmente la tercera derivada del tensor métrico”. Ahora, los términos [1g] son como el s´ımbolo de Christoffel, los términos [2g] son como el tensor de Riemann, los [3g] son como la primera derivada del tensor de Riemann, etc.: F µν ,µ =

4π ν J + [Christ] + [Riem] + [1Riem] + [2Riem] + · · · c

Aqu´ı, [Christ] representa a los términos que contienen al s´ımbolo de Christoffel, [2Riem] representa a los términos que contienen segundas derivadas del tensor de Riemann, etc. Algunos términos de la forma [Riem] podr´ıan ser Rν αβρ F αβ Aρ , Rνβ βα F αρ Aρ , Rαβ F αβ Aν , RF να Aα , etc. Algunos términos de la forma [1Riem] podr´ıan ser R;δ F να Fα δ , Rαβ ;δ Aα Aβ Aδ Aν , etc. El principio de equivalencia afirma que, al incluir los efectos de la gravitaci´ on, los términos [Riem], [1Riem], [2Riem] · ·· no aparecen; dicho de otra manera, que esos términos aparecen multiplicados por unos coeficientes que son cero. Los términos [1Riem], por ejemplo, aparecen del modo 0[1Riem] ; el factor [1Riem] expresa la posibilidad, la legitimidad matemática de que la gravitación se acople a los fenómenos f´ısicos a través de la primera derivada del tensor de Riemann; pero el coeficiente 0 que lo acompa˜ na dice que tal posibilidad, estrictamente matemática, no se realiza en el mundo f´ısico. Algunas leyes f´ısicas se expresan mediante ecuaciones diferenciales. El campo gravitatorio no entra en esas ecuaciones diferenciales a través del tensor de Riemann ni a través de ninguna de las derivadas de Rν αβρ . El acople gravitatorio se realiza u ńicamente a través del s´ımbolo de Christoffel, es decir, 281

a través de la operación punto y coma (;). A esto se le dice el acople m´ınimo: sólamente a través de los s´ımbolos de Christoffel el campo gravitatorio influye en las ecuaciones tensoriales que expresan a las leyes f´ısicas.

11.6

Ejemplos

Queremos mostrar en ejemplos concretos la manera como aparecen los s´ımbolos de Christoffel cuando se trata de incluir la influencia del campo gravitatorio. Para tal efecto, en las ecuaciones de Maxwell y las leyes de conservaci´ on (6.31)-(6.32)-(7.13)-(7.32) cambiamos coma por punto y coma: F µν ;µ =

4π ν J c

(11.5)

Fµν ;α + Fαµ;ν + Fνα;µ = 0

(11.6)

J µ ;µ = 0

(11.7)

T µν ;µ = 0

(11.8)

Estudiemos primero las dos ecuaciones inhomogéneas de Maxwell. Utilizando (9.73) en (11.5) se llega a: F µν ,µ + Γµ αµ F αν + Γν µα F µα =

4π ν J c

(11.9)

Ahora, Γν µα es simétrico bajo el intercambio µ α, mientras que F µα es antisimétrico; entonces, de acuerdo con (5.38), el término Γν µα F µα es cero y la ecuación (11.9) queda as´ı: F µν ,µ + Γµ αµ F αν =

4π ν J c

Utilizando (9.74) en (11.6) se llega a: Fµν ,α − Γρ να Fµρ − Γρ µα Fρν + Fαµ,ν − Γρ αν Fρµ − Γρ µν Fαρ + Fνα,µ − Γρ νµ Fρα − Γρ αµ Fνρ = 0 282

Esta ecuación se puede reescribir as´ı: Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν + Γρ αµ Fνρ ) − (Γρ να Fµρ + Γρ αν Fρµ ) − (Γρ µν Fαρ + Γρ νµ Fρα ) = 0 , es decir: Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν − Γρ µα Fρν ) − (Γρ να Fµρ − Γρ να Fµρ ) − (Γρ µν Fαρ − Γρ µν Fαρ ) = 0 Obsérvese que en esta ecuación son cero las cantidades contenidas en los tres paréntesis, lo que nos permite escribir Fµν ,α + Fαµ,ν + Fνα,µ = 0. Hemos descubierto, curiosamente, que si en la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0 se cambia punto y coma por coma, lo que queda es también una ecuación covariante: Fµν ;α + Fαµ;ν + Fνα;µ = 0 ⇔ Fµν ,α + Fαµ,ν + Fνα,µ = 0

(11.10)

En otras palabras: la ecuación Fµν ;α + Fαµ;ν + Fνα;µ = 0 no contiene s´ımbolos de Christoffel. Ataquemos ahora la tercera ecuación (11.7) con ayuda de (9.71); se obtiene J µ ,µ + Γµ αµ J α = 0. Finalmente desarrollemos la ecuación (11.8); utilizamos la fórmula (9.73) y llegamos a T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0. En resumen as´ı son las leyes de conservaci´ on y las ecuaciones de Maxwell en presencia de un campo gravitatorio: J µ ,µ + Γµ αµ J α = 0

(11.11)

T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0

(11.12)

4π ν J c

(11.13)

Fµν ,α + Fαµ,ν + Fνα,µ = 0

(11.14)

F µν ,µ + Γµ αµ F αν =

283

Schwarzschild. Estas cuatro ecuaciones son válidas en general, cualquiera que sea el campo gravitacional. Conviene desarrollarlas en detalle para un caso particular. Hay un campo gravitacional muy conocido, que es el causado por una masa puntual M que no tiene carga eléctrica ni momentum angular. Este se conoce como la solución de Schwarzschild, y lo estudiaremos en el cap´ıtulo 13. Los s´ımbolos de Christoffel de ese campo gravitacional (sección 13.2) son: Γ0 01 = Γ0 10 =

s 2r(r − s)

s(r − s) 2r3 = −r + s

s 2r(r − s) = −(r − s) sen2 θ

Γ1 00 =

Γ1 11 = −

Γ1 22

Γ1 33

Γ2 33 = − sen θ cos θ Γ3 13 = Γ3 31 =

Γ2 12 = Γ2 21 =

1 r

1 r

Γ3 23 = Γ3 32 = cot θ

En estas expresiones, s = 2GM/c2 es una medida de la masa M , aunque tiene unidades de longitud. Vemos aqu´ı, de manera patente, que el campo gravitacional afecta a los s´ımbolos de Christoffel. Cuando s = 0 se tiene M = 0, el campo gravitacional se anula y el espaciotiempo se aplana; en tal caso estos s´ımbolos regresan a la forma que ten´ıan en el espaciotiempo plano en coordenadas esféricas. No olvidemos que estamos con coordenadas esféricas, o sea que, por ejemplo, T 12 significa T rθ , etc. Las leyes de conservaci´ on. Utilizando los s´ımbolos de Christoffel recién escritos, las ecuaciones de conservaci´ on (11.11) y (11.12) quedan as´ı: 2 r J + J θ cot θ = 0 r 2 s 1 T µt,µ + T tr + T tθ cot θ = − 2 T tr r 2r 1 − s/r J µ ,µ +

2 rr T + T rθ cot θ − r T θθ − rT ϕϕ sen2 θ r ´ 1 s ³ T rr − sT θθ − sT ϕϕ sen2 θ = − 2 (1 − s/r) T tt − 2r 1 − s/r

T µr,µ +

284

4 rθ T + T θθ cot θ − T ϕϕ sen θ cos θ = 0 r 4 T µϕ,µ + T rϕ + 3T θϕ cot θ = 0 r

T µθ,µ +

Estas cinco ecuaciones están escritas de modo sugestivo. Toda dependencia con s aparece en los lados derechos. Este ejemplo muestra claramente que el campo gravitatorio influye en algunas de las ecuaciones diferenciales que expresan a las leyes de conservaci´ on. Si M = 0 se tiene s = 0, el campo gravitacional se anula, los lados derechos de estas ecuaciones se vuelven cero y las ecuaciones regresan a la forma que ten´ıan en el espaciotiempo plano. Las ecuaciones de Maxwell. Acabamos de comentar que la presencia del campo gravitatorio no influye en las dos ecuaciones homogéneas de Maxwell, debido a que en la ecuación (11.14) no hay s´ımbolos de Christoffel. Veamos ahora las dos ecuaciones inhomogéneas de Maxwell, contenidas en (11.13). En esta ecuación s´ı hay s´ımbolos de Christoffel y es posible, en principio, que a través de ellos el campo gravitatorio manifieste su presencia. En el caso particular de Schwarzschild, utilizamos los s´ımbolos de Christoffel que escribimos en la página 284. Colocando estos s´ımbolos en las ecuaciones (11.13) se llega, al final, a un resultado curioso: la variable s desaparece. O sea que el campo gravitatorio de Schwarzschild tampoco se manifiesta en las dos ecuaciones inhomogéneas de Maxwell. En conclusión, en el espaciotiempo de Schwarzschild el campo gravitatorio no se manifiesta en ninguna de las ecuaciones de Maxwell.

285

286

Cap´ıtulo 12

La ecuaci´ on del campo gravitatorio La ecuación de Poisson: ∇2 Φ = 4πGρ

(12.1)

es la fórmula maestra de la gravitaci´ on newtoniana. En el lado izquierdo aparecen las segundas derivadas del campo gravitatorio Φ, y al lado derecho aparece la densidad de masa ρ, que es la fuente, la causa del campo. Si las cantidades que intervienen en esta fórmula fueran tensores bajo el grupo de las transformaciones generales de coordenadas, tendr´ıamos una ecuación tensorial, y nos sentir´ıamos satisfechos. Pero ni ∇2 , ni Φ ni ρ son tensores, y por eso la fórmula es insatisfactoria. Queremos construir una ecuación tensorial que sea una generalización de (12.1). Más precisamente, una nueva fórmula en la que todas las cantidades sean tensores y que contenga, como caso particular, a la ecuación (12.1). Se espera que la nueva fórmula sea la expresión de una nueva teor´ıa gravitacional más amplia que contenga, como caso l´ımite, a la vieja teor´ıa gravitacional de Newton. Es claro que para generalizar una ecuación no hay un camino u ńico, sino que se presentan varias posibilidades. En este cap´ıtulo seguiremos el camino de Einstein y llegaremos a la célebre ecuación Rµν −

8πG 1 gµν R = 4 Tµν , 2 c

(12.2)

donde Rµν es el tensor de Ricci, R es el escalar de curvatura, Tµν el tensor de energ´ıa y momentum y G = 6.670 × 10−8 cm3 gr−1 seg−2 es la constante de la gravitación universal. Veremos que la ecuación (12.2) surge como una generalización natural de (12.1). Einstein construyó esta ecuación en un proceso 287

penoso que le tomó varios a˜ nos y que concluyó [17, 18, 19, 20] en noviembre de 1915. Curiosamente, Hilbert se adelant´ o a Einstein y publicó esta fórmula cinco d´ıas antes [21]. Por tal motivo (12.1) se llama la ecuaci´ on de Hilbert-Einstein. Acabamos de anotar que (12.1) admite varias generalizaciones, o sea que (12.1) ; (12.2). Para recorrer el camino que conduce de (12.1) a (12.2) vamos a proponer algunos argumentos que, aunque no son rigurosos, s´ı son razonables y convincentes. Es aqu´ı, en los argumentos convincentes, donde puede apreciarse el mérito de la propuesta gravitacional de Einstein.

12.1

El l´ımite newtoniano

Si calculamos el valor numérico de Φ/c2 en la superficie del Sol o de la Tierra, obtenemos Φ/c2 ≈ −10−6 y −10−9 , respectivamente. Esto indica que en el sistema solar el campo gravitacional es muy débil. Además las velocidades de los planetas y sus satélites son muy bajas en comparación con c. El régimen de campo débil y bajas velocidades se llama el l´ımite newtoniano. Es aqu´ı, en el l´ımite newtoniano, donde la vieja teor´ıa gravitacional es exitosa. En efecto, la capacidad predictiva y explicativa de esa teor´ıa se ha mostrado en m´ ultiples problemas que ata˜ nen al movimiento de los planetas y sus lunas. La nueva teor´ıa gravitacional que nosotros construyamos debe reproducir los resultados de la vieja teor´ıa en aquellos casos que se encuentran dentro del l´ımite newtoniano.1

12.2

Los 10 potenciales gµν

El campo gravitacional afecta las trayectorias de las part´ıculas y afecta la evolución de los otros campos. En el cap´ıtulo 11 vimos que la gravitaci´ on se acopla con las trayectorias a través de las geodésicas, y se acopla con los otros campos a través del s´ımbolo de Christoffel Γα µν . La gravitaci´ on podr´ıa ser un asunto geométrico: ella se manifiesta a través de las propiedades geométricas del espaciotiempo. ¿Cuál de las propiedades geométricas del espaciotiempo expresa al campo gravitacional? Tenemos a nuestra disposición muchas cantidades geométricas: gαβ , det(g), Γµαβ , gαβ,µ , Γµαβ,δ , Rαβµν , Rβµ , R : ¿cuál de ellas representa al campo gravitacional? De todas las posibilidades escogeremos a gαβ para representar al campo, basados en una secuencia de 1 Advertencia: Hay muchas situaciones interesantes que no est´ an en el l´ımite newtoniano, como por ejemplo el viaje de un pulso de luz. La velocidad de la luz no es baja.

288

ideas, muy laxa, que expondremos enseguida. De acuerdo con la gravitaci´ on newtoniana, la aceleración de una part´ıcula en ca´ıda libre es −∇Φ:

aceleración ∼

∂Φ ∂x

(12.3)

De otro lado, recordemos la hipótesis geodésica que vimos en la sección 11.1: las part´ıculas que caen libremente siguen curvas geodésicas, o sea que cumplen la ecuación (10.11): d2 x dx dx ∼ Γ 2 dτ dτ dτ El lado izquierdo de esta fórmula es como aceleración, entonces: aceleraci´ on ∼ Γ

Recordemos, de acuerdo con la definición (9.57), que Γ es como las derivadas de gµν . O sea que la u ´ltima fórmula es

aceleración ∼

∂gµν ∂x

(12.4)

Finalmente conectamos los lados derechos de (12.3) y (12.4) para escribir ∂gµν ∂Φ ∼ , es decir, ∂x ∂x gµν ∼ Φ Esta fórmula asocia el campo gravitacional newtoniano, que es Φ, con el tensor métrico: de esta manera se justifica la propuesta de escoger al tensor métrico gµν como el campo gravitacional en la teor´ıa que queremos construir. La teor´ıa que buscamos debe coincidir con la vieja teor´ıa gravitacional en el l´ımite newtoniano y por eso esperamos que, en ese l´ımite, gµν coincida con Φ. Pero gµν tiene diez componentes independientes: ¿cuál de las diez es la que coincide con Φ? 289

12.3

El potencial g00 en coordenadas cartesianas

Para responder esta pregunta regresemos al estudio de una part´ıcula en ca´ıda libre en coordenadas cartesianas xµ = (ct, x, y, z). La ecuación (5.54) muestra que la componente U 0 es mucho mayor que las otras tres U a , o sea que dxa /dτ es despreciable en comparación con dx0 /dτ , y la ecuación (10.11) se convierte en d2 xα dτ 2

dx0 dx0 dτ dτ µ ¶2 dt 2 α = −c Γ 00 dτ ≈ −Γα00

(12.5)

Para desarrollar esta ecuación debemos calcular el s´ımbolo de Christoffel Γα00 . De acuerdo con la definición (9.57): 1 Γα00 = g ασ (gσ0,0 + g0σ,0 − g00,σ ) 2 En este momento suponemos, para simplificar el problema, que el campo es estático, o sea que todas las derivadas temporales son cero: gσ0,0 = g0σ,0 = 0. En la u ´ltima ecuación sólo sobreviven las derivadas espaciales g00,b : 1 Γα00 = − g αb g00,b 2

(12.6)

Si el campo es débil podemos escribir gαβ = ηαβ + hαβ ,

(12.7)

donde ηαβ es la métrica de Minkowski (5.2) y hαβ es una matriz 4 × 4 en la que todas sus componentes son muy peque˜ nas: |hαβ | ¿ 1. La ecuación 1 1 αb αb (12.6) es entonces Γα00 = − (η +h )(η00,b +h00,b ) = − (η αb +hαb )h00,b = 2 2 1 αb − η h00,b + términos de orden 2, que despreciaremos. La ecuación (12.5) 2 queda aproximadamente 290

d2 xα c2 αb = η h00,b dτ 2 2

µ

dt dτ

¶2

Escribamos esta ecuación para α = 0 y para α = a: d2 t = 0 dτ 2 µ ¶2 d2 r c2 dt = − ∇h00 2 dτ 2 dτ

(12.8)

La primera de estas ecuaciones dice que dt = constante dτ

(12.9)

Dejemos esto all´ı un momento, mientras nos concentramos en la derivada d/dτ . La regla de la derivación en cadena dice que d/dτ = (dt/dτ )(d/dt) , de donde d2 dt d dt d d d = , = 2 dτ dτ dτ dτ dt dτ dt y usando (12.9): d2 = dτ 2

µ

dt dτ

¶2

d2 dt2

Utilizamos esto en el lado izquierdo de (12.8) para escribir d2 r c2 = − ∇h00 dt2 2 De otro lado, la gravitación newtoniana dice que d2 r = −∇Φ, dt2 Igualemos ahora los lados derechos de las dos u ´ltimas ecuaciones: 291

∇h00 = h00 =

2 ∇Φ c2 2Φ + constante c2

La constante de integraci´ on que aparece en el lado derecho de esta ecuación se puede averiguar en cualquier punto del espacio. Escojamos un punto donde Φ sea cero. En ese punto la métrica gµν es igual a ηµν , y en consecuencia hµν es cero. Colocando estos valores en la u ´ltima ecuación descubrimos que la constante es cero, o sea que: h00 =

2Φ c2

g00 = 1 +

(12.10) 2Φ c2

en el l´ımite newtoniano

(12.11)

Aprendemos as´ı que de los diez potenciales relativistas hay uno, g00 , que está conectado al potencial newtoniano Φ de acuerdo con la u ´ltima ecuación. El análisis recién hecho establece qué es g00 , pero no da información acerca de los otros nueve potenciales.

12.4

La ecuaci´ on de Hilbert-Einstein

Ha llegado el momento de construir una ecuación tensorial de fuentes para el campo gravitatorio gµν . Con este propósito, vamos a apoyarnos en el ejemplo que nos dan las dos grandes ecuaciones de fuentes de la f´ısica clásica, que son (12.1) y (6.19). Estas dos ecuaciones tienen varios aspectos en com´ un: al lado derecho aparece la fuente del campo y al lado izquierdo aparecen derivadas del campo. Demos el primer paso diciendo que buscamos una ecuación de la forma: Alguna función de las derivadas de gµν es ∼ ρ

(12.12)

Ahora, ρc2 no es un tensor, sino solamente la componente T00 de alg´ un tensor Tµν de energ´ıa-momentum. Por el momento no tenemos una idea clara de qué es este tensor: no estamos seguros de si Tµν contiene o excluye los aportes del campo gravitatorio. Como queremos una ecuación tensorial escribimos Tµν en vez de ρ en el lado derecho de (12.12). Entonces el lado izquierdo también tiene que ser un tensor de rango 2: 292

Alg´ un tensor de rango 2 que es derivadas de gµν es ∼ Tµν

(12.13)

Las dos ecuaciones clásicas que sirven de modelo, (12.1) y (6.19), tienen en el lado izquierdo derivadas del campo. Estas derivadas no son de grado superior a 2, y las derivadas de grado 2 aparecen linealmente. Para seguir el ejemplo queremos proponer ahora una ecuación de ese estilo, o sea que en el lado izquierdo de (12.13) queremos escribir alg´ un tensor de rango 2 con las siguientes propiedades: 1) puede tener gµν y gµν,α 2) debe tener segundas derivadas gµν,α,β y 3) las segundas derivadas gµν,α,β deben aparecer linealmente. Acudimos a los enunciados (9.109) y (9.110) para afirmar que la forma más general del lado izquierdo de (12.13) es una combinaci´ on lineal de Rµν , R y gµν : aRµν + b0 gµν R + Λ0 gµν = κ0 Tµν , donde a, b0 , Λ0 y κ0 son constantes. Dividiendo ambos lados por a llegamos a: Rµν + bgµν R + Λgµν = κTµν ,

(12.14)

donde b, Λ y κ son constantes que debemos determinar. Subiendo ´ındices en la u ´ltima ecuación se obtiene: Rµν + bg µν R + Λg µν = κTµν

(12.15)

Averiguar la constante b y precisar qu´ e es Tµν : Si se toma la divergencia covariante (punto y coma) en ambos lados de la u ´ltima ecuación se llega a: Rµν; ν + bg µν R; ν + bg µν; ν R + Λg µν; ν = κTµν; ν En el lado izquierdo los dos u ´ltimos términos son cero debido a la identidad (9.79). Queda: Rµν; ν + bg µν R; ν = κTµν; ν Hasta el momento no hemos tenido necesidad de precisar qué es Tµν . De 293

otro lado, la constante b est´ a todav´ıa sin determinar. Resolveremos estas dos ambig¨ uedades con un solo movimiento. Digamos que Tµν re´ une todas las formas de energ´ıa-momentum que no son gravitatorias; la frase escrita en bastardilla en la página 280 afirma que Tµν; ν = 0, de modo que la u ´ltima ecuación es: Rµν; ν + bg µν R; ν = 0 y al comparar esto con la identidad de Bianchi (9.104) descubrimos que b = −1/2 . La ecuación (12.14) queda as´ı: Rµν −

1 gµν R + Λgµν = κTµν 2

(12.16)

Hemos escrito T µν en vez de Tµν para seguir nuestra notación habitual. Quede claro que el T µν que aparece en la ecuación (12.16) recoge todas las formas de energ´ıa-momentum, excepto la contribuci´ on del campo gravitatorio. Por supuesto que el campo gravitatorio tiene energ´ıa y momentum, pero éstos no hacen parte del T µν de la ecuación (12.16). La constante Λ: La propuesta inicial [20] de Einstein fue con Λ = 0: Rµν −

1 gµν R = κTµν 2

(12.17)

En esta ecuación podemos subir el ´ındice µ para obtener Rµν − 21 g µν R = κT µν . Si además hacemos ν = µ escribimos Rµµ − 12 g µµ R = κT µµ . La traza Rµµ es el escalar de curvatura R, y la traza g µµ es igual a 4. Queda entonces R − 2R = κT µµ : R = −κT µµ

(12.18)

Con este resultado la ecuación (12.17) deviene Rµν

µ ¶ 1 α = κ Tµν − gµν T α 2

En particular, la componente R00 es 294

(12.19)

µ ¶ 1 R00 = κ T00 − g00 T αα 2

(12.20)

La constante κ: Nos queda por determinar la constante κ, y para hacerlo queremos obligar a la gravitación einsteiniana a que contenga a la newtoniana. En particular, haremos que la nueva teor´ıa coincida con la vieja en el l´ımite newtoniano. Para ejecutar este proyecto obligaremos a la ecuación (12.20) a que coincida con (12.1) cuando el campo es débil y las velocidades son bajas: al establecer esta coincidencia quedará determinado el valor de la incógnita κ. De acuerdo con la ecuación (12.7), las derivadas de gαβ son iguales a las derivadas de hαβ , y en vista del enunciado (9.59) podemos afirmar que Γ es como las derivadas de hµν . En consecuencia los productos Γ Γ son de orden 2 en potencias de hµν y, suponiendo que este campo hµν es débil, podremos despreciar los productos Γ Γ en el lado derecho de la definición (9.77): Rλµνσ ≈ Γλµν,σ − Γλµσ,ν El tensor de Ricci Rµν = Rλµνλ es, entonces, Rµν ≈ Γλµν,λ − Γλµλ,ν En el lado derecho usamos la definición (9.57) para escribir Rµν =

i i 1 h λρ 1 h λρ g (gρµ,ν + gνρ,µ − gµν,ρ ) − g (gρµ,λ + gλρ,µ − gµλ,ρ ) 2 2 ,λ ,ν

Usamos la fórmula (12.7) y despreciamos términos cuadráticos en hµν ; de esta manera se llega a Rµν

=

i i 1 h λρ 1 h λρ η (hρµ,ν + hνρ,µ − hµν,ρ ) − η (hρµ,λ + hλρ,µ − hµλ,ρ ) 2 2 ,λ ,ν

=

1 λρ η [hνρ,µ,λ − hµν,ρ,λ − hλρ,µ,ν + hµλ,ρ,ν ] 2

Concentrarse en la componente R00 : 295

R00 =

1 λρ η [h0ρ,0,λ − h00,ρ,λ − hλρ,0,0 + h0λ,ρ,0 ] 2

Si el campo es estático las derivadas respecto a x0 son cero (recuérdese que en coordenadas cartesianas x0 = ct) y queda 1 R00 = − η λρ h00,ρ,λ 2 De nuevo, las derivadas respecto a x0 son cero, o sea que en el lado derecho de esta ecuación sobreviven u ńicamente los ´ındices latinos, y podemos escribir 1 ab 1 R00 = − η h00,a,b , es decir R00 = ∇2 h00 , y en vista de (12.10) llegamos 2 2 finalmente a R00 =

1 2 ∇ Φ c2

(12.21)

Este es el lado izquierdo de (12.20). Ahora transformemos el lado derecho de (12.20) que es: ¶ µ 1 (12.22) κ g0µ g0ν T µν − g00 gαβ T αβ 2 La ecuación (5.58) dice que, a bajas velocidades, p0 À pa . Entonces, de acuerdo con (7.16), podemos afirmar que T 00 À T a0 y T 00 À T ab . Bajo estas condiciones la expresión (12.22) es, aproximadamente, µ ¶ 1 1 κ (g00 )2 T 00 − (g00 )2 T 00 = κ(g00 )2 T 00 2 2

(12.23)

De otro lado, apuntamos en la página 166 que T 00 es la densidad de energ´ıa ρc2 , entonces (12.23) es 1 κρc2 (g00 )2 2 Ya podemos igualar las expresiones (12.21) y (12.24): 1 1 2 ∇ Φ = κρc2 (g00 )2 2 c 2 296

(12.24)

De nuevo, para campo débil la ecuación (12.11) da g00 = 1 + ∇2 Φ =

2Φ ≈ 1: c2

1 κρc4 , 2

y comparando con (12.1) descubrimos que κ = 8πG/c4 . La ecuación (12.17) queda finalmente as´ı: Rµν −

1 8πG gµν R = 4 Tµν 2 c

(12.25)

Esta es la ecuaci´ on de Hilbert-Einstein que quer´ıamos construir. De otro lado, la ecuación (12.18) se convierte en R = −

8πG α T α c4

(12.26)

Al poner esto en la ecuación (12.25) llegamos a ¶ µ 8πG 1 αβ α β Tαβ Rµν = 4 gµ gν − gµν g c 2 Obsérvese que Tαβ = 0

⇒

Rµν = 0

(12.27)

Ya hemos dicho que Tαβ recoge todas las formas de momentum y energ´ıa diferentes a las producidas por el campo gravitatorio. Las ecuaciones Tαβ = 0 y Tαβ 6= 0, no dicen nada acerca de la energ´ıa-momentum del campo gravitatorio. Lo que s´ı podemos afirmar es que si en alg´ un evento se cumple Tαβ = 0, cualquier energ´ıa-momentum que en ese evento haya proviene, sin duda, del campo gravitacional. Supongamos por ejemplo que el u ńico objeto del universo es un astro de radio a. En la región r < a los tensores Tαβ y Rµν son, en general, diferentes de cero. Ahora estudiemos lo que ocurre en la región r > a: 1) Si el planeta tiene cargas o corrientes eléctricas se genera un campo electromagnético y, 297

por consiguiente, hay un Tαβ 6= 0: el tensor Rµν no es, en general, cero. 2) Si el planeta no es fuente de campo electromagnético se cumple que Tαβ = 0 y en consecuencia Rµν = 0 . Debemos hacer un comentario acerca de T µν . Nótese que el lado izquierdo de la ecuación (12.25) es simétrico bajo el intercambio de los ´ındices µ y ν, lo que quiere decir que Tµν también tiene que ser simétrico (Tµν tiene que ser igual a Tνµ ). Si Tµν no es simétrico, la ecuación de Hilbert-Einstein es inconsistente. Al enfrentar cualquier problema particular, debemos revisar juiciosamente que el tensor de energ´ıa-momentum que estamos usando sea verdaderamente simétrico. Por ejemplo, el tensor de la ecuación (8.52) es asimétrico, y por eso no se puede usar en la ecuación de Hilbert-Einstein. Pero el tensor de la ecuación (8.59) s´ı es simétrico, y en consecuencia es l´ıcito usarlo en la ecuación (12.25).

12.5

Las coordenadas

Antes de concluir este cap´ıtulo es conveniente que nos detengamos para establecer algunas nociones generales acerca de las soluciones de la ecuación del campo gravitatorio (12.25). Cuando se trata de resolver esta ecuación en un problema particular, es necesario escoger las coordenadas xµ que mejor se ajustan a las condiciones particulares del problema. En principio, la escogencia de las cuatro coordenadas es bastante libre y puede ser, incluso, caprichosa, como la que propone Ohanian [13]: Para las coordenadas espaciales de un punto P se utilizan los rayos de luz de tres estrellas fijas (amarilla, azul y roja) no colineales, como muestra la Figura 12.1; se adoptan como coordenadas espaciales los tres ángulos que se forman entre los tres rayos que convergen en P . La coordenada temporal se establece con otra estrella (blanca) móvil; se adopta como coordenada temporal el ángulo formado en P por los rayos rojo y blanco. A la coordenada x0 no se le dice tiempo sino, en general, coordenada temporal; esto es entendible, ya que x0 no viene necesariamente en segundos, sino que puede estar dada en metros, en radianes, etc. Tiempo universal y campo constante. Si, en un espaciotiempo dado, es posible escoger un sistema coordenado xµ tal que todas las componentes gµν sean2 independientes de la coordenada temporal x0 , entonces x0 se lla2 En tal caso x0 es una coordenada c´ıclica, y se le asocia una constante del movimiento en las curvas geodésicas (véase la secci´ on 10.3).

298

ma tiempo universal. En tal caso, decimos que el campo gravitatorio es estacionario (también se le dice constante). El tiempo universal es una coordenada c´ıclica, y en consecuencia las curvas geodésicas tienen, asociada a x0 , una constante del movimiento. Lo del tiempo universal y el campo constante es sólo de interés académico porque, estrictamente, debemos admitir [22] que sólo puede ser constante el campo producido por un cuerpo; en efecto, cuando hay varios cuerpos las atracciones mutuas producen unas aceleraciones que hacen que el campo cambie con el transcurso del tiempo. La inversi´ on del tiempo universal. Separemos los ´ındices latinos en la fórmula del intervalo (9.1): (ds)2 = g00 dx0 dx0 + gab dxa dxb + ga0 dxa dx0 + g0a dx0 dxa

(12.28)

Supongamos que x0 es un tiempo universal. La operación x0 → −x0 modifica as´ı al intervalo: (ds)2 → g00 dx0 dx0 + gab dxa dxb − ga0 dxa dx0 − g0a dx0 dxa

(12.29)

Al comparar (12.28) y (12.29) nos damos cuenta de que, en general, (ds)2 9 (ds)2 . En palabras, el intervalo es, en general, sensible a la inversi´ on del 0 0 tiempo universal x → −x . Pero si ga0 = g0a = 0 en la ecuación (12.29), llegamos a (ds)2 → (ds)2 . aticos son un subconjunto de los estaCampo est´ atico. Los campos est´ cionarios. Si, además de que los gµν sean independientes de la coordenada temporal, se cumple que ga0 = g0b = 0, decimos que el campo no sólo es estacionario sino además estático. En los campos estáticos el intervalo es insensible a la inversión del tiempo universal: (ds)2 → (ds)2 . La diferencia entre estacionario y estático se aprecia fácilmente con un ejemplo. El campo producido por una estrella que no gira es estático. Si la estrella gira alrededor de su eje, el campo es estacionario, pero no estático. En efecto, la operación x0 → −x0 no ha de afectar el campo de una estrella quieta. Pero si la estrella rota con velocidad angular ω , la inversi´ on del tiempo universal trae como consecuencia ω → − ω , y ésto a su vez debe afectar al campo producido por la estrella. Modernamente, la distinción estacionario-estático 299

es importante en el problema de la masa puntual: si la masa rota, el campo es estacionario (solución de Kerr); y si no rota, el campo es estático (solución de Schwarzschild). a

ll ari am

azul roja

P

Figura 12.1 Las coordenadas de Ohanian. Las coordenadas espaciales de un punto P son los tres ángulos que forman en P las luces que provienen de tres estrellas (amarilla, azul y roja). La coordenada temporal es el ángulo formado en P por los rayos de la estrella roja y de una cuarta estrella móvil.

300

Cap´ıtulo 13

La soluci´ on de Schwarzschild

El problema más simple de la f´ısica clásica es el del universo vac´ıo. El problema que le sigue es el estudio de los efectos causados por la presencia de una part´ıcula puntual. La gravitaci´ on newtoniana resolvió este problema con gran éxito: trescientos a˜ nos de astronom´ıa han confirmado la bondad de la solución de Newton. Más tarde, en la década de 1920, la mecánica cuántica naciente habr´ıa de resolver de nuevo este problema que se conoce bajo el nombre de átomo de hidrógeno. El caso de la part´ıcula puntual fue el problema escuela de la f´ısica newtoniana y de la mecánica cuántica. También en la gravitación Einstein atacó el problema de la masa puntual. Y as´ı como ocurrió con la versión newtoniana y con la versi´ on cuántica, este viejo problema fue la escuela de la relatividad general, entren´ o a los cient´ıficos en las sutilezas de la teor´ıa y les exigió métodos de cálculo especiales. Einstein resolvió este problema en 1915, aunque no en forma exacta, sino aproximada; en esa solución aproximada logró explicar la precesión del perihelio de Mercurio y pudo predecir la desviación de un rayo de luz al pasar cerca del Sol. Schwarzschild [23] resolvió exactamente el problema de la masa puntual en diciembre de 1915, unas pocas semanas después de que Einstein y Hilbert encontraran la ecuación (12.25) de los campos gravitacionales1 .

13.1

Campo is´ otropo est´ atico

Nos proponemos averiguar la forma más general que puede tener un campo gravitatorio isótropo estático. Con ese propósito vamos a desarrollar sucesi1

Schwarzschild, profesor de la universidad de Gotinga, resolvi´ o el problema mientras prestaba sus servicios como soldado en el frente oriental. Muri´ o cinco meses después, a los 42 a˜ nos de edad, por la infecci´ on de una herida.

301

vamente los casos isótropo, estacionario y estático. Campo is´ otropo. En este caso el intervalo ds2 debe ser un escalar bajo el grupo de las rotaciones en el espacio tridimensional. Para proponer o construir un ds2 debemos acudir a cantidades escalares. ¿Cuáles son las cantidades escalares disponibles? Con la coordenada temporal ct se producen dos escalares, que son t y dt. De otro lado, con dos vectores A y B se consigue una cantidad escalar mediante el producto punto A · B. Debemos encontrar vectores para ejecutar el producto punto. Disponemos u ńicamente de los vectores r y dr, y los productos punto entre ellos son r · r, r · dr y dr · dr. En conclusión, el intervalo isótropo más general se construye con t, dt, r · r, r · dr y dr · dr : ds2 = {r · r, t}(dt)2 + {r · r, t}r · drdt + {r · r, t}(r · dr)2 + {r · r, t}dr · dr En esta fórmula la escritura {r · r, t} es una manera corta de decir “alguna función de r · r y de t ”. No se nos escapa que esta notación es ambigua porque podr´ıa sugerir, equivocadamente, que las cuatro funciones {r · r, t} que aparecen en la fórmula son iguales. Debemos entender que las cuatro funciones {r · r, t} son, en principio, diferentes. Campo is´ otropo estacionario. Sabemos por la sección 12.5 que para campos estacionarios las componentes gµν del tensor métrico son independientes del tiempo universal, o sea que el intervalo ds2 se simplifica: ds2 = {r · r}(dt)2 + {r · r}r · drdt + {r · r}(r · dr)2 + {r · r}dr · dr Campo is´ otropo est´ atico. Utilizando de nuevo la sección 12.5 debemos imponer la condición de que las entradas g0a del tensor métrico sean cero. Queda: ds2 = {r · r}(dt)2 + {r · r}(r · dr)2 + {r · r}dr · dr ˆ r , dr = dr 1 ˆ r + rdθ 1 ˆ θ + r sen θdϕ 1 ˆ ϕ . Los En coordenadas esféricas r = r 1 productos escalares son: r · r = r2 302

r · dr = rdr

³ ´ dr · dr = (dr)2 + r2 (dθ)2 + sen2 θ(dϕ)2 Con estas expresiones regresamos a ds2 : ³ ´ ds2 = {r}dt2 + {r}dr2 + {r} dr2 + r2 (dθ2 + sen2 θdϕ2 ) = {r}dt2 + {r}dr2 + {r}r2 (dθ2 + sen2 θdϕ2 ) Pongamos nombres a las tres funciones {r}: ds2 = D(r)dt2 − E(r)dr2 − F (r)r2 (dθ2 + sen2 θdϕ2 ) Ahora hacemos una transformación de coordenadas (ct, r, θ, ϕ) → (ct, ρ, θ, ϕ), donde la nueva coordenada ρ est´ a definida por medio de la ecuación ρ2 ≡ 2 F (r)r : ds2 = A(ρ)c2 dt2 − B(ρ)dρ2 − ρ2 (dθ2 + sen2 θdϕ2 )

(13.1)

Este intervalo corresponde al tensor métrico: 

gµν

   =   

A(ρ)

0

0

0

0

−B(ρ)

0

0

0

0

−ρ2

0

0

0

0

−ρ2 sen2 θ

       

(13.2)

Esta es la métrica del problema más general de campo estático isótropo. El tensor de Ricci tiene sólo cuatro componentes no nulas: ´ 1 ³ 00 02 0 0 0 2ρABA − ρBA − ρAA B + 4ABA 4ρAB 2 ´ 1 ³ 00 02 0 0 2 0 2ρABA − ρBA − ρAA B − 4A B 4ρA2 B

R00 = − R11 =

303

R22 = −

´ 1 ³ 0 0 2 − ρBA + ρAB + 2AB − 2AB 2AB 2

R33 = sen2 θR22 Aqu´ı la prima (0 ) quiere decir derivada respecto a ρ. A partir de este momento supondremos que la distribución de momentum y energ´ıa Tµν est´ a concentrada en una región finita del espacio: estamos pensando en una estrella, un planeta, una bola de polvo, etc. Esta distribución de momentum y energ´ıa tiene cierto radio. Vamos a estudiar u ńicamente la región exterior. Si esta bola de polvo o estrella no es fuente de campo electromagnético podemos afirmar, de acuerdo con la discusión de la página 298, que los tensores Tµν y Rµν son cero. Al imponer las ecuaciones R00 = 0, R11 = 0 y R22 = 0 se obtiene: 2ρABA00 − ρBA02 − ρAA0 B 0 = −4ABA0

(13.3)

2ρABA00 − ρBA02 − ρAA0 B 0 = 4A2 B 0

(13.4)

−ρBA0 + ρAB 0 + 2AB 2 − 2AB = 0

(13.5)

Obsérvese que los lados izquierdos de (13.3) y (13.4) son iguales; entonces los lados derechos también tienen que ser iguales: −4ABA0 = 4A2 B 0 , o sea que AB 0 + BA0 = 0, es decir (AB)0 = 0. Esto significa que: A(ρ)B(ρ) = una constante

(13.6)

Para averiguar el valor de esta constante recordamos que a grandes distancias la métrica (13.2) debe coincidir con (9.45). Pues bien, al comparar (13.2) con (9.45) vemos que, a grandes distancias, las funciones A(ρ) y B(ρ) tienden al valor 1, y por consiguiente la constante de la ecuación (13.6) es 1: A(ρ)B(ρ) = 1 B(ρ) =

1 A(ρ)

(13.7)

Al colocar este resultado en la ecuación (13.5) se obtiene ρA0 + A = 1, es decir 304

d (ρA) = 1 dρ La solución de esta ecuación es A=1+

k ρ

(13.8)

donde k es una constante cuyo valor debemos averiguar. Para hacerlo estudiemos la situación a distancias grandes, donde esperamos que se logre el l´ımite newtoniano. El potencial newtoniano es Φ = −GM/r y la ecuación (12.11) dice que A ' 1−

2GM c2 r

2GM k = − 2 . Esto significa que ρ es ρ c r proporcional a r. Lo más sencillo es escoger ρ igual a r. Con esta elección la 2GM constante k queda determinada: k = − 2 . Las ecuaciones (13.8) y (13.7) c dan finalmente Al comparar con (13.8) vemos que

A =

2GM 1 = 1− 2 B c r

El intervalo (13.1) y la métrica (13.2) son: µ ¶ µ ¶ 2GM 2GM −1 2 2 2 2 2 ds = 1 − 2 c dt − 1 − 2 dr −r (dθ +sen2 θdϕ2 ) (13.9) c r c r 2



gµν

      =      

1−

2GM c2 r

 0

0

0

0

¶ µ 2GM −1 − 1− 2 c r

0

0

0

0

−r2

0

0

0

0

−r2 sen2 θ

305

            

(13.10)

Esta es la solución en la región “de afuera”, en el exterior de la distribución esférica de energ´ıa y momentum. De ahora en adelante nos concentraremos en lo que se llama el problema de Schwarzschild: cuando toda la energ´ıamomentum representada por Tµν se acumula en un punto, que es el origen de coordenadas. En tal caso la métrica (13.10) será válida en todos los puntos del universo, excepto en r = 0 . Ya que la cantidad 2GM/c2 aparece frecuentemente, conviene darle un nombre; se llama el radio de Schwarzschild : s ≡

2GM c2

(13.11)

ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θ dϕ2 ) 

gµν

     =     

1 − s/r

0

0



0

          

− (1 − s/r)−1

0

0

0

−r2

0

0

0

0

−r2 sen2 θ

0

0

0

(13.12)

0

(13.13)

La inversa de esta matriz es 

g

µν

     =     

(1 − s/r)−1 0

0

−(1 − s/r)

0

0

0

0

−r−2

0

0

0

0

−(r sen θ)−2

           

(13.14)

Para s = M = 0 se recupera el tensor métrico (9.45) del espacio plano. Antes de cerrar esta sección anotemos que, como la constante de la gravitaci´ on G 2 es muy baja, s = 2GM/c toma valores sorprendentemente peque˜ nos. En efecto, cuando M es la masa del Sol se obtiene s ' 3 km., y cuando M es la masa de la Tierra se obtiene s ' 9 mm. 306

13.2

La geometr´ıa del espaciotiempo

Con la métrica (13.13) procedemos a calcular los s´ımbolos de Christoffel y las componentes contravariantes del tensor de Riemann. Resulta que las cantidades no nulas son Γ0 01 = Γ0 10 =

s 2r(r − s)

s(r − s) 2r3 = −r + s

s 2r(r − s) = −(r − s) sen2 θ

Γ1 00 =

Γ1 11 = −

Γ1 22

Γ1 33

Γ2 33 = − sen θ cos θ Γ3 13 = Γ3 31 =

Γ2 12 = Γ2 21 =

1 r

1 r

Γ3 23 = Γ3 32 = cot θ

R0101 = R1010 = −R1001 = −R0110 =

s r3

R0202 = R2020 = −R2002 = −R0220 = − R0303 = R3030 = −R3003 = −R0330

s 2r4 (r

− s) s = − 4 2r (r − s) sen2 θ

R1212 = R2121 = −R2112 = −R1221 =

s(r − s) 2r6

s(r − s) 2r6 sen2 θ s = − 7 r sen2 θ

R1313 = R3131 = −R3113 = −R1331 = R2323 = R3232 = −R3223 = −R2332

Todas las componentes del tensor de Ricci son cero, de acuerdo con (12.27), y por consiguiente el escalar de curvatura también es cero. El espaciotiempo es obviamente curvo, porque algunas componentes del tensor de Riemann no son cero. Nótese, sin embargo, que si s → 0 (es decir, si M → 0) el espaciotiempo se vuelve plano. La larga lista de las componentes no nulas del tensor de Riemann es excesiva, ya que muchas de ellas se obtienen de las otras, utilizando las tres identidades algebraicas (9.83, 9.84, 9.85). En vez de escribir toda la lista, pudimos 307

dar u ńicamente R0101 , R0202 , R0303 , R1212 , R1313 y R2323 . As´ı mismo, no era necesario dar Γ2 21 , Γ3 31 ni Γ3 32 . De ahora en adelante, para ahorrar espacio, no escribiremos aquellas componentes que pueden averiguarse fácilmente utilizando las fórmulas de las identidades algebraicas.

13.3

Subespacios

El triespacio (r, θ, ϕ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un corte de t constante (es decir dt = 0) y lo que queda es un espacio tridimensional. Al poner dt = 0 en las ecuaciones (13.12) y (13.13) queda este espacio tridimensional: ds2 = − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θdϕ2 )  gµν

  =  

− (1 − s/r)−1

0

0

0

−r2

0

0

0

−r2 sen2 θ

(13.15)

     

(13.16)

Las componentes covariantes no nulas del tensor de Riemann son

Rrθrθ =

s , 2(r − s)

Rrϕrϕ =

s sen2 θ , 2(r − s)

Rθϕθϕ = −sr sen2 θ

Este triespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el triespacio se aplana) cuando M → 0 . La curvatura de este triespacio es un efecto gravitacional. El biespacio (r, θ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un corte de t constante y ϕ constante (es decir dt = dϕ = 0) y lo que queda es un espacio bidimensional. Al poner dt = dϕ = 0 en las ecuaciones (13.12) y (13.13) queda este espacio bidimensional: ds2 = − (1 − s/r)−1 dr2 − r2 dθ2 308

(13.17)

 gµν = 



− (1 − s/r)−1

0

0

−r2



(13.18)

Las componentes covariantes no nulas del tensor de Riemann son: Rrθrθ =

s 2(r − s)

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. El biespacio (θ, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt = dr = 0, queda un espacio bidimensional: ds2 = −r2 dθ2 − r2 sen2 θdϕ2  gµν = 

−r2

0

0

−r2 sen2 θ

(13.19)

 

(13.20)

Las componentes covariantes no nulas del tensor de Riemann son Rθϕθϕ = −r2 sen2 θ Este biespacio, que es una superficie esférica, es curvo, porque algunas componentes del tensor de Riemann no son cero. Cuando M → 0 , este biespacio no se aplana: la superficie esférica es curva con M 6= 0 y también es curva con M = 0. La curvatura de esta superficie no es un efecto gravitacional. El biespacio (t, r). Si en las ecuaciones (13.12) y (13.13) hacemos dθ = dϕ = 0, queda un espacio bidimensional: ³ s´ 2 2 ³ s ´−1 2 ds2 = 1 − c dt − 1 − dr r r 309

(13.21)



1 − s/r



0

gµν = 

 −1

0

(13.22)

− (1 − s/r)

Las componentes covariantes no nulas del tensor de Riemann son: Rtrtr =

s r3

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. El biespacio (t, θ). Si en las ecuaciones (13.12) y (13.13) hacemos dr = dϕ = 0, queda un espacio bidimensional: ds2 = (1 − s/r) c2 dt2 − r2 dθ2  gµν = 

1 − s/r

0

0

−r2

 

Todas las componentes del tensor de Riemann son cero, cualquiera que sea el valor de M . Vemos as´ı que el biespacio (t, θ) es plano con M 6= 0 y también con M = 0. El biespacio (r, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt = dθ = 0, queda un espacio bidimensional: ds2 = − (1 − s/r)−1 dr2 − r2 sen2 θdϕ2  gµν = 

− (1 − s/r)−1

0

0

−r2 sen2 θ

 

Las componentes covariantes no nulas del tensor de Riemann son 310

(13.23)

Rrϕrϕ =

1 s sen2 θ 2 r−s

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. Para comprender la curvatura de este biespacio podemos simplificar la escritura usando longitudes positivas en (13.23), y concentrarnos en aquellas figuras que están en el plano ecuatorial, para lo cual hacemos θ = π/2: dl2 = (1 − s/r)−1 dr2 + r2 dϕ2

(13.24)

Para segmentos radiales hacemos dϕ = 0 en (13.24), y para segmentos de circunferencia hacemos dr = 0: dl =

p

1

1 − s/r dl = rdϕ :

dr :

segmento radial

(13.25)

arco de circunferencia

(13.26)

Calculemos el área de la corona comprendida entre los radios r y dr. La distancia entre los dos c´ırculos está dada por (13.25), y la longitud de la circunferencia menor se calcula pcon (13.26), y da 2πr. Entonces el área de la corona es el producto de 1/ 1 − s/r dr con 2πr: 2πrdr ´ Area =p 1 − s/r

(13.27)

Pero esto difiere del resultado euclidiano, que es 2πrdr. Este ejemplo muestra que el biespacio (r, ϕ) es curvo, mientras s sea diferente de cero. Por supuesto que para M = 0 se tiene s = 0 y el área (13.27) se convierte en el valor euclidiano 2πrdr, que es lo que se esperaba, ya que para s = 0 el espacio se aplana.

13.4

Relojes

Un punto en reposo tiene dr = dθ = dϕ = 0, y en consecuencia el intervalo (13.12) queda simplemente: 311

ds2 = c2 (1 − s/r) dt2 Ahora supongamos que en ese punto se encuentra un reloj y llamemos T al tiempo que marca ese reloj que está en reposo. El intervalo es: ds2 = c2 dT 2 Combinando las dos u ´ltimas ecuaciones llegamos a dT 2 = (1 − s/r) dt2 , es decir: dT

p = dt 1 − s/r p = dt 1 + 2Φ/c2

(13.28) (13.29)

Aqu´ı, Φ = −GM/r es el potencial gravitacional newtoniano. Si el reloj que est´ a en reposo se encuentra en el infinito, la ecuación (13.28) da dT∞ = p dt 1 − s/∞ = dt. De esta manera se aclara el significado de la coordenada t que hemos usado desde el principio: t es un tiempo universal; un reloj que se encuentra en reposo en r = ∞ marca un tiempo t. La fórmula del intervalo (13.12) da la longitud tridimensional dl: q dl =

(1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2

La velocidad de un punto móvil se puede definir de dos maneras, bien sea usando dt o dT . La cantidad dl/dt es es una velocidad medida con un reloj t lejano, que está en el infinito: dl/dt no es una medida local. La cantidad dl/dT es una velocidad medida con un reloj local T que se encuentra en reposo. Esta u ´ltima será llamada velocidad local y le asignaremos el s´ımbolo v, as´ı: v = dl/dT . Saquemos c2 dt2 como factor com´ un en la fórmula del intervalo (13.12): " 2

ds =

1 1 − s/r − 2 c 312

µ

dl dt

¶2 #

c2 dt2

(13.30)

Esta fórmula da un resultado interesante para pulsos de luz, ya que si hacemos ds = 0 encontramos p dl = c 1 − s/r , dt o sea que la velocidad no local de la luz, dada por dl/dt, no es c. Afortunadamente la velocidad local, dada por dl/dT , s´ı es c, como veremos enseguida. En vista de (13.28), podemos escribir (dl/dt)2 = (1 − s/r) (dl/dT )2 = (1 − s/r)v 2 , y la ecuación (13.30) se convierte en: ¡ ¢ ds2 = (1 − s/r) 1 − v 2 /c2 c2 dt2

(13.31)

Haciendo ds2 = 0 en esta ecuación se llega a v = c. En palabras: la velocidad de la luz, medida localmente con un reloj en reposo, es c. Concentrémonos ahora en lo que ocurre con una part´ıcula móvil, llamando dτ , como es costumbre, al tiempo que marca un reloj que la acompa˜ na. Hacemos ds2 = c2 dτ 2 en (13.31) para escribir: dτ

p (1 − s/r) (1 − v 2 /c2 ) p = dt (1 + 2Φ/c) (1 − v 2 /c2 ) = dt

(13.32) (13.33)

Esta es una fórmula general, con tres casos particulares importantes: 1) Cuando el reloj está en reposo, dτ = dT y la ecuación (13.32) se convierte en (13.28). 2) Cuando el reloj está en el infinito y tiene velocidad v, la ecuación (13.32) se convierte en (2.14). 3) Cuando el reloj está en reposo en el infinito, τ = t. La ecuación general (13.33) muestra que el reloj τ se atrasa respecto a t por dos causas diferentes: por tener velocidad, asunto que ya se ha estudiado en la relatividad especial, y por estar en un campo gravitacional. Veamos en detalle este u ´ltimo. La existencia de un tiempo universal t facilita la comprensión del espaciotiempo de Schwarzschild, ya que podemos imaginar cortes de simultaneidad. La Figura 13.1 trae tres l´ıneas rectas horizontales; todos los eventos contenidos en la primera l´ınea tienen el mismo valor t = 7; asimismo, todos 313

los eventos contenidos en la segunda l´ınea tienen el mismo valor t = 8, etc. La Figura también trae dos l´ıneas rectas verticales; una representa a un tripunto fijo (r1 , θ1 , ϕ1 ), y la otra representa a otro tripunto fijo (r2 , θ2 , ϕ2 ). Supongamos ahora que desde el punto (r1 , θ1 , ϕ1 ) se lanza una serie de proyectiles hacia (r2 , θ2 , ϕ2 ), periódicamente, y todos ellos se lanzan de la misma manera (con la misma velocidad inicial y la misma inclinación). La Figura muestra, en l´ıneas curvas, las trayectorias de esos proyectiles. Lo interesante es que, debido a que el espaciotiempo de Schwarzschild es estático (véase la métrica (13.13)), las trayectorias de todos los proyectiles son similares, y en consecuencia todas las l´ıneas curvas de la Figura 13.1 son repetitivas. Llamemos ahora ∆t1 al tiempo universal que transcurre entre dos proyectiles sucesivos emitidos en el primer punto, y ∆t2 al lapso entre dos proyectiles sucesivos recibidos en el segundo punto. Como todas las l´ıneas curvas de la Figura 13.1 son similares, es claro que: ∆t1 = ∆t2

(13.34)

Pensemos ahora que en los dos puntos hay dos relojes en reposo, y llamemos T1 y T2 a los tiempos que ellos marcan. El primer reloj mide el tiempo ∆T1 que transcurre entre dos proyectiles sucesivos emitidos y el segundo reloj mide el tiempo ∆T2 que transcurre entre dos proyectiles recibidos. La fórmula (13.28) dice que: p 1 − s/r1 p = ∆t2 1 − s/r2

∆T1 = ∆t1 ∆T2

Dividir lado a lado esta dos ecuaciones y utilizar la ecuación (13.34): s ∆T2 = ∆T1

1 − s/r2 1 − s/r1

(13.35)

Nótese que r2 < r1 ⇒ ∆T2 < ∆T1 : mientras más hundido está un reloj en el campo gravitacional, más se atrasa. Los relojes se atrasan bien sea a causa del campo gravitatorio o a causa de la velocidad translacional que ellos tengan. Uno podr´ıa preguntarse si 314

acaso la aceleración también ocasiona alg´ un atraso. La respuesta es no: se han realizado experimentos con aceleraciones extremas en ciclotrones, en los que los relojes (sistemas atómicos) no registran atrasos debidos a la aceleración. Antes de concluir esta sección vamos a completar el estudio de la velocidad local v = dl/dT , escribiendo en detalle sus tres componentes. La fórmula del intervalo (13.12) da la longitud tridimensional dl y sus tres componentes dlr , dlθ y dlϕ : q dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2 dlr =

dr

p

(13.36)

1 − s/r

dlθ = r dθ dlϕ = r sen θ dϕ Al dividir estas cantidades por dT se obtienen las componentes vr , vθ y vϕ : v = vr = vθ = vϕ =

q dl = vr2 + vθ2 + vϕ2 dT dlr 1 dr = p dT dT 1 − s/r dlθ dθ = r dT dT dlϕ dϕ = r sen θ dT dT

(13.37) (13.38) (13.39) (13.40)

A continuación vamos a deducir una ecuación interesante que combina las variables r, v y vϕ . Si el movimiento se desarrolla u ńicamente en el plano ecuatorial, vθ = 0 y la ecuación (13.37) dice que vr2 = v 2 − vϕ2 , o sea que: vr2 = 1− c2

Ã

v 2 vϕ2 1− 2 + 2 c c

!

En el segundo término del lado derecho multiplicar y dividir por (1 − s/r): 315

 " #2  ³ rvϕ /c vr2 s ´  1 − v 2 /c2 1 = 1− 1− + p 2 c r 1 − s/r 1 − s/r r2 Esta ecuación se escribe concisamente as´ı: µ ¶ ³ vr2 s´ J2 = 1− 1− D+ 2 , c2 r r

(13.41)

1 − v 2 /c2 , 1 − s/r

(13.42)

donde D =

J = p

vϕ 1 − s/r c r

Las cantidades D y J son funciones de r, v y vϕ ; en general, D y J van cambiando a medida que el punto móvil progresa en su trayectoria. Pero hay una excepción importante: cuando la trayectoria del punto móvil es una geodésica, las cantidades D y J se mantienen constantes, es decir, son constantes del movimiento. Esto lo veremos pronto.

13.5

Corrimiento hacia el rojo

Consideremos de nuevo los dos relojes de la sección anterior. La frecuencia a la que se emiten los proyectiles es ν1 = 1/∆T1 , y la frecuencia a la que se reciben es ν2 = 1/∆T2 . Si dividimos lado a lado estas dos ecuaciones se obtiene ν2 /ν1 = ∆T1 /∆T2 , y en vista de (13.35) se llega finalmente a: s ν2 = ν1

1 − s/r1 1 − s/r2

(13.43)

Si r2 < r1 entonces ν2 > ν1 : esto se llama corrimiento hacia el azul. Si r2 > r1 entonces ν2 < ν1 , y se llama corrimiento hacia el rojo. Uno se puede figurar, en la imaginación, que mientras la luz baja (hacia la masa M ) se fortalece, aumenta su frecuencia y se corre hacia el azul. As´ı mismo, subir debilita a la luz, le disminuye su frecuencia2 y la corre hacia el rojo. 2

En ´ optica, cuando la luz pasa por materiales transparentes de diversos ´ındices de refracci´ on, su frecuencia y su color no cambian. Pero en la relatividad einsteiniana, cuando la luz pasa por una regi´ on donde hay campo gravitacional, su frecuencia y su color son cambiantes.

316

Pensemos en un pulso de luz emitido en la superficie de una estrella (la coordenada radial de este punto de emisión es r1 = R) y recibido en otro punto cuya coordenada radial es r2 = ∞. La fórmula (13.43) da en este caso ν∞ = νR [1 − s/R]1/2 . Expandir el binomio: ν∞ = νR [1 − s/2R + · · ·]. Si s/R es peque˜ no conservamos los dos primeros términos en esta serie, obteniendo ν∞ = νR [1 − s/2R], es decir ν∞

· ¸ GM = νR 1 − 2 c R

(13.44)

O sea que la frecuencia recibida en r = ∞ es menor que la emitida en la estrella: corrimiento hacia el rojo. En el viaje desde la estrella hasta el infinito, la luz sube de un lugar donde el potencial gravitacional newtoniano Φ = −GM/R es negativo, a otro donde es cero; en este ascenso la luz se debilita, su frecuencia disminuye y su color tira hacia el rojo. ¿Qué podr´ıamos decir de la luz que viaja desde el infinito hacia la estrella?: el descenso la fortalece, le aumenta la frecuencia y su color tira hacia el azul. Al subir, la luz se enrojece. Y al bajar se azulea. Para darnos cuenta de la magnitud del corrimiento pongamos en la fórmula la masa y el radio del Sol: M¯ = 1.99 × 1033 g, R¯ = 6.96 × 1010 cm: ν∞ = ν¯ (1 − 2.12 × 10−6 ) En otras palabras, (ν¯ −ν∞ )/ν¯ es cerca de dos millonésimas. Esta diferencia es peque˜ na, pero se ha observado. También se ha observado el corrimiento hacia el rojo en la luz de otras estrellas, como por ejemplo Sirio y Eridani.3

13.6

Constantes del movimiento

A continuación vamos a estudiar la ca´ıda libre de una part´ıcula de cualquier masa, bien sea m = 0 o m 6= 0. Tal como hemos visto, la trayectoria es una geodésica. Lo primero es identificar las constantes del movimiento siguiendo 3

Hay tres clases de corrimiento hacia el rojo : 1) Debido a la explosi´ on del espacio (big bang), se corren hacia el rojo la luz de las galaxias y la radiaci´ on de fondo. 2) El del efecto Doppler, causado por la velocidad fuente-receptor y explicado por la relatividad especial en la secci´ on 5.8. Finalmente, 3) el gravitacional, explicado en esta secci´ on por la relatividad general.

317

la regla (10.15). Como x0 y x3 no aparecen en la métrica (13.13), podemos asegurar que g0β dxβ /dλ y g3β dxβ /dλ son constantes del movimiento:

g0β

dxβ dλ

= g00

dx0 dt dt = cg00 = c (1 − s/r) dλ dλ dλ

g3β

dxβ dλ

= g33

dx3 dϕ = −r2 sen2 θ dλ dλ

Ajustamos el parámetro af´ın de manera que la primera constante valga 1 y a la segunda constante la llamamos −J. Escribimos entonces c(1−s/r)dt/dλ = 1 y −r2 sen2 θdϕ/dλ = −J, es decir, dλ = c (1 − s/r) dt J

= r2 sen2 θ

dϕ dλ

(13.45) (13.46)

Vamos a demostrar que el movimiento de la part´ıcula se desarrolla en un plano. Si J es cero en un instante, también será cero en todos los instantes. Pero J es proporcional a dϕ/dλ, y podemos afirmar en consecuencia que si dϕ/dλ es cero en un instante, también será cero en todos los instantes. Esto es lo que ocurre si la part´ıcula se mueve en un plano que pasa por los polos norte y sur. Esta idea se generaliza afirmando que si en un instante la part´ıcula se mueve en un plano (cualquiera) que pase por el centro, entonces ella nunca abandonará ese plano4 . Para simplificar la escritura conviene que orientemos al eje zeta de modo que el plano del movimiento sea el plano ecuatorial; haciendo θ = π/2, dθ = 0 en las ecuaciones (13.12) y (13.46) se obtiene: ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 dϕ2 J dϕ dλ

= r2 =

dϕ dλ

(13.47) (13.48)

J r2

(13.49)

4

Recordemos la manera como se trata, en mec´ anica newtoniana, el problema de una part´ıcula sujeta a una fuerza central: el torque es cero ⇒ el momentum angular es constante ⇒ el movimiento se desarrolla en un plano.

318

13.7

Una tercera constante del movimiento

De las cuatro ecuaciones (10.8) de las geodésicas ya hemos ejecutado dos, al identificar las dos constantes del movimiento de la sección anterior. Nos falta por considerar las otras dos ecuaciones de las geodésicas: dxµ dxν d2 x1 1 + Γ =0 µν dλ2 dλ dλ

(13.50)

dxµ dxν d2 x2 2 + Γ =0 µν dλ2 dλ dλ

(13.51)

Utilizando los s´ımbolos Γ0 µν de la página 307, y la escogencia θ = π/2, dθ = 0, es evidente que la ecuación (13.51) se convierte en d2 θ/dλ2 = 0 , lo cual, si bien es cierto, no es u ´til. Nos queda entonces la ecuación (13.50); r usando los coeficientes Γ µν de la página 307 y la condición θ = π/2, dθ = 0, obtenemos: d2 r s − 2 dλ 2r(r − s)

µ

dr dλ

¶2

c2 s(r − s) + 2r3

µ

dt dλ

¶2

µ − (r − s)

dϕ dλ

¶2 =0

En el tercer término usar (13.45) y en el cuarto término usar (13.49): d2 r s − 2 dλ 2r(r − s)

µ

dr dλ

¶2 +

s(r − s) ³ s ´−2 J 2 (r − s) 1 − − =0 2r3 r r4

Multiplicar ambos lados de esta ecuación por 2r dr d2 r s − 2 r − s dλ dλ (r − s)2

µ

dr dλ

¶3 +

2r dr : r − s dλ

2J 2 dr s dr − =0 (r − s)2 dλ r3 dλ

Reunir los dos primeros términos con un com´ un denominador:

2r(r − s)

dr d2 r −s dλ dλ2 (r − s)2

µ

dr dλ

¶3 + 319

s dr 2J 2 dr − =0 (r − s)2 dλ r3 dλ

El lado izquierdo de esta ecuación tiene tres términos. El primer término es d r(dr/dλ)2 d r igual a ; el segundo término es − , y el tercer término dλ r − s dλ r − s d J2 es . La ecuación es entonces dλ r2  µ ¶2  dr r d  r J2  dλ   − + 2=0  dλ  r − s r−s r 

o sea que la cantidad entre paréntesis es una constante, a la que llamaremos −D: µ ¶2 dr 1− J2 dλ D ≡ − (13.52) s r2 1− r dD = 0 (13.53) dλ La ecuación (13.52) se puede escribir también as´ı : µ

13.8

dr dλ

¶2

µ ¶ ³ s´ J2 =1− 1− D+ 2 r r

(13.54)

J y D en t´ erminos de r, v y vϕ

Las variables naturales de la cinemática son la posición y la velocidad. Si nosotros conocemos la posición y la velocidad de una part´ıcula en cierto instante, deber´ıamos ser capaces de utilizar esa información para averiguar los valores de las constantes J y D. En esta sección nos proponemos deducir las fórmulas correspondientes. Para ejecutar esta tarea debemos encontrar inicialmente la relación que existe entre el parámetro λ y el tiempo local p T : basta combinar las ecuaciones (13.28) y (13.45)para obtener dλ = cdT 1 − s/r. Con este resultado las ecuaciones (13.48) y (13.52) dan: J

1 dϕ = r2 p dT c 1 − s/r 320

D =

1 1− 2 c (1 − s/r) 1 − s/r

µ

dr dT

¶2 r2 − 2 c (1 − s/r)

µ

dϕ dT

¶2

Aqu´ı reconocemos las velocidades locales vr , vϕ y v 2 que hab´ıamos definido en las ecuaciones (13.37), (13.38) y (13.40), lo que nos permite escribir: J

=

D =

vϕ r p 1 − s/r c

(13.55)

1 − v 2 /c2 1 − s/r

(13.56)

Estas son las fórmulas que buscábamos. Si sabemos que una part´ıcula en ca´ıda libre pasa por r, y que al pasar por r tiene velocidades locales v y vϕ , entonces las ecuaciones (13.55) y (13.56) nos permiten averiguar los valores de J y D. Los valores r, v y vϕ que la part´ıcula tiene en cierto instante (es decir, las condiciones iniciales) determinan un´ıvocamente la trayectoria futura y pasada: en otros instantes la part´ıcula tiene que ajustar los valores de r, v y vϕ de modo que las cantidades J y D adopten los mismos valores que adoptaron en el instante inicial. Esto de ajustar es lo que quiere decir que J y D sean constantes del movimiento. Cada geodésica en el espaciotiempo de Schwarzschild está caracterizada por dos n´ umeros, que son los valores que adoptan J y D. Una vez que la part´ıcula ha escogido determinada geodésica (es decir, determinados valores de J y D), no podrá abandonarla jamás, ya que abandonarla ser´ıa como cambiar los valores iniciales de J y D. Continuemos con el examen de las ecuaciones (13.55) y (13.56). Es claro que ellas se combinan para producir esta otra relación, que será u ´til dentro de poco: Dr2 1 − v 2 /c2 = J2 vϕ2 /c2

(13.57)

De otro lado, las ecuaciones (13.55) y (13.56) se pueden invertir para expresar v y vϕ en términos de las constantes D y J: v2 c2

³ s´ = 1− 1− D r 321

(13.58)

vϕ2 c2

=

³ s´ J2 1− r r2

(13.59)

Restamos lado a lado estas dos ecuaciones para obtener: µ ¶ ³ v 2 − vϕ2 s´ J2 =1− 1− D+ 2 c2 r r Pero v 2 − vϕ2 = vr2 , entonces µ ¶ ³ vr2 J2 s´ =1− 1− D+ 2 c2 r r

(13.60)

Obsérvese que p dT dt dr dr dlr vr dr 1 = = 1 − s/r = = , dλ dt dλ dT c(1 − s/r) dT cdT c

(13.61)

o sea que las ecuaciones (13.60) y (13.54) son equivalentes. Observemos también la diferencia que existe entre las ecuaciones (13.41) y (13.60): en la primera ecuación, las cantidades D y J son, en general, variables, mientras que en la segunda ecuación las cantidades D y J son constantes del movimiento. A grandes distancias, la constante J tiene un significado que es familiar. En efecto, para s/r muy peque˜ no la ecuación (13.55)da cJ ' rvϕ . En palabras, a grandes distancias cJ tiende al momentum angular zeta por unidad de masa. La constante D permite también algunos comentarios. Para un pulso de luz se tiene v = c, y en en este caso la ecuación (13.56) dice que D = 0. Para part´ıcula masiva la ecuación (13.58) es clara: dado un valor de D, la velocidad local v depende u ńicamente de la coordenada r. Cuando la part´ıcula se acerca, r disminuye y la velocidad v tiene que aumentar. Esta ecuación es análoga a la ecuación newtoniana que dice que la energ´ıa total (que es constante) es la suma de la energ´ıa cinética y la energ´ıa potencial. La analog´ıa se confirma al estudiar el comportamiento de D en el l´ımite newtoniano: la ecuación (13.56) es D = (1 − v 2 /c2 )(1 − s/r)−1 = (1 − v 2 /c2 )(1 + s/r + · · ·) 322

→ (1 − v 2 /c2 )(1 + s/r) ' 1 − (v 2 /c2 − s/r) = 1 −

2 c2

µ

¶ 1 2 v + Φ . Vemos 2

1 as´ı que (1 − D)c2 /2 → v 2 + Φ; en palabras, (1 − D)c2 /2 tiende a la energ´ıa 2 total (prerrelativista) por unidad de masa. ¿Cuáles son los valores numéricos que adoptan las constantes J y D? Esperamos responder esta pregunta, al menos medianamente, estudiando dos casos bien diferentes: el del planeta Tierra y el de una part´ıcula de alta velocidad que pasa por las cercan´ıas del origen. La Tierra en su órbita alrededor del Sol tiene una r promedio de 1.49 × 1013 cm y una velocidad promedio de 0.98 × 10−4 c ; como el s del Sol es 2.93 km, concluimos que J/s ' 5000 y D ' 1 + 0.00000001. Aprendemos que para los planetas solares J/s es un n´ umero muy grande y que D es muy cercano a 1, y mayor que 1. Pensemos ahora en una part´ıcula masiva de alta velocidad, v = 0.8c y r promedio igual a 10s; en este caso se obtiene J/s ' 8 y D ' 0.4.

13.9

Las cuatro variables t, T, τ y λ

Queremos hacer una recopilación de las relaciones que existen entre las cuatro variables t, T, τ y λ. Antes de hacerlo conviene que repasemos el significado de esas variables. t es un tiempo universal. Un reloj en reposo en r = ∞ marca un tiempo t. El tiempo T es el que marca un reloj en reposo en un punto con coordenada radial r. El parámetro af´ın dλ es el que participa en las ecuaciones de las geodésicas. Para una part´ıcula masiva el intervalo ds2 es igual a c2 dτ 2 , donde dτ es el tiempo que marca un reloj que acompa˜ na a la part´ıcula. Se puede verificar, con lo expuesto en las páginas anteriores, que las relaciones entre las cuatro variables son: dλ = c (1 − s/r) dt c dλ = √ dτ D √ dτ = D (1 − s/r) dt p dT = 1 − s/r dt 323

(13.62) (13.63) (13.64) (13.65)

13.10

dT

=

1 p dτ D (1 − s/r)

(13.66)

dT

=

1 p dλ c 1 − s/r

(13.67)

La ca´ıda vertical

Hagamos una pausa para estudiar una trayectoria simple, que es la que describe una part´ıcula masiva que se suelta desde cierta altura. Este es, sin duda, uno de los problemas más importantes de la f´ısica, como lo demuestra el interés que Galileo le prestó al construir las bases de la ciencia moderna. Suponemos que la part´ıcula se suelta desde una altura r0 . Este dato deber´ıa ser suficiente para determinar la constante D; en efecto, haciendo v = 0 en la ecuación (13.56) encontramos D=

1 1 − s/r0

(13.68)

Igualando los lados derechos de las ecuaciones (13.56) y (13.68) se obtiene: s v = c

r0 = s

s/r − s/r0 1 − s/r0 1 − v 2 /c2 s/r − v 2 /c2

(13.69)

(13.70)

Pensemos en este momento en el problema rec´ıproco, el de una part´ıcula masiva que inicialmente está en r y que se dispara hacia arriba con una velocidad v. A medida que asciende, su velocidad disminuye hasta que se vuelve cero en r0 . Vemos as´ı que la ecuación (13.69) da respuesta a dos preguntas: a) da la velocidad (en r) que tiene una part´ıcula que se suelta en r0 y, b) da la velocidad vertical que hay que impartirle a una part´ıcula para que alcance una altura máxima r0 . Del mismo modo, la ecuación (13.70) responde dos preguntas: a) si se sabe que una part´ıcula tiene (en r) una velocidad v hacia abajo, la ecuación nos permite averiguar desde qué altura fue soltada, y, b) si una part´ıcula se dispara (en r) hacia arriba, la ecuación dice cuál es la altura máxima que ella alcanza. 324

La ecuación (13.69) tiene un caso interesante, y es cuando r0 = ∞: p v = c s/r

para r0 = ∞

(13.71)

En palabras: si, con un disparo vertical, se quiere enviar una part´p ıcula al infinito, se le debe impartir una velocidad local mayor o igual que c s/r. Concentrémonos ahora en otro aspecto de la ca´ıda vertical, que es el cálculo del tiempo que transcurre entre r0 y r. Como el movimiento se da u ńicamente en la dirección radial, la constante J es cero y la ecuación (13.54) queda as´ı: µ ¶2 dr = 1 − (1 − s/r)D (13.72) dλ Utilizar la ecuación (13.63): Ã√ !2 ³ D dr s´ =1− 1− D c dτ r

(13.73)

Al tomar ra´ız cuadrada surge un ±; escogemos el signo − porque la part´ıcula está cayendo: √ r ³ D dr s´ =− 1− 1− D, c dτ r es decir: rdr

cdτ = − r

D−1 2 sr − r D

y utilizando la ecuación (13.68):

cdτ

rdr

= −r

sr − 325

s 2 r r0

,

cdτ

¶ r r2 r0 = −√ 0 s µ ¶ sr0 r r 2 − r0 r0 r d r0

µ

(13.74)

Llamar x ≡ r/r0 e integrar, asumiendo que el reloj τ comienza a marchar cuando la part´ıcula se suelta: Z

τ

c 0

r2 dτ = − √ 0 sr0

Z

r/r0

1

xdx √ x − x2

(13.75)

La integral del lado derecho se resuelve con ayuda de la fórmula 2.264.2 de [14], que es Z

p xdx 1 √ = − x − x2 − arc sen(1 − 2x) 2 2 x−x

La ecuación (13.75) es entonces s  µ ¶2 µ ¶ r02  r r 2r π 1 cτ = √ − + + arc sen 1 − sr0 r0 r0 2 r0 4

(13.76)

También nos interesa calcular t , el tiempo coordenado, y esto es un poco más dif´ıcil. Veamos: en vista de la ecuación (13.62) la ecuación (13.72) es 1 (1 − s/r)2

µ

dr cdt

¶2 = 1 − (1 − s/r)D ,

y utilizando la fórmula (13.68): 1 (1 − s/r)2

µ

dr cdt

¶2 =1−

de donde despejamos cdt: 326

1 − s/r , 1 − s/r0

p

cdt = −

1 − s/r0 dr p (1 − s/r) s/r − s/r0

(13.77)

Para integrar el lado derecho de esta ecuación conviene [24] hacer el cambio de variable η = arc cos(2r/r0 − 1) , para finalmente llegar a r ¯r ¯ ¯ r0 ¯ r0 ¯ − 1 ¯¯ ¯ s −1+ r ¯ + r ct = s ln ¯¯ r ¯ r r 0 0 ¯ ¯ − 1 − − 1 ¯ ¯ s r   s r µ ¶ µ ¶2 ³ ´ r0 r0 2r r0 r r  s −1  + 1 arc cos −1 + + s 2s r0 s r0 r0 (13.78) Esta es verdaderamente la integraci´ on de la ecuación (13.77); para cerciorarse de ello basta verificar que la ecuación (13.77) se obtiene tomando diferenciales en ambos lados de (13.78). Observemos que el logaritmo en el lado derecho de la ecuación (13.78) diverge en r = s . Esto quiere decir que para llegar a r = s la part´ıcula toma una cantidad infinita de tiempo coordenado t . La Figura 13.4 muestra dos curvas: en trazo continuo el tiempo propio τ dado por la fórmula (13.76), y en trazo punteado el tiempo coordenado t dado por la fórmula (13.78). Notoriamente, el tiempo propio τ es una función de buena conducta, mientras que el tiempo coordenado t tiene un comportamiento muy preocupante. En la sección 13.19 abordaremos de nuevo este asunto. Finalmente, es interesante anotar que la f´ısica newtoniana da la misma respuesta (13.76). En efecto, en la gravitaci´ on de Newton el potencial gravitacional es −GM/r = −c2 s/2r, y por consiguiente la energ´ıa total para una part´ıcula de masa m es −c2 sm/2r + 12 mu2 . Como esta energ´ıa es una constante del movimiento podemos escribir −

c2 sm c2 sm 1 + mu2 = − + 0, 2r 2 2r0

de donde 327

µ u2 = c2 s

1 1 − r r0

¶

Esta ecuación newtoniana coincide con la ecuación relativista (13.73), o sea que el tiempo newtoniano es el mismo tiempo dado por la ecuación (13.76).

13.11 Definimos

Potencial efectivo µ ¶ s´ J2 V = 1− D+ 2 r r ³

(13.79)

de modo que la ecuación (13.60) es vr2 = 1−V c2

(13.80)

Al tomar la derivada d/dT en ambos lados de esta ecuación se obtiene dV dlr dV dV 2vr dvr =− =− = −vr , o sea que 2 c dT dT dT dlr dlr dvr c2 dV =− dT 2 dlr

(13.81)

Esta ecuación es de la forma “aceleración es menos el gradiente del potencial”, y por esta razón V recibe el nombre de potencial efectivo. Como vr2 ≥ 0, el lado derecho de la ecuación (13.80) también tiene que ser ≥ 0: el movimiento de la part´ıcula está permitido solamente en aquellas regiones del espacio donde V ≤ 1. El gráfico de V versus r es sumamente u ´til. En un mismo gráfico se traza la función V versus r y se traza una l´ınea horizontal a una altura 1; la part´ıcula puede moverse u ńicamente en aquellas regiones donde V está por debajo de la l´ınea horizontal de altura 1. La ecuación (13.81) corresponde a un problema ficticio unidimensional en el que la fuerza es proporcional a −dV /dr. En aquellas regiones donde V es una función decreciente de r, la fuerza es repulsiva; y all´ı donde V es una función creciente, la fuerza es atractiva. Los puntos de retorno ocurren en aquellos valores de r en los que V = 1. El movimiento circular ocurre cuando se cumplen estas dos condiciones: V = 1 y dV /dr = 0; si d2 V /dr2 < 0, el 328

movimiento circular es inestable, y si d2 V /dr2 > 0 es estable. La Figura 13.2 muestra las posibilidades que tiene un fotón (D = 0) que tiene un valor de J dado por J = 2.7s ; en la gráfica, A y B son puntos de retorno: el movimiento es posible u ńicamente en las regiones r < rA y r > rB ; en la primera región las órbitas son ligadas y en la segunda desligadas. La Figura 13.3 es para una part´ıcula masiva que tiene D = 0.5 y J = 2.7s ; también en esta gráfica A y B son puntos de retorno: el movimiento es posible u ńicamente en las regiones r < rA y r > rB ; en la primera región las órbitas son ligadas y en la segunda desligadas. El lector seguramente reconoce el mismo método y los mismos elementos gráficos que se usan en mecánica clásica: potencial efectivo, puntos de retorno, pozos de potencial, etc. Hay sin embargo una diferencia importante entre los gráficos de la mecánica clásica y los de la solución de Schwarzschild: en los primeros la l´ınea horizontal representa energ´ıa total y es de altura variable, en cambio en los segundos la l´ınea horizontal es de altura fija 1. M´ aximos y m´ınimos de V (r). Calculemos las dos primeras derivadas del potencial efectivo, usando la ecuación (13.79): dV dr

=

d2 V dr2

=

¶ Dr2 2r +3− J2 s ¶ µ 2sJ 2 Dr2 3r − 2 −6+ r5 J s sJ 2 r4

µ

(13.82) (13.83)

En los máximos y m´ınimos ocurre que dV /dr = 0. Al hacer dV /dr = 0 en (13.82) se obtiene: Dr2 2r = 0 +3− 2 J s

(13.84)

Las soluciones de esta ecuación son: " # r J2 3Ds2 r= 1± 1− Ds J2

(13.85)

Para que los máximos y m´ınimos verdaderamente existan es necesario que 329

los valores dados en la ecuación (13.85) sean cantidades reales, es decir, que 3Ds2 1− sea ≥ 0: J2 J2 ≥1 3Ds2

(13.86)

La fórmula (13.85) presenta dos valores de r. ¿En cuál de ellos ocurre un máximo y en cuál un m´ınimo? Para responder esta pregunta debemos evaluar la segunda derivada d2 V /dr2 en los puntos (13.85) y determinar si d2 V /dr2 es negativa o positiva. Al colocar (13.85) en (13.83) se obtiene: 6J 2 s d2 V = dr2 r5

Ã

" # ! r 3Ds2 J2 1± 1− −1 3Ds2 J2

(13.87)

Utilizando (13.86) en (13.87) vemos que con el signo superior se obtiene d2 V /dr2 > 0, y con el signo inferior d2 V /dr2 < 0. Leamos finalmente la ecuación (13.85) as´ı:

r =

r =

" # r 3Ds2 J2 1− 1− Ds J2 " # r J2 3Ds2 1+ 1− Ds J2

V es máximo

(13.88)

V es m´ınimo

(13.89)

Nótese que (13.88) es menor que (13.89): si el máximo y el m´ınimo de V ocurren (ver condición (13.86)), el máximo se presenta en las cercan´ıas del origen, y el m´ınimo en las lejan´ıas. Una curva t´ıpica es as´ı: V es cero en r = s y asciende monótonamente hasta el r dado por (13.88). All´ı comienza a descender hasta que logra el m´ınimo en el r dado por (13.89). All´ı comienza a ascender de nuevo y tiende asint´ oticamente al valor V = D. Es en este u ´ltimo pozo de potencial donde están los planetas del sistema solar. La ecuación (13.85) da los valores de r en términos de las constantes D y J. También es deseable expresar estos r en términos de las velocidades locales v y vϕ , y para tal efecto usamos la ecuación (13.57) en (13.84), con lo que se llega al siguiente resultado: 330

3 1 − v 2 /c2 r = + s 2 2vϕ2 /c2

V m´ aximo o m´ınimo

(13.90)

´ Puntos de retorno. Estos ocurren en aquellos valores de r donde vr = 0, es decir: vϕ = v

puntos de retorno

(13.91)

Trayectoria circular. La órbita es circular si se cumplen simult´ aneamente las condiciones (13.90) y (13.91). Combinando estas dos ecuaciones obtenemos 1 1 r = 1+ s 2 v 2 /c2

órbita circular

(13.92)

La trayectoria circular es inestable si V est´ a en el máximo, y es estable si V es m´ınimo. En otras palabras, inestable para d2 V /dr2 < 0, y estable para d2 V /dr2 > 0. Investiguemos entonces bajo qué condiciones d2 V /dr2 < 0 utilizando la ecuación (13.83): −

3r Dr2 c/2

⇐

inestable

⇒

r < 3s

331

(13.93)

13.12

Puntos de retorno

En ocasiones lo que se conoce de la trayectoria de una part´ıcula es los puntos de retorno. En esta sección nos proponemos aprovechar esa información para averiguar el valor de las constantes D y J 2 . En los puntos de retorno se hace cero el lado derecho de la ecuación (13.60): µ ¶ ³ J2 s´ D + 2 = 0, 1− 1− r r es decir: r3 −

sD 2 J2 sJ 2 r + r− = 0 D−1 D−1 D−1

(13.94)

Esta es una ecuación de tercer grado y tiene, naturalmente, tres soluciones, que llamaremos r1 , r2 y r3 . Las tres ra´ıces r1 , r2 , r3 son, en general n´ umeros complejos, y denotan puntos verdaderos de retorno cuando son n´ umeros positivos. La ecuación (13.94) se puede escribir de esta otra manera: (r − r1 )(r − r2 )(r − r3 ) = 0

(13.95)

Al expandir todos los productos en esta ecuación se obtiene r3 − (r1 + r2 + r3 ) r2 + (r1 r2 + r2 r3 + r3 r1 ) r − r1 r2 r3 = 0

(13.96)

Ahora comparamos uno a uno los términos de las ecuaciones (13.94) y (13.96), para llegar a:

r1 + r2 + r3 =

sD D−1

(13.97)

r1 r2 + r2 r3 + r3 r1 =

J2 D−1

(13.98)

r1 r2 r3 =

sJ 2 D−1

(13.99)

332

Estas tres ecuaciones se pueden utilizar de dos maneras. La primera es expresar a las ra´ıces r1 , r2 y r3 en términos de las constantes D y J 2 : se obtienen unas ecuaciones sumamente complicadas. La segunda es expresar a las constantes D y J 2 en términos de dos ra´ıces r1 y r2 : sr1 r2 r1 + r2 r1 r2 − s(r1 + r2 ) + s2

r1 r2 − s(r1 + r2 ) + D = J2 =

s (r1 r2 )2 r1 + r2 r1 r2 − s(r1 + r2 ) + s2

(13.100) (13.101)

Es claro que en estas expresiones la pareja r1 , r2 puede ser substituida por r2 , r3 o por r3 , r1 . Entre las tres ra´ıces r1 , r2 y r3 existe una relación muy simple. Para deducirla dividamos ambos lados de (13.99) por s: J2 r1 r2 r3 = s D−1

(13.102)

Igualamos los lados izquierdos de las ecuaciones (13.98) y (13.102) para obtener: 1 1 1 1 + + = , r1 r2 r3 s

(13.103)

· ¸ r3 s s −1 = 1− − s r1 r2

(13.104)

o, equivalentemente:

Los planetas. En el sistema solar los planetas están en la zona lejana. La órbita de la Tierra, por ejemplo, tiene un radio promedio de 1.49 × 1013 cm. Comparando esto con s = 2.93 × 105 cm nos damos cuenta de que la razón entre estas dos cantidades es del orden de 10−8 . Si tomamos r1 y r2 como el perihelio y el apelio de la órbita terrestre, vemos que s/r1 y s/r2 son cantidades muy peque˜ nas, del orden de 10−8 . Es razonable despreciar s2 en el denominador de (13.100) y despreciar −s(r1 + r2 ) + s2 en el denominador de (13.101), para escribir esas ecuaciones de esta forma aproximada: 333

D '

µ ¶ sr1 r2 r1 r2 − s(r1 + r2 ) + [r1 r2 − s(r1 + r2 )]−1 (13.105) r1 + r2

J2 '

sr1 r2 r1 + r2

(13.106)

Los factores [ ]−1 que aparecen en (13.104) y (13.105) se expanden con la fórmula del binomio de Newton y se desprecian los términos en s2 , y as´ı llegamos a estas dos ecuaciones: s r1 + r2 s s ' 1+ + r1 r2

D ' 1+

(13.107)

r3 s

(13.108)

En el caso particular de la órbita terrestre los datos astronómicos son r1 = 1.47 × 1013 cm y r2 = 1.52 × 1013 cm. Entonces: r3 s

' 1 + 3.95 × 10−8

D ' 1 + 0.98 × 10−8 J2 s2

' 0.255 × 108

Con estos resultados el potencial efectivo para la Tierra es: µ ¶ ³ s´ s2 −8 8 V (r) = 1 − 1 + 0.98 × 10 + 0.255 × 10 × 2 r r No es fácil dibujar, en una sola página, el potencial V (r) en todo el rango 1 ≤ r/s ≤ ∞, debido a que ocurren n´ umeros muy dispares. En r/s = 1 el potencial vale cero y crece rápidamente para alcanzar el valor V = 3.8 × 106 en r/s = 3/2. All´ı comienza a descender lentamente hasta llegar al m´ınimo: V = 1 − 0.98 × 10−8 en r/s = 0.51 × 108 . Entonces comienza a crecer de nuevo hasta V = 1+0.98×10−8 en r/s = ∞. Los puntos de retorno están en r3 /s = 1+3.95×10−8 , en r1 /s = 0.50×108 y en en r2 /s = 0.52×108 . Es claro que en la zona lejana se forma un pozo de potencial, en el que reside nuestro planeta. Este pozo es muy pando y muy angosto. Su profundidad respecto a la l´ınea recta de altura 1 es apenas 0.98 × 10−8 ; nos podemos formar una idea del ancho dividiendo a r2 − r1 sobre r1 , as´ı: (r2 − r1 )/r2 = 0.04: apenas un 4 % . 334

13.13

Eliminaci´ on del par´ ametro af´ın λ

Las coordenadas (r, ϕ) de la part´ıcula son funciones de λ. Queremos eliminar el parámetro af´ın. Las ecuaciones (10.21) y (10.27) nos ense˜ naron que para tal eliminación debemos intentar una derivaci´ on en cadena. Siguiendo esta recomendación hacemos d/dλ = (dϕ/dλ)(d/dϕ) , y en vista de la ecuación (13.46): d d J = 2 2 dλ r sen θ dϕ Ahora, como todas las trayectorias que estamos estudiando pertenecen al plano ecuatorial: d J d = 2 dλ r dϕ Aplicar ambos lados de esta ecuación a la variable r: dr J dr = 2 , dλ r dϕ y elevando al cuadrado: µ

dr dλ

¶2

J2 = 4 r

µ

dr dϕ

¶2 (13.109)

Igualamos los lados derechos de las ecuaciones (13.54) y (13.109), para obtener µ ¶ µ ¶ ³ J 2 dr 2 s´ J2 =1− 1− D+ 2 , (13.110) r4 dϕ r r es decir: s 1 1 dr =± r2 dϕ J

µ ¶ ³ s´ J2 1− 1− D+ 2 , r r

o también: 335

(13.111)

1 dr r2 dϕ = ± s µ ¶ ³ 1 s´ J2 1− 1− D+ 2 J r r

(13.112)

Hemos logrado nuestro propósito, ya que esta ecuación no muestra ninguna dependencia expl´ıcita con el parámetro af´ın λ, ni con ning´ un tiempo t, τ ni T.

13.14

La variable u

Hacemos un cambio de variable usual en mecánica celeste: u ≡ mamos u0 = du/dϕ. La ecuación (13.110) es entonces J 2 u02 = 1 − D + sDu − J 2 u2 + sJ 2 u3

1 , y llar

(13.113)

Tomamos otra derivada respecto a ϕ: µ 00

0

(u + u)u =

¶ sD 3s 2 u u0 + 2J 2 2

(13.114)

En los puntos de retorno ocurre que u0 = 0. En aquellos puntos donde u0 6= 0 podemos dividir ambos lados de (13.114) por u0 para obtener: u00 + u =

sD 3s 2 u : Einstein + 2 2J 2

(13.115)

Comparaci´ on. En este momento es importante establecer una comparación con los resultados [25] de la mecánica newtoniana: u00 + u =

s 2J 2

:

Newton

(13.116)

Las ecuaciones (13.115) y (13.116) son diferentes, lo que quiere decir que las teor´ıas newtoniana y einsteiniana predicen trayectorias diferentes para las part´ıculas en ca´ıda libre. Recuérdese en particular un resultado de la geometr´ıa anal´ıtica elemental seg´ un el cual u00 + u = const. positiva es la 336

ecuación general de las curvas cónicas, y u00 + u = 0 es la ecuación de la l´ınea recta: u00 + u = const. positiva :

cónicas

(13.117)

u00 + u = 0 :

l´ınea recta

(13.118)

Las ecuaciones (13.116) y (13.117) muestran que en la teor´ıa newtoniana las trayectorias son curvas cónicas; las ecuaciones (13.115) y (13.117) muestran que en la teor´ıa einsteiniana las trayectorias no son curvas cónicas. Para mejor comparar las ecuaciones einsteiniana y newtoniana podemos reescribir la ecuación (13.115) de la manera siguiente: u00 + u =

s s(D − 1) 3s 2 u : Einstein + + 2 2J 2J 2 2

(13.119)

Observando las ecuaciones (13.116) y (13.119) nos damos cuenta de que la diferencia entre las trayectorias newtoniana y einsteiniana procede de los dos u ´ltimos términos del lado derecho de (13.119). En algunos casos estos dos términos son de tama˜ no considerable y no pueden despreciarse. ¿Podemos despreciar estos dos términos en el movimiento de los planetas alrededor del Sol? En el caso de la Tierra, al usar los valores numéricos de la página 334 descubrimos que estos dos u ´ltimos términos son 108 veces más peque˜ nos que el primer término del lado derecho de (13.119). En el caso de Mercurio, por estar más cercano al sol, estos dos términos, aunque peque˜ nos, son de un tama˜ no suficiente para producir diferencias observables, tal como veremos más tarde cuando estudiemos la precesión del perihelio de Mercurio. Antes de cerrar esta sección veamos la ecuación de la trayectoria de un pulso de luz, haciendo D = 0 en la ecuación (13.115): u00 + u =

3s 2 u 2

(13.120)

Comparando esta ecuación con (13.118) vemos que, de acuerdo con la teor´ıa einsteiniana, la trayectoria de un pulso de luz no es una l´ınea recta, asunto de primera importancia que trataremos enseguida. 337

13.15

Deflexi´ on de un rayo de luz

Vamos a estudiar la trayectoria de un rayo de luz que incide desde la derecha, como muestra la Figura 13.5. La coordenada r, que inicialmente es infinita, disminuye gradualmente hasta que alcanza un m´ınimo valor r0 . Después de este punto la coordenada r crece monótonamente. Claramente r0 es un punto de retorno, y por consiguiente vϕ = v = c, y la ecuación (13.55) da (J/r0 )2 = (1 − s/r0 )−1 . En términos de u0 = 1/r0 esta ecuación se escribe: (Ju0 )−2 = 1 − su0

(13.121)

Por tratarse de la luz, D = 0 y la ecuación (13.113) da u02 = J −2 − u2 + su3 . Dividir ambos lados de esta ecuación por u20 y definir x ≡ u/u0 para escribir: x02 = (Ju0 )−2 − x2 + su0 x3 Utilizar la ecuación (13.121): x02 = 1 − su0 − x2 + su0 x3 = 1 − x2 − su0 (1 − x3 ) · µ 2 = (1 − x ) 1 − su0 x +

1 1+x

¶¸

Como x0 = dx/dϕ, la u ´ltima ecuación se puede escribir de esta otra manera equivalente: dx · µ 2 (1 − x ) 1 − su0 x +

dϕ = ± s

1 1+x

¶¸

· µ ¶¸−1/2 dx 1 = ±√ 1 − su0 x + 1+x 1 − x2 Ahora usamos la fórmula del binomio de Newton para expandir el factor [ ]−1/2 conservando solamente los dos primeros términos en la serie: 338

· µ ¶¸ 1 dx 1 dϕ ' ± √ 1 + su0 x + 2 1+x 1 − x2 Integrar: Z

Z

ϕ(r0 )

dϕ = ± 0

0

1

· µ ¶¸ 1 1 dx √ 1 + su0 x + 2 1+x 1 − x2

Ã

1 ϕ(r0 ) = ± arc sen x − su0 2 ´ ³π + su0 = ± 2

Ã p

1−

x2

!!¯1 √ ¯ 1 − x2 ¯ + ¯ ¯ 1+x 0

El doble de este ángulo es la dirección en la que el rayo emerge: 2ϕ(r0 ) = π + 2su0 Si no hubiera la masa M , entonces s ser´ıa cero y se tendr´ıa 2ϕ(r0 ) = π . Esto quiere decir que 2su0 es la deflexión ocasionada por M . La llamamos α: α = 2su0 =

2s 4GM = 2 r0 c r0

(13.122)

Usando en (13.122) los valores numéricos G/c2 = 7.425 × 10−29 cm/g, M = M¯ = 1.99 × 1033 g, y b = R¯ = 6.96 × 1010 cm se obtiene α = 1.74 segundos. Esta cifra, predicha por Einstein [19] en 1915, ha sido confirmada en m´ ultiples ocasiones.

13.16

La precesi´ on an´ omala del perihelio de Mercurio

Se sabe que la órbita mercurial no es estática, sino que su perihelio rota alrededor del Sol. Más precisamente, podemos hablar del ángulo que barre el planeta mientras va del perihelio al apelio. Si se tratara de una elipse perfecta, tal ángulo ser´ıa π. Pero las observaciones astronómicas muestran 339

que el ángulo no es exactamente π, lo que significa que la órbita no es exactamente el´ıptica, sino que el perihelio precesa. La velocidad angular de esta precesión es 5600.73 segundos de arco cada siglo. La gravitación newtoniana admite dos causas para la precesión. La primera (que da cuenta de 5025 seg/siglo) se debe a que las observaciones se hacen desde un sistema móvil, rotante, que es la Tierra. La segunda (que da cuenta de 532 seg/siglo) se debe a las perturbaciones ejercidas por los otros planetas, especialmente Venus, Tierra y J´ upiter. Vemos as´ı que la teor´ıa newtoniana da cuenta de 5025 + 532 = 5557 seg/siglo. Pero la precesión observada no es 5557 seg/siglo sino 5600.73 seg/siglo. La diferencia, que es 5600.73 − 5557 = 43.11 parec´ıa inexplicable. Y por eso se llamó “la precesión anómala”del perihelio de Mercurio. La precesión anómala fue un misterio durante 69 a˜ nos. Los astrónomos buscaron, sin éxito, una explicación de esta “anomal´ıa”hasta que, por fin, Einstein la pudo explicar [19] en el contexto de su teor´ıa gravitacional. La ecuación (13.113) es u02 =

1 − D sD + 2 u − u2 + su3 J2 J

Escribámosla de manera factorizada: u02 = s(u − u1 )(u − u2 )(u − u3 )

(13.123)

Las constantes u1 , u2 y u3 son las soluciones de la ecuación s(u − u1 )(u − u2 )(u − u3 ) = 0 es decir, u1 , u2 y u3 son los puntos de retorno. Pensemos que u1 y u2 son el perihelio y el apelio de Mercurio, y que u3 es el tercer punto de retorno, muy cercano al centro de coordenadas. En este momento escribimos de nuevo la ecuación (13.103) en términos de las cantidades u1 , u2 y u3 : u1 + u2 + u3 = 1/s 340

de donde u3 = 1/s − u1 − u2 . Al poner esta expresión en (13.123) se llega a: 02

u

µ ¶ 1 = s(u − u1 )(u − u2 ) u − + u1 + u2 s £ ¤ = −(u − u1 )(u − u2 ) 1 − su − s(u1 + u2 ) · ¸ s(u1 + u2 ) = −(u − u1 )(u − u2 )(1 − su) 1 − 1 − su

Como u0 = du/dϕ, esta ecuación es: ¶¸ · µ s(u1 + u2 ) −1/2 dϕ = ±du −(u − u1 )(u − u2 )(1 − su) 1 − 1 − su Expresar el lado derecho como el producto de tres factores: −1/2

dϕ = ±du [−(u − u1 )(u − u2 )]

−1/2

(1 − su)

¶ µ s(u1 + u2 ) −1/2 1− 1 − su

Los dos u ´ltimos factores se expanden como potencias de su, que es una cantidad peque˜ na, as´ı : 1 1 (1 − su)−1/2 = 1 + su + ... ' 1 + su 2 2 ¶ µ ¡ ¢−1/2 s(u1 + u2 ) −1/2 1− = 1 − s(u1 + u2 )(1 − su)−1 1 − su ' (1 − s(u1 + u2 ))−1/2 1 ' 1 + s(u1 + u2 ) 2 Entonces regresamos a la ecuación de dϕ para escribir: −1/2

dϕ = ±du [−(u − u1 )(u − u2 )]

341

µ ¶µ ¶ 1 1 1 + su 1 + s(u1 + u2 ) 2 2

µ ¶ 1 + 21 su 1 = ± 1 + s(u1 + u2 ) p du 2 −(u − u1 )(u − u2 ) Ya estamos en condición de integrar. Se verifica fácilmente que Z

1 + 21 su 1 p p du = − s −(u − u1 )(u − u2 ) − 2 −(u − u1 )(u − u2 ) µ ¶ 1 u1 + u2 − 2u 1 + s(u1 + u2 ) arc sen 4 u1 − u2

O sea que Z

ϕ(u2 )

ϕ(u1 )

·

¶ µ 1 dϕ = ± 1 + s(u1 + u2 ) × 2

µ ¶ ¸¯ 1 p 1 u1 + u2 − 2u ¯¯u2 − s −(u − u1 )(u − u2 ) − 1 + s(u1 + u2 ) arc sen ¯ 2 4 u1 − u2 u1

¶· µ ¶¸ µ 1 1 ϕ(u2 ) − ϕ(u1 ) = ± 1 + s(u1 + u2 ) −π 1 + s(u1 + u2 ) 2 4 µ ¶ 3 1 2 2 = ∓π 1 + s(u1 + u2 ) + s (u1 + u2 ) 4 8 µ ¶ 3 ' ∓π 1 + s(u1 + u2 ) 4 Escoger el signo positivo: 2 (ϕ(u2 ) − ϕ(u1 )) = 2π +

3π s(u1 + u2 ) 2

El u ´ltimo término del lado derecho es la precesión anómala: el ángulo que se corre el perihelio en cada vuelta: ∆ ≡ =

3π s(u1 + u2 ) 2 3πGM (u1 + u2 ) c2 342

Ahora, podemos expresar a u1 y u2 en términos de la excentricidad ² y el semieje mayor b: 1 u1 1 u2

= r1 = (1 − ²)b = r2 = (1 + ²)b ,

∆=

o sea que

6πGM − ²2 )

c2 b(1

(13.124)

Pongamos en la ecuación (13.124) los datos de Mercurio:

∆ =

6π(6.67 × 10−8 )(1.99 × 1033 ) (3 × 1010 )2 (5.79 × 1012 )(1 − 0.2062 )

= 5.01 × 10−7

rad. cada vuelta

Como el per´ıodo es 0.241 a˜ nos = 0.00241 siglos, tenemos:

∆ =

5.01 × 10−7 0.00241

= 44.9

rad. cada siglo

segundos cada siglo

¦¦¦¦¦¦¦¦¦¦¦

La solución de Schwarzschild coincide, a grandes distancias, con la gravitación newtoniana. Esto no puede sorprendernos, ya que al construir la solución relativista nos hemos apoyado firmemente en el potencial gravitacional clásico Φ = −GM/c2 r , como puede verse en los pasos que siguen a la ecuación (13.8). A medianas distancias comienzan a notarse las diferencias entre las dos teor´ıas gravitacionales, con efectos como la precesión del perihelio de Mercurio. A cortas distancias las diferencias son radicales: cuando 343

la coordenada r es igual a s aparece un horizonte, es decir, una superficie que sólo se puede cruzar hacia adentro. Para r < s la relatividad predice unos efectos sorprendentes: la coordenada t se vuelve espacialoide, la coordenada r se vuelve temporaloide y el centro r = 0 adquiere la cualidad de atractor inevitable. En lo que resta del cap´ıtulo vamos a estudiar estos efectos curiosos.

13.17

Coordenadas temporaloides y espacialoides

Consideremos de nuevo la trayectoria de un punto que se mueve radialmente. Haciendo dθ = dϕ = 0 en la ecuación (13.12) escribimos: (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = ds2

(13.125)

Para un pulso de luz se tiene ds2 = 0 y para part´ıcula masiva hacemos ds2 > 0 : (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = 0 ,

m=0

(13.126)

(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 > 0 ,

m 6= 0

(13.127)

En la zona exterior, r > s y la cantidad (1 − s/r) es positiva. Podemos dividir ambos lados de la desigualdad (13.127) por (1 − s/r) sin afectar el signo >, para llegar a: c2 dt2 > (1 − s/r)−2 dr2

(13.128)

Esta desigualdad se cumple u ńicamente si dt 6= 0 . Esto quiere decir que el progreso del movimiento, el desarrollo del fenómeno, va necesariamente acompa˜ nado de un cambio en la coordenada t, y por esta razón t se llama coordenada temporaloide. La desigualdad (13.128) no impone ninguna condición sobre dr, el cual puede ser positivo, negativo o cero, y por eso a r le decimos coordenada espacialoide. En la región r > s, la ecuación (13.12) muestra que al diferencial temporaloide dt lo acompa˜ na el factor positivo (1 − s/r), mientras que al diferencial espacialoide dr lo acompa˜ na el factor 344

negativo − (1 − s/r)−1 . Ahora veamos lo que ocurre en la zona interior, r < s : la cantidad (1 − s/r) es negativa. Si multiplicamos ambos lados de la desigualdad (13.127) por (1 − s/r) debemos cambiar el signo > por el signo < , as´ı: dr2 > (1 − s/r)2 c2 dt2

(13.129)

Esta desigualdad se cumple u ńicamente si dr 6= 0 . Esto quiere decir que el progreso del movimiento, el desarrollo del fenómeno, va necesariamente acompa˜ nado de un cambio en la coordenada r, y por esta razón r se llama coordenada temporaloide. La desigualdad (13.129) no impone ninguna condición sobre dt, el cual puede ser positivo, negativo o cero, y por eso a t le decimos coordenada espacialoide. En la región r < s, la ecuación (13.12) muestra que al diferencial temporaloide dr lo acompa˜ na el factor positivo −1 − (1 − s/r) , mientras que al diferencial espacialoide dt lo acompa˜ na el factor negativo (1 − s/r) . Reconocemos as´ı que al pasar del exterior al interior las coordenadas t y r intercambian sus papeles: la coordenada temporaloide se vuelve espacialoide, y la espacialoide se vuelve temporaloide. Esto trae consigo una rotación del cono de luz, como veremos enseguida.

13.18

El cono de la luz

El cono de luz en un evento dado se construye trazando las curvas luminoides, es decir, aquellas que cumplen la condición ds = 0. Acto seguido se procede a averiguar en qué dirección está orientado este cono de luz. Con el propósito de simplificar el análisis, concentrémonos en las coordenadas (r, θ), de modo que podamos hacer dibujos bidimensionales. Trazamos, cruzándose en el evento central escogido, los ejes de t y de r, el primero vertical y el segundo horizontal. En seguida se dibuja la LÍNEA en el mundo de los eventos que tienen la misma coordenada espacialoide del evento central. La clave está en identificar que el cono de luz acoge, rodea a esa LÍNEA, y eso determina la orientación del cono: si la LÍNEA es vertical, entonces el cono de luz es también vertical, está erguido; y si la LÍNEA es horizontal, entonces el cono de luz es también horizontal, está acostado. Veamos:

345

Para la región exterior r > s la Figura 13.6 muestra el cono de luz centrado en el evento A . La l´ınea AB es la trayectoria de un punto que mantiene constante la coordenada espacialoide r . Como esta l´ınea es vertical, el cono debe ser vertical, es decir, el pasado está abajo y el futuro arriba. Ning´ un objeto puede viajar del futuro al pasado. Pero en la región interior r < s el análisis trae sorpresas. La Figura 13.7 muestra el cono de luz centrado en el evento C . La l´ınea CD es la trayectoria de un punto que mantiene constante la coordenada espacialoide t . Como esta l´ınea es horizontal, el cono debe ser horizontal. Pero debemos además aclarar si el pasado está a la izquierda y el futuro a la derecha, como en la Figura 13.8, o si, por el contrario, el pasado está a la derecha y el futuro a la izquierda, como en la Figura 13.9. Demostremos que la Figura 13.9 es la correcta. Una part´ıcula masiva que se suelta desde cierta altura sigue la curva punteada ct de la Figura 13.4, y esa curva indica que el fenómeno progresa de derecha a izquierda; es decir, la relación pasado-futuro es, en la Figura 13.7, la dirección derecha-izquierda: la Figura 13.9 es la correcta. Todos los objetos viajan del pasado al futuro, y ninguno viaja del futuro al pasado: en la región interior r < s todos los objetos se mueven hacia el centro r = 0 , y ninguno viaja hacia afuera. El punto r = 0 es el futuro ineludible para todos los objetos que se encuentren en la región interior r < s . Los objetos pueden moverse hacia atrás o hacia adelante en la coordenada espacialoide, pero sólo pueden moverse hacia adelante en la coordenada temporaloide. En la región exterior r > s los objetos pueden moverse hacia atrás o hacia adelante en la coordenada espacialoide r, pero sólo pueden moverse hacia adelante (hacia t = ∞) en la coordenada temporaloide t . En la región interior r < s los objetos pueden moverse hacia atrás o hacia adelante en la coordenada espacialoide t, pero sólo pueden moverse hacia adelante (hacia r = 0) en la coordenada temporaloide r . Estas consideraciones ponen de manifiesto uno de los asuntos más intrigantes de la f´ısica teórica del siglo XX, que es la existencia de huecos negros. Un agujero negro, en general, es una región del espacio a la que se puede entrar, pero no salir: ning´ un objeto puede cruzar hacia afuera la superficie que bordea a la región mencionada. Esa superficie recibe el nombre de horizonte. El hueco negro es un corte en el espaciotiempo, es un aislamiento, una exclusión porque, para los objetos que están dentro, la región exterior es inaccesible. En el caso particular del espaciotiempo de Schwarzschild, el hueco negro es el sector r < 0 y el horizonte es la superficie esférica r = s. 346

13.19

Singularidades

Uno de los resultados más curiosos en el problema del cuerpo que se suelta desde cierta altura es que el tiempo coordenado t se vuelve infinito en el horizonte r = s, como muestra la curva de trazo punteado en la Figura 13.4. Si este fuera un efecto f´ısico verdadero, la part´ıcula nunca llegar´ıa al horizonte, contradiciendo nuestras expectativas. Nos preguntamos si este es un efecto f´ısico real, o es acaso un defecto de las coordenadas (ct, r). Para responder la pregunta recordemos que el tiempo propio τ no exhibe ninguna discontinuidad en r = s, como se ve en la curva de trazo continuo de la Figura 13.4. Hay dos tiempos, t y τ , que tienen comportamientos muy diferentes en el horizonte. ¿Cuál de los dos tiempos es más confiable? La respuesta de esta pregunta es enfática: τ es más confiable porque es un escalar, es decir, una cantidad invariante. En conclusión, el hecho matemático de que t sea infinito en el horizonte no expresa un hecho f´ısico real, sino que es el resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de t usamos un tiempo sano τ , este tiempo propio resulta perfectamente finito en el horizonte. Hay otro asunto que pone en evidencia el comportamiento patológico de las coordenadas (ct, r) en el horizonte, y es que en r = s algunas componentes del tensor de Riemann Rαβµν valen infinito, tal como puede verse en la sección 13.2. Si éste fuera un efecto f´ısico verdadero, las fuerzas de marea ser´ıan infinitas en r = s, y un cuerpo extenso que atravesara el horizonte sufrir´ıa desgarrones infinitos. Nos preguntamos si éste es un efecto f´ısico real, o es acaso un defecto de las coordenadas (ct, r). El caso mencionado en el párrafo anterior nos mueve a desconfiar de las coordenadas (ct, r), y en consecuencia nos preguntamos si existe acaso otro sistema coordenado en el que el tensor de Riemann sea finito en el horizonte. El hecho es que este otro sistema coordenado existe, y lo llamamos x ¯ en la sección 9.21. El lector está invitado a reconocer, en la página 249, que todas las componentes ¯ αβµν del tensor de Riemann son finitas y de buena conducta en r = s; esto R quiere decir que en la superficie de Schwarzschild las fuerzas de marea y la desviación geodésica son finitas. En conclusión, el hecho matemático de que Rαβµν sea infinito en el horizonte no expresa un hecho f´ısico, sino que es el resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de (ct, r) usamos unas coordenadas sanas x ¯, el tensor de Riemann αβµν ¯ R queda perfectamente finito en el horizonte. Las coordenadas (ct, r, θ, ϕ) se comportan mal en la superficie r = s. En 347

términos técnicos, esas coordenadas son singulares en r = s. Hagamos una pausa para discutir el asunto de las singularidades en una geometr´ıa cualquiera, no necesariamente la de Schwarzschild. Para estudiar las propiedades geométricas de un espacio cualquiera se debe escoger un sistema coordenado, y éste debe describir adecuadamente la geometr´ıa. Si acaso en alg´ un punto P de ese espacio las coordenadas no describen [16] fielmente la geometr´ıa, decimos que el sistema coordenado es singular en el punto P . Por ejemplo, las coordenadas esféricas (θ, ϕ) presentan una singularidad en θ = 0 , porque all´ı la coordenada ϕ es indefinida, ya que puede tomar cualquier valor entre 0 y 2π ; as´ı mismo, estas coordenadas son singulares en θ = π. La singularidad de las coordenadas (θ, ϕ) en θ = 0, π se manifiesta claramente en los mapamundis que usan proyecciones cil´ındricas, que son aquellas en que los paralelos aparecen como l´ıneas rectas horizontales y los meridianos como rectas verticales. La Figura 13.10 muestra uno de esos mapas. All´ı, la l´ınea AB representa al polo norte y CD al polo sur. El error del mapa es grave: el polo norte, que es un punto y tiene extensión cero, está representado en el mapa por medio de la l´ınea AB , cuya longitud no es cero. Uno se pregunta si este error es un defecto del mapa o es un problema intr´ınseco de la geometr´ıa, y la respuesta es inmediata: desde un punto de vista geométrico, los polos norte y sur no tienen ninguna peculiaridad, no hay nada en la geometr´ıa intr´ınseca que haga especiales a los polos; entonces el problema debe ser del mapamundi y la proyecci´ on cil´ındrica falla: las coordenadas (θ, ϕ) son singulares en los polos. De regreso a la geometr´ıa de Schwarzschild, la sección 13.2 muestra que el tensor de Riemann diverge5 en r = 0 y en r = s . Ya hemos visto que la singularidad en r = s es espuria, y por eso recibe el nombre de pseudosingularidad. Pero los infinitos que ocurren en r = 0 tienen6 una explicación f´ısica, y es que all´ı la densidad de masa es infinita; no nos sorprende que cuando r tiende a cero el tensor de Riemann y las fuerzas de marea tiendan a valores infinitos.

5

Ya hemos mencionado en la p´ agina 306 que la soluci´ on de Schwarzschild no debe ser v´ alida en el origen de coordenadas r=0, o sea que los Rαβµν de la secci´ on 13.2 no se deben evaluar en r=0. Para ser m´ as cuidadosos deber´ıamos decir que el tensor de Riemann tiende a infinito en el origen. 6 En general, discernir si una singularidad es f´ısica o si, por el contrario, es un defecto del sistema coordenado, es un asunto peliagudo, como también lo es, en el segundo caso, construir otro sistema coordenado libre de singularidades [26, 27].

348

13.20

Las coordenadas de Kruskal-Szekeres

Hemos visto que en la superficie de Schwarzschild r = s las coordenadas (ct, r, θ, ϕ) presentan varias anomal´ıas indeseables: de un lado, gµν y Rαβµν toman valores infinitos y, de otro lado, tal como muestra la Figura 13.4, la curva de t versus r es discontinua y tiene una as´ıntota. Ya hemos mencionado que estas dificultades no reflejan problemas intr´ınsecos de la geometr´ıa, sino que son defectos exclusivamente achacables a las coordenadas (ct, r, θ, ϕ) . Ser´ıa bueno encontrar un sistema de coordenadas sano, en el que las l´ıneas en el mundo sean continuas y sin as´ıntotas, un sistema coordenado en el que gµν y Rαβµν sean funciones regulares. Se han encontrado varias soluciones a este problema; en efecto, se conocen varios sistemas coordenados que no presentan las anomal´ıas mencionadas, entre los cuales podemos mencionar el de Eddington-Finkelstein, el de Painlevé-Gullstrand y el de Kruskal-Szekeres. En esta sección vamos a presentar este u ´ltimo sistema de coordenadas. Se trata de ejecutar el cambio de coordenadas (ct, r, θ, ϕ) → (v, u, θ, ϕ) , donde las nuevas coordenadas (v, u) están definidas de la manera siguiente. En la región r < s : p ct 1 − r/s cosh 2s p ct u = er/2s 1 − r/s senh , 2s v = er/2s

(13.130) (13.131)

y en la región r > s : p ct r/s − 1 senh 2s p ct u = er/2s r/s − 1 cosh 2s v = er/2s

(13.132) (13.133)

Las transformadas inversas son ct = 2s arctanh u/v ,

para r < s

(13.134)

ct = 2s arctanh v/u ,

para r > s

(13.135)

para todo r

(13.136)

(r/s − 1) er/s = u2 − v 2 , 349

La u ´ltima ecuación debe entenderse como una definición impl´ıcita de r en términos de las variables v y u . Tomando diferenciales en las ecuaciones (13.130), (13.131), (13.132) y (13.133) llegamos a estas expresiones que son válidas para todos los valores de r : dv =

c 1 u dt + (1 − s/r)−1 v dr 2s 2s

du =

c 1 v dt + (1 − s/r)−1 u dr 2s 2s

Elevamos al cuadrado cada una de estas dos ecuaciones y luego restamos lado a lado, obteniéndose: ¤ 1 u2 − v 2 £ 2 c (1 − s/r) dt2 − (1 − s/r)−1 dr2 2 4s 1 − s/r

(dv)2 − (du)2 =

En el lado derecho podemos usar la ecuación (13.12): dv 2 − du2 =

¤ 1 u2 − v 2 £ 2 ds + r2 (dθ2 + sen2 θ dϕ2 ) , 2 4s 1 − s/r

de donde: ds2 = 4s2

1 − s/r (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) u2 − v 2

Finalmente usamos la ecuación (13.136): ds2 = 4s2 ds2 =

1 − s/r (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) r/s (r/s − 1) e

4s3 −r/s e (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) r

(13.137)

Olvidando las coordenadas angulares (θ, ϕ), la Figura 13.11 muestra el espaciotiempo (v, u). En este dibujo se debe entender que r significa r/s y t 350

significa t/s . La gráfica es la superposición de un conjunto de l´ıneas rectas radiales (que son regiones de t constante) y otro conjunto de hipérbolas (que son regiones de r constante). Las rectas t = ∞ y t = −∞ parten el espaciotiempo en cuatro cuadrantes: el de la derecha, el de arriba, el de la izquierda y el de abajo. Por razones que expondremos prontamente, el cuadrante de arriba es un agujero negro. El cono de la luz. Consideremos la trayectoria de un punto que se mueve radialmente. Haciendo dθ = dϕ = 0 en la ecuación (13.137) escribimos 4s3 −r/s e (dv 2 − du2 ) = ds2 r

(13.138)

Para un pulso de luz se tiene ds2 = 0 y para part´ıcula masiva hacemos ds2 > 0 : 4s3 −r/s e (dv 2 − du2 ) = 0 , r 4s3 −r/s e (dv 2 − du2 ) > 0 , r

para la luz

(13.139)

part´ıcula masiva

(13.140)

La desigualdad (13.140) quiere decir dv 2 > du2 . Esta desigualdad se cumple u ńicamente si dv 6= 0 . Vemos as´ı que el progreso del movimiento, el desarrollo del fenómeno, va necesariamente acompa˜ nado de un cambio en la coordenada v, y por esta razón v es una coordenada temporaloide. La desigualdad dv 2 > du2 no impone ninguna condición sobre du, el cual puede ser positivo, negativo o cero, y por eso u es una coordenada espacialoide. La coordenada v es temporaloide en todo el espaciotiempo y la coordenada u es espacialoide en todo el espaciotiempo. Nótese, en la ecuación (13.137), 4s3 −r/s e , que al diferencial temporaloide dv lo acompa˜ na el factor positivo r mientras que al diferencial espacialoide du lo acompa˜ na el factor negativo 3 4s −r/s − e . r Ahora nos preguntamos cómo se dibuja, en la Figura 13.11, la trayectoria de un punto que mantiene constante la coordenada espacialoide u. La respuesta es: se traza una l´ınea vertical. Entonces el cono de luz debe también ser vertical, con el pasado abajo y el futuro arriba. Los objetos pueden 351

moverse hacia atrás o hacia adelante en la coordenada espacialoide u , pero sólo pueden moverse hacia adelante en la coordenada temporaloide v (s´ olo se pueden mover de abajo hacia arriba en la Figura 13.11). Los pulsos de luz satisfacen la ecuación (13.139); esta ecuación dice que du2 = dv 2 , o sea que du = ±1 dv

(13.141)

Esta ecuación tiene un significado interesante, pues dice que las trayectorias de los pulsos de luz tienen una inclinación de ±45 grados en el espacio (v, u) . Recordando que los conos de luz están bordeados por trayectorias de pulsos de luz, llegamos a la siguiente conclusión: en el espacio (v, u) los conos de luz tienen una apertura angular de 90 grados, as´ı como en la relatividad especial, seg´ un la Figura 2.6. Las trayectorias de las part´ıculas (masivas o no masivas) quedan contenidas dentro del cono de luz, es decir, hacen ángulos de ≤ 45 grados a lado y lado de la dirección vertical en la Figura 13.11. Si dibujamos l´ıneas curvas que en todo punto hacen ángulos de ≤ 45 grados a lado y lado de la dirección vertical en la Figura 13.11, nos damos cuenta de que, en el cuadrante de arriba, TODAS estas trayectorias avanzan hacia valores decrecientes de r , es decir, hacia la hipérbola r = 0 , lo que significa que este cuadrante es verdaderamente un hueco negro. En el cuadrante derecho, algunas trayectorias de part´ıculas avanzan hacia valores crecientes de r y otras avanzan hacia valores decrecientes de r , lo que significa que este cuadrante es el exterior del hueco negro. La frontera entre el cuadrante derecho y el de arriba, la recta (t = ∞, r = 1) , es la superficie de Schwarzschild, esa “membrana” que sólo se puede cruzar en una dirección. En el cuadrante de abajo TODAS las trayectorias de part´ıculas avanzan hacia valores crecientes de r y penetran en los cuadrantes derecho e izquierdo. Por esta razón, al cuadrante de abajo, en un juego de palabras, se le podr´ıa llamar hueco blanco. Esto del hueco blanco es una n ãpa que nos da la Figura 13.11, pero no podemos precipitarnos a afirmar la existencia real de estos objetos en el universo [13].

352

t=8

t=8

V(r) 1

Dt2

B

A

Dt1 0.5 t=7

t=7

r

2.5 s

1.5 s

Figura 13.1 Las l´ıneas curvas representan una serie de proyectiles que se lanzan periódicamente de un punto a otro. Como todos los lanzamientos son idénticos, las l´ıneas curvas son también iguales.

Figura 13.2 Potencial efectivo para un pulso de luz con J = 2.7s . Las marcas A y B denotan puntos de retorno.

V(r)

8 t 1 A

B

6

4

t t

2 0.5 r 3s

6s

s

Figura 13.3 Potencial efectivo para part´ıcula masiva con D = 0.5 y J = 2.7s . Las marcas A y B denotan puntos de retorno.

r

Figura 13.4 Un cuerpo se suelta desde cierta altura. En trazo continuo el tiempo propio τ , y en trazo punteado el tiempo coordenado t .

353

t

Futuro B s

r A

Pasado r ro j x

Figura 13.5 Un pulso de luz incide de derecha a izquierda. Su trayectoria se deflecta debido a la presencia de la masa M en el origen de coordenadas.

Figura 13.6 Fuera del hueco negro, el cono de luz está erguido: el pasado abajo y el futuro arriba.

t

s

D

r

C

Figura 13.7 Dentro del hueco negro el cono de luz está acostado.

Futuro

Futuro

Pasado

C

Figura 13.8 Dentro del hueco negro. ¿Está el futuro a la derecha? A

B

C

D

Pasado

C

Figura 13.9 Dentro del hueco negro. ¿Está el futuro a la izquierda?

Figura 13.10 Proyecci´ on cil´ındrica: los meridianos son rectas verticales y los paralelos son rectas horizontales. La recta AB representa el polo norte, y recta CD representa el polo sur.

354

8

5

0 r= 7 0. r= 0.9 r=

9

r=

1.0 r= 1.2

r=

t=-

2 1.3 t=

1 .0 9 r= 1.2

-1.

32

t=

2 1.3

55

32 -1.

t=

1

1

r=

t=

8

t =0.5

t=

1 r=

-

t = -0.

t=

t=0

v

.55

t=0

0.55

t=0

0

r=

0.9 r=

-1

0.7 0

t=

- 1 t= r=

8

r=

1

r=

0

-1

8

1

Figura 13.11 Coordenadas de Kruskal-Szekeres. Las regiones de t constante son l´ıneas rectas radiales. Las regiones de r constante son hipérbolas. El cuadrante superior es un agujero negro.

355

u

356

Ap´ endice A

La constancia de la velocidad de la luz

Al mirar los tres postulados (1.10) que fundamentan a la relatividad especial, no se nos escapa que el principio de la constancia de la velocidad de la luz (que aqu´ı llamaremos cortamente PriVel) es de un carácter muy diferente a los otros dos. En efecto, el principio de la homogeneidad del tiempo y del espacio (PriHomo) y el principio de la relatividad (PriRel) son extensiones esperadas de ideas que hab´ıan estado presentes en el pensamiento cient´ıfico desde hac´ıa mucho tiempo. De un lado, a comienzos del siglo XVII, justo antes de Newton, ya se aceptaba [28] que el espacio es infinito, homogéneo e isótropo. De otro lado, Newton escribe: “The motions of bodies included in a given space are the same among themselves, whether that space is at rest, or moves uniformly forwards in a right line without any circular motion” [29]. El PriVel es inesperado y extra˜ no. Einstein lo introduce abruptamente, sin motivación manifiesta, en la segunda página del art´ıculo en el que presenta su teor´ıa de la relatividad especial [2]. La aparición s´ ubita de PriVel lo hace particularmente dif´ıcil de aceptar, o entender. Aunque la evoluci´ on del pensamiento cient´ıfico no es una secuencia suave y continua de pasos cortos, s´ı desear´ıamos creer que el surgimiento de las ideas cient´ıficas tiene alguna motivación. El PriVel carece de esta motivaci´ on. El propósito de este cap´ıtulo es un intento de suministrar la motivaci´ on deseada; en efecto demostraremos que PriVel se puede deducir a partir de PriHomo, PriRel y de las ecuaciones de Maxwell. En la sección A.1 aplicamos el PriRel a las ecuaciones de Maxwell. Para esto se requiere un conjunto de reglas (transformaciones) que relacionen las coordenadas espaciotemporales de dos observadores inerciales; la sección A.2 establece el tratamiento general de esas transformaciones. En la sección A.3 regresamos al análisis de la sección A.1 y probamos que la luz tiene la misma velocidad en todos los 357

sistemas inerciales. Con esto queda cumplido el propósito de este cap´ıtulo, pero no podemos perder la oportunidad de dar, muy fácilmente, otros dos pasos interesantes: en la sección A.4 deducimos las transformaciones de Lorentz, y en la sección A.5 deducimos las reglas de transformación del campo electromagnético.

A.1

El principio de la relatividad

Einstein comienza su art´ıculo estudiando dos fenómenos: En el Fen´ omeno 1 hay un material que conduce la electricidad (un trozo de metal por ejemplo) en reposo y hay un imán en las cercan´ıas que se desplaza con una velocidad v respecto al metal. Es claro que en el metal se produce una corriente eléctrica que llamaremos i1 . En el Fen´ omeno 2 hay un imán en reposo y, en las cercan´ıas, hay un trozo de metal que se desplaza con una velocidad −v respecto al imán. Es claro que en el metal se produce una corriente eléctrica que llamaremos i2 . Si en los dos fenómenos participan imanes iguales y conductores iguales, y si los arreglos de los dos fenómenos son similares, podemos afirmar, sin duda, que i1 = i2 . Esto, que i1 sea igual a i2 , es el hecho observado importante, y nos mueve a pensar que los dos fenómenos son equivalentes. Pero la teor´ıa electromagnética de Maxwell, seg´ un se la entend´ıa a finales del siglo XIX y principios del XX, no pod´ıa aceptar la equivalencia de los dos fenómenos. De hecho, los f´ısicos supon´ıan que las ecuaciones de Maxwell eran válidas u ńicamente para un observador en reposo respecto al éter y que, portanto, en el Fen´ omeno 1 es el metal el que está en reposo respecto al éter (está en reposo absoluto), mientras que en el Fen´ omeno 2 el imán es el que está en reposo absoluto. Para los cient´ıficos de la época los dos fenómenos mencionados eran esencialmente diferentes. No hab´ıa simetr´ıa entre las dos situaciones.1 Einstein se siente incómodo con esta asimetr´ıa, y quiere resolverla. Propone entonces que el PriRel, además de ser válido en los fenómenos de la mecánica, debe también ser válido en los fenómenos electromagnéticos: todos los observadores inerciales deben ser igualmente leg´ıtimos. El viejo observador en reposo respecto al éter, el que estaba en “reposo absoluto”, no es más importante que los otros. El éter no es necesario, como tampoco lo son las nociones de 1

La asimetr´ıa se hac´ıa patente en que, para ellos, en el Fen´ omeno 1 hay un campo eléctrico (de este campo eléctrico da cuenta la ecuaci´ on de Maxwell c∇ × E = −∂B/∂t), mientras que en el Fen´ omeno 2 no hay ning´ un campo eléctrico.

358

reposo absoluto ni espacio absoluto. Para entender que las leyes del electromagnetismo son válidas en todos los observadores inerciales se necesitan tres cosas: Primero, averiguar cómo es la verdadera transformación de coordenadas (t, x, y, z) → (t0 , x0 , y 0 , z 0 ). Segundo, averiguar cómo es la transformación de los campos (E, B) → (E0 , B0 ). Y tercero, que los pasos Primero y Segundo se unan de modo que las ecuaciones de Maxwell sean covariantes. Einstein decide resolver primero el problema (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) (introduciendo un nuevo principio, el de la velocidad de la luz) y deja para después el problema (E, B) → (E0 , B0 ) y la covariancia de las ecuaciones. Nosotros ahora, en este apéndice, tomaremos otra ruta: Supondremos que las ecuaciones de Maxwell son covariantes; con ésto y con PriHomo demostraremos la constancia de la velocidad de la luz, hallaremos cómo debe ser la transformación (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) y deduciremos la transformación (E, B) → (E0 , B0 ). Para aplicar el PriRel cuantitativamente utilizamos los dos observadores inerciales O y O0 . Para O, dos de las ecuaciones de Maxwell en el vac´ıo son: 1 ∂E c ∂t 1 ∂B c ∂t

= ∇×B

(A.1)

= −∇ × E

(A.2)

Para el observador O0 las ecuaciones correspondientes son 1 ∂E0 c0 ∂t0 1 ∂B0 c0 ∂t0

= ∇0 × B0

(A.3)

= −∇0 × E0

(A.4)

Probaremos que c0 = c, es decir, que la velocidad de la luz es la misma para todos los observadores inerciales. De la ecuación (A.1) tomamos la parte y , y de la ecuación (A.2) tomamos la parte z : 1 ∂t Ey = ∂z Bx − ∂x Bz c 359

(A.5)

1 ∂t Bz = ∂y Ex − ∂x Ey , c donde, tal como hemos hecho en otras ocasiones, ∂t quiere decir Para O0 las ecuaciones correspondientes son: 1 ∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 c0 1 ∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 c0

(A.6) ∂ , etc. ∂t

(A.7) (A.8)

Supondremos que las ecuaciones de Maxwell expresan leyes f´ısicas, de manera que a ellas se aplica el PriRel. En particular, las ecuaciones (A.5) y (A.6) deben ser equivalentes a las ecuaciones (A.7) y (A.8). Debe existir entonces un conjunto de cuatro funciones que expresen las coordenadas primadas (t0 , x0 , y 0 , z 0 ) en términos de las no primadas (t, x, y, z); a esto nos dedicamos enseguida.

A.2

Transformaciones

Recordemos que las cuatro ecuaciones (1.28) se obtuvieron utilizando u ńicamente los principios de la relatividad y de la homogeneidad del espacio y el tiempo. Reescribamos este conjunto de ecuaciones t0

=

a00 t + a01 x

(A.9)

0

x

=

a11 (x − vt)

(A.10)

0

=

y

(A.11)

z0

=

z

(A.12)

y

Los tres coeficientes desconocidos a00 , a01 y a11 son funciones de la velocidad v, o sea que deber´ıamos escribir, propiamente, a00 (v), a01 (v) y a11 (v). Antes de seguir adelante, probaremos que los coeficientes a00 (v) y a11 (v) satisfacen las siguientes condiciones: a00 (v)

> 0

(A.13)

a11 (v)

> 0

(A.14)

360

a00 (−v)

= a00 (v)

(A.15)

Para probar estas fórmulas consideremos el plano x = 0 ; de acuerdo con las ecuaciones (A.9) y (A.10), los eventos de este plano satisfacen las ecuaciones t0 = a00 (v) t

(A.16)

x0 = −a11 (v) vt

(A.17)

Para estos eventos la condición t > 0 debe implicar que t0 > 0; entonces, en vista de la ecuación (A.16), el coeficiente a00 (v) debe ser positivo; esto prueba la ecuación (A.13). De la misma manera, para estos eventos la condición t > 0 debe implicar que x0 < 0; entonces, en vista de la ecuación (A.17), el coeficiente a11 (v) debe ser positivo; esto prueba la ecuación (A.14). Para probar la ecuación (A.15) consideramos otro observador O00 que se mueve, respecto a O, con velocidad v en la dirección −x ; en vista de la ecuación (A.16) escribimos: t00 = a00 (−v) t

(A.18)

Ahora, t00 debe ser igual a t0 ; entonces la ecuación (A.18) es t0 = a00 (−v) t . Al comparar esta ecuación con la ecuación (A.16) vemos que a00 (−v) = a00 (v). Esta es la prueba de la ecuación (A.15).

A.3

La velocidad de la luz

En el cap´ıtulo 1 seguimos la exposición convencional: se presentan los tres principios de la relatividad especial y a partir de ellos se deducen las transformaciones de Lorentz. Luego, en la sección 4.1 y de nuevo en la sección 6.5 se dedujeron las transformaciones de los campos electromagnéticos E y B. Tal como indicamos hace poco, en este Apéndice tomaremos otra ruta. Asumiremos válidos el principio de la homogeneidad del espacio y el tiempo, el principio de la relatividad y algunas de las ecuaciones de Maxwell; y a partir de estos supuestos, deduciremos las transformaciones de Lorentz y deduciremos las reglas de transformación de E y B . Las cuatro ecuaciones (A.9)-(A.12) son una familia de transformaciones. Dos miembros de esta familia son las transformaciones de Galileo y las de 361

Lorentz. La transformaciones galileanas se obtienen haciendo a00 = a11 = 1 y a01 = 0. Demostraremos que las transformaciones de Lorentz se obtienen al aplicar el PriRel a las ecuaciones de Maxwell, es decir, explotando la equivalencia que existe entre las ecuaciones (A.5), (A.6) y las ecuaciones (A.7), (A.8). Para tal efecto, las derivadas no primadas ∂t , ∂x , ∂y , ∂z se expresarán en términos de las derivadas primadas ∂t0 , ∂x0 , ∂y0 , ∂z 0 , de modo que las ecuaciones (A.5) y (A.6) se “conviertan” en otras ecuaciones que usan derivadas primadas. Al comparar término a término las ecuaciones “convertidas” con las ecuaciones (A.7) y (A.8), descubriremos la constancia de la velocidad de la luz. Esto nos llevar´ a a las transformaciones de Lorentz en la sección A.4 y a las transformaciones del campo electromagnético en la sección A.5. Para escribir las derivadas no primadas en términos de las primadas usamos la regla de la derivaci´ on en cadena. Se ve fácilmente que, usando las ecuaciones (A.9)-(A.12), la regla de la derivaci´ on en cadena da: ∂t = a00 ∂t0 − va11 ∂x0 ∂x = a11 ∂x0 + a01 ∂t0 ∂y = ∂y0

(A.19)

∂z = ∂z 0

Colocamos estas derivadas en las ecuaciones (A.5) y (A.6) para obtener: µ

¶

³ v ´ = ∂z 0 Bx − ∂x0 a11 Bz − Ey (A.20) c µ 0 ¶ ³ 1 c v ´ 0 0 0 0 a B + a c E = ∂ E − ∂ a E − Bz (A.21) ∂ 00 z 01 y y y x x 11 t c0 c c 1 ∂t0 c0

c0 a00 Ey + a01 c0 Bz c

Comparemos estas dos ecuaciones con las ecuaciones (A.7) y (A.8); los campos en la ecuación (A.7) deben ser proporcionales a los campos en la ecuación (A.20): µ Ey0

= f

c0 a00 Ey + a01 c0 Bz c

Bx0 = f Bx

¶ (A.22) (A.23)

362

v Bz0 = f a11 (Bz − Ey ) c

(A.24)

Aqu´ı, f (v) es una función que depende solamente del parámetro v. De la misma manera, introducimos una función g(v) para comparar la ecuación (A.8) con la ecuación (A.21): µ Bz0

= g

c0 a00 Bz + a01 c0 Ey c

¶ (A.25)

Ex0 = g Ex

(A.26)

v Ey0 = g a11 (Ey − Bz ) c

(A.27)

Las funciones f (v) y g(v) son desconocidas. Pasamos a probar que g(v) = f (v). Para tal efecto notemos que los lados derechos de las ecuaciones (A.22) y (A.27) deben ser iguales: c0 v ga11 Ey − g a11 Bz = f a00 Ey + f a01 c0 Bz c c Los coeficientes de Ey deben ser iguales entre s´ı, y los de Bz también deben ser iguales entre s´ı: c0 g a11 = f a00 c v −g a11 = f a01 c0 c

(A.28) (A.29)

Del mismo modo, al igualar los lados derechos de las ecuaciones (A.24) y (A.25) obtenemos: c0 f a11 = g a00 c v −f a11 = g a01 c0 c

(A.30)

Con una mirada a las ecuaciones (A.28) y (A.30) nos damos cuenta de que 363

g 2 = f 2 , es decir, g = ±f . Para descubrir cuál de los dos signos es adecuado, se pone la condición g = ±f en la ecuación (A.28), obteniéndose c0 a00 c

a11 = ±

Sin embargo, de acuerdo con las ecuaciones (A.13) y (A.14), los coeficientes a00 y a11 son positivos, o sea que debemos escoger el signo superior: g = +f . Poniendo la condición g = f en las ecuaciones (A.28) y (A.29) se obtiene c0 a00 c = a01 c0

a11 = v − a11 c

(A.31)

Estas dos ecuaciones implican que a01 = −

v a00 c2

(A.32)

En vista de las ecuaciones (A.31) y (A.32) y la condición g = f , reescribimos las seis ecuaciones de transformación (A.22)-(A.27) de esta manera compacta: Ex0 = f (v) Ex0

(A.33)

Bx0 = f (v) Bx0 Ey0 = f (v) a00 (v) Bz0

c0

³

´

Ey − c ³ c0 = f (v) a00 (v) Bz − c

v Bz c v ´ Ey c

(A.34) (A.35) (A.36)

Demostremos rápidamente que f (v) debe ser una función par de v. Para tal efecto supongamos que Ey = 0, de modo que la ecuación (A.36) da Bz0 = f (v) a00 (v) 364

c0 Bz c

(A.37)

Ahora consideremos otro observador inercial O00 que se mueve, respecto a O, con velocidad v en la dirección −x ; en vista de la ecuación (A.37) escribimos: Bz00 = f (−v) a00 (−v)

c0 Bz c

(A.38)

Claramente, Bz0 y Bz00 deben ser iguales, y podemos formar una nueva ecuación con los lados derechos de las ecuaciones (A.37) y (A.38): f (v) a00 (v)

c0 c0 Bz = f (−v) a00 (−v) Bz , c c

o sea que, apoyándonos en la ecuación (A.15): f (−v) = f (v)

(A.39)

Para hallar el rec´ıproco del sistema de ecuaciones (A.35) y (A.36) intercambiamos variables primadas y no primadas, y escribimos −v en vez de v: c c0 c = f (−v) a00 (−v) 0 c

Ey = f (−v) a00 (−v) Bz

³

v 0´ B c0 z ³ ´ v Bz0 + 0 Ey0 , c Ey0 +

y usamos las ecuaciones (A.15) y (A.39): c c0 c = f (v) a00 (v) 0 c

Ey = f (v) a00 (v) Bz

³ ´ v Ey0 + 0 Bz0 c ³ v 0´ 0 Bz + 0 Ey c

Finalmente, ponemos estas expresiones de Ey y Bz en el lado derecho de la ecuación (A.35) para obtener: Ey0

=

f 2 a200

·µ ¶ µ ¶ ¸ v2 1 1 0 1 − 0 Ey + v 0 − Bz0 cc c c 365

(A.40)

Ya que Ey0 y Bz0 son variables independientes, los coeficientes de Ey0 en ambos lados de la ecuación deben ser iguales, y los coeficientes de Bz0 también: 1 =

µ ¶ v2 1− 0 cc 1 1 − c0 c

f 2 a200

0 =

(A.41) (A.42)

La ecuación (A.42) dice que c0 = c

(A.43)

En palabras, la velocidad de la luz es la misma en todos los sistemas de referencia inerciales.

A.4

Las transformaciones de Lorentz

Si usamos la ecuación (A.43) en la ecuación (A.41) se obtiene µ ¶ v2 f 2 a200 1 − 2 = 1 , c y en vista de la ecuación (A.13) llegamos a a00 =

a00 =

γ |f |

1 1 p : |f | 1 − v 2 /c2 (A.44)

1 Aqu´ı estamos usando el s´ımbolo convencional γ = p . Ha llegado 1 − v 2 /c2 el momento de agrupar las ecuaciones (A.31), (A.32), (A.43) y (A.44) para reescribir las ecuaciones de transformación (A.9) y (A.10): t0 = x0 =

γ v (t − 2 x) |f | c γ (x − vt) |f | 366

(A.45) (A.46)

Ahora demostraremos que la función |f | que aparece en estas ecuaciones es 1. Consideremos un pulso de luz que conecta los p eventos (0,0,0,0) y (t, x, y, z). x2 + y 2 + z 2 La velocidad c es espacio sobre tiempo: c = ; de aqu´ı se sigue t que c2 t2 − (x2 + y 2 + z 2 ) = 0

(A.47)

c02 t02 − (x02 + y 02 + z 02 ) = 0

(A.48)

Similarmente:

Queremos escribir esta ecuación en términos de variables no primadas, y para tal efecto ponemos las ecuaciones (A.11), (A.12), (A.43), (A.45) y (A.46) en la ecuación (A.48), obteniéndose as´ı: 1 2 2 (c t − x2 ) − y 2 − z 2 = 0 f2 Al comparar esta ecuación con la ecuación (A.47) descubrimos que f 2 = 1, lo que significa que |f | = 1, y los denominadores de las ecuaciones (A.45) y (A.46) se simplifican. Por u ´ltimo, utilicemos las ecuaciones (A.11), (A.12), (A.45) y (A.46) para escribir la forma final de las transformaciones de Lorentz v x) c2 x0 = γ (x − vt) t0 = γ (t −

y0 = y ,

A.5

(A.49)

z0 = z

Regreso al campo

Hemos probado que |f | = 1, es decir, que f = ±1. Debemos decidir cuál de los dos signos es el correcto. Si insertamos la condición f = ±1 en la ecuación (A.33) se obtiene Ex0 = ±Ex ; el signo inferior no sirve, porque implicar´ıa una inversion incre´ıble Ex0 = −Ex . Por esta razón escogemos el signo superior y 367

escribimos f = 1. Ya estamos en condición de usar las ecuaciones (A.43) y (A.44) en las transformaciones (A.33)-(A.36), para obtener: Ex0 = Ex ³ v ´ Ey0 = γ Ey − Bz c 0 Bx = Bx ³ v ´ Bz0 = γ Bz − Ey c

(A.50) (A.51) (A.52) (A.53)

Estas son cuatro de las seis ecuaciones de transformación que estábamos buscando. A´ un nos falta por averiguar las ecuaciones de Ez0 y By0 . Para tal efecto anotemos rápidamente que, de acuerdo con los resultados obtenidos, las derivadas (A.19) se han simplificado: ∂t = γ ∂t0 − vγ ∂x0 ∂x = γ ∂x0 − (vγ/c2 ) ∂t0 ∂y = ∂y0

(A.54)

∂z = ∂z 0

Estas son, por supuesto, las mismas ecuaciones (1.44). La parte z de la ecuación (A.1) es 1 ∂t Ez = ∂x By − ∂y Bx , c

(A.55)

y la parte z de la ecuación (A.3) es 1 ∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 c

(A.56)

Utilizando las derivadas (A.54) en la ecuación (A.55) llegamos a: ³ ³ γ v ´ v ´ 0 0 ∂t Ez + By = γ ∂x By + Ez − ∂y0 Bx c c c Al comparar esta ecuación con (A.56) introducimos una función h(v), desconocida hasta el momento: 368

³ v ´ Ez0 = h(v) γ Ez + By c ³ v ´ 0 By = h(v) γ By + Ez c Bx0 = h(v)Bx En este momento comparamos la u ´ltima ecuación con (A.52), y esto nos muestra que h(v) = 1. Escribamos finalmente las dos ecuaciones que nos faltaban: ³ v ´ Ez0 = γ Ez + By c ³ ´ v By0 = γ By + Ez c

A.6

(A.57) (A.58)

Conclusiones

En su art´ıculo [2], Einstein propone el PriVel y el PriRel, asume el PriHomo y con estas tres bases deduce las transformaciones de Lorentz. Finalmente toma el PriRel, las ecuaciones de Maxwell y las transformaciones de Lorentz recién obtenidas, para deducir las transformaciones del campo electromagnético. A esta estructura lógica la llamaremos la estructura standard de la relatividad. Pero el art´ıculo de Einstein también se puede leer de atrás hacia adelante, tal como hemos hecho en este apéndice: Se asumen el PriHomo y el PriRel; se asume que las ecuaciones de Maxwell verdaderamente representan a las leyes f´ısicas del electromagnetismo, y esto nos permite aplicar el PriRel a las ecuaciones de Maxwell. A partir de aqu´ı se deducen fácilmente la constancia de la velocidad de la luz, las transformaciones de Lorentz y las transformaciones del campo electromagnético. Esta será llamada la otra estructura lógica de la relatividad. Queremos resaltar que en la otra estructura la constancia de la velocidad de la luz es un teorema, mientras que en la estructura standard el PriVel es un postulado. Mientras en la standard el PriVel aparece s´ ubitamente, sin motivación expl´ıcita, en la otra estructura la constancia de la velocidad de la luz aparece más suavemente, pues es un resultado de otras suposiciones 369

más familiares, más fáciles de aceptar. La estructura standard se basa en el PriVel, y refiriéndose este principio a la luz, la estructura standard está vinculada al electromagnetismo. Ahora, a˜ nos después, nosotros reconocemos que Einstein podr´ıa haber basado su relatividad, no en el PriVel, sino en esta generalización: “cualquier part´ıcula no masiva se mueve con una velocidad c que es la misma para todos los observadores inerciales”. Vemos as´ı que la conexión entre la estructura standard y el electromagnetismo no es muy fuerte. En cambio, en la otra estructura las ecuaciones de Maxwell para el electromagnetismo juegan un papel esencial. En la comparación entre estas dos estructuras lógicas de la relatividad podemos avanzar algunos comentarios: 1. Si se llegara a encontrar alg´ un defecto en la teor´ıa de Maxwell, esto probablemente repercutir´ıa muy fuertemente en la otra estructura, pero quizás la estructura standard podr´ıa salir ilesa. Vemos as´ı que la standard es una estructura más robusta que la otra. 2. En la otra estructura la relatividad aparece, en cierto modo, como una parte del electromagnetismo. En otras palabras, la relatividad le da realce a la teor´ıa de Maxwell. 3. Hemos usado la covariancia de las ecuaciones de Maxwell para construir la otra estructura. Probablemente no sea equivocado pensar que, usando otras teor´ıas f´ısicas (QCD, por ejemplo), se podr´ıan construir a´ un otras estructuras para la relatividad. 4. La importancia del PriRel ya ha sido ampliamente reconocida durante un siglo. Pero la existencia de otra estructura, o a´ un otras estructuras, nos muestra un PriRel más fértil: cuando éste se une a una teor´ıa f´ısica concreta, dan a luz a la teor´ıa de la relatividad. 5. Dar a luz a la relatividad es algo enorme, ya que ésta establece la métrica del espaciotiempo. En efecto, la relatividad contiene las transformaciones de Lorentz, y éstas dan pie a la métrica de Minkowski, que es la métrica del espaciotiempo. El espaciotiempo no es una simple acumulaci´ on de eventos, sino que además tiene una métrica, una estructura. Vemos as´ı que la métrica del espaciotiempo resulta, en parte, del contacto con las leyes f´ısicas, como el electromagnetismo por ejemplo. En nuestra mente, podemos imaginar que el espaciotiempo es una simple yuxtaposición de puntos hasta que 370

las leyes de la naturaleza, las que rigen a los objetos f´ısicos, le imprimen a esa yuxtaposición una estructura, una métrica, una organización.

371

372

Bibliograf´ıa

[1] H.A. Lorentz: Versuch einer Theorie der elektrischen und optischen Erscheinungen in bewegten K¨ orpern, Leiden,(1905). Traducido al inglés como Michelson’s interference experiment, en Referencia [5] [2] A. Einstein: Zur Elektrodynamik bewegter K¨ orper, Annalen der Physik, 17,(1905). Traducido al inglés como On the electrodynamics of moving bodies, en Referencia [5]. Existe otra traducción al inglés: H.M. Schwarz, Am.J.Phys. 45, 18(1977). Internet: http://dbserv.ihep.su/ elan/src/einstein05b/eng.pdf agheit eines K¨ orpers von seinem Energiegehalt [3] A. Einstein: Ist die Tr¨ abh¨ angig?, Annalen der Physik, 17,(1905). Traducido al inglés como Does the inertia of a body depend upon its energy-content? en Referencia [5]. Internet: http://dbserv.ihep.su/ elan/src/einstein05c/eng.pdf [4] H.A. Lorentz: Electromagnetic phenomena in a system moving with any velocity less than that of light, Proceedings of the Academy of Sciences in Amsterdam, 6, 1904. Traducido al inglés en Referencia [5] [5] The Principle of Relativity, Dover,New York (1952) [6] R. Resnick: Introduction to Special Relativity, Wiley,New York (1968) [7] J.D. Jackson: Classical Electrodynamics, Wiley,New York (1975) [8] Referencia [7], sección 11.9 [9] Referencia [7], sección 14.1 [10] H. Minkowski: Raum und Zeit, Ponencia en la 80 Asamblea de Cient´ıficos Naturales y Médicos Alemanes, en Colonia, el 21 de septiembre de 1908. Traducido al ingés bajo el t´ıtulo Space and Time, en Referencia [5] 373

[11] S. Weinberg: Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity, Wiley,New York (1972) [12] G.B. Thomas: Calculus Wesley,Reading (1965)

and

Analytic

Geometry,

Addison-

[13] H. Ohanian, R. Ruffini: Gravitation and Spacetime, Second Edition, Norton,New York(1994) [14] I.S. Gradshteyn, I.M. Ryzhik: Table of Integrals, Series and Products, Academic Press,New York(1983), fórmula 2.599.6 [15] D.C. Kay: Tensor Calculus, Schaum’s Outlines, Mc Graw Hill,New York(1988) [16] B.F. Schutz: A first course in general relativity, Cambridge U. Press,Cambridge(1999) [17] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 778-786 [18] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 799-801 [19] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 831-839 [20] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, pt.2, pp. 844-847 [21] J. Mehra: Einstein, Hilbert, and The Theory of Gravitation, Reidel,Dordrecht (1974) [22] L.D. Landau, E.M. Lifshitz: Teor´ıa cl´ asica de campos, Reverté,Barcelona (1966) [23] K. Schwarzschild: Ueber das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie, Preuss.Ak.Wiss.Sitzungsber, 189196(1916) [24] A.P. Lightman, W.H. Press, R.H. Price, S.A. Teukolsky: Problem book in relativity and gravitation, Princeton U. Press,Princeton (1975) [25] H. Goldstein: Mec´ anica Cl´ asica, Aguilar,Madrid(1963), ec. 3-34 374

[26] R. Wald: General Relativity, U. Chicago Press,Chicago (1984) [27] R. Torretti: Relativity and Geometry, Dover, New York(1996) [28] M. Jammer: Concepts of Space (Dover, New York, 1993), p. 110 [29] I. Newton: Mathematical Principles of Natural Philosophy (Encyclopaedia Britannica Inc., Chicago, 1952), Corolary V, p. 19

375

´ Indice Alfab´ etico

Aµ , 148–157, 182, 193–197 Aberraci´ on de la luz, véase Luz Absoluto carga eléctrica, 43 E · B y E 2 − B 2 , 99–101, 159 equilibrio, 81 intervalo, 33, 199 izquierda-derecha, 56 pasado-futuro, 56 Acci´ on, 180, 186 A, 180 Aceleraci´ on, 31, 49, 83, 140, 315 Acelerador, 87, 315 Acople m´ınimo, 281 Adaptadas, véase Coordenadas Adici´ on de aceleraciones, 31, 49 de velocidades, 31, 45 Af´ın conexi´ on, véase Γµ αβ par´ ametro, véase Par´ ametro Agujero blanco, véase Schwarzschild Agujero negro, véase Schwarzschild Aislado, 15, 169 Alambre recto, 104 Anulando E o B, 108–110 Apelio, véase Schwarzschild Arago, 5 ´ Atomo, 74 de hidr´ ogeno, 82, 301 Atraso, véase Relojes

observador en, 276, 278 C´ alculo variacional, 177, 253–256 Calor, 73 Cambiar (,) → (;), véase Regla Campo de alambre recto, 104 de carga m´ ovil, 102 eléctrico, 102, 106, 147–159 electromagnético, 93–115, 147–159, 170–172, 182, 185–197 en general, 185 gravitatorio, véase Campo gravitatorio inducido, 98 magnético, 85–89, 102, 106, 147–159 Campo gravitatorio, 273, 287 constante, 299 est´ atico, 296, 299, 302, 314 estacionario, 299, 302 is´ otropo, 301 y ca´ıda libre, 274, 317 y geodésicas, 274, 317 y leyes f´ısicas, 273, 278 Carga eléctrica, 43, 297 de alambre recto, 104 densidad, 105 m´ ovil, 102 Cartesianas, véase Coordenadas Causalidad, 52, 345, 351 Christoffel, véase Γµ αβ C´ıclica, véase Coordenadas Ciclotr´ on, 85, 315 Cil´ındricas, véase Coordenadas C´ırculo, 311 m´ aximo, 233, 234, 253, 265 Conexi´ on af´ın, véase Γµ αβ C´ onicas, 337, 340 no c´ onicas, 337, 340

β, 124 Bianchi, 238, 294 Big-bang, 76, 317 Biot-Savart, 106 Bradley, 4, 144 Ca´ıda libre, 274, 277

376

Cono de la luz, 52, 55, 56, 345, 351 Conservaci´ on de energ´ıa-momentum, 166–175, 189– 197, 280, 284 de la energ´ıa, 69 del momentum, 14, 61–65, 69 del momentum angular, 172–175 del n´ umero de part´ıculas, 163 Constante cosmol´ ogica Λ, 294 Constantes del movimiento, 258–267, 299 en Schwarzschild, véase Schwarzschild Continuidad, véase Ecuaci´ on Contracci´ on de la longitud, 41, 44, 54 Contravariante, véase Índices Coordenada espacialoide, 344–346, 351 Coordenada temporal, 298, 302 Coordenada temporaloide, 344–346, 351 Coordenadas adaptadas, 236 cartesianas, 199, 214, 263, 265, 278, 280 c´ıclicas, 259, 260, 263, 266, 299, 317 cil´ındricas, 201, 260, 263 continuas, 185 de Eddington-Finkelstein, 349 de Kruskal-Szekeres, 349 de Ohanian, 298, 300 de Painlevé-Gullstrand, 349 esféricas, 214, 233, 248, 265, 302, 348 geodésicas, 276, 277 singulares, 348 Corriente de momentum, 164 de part´ıculas, 163 del momentum angular, 172–175 eléctrica, 110, 143, 164, 297, 358 en alambre recto, 104 en circuito eléctrico, 107 Corrimiento al azul, 144, 316 Corrimiento al rojo big bang, 317 efecto Doppler, 144, 317 gravitacional, 316 Coulomb, 149 Covariancia de ecuaciones de Maxwell, 111–114, 147– 157, 359, 369 electrodin´ amica, 111–115, 147–159

fuerza de Lorentz, 114 las ecuaciones de las leyes, 220 Covariante ecuaci´ on, 137, 139 ´ındice, 125, 204 manifiestamente, 147 no manifiestamente, 147 Curvo, véase Espacio curvo D, 316, 320 Deflexi´ on de la luz, véase Schwarzschild δ de Dirac, 162–169, 172 δ de Kronecker, 121, 127, 132, 210, 237 Densidad de carga, 43, 105, 110 de corriente, 161 de energ´ıa, 103, 191, 296 de masa, 287 de momentum, 191 de part´ıculas, 161 lagrangiana, 186 propia, 43 Derecha, 55, 56 Derivada, 133, 210 covariante, 213, 226, 237, 279 en una curva, 267 es tensorial, 134, 211 no es tensorial, 211 simple, 201, 213, 237, 279 Desincronizaci´ on de relojes, 36 Desligada, véase Schwarzschild Desviaci´ on de rayo de luz, véase Luz geodésica, véase Geodésica Deuter´ on, 74 Diferencial D s´ı es covariante, 267 d no es covariante, 212, 267 de volumen, 136, 221 Dilataci´ on del tiempo, 37, 44, 55 Dirac, véase δ de Dirac Divergencia covariante, 280, 293 de θµν , 170, 192, 196 de J µ , 164, 165 µνδ de Mmec , 172–175 µν de T , 166–175, 189–197, 280 Doppler, véase Efecto Doppler

377

E = mc2 , 62, 67, 69–75 Ecuaci´ on tensorial, véase Ecuaci´ on covariante Ecuaci´ on covariante, 137, 139, 148, 218, 220, 228, 256, 278, 287 de continuidad, 151, 162, 164, 165 de Euler-Lagrange, 180, 181, 183, 187, 194, 254 de fuentes, 287 de geodésica, véase Geodésica de Hilbert-Einstein, 288, 292 de Hilbert-Einstein inconsistente, 298 de ondas, 152 de Poisson, 287 de tercer grado, véase Schwarzschild del intervalo, 258, 260, 262, 264, 266 Ecuaciones de Maxwell, 6, 93–99, 111– 114, 147–157, 358, 359, 369 en campo grav., 285 homogéneas, 150, 156, 193 inhomogéneas, 150, 156, 193 Efecto Doppler, 79, 144, 317 Einstein convenci´ on de, 119 en 1905, 20, 74, 93, 357, 369 en 1912, 51 en 1915, 287, 294, 301, 339, 340 joven, 2 viejo, 74 Electrodin´ amica, 147–159 Electromagnetismo, 2, 6, 93–115 Electr´ on, 82, 87 Energ´ıa-momentum, 166–175, 280, 294, 304, 306 no gravitacional, 280, 294, 297 Energ´ıa, 62, 69–75 de enlace, 74 cinética, 65–69 del campo E, B, 103 E¨ otv¨ os, 276 ²αβγδ , 133 Eridani, 317 Escalar, 111, 129, 132, 136, 178, 188, 209, 222, 228, 302 de curvatura R, 230, 244, 287 E · B y E 2 − B 2 , 99–101, 159 Esféricas, véase Coordenadas Espacialoide, 51, 52, 344–346, 351

Espacio curvo, 233, 234, 250, 269, 274, 307 de Minkowski, 215, 218 de Riemann, 199, 253 de Schwarzschild, véase Schwarzschild euclidiano, 233, 234 no euclidiano, 234, 311 plano, 233, 306 Est´ atico, véase Campo gravitatorio Estacionario, 253, véase Campo gravitatorio ηµν , 120, 215, 276 ´ Eter, 1–11, 13, 358 Euclidiano, véase Espacio Euler-Lagrange, véase Ecuaci´ on de EulerLagrange Experimento de Michelson-Morley, véase Michelson y Morley Extremal, 253 Fase de una onda, 144 Φ, 287, 305, 343 segunda derivada, 287 Filtro de velocidades, 86 F´ısica nuclear, 74 Fisi´ on nuclear, 75 Fizeau, 2 F µν , 155, 193–197, 217 Fot´ on, 68, 74, 75, 79, 142 Frente de onda, 144 Fresnel, 4, 6, 47 Fuerza, 65–69, 82 de Lorentz, 114, 147, 152–154, 157, 182 gravitacional, 274 Fusi´ on nuclear, 75 Futuro, 52, 55, 56, 346, 351 G: constante gravitacional, 273, 275, 287 Galaxias, 76 Galileo, 12, 24, 26, 46, 324, 361 Γµ αβ , 222, 274, 276, 281, 288 Gauge, 148 condici´ on de, 149 de Coulomb, 149 de Lorentz, 149, 150 Gauss, véase Teorema de Gauss Geodésica, 253, 274, 288

378

coordenadas, véase Coordenadas desviaci´ on, 269, 275 ecuaci´ on algebraica, 260 ecuaci´ on diferencial, 253, 262, 277 estacionario, 253 extremal, 253 Geodésico postulado, 274 Geometr´ıa de Riemann, 199–251 de Schwarzschild, véase Schwarzschild euclidiana, 33, 132 intr´ınseca, 251 y gravitaci´ on, 273, 288 gµν , 199, 210 de Schwarzschild, véase Schwarzschild derivada covariante gµν;α , 229, 293 gµν es como Φ, 289 g00 = 1 + 2Φ/c2 , 290, 305 primera derivada gµν,α , 223, 226, 243, 277, 293 segunda derivada gµν,α,β , 243, 277, 293 altas derivadas, 281 Goldstein, 336 Gradshteyn, 264, 326 Gravitaci´ on comparaci´ on Newton-Einstein, 336 idea central, 273 newtoniana, 275, 287, 295, 301, 336, 343 y geometr´ıa, 273, 288

covariantes, 125, 204 griegos, 119 latinos, 119 libres, 123, 139, 200 Inercia, 73 Inercial, véase Observador Interacci´ on, 182, 273, 288 Intervalo, 76, 120, 123, 140, 177, 201, 209, 253, 273, 302 espacialoide, 34, 51, 52 luminoide, 35, 39, 51, 52 negativo, 257 nulo, 257 positivo, 254, 257 temporaloide, 33, 37, 51, 52 Invariante, 132, 136, 139, 178, 188, 209, 222 E · B y E 2 − B 2 , 99–101, 159 Izquierda, 55, 56 J, 316, 318 Jackson, 26, 43, 102 Jacobiano, 222 Jammer, 357 J µ , 143, 151, 216 del polvo, 163 eléctrica, 164 J´ upiter, 340 Kay, 277 Kerr, 300 kµ , 142 Kronecker, véase δ de Kronecker Kruskal, 349

~, 144 Hamilton, véase Principio de Hamilton ´ Hidr´ ogeno, véase Atomo Hilbert, 288, 301 Hilbert-Einstein, 288, 292 Homogeneidad, véase Principio de Horizonte, véase Schwarzschild Hueco blanco, véase Schwarzschild Hueco negro, véase Schwarzschild Huygens, 3

L, 180 L, 178 Lagrangiana, 180, 255, 259 L, 186 Λ, 135, 294 λ, 318, 335 Landau, 299 Levi-Civita, 133, 159 Liénard-Wiechert, 102 Ligada, véase Schwarzschild Lightman, 327 L´ımite newtoniano, 288, 295, 305 L´ınea en el mundo, 51 Local, véase Velocidad local

Identidades de Bianchi, véase Bianchi Índices bajar o subir, 122, 128, 139, 200, 201 contra´ıdos, 123, 200 contravariantes, 125, 204

379

Longitud, 31, 41, 44, 54 propia, 41, 44 Lorentz, 2, 6, 20, 149, 150 Luminoide, 35, 39, 51, 52, 345 Luz aberraci´ on, 4, 31, 79 cono de luz, véase Cono de la luz difracci´ on, 3, 4 interferencia, 3, 4, 8–11 polarizaci´ on, 3, 4 rayo de, 3, 301, 337, 338 velocidad, 4, 6–13, 46, 357, 361–366, 369

Nube de part´ıculas cargadas, 110, 169 de polvo, 162 Nuclear, 74

µνδ Mmec , 172–175 Mapamundi, 348 Mareas, 347, 348 Masa, 61–85, 140 gravitacional, 74, 275 inercial, 74, 275 variable, 83 Matriz F µν , 155 Λ, 135, 213 θµν y θµ ν , 196 Mec´ anica cu´ antica, 74, 82, 144, 301 lagrangiana, 177 newtoniana, 1, 2, 61, 65, 67, 69, 83, 86–89, 275, 318, 327, 336, 343 Mehra, 288 Mercurio, 301, 337, 339, véase Schwarzschild Métrica, 370 de Minkowski, 76, 120, 132, 215, 218, 276, 290, 370 de Schwarzschild, véase Schwarzschild Michelson y Morley, 2, 8–11, 13 Minkowski, véase Métrica de Minkowski Minkowski H., 50, 51 Momento dipolar eléctrico, 107 Momentum, 61–73, 141 del fot´ on, 79, 142 Momentum angular, 172–175 Movimiento circular, 85 Mundo, 51

Neutr´ on, 74 Newton, 3, 357 Newtoniana, véase Mec´ anica

380

Observador inercial, 7, 13, 15, 93, 140, 177, 202 Observador no inercial, 202, 276, véase Ca´ıda libre Ohanian, 236, 240, 276, 298, 300, 352 Onda electromagnética, 1, 6, 152 fase de, 144 frente de, 144 Onda-corp´ usculo, 1–8 ´ Optica, 3–11 ´ Orbita desligada, véase Schwarzschild ´ Orbita de un rayo de luz, véase Schwarzschild ´ Orbita ligada, véase Schwarzschild ´ Orbita mercurial, véase Schwarzschild ´ Orbita terrestre, véase Schwarzschild Pais, 2 Par´ ametro, 39, 177, 254, 267 af´ın, 256, 262, 263, 269, 318, 335 Part´ıcula ca´ıda libre, véase Ca´ıda libre de m 6= 0, 257 en campo grav., véase Ca´ıda libre en un campo Aµ , 182 forzada, 51, 140, 168, 169, 177 libre, 38, 51, 81, 140, 157, 168, 177, 181, 274 Pasado, 52, 55, 56, 346, 351 Perihelio, véase Schwarzschild Planck, 6 Planetas, 330, 333 Plano, véase Espacio plano pµ , 141, véase Momentum Poisson, 4, 287 Polvo, 162 Postulado geodésico, 274 Potencia, 154 Potencial efectivo, 328, 334 electrost´ atico, 82, 87 escalar φ, 148, 182 gravitatorio, véase Φ pozo de, véase Pozo de potencial

vectorial A, 148, 182 Poynting, 104 Pozo de potencial, 330, 334 Precesi´ on del perihelio de Mercurio, véase Schwarzschild Press, 327 Price, 327 PriHomo, véase Ppio. de homog. de tiempo y espacio Principio de conservaci´ on de la energ´ıa, 69 conservaci´ on del momentum, 61–65, 69 covariancia general, 220 equivalencia, 277 Galileo, 275 Hamilton, 186 Huygens, 3 la homogeneidad del tiempo y el espacio, 12, 14, 357, 360, 369 la relatividad, 2, 12, 13, 94, 111, 138, 139, 357, 359, 360, 369 la velocidad de la luz, 2, 12, 46, 357, 361–366, 369 mundo absoluto, 51 PriRel, véase Ppio. de relatividad PriVel, véase Ppio. de la vel. de la luz Propio densidad, 43 longitud, 41, 44 tiempo, 31, 37, 44, 55, 110, 140, 178, 257, 311 volumen, 42 Prot´ on, 74, 88 Prototipo, véase Vector Puntos de retorno, véase Schwarzschild

separaci´ on espacial, 32, 54 separaci´ on temporal, 32, 36, 54 Relojes, 38, 311 atraso gravitacional, 313 atraso por aceleraci´ on, 314 atraso por movimiento, 37, 313 desincronizaci´ on, 36 en el infinito, 313, 323 en reposo, 313, 323 en reposo en el infinito, 313, 323 sincronizaci´ on, 16 Resnick, 20, 62, 69, 104 Ricci Rβµ , 230, 244, 287, 303 Riemann espacio de, 199, 253 Riemann tensor de, 229–244, 277, 347, 348 n2 (n2 − 1)/12 componentes, 232 cinco identidades, 230 es u ńico, 240, 293 es curvatura, 233, 269 Rotaci´ on de masa puntual, 300 grupo de, 302 Ruffini, 236, 240, 276, 298, 352 Ryzhik, 264, 326 Schroedinger, 82 Schutz, 277, 348 Schwarzschild, 300, 301 ca´ıda libre, 317 ca´ıda libre vertical, 324 cono de luz, 345, 351 consts. del mov., 316, 317, 333 tercera const. del mov., 319 ecuaci´ on de tercer grado, 332 el subespacio (θ, ϕ), 309 el subespacio (r, θ, ϕ), 308 el subespacio (r, ϕ), 310 el subespacio (r, θ), 308 el subespacio (t, θ), 310 el subespacio (t, r), 309 escalar R, 307 espacio de, 248 futuro, 346, 351 geometr´ıa de, 248 horizonte, 344, 346, 347 hueco blanco, 352 hueco negro, 345–348 leyes f´ısicas en, 284

QCD, 370 Rango de un tensor, 129, 207, 209 Red shift, véase Corrimiento al rojo Regla (,) → (;), 280 Relatividad especial estructura, 3, 19 motivaci´ on, 2, 357 Relativo frente de onda, 144 izquierda-derecha, 55 pasado-futuro, 55

381

µν Tcan , 189–197 Temporaloide, 51, 52, 344–346, 351 Tensor µνδ Mmec , 172–175 Aµ , 148, 182, 193–197, 203 Aµ Bµ es un tensor, 132, 209 antisimétrico, 209 asimétrico, 192, 195 µν , 189–197 can´ onico Tcan de energ´ıa-momentum, 165–175, 189– 197, 280 de Levi-Civita, 159 de momentum angular, 172–175 del campo electromagnético, 170, 189– 197 δµ ν es un tensor, 132 ∂ µ ∂µ , 134 ∂µ φ y ∂µ Aν son tensores, 134 ecuaciones, 137, 139 electromagnético, 155, 193–197, 217 ²αβγδ es un tensor, 133 escalar, 129, 132 ηµν es un tensor, 132 F µν , 155, 193–197, 217 gµν , 199, 210 J µ , 143, 163, 216 kµ del fot´ on, 142 Levi-Civita, 133 métrico, 132, 199, 210, 273 pµ es un tensor, 141 rango de un, 129, 207, 209 Riemann, véase Riemann simétrico, 166, 175, 192, 195, 209 µν Tcan , 189–197 µν θ , 170, 192, 196 U µ es un tensor, 141 vector, 79, 129 Tensor de Riemann, véase Riemann Teor´ıa de la gravitaci´ on, véase Gravitaci´ on Teorema de Gauss, 163, 166 de las coordenadas adaptadas, 236 del tensor métrico, 244 principal del c´ alculo, 222 Teukolsky, 327 θµν , 170, 192, 196 Thomas, 136 Tiempo T , 311

métrica de, 248 mareas, 347, 348 o ´rbita circular, 331 o ´rbita desligada, 329 o ´rbita de un rayo de luz, 337, 338 o ´rbita ligada, 329 o ´rbita mercurial, 337, 339 o ´rbita terrestre, 333, 337 par´ ametro af´ın, 318, 323, 335 pasado, 346, 351 apelio mercurial, 339 perihelio mercurial, 339 apelio terrestre, 333 perihelio terrestre, 333 planetas, 330, 333 potencial efectivo, 328, 334 pozo de potencial, 330, 334 precesi´ on perihelio mercurial, 339 pseudosingularidad, 348 puntos de retorno, 328, 331, 332, 336, 338, 340 radio de, 248, 306 s´ımbolos Γµ αβ , 307 singularidad, 347 subespacios, 308 tensor Rµν , 307 tensor Rα βµν , 307 tiempo τ , 311, 323, 326, 347 tiempo T , 311, 323 tiempo t, 311, 323, 327, 347 tiempo universal, 323 Serie de Taylor, 180, 270 S´ımbolo de Christoffel, véase Γµ αβ Simultaneidad, 31, 34, 36, 44, 54, 144, 313 Sincronizaci´ on de relojes, 16 Singularidad, véase Schwarzschild Sirio, 317 Sistema f´ısico aislado, 15, 169 no aislado, 169 Snell, 3 Sol, 288, 306, 317, 333, 337, 339 Sonido, 1, 5 Stokes, 6 Szekeres, 349 τ , 37, 178, 311, véase Tiempo propio Taylor, véase Serie de Taylor

382

τ , 311 t, 311 coordenado, véase Coordenada temporal de vida media, 39 propio, 31, 37, 44, 55, 110, 140, 178, 257, 311, 347 universal, 298, 313, 323 inversi´ on, 299 Tierra, 4, 8–11, 288, 306, 323, 333, 337 T µν , 280, 287, 294, 304, 306 asimétrico, 192, 195, 298 T µν ,ν = 0, 166–175, 280 T µν ;ν = 0, 280, 294 simétrico, 166, 175, 192, 195, 298 Torretti, 348 Trabajo, 65–69, 82 Transformaci´ on de p , E , m , F, 76 de E y B, 93–115, 158, 359, 367–369 de F µν , 158 de J µ = (cρ, J), 111 gauge, 148 Transformaciones de coordenadas, 17, 359, 360, 369 de Galileo, 12, 24, 26, 46, 65, 361 de Lorentz, 20–28, 124, 138, 139, 199, 218, 280, 366–367 familia de, 24, 361 generales, 199–251, 280 lineales, 20, 124, 199, 244 no lineales, 202 Translaciones, 188 Trayectoria de una part´ıcula, 16, 39, 140, 164, 177 en campo grav., véase Ca´ıda libre

Velocidad de una part´ıcula, 17, 62, 75, 140, 141 Velocidad de un observador, 17, 62 Velocidad local, 312, 315, 321 Venus, 340 Vida media, 39 Virtual, 178 Volumen de nube, 110 diferencial de, 136, 221 propio, 42 Wald, 348 Weinberg, 133, 162, 281 Young, 4

u = 1/r, 336 U µ , 141 Uni´ on de E y B, 101, 119 de espacio y tiempo, 31, 119 Unitario, véase Vector Universal, véase Tiempo Variacional, véase C´ alculo variacional Vector, 79, 125, 129, 203, 209 prototipo, 125, 131, 140, 203, 209 unitario, 85, 142, 143, 214

383

Relatividad (Lorenzo de la Torre).pdf

Short Description

Description

Comments

We need your help!