Relatividad

September 29, 2017 | Author: guydepine | Category: Special Relativity, Light, Speed Of Light, Waves, Velocity
Share Embed Donate


Short Description

Descripción: Introduction to the concepts of relativity...

Description

Prefacio

Este libro presenta los elementos de la teor´ıa de la relatividad. El texto se dirige especialmente a estudiantes de pregrado; pensando en ellos, he intentado presentar la teor´ıa as´ı como yo habr´ıa deseado leerla cuando la estudi´e por vez primera, hace a˜ nos. La primera parte del libro se dedica a la relatividad especial, y la segunda parte a la general. La fundamentaci´ on de la teor´ıa especial, en el primer cap´ıtulo, se apoya fuertemente en el experimento de Michelson y Morley. Esta ruta es probablemente cuestionable desde un punto de vista hist´orico, pero tiene la ventaja de aprovechar las ense˜ nanzas y sugerencias que se derivan de ese experimento, y lo hacen pedag´ogicamente valioso. Para algunos la esencia de la relatividad especial est´a en las transformaciones de Lorentz, y la covariancia de las ecuaciones de Maxwell resulta al final, como una virtud de las transformadas. Este punto de vista tiene ventajas pedag´ogicas, y por eso lo he seguido en los primeros cap´ıtulos, que se dedican a mostrar la estructura de la teor´ıa. Pero tambi´en se puede pensar que la esencia del proyecto relativista es el empe˜ no por extender el principio de la relatividad al electromagnetismo: que las ecuaciones de Maxwell sean las mismas para todos los observadores inerciales; en busca de este objetivo se encuentran, como un paso intermedio, las transformaciones de Lorentz y la constancia de la velocidad de la luz. Me gusta este punto de vista, aunque admito que tiene dificultades did´acticas. El lector interesado puede ir al ap´endice, donde se ejecutan en detalle los pasos correspondientes. Los cap´ıtulos 5 y 9 dan los fundamentos del c´alculo tensorial que se usa en la relatividad especial, y en la general, respectivamente. Si bien la teor´ıa especial puede estudiarse sin tensores, la general se entiende con el uso dei

cidido del c´alculo tensorial. El cap´ıtulo 11 es crucial, y desarrolla la idea de que la gravitaci´ on puede entenderse como un hecho geom´etrico. El 12 construye la ecuaci´on de los campos gravitacionales, de Hilbert-Einstein, y el cap´ıtulo 13 est´a dedicado a la soluci´on de Schwarzschild. En este u ´ltimo cap´ıtulo se enfatiza el asunto de las part´ıculas en ca´ıda libre, que siguen trayectorias geod´esicas. As´ı se justifica que se haya dedicado antes todo un cap´ıtulo, el 10, al estudio de las l´ıneas geod´esicas. La teor´ıa de la relatividad es la gloria de la f´ısica te´orica. Si hay un lector que, inici´andose en el camino de esa teor´ıa, encuentra que este libro es de alguna ayuda, yo sentir´e que mi trabajo ha sido bien pagado. Lorenzo de la Torre Medell´ın, diciembre de 2006

ii

´ Indice General

Prefacio

I

1. El origen de la relatividad 1.1. Corp´ usculos y ondas . . . . . . . . . . 1.2. El ´eter . . . . . . . . . . . . . . . . . . 1.3. El experimento de Michelson y Morley 1.4. La transformaci´on de Galileo . . . . . 1.5. La constancia de la velocidad de la luz 1.6. El principio de la relatividad . . . . . 1.7. Homogeneidad del espacio y el tiempo 1.8. El concepto de observador . . . . . . . 1.9. Transformaciones de coordenadas . . . 1.10. Las transformaciones de Lorentz . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

2. Propiedades del espaciotiempo 2.1. Las separaciones espacial y temporal son relativas . 2.2. El intervalo es absoluto . . . . . . . . . . . . . . . 2.3. Clases de intervalos . . . . . . . . . . . . . . . . . . 2.4. La simultaneidad es relativa . . . . . . . . . . . . . 2.5. Tiempo propio . . . . . . . . . . . . . . . . . . . . 2.6. Longitud propia . . . . . . . . . . . . . . . . . . . . 2.7. Comparaci´on de longitud propia y tiempo propio . 2.8. Un caso de simultaneidad . . . . . . . . . . . . . . 2.9. La adici´on de velocidades . . . . . . . . . . . . . . 2.10. La adici´on de aceleraciones . . . . . . . . . . . . . 2.11. Gr´aficos . . . . . . . . . . . . . . . . . . . . . . . . 2.12. M´as gr´aficos . . . . . . . . . . . . . . . . . . . . . . iii

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . .

1 3 5 8 11 12 13 14 15 17 20

. . . . . . . . . . . .

31 32 32 33 36 37 41 44 44 45 49 50 53

3. Mec´ anica 3.1. La conservaci´ on del momentum . . . 3.2. Las nuevas cantidades din´amicas . . 3.3. La energ´ıa en la relatividad especial 3.4. E = mc2 . . . . . . . . . . . . . . . . 3.5. La velocidad l´ımite . . . . . . . . . . 3.6. Las transformaciones de p , E , m , F 3.7. Masa y potencial electrost´atico . . . 3.8. La aceleraci´on . . . . . . . . . . . . . 3.9. Movimiento circular . . . . . . . . . 4. El campo electromagn´ etico 4.1. Transformaci´on de los campos E y B 4.2. Dos cantidades invariantes . . . . . . 4.3. El campo electromagn´etico total . . 4.4. Una carga con velocidad uniforme . 4.5. Un alambre recto con corriente . . . 4.6. Anulando el campo menor . . . . . . 4.7. La corriente el´ectrica . . . . . . . . . 4.8. Covariancia de la electrodin´amica .

. . . . . . . . .

. . . . . . . .

. . . . . . . . .

. . . . . . . .

5. Tensores en la relatividad especial 5.1. Sub´ındices y super´ındices . . . . . . . . 5.2. Los vectores . . . . . . . . . . . . . . . . 5.3. Otros tensores . . . . . . . . . . . . . . . 5.4. Matrices . . . . . . . . . . . . . . . . . . 5.5. Ecuaciones tensoriales . . . . . . . . . . 5.6. El principio de la relatividad . . . . . . 5.7. Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ 5.8. Aberraci´on de la luz y efecto Doppler . 6. La electrodin´ amica manifiestamente covariante 6.1. El cuadripotencial Aµ . . . . . . 6.2. Las dos ecuaciones de Maxwell . 6.3. La fuerza de Lorentz . . . . . . . 6.4. El tensor electromagn´etico . . . . 6.5. La transformaci´on de los campos 6.6. Dos escalares . . . . . . . . . . . iv

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . .

. . . . . . . . .

61 62 65 69 73 75 76 82 83 85

. . . . . . . .

. . . . . . . .

93 93 99 101 102 104 108 110 111

. . . . . . . .

119 . 119 . 123 . 128 . 135 . 137 . 139 . 140 . 143

. . . . . .

147 . 148 . 150 . 152 . 155 . 158 . 159

. . . . . . . . .

7. Las 7.1. 7.2. 7.3. 7.4. 7.5. 7.6.

leyes de conservaci´ on La nube de part´ıculas . . . . . . . Otras corrientes . . . . . . . . . . . El tensor de energ´ıa y momentum . µν µν ∂µ Tmec = 0 , ∂µ Tmec 6= 0 . . . . . La corriente de momentum angular Generalizaci´on . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

8. Din´ amica lagrangiana 8.1. Teor´ıa lagrangiana para una part´ıcula . . . . . . . . 8.2. Teor´ıa lagrangiana para coordenadas continuas . . . 8.3. El tensor energ´ıa-momentum . . . . . . . . . . . . . 8.4. Formulaci´on lagrangiana del campo electromagn´etico 9. Transformaciones generales de coordenadas 9.1. Sub´ındices y super´ındices . . . . . . . . . . . . . 9.2. Transformaciones generales . . . . . . . . . . . . 9.3. Los vectores . . . . . . . . . . . . . . . . . . . . 9.4. Otros tensores . . . . . . . . . . . . . . . . . . . 9.5. La derivada . . . . . . . . . . . . . . . . . . . . . 9.6. Matrices . . . . . . . . . . . . . . . . . . . . . . 9.7. Coordenadas esf´ericas . . . . . . . . . . . . . . . 9.8. La relatividad especial . . . . . . . . . . . . . . . 9.9. Ecuaciones tensoriales . . . . . . . . . . . . . . . 9.10. Covariancia general . . . . . . . . . . . . . . . . 9.11. El elemento invariante de volumen . . . . . . . . 9.12. El s´ımbolo de Christoffel . . . . . . . . . . . . . 9.13. La derivada covariante . . . . . . . . . . . . . . 9.14. El tensor de Riemann . . . . . . . . . . . . . . . 9.15. Plano y curvo . . . . . . . . . . . . . . . . . . . 9.16. Coordenadas adaptadas . . . . . . . . . . . . . . 9.17. Las identidades de Bianchi . . . . . . . . . . . . 9.18. El tensor de Riemann es el u ´nico . . . . . . . . . 9.19. Obligar a gµν a que tome el valor que queramos 9.20. Dos transformaciones sucesivas . . . . . . . . . . 9.21. Un ejemplo . . . . . . . . . . . . . . . . . . . . . v

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . .

161 . 161 . 164 . 165 . 166 . 172 . 173

. . . .

177 . 177 . 185 . 188 . 193

. . . . . . . . . . . . . . . . . . . . .

199 . 199 . 202 . 203 . 207 . 210 . 213 . 214 . 217 . 218 . 220 . 221 . 222 . 226 . 230 . 233 . 236 . 238 . 240 . 244 . 246 . 248

10. Las geod´ esicas 10.1. La ecuaci´on diferencial . . . . . . 10.2. Par´ametros afines . . . . . . . . . 10.3. Constantes del movimiento . . . 10.4. Las ecuaciones algebraicas . . . . 10.5. Derivada a lo largo de una curva 10.6. Rαβµν y la curvatura . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

253 . 253 . 256 . 258 . 260 . 267 . 269

11. El principio de equivalencia 11.1. El postulado de las geod´esicas 11.2. El principio de Galileo . . . . . 11.3. Coordenadas geod´esicas . . . . 11.4. El principio de equivalencia . . 11.5. El acople m´ınimo . . . . . . . 11.6. Ejemplos . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

273 274 275 276 277 281 282

12. La ecuaci´ on del campo gravitatorio 12.1. El l´ımite newtoniano . . . . . . . . . . . . . 12.2. Los 10 potenciales gµν . . . . . . . . . . . . 12.3. El potencial g00 en coordenadas cartesianas 12.4. La ecuaci´on de Hilbert-Einstein . . . . . . . 12.5. Las coordenadas . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

287 288 288 290 292 298

. . . . . . . . . . . . . . . .

301 . 301 . 307 . 308 . 311 . 316 . 317 . 319 . 320 . 323 . 324 . 328 . 332 . 335 . 336 . 338 . 339

. . . . . .

13. La soluci´ on de Schwarzschild 13.1. Campo is´otropo est´atico . . . . . . . 13.2. La geometr´ıa del espaciotiempo . . . 13.3. Subespacios . . . . . . . . . . . . . . 13.4. Relojes . . . . . . . . . . . . . . . . . 13.5. Corrimiento hacia el rojo . . . . . . . 13.6. Constantes del movimiento . . . . . . 13.7. Una tercera constante del movimiento 13.8. J y D en t´erminos de r, v y vϕ . . . . 13.9. Las cuatro variables t, T, τ y λ . . . . 13.10. La ca´ıda vertical . . . . . . . . . . . 13.11. Potencial efectivo . . . . . . . . . . . 13.12. Puntos de retorno . . . . . . . . . . . 13.13. Eliminaci´on del par´ametro af´ın λ . . 13.14. La variable u . . . . . . . . . . . . . 13.15. Deflexi´on de un rayo de luz . . . . . 13.16. La precesi´on an´omala del perihelio de vi

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mercurio

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

13.17. 13.18. 13.19. 13.20.

Coordenadas temporaloides y espacialoides El cono de la luz . . . . . . . . . . . . . . Singularidades . . . . . . . . . . . . . . . . Las coordenadas de Kruskal-Szekeres . . .

A. La constancia de la velocidad de la luz A.1. El principio de la relatividad . . . . . A.2. Transformaciones . . . . . . . . . . . . A.3. La velocidad de la luz . . . . . . . . . A.4. Las transformaciones de Lorentz . . . A.5. Regreso al campo . . . . . . . . . . . . A.6. Conclusiones . . . . . . . . . . . . . . Bibliograf´ıa

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . .

. . . .

344 345 347 349

. . . . . .

357 . 358 . 360 . 361 . 366 . 367 . 369 373

vii

viii

Cap´ıtulo 1

El origen de la relatividad

En este primer cap´ıtulo nos proponemos construir las primeras bases de la teor´ıa especial de la relatividad. Comenzamos mostrando algunas de las dificultades en que se hallaba la f´ısica a fines del siglo XIX; es all´ı, en la crisis del electromagnetismo, donde se encuentra el origen hist´orico de la relatividad. Antes de revisar las dificultades de la f´ısica en esa ´epoca, conviene que presentemos un recuento breve de la pol´emica ondas-corp´ usculos que acompa˜ naba a la ´optica desde siglos atr´as. Para darle fundamento a la teor´ıa ondulatoria de la luz, los cient´ıficos de los siglos XVIII y XIX se apoyaron en aquella otra onda que conoc´ıan bien, el sonido, en un intento por sacar de all´ı los elementos conceptuales que pudieran servirles para la luz. Ellos ten´ıan muy claro que la onda ac´ ustica se propaga en medios el´asticos como el aire, el agua, los cuerpos s´olidos, etc., y que, sin el medio, la onda no puede propagarse. Para trasladar este concepto al estudio de la luz, era necesario aceptar la existencia de un medio (al que llamaron ´eter) que soportara la propagaci´on de la onda luminosa. El concepto del ´eter penetr´o con dificultad en la f´ısica te´orica; para ajustarlo al conocimiento de la ´epoca, los cient´ıficos tuvieron que admitir que ´el deb´ıa tener un conjunto de propiedades extra˜ nas, absurdas y contradictorias. A´ un as´ı, los f´ısicos se aferraron a su creencia en el ´eter, ese medio curioso que cumpl´ıa una doble funci´on: de un lado, supuestamente soportaba a las ondas electromagn´eticas, y de otro lado era como una corporizaci´on del espacio absoluto en que se apoyaba la mec´anica newtoniana. Era importante que la idea del ´eter tuviera un respaldo experimental, y el instrumental ´optico de fines del siglo XIX contaba ya con la precisi´on suficiente para medir la velocidad v que nuestro planeta supuestamente ten´ıa respecto al ´eter. El experimento de Michelson y Morley dio un resultado sorpresivo: v debe ser 1

cero. Este resultado no es il´ogico, pero s´ı es incre´ıble. Nuestra presentaci´on se basa fuertemente en el experimento de Michelson y Morley. Hemos preferido esta ruta did´actica porque el an´alisis del experimento trae unas ventajas pedag´ogicas que no podemos despreciar. Tal como veremos, el estudio de este experimento dispara una variedad de ideas sugestivas que se conectan con el principio de la constancia de la velocidad de la luz y con el principio de la relatividad. No se nos escapa que nuestra presentaci´on es cuestionable, en cuanto los historiadores aceptan1 que el experimento no fue decisivo en las motivaciones que tuvo el joven Einstein en aquellos a˜ nos de creaci´on de la teor´ıa. El principio de la relatividad, que dice que lo que ocurre para un observador inercial tambi´en puede ocurrir para cualquier otro observador inercial, lo aceptaron los cient´ıficos desde el siglo XVIII, cuando se dieron las bases de la ciencia. Pero lo aceptaban u ´nicamente para experiencias de mec´anica, como las que se realizan con resortes, p´endulos, planos inclinados, etc. Hab´ıa otro conjunto de experiencias para las cuales no cre´ıan que valiera el principio de la relatividad: las de la electricidad y el magnetismo. ¿Por qu´e los cient´ıficos anteriores a 1905 pensaban que el Principio no se aplica a los fen´omenos electromagn´eticos? Porque ellos cre´ıan, equivocadamente, que el espacio y el tiempo tienen una estructura galileana. La teor´ıa de la relatividad encuentra la verdadera estructura y demuestra que, dentro de esta estructura, el principio de la relatividad s´ı abarca los fen´omenos del electromagnetismo, asuntos que estudiaremos en los cap´ıtulos 4 y 6. Se puede pensar que la parte fuerte de la teor´ıa de la relatividad es encontrar la estructura verdadera del espaciotiempo y que, despu´es, la teor´ıa electromagn´etica resulta v´alida para todos los observadores inerciales; este es el punto de vista que se sigue en el cap´ıtulo presente. Pero tambi´en se 1

Einstein conoci´ o antes de 1905 los resultados del experimento de Michelson y Morley. Decimos esto porque se sabe que ´el hab´ıa estudiado el art´ıculo [1] de Lorentz de 1895 en el que el f´ısico holand´es discut´ıa en detalle los resultados del experimento. El experimento impresion´ o a muchos, pero no a Einstein. ¿Por qu´e no? Porque ´el ya sab´ıa que el resultado del experimento ten´ıa que ser nulo, simple y llanamente porque el ´eter era, para ´el, inexistente. El Michelson-Morley no fue lo que condujo a Einstein hacia la relatividad. Cuando, a˜ nos despu´es, le preguntaron a Einstein sobre las motivaciones que hab´ıa tenido para formular la relatividad especial, respondi´ o que la aberraci´ on y el experimento de Fizeau le mostraron el camino, y que ellos dos “fueron suficientes”. Estas dos palabras de Einstein son, seg´ un Pais, “la declaraci´ on m´ as crucial que Einstein jam´ as hiciera acerca de los or´ıgenes de la teor´ıa de la relatividad”[?].

2

puede pensar que la parte fuerte de la teor´ıa es su motivaci´ on: que las leyes electromagn´eticas sean v´alidas para todos los observadores inerciales; y que para darle cumplimiento a esa motivaci´ on es necesario averiguar cu´al es la estructura verdadera del espaciotiempo. Este segundo punto de vista se sigue en el ap´endice.

1.1

Corp´ usculos y ondas

La ´optica moderna naci´o en el siglo XVII, cuando los cient´ıficos lograron controlar, en el laboratorio, los fen´omenos b´asicos de la luz. Animados por el esp´ıritu experimental, estudiaron la propagaci´on rectil´ınea de un rayo de luz, la descomposici´on espectral, la polarizaci´on, difracci´on e interferencia. Esta fase inicial de la ´optica se dio dentro de un debate intenso respecto a la naturaleza de la luz, ya que unos cre´ıan que la luz estaba compuesta de corp´ usculos, mientras otros prefer´ıan pensar a la luz como un fen´omeno ondulatorio. La interpretaci´on ondulatoria mostr´o su eficacia al explicar los fen´omenos de difracci´on y de interferencia en l´aminas delgadas. La base te´orica de la visi´on ondulatoria est´a en el principio de Huygens, seg´ un el cual todo punto de un frente de onda origina una onda esf´erica secundaria, y el frente de onda est´ a formado por la envolvente de las ondas secundarias emitidas por el frente anterior. La potencia explicativa de este principio se manifest´o r´apidamente, porque condujo a una visi´on cuantitativa y exacta de la interferencia y la difracci´on, y permiti´o deducir, con argumentos elementales, la ley de refracci´on de Snell. La interpretaci´ on ondulatoria de la luz tuvo numerosos adeptos, aunque se debe tener en cuenta que la palabra onda no significaba lo mismo para todos. Huygens, por ejemplo, no conceb´ıa la onda como una perturbaci´on continua, con longitud de onda, sino m´as bien como pulsos de duraci´on finita. Los primeros seguidores de la interpretaci´ on ondulatoria se encontraron con un escollo que no pudieron vencer, que es la polarizaci´on de la luz. La teor´ıa ondulatoria inicial, con ondas longitudinales, no pudo explicar la polarizaci´on, ya que ´esta pone de manifiesto unas propiedades perpendiculares a la direcci´on de propagaci´on. En cambio, los seguidores de la interpretaci´ on corpuscular s´ı ten´ıan al menos un intento de explicaci´on, propuesto por Newton: “la luz tiene lados”, enunciado que hoy se interpreta como si ´el hubiera querido decir que los corp´ usculos luminosos son ovalados y se pueden ajustar 3

as´ı a las exigencias de las placas de polarizaci´on. Que la teor´ıa ondulatoria inicial fuera incapaz de explicar la polarizaci´on de la luz incomodaba a muchos, y fue lo que condujo a Newton a preferir la teor´ıa corpuscular. Es justo anotar, sin embargo, que ´el nunca tom´o partido decidido por ninguna de las dos teor´ıas de la luz, y por eso carece de fundamento la creencia, altamente generalizada, de que Newton fuera el padre de la teor´ıa corpuscular. Uno de los seguidores m´as importantes de la interpretaci´ on corpuscular fue Bradley quien, con una serie de observaciones astron´omicas, descubri´o la aberraci´on de la luz de las estrellas. Interpretando la luz como corp´ usculos, el ingl´es explic´o este efecto, midi´o la velocidad de la luz y demostr´o, por primera vez, que la Tierra se mueve anualmente alrededor del Sol. Estas observaciones astron´omicas y la explicaci´on subsecuente aportada por Bradley, se dieron en un per´ıodo dominado por la interpretaci´ on corpuscular. En efecto, ´esta se impuso durante casi todo el siglo XVIII. Pero en los primeros a˜ nos del XIX resurgi´o vigorosamente la idea ondulatoria, debido, en parte, a la gran precisi´on, nunca antes vista, que se estaba logrando en los experimentos de interferencia y difracci´on. A Young se le ocurre una idea que habr´ıa de cambiar radicalmente el rumbo de la ´optica: la polarizaci´on se entiende f´acilmente si las ondas de la luz no son longitudinales, sino transversales. Fresnel toma esta idea y en poco tiempo reconstruye toda la teor´ıa de interferencia, difracci´on, refracci´on y polarizaci´on a partir de ondas transversales. Renovada, la teor´ıa ondulatoria fue capaz de explicar una gran variedad de fen´omenos de interferencia y difracci´on, y tambi´en pudo hacer predicciones, como por ejemplo esta: Si un haz de luz que ha pasado por un agujero bien peque˜ no se dirige hacia un disco opaco, como una moneda por ejemplo, entonces detr´as del disco, en el eje ´optico, no todo es obscuridad, sino que en cierto lugar deber´a aparecer un punto brillante; en la zona de la sombra debe aparecer un punto brillante. Una predicci´on de estas, tan puntual y precisa, no puede pasar desapercibida a los rivales de la teor´ıa ondulatoria, entre los que se contaba Poisson. Este matem´atico y f´ısico franc´es piensa que no puede haber un punto brillante en la regi´on de las sombras y que, por consiguiente, la predicci´on debe estar equivocada. La teor´ıa undulatoria substituy´o a la corpuscular tan s´ ubitamente, que podr´ıamos decir que el cambio se efectu´o “de un d´ıa para otro”. Fresnel presen4

ta su teor´ıa ondulatoria a la Academia Francesa en 1815. Poisson se opone a esta teor´ıa y, para atacarla, trae a cuento la predicci´on del punto brillante en la sombra de la moneda. Arago recibe la objeci´on de Poisson como un reto y se dispone a montar un experimento para establecer si tal punto brillante verdaderamente existe o no; y mostr´o a los acad´emicos pasmados, en una escena memorable de la historia de la f´ısica, el puntico brillante en medio de la sombra. La teor´ıa ondulatoria fue acatada desde ese momento.

1.2

El ´ eter

Anotamos arriba que el sonido era bien conocido y se le entend´ıa, correctamente, como las vibraciones longitudinales de un medio material, bien sea gaseoso, l´ıquido o s´olido. Tambi´en apuntamos que los primeros ´opticos partidarios de la teor´ıa ondulatoria trasladaron a la luz las propiedades conocidas del sonido: la luz debe de ser una vibraci´on longitudinal. Pero, ¿qu´e es lo que vibra en los fen´omenos luminosos? Hoy por hoy se acepta que lo que vibra es el campo electromagn´etico, y que esta ondulaci´on puede darse en el vac´ıo, pero en la cultura de los siglos anteriores la idea del vac´ıo era dif´ıcil de aceptar. Que el espacio entre los astros pueda estar vac´ıo era inadmisible, porque los hombres ten´ıan horror a la idea del vac´ıo. Prefirieron pensar en una substancia que rellena tal espacio, un medio a trav´es del cual viajan los astros y la luz: estas son las caracter´ısticas principales de lo que se ha denominado2 el ´eter3 . No hay una definici´on precisa4 de en qu´e consiste este medio transmisor de la luz, el ´eter, pero podemos rese˜ nar algunas de sus propiedades. El ´eter debe invadir todo el universo, porque de lo contrario no podr´ıamos recibir la luz que proviene de las estrellas. Debe ser suficientemente r´ıgido para transmitir las ondas con una velocidad tan grande. Un medio con estas caracter´ısticas debe causar rozamiento en los planetas, motivando as´ı un frenado, un retardo en sus trayectorias. Sin embargo, un frenado acumulado ser´ıa f´acilmente 2

La palabra ´eter tiene varios significados. El que estamos discutiendo es el ´eter lumin´ıfero. Este se debe distinguir del ´eter et´ılico, que es un gas usado en medicina como antiespasm´ odoco y anest´esico. 3 La teor´ıa corpuscular se basa en la supuesta existencia de las part´ıculas lumin´ıferas; dado que ´estas podr´ıan perfectamente propagarse en el vac´ıo, la teor´ıa corpuscular no necesita ´eter. Pero la ondulatoria es hermana del ´eter. 4 El Diccionario de la Real Academia Espa˜ nola de 1780 trae esta definici´ on de ´eter: /La esfera, ´ o cielo del fuego/Se toma tambien muy freq¨ uentemente por la substancia celeste y pura desde la atm´ osfera arriba, por la cual caminan los astros.

5

detectable en las observaciones astron´omicas y, dado que los astr´onomos no han notado el m´as m´ınimo indicio de frenado, se concluye que el ´eter debe ser un gas delgad´ısimo, muy sutil: cuando los astros viajan en el espacio no lo notan, porque el ´eter se cuela a trav´es de ellos libremente, as´ı “como la brisa fluye entre los ´arboles con poca o ninguna oposici´on”. Mientras la luz sea ondas longitudinales, el ´eter como un gas sutil no est´a mal; pero, tal como hemos mencionado, la teor´ıa ondulatoria pas´o de ondas longitudinales a transversales y aqu´ı hay un problema, ya que los gases no transmiten ondas transversas. Para que el ´eter transmita las nuevas ondas transversas de la luz, debe ser un s´olido. Y como la velocidad de la luz es tan alta, el s´olido debe ser muy el´astico y muy r´ıgido. En conclusi´on, el ´eter lumin´ıfero es una substancia que no atrae ni es atra´ıda gravitacionalmente, inm´ovil, transparente, s´olida, r´ıgida, el´astica y se cuela entre los objetos m´oviles sin rozarlos. Debemos entender que un medio transmisor tan contradictorio se presta a m´ ultiples interpretaciones. Se propusieron toda clase de explicaciones. Fresnel5 dice que un medio ´optico de ´ındice de refracci´on n, cuando se mueve con velocidad v, arrastra parcialmente al ´eter consigo y le imparte6 una velocidad (1 − n−2 )v. Para Stokes el ´eter es completamente arrastrado por un cuerpo en movimiento. Lorentz propone que no hay arrastre de ´eter, sino que hay un par´ametro temporal efectivo dado por t0 = t−vx/c2 . Planck dice que probablemente el ´eter es compresible y se acumula con gran densidad alrededor de los cuerpos grandes. En el siglo XIX se dan los grandes avances del electromagnetismo, no s´olo en el lado experimental, sino adem´as en el te´orico. A fines de ese siglo se produce una compilaci´on de la teor´ıa electromagn´etica, una reuni´on expresada en las cuatro ecuaciones de Maxwell. Estas ecuaciones hacen una predicci´on definitiva: debe haber ondas electromagn´eticas, y ´estas tienen una velocidad c que es la misma en todas las direcciones. Con esto queremos decir que la velocidad c de un pulso de luz tiene una magnitud c que no depende de la direcci´on del vector c. En pocas palabras, la velocidad de la luz es is´otropa. Pero hay un detalle crucial acerca de esta isotrop´ıa, y es que como las ecuaciones de Maxwell se consideraban v´alidas u ´nicamente para un observador inercial O en reposo respecto al ´eter, la velocidad de la luz se consideraba, 5

Fresnel fue quien m´ as empe˜ no puso en fundamentar el concepto del medio transmisor de la onda luminosa, y se le considera el padre de la hip´ otesis et´erea. Es ´el quien introduce la idea del ´eter en reposo absoluto en 1818, y quien hace los esfuerzos iniciales para someterlo a la observaci´ on experimental. 6 V´ease la ecuaci´ on (2.31).

6

tambi´en, que era is´otropa u ´nicamente respecto a O: se pensaba que para los otros observadores inerciales la velocidad de la luz no pod´ıa ser is´otropa. Veamos esto. Consideremos un observador inercial O0 que se mueve con velocidad v respecto a O. Llamaremos c 0 a la velocidad del pulso de luz respecto a O0 . Quiz´as no sea equivocado pensar que c0 = c − v

(1.1)

c02 = c2 + v 2 − 2vc cos θ ,

(1.2)

Esta ecuaci´on implica que:

donde θ es el ´angulo que se forma entre c y v . La Figura 1.1 muestra los vectores c, v y c 0 , el ´angulo θ, y el ´angulo θ0 que se forma entre c 0 y v . En esta figura se ve claramente que c cos θ = v + c0 cos θ0 . Remplazando este valor en el lado derecho de (1.2) se llega a: c02 = c2 + v 2 − 2v(v + c0 cos θ0 ) c02 + 2v cos θ0 c0 − (c2 − v 2 ) = 0 Esta u ´ltima es una ecuaci´on de segundo grado, y sus dos soluciones son "

v c = c − cos θ0 ± c

r

v2 1 − 2 sen2 θ0 c

0

#

La soluci´on con el signo inferior da una c0 negativa, y por eso es inaceptable. Queda la soluci´on del signo superior: "

v c0 = c − cos θ0 + c

r

v2 1 − 2 sen2 θ0 c

# (1.3)

N´otese que c0 depende expl´ıcitamente de θ0 : la velocidad c0 de la luz es 7

anis´otropa. En O se cumplen las ecuaciones de Maxwell y por consiguiente la velocidad de la luz es is´otropa. En O0 la velocidad de la luz es anis´otropa, o sea que para ese observador no se deben cumplir las ecuaciones de Maxwell. Hemos llegado a una idea importante: si la f´ ormula (1.1) es v´ alida, las ecuaciones de Maxwell se cumplen u ´nicamente para un observador inercial. Este observador es especial, privilegiado. Ser´ıa interesante averiguar la velocidad v de la Tierra respecto a O. Si decimos que O0 es un laboratorio fijo en la Tierra, la ecuaci´on (1.1) podr´ıa utilizarse para medir v: la anisotrop´ıa de la velocidad c0 indicar´ıa la magnitud de v. La gran dificultad experimental se centra en el hecho de que en (1.1) ocurre la fracci´on v/c que, presumiblemente, es muy peque˜ na. En efecto, las velocidades involucradas con nuestro planeta son muy bajas en comparaci´on con c; por ejemplo, la velocidad de la Tierra respecto al Sol es tan s´olo 30 km/s, es decir, 104 veces m´as peque˜ na que c. Se necesitar´ıa un instrumental sumamente fino para averiguar la v de la Tierra a trav´es de la f´ormula (1.1). Ocurr´ıa, felizmente, que a fines del siglo XIX los instrumentos ´opticos ya hab´ıan alcanzado un nivel de precisi´on suficiente.

1.3

El experimento de Michelson y Morley

El interfer´ometro de Michelson est´a capacitado para mostrar la supuesta anisotrop´ıa de la velocidad c0 . La luz incide sobre un espejo semitransparente P colocado a 45o , de modo que en P emergen dos rayos perpendiculares. Uno de los rayos va hacia el punto A, donde hay un espejo; el otro rayo va hacia el punto B, donde hay otro espejo. Los rayos reflejados en los espejos A y B se re´ unen finalmente en una pantalla de observaci´ on, como muestra la Figura 1.2. En la pantalla se observa la interferencia de las se˜ nales que provienen de los espejos que hay en A y B. Llamemos t0P AP al tiempo total que tarda la luz para recorrer el trayecto P AP , y t0P BP para el trayecto P BP . La interferencia en la pantalla depende del retardo t0P AP − t0P BP de una se˜ nal respecto a la otra. Si t0P AP − t0P BP es un n´ umero entero de per´ıodos, hay interferencia constructiva y la pantalla muestra mucho brillo, alta intensidad. Y si t0P AP − t0P BP es un n´ umero impar de semiper´ıodos, se observa interferencia destructiva: cero intensidad y pantalla opaca. En el experimento se usa un interfer´ometro cuyos brazos P A y P B tienen la misma longitud L. Si la velocidad c0 de la luz fuera la misma en todas las direcciones, la luz demor8

ar´ıa el mismo tiempo recorriendo los trayectos P AP y P BP , y se observar´ıa interferencia constructiva en la pantalla. Pero la f´ormula (1.3) afirma que c0 es anis´otropa y, en consecuencia, el retardo t0P AP − t0P BP tambi´en debe ser anis´otropo: esto significa que el grado de interferencia en la pantalla debe depender de la orientaci´on que se le d´e al interfer´ ometro. Veamos el an´alisis que hace un observador en reposo respecto a la Tierra. Llamamos α al ´angulo formado por v y la direcci´on P A, como muestra la Figura 1.2. Para el recorrido P A hacemos θ0 = α en la f´ormula (1.3): "

v c0 = c − cos α + c

r

v2 1 − 2 sen2 α c

#

El tiempo que demora la luz en este trayecto es L/c0 :

t0P A

L = c

"

v − cos α + c

r

v2 1 − 2 sen2 α c

#−1

Para el trayecto AP hacemos θ0 = α + π en la f´ormula (1.3). Para el trayecto P B hacemos θ0 = α + π/2 y para BP se tiene θ0 = α − π/2. Llegamos a

t0AP

L = c

t0P B

L = c

t0BP

L = c

"

v + cos α + c

r

v2 1 − 2 sen2 α c

#−1

"

r

#−1

"

r

#−1

v + sen α + c

v − sen α + c

v2 1 − 2 cos2 α c

v2 1 − 2 cos2 α c

El retardo t0P AP − t0P BP es la diferencia (t0P A + t0AP ) − (t0P B + t0BP ): t0P AP



t0P BP

2L/c = 1 − v 2 /c2

"r

v2 1 − 2 sen2 α − c 9

r

v2 1 − 2 cos2 α c

# (1.4)

Al mirar esta ecuaci´on, concentremos nuestra atenci´on en tres de las variables que en ella participan: t0P AP − t0P BP corresponde al grado de interferencia, α es la orientaci´ on que se le da al interfer´ ometro y v es la velocidad de la Tierra. Escogiendo un α y midiendo el grado de interferencia, deber´ıamos ser capaces de deducir el valor de v. El problema es que el grado de interferencia no es una cantidad f´acil de medir. Por tal motivo, no es aconsejable que se use un s´olo valor de α, sino permitir que α tome todos los valores dentro de un rango continuo. En tal caso nos interesa tomar la derivada de t0P AP − t0P BP respecto a α: d 0 (t − t0P BP ) = dα P AP −





 (Lv 2 /c3 ) sen 2α  1 1 r  + r   2 2 2 2 1 − v /c v v 1 − 2 sen2 α 1 − 2 cos2 α c c

(1.5)

Podr´ıamos utilizar esta ecuaci´on si α cambiara a medida que pasa el tiempo, es decir, si el interfer´ ometro, como un todo, se hiciera rotar continuamente. En tales circunstancias el patr´on de interferencia deber´ıa ir cambiando a medida que pasa el tiempo. Michelson y Morley efectivamente montaron el interfer´ometro sobre un “lago” de mercurio, lo que les permiti´o rotarlo suave y continuamente. ¿Qu´e esperaban ellos? Ellos esperaban que, a medida que rotaran el espectr´ometro, el patr´on de interferencia fuera cambiando paulatinamente. Pero, para su sorpresa, el patr´on de interferencia permaneci´o inmutable, sin mostrar ning´ un cambio paulatino. Esto significa que la derivada (1.5) tiene que ser cero para todos los valores del ´angulo α. Haciendo (1.5) igual a cero se llega a: r v

2

v2 1 − 2 cos2 α = −v 2 c

r 1−

v2 sen2 α c2

(1.6)

Esta ecuaci´on corresponde al resultado experimental. Hay dos posibilidades: La primera es v = 0. La segunda posibilidad es v 6= 0; pero si v 6= 0 la ecuaci´on (1.6) es absurda; no puede ser v´alida, porque implica que una cantidad positiva iguale a una cantidad negativa. La u ´nica implicaci´on v´alida de (1.6) es v = 0. Esta conclusi´on dice que 10

la Tierra estar´ıa en reposo respecto al ´eter; la Tierra ser´ıa ese u ´nico y privilegiado observador en el que se cumplen las ecuaciones de Maxwell, ese observador en el que la velocidad de la luz es is´otropa. Eso es incre´ıble. Como el an´alisis de los resultados del experimento conduce a una conclusi´on incre´ıble, nos vemos impulsados a pensar que alguna de las suposiciones en que se basa el an´alisis est´a probablemente equivocada. Volviendo sobre los pasos del estudio reci´en hecho, nos damos cuenta de que la suposici´on (1.1) es el paso d´ebil, el que podemos abandonar. De ahora en adelante vamos a pensar que (1.1) es falsa. En nuestro haber tenemos un hecho experimental y una gu´ıa te´orica: El hecho experimental: la velocidad de la luz es is´otropa respecto a la Tierra. La gu´ıa te´ orica: la ecuaci´on (1.1) es falsa. El hecho experimental trae consigo una pregunta inmediata: ¿acaso el planeta Tierra es el u ´nico observador respecto al cual la velocidad de la luz es is´otropa? Nos parece prudente responder de esta manera: No vemos ninguna raz´on que nos lleve a pensar que este planeta es especial; si la velocidad de la luz es is´otropa respecto al observador inercial O0 , se espera que tambi´en sea is´otropa respecto a todos los otros observadores inerciales O00 , O000 , ...etc: todas las velocidades c, c0 , c00 , c000 , ... etc. deben ser is´otropas. Demos un salto adicional: supongamos que c = c0 = c00 = c000 ... El salto, en palabras, dice que la velocidad de la luz es la misma para todos los observadores inerciales. Este enunciado es El Principio de la Constancia de la Velocidad de la Luz. De otro lado, la frase escrita en bastardilla en la p´agina 8 se˜ nala que la ecuaci´on (1.1) es un impedimento; si ahora adoptamos la gu´ıa te´ orica reci´en mencionada, desaparece el impedimento y se nos abre un camino interesante: la posibilidad de que las ecuaciones de Maxwell sean v´ alidas para todos los observadores inerciales.

1.4

La transformaci´ on de Galileo

El siguiente conjunto de ecuaciones: t0 = t r0 = r − v t 11

(1.7)

recibe el nombre de la transformaci´ on de Galileo 7 . Tomando una derivada temporal se llega a la f´ormula galileana para la adici´on de velocidades: u0 = u − v ,

(1.8)

y tomando otra derivada temporal: a0 = a

(1.9)

Estas ecuaciones son tradicionales en la f´ısica cl´asica. Han tenido gran prestigio por dos razones: primero, porque la ecuaci´on (1.8) es cercana a nuestra intuici´on, nos parece “natural” y razonable; y segundo, porque la teor´ıa de la mec´anica newtoniana es invariante bajo las transformaciones (1.7). N´otese de paso que haciendo u = c y u 0 = c 0 , la ecuaci´on (1.8) se convierte en (1.1). Esto muestra que en el fondo de (1.1) est´a (1.8); dado que queremos abandonar (1.1), lo que verdaderamente queremos abandonar es la transformaci´on de Galileo (1.8). La teor´ıa de la relatividad repudia la transformaci´on de Galileo. Queremos substituir la transformaci´on de Galileo por otra que est´e de acuerdo con la isotrop´ıa de u 0 que resulta en el experimento de Michelson y Morley. Para encontrar la nueva transformaci´on nos basaremos en estos tres postulados: 1) El Principio de la Constancia de la Velocidad de la Luz. 2) El Principio de la Relatividad.

(1.10)

3) El Principio de la Homogeneidad del Espacio y el Tiempo. Las pr´oximas secciones est´an dedicadas a la descripci´on de estos tres postulados.

1.5

La constancia de la velocidad de la luz

La velocidad de la luz en el vac´ıo es la misma para todos los observadores inerciales: ´este es el principio de la constancia de la velocidad de la luz. 7

As´ı la llam´ o Philipp Frank en 1909.

12

El sentido de este principio se puede entender con el siguiente ejemplo. Supongamos que alguien apunta una linterna hacia el norte, la prende, y un instante despu´es la apaga; de este modo se forma un pulso de luz que viaja hacia el norte. La velocidad de este pulso es 300.000 km/s. Pensemos en un observador inercial que tambi´en viaja hacia el norte en un cohete de alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene 300.000 km/s. Pensemos en otro observador inercial que viaja hacia el sur en un cohete de alta velocidad; si este observador mide la velocidad del pulso de luz, obtiene 300.000 km/s. Pensemos a´ un en otro observador inercial que viaja hacia el oriente; si mide la velocidad del pulso de luz, obtiene 300.000 km/s. Todos los observadores inerciales, los lentos, los veloces, los que viajan en esta direcci´on, los que viajan en esa otra direcci´on, todos ellos registran que la velocidad del pulso de luz es 300.000 km/s. Cualquiera que sea el estado de movimiento del observador inercial, ´el siempre registra que la velocidad del pulso es 300.000 km/s. Si el observador persigue al pulso con intenci´on de darle alcance, nunca lo logra, porque el pulso se aleja con velocidad 300.000 km/s. Y si el observador huye del pulso de luz, de nada le vale viajar muy r´apido porque el pulso siempre tendr´a velocidad 300.000 km/s. El principio que estamos discutiendo afirma que la velocidad de la luz es independiente de la velocidad relativa entre el observador y la fuente de luz. Si este principio es v´alido, el resultado del experimento de Michelson y Morley no presenta ninguna paradoja y es enteramente entendible: la luz tiene la misma velocidad en los dos brazos del interfer´ ometro y por consiguiente tarda lo mismo en recorrer ambas rutas, o sea que las franjas de interferencia no tienen por qu´e mostrar variaciones. No hay tal cosa como “la velocidad de la luz respecto al ´eter”, ´este queda devaluado y se puede incluso considerar la posibilidad de erradicarlo de la f´ısica.

1.6

El principio de la relatividad

La experiencia de viajar en autom´ovil en l´ınea recta y a velocidad constante es muy simple: no se siente nada especial. Uno puede comer, tomar caf´e y recoger un l´apiz que se cay´o, del mismo modo como se realizan esas actividades en casa. En realidad las experiencias en el carro y en casa son iguales. Estamos poniendo de manifiesto una de las observaciones m´as importantes de la f´ısica, al establecer que todos los observadores inerciales son equivalentes. Esto, que ning´ un observador inercial es preferido, es lo que afirma el 13

Principio de la Relatividad: lo que ocurre para un observador inercial tambi´en puede ocurrir para cualquier otro observador inercial. Las leyes de la f´ısica son las mismas para todos los sistemas inerciales. ¿C´omo se aplica este principio, de qu´e modo se implementa en las ecuaciones de la f´ısica? Para responder esta pregunta presentemos un ejemplo: la ley de la conservaci´on del momentum debe ser v´alida en todos los sistemas inerciales. Esta ley de conservaci´ on se expresa mediante una ecuaci´on; lo que el principio de la relatividad afirma es que tal ecuaci´on se cumple para todos los observadores inerciales. M´as concretamente, pensemos en el choque de dos part´ıculas, llamando pa al momentum total antes del choque, y pd al momentum total despu´es del choque. La ley de la conservaci´ on del momentum dice que pa = pd

(1.11)

Esto es lo que registra un observador inercial O. Ahora introducimos otro observador inercial O0 . El nuevo observador registra que el momentum antes del choque es p0a , y despu´es p0d ; este observador tambi´en registra que se conserva el momentum: p0a = p0d

(1.12)

N´otese que las ecuaciones (1.11) y (1.12) tienen la misma forma. La ecuaci´on que expresa la ley de conservaci´ on tiene la misma forma para todos los observadores inerciales. Este ejemplo del choque de dos part´ıculas nos ha servido para ver la manera como se expresa, formalmente, el principio de la relatividad: las ecuaciones que representan las leyes de la f´ısica tienen la misma forma para todos los observadores inerciales.

1.7

Homogeneidad del espacio y el tiempo

La observaci´on directa nos permite afirmar que la Luna da una vuelta alrededor de la Tierra en 28 d´ıas, y ´esta da una vuelta alrededor del Sol en 365 d´ıas. Si el sistema solar en pleno se trasladara a otro lugar B del universo, all´a funcionar´ıa como funciona aqu´ı, sin ninguna modificaci´on: la “nueva” Luna tomar´ıa 28 d´ıas para darle una vuelta a la “nueva” Tierra, y ´esta dar´ıa una vuelta alrededor del “nuevo” Sol en 365 d´ıas. Pensamos que el sistema solar funcionar´ıa lo mismo en un lugar A y en otro B. Respecto al tiempo 14

tenemos una idea similar: si el sistema solar se trasladara en pleno al futuro o al pasado, funcionar´ıa como funciona ahora, sin ninguna modificaci´on. Conviene anotar que las ideas reci´en expresadas se basan en la suposici´on de que el sistema solar est´a aislado del exterior, o al menos suficientemente aislado. En general, cualquier sistema aislado funcionar´ıa lo mismo si se le trasladara en el espacio, y tambi´en funcionar´ıa lo mismo si se le trasladara en el tiempo. Dicho de otra manera, todos los puntos del espacio son equivalentes, y todos los instantes son equivalentes: ´este es el principio de la homogeneidad del tiempo y el espacio. Las interacciones que se dan entre los objetos f´ısicos que pueblan el universo hacen que en un lugar ocurran fen´omenos diferentes de los que ocurren en otro lugar: no es lo mismo pararse en la superficie de la Luna y pararse en la superficie de la Tierra. La diferencia entre estos dos lugares no indica que esos puntos del espacio sean inequivalentes; la diferencia proviene de las interacciones que se dan entre los objetos f´ısicos que hay en el universo.

1.8

El concepto de observador

Las coordenadas (x, y, z) de los puntos del espacio se pueden establecer con relojes y pulsos de luz, como explicaremos enseguida. En un punto del espacio tenemos un reloj; enviamos un pulso de luz a otro punto donde hay un espejo, y esperamos a que el pulso regrese al punto inicial. Registramos el tiempo ∆t que toma el pulso en el viaje total de ida y vuelta, y finalmente decimos que la distancia entre los dos puntos es 12 c∆t. De esta manera se establecen las distancias entre todos los puntos y podemos calibrar o marcar las escalas de los tres ejes cartesianos. Todo punto en el espacio se caracteriza por medio de sus tres coordenadas (x, y, z). Ahora suponemos que en todo punto del espacio hay un reloj en reposo, form´andose as´ı una gran red tridimensional, r´ıgida e infinita. A esta gran malla r´ıgida de relojes se le llama observador. Si suponemos que todos los relojes son igualmente construidos, podemos afirmar que marchan a la misma frecuencia. A pesar de que tengan la misma frecuencia, los relojes podr´ıan estar descuadrados, es decir, podr´ıa ser que marquen horas diferentes por haber comenzado a marchar en diferentes instantes. Es preciso sincronizarlos. Para sincronizar dos relojes, el reloj uno env´ıa un pulso de luz hacia el reloj dos, y mide el tiempo ∆t que tarda el pulso en ir y regresar. Supong15

amos que ∆t = 6 minutos. M´as tarde, cuando en el reloj uno sean las 3:57 p.m., el reloj uno env´ıa otra se˜ nal luminosa hacia el reloj dos con la siguiente instrucci´on: “en el instante en que reciba esta se˜ nal, cuadre las manecillas de su reloj en la hora 4:00 p.m.”. De esta manera se pueden sincronizar todos los relojes de un observador inercial. En lo sucesivo, siempre que hablemos de observador inercial, hemos de entender que sus relojes est´an sincronizados. Veamos de qu´e manera este observador registra el vuelo de una part´ıcula puntual. A medida que transcurre el tiempo, la part´ıcula visita un punto, y otro, y otro, y los relojes de los puntos visitados registran a qu´e hora fueron visitados. Luego se recogen todos los registros y se reconstruye la trayectoria: la part´ıcula pas´o por tal punto en tal instante, pas´o por aquel otro punto en este otro instante, etc. As´ı se establece la posici´on de la part´ıcula como funci´on del tiempo. N´otese que los relojes no necesitan enviar datos a un computador central ni hay un reloj principal: el observador no es un ser humano que usa la vista, sino que es un l´atice infinito con un reloj en cada punto. Llamemos O a un observador inercial, y O0 a otro observador inercial que se mueve con cierta velocidad (constante) v respecto a O. Nos imaginamos dos mallas de relojes, una para O y otra para O0 ; las dos mallas se cuelan una a trav´es de la otra, y cada una de ellas tiene su propio sistema de coordenadas. En cada punto del espacio hay dos relojes, uno pertenece a O y el otro pertenece O0 , de manera que el de O0 se desplaza con velocidad v respecto al de O. Podemos pensar que hay un n´ umero infinito de observadores inerciales, y cada uno es una malla r´ıgida de relojes; estas mallas se cuelan unas entre las otras; en cada punto del espacio hay un n´ umero infinito de relojes que pertenecen a todos los observadores inerciales. Todos los observadores inerciales son igualmente dignos, no hay ninguno preferido, todos registran las mismas leyes de la f´ısica: las ecuaciones que expresan las leyes de la f´ısica tienen la misma forma para todos estos observadores. Como todos los observadores inerciales est´an en un plano de igualdad, no habiendo ninguno que sea especial, desaparecen las nociones de espacio y tiempo absolutos. Cada observador tiene pleno derecho a medir distancias y tiempos, y los resultados de sus mediciones son distancias verdaderas y tiempos verdaderos. Aqu´ı se establece una diferencia radical con la f´ısica preeinsteiniana. En esa f´ısica la variable t se refiere al tiempo absoluto, ese flujo imperturbable dentro del cual se supon´ıa que las cosas del mundo f´ısico 16

est´an inscritas. En la relatividad especial t es lo que marca un reloj. Nota. Antes de concluir esta secci´on queremos hacer un comentario acerca de la velocidad que puede tener un observador inercial respecto a otro. El lector notar´a, obviamente, que esta nota desubicada introduce un elemento de desorden, pero a´ un as´ı queremos presentarla desde ya, porque pronto nos ser´a u ´til. Supongamos que deseamos acelerar una part´ıcula masiva con el prop´osito de que adquiera la velocidad de la luz c. Tal como veremos en la secci´on 3.5, cuando estudiemos la din´amica relativista, para realizar este proceso habr´ıa que darle a la part´ıcula una energ´ıa infinita, y por eso es imposible: no se puede acelerar una part´ıcula masiva hasta darle la velocidad c. Esta afirmaci´on est´a de acuerdo con el hecho de que no se observan part´ıculas masivas que viajen a la velocidad de la luz. Los laboratorios (los laboratorios constan de objetos masivos como relojes) tienen velocidades que son menores que c: la velocidad relativa entre dos observadores inerciales es siempre menor que c.

1.9

Transformaciones de coordenadas

Un evento es un punto en el espaciotiempo. Un evento no es un suceso, no es algo que ocurre, sino que es un simple punto en el cuadriespacio. En un evento pueden ocurrir fen´omenos, como por ejemplo la desintegraci´ on de una part´ıcula. Para caracterizar un evento, el observador O usa cuatro n´ umeros (t, x, y, z) de la manera siguiente; supongamos que una part´ıcula se desintegra en el evento (9,2,4,6); esto quiere decir que el fen´omeno ocurre en aquel lugar cuyas coordenadas espaciales son (2,4,6) y que el reloj que se encuentra en ese punto marca t = 9 en el instante de la desintegraci´ on. As´ı como en la secci´on anterior, pensemos en dos observadores inerciales O y O0 tales que el segundo se mueve respecto al primero con cierta velocidad (constante) v . Un evento cualquiera, gen´erico, tiene coordenadas (t, x, y, z) en el sistema O y tiene coordenadas (t0 , x0 , y 0 , z 0 ) en el sistema O0 . Con t y t0 queremos decir que en el sitio y en el instante del evento hay dos relojes que pertenecen a O y O0 . (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son las coordenadas de un mismo evento para dos observadores diferentes. Debe existir una manera de averiguar las cuatro coordenadas (t0 , x0 , y 0 , z 0 ) cuando se conocen v y las cuatro coordenadas (t, x, y, z). Pero, y aqu´ı radica la importancia, no se trata de encontrar 17

las f´ormulas de conexi´on para un evento particular, sino las f´ormulas de conexi´on para todos los eventos; en t´erminos matem´aticos, se debe reconocer que (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) son variables algebraicas. Las coordenadas primadas deben ser funciones de las no primadas: t0 = t0 (v , t, x, y, z) x0 = x0 (v , t, x, y, z) y 0 = y 0 (v , t, x, y, z)

(1.13)

z 0 = z 0 (v , t, x, y, z) A cualquier conjunto de cuatro ecuaciones como (1.13) se le llama transformaci´ on de coordenadas. Hay, por supuesto, un n´ umero infinito de transformaciones de coordenadas, pero s´olo una es verdadera. Es decir, hay s´olo una transformaci´on que verdaderamente corresponde a los registros de las dos mallas infinitas de relojes (la red primada y la no primada). En las pr´oximas secciones concentraremos el esfuerzo en encontrar la transformaci´on verdadera. Ese es nuestro prop´osito a corto plazo. No podemos olvidar, sin embargo, el prop´osito a largo plazo, el gran objetivo del proyecto relativista: que se cumpla el principio de la relatividad: que las leyes de la f´ısica se expresen mediante ecuaciones que tengan la misma forma para todos los observadores inerciales. Por ejemplo, para los observadores O y O0 la ecuaci´on de Maxwell ∇ · B = 0 se escribe ∂By ∂Bz ∂Bx + + ∂x ∂y ∂z

= 0

∂By0 ∂Bx0 ∂Bz0 + + ∂x0 ∂y 0 ∂z 0

= 0

Debemos ser capaces de pasar de una ecuaci´on a la otra: que las dos ecuaciones sean equivalentes. Para que se pueda ejecutar la conversi´ on de una de las ecuaciones en la otra, la teor´ıa de la relatividad debe suministrar: 1) La f´ormula que permita averiguar las variables (Ex0 , Ey0 , Ez0 , Bx0 , By0 , Bz0 ) cuando se conocen las (Ex , Ey , Ez , Bx , By , Bz ) (a esa f´ormula se le dice “la transformaci´on del campo electromagn´etico”, y la deduciremos en el cap´ıtulo 4).

18

µ ¶ ∂ ∂ ∂ 2) La f´ormula que permita averiguar las variables , , cuan∂x0 ∂y 0 ∂z 0 ¶ µ ∂ ∂ ∂ do se conocen las , , . M´as precisamente, la f´ormula que permite ∂x ∂y ∂z averiguar las variables (t0 , x0 , y 0 , z 0 ) cuando se conocen las (t, x, y, z); esta f´ormula se llama “la transformaci´on verdadera de las coordenadas”, y la deduciremos enseguida. El prop´osito 2) de encontrar la transformaci´on verdadera de coordenadas es v´alido de por s´ı; pero ese prop´osito cobra una gran importancia cuando se inscribe dentro del principio de la relatividad 1), que pide que las ecuaciones que expresan las leyes de la f´ısica sean las mismas para todos los observadores inerciales (que las ecuaciones sean invariantes). La transformaci´on verdadera de coordenadas deja invariantes las ecuaciones que describen las leyes de la f´ısica. Hay dos m´etodos para encontrar la transformaci´on verdadera de coordenadas: M´etodo a): Acudir a las ecuaciones que expresan las leyes de la f´ısica y averiguar la transformaci´on de coordenadas que las deja invariantes (esta ruta se explora en el ap´endice). M´etodo b): Establecer un conjunto de primeros principios, como por ejemplo (1.10), deducir una transformaci´on de coordenadas a partir de ellos y luego estudiar si las ecuaciones de las leyes f´ısicas son covariantes: si lo son, entonces la transformaci´on es muy probablemente la transformaci´on verdadera de coordenadas. En la pr´oxima secci´on seguiremos el m´etodo b) y encontraremos:

v t− 2 x c t0 = p 1 − v 2 /c2 x − vt x0 = p 1 − v 2 /c2 y0 = y z0 = z 19

(1.14)

Einstein dedujo estas transformaciones en su c´elebre art´ıculo [2] de 1905 en el que funda la relatividad especial. Ellas son quiz´a las ecuaciones m´as importantes de la f´ısica del siglo XX, y se conocen como las transformaciones de Lorentz. El origen de este nombre es curioso, porque las ecuaciones (1.14) ya hab´ıan sido obtenidas, usando el m´etodo a), por Hendrik Antoon Lorentz [4] unos meses antes, cuando el holand´es prob´o la covariancia de los campos el´ectrico y magn´etico bajo la transformaci´on (1.14) (sin embargo, por un error de c´alculo, s´olo pudo probar la covariancia hasta primer orden en v/c). Einstein, que no conoc´ıa este trabajo de Lorentz, dedujo independientemente las transformaciones (1.14). Lorentz no le dio al t0 de estas ecuaciones la importancia que luego habr´ıa de lograr en la relatividad; en efecto, Lorentz pensaba en 1904 que mientras t es el tiempo verdadero, la variable t0 era simplemente una cantidad auxiliar.

1.10

Las transformaciones de Lorentz

Einstein [2] se basa en los tres principios (1.10) para derivar las transformaciones de Lorentz. Aqu´ı seguiremos la presentaci´ on de Resnick [6] que nos parece m´as ordenada y pedag´ogica. As´ı como en las secciones anteriores, suponemos que la velocidad de separaci´on v es paralela al eje com´ un xx0 . Comencemos el estudio demostrando que las ecuaciones (1.13) deben ser lineales. Para tal efecto consideremos dos eventos que son iguales en todo, excepto en la coordenada x; en estas condiciones podemos decir que los dos eventos son (t, x, y, z) y (t, x + δx, y, z). Asumiendo que δx es infinitesimal nos preguntamos cu´al es la separaci´on δx0 de acuerdo con el observador O0 . Tomando diferenciales δ en la segunda de las ecuaciones (1.13) escribimos: δx0 =

∂x0 ∂x0 ∂x0 ∂x0 δt + δx + δy + δz, ∂t ∂x ∂y ∂z

pero δt = δy = δz = 0, entonces δx0 =

∂x0 δx ∂x

(1.15)

La homogeneidad del espacio nos permite afirmar que, para un δx dado, el 20

valor δx0 debe ser igual en todas las regiones del espacio, o sea que ∂x0 /∂x debe ser independiente de x, y, z. As´ı mismo, la homogeneidad del tiempo dice que δx0 debe ser igual en todas las ´epocas, o sea que ∂x0 /∂x es independiente del tiempo. En conclusi´on, la derivada ∂x0 /∂x es una constante. Consideraciones parecidas, invocando la homogeneidad del espacio y del tiempo, nos llevan a afirmar que ∂x0 /∂t, ∂x0 /∂y, ∂x0 /∂z son tambi´en constantes. La segunda funci´on (1.13) debe ser: x0 = a10 t + a11 x + a12 y + a13 z,

(1.16)

con a10 , a11 , a12 , a13 constantes. Se puede repetir este razonamiento para las otras tres funciones de (1.13), con resultados similares a (1.16): t0

=

a00 t

+

a01 x

+

a02 y

+

a03 z

(1.17)

0

x

=

a10 t

+

a11 x

+

a12 y

+

a13 z

(1.18)

y

0

=

a20 t

+

a21 x

+

a22 y

+

a23 z

(1.19)

z

0

=

a30 t

+

a31 x

+

a32 y

+

a33 z

(1.20)

Aqu´ı los 16 coeficientes aµν son constantes. Ahora procedemos a averiguar los valores de estos coeficientes utilizando los tres principios (1.10). Primero vamos a averiguar los ocho coeficientes de las dos u ´ltimas ecuaciones (1.19) y (1.20), y luego atacaremos las dos primeras ecuaciones (1.17) y (1.18). Los puntos que pertenecen al eje x (los que tienen y = z = 0) tambi´en pertenecen al eje x0 , es decir, tienen y 0 = z 0 = 0. Formalmente, las condiciones {y = z = 0} y {y 0 = z 0 = 0} se implican mutuamente: {y = z = 0}



{y 0 = z 0 = 0}

De aqu´ı podemos concluir que a20 = a21 = a30 = a31 = 0. Los puntos que pertenecen al plano xy (los que tienen z = 0) tambi´en pertenecen al plano x0 y 0 , es decir, tienen z 0 = 0. Formalmente: z=0

⇔ 21

z0 = 0

De aqu´ı se deduce que a32 = 0. Un razonamiento similar (con el plano xz) nos lleva a que a23 = 0 . Vamos a probar que a22 = 1 al comparar estas dos situaciones: Situaci´ on 1: En t = 0 hay una varilla en reposo respecto a O parada en el eje y, con sus extremos en los puntos y = 0 y y = L; o sea que los dos extremos tienen coordenadas no primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos de qu´e manera el observador O0 registra este objeto: claramente se trata de una varilla que viaja hacia la izquierda y cuyos extremos tienen, de acuerdo con (1.19), coordenadas primadas y 0 = 0 y y 0 = a22 L. Situaci´ on 2: En t0 = 0 hay una varilla en reposo respecto a O0 parada en el eje y 0 , con sus extremos en los puntos y 0 = 0 y y 0 = L; o sea que los dos extremos tienen coordenadas primadas (0, 0, 0, 0) y (0, 0, L, 0). Veamos de qu´e manera el observador O registra este objeto: claramente se trata de una varilla que viaja hacia la derecha y cuyos extremos tienen, de acuerdo con (1.19), coordenadas no primadas y = 0 y y = L/a22 . De acuerdo con el principio de la relatividad (1.10), la Situaci´ on 1 y la Situaci´ on 2 son equivalentes. Entonces a22 L = L/a22 , de donde a22 = 1. Un an´alisis parecido nos permitir´a concluir que a33 = 1. Ya hemos averiguado los ocho coeficientes de las ecuaciones (1.19) y (1.20), ecuaciones que ahora se escriben: y0 = y ,

z0 = z

(1.21)

Nos falta estudiar las ecuaciones (1.17) y (1.18). Comencemos considerando dos eventos (t, x, y, z) y (t, x, −y, z). Por la homogeneidad del espacio, ambos eventos deben tener la misma coordenada temporal t0 . En vista de (1.17) concluimos que a02 = 0. Un an´alisis parecido nos conduce a que a03 = 0. Hasta el momento la ecuaci´on (1.17) se ha convertido en t0 = a00 t + a01 x

(1.22)

Pensemos en los eventos del plano x = 0; de acuerdo con la ecuaci´on (1.22), los eventos de este plano cumplen la ecuaci´on t0 = a00 t. Para estos eventos la condici´on t > 0 debe implicar que t0 > 0, o sea que a00 debe ser positiva: 22

a00 > 0

(1.23)

Sean (T, X, Y, Z) las coordenadas no primadas de un evento cualquiera en el plano x0 = 0. Haciendo x0 = 0 en (1.18) escribimos: a10 T + a11 X + a12 Y + a13 Z = 0

(1.24)

Si hacemos T = X = 0 en (1.24) se obtiene a12 Y + a13 Z = 0 Como esta u ´ltima ecuaci´on debe cumplirse para todos los (arbitrarios) valores de Y y de Z, entonces a12 = a13 = 0. Con este resultado regresamos a (1.24) para escribir a10 T + a11 X = 0

(1.25)

No olvidemos que (T, X, Y, Z) pertenece al plano x0 = 0, cuyos puntos cumplen la condici´on X = vT ; claramente la ecuaci´on (1.25) dice que a10 T + a11 v T = 0, de donde a10 = −va11 . Hasta el momento la ecuaci´on (1.18) se ha convertido en x0 = a11 (x − vt)

(1.26)

Demostraremos enseguida que a11 debe ser positiva. Para tal efecto consideremos aquellos eventos que est´an a la derecha del origen de O0 ; esos eventos cumplen las condiciones x0 > 0 y x > vt. En otras palabras, x > vt ⇒ x0 > 0. Al poner esto en (1.26) encontramos: a11 > 0 Hagamos un resumen de lo que hemos averiguado hasta el momento: 23

(1.27)

t0 = a00 t + a01 x x0 = a11 (x − vt) y0 = y

(1.28)

z0 = z Hasta aqu´ı se llega usando los principios de la relatividad y de la homogeneidad del espacio y del tiempo. Pero todav´ıa hay tres coeficientes desconocidos a00 , a01 , a11 , o sea que (1.28) no es una transformaci´on particular, sino una familia de transformaciones. Para individualizar una transformaci´on particular es necesario dar los valores de a00 , a01 y a11 , lo que se logra imponiendo alguna condici´on suplementaria. Por ejemplo, la transformaci´on de Galileo (1.7) pertenece a la familia de transformaciones (1.28). Para obtener Galileo a partir de (1.28) se impone la condici´on suplementaria a01 = 0, a00 = a11 = 1. La transformaci´on de Lorentz tambi´en pertenece a la familia de transformaciones (1.28). Einstein obtiene la transformaci´on de Lorentz usando, como condici´on suplementaria, el principio de la constancia de la velocidad de la luz. En efecto, tal como veremos enseguida, al implementar este principio quedan un´ıvocamente determinados los tres coeficientes a00 , a11 , a01 . Supongamos que un pulso de luz sale del origen de coordenadas cuando los or´ıgenes de O y O0 coinciden. Un tiempo despu´es, este pulso llega a un evento E. Las coordenadas no primadas de E son (t, x, y,pz), y las primadas 2 2 2 son (t0 , x0 , y 0 , z 0 ). Para O la velocidad del p pulso es c = x + y + z /t, y 2 2 2 para O0 la velocidad del pulso es c0 = x0 + y 0 + z 0 /t0 . Pero c0 = c, por el principio de la constancia de la velocidad de la luz: c = c =

p x2 + y 2 + z 2 t p 2 0 x + y02 + z02 t0

Estas dos ecuaciones pueden escribirse as´ı: c2 t2 − (x2 + y 2 + z 2 ) = 0 2

2

2

2

c2 t0 − (x0 + y 0 + z 0 ) = 0 24

(1.29) (1.30)

Usar ahora las cuatro ecuaciones (1.28) en (1.30) para que (1.30) quede en t´erminos de cantidades no primadas: (c2 a200 − v 2 a211 )t2 − (a211 − c2 a201 )x2 − y 2 − z 2

(1.31)

+ 2 (c2 a00 a01 + va211 ) xt = 0

Vamos a comparar, t´ermino a t´ermino, las ecuaciones (1.29) y (1.31); igualando los coeficientes correspondientes se llega a: c2 a200 − v 2 a211 = c2 a211 − c2 a201 = 1 c2 a00 a01 + va211 = 0 Este es un sistema de tres ecuaciones para las tres inc´ognitas a00 , a01 , a211 . Hay dos soluciones: Primera soluci´ on: a211 =

1 , 1 − v 2 /c2

v/c2 a01 = p , 1 − v 2 /c2

1

a00 = − p

1 − v 2 /c2

Segunda soluci´ on: a211 =

1 , 1 − v 2 /c2

v/c2

a01 = − p

1−

v 2 /c2

,

1

a00 = p

1 − v 2 /c2

En vista de (1.23), la primera soluci´ on est´a descartada. Adoptamos entonces la segunda soluci´ on, utilizando (1.27) al tomar la ra´ız cuadrada de a211 : 1

a11 = a00 = p

1 − v / c2

,

v/c2

a01 = − p

1 − v / c2

p He aqu´ı el factor 1/ 1 − v 2 /c2 , que aparece innumerables veces en la relatividad. Tradicionalmente se le conoce como γ: 25

γ = p

1 1 − v 2 /c2

(1.32)

Los tres coeficientes son, entonces, a11 = a00 = γ, a01 = −γv/c2 y el resultado final de las transformaciones queda: v x) c2 x0 = γ (x − vt) t0 = γ (t −

y0 = y ,

(1.33)

z0 = z

Estas son las transformaciones de Lorentz. Las hemos presentado como una consecuencia directa de los tres postulados de la relatividad, y en este sentido ellas son del ´ambito de la f´ısica te´orica. Lo importante es que ellas tambi´en son del ´ambito de la f´ısica experimental: innumerables experimentos realizados durante el siglo XX han confirmado, una y otra vez, y sin ninguna excepci´on, que las transformaciones de Lorentz son buenas. Anotemos que las transformaciones de Lorentz se confunden con las de Galileo a bajas velocidades. En efecto, las ecuaciones (1.33) se convierten en (1.7) cuando v ¿ c. Esta observaci´ on deja en claro que la relatividad especial abarca al pensamiento newtoniano, y que este u ´ltimo es un caso l´ımite del pensamiento relativista. El espaciotiempo relativista es diferente del newtoniano para todos los valores de v, pero la diferencia es notoria u ´nicamente a altas velocidades. Si queremos expresar las coordenadas no primadas en t´erminos de las primadas, podemos resolver estas cuatro ecuaciones simult´ aneas y despejar t, x, y, z. Pero hay otra manera m´as simple, que consiste en lo siguiente: en cada una de las cuatro ecuaciones se cambia v por −v y se intercambian coordenadas primadas y no primadas: v 0 x) c2 x = γ (x0 + vt0 ) t = γ (t0 +

y = y0 ,

(1.34)

z = z0

Generalizaci´ on. Hemos asumido que O0 se mueve, respecto a O, con una velocidad v que apunta en la direcci´on del eje com´ un x x0 . Enseguida escribimos el caso [7] general, cuando v apunta en cualquier direcci´on: 26

1 t0 = γ(t − 2 v · r) µc ¶ γ−1 0 r =r+ v · r − γt v v2

(1.35)

1 t = γ(t0 + 2 v · r0 ) ¶ µc γ−1 0 0 0 v · r + γt v r=r + v2

(1.36)

Los diferenciales. En diferenciales, las dos primeras ecuaciones (1.33) son: v ∆x) c2 = γ(∆x − v∆t)

∆t0 = γ(∆t −

(1.37)

∆x0

(1.38)

Y las inversas proceden de (1.34): v ∆x0 ) c2 ∆x = γ(∆x0 + v∆t0 ) ∆t = γ(∆t0 +

(1.39) (1.40)

Tambi´en podemos escribir las ecuaciones (1.35) en diferenciales: 1 ∆t0 = γ(∆t − 2 v · ∆r) µc ¶ γ−1 0 ∆r = ∆r + v · ∆r − γ∆t v v2

(1.41) (1.42)

Las derivadas: A partir de las transformaciones (1.33) calculamos estas seis derivadas: ∂t0 ∂x0 = = γ, ∂t ∂x ∂x0 = −γv, ∂t

∂t0 γv =− 2, ∂x c 0 ∂y ∂z 0 = =1 ∂y ∂z

Ahora, la regla de la derivaci´on en cadena dice que 27

(1.43)

∂ ∂t0 ∂ ∂x0 ∂ ∂y 0 ∂ ∂z 0 ∂ = + + + , 0 0 0 ∂t ∂t ∂t ∂t ∂x ∂t ∂y ∂t ∂z 0 entonces, utilizando las derivadas (1.43): ∂ ∂ ∂ = γ 0 − γv 0 , ∂t ∂t ∂x que escribimos cortamente ∂t = γ ∂t0 − γv ∂x0 . De la misma manera se calculan ∂x , ∂y , y ∂z : ∂t = γ ∂t0 − γv ∂x0 γv ∂x = γ ∂x0 − 2 ∂t0 c ∂y = ∂y0 ∂z = ∂z 0

c

c'

Luz

q'

q

(1.44)

a v

Figura 1.1 Las velocidades c, v y c 0 tales que c = v + c 0

Figura 1.2 Interfer´ ometro de Michelson. En P la luz se reparte hacia A y B. Despu´es de reflejarse en los espejos, los haces se encuentran de nuevo en P y de all´ı salen juntos hacia el detector.

28

y x

y'

z x' z'

Figura 1.3 Definici´on de los sistemas coordenados. Los ejes x y x0 coinciden, los ejes y y y 0 son paralelos y los ejes z y z 0 tambi´en son paralelos. La velocidad de separaci´on v apunta en direcci´ on x.

29

30

Cap´ıtulo 2

Propiedades del espaciotiempo En este cap´ıtulo nos proponemos estudiar las consecuencias m´as directas de las transformaciones de Lorentz. La m´as importante se refiere a dos eventos que son simult´aneos para un observador: para otros observadores, en general, esos dos eventos no son simult´ aneos. Directamente conectado con esto aparece otro efecto curioso: la longitud de un objeto cualquiera depende, en general, del estado de movimiento del observador que la registra. Las implicaciones de estos dos resultados son inmediatas. Surge un conjunto de definiciones y efectos de primera importancia: el tiempo propio, la longitud propia, el modo como se adicionan velocidades y como se adicionan aceleraciones. Estos asuntos est´an cobijados por la idea central de la relatividad, la gran idea que revolucion´o el pensamiento cient´ıfico: el espacio y el tiempo no son independientes uno del otro, sino que forman un todo espaciotemporal. Consideremos dos eventos E1 y E2 . El observador O registra que estos dos eventos tienen coordenadas (t, r) y (t + ∆t, r + ∆r), respectivamente. Para O0 las coordenadas1 de E1 y E2 son (t0 , r0 ) y (t0 + ∆t0 , r0 + ∆r0 ). La conexi´on entre ∆t, ∆r, ∆t0 y ∆r0 est´a dada por las f´ormulas (1.41) y (1.42). Supongamos que para O la separaci´on entre los dos eventos es puramente espacial, es decir, ∆t = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos eventos tienen separaciones espacial y temporal. As´ı mismo, supongamos que para O la separaci´on entre los dos eventos es puramente temporal, es decir, ∆r = 0; las ecuaciones (1.41) y (1.42) muestran que para O0 los dos eventos tienen separaciones espacial y temporal. Vemos as´ı que el espacio y el tiempo no son independientes uno del otro. Cada observador inercial puede establecer un corte, un lindero, entre su espacio y su tiempo, pero el 1 Estamos mencionando cuatro relojes: los dos relojes de O marcan t y t + ∆t, y los dos relojes de O0 marcan t0 y t0 + ∆t0 .

31

lindero que establece O es diferente al que establece O0 .

2.1

Las separaciones espacial y temporal son relativas

Las ecuaciones (1.41) y (1.42) muestran que, en general, ∆t0 6= ∆t; por esto decimos que la separaci´on temporal entre dos eventos es relativa. As´ı mismo, en general ∆r0 6= ∆r: la separaci´on espacial tambi´en es relativa. El adjetivo relativo se aplica a cualquier cantidad que, registrada por diferentes observadores, da resultados diferentes. Tambi´en decimos que una cantidad es absoluta cuando, al registrarla diferentes observadores, todos obtienen el mismo resultado. Acabamos de probar que en la relatividad especial las separaciones espacial y temporal no son absolutas, sino relativas. Comparando, las transformaciones de Galileo (1.7) dan t02 − t01 = t2 − t1 y x02 −x01 6= x2 −x1 . En palabras: en Galileo la separaci´on temporal es absoluta y la separaci´on espacial es relativa.

2.2

El intervalo es absoluto

A pesar de que las separaciones espacial y temporal son relativas, hay una funci´on de ∆t y ∆r que resulta absoluta. Definamos: ∆s2 = c2 (∆t)2 − (∆r)2 ∆s0

2

(2.1)

= c2 (∆t0 )2 − (∆r0 )2

En palabras: el cuadrado de la separaci´on temporal menos el cuadrado de la separaci´on espacial. Enseguida probaremos que ∆s02 = ∆s2 . Para tal efecto se eleva al cuadrado cada uno de los lados en las ecuaciones (1.41) y (1.42), obteni´endose: c2 (∆t0 )2 = γ 2 c2 (∆t)2 + −(∆r0 )2 = −(∆r)2 −

γ2 (v · ∆r)2 − 2γ 2 ∆t(v · ∆r) c2

γ2 (v · ∆r)2 + 2γ 2 ∆t(v · ∆r) − γ 2 v 2 (∆t)2 c2

Ahora sumar lado a lado estas dos ecuaciones: 32

c2 (∆t0 )2 − (∆r0 )2 = c2 (∆t)2 − (∆r)2

(2.2)

∆s02 = ∆s2

(2.3)

Es decir,

A ∆s2 se le llama intervalo. El intervalo es la separaci´on espaciotemporal. La separaci´on espacial es relativa; la separaci´on temporal es relativa; la separaci´on espaciotemporal es absoluta. En las geometr´ıas euclidianas la definici´on de distancia involucra u ´nicamente signos +. Esto tiene una consecuencia importante: la distancia entre dos puntos diferentes es siempre positiva; o sea que que si la distancia entre dos puntos es cero es porque se trata, no de dos puntos, sino del mismo punto. La geometr´ıa del espaciotiempo no es euclidiana, porque el intervalo tiene un signo − que es crucial. En el espaciotiempo la cantidad ∆s2 puede ser positiva, negativa o cero; el intervalo entre dos eventos diferentes puede ser cero.

2.3

Clases de intervalos

Cuando ∆s2 es positivo, cero o negativo, el intervalo es temporaloide, luminoide o espacialoide, respectivamente. Vamos a estudiar por separado cada uno de estos casos. Intervalos temporaloides. Para que ∆s2 sea positivo debe cumplirse la siguiente desigualdad: c|∆t| > |∆r|

(2.4)

Este intervalo tiene dos propiedades interesantes: a) Un observador inercial que recorra el espacio ∆r en el lapso ∆t, debe registrar que los dos eventos ocurren en el mismo punto del triespacio. Escribamos la velocidad de este observador inercial: v = 33

∆r ∆t

(2.5)

Para verificar que esto es cierto, notemos que al colocar el valor v = ∆r/∆t en (1.42) se obtiene ∆r0 = 0. b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son simult´aneos? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condici´on ∆t0 = 0 en (1.41) se obtiene v·

∆r = c2 ∆t

(2.6)

Sin embargo, la combinaci´ on de (2.4) y (2.6) implica que v tendr´ıa que ser mayor que c, lo que es imposible (ver la frase en bastardilla en la p´agina 17). En conclusi´on: si dos eventos tienen intervalo temporaloide, ning´ un observador registra que son simult´ aneos. Intervalos espacialoides. Para que ∆s2 sea negativo debe cumplirse la siguiente desigualdad: |∆r| > c|∆t|

(2.7)

Este intervalo tiene dos propiedades interesantes: a) Los observadores inerciales que cumplen la condici´on v·

∆r = c2 ∆t

registran que los dos eventos son simult´ aneos. Podemos convencernos de que esto es cierto de la manera siguiente: al poner v · (∆r/∆t) = c2 en (1.41) se obtiene ∆t0 = 0. b) ¿Existe acaso un observador inercial O0 para el cual los dos eventos ocurren en el mismo punto r0 ? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condici´on ∆r0 = 0 en (1.42) se obtiene µ ∆r +

¶ γ−1 v · ∆r − γ∆t v = 0 v2 34

∆r = − ∆t

µ

¶ γ−1 ∆r v · − γ v v2 ∆t

(2.8)

Multiplicar escalarmente ambos lados de esta ecuaci´on por el vector v : ∆r v· ∆t

µ ¶ ∆r 2 = − (γ − 1) v · − γv ∆t

0 = −v ·

∆r + v2 ∆t

(2.9)

El lado izquierdo de la ecuaci´on (2.8) es un vector en direcci´on ∆r/∆t y el lado derecho es un vector en direcci´on v ; para que la ecuaci´on sea v´alida es necesario que esos dos vectores sean paralelos o antiparalelos, o sea que v · ∆r/∆t = ±|v||∆r/∆t|. Al poner este valor en la ecuaci´on (2.9) se obtiene |v| = ± |∆r/∆t|. El signo − es inadmisible, porque permitir´ıa que una cantidad positiva fuera igual a una negativa. Escogemos el signo +: ¯ ¯ ¯ ∆r ¯ ¯ ¯ |v| = ¯ ∆t ¯

(2.10)

El problema es que la combinaci´ on de (2.7) y (2.10) implica que |v| tendr´ıa que ser mayor que c, lo que es imposible (de nuevo, la frase escrita en bastardilla en la p´agina 17). En conclusi´on: si dos eventos tienen intervalo espacialoide, ning´ un observador registra que ocurren en el mismo punto del triespacio. Intervalos luminoides. El intervalo entre dos eventos es cero si c|∆t| = |∆r|

(2.11)

Hay dos preguntas interesantes: a) ¿Existe acaso un observador inercial O0 para el cual los dos eventos son simult´aneos? Respondamos esta pregunta averiguando la velocidad v que deber´ıa tener O0 . Al imponer la condici´on ∆t0 = 0 en (1.41) se obtiene (2.6). Sin embargo, la combinaci´on de (2.6) y (2.11) implica que v tendr´ıa que mayor que c, lo que es imposible. 35

b) ¿Existe un observador inercial O0 para el cual los dos eventos ocurren en el mismo punto r0 ? Al imponer la condici´on ∆r0 = 0 en (1.42) se obtiene la ecuaci´on (2.10). El problema es que la combinaci´ on de (2.10) y (2.11) implica que v tendr´ıa que ser igual c, lo que es imposible. En conclusi´on, cuando el intervalo entre dos eventos es luminoide, ning´ un observador registra que son simult´ aneos y ning´ un observador registra que ocurren en el mismo punto del triespacio.

2.4

La simultaneidad es relativa

Consideremos dos eventos que aparecen simult´ aneos para el observador O. Haciendo ∆t = 0 en (1.41) encontramos ∆t0 = −

γ v · ∆r c2

(2.12)

Si v · ∆r 6= 0, entonces ∆t0 6= 0, lo que constituye una propiedad de primera importancia: dos eventos que aparecen simult´ aneos para O pueden aparecer simult´aneos o no simult´ aneos para O0 , dependiendo de la direcci´on de la velocidad v . Aparecen simult´ aneos para todos los observadores O0 que tengan v perpendicular a ∆r, y aparecen no simult´ aneos a todos los O0 cuya v no sea perpendicular a ∆r. Vemos as´ı que la simultaneidad no es absoluta, sino relativa. Desincronizaci´ on de relojes. Tambi´en se puede entender la f´ormula (2.12) en t´erminos de desincronizaci´on de relojes, vali´endonos de la nota escrita al pie de la p´agina 31. Los dos relojes de O est´an marcando la misma hora; por ejemplo t = 3:29 a.m. Pero los dos relojes de O0 est´ an marcando horas diferentes; por ejemplo, el reloj primado en el primer evento marca t01 = 3:27 a.m., y el reloj primado en el segundo evento marca t02 = 3:31 a.m. El observador O dice que todos sus relojes (los no primados) est´an de acuerdo, es decir, est´an sincronizados; el observador O0 tambi´en dice que todos sus relojes (los primados) est´an sincronizados. Pero O registra que los relojes de O0 est´an desincronizados, y O0 registra que los relojes de O est´an desincronizados. 36

2.5

Tiempo propio

Al estudiar los intervalos temporaloides vimos que la separaci´on espacial aparece nula para aquel observador O0 que tiene una velocidad dada por (2.5). Veamos ahora cu´al es la separaci´on temporal ∆t0 que registra ese observador O0 . Utilizando el resultado (2.5) en (1.41) se obtiene ∆t0 = 1 γ(∆t − 2 v · v ∆t) = γ(1 − v 2 /c2 )∆t. Este ∆t0 se llama tiempo propio y c se denota por medio del s´ımbolo ∆τ. En conclusi´on: ∆r0 = 0 ∆τ

(2.13)

= ∆t

p 1 − v 2 /c2

< ∆t

(2.14) (2.15)

La ecuaci´on (2.2) se reescribe as´ı: c2 ∆τ 2 = c2 (∆t)2 − (∆r)2 + (∆r0 )2 En el lado derecho tenemos ∆r0 = 0 y (∆r)2 > 0, y esto implica necesariamente que ∆τ 2 < ∆t2 : el tiempo propio es el menor de los tiempos. Las f´ormulas (2.13), (2.14) y (2.15), que son de primera importancia, dan pie a las siguientes dos observaciones: 1) El tiempo propio τ es un concepto que se aplica u ´nicamente a intervalos temporaloides. Dado un intervalo temporaloide, existe un observador que registra que los dos eventos ocurren en el mismo tripunto y con una separaci´on temporal ∆τ. Otros observadores registran, en general, que los dos eventos ocurren en lugares diferentes y con una separaci´on temporal mayor que ∆τ : el tiempo propio es el menor de los tiempos. 2) Regresemos a la nota al pie de la p´agina 31. En general se trata de cuatro relojes, pero el caso del tiempo propio es especial, ya que O0 usa solamente un reloj. Es claro que para el observador primado los dos eventos ocurren en un punto fijo del triespacio, y los dos tiempos t0 y t0 + ∆t0 los registra aquel reloj primado que ocupa el tripunto. Llegamos as´ı a una clave que puede ser u ´til en momentos de confusi´on: el tiempo propio τ lo mide un solo reloj. 37

Medici´ on de τ . Supongamos que los relojes se construyen con dos espejos paralelos separados una distancia δ, y un pulso de luz que se refleja una y otra vez en los espejos, como muestra la Figura 2.1. En cada tripunto de O0 se encuentra, fijo, un reloj de estos. De acuerdo con O0 , el tiempo que el pulso de luz tarda en regresar a uno de los espejos es ∆t0 =

2δ c

Suponemos que este reloj tiene sus espejos paralelos al plano z 0 x0 . Para O el viaje del pulso de luz es como en punteada de la Figura 2.2; el qla l´ınea ¡1 ¢2 recorrido total es dos hipotenusas: 2 δ 2 + 2 v∆t , o sea que ∆t viene dado por: q ¡ ¢2 2 δ 2 + 12 v∆t ∆t = c Despejar (∆t)2 para obtener µ

(∆t)2 =

∆t =

¶ 2δ 2 c 1 − v 2 /c2 ∆t0 p 1 − v 2 /c2

Los dos eventos (salida y regreso del pulso) se registran de manera diferente por los dos observadores. Para O los dos eventos ocurren en puntos diferentes, o sea que los registran relojes diferentes. Para O0 los dos eventos ocurren en el mismo punto, o sea que los registra el mismo reloj: tiempo propio. Part´ıcula libre. Veremos en la secci´on 3.5 que las part´ıculas masivas tienen velocidades inferiores a c; por eso los eventos de sus trayectorias tienen intervalos temporaloides y, en consecuencia, se les aplica el concepto de tiempo propio τ. ¿C´omo se mide el τ de estos intervalos? Para responder esta pregunta supongamos el m´as simple de los casos, que es el de una part´ıcula masiva libre. Pensamos en un reloj atado a la part´ıcula, que la 38

acompa˜ na en todo instante: el tiempo que marca este reloj es τ. Obs´ervese que este tiempo propio lo mide un s´olo reloj. Hay un sistema coordenado inercial para el cual la part´ıcula est´a siempre en reposo; en estas coordenadas el intervalo entre dos puntos de la trayectoria es puro tiempo, y es c2 τ 2 . Llegamos as´ı a una f´ormula de gran utilidad en el estudio de las trayectorias de las part´ıculas libres: ds2 = c2 dτ 2 ,

(2.16)

siendo τ el tiempo que marca un reloj que acompa˜ na a la part´ıcula2 . Para un observador que acompa˜ na a una part´ıcula masiva, τ es un par´ametro que sirve para caracterizar los eventos de la trayectoria. Pero otros observadores que no acompa˜ nan a la part´ıcula tambi´en pueden utilizar a τ para caracterizar los puntos de la trayectoria de la part´ıcula, de la manera siguiente. Sean (T, X, Y, Z) las coordenadas de los eventos de la trayectoria de una part´ıcula libre, seg´ un los registra un observador inercial cualquiera. La idea es que cada una de las cuatro coordenadas (T, X, Y, Z) se puede considerar como funci´on de τ (que, como hemos dicho, es el tiempo que marca un reloj atado a la part´ıcula). Escribimos entonces T = T (τ ), X = X(τ ), Y = Y (τ ) y Z = Z(τ ). Supongamos que, cuando τ = 23, la part´ıcula ocup´o el evento (5, 6, 7, 8). Decimos entonces que T (23) = 5, X(23) = 6, Y (23) = 7 y Z(23) = 8. El fot´on viaja con velocidad c, y por esta raz´on los eventos de su trayectoria tienen intervalos luminoides, para los cuales no se aplica el concepto de tiempo propio: el concepto de tiempo propio no se aplica a part´ıculas de masa cero. Tiempo de vida media. Un electr´on solo y aislado sigue siendo electr´on indefinidamente, y por esto decimos que es estable. Otro ejemplo de part´ıcula estable es el prot´on. Pero la estabilidad es una propiedad escasa, ya que casi todas las part´ıculas tienden a desintegrarse. El tiempo de vida media se define como el tiempo que tarda una poblaci´on de part´ıculas id´enticas en reducirse a la mitad3 . Nos interesa en este momento resaltar que el enunciado “tiempo que tarda...” es ambiguo, porque es relativo. Deber´ıa definirse el 2

Esta f´ ormula, que hemos encontrado para part´ıcula libre, es tambi´en v´ alida cuando la part´ıcula no es libre, como veremos en la ecuaci´ on (8.1). 3 En verdad, y debido a la incertidumbre esencial que asiste al proceso cu´ antico de la desintegraci´ on, deber´ıamos decir “aproximadamente la mitad”.

39

tiempo de vida media en t´erminos absolutos, no relativos. Se ha convenido en que “el tiempo que tarda una poblaci´on en reducirse a la mitad, aproximadamente” significa lo siguiente: el que registra un observador en reposo respecto a las part´ıculas. Veamos por ejemplo los piones no neutros, que el 99.98770 % de las veces se desintegran as´ı: π + → µ+ νµ π − → µ− ν¯µ τ

=

con

2.6 × 10−8 s :

Vida media

El significado de τ, desde un punto de vista experimental es el siguiente. Supongamos un conjunto de 700 piones que se encuentran en reposo respecto a un observador O0 ; cuando en los relojes de este observador hayan transcurrido 2.6 × 10−8 segundos, la poblaci´on de piones ser´a 350 aproximadamente. Supongamos ahora que este grupo de piones tiene una velocidad de 0.99c respecto al laboratorio, y nos preguntamos: seg´ un el reloj del laboratorio, ¿cu´anto tiempo t (el que marca un reloj del laboratorio) se demora la poblaci´on de piones para pasar de 700 a 350? Para responder esta pregunta utilizamos la ecuaci´on (2.14): 2.6 × 10−8 s = √ = 18.43 × 10−8 s 2 2 2 1 − 0.99 1 − v /c

t = p

τ

El trayecto recorrido por los piones antes de desintegrarse es vt: v t = 0.99 ct = 54.74 m :

Relatividad

Si, en vez de usar las transformaciones de Lorentz, se usan las de Galileo, el resultado es bien diferente. De acuerdo con las ecuaciones (1.7), las cantidades ∆t y ∆t0 ser´ıan iguales, y el trayecto recorrido por los piones antes de desintegrarse ser´ıa v ∆t0 = 7.72 m :

Galileo,

muy diferente a 54.74 m. En el laboratorio el experimento da 54.74 m y no 7.72 m: la relatividad especial confirmada. 40

2.6

Longitud propia

Para medir fotogr´aficamente la longitud de un avi´ on volando se debe tener en cuenta que el diafragma de la c´amara fotogr´afica se abra por muy poco tiempo; porque si se abre durante mucho tiempo, la fotograf´ıa queda corrida o borrosa, y no sirve: en general, para medir la longitud de un objeto se deben registrar los dos extremos simult´ aneamente. En el caso especial en que el avi´on est´a en reposo, los registros de los dos extremos no tienen que ser simult´aneos. Supongamos pues que el avi´ on est´a en reposo en O0 , y llamemos L0 = |∆r0 | a su longitud para O0 . Esta L0 recibe el nombre de longitud propia. La ecuaci´on (2.2) se escribe: c2 (∆t0 )2 − L20 = c2 (∆t)2 − (∆r)2

(2.17)

Ahora utilizar la ecuaci´on (1.41): µ ¶2 1 c γ ∆t − 2 v · ∆r − L20 = c2 (∆t)2 − (∆r)2 c 2 2

Queremos que |∆r| sea L, la longitud del avi´ on seg´ un la registra O. Tal como acabamos de explicar, para medir esta L se deben registrar los dos extremos en el mismo valor de t, es decir, ∆t = 0. Entonces: µ 2 2

c γ

¶2 1 v · L − L20 = −L2 c2

O sea que L20 = L2 +

γ2 (v · L)2 2 c

(2.18)

Esta f´ormula sirve en general, cualquiera que sea el ´angulo formado por el avi´on L y la velocidad de separaci´on v . La estudiaremos en dos casos: cuando L y v son perpendiculares, y cuando L y v son paralelos. Si son perpendiculares, se cumple la ecuaci´on v · L = 0 y en consecuencia L = L0 : las longitudes perpendiculares a v no sufren ning´ un cambio. De otro lado, si L y v son paralelos, la f´ormula (2.18) da 41

p L0 = L/ 1 − v 2 /c2 > L

(2.19) (2.20)

La ecuaci´on (2.17) se reescribe as´ı: L20 = (∆r)2 − c2 (∆t)2 + c2 (∆t0 )2 No olvidemos que ∆t = 0 y (∆t0 )2 > 0, lo que implica necesariamente que L20 > (∆r)2 : la longitud propia es la mayor de las longitudes. Volumen propio. Dado que las longitudes perpendiculares a vq no sufren cambios, y que las longitudes paralelas a v se afectan por un factor 1 − v 2 /c2 , la forma de los objetos tridimensionales depende del estado de movimiento del observador que los registra: la forma es relativa. Presentemos un ejemplo de esta deformaci´on, suponiendo que en O0 hay, en reposo, un cubo con sus aristas paralelas a los ejes x0 , y 0 y z 0 , respectivamente. Llamemos L0 a la longitud de las aristas, seg´ un O0 . Nos preguntamos en seguida de qu´e manera registra O a este cuerpo; claramente, las aristas paralelas a los ejes y y z son de longitud q L0 , pero las aristas paralelas al eje x tienen una longitud

contra´ıda L0 1 − v 2 /c2 . Vemos as´ı que para O no se trata de un cubo, sino de un paralelep´ q ıpedo recto rectangular -i.e.: un “cubo achatado”- de aristas L0 , L0 , L0

1 − v 2 /c2 .

Esto repercute en q el volumen, ya que mientras el volumen es L30 para O0 , el volumen es L30 1 − v 2 /c2 para O. Ahora supongamos un cuerpo de cualquier forma; es claro que O0 lo puede considerar como la yuxtaposici´on de muchos cubitos, y cada uno de estos cubitos aparece deformado para O. Lo importante es que q todos los cubitos se ven afectados por el mismo factor de deformaci´on vol´ umenes es

1 − v 2 /c2 , y en consecuencia la relaci´on entre los V = V0

q 1 − u2 /c2 ,

(2.21)

donde V0 = L30 . En esta ecuaci´on estamos hablando de cualquier cuerpo tridimensional que tiene velocidad u respecto a O. La cantidad V0 es el volumen propio, es decir, el que registra un observador para el cual el cuerpo est´a en reposo. 42

Densidad propia. Consideremos una nube de part´ıculas. El observador O registra que en un punto r y en un instante t la velocidad de la nube es u. Pensemos en un peque˜ no volumen V alrededor de r, que en el instante t tiene la misma velocidad u: claramente este volumen V est´ a acompa˜ nando a las part´ıculas. Si dentro de V hay n part´ıculas, entonces la densidad de part´ıculas por unidad de volumen es n/V. Y si cada part´ıcula tiene una carga el´ectrica q, entonces para el observador O la densidad de carga por unidad de volumen es ρ(r, t) =

nq V

(2.22)

Seguidamente estudiaremos lo que registra otro observador inercial O0 que, en el instante t, tiene velocidad u: es claro que para este observador el volumen mencionado en el p´arrafo anterior est´a en reposo, y en vez de ser V, es V0 , de acuerdo con la ecuaci´on (2.21). El volumen V0 tambi´en contiene n part´ıculas de carga q, o sea que para el nuevo observador4 la densidad de carga por unidad de volumen es:

ρ0 (r, t) =

nq V0

(2.23)

La cantidad ρ0 recibe el nombre de densidad propia de carga por unidad de volumen. En vista de la ecuaci´on (2.21):

ρ =

=

ρ0 q 1 − u2 /c2

(2.24)

nq q V0 1 − u2 /c2

(2.25)

La ecuaci´on (2.24) dice que ρ0 < ρ: la densidad propia es la menor de las densidades. 4

La carga el´ectrica q es la misma para todos los observadores inerciales. En efecto, se han realizado suficientes pruebas experimentales que muestran confiablemente [8] que q no depende de la velocidad de la part´ıcula: la carga el´ectrica es invariante bajo las transformaciones de la relatividad especial.

43

2.7

Comparaci´ on de longitud propia y tiempo propio

Hemos dicho que el concepto de tiempo propio s´olo se aplica a intervalos temporaloides. De la misma manera, el concepto de longitud propia s´olo se aplica a intervalos espacialoides. Vemos as´ı que estos dos conceptos son esencialmente diferentes y nunca se aplican al mismo intervalo. Hay sin embargo cierto parecido formal entre ellos, como veremos en seguida. La ecuaci´on fundamental es la invariancia del intervalo (2.2): +c2 (∆t0 )2 − (∆r0 )2 = +c2 (∆t)2 − (∆r)2

(2.26)

Los signos + y − en esta ecuaci´on son cruciales: el tiempo propio ∆t0 es el menor de los tiempos, porque resulta de hacer ∆r0 = 0 en esta ecuaci´on; as´ı mismo, la longitud propia |∆r0 | es la mayor de las longitudes, porque resulta de hacer ∆t = 0 en (2.26). En otras palabras: ∆t > ∆τ porque O registra los dos eventos en tripuntos diferentes; as´ı mismo, L0 > L porque O0 registra los dos eventos en instantes diferentes.

2.8

Un caso de simultaneidad

La dilataci´on del tiempo, la contracci´ on de la longitud y la relatividad de la simultaneidad son los efectos m´as dram´aticos de la relatividad. En las dos u ´ltimas secciones vimos c´omo se miden el tiempo propio y la longitud propia, y es justo dedicarle tambi´en a la simultaneidad un ejemplo y una discusi´on. Sean A y B dos puntos en reposo5 en el sistema O0 , como en la Figura 2.3. En el punto medio se emite un pulso de luz. Para O0 , las dos se˜ nales llegan a A y B en los instantes t0A y t0B , respectivamente. Pensemos en otro observador O que se desplaza con una velocidad v respecto a O0 , y la direcci´on de esta velocidad es hacia la izquierda. O registra que las dos se˜ nales luminosas llegan a A y B en los instantes tA y tB , respectivamente. La f´ormula (1.39) da

tB − tA 5

v (t0B − t0A ) + 2 (x0B − x0A ) c p = 1 − v 2 /c2

A y B no son eventos, sino puntos en el espacio tridimensional.

44

Ahora, es claro que t0B = t0A , o sea que

tB − tA

v 0 (xB − x0A ) 2 c = p 6= 0 1 − v 2 /c2

Vemos as´ı que la llegada de las dos se˜ nales a A y B es registrada de manera muy diferente por los dos observadores ya que, mientras O0 afirma que son simult´aneas, para O no son simult´ aneas. Este an´alisis relativista puede parecer, como todo en la relatividad, un poco complejo. Pero debemos admitir que tiene un elemento muy simple: no hemos tenido necesidad de aclarar si la fuente de luz se est´a moviendo o no, respecto a ninguno de los dos observadores. Hemos utilizado el principio de la constancia de la velocidad de la luz (1.10), que afirma que la velocidad de la luz es independiente del estado de movimiento de la fuente de luz. La simplicidad del an´alisis relativista est´a ausente en el an´alisis prerrelativista; en efecto, en el prerrelativista es necesario decir c´omo se mueve la fuente de luz, o de lo contrario faltan datos para resolver el problema.

2.9

La adici´ on de velocidades

Consideremos un punto m´ovil, que tiene velocidad u respecto a O, y tiene velocidad u0 respecto a O0 . De acuerdo con la f´ısica galileana (1.7) se tiene: u = u0 + v

(2.27)

Veremos enseguida que en relatividad especial la regla de adici´on de velociv dades no es tan simple como (2.27). La ecuaci´on (1.39) es dt = γ(dt0 + 2 dx0 ); c en el lado derecho se saca dt0 como factor com´ un, para obtener µ ¶ vu0x dt = γ 1 + 2 dt0 c 1 dt

=

1 γ −1 0 vu dt0 1 + 2x c 45

(2.28)

Repitamos el proceso µ 0 para¶la coordenada x. La ecuaci´on (1.40) es dx = dx 0 0 γ(dx + vdt ) = γ + v dt0 : dt0 dx = γ(u0x + v)dt0

(2.29)

Ahora multiplicar lado a lado las ecuaciones (2.28) y (2.29) para obtener

ux =

u0x + v vu0 1 + 2x c

(2.30)

Observaciones: 1. Notemos que u0x = c ⇒ ux = c: un punto matem´atico que tenga velocidad c para O0 , tambi´en tendr´a velocidad c para todos los otros observadores O. Esta es una generalizaci´on del postulado (1.10) de la constancia de la velocidad de la luz. 2. Si u0x ¿ c o v ¿ c, el denominador de (2.30) es aproximadamente 1, y entonces ux ≈ u0x + v, que es la transformaci´on de Galileo (2.27): la teor´ıa relativista abarca a la galileana. 3. Podemos expandir el lado derecho de (2.30) como un polinomio en potencias de v : ux = (u0x + v)(1 + vu0x /c2 )−1 = (u0x + v)(1 − vu0x /c2 + · · ·) 2 = u0x + v − vu02 x /c + · · · 2 ≈ u0x + v − vu02 x /c ,

es decir: ux ≈

u0x

¶ µ u02 x + 1 − 2 v, c 46

y haciendo n = c/u0x : ux ≈

u0x

µ ¶ 1 + 1− 2 v n

(2.31)

Esta es la c´elebre f´ormula que Fresnel deriv´o en 1818, cuando estaba investigando la velocidad de la luz en medios m´oviles. Ya hab´ıamos mencionado esta ecuaci´on en la p´agina 6. La f´ormula (2.30) es la ley de la adici´on de las velocidades paralelas u0x y v. Todav´ıa nos queda la tarea de deducir las f´ormulas que expresan a las velocidades transversas uy y uz en t´erminos de velocidades primadas. Para tal efecto tomamos diferenciales en ambos lados de la ecuaci´on y = y 0 , 1 dy = dy 0 , lo que se escribe obteni´endose dy = dy 0 , es decir dt dt uy = dy 0

1 dt

Ahora usar (2.28): p uy =

1 − v 2 /c2 0 uy vu0 1 + 2x c

Similarmente se deduce que p 1 − v 2 /c2 0 uz = uz vu0 1 + 2x c En resumen, la adici´on relativista de velocidades es as´ı: ux =

uy =

u0x + v vu0 1 + 2x p c 1 − v 2 /c2 0 uy vu0x 1+ 2 c 47

(2.32)

(2.33)

p uz =

1 − v 2 /c2 0 uz vu0x 1+ 2 c

(2.34)

Estas tres f´ormulas son complicadas, y cuando rastreamos los pasos que condujeron a ellas, nos damos cuenta de que (2.32) es m´as complicada que (2.33) y (2.34). Para ver esto anotemos que (2.33) es complicada u ´nicamente por la transformaci´on temporal (2.28). En cambio (2.32) es complicada, no s´olo por la transformaci´on temporal (2.28), sino adem´as por la transformaci´on espacial (2.29). Las transformaciones inversas se obtienen, a partir de (2.32), (2.33) y (2.34), cambiando v por −v e intercambiando velocidades primadas y no primadas: u0x = u0y = u0z =

ux − v vux 1− 2 p c 1 − v 2 /c2 vux uy 1− 2 c p 1 − v 2 /c2 vux uz 1− 2 c

(2.35)

(2.36)

(2.37)

Las ecuaciones (2.32), (2.33) y (2.34) sirven cuando la velocidad de separaci´on v es en direcci´on del eje com´ un xx0 . Debemos ahora generalizar para cuando v es en cualquier direcci´on. Claramente (2.28) se convierte en 1 = dt

p 1 − v 2 /c2 1 , v · u0 dt0 1+ 2 c

(2.38)

y la adici´on de velocidades (2.32), (2.33) y (2.34) se generaliza as´ı: uk =

u⊥ =

u0k + v v · u0 1+ 2 c p 1 − v 2 /c2 0 u v · u0 ⊥ 1+ 2 c 48

(2.39)

(2.40)

2.10

La adici´ on de aceleraciones

Tomar diferenciales en ambos lados de la ecuaci´on (2.39): µ ¶ v · u0 v · du0 1+ 2 du0k − (u0k + v) 2 1 − v 2 /c2 c c 0 duk = = µ ¶ µ ¶2 duk 2 0 0 v ·u v ·u 1+ 2 1+ 2 c c Ahora usar la ecuaci´on (2.38): 0 duk (1 − v 2 /c2 )3/2 duk = µ , ¶ dt v · u0 3 dt0 1+ 2 c

es decir: (1 − v 2 /c2 )3/2 0 ak = µ ¶ ak v · u0 3 1+ 2 c

(2.41)

Esta es la manera como transforman las aceleraciones paralelas. Pasamos ahora a deducir la transformaci´on de las aceleraciones perpendiculares, tomando diferenciales en ambos lados de (2.40):

du⊥

p ½µ ¶ ¾ 0 1 − v 2 /c2 v · u0 0 0 v · du = µ 1+ 2 du ⊥ − u ⊥ ¶ c c2 v · u0 2 1+ 2 c

Se multiplican, lado a lado, esta ecuaci´on y la ecuaci´on (2.38):

a⊥

1 − v 2 /c2 = µ ¶ v · u0 3 1+ 2 c

½ ¾ ¤ 1 £ 0 0 0 0 0 a⊥+ 2 v ·u a⊥−v ·a u⊥ c

(2.42)

El t´ermino v · u0 a0 ⊥ − v · a0 u0 ⊥ que aparece en el lado derecho de esta ecuaci´on se trata de la manera siguiente: 49

v · u0 a0 ⊥ − v · a0 u0 ⊥ = v · u0 (a0 − a0 k ) − v · a0 (u0 − u0 k ) = v · u0 a0 − v · a0 u0 + v · a0 u0 k − v · u0 a0 k El lado derecho de esta ecuaci´on tiene cuatro t´erminos. Los dos primeros6 suman v × (a0 × u0 ) y los dos u ´ltimos suman7 cero; entonces: v · u0 a0 ⊥ − v · a0 u0 ⊥ = v × (a0 × u0 ), y (2.42) queda:

a⊥

2.11

1 − v 2 /c2 = µ ¶ v · u0 3 1+ 2 c

¾ ½ 1 0 0 0 a ⊥ + 2 v × (a × u ) c

(2.43)

Gr´ aficos

Ahora estudiaremos el m´etodo gr´afico de Minkowski [10]. Consideramos puntos que se mueven u ´nicamente en el eje x. Las coordenadas x y t tienen dimensiones de metro y segundo, respectivamente. Conviene usar variables de espacio y tiempo que tengan las mismas dimensiones, y por eso vamos a usar la variable ct en vez de t. La variable ct significa tiempo, pero con dimensiones de longitud. Las transformaciones de Lorentz (1.33) toman una forma sim´etrica entre x y ct:

x0 =

(ct)0 =

v x − ct c p 1 − v 2 /c2 v ct − x c p , 1 − v 2 /c2

(2.44)

(2.45)

o las inversas: 6

Recordar la identidad A × (B × C) = A · C B − A · B C Como u0 k y a0 k apuntan en la direcci´ on de v , es claro que v · a0 u0 k − v · u0 a0 k es un vector en direcci´ on de v . La magnitud de este vector es va0k u0k − vu0k a0k = 0. 7

50

v x0 + (ct)0 x= p c 1 − v 2 /c2 v (ct)0 + x0 c ct = p 2 1 − v /c2

(2.46)

Se grafica el eje ct vertical y el eje x horizontal. Un punto en reposo mantiene constante su coordenada x, y su trayectoria se representa por medio de una l´ınea recta vertical. Estudiemos ahora un punto m´ovil cuya velocidad es u = dx/dt: d(ct) c = dx u Llamando “pend” a la pendiente de la curva, esta ecuaci´on es pend =

c u

(2.47)

La cantidad u es positiva si el punto viaja hacia la derecha, y negativa si va hacia la izquierda, y en estos casos pend es positiva o negativa. Tomar valor absoluto: c |pend| = (2.48) |u| Si se trata de una part´ıcula masiva, la velocidad es infralum´ınica, y por consiguiente |u| < c; la ecuaci´on (2.48) dice que |pend| tiene que ser >1 en todos los instantes. En el caso importante de un pulso de luz, la trayectoria es una l´ınea recta con |pend| = 1: la trayectoria es la bisectriz del ´angulo formado por los ejes ct y x. La Figura 2.4 muestra cuatro trayectorias: La l´ınea recta de 45o de inclinaci´on es para un pulso de luz. Las otras tres curvas representan trayectorias de part´ıculas masivas: la recta vertical corresponde a part´ıcula en reposo; la recta con inclinaci´on >45o es para part´ıcula libre, y la l´ınea curva para part´ıcula forzada. Es importante notar que en esta u ´ltima trayectoria la pendiente es >1 en todos los instantes. Minkowski escribe con grandilocuencia. A la totalidad t, x, y, z la llama el mundo. Al principio de la relatividad (1.10) le dice el principio del mundo absoluto, un evento (t, x, y, z) es un punto en el mundo y la trayectoria de 51

una part´ıcula es una l´ınea en el mundo. Es ´el quien introduce en la f´ısica las palabras luminoide, espacialoide, temporaloide y cono de la luz. La visi´on geom´etrica de Minkowski est´a llena de contenido conceptual, aunque no siempre se apreci´o as´ı. El mismo Einstein tard´o a˜ nos en reconocer su importancia. En un principio consider´o que el trabajo de Minkowski era redundante y carec´ıa de profundidad; finalmente, en 1912, lleg´o al convencimiento de que la relatividad general deb´ıa ser planteada en t´erminos geom´etricos, y pudo apreciar el trabajo de su antiguo profesor. La causalidad. La Figura 2.5 muestra un evento E1 y las l´ıneas en el mundo de dos pulsos de luz que pasan por E1 : uno viaja hacia la izquierda y el otro hacia la derecha. La trayectoria del pulso que va hacia la derecha tiene pendiente 1, y la trayectoria del pulso que va hacia la izquierda tiene pendiente −1. La uni´on de las dos rectas se llama el cono de la luz del evento E1 . Las dos rectas que pasan por E1 cortan al mundo en cuatro partes: izquierda, derecha, pasado y futuro. Las partes izquierda y derecha est´an fuera del cono de la luz; el futuro y el pasado est´an dentro del cono de la luz; tambi´en decimos que los eventos que est´an en las dos rectas est´an dentro del cono de la luz. Las se˜ nales energ´eticas son part´ıculas, bien sea de masa cero como el fot´on, o de masa diferente de cero; sus trayectorias tienen |pend| ≥ 1, de donde concluimos que las trayectorias de las se˜ nales energ´eticas que pasan por un evento E1 est´an completamente dentro del cono de la luz de E1 . Einstein pensaba que si un suceso (que ocurre en el evento E1 ) es causa eficiente de otro suceso (que ocurre en el evento E2 ,) es porque hay una se˜ nal energ´etica que va desde E1 hasta E2 . Como esta se˜ nal est´a dentro del cono de la luz de E1 , es claro que tambi´en E2 tiene que estar dentro del cono de la luz de E1 . En conclusi´on: Lo que ocurre dentro del cono de la luz de E1 puede tener una conexi´on causal con lo que ocurre en E1 . Lo que ocurre en la regi´on del futuro puede ser efecto de lo que ocurre en E1 . Lo que ocurre en la regi´on del pasado puede ser causa de lo que ocurre en E1 . Lo que ocurre en la regi´on del futuro puede ser efecto de lo que ocurre en la regi´on del pasado. La causalidad einsteiniana es una conexi´on entre el pasado y el futuro8 . 8

Bohr pensaba que la causalidad einsteiniana no es la u ´nica posible; ´el admit´ıa la posibilidad de que hubiera tambi´en unas correlaciones cu´ anticas que no est´ an mediadas por se˜ nales energ´eticas. El dan´es cre´ıa que dos sucesos en E1 y E2 pueden estar correlacionados sin necesidad de una se˜ nal energ´etica que viaje desde un evento hasta el otro. Bohr y Einstein ten´ıan que chocar, y as´ı lo hicieron en un debate que dur´ o treinta a˜ nos.

52

Clases de intervalos: Supongamos dos eventos cuyo intervalo es temporaloide. Trazamos una recta que pase por los dos eventos; entonces, de acuerdo con la desigualdad (2.4), esta recta tiene |pend| > 1. As´ı mismo, utilizando las f´ormulas (2.7) y (2.11) llegamos a que la recta que une dos eventos con intervalo espacialoide tiene |pend| < 1, y la recta que une dos eventos con intervalo luminoide tiene |pend| = 1. La Figura 2.6 muestra cuatro eventos A, E, T, y L. El intervalo AE es espacialoide, el intervalo AT es temporaloide y el intervalo AL es luminoide. El cono de la luz corta en cuatro partes al espaciotiempo. En general, los eventos con intervalo espacialoide est´an fuera del cono de la luz, los que tienen intervalo temporaloide est´an dentro del cono de la luz y los que tienen intervalo luminoide est´an justo en el cono de la luz.

2.12

M´ as gr´ aficos

Ya que hemos construido los ejes ct y x del mundo de O, procedemos a dibujar los ejes ct0 y x0 del mundo de O0 : queremos trazar los ejes (ct0 , x0 ) en el plano (ct, x). Es claro que la condici´on x0 = 0 identifica al eje ct0 ; haciendo x0 = 0 en (2.44) encontramos: ct =

c x, v

(2.49)

que es una l´ınea recta con pendiente c/v > 1. Vemos as´ı que el eje ct0 se representa por medio de una recta que pasa por el origen, y que hace con el eje ct un ´angulo v registran que T est´a a la izquierda de A. Aprendemos as´ı algo interesante: cualquier evento que est´e dentro del cono de la luz aparece a la derecha para unos observadores y a la izquierda para otros observadores. O sea que para estos eventos la relaci´on izquierda-derecha no es absoluta, sino relativa. ultimo p´arrafo Relaciones absolutas. Regresando al evento E del pen´ anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un observador inercial para el cual E aparezca a la izquierda del origen. Es decir, los eventos que est´an fuera del cono de la luz tienen una relaci´on izquierda-derecha absoluta. Similarmente, en referencia al evento T del pen´ ultimo p´arrafo anotamos que no es posible conseguir, ni con la Figura 2.7, ni con la Figura 2.16, un observador inercial para el cual T ocurra antes que el origen. Aprendemos as´ı que los eventos que est´an dentro del cono de la luz tienen una relaci´on pasado-futuro absoluta. Los nombres izquierda, derecha, pasado y futuro que les hemos dado a las cuatro regiones, son adecuados: los eventos de estas regiones est´an, respecto al v´ertice del cono, absolutamente a la izquierda, absolutamente a la derecha, absolutamente en el pasado y absolutamente en el futuro.

56

d

Figura 2.1 Un reloj se construye con dos espejos paralelos y un pulso de luz que se refleja en ellos repetidamente. Este dibujo representa el registro hecho por un observador O0 que est´a en reposo respecto al reloj.

Figura 2.2 El mismo reloj de la Figura 2.1, seg´ un lo registra otro observador O que se mueve respecto al reloj.

ct

A

B

x

Figura 2.3 Para el observador O0 los puntos A y B est´an en reposo. Desde el punto medio se env´ıan dos se˜ nales luminosas hacia A y B.

Figura 2.4 Trayectorias de cuatro part´ıculas. De izquierda a derecha: part´ıcula masiva libre, part´ıcula en reposo, pulso de luz y part´ıcula forzada.

57

T

L E

Futuro Izquierda

A

Derecha E1 Pasado

Figura 2.5 El cono de luz est´a comprendido entre dos pulsos de luz; uno viaja hacia la izquierda y el otro hacia la derecha.

Figura 2.6 Los intervalos AE, AT y AL son espacialoide, temporaloide y luminoide, respectivamente

ct

ct

ct'

ct'

4 3 3 x'

2 2

arctan

v/c

x'

3 1 c arctan v/

1 2 1

x

1

Figura 2.7 El observador O0 se mueve respecto a O con velocidad v = 3c/8.

x 2

3

4

Figura 2.8 Para O0 , la distancia OP es 1. Replicamos esta medida a lo largo del eje x0 para marcar aquellos eventos cuyas coordenadas primadas son (0,2), (0,3), (0,4), etc.

58

ct ct'

3 x' 2 1 2 1

x

Figura 2.9 Para averiguar la coordenada ct0 de un evento se traza una l´ınea paralela al eje x0 : all´ı donde esta paralela corta al eje ct0 queda marcada la coordenada ct0 del evento.

Figura 2.10 La l´ınea punteada vertical es la trayectoria de una part´ıcula que est´a en reposo respecto al observador O. La otra l´ınea punteada es para una part´ıcula que est´a en reposo respecto a O0 .

x'

C A

2

B

x 2

Figura 2.11 Los eventos A y B son simult´aneos para O; sin embargo, O0 registra que B ocurre antes que A. As´ı mismo, B y C son simult´aneos para O0 , pero O registra que B ocurre antes que C.

Figura 2.12 El trazo grueso representa una varilla en reposo en O0 ; seg´ un este observador, ella mide 2 metros. Para O la longitud es menor que 2.

59

ct ct' x'

x' 2

2

2 x 2

Figura 2.13 El trazo grueso representa una varilla en reposo en O; seg´ un este observador, ella mide 2 metros. Para O0 la longitud es menor que 2.

Figura 2.14 El trazo punteado es la l´ınea en el mundo de un reloj en reposo en el origen de O. Este reloj marca un tiempo (propio) de 2. Para O0 el tiempo transcurrido es mayor que 2.

ct ct

ct' ct'

2

2

x

x'

x

Figura 2.16 El observador O0 se mueve hacia la izquierda respecto a O. Comparar con la Figura 2.7: en ambas gr´aficas el eje ct0 apunta hacia el futuro, y el eje x0 apunta hacia la derecha.

Figura 2.15 El trazo punteado es la trayectoria de un reloj en reposo en el origen de O0 . Este reloj marca un tiempo (propio) de 2. Para O el tiempo transcurrido es mayor que 2.

60

Cap´ıtulo 3

Mec´ anica Si la relatividad ha cambiado nuestro entendimiento del espaciotiempo, debemos estar preparados para indagar y asimilar los efectos de esos cambios. Se espera que, una vez aceptadas las nuevas propiedades del espaciotiempo, tengamos que introducir modificaciones en los estudios de la din´amica, la mec´anica ondulatoria, etc. Este cap´ıtulo explora la primera de las repercusiones, que es el efecto de la relatividad en la din´amica. Veremos que la nueva din´amica trae sutilezas te´oricas y efectos sorprendentes que la separan de la vieja mec´anica1 newtoniana. El momentum es el primero de los conceptos que la relatividad reforma. De acuerdo con el principio de la relatividad, la ley de la conservaci´ on del momentum debe ser v´alida en todos los sistemas de referencia inerciales. Pero la relatividad muestra, para nuestra sorpresa, que si se mantiene la definici´on de momentum p = mu con m constante, la ley de la conservaci´ on del momentum no se cumple para todos los observadores inerciales, viol´andose as´ı el principio de la relatividad. Hay tres caminos para salir de esta crisis: abandonar el principio de la relatividad (no queremos abandonarlo), o abandonar la ley de la conservaci´ on del momentum (tampoco queremos abandonarla), o modificar la vieja definici´on de momentum p = mu. En la secci´on 3.1 tomaremos el tercer camino; propondremos p = m(u)u, donde m(u) es alguna funci´on desconocida de la magnitud de la velocidad u, nos preguntaremos c´omo debe ser la funci´on desconocida m(u) para que la conservaci´on del momentum sea v´alida en todos p los sistemas de referencia inerciales, y descubriremos que m(u) = m(0)/ 1 − u2 /c2 . 1

Cuando decimos “mec´ anica newtoniana” nos referimos, no s´ olo a la mec´ anica que Newton formul´ o, sino adem´ as a los aportes que los f´ısicos hicieron en los dos siglos siguientes: las formulaciones lagrangiana y hamiltoniana, las aplicaciones a los cuerpos celestes, etc.

61

El nuevo concepto de masa conduce a uno de los hallazgos m´as importantes de la relatividad, que es la asociaci´on masa-energ´ıa, expresada en la ecuaci´on E = mc2 . Esta f´ormula dice que el contenido de masa de un objeto es una medida de su energ´ıa total. La secci´on 3.4 trae una discusi´on de este asunto y luego, en la secci´on 3.5 mostramos que una part´ıcula masiva no puede llegar a tener la velocidad c. La secci´on 3.9 trata, como un caso particularmente interesante, el movimiento circular.

3.1

La conservaci´ on del momentum

Nos proponemos estudiar [6] la colisi´on el´astica de dos part´ıculas de igual masa. La Figura 3.1 muestra el choque seg´ un lo registra un observador O que est´a en reposo respecto al centro de masa. La part´ıcula A va de derecha a izquierda y la part´ıcula B de izquierda a derecha. La figura incluye las cantidades positivas ux y uy , que tienen el siguiente significado: La part´ıcula B tiene una velocidad horizontal ux hacia la derecha en todo instante; pero su velocidad vertical es uy hacia abajo antes del choque, y es uy hacia arriba despu´es. En forma similar, la velocidad horizontal de A es ux hacia la izquierda en todo instante; y su velocidad vertical pasa de ser uy hacia arriba antes del choque, a ser uy hacia abajo despu´es. Con una mirada a la Figura nos damos cuenta de que, para el observador O, el momentum total es cero. Lo que m´as nos interesa por el momento es que el momentum total se conserva: el momentum ganado por la part´ıcula B es igual al perdido por A . De hecho, las cantidades escritas en la Figura fueron expresamente definidas para que, en O, se cumpla la ley de la conservaci´on del momentum. Ahora, por el Principio de la Relatividad, queremos que la ley de la conservaci´ on del momentum tambi´en se cumpla en los otros observadores inerciales. Nos proponemos analizar la colisi´on de estas dos part´ıculas desde el punto de vista de otro observador inercial O0 que se mueve, respecto a O, con una velocidad v hacia la derecha: vamos a exigir que en O0 se cumpla la ley de la conservaci´ on del momentum. Uno podr´ıa, de entrada, definir el momentum de una part´ıcula (intentar por ejemplo la definici´on newtoniana mu) y luego indagar si la conservaci´ on del momentum se cumple en todos los observadores inerciales. Nosotros vamos a seguir la ruta contraria: exigir que la conservaci´ on del momentum valga en todos los sistemas de referencia inerciales y, a partir de esta exigencia, averiguar c´omo se debe definir el momentum de una part´ıcula. Comence62

mos con una propuesta bien general; digamos que si una part´ıcula tiene velocidad u , entonces su momentum es m(u)u , donde m(u) es una funci´on desconocida de la magnitud de la velocidad u . Vamos a exigir que la ley de la conservaci´on del momentum se cumpla en todos los observadores inerciales. Veremos que esta exigencia es suficiente para averiguar la funci´on desconocida m(u) . La Figura 3.2 muestra de qu´e manera el observador O0 registra el choque de las dos part´ıculas. Para la part´ıcula B el momentum vertical despu´es del choque es m(u0B )u0By y antes del choque es −m(u0B )u0By . Entonces el moq 2 + u0 2 , mentum vertical ganado por B es 2m(u0B )u0By . Ahora, u0B = u0Bx By ³q ´ 0 2 + u0 2 entonces el momentum vertical ganado por B es 2m u0Bx By uBy . ³q ´ 0 2 + u0 2 As´ı mismo, el momentum vertical perdido por A es 2m u0Ax Ay uAy . La ley de la conservaci´on del momentum dice que el momentum vertical perdido por una part´ıcula es igual al ganado por la otra:

m

´ ³q ´ ³q 0 0 2 + u0 2 0 2 + u0 2 u0Ax u = m u Ay Ay Bx By uBy

(3.1)

En este momento debemos expresar las cuatro variables u0Ax , u0Ay , u0Bx y u0By en t´erminos de las cantidades nos primadas ux , uy y v, y esto se hace con las f´ormulas de la adici´on relativista de velocidades. T´engase en cuenta que las ecuaciones (2.35) y (2.36) no pueden usarse directamente, porque hay una confusi´on en la notaci´on: en las f´ormulas (2.35) y (2.36) las ux , uy son variables algebraicas (que pueden tomar valores positivos o negativos), en cambio en la presente secci´on las ux , uy , u0Ax , u0By , ... son cantidades positivas. Con esta advertencia en mente procedemos a usar, para la part´ıcula B, las ecuaciones (2.35) y (2.36): u0Bx = u0By =

ux − v vux 1− 2 p c 1 − v 2 /c2 vux uy 1− 2 c

As´ı mismo, para la part´ıcula A las ecuaciones (2.35) (2.36) dan: 63

−ux − v v(−ux ) 1− c2 p 1 − v 2 /c2 u v(−ux ) y 1− c2

−u0Ax =

u0Ay =

Al colocar estas cuatro ecuaciones en (3.1) se llega a:  q (ux + v)2 + (1 − v 2 /c2 )u2y  m vux 1+ 2 c q  vux 1+ 2 (ux − v)2 + (1 − v 2 /c2 )u2y c  = m vux vux 1− 2 1− 2 c c Llevemos esta ecuaci´on al l´ımite uy → 0: 

   vux 1+ 2 |u + v| |u − v| x c  = m x  m vux vux vux 1+ 2 1− 2 1− 2 c c c De todos los observadores inerciales, escojamos aquel que tiene v = ux : µ m

2v 1 + v 2 /c2

¶ = m(0) =

1 + v 2 /c2 1 − v 2 /c2 m(0)

s

µ 1−

2v/c 1 + v 2 /c2

¶2

Esta es la respuesta que busc´abamos. Para simplificar su escritura hagamos 2v estos dos cambios en la notaci´on: m(0) → m0 y →u : 1 + v 2 /c2 m0 m(u) = q 1 − u2 /c2 64

(3.2)

Esta es la ecuaci´on m´as importante de la mec´anica en la teor´ıa especial de la relatividad. La masa de una part´ıcula no es una constante, sino que es funci´on de la velocidad u de la part´ıcula; he aqu´ı una modificaci´on esencial en el concepto de masa. Nota: Releamos las palabras que siguen a la ecuaci´on (3.1). Si en vez de usar la adici´on relativista de velocidades hubi´eramos empleado la adici´on galileana (2.27) ¿ad´onde habr´ıamos llegado? Para responder esta pregunta apliquemos la f´ormula (2.27) a las part´ıculas A y B, con lo que llegamos a: −u0Ax = −ux − v , u0Bx = ux − v , u0Ay = uy y u0By = uy . Al poner estas cuatro ecuaciones en la f´ormula (3.1) se obtiene ³q m

(ux + v)2 + u2y

´ =m

³q ´ (ux − v)2 + u2y

Si esta ecuaci´on ha de cumplirse para valores arbitrarios de ux , uy y v, se concluye que m no puede ser una funci´on, sino que tiene que ser una constante. De esta manera hemos llegado a un viejo resultado de la f´ısica newtoniana: cuando se usan las transformaciones de Galileo, y se define p = mu con m constante, entonces la ley de la conservaci´ on del momentum es v´alida para todos los observadores inerciales.

3.2

Las nuevas cantidades din´ amicas

En la f´ısica newtoniana el momentum, la fuerza, el trabajo y la energ´ıa R cin´etica se definen as´ı: p = mu, F = dp/dt, Trabajo = F · dr, Energ´ıa cin´etica = el trabajo que se realiza para llevar a la part´ıcula desde el reposo hasta velocidad u. La din´amica relativista conserva estas definiciones, pero todas con la nueva masa m(u). En general, siempre que escribamos m, debe entenderse m(u): p = mu =

(3.3) m0 u

q

1 − u2 /c2

F = 65

dp dt

(3.4)

(3.5)

Z Trabajo =

Z F · dr =

Z

dp · dr = dt

dr dp · = dt

Z d(mu) · u ,

o sea que Z Trabajo =

(m du · u + dm u2 )

(3.6)

De otro lado, elevando al cuadrado ambos lados de la ecuaci´on (3.2) se obtiene: ³ u · u´ = m20 m2 1 − 2 c Tomar diferenciales en ambos lados: 2m dm − 2m dm u2 /c2 − 2m2

u · du = 0, c2

de donde: m u · du + dm u2 = c2 dm Esto en la ecuaci´on (3.6) da: Z 2

Trabajo = c

dm

(3.7)

Esta f´ormula establece una nueva interpretaci´ on del trabajo: en la relatividad el trabajo es el cambio de masa. La energ´ıa cin´etica K (que es, por definici´on, la energ´ıa que hay que invertir para llevar una part´ıcula desde el reposo hasta velocidad u) es un trabajo muy especial: el que se necesita para cambiar la masa desde m0 hasta m: Z K = c2

m

dm m0

K = mc2 − m0 c2 66

(3.8)

De la ecuaci´on (3.8) se sigue que K + m0 c2 = mc2

(3.9)

La energ´ıa mec´anica total de la part´ıcula, que representamos mediante la letra E , es la suma K + m0 c2 : E = m0 c2 + K = mc2

(3.10) (3.11)

¿Por qu´e llamar energ´ıa a la cantidad mc2 ? A primera vista parece apresurado llamar energ´ıa a una cantidad reci´en encontrada; ya tendremos ocasi´on de justificar este nombre en la secci´on 3.3. Si usamos la ecuaci´on (3.2) en la (3.11) escribimos: m0 c2 E=q 1 − u2 /c2

(3.12)

Esta ha sido una presentaci´on r´apida de las cuatro cantidades din´amicas m, p, K, y E , tal como quedan redefinidas en la relatividad especial. Las Figuras 3.3, 3.4, 3.5 y 3.6 muestran cualitativamente estas curvas einsteinianas marcadas con la letra e ; se deben comparar con las curvas newtonianas que aparecen marcadas con la letra n. Claramente las cuatro cantidades din´amicas E, K, p, u son redundantes, si m0 est´a dada: conocida una cualquiera de ellas se puede averiguar las otras tres. Hallemos por ejemplo algunas de esas relaciones. Para expresar u en t´erminos de p, podemos elevar al cuadrado cada uno de los lados de la ecuaci´on (3.4), y despejar u2 /c2 : u2 /c2 = 1 − 67

m20 c2 m20 c2 + p2

(3.13)

Para expresar u en t´erminos de E, podemos elevar al cuadrado cada uno de los lados de la ecuaci´on (3.12), y despejar u2 /c2 :

u2 /c2 = 1 −

m20 c4 E2

(3.14)

Para expresar E en t´erminos de p, igualamos los lados derechos de las ecuaciones (3.13) y (3.14): E 2 = m20 c4 + p2 c2

(3.15)

En forma similar se encuentran todas las conexiones entre las cuatro variables: E = m0 c2 + K = K = E − m0 c2 =

p m0 c2 (m0 c2 )2 + p2 c2 = p 1 − u2 /c2 p

(m0 c2 )2 + p2 c2 − m0 c2 = p

m0 c2 1−

u2 /c2

− m0 c2

1p m0 u 1p 2 E − (m0 c2 )2 = (m0 c2 + K)2 − (m0 c2 )2 = p c c 1 − u2 /c2 s s µ ¶2 µ ¶−2 m0 c2 K c =c 1− 1+ u = c 1− =s 2 µ ¶ E m0 c m0 c 2 1+ p p =

Masa cero: Para part´ıculas de masa cero, como el fot´on, el momentum se denota por medio de la letra k, y su magnitud es k. Las f´ormulas anteriores se simplifican considerablemente: k = E/c

para masa cero.

(3.16)

p Bajas velocidades: El factor 1/ 1 − u2 /c2 se puede expandir usando la f´ormula del binomio de Newton: 68

p 1 1/ 1 − u2 /c2 = r 1−

u2 c2

µ ¶− 12 u2 1 u2 3 u4 = 1− 2 = 1+ + +··· c 2 c2 8 c4

Si la velocidad es suficientemente baja podemos despreciar los t´erminos del p u4 1 u2 orden de 4 . En este caso 1/ 1 − u2 /c2 → 1 + . Con este resultado c 2 c2 llegamos a: 1 m0 u2 2 ¶ µ u2 → m0 m → m0 1 + 2 2c µ ¶ u2 p → m0 u 1 + 2 → m0 u 2c µ ¶ u2 2 E → m0 c 1+ 2 → m0 c2 2c

K →

3.3

La energ´ıa en la relatividad especial

El momentum newtoniano es m0 u, y el relativista es mu. La redefinici´on m0 u → mu se hace con el prop´osito expreso de que la ley de la conservaci´ on del momentum se cumpla para todos los observadores inerciales. De la misma manera, la energ´ıa relativista se define como en (3.10) para que la ley de la conservaci´on de la energ´ıa se cumpla absolutamente. Esta presentaci´ on podr´ıa parecer extra˜ na, pero es sana: en vez de probar que el momentum y la energ´ıa se conservan absolutamente, vamos a definir momentum y energ´ıa de una manera que garantice que las dos leyes de conservaci´ on sean absolutamente v´alidas. En la secci´on 3.1 vimos que el momentum se conserva absolutamente si se define como p = mu ; el prop´osito de esta secci´on es probar que la energ´ıa se conserva absolutamente si se define como E = m0 c2 + K . Estudiemos [6] la colisi´on de dos objetos que tienen la misma masa en reposo m0 . Pensemos que uno de los objetos es una piedra y el otro es de alg´ un material blando como barro; los objetos se escogen as´ı para que la colisi´on sea completamente inel´astica seg´ un un observador O que est´a en reposo respecto al centro de masa. La Figura 3.7 muestra, seg´ un O, las situaciones antes y despu´es del choque: los dos cuerpos, llamados A y B, tienen velocidad u 69

antes del choque. Como resultado del choque queda, al final, un s´olo cuerpo, en reposo, cuya masa en reposo es M0 . N´otese que como este cuerpo final queda en reposo para O, este observador registra que la energ´ıa cin´etica se ha perdido por completo: para O la colisi´on es completamente inel´astica. Ahora consideremos otro observador O0 que se mueve, respecto a O, con velocidad u hacia la derecha. Es claro que para O0 la part´ıcula A est´a en reposo antes del choque; la part´ıcula B tiene una velocidad que llamaremos u0 . La Figura 3.8 muestra las situaciones para O0 , antes y despu´es del choque: claramente el cuerpo final M0 tiene velocidad u. Veamos cu´al es, seg´ un O0 , el momentum total antes del choque: m0 u0 mu0 = q , 2 1 − u0 /c2 y el momentum despu´es, tambi´en seg´ un O0 : M0 u

Mu = q

1 − u2 /c2

Para O0 la ley de la conservaci´ on del momentum dice que M0 u

q

1 − u2 /c2

M0

m u0 q 0 2 1 − u0 /c2 q 0 1 − u2 /c2 u = m0 q u 2 1 − u0 /c2 =

(3.17)

Queremos expresar u0 en t´erminos de u, para que en la ecuaci´on (3.17) aparezca una sola velocidad u. Notemos que el objeto B tiene velocidad u seg´ un O, y tiene velocidad u0 respecto a O0 ; como estas u y u0 se refieren al mismo cuerpo, deben satisfacer la ecuaci´on (2.35). Haciendo u0x = −u0 , ux = −u y v = u, la ecuaci´on (2.35) es: (−u0 ) =

(−u) − u , u(−u) 1− c2 70

de donde

u0 =

2u 1 + u2 /c2

Al poner este valor de u0 en la ecuaci´on (3.17), se llega a 2m0 M0 = q 1 − u2 /c2

(3.18)

Este resultado es novedoso: ya que M0 6= 2m0 , la masa en reposo total no se conserva. El cambio de la masa en reposo es: 



1 M0 − 2m0 = 2m0  q − 1 2 2 1 − u /c

(3.19)

Calculemos ahora el cambio en la energ´ıa cin´etica, de acuerdo con un observador inercial cualquiera O00 que se mueve, respecto a O , con una velocidad arbitraria ω. Para el observador O00 los cuerpos A y B tienen velocidades u00A y u00B , y el cuerpo final de masa M0 tiene velocidad U 00 . Para la transformaci´on entre los observadores O y O00 usamos la f´ormula de adici´on de velocidades (2.35): u00A =

u−ω uω ; 1− 2 c

u00B =

−u − ω uω ; 1+ 2 c

U 00 =

0−ω = −ω 1−0

(3.20)

Calculemos, seg´ un O00 , cu´anto es la energ´ıa cin´etica perdida en la colisi´on. Utilizamos la ecuaci´on (3.8) para calcular la energ´ıa cin´etica antes y despu´es del choque: 00 00 00 Kantes = KA + KB

= (m00A c2 − m0 c2 ) + (m00B c2 − m0 c2 ) 

 c2



 c2

m0 m0 = q − m0 c2  +  q − m0 c2  00 2 2 00 2 2 1 − uA /c 1 − uB /c 71



 1

00 00 2 2 2 q Kdespu´ es = M c − M0 c = M0 c

1−U

00 2

2

− 1

/c

00 00 Entonces el cambio de energ´ıa cin´etica ∆K 00 = Kdespu´ es − Kantes es:



 1

00 00 2 q Kdespu´ − 1 es − Kantes = M0 c 1 − U 00 2 /c2









(3.21)

m0 c2 m0 c2 − m0 c2  −  q − m0 c2  − q 00 2 2 00 2 2 1 − uA /c 1 − uB /c Al poner las ecuaciones (3.20) en la ecuaci´on (3.21) se obtiene 



1 − 1 Kdespu´es − Kantes = −2m0 c2  q 2 2 1 − u /c

(3.22)

N´otese que en el lado derecho de esta ecuaci´on no aparece la velocidad ω del observador O00 , lo que quiere decir que el cambio en la energ´ıa cin´etica es el mismo para todos los observadores inerciales: es absoluto; por esta raz´on hemos borrado la doble prima en K 00 . Si multiplicamos ambos lados de la ecuaci´on (3.19) por c2 encontramos: 

 1

− 1 (M0 − 2m0 ) c2 = 2m0 c2  q 2 2 1 − u /c Ahora, al sumar lado a lado las ecuaciones (3.22) y (3.23) se obtiene: Kdespu´es − Kantes + (M0 − 2m0 )c2 = 0 2m0 c2 + Kantes = M0 c2 + Kdespu´es 72

(3.23)

Escribamos la u ´ltima ecuaci´on sugestivamente: (m0 c2 + KA, antes ) + (m0 c2 + KB, antes ) = M0 c2 + Kdespu´es

(3.24)

Consideremos un conjunto de cuerpos que chocan. En cualquier instante el conjunto consta de cuerpos con masas en reposo m0,1 , m0,2 , m0,3 , · · · y energ´ıas cin´eticas K1 , K2 , K3 , · · · . La f´ormula (3.24) dice que la cantidad X

(m0,i c2 + Ki )

(3.25)

i

es una constante del movimiento. Queremos recalcar que la velocidad ω del observador O00 , no aparece en (3.24), o sea que la ley de conservaci´ on (3.24) no es relativa, sino absoluta. En otras palabras, (3.24) cumple el principio de la relatividad (1.10), y podemos afirmar que la cantidad conservada (3.25) debe ser importante. La llamamos energ´ıa total o tambi´en energ´ıa mec´ anica. La energ´ıa total de una part´ıcula es su energ´ıa cin´etica m´as su masa en reposo multiplicada por c2 . As´ı justificamos, a posteriori, que a la cantidad (3.10) le hubi´eramos dado el nombre de energ´ıa.

3.4

E = mc2

La palabra inercia se usa para denotar aquella oposici´on que presentan los cuerpos cuando se intenta acelerarlos. De una manera gr´afica podemos decir que la inercia de un cuerpo corresponde a la presi´on que sentimos en las manos cuando lo empujamos; al empujar una naranja o un cami´on sentimos muy diferentes grados de presi´on en nuestras manos, y decimos en consecuencia que el cami´on tiene m´as inercia que una naranja. Siguiendo una tradici´on de muchos siglos, la cantidad f´ısica asociada a la inercia de un cuerpo es la masa. Respecto al choque inel´astico que estudiamos en la secci´on anterior, el aumento de masa en reposo M0 −2m0 es un aumento de la energ´ıa total interna. En efecto, M0 − 2m0 es igual a la energ´ıa cin´etica perdida; en el choque esta energ´ıa cin´etica se ha convertido en movimiento rotacional y vibracional de las mol´eculas, es decir, calor. Todo este calor es energ´ıa interna, es masa, es inercia. Un cuerpo puede contener, albergar, muchas clases de energ´ıa: masa 73

en reposo de las part´ıculas que lo componen, energ´ıa cin´etica de ellas y toda clase de energ´ıas de interacci´ on entre ellas. La suma de todas estas energ´ıas internas se manifiesta como masa; la masa del cuerpo es una medida de la suma de todas esas energ´ıas internas. La relaci´on entre masa y energ´ıa, dada por la ecuaci´on (3.11), fue, en palabras de Einstein, “el pensamiento m´as feliz de mi vida”. El art´ıculo en el que public´o este resultado [3] tiene una extensi´on de menos de tres p´aginas, y ´el lo presenta como una continuaci´ on del art´ıculo principal [2] de la relatividad. Para deducir la relaci´on entre masa y energ´ıa, calcula la energ´ıa cin´etica de un cuerpo que emite dos pulsos de luz. Esta es, claramente, una referencia a la masa inercial del cuerpo; habr´ıan de pasar seis a˜ nos para que se diera cuenta de que cuando un cuerpo sufre un cambio en su masa inercial, tambi´en sufre un cambio en su masa gravitacional, y que ambos cambios tienen exactamente la misma magnitud. Conviene recalcar que aunque la masa y la energ´ıa est´an conectadas por una relaci´on tan simple como E = mc2 , esto no significa que masa y energ´ıa sean conceptos id´enticos. De hecho, puede haber la segunda sin que haya la primera: el fot´on tiene energ´ıa, mas no masa. Afirmamos arriba que la masa de un sistema f´ısico es una medida de su energ´ıa interna. En t´erminos de mec´anica cu´antica, la masa es mayor cuando el sistema ocupa un estado excitado que cuando ocupa el estado b´asico. Para ilustrar lo que estamos mencionando, supongamos una mol´ecula formada por dos ´atomos id´enticos; si los dos ´atomos est´an en el mismo estado cu´antico, podemos afirmar que tienen la misma masa y por consiguiente el centro de masa de la mol´ecula est´a en el punto medio de la l´ınea que los une; pero si uno de los ´atomos est´a en un estado excitado y el otro no, el primero tiene mayor masa que el segundo y en consecuencia el centro de masa de la mol´ecula no queda en el punto medio de la l´ınea que los une.

Energ´ıa de enlace. Cuando Einstein public´o su ecuaci´on E = mc2 , dijo claramente que “la radiaci´on transporta inercia”. Decenios de experimentaci´on en f´ısica nuclear y en part´ıculas elementales habr´ıan de corroborar la validez de esta afirmaci´on. Para verlo con claridad introducimos a continuaci´on el concepto de energ´ıa de enlace, vali´endonos de un ejemplo de la f´ısica nuclear. El deuter´on es una part´ıcula formada por un prot´on y un neutr´on. Las masas en reposo de estas tres part´ıculas son 74

mp = 938.27 MeV/c2

(3.26)

mn = 939.57 MeV/c2

(3.27)

md = 1875.61

MeV/c2

(3.28)

R´apidamente nos damos cuenta de que mp + mn 6= md . La energ´ıa de enlace es, en este caso, (mp + mn )c2 − md c2 = 2.23 MeV. Cuando un fot´on incide sobre un deuter´on, puede desintegrarlo, produci´endose un prot´on y un neutr´on. Para que esto ocurra, la energ´ıa del fot´on debe ser igual o mayor que 2.23 MeV. As´ı mismo, un prot´on y un neutr´on libres pueden formar un deuter´on; cuando esto ocurre se emite un fot´on de energ´ıa 2.23 MeV. Lo que hemos mencionado para el deuter´on tambi´en ocurre f´acilmente con otros n´ ucleos livianos: n´ ucleo liviano 1 + n´ ucleo liviano 2 → n´ ucleo 3 + fot´on

(3.29)

Ya que el fot´on porta energ´ıa, es claro que la masa en reposo del n´ ucleo 3 tiene que ser menor que la suma de las masas en reposo de los n´ ucleos 1 y 2. El proceso general (3.29) se llama fusi´ on nuclear y es lo que ocurre en el Sol, donde dos hidr´ogenos se pueden fusionar para producir un fot´on y un ´atomo de helio. De otro lado, en los n´ ucleos pesados es frecuente la reacci´on: n´ ucleo pesado → n´ ucleo1 + n´ ucleo 2 + fot´on

(3.30)

Ya que el fot´on porta energ´ıa, la masa en reposo del n´ ucleo pesado tiene que ser mayor que la suma de las masas en reposo de los n´ ucleos 1 y 2. El proceso general (3.30) se llama fisi´ on nuclear, y es lo que ocurre en las plantas de energ´ıa nuclear.

3.5

La velocidad l´ımite

p La ecuaci´on K = m0 c2 / 1 − u2 /c2 − m0 c2 que aparece en la p´agina 68 dice claramente que K → ∞ cuando u → c . En palabras, para llevar un objeto masivo desde el reposo hasta que tenga la velocidad de la luz, es necesario a˜ nadirle una cantidad infinita de energ´ıa. Como es imposible usar una cantidad infinita de energ´ıa, concluimos que ning´ un objeto masivo se puede llevar 75

hasta la velocidad de la luz. Un sistema de referencia es un cuerpo de reglas y relojes y, por consiguiente, no puede ser llevado desde el reposo hasta c . Esta es la raz´on por la que escribimos la frase en bastardilla en la p´agina 17. Debemos tener en cuenta que el espaciotiempo de la relatividad especial tiene un intervalo est´atico; en efecto, dados un ∆t y un ∆r, el intervalo (2.1) es constante, no cambia en el tiempo. Cuando se estudien condiciones que se salen del marco de la relatividad especial, no puede sorprendernos que ocurran cosas diferentes a las que hemos discutido. Por ejemplo, si el espacio est´a explotando, como afirma la teor´ıa del big-bang, el intervalo entre dos eventos fijos no es constante, y en consecuencia[?] algunas galaxias pueden tener, respecto a nosotros, velocidades mayores que c.

3.6

Las transformaciones de p , E , m , F

Consideremos una part´ıcula de masa en reposo m0 sobre la cual se ejerce una fuerza. Las cantidades f´ısicas que registra O son p , E , m , F , y las de O0 son p0 , E 0 , m0 , F0 . Nos proponemos encontrar las ecuaciones que expresan las cantidades primadas en t´erminos de las no primadas. Antes de ejecutar esta tarea es conveniente que demostremos la f´ormula: vu0x 1 c2 p p =p 2 2 0 2 2 1 − u /c 1 − u /c 1 − v 2 /c2 1+

(3.31)

Esta ecuaci´on ser´a utilizada varias veces a lo largo de esta secci´on. Para deducir la ecuaci´on (3.31) elevamos al cuadrado cada uno de los lados de las ecuaciones (2.32) , (2.33) y (2.34), obteni´endose: u2x

(u0 + v)2 =µ x ¶ ; vu0x 2 1+ 2 c

u2y

¡ ¢ 1 − v 2 /c2 u0y2 = µ ¶ ; vu0x 2 1+ 2 c

u2z

¡ ¢ 1 − v 2 /c2 u0z2 = µ ¶ vu0x 2 1+ 2 c

Ahora sumamos, lado a lado, estas tres ecuaciones: £ 0 ¡ ¢¡ 02 ¢¤ 1 2 2 2 u2x + u2y + u2z = µ uy + u0z2 ¶2 (ux + v) + 1 − v /c 0 vu 1 + 2x c 76

En el lado izquierdo identificamos u2x + u2y + u2z = u2 ; en el lado derecho identificamos u0y2 + u0z2 = u0 2 − u0x2 : u

2

=

=

¡ ¢¡ ¢ (u0x + v)2 + 1 − v 2 /c2 u0 2 − u0x2 µ ¶ vu0 2 1 + 2x c µ 0 ¶2 vux v 2 u0 2 v 2 + u0 2 − 2 + + 2vu0x c c µ ¶ vu0x 2 1+ 2 c

Observemos los dos u ´ltimos t´erminos del numerador; si sumamos c2 se completa el cuadrado: v2 2

u

+

u0 2

=

=

µ ¶ v 2 u0 2 vu0x 2 2 2 − 2 −c +c 1+ 2 c c µ ¶2 0 vu 1 + 2x c

v 2 u0 2 v 2 + u0 2 − 2 − c2 c + c2 µ ¶ vu0x 2 1+ 2 c

c2 − u2 =

=

v 2 u0 2 −v 2 − u0 2 + 2 + c2 c µ ¶ vu0x 2 1+ 2 c c2 (1 − v 2 /c2 )(1 − u0 2 /c2 ) µ ¶ vu0x 2 1+ 2 c

Ahora dividir ambos lados por c2 : 1 − u2 /c2 =

(1 − v 2 /c2 )(1 − u0 2 /c2 ) , µ ¶ vu0x 2 1+ 2 c 77

y de aqu´ı se sigue la f´ormula (3.31), que es lo que quer´ıamos demostrar. Ya estamos en condici´on de calcular la transformaci´on del momentum. Comencemos con px que es m0 ux px = p 1 − u2 /c2 En el numerador usamos la ecuaci´on (2.32) y en el denominador usamos la ecuaci´on (3.31):

px =

=

Ã

1

p 1 − v 2 /c2

m0 u0x

m0 c2

v p +p 02 2 02 2 c 1 − u /c 1 − u /c 2

!

vE 0 p0x + 2 c p 1 − v 2 /c2

Con procedimientos similares se encuentra que py = p0y y que pz = p0z . Ataquemos ahora la transformaci´on de la energ´ıa: E=p

m0 c2 1 − u2 /c2

En el denominador usamos la ecuaci´on (3.31): 1

E =

p 1 − v 2 /c2

=

E 0 + vp0x p 1 − v 2 /c2

Ã

m0 c2

m0 u0x

!

p +v p 1 − u02 /c2 1 − u02 /c2

Reunamos las transformaciones obtenidas hasta el momento: E = γ (E 0 + vp0x ) ³ v ´ px = γ p0x + 2 E 0 c 0 py = py , pz = p0z 78

(3.32) (3.33) (3.34)

A partir de estas cuatro ecuaciones se obtienen las transformaciones inversas cambiando v por −v e intercambiando variables primadas con no primadas: E 0 = γ (E − vpx ) ³ v ´ p0x = γ px − 2 E c p0y = py ,

(3.35)

p0z = pz

Dedujimos las transformaciones de E y p estudiando una part´ıcula cualquiera, de masa m0 . Debemos anotar, sin embargo, que estas transformaciones tienen validez general, ya que se aplican a cualquier sistema f´ısico. Pensemos que las u ´ltimas ocho ecuaciones son las f´ormulas de transformaci´on de la energ´ıa y el momentum de cualquier sistema (una nube, un planeta, etc.). Las cuatro ecuaciones (3.35) son como las cuatro ecuaciones (1.33), si se admite la correspondencia E/c ↔ ct, px ↔ x, py ↔ y, pz ↔ z. M´as concisamente: µ

¶ E ,p c



(ct , r)

(3.36)

La asociaci´on (3.36) se dice, en palabras, as´ı: (E/c , p) transforma como (ct , r); as´ı se definen los vectores, asunto que trataremos en detalle en el cap´ıtulo 5, dedicado a los tensores de la relatividad especial. De otro lado, estamos a un paso de definir el momentum del fot´on y deducir las f´ormulas de la aberraci´on de la luz y del efecto Doppler; pero aplazamos esta tarea hasta la secci´on 5.8. La transformaci´on de la masa se obtiene muy f´acilmente si reescribimos la ecuaci´on (3.32) de la manera siguiente: mc2 = γ (m0 c2 + m0 vu0x ) , de donde: ¶ µ vu0x m0 m = γ 1+ 2 c ³ vux ´ m0 = γ 1 − 2 m c 79

(3.37) (3.38)

Nos queda por calcular la transformaci´on de la fuerza. Comencemos con Fx . dpx Escribimos Fx = y usamos la ecuaci´on (2.28): dt Fx =

γ −1 d px vu0x dt0 1+ 2 c

Ahora utilizamos la f´ormula (3.33): 1 Fx = vu0 1 + 2x c

µ

dp0x v dE 0 + dt0 c2 dt0

En el par´entesis del lado derecho reconocemos que m0 c2 ; entonces Fx =

dp0x = Fx0 y que E 0 = dt0

1 dm0 0 (F + v ) vu0x x dt0 1+ 2 c

Ahora, la ecuaci´on (3.47) dice que

Fx =



dm0 1 = 2 F0 · u0 , o sea que 0 dt c

1 v (Fx0 + 2 F0 · u0 ) 0 vu c 1 + 2x c

Repitamos este an´alisis para Fy :

Fy =

Pero py = p0y y

d γ −1 py vu0x dt0 1+ 2 c

dpy0 = Fy0 , entonces Fy = dt0

resultado similar. En conclusi´on: 80

γ −1 F 0 , y para Fz un vu0x y 1+ 2 c

Fx =

Fy =

Fz =

v 0 0 u ·F c2 vu0 1 + 2x c −1 γ F0 vux0 y 1+ 2 c −1 γ F0 vux0 z 1+ 2 c Fx0 +

(3.39)

(3.40)

(3.41)

Estas ecuaciones dicen claramente que F0 = 0 ⇔ F = 0: si una part´ıcula aparece en equilibrio (en otras palabras, la part´ıcula es libre) para un observador, tambi´en aparece en equilibrio para todos los otros observadores inerciales. Adem´as F0 6= 0 ⇔ F 6= 0: si una part´ıcula no aparece en equilibrio para un observador, entonces todos los otros observadores inerciales registran que la part´ıcula no est´a en equilibrio. En otras palabras: la condici´on de equilibrio es absoluta, y la situaci´on de desequilibrio tambi´en es absoluta. Las rec´ıprocas de las u ´ltimas tres ecuaciones son

Fx0 = Fy0 = Fz0 =

v u·F c2 vux 1− 2 c −1 γ vux Fy 1− 2 c −1 γ vux Fz 1− 2 c Fx −

(3.42)

(3.43)

(3.44)

¦¦¦¦¦¦¦¦¦¦¦¦¦ Ya hemos sentado las bases de la nueva mec´anica, relativista. En este momento el cap´ıtulo cambia el rumbo que tra´ıa, para dedicarse al estudio de ejemplos y casos particulares. Comenzamos con el estudio de una part´ıcula cargada que viaja en una regi´on donde hay un potencial electrost´atico; luego planteamos el problema general de la aceleraci´on relativista y finalmente aplicamos este estudio al caso importante de la part´ıcula cargada que, por la acci´on de un campo magn´etico, describe una trayectoria circular. Es 81

bien sabido que las cargas el´ectricas aceleradas emiten radiaci´on electromagn´etica, y todo estudio riguroso deber´ıa tener en cuenta esta p´erdida de momentum y energ´ıa. El an´alisis detallado de esta radiaci´on es intrincado y, de seguirlo, podr´ıa distraernos de nuestro prop´osito principal, que es describir la ideas esenciales de la mec´anica relativistas. Por este motivo, para simplificar los c´alculos, nos olvidaremos de la radiaci´on. Sabemos que de esta manera se cometen errores esenciales, pero lo hacemos en aras de enfatizar los aspectos relativistas de la mec´anica.

3.7

Masa y potencial electrost´ atico

Estudiemos el movimiento de una part´ıcula cargada que se mueve en una regi´on donde hay un potencial electrost´atico V . Para simplificar el an´alisis supongamos que el movimiento de la part´ıcula es en la direcci´on x. El campo el´ectrico es −dV /dx, la fuerza es −q dV /dx y el trabajo que realiza el campo cuando la part´ıcula se desplaza dx es (−q dV /dx) dx = −q dV. Escribamos el trabajo total cuando la part´ıcula pasa de un punto donde el potencial es Vi , a otro punto donde el potencial es Vf : Z Trabajo = −q

Vf

Vi

dV = −q(Vf − Vi ) ≡ −q∆V

(3.45)

Obs´ervese que si q es positiva y ∆V es negativo, entonces el trabajo es positivo: la carga positiva gana velocidad a medida que desciende en el potencial electrost´atico. Gana energ´ıa cin´etica, es decir gana masa. La masa que gana la part´ıcula es −q∆V /c2 . ¿Es la masa ganada −q∆V grande o peque˜ na? Para responder esta pregunta debemos comparar −q∆V con alguna otra masa, y lo m´as natural es compararla con m0 . El problema es altamente relativista si −q∆V À m0 c2 , y el problema no es relativista si −qV ¿ m0 c2 . Por ejemplo, en el caso del electr´on se tiene m0 c2 = 0.511 MeV; el r´egimen altamente relativista es e∆V À 0.5 MeV, es decir: ∆V À 0.5 MV. Esto significa que para llevar un electr´on al r´egimen altamente relativista se necesita que la diferencia ∆V sea mucho mayor que 0.5 megavoltios. As´ı mismo, cuando ∆V sea mucho menor que 0.5 megavoltios, podremos confiadamente pensar que el r´egimen no es relativista. De aqu´ı se saca una ense˜ nanza: Cuando la energ´ıa cin´etica de una part´ıcula es mucho mayor 82

que su masa en reposo, el r´egimen es altamente relativista. Y si la energ´ıa cin´etica es mucho menor que la masa en reposo, el r´egimen no es relativista, es decir, no se notan lo efectos relativistas. Apliquemos el criterio establecido en el u ´ltimo p´arrafo al caso del electr´on en el ´atomo de hidr´ogeno. Las energ´ıas t´ıpicas del ´atomo son electronvoltios; esto quiere decir que la energ´ıa cin´etica es del orden de 1 eV. Para comparar esta energ´ıa cin´etica con la masa en reposo formamos el cociente as´ı: eV ≈ 10−5 0.5 MeV Como 10−5 es bastante menor que 1, podemos afirmar que en el ´atomo de hidr´ogeno no son prominentes los efectos relativistas. Por eso la soluci´on no relativista que Schroedinger le dio a este ´atomo en 1926 funciona bien. Debemos apuntar, sin embargo, que los efectos relativistas en este ´atomo, aunque peque˜ nos, pueden notarse con instrumentos de alta precisi´on.

3.8

La aceleraci´ on

Averiguar la trayectoria de una part´ıcula es llegar a una expresi´on del vector posici´on r como funci´on del tiempo t . Claramente, u = dr/dt y a = du/dt, o sea que para averiguar la trayectoria se puede partir de la aceleraci´on a , e integrar dos veces. Ahora, para partir de la aceleraci´on es necesario conocer la fuerza F. En conclusi´on, para averiguar la trayectoria de una part´ıcula es necesario precisar c´omo se averigua a cuando se conoce F. Usamos las ecuaciones (3.3) y (3.5) para escribir: F =

d du dm (mu) = m +u dt dt dt = ma

+u

dm dt

(3.46)

Esta f´ormula dice que, cuando la masa var´ıa con el tiempo, la fuerza no es simplemente ma. Es interesante anotar que la ecuaci´on (3.46) es v´alida tanto en la mec´anica newtoniana (un cometa pierde agua por evaporaci´on cuando se acerca al Sol, y en consecuencia dm/dt 6= 0) como en la mec´anica relativista (cuando la part´ıcula gana u su masa aumenta y en consecuencia 83

dm/dt 6= 0); el hecho, seg´ un (3.46), de que a no sea en general paralela a F, no es un resultado exclusivo de la relatividad especial, sino que ya era posible en la mec´anica newtoniana. Para calcular dm/dt en el caso relativista usamos las ecuaciones (3.10) y (3.11): dm 1 dE 1 d 1 dK = 2 = 2 (m0 c2 + K) = 2 dt c dt c dt c dt Ahora, dK es un diferencial de trabajo F · dr: dm dt

=

1 dr F· 2 c dt

=

1 F·u c2

(3.47)

Colocando esta ecuaci´on en (3.46) escribimos: F = ma + a =

F·u u, c2

es decir:

F·u F − u m mc2

(3.48) (3.49)

Vemos as´ı que en la relatividad especial la aceleraci´on no es, en general, paralela a la fuerza. Se presentan sin embargo dos situaciones excepcionales en las que fuerza y aceleraci´on s´ı son paralelas: cuando F es paralela a u, y cuando F es perpendicular a u. Si F es paralela a u la ecuaci´on (3.49) da: F F uu − m mc2 ¡ ¢F = 1 − u2 /c2 m 3 ¡ ¢ F = 1 − u2 /c2 2 m0

a =

para F k u

Ahora, si F y u son perpendiculares, la ecuaci´on (3.49) da: a =

F m 84

(3.50)

=

¡ ¢ F 1 − u2 /c2 m0

para F ⊥ u

(3.51)

La f´ormula (3.50) se usa en el caso de los aceleradores lineales. La f´ormula (3.51) se usa en los ciclotrones y, en general, siempre que una carga el´ectrica se mueva en un lugar donde hay un campo magn´etico uniforme.

3.9

Movimiento circular

Estudiemos el movimiento de una part´ıcula en un plano en coordenadas polares (r, θ). El vector unitario 1r apunta en direcci´on de r, y el vector 1θ es perpendicular a r. Es bien sabido [?] que: dθ dr + 1θ r dt dt à µ µ ¶2 ! ¶ dr dθ d2 r d2 θ dθ + 1θ 2r +r 2 a = 1r −r dt2 dt dt dt dt

u = 1r

Si colocamos este resultado en la ecuaci´on general (3.49) se obtiene à 1r

d2 r −r dt2

µ

dθ dt

¶2 !

µ ¶ dr dθ d2 θ F·u F + 1θ 2r +r 2 = − u dt dt dt m mc2

(3.52)

Pensemos ahora que se presentan estas condiciones: E = 0, B es uniforme y una part´ıcula ingresa con una velocidad u que es perpendicular a B. La u fuerza sobre la part´ıcula es q × B. Esta fuerza es perpendicular a u y la c ecuaci´on (3.49) dice que la aceleraci´on tambi´en es perpendicular a u. En conclusi´on, la fuerza ocasiona un cambio constante en la direcci´on de u sin que cambie u, resultando as´ı un movimiento circular uniforme. Es claro que dr d2 r d2 θ = 2 = 2 = 0, y la ecuaci´on (3.52) queda: dt dt dt µ −1r r µ r

dθ dt dθ dt

¶2 =

q u×B mc

=

|q|Bu mc

¶2

85

Ahora, r

dθ = u, entonces dt u2 r

=

r =

|q|Bu mc muc |q|B

(3.53)

Part´ıcula preparada en un filtro de velocidades. La f´ormula (3.53) se puede escribir: r=

m0 c u q |q|B 1 − u2 /c2

(3.54)

Esta f´ormula es u ´til si u es dado. Tal es el caso cuando, antes de entrar en el campo B, la part´ıcula es preparada en un filtro de velocidades. Sabemos [?] que un filtro de velocidades se construye con campos E1 y B1 perpendiculares. Una part´ıcula de carga q y velocidad u experimenta una fuerza dada 1 1 por q(E1 + u1 × B1 ). Esta fuerza es cero si E1 + u1 × B1 = 0, es decir, c c si u1 × B1 = −E1 . Las u ´nicas part´ıculas cargadas que siguen derecho, sin desviarse, son aquellas que ingresan al filtro con una velocidad cuya magnitud es c E1 /B1 y cuya direcci´on es perpendicular a E1 y a B1 . Pensemos en una part´ıcula que emerge de este filtro de velocidades y luego entra en la regi´on donde existe el campo B. Hacemos entonces u = cE1 /B1 en la ecuaci´on (3.54):

r=

E1 /B1 m0 c2 p : |q|B 1 − (E1 /B1 )2

C´alculo relativista

(3.55)

En este momento nos preguntamos cu´al ser´ıa el radio si hici´eramos el c´alculo de acuerdo con la f´ısica prerrelativista. Para contestar esta pregunta basta que tomemos en la ecuaci´on (3.55) la aproximaci´ on u2 /c2 ¿ 1, es decir, 2 (E1 /B1 ) ¿ 1:

r=

m0 c2 E1 : |q|BB1

C´alculo prerrelativista 86

(3.56)

Part´ıcula preparada en un acelerador. De acuerdo con la f´ormula (3.53): r=

pc |q|B

(3.57)

p De otro lado, traigamos de la p´agina 68 la f´ormula pc = (m0 c2 + K)2 − (m0 c2 )2 . Si usamos este valor de pc en la ecuaci´on (3.57) encontramos r=

1 p (m0 c2 + K)2 − (m0 c2 )2 |q|B

(3.58)

Esta f´ormula es u ´til cuando K es dado. Tal es el caso si, antes de entrar en el campo B, la part´ıcula es preparada en un acelerador. Supongamos que una part´ıcula de carga q es acelerada a trav´es de una diferencia de potencial ∆V ; de acuerdo con la ecuaci´on (3.45) se tiene K = −q∆V = |q∆V |, entonces: r =

=

1 p (m0 c2 + |q∆V |)2 − (m0 c2 )2 |q|B s p 2m0 c2 |q∆V | |q∆V | 1+ |q|B 2m0 c2

(3.59)

Nos preguntamos de nuevo cu´al habr´ıa sido r si hubi´eramos hecho el c´alculo usando la f´ısica prerrelativista. Basta que en la ecuaci´on (3.59) se haga la |q∆V | aproximaci´on u2 /c2 ¿ 1, es decir, ¿1: m0 c2 p 2m0 c2 |q∆V | r= : |q|B

C´alculo prerrelativista

(3.60)

Ejemplo. Considere un filtro de velocidades construido con un campo magn´etico de 2000 gauss y un campo el´ectrico de 1800 statvolt/cm. Un electr´on emerge de este filtro y entra en una regi´on donde hay un campo magn´etico de 1500 gauss (al entrar en esta regi´on la velocidad del electr´on es perpendicular al campo de 1500 gauss). Calcule el radio del c´ırculo descrito por el electr´on de dos maneras: usando la teor´ıa de la relatividad y usando la f´ısica prerrelativista. Las cantidades f´ısicas de este problema son: 87

m0 c2 = 0.511 MeV,

|q| = 4.8 × 10−10 esu

E1 = 1800 statvolt/cm,

B1 = 2000 gauss,

B = 1500 gauss

(3.61)

La f´ormula (3.55) da, en este caso,

r =

0.511 MeV 1800/2000 s −10 µ ¶ 4.8 × 10 × 1500 dina 1800 2 1− 2000

Ahora, eV = 1.6 × 10−12 ergio, o sea que eV/dina = 1.6 × 10−12 cm

(3.62)

r = 2.35 cm

(3.63)

C´alculo relativista.

Para el c´alculo prerrelativista usamos la ecuaci´on (3.56), y se obtiene: r = 1.02 cm

C´alculo prerrelativista.

(3.64)

La comparaci´on entre las ecuaciones (3.63) y (3.64) muestra que el resultado relativista es mayor que el prerrelativista. La causa de esto no es dif´ıcil de rastrear; en efecto, la diferencia entre los dos c´alculos est´a en la ra´ız cuadrada en el denominador de la ecuaci´on (3.55), que es justamente el que causa el crecimiento de la masa de una part´ıcula en la teor´ıa de la relatividad. Se esperaba que el resultado del c´alculo relativista fuera mayor que el prerrelativista, porque en el primero la part´ıcula es m´as masiva que en el segundo, y esto debe notarse como una ampliaci´on del c´ırculo. Ejemplo. Un prot´on se acelera desde el reposo a trav´es de una diferencia de potencial de 5 MV y luego ingresa en una regi´on donde hay un campo magn´etico de 30000 gauss. Calcular el radio del c´ırculo de acuerdo con la teor´ıa de la relatividad, y luego usando la f´ısica prerrelativista. La masa del prot´on es 938 MeV/c2 . Las cantidades f´ısicas de este problema son: 88

m0 c2 = 938 MeV,

|q| = 4.8 × 10−10 esu

B = 30000 gauss,

|q∆V | = 5 MeV

Con estas cantidades la f´ormula (3.59) es: p

2 × 938 × 5 × (MeV)2 r = 4.8 × 10−10 × 30000 dina

r 1+

5 2 × 938

Usar la f´ormula (3.62): √ r = 10.76 1 + 0.0027 cm = 10.77 cm

(3.65)

El c´alculo prerrelativista se hace con la ecuaci´on (3.60). El resultado da como en la ecuaci´on (3.65), pero sin la ra´ız cuadrada: r = 10.76 cm :

C´alculo prerrelativista.

(3.66)

De nuevo, el resultado (3.65) es mayor que (3.66) porque la part´ıcula tiene mayor masa en la relatividad especial.

ux B

uy ux

uy

A uy

ux uy

ux

Figura 3.1 El choque de dos part´ıculas seg´ un lo registra un observador O que est´a en reposo respecto al centro de masa. La part´ıcula A va de derecha a izquierda y la part´ıcula B de izquierda a derecha. ux y uy son cantidades positivas.

89

u'By

u'Bx u'Bx

u'By

u'Ay

u'Ax u'Ax

u'Ay

Figura 3.2 El mismo choque de la Figura 3.1, seg´ un lo registra otro observador O0 que viaja hacia la derecha con velocidad v.

m

p

e

e

n

n

u

u

c

c

Figura 3.3 La masa como funci´on de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Figura 3.4 El momentum como funci´on de la velocidad. La versi´on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

90

K

e

E e

n

n

u

u

c

c

Figura 3.5 Energ´ıa cin´etica en funci´ on de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Figura 3.6 La energ´ıa total como funci´on de la velocidad. La versi´ on newtoniana tiene la marca n, y la einsteiniana tiene la marca e.

Después

Antes mo

mo u

M0, reposo

u

A

B

Figura 3.7 El choque de dos part´ıculas de masas iguales, de acuerdo con un observador O que est´a en reposo respecto al centro de masa. Antes del choque las part´ıculas tienen velocidad u . El choque deja como resultado un cuerpo final en reposo de masa M0 . Claramente la energ´ıa cin´etica final es cero: para O la colisi´on es completamente inel´astica.

Después

Antes Reposo u' A

u

M0

B

Figura 3.8 El mismo choque de la Figura 3.7, pero ahora desde el punto de vista de un observador O0 que se mueve hacia la derecha con velocidad u . Para O0 , antes del choque el cuerpo A est´a en reposo y el cuerpo B tiene velocidad u0 hacia la izquierda. Despu´es del choque el cuerpo final M0 tiene velocidad u hacia la izquierda.

91

92

Cap´ıtulo 4

El campo electromagn´ etico En los cap´ıtulos anteriores discutimos algunas consecuencias del principio de la relatividad. De un lado, nos vimos poco menos que obligados a generalizar los conceptos newtonianos de masa, momentum, energ´ıa, etc. Y de otro lado, cuando dos observadores inerciales toman medidas de longitud, tiempo, fuerza, etc., el principio de la relatividad nos mostr´o de qu´e manera se establece una comparaci´on entre las dos mediciones. El cap´ıtulo presente se refiere a la segunda clase de consecuencias: estudiaremos c´omo se comparan los campos el´ectrico y magn´etico que registra un observador, con los registros de otro observador. El tema es de primera importancia, como lo demuestra el hecho de que el mismo Einstein, en el primer p´arrafo del art´ıculo [2] en que publica su relatividad especial, presenta as´ı la motivaci´ on, la idea central de su trabajo: las leyes del electromagnetismo deben ser, en el fondo, las mismas para todos los observadores inerciales1 . Concentraremos nuestra atenci´on en la transformaci´on del campo electromagn´etico, y presentaremos dos ejemplos interesantes: la carga m´ovil y el alambre que porta una corriente. Finalmente veremos que la electrodin´amica cumple el principio de la relatividad, es decir, que las ecuaciones de Maxwell y la ley de fuerza de Lorentz son covariantes bajo las transformaciones de Lorentz.

4.1

Transformaci´ on de los campos E y B

De acuerdo con el observador O, las componentes del campo electromagn´etico son E, B. El mismo campo electromagn´etico tiene, para O0 , componentes 1 El art´ıculo lleva por t´ıtulo Sobre la electrodin´ amica de cuerpos en movimiento. La palabra cuerpo quiere decir observador inercial.

93

E0 , B0 . Nos proponemos encontrar la transformaci´on entre E, B y E0 , B0 ; es decir, vamos a encontrar las f´ormulas que nos permiten escribir las componentes E0 , B0 en t´erminos de las componentes E, B. Para hallar las f´ormulas de la transformaci´on del campo electromagn´etico asumiremos que las ecuaciones de Maxwell representan fielmente a las leyes f´ısicas del electromagnetismo. De acuerdo con el principio de la relatividad (1.10), la forma de estas ecuaciones debe ser la misma para todos los observadores inerciales. Tomemos dos de las ecuaciones de Maxwell: 1 ∂E c ∂t 1 ∂B c ∂t

= ∇×B

(4.1)

= −∇ × E

(4.2)

As´ı son para el observador O. Siguiendo el principio de la relatividad, afirmamos que para O0 : 1 ∂E0 c ∂t0 1 ∂B0 c ∂t0

= ∇0 × B0

(4.3)

= −∇0 × E0

(4.4)

1 ∂t Ey = ∂z Bx − ∂x Bz c

(4.5)

La parte y de la ecuaci´on (4.1) es:

As´ı mismo, la parte z de (4.2) y la parte z de (4.1) son: 1 ∂t Bz = ∂y Ex − ∂x Ey c 1 ∂t Ez = ∂x By − ∂y Bx c

(4.6) (4.7)

Las ecuaciones de O0 que corresponden a (4.5), (4.6) y (4.7) son: 1 ∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 c 94

(4.8)

1 ∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 c 1 ∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 c

(4.9) (4.10)

Ahora ponemos las cuatro derivadas (1.44) en las ecuaciones (4.5)-(4.7) para obtener: ³ 1 ∂t0 γ Ey − c ³ 1 ∂t0 γ Bz − c ³ 1 ∂t0 γ Ez + c

³ v ´ v ´ = ∂z 0 Bx − ∂x0 γ Bz − Ey Bz c c ´ ³ v v ´ Ey = ∂y0 Ex − ∂x0 γ Ey − Bz c c ³ ´ ´ v v By = ∂x0 γ By + Ez − ∂y0 Bx c c

(4.11) (4.12) (4.13)

Al comparar las ecuaciones (4.8) y (4.11) vemos que Ey0 debe ser proporcional v a γ(Ey − Bz ), que Bx0 debe ser proporcional a Bx , y que Bz0 debe ser c v proporcional a γ(Bz − Ey ). Llamemos f al factor de proporcionalidad. c Esta f debe ser independiente de t, x, y, z, pero puede, en principio, ser funci´on de v: ³ v ´ Ey0 = f (v)γ Ey − Bz c Bx0 = f (v)Bx ³ v ´ Bz0 = f (v)γ Bz − Ey c

(4.14) (4.15) (4.16)

De la misma manera, la comparaci´on de las ecuaciones (4.9) y (4.12) da: ³ v ´ Bz0 = g(v)γ Bz − Ey c Ex0 = g(v)Ex ³ v ´ Ey0 = g(v)γ Ey − Ez , c

(4.17) (4.18) (4.19)

donde g(v) es alg´ un factor de proporcionalidad. Finalmente, introduciendo otro factor h(v), la comparaci´on de las ecuaciones (4.10) y (4.13) da: 95

³ v ´ Ez0 = h(v)γ Ez + By c ³ v ´ By0 = h(v)γ By + Ez c Bx0 = h(v)Bx

(4.20) (4.21) (4.22)

Las ecuaciones (4.16) y (4.17) dicen que g = f , y las ecuaciones (4.15) y (4.22) dicen que h = f . De este modo vemos que las seis componentes del campo electromagn´etico transforman as´ı : Ex0 = f (v)Ex ³ Ey0 = f (v)γ Ey − ³ Ez0 = f (v)γ Ez +

Bx0 = f (v)Bx ³ By0 = f (v)γ By + ³ Bz0 = f (v)γ Bz −

´

v Bz c v ´ By c

´

v Ez c v ´ Ey c

(4.23) (4.24) (4.25)

(4.26) (4.27) (4.28)

Nos queda por averiguar la funci´on desconocida f (v). Anticip´ andonos al resultado final, afirmamos que f (v) es igual a 1. Para probar esto seguiremos tres pasos: primero probaremos que f (v) = f (−v), luego probaremos que f (v) = ±1, y finalmente escogeremos el signo superior +. Supongamos por un momento que Ey = 0; en este caso la ecuaci´on (4.28) da: Bz0 = f (v)γBz

(4.29)

Ahora pensemos en un tercer observador O00 que se mueve, respecto a O, con velocidad v en direcci´on −x. En vista de la ecuaci´on (4.29): Bz00 = f (−v)γBz 96

(4.30)

Claramente Bz0 y Bz00 deben ser iguales, entonces la comparaci´on de las ecuaciones (4.29) y (4.30) da: f (−v) = f (v)

(4.31)

Pasemos ahora a escribir las rec´ıprocas de las ecuaciones (4.24) y (4.28). Para tal efecto intercambiamos variables primadas con no primadas y cambiamos v por −v: ³ Ey = f (−v)γ Ey0 + ³ Bz = f (−v)γ Bz0 +

v 0´ B c z v 0´ E , c y

y en vista de (4.31): ³ Ey = f (v)γ Ey0 + ³ Bz = f (v)γ Bz0 +

v 0´ B c z v 0´ E c y

Entonces, colocando estas expresiones de Ey y Bz en el lado derecho de (4.24) encontramos: h³ v ´ v³ 0 v ´i Ey0 + Bz0 − Bz + Ey0 c c c µ ¶ v2 = f 2 γ 2 1 − 2 Ey0 , c

Ey0 = f 2 γ 2

o sea que f 2 = 1: f = ±1

(4.32)

Las ecuaciones (4.23) y (4.32) dicen que Ex0 = ±Ex . El signo inferior, −, expresa una inversi´on del campo, que es incre´ıble. Entonces en la ecuaci´on (4.32) debemos escoger el signo superior, f = 1, y las ecuaciones (4.23)(4.28) son, finalmente: 97

Ex0 = Ex ³ Ey0 = γ Ey − ³ 0 Ez = γ Ez + Bx0 = Bx ³ By0 = γ By + ³ Bz0 = γ Bz −

´

v Bz c v ´ By c ´

v Ez c v ´ Ey c

(4.33) (4.34) (4.35) (4.36) (4.37) (4.38)

Estas seis ecuaciones de transformaci´on se pueden escribir de un modo m´as general, as´ı: v ×B c v = B + (γ − 1)B⊥ − γ × E c

E0 = E + (γ − 1)E⊥ + γ

(4.39)

B0

(4.40)

La ecuaci´on (4.39) dice que el campo E0 se construye con dos aportes: de un v lado, el campo E, y del otro lado el campo inducido (γ − 1)E⊥ + γ × B. c As´ı mismo, la ecuaci´on (4.40) dice que el campo B0 se construye con dos aportes: de un lado, el campo B, y del otro lado el campo inducido (γ − v 1)B⊥ − γ × E . Fijemos nuestra atenci´on en los campos inducidos. c Lo primero que debemos notar es que el campo inducido depende crucialmente de la velocidad v, ya que es cero cuando v es cero, y es una funci´on mon´otonamente creciente de v. Por esto debemos acostumbrarnos a pensar que el campo inducido es inducido por v: es el movimiento de O0 lo que hace aparecer un campo inducido en O0 . Pero no basta que O0 se est´e moviendo respecto a O. Se requiere adem´as que en O haya campos perpendiculares B⊥ o E⊥ , seg´ un se lee en las ecuaciones (4.39) y (4.40). Son los campos perpendiculares en O los que inducen campos en O0 . Los campos paralelos Ek y Bk no inducen campos en O0 . Las seis ecuaciones (4.33)-(4.38) expresan a los campos primados en t´erminos de los no primados. Las ecuaciones rec´ıprocas se obtienen intercambiando variables primadas y no primadas, y cambiando v por −v: 98

Ex = Ex0 ³ Ey = γ Ey0 + ³ Ez = γ Ez0 −

v 0 B c z v 0´ B c y

Bx = Bx0 ³ By = γ By0 − ³ Bz = γ Bz0 +

v 0´ E c z v 0´ E c y

´

(4.41) (4.42) (4.43) (4.44) (4.45) (4.46)

Escribimos tambi´en las rec´ıprocas de las ecuaciones (4.39) y (4.40): v × B0 c v B = B0 + (γ − 1)B0⊥ + γ × E0 c E = E0 + (γ − 1)E0⊥ − γ

4.2

(4.47) (4.48)

Dos cantidades invariantes

En esta secci´on nos proponemos demostrar que las cantidades E·B y E 2 −B 2 son invariantes, es decir, que: E · B = E0 · B0

(4.49)

E 2 − B 2 = E 02 − B 02

(4.50)

Para probar la ecuaci´on (4.49) comenzamos escribiendo el producto E0 ·B0 en la forma Ex0 Bx0 +Ey0 By0 +Ez0 Bz0 . Ahora procedemos a expresar esta cantidad en t´erminos de variables no primadas, para lo cual utilizamos las seis ecuaciones (4.33)-(4.38): E0 · B0 = Ex0 Bx0 + Ey0 By0 + Ez0 Bz0 ³ v ´ v ´³ = Ex Bx + γ 2 Ey − Bz By + Ez c c 99

³ v ´³ v ´ +γ 2 Ez + By Bz − Ey c c = Ex Bx + Ey By + Ez Bz = E·B De la misma manera se prueba la ecuaci´on (4.50): comenzamos escribiendo E 02 − B 02 en la forma Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 , y luego procedemos a expresar esta cantidad en t´erminos de variables no primadas, para lo cual utilizamos las seis ecuaciones (4.33)-(4.38): E 02 − B 02 = Ex02 + Ey02 + Ez02 − Bx02 − By02 − Bz02 =

³ ³ v ´2 Ex2 + γ 2 Ey − Bz + γ 2 Ez + c ³ ³ v ´2 −Bx02 − γ 2 By + Ez − γ 2 Bz − c

v ´2 By c v ´2 Ey c

= E2 − B2 Usaremos las cantidades E = |E| y B = |B|; es claro que E y B son mayores o iguales a cero. La ecuaci´on (4.50) tiene varias consecuencias interesantes: E < B ⇐⇒ E 0 < B 0

(4.51)

B < E ⇐⇒ B 0 < E 0

(4.52)

E = B ⇐⇒ E 0 = B 0

(4.53)

Estas tres implicaciones, en palabras, rezan: Si uno de los campos (bien sea el el´ectrico o el magn´etico) es menor que el otro en un sistema de referencia, lo ser´a tambi´en en todos los otros sistemas de referencia. Si los dos campos son de igual magnitud para un observador, ser´an de igual magnitud para todos los observadores.

100

La existencia de dos cantidades invariantes, E·B y E 2 −B 2 , no es accidental, sino que responde a la existencia de simetr´ıas de fondo, como veremos en la secci´on 6.6.

4.3

El campo electromagn´ etico total

Supongamos que para el observador O0 el campo electromagn´etico aparece puramente el´ectrico, es decir, B0 = 0. ¿C´omo aparece el campo electromagn´etico para otro observador O que se mueve, respecto a O0 , con velocidad −v ? La respuesta se obtiene haciendo B0 = 0 en las f´ormulas (4.47) y (4.48):

E = E0k + γE0⊥ B = γ

v × E0⊥ c

(4.54) (4.55)

La ecuaci´on (4.55) muestra que para O existe, en general, campo magn´etico. Vemos as´ı que un campo electromagn´etico que es puramente el´ectrico para un observador aparece, a otros observadores, en general, como una mezcla de campos el´ectrico y magn´etico. Del mismo modo, cuando un campo electromagn´etico es puramente magn´etico para un observador, otros observadores registran un campo magn´etico y adem´as un campo el´ectrico. Esto nos recuerda los primeros p´arrafos del Cap´ıtulo 2, donde consider´abamos dos eventos con separaci´on puramente espacial o puramente temporal, para un observador. Apunt´abamos en esa ocasi´on que para otros observadores los eventos aparecen, en general, con separaciones espacial y temporal. Y conclu´ıamos entonces que el espacio y el tiempo no son entidades independientes, sino que forman un todo. Del mismo modo nosotros, ahora hablando del campo electromagn´etico, afirmamos que los campos el´ectrico y magn´etico no son independientes uno del otro, sino que forman un todo electromagn´etico que es irreductible. Cada observador inercial puede establecer un corte, un lindero, entre su campo el´ectrico y su campo magn´etico, pero el lindero que establece O es diferente al que establece O0 . 101

4.4

Una carga con velocidad uniforme

Para mostrar una aplicaci´on de la transformaci´on (4.41)-(4.46), queremos resolver un problema cl´asico de electromagnetismo, que consiste en averiguar los campos el´ectrico y magn´etico que produce una carga que tiene velocidad rectil´ınea uniforme u . Este problema se puede resolver [9] por medio de los potenciales de Li´enard-Wiechert, en los que se tiene en cuenta que la se˜ nal electromagn´etica toma cierto tiempo para viajar desde la part´ıcula hasta el punto de observaci´on, lo que hace necesario que se usen tiempos retardados. Este modo de atacar el problema es complicado. En esta secci´on lo resolveremos muy f´acilmente, utilizando nuestros conocimientos de relatividad. La estrategia es resolver inicialmente el problema de acuerdo con un observador inercial O0 en reposo respecto a la part´ıcula; una vez obtenidos E0 , B0 , utilizamos las seis ecuaciones (4.41)-(4.46) para averiguar los campos E, B que registra otro observador que se mueve, respecto al anterior, con velocidad constante −u . Para O0 el fen´omeno es muy simple. Como la carga est´a en reposo, no hay campo magn´etico B0 , y el campo el´ectrico E0 es el de Coulomb: B0 = 0 E0 =

(4.56)

q 1r0 r02

Aqu´ı, 1r0 es un vector unitario que apunta en la direcci´on de r0 . Claramente r0 qr0 1r0 = 0 y el campo el´ectrico es E0 = 03 . Las tres componentes cartesianas r r de este campo son: Ex0 =

qx0 ; r03

Ey0 =

qy 0 ; r03

Ez0 =

qz 0 r03

(4.57)

Tal como hemos indicado, O0 se mueve respecto a O con velocidad u . N´ otese que esta u est´a jugando el papel que siempre le hemos asignado a v , lo que quiere decir que el γ de la ecuaci´on (1.32) ahora quiere decir 1

γ=p

1 − u2 /c2

102

(4.58)

En este momento suponemos que el eje x est´ a orientado paralelo a la velocidad u de la part´ıcula, y podemos colocar los campos primados (4.56) y (4.57) en las seis ecuaciones (4.41)-(4.46) para obtener: qx0 r03 γqy 0 Ey = 03 r γqz 0 Ez = 03 r

Ex =

Bx = 0 quγ z 0 c r03 quγ y 0 Bz = c r03

By = −

Estos son los campos para el observador O. Debemos, sin embargo, pulir estas expresiones para que contengan u ´nicamente variables no primadas, utilizando las transformaciones de Lorentz (1.33). Al ejecutar esta tarea se debe recordar que r03 = (x02 + y 02 + z 02 )3/2 = [γ 2 (x − ut)2 + y 2 + z 2 ]3/2 : qγ(x − ut) − ut)2 + y 2 + z 2 ]3/2 qγy Ey = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2 qγz Ez = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2

Ex =

[γ 2 (x

(4.59)

Bx = 0 quγ z c By = − 2 [γ (x − ut)2 + y 2 + z 2 ]3/2 quγ y c By = 2 [γ (x − ut)2 + y 2 + z 2 ]3/2

(4.60)

La Figura 4.1 muestra el campo E para u = 0; n´otese que E es radial e isotr´opico. La Figura 4.2 es para u 6= 0: el campo E es radial (respecto a la posici´on de la part´ıcula) pero no es isotr´opico. El flujo de energ´ıa. La densidad de energ´ıa por unidad de volumen es ¢ 1 ¡ (campo el´ectrico)2 + (campo magn´etico)2 de donde vemos que tanto 8π 103

para O0 como para O, hay energ´ıa electromagn´etica. Ahora, como para O0 la carga est´a en reposo, la energ´ıa electromagn´etica tambi´en est´a en reposo. Sin embargo, para O la part´ıcula se mueve y este observador deber´ıa registrar que la energ´ıa electromagn´etica fluye. La cantidad adecuada para describir el flujo de la energ´ıa electromagn´etica es el vector de Poynting: S=

c E×B 4π

(4.61)

S es la cantidad de energ´ıa electromagn´etica que, por unidad de tiempo, cruza la unidad de ´area perpendicular. Utilizando las seis ecuaciones (4.59) y (4.60) obtenemos:

S=

q 2 uγ 2 (y 2 + z 2 )1x − (x − ut)(y1y + z1z ) 4π [γ 2 (x − ut)2 + y 2 + z 2 ]3

Podemos especializar esta f´ormula en z = 0:

S=

4.5

q 2 uγ 2 y 2 1x − (x − ut)y1y 4π [γ 2 (x − ut)2 + y 2 ]3

(4.62)

Un alambre recto con corriente

A continuaci´on vamos a estudiar [6] lo que ocurre con un alambre recto que porta una corriente, desde el punto de vista de la relatividad. Llegaremos a un resultado interesante: si el alambre aparece neutro para un observador, entonces aparece cargado para otros observadores. Para comprender este efecto es importante que nos demos cuenta del modo como est´an repartidas las part´ıculas cargadas dentro de un metal. Los iones positivos forman una red aproximadamente inm´ovil, y algunos electrones forman un fluido que viaja, que se cuela a trav´es de la malla r´ıgida, cuando hay una diferencia de potencial. La Figura 4.3 muestra un modelo para entender la corriente en un alambre recto, de acuerdo con un observador O que se encuentra en reposo respecto a los iones positivos. Los electrones se mueven hacia la derecha con una velocidad u, o sea que la corriente el´ectrica va hacia la izquierda. 104

Supongamos que para O el alambre es neutro. Esto quiere decir que las cargas positivas y negativas son equidistantes. Sin embargo, el fen´omeno debe aparecer diferente a otro observador O0 que se mueve con velocidad u hacia la derecha, seg´ un muestra la Figura 4.4. En esta figura aparecen, en l´ıneas punteadas, las trayectorias de los iones y de los electrones. N´otese que para O0 la distancia entre electrones es mayor que la distancia entre iones positivos. Esto quiere decir que, para O0 , la densidad de carga positiva por unidad de longitud es mayor que la densidad negativa: el alambre que es neutro para O es cargado para O0 . Estudio formal. Veamos de qu´e manera las ecuaciones de la teor´ıa de la relatividad dan cuenta del fen´omeno que acabamos de describir cualitativamente. Llamemos d0+ y d − a las densidades de carga positiva y negativa, seg´ un el observador O. N´otese el sub´ındice cero en la densidad positiva, acentuando que para O las cargas positivas est´an en reposo. Claramente, d0+ > 0 , d − < 0

(4.63)

Para el observador O0 los electrones est´an en reposo y forman una densidad de carga d0− , y los iones positivos tienen una velocidad u y forman una densidad de carga d + . Claramente, d0− < 0 , d + > 0

(4.64)

Para O la densidad neta es: d = d0+ + d −

(4.65)

mientras que la densidad neta para O0 es d0 = d + + d0− Ahora, de acuerdo con2 la ecuaci´on (2.24): 2

Aqu´ı tambi´en γ est´ a dada por la ecuaci´ on (4.58).

105

(4.66)

d + = γd0+

(4.67)

d − = γd0− ,

(4.68)

entonces las ecuaciones (4.65) y (4.66) son: d = d0+ + γd0−

(4.69)

d0 = γd0+ + d0−

(4.70)

d0 = d + (γ − 1)(d0+ − d0− )

(4.71)

N´otese que

Recordemos, de acuerdo con las f´ormulas (4.63) y (4.64), que d0+ y −d0− son cantidades positivas, entonces la ecuaci´on (4.71) dice que d0 > d: la densidad de carga por unidad de longitud es mayor para O0 que para O. Si d = 0, entonces la ecuaci´on (4.69) da d0− = −d0+ /γ, y las ecuaciones (4.68) y (4.71) se convierten en: d − = −d0+

(4.72)

d0 = (γ − γ −1 )d0+

(4.73)

Los campos. Pasemos ahora a calcular los campos el´ectrico y magn´etico. Pensemos en el problema general de un alambre recto que tiene cierta carga por unidad de longitud; es bien sabido que el campo el´ectrico a una distancia R del alambre est´a dado por: campo el´ectrico =

2 × carga por unidad de longitud R

(4.74)

y si el alambre porta una corriente se usa la ley de Biot-Savart: campo magn´etico =

2 × corriente cR

Apliquemos las f´ormulas (4.74) y (4.75) al observador O: 106

(4.75)

E = 0

(4.76)

B = −

2ud − cR

,

donde hemos puesto el signo − para que la magnitud B resulte positiva. En vista de la ecuaci´on (4.72): B=

2ud0+ cR

(4.77)

Tambi´en podemos usar las f´ormulas (4.74) y (4.75) para el observador O0 : E0 = B0 =

2d0 R 2ud + , cR

y en vista de las ecuaciones (4.73) y (4.67):

E0 = B0 =

2(γ − γ −1 )d0+ R + 2γud0 cR

(4.78) (4.79)

Finalmente, conviene anotar que las ecuaciones (4.76), (4.77), (4.78) y (4.79) satisfacen las reglas de transformaci´on (4.34) y (4.38). Esta es una peque˜ na prueba de consistencia de nuestra teor´ıa relativista del electromagnetismo. Circuitos. Hemos estudiado un alambre recto que, para O, es neutro y porta una corriente el´ectrica hacia la izquierda; para O0 el alambre aparece cargado positivamente. As´ı mismo, si para O la corriente es hacia la izquierda, entonces para O0 el alambre aparece cargado negativamente. Pensemos ahora en un circuito rectangular que porta una corriente el´ectrica, como en la Figura 4.5. Para O0 , el lado CD est´ a cargado positivamente y el lado AB negativamente, dando como resultado [?] un momento dipolar el´ectrico que apunta hacia arriba. El observador O0 puede leg´ıtimamente concluir que los circuitos el´ectricos que se mueven tienen momento dipolar el´ectrico. 107

4.6

Anulando el campo menor

Hemos visto que los valores de los campos el´ectrico y magn´etico dependen del estado de movimiento del observador. Nos preguntamos ahora si para alg´ un observador se vuelve cero alguno de los dos campos. Si para alg´ un observador el campo el´ectrico (magn´etico) es cero, decimos que el campo el´ectrico (magn´etico) es anulable. R´apidamente nos damos cuenta de qu´e condiciones se deben cumplir para que un campo sea anulable. Supongamos por ejemplo que el campo magn´etico es anulable y llamemos O0 al observador que registra que el campo magn´etico es cero: B0 = 0. Esta ecuaci´on implica que E0 · B0 = 0 y que B 0 < E 0 . Pero, de acuerdo con (4.49) y (4.52), estas dos propiedades son invariantes, de donde podemos concluir que, para cualquier observador, el producto escalar de los dos campos es cero y el campo magn´etico es menor que el el´ectrico. Un resultado similar se obtiene cuando el campo el´ectrico es anulable. Tambi´en abordaremos el asunto importante de identificar al observador O0 para el cual uno de los dos campos es nulo. Para identificar a O0 basta decir cu´al es la velocidad v que O0 tiene respecto a O . Anulaci´ on del campo magn´ etico. Suponiendo que para O0 el campo magn´etico se anula, podemos escribir B0 = 0 y la ecuaci´on (4.40) queda as´ı: B + (γ − 1)B⊥ − γ

v ×E = 0 c

(4.80)

En ambos lados de esta ecuaci´on multiplicamos escalarmente con v : v · B + (γ − 1)v · B⊥ − γv ·

v ×E = 0 c

Esta ecuaci´on es v · B + 0 − 0 = 0, o sea que v es perpendicular a B. Entonces B⊥ = B, y la ecuaci´on (4.80) se simplifica: B =

v ×E c

(4.81)

B =

vE sen α c

(4.82)

108

v sen α = c

B E

(4.83)

Aqu´ı α es el ´angulo entre E y v . La Figura 4.6 muestra los campos E y B perpendiculares, y adem´as al vector v que es perpendicular a B. Claramente existe un n´ umero infinito de vectores v que satisfacen la ecuaci´on (4.83). Esto quiere decir que cuando B < E y E es ortogonal a B, hay un n´ umero infinito de observadores inerciales para los cuales el campo magn´etico se anula. on del campo el´ectrico es Anulaci´ on del campo el´ ectrico. La anulaci´ muy parecida a la del campo magn´etico. Suponiendo que para O0 el campo el´ectrico se anula, podemos escribir E0 = 0 y la ecuaci´on (4.39) queda as´ı: E + (γ − 1)E⊥ + γ

v ×E = 0 c

(4.84)

En ambos lados de esta ecuaci´on multiplicamos escalarmente con v : v · E + (γ − 1)v · E⊥ + γv ·

v ×B = 0 c

Esta ecuaci´on es v · E + 0 − 0 = 0, o sea que v es perpendicular a E. Entonces E⊥ = E, y la ecuaci´on (4.80) se simplifica: v ×B c

(4.85)

vB sen β c

(4.86)

E B

(4.87)

E = − E = v sen β = c

Aqu´ı β es el ´angulo entre B y v . La Figura 4.7 muestra los campos E y B perpendiculares, y adem´as al vector v que es perpendicular a E. Claramente existe un n´ umero infinito de vectores v que satisfacen la ecuaci´on (4.87). Esto quiere decir que cuando E < B y E es ortogonal a B, hay un n´ umero infinito de observadores inerciales para los cuales el campo el´ectrico se anula. 109

Conclusi´ on. La anulaci´ on de un campo puede darse cuando se cumplen estas dos condiciones: que sean perpendiculares entre s´ı y que no tengan la misma magnitud; de los dos campos, el menor es anulable y el otro no. Si E es anulable, v tiene que ser perpendicular a E ; as´ı mismo, si B es anulable, v tiene que ser perpendicular a B . En resumen, v debe ser perpendicular al campo menor. La luz no es anulable. Una de las peculiaridades de la luz es que, en todo punto r y en cualquier instante t, los campos el´ectrico y magn´etico tienen la misma magnitud. Como B ≮ E, el campo magn´etico no es anulable, y como E ≮ B, el campo el´ectrico tampoco es anulable.

4.7

La corriente el´ ectrica

Estudi´abamos en la p´agina 43 una nube de part´ıculas cargadas, y llam´abamos u a la trivelocidad promedio de una peque˜ na porci´on de la nube. El trivector J se define as´ı: J = ρu ,

(4.88)

y en vista de (2.25): J =

V0

nqu

p

1 − u2 /c2

(4.89)

La magnitud de J es la cantidad de carga que, por unidad de tiempo, cruza una unidad de ´area perpendicular a u. Llamemos r al vector posici´on del peque˜ no volumen de nube que estamos estudiando. Claramente u = dr/dt, y en consecuencia la ecuaci´on (4.89) queda as´ı: J =

nq p dr V0 dt 1 − u2 /c2

(4.90)

De otro lado, multiplicando ambos lados de la ecuaci´on (2.25) por c llegamos a nq q ρc = cdt (4.91) V0 dt 1 − u2 /c2 En los denominadores de las dos u ´ltimas ecuaciones reconocemos el tiempo propio dτ : 110

ρc =

nq cdt , V0 dτ

nq dr V0 dτ

J =

nq es un escalar. Esto es V0 dτ importante porque indica que las cuatro cantidades (cρ, J) transforman, bajo un cambio de coordenadas, as´ı como transforman los cuatro diferenciales (cdt, dr). M´as concretamente, podemos utilizar las ecuaciones (1.34) para escribir Notemos que en estas expresiones el quebrado

4.8

ρ =

v ρ0 + 2 Jx0 c p 1 − v 2 /c2

(4.92)

Jx =

J 0 + vρ0 px 1 − v 2 /c2

(4.93)

Jy = Jy0

(4.94)

Jz = Jz0

(4.95)

Covariancia de la electrodin´ amica

Tenemos confianza en que las ecuaciones de Maxwell y la ley de Fuerza de Lorentz representan leyes de la naturaleza. Entonces, de acuerdo con el principio de la relatividad (1.10), las ecuaciones de Maxwell y la ley de fuerza de Lorentz deben ser covariantes cuando se pasa de un observador inercial a otro. En esta secci´on probaremos tal covariancia. Comenzaremos con las ecuaciones de Maxwell, que son: ∇×E+

1 ∂B c ∂t

= 0

∇×B−

1 ∂E c ∂t

=

4π J c

(4.96) (4.97)

∇·B = 0

(4.98)

∇ · E = 4πρ,

(4.99)

y luego seguiremos con la fuerza de Lorentz: ³ ´ u F=q E+ ×B c 111

(4.100)

Covariancia de las ecuaciones de Maxwell. Para el observador O0 las ecuaciones de Maxwell son: ∇0 × E0 +

1 ∂B0 c ∂t0

= 0

∇0 × B0 −

1 ∂E0 c ∂t0

=

4π 0 J c

(4.101) (4.102)

∇0 · B0 = 0

(4.103)

∇0 · E0 = 4πρ0

(4.104)

Para probar la covariancia debemos demostrar que las ecuaciones (4.96)(4.99) implican las ecuaciones (4.101)-(4.104). Comencemos separando, en (4.96) y (4.97), las partes que son paralelas y perpendiculares a v : ¶ µ 1 ∂B = 0 ∇×E+ c ∂t ⊥ µ ¶ 1 ∂E 4π ∇×B− − J = 0 c ∂t c ⊥ µ ¶ 1 ∂B ∇×E+ = 0 c ∂t k ∇·B = 0 µ ¶ 1 ∂E 4π ∇×B− − J = 0 c ∂t c k ∇ · E = 4πρ

(4.105) (4.106) (4.107) (4.108) (4.109) (4.110)

Para realizar los c´alculos concretamente, usamos coordenadas cartesianas y llamamos x a la direcci´on de v . Las ocho ecuaciones (4.105)-(4.110) son: 1 ∂z Ex − ∂x Ez + ∂t By = 0 c 1 ∂x Ey − ∂y Ex + ∂t Bz = 0 c 4π 1 Jy ∂z Bx − ∂x Bz − ∂t Ey = c c 112

(4.111) (4.112) (4.113)

1 ∂x By − ∂y Bx − ∂t Ez = c

4π Jz c

(4.114)

1 ∂y Ez − ∂z Ey + ∂t Bx = 0 c

(4.115)

∂x Bx + ∂y By + ∂z Bz = 0

(4.116)

1 ∂y Bz − ∂z By − ∂t Ex = c

4π Jx c

∂x Ex + ∂y Ey + ∂z Ez = 4πρ

(4.117) (4.118)

Las ocho ecuaciones primadas correspondientes son: 1 ∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 c 1 ∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 c 1 ∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 c 1 ∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 c

= 0

(4.119)

= 0

(4.120)

= =

4π 0 J c y 4π 0 J c z

(4.121) (4.122)

1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = 0 c

(4.123)

∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0 = 0

(4.124)

1 ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 = c

4π 0 J c x

∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 = 4πρ0

(4.125) (4.126)

En las ocho ecuaciones (4.111)-(4.118) vamos a cambiar todas las variables no primadas por variables primadas, utilizando: las cuatro ecuaciones (1.44), las seis ecuaciones (4.41)-(4.46), y las cuatro ecuaciones (4.92)-(4.95). Se obtienen estas ocho ecuaciones que proceden, una a una, de las ocho ecuaciones (4.111)-(4.118): 1 ∂z 0 Ex0 − ∂x0 Ez0 + ∂t0 By0 = 0 c 113

(4.127)

1 ∂x0 Ey0 − ∂y0 Ex0 + ∂t0 Bz0 = 0 c 1 4π 0 ∂z 0 Bx0 − ∂x0 Bz0 − ∂t0 Ey0 = J c c y 1 4π 0 ∂x0 By0 − ∂y0 Bx0 − ∂t0 Ez0 = J c c z 1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = c 1 ∂y0 Ez0 − ∂z 0 Ey0 + ∂t0 Bx0 = c

v c c v

(4.128) (4.129) (4.130)

¡ ¢ ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0

(4.131)

¡ ¢ ∂x0 Bx0 + ∂y0 By0 + ∂z 0 Bz0

(4.132)

¢ v¡ 1 ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 c c 4π 0 v = Jx + 4πρ0 c c ¡ ¢ 1 c ∂y0 Bz0 − ∂z 0 By0 − ∂t0 Ex0 + ∂x0 Ex0 + ∂y0 Ey0 + ∂z 0 Ez0 c v c 4π 0 J + 4πρ0 = c x v

(4.133)

(4.134)

Obs´ervese que las ecuaciones (4.119) y (4.127) son iguales, que (4.120) y (4.128) son iguales, que (4.121) y (4.129) son iguales y que (4.122) y (4.130) son iguales. Obs´ervese que (4.123) y (4.131) no son iguales y que (4.124) y (4.132) no son iguales. Pero el conjunto de las dos ecuaciones (4.131), (4.132) implica el conjunto de las dos ecuaciones (4.123), (4.124). As´ı mismo (4.125) y (4.133) no son iguales; (4.126) y (4.134) no son iguales. Pero el conjunto de las dos ecuaciones (4.133), (4.134) implica el conjunto de las dos ecuaciones (4.125), (4.126). En conclusi´on, las ecuaciones de Maxwell no primadas implican el conjunto de las ecuaciones primadas. O sea que las ecuaciones de Maxwell son covariantes bajo el grupo de las transformaciones de la relatividad especial, satisfaci´endose as´ı el principio de la relatividad. Covariancia de la fuerza de Lorentz. Ahora pasamos a demostrar la covariancia de la fuerza de Lorentz, ecuaci´on (4.100). Para el observador O0 se debe cumplir que: µ ¶ u0 0 0 0 F =q E + ×B (4.135) c 114

Podemos desplegar las tres partes de esta ecuaci´on: µ ¶ 1 0 0 1 0 0 0 = q Ex + uy Bz − uz By c c µ ¶ 1 1 Fy0 = q Ey0 + u0z Bx0 − u0x Bz0 c c µ ¶ 1 0 0 1 0 0 0 0 Fz = q Ez + ux By − uy Bx c c

Fx0

(4.136) (4.137) (4.138)

As´ı mismo las tres partes de la ecuaci´on (4.100) son: µ ¶ 1 1 Fx = q Ex + uy Bz − uz By c c µ ¶ 1 1 Fy = q Ey + uz Bx − ux Bz c c µ ¶ 1 1 Fz = q Ez + ux By − uy Bx c c

(4.139) (4.140) (4.141)

Debemos probar que las tres ecuaciones (4.136)-(4.138) implican las ecuaciones (4.139)-(4.141), y para tal efecto debemos expresar las tres primeras ecuaciones en t´erminos de variables no primadas. Utilicemos entonces las tres ecuaciones (2.35)-(2.37), las tres3 ecuaciones (3.42)-(3.44) y las seis ecuaciones (4.33)-(4.38). Entonces la ecuaci´on (4.136) se convierte en (4.139), la ecuaci´on (4.137) deviene (4.140) y la ecuaci´on (4.138) se vuelve (4.141). Queda as´ı demostrada la covariancia de la fuerza de Lorentz.

3

Al utilizar la ecuaci´ on (3.42) se debe tener en cuenta que ³ ´ u u · F = u · q E + × B = qu · E c

115

ut

Figura 4.1 El campo el´ectrico para un observador que est´a en reposo respecto a una carga positiva. Las l´ıneas del campo son radiales e is´otropas.

Figura 4.2 El campo el´ectrico de una carga que tiene velocidad constante. Las l´ıneas del campo son radiales, mas no is´otropas.

ct'

x'

x

Figura 4.3 Un alambre recto que porta corriente el´ectrica, seg´ un un observador en reposo respecto a los iones positivos. Los electrones se mueven hacia la derecha.

Figura 4.4 L´ıneas en el mundo de los iones positivos (trazos punteados verticales) y de los electrones (trazos punteados inclinados). Para O, la distancia entre electrones contiguos es igual a la distancia entre iones positivos contiguos. Para O0 , la distancia entre electrones es mayor que la distancia entre iones.

116

+ + + +

C

D

i

B

A

Figura 4.5 Un circuito el´ectrico. Para un observador que viaje hacia la derecha, el lado CD est´a cargado positivamente y el lado AB negativamente, dando como resultado un momento dipolar el´ectrico que apunta hacia arriba.

E

E a

v v

b B

B

Figura 4.6 Campos E y B perpendiculares, con B < E . Otro observador O0 tiene velocidad v con inclinaci´on α . Las variables v y α se pueden ajustar de modo que B 0 sea cero.

Figura 4.7 Campos E y B perpendiculares, con E < B . Otro observador O0 tiene velocidad v con inclinaci´on β . Las variables v y β se pueden ajustar de modo que E 0 sea cero.

117

118

Cap´ıtulo 5

Tensores en la relatividad especial El prop´osito de este cap´ıtulo es darle a la relatividad especial una presentaci´on formal, tensorial. Hemos visto que el espacio y el tiempo se unen para formar un ente mayor, el espaciotiempo; y los campos el´ectrico y magn´etico no son objetos separados, sino que forman una totalidad electromagn´etica. En este cap´ıtulo expresaremos estas uniones, y otras tambi´en, en una notaci´on condensada que se adec´ ua a las necesidades y exigencias de la f´ısica te´orica. Debemos advertir, sin embargo, que en este tratamiento hay algo m´as que notaci´on compacta y elegante: hay, sobre todo, una visi´on profunda y geom´etrica de la relatividad especial.

5.1

Sub´ındices y super´ındices

Tal como hemos descrito varias veces, el observador O consta de una malla tridimensional de relojes, uno en cada punto. Suponemos adem´as que este observador erige un sistema cartesiano de coordenadas, de modo que cada evento tiene cuatro coordenadas xµ , as´ı: (x0 , x1 , x2 , x3 ) = (ct, x, y, z) Los ´ındices griegos, como por ejemplo µ, van de cero a tres: µ = 0, 1, 2, 3 . En algunas escasas ocasiones desearemos ir u ´nicamente de uno a tres, y entonces usaremos ´ındices latinos, como por ejemplo a = 1, 2, 3 . Siempre seguiremos la convenci´on de Einstein: cuando en un mismo t´ermino aparece dos veces un ´ındice, se supone que hay una suma sobre los cuatro (o tres) valores que puede tomar ese ´ındice. Pensemos ahora en el intervalo que hay entre el origen de coordenadas 119

(0,0,0,0) y el evento (x0 , x1 , x2 , x3 ) . De acuerdo con la definici´on (2.1) este intervalo viene dado por: (∆s)2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2

(5.1)

Si definimos la matriz 

ηµν

1

   0  =   0   0

0 −1

0 0

0

−1

0

0

0



  0     0   

(5.2)

−1

la ecuaci´on (5.1) se escribe: (∆s)2 = ηµν xµ xν

(5.3)

Ahora definimos η µν como la inversa de ηµν : η µλ ηλν = δ µ ν

(5.4)

Claramente esta inversa es 

η µν

1

   0  =   0   0

0

0

−1

0

0

−1

0

0

0



  0     0   

(5.5)

−1

A partir de las cuatro cantidades xµ y la matriz ηµν definimos otras cuatro cantidades xµ de la manera siguiente: 120

xµ = ηµλ xλ

(5.6)

Escribamos en detalle las cuatro componentes xµ y las cuatro componentes xµ : xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z)

(5.7)

xµ = (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z)

(5.8)

xµ = η µλ xλ

(5.9)

N´otese que

Las ecuaciones (5.6) y (5.9) dicen que ηµλ sirve para bajar un super´ındice y η µλ sirve para subir un sub´ındice. Ahora, a η µλ tambi´en se le puede bajar el super´ındice λ , para lo cual basta multiplicarlo por ηλν :

η µλ ηλν = η µ ν Comparando esto con la ecuaci´on (5.4) llegamos a ηµν = δµν

(5.10)

Consideremos ahora este conjunto de 16 cantidades: (−Bx , 0, Ez , −Bz , 0, Ex , −By , 0, −Ey , Bx , −Ex , By , −Ez , 0, Bz , Ey ) , el cual organizamos en este arreglo cuadrado: 

F

µν

0

   Ex  =   Ey   Ez

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

121

−Ez



  By     −Bx    0

(5.11)

Si queremos bajar el super´ındice µ multiplicamos por ηλµ , as´ı: Fλ ν = ηλµ F µν : 

Fλ ν

1

   0  =    0   0

0

0

0

−1

0

0

−1

0

0 



0

−Ex −Ey

   0    Ex    0    Ey  Ez

−1

0

−Ex −Ey

   −Ex 0   =   −Ey −Bz   −Ez

Bz 0

By

0

−Bz

Bz

0

−By

Bx

−Ez

−Ez



  By     −Bx    0



  −By     Bx   

−Bx

0

Si adem´as queremos bajar el super´ındice ν multiplicamos Fλ ν por ηρν , as´ı: Fλρ = ηρν Fλ ν = ηνρ Fλ ν = Fλ ν ηνρ . Ejecutemos pues el producto Fλ ν ηνρ : 

Fλρ

0

−Ex −Ey

   −Ex 0  =    −Ey −Bz   −Ez

0 −Bx 0

   −Ex  =    −Ey   −Ez



1

0

   −By   0    Bx   0 

Bz

By 

−Ez

0

0

Ex

Ey

0

−Bz

Bz

0

−By

Bx

122

Ez

−1

0

0

−1

0

0



  By     −Bx    0

0

0



  0     0    −1

El asunto de subir y bajar ´ındices no tiene complicaci´on. Por ejemplo: Aα β γ

= ηνβ Aανγ

Aαβγ

= η νβ Aα ν γ

∂ µ = η µν ∂ν ∂ν

= ηµν ∂ µ

dxµ = ηµν dxν Cuando un ´ındice aparece una sola vez en un t´ermino, decimos que es libre. Por ejemplo, en B µ Cν los ´ındices µ y ν son libres. Si una misma letra aparece dos veces en un t´ermino, como super´ındice y como sub´ındice, decimos que se trata de ´ındices contra´ıdos. Por ejemplo, en B µ Cµ los ´ındices µ est´ an contra´ıdos. Reunamos las formas diferentes que conocemos de escribir la ecuaci´on del intervalo (5.1): (∆s)2 = (∆x0 )2 − (∆x1 )2 − (∆x2 )2 − (∆x3 )2 = η µν ∆xµ ∆xν = ηµν ∆xµ ∆xν =

5.2

∆xµ ∆xµ

Los vectores

El observador O0 consta de otra malla infinita de relojes primados y erige otro sistema de ejes cartesianos. Diremos que un evento que tiene coordenadas xµ para el observador O , tiene coordenadas x0µ para el observador O0 : (x00 , x01 , x02 , x03 ) = (ct0 , x0 , y 0 , z 0 ) Pensamos que O0 tiene velocidad constante v respecto a O y que, en cierto 123

instante, los or´ıgenes de O y O0 coinciden. En el instante de la coincidencia se cuadran en t = 0 y t0 = 0 , respectivamente, los dos relojes que est´an en los or´ıgenes de O y O0 . Los ejes cartesianos de O y O0 se orientan de modo que los ejes x y x0 son siempre paralelos, los y y y 0 son siempre paralelos y tambi´en los ejes z y z 0 . Cada una de las coordenadas primadas x0µ debe ser funci´on de las no primadas xν : x0µ = x0µ (xν )

(5.12)

p Llamemos β = v/c y γ = 1/ 1 − β 2 y supongamos que el desplazamiento es a lo largo del eje com´ un x x0 ; de acuerdo con las ecuaciones (1.33), las coordenadas primadas y no primadas est´an conectadas por las transformaciones de Lorentz: x00 = γ(x0 − βx1 ) x01 = γ(x1 − βx0 ) x02 = x2

(5.13)

x03 = x3 Calculemos las diez y seis derivadas ∂x0µ /∂xν ; diez de estas derivadas son cero, y las seis no nulas son: ∂x00 /∂x0 = ∂x01 /∂x1 = γ , ∂x00 /∂x1 = ∂x01 /∂x0 = −γβ , ∂x02 /∂x2 = ∂x03 /∂x3 = 1 . Es muy importante que reconozcamos que todas las diez y seis derivadas son constantes, propiedad1 que usaremos crucialmente m´as tarde, en el paso de (5.42) a (5.43). Por el momento tomemos diferenciales en ambos lados de (5.12) para obtener dx0µ =

∂x0µ ν dx ∂xν

Ahora integrar, teniendo en cuenta que 1

(5.14)

∂x0µ es constante: ∂xν

Debemos dejar claro que las diez y seis derivadas son constantes no s´ olo en la transformaci´ on particular (5.13), sino en cualquier transformaci´ on de Lorentz. En efecto, un vistazo a las ecuaciones (1.35) nos muestra que las derivadas son constantes, en general, para cualquier transformaci´ on de Lorentz.

124

x0µ =

∂x0µ ν x . ∂xν

xµ =

∂xµ 0ν x ∂x0ν

As´ı mismo:

(5.15) (5.16)

Pensemos enseguida en un conjunto de cuatro cantidades que en las coordenadas no primadas aparecen como Aµ , mientras que en las coordenadas primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano cu´al es la relaci´on entre las A0µ y las Aµ . Pero si ocurre que A0µ =

∂x0µ ν A , ∂xν

(5.17)

entonces decimos que A es un vector. Comparando (5.17) con (5.15) nos damos cuenta de que A transforma como x, porque en ambas ecuaciones ∂x0µ se usan los mismos coeficientes . Las cuatro cantidades xµ constituyen, ∂xν por definici´on, el vector prototipo. Decimos que A es un vector porque transforma como el vector prototipo (obs´ervese que uno no prueba que x es un vector). El concepto de vector aparece inseparablemente ligado al concepto de las transformaciones de coordenadas. Que A sea un vector no es una propiedad intr´ınseca de A; no podemos decir que A es un vector por s´ı s´olo, sino que el car´acter vectorial de A es una propiedad que tiene A en referencia a la transformaci´on de coordenadas xµ → x0µ . No cualquier conjunto de cuatro cantidades, aunque se rotulen con ´ındices, es un vector. Si la velocidad del observador O0 respecto a O es v , la transformaci´on del vector debe ser como en las f´ormulas (1.35): µ ¶ 1 0 A =γ A − v ·A c µ ¶ γ−1 γ 0 0 A =A+ v ·A− A v v2 c 00

(5.18)

Las cuatro cantidades xµ se llaman las componentes contravariantes del vector x , y xµ se llaman las componentes covariantes. El concepto de vector es m´as abstracto que el concepto de componentes, y decimos que el vector x se puede representar de dos maneras; bien sea por medio de sus componentes 125

contravariantes xµ , o por medio de sus componentes covariantes xµ . Del mismo modo, el vector A se caracteriza por medio de sus componentes contravariantes Aµ , o por medio de sus componentes covariantes Aµ . As´ı como en las f´ormulas (5.7) y (5.8), escribimos ahora Aµ = (A0 , A1 , A2 , A3 ) =

(A0 , Ax , Ay , Az )

= (A0 , A)

(5.19)

Aµ = (A0 , A1 , A2 , A3 ) = (A0 , −Ax , −Ay , −Az ) = (A0 , −A) (5.20) Transformaci´ on de las componentes Aµ . Ya que sabemos que las componentes contravariantes Aµ transforman seg´ un (5.17), pasemos a averiguar de qu´e manera transforman las componentes covariantes Aµ . Pero para llevar a efecto esa tarea es preciso deducir antes una identidad importante. Lo primero es reescribir la ecuaci´on (2.2) en nuestra notaci´on compacta: µ

ηµν xµ xν = ηµν x0 x0

ν

(5.21)

Esta ecuaci´on dice que, para calcular intervalos, todos los observadores inerciales usan la misma matriz ηµν . La ecuaci´on (5.21) es, obviamente: ηµν xµ xν

λ

ρ

= ηλρ x0 x0 . = ηλρ

Utilizar (5.15):

∂x0λ ∂x0ρ µ ν x x ; ∂xµ ∂xν

reunir todo en el lado izquierdo: µ ¶ ∂x0λ ∂x0ρ ηµν − ηλρ xµ xν = 0 ∂xµ ∂xν Como esta ecuaci´on debe ser v´alida para todos los eventos, la cantidad dentro del par´entesis debe ser cero:

ηλρ

∂x0λ ∂x0ρ = ηµν ∂xµ ∂xν 126

(5.22)

Ahora multiplicar ambos lados de esta ecuaci´on por η νπ y utilizar la ecuaci´on (5.10): ∂x0ρ ∂x0λ νπ η η = δµ π λρ ∂xµ ∂xν

(5.23)

Como las coordenadas xη son independientes, podemos afirmar que ∂xπ = δµ π ∂xµ

(5.24)

Ahora, de acuerdo con la regla de la derivaci´ on en cadena, ∂xπ ∂x0λ ∂xπ = , ∂xµ ∂xµ ∂x0λ o sea que la ecuaci´on (5.24) es: ∂x0λ ∂xπ = δµ π ∂xµ ∂x0λ

(5.25)

Igualemos entonces los lados izquierdos de las ecuaciones (5.23) y (5.25): ∂x0λ νπ ∂x0ρ ∂x0λ ∂xπ η η = , λρ ∂xµ ∂xν ∂xµ ∂x0λ y multipliquemos ambos lados de esta ecuaci´on por

∂xµ : ∂x0ω

∂xµ ∂x0λ νπ ∂x0ρ ∂xµ ∂x0λ ∂xπ η ηλρ = 0ω µ ν ∂x ∂x ∂x ∂x0ω ∂xµ ∂x0λ En ambos lados de esta ecuaci´on aparece el factor la derivaci´on en cadena dice que ecuaci´on (5.26) es

(5.26)

∂xµ ∂x0λ ; la regla de ∂x0ω ∂xµ

∂xµ ∂x0λ ∂x0λ = = δω λ , o sea que la ∂x0ω ∂xµ ∂x0ω 127

δω λ η νπ ηλρ

∂x0ρ ∂xν

= δω λ

η νπ ηωρ

∂x0ρ ∂xν

=

∂xπ ∂x0λ

∂xπ ∂x0ω

(5.27)

Esta es la ecuaci´on importante que quer´ıamos deducir. Ahora multiplicar ambos lados por Aπ : ηωρ

∂x0ρ ν ∂xπ A = Aπ ∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuaci´on (5.17) para obtener: ηωρ A0ρ =

∂xπ Aπ ∂x0ω

Ya hab´ıamos indicado, justo despu´es de la ecuaci´on (5.21), que todos los observadores inerciales usan la misma matriz η , lo que quiere decir que O0 utiliza a η para subir y bajar ´ındices. De aqu´ı vemos que ηωρ A0ρ debe ser A0ω , y la u ´ltima ecuaci´on es, finalmente: A0ω =

∂xπ Aπ ∂x0ω

(5.28)

Este es el modo como transforman las componentes covariantes de cualquier vector A . Por supuesto que las componentes xµ transforman de la misma manera: x0ω =

5.3

∂xπ xπ ∂x0ω

(5.29)

Otros tensores

Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De acuerdo con la regla de transformaci´on (5.17), las componentes contravariantes de A y B transforman as´ı: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β . Multipliquemos lado a lado estas dos ecuaciones para obtener: 128

∂x0µ ∂x0ν α β A B ∂xα ∂xβ

A0µ B 0ν =

Los tensores de rango 2 se definen por comparaci´on con la u ´ltima ecuaci´on: T es un tensor de rango 2 si ∂x0µ ∂x0ν αβ T ∂xα ∂xβ

T 0µν =

(5.30)

Las componentes contravariantes de T transforman como Aµ B ν ; de la misma manera, las componentes covariantes de T transforman como Aµ Bν : 0 Tµν =

∂xα ∂xβ Tαβ , ∂x0µ ∂x0ν

(5.31)

y las componentes mixtas transforman como Aµ Bν : T 0µ ν =

∂x0µ ∂xβ α T β, ∂xα ∂x0ν

(5.32)

T0 µ ν =

∂xα ∂x0ν Tα β ∂x0µ ∂xβ

(5.33)

y como Aµ B ν :

Generalizamos diciendo que los tensores de rango j tienen j ´ındices, es decir, 4j cantidades. Los tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se llaman vectores. Algunas de las componentes de un tensor C de rango 3 transforman as´ı: C 0 µνδ =

∂x0µ ∂x0ν ∂x0δ αβγ C ∂xα ∂xβ ∂xγ

C 0 µνδ =

∂xα ∂xβ ∂xγ Cαβγ ∂x0µ ∂x0ν ∂x0δ

C0 µ ν δ =

∂xα ∂x0ν ∂xγ Cα β γ ∂x0µ ∂xβ ∂x0δ 129

Finalmente, un tensor de rango 4: A0µνσ ρ =

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ A γ ∂xα ∂xβ ∂xλ ∂x0ρ

(5.34)

En este momento es conveniente que hagamos una pausa y reconsideremos la ∂x0ν notaci´on que estamos usando. El uso de las derivadas recarga, sin duda, ∂xβ la escritura, y podemos preguntarnos si vale la pena toda esta complicaci´on. La pregunta est´a justificada, ya que todas estas derivadas son constantes en este cap´ıtulo y uno podr´ıa reducir la notaci´on. No queremos reducirla, porque nuestro deseo es que el presente cap´ıtulo sirva de pre´ambulo al cap´ıtulo 9: all´ı las derivadas no ser´an constantes. Las transformaciones inversas. Hasta el momento hemos presentado la manera de averiguar las componentes primadas de un tensor en t´erminos de las no primadas. El camino inverso -las no primadas en t´erminos de las primadas- es muy f´acil. Multipliquemos ambos lados de la ecuaci´on (5.17) ∂xα por , con lo que se llega a: ∂x0µ ∂xα 0µ ∂xα ∂x0µ ν A = A = δ α ν Aν = Aα ∂x0µ ∂x0µ ∂xν Hemos obtenido: Aµ =

∂xµ 0ν A . ∂x0ν

Aµ =

∂x0ν 0 A ∂xµ ν

As´ı mismo:

Esto para tensores de rango 1. Para los de rango 2: T µν

=

∂xµ ∂xν 0αβ T ∂x0α ∂x0β

Tµν

=

∂x0α ∂x0β 0 T ∂xµ ∂xν αβ 130

Tµ ν

=

∂xµ ∂x0β 0α T β ∂x0α ∂xν

ν

=

∂x0α ∂xν 0 β T ∂xµ ∂x0β α

T

µ

Y los de rango 3:

C µνδ =

∂xµ ∂xν ∂xδ 0αβγ C ∂x0α ∂x0β ∂x0γ

C µνδ =

∂x0α ∂x0β ∂x0γ 0 C ∂xµ ∂xν ∂xδ αβγ

Cµνδ =

∂x0α ∂xν ∂x0γ 0 β C γ ∂xµ ∂x0β ∂xδ α

La importancia del vector xµ . Gran parte de la estructura de los tensores se fundamenta en el vector prototipo xµ . En efecto: 1) En la ecuaci´on (5.17) hemos definido los vectores, en general, por comparaci´on con xµ y, 2) en esta secci´on hemos construido tensores de rangos 0, 2, y 3 a partir de vectores. En general, un tensor de rango j > 0 transforma como transforma el producto de j vectores. Contracci´ on de ´ındices. Estudiemos la estructura Aµ Bµ , cuando A y B son vectores. Usando las reglas de transformaci´on (5.17) y (5.28) escribimos

A0µ B 0 µ =

∂x0µ ∂xβ α A Bβ ∂xα ∂x0µ

∂x0µ ∂xβ ∂xβ Ahora, la regla de la derivaci´on en cadena dice que = , en∂xα ∂x0µ ∂xα tonces: A0µ B 0 µ =

∂xβ α A Bβ = δα β Aα Bβ = Aα Bα ∂xα

O sea que A0µ B 0 µ = Aµ Bµ 131

(5.35)

En palabras, el producto Aµ Bµ es, en general, invariante y el intervalo xµ xµ es un caso particular. Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un tensor de rango 2. En efecto, si hacemos σ = ρ en la ecuaci´on (5.34) obtenemos ∂x0ρ ∂xγ ∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ A . Pero = δλ γ , entonces A0µνρ ρ = γ ∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ A0µνρ ρ =

∂x0µ ∂x0ν αβλ A λ, ∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con la ecuaci´on (5.30). En general, la contracci´ on de dos ´ındices en un tensor de rango j produce un tensor de rango j − 2. δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen∂x0ν zamos escribiendo δµ0 ν = y luego usamos la regla de la derivaci´ on en ∂x0µ cadena: ν

δµ0 =

∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α = = δβ , ∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de acuerdo con ecuaci´on (5.33). El tensor m´ etrico. Probemos ahora que η es un tensor. Para tal efecto recordemos que todos los observadores inerciales usan la misma η , o sea que, 0 en vez de η en la ecuaci´on (5.22), podemos escribir ηλρ λρ :

ηµν =

∂x0λ ∂x0ρ 0 η , ∂xµ ∂xν λρ

y ´esta es justamente la forma como transforman los tensores de segundo rango. Este es un tensor de primera importancia y recibe el nombre de tensor m´etrico, ya que, de acuerdo con la ecuaci´on (5.3), es el que ejecuta la distancia entre dos eventos. Una cosa es un espacio formado por una simple acumulaci´on de puntos. Un espacio m´etrico tiene adem´as una prescripci´on, 132

una regla, para establecer la distancia entre dos puntos, y el tensor m´etrico es el encargado de suministrar tal regla. Por esta raz´on decimos que el tensor m´etrico contiene toda la informaci´on acerca de la estructura geom´etrica de un espacio. El tensor de Levi-Civita. El tensor de Levi-Civita se define as´ı:

²αβγδ

 on par de 0123  +1 si αβγδ es una permutaci´ −1 si αβγδ es una permutaci´ on impar de 0123 =  0 si dos ´ındices son iguales

(5.36)

La prueba de que ²αβγδ es verdaderamente un tensor se encuentra f´acilmente en la literatura [11]. Cantidades sim´ etricas y antisim´ etricas. Sea S µν = S νµ , y sea Aµν = νµ −A . En palabras, S es sim´etrico bajo la permutaci´ on µ À ν y A es µν antisim´etrico. Consideremos la contracci´ on total S Aµν = −S νµ Aνµ = αβ −S Aαβ : S µν Aµν = −S αβ Aαβ

(5.37)

Si cambiamos α → µ y β → ν, el lado derecho de (5.37) se convierte en −S µν Aµν . La ecuaci´on (5.37) es entonces S µν Aµν = −S µν Aµν , es decir, S µν Aµν = 0

(5.38)

En palabras: la contracci´on total de una cantidad sim´etrica con otra antisim´etrica da cero. Esta afirmaci´on es verdadera en general, sin necesidad de exigir que S y A sean tensores. La derivada. Para la derivada se usa una notaci´on compacta: ¶ ∂ = ,∇ c ∂t µ ¶ µ ¶ ∂ ∂ ∂ ∂ ∂ = ,− ,− ,− = , −∇ c ∂t ∂x ∂y ∂z c ∂t

∂µ =

∂ = ∂xµ

∂µ =

∂ ∂xµ

µ

∂ ∂ ∂ ∂ , , , c ∂t ∂x ∂y ∂z

133



µ

(5.39)

(5.40)

El producto ∂ µ ∂µ = ∂ 0 ∂0 + ∂ a ∂a es: ∂ µ ∂µ =

1 ∂2 − ∇2 c2 ∂t2

(5.41)

Probemos que si φ es un escalar, entonces ∂µ φ es un vector. Comenzamos ∂ escribiendo ∂µ0 φ = φ y luego usamos la regla de la derivaci´ on en cadena: ∂x0µ ∂µ0 φ =

∂ ∂xν ∂ ∂xν φ = φ = ∂ν φ, ∂x0µ ∂x0µ ∂xν ∂x0µ

que es verdaderamente la manera como transforman los vectores, de acuerdo con la ecuaci´on (5.28). La derivada de un tensor es un tensor; para probarlo tomemos por ejem∂ plo ∂µ0 A0ν = A0ν y usemos la regla de la derivaci´ on en cadena: ∂x0µ ∂µ0 A0ν =

∂ ∂xα ∂ ∂xα 0ν 0ν A = A = ∂α A0ν ; ∂x0µ ∂x0µ ∂xα ∂x0µ

ahora usamos la ecuaci´on (5.17): ∂µ0 A0ν = No olvidemos que las

∂xα ∂x0ν β ∂ A α ∂x0µ ∂xβ

(5.42)

∂x0ν son constantes, entonces ∂xβ ∂µ0 A0ν =

∂xα ∂x0ν ∂α Aβ ; ∂x0µ ∂xβ

(5.43)

pero ´esta, seg´ un la ecuaci´on (5.33), es la manera como transforman los tensores de rango 2. Hemos probado as´ı que la derivada de un tensor es otro tensor2 . 2 M´ as tarde, en el cap´ıtulo 9, vamos a abandonar las transformaciones de Lorentz para estudiar las transformaciones generalizadas de coordenadas. En las transformaciones gen-

134

5.4

Matrices

Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ´ındices, respectivamente, es muy c´omoda la notaci´on matricial. Definamos la matriz cuadrada Λµ ν =

∂x0µ ∂xν

(5.44)

Con Λ podemos reescribir las ecuaciones (5.17) y (5.30): A0 µ = Λµ ν Aν F 0 µν

= Λµ α F αβ Λν β = Λµ α F αβ ΛT

β

ν

O m´as concisamente: A0 µ = Λ Aν

F 0 µν = Λ F αβ ΛT

Ocurre sin embargo que Λ resulta ser sim´etrica (ver (5.48)), entonces A0 µ = Λ Aν F 0 µν

(5.45)

= Λ F αβ Λ

(5.46)

Calculemos la matriz Λ para el caso particular de la transformaci´on (5.13): 

γ

   −γβ  Λ=   0   0

−γβ

0

γ

0

0

1

0

0

0



  0     0   

(5.47)

1

erales los coeficientes ∂x0ν /∂xβ no son constantes, y por consiguiente el paso de (5.42) a (5.43) es inv´ alido: v´ease el paso de la ecuaci´ on (9.29) a (9.30).

135

Esta matriz corresponde a las transformaciones (5.13), en las que la velocidad v es en la direcci´on del eje x. Para la transformaci´on m´as general (1.35) se obtiene: 

γ

    −γβx    Λ=   −γβ y      −γβz

−γβx 1 + (γ −

−γβy

β2 1) x2 β

(γ − 1)

βy βx β2

(γ − 1)

βz βx β2

(γ − 1)

βx βy β2

1 + (γ − 1)

(γ − 1)



−γβz

βy2 β2

βz βy β2

(γ − 1)

βx βz β2

(γ − 1)

βy βz β2

1 + (γ − 1)

              

βz2 β2 (5.48)

Tal como anunciamos arriba, esta matriz es sim´etrica. El diferencial de volumen: Para cualquier clase de transformaci´on de coordenadas (x, y, z, ...) → (u, v, w, ...) los diferenciales de volumen satisfacen [12] la ecuaci´on dx dy dz · ·· = J du dv dw · ··, donde J es el jacobiano de la transformaci´on, que es el determinante de la matriz formada con las derivadas ∂x/∂u , ∂x/∂v, etc. En nuestro caso el jacobiano es el determinante de Λ, entonces dx00 dx01 dx02 dx03 = (det Λ) dx0 dx1 dx2 dx3 . Ocurre que el determinante de Λ es 1 para todas las transformaciones de Lorentz. Esto se ve f´acilmente en la matriz (5.47) que corresponde a una velocidad v en direcci´on x. Para una v en cualquier direcci´on, la Λ viene dada por (5.48). El lector puede verificar que el determinante de (5.48) tambi´en es 1 . Concluimos entonces que para todas las transformaciones de Lorentz se cumple que dx00 dx01 dx02 dx03 = dx0 dx1 dx2 dx3 , lo que cortamente se escribe: d4 x0 = d4 x En palabras: el diferencial de volumen d4 x es un escalar.

136

(5.49)

Una cantidad invariante: Que el determinante de la matriz Λ sea 1 tiene otra consecuencia interesante: el determinante de F µν es invariante bajo el grupo de las transformaciones de Lorentz. Para probarlo tomemos determinante en ambos lados de la ecuaci´on (5.46), as´ı: det F 0 = det(ΛF Λ) = (det Λ)(det F )(det Λ)= det F : det F 0µν = det F µν

5.5

(5.50)

Ecuaciones tensoriales

En esta secci´on vamos a ver algunas propiedades importantes de las ecuaciones entre tensores. a) La m´as importante es que las ecuaciones tensoriales son autom´aticamente covariantes, es decir, tienen la misma forma en todos los observadores inerciales. Para ver esto consideremos por ejemplo la ecuaci´on Aµ ν = B µ Cν

(5.51)

Si A, B y C son tensores, podemos reemplazar Aµ ν = Bµ =

∂xµ ∂x0β 0α A β , ∂x0α ∂xν

∂xµ 0α ∂x0β 0 B y C = C en la ecuaci´on (5.51) para escribir ν ∂x0α ∂xν β ∂xµ ∂x0β 0α ∂xµ ∂x0β 0α 0 A = B Cβ β ∂x0α ∂xν ∂x0α ∂xν

Multiplicar ambos lados de esta ecuaci´on por

∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α 0 B Cβ ∂xµ ∂x0α ∂x0ρ ∂xν

δ σ α δ β ρ A0α β = δ σ α δ β ρ B 0α Cβ0 A0σ ρ = B 0σ Cρ0 137

(5.52)

Comparando (5.52) con (5.51) nos damos cuenta de que tienen la misma forma: (5.51) es una ecuaci´on covariante porque es la igualdad de dos tensores. Si queremos que se cumpla el principio de la relatividad, debemos expresar las leyes de la f´ısica mediante ecuaciones tensoriales. b) Supongamos que una ecuaci´on es v´alida en todos los sistemas inerciales. Pensemos que esta ecuaci´on tiene n elementos (factores o sumandos) y supongamos que n − 1 de ellos son tensores; entonces el otro elemento tambi´en tiene que ser tensor. Para mostrar que esto es cierto supongamos que la ecuaciones (5.51) y (5.52) son verdaderas y que A y C son tensores; probaremos que B tambi´en es tensor. ∂xµ ∂x0β 0α ∂x0β 0 Reemplazando Aµ ν = A , y C = C en (5.51) escribiν β ∂x0α ∂xν ∂xν β mos: ∂xµ ∂x0β 0α ∂x0β µ 0 A = B Cβ β ∂x0α ∂xν ∂xν Multiplicar ambos lados de esta ecuaci´on por ∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν δ σ α δ β ρ A0α β = A0σ ρ =

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xν ∂x0β µ 0 B Cβ ∂xµ ∂x0ρ ∂xν ∂x0σ β δ ρ B µ Cβ0 ∂xµ ∂x0σ µ 0 B Cρ ∂xµ

Comparando la u ´ltima ecuaci´on con (5.52) vemos que B 0σ =

∂x0σ µ B , ∂xµ

que es la forma como transforman los vectores: B es un vector, que es lo que nos propusimos demostrar. c) Las transformaciones de Lorentz (5.13) han sido corroboradas miles de 138

veces durante todo un siglo. Esto quiere decir que cuando se comparan las mediciones que O0 hace con sus reglas y relojes, con las mediciones que O hace con sus reglas y relojes, esas dos mediciones cumplen las relaciones (5.13). d) Si multiplicamos ambos lados de la ecuaci´on (5.51) por ηµσ obtenemos Aσν = Bσ Cν . As´ı mismo, al multiplicar ambos lados de (5.51) por η νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de Aµσ = B µ C σ por ηµν se obtiene Aν σ = Bν C σ . En conclusi´on, todas estas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y Aµ ν = Bµ C ν . Vemos as´ı que dos ´ındices libres e iguales en ambos lados de una ecuaci´on se pueden subir o bajar.

5.6

El principio de la relatividad

Este principio afirma que las leyes de la f´ısica deben ser las mismas en todos los sistemas inerciales. En otras palabras, todos los observadores inerciales son equivalentes. Este es un principio profundo, lleno de motivaci´ on filos´ofica y valor est´etico, pero debe ser traducido a t´erminos pr´acticos para que sea u ´til. Admitiendo que las transformaciones de Lorentz (TL) son, verdaderamente, las encargadas de relacionar las observaciones de dos sistemas de referencia inerciales, decimos que, de acuerdo con el Principio, las leyes de la f´ısica deben ser enunciados invariantes bajo las TL. Acabamos de ver que las ecuaciones tensoriales son autom´aticamente covariantes bajo las TL. Entonces terminamos en esta conclusi´on: el principio de la relatividad se satisface si las leyes de la f´ısica se expresan mediante ecuaciones tensoriales. El Principio no se reduce simplemente a la frase “las leyes de la f´ısica son ecuaciones tensoriales”, pero s´ı podemos afirmar que ´el gu´ıa el trabajo de la f´ısica al indicar el camino y el m´etodo que se debe seguir: utilizar ecuaciones tensoriales. Las cantidades f´ısicas deben ser componentes de tensores. Por ejemplo el campo el´ectrico hace parte del tensor electromagn´etico Fµν y la energ´ıa de una part´ıcula hace parte del cuadrivector momentum pµ . Ahora, hemos visto que los tensores de rango j tienen 4j componentes, lo que quiere decir que los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos as´ı que toda cantidad f´ısica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · miembros. Los 139

n´ umeros 1, 4, 16, 64 · · · son muy importantes para la f´ısica, porque indican los u ´nicos tama˜ nos que las familias pueden tener: no hay familias de 10, 15, 63 miembros.

5.7

Los tensores m0 , xµ , dτ, U µ , pµ , k µ y J µ

Durante todo este cap´ıtulo nos hemos dedicado b´asicamente a estudiar las propiedades tensoriales del grupo de las transformaciones lineales de coordenadas. Queremos ahora presentar, como ejemplos, los escalares y los tensores m´as importantes en problema del movimiento de una part´ıcula masiva. un la mide La masa en reposo. m0 es la masa de una part´ıcula, seg´ un observador para el cual la part´ıcula est´a en reposo. Esta constante es claramente un escalar. El vector posici´ on. Llamamos x a un evento de la trayectoria de una µ part´ıcula y x = (ct, x, y, z) a las coordenadas del evento x. N´otese que estamos cambiando la notaci´on, ya que antes hab´ıamos usado x para denotar, en general, los eventos del espaciotiempo. El lector se acostumbrar´ a a distinguir por el contexto cu´ando xµ son las coordenadas de un evento cualquiera o de un evento de una l´ınea en el mundo. p ηµν dxµ dxν es el intervalo a lo largo de la trayecEl tiempo propio dτ . toria de la part´ıcula. En caso de que la part´ıcula sea libre su velocidad es constante, y en consecuencia hay un observador inercial para el cual la part´ıcula est´a siempre en reposo; para p este observador el intervalo es puro tiempo, es el tiempo propio: c2 dτ 2 = ηµν dxµ dxν . Pero si la part´ıcula tiene aceleraci´on, un sistema de coordenadas que la acompa˜ ne permanentemente ser´ıa no inercial y, por lo tanto, no podr´ıa usarse en pla relatividad especial. Sin embargo vamos a ver que la f´ormula c2 dτ 2 = ηµν dxµ dxν sigue siendo v´alida si el s´ımbolo dτ adquiere un significado ligeramente diferente del que ten´ıa hace un par de renglones. Pensamos en una porci´on infinitesimal de trayectoria durante la cual la velocidad se puede considerar aproximadamente constante. En esa porci´on infinitesimal de trayectoria hay un observador inercial para el cual la part´ıcula est´a aproximadamente en reposo. Para este observador la porci´on de trayectoria es puramente temporaloide, y dura un tiempo propio p que llamaremos dτ . Claramente c2 dτ 2 = ηµν dxµ dxν . En conclusi´on, esta f´ormula es v´alida para part´ıculas libres y aceleradas; aqu´ı dτ es el tiempo 140

propio que registra un observador inercial que acompa˜ na moment´ aneamente a la part´ıcula; dτ es un escalar. La velocidad. Una vez aclarado el significado de dτ pasamos a definir la velocidad: Uµ =

dxµ dτ

(5.53)

Ya que dxµ y dτ son tensores, concluimos que U µ es tambi´en un tensor. Sus componentes son: µ ¶ c dt dx dy dz µ U = , , , dτ dτ dτ dτ p Pero dτ = dt 1 − u2 /c2 , entonces à µ

U =

p

c 1 − u2 /c2

u

, p

! (5.54)

1 − u2 /c2

De acuerdo con la ecuaci´on (5.35) la cantidad U µ Uµ es escalar. Averig¨ uemos cu´anto vale: U µ Uµ = U 0 U0 − U a Ua = c2

(5.55)

El momentum. Ahora definimos el momentum de una part´ıcula: pµ = m0 U µ

(5.56)

Obviamente es un tensor, ya que es el producto de dos tensores. Calculemos pµ pµ = m20 U µ Uµ usando (5.55): pµ pµ = (m0 c)2

(5.57)

Con (5.54) y (5.56) podemos escribir las componentes de pµ : Ã p

µ

=

p

m0 c 1 − u2 /c2 141

, p

m0 u 1 − u2 /c2

!

= (mc , mu)

(5.58)

= (E/c , p)

(5.59)

Utilizamos esta ecuaci´on para calcular el producto pµ pµ : pµ pµ = E 2 /c2 − p2

(5.60)

Al igualar los lados derechos de (5.57) y (5.60) escribimos, finalmente, E=

p

(m0 c2 )2 + (pc)2

(5.61)

Esta es la misma ecuaci´on (3.15). Queremos presentar una u ´ltima f´ormula que combina la velocidad, la energ´ıa y el momentum. Las ecuaci´on (5.56) dice que pν = m dxν /dt; pero m = E/c2 , entonces pν = (E/c2 ) (dxν /dt), o sea que c2 ν dxν = p dt E

(5.62)

Esta f´ormula, aunque es una mezcla inusual de vectores y cantidades no tensoriales, mostrar´a su utilidad cuando veamos las corrientes en el cap´ıtulo 7. El momentum del fot´ on. Para part´ıculas de masa cero, como el fot´on, el momentum se denomina k ν . Si se trata de un pulso de luz que se propaga en direcci´on del vector unitario n, escribimos k = |k| n. Las ecuaciones de pν se simplifican considerablemente: k µ kµ = 0 |k| = E/c kµ =

E (1, n) c

142

(5.63) (5.64) (5.65)

La corriente el´ ectrica. Ya hab´ıamos demostrado en la p´agina 111 que (ρc, J) transforma como un vector, al que llamaremos J µ : J µ = (ρc, J)

5.8

(5.66)

Aberraci´ on de la luz y efecto Doppler

Pensemos en un pulso de luz. Respecto al observador O tiene energ´ıa E y se propaga en direcci´on del vector unitario n. Respecto a O la energ´ıa es E 0 y se propaga en direcci´on n0 . La ecuaciones (5.18) son, en este caso: k

00

k0

µ ¶ 1 0 = γ k − v ·k c ¶ µ γ−1 γ 0 = k+ v ·k− k v v2 c

En vista de (5.65), estas dos ecuaciones quedan as´ı: ³ v · n´ E 0 = Eγ 1 − c · µ ¶ ¸ γ−1 γ 0 0 E n = E n+ v v ·n− v2 c

(5.67)

Para aislar la variable n0 basta dividir lado a lado estas dos ecuaciones: µ

γ−1 γ n+ v ·n− 2 v c ³ n0 = v · n´ γ 1− c

¶ v (5.68)

Aberraci´ on: La ecuaci´on (5.68) es general, pero debemos admitir que no es simple. Para apreciar el significado de la aberraci´on supongamos que v es en direcci´on x y que n es paralela al plano xy y hace un ´angulo θ con el eje x. Escribimos entonces nx = cos θ, ny = sen θ. Las componentes de n0 se averiguan f´acilmente con la f´ormula (5.68): n0x =

cos θ − v/c v cos θ 1− c 143

n0y =

1 γ

sen θ v cos θ 1− c

Vamos a dividir, lado a lado, estas dos ecuaciones. Al cociente n0y /n0x lo llamamos tan θ0 : tan θ0 =

sen θ 1 γ cos θ − v/c

(5.69)

Esta es la ecuaci´on de la aberraci´on estelar que Bradley dedujo en el siglo XVIII. Recuperar esta f´ormula centenaria es uno de los hallazgos de la relatividad. No es dif´ıcil entender la causa de la aberraci´on de la luz desde un punto de vista ondulatorio. Recordemos que, por definici´on, un frente de onda es el lugar geom´etrico de todos los puntos que, en cierto instante dado, tienen la misma fase. El frente de onda es un objeto extendido en el espacio, en cierto instante. En otras palabras, es un conjunto de eventos simult´ aneos que ocupan una regi´on extendida en el espacio. Ya hemos advertido que la simultaneidad es relativa: un objeto extenso que aparece simult´ aneo a un observador, en general no aparece simult´ aneo a otros observadores. En nuestro caso decimos que los eventos que constituyen un frente de onda para O no son, en general, simult´ aneos para O0 . Vemos as´ı que los eventos de un frente de onda para O no forman un frente de onda para O0 . De esta manera llegamos a una conclusi´on importante: en una onda luminosa, los frentes de onda para O no son frentes de onda para O0 . Cada observador inercial registra sus propios frentes de onda3 . Ahora, como la direcci´on de propagaci´on de la onda es perpendicular a los frentes de onda, concluimos que la direcci´on de propagaci´on para O es diferente a la direcci´on de propagaci´on para O0 . Doppler: Si suponemos que en la luz la energ´ıa es proporcional a la frecuencia (E = hν, por ejemplo) la ecuaci´on (5.67) queda: ³ v · n´ ν 0 = νγ 1 − c 3

(5.70)

Consideremos un frente de onda para O y un frente de onda para O0 ; la intersecci´ on de esos dos planos es una l´ınea recta; los eventos de esa l´ınea son simult´ aneos para O y tambi´en son simult´ aneos para O0 .

144

Hay tres casos particularmente claros: cuando n y v son paralelos (⇒), cuando son antiparalelos (¿), y cuando son perpendiculares (→↑). En estos casos la f´ormula (5.70) da: s ⇒

ν0 = ν s

¿ →↑

ν

0

= ν

ν 0 = γν

1 − v/c 1 + v/c

(5.71)

1 + v/c 1 − v/c

(5.72) (5.73)

La f´ormula (5.71) vale cuando la luz y O0 viajan en la misma direcci´on, (5.72) para direcciones opuestas y (5.73) para direcciones perpendiculares. Las dos primeras f´ormulas, conocidas como efecto Doppler longitudinal, ya se conoc´ıan antes de 1905. El efecto Doppler transverso, f´ormula (5.73), era desconocido hasta 1905, y se constituye como una novedad de la teor´ıa especial de la relatividad.

145

146

Cap´ıtulo 6

La electrodin´ amica manifiestamente covariante La electrodin´amica est´a formalmente contenida en las ecuaciones de Maxwell y en la fuerza de Lorentz:

∇×E+

∇×B−

∇·B = 0

(6.1)

1 ∂B c ∂t

(6.2)

= 0

∇ · E = 4πρ

(6.3)

1 ∂E c ∂t

(6.4)

dp dt

4π J c ³ ´ u = q E+ ×B c =

(6.5)

Hemos visto que la relatividad especial le da al electromagnetismo una apariencia interesante, porque unifica los campos el´ectrico y magn´etico. Sin embargo, es justo advertir que la relatividad no afecta esencialmente la estructura formal de la teor´ıa electromagn´etica. Dicho en otras palabras, la electrodin´amica es covariante bajo las transformaciones entre observadores inerciales, tal como tuvimos ocasi´on de probar en la secci´on 4.8. No olvidemos sin embargo que esa secci´on es larga y engorrosa: las cuatro ecuaciones de Maxwell y la fuerza de Lorentz son covariantes, pero esa covariancia es dif´ıcil de ver. Por este motivo decimos que la covariancia de las cinco ecuaciones, aunque es verdadera e indudable, no es manifiesta. Conviene formular la electrodin´amica utilizando otras ecuaciones, equivalentes a las cinco mencionadas, que sean manifiestamente covariantes. Ya vimos en la 147

secci´on 5.5 que las ecuaciones tensoriales son autom´aticamente covariantes, entonces nuestro proyecto es este: convertir a las cinco ecuaciones en ecuaciones tensoriales.

6.1

El cuadripotencial Aµ

Los campos E y B son enteramente suficientes para describir el campo electromagn´etico. Sin embargo, para darle a la electrodin´amica una escritura manifiestamente covariante, podemos abandonar los campos E y B , expres´andolos en t´erminos de otros campos φ y A , de la manera siguiente: B = ∇×A

(6.6)

E = −∇φ −

1 ∂A c ∂t

(6.7)

Sin embargo, y aqu´ı viene un asunto de primera importancia, la relaci´on entre (E, B) y (φ, A) no es uno a uno, ya que para describir a (E, B) hay un n´ umero infinito de opciones (φ, A) . Esto es lo que se espera, ya que los campos (E, B) se producen como derivadas de los campos (φ, A) , o sea que a los (φ, A) se les pueden agregar t´erminos sin afectar sus derivadas. En efecto, utilizando cualquier funci´on derivable χ se pueden producir unos nuevos campos (φ0 , A0 ) equivalentes a los viejos (φ, A) , as´ı: φ0 = φ −

1 ∂χ c ∂t

(6.8)

A0 = A + ∇χ

(6.9)

Podemos r´apidamente verificar que los campos (φ0 , A0 ) y los campos (φ, A) son equivalentes, al darnos cuenta de que ∇ × A0 = ∇ × A −∇φ0 −

1 ∂A0 c ∂t

= −∇φ −

1 ∂A , c ∂t

es decir, los campos (E, B) se pueden calcular, bien sea con (φ, A) , o con (φ0 , A0 ) . Esto indica que para describir una realidad (E, B) no estamos 148

obligados a usar unos (φ, A) determinados, sino que tenemos una cierta libertad en la escogencia, que recibe el nombre de libertad gauge. La Figura 6.1 muestra que para describir un campo electromagn´etico se puede usar las variables (E, B) o las variables (φ, A) . Pero a cada punto en el plano (E, B) le corresponde en el plano (φ, A) , no un punto, sino un conjunto infinito de puntos que denotamos D. La libertad gauge es poder usar cualquier punto del conjunto D. Ahora, podemos escoger, dentro de D, un subconjunto, el subconjunto de todos los campos (φ, A) que cumplen alguna condici´on que nos parezca conveniente. Es usual escoger dentro de D el subconjunto de campos (φ, A) que cumplen una ecuaci´on subsidiaria que recibe el nombre de condici´ on de gauge. Las condiciones de gauge m´as conocidas son la de Coulomb y la de Lorentz: ∇ · A = 0 es la condici´on de gauge de Coulomb. Una de las ense˜ nanzas de la relatividad especial es la uni´on del espacio y el tiempo, y una ecuaci´on que sea relativistamente v´alida debe tratar al espacio y al tiempo en un plano de igualdad. Si una ecuaci´on menciona el espacio sin mencionar el tiempo, no puede ser covariante, y tal es el caso con la ecuaci´on ∇ · A = 0. El hecho de que la condici´on de Coulomb no sea covariante la hace inapropiada cuando se desea formular covariantemente una teor´ıa. Si queremos una formulaci´ on manifiestamente covariante de la electrodin´amica, no debemos usar el gauge de Coulomb. Esto no quiere decir que esta condici´on gauge sea in´ util. A bajas velocidades, y en muchos problemas de f´ısica at´omica y estado s´olido, una formulaci´on relativista resulta excesiva y torpe. En esos problemas no se aspira a usar una formulaci´on covariante, y el gauge de Coulomb es apropiado. Como queremos una expresi´on manifiestamente covariante de la electrodin´amica, debemos buscar una condici´on de gauge covariante. Investiguemos la condici´on de gauge de Lorentz: 1 ∂φ +∇·A=0 c ∂t

(6.10)

A primera vista esta ecuaci´on no parece covariante, pero si definimos Aµ = (φ, A) , la ecuaci´on (6.10) se escribe muy cortamente: 149

(6.11)

∂µ Aµ = 0

(6.12)

Como ∂µ es un operador vectorial, la ecuaci´on (6.12) dice que en el gauge de Lorentz Aµ es un vector. En general, cuando se necesite una formulaci´ on manifiestamente covariante se puede usar el gauge de Lorentz. A lo largo de todo este cap´ıtulo supondremos que el potencial Aµ cumple la condici´on ∂µ Aµ = 0. Queremos expresar las cinco ecuaciones (6.1)-(6.5) en t´erminos del potencial Aµ , y aqu´ı encontramos una de las ventajas del nuevo tratamiento: cuando se usa Aµ , las dos ecuaciones homog´eneas de Maxwell se satisfacen autom´aticamente. En efecto, es evidente que con las definiciones (6.6) y (6.7) se cumplen autom´aticamente las ecuaciones homog´eneas (6.1) y (6.2). Esta es una simplificaci´on, ya que los campos Aµ quedan regidos, no por cuatro ecuaciones (de Maxwell), sino por dos apenas: las inhomog´eneas (6.3) y (6.4). Esta es una ense˜ nanza, una gu´ıa pr´actica: cuando se usa Aµ , uno no piensa en cuatro ecuaciones de Maxwell, sino en dos. Expresemos pues las dos ecuaciones inhomog´eneas (6.3) y (6.4) y la fuerza de Lorentz (6.5) en t´erminos del tensor Aµ . Esto es lo que haremos en las pr´oximas dos secciones.

6.2

Las dos ecuaciones de Maxwell

Al colocar las definiciones (6.6) y (6.7) en las ecuaciones inhomog´eneas (6.3) y (6.4) se obtiene f´acilmente 1∂ (∇ · A) + ∇2 φ = −4πρ c ∂t µ ¶ 1 ∂2A 1 ∂φ 4π 2 −∇ A+∇ +∇·A = J 2 2 c ∂t c ∂t c

(6.13) (6.14)

En estas dos ecuaciones las variables φ y A est´ an acopladas de una manera complicada. Pero ellas se pueden desacoplar muy f´acilmente; en efecto, si utilizamos el gauge de Lorentz (6.10) las dos ecuaciones (6.13) y (6.14) quedan as´ı: 1 ∂2φ − ∇2 φ = 4πρ c2 ∂t2 150

(6.15)

1 ∂2A − ∇2 A = c2 ∂t2

4π J c

(6.16)

La ganancia es considerable: ahora las ecuaciones de movimiento de φ y A est´an desacopladas y, adem´as, tienen una simetr´ıa evidente. En vista de la f´ormula (5.41) las ecuaciones (6.15) y (6.16) se escriben muy cortamente: ∂µ ∂ µ φ = 4πρ ∂µ ∂ µ A =

4π J c

(6.17)

De otro lado, la ecuaci´on (5.66) nos ense˜ n´ o que las cantidades (ρc, J) forman un cuadrivector: J µ = (ρc, J) ,

(6.18)

entonces las ecuaciones (6.11) y (6.18) en (6.17) dan: ∂µ ∂ µ Aν =

4π ν J c

(6.19)

Esta f´ormula expresa las dos ecuaciones inhomog´eneas de Maxwell de una manera manifiestamente covariante. Operando con ∂ν en ambos lados de esta ecuaci´on se obtiene 4π ∂ν J ν = ∂µ ∂ µ ∂ν Aν c Ahora, el lado derecho de esta ecuaci´on es cero, debido a la condici´on (6.12), entonces ∂ν J ν = 0

(6.20)

Esta es la ecuaci´on de continuidad. Antes de concluir esta secci´on anotemos que en ausencia de cargas y corrientes la teor´ıa de Maxwell admite la existencia de ondas electromagn´eticas. En efecto, sino hay cargas ni corrientes, los lados derechos de las ecuaciones (6.15) y (6.16) son cero, y en consecuencia: 151

¶ 1 ∂2 2 −∇ φ = 0 c2 ∂t2 µ ¶ 1 ∂2 2 −∇ A = 0 c2 ∂t2 µ

Estas son ecuaciones de ondas. Si hacemos cero los lados derechos de las ecuaciones (6.17) se llega a ∂µ ∂ µ Aν = 0

(6.21)

Esta es la ecuaci´on de ondas en una forma manifiestamente covariante.

6.3

La fuerza de Lorentz

Al desplegar las ecuaciones (6.6) y (6.7) en todas sus componentes llegamos a: Ex = −(∂ 0 A1 − ∂ 1 A0 )

Bx = −(∂ 2 A3 − ∂ 3 A2 )

Ey = −(∂ 0 A2 − ∂ 2 A0 )

By = −(∂ 3 A1 − ∂ 1 A3 )

Ez =

−(∂ 0 A3



∂ 3 A0 )

Bz =

−(∂ 1 A2



(6.22)

∂ 2 A1 )

Ya estamos en condici´on de atacar la fuerza de Lorentz. Las ecuaciones (4.139)-(4.141) son: dpx dt

=

q [cEx + uy Bz − uz By ] c

(6.23)

dpy dt

=

q [cEy + uz Bx − ux Bz ] c

(6.24)

dpz dt

=

q [cEz + ux By − uy Bx ] c

(6.25)

Modifiquemos la escritura de la primera ecuaci´on; la ecuaci´on (5.54) dice que c = γ −1 U 0 , uy = γ −1 U 2 , uz = γ −1 U 3 , entonces γ

¤ q£ 0 dpx = U Ex + U 2 Bz − U 3 By dt c 152

De otro lado, γ

dpx dp1 = : dt dτ ¤ dp1 q£ 0 = U Ex + U 2 Bz − U 3 By dτ c

Tambi´en usamos tres de las ecuaciones (6.22) para obtener: ¤ dp1 q£ 1 0 = (∂ A − ∂ 0 A1 )U 0 − (∂ 1 A2 − ∂ 2 A1 )U 2 − (∂ 1 A3 − ∂ 3 A1 )U 3 , dτ c es decir: ¤ dp1 q£ 1 0 = (∂ A − ∂ 0 A1 )U0 + (∂ 1 A2 − ∂ 2 A1 )U2 + (∂ 1 A3 − ∂ 3 A1 )U3 dτ c N´otese que esta ecuaci´on se puede escribir dpa q = (∂ a Aν − ∂ ν Aa )Uν dτ c

(6.26)

En esto se ha convertido la ecuaci´on (6.23). Es f´acil darse cuenta de que tambi´en (6.24) y (6.25) corresponden a la ecuaci´on (6.26). Ahora damos un salto interesante; en vez de la ecuaci´on (6.26) proponemos: dpµ q = (∂ µ Aν − ∂ ν Aµ )Uν dτ c

(6.27)

En conclusi´on: con la condici´on (6.12), las ecuaciones de la electrodin´amica manifiestamente covariantes son (6.19) y (6.27). La conexi´on entre Aµ y los campos E y B est´a en (6.6) y (6.7). Las ecuaciones homog´eneas (6.1) y (6.2) no constituyen un resultado adicional (ver p´agina 150). Nota: El salto de las tres ecuaciones (6.26) a las cuatro ecuaciones (6.27) es una generalizaci´on, porque agrega una cuarta ecuaci´on, para µ = 4 : q dp0 = (∂ 0 Aν − ∂ ν A0 )Uν dτ c 153

¿Qu´e significa esta ecuaci´on, hemos descubierto algo nuevo, esto ya lo sab´ıamos? Para responder estas preguntas notemos que esta ecuaci´on se puede escribir as´ı:

γ

dp0 dτ

=

dp0 dt

q = γ (∂ 0 Aa − ∂ a A0 )ua c

dp0 dt

=

q 0 a (∂ A − ∂ a A0 )Ua c

q q (Ea )ua = E · u c c

Ahora, p0 es la componente cero del cuadrivector momentum: p0 = Energ´ıa/c = E/c, entonces dE = qE·u dt En el lado derecho de esta ecuaci´on podemos sumar u × B · u = 0 : dE dt

= q [E +

u × B] · u c

= F·u

Esta ecuaci´on es Potencia = F · u , que es una ecuaci´on ampliamente conocida en la mec´anica. En otras palabras, la ecuaci´on (6.27) unifica la fuerza de Lorentz con la ecuaci´on de potencia. No es esta la primera vez, ni ser´a la u ´ltima, en que la relatividad unifica. Lo que acabamos de ver ocurre a menudo cuando uno quiere convertir una ecuaci´on no covariante en otra ecuaci´on que s´ı sea covariante. Por lo general este proceso incluye una generalizaci´on (como el paso de (6.26) a (6.27)), y es aqu´ı donde aparece informaci´on adicional, ecuaciones adicionales. Estas ecuaciones adicionales pueden ser informaci´on ya conocida, o pueden ser informaci´on nueva. En el primer caso la generalizaci´on aporta unificaci´on, que es algo de por s´ı valioso. En el segundo caso, la generalizaci´on aporta nueva f´ısica y abre las puertas a la observaci´ on de fen´omenos insospechados. 154

6.4

El tensor electromagn´ etico

La teor´ıa electrodin´amica est´a escrita de modo manifiestamente covariante en las ecuaciones (6.12), (6.19), y (6.27). Lograr esta escritura covariante era uno de los objetivos principales de este cap´ıtulo; pero conviene adem´as que presentemos un nuevo tensor F µν que trae ventajas en el estudio de las leyes de conservaci´on y la formulaci´ on lagrangiana, asuntos que veremos en los cap´ıtulos 7 y 8. Para comenzar anotemos que las ecuaciones (6.22) y (6.27) sugieren decididamente que definamos la cantidad F µν = ∂ µ Aν − ∂ ν Aµ

(6.28)

La derivada ∂ µ es un operador vectorial y Aµ es un vector en el gauge de Lorentz; entonces F µν es un tensor en el gauge de Lorentz, y se le conoce como el tensor electromagn´etico. F µν es de rango 2, y por tanto tiene 16 componentes; pero es antisim´etrico, entonces tiene solamente 6 componentes libres, que son justamente las tres componentes de E y las tres componentes de B. Las ecuaciones (6.22) muestran que Ex = F 10 ,

Ey = F 20 ,

Ez = F 30

Bx = F 32 ,

By = F 13 ,

Bz = F 21

(6.29)

O, en forma matricial: 

F µν

0

   Ex  =   Ey   Ez

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

−Ez



  By     −Bx   

(6.30)

0

Ahora pasamos a expresar las ecuaciones de la electrodin´amica en t´erminos del nuevo tensor F µν . Primero veremos las ecuaciones inhomog´eneas de Maxwell, luego las homog´eneas y por u ´ltimo la fuerza de Lorentz. 155

´ Las ecuaciones inhomog´ eneas de Maxwell. Estas se expresan mediante (6.19): 4π ν J c

= ∂µ (∂ µ Aν ) = ∂µ (∂ µ Aν − ∂ ν Aµ + ∂ ν Aµ ) = ∂µ (∂ µ Aν − ∂ ν Aµ ) + ∂ ν ∂µ Aµ

El u ´ltimo t´ermino del lado derecho es cero por la condici´on de Lorentz, 4π ν entonces queda J = ∂µ (∂ µ Aν − ∂ ν Aµ ), es decir c ∂µ F µν =

4π ν J c

(6.31)

Las ecuaciones homog´ eneas de Maxwell. Por la definici´on del tensor µν α µν F es claro que ∂ F + ∂ ν F αµ + ∂ µ F να = ∂ α (∂ µ Aν − ∂ ν Aµ ) + ∂ ν (∂ α Aµ − ∂ µ Aα ) + ∂ µ (∂ ν Aα − ∂ α Aν ). F´acilmente vemos que el lado derecho de esta ecuaci´on es cero, o sea que ∂ α F µν + ∂ ν F αµ + ∂ µ F να = 0 En la ecuaci´on (6.32) hacer α = 1 , µ = 2 y ν = 3 : ∂ 1 F 23 + ∂ 3 F 12 + ∂ 2 F 31 = 0 En la ecuaci´on (6.32) hacer α = 0 , µ = 3 y ν = 2 : ∂ 0 F 32 + ∂ 2 F 03 + ∂ 3 F 20 = 0 En la ecuaci´on (6.32) hacer α = 0 , µ = 1 y ν = 3 : ∂ 0 F 13 + ∂ 3 F 01 + ∂ 1 F 30 = 0 En la ecuaci´on (6.32) hacer α = 0 , µ = 2 y ν = 1 : ∂ 0 F 21 + ∂ 1 F 02 + ∂ 2 F 10 = 0 156

(6.32)

En estas cuatro ecuaciones haremos dos cosas: primero, cambiar las componentes F µν por las entradas de la matriz (6.30) y, segundo, substituir ∂ 0 , ∂ 1 , ∂ 2 , ∂ 3 por ∂0 , −∂1 , −∂2 , −∂3 , respectivamente. Se obtiene entonces estas cuatro ecuaciones: ∂1 Bx + ∂3 Bz + ∂2 By = 0 ∂0 Bx + ∂2 Ez − ∂3 Ey = 0 ∂0 By + ∂3 Ex − ∂1 Ez = 0 ∂0 Bz + ∂1 Ey − ∂2 Ex = 0 Estas ecuaciones son, claramente, las dos ecuaciones homog´eneas (6.1) y (6.2). En conclusi´on, la ecuaci´on (6.32) es una escritura manifiestamente covariante de las dos ecuaciones inhomog´eneas de Maxwell. La fuerza de Lorentz. En la ecuaci´on (6.27) reconocemos la definici´on del tensor electromagn´etico: q dpµ = F µν Uν dτ c

(6.33)

El problema de part´ıcula libre ocurre cuando q = 0 o cuando no hay campo electromagn´etico. En ambos casos el lado derecho de esta ecuaci´on es cero: dpµ dτ d2 xµ dτ 2

= 0

Part´ıcula libre

(6.34)

= 0

Part´ıcula libre

(6.35)

Para concluir digamos que la formulaci´ on covariante de la electrodin´amica es as´ı: con la definici´on (6.28) y la condici´on (6.12), las ecuaciones de la electrodin´amica son (6.31) y (6.33). La conexi´on entre F µν y los campos E y B est´a en (6.29). Las ecuaciones homog´eneas, contenidas en (6.32) no constituyen un resultado adicional (ver p´agina 150). 157

6.5

La transformaci´ on de los campos

En la secci´on 4.1 encontramos las reglas de transformaci´on de los campos E y B. Recu´erdese, sin embargo, que el camino seguido en esa ocasi´on fue largo y dispendioso. En este momento queremos deducir de nuevo esas reglas con las herramientas que nos suministra la notaci´on covariante. Como en esta notaci´on no se usan E, B, sino F µν , lo que hacemos primero es encontrar la transformada del tensor electromagn´etico. Para esto utilizamos las ecuaciones (5.46) , (5.47) y (6.30), as´ı: 

γ

−γβ

   −γβ     0   0

0

γ

0

0

1

0

0

0



0

   0    Ex    0    Ey  Ez

1

−Ex −Ey 0

−Bz

Bz

0

−By

Bx

−Ez



γ

   By    −γβ    −Bx   0  0

0

−γβ

0

γ

0

0

1

0

0

Obtenemos esta expresi´on de F 0 µν : 

F 0 µν

0

−Ex

−γ(Ey − βBz ) −γ(Ez + βBy )

    Ex 0 −γ(Bz − βEy )   =  γ(E − βB ) γ(B − βE ) 0  y z z y   γ(Ez + βBy ) −γ(By + βEz ) Bx

Comparando con 

F

0 µν

0

  0  Ex  =   E0  y  Ez0

−Ex0 −Ey0 0

−Bz0

Bz0

0

−By0

Bx0

identificamos: 158

−Ez0



    ,  0 −Bx    By0

0



   γ(By + βEz )      −Bx    0

0



  0     0    1

Ex0 = Ex

Bx0 = Bx

Ey0 = γ(Ey − βBz )

By0 = γ(By + βEz )

Ez0 = γ(Ez + βBy )

Bz0 = γ(Bz − βEy )

Estas son las mismas reglas de transformaci´on de la secci´on (4.1).

6.6

Dos escalares

Con F µν y el tensor ²αβγδ de Levi-Civita (ver la ecuaci´on (5.36)) se puede construir otro, que se llama el tensor electromagn´etico dual: F αβ ≡ 12 ²αβγδ Fγδ . 

F αβ

0

−Bx −By −Bz

   Bx 0  =   By −Ez   Bz

Ey

Ez 0 −Ex





0

Bx

By

      −Bx −Ey  0  ; Fαβ =     −By −Ez Ex      0

−Bz

Ey

Ez 0 −Ex

Bz



  −Ey     Ex    0

Con los tensores F µν y F αβ se puede construir tres cantidades escalares, que son F αβ Fαβ , F αβ Fαβ y F αβ Fαβ . Al desarrollar estos productos matriciales se obtiene F αβ Fαβ = −4E · B :

escalar (6.36)

F αβ Fαβ = −F αβ Fαβ = 2(E 2 − B 2 ) :

escalar

Estas son las dos cantidades invariantes que vimos en las ecuaciones (4.49) y (4.50). Los escalares (6.36) son cuadr´aticos en los campos, es decir, son productos de dos campos. Con productos de cuatro campos tambi´en se puede construir un escalar (ver la ecuaci´on (5.50)) que es el determinante de F αβ . El resultado es det F αβ = (E · B)2 :

159

escalar

E, B

D

f, A

Figura 6.1 La relaci´on entre (E , B) y (φ , A) no es biun´ıvoca: a unos valores dados de (E , B) les corresponde todo un conjunto D de valores (φ , A) .

160

Cap´ıtulo 7

Las leyes de conservaci´ on

Ha llegado el momento de estudiar las corrientes, el tensor energ´ıa-momentum y las leyes de conservaci´on. Para tal efecto nos valdremos de un sistema f´ısico, la nube de part´ıculas, que es suficientemente simple para admitir un tratamiento matem´atico sencillo, pero tiene adem´as una complejidad suficiente para mostrar las sutilezas de las leyes de conservaci´ on. Despu´es de presentar estos temas concluimos el cap´ıtulo con la corriente del momentum angular.

7.1

La nube de part´ıculas

Al estudiar la nube de part´ıculas en la secci´on 4.7 supon´ıamos que a un peque˜ no volumen de la nube se le pod´ıa asignar una velocidad u. Nuestro prop´osito ahora es hacer un tratamiento m´as refinado, atendiendo a la contribuci´on que cada part´ıcula individual aporta a la densidad y a la corriente. Pensamos en un conjunto de part´ıculas en los puntos x1 (t), x2 (t), x3 (t), ... La densidad ρpar de part´ıculas y la densidad Jpar de corriente se definen as´ı:

ρpar (x, t) =

X

δ 3 (x − xn (t))

(7.1)

n

Jpar (x, t) =

X

δ 3 (x − xn (t))

n

161

dxn (t) , dt

(7.2)

donde el ´ındice n = 1, 2, 3, ... recorre1 todas las part´ıculas de la nube2 . ∂ a Tomemos ahora la divergencia ∇ · Jpar = J ; se obtiene: ∂xa par ¶ a Xµ ∂ dxn (t) ∂ dxan (t) 3 3 δ (x − x (t)) + δ (x − x (t)) n n ∂xa dt ∂xa dt n Ahora, tonces:

(7.3)

dxan (t) ∂ dxan (t) depende u ´nicamente de t, o sea que es cero, endt ∂xa dt

∇ · Jpar =

X dxa (t) ∂ n δ 3 (x − xn (t)) a dt ∂x n

= −

X dxa (t) ∂ n δ 3 (x − xn (t)) a dt ∂x n n

= −

X ∂ ∂ δ 3 (x − xn (t)) = − ρpar ∂t ∂t n

De donde vemos que ∂ρpar + ∇ · Jpar = 0 ∂t

(7.4)

Esta es la c´elebre ecuaci´on de continuidad (v´ease la ecuaci´on (6.20)). Es muy importante, porque trae consigo la conservaci´ on del n´ umero de part´ıculas, tal como veremos enseguida. El n´ umero N de part´ıculas es: Z N=

Tomar la derivada

d3 x ρpar (x, t)

(7.5)

dN y usar la ecuaci´on (7.4) dt

1 La ventaja de este tratamiento, tomado de Weinberg [11], radica en el hecho de que aunque la nube est´ a compuesta de part´ıculas en posiciones discretas, las cantidades ρpar (x, t) y Jpar (x, t) son campos que dependen de las coordenadas continuas (x, t). 2 Los f´ısicos le dicen polvo a un conjunto de part´ıculas tal que todas ellas est´ an en reposo respecto a alg´ un observador inercial. Lo que queremos estudiar en este cap´ıtulo no es una nube de polvo.

162

dN = dt

Z

∂ρpar (x, t) = − ∂t

d3 x

Z d3 x ∇ · Jpar (x, t)

El lado derecho es un integral de volumen que, seg´ un el teorema de Gauss, es igual a una integral en la superficie que cubre al volumen. Si este volumen es suficientemente grande para abarcar todas las part´ıculas, la corriente J es cero en la superficie y el integral es cero. Vemos as´ı que dN =0 dt

(7.6)

En conclusi´on, la ecuaci´on de continuidad (7.4) implica que el n´ umero total de part´ıculas de la nube se conserva. Es importante que escribamos la corriente en notaci´on covariante. Si llamamos x0n (t) = ct, el evento (ct, xn (t)) que ocupa la part´ıcula n se puede escribir (x0n (t), xn (t)) ; o m´as cortamente, xµn (t). Las ecuaciones (7.1) y (7.2) son X

cρpar (x, t) =

δ 3 (x − xn (t))

dx0n (t) dt

δ 3 (x − xn (t))

dxan (t) dt

n

X

a Jpar (x, t) =

n

0 = cρ Para unificar estas dos ecuaciones definimos Jpar par , de modo que µ Jpar = (cρpar , Jpar ) µ Jpar

=

X n

(7.7)

dxµn (t) δ (x − xn (t)) dt 3

(7.8)

µ Vamos a probar que Jpar es un Rvector, para lo cual multiplicamos el lado derecho de la ecuaci´on (7.8) por dx0 δ(x0 − x0n ) = 1:

µ Jpar =

XZ

dx0 δ(x0 − x0n )δ 3 (x − xn (t))

n

163

dxµn (t) dt

=

XZ

dx0 δ 4 (x − xn )

n

= c

XZ

dxµn dt

δ 4 (x − xn )dxµn

(7.9)

n

R De otro lado, la funci´on δ 4 satisface la ecuaci´on δ 4 (x − xn )d4 x = 1, o sea que δ 4 (x − xn )d4 x es un escalar; como d4 x es un escalar (ver la ecuaci´on (5.49)), concluimos que δ 4 (x − xn ) es un escalar. Hecha esta observaci´ on, regresamos al lado derecho de la ecuaci´on (7.9). Como dxµn y δ 4 (x − xn ) son µ tensores, entonces Jpar es un vector. La ecuaci´on de continuidad (7.4) se escribe tambi´en: µ ∂µ Jpar (x) = 0

7.2

(7.10)

Otras corrientes

La n-´esima part´ıcula de la nube tiene carga el´ectrica qn y momentum pνn . En el lado derecho de la ecuaci´on (7.8) podemos multiplicar cada sumando por qn o por pνn , y de esta manera se obtienen otras dos corrientes: ν Jelec (x) =

X

qn δ 3 (x − xn (t))

n

Jpνµ (x) =

X

dxνn (t) dt

pµn (t) δ 3 (x − xn (t))

n

dxνn (t) dt

(7.11) (7.12)

dxµn (t) En la ecuaci´on (7.11) podemos interpretar que qn δ 3 (x − xn (t)) es dt la densidad de corriente el´ectrica que aporta la n-´esima part´ıcula para la µ construcci´on de la densidad total de corriente el´ectrica Jelec . As´ı mismo, la ecuaci´on (7.12) da la ν-´esima componente de la densidad de corriente de µ momentum µ. N´otese que, como qn es un escalar, la corriente Jelec es un µ ν vector; de la misma manera, como pn (t) es un vector, Jpµ es un tensor de segundo rango. Cada part´ıcula de la nube tiene una l´ınea en el mundo, una trayectoria en el espaciotiempo. Esa trayectoria crea varias corrientes: la el´ectrica, la de momentum µ, etc. Con los aportes de todas las part´ıculas se obtienen las corrientes totales de la nube. Lo interesante es que existen varias corrientes ν , J ν , J ν , etc. simult´aneamente: Jpart pµ elec 164

Vamos a demostrar que corriente el´ectrica3 se conserva. Al tomar la divergencia en la ecuaci´on (7.11) tenemos en cuenta que la carga q es invariante (ver p´agina 43), o sea que sus derivadas son cero y se llega limpiamente a una ecuaci´on como (7.4): ∂µ J µ (x) = 0

(7.13)

Este es un resultado importante: la corriente el´ectrica satisface la ecuaci´on de continuidad. En consecuencia, la carga el´ectrica total de la nube permanece constante a medida que transcurre el tiempo.

7.3

El tensor de energ´ıa y momentum

La densidad de corriente del momentum µ que presentamos en (7.12) se µν escribe usualmente Tmec : X

µν Tmec (x) =

pµn (t) δ 3 (x − xn (t))

n

dxνn (t) dt

(7.14)

o como en la ecuaci´on (7.9): µν Tmec (x)

=c

XZ

pµn δ 4 (x − xn ) dxµn

(7.15)

n

La f´ormula (7.14) puede transformarse usando la ecuaci´on (5.62): µν Tmec (x) = c2

X pµn pν

n

n

En

δ 3 (x − xn (t))

(7.16)

Esta ecuaci´on muestra que el tensor se construye con las propiedades mec´anicas de las part´ıculas, que son los momentos pµn ; por esta raz´on escribimos el µν sub´ındice “mec” en Tmec . Veremos m´as tarde que hay otros tensores de 3

De ahora en adelante omitiremos el sub´ındice “elec” que aparece en (7.11), de modo que la corriente el´ectrica se llamar´ a simplemente J ν . As´ı la hemos llamado en cap´ıtulos anteriores.

165

energ´ıa y momentum: para el campo electromagn´etico, para el campo gravµν itatorio, etc. Esos otros tensores no son de naturaleza mec´anica como Tmec . µν De otro lado, la ecuaci´on (7.16) tambi´en dice que Tmec es sim´etrico: µν νµ Tmec (x) = Tmec (x)

(7.17)

0µ Las cuatro componentes Tmec son especialmente importantes: 00 Tmec (x) =

X

En δ 3 (x − xn (t))

(7.18)

n 0a Tmec (x) = c

X

pan δ 3 (x − xn (t))

(7.19)

n 00 (x) es la densidad de energ´ 0a (x) es Estas ecuaciones dicen que Tmec ıa y Tmec µν c veces la densidad de momentum en direcci´on a. Por esta raz´on Tmec (x) recibe el nombre de tensor de energ´ıa y momentum.

7.4

µν ∂µ Tmec =0,

µν ∂µ Tmec 6= 0

Es importante que nos detengamos a estudiar lo que ocurrir´ıa si la diverµν gencia de Tmec fuera cero, es decir, si µν µν ∂µ Tmec = Tmec ,µ = 0

(7.20)

Esta ecuaci´on implica que ∂ 0ν ∂ aν T = −c a Tmec ∂t mec ∂x Z Z ∂ ∂ aν 3 0ν 3 Tmec d x = −c T d x ∂t ∂xa mec De acuerdo con el teorema de Gauss, el lado derecho de esta ecuaci´on es igual a un integral en la superficie que cubre al volumen. Pensamos que este volumen es mayor que el volumen ocupado por la nube de part´ıculas, aν y sus derivadas valen cero en la superficie. En estas de manera que Tmec condiciones el lado derecho de la u ´ltima ecuaci´on es cero y 166

d dt

Z 0ν Tmec (x) d3 x = 0

(7.21)

R 0ν 3 O sea que las cuatro cantidades Tmec d x son constantes. En vista de que estas cuatro cantidades son la energ´ıa total y el momentum total, podemos µν afirmar que cuando ∂µ Tmec = 0 se conservan la energ´ıa total y el momentum total de la nube. Acabamos de llegar a una conclusi´on importante, cual es que las leyes de conservaci´on de momentum y energ´ıa est´an expresadas en la ecuaci´on µν µν ∂µ Tmec = 0. Pero ¿verdaderamente se cumple la ecuaci´on ∂µ Tmec = 0 en las nubes?, ¿en toda clase de nubes?, ¿en cu´ales s´ı y en cu´ales no? Para responder estas preguntas vayamos en detalle a los t´erminos que conforman µν µν µ0 µa la divergencia de Tmec . Esta divergencia es ∂ν Tmec = ∂0 Tmec + ∂a Tmec : µν µ0 ∂ν Tmec = ∂0 Tmec +

µ0 = ∂0 Tmec +

∂ X µ dxan (t) 3 δ (x − xn (t)) p (t) ∂xa n n dt X

pµn (t)

dxan (t) ∂ 3 δ (x − xn (t)) dt ∂xa

pµn (t)

∂xan ∂ 3 δ (x − xn (t)) ∂t ∂xan

pµn (t)

∂ 3 δ (x − xn (t)) ∂t

n µ0 = ∂0 Tmec −

X n

µ0 = ∂0 Tmec −

X n

(7.22)

El u ´ltimo t´ermino del lado derecho es de la forma p

∂ 3 ∂ ∂p 3 δ = (p δ 3 ) − δ , ∂t ∂t ∂t

o sea que la ecuaci´on (7.22) es µν µ0 ∂ν Tmec = ∂0 Tmec −

X dpµn ∂ X µ 3 pn δ (x − xn (t)) + δ 3 (x − xn (t)) ∂t n dt n

µ0 µ0 = ∂0 Tmec − ∂0 Tmec +

X dpµn n

dt

167

δ 3 (x − xn (t)) ,

es decir: X dpµn δ 3 (x − xn (t)) dt n

µν ∂ν Tmec (x) =

(7.23)

Esta ecuaci´on establece que la energ´ıa y el momentum de la nube se conserP dpµn 3 van si se cumple la condici´on δ (x − xn ) = 0. Veremos que hay unas n dt nubes que satisfacen esta condici´on, y otras que no la cumplen. a) Part´ıculas libres. En este caso las part´ıculas no interact´ uan entre s´ı ni con el exterior; como no hay choques, las part´ıculas tienen movimiento recdpµn til´ıneo uniforme, las derivadas son cero, y en consecuencia la f´ormula dt µν (7.23) da ∂µ Tmec = 0. Se conservan la energ´ıa y el momentum. b) Choques puntuales. Pensemos ahora que la nube no interact´ ua con el exterior, pero las part´ıculas chocan, interact´ uan en forma instant´ anea: varias part´ıculas coinciden en un evento e intercambian energ´ıa y momentum en un proceso instant´ aneo. Bajo estas condiciones regresamos al lado dpµn difieren de derecho de la ecuaci´on (7.23) y notamos que las derivadas dt cero u ´nicamente durante los choques. Denotando por R el punto donde ocurre un choque, la f´ormula (7.23) es: µν ∂ν Tmec (x) =

XX R

δ 3 (x − R(t))

n0

dpµn0 dt

Aqu´ı hay una suma sobre todos los choques R, y el ´ındice n0 recorre u ´nicamente las part´ıculas que intervienen en el choque en R. µν ∂ν Tmec (x) =

X

δ 3 (x − R(t))

R

La sumatoria

P n0

d X µ p 0 dt 0 n n

pµn0 es el momentum total, sumado, de todas las part´ıculas

que intervienen en la colisi´on en R. Este momentum es constante, o sea que d X µ µν p 0 es cero. En este caso la ecuaci´on (7.23) es ∂ν Tmec = 0. Se conserdt 0 n n van la energ´ıa y el momentum. 168

c) La nube de part´ıculas cargadas. Para la part´ıcula n-´esima la fuerza de Lorentz (6.33) es: dpµn dτn

Multiplicar ambos lados por

=

qn µ F α (xn )Unα c

=

qn µ dxα F α (xn ) n c dτn

dτn : dt

dpµn qn µ dxα = F α (xn ) n , dt c dt y esto en la ecuaci´on (7.23) da: µν ∂ν Tmec (x) =

X qn n

=

X qn n

=

c c

F µ α (xn ) F µ α (x)

dxαn 3 δ (x − xn (t)) dt

dxαn 3 δ (x − xn (t)) dt

X dxα 1 µ qn n δ 3 (x − xn (t)) F α (x) c dt n

Con (7.11) reconocemos la densidad de corriente el´ectrica: µν ∂ν Tmec (x) =

1 µ F α (x)J α (x) c

(7.24)

Los casos a), b) y c) que acabamos de rese˜ nar indican cu´ales son las condiµν ciones din´amicas que se deben cumplir para que la divergencia ∂ν Tmec sea µν cero. La clave est´a en reconocer en qu´e casos el tensor Tmec se refiere a un sistema f´ısico aislado. En el caso a) la nube est´a aislada del exterior y del interior: la energ´ıa 169

y el momentum total de la nube se forman exclusivamente con las contribuµν ciones mec´anicas. Es decir, Tmec menciona la totalidad de un sistema f´ısico; no puede sorprendernos que se conserven la energ´ıa y el momentum; no µν puede sorprendernos que ∂ν Tmec sea cero. En el caso c) existe el campo electromagn´etico creado por las mismas part´ıculas cargadas que forman la nube, y este campo tiene energ´ıa y momentum. Hay un sistema total que tiene dos subsistemas: 1) las part´ıculas, que µν tienen una energ´ıa-momentum enteramente mec´anica descrita por Tmec y 2) el campo electromagn´etico. Estos dos subsistemas interact´ uan, intercambian momentum-energ´ıa, o sea que ninguno de los dos conserva energ´ıaµν momentum. El tensor Tmec se refiere apenas a uno de los subsistemas y µν por eso no se espera que ∂ν Tmec sea cero. El sistema total part´ıculas-campo s´ı est´a aislado del exterior, y portanto la energ´ıa y el momentum totales s´ı se deben conservar. Debe existir otro tensor θµν que de cuenta de la enµν erg´ıa-momentum del campo, de modo que la suma (Tmec + θµν ) exprese la µν totalidad, y en consecuencia tenga divergencia nula: ∂ν (Tmec + θµν ) = 0. El caso c) aclara lo que ocurre cuando entre las part´ıculas de la nube hay interacciones a distancia. Las interacciones a distancia denotan la presencia de un campo, campo que tambi´en tiene energ´ıa y momentum. La totalidad part´ıculas-campo debe tener un tensor total de energ´ıa- momentum cuya µν µν divergencia sea nula. Ese tensor total no es Tmec , y por eso ∂ν Tmec 6= 0. Algo muy diferente ocurre en el caso b); all´ı no hay interacciones a distancia, no µν µν hay campo, Tmec s´ı expresa un sistema total y por eso ∂ν Tmec = 0. De regreso al caso c) que nos ocupaba hace un par de p´arrafos, deteng´amonos en el tensor energ´ıa-momentum del campo electromagn´etico. Veremos en la ecuaci´on (8.59) que este tensor es θµν = Tomar la derivada θµν ,ν = =

1 µν 1 µα ν F Fα + η Fαβ F αβ 4π 16π

∂ : ∂xν

1 µα ν 1 µα 1 F Fα ,ν + F ,ν Fα ν + 2η µν Fαβ F αβ ,ν 4π 4π 16π 1 µα ν 1 1 F Fα ,ν + Fαν F µα,ν + Fαβ F αβ ,µ 4π 4π 8π 170

(7.25)

Partir en dos el segundo t´ermino del lado derecho: θµν ,ν =

1 µα ν 1 1 1 F Fα ,ν + Fαν F µα,ν + Fαν F µα,ν + Fαβ F αβ ,µ 4π 8π 8π 8π

El tercer t´ermino del lado derecho es 1 1 1 1 Fαν F µα,ν = Fβν F µβ ,ν = Fβα F µβ ,α = Fαβ F βµ,α 8π 8π 8π 8π Entonces: θµν ,ν

=

1 µα ν 1 1 1 F Fα ,ν + Fαβ F µα,β + Fαβ F βµ,α + Fαβ F αβ ,µ 4π 8π 8π 8π

=

1 µα ν 1 F Fα ,ν + Fαβ (F µα,β + F βµ,α + F αβ ,µ ) 4π 8π

En el lado derecho de esta ecuaci´on usamos la ecuaci´on de Maxwell (6.32) para obtener: θµν ,ν =

1 µα ν F Fα ,ν 4π

Ahora, ya que F µν = −F νµ la ecuaci´on de Maxwell (6.31) es 4π ν J , c

(7.26)

1 θµν ,ν = − F µα Jα c

(7.27)

F νµ ,µ = − es decir, Fα ν ,ν = −

4π Jα . Entonces c

En este momento sumamos lado a lado las ecuaciones (7.24) y (7.27) para obtener: µν (Tmec + θµν ),ν = 0

171

(7.28)

M´as expl´ıcitamente, usando las ecuaciones (7.16) y (7.25): Ã c2

X pµn pν

n

n

En

1 µα ν 1 µν δ 3 (x − xn ) + F Fα + η Fαβ F αβ 4π 16π

! =0 ,ν

µν La ecuaci´on (7.28) dice que la energ´ıa y el momentum contenidos en Tmec + µν θ se conservan.

7.5

La corriente de momentum angular

En las ecuaciones (7.11) y (7.12) definimos las corrientes asociadas a q y pµ . Las part´ıculas tambi´en tienen momentum angular L y quisi´eramos definir la densidad de corriente que le corresponde. Un primer intento ser´ıa imitar lo de (7.11) y (7.12): X

Ln (t) δ 3 (x − xn (t))

n

dxνn (t) dt

Pero esta cantidad tiene un defecto grave: no es un tensor, porque L no es un tensor. Entonces esta cantidad no puede ser una corriente en un tratamiento covariante. Debemos buscar otra manera de producir una corriente de momentum angular que s´ı sea tensorial. M´as espec´ıficamente, buscamos un tensor tal que una de sus componentes sea la densidad de momentum angular en direcci´on x, otra componente sea la densidad de momentum angular y y otra componente sea la densidad de momentum angular z. Proponemos este tensor: µνδ µν µδ Mmec (x) = Tmec (x)xδ − Tmec (x)xν µ ν ¶ X dxδn ν 3 µ dxn δ = δ (x − xn (t)) pn x − x dt dt n

(7.29) (7.30)

1 032 La densidad de momentum angular en direcci´on x es Mmec . As´ı mismo, c 1 021 1 013 Mmec es la densidad en direcci´on y, y Mmec es la densidad del momentum c c angular en direcci´on z. Estas identificaciones indican que la escogencia (7.29) es adecuada. 172

7.6

Generalizaci´ on

Lleg´o el momento de abandonar la nube de part´ıculas que tanto nos ha servido para establecer los conceptos de corrientes y conservaciones. De ahora en adelante nos referiremos, en general, a cualquier tensor de energ´ıa y µν momentum T µν (x). Ejemplos concretos de este tensor son Tmec y θµν . El T µν que mencionamos es general, y no tenemos que decidir de antemano si T µν = T νµ o T µν 6= T νµ , ni necesitamos comprometernos con que ∂ν T µν = 0 o ∂ν T µν 6= 0, ni tenemos que decidir desde ya si T µν se refiere a una parte o a la totalidad de un sistema f´ısico. As´ı como en las ecuaciones (7.18) y (7.19), la componente T 00 (x) es la densidad de energ´ıa y T 0a (x) es c veces la densidad de momentum en direcci´on a. Asociado a la energ´ıa-momentum contenidas en T µν hay un M µνδ que se define en forma similar a (7.29): M µνδ (x) = T µν (x)xδ − T µδ (x)xν

(7.31)

1 La densidad de momentum angular en direcci´on x es M 032 . As´ı mismo, c 1 013 1 021 M es la densidad en direcci´on y, y M es la densidad del momenc c µνδ tum angular en direcci´on z. El tensor M es antisim´etrico bajo el intercambio de los ´ındices νδ. Para saber cu´antas componentes independientes tiene, analicemos la estructura Aµ B νδ , con B νδ = −B δν . Como B νδ tiene 6 componentes independientes, entonces M µνδ tiene 24 componentes independientes. Leyes de conservaci´ on. La ecuaci´on (7.20) se generaliza as´ı: ∂µ T µν = T µν ,µ = 0

(7.32)

Esta ecuaci´on expresa la conservaci´ on de la energ´ıa y el momentum. Veamos ahora qu´e ocurrir´ıa si la divergencia de M µνδ fuera cero: ∂µ M µνδ = 0 Esta ecuaci´on dice que ∂0 M 0νδ = −∂a M aνδ , es decir 173

(7.33)

∂ ∂ 0νδ M = −c a M aνδ ∂t ∂x Z Z d ∂ 0νδ 3 M aνδ d3 x M d x = −c dt ∂xa El lado derecho de la u ´ltima ecuaci´on es un integral de volumen; de acuerdo con el teorema de Gauss, es igual a un integral en la superficie que envuelve al volumen. Pensemos que esta superficie cubre completamente al sistema f´ısico, de manera que M aνδ y sus derivadas son, all´ı, cero. Entonces el integral es cero y queda Z d M 0νδ (x)d3 x = 0 (7.34) dt R O sea que lasZ10 cantidades M 0νδ d3 x son constantes del movimiento. En 1 particular, M 032 d3 x , que es el momentum angular total en direcci´on c x, se conserva. Tambi´en Z son constantesZlas componentes en direcci´on y y en 1 1 direcci´on z, que son M 013 d3 x y M 021 d3 x, respectivamente. c c Lo que acabamos de ver es ya rutina: una divergencia nula corresponde a una ley de conservaci´ on. Lo interesante es aclarar bajo qu´e condiciones se anula la divergencia de M µνδ , es decir, qu´e se necesita para que se conserve el momentum angular. Para responder esta pregunta colocamos (7.31) en (7.33): 0 = ∂µ (T µν xδ − T µδ xν ) = (∂µ T µν )xδ − (∂µ T µδ )xν + T µν ηµ δ − T µδ ηµ ν = (∂µ T µν )xδ − (∂µ T µδ )xν + T δν − T νδ

(7.35)

Esta ecuaci´on se cumple si ∂µ T µν = 0 y T δν = T νδ . En conclusi´on, el momentum angular se conserva cuando se cumplen estas dos condiciones: ∂µ T µν = 0 y T µν = T νµ . Resumen: la ecuaci´on ∂µ T µν = 0 expresa la conservaci´ on de la energ´ıa y el momentum; si T µν = T νµ , la ecuaci´on ∂µ T µν = 0 expresa la conservaci´ on de la energ´ıa, el momentum y el momentum angular. 174

Buscaremos siempre tensores de energ´ıa-momentum que sean sim´etricos por dos razones: 1) Para que que la ecuaci´on ∂µ T µν = 0 exprese no solamente la conservaci´on de la energ´ıa-momentum, sino tambi´en la conservaci´ on del momentum angular. 2) Para que la ecuaci´on del campo gravitatorio no sea inconsistente (v´eanse los comentarios acerca de la simetr´ıa del tensor energ´ıa-momentum que aparecen en la p´agina 298).

175

176

Cap´ıtulo 8

Din´ amica lagrangiana

Cuando a una part´ıcula se le imponen unas condiciones iniciales, ella sigue cierta trayectoria. Y si, repitiendo el experimento, a la part´ıcula se le imponen de nuevo las mismas condiciones iniciales, ella repite la trayectoria del primer experimento. Es como si la part´ıcula estuviera obligada a seguir esa trayectoria. ¿Qu´e tiene especial esa trayectoria, qu´e la distingue? Para responder esta pregunta los f´ısicos han elaborado la idea de trayectorias variadas: otras rutas que la part´ıcula no sigue. Las trayectorias variadas no son rutas verdaderas, sino imaginadas. Del conjunto total formado por la trayectoria verdadera y las imaginadas, la verdadera se distingue por la siguiente caracter´ıstica: en ella se minimiza la acci´on. En general, todos los sistemas f´ısicos, al evolucionar, toman aquella ruta en la que se minimiza la acci´on. El presente cap´ıtulo desarrolla estas ideas en una formulaci´ on manifiestamente covariante.

8.1

Teor´ıa lagrangiana para una part´ıcula

Parametrizaci´ on de una curva. Continuamos con la notaci´on habitual, en la que xµ son las coordenadas de un evento cualquiera del espaciotiempo y ηµν dxµ dxν es el intervalo entre dos eventos cercanos. Vamos a estudiar el movimiento de una part´ıcula masiva. Para ganar generalidad suponemos que el movimiento es acelerado, y la part´ıcula libre ser´a un caso particular de nuestro estudio. Pensemos, as´ı como en la la secci´on 5.7, que la trayectoria total de la part´ıcula est´a compuesta de muchos fragmentos infinitesimales. Escojamos uno cualquiera de ellos y d´emonos cuenta de que existe un observador inercial respecto al cual la part´ıcula est´a aproximadamente en reposo. Un poco de tiempo despu´es, y debido a la aceleraci´on de la part´ıcula, ´esta 177

ya no estar´a en reposo respecto al primer observador inercial, el cual se ha vuelto obsoleto y debe ser substituido por otro observador para el pr´oximo fragmento de trayectoria. Vemos as´ı que diferentes observadores, todos inerciales, se relevan para acompa˜ nar a la part´ıcula en fragmentos infinitesimales sucesivos. Cada uno de los observadores registra un dτ dado por: c dτ =

p ηµν dxµ dxν

en la trayect. de la part´ıcula

(8.1)

R y el tiempo propio se define como τ = dτ . Ya que cada dτ es un invariante, un escalar, concluimos que τ es tambi´en un escalar. Llamaremos trayectoria verdadera a la l´ınea en el mundo que verdaderamente sigue la part´ıcula que estamos estudiando. Esta trayectoria es el resultado de las fuerzas que sobre ella operan y de las condiciones iniciales. A cada punto x ¯ de la trayectoria verdadera le corresponde un valor de τ ; en otras palabras, las x ¯µ son funciones del par´ametro escalar τ , dependencia que escribimos en la forma habitual x ¯µ = x ¯µ (τ ). Por ejemplo, si en τ = 3.7 las coordenadas de la part´ıcula son (22, 33, 44, 55), podemos escribir x ¯0 (3.7) = 22, x ¯1 (3.7) = 33, x ¯2 (3.7) = 44, x ¯3 (3.7) = 55. Curvas variadas. Pensemos ahora en otra curva imaginaria, diferente a la trayectoria verdadera; esta “trayectoria virtual” se construye punto a punto de la manera siguiente: el punto x ¯µ (τ ) se corre una cantidad δxµ (τ ) , o sea que las coordenadas del nuevo punto ser´an x ¯µ (τ ) + δxµ (τ ) . Vemos as´ı que todos los puntos de la trayectoria verdadera y todos los puntos de la nueva curva son funciones del mismo par´ametro escalar τ . Sean E1 y E2 dos eventos de la trayectoria verdadera, en los cuales el tiempo propio vale τ1 y τ2 , respectivamente. Consideramos curvas virtuales arbitrarias, pero con la condici´on de que pasen por E1 y E2 . Esto quiere decir que las variaciones δxµ deben ser cero en los extremos E1 y E2 , lo que se escribe δxµ (τ1 ) = δxµ (τ2 ) = 0

(8.2)

El c´ alculo de variaciones. Ahora pensamos que la trayectoria verdadera se distingue de las variadas porque en la primera se minimiza el integral de l´ınea de una funci´on L: 178

Z

τ2

δ

L dτ = 0

en la trayectoria verdadera

(8.3)

τ1

Si L es dada, la condici´on (8.3) se encarga de determinar cu´al es la curva verdadera que pasa por E1 y E2 . Si la curva verdadera es dada, la condici´on (8.3) se encarga de determinar cu´al es la funci´on L. Pasemos a desarrollar (8.3): Z

τ2

0 =

δL dτ

(8.4)

³ ∂L δxα + ∂xα

(8.5)

τ1

Z

∂L dxα ´ δ dτ dxα dτ τ1 ∂ dτ Z τ2 ³ ∂ L dδxα ´ ∂L α dτ = δx + dxα dτ ∂xα τ1 ∂ dτ =

τ2

(8.6)

El u ´ltimo t´ermino del lado derecho se integra por partes, as´ı: Z

¯τ2   ¯ Z τ2 ¯ α dδx  ∂L  d ∂L  α α ¯ dτ =  −  δx dτ  α δx ¯ dx ¯ dτ dτ dxα τ1 ¯ ∂ ∂ dτ dτ τ1 

τ2

τ1

∂L dxα ∂ dτ

En esta ecuaci´on el primer t´ermino del lado derecho es cero debido a (8.2), y la f´ormula (8.6) queda: Z

 τ2

0 = τ1



d ∂L  α  ∂L  α −  δx dτ ∂x dτ dxα ∂ dτ

Finalmente, como esta ecuaci´on debe ser v´alida para valores arbitrarios de δxα , es necesario que el integrando sea cero: ∂L d ∂L = 0 − α ∂x dτ dxα ∂ dτ 179

(8.7)

Estas son las c´elebres ecuaciones de Euler y Lagrange. El principio variacional (8.3) se expresa mediante la ecuaci´on diferencial (8.7). En verdad, las ecuaciones de Euler-Lagrange no suelen ser muy u ´tiles en problemas pr´acticos. La importancia del m´etodo lagrangiano radica, primero, en que las (8.7) son invariantes bajo transformaciones generales de coordenadas y, segundo, por el impacto que tienen en amplias ´areas de la f´ısica te´orica. Usualmente uno conoce la ecuaci´on de la trayectoria verdadera y desea averiguar cu´al es la funci´on L adecuada. Se propone tentativamente una L de prueba, y seguidamente se procede a desarrollar las ecuaciones (8.7) correspondientes; si estas ecuaciones coinciden con la ecuaci´on conocida de la trayectoria verdadera, entonces la L de prueba es buena. Debemos tener presente que el c´alculo variacional utiliza, en el fondo, los dos primeros t´erminos de una serie de Taylor. En efecto, esto es lo que se entiende al pasar de la ecuaci´on (8.4) a la (8.5). As´ı como en toda serie de Taylor, las derivadas se calculan en el punto de referencia (en la trayectoria verdadera), o sea que la ecuaci´on (8.7) se puede escribir m´as claramente as´ı: ·

∂L ∂xα



¸ − Verdadera



d  ∂L  = 0   dxα dτ ∂ dτ Verdadera

(8.8)

dxα y τ . Escribimos entonces L = L es en general una funci´on de xα , dτ µ ¶ α dx L xα , , τ . La lagrangiana L y la acci´on A se definen as´ı: dτ

L =

1 L γ Z τ2

A =

lagrangiana L dτ

Acci´on

(8.9) (8.10)

τ1

p Aqu´ı, 1/γ = 1 − u2 /c2 , y u es la trivelocidad de la part´ıcula. La acci´on debe ser un escalar, lo que implica que L tambi´en es escalar. Pero la lagrangiana L no es escalar. Hay otra manera de escribir la acci´on, que se obtiene combinando las ecuaciones (2.14), (8.9) y (8.10): 180

Z

t2

L dt

A =

(8.11)

t1

Part´ıcula libre. Como una aplicaci´on sencilla de la formulaci´ on lagrangiana reci´en vista, estudiemos el caso de la part´ıcula libre. De acuerdo con la dpα dUα ecuaci´on (6.34) podemos escribir = m0 = 0, o sea que: dτ dτ dUα = 0 dτ

(8.12)

Buscamos una funci´on L tal que su ecuaci´on (8.7) de Euler-Lagrange coincida con (8.12). Proponemos: ¶ r µ α dxµ dxν α dx = ηµν L x , dτ dτ dτ

(8.13)

Para desarrollar las ecuaciones (8.7) procedemos a calcular los t´erminos ∂L d ∂L y : α ∂x dτ dxα ∂ dτ ∂L ∂xα ∂L dxα ∂ dτ

= 0 =

=

(8.14)

· ¸ ∂ dxµ dxν η dxα µν dτ dτ ∂ dτ · ¸ ν 1 dxµ ν µ dx ηµν η α + ηµν η α 2L dτ dτ 1 2L

=

1 dxν 2ηνα 2L dτ

(8.15)

=

1 dxα L dτ

(8.16)

La ecuaci´on (8.8) exige que evaluemos (8.14) y (8.16) en la trayectoria verdadera. Comencemos aclarando cu´anto vale L en la trayectoria verdadera. De acuerdo con la ecuaci´on (8.13) podemos escribir 181

"r [ L ]Verdadera =

dxµ dxν ηµν dτ dτ

# Verdadera

De otro lado la ecuaci´on (8.1) dice que "r

dxµ dxν ηµν dτ dτ

# =c Verdadera

Combinando las dos u ´ltimas ecuaciones resulta [ L ]Verdadera = c, y al evaluar (8.16) en la trayectoria verdadera se obtiene: 



· ¸ 1 dxα  ∂L  =  dxα  c dτ Verdadera ∂ dτ Verdadera La ecuaci´on (8.8) da, finalmente, · ¸ 1 d2 xα − = 0 c dτ 2 Verdadera Esta ecuaci´on coincide con (8.12), lo que nos permite concluir que la escogencia (8.13) es apropiada. Con (8.9) se sigue que un lagrangiano para part´ıcula libre es r 1 dxµ dxµ L= (8.17) γ dτ dτ El m´etodo lagrangiano no determina un´ıvocamente la funci´on L. Por ejemplo, cualquier m´ ultiplo de (8.17) es tambi´en bueno para part´ıcula libre. Pronto usaremos este: r m0 c dxµ dxµ L=− (8.18) γ dτ dτ Part´ıcula en un campo Aµ . Despu´es de estudiar la part´ıcula libre, pasemos al pr´oximo nivel de complejidad estudiando la part´ıcula sometida a una fuerza. Veamos el caso de una part´ıcula de carga q en un campo electromagn´etico Aµ . Sabemos que la ecuaci´on de movimiento est´a dada por la fuerza de Lorentz (6.33): 182

q dpα = F αβ Uβ dτ c

(8.19)

Seguiremos la rutina habitual, que consiste en proponer un L. Si su ecuaci´on (8.7) de Euler-Lagrange coincide con (8.19), entonces el L escogido es bueno. El L buscado debe ser (8.18) m´as un t´ermino que exprese la interacci´ on part´ıcula-campo: m0 c L∼− γ

r

dxµ dxµ + t´ermino de interacci´ on dτ dτ

La forma prerrelativista L = T − V = T − qφ sugiere que el t´ermino de interacci´on es parecido a −qφ : m0 c L∼− γ

r

dxµ dxµ − qφ , dτ dτ

y en vista de (8.9): r L ∼ −m0 c

dxµ dxµ − qγφ dτ dτ

Ahora, como E = mc2 = γm0 c2 , tenemos γ = φ = A0 , entonces: r L ∼ −m0 c

E p0 . Adem´as = m0 c2 m0 c

q 0 dxµ dxµ − p A0 dτ dτ m0 c

Sin embargo L debe ser un escalar, lo que sugiere que intentemos cambiar p0 A0 por pµ Aµ : r dxµ dxµ q µ L = −m0 c − p Aµ (8.20) dτ dτ m0 c ¿Es este L bueno? Para responder esta pregunta debemos averiguar si la ecuaci´on (8.7) de Euler-Lagrange de este L coincide con (8.19). Veremos enseguida que efectivamente (8.20) es una buena escogencia. Para demostrarlo calculemos todas la derivadas que intervienen en (8.7): 183

q µ ∂L =− p Aµ,α α dx m0 c

∂L ∂ = − m c dxα dxα 0 ∂ ∂ dτ dτ

r

dxµ dxµ q − dτ dτ m0 c

(8.21)

∂ pµ Aµ dxα ∂ dτ

El primer t´ermino del lado derecho ya fue calculado en (8.16); escribimos entonces: ∂L dxα ∂ dτ

=

−r

=

−r

=

−r

m0 c dxµ dxµ dτ dτ m0 c dxµ

dxµ dτ dτ m0 c

dxµ

dxµ dτ dτ

dxα q − Aµ dτ c

∂ dxµ dxα dτ ∂ dτ

dxα q − Aµ ηα µ dτ c dxα q − Aα dτ c

(8.22)

Ya podemos colocar (8.21) y (8.22) en (8.7):



m c q d q µ d dxα r 0 − Aα = − p Aµ,α µ dτ dx dxµ dτ c dτ m0 c dτ dτ

(8.23)

Recordemos, una vez m´as, lo que dec´ıamos respecto a la ecuaci´on (8.8): todos los t´erminos en (8.23) deben calcularse en la trayectoria verdadera. Entonces, de acuerdo con la f´ormula (8.1), la ra´ız cuadrada que aparece en el lado izquierdo de (8.23) es c: q d d pα + Aα = dτ c dτ dpα q dxµ ∂Aα + dτ c dτ ∂xµ 184

=

q µ p Aµ,α m0 c q µ U Aµ,α c

dxµ De nuevo, la derivada debe evaluarse en la trayectoria verdadera, dando dτ µ dx = U µ: dτ q q dpα + U µ Aα,µ = U µ Aµ,α dτ c c ¢ dpα q¡ q = Aµ,α − Aα,µ U µ = Fαµ U µ , dτ c c que coincide con (8.19). Vemos as´ı que (8.20) es una buena escogencia. Deteng´amonos un momento para mirar hacia atr´as. Primero estudiamos el problema m´as simple, que es part´ıcula libre; para L propusimos (8.13) y mostramos que, efectivamente, la ecuaci´on de Euler-Lagrange coincide con la ecuaci´on de movimiento (8.12). Despu´es pasamos al siguiente nivel de complejidad, que es la part´ıcula sometida a las fuerzas del campo electromagn´etico; para L propusimos (8.20) y mostramos que, efectivamente, la ecuaci´on de Euler-Lagrange coincide con la ecuaci´on de movimiento (8.19). En estos dos niveles iniciales hemos podido describir el movimiento de la part´ıcula. Queremos ahora atacar el pr´oximo nivel, que es describir el movimiento del campo; es decir, las ecuaciones de evoluci´ on del campo, que son las ecuaciones de Maxwell. El campo Aµ (x) juega el papel de coordenada generalizada. Como hay infinitos eventos x que forman un continuo, hay tambi´en un n´ umero infinito de coordenadas Aµ (x) que forman un continuo. Es necesario que desarrollemos la teor´ıa lagrangiana para coordenadas continuas, asunto que atacaremos enseguida.

8.2

Teor´ıa lagrangiana para coordenadas continuas

La formulaci´on lagrangiana no se reduce al estudio de las trayectorias de las part´ıculas, sino que adem´as se aplica a los campos, que son aquellas cantidades f´ısicas que son funciones continuas del espacio y del tiempo. Llamemos ω(t, r) al campo que queremos estudiar: ´esta es una funci´on continua de las coordenadas (t, r) de los eventos del espaciotiempo. Para un r fijo, el campo ω es una funci´on u ´nicamente de t, funci´on a la que llamamos “la trayectoria verdadera del campo ω en el punto fijo r”. Al compendiar todos los puntos r del espacio se crea el concepto de “la trayectoria verdadera de ω en todo el 185

espacio”. Alrededor de ´esta podemos imaginar variaciones, trayectorias que no ocurren realmente. Pensemos ahora en una porci´on del espaciotiempo comprendida entre t1 y t2 , y en un volumen V bordeado por una superficie S. Imaginemos trayectorias variadas, con unas variaciones δω(t, r) que cumplen estas condiciones de frontera: δω(t1 , r) = δω(t2 , r) = 0 δω(t, r) = 0

para todo r

(8.24)

en S, para todo t

(8.25)

El lagrangiano L es el integral de volumen de una densidad lagrangiana L: Z L d3 x

L =

(8.26)

V

L = L(ω(x), ∂µ ω(x))

(8.27)

La acci´on (8.11) es entonces: Z

t2

Z

Z 3

A =

L dt d x = t1

L d4 x

(8.28)

V

El principio de Hamilton dice que δA = 0 en la trayectoria verdadera. En vista de (8.28) escribimos: ZZ 0 =

δL dt d3 x

¶ ∂L ∂L δω + δω,µ dt d3 x = ∂ω ∂ω,µ ¶ ZZ µ ∂L ∂L ∂ δω + δω dt d3 x = ∂ω ∂ω,µ ∂xµ

(8.29)

ZZ µ

En el lado derecho reconocemos que · ¸ ∂L ∂ ∂ ∂L ∂ ∂L δω = δω − δω µ , µ µ ∂ω,µ ∂x ∂x ∂ω,µ ∂x ∂ω,µ 186

(8.30)

o sea que (8.30) es: µ

ZZ δω

∂ ∂L ∂L − µ ∂ω ∂x ∂ω,µ



ZZ 3

dt d x = −

· ¸ ∂ ∂L δω dt d3 x ∂xµ ∂ω,µ

(8.31)

Llamemos LD al lado derecho de esta ecuaci´on. Este lado derecho es una suma de cuatro t´erminos, seg´ un µ recorre los valores 0,1,2,3: Z Z

t2

LD = − V

t1

· ¸ · ¸ Z t2 Z ∂ ∂ ∂L ∂L 3 δω dtd x − δω d3 x dt a ∂ω c ∂t ∂ω,0 ∂x ,a t1 V (8.32)

En el primer t´ermino de (8.32) se ejecuta la integraci´ on temporal y (8.24) dice que el resultado es cero. Del mismo modo, en el segundo t´ermino de (8.32) se ejecuta la integraci´on espacial y (8.25) dice que el resultado es cero. Vemos as´ı que LD es cero y (8.31) queda: µ

ZZ δω

∂ ∂L ∂L − µ ∂x ∂ω,µ ∂ω

¶ dt d3 x = 0

Como las variaciones δω son arbitrarias, la cantidad entre par´entesis debe ser cero: ∂ ∂L ∂L = ∂xµ ∂ω,µ ∂ω

(8.33)

Esta es la ecuaci´on de Euler-Lagrange para un campo ω. Supongamos que se conoce la ecuaci´on de movimiento de un campo. Para hacer la formulaci´on lagrangiana se comienza proponiendo una L, en base a la cual se desarrolla la ecuaci´on (8.33) de Euler-Lagrange. Si el resultado de ese desarrollo coincide con la ecuaci´on de movimiento del campo, decimos que la escogencia de L fue apropiada. As´ı se hace para formular lagrangianamente una ecuaci´on de movimiento dada. En otras ocasiones se desea construir una teor´ıa que tenga ciertas propiedades y se debe comenzar proponiendo de entrada una L con la simetr´ıa deseada. Aqu´ı hay cierta dosis 187

de libertad; pero al proponer una densidad lagrangiana se debe verificar que la L propuesta sea verdaderamente un escalar1 .

8.3

El tensor energ´ıa-momentum

La formulaci´on lagrangiana conduce a la formulaci´ on hamiltoniana y al tensor energ´ıa-momentum. A continuaci´ on veremos que este tensor surge naturalmente en el estudio de las translaciones en el espaciotiempo. Para tal efecto debemos demostrar primero que bajo una translaci´on infinitesimal δaµ el campo ω y su derivada ∂µ ω sufren unas variaciones dadas por δω = (∂ν ω)δaν y δ∂µ ω = (∂µ ∂ν ω)δaν . El grupo de las translaciones en el espaciotiempo. Sean p1 y p2 dos puntos del espacio xyz, y sea b = p2 − p1 . En estos dos puntos, el campo ω adopta los valores ω(p1 ) y ω(p2 ). Ahora vamos a pensar en una translaci´on activa de un sistema f´ısico aislado: el sistema f´ısico (el campo), se translada una cantidad b, mientras permanecen fijos los ejes coordenados y los puntos p1 y p2 : El valor del campo en p1 antes de la translaci´on es ω(p1 ). El valor del campo en p2 antes de la translaci´on es ω(p2 ). El valor del campo en p2 despu´es de la translaci´on es ω(p1 ). El valor del campo en p2 ha sufrido un cambio: ω(p2 ) → ω(p1 ) = ω(p2 − b).

En general :

ω(r) → ω(r − b) Para una translaci´on infinitesimal b = −δa: ω(r) → ω(r + δa) En este momento hacemos una generalizaci´on a cuatro dimensiones. Cuando 1 Ya vimos que A es escalar; adem´ as la ecuaci´ on (5.49) dice que el diferencial de volumen dt d3 x es escalar; la ecuaci´ on (8.28) dice entonces que L es escalar.

188

el sistema f´ısico se translada una cantidad constante −δaµ , el valor del campo en el evento xµ sufre un cambio: ω(xµ ) → ω(xµ + δaµ ) , o sea que δω(x) = ω(xµ + δaµ ) − ω(xµ ) =

∂ω δaν . M´as cortamente: ∂xν

δω = (∂ν ω)δaν

(8.34)

Esta es la f´ormula que nos propusimos demostrar. Ella dice c´omo var´ıa el campo bajo la translaci´on; ahora veamos c´omo var´ıa la derivada del campo. Tomar derivada ∂µ en ambos lados de(8.34): ∂µ δω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν δ∂µ ω = (∂µ ∂ν ω)δaν + (∂ν ω)∂µ δaν

(8.35)

Como δaν es constante, queda finalmente: δ∂µ ω = (∂µ ∂ν ω)δaν

(8.36)

Concluye as´ı la tarea preliminar que nos hab´ıamos propuesto de calcular las variaciones δω y δ∂µ ω. El tensor can´ onico de energ´ıa y momentum. Enseguida procedemos a calcular la variaci´on δL ocasionada por una translaci´on infinitesimal δaν . Calculamos esta δL de dos maneras. La primera es: δL =

∂L ν δa ∂xν

(8.37)

y la segunda manera es con la regla de la derivaci´ on en cadena: δL =

∂L ∂L δω + δ∂µ ω ∂ω ∂∂µ ω 189

(8.38)

En el primer t´ermino del lado derecho utilizar la ecuaci´on (8.33): µ ¶ ∂L ∂L δL = ∂µ δω + δ∂µ ω ∂∂µ ω ∂∂µ ω

Ahora usamos (8.34) y (8.36): ·µ ¶ ¸ ∂L ∂L δL = ∂µ ∂ν ω + ∂µ ∂ν ω δaν ∂∂µ ω ∂∂µ ω µ

¶ ∂L = ∂µ ∂ν ω δaν ∂∂µ ω ¶ µ ∂L ω,ν δaν = ∂µ ∂ω,µ

(8.39)

Igualamos los lados derechos de (8.37) y (8.39): µ ∂µ Es decir:

·

µ ∂µ

¶ ∂L ω,ν δaν = (∂ν L) δaν ∂ω,µ

∂L ω,ν ∂ω,µ



¸ −η

µ

ν ∂µ L

δaν = 0

Ahora, como las δa son arbitrarias, la cantidad entre par´entesis debe ser cero: µ

∂µ

¶ ∂L ω,ν − η µ ν ∂µ L = 0 ∂ω,µ µ ¶ ∂L µ ∂µ ω,ν − η ν L = 0 ∂ω,µ µ ¶ ∂L ,ν µν ∂µ ω −η L = 0 ∂ω,µ 190

(8.40)

La u ´ltima ecuaci´on se escribe µν ∂µ Tcan = 0,

(8.41)

con µν Tcan (x) =

∂L ,ν ω − η µν L ∂ω,µ

(8.42)

Este T µ ν se llama el tensor can´ onico de energ´ıa-momentum, y por esta raz´on escribimos el sub´ındice “can”. La ecuaci´on (7.21) nos indic´o cu´ales son las cuatro cantidades que se conservan cuando la divergencia del tensor energ´ıa-momentum es cero. En nuestro caso el tensor can´onico tambi´en tiene divergencia cero, y en consecuencia las cuatro cantidades conservadas son: Z 0ν Tcan (x) d3 x

Las cuatro cantidades que hay dentro del integrando dan las densidades de energ´ıa y de momentum: ∂L ω˙ − L ∂ ω˙

H =

00 Tcan

→ − P =

→ 1 0a ∂L − Tcan = − ∇ω c ∂ ω˙

=

Aqu´ı, ω˙ = ∂ω/∂t. La conservaci´on de energ´ıa-momentum es consecuencia del aislamiento del sistema. Para un sistema que interact´ ua con el exterior, la L no es como en (8.27), sino L = L(x, ω, ω,µ ). Que L dependa expl´ıcitamente de x agrega algunos t´erminos en las ecuaciones que hemos escrito, y al final, en vez de la ecuaci´on (8.40) resulta: µ ∂µ

¶ ∂L µ ω,ν − η ν L 6= 0 , ∂ω,µ 191

o sea que no hay divergencia nula ni conservaciones. Pero regresemos al sistema aislado, para el cual la divergencia del tensor can´onico es cero (se conservan la energ´ıa y el momentum). Tensor sim´ etrico, tensor asim´ etrico. N´otese en la definici´on (8.42) que los ´ındices µ y ν intervienen disparejamente, o sea que el tensor can´onico µν Tcan no es necesariamente sim´etrico bajo el intercambio de µ y ν. De heµν νµ cho, en algunos problemas ocurre que Tcan = Tcan y en otros ocurre que µν νµ Tcan 6= Tcan . Esto es preocupante ya que, como dec´ıamos en la p´agina 175, necesitamos tensores energ´ıa-momentum que sean sim´etricos. En aquellos µν νµ µν problemas felices en los que Tcan = Tcan , el Tcan es satisfactorio. Pero si en µν νµ µν alg´ un problema resulta que Tcan 6= Tcan , entonces Tcan es insatisfactorio y se µν µν necesita encontrar otro tensor θ que s´ı sea satisfactorio. El Tcan asim´etrico µν debe ser “simetrizado”. Se trata de apoyarse en Tcan para construir otro tensor de energ´ıa-momentum θµν que sea satisfactorio, es decir, que cumpla estas dos condiciones: ∂µ θµν = 0 θµν = θνµ

(8.43)

µν ¿C´omo construir θµν a partir de Tcan ? No hay una regla que sirva para µν todos los casos; pero en un primer intento podemos sumarle a Tcan un nuevo tensor, aun desconocido, que llamamos B µν : µν θµν = Tcan + B µν

(8.44)

Se trata de averiguar el tensor desconocido B µν . Para tal efecto vamos a colocar la θµν de la ecuaci´on (8.44) en las dos ecuaciones (8.43). Al poner µν (8.44) en la primera de las condiciones (8.43) se obtiene ∂µ Tcan + ∂µ B µν = 0 y, en vista de (8.41) concluimos que ∂µ B µν = 0

(8.45)

Ahora, utilizando la ecuaci´on (8.44) en la segunda de las condiciones (8.43) µν νµ llegamos a Tcan + B µν = Tcan + B νµ , es decir: 192

νµ µν B µν − B νµ = Tcan − Tcan

(8.46)

µν En conclusi´on: cuando Tcan resulta asim´etrico, debemos construir un nuevo µν tensor energ´ıa-momentum θ satisfactorio, es decir, un θµν que cumpla las µν condiciones (8.43). Se propone θµν = Tcan + B µν . La inc´ognita B µν debe cumplir las ecuaciones (8.45) y (8.46). La pr´oxima secci´on muestra c´omo se µν simetriza el Tcan del campo electromagn´etico.

8.4

Formulaci´ on lagrangiana del campo electromagn´ etico

El campo electromagn´etico nos ofrece una oportunidad para ilustrar con un ejemplo las ideas que hemos desarrollado acerca de la formulaci´ on lagrangiana de los campos. Comenzamos, como es costumbre, proponiendo una densidad lagrangiana L tal que sus ecuaciones de Euler-Lagrange coincidan con las ecuaciones de movimiento, que en este caso son las cuatro ecuaciones de Maxwell (6.1-6.2). Ya vimos sin embargo, en la p´agina 150, que la definici´on Fµν = Aν ,µ − Aµ,ν garantiza que las dos ecuaciones homog´eneas de Maxwell se satisfagan autom´aticamente. Entonces la u ´nica tarea que debe cumplir L es reproducir a las dos ecuaciones inhomog´eneas, condensadamente escritas en la f´ormula (6.31). Proponemos: L=−

1 1 Fαβ F αβ − Jα Aα 16π c

(8.47)

Calculemos los t´erminos que intervienen en la ecuaci´on (8.33) de EulerLagrange. El campo es Aσ : ∂L 1 ∂ =− F αβ Fαβ ∂Aσ,µ 16π ∂Aσ,µ µ ∂Fαβ 1 =− F αβ + 16π ∂Aσ,µ µ ∂Fαβ 1 =− F αβ + 16π ∂Aσ,µ =−

1 αβ ∂Fαβ F 8π ∂Aσ,µ 193

∂F αβ Fαβ ∂Aσ,µ



∂Fαβ αβ F ∂Aσ,µ



∂L ∂Aσ,µ

∂L ∂Aσ,µ

= −

1 αβ ∂ F (Aβ ,α − Aα,β ) 8π ∂Aσ,µ

= −

1 αβ σ µ F (η β η α − η σ α η µ β ) 8π

= −

1 (F µσ − F σµ ) 8π

= −

1 µσ F 4π

(8.48)

De otro lado: 1 ∂L = − J σ, ∂Aσ c entonces la ecuaci´on (8.33) de Euler-Lagrange es:



1 1 ∂µ F µσ = − J σ , 4π c

(8.49)

que coincide con la ecuaci´on (6.31) que quer´ıamos obtener. Vemos as´ı que (8.47) es una buena densidad lagrangiana. Nos interesa particularmente el campo de radiaci´on en el vac´ıo, donde Jα es cero; en este caso la ecuaci´on (8.47) da L=−

1 Fαβ F αβ : 16π

radiaci´on libre

(8.50)

µν El tensor can´ onico Tcan . Vamos a calcular el tensor can´onico de energ´ıamomentum, usando la f´ormula (8.42), que en nuestro caso es:

µν Tcan =

∂L Aσ ,ν − η µν L ∂Aσ,µ

(8.51)

En el lado derecho usamos (8.48) y (8.50): µν Tcan =−

1 µν 1 µ σ,ν F σA + η Fαβ F αβ 4π 16π 194

(8.52)

Por las razones que expusimos en la p´agina 175 es importante que invesµν tiguemos si Tcan es sim´etrico o asim´etrico; esto se resuelve calculando la νµ µν diferencia entre Tcan y Tcan : νµ µν Tcan − Tcan =

1 µ σ,ν 1 ν σ,µ F σA − F σA 6= 0 4π 4π

(8.53)

O sea que el tensor can´onico es asim´etrico. Vamos a remediar este defecto µν a˜ nadi´endole a Tcan una cantidad B µν , como en (8.44). La nueva cantidad debe cumplir las condiciones (8.45) y (8.46). Deteng´amonos inicialmente en la condici´on (8.46), que en vista de (8.53) es: B µν − B νµ = = = =

1 µ σ,ν 1 ν σ,µ F σA − F σA (8.54) 4π 4π 1 ν 1 µ F σ (Aσ,ν − Aν ,σ + Aν ,σ ) − F σ (Aσ,µ − Aµ,σ + Aµ,σ ) 4π 4π 1 µ 1 ν F σ (F νσ + Aν ,σ ) − F σ (F µσ + Aµ,σ ) 4π 4π 1 µ ν ,σ 1 ν µ,σ F σA − F σA (8.55) 4π 4π

Esto sugiere que probemos, tentativamente, la siguiente propuesta: B µν

= =

1 µ ν ,σ F σA 4π 1 µσ 1 1 F ∂σ Aν = ∂σ (F µσ Aν ) − (∂σ F µσ )Aν 4π 4π 4π

(8.56)

En el u ´ltimo t´ermino del lado derecho usar la ecuaci´on (7.26): B µν =

1 1 ∂σ (F µσ Aν ) + J µ Aν 4π c

(8.57)

1 ∂σ (F µσ Aν ) 4π

(8.58)

y en el vac´ıo se tiene J µ = 0: B µν =

195

Esto es lo que se obtiene al imponer la condici´on (8.46). Debemos todav´ıa ponerle atenci´on a la condici´on (8.45). El intento (8.56) es bueno si esa B µν cumple la condici´on (8.45). Veamos que efectivamente la cumple, aplicando la derivada ∂µ en ambos lados de (8.58):

∂µ B µν =

1 ∂µ ∂σ (F µσ Aν ) 4π

El lado derecho es cero, porque es la contracci´ on total de un tensor sim´etrico con otro antisim´etrico (v´ease la ecuaci´on (5.38)). Es claro entonces que la escogencia (8.56) es adecuada. Ya estamos en condici´on de colocar (8.52) y (8.56) en (8.44):

θµν

1 µ σ,ν 1 µν 1 µ ν ,σ F σA + η Fαβ F αβ + F σA 4π 16π 4π 1 µ 1 µν η Fαβ F αβ − F σ (Aσ,ν − Aν ,σ ) 16π 4π 1 µν 1 µ νσ η Fαβ F αβ − F σF 16π 4π

= − = =

He aqu´ı la respuesta final:

θµν

=

1 µσ ν 1 µν η Fαβ F αβ − F F σ 16π 4π

θµ ν

=

1 µ 1 µσ η ν Fαβ F αβ − F Fνσ 16π 4π

En forma matricial, los tensores θµν y θµ ν son: 196

(8.59)



θµν

+ B2)

     (E × B)x      1   = 4π   (E × B)y        (E × B)z  



θµ ν

1 2 2 (E

1 2 2 (E

+ B2)

     (E × B)x      1   = 4π   (E × B)y        (E × B)z  

(E × B)x

(E × B)y

(E × B)z



−Bx By

1 2 (E + B 2 ) 2 −Ey2 − By2

−Ex Ez

−Ey Ez

−Bx Bz

−By Bz

    −Ex Ez   −Bx Bz       −Ey Ez   −By Bz     1 2 2  (E + B )   2  2 2  −Ez − Bz

−(E × B)y

−(E × B)z

1 2 (E + B 2 ) 2 −Ex2 − Bx2 −Ex Ey

−(E × B)x 1 − (E 2 + B 2 ) 2 +Ex2 + Bx2 Ex Ey +Bx By

−Ex Ey −Bx By

Ex Ey +Bx By 1 − (E 2 + B 2 ) 2 +Ey2 + By2

Ex Ez

Ey Ez

+Bx Bz

+By Bz

197



    Ex Ez   +Bx Bz       Ey Ez   +By Bz      1 2 − (E + B 2 )   2  2 2  +Ez + Bz

198

Cap´ıtulo 9

Transformaciones generales de coordenadas Cuando dedujimos las transformaciones de Lorentz nos dimos cuenta de que, si quer´ıamos usar coordenadas cartesianas (t, x, y, z), las ecuaciones deb´ıan ser lineales, y as´ı lo establecimos en la p´agina 21. Para el estudio de la relatividad general es necesario salirse de las ecuaciones lineales y abordar las transformaciones generales de coordenadas. Este cap´ıtulo, que a eso se dedica, pretende dar las bases matem´aticas necesarias para la formulaci´ on de la teor´ıa general de la relatividad, de Einstein. Comenzamos definiendo los espacios de Riemann. Decimos que un espacio (con coordenadas xµ ) es riemanniano si se cumplen las siguientes tres condiciones: • Existe una forma fundamental gµν dxµ dxν que es invariante bajo transformaciones generalizadas de coordenadas. • Todas las segundas derivadas de gµν existen y son continuas. • El determinante de gµν no es cero.

9.1

Sub´ındices y super´ındices

La forma fundamental gµν dxµ dxν se llama intervalo, y la denotamos (ds)2 : (ds)2 = gµν dxµ dxν ,

(9.1)

donde los n2 coeficientes gµν son, en general, funciones de las coordenadas xα . Estos coeficientes forman una matriz n×n que es sim´etrica. Para probar que es sim´etrica notemos que si en (9.1) intercambiamos los nombres de los ´ındices mudos µ y ν obtenemos (ds)2 = gνµ dxν dxµ = gνµ dxµ dxν . Al 199

comparar esto con (9.1) concluimos que gµν = gνµ . Hay otra matriz muy importante que es la identidad, que denotamos por medio del s´ımbolo δ µ ν . Ahora definimos la matriz g µα como la inversa de gαν : g µα gαν = δ µ ν

(9.2)

A partir de las n cantidades dxν y la matriz gµν definimos otras n cantidades dxµ de la manera siguiente: dxµ = gµν dxν

(9.3)

Ahora, si multiplicamos ambos lados de esta ecuaci´on por g ξµ y utilizamos la ecuaci´on (9.2) encontramos g ξµ dxµ = δ ξ ν dxν , es decir: dxξ = g ξµ dxµ

(9.4)

Las ecuaciones (9.3) y (9.4) indican que g µν sirve para “subir” un sub´ındice y gµν sirve para“bajar” un super´ındice. Los ´ındices se pueden bajar y subir no s´olo en dxα y en dxα , sino adem´as en cualquier otra cantidad, como por ejemplo: Cµ = gµν C ν

C µ = g µν Cν

Aα β γ = gνβ Aανγ

Aαβγ = g νβ Aα ν γ

Claramente podemos usar a g µα para subir un ´ındice en gαν , as´ı: g µα gαν = gµν = δµν : gµν = δµν

gµ ν = δµ ν

Cuando un ´ındice aparece una sola vez en un t´ermino, decimos que es libre. Por ejemplo, en B µ Cν los ´ındices µ y ν son libres. Si una misma letra aparece dos veces en un t´ermino, como super´ındice y como sub´ındice, decimos que se trata de ´ındices contra´ıdos. Por ejemplo, en B µ Cµ los ´ındices µ est´an contra´ıdos. Si multiplicamos ambos lados de la ecuaci´on Aµ ν = B µ Cν por gµσ obtenemos Aσν = Bσ Cν . As´ı mismo, al multiplicar ambos lados de Aµ ν = B µ Cν 200

por g νσ obtenemos Aµσ = B µ C σ . Finalmente, si multiplicamos ambos lados de Aµσ = B µ C σ por gµν se obtiene Aν σ = Bν C σ . En conclusi´on, todas estas ecuaciones son equivalentes: Aµ ν = B µ Cν , Aµν = Bµ Cν , Aµν = B µ C ν y Aµ ν = Bµ C ν . Vemos as´ı que dos ´ındices libres e iguales en ambos lados de una ecuaci´on se pueden subir o bajar. Reunamos las formas diferentes que conocemos de escribir la ecuaci´on del intervalo (9.1): (ds)2 = g µν dxµ dxν = gµν dxµ dxν = dxµ dxµ Ejemplo: En el plano podemos usar coordenadas cil´ındricas (r, ϕ) , que llamaremos (x1 , x2 ) . El intervalo es (ds)2 = (dx1 )2 + r2 (dx2 )2 , que escribimos sugestivamente as´ı: (ds)2 = dx1 dx1 + (x1 )2 dx2 dx2 + 0 dx1 dx2 + 0 dx2 dx1

y al comparar esto con (9.1) identificamos las cuatro entradas de la matriz gαβ : " # 1 0 gαβ = (9.5) 0 (x1 )2 F´acilmente calculamos el inverso de esta matriz, y la llamamos g αβ : " g αβ =

1

0

0

¡ ¢2 1/x1

# (9.6)

Finalmente, las componentes (x1 , x2 ) se calculan usando las f´ormulas (9.3) y (9.5), para obtener (x1 , (x1 )2 x2 ) = (r, r2 ϕ) La derivada tiene una notaci´on muy compacta:

∂µ =

∂ = gµν ∂ ν ∂xµ

∂µ = 201

∂ = g µν ∂ν ∂xµ

9.2

Transformaciones generales

Hemos dicho que xν son las coordenadas de un punto del espacio en un sistema de coordenadas no primado. Ahora, si se usa otro sistema de coordenadas, el mismo punto tendr´a coordenadas x0ν . Cada una de las coordenadas primadas x0µ debe ser funci´on de las no primadas xν : x0µ = x0µ (xν )

(9.7)

¿Son estas funciones lineales o no lineales? Para responder esta pregunta continuemos el ejemplo de la secci´on anterior, pensando ahora en la transformaci´on que lleva de coordenadas cil´ındricas (r, ϕ) a coordenadas cartesianas (x, y) . Llamando (x1 , x2 ) a las coordenadas cil´ındricas y (x01 , x02 ) a las cartesianas, podemos escribir la transformaci´on entre los dos sistemas coordenados: x01 = x1 cos x2 ;

x02 = x1 sen x2

(9.8)

Notemos que ∂x01 /∂x1 = cos x2 , ∂x01 /∂x2 = −x1 sen x2 , ∂x02 /∂x1 = sen x2 , y ∂x02 /∂x2 = x1 cos x2 . Queremos resaltar un asunto de primera importancia: las derivadas ∂x0µ /∂xν no son constantes, lo que marca una diferencia fundamental con las transformaciones lineales discutidas en la secci´on 5.2. Este ejemplo pone de presente la importancia de las transformaciones no lineales. Las transformaciones no lineales son interesantes desde un punto de vista matem´atico, pero tambi´en desde un punto de vista f´ısico, asunto que se hace evidente cuando se desea generalizar la relatividad especial, como veremos enseguida: En la relatividad especial se trata de observadores inerciales. Si queremos generalizar esta teor´ıa debemos pensar en la transformaci´on que lleva de un observador inercial a otro observador acelerado. Pensemos en un observador primado que tiene aceleraci´on a en direcci´on z respecto al no primado; en relatividad galileana y en notaci´on standard, la transformaci´on ser´ıa: 1 z 0 = z − (v0 t + at2 ) , 2 de donde vemos que ∂z 0 /∂t = −v0 − at 6= constante. Esto muestra que a´ un 202

para generalizar la m´as simple de las relatividades, como es la de Galileo, es preciso utilizar transformaciones no lineales, i.e., aquellas en las que las derivadas ∂x0µ /∂xν no son constantes. Vemos as´ı plenamente justificado este cap´ıtulo, dedicado a las transformaciones generales de coordenadas. En este contexto de las transformaciones generalizadas de coordenadas se definen los vectores:

9.3

Los vectores

Tomando diferenciales en ambos lados de la ecuaci´on (9.7) encontramos dx0µ =

∂x0µ ν dx ∂xν

(9.9)

Una de las piezas m´as importantes en la teor´ıa de transformaciones generalizadas de coordenadas es el vector dxµ . Entre dos puntos infinitamente pr´oximos la diferencia de coordenadas no primadas es dxµ y la diferencia de coordenadas primadas es dx0µ . Lo importante es que conociendo las componentes no primadas del vector (que son las dxµ ) podemos llegar a conocer las componentes primadas del vector (que son las dx0µ ) por medio de la f´ormula (9.9). Pensemos enseguida en un conjunto de cuatro cantidades que en las coordenadas no primadas aparecen como Aµ , mientras que en las coordenadas primadas aparecen como A0µ . Nosotros no podemos asegurar de antemano cu´al es la relaci´on entre las A0µ y las Aµ . Pero si ocurre que A0µ =

∂x0µ ν A , ∂xν

(9.10)

entonces decimos que A es un vector. dxµ es, por definici´on, el vector prototipo. Comparando (9.10) con (9.9) nos damos cuenta de que A transforma como dx , porque en ambas ecua∂x0µ ciones se usan los mismos coeficientes . Decimos que A es un vector ∂xν porque transforma como el vector prototipo (obs´ervese que uno no prueba que dx es un vector). El concepto de vector aparece inseparablemente ligado al concepto de las transformaciones de coordenadas. Que A sea un vector 203

no es una propiedad intr´ınseca de A; no podemos decir que A es un vector por s´ı s´olo, sino que el car´acter vectorial de A es una propiedad que tiene A en referencia a la transformaci´on de coordenadas xµ → x0µ . No cualquier conjunto de n cantidades, aunque se rotulen con ´ındices, es un vector. Invitamos al lector a regresar a la secci´on 5.2, y en particular al paso que se da entre las ecuaciones (5.14) y (5.15). Ese paso es inv´ alido en las transformaciones generales, o sea que, en vez de las ecuaci´on (5.15), debemos ahora escribir: x0µ 6=

∂x0µ ν x ∂xν

Transf. generales

(9.11)

Comparando las ecuaciones (9.9) y (9.11) nos damos cuenta de que xν no transforma como el vector prototipo dxν . Entonces xν no es un vector bajo el grupo de las transformaciones generales de coordenadas. Aunque s´ı es vector bajo el grupo de las transformaciones lineales. Vemos que un conjunto de n cantidades puede ser vector respecto a un grupo de transformaciones, y no serlo respecto a otro grupo; de esta manera confirmamos la afirmaci´on que hicimos arriba, en el sentido de que el car´acter vectorial de una cantidad no es una propiedad exclusiva de esa cantidad, en s´ı misma, sino que adem´as se refiere a un grupo de transformaciones. El vector dx se caracteriza por sus n componentes contravariantes dx0 , dx1 , dx2 , dx3 · ··, pero tambi´en se puede caracterizar por sus n componentes covariantes dx0 , dx1 , dx2 , dx3 · · · . La f´ormula (9.3) dice c´omo se construyen las cantidades dxµ , y tambi´en c´omo se construyen las cantidades Aµ : Aµ = gµν Aν Decimos entonces que todo vector A se caracteriza por sus n componentes contravariantes A0 , A1 , A2 , A3 · ··, y tambi´en se puede caracterizar por sus n componentes covariantes A0 , A1 , A2 , A3 · · · . Transformaci´ on de las componentes Aµ . Hemos visto que las componentes contravariantes Aµ transforman seg´ un (9.10), y debemos averiguar de qu´e manera transforman las componentes covariantes Aµ . Para tal efecto es preciso deducir antes una identidad importante. Hemos dicho que el intervalo (ds)2 es un escalar, es decir, da lo mismo en todos los sistemas 204

0 dx0 µ dx0 ν . coordenados; entonces la ecuaci´on (9.1) dice que gµν dxµ dxν = gµν Esta ecuaci´on es, obviamente, λ

0 gµν dxµ dxν = gλρ dx0 dx0

ρ

(9.12)

Entonces, utilizando la ecuaci´on (9.9): 0 gµν dxµ dxν = gλρ

∂x0λ ∂x0ρ µ ν dx dx ; ∂xµ ∂xν

reunir todo en el lado izquierdo: µ ¶ 0λ 0ρ 0 ∂x ∂x gµν − gλρ dxµ dxν = 0 ∂xµ ∂xν Como esta ecuaci´on debe ser v´alida para todos los valores de dxµ , la cantidad dentro del par´entesis debe ser cero: 0 gλρ

∂x0λ ∂x0ρ = gµν ∂xµ ∂xν

(9.13)

Ahora multiplicar ambos lados de esta ecuaci´on por g νπ y utilizar la ecuaci´on (9.2): ∂x0λ νπ 0 ∂x0ρ g gλρ = δµ π ∂xµ ∂xν

(9.14)

De otro lado es claro que, como las coordenadas xπ son independientes, entonces ∂xπ /∂xµ = δµ π . Ahora, la regla de la derivaci´ on en cadena dice que esta ecuaci´on es igual a: ∂x0λ ∂xπ = δµ π ∂xµ ∂x0λ

(9.15)

Igualemos entonces los lados izquierdos de las ecuaciones (9.14) y (9.15): ∂x0λ νπ 0 ∂x0ρ ∂x0λ ∂xπ g g = , λρ ∂xµ ∂xν ∂xµ ∂x0λ 205

y multipliquemos ambos lados de esta ecuaci´on por

∂xµ : ∂x0ω

∂xµ ∂x0λ νπ 0 ∂x0ρ ∂xµ ∂x0λ ∂xπ g g = λρ ∂x0ω ∂xµ ∂xν ∂x0ω ∂xµ ∂x0λ En ambos lados de esta ecuaci´on aparece el factor la derivaci´on en cadena dice que ecuaci´on (9.16) es

(9.16)

∂xµ ∂x0λ ; la regla de ∂x0ω ∂xµ

∂xµ ∂x0λ ∂x0λ = = δω λ , o sea que la ∂x0ω ∂xµ ∂x0ω

0 δω λ g νπ gλρ

∂x0ρ ∂xν

= δω λ

0 g νπ gωρ

∂x0ρ ∂xν

=

∂xπ ∂x0λ

∂xπ ∂x0ω

(9.17)

Esta es la ecuaci´on importante que quer´ıamos deducir. Ahora multiplicar ambos lados por Aπ : 0 gωρ

∂xπ ∂x0ρ ν A = Aπ ∂xν ∂x0ω

En el lado izquierdo utilizamos la ecuaci´on (9.10) para obtener: 0 gωρ A0ρ =

∂xπ Aπ , ∂x0ω

o sea que, finalmente: A0ω =

∂xπ Aπ ∂x0ω

(9.18)

Este es el modo como transforman las componentes covariantes de cualquier vector A . Por supuesto que las componentes dxµ transforman de la misma manera: dx0ω =

∂xπ dxπ ∂x0ω

206

(9.19)

9.4

Otros tensores

Pasemos a estudiar la estructura Aµ B ν , cuando A y B son vectores. De acuerdo con la regla de transformaci´on (9.10), las componentes contravariantes de A y B transforman as´ı: A0µ = (∂x0µ /∂xα )Aα y B 0ν = (∂x0ν /∂xβ )B β . Multipliquemos lado a lado estas dos ecuaciones para obtener: ∂x0µ ∂x0ν α β A B ∂xα ∂xβ

A0µ B 0ν =

Comparando con esta f´ormula, pasamos a definir lo que es un tensor de rango 2, de este modo: T es un tensor de rango 2 si ∂x0µ ∂x0ν αβ T ∂xα ∂xβ

T 0µν =

(9.20)

Las componentes contravariantes de T transforman como Aµ B ν ; de la misma manera, las componentes covariantes de T transforman como Aµ Bν :

0 Tµν =

∂xα ∂xβ Tαβ , ∂x0µ ∂x0ν

(9.21)

y las componentes mixtas transforman como Aµ Bν : T 0µ ν =

∂x0µ ∂xβ α T β, ∂xα ∂x0ν

(9.22)

∂xα ∂x0ν Tα β ∂x0µ ∂xβ

(9.23)

y como Aµ B ν : T0 µ ν =

Generalizamos diciendo que los tensores de rango j tienen j ´ındices. Los tensores de rango 0 reciben el nombre de escalares, y los de rango 1 se llaman vectores. Algunas de las componentes de un tensor C de rango 3 transforman as´ı: 207

C 0 µνδ =

∂x0µ ∂x0ν ∂x0δ αβγ C ∂xα ∂xβ ∂xγ

C 0 µνδ =

∂xα ∂xβ ∂xγ Cαβγ ∂x0µ ∂x0ν ∂x0δ

C0 µ ν δ =

∂xα ∂x0ν ∂xγ Cα β γ ∂x0µ ∂xβ ∂x0δ

Finalmente, un tensor de rango 4: A0µνσ ρ =

∂x0µ ∂x0ν ∂x0σ ∂xγ αβλ A γ ∂xα ∂xβ ∂xλ ∂x0ρ

(9.24)

Las transformaciones inversas: Hasta el momento hemos presentado la manera de averiguar las componentes primadas de un tensor en t´erminos de las no primadas. El camino inverso -las no primadas en t´erminos de las primadas- es muy f´acil. Multiplicando ambos lados de la ecuaci´on (9.10) por ∂xα se llega a: ∂x0µ ∂xα 0µ ∂xα ∂x0µ ν ∂xα ν A = A = A = δ α ν Aν = Aα ∂x0µ ∂x0µ ∂xν ∂xν Reescribamos esto: Aµ =

∂xµ 0ν A . ∂x0ν

Aµ =

∂x0ν 0 A ∂xµ ν

As´ı mismo:

Esto para tensores de rango 1. Para los de rango 2: T µν

=

∂xµ ∂xν 0αβ T ∂x0α ∂x0β

Tµν

=

∂x0α ∂x0β 0 T ∂xµ ∂xν αβ

Tµ ν

=

∂xµ ∂x0β 0α T β ∂x0α ∂xν 208

(9.25)

T

µ

ν

∂x0α ∂xν 0 β T ∂xµ ∂x0β α

=

Y los de rango 3: C µνδ =

∂xµ ∂xν ∂xδ 0αβγ C ∂x0α ∂x0β ∂x0γ

C µνδ =

∂x0α ∂x0β ∂x0γ 0 C ∂xµ ∂xν ∂xδ αβγ

Cµνδ =

∂x0α ∂xν ∂x0γ 0 β C γ ∂xµ ∂x0β ∂xδ α

La importancia del vector dxµ : Gran parte de la estructura de los tensores se fundamenta en el vector prototipo dxµ . En efecto: 1) En la ecuaci´on (9.10) hemos definido los vectores, en general, por comparaci´on con dxµ y, 2) en esta secci´on hemos construido tensores de rangos 0, 2, y 3 a partir de vectores. En general, un tensor de rango j > 0 transforma as´ı como transforma el producto de j vectores. Contracci´ on de ´ındices: Estudiemos la estructura Aµ Bµ , cuando A y B son vectores. Usando las reglas de transformaci´on (9.10) y (9.18) escribimos A0µ B 0 µ =

Ahora,

∂x0µ ∂xβ α A Bβ , ∂xα ∂x0µ

∂x0µ ∂xβ = δα β , entonces ∂xα ∂x0µ A0µ B 0 µ = Aµ Bµ

(9.26)

En palabras, el producto Aµ Bµ es, en general, invariante. El ejemplo m´as importante es el intervalo dxµ dxµ . Probemos que si A es un tensor de rango 4, entonces A0µνρ ρ es un tensor de rango 2. En efecto, si hacemos σ = ρ en la ecuaci´on (9.24) obtenemos ∂x0ρ ∂xγ ∂x0µ ∂x0ν ∂x0ρ ∂xγ αβλ A . Pero = δλ γ , entonces A0µνρ ρ = γ ∂xα ∂xβ ∂xλ ∂x0ρ ∂xλ ∂x0ρ 209

A0µνρ ρ =

∂x0µ ∂x0ν αβλ A λ, ∂xα ∂xβ

que es la forma como transforman los tensores de rango 2, de acuerdo con la ecuaci´on (9.20). En general, la contracci´ on de dos ´ındices en un tensor de rango j produce un tensor de rango j − 2. δ de Kronecker. Probemos que δµ ν es un tensor. Para tal efecto comen∂x0ν zamos escribiendo δµ0 ν = y luego usamos la regla de la derivaci´ on en ∂x0µ cadena: ν

δµ0 =

∂x0ν ∂x0ν ∂xα ∂x0ν ∂xβ α = = δβ , ∂x0µ ∂xα ∂x0µ ∂xα ∂x0µ

que es ciertamente el modo como transforman los tensores de rango 2, de acuerdo con ecuaci´on (9.23). El tensor m´ etrico. Al comparar las ecuaciones (9.13) y (9.25) nos damos cuenta de que gµν transforma como un tensor. Esto significa que gµν es un tensor. Se llama el tensor m´etrico y es de primera importancia porque contiene toda la informaci´on acerca de la geometr´ıa del espacio. Tensores sim´ etricos y antisim´ etricos: Con la ecuaci´on (9.20) se prueba f´acilmente que si T µν es un tensor sim´etrico en unas coordenadas, tambi´en ser´a sim´etrico en cualquier otro sistema coordenado. Y si F µν es antisim´etrico en unas coordenadas, tambi´en ser´a antisim´etrico en todos los otros sistemas coordenados:

9.5

T µν = T νµ



T 0µν = T 0νµ

F µν = −F νµ



F 0µν = −F 0νµ

(9.27)

La derivada

Veamos la derivada del vector A0µ ; empezamos usando la regla de la derivaci´ on en cadena y luego utilizamos la ecuaci´on (9.10): ∂A0ν ∂x0µ

=

∂xα ∂ A0ν ∂x0µ ∂xα 210

(9.28)

=

∂xα ∂ ∂x0ν β A ∂x0µ ∂xα ∂xβ

=

∂xα ∂x0ν ∂Aβ ∂xα ∂ 2 x0ν + Aβ ∂x0µ ∂xβ ∂xα ∂x0µ ∂xα ∂xβ

(9.29)

Escribamos de nuevo la u ´ltima ecuaci´on con notaci´on ∂µ : ∂µ0 A0ν =

∂xα ∂x0ν ∂xα ∂ 2 x0ν β ∂ A + Aβ α ∂x0µ ∂xβ ∂x0µ ∂xα ∂xβ

(9.30)

Observemos bien el lado derecho de esta ecuaci´on. Si el segundo t´ermino fuera cero, quedar´ıa claramente la ley de transformaci´on de los tensores de rango dos, de acuerdo con la ecuaci´on (9.23). Pero en el grupo de las transformaciones generalizadas de coordenadas ese segundo t´ermino no es cero, de donde concluimos que la derivada de un vector no es un tensor: En general, la derivada ∂µ no es una operaci´on covariante

(9.31)

Esta regla (9.31) tiene dos excepciones importantes: La primera es cuando el tensor es de rango 0; en este caso ∂µ s´ı es covariante. En efecto, sigamos de nuevo los pasos que llevaron de (9.28) a (9.30), pero esta vez con un escalar φ , para obtener ∂µ φ = ∂µ0 φ0 : La derivada de un escalar s´ı es una operaci´on covariante

(9.32)

La segunda excepci´on de la regla (9.31) ocurre con las transformaciones lin∂ 2 x0ν eales. Es claro que en este caso las segundas derivadas son cero y, en ∂xα ∂xβ consecuencia el segundo t´ermino en el lado derecho de (9.30) es cero, quedando limpiamente la transformaci´on de los tensores de rango 2, de acuerdo con (9.23). La m´as importante de las transformaciones lineales es la de Lorentz y, tal como se recuerda, all´ı la derivada de un tensor s´ı era un tensor (v´ease el paso de la ecuaci´on (5.42) a la (5.43)).

211

Existe una notaci´on concisa para la derivada, y es a trav´es de la coma. El uso se aclara con los siguientes ejemplos: Aµ,ν =

∂Aµ ∂xν

A0µ,ν =

∂A0µ ∂x0ν

F αβ ,ν =

∂F αβ ∂xν

Para mostrar que la derivada de un vector no es una operaci´on covariante hemos seguido unos c´alculos similares a los de la p´agina 134, y lo hemos hecho as´ı para mostrar el contraste entre las transformaciones lineales y las generales. Pero la falta de covariancia radica en un nivel m´as profundo: es el diferencial dAµ el que carece de covariancia. Para ver esto en detalle, y corriendo el riesgo de repetir un argumento que se ha presentado ya, usemos de nuevo la regla de la derivaci´ on en cadena para calcular dA0µ , as´ı: dA0µ = Es decir, dA0µ =

∂A0µ 0σ ∂A0µ ∂xν ∂A0µ ν 0σ dx = dx = dx ∂x0σ ∂xν ∂x0σ ∂xν

∂A0µ ν dx : ∂xν

dA0µ = =

∂ (A0µ ) dxν ∂xν µ 0µ ¶ ∂ ∂x π A dxν ∂xν ∂xπ

=

∂ 2 x0µ ∂x0µ ∂Aπ ν π ν A dx + dx ∂xν ∂xπ ∂xπ ∂xν

=

∂ 2 x0µ ∂x0µ π ν A dx + dAπ ∂xν ∂xπ ∂xπ

Si, en el u ´ltimo rengl´on, las segundas derivadas

∂ 2 x0µ fueran cero, quedar´ıa ∂xν ∂xπ

∂x0µ dA0µ = dAπ , que es la regla de transformaci´on de los vectores: en ∂xµπ tal caso dA ser´ıa un vector. Pero esas segundas derivadas no son cero en las transformaciones generalizadas de coordenadas, y concluimos que en las transformaciones generales el diferencial dAµ no es un vector: en general, el diferencial de un tensor no es un tensor.

212

La derivada es una operaci´on de primera importancia en la f´ısica, como lo muestra el hecho de que las ecuaciones de movimiento son ecuaciones diferenciales. Nosotros quisi´eramos escribir esas ecuaciones de modo tensorial, para que sean covariantes. El problema es que la derivada ∂µ y el diferencial d no son operaciones covariantes y, en consecuencia, es preciso que tengamos mucho cuidado cuando queramos utilizarlas. Debemos construir otras operaciones que se parezcan a ∂µ y d, que s´ı sean covariantes: estas nuevas operaciones s´ı pueden ser usadas tranquilamente en las ecuaciones de la f´ısica. En las secciones 9.13 y 10.5 presentaremos esas nuevas operaciones que se parecen a ∂µ y a d, y que s´ı son covariantes.

9.6

Matrices

Para los tensores de rangos 1 y 2, que son los que tienen 1 y 2 ´ındices, respectivamente, es muy c´omoda la notaci´on matricial. Definamos la matriz cuadrada Λµ ν =

∂x0µ ∂xν

(9.33)

Con Λ podemos reescribir las ecuaciones (9.10) y (9.20): A0 µ = Λµ ν Aν F 0 µν

= Λµ α F αβ Λν β = Λµ α F αβ ΛT

β

ν

O m´as concisamente: A0 µ = Λ Aν F 0 µν

= Λ F αβ ΛT

(9.34) (9.35)

Estamos desarrollando una teor´ıa general que puede aplicarse a transformaciones cuadridimensionales en el espaciotiempo, como las que ocurren en la gravitaci´on einsteiniana. Pero nuestra teor´ıa general de transformaciones tambi´en puede usarse para resolver problemas sencillos tridimensionales, que no involucran el tiempo, como son los simples cambios entre coordenadas cartesianas, cil´ındricas, parab´olicas, etc. Como ejemplo veamos la transformaci´on de coordenadas cartesianas a esf´ericas. 213

9.7

Coordenadas esf´ ericas

Antes de ejecutar esta transformaci´on, deteng´amonos brevemente para recordar un asunto del c´alculo vectorial en el triespacio (x, y, z). Un trivector cualquiera V se puede expresar en componentes cartesianas y tambi´en en ˆ x Vx + 1 ˆ y Vy + 1 ˆ z Vz y la componentes esf´ericas. La primera manera es V = 1 ˆ ˆ ˆ segunda es V = 1r Vr + 1θ Vθ + 1ϕ Vϕ . Igualemos estas dos expresiones: ˆ x Vx + 1 ˆ y Vy + 1 ˆ z Vz = 1 ˆ r Vr + 1 ˆ θ Vθ + 1 ˆ ϕ Vϕ 1

(9.36)

ˆx, 1 ˆy , 1 ˆ z ) y (1 ˆr , 1 ˆθ , 1 ˆ ϕ ) son Las relaciones entre los vectores unitarios (1 ˆr = 1 ˆ x sen θ cos ϕ + 1 ˆ y sen θ sen ϕ + 1 ˆ z cos θ 1 ˆθ = 1 ˆ x cos θ cos ϕ + 1 ˆ y cos θ sen ϕ − 1 ˆ z sen θ 1

(9.37)

ˆ ϕ = −1 ˆ x sen ϕ + 1 ˆ y cos ϕ 1 Al colocar estas tres ecuaciones en el lado derecho de la ecuaci´on (9.36) se encuentran las relaciones que existen entre las componentes cartesianas (Vx , Vy , Vz ) y las esf´ericas (Vr , Vθ , Vϕ ) : Vx = Vr sen θ cos ϕ + Vθ cos θ cos ϕ − Vϕ sen ϕ Vy = Vr sen θ sen ϕ + Vθ cos θ sen ϕ + Vϕ cos ϕ

(9.38)

Vz = Vr cos θ − Vθ sen θ O, en forma equivalente: Vr = Vx sen θ cos ϕ + Vy sen θ sen ϕ + Vz cos θ Vθ = Vx cos θ cos ϕ + Vy cos θ sen ϕ − Vz sen θ

(9.39)

Vϕ = −Vx sen ϕ + Vy cos ϕ Ya estamos en condici´on de ejecutar la transformaci´on de coordenadas cartesianas a esf´ericas. Las primeras son (x0 , x1 , x2 , x3 ) = (ct, x, y, z), y las segundas son (x00 , x01 , x02 , x03 ) = (ct, r, θ, ϕ). La transformaci´on es: 214

x00 = x0 p x01 = (x1 )2 + (x2 )2 + (x3 )2 x3 x02 = arc cos p (x1 )2 + (x2 )2 + (x3 )2 x2 x03 = arctan 1 x

(9.40)

Procedemos a calcular las entradas de la matriz Λ, de acuerdo con (9.33), para obtener 

1

0

   0 sen θ cos ϕ    Λ=  0 cos θ cos ϕ  r    sen ϕ 0 − r sen θ

0

0



  sen θ sen ϕ cos θ     cos θ sen ϕ sen θ   − r r     cos ϕ 0 r sen θ

(9.41)

El intervalo (2.1) en coordenadas cartesianas es ds2 = c2 dt2 − dx2 − dy 2 − dz 2

(9.42)

Cartesianas Al comparar esta ecuaci´on con (9.1) identificamos la matrix diagonal gµν = diag (1, −1, −1, −1, −1). La inversa de esta matriz es: µν gCartesianas = diag (1, −1, −1, −1, −1)

(9.43)

Esta es claramente la m´etrica de Minkowski que utilizamos en el cap´ıtulo 5 de la relatividad especial. Pasamos ahora a calcular el tensor m´etrico en µν coordenadas esf´ericas, por medio de la f´ormula (9.35), que es gEsf´ ericas = αβ Λ gCartesianas ΛT . Usamos entonces (9.41) y (9.43) para ejecutar el producto de las tres matrices, y obtenemos: µν −2 −2 gEsf´ ericas = diag (1, −1, −r , −(r sen θ) )

215

(9.44)

La matriz inversa de (9.44) es: Esf´ ericas gµν = diag (1, −1, −r2 , −r2 sen2 θ)

(9.45)

Esta f´ormula dice que ds2 = dt2 − dr2 − r2 dθ2 − r2 sen2 θ dϕ2 ,

(9.46)

que es el mismo intervalo (9.42), escrito ahora en coordenadas esf´ericas. Calculemos ahora las componentes de un vector cualquiera en coordenadas esf´ericas. Tomaremos como ejemplo el vector densidad de la f´ormula (6.18), µ que es JCartesianas = (ρc, Jx , Jy , Jz ). Utilizando estas componentes y la matriz Λ en la ecuaci´on (9.34) se obtienen las componentes contravariantes en coordenadas esf´ericas: 

µ JEsf´ ericas

1

0

   0 sen θ cos ϕ    =  0 cos θ cos ϕ  r    sen ϕ 0 − r sen θ 

0

0



ρc



      sen θ sen ϕ cos θ   J    x      cos θ sen ϕ sen θ     −   r r   Jy        cos ϕ 0 Jz r sen θ ρc

  J sen θ cos ϕ + J sen θ sen ϕ + J cos θ y z  x   =  Jx cos θ cos ϕ Jy cos θ sen ϕ Jz sen θ  + −  r r r   Jx sen ϕ Jy cos ϕ − + r sen θ r sen θ

          

(9.47)

Comparando las tres u ´ltimas filas de (9.47) con las formas generales (9.39), reconocemos las componentes Jr , Jθ y Jϕ , o sea que 216



µ JEsf´ ericas

    =    

ρc Jr Jθ r Jϕ r sen θ

         

(9.48)

Calculemos finalmente el tensor electromagn´etico en coordenadas esf´ericas, αβ µν T por medio de la f´ormula (9.35), que es FEsf´ ericas = Λ FCartesianas Λ . Usamos entonces (9.41) y (6.30) para ejecutar el producto de las tres matrices. El resultado es una matriz complicada que contiene las seis componentes cartesianas (Ex , Ey , Ez , Bx , By , Bz ). Tal matriz se simplifica considerablemente al expresar esas seis componentes cartesianas en t´erminos de las componentes esf´ericas, para lo cual utilizamos f´ormulas del tipo (9.38). Se llega a: 

µν FEsf´ ericas

9.8

       =      

0

−Er

Er

0

Eθ r

Bϕ r

Eϕ r sen θ



Eθ − r −

Bϕ r 0

Bθ r sen θ

Br r2 sen θ

 Eϕ − r sen θ     Bθ  r sen θ     Br  − 2 r sen θ     0

(9.49)

La relatividad especial

Este es un momento oportuno para presentar un ejemplo con transformaciones tetradimensionales. Una de las m´as sencillas de todas, y no por eso trivial, es la transformaci´on de Lorentz (ct, x, y, z) → (ct0 , x0 , y 0 , z 0 ) que escribimos en las ecuaciones (5.13). La matriz Λ ya fue calculada en (5.47). El tensor m´etrico en las coordenadas no primadas η µν est´a dado por la ecuaci´on (9.43). La f´ormula (9.35) dice que η 0 µν = Λη αβ ΛT . Ejecutamos el producto de las tres matrices para llegar a 217



η 0 µν

1

  0  =   0  0

0

0

−1

0

0

−1

0

0

0



 0     0   −1

En palabras: la m´etrica de Minkowski es invariante bajo transformaciones de Lorentz. Esto ya lo hab´ıamos elaborado anteriormente, en particular en los comentarios que siguen a la ecuaci´on (5.21). Por lo general, las componentes de los tensores sufren grandes modificaciones cuando se hace un cambio de unas coordenadas a otro, como puede verse comparando (6.30) con (9.49), o comparando (9.43) con (9.44). Esta regla tiene dos excepciones notables: 1) los escalares, por definici´on, no cambian bajo ninguna transformaci´on de coordenadas, y 2) la m´etrica de Minkowski η es invariante bajo las transformaciones de Lorentz.

9.9

Ecuaciones tensoriales

En esta secci´on veremos algunas propiedades importantes de las ecuaciones entre tensores. a) La m´as importante es que las ecuaciones tensoriales son autom´aticamente covariantes, es decir, tienen la misma forma en todos los sistemas coordenados. Para ver esto consideremos por ejemplo la ecuaci´on Aµ ν = B µ Cν

(9.50)

Si A, B y C son tensores, podemos reemplazar Aµ ν = Bµ =

∂xµ ∂x0β 0α A β , ∂x0α ∂xν

∂x0β 0 ∂xµ 0α B y C = C en la ecuaci´on (9.50) para escribir ν ∂x0α ∂xν β ∂xµ ∂x0β 0α 0 ∂xµ ∂x0β 0α A = B Cβ β ∂x0α ∂xν ∂x0α ∂xν

Multiplicar ambos lados de esta ecuaci´on por 218

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν

∂x0σ ∂xµ ∂xν ∂x0β 0α 0 B Cβ ∂xµ ∂x0α ∂x0ρ ∂xν

g σ α g β ρ A0α β = g σ α g β ρ B 0α Cβ0 A0σ ρ = B 0σ Cρ0

(9.51)

Comparando (9.51) con (9.50) nos damos cuenta de que tienen la misma forma: (9.50) es una ecuaci´on covariante porque es la igualdad de dos tensores. Las ecuaciones tensoriales son autom´aticamente covariantes. b) Supongamos que una ecuaci´on es v´alida en todos los sistemas coordenados. Pensemos que esta ecuaci´on tiene k elementos (factores o sumandos) y supongamos que k − 1 de ellos son tensores; entonces el otro elemento tambi´en tiene que ser tensor. Para mostrar que esto es cierto supongamos que la ecuaciones (9.50) y (9.51) son verdaderas y que A y C son tensores; probaremos que B tambi´en es tensor. ∂xµ ∂x0β 0α ∂x0β 0 Reemplazando Aµ ν = A , y C = C en (9.50) escribiν β ∂x0α ∂xν ∂xν β mos: ∂xµ ∂x0β 0α ∂x0β µ 0 A = B Cβ β ∂x0α ∂xν ∂xν Multiplicar ambos lados de esta ecuaci´on por ∂x0σ ∂xµ ∂xν ∂x0β 0α A β = ∂xµ ∂x0α ∂x0ρ ∂xν g σ α g β ρ A0α β = A0σ ρ =

∂x0σ ∂xν : ∂xµ ∂x0ρ

∂x0σ ∂xν ∂x0β µ 0 B Cβ ∂xµ ∂x0ρ ∂xν ∂x0σ β g ρ B µ Cβ0 ∂xµ ∂x0σ µ 0 B Cρ ∂xµ

Comparando la u ´ltima ecuaci´on con (9.51) vemos que B 0σ =

∂x0σ µ B , ∂xµ 219

que es la forma como transforman los vectores: B es un vector, que es lo que nos propusimos demostrar. c) Hay dos maneras de establecer si un conjunto de n cantidades A0 , A1 , A2 , · · · es un vector. La primera es invocando una ecuaci´on en la que aparezcan esas cantidades, como en la nota b) hace un par de p´arrafos. La segunda es emp´ıricamente: en las coordenadas xµ se miden las cantidades A0 , A1 , A2 , · · · y en las coordenadas x0µ se miden las cantidades A00 , A01 , A02 , · · ·. Si las cantidades f´ısicamente medidas Aµ y A0µ satisfacen la ecuaci´on (9.34), entonces Aµ es un vector. El mismo pensamiento se aplica para establecer si un conjunto de n2 cantidades es un tensor de rango 2: bien sea invocando una ecuaci´on en la que aparezca el conjunto en cuesti´on, o de manera emp´ırica usando la condici´on (9.35). d) Mencion´abamos en la p´agina 213 la necesidad de utilizar otras versiones de ∂µ y d que sean covariantes.

9.10

Covariancia general

Podemos pensar que las leyes de la f´ısica se ubican por encima de los sistemas coordenados. Por supuesto que para utilizar num´ericamente una ley es necesario erigir antes un sistema coordenado particular, pero podemos pensar que las leyes son, de alguna manera, independientes de los sistemas coordenados. M´as concretamente, las leyes deben expresarse por medio de enunciados que sean invariantes bajo el grupo de las transformaciones generalizadas de coordenadas. Este es el Principio de la Covariancia General. Acabamos de ver que las ecuaciones tensoriales son autom´aticamente covariantes bajo el grupo de las transformaciones generalizadas de coordenadas, lo que nos lleva a concluir que el Principio se satisface si las leyes de la f´ısica se expresan mediante ecuaciones tensoriales. El Principio indica un m´etodo y una gu´ıa: al formular una teor´ıa f´ısica se deben buscar ecuaciones tensoriales. Las cantidades f´ısicas deben ser componentes de tensores. Por ejemplo el campo el´ectrico hace parte del tensor electromagn´etico Fµν y la energ´ıa de una part´ıcula hace parte del cuadrivector momentum pµ . Ahora, hemos visto que los tensores de rango j tienen 4j componentes, lo que quiere decir que los tensores tienen 1, 4, 16, 64 ··· componentes. Vemos as´ı que toda cantidad 220

f´ısica debe ser miembro de alguna familia de 1, 4, 16, 64 · · · elementos. Los n´ umeros 1, 4, 16, 64 · · · son muy importantes para la f´ısica, porque indican los u ´nicos tama˜ nos que las familias pueden tener: no hay familias de 10, 15, 63 miembros. Supongamos que queremos saber si determinada ecuaci´on tensorial es v´alida: si la ecuaci´on se cumple en un sistema coordenado, entonces tiene que cumplirse en todos los sistemas de coordenadas. O sea que que para demostrar la validez de una ecuaci´on covariante basta probar que la ecuaci´on

(9.52)

se cumple en un sistema coordenado. Si una ecuaci´on tiene forma covariante y es v´alida en un sistema coordenado, entonces es v´alida en

(9.53)

todos los sistemas coordenados.

9.11

El elemento invariante de volumen

La f´ormula (9.35) dice que g 0 µν = Λg αβ ΛT . Tomemos determinante en ambos lados de esta ecuaci´on: det g 0 µν = det Λ det g αβ det ΛT = (det Λ)2 det g αβ , es decir:

p | det g 0 µν | | det Λ| = p | det g αβ |

De otro lado, tomando determinante en ambos lados de la ecuaci´on (9.2) 1 vemos que det g αβ = , de donde: det gαβ p | det gαβ | | det Λ| = q 0 | | det gµν 0 . Entonces: Llamar g ≡ det gαβ y g 0 ≡ det gµν

221

p |g| | det Λ| = p |g 0 |

(9.54)

| det Λ| se llama el Jacobiano de la transformaci´on. El Teorema Principal del C´alculo Integral dice que los vol´ umenes n-dimensionales dn x0 y dn x cumplen la condici´on dn x0 = | det Λ| dn x ; = p

|g 0 | dn x0 =

p |g| n p d x, |g 0 |

usar (9.54): o sea que:

p |g| dn x

(9.55)

p Esto es importante: |g| d4 x es un escalar, y se puede tomar como el elemento diferencial de volumen. Es claro entonces que: Z ·

9.12

¸ · ¸ Alg´ un tensor p Otro tensor |g| d4 x = de rango j de rango j

(9.56)

El s´ımbolo de Christoffel

El s´ımbolo de Christoffel Γµ αβ se define de la manera siguiente: 1 Γµ αβ = g µν (gνα,β + gβν,α − gαβ,ν ) 2

(9.57)

Lo primero que debemos notar es que el s´ımbolo de Christoffel es sim´etrico bajo el intercambio de los dos sub´ındices: Γµ αβ = Γµ βα . Contemos cu´antas componentes independientes tiene Γµ αβ utilizando un argumento similar al que empleamos en la secci´on 7.5 cuando quer´ıamos calcular el n´ umero de componentes del tensor M αβδ . Para tal efecto comparemos la estructura de Γµ αβ con la estructura de Aµ Bαβ , suponiendo que Bαβ = Bβα . La cantidad Bαβ , como es de dos ´ındices, tiene n2 componentes, pero adem´as es sim´etrica, entonces s´olo tiene n(n + 1)/2 componentes independientes; entonces Aµ Bαβ tiene n2 (n + 1)/2 componentes independientes. As´ı mismo, el s´ımbolo de Christoffel tiene n2 (n + 1)/2 componentes independientes. De otro 222

lado el tensor m´etrico gµν , por ser sim´etrico, tiene n(n + 1)/2 componentes independientes, o sea que hay n2 (n + 1)/2 derivadas gµν ,α independientes. Vemos pues que n2 (n+1)/2 es el n´ umero de s´ımbolos Γµ αβ independientes y 2 n (n+1)/2 es el n´ umero de derivadas gαβ,ν independientes. En el fondo estos dos conjuntos son equivalentes: de un lado, (9.57) determina totalmente las derivadas gµν ,α en t´erminos de los s´ımbolos Γ, y de otro lado las ecuaciones (9.65) determinan totalmente los s´ımbolos Γ en t´erminos de las derivadas gµν ,α : los s´ımbolos Γ son como las primeras derivadas del tensor m´etrico. Si todos los s´ımbolos de Christoffel son cero, entonces todas las primeras derivadas gµν ,α

(9.58)

son cero; y viceversa. El conjunto de los s´ımbolos Γ es como

(9.59)

el conjunto de las primeras derivadas de gµν . Γµ αβ no es un tensor. En notaci´on obvia:

Γµ αβ =

Γ0µ αβ =

=

=

     ν→β ν→α 1 µν  ∂gνα  g + α → ν  −  α → β  , 2 ∂xβ β→α β→ν      ν→β ν→α 0 1 0µν  ∂gνα  g + α → ν  −  α → β  . 2 ∂x0β β→α β→ν µ ¶ ∂ ∂xσ ∂xρ 1 0µν g gσρ + [ ] − [ ] 2 ∂x0β ∂x0ν ∂x0α 1 0µν g 2

µ

∂xσ ∂xρ ∂ gσρ + [ ] − [ ] ∂x0ν ∂x0α ∂x0β

1 + g 0µν gσρ 2

µ

y con primas:

Usar (9.21):



∂ h ∂xσ ∂xρ i +[ ]−[ ] ∂x0β ∂x0ν ∂x0α



Para facilitar los c´alculos escribamos este u ´ltimo resultado as´ı: Γ0µ αβ = M + N

(9.60) 223

M

=

N

=

¶ ∂xσ ∂xρ ∂ g + [ ] − [ ] σρ ∂x0ν ∂x0α ∂x0β µ ¶ ∂ h ∂xσ ∂xρ i 1 0µν g gσρ + [ ] − [ ] 2 ∂x0β ∂x0ν ∂x0α

1 0µν g 2

µ

Desarrollemos por separado cada uno de los t´erminos M y N . El t´ermino M es 1 M = g 0µν 2

µ

¶ ∂xσ ∂xρ ∂xω gσρ,ω + [ ] − [ ] ∂x0ν ∂x0α ∂x0β

1 ∂x0µ ∂x0ν ξη g gσρ,ω = 2 ∂xξ ∂xη =

µ

∂xσ ∂xρ ∂xω +[ ]−[ ] ∂x0ν ∂x0α ∂x0β



1 ∂x0µ ξη ∂x0ν h ∂xσ ∂xρ ∂xω ∂xσ ∂xρ ∂xω g g + 0β σρ,ω ξ η 0ν 0α 0β 2 ∂x ∂x ∂x ∂x ∂x ∂x ∂x0ν ∂x0α −

∂xσ ∂xρ ∂xω i ∂x0α ∂x0β ∂x0ν

=

h ρ ω σ ∂xω σ ∂xρ i 1 ∂x0µ ξη σ ∂x ∂x ρ ∂x ω ∂x g g g + g − g σρ,ω η η η 2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

=

1 ∂x0µ ξη h ∂xρ ∂xω ∂xσ ∂xω ∂xσ ∂xρ i g g + g − g ηρ,ω ση,ω σρ,η 2 ∂xξ ∂x0α ∂x0β ∂x0β ∂x0α ∂x0α ∂x0β

=

∂x0µ ∂xρ ∂xω 1 ξη g (gηρ,ω + gωη,ρ − gρω,η ) ∂xξ ∂x0α ∂x0β 2

Con (9.57) reconocemos Γξ ρω :

M=

∂x0µ ∂xρ ∂xω ξ Γ ρω ∂xξ ∂x0α ∂x0β

Ahora ataquemos el t´ermino N , que es: 224

(9.61)

µh σ ¶ 1 0µν ∂x ∂ 2 xρ ∂xρ ∂ 2 xσ i N = g gσρ + 0α +[ ]−[ ] 2 ∂x0ν ∂x0α ∂x0β ∂x ∂x0β ∂x0ν La operaci´on [ ] − [ ] es un poco tediosa, pero no tiene ninguna dificultad especial. Cuatro t´erminos se cancelan mutuamente y al final se obtiene: N

=

1 0µν ∂xσ ∂ 2 xρ g gσρ 2 2 ∂x0ν ∂x0α ∂x0β

= gσρ g ξη = gσρ g ξη = gσρ g ξη =

∂x0µ ∂x0ν ∂xσ ∂ 2 xρ ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β µ ¶ ∂x0µ ∂x0ν ∂xσ ∂ 2 xρ ∂xξ ∂xη ∂x0ν ∂x0α ∂x0β ∂x0µ ∂ 2 xρ σ (g ) η ∂xξ ∂x0α ∂x0β

∂x0µ ∂ 2 xρ ∂xρ ∂x0α ∂x0β

(9.62)

Al colocar (9.61) y (9.62) en (9.60) llegamos finalmente a: Γ0µ αβ =

∂x0µ ∂xρ ∂xω ξ ∂x0µ ∂ 2 xρ Γ + ρω ∂xξ ∂x0α ∂x0β ∂xρ ∂x0α ∂x0β

(9.63)

Nos ser´a u ´til una versi´on de Γ0µ αβ ligeramente diferente de (9.63), que se obtiene muy f´acilmente. Es claro que ∂x0µ /∂x0 α = gα µ = δα µ ; como esto es una constante, sus derivadas son cero: 0=

∂ ∂x0µ ∂ ∂x0µ ∂xρ ∂x0µ ∂ 2 xρ ∂xρ ∂ ∂x0µ = = + ∂x0β ∂x0α ∂x0β ∂xρ ∂x0α ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xρ

Aislar el primer t´ermino del lado derecho: ∂xν ∂ ∂x0µ ∂xν ∂xσ ∂ 2 x0µ ∂x0µ ∂ 2 xρ = − = − ∂xρ ∂x0α ∂x0β ∂x0α ∂x0β ∂xν ∂x0α ∂x0β ∂xν ∂xσ Entonces (9.63) se convierte en 225

Γ0µ αβ =

∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ Γ − στ ∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν

(9.64)

Si el segundo t´ermino del lado derecho fuera cero, tendr´ıamos la ley de transformaci´on de un tensor de rango tres con un ´ındice contravariante y dos covariantes. Pero, en general, el segundo t´ermino del lado derecho de (9.64) no es cero: El s´ımbolo de Christoffel Γµ αβ no es un tensor1 . Es oportuno hacer un comentario acerca de la notaci´on. Al escribir las componentes de los tensores hemos sido muy cuidadosos de no poner un super´ındice encima de un sub´ındice; por ejemplo, nunca hemos escrito Tαµ . Siguiendo esta costumbre, hemos escrito Γµ αβ aunque Γ no es un tensor. Debemos aclarar, sin embargo, que en la mayor´ıa de los libros aparece Γµαβ . Esta escritura Γµαβ no debe causar confusi´on. De otro lado, en algunas escasas ocasiones es preciso usar las cantidades Γµαβ , las cuales se deben entender como el resultado de multiplicar a gµξ por Γξ αβ . Se define entonces Γµαβ ≡ gµξ Γξ αβ . Hay dos identidades u ´tiles que se prueban con facilidad a partir de la definici´on (9.57):

9.13

gαβ , γ

= Γαβγ + Γβαγ

(9.65)

g αβ

= −g µβ Γα µγ − g µα Γβ µγ

(9.66)



La derivada covariante

Dec´ıamos en la p´agina 213 que necesitamos una operaci´on derivada que tenga car´acter tensorial, es decir, que al actuar sobre un tensor produzca un tensor. El prop´osito de esta secci´on es construir esta derivada tensorial. Aunque Γµ αβ no es un tensor, s´ı sirve para construir la derivada covariante que necesitamos. Comencemos escribiendo: ∂A0µ + Γ0µ αβ A0α = V + W , ∂x0β donde V =

(9.67)

∂A0µ y W = Γ0µ αβ A0α . Desarrollemos el t´ermino V utilizando ∂x0β

1

Sin embargo Γµ αβ s´ı es un tensor bajo el subgrupo de las transformaciones lineales, ∂ 2 x0µ son cero y entonces tambi´en es cero el u ´ltimo pues en ´estas las segundas derivadas ∂xσ ∂xν t´ermino del lado derecho de (9.64).

226

la regla de la derivaci´on en cadena: V

=

∂xρ ∂ A0µ ; ∂x0β ∂xρ

=

∂xρ ∂x0µ ∂Aσ ∂xρ ∂ 2 x0µ σ ∂xρ ∂ ∂x0µ σ A = + A (9.68) ∂x0β ∂xρ ∂xσ ∂x0β ∂xσ ∂xρ ∂x0β ∂xρ ∂xσ

utilizar (9.10):

Pasemos a desarrollar el t´ermino W usando la ecuaci´on (9.10): W = Γ0µ αβ A0α = Γ0µ αβ

∂x0α ξ A ∂xξ

Ahora utilizar la ecuaci´on (9.64): µ W

= µ =

=

∂x0µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x0µ Γ − στ ∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν σ ∂ 2 x0µ ∂x0µ σ ∂xτ ν ν ∂x g Γ − g στ ξ ξ ∂xν ∂x0β ∂x0β ∂xσ ∂xν



∂x0α ξ A ∂xξ

¶ Aξ

∂x0µ ∂xτ ν ∂xσ ∂ 2 x0µ ν σ Γ A − A στ ∂xν ∂x0β ∂x0β ∂xσ ∂xν

(9.69)

Ya estamos en condici´on de poner (9.68) y (9.69) en (9.67) para obtener finalmente: · ¸ ∂A0µ ∂x0µ ∂xρ ∂Aν 0µ 0α ν σ + Γ αβ A = + Γ σρ A ∂x0β ∂xν ∂x0β ∂xρ Pero este es, seg´ un la regla (9.22), el modo como transforman los tensores de rango 2. En conclusi´on, ∂Aν + Γν ρσ Aσ ∂xρ

(9.70)

es un tensor de rango 2. Es muy importante, y se llama Derivada Covariante. ∂Aν Aunque y Γν ρσ Aσ no son tensores, la derivada covariante s´ı lo es. ∂xσ 227

Aµ ; β = Aµ , β + Γµ βα Aα

(9.71)

Aqu´ı estamos usando una notaci´on muy c´omoda: la coma quiere decir derivada corriente y el punto y coma quiere decir derivada covariante. La expresi´on (9.71) es la derivada covariante de un vector contravariante. Para las componentes covariantes se escoge: Aµ ; β = Aµ ,β − Γα µβ Aα

(9.72)

Hemos probado que las componentes Aµ ; β transforman como un tensor de segundo rango. De manera independiente se puede probar que las Aµ ; β tambi´en transforman como un tensor de rango 2. Acabamos de ver que la derivada covariante de un vector es un tensor de rango 2. En general, la derivada covariante de un tensor de rango j es un tensor de rango j + 1 . La derivada covariante de tensores de rango mayor que 0 introduce un s´ımbolo de Christoffel por cada ´ındice: F µν ; β = F µν , β + Γµ βα F αν + Γν βα F µα

(9.73)

Fµν ; β = Fµν , β − Γα µβ Fαν − Γα νβ Fµα

(9.74)

F µν σ ; β = F µν σ , β + Γµ βτ F τ ν σ + Γν βτ F µτ σ − Γτ σβ F µν τ Esta es la regla para tomar la derivada covariante de tensores de rango mayor que 0, pero ¿qu´e hacer para tomar la derivada covariante de un escalar? Para resolver esta dificultad recordemos el enunciado (9.32), seg´ un el cual la derivada corriente de un escalar es una operaci´on covariante; no hay motivo de preocupaci´on, y podemos definir la derivada covariante de un escalar como su derivada corriente: φ; α = φ, α En conclusi´on, la derivada covariante convierte tensores en tensores, y por eso es buena para las ecuaciones tensoriales, de acuerdo con la necesidad que mencion´abamos en la p´agina 213 de utilizar operaciones covariantes. La ecuaci´on (9.73) dice que 228

(C µ Dν ) ; β = C µ ; β Dν + C µ Dν ; β

(9.75)

o sea que la derivada covariante cumple la regla usual de la derivada del producto de dos factores. En general la derivada covariante se maneja con tranquilidad, con soltura, debido a la propiedad (9.75). La u ´nica advertencia, muy importante, es que, a diferencia de las derivadas simples, las derivadas covariantes no conmutan: Aα ; ν ; µ = (Aα ; ν ) ; µ = (Aα ; ν ) , µ + Γα τ µ Aτ ; ν − Γτ νµ Aα ; τ = (Aα , ν + Γα τ ν Aτ ), µ + Γα τ µ (Aτ , ν + Γτ βν Aβ ) − Γτ νµ Aα ; τ Para Aα ; µ ; ν basta intercambiar los ´ındices ν y µ. El conmutador es: Aα ; µ ; ν − Aα ; ν ; µ = Rα βµν Aβ ,

(9.76)

donde Rα βµν = Γα βµ , ν − Γα βν , µ − Γσ βν Γα σµ + Γσ βµ Γα σν

(9.77)

As´ı mismo: Aα ; µ ; ν − Aα ; ν ; µ = −Rβ αµν Aβ

(9.78)

Antes de concluir esta secci´on presentamos una identidad importante: gµν ; α = 0,

g µν



= 0

(9.79)

En palabras, la derivada covariante del tensor m´etrico es cero. Esta identidad se prueba f´acilmente a partir de las ecuaciones (9.73) y (9.74). 229

9.14

El tensor de Riemann

Deteng´amonos un momento en la ecuaci´on (9.78): Debido a que las cantidades Aµ ; α ; β , Aµ ; β ; α y Aν son tensores, podemos afirmar que Rν µαβ tambi´en es un tensor: se llama tensor de Riemann. Que ´este sea un tensor significa que bajo una transformaci´on general de coordenadas xµ → x0µ ocurre lo siguiente: R0 αβµν =

∂x0α ∂x0β ∂x0µ ∂x0ν ρσπδ R ∂xρ ∂xσ ∂xπ ∂xδ

(9.80)

El tensor de Riemann, por su origen en las ecuaciones (9.76) y (9.78), expresa la no conmutatividad de las derivadas covariantes. Una contracci´ on de ´ındices produce el tensor de Ricci Rβµ , y con otra contracci´ on se obtiene el escalar de curvatura R: Rβµ ≡ Rα βµα = Rµβ R ≡ Rµ µ

(9.81) (9.82)

Los tensores (9.77),(9.81) y (9.82) satisfacen cinco ecuaciones: tres algebraicas y dos diferenciales: Rλµνκ = Rνκλµ

(9.83)

Rλµνκ = −Rµλνκ = −Rλµκν = Rµλκν

(9.84)

Rλµνκ + Rλκµν + Rλνκµ = 0

(9.85)

Rα βµν ; σ + Rα βσµ ;ν + Rα βνσ ; µ = 0

(9.86)

1 (Rµ ν − g µ ν R); µ = 0 2

(9.87)

Nos disponemos a probar la validez de las identidades algebraicas (9.83), (9.84) y (9.85). Para tal efecto debemos bajar el ´ındice contravariante de Rα βµν , lo que se logra multiplicando ambos lados de la ecuaci´on (9.77) por gλα : Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − gλσ Γσ µκ , ν − gλη Γσ µκ Γη σν 230

(9.88)

En el lado derecho de esta ecuaci´on los dos u ´ltimos t´erminos se obtienen intercambiando los ´ındices κ y ν en los dos primeros t´erminos: Rλµνκ = gλσ Γσ µν , κ + gλη Γσ µν Γη κσ − (ν ­ κ)

(9.89)

Desarrollemos el primer t´ermino del lado derecho de esta ecuaci´on: £ ¡ ¢¤ 1 gλσ Γσ µν , κ = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ 2 ¡ ¢ 1 = gλσ g ση gηµ , ν + gνη , µ − gµν , η , κ 2 ¢ 1¡ gηµ , ν + gνη , µ − gµν , η gλσ g ση , κ + 2 Ahora, con (9.66) se prueba f´acilmente que gλσ g ση , κ = −g ση (gλξ Γξ σκ + gσξ Γξ λκ ). Entonces: ¢ ¡ 1 gλσ Γσ µν , κ = gλ η gηµ , ν + gνη , µ − gµν , η , κ 2 ¢ ¡ 1 − g ση gηµ , ν + gνη , µ − gµν , η (gλξ Γξ σκ + gσξ Γξ λκ ) 2 ¢ 1 η¡ = gλ gηµ , ν + gνη , µ − gµν , η , κ − Γσ µν (gλξ Γξ σκ + gσξ Γξ λκ ) 2 ¢ 1 η¡ = gλ gηµ , ν + gνη , µ − gµν , η , κ − gσξ Γξ λκ Γσ µν − gλξ Γσ µν Γξ σκ 2 N´otese que el u ´ltimo t´ermino del lado derecho cancela exactamente al segundo t´ermino de la ecuaci´on (9.89). Entonces (9.89) queda finalmente as´ı: Rλµνκ =

1 (gνλ , µ , κ − gκλ , µ , ν − gµν , λ , κ + gµκ , λ , ν ) 2 σ

+ gσξ (Γ

ξ

µκ Γ λν

−Γ

σ

(9.90)

ξ

µν Γ λκ )

Por inspecci´on, es clara la validez de las ecuaciones (9.83) y (9.84). Tambi´en es clara la validez de la ecuaci´on (9.85). Vemos as´ı que las ecuaciones (9.83), (9.84) y (9.85) son correctas. (9.83) y (9.84). Luego, en la secci´on 9.17, tendremos ocasi´on de probar la validez de las otras dos identidades (9.86) y (9.87). 231

La ecuaci´ on (9.85): En la ecuaci´on (9.85) vamos a hacer ν = µ (no sumar ´ındices repetidos): Rλµµκ + Rλκµµ + Rλµκµ = 0

(9.91)

El segundo t´ermino de esta ecuaci´on es cero (debido a (9.84)) y la suma del primero y el tercero da cero (debido a (9.84)). Vemos as´ı que (9.91) no aporta nada nuevo. Se puede verificar, en general, que cuando en (9.85) hay dos ´ındices repetidos se obtiene una ecuaci´on que redunda con (9.83) y (9.84). En conclusi´on, la ecuaci´on (9.85) suministra informaci´on nueva cuando los cuatro ´ındices toman valores diferentes. Por ejemplo, para un espacio de dimensi´on 4 la u ´nica informaci´on novedosa contenida en (9.85) es: R0123 + R0312 + R0231 = 0

(9.92)

Rαβµν tiene n2 (n2 −1)/12 componentes independientes. En un espacio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes independientes. No probaremos esto en general, pero s´ı lo verificaremos en el caso particular n = 4. En seguida vamos a comprobar que en una geometr´ıa de dimensi´on 4 el tensor de Riemann tiene 20 componentes independientes. Como Rαβµν tiene cuatro ´ındices, y cada ´ındice adopta cuatro valores, Rαβµν tiene 44 = 256 componentes. Demostremos que las f´ormulas (9.84) reducen a 36 el n´ umero de componentes independientes. En Rαβµν la pareja αβ es antisim´etrica, o sea que hay s´olo 6 parejas αβ independientes; escogemos estas seis: αβ : 010203121323 As´ı mismo hay s´olo seis parejas µν independientes. Escogemos: µν : 010203121323

Escribamos estas 36 componentes de Rαβµν que son, hasta el momento, independientes: 232

R0101 R0201 R0301 R1201 R1301 R2301

R0102 R0202 R0302 R1202 R1302 R2302

R0103 R0203 R0303 R1203 R1303 R2303

R0112 R0212 R0312 R1212 R1312 R2312

R0113 R0213 R0313 R1213 R1313 R2313

R0123 R0223 R0323 R1223 R1323 R2323

Ahora, la ecuaci´on (9.84) dice que este arreglo cuadrado, o matriz, es sim´etrico. Una matriz 6 × 6 sim´etrica s´olo tiene 21 entradas independientes (por ejemplo, las de la diagonal y las que se encuentran por encima de ´esta). Finalmente, la ecuaci´on (9.92) reduce a 20 el n´ umero de componentes independientes. Hemos verificado, en el caso particular n=4, que en un espacio de n dimensiones el tensor de Riemann tiene n2 (n2 − 1)/12 componentes independientes.

9.15

Plano y curvo

Decimos que un espacio es plano en un punto dado, si en ese punto el tensor de Riemann vale cero; es decir, si todas las componentes del tensor de Riemann son cero. Decimos que un espacio es curvo si no es plano: un espacio es curvo en un punto dado, si en ese punto el tensor de Riemann no es cero; es decir, si al menos una de las componentes del tensor de Riemann difiere de cero. Ejemplo. Consideremos una geometr´ıa en tres dimensiones, con un intervalo ds2 = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 . El tensor m´etrico es 

1

0

0



  2  0 g [3] µν =   0 r  2 2 0 0 r sen θ Para esta geometr´ıa todas las componentes del tensor de Riemann son cero, o sea que el espacio es plano. El diferencial de longitud es la ra´ız cuadrada del intervalo: p ds = dr2 + r2 dθ2 + r2 sen2 θ dϕ2 Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta 233

circunferencia tienen θ = π/2, dθ = 0, r = a, dr = 0. A lo largo de la circunferencia el elemento R Rde longitud es ds = adϕ, y la longitud total de la circunferencia es ds = a dϕ = 2πa. Ahora calculemos el radio. La l´ınea radial pasa por el centro y tiene θ = π/2, dθ = dϕ = 0, y la R de coordenadas R longitud del radio es ds = dr = a. Al dividir circunferencia sobre radio se obtiene 2πa/a = 2π, que es el mismo resultado de la geometr´ıa euclidiana. Inmersos en este espacio tridimensional plano puede haber subespacios bidimensionales curvos, como el que estudiaremos enseguida. Consideremos un espacio bidimensional con intervalo ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . Para esta geometr´ıa el tensor m´etrico es " g

[2]

µν

=

a2

0

0

a2 sen2 θ

# (9.93)

El tensor de Riemann tiene una componente que difiere de cero: R[2] 1212 = a2 sen2 θ; por esta raz´on podemos afirmar que el espacio bidimensional es curvo. El diferencial de longitud es la ra´ız cuadrada del intervalo: ds =

p a2 dθ2 + a2 sen2 θ dϕ2

Pensemos en una circunferencia ecuatorial de radio a. Los puntos de esta circunferencia tienen θ = π/2, dθ = 0. A lo largo de la circunferencia el elemento deR longitud es ds = adϕ, y la longitud total de la circunferencia R es ds = a dϕ = 2πa. Ahora calculemos el radio. La l´ınea radial pasa por el polo norte o por el polo sur, o sea que la longitud del radio es la cuarta parte de la longitud de la circunferencia, es decir πa/2. Al dividir circunferencia sobre radio se obtiene 2πa/(πa/2) = 4, que es diferente al resultado de la geometr´ıa euclidiana. Cuando, al estudiar un espacio, descubrimos que se puede trazar un c´ırculo tal que el cociente de circunferencia sobre radio no es 2π, podemos asegurar que el espacio no es euclidiano y que es curvo. Terminado este ejemplo, regresemos a las consideraciones generales sobre curvatura en un espacio de Riemann. Rαβ y R no son indicadores de curvatura; el u ´nico indicador de curvatura es Rα βµν . Pensemos en un espacio curvo; aunque algunas componentes Rα βµν sean diferentes de cero, puede ocurrir que todas las Rαβ sean cero y, en consecuencia, R tambi´en sea cero: en este caso, aunque el tensor de Ricci y el escalar de curvatura sean cero, es espacio es curvo: 234

R = 0 ; espacio plano Todas las Rαβ = 0 ; espacio plano

(9.94)

Todas las Rα βµν = 0 ⇒ espacio plano R 6= 0 ⇒ espacio curvo Alguna Rαβ 6= 0 ⇒ espacio curvo Alguna R

α

βµν

(9.95)

6= 0 ⇒ espacio curvo

La curvatura es una propiedad intr´ınseca de un espacio. Con la palabra intr´ınseca queremos decir que la curvatura no depende de cu´al es el sistema de coordenadas usado. Si el tensor de Riemann es cero en unas coordenadas, ser´a cero en todos los sistemas coordenados; es decir, si un espacio aparece plano en unas coordenadas, aparecer´a plano en todos los sistemas coordenados: un espacio plano no se puede curvar con ning´ un cambio de coordenadas. Un espacio curvo no se puede aplanar con ning´ un cambio de coordenadas. La curvatura es una propiedad local. El tensor de Riemann es un campo, es decir, una cantidad que cambia de punto a punto del espacio. As´ı mismo, la curvatura es una propiedad local. Un espacio puede ser curvo en unos puntos y plano en otros. En varias secciones de este libro nos dedicaremos a estudiar una propiedad importante que tienen los espacios de Riemann, curvos o planos. Se escoge un punto cualquiera E. Se puede adaptar un sistema de coordenadas de manera que el tensor m´etrico, al evaluarse en E, sea diag(±1, ±1, ±1, · · ·). M´as aun, podremos escoger estas coordenadas de modo que todas las primeras derivadas del tensor m´etrico, al evaluarse en E, den cero: gµν (E) = diag(±1, ±1, ±1, · · ·), gµν ,α (E) = 0. En vista del enunciado (9.59), podemos decir que gµν (E) = diag(±1, ±1, ±1, · · ·),

Γα µν (E) = 0

(9.96)

Al escribir (E) estamos enfatizando que las condiciones (9.96) se cumplen u ´nicamente en el punto E escogido. En general, en otros puntos del espacio, el tensor m´etrico no ser´a diag(±1, ±1, ±1, · · ·) ni los s´ımbolos de Christoffel ser´an cero. Demostraremos que (9.96) es posible en todos los casos: si en el punto E el espacio es curvo, o si es plano. La demostraci´on no es dif´ıcil, pero s´ı es larga, y nos tomar´a las secciones 9.16, 9.20, 9.21 y 11.3. 235

9.16

Coordenadas adaptadas

Teorema. Es posible [13] erigir un sistema adaptado de coordenadas tal que, en alg´ un punto E del espaciotiempo, todos los s´ımbolos de Christoffel valgan cero. Sea xµ un sistema general, cualquiera, de coordenadas, sin ninguna restricci´on, y sea E un evento cualquiera. Vamos a construir en E un sistema de coordenadas adaptadas, que llamaremos x ˜µ , y que tiene la siguiente peculiaridad: en las coordenadas x ˜µ , todos los s´ımbolos de Christoffel valen cero cuando se eval´ uan en E. Para demostrar el teorema propondremos un cambio de coordenadas xµ → x ˜µ y enseguida demostraremos que en las nuevas ˜ dan cero cuando se les eval´ coordenadas los s´ımbolos Γ ua en E. Empecemos pues proponiendo este cambio de coordenadas: x ˜µ = (xµ − xµE ) +

1 µ Γ αβ (xα − xαE )(xβ − xβE ) 2

(9.97)

Debemos ahora transformar los s´ımbolos de Christoffel a las nuevas coordenadas x ˜µ , para lo cual utilizamos la f´ormula (9.64): ˜µ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x ˜µ ˜ µ αβ = ∂ x Γ Γ − στ ∂xν ∂ x ˜α ∂ x ˜β ∂x ˜α ∂ x ˜β ∂xσ ∂xν

(9.98)

Para desarollar esta f´ormula se toma la derivada en ambos lados de la ecuaci´on (9.97): 1 ∂x ˜µ = gν µ + Γµ αβ , ν (xα − xαE )(xβ − xβE ) + Γµ αβ (xα − xαE )gν β ν ∂x 2 2 µ ∂ x ˜ 1 = Γµ αβ , ν , σ (xα − xαE )(xβ − xβE ) + Γµ αβ , ν (xα − xαE )gσ β σ ν ∂x ∂x 2 + Γµ αν , σ (xα − xαE ) + Γµ αν gσ α Ya que debemos evaluar estas derivadas en E, hacemos xα = xαE : ¯ ∂x ˜µ ¯¯ = gν µ ∂xν ¯E

¯ ∂2x ˜µ ¯¯ = Γµ σν |E ∂xσ ∂xν ¯E 236

(9.99)

¯ ¯ µ ˜ Cuando ponemos estos valores en (9.98) se obtiene Γ αβ ¯ = 0, que es lo E que quer´ıamos demostrar. Veamos c´omo transforman las componentes de los tensores cuando se hace el cambio de coordenadas xµ → x ˜µ . Tomemos un tensor cualquiera (llamarµν lo T , por ejemplo); de acuerdo con la regla general de transformaciones (9.20) podemos escribir ∂x ˜µ ∂ x ˜ν αβ T˜µν = T ∂xα ∂xβ Esta f´ormula dice que en un punto cualquiera, arbitrario, del espacio, T˜µν no es igual a T µν . Pero en el punto E las derivadas son deltas de Kronecker, seg´ un (9.99), y en consecuencia T˜Eµν = g µ α g ν β TEαβ = TEµν . En palabras: en el punto E, las componentes de los tensores en coordenadas xµ son iguales a las componentes en coordenadas x ˜µ . Como casos particulares de este resultado general mencionemos el tensor m´etrico y el tensor de Riemann: µν µν g˜E = gE

˜ αβµν = Rαβµν R E E

(9.100)

Ya que en el punto E y en coordenadas adaptadas x ˜µ los s´ımbolos de Christoffel son cero, la derivada covariante (;) es igual a la derivada corriente (,), lo que representa una simplificaci´on considerable. Esto nos mueve a trazar una estrategia general de simplificaci´on de los procesos matem´aticos. Pensemos por ejemplo que queremos demostrar la validez de una ecuaci´on que tiene una derivada covariante. Si queremos demostrar la ecuaci´on en cualquier sistema coordenado xµ , la derivada covariante nos obliga a calcular los Γµ αβ , y esto es dispendioso. La idea es escoger un punto, llamarlo ¯ Ey µ µ ˜ αβ ¯¯ = 0 erigir un sistema de coordenadas adaptadas x ˜ . Hemos visto que Γ E

y, en consecuencia, la derivada covariante (;) se reduce a la derivada corriente (,), que es m´as f´acil de manejar. Si logramos demostrar la ecuaci´on en coordenadas x ˜µ , la f´ormula (9.52) nos asegura que la prueba ser´a v´alida tambi´en en cualquier otro sistema de coordenadas xµ . En la pr´oxima secci´on usaremos esta estrategia para demostrar la validez de la primera identidad de Bianchi (9.86). Finalmente, en vista de (9.58), el teorema de esta secci´on dice que es posible 237

erigir un sistema adaptado de coordenadas x ˜µ tal que, en alg´ un punto E del ∂ g˜αβ sean cero. espaciotiempo, todas las primeras derivadas g˜αβ , µ = ∂x ˜µ

9.17

Las identidades de Bianchi

Ya estamos en condici´on de demostrar las identidades de Bianchi (9.86) y (9.87). Comenzaremos con la primera, (9.86). Montamos un sistema coordenado x ˜µ adaptado al punto E. En estas nuevas coordenadas el tensor de ˜α ˜α Riemann y el s´ımbolo de Christoffel se escriben con tilde: R βµν y Γ βµ . De acuerdo con la definici´on (9.77) : ˜α ˜α ˜α ˜σ ˜α ˜σ ˜α R βµν = Γ βµ , ν − Γ βν , µ − Γ βν Γ σµ + Γ βµ Γ σν ˜ Evaluar esta ecuaci´on en el evento E, donde los s´ımbolos de Christoffel Γ son cero: ¯ ³ ´¯ ¯ ˜ α ¯¯ = Γ ˜α ˜α R − Γ (9.101) βµν βµ , ν βν , µ ¯ E

Tomar la derivada

∂ : ∂x ˜σ

¯ ¯ ˜α R = βµν , σ ¯ E ¯ ¯ ˜α R = βσµ , ν ¯ E ¯ ¯ ˜α R = βνσ , µ ¯ E

E

³ ´¯ ¯ ˜α ˜α Γ − Γ βµ , ν , σ βν , µ , σ ¯ . E ³ ´¯ ¯ ˜α ˜α Γ βσ , µ , ν − Γ βµ , σ , ν ¯ E ³ ´¯ ¯ α α ˜ ˜ Γ βν , σ , µ − Γ βσ , ν , µ ¯

As´ı tambi´en:

E

Sumar lado a lado estas tres ecuaciones para obtener ³

´¯ ¯ ˜α ˜α ˜α R + R + R βµν , σ βσµ , ν βνσ , µ ¯ = 0 E

Como en estas coordenadas adaptadas las derivadas corriente y covariante coinciden, podemos cambiar los signos (,) por los signos (;): ³

´¯ ¯ ˜α ˜α ˜α R βµν ; σ + R βσµ ; ν + R βνσ ; µ ¯ = 0 E

238

Esta ecuaci´on covariante es v´alida en un sistema de coordenadas x˜µ . La f´ormula (9.53) asegura que tambi´en es v´alida en cualquier otro sistema xµ : ¡ α ¢¯ R βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ ¯E = 0 La escritura enfatiza que la ecuaci´on es v´alida en el punto E. Pero lo que hicimos para E tambi´en se puede hacer para cualquier otro punto, o sea que la ecuaci´on es v´alida en todos los puntos del espacio: Rα βµν ; σ + Rα βσµ ; ν + Rα βνσ ; µ = 0

(9.102)

Hemos probado as´ı la primera identidad de Bianchi (9.86). Demostremos ahora la segunda. En (9.102) hacer µ = α: Rα βαν ; σ + Rα βσα ; ν + Rα βνσ ; α = 0 ↓ −R

α

βνα ; σ





Rσβ ; ν

g αρ Rρβνσ ; α



↓ g αρ Rνσρβ ; α

−Rβν ; σ La ecuaci´on queda entonces:

−Rβν ; σ + Rσβ ; ν + g αρ Rνσρβ ; α = 0 Multiplicar por g βν y utilizar la propiedad (9.79): −R; σ + Rν σ ; ν + g αρ g βν Rνσρβ ; α = 0 −R; σ + Rν σ ; ν + Rα σ ; α = 0 Es decir 1 Rα σ ; α − R;σ = 0 2 239

(9.103)

1 (Rα σ − g α σ R); α = 0 2 Quedan entonces demostradas las identidades de Bianchi. Esta u ´ltima identidad la queremos presentar en una forma ligeramente diferente, que nos ser´a u ´til m´as tarde. Multiplicando la ecuaci´on (9.103) por g µσ escribimos αµ R ; α = 12 g µσ R;σ , y como Rαµ = Rµα tenemos Rµα ; α = 12 g µσ R;σ , es decir: 1 Rµν ; ν = g µν R;ν 2

(9.104)

Esta f´ormula es equivalente a la identidad de Bianchi. Ahora ataquemos el problema de demostrar que

9.18

El tensor de Riemann es el u ´ nico

que contiene linealmente las primeras derivadas del s´ımbolo de Christoffel Γ. Lo demostraremos [13] siguiendo este derrotero: calcular las derivadas Γα µν , δ , averiguar c´omo transforman ( y darse cuenta de que no son tensores), proponer una combinaci´ on lineal de derivadas Γα µν , δ que s´ı transforma como un tensor (al que llamaremos Rρ ξη , σ ), probar que este tensor Rρ ξη , σ es igual al tensor de Riemann Rρ ξη , σ y, finalmente, demostrar que siempre se llega al tensor Rρ ξη , σ y no a otro. Multiplicar ambos lados de (9.63) por

∂xσ : ∂x0µ

∂xρ ∂xω σ ∂ 2 xσ ∂xσ 0µ Γ = Γ + ρω αβ ∂x0µ ∂x0α ∂x0β ∂x0α ∂x0β Tomemos la derivada

∂ en ambos lados de esta ecuaci´on: ∂x0κ

∂ 2 xσ ∂xρ ∂xω ∂Γσ ρω ∂xσ ∂Γ0µ αβ 0µ + Γ = αβ ∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ µ ρ ¶ ∂ ∂x ∂xω ∂ 3 xσ σ + Γ ρω + ∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β 240

∂Γσ ρω ∂xη ∂Γσ ρω En el primer t´ermino del lado derecho hacemos = , y la ∂x0κ ∂x0κ ∂xη ecuaci´on queda: ∂ 2 xσ ∂xρ ∂xω ∂xη ∂Γσ ρω ∂xσ ∂Γ0µ αβ 0µ + Γ = αβ ∂x0µ ∂x0κ ∂x0κ ∂x0µ ∂x0α ∂x0β ∂x0κ ∂xη µ ρ ¶ ∂ ∂x ∂xω ∂ 3 xσ σ + Γ ρω + ∂x0κ ∂x0α ∂x0β ∂x0κ ∂x0α ∂x0β Multiplicar ambos lados por

∂x0λ y reordenar t´erminos: ∂xσ

∂Γ0λ αβ ∂x0λ ∂xρ ∂xω ∂xη Γσ ρω ∂x0λ ∂ 3 xσ = + ∂x0κ ∂xσ ∂x0α ∂x0β ∂x0κ ∂xη ∂xσ ∂x0κ ∂x0α ∂x0β µ ¶ ∂xρ ∂xω ∂x0λ ∂ 2 xσ ∂x0λ ∂ 0µ − Γ + Γσ ρω αβ ∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ Y en notaci´on con comas: ∂x0λ ∂xρ ∂xω ∂xη σ ∂x0λ ∂ 3 xσ Γ + ρω , η ∂xσ ∂x0α ∂x0β ∂x0κ ∂xσ ∂x0κ ∂x0α ∂x0β µ ¶ ∂x0λ ∂ ∂xρ ∂xω ∂x0λ ∂ 2 xσ 0µ + Γσ ρω − Γ αβ ∂xσ ∂x0κ ∂x0α ∂x0β ∂xσ ∂x0κ ∂x0µ

Γ 0λ αβ , κ =

Observemos bien esta ecuaci´on. Si en el lado derecho hubiera u ´nicamente el primer t´ermino, podr´ıamos decir que Γλ αβ , κ es un tensor. Pero el lado derecho tiene m´as t´erminos, y por eso las derivadas Γλ αβ , κ no son tensores. En seguida veremos que hay una combinaci´ on lineal de estas derivadas que s´ı es tensor. Cambiemos ahora la notaci´on: escribimos x ˜µ en vez de xµ , y escribimos x ˜0µ en vez de x0µ : ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ˜0λ ∂ x ˜ 0λ αβ , κ = ∂ x Γ + Γ ∂x ˜σ ∂ x ˜0α ∂ x ˜0κ ρω , η ˜0β ∂ x µ ρ ¶ ∂x ˜ ∂x ˜ω ∂x ˜0λ ∂ σ ˜ − + Γ ρω ∂x ˜σ ∂ x ˜0κ ∂ x ˜0α ∂ x ˜0β 241

∂x ˜0λ ∂3x ˜σ ∂x ˜σ ∂ x ˜0κ ∂ x ˜0α ∂ x ˜0β ˜σ ˜0λ ∂ 2 x ˜ 0µ ∂ x Γ αβ ∂ x ˜σ ∂ x ˜0κ ∂ x ˜0µ

Supongamos en este momento que tanto las x ˜µ como las x ˜0µ son coordenadas adaptadas al punto E. Vamos a evaluar la u ´ltima ecuaci´on en E, recordando ˜=Γ ˜ 0 = 0: que en ese punto Γ ¯ ¯ ¯ ¯ ¯ ∂x ˜0λ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂3x ˜σ ¯ 0λ ˜ ¯ ¯ Γ αβ , κ ¯ = Γ ρω , η ¯ + ¯ σ 0α 0β 0κ σ 0κ 0α 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂ x ˜ ∂ x ˜ ∂ x ˜ ∂ x ˜ E E E (9.105) Sea G el grupo de todas las transformaciones de coordenadas, y sea G 0 el subgrupo de las transformaciones que llevan de unas coordenadas adaptadas a otras adaptadas. Observemos la ecuaci´on (9.105). Si en el lado derecho ˜ 0λ αβ , κ es un hubiera u ´nicamente el primer t´ermino, podr´ıamos decir que Γ 0 tensor bajo el subgrupo G . Pero el lado derecho tiene otro t´ermino, y por eso ˜ 0λ αβ , κ no es un tensor bajo el subgrupo G 0 . En seguida veremos que hay Γ una combinaci´on lineal de estas derivadas que s´ı es tensor bajo el subgrupo G 0 . Se trata de erradicar al segundo t´ermino del lado derecho de (9.105), y esto no es dif´ıcil. En efecto, notemos que el segundo t´ermino del lado derecho de (9.105) es sim´etrico bajo la permutaci´ on κ ® β ; entonces, si en ambos lados de (9.105) restamos la permutaci´ on κ ® β , debe desaparecer el t´ermino inc´omodo: ³ ´¯ ˜ 0λ αβ , κ − Γ ˜ 0λ ακ , β ¯¯ Γ E

µ =

¶¯ ¯ ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ∂x ˜0λ ∂ x Γ ρω , η − Γ ρω , η ¯¯ σ 0α 0β 0κ σ 0α 0κ 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E

En el segundo t´ermino del lado derecho intercambiar los nombres de los ´ındices η y ω: ³ ´¯ ˜ 0λ αβ , κ − Γ ˜ 0λ ακ , β ¯¯ Γ E

µ =

=

¶¯ ¯ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ˜ σ ˜ρ ∂ x ˜η ∂ x ˜ω ˜ σ ∂x ˜0λ ∂ x Γ ρω , η − Γ ρη , ω ¯¯ σ 0α 0κ σ 0α 0κ 0β 0β ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E

´¯¯ ∂x ˜0λ ∂ x ˜ρ ∂ x ˜ω ∂ x ˜η ³ ˜ σ σ ˜ Γ ρω , η − Γ ρη , ω ¯¯ ∂x ˜σ ∂ x ˜0α ∂ x ˜0β ∂ x ˜0κ E

Definiendo 242

¯ ³ ´¯ ¯ λ ˜ ˜ λ αβ , κ − Γ ˜ λ ακ,β ¯¯ , R αβκ ¯ = Γ

(9.106)

¯ ¯ ρ ∂x ω ∂x η 0λ ∂ x ¯ ˜ ˜ ˜ ∂ x ˜ ¯ σ ˜ ρωη ¯ ˜ αβκ ¯ = R R ¯ σ 0α 0β 0κ ∂x ˜ ∂x ˜ ∂x ˜ ∂x ˜ E E

(9.107)

E

E

podemos escribir 0λ

˜ λ αβκ transforma como Esta ecuaci´on dice que, en el punto E, la cantidad R un tensor bajo el grupo G 0 . Por el momento comparemos las ecuaciones (9.101) y (9.106) para afirmar que ¯ ¯ ˜ λ αβκ ¯¯ = R ˜ λ αβκ ¯¯ R E

E

(9.108)

˜ λ αβκ coincide En palabras: en el punto E y en coordenadas adaptadas, R λ ˜ con el tensor de Riemann. ¯ Pero R αβκ es tensor bajo G, entonces la ecuaci´on ¯ ˜ λ αβκ ¯ tambi´en es tensor bajo G. (9.108) dice que R E

Ahora, si dos tensores son iguales en un sistema coordenado,¯ tambi´en ser´a¯ n ˜ λ αβκ ¯¯ = R ˜ λ αβκ ¯¯ iguales en otro sistema coordenado, lo que se escribe R E E ¯ ¯ ⇒ R λ αβκ ¯E = R λ αβκ ¯E . Anotemos finalmente que lo hecho para el punto E tambi´en se puede hacer para cualquier otro punto; esto nos permite afirmar que en todos los puntos del espacio se cumple la igualdad R λ αβκ = R λ αβκ . Nuestro inter´es ha sido construir un tensor que contenga linealmente las primeras derivadas del s´ımbolo de Christoffel, y hemos encontrado que ese tensor es el tensor de Riemann. Debemos adem´as probar que fuera del tensor de Riemann no hay otro tensor que contenga linealmente las primeras derivadas del s´ımbolo de Christoffel. Esto es f´acil. Cuando rastreamos hacia atr´as el camino recorrido encontramos que hay otra ruta posible: para erradicar el t´ermino inc´omodo de (9.105) nosotros restamos la permutaci´ on κ ® β ; pero el t´ermino inc´omodo tambi´en se puede erradicar restando la permutaci´on κ ® α ; en tal caso terminamos, no en R λ αβκ , sino en R λ βακ . Claramente, esta segunda ruta produce otra componente del tensor de Riemann, pero no produce un tensor diferente al de Riemann. En conclusi´on, las dos rutas llegan al mismo tensor. En vista de (9.59) podemos afirmar que 243

R λ αβκ es el u ´nico tensor en el que: 1) Aparecen las derivadas gµν ,α y gµν ,α,β 2) Las gµν ,α,β aparecen linealmente.

(9.109)

Rµν y R tambi´ en son u ´ nicos: Veamos que cuando se contraen dos ´ındices en el tensor de Riemann, siempre se produce el tensor de Ricci. Analicemos en detalle las posibles contracciones de Rαβµν para producir un tensor de rango dos: Contraer α y ν :

g να Rαβµν = Rβµ

Contraer α y µ :

g µα Rαβµν = −g µα Rαβνµ = −Rβν

Contraer α y β :

g αβ Rαβµν = 0

Contraer β y µ :

g βµ Rαβµν = g βµ Rβανµ = Rαν

Contraer β y ν :

g βν Rαβµν = −g βν Rβαµν = −Rαµ

Vemos as´ı que siempre se termina en el tensor de Ricci. De otro lado, es claro que con Rµν hay una s´ola contracci´ on posible, que es R. En conclusi´on: El u ´nico tensor de rango dos que se puede obtener a partir de R λ αβκ es Rµν , y el u ´nico escalar es R .

9.19

(9.110)

Obligar al tensor m´ etrico a que, en cierto evento, tome alg´ un valor que nosotros queramos

Teorema: Es posible erigir un sistema de coordenadas x ¯µ de tal manera que el tensor m´etrico tome, en alg´ un punto E del espacio, cualquier valor que nosotros arbitrariamente queramos. Para demostrar este teorema supongamos que tenemos un sistema de coordenadas xµ , con m´etrica g αβ . Vamos a hacer una transformaci´on a otro sistema coordenado x ¯µ ; pero no una transformaci´on cualquiera, sino lineal: x ¯µ = bµ ν xν , 244

(9.111)

con bµ ν constante. Derivando dos veces se encuentra: ∂2x ¯µ =0 ∂xσ ∂xν

(9.112)

Ahora usamos la ecuaci´on (9.20) para calcular el tensor m´etrico en las nuevas coordenadas: g¯µν =

∂x ¯µ ∂ x ¯ν αβ g , ∂xα ∂xβ

y utilizando (9.111): g¯µν = bµ α bν β g αβ

(9.113)

Esta ecuaci´on es v´alida en todos los puntos del espacio. En particular, en el punto E : g¯µν (E) = bµ α bν β g αβ (E)

(9.114)

Asignemos a las componentes g¯µν (E) cualesquiera valores que nosotros arbitrariamente queramos darles. La cuesti´on importante es esta: ¿Acaso estamos construyendo un g¯µν (E) contradictorio, sin consistencia interna? ¿Tenemos realmente plena libertad para asignar a las componentes g¯µν (E) los valores que caprichosamente queramos? La pregunta se concreta de la manera siguiente: ¿existe el conjunto de coeficientes bµ ν capaz de llevar del g µν (E) inicial al g¯µν (E) caprichoso? Veremos que s´ı existe el conjunto de coeficientes bµ ν , es decir, que los datos (que son g µν (E) y g¯µν (E)) admiten la existencia de los coeficientes bµ ν . Para demostrar que los datos son compatibles con los coeficientes bµ ν , tomamos a estos bµ ν como si fueran inc´ognitas, y nos preguntamos si acaso hay suficientes ecuaciones para averiguar las n2 las inc´ognitas. Como el tensor m´etrico es de dos ´ındices, tiene n2 componentes; pero adem´as es sim´etrico, entonces s´olo tiene (n2 +n)/2 componentes independientes. Esto nos permite afirmar que (9.114) es un conjunto de (n2 + n)/2 ecuaciones independientes. Tenemos pues (n2 + n)/2 ecuaciones y n2 inc´ ognitas; pero n2 >(n2 + n)/2 , es 245

decir, hay m´as inc´ognitas que ecuaciones: el sistema de ecuaciones est´a subdeterminado, y por consiguiente hay un n´ umero infinito de soluciones para las inc´ognitas bµ α . En conclusi´on, s´ı es posible asignar a las componentes g¯µν (E) los valores que nosotros arbitrariamente queramos darles2 . Pensando en una matriz b cuyas entradas son bµ α , la ecuaci´on 9.114) se escribe concisamente de la manera siguiente: g¯µν (E) = b g αβ (E) bT

(9.115)

Como hay un n´ umero infinito de soluciones para la matriz b , no podemos aspirar a deducirla. Esta matriz b se averigua por inspecci´on directa de la ecuaci´on (9.115): en esta f´ormula las variables g¯µν (E) y g µν (E) son datos. Podemos escoger las componentes de g¯µν (E) arbitrariamente, o las de g¯µν (E 0 ), o las de g¯µν (E 00 ) ... Pero no podemos escoger arbitrariamente las de g¯µν (E) y las de g¯µν (E 0 ) y las de g¯µν (E 00 )...Esto es claro, ya que para obtener g¯µν (E) se necesita hacer una transformaci´on de coordenadas (un conjunto de coeficientes bµ ν ) y para obtener g¯µν (E 0 ) se necesita otra transformaci´on. Escribamos de qu´e manera quedan el tensor m´etrico y el de Riemann despu´es de esta transformaci´on de coordenadas, siguiendo las f´ormulas (9.113) y (9.80): g¯µν = bµ ρ bν σ g ρσ

9.20

¯ αβµν = bα ρ bβ σ bµ δ bν π Rρσδπ R

(9.116)

Dos transformaciones sucesivas

Ahora vamos a considerar dos transformaciones: xµ → x ˜µ → x ¯µ . La primera transformaci´on sigue al teorema de la secci´on 9.16 y la segunda sigue al teorema de la secci´on 9.19. M´as precisamente: en las coordenadas xµ el tensor m´etrico es g µν y los s´ımbolos de Christoffel son Γα µν . En coordenadas x ˜µ el tensor m´etrico es g˜µν y los s´ımbolos de Christoffel, evaluados en E , son cero. En coordenadas x ¯µ el tensor m´etrico es g¯µν y los s´ımbolos de Christoffel, evaluados en E , siguen siendo cero. El tensor g¯µν , evaluado en E , tiene cualesquiera componentes que nosotros queramos. 2

Algo similar ocurre en la teor´ıa newtoniana de la gravitaci´ on. El potencial gravitacional Φ puede ser subido o bajado a nuestro ama˜ no para que Φ adopte, en un punto dado, cualquier valor que nosotros queramos darle.

246

Uno podr´ıa poner en duda que en las u ´ltimas coordenadas x¯ los s´ımbo¯ (E) sigan siendo cero. Esta duda es justificada porque, los de Christoffel Γ ˜ sabido que los Γ(E) se volvieron cero en la primera transformaci´on, ¿c´omo garantizamos que siguen siendo cero despu´es de la segunda transformaci´on de coordenadas? En otras palabras: ¿c´omo garantizamos que las x¯ sean coordenadas adaptadas? Pues as´ı ocurre, verdaderamente; en efecto, utilizando la f´ormula (9.64) para escribir la transformaci´on x ˜→x ¯ encontramos: ¯µ ∂ x ˜σ ∂ x ˜τ ˜ ν ∂x ˜ν ∂ x ˜σ ∂ 2 x ¯µ ¯ µ αβ = ∂ x Γ Γ − στ ∂x ˜ν ∂ x ¯α ∂ x ∂x ¯α ∂ x ˜σ ∂ x ˜ν ¯β ¯β ∂ x ¯ µ αβ no es, en general, cero; Esta ecuaci´on es v´alida en todo el espacio, y Γ pero en E s´ı es cero. En efecto, en E ambos t´erminos del lado derecho son ˜ ν στ (E) = 0, y el segundo t´ermino por cero: el primer t´ermino porque Γ ˜ = 0 , tambi´en Γ ¯=0. (9.112). En conclusi´on, en el punto E no s´olo Γ La segunda transformaci´on x ˜→x ¯ es, de acuerdo con las f´ormulas (9.111) y (9.116), as´ı: x ¯µ = bµ ρ x ˜ρ ,

g¯µν = bµ ρ bν σ g˜ρσ ,

¯ αβµν = bα ρ bβ σ bµ δ bν π R ˜ ρσδπ , R

y en vista de (9.97) y (9.100): x ¯µ = bµ ρ (xρ − xρE ) + g¯µν ¯ αβµν R

1 µ ρ b ρ Γ δπ (xδ − xδE )(xπ − xπE ) (9.117) 2

= bµ ρ bν σ g ρσ

(9.118)

= bα ρ bβ σ bµ δ bν π Rρσδπ

(9.119)

Hagamos una breve recopilaci´on de la doble transformaci´on: Se escoge un punto E . Se conoce la m´etrica g µν en las coordenadas iniciales xµ . Uno quiere que la m´etrica final, evaluada en el punto E , sea g¯µν (E) . O sea que E , g µν y g¯µν (E) son datos. La pregunta es ¿c´omo son las coordenadas finales x ¯µ y c´omo son las componentes de los tensores en estas coordenadas finales? Para resolver esta pregunta se siguen los siguientes 247

pasos: Se escribe la ecuaci´on (9.115) y, por inspecci´on, se averigua la matriz b . Conocidos los coeficientes bα ρ , uno ejecuta las tres ecuaciones (9.117)(9.119). Debe resaltarse que estas tres ecuaciones son v´alidas en todos los puntos del espacio. Finalmente, n´otese que en estas ecuaciones no aparecen ˜ αβµν , que corresponden a las coordenadas incantidades del tipo x ˜µ , g˜µν ni R termedias; en otras palabras, estas ecuaciones muestran una transformaci´on directa xµ → x ¯µ , sin vestigios de la transformaci´on intermedia xµ → x ˜µ .

9.21

Un ejemplo

A continuaci´on traemos un ejemplo de la doble transformaci´on. En la secci´on 13.1 tendremos ocasi´on de estudiar un problema de primera importancia, que es el campo gravitatorio ocasionado por una masa puntual M . Veremos que el tensor m´etrico est´a dado por la matriz (13.14); en esa expresi´on la variable s , que se llama el radio de Schwarzschild, quiere decir 2GM/c2 . O sea que aunque s tiene unidades de longitud, representa a la masa M , de modo que el l´ımite del espacio plano, que corresponde a M = 0 , se obtiene haciendo s = 0 en la ecuaci´on (13.14), lo que da como resultado la ecuaci´on (9.44). Tambi´en veremos, en la secci´on 13.2, las componentes no nulas de los s´ımbolos de Christoffel y del tensor de Riemann. En las coordenadas iniciales xµ = (ct, r, θ, ϕ) el evento E tiene coordenadas xµE = (ctE , rE , θE , ϕE ) y el tensor m´etrico est´a dado por (13.14). Este tensor, evaluado en E , es:      µν g (E) =     

(1 − s/rE )−1

0

0

−(1 − s/rE )

0

0

0

0

−2 −rE

0

0

0

0

0

0

         

−(rE sen θE )−2 (9.120)

De otro lado, queremos que en las coordenadas finales x¯µ el tensor m´etrico, al evaluarse en E , sea (9.44): 248



1

0

0

0

   0 −1 0  µν g¯ (E) =    0 0 −r−2  E  0

0

0 0

         

(9.121)

−(rE sen θE )−2

0

Para averiguar la matriz b debemos poner las matrices (9.120) y (9.121) en la ecuaci´on (9.115). Al hacerlo nos damos cuenta, por simple inspecci´on, de que una b posible es la siguiente matriz diagonal:

b = bT = diag

à p

1

!

1 − s/rE , p ,1,1 1 − s/rE

(9.122)

¯ αβµν del tensor Conocida la matriz b , es muy f´acil calcular las componentes R de Riemann en las coordenadas finales x ¯µ . Para tal efecto se ponen las vieρσδπ jas componentes R (de la secci´on 13.2) y la matriz (9.122) en la f´ormula (9.119), obteni´endose: ¯ 0101 = R ¯ 1010 = −R ¯ 1001 = −R ¯ 0110 = R

s r3

¯ 0202 = R ¯ 2020 = −R ¯ 2002 = −R ¯ 0220 = R

s(1 − s/rE ) 2r5 (1 − s/r) s(1 − s/rE ) − 5 2r (1 − s/r) sin2 θ s(1 − s/r) 2r5 (1 − s/rE ) s(1 − s/r) 2r5 (1 − s/rE ) sin2 θ s − 7 2 r sin θ

¯ 0303 = R ¯ 3030 = −R ¯ 3003 = −R ¯ 0330 = R ¯ 1212 = R ¯ 2121 = −R ¯ 2112 = −R ¯ 1221 = R ¯ 1313 = R ¯ 3131 = −R ¯ 3113 = −R ¯ 1331 = R ¯ 2323 = R ¯ 3232 = −R ¯ 3223 = −R ¯ 2332 = R



Para calcular el tensor m´etrico g¯µν en las coordenadas finales x ¯µ debemos colocar las matrices (13.14) y (9.122) en la f´ormula (9.118) para obtener: 249



µν



1 − s/rE  1 − s/r      0 =     0   0

 0



0

0

0

0

0

−r−2

0

0

0

−(r sen θ)−2

1 − s/r 1 − s/rE

            

(9.123)

¯ αβµν y los g¯µν sin necesiEs interesante apuntar que pudimos calcular los R dad de averiguar antes las coordenadas finales x ¯µ . No sobra, sin embargo, que presentemos estas coordenadas finales. Para calcularlas se utilizan los t´erminos de Christoffel de la secci´on 13.2 y la matriz (9.122) en la f´ormula (9.117), lleg´andose a: x ¯0 =

p 1 − s/rE (ct − ctE )

h 1 s(1 − s/r)(ct − ctE )2 s(r − rE )2 x ¯1 = p 2(r − rE ) + − 2 2 2r 2r (1 − s/r) 2 1 − s/rE − r(1 − s/r)(θ − θE )2 − r(1 − s/r)(sen θ)2 (ϕ − ϕE )2

i

1 1 x ¯2 = θ − θE + (r − rE )(θ − θE ) − sen θ cos θ(ϕ − ϕE )2 r 2 1 x ¯3 = ϕ − ϕE + (r − rE )(ϕ − ϕE ) + cot θ (θ − θE )(ϕ − ϕE ) r El espacio no es plano en el evento E . En el evento E ocurren dos cosas interesantes: 1) la m´etrica (9.121) es la misma (9.44) del espaciotiempo plano; y 2) los s´ımbolos de Christoffel son cero, como ocurre en el espaciotiempo plano. En vista de estas dos propiedades uno podr´ıa precipitarse a afirmar que en E el espaciotiempo es plano, pero esta afirmaci´on es falsa, ya que el espaciotiempo descrito por (9.123) no es plano ni en E ni en ning´ un otro evento. Ya hemos visto que lo que indica si un espacio es plano o curvo es el tensor de Riemann: acabamos de demostrar que algunas componentes de este tensor difieren de cero, y por eso el espaciotiempo descrito por (9.123) es curvo. El ejemplo que acabamos de estudiar, aunque se refiere a un espacio particular de dimensi´on 4, pone de presente una propiedad general: en todo espacio 250

de Riemann, de cualquier dimensi´on n, es posible construir un sistema de coordenadas adaptadas a un punto (llam´emoslo E), de modo que en E la m´etrica y los s´ımbolos de Christoffel sean como los de un espacio plano. A primera vista se podr´ıa creer que el espacio se ha aplanado en E , pero ese pensamiento es err´oneo: la curvatura o planitud del espacio en E es una propiedad intr´ınseca de la geometr´ıa, tal como hab´ıamos mencionado en la p´agina 235. Damos por terminada la tarea que nos hab´ıamos planteado en la p´agina 235: demostrar que es posible adaptar al punto E un sistema de coordenadas de modo que se cumplan las dos condiciones (9.96). Esto nos dota de herramientas suficientes para construir una teor´ıa general de la relatividad, asunto que nos ocupar´a a partir del cap´ıtulo 11.

251

252

Cap´ıtulo 10

Las geod´ esicas Pensemos en dos puntos P1 y P2 en la superficie de una esfera. Existe un n´ umero infinito de curvas que pasan por ambos puntos, a lo largo de las cuales se puede medir la distancia P1 P2 . Nos preguntamos ahora en cu´al de las curvas la distancia P1 P2 resulta m´ınima, y la respuesta es bien conocida: en el arco menor del c´ırculo m´aximo que pasa por ambos puntos. El c´alculo elemental nos ense˜ na que una funci´on se minimiza cuando se anula una primera derivada, es decir, cuando la funci´on es estacionaria. En nuestro caso decimos que a lo largo del arco menor la distancia es estacionaria: el c´alculo de la distancia arroja el mismo resultado bien sea que se ejecute a lo largo del arco menor o a lo largo de cualquier otra curva, muy cercana al arco menor, que pase por P1 y P2 . Para cualquier geometr´ıa, en general, la geod´esica se define como aquella curva en la que la distancia total es estacionaria (en vez de estacionaria se puede usar tambi´en la palabra extremal). Este es un concepto variacional que se refiere a la geod´esica y a todas las curvas arbitrarias cercanas a ella. Nos proponemos desarrollar el c´alculo variacional para encontrar la geod´esica.

10.1

La ecuaci´ on diferencial de las geod´ esicas

Consideremos un espacio de Riemann con coordenadas xµ e intervalo ds2 = gµν dxµ dxν . Sean E1 y E2 dos puntos en ese espacio. Pensemos ahora en una curva R E2 pque pasa por estos dos puntos y llamemos longitud total al integral gµν dxµ dxν ejecutado a lo largo de esa curva. Sin embargo, esta curva E1 no es la u ´nica que pasa por E1 y E2 ya que, en efecto, hay un n´ umero 253

infinito de curvas, y cada una tiene su propia longitud. Dentro del infinito n´ umero de curvas que conectan a E1 con E2 hay una muy especial, llamada la geod´esica, en la que se extremaliza la longitud total: Z

E2

δ E1

p gµν dxµ dxν = 0

en la geod´esica.

(10.1)

p Hemos cometido una ligereza al tomar la ra´ız cuadrada gµν dxµ dxν , cosa que s´olo puede hacerse cuando el intervalo no es negativo. Por el momento vamos a suponer que los intervalos son positivos y aplazamos para la secci´on 10.2 el estudio de los intervalos nulos y negativos. Parametrizaci´ on. Llamamos (dλ)2 al intervalo a lo largo de la geod´esica: ·q ¸ µ ν dλ = gµν (x) dx dx

(10.2) Geod´ esica

R La integral λ = E1 dλ es la longitud parcial de la geod´esica desde E1 hasta un punto cualquiera de ella. El par´ametro λ es propiedad de la geod´esica y sirve para caracterizar los puntos que a ella pertenecen. M´as expl´ıcitamente, denotando por x ¯ a los puntos de la geod´esica, escribimos x ¯=x ¯(λ) ; las coµ µ ordenadas de x ¯ tambi´en son funciones de λ, es decir, x ¯ =x ¯ (λ) . Pensemos ahora en otra curva diferente a la geod´esica, que se construye punto a punto de la manera siguiente: el punto x ¯(λ) se corre una cantidad δx(λ) , o sea que las coordenadas del nuevo punto ser´an x ¯µ (λ) + δxµ (λ) . Vemos as´ı que todos los puntos de la geod´esica y todos los puntos de la nueva curva son funciones del par´ametro escalar λ . Las variaciones δxµ son infinitesimales y arbitrarias, pero deben ajustarse a la condici´on de que la curva variada x ¯µ + δxµ tambi´en pase por E1 y E2 : δxµ = 0

en E1 y en E2

(10.3)

Las ecuaciones de Euler-Lagrange. El problema variacional contenido en la ecuaci´on (10.1) es matem´aticamente igual al de la ecuaci´on (8.3), si se hace el cambio L → L, con la lagrangiana L definida as´ı: r L ≡

gµν

dxµ dxν dλ dλ

254

(10.4)

Nos ahorramos los pasos que llevan de (8.3) a (8.8), y simplemente escribimos las ecuaciones de Euler-Lagrange (8.8) con L en vez de L: ·

∂L ∂xα



¸ − Geod´ esica



d  ∂L  = 0   dxα dλ ∂ dλ Geod´esica

(10.5)

Los parecidos con el Cap´ıtulo 8 no cesan aqu´ı. En efecto, el lector podr´a reconocer que el problema que queremos atacar es muy parecido al que resolvimos en los pasos que llevan de la ecuaci´on (8.13) a la (8.16). Pero hay una diferencia importante: en esa ocasi´on la m´etrica ηµν era constante, en cambio en el problema que ahora nos ocupa ocurre que gµν es variable. Concretamente, en vez de (8.14) debemos ahora escribir dxµ dxν ∂L 1 g = µν ,α ∂xα 2L dλ dλ La an´aloga de (8.15) es ∂L dxν 1 gνα α = dx L dλ ∂ dλ Pongamos ahora las dos u ´ltimas ecuaciones en (10.5): ·

1 dxµ dxν gµν ,α 2L dλ dλ

¸

· ¸ d 1 dxν − gνα =0 dλ L dλ Geod Geod

Ahora, la ecuaci´on (10.2) afirma que [ L ]Geod = 1, entonces (10.6) es: 1 dxµ dxν d gµν ,α − 2 dλ dλ dλ

µ ¶ dxν gνα =0 dλ

Procedemos a transformar la apariencia de esta ecuaci´on: 0 =

dxµ dxν d ³ dxµ ´ 1 gµν ,α − gµα 2 dλ dλ dλ dλ 255

(10.6)

= =

´ dxµ 1 dxµ dxν ³ d d2 xµ gµν ,α − gµα − gµα 2 dλ dλ dλ dλ dλ2 h1 2

gµν ,α − gµα,ν

i dxµ dxν d2 xµ − gµα dλ dλ dλ2

Multiplicar ambos lados por g σα : 0 =

¡ ¢ dxµ dxν d2 xσ 1 + g σα 2gαµ , ν − gµν , α 2 dλ 2 dλ dλ

=

¢ dxµ dxν d2 xσ 1 σα ¡ + g g + g − g + g − g αµ , ν να , µ µν , α αµ , ν να , µ dλ2 2 dλ dλ

=

¢ dxµ dxν d2 xσ 1 σα ¡ dxµ dxν σ + g g − g + Γ αµ , ν αν , µ µν dλ2 dλ dλ 2 dλ dλ

(10.7)

¢ ¡ on µ À ν, Se observa que gαµ , ν − gαν , µ es antisim´etrico bajo la permutaci´ µ ν mientras que dx dx es sim´etrico; entonces, de acuerdo con la ecuaci´on (5.38), la contracci´on total es cero. Vemos as´ı que el u ´ltimo t´ermino del lado derecho de la ecuaci´on (10.7) es cero, o sea que: d2 xσ dxµ dxν σ = 0 + Γ µν dλ2 dλ dλ

(10.8)

Esta es la ecuaci´on diferencial de las geod´esicas. Ella es, en el fondo, la ecuaci´on de Euler-Lagrange asociada a la L de (10.4). Conviene apuntar que aunque en el lado izquierdo de (10.8) ninguno de los dos t´erminos es tensor, la suma s´ı da el tensor cero. En otras palabras, (10.8) es una ecuaci´on tensorial, lo que significa que es covariante bajo el grupo de las transformaciones generales de coordenadas.

10.2

Par´ ametros afines

λ recibe el nombre de par´ ametro af´ın. La definici´on inicial (10.2) aclara cu´al 2 es el significado de dλ : es el intervalo a lo largo de la geod´esica. En la ecuaci´on diferencial de las geod´esicas (10.8) aparece λ como el par´ametro importante, la variable independiente. En este momento damos un giro a 256

la presentaci´on, para definir al par´ametro af´ın en base a la ecuaci´on de las geod´esicas: si la ecuaci´on de una geod´esica es (10.8), entonces λ es un par´ametro af´ın de esa geod´esica. Ahora, si λ es un par´ametro af´ın de una geod´esica, entonces aλ + b tambi´en es par´ametro af´ın (a y b constantes). En efecto, llamando λ0 = aλ + b, la ecuaci´on (10.8) se convierte en dxµ dxν d2 xσ σ + Γ = 0 µν dλ02 dλ0 dλ0 Como esta ecuaci´on es de la forma (10.8), podemos afirmar que λ0 = aλ + b tambi´en es un par´ametro af´ın. Hagamos una pausa para ver un ejemplo u ´til de lo que puede ser un par´ametro af´ın. En el caso particular del espaciotiempo, consideremos el tiempo propio dτ de una part´ıcula masiva. De acuerdo con la ecuaci´on (8.1): ds2 = c2 dτ 2

(10.9)

Si esta part´ıcula sigue una trayectoria geod´esica, entonces ds2 = dλ2 . Hay dos par´ametros afines importantes, que son s y τ : d2 xσ dxµ dxν σ + Γ µν ds2 ds ds

= 0

part´ıcula masiva

(10.10)

d2 xσ dxµ dxν σ + Γ µν dτ 2 dτ dτ

= 0

part´ıcula masiva

(10.11)

Despu´es de definir el par´ametro af´ın en base a la ecuaci´on de la geod´esica, estamos en condici´on de abordar el asunto de los intervalos nulos y negativos. Recordemos que justo antes de escribir la ecuaci´on (10.1) supusimos que el intervalo ds2 era positivo y, basados en esa suposici´on, dedujimos la ecuaci´on de las geod´esicas (10.8). A primera vista podr´ıamos afirmar que (10.8) es v´alida u ´nicamente para geod´esicas de intervalos positivos, pero tal afirmaci´on es apresurada: (10.8) es, en general, la ecuaci´on de todas las geod´esicas, sean ´estas de intervalos positivos, nulos o negativos. Decimos que, en general ds2 = ² dλ2 , 257

(10.12)

donde ² = 0, ±1. El valor ² = 0 es para intervalos nulos, mientras que ² = ±1 para intervalos positivos o negativos. En todos los casos dλ2 es una cantidad positiva. Para intervalos positivos, es claro que dλ2 es directamente el intervalo, y para intervalos negativos dλ2 es el negativo del intervalo. Para intervalos nulos no hay una regla general que se aplique a todos los casos; lo que usualmente ocurre es que la misma ecuaci´on de la geod´esica indica cu´al es el par´ametro af´ın λ que se debe emplear; el lector interesado puede dirigirse a la ecuaci´on (13.45), donde encontrar´ a un ejemplo de c´omo las geod´esicas ayudan a determinar el par´ametro af´ın. El intervalo entre dos puntos cualesquiera del espacio es gµν dxµ dxν = ds2 . Si esos dos puntos pertenecen a la geod´esica, ds2 = ²dλ2 , o sea que gµν dxµ dxν = ²dλ2 . De aqu´ı se sigue que gµν

dxµ dxν =² dλ dλ

(10.13)

Esta es la ecuaci´on del intervalo entre dos puntos de la geod´esica.

10.3

Constantes del movimiento

Si llamamos V σ ≡

dxσ , la ecuaci´on de las geod´esicas (10.8) es: dλ d σ V = −Γσ µν V µ V ν dλ

Multiplicar ambos lados de esta ecuaci´on por gασ : gασ

d σ V = −gασ Γσ µν V µ V ν dλ

d d (gασ V σ ) − V σ gασ = −gασ Γσ µν V µ V ν dλ dλ Es decir: d d (gασ V σ ) = V σ gασ − gασ Γσ µν V µ V ν dλ dλ 258

(10.14)

= Vσ

dxη gασ,η − gασ Γσ µν V µ V ν dλ

= V σ V η gασ,η − = V σ V η gασ,η − =

1 gασ g σρ (gρµ,ν + gνρ,µ − gµν ,ρ ) V µ V ν 2 1 (gαµ,ν + gνα,µ − gµν ,α ) V µ V ν 2

1 1 gµν ,α V µ V ν + (gαµ,ν − gνα,µ ) V µ V ν 2 2

Obs´ervese que el u ´ltimo t´ermino del lado derecho es la contracci´ on total de un factor sim´etrico con otro antisim´etrico, y por (5.38) es cero. Queda entonces 1 d (gασ V σ ) = gµν , α V µ V ν dλ 2

Esta ecuaci´on dice claramente que

gµν ,α = 0



gασ

dxσ dλ

es constante

(10.15)

Este es el modo de identificar las “constantes del movimiento”: si la m´etrica es independiente de la coordenada xα , entonces gασ dxσ /dλ es una constante del movimiento. Decimos que una coordenada xα es c´ıclica si xα no aparece en el tensor m´etrico gµν . La f´ormula (10.15) dice, entonces, que a toda coordenada c´ıclica le corresponde una constante del movimiento. De otro lado, un vistazo a la definici´on (10.4) muestra que las coordenadas c´ıclicas tampoco aparecen en la lagrangiana, o sea que a toda coordenada xα que no aparezca en la lagrangiana se le asocia una constante del movimiento. En mec´anica cl´asica se usa exactamente el mismo enunciado. Es importante que se reconozca que gασ dxσ /dλ = constante proviene de las ecuaciones (10.8), lo que significa que, en total, las n ecuaciones (10.8) y la ecuaci´on gασ dxσ /dλ = constante forman un conjunto redundante. 259

10.4

Las ecuaciones algebraicas de las geod´ esicas

En el caso general disponemos de la ecuaci´on del intervalo (10.13) y de las n ecuaciones diferenciales (10.8). Como las (10.8) son ecuaciones de segundo grado, su soluci´on puede presentar dificultades. En comparaci´on, la (10.13) tiene derivadas de primer grado, y por esto puede ser m´as tratable que las (10.8). Como recomendaci´on general, uno debe utilizar la (10.13). Se presentan ocasionalmente casos felices, en los que hay constantes del movimiento; en estas situaciones, adem´as de las (10.8) y de las (10.13), uno dispone de una o varias ecuaciones (10.15). A continuaci´ on veremos algunos ejemplos; en todos ellos el par´ametro af´ın λ ser´a erradicado por completo, o sea que podremos escribir la ecuaci´on de la l´ınea geod´esica sin que aparezca λ. Ejemplo: Averiguar las ecuaciones algebraicas de las geod´esicas de la siguiente geometr´ıa: ds2 = dr2 + r2 dθ2 . Para la geometr´ıa dada el intervalo es positivo y podemos escoger el par´ametro af´ın λ igual a s. Es decir, ² = 1. El tensor m´etrico es · gµν =

1 0 0 r2

¸ (10.16)

La constante del movimiento: La m´etrica es claramente independiente de la dθ = gθθ θ˙ = r2 θ˙ variable θ, entonces, de acuerdo con (10.15), la cantidad gθθ dλ es constante del movimiento. La llamaremos K: K = r2 θ˙

θ˙−2

(10.17)

= Constante r4 = K2

(10.18) (10.19) µ

La ecuaci´ on del intervalo: Como ² = 1 , la ecuaci´on (10.13) es µ ¶2 dθ r2 = 1 , que ahora escribimos cortamente as´ı: dλ 260

dr dλ

¶2 +

µ

dr dλ

¶2

+ r2 θ˙2 = 1

(10.20)

dr dr dθ dr ˙ θ = = dλ dθ dλ dθ

(10.21)

Truco:

µ Entonces (10.20) queda

dr dθ

¶2

µ

θ˙2 + r2 θ˙2 = 1 , de donde:

dr dθ

¶2

+ r2 = θ˙−2

(10.22)

Desenlace: Al colocar la ecuaci´on (10.19) en (10.22) obtenemos: ³ dr ´2 dθ

+ r2 =

r4 K2

(10.23)

Todav´ıa queda la tarea de resolver esta ecuaci´on, asunto que se facilita si la dr K dr/r2 reescribimos de la manera siguiente: dθ = p = p . r4 /K 2 − r2 1 − (K/r)2 Entonces, llamando z = K/r: dz dθ = − √ 1 − z2 Integrar desde z = 1: Z

Z

θ

dθ = − θ0

1

z

dz √ 1 − z2

θ − θ0 = arc cos(z) O sea que r cos(θ − θ0 ) = K 261

(10.24)

Esta es la ecuaci´on de la l´ınea recta que est´a a una distancia K del origen y que forma un ´angulo π/2 + θ0 con el eje x. Recopilaci´on: 1. En una geometr´ıa de n dimensiones hay n ecuaciones diferenciales del tipo (10.8). Estas ecuaciones tienen dos desventajas: primero, desarrollarlas puede ser laborioso, porque hay que calcular todos los s´ımbolos de Christoffel; y, segundo, por ser ecuaciones diferenciales de segundo grado, ellas pueden ser dif´ıciles de resolver o manipular. 2. Adem´as de las n ecuaciones diferenciales del tipo (10.8), tenemos la ecuaci´on del intervalo (10.13). Esta ecuaci´on del intervalo tiene dos ventajas: primero, ella usualmente hace parte de los datos de un problema y, segundo, es una ecuaci´on diferencial de primer grado, lo que la hace comparativamente f´acil de integrar y manipular. 3. Si hay constantes del movimiento, la soluci´on del problema se facilita enormemente, porque adem´as de (10.8) y (10.13) disponemos de las ecuaciones adicionales (10.15). En estos casos podemos aspirar a que la soluci´on final, como (10.24), no contenga a la variable λ . En alg´ un momento del an´alisis es preciso erradicar al par´ametro inc´omodo λ. En el ejercicio que acabamos de resolver, pudimos desembarazarnos de dλ utilizando combinadamente: a) la constante del movimiento y, b) el truco dr/dλ = (dr/dθ)(dθ/dλ). Aqu´ı vemos la utilidad de las constantes del movimiento: us´andolas hemos logrado averiguar las l´ıneas geod´esicas sin emplear directamente las ecuaciones (10.8) de las geod´esicas. 4. Es preciso aclarar que aunque no hemos usado las (10.8) directamente, s´ı las hemos usado indirectamente, ya que la identificaci´ on de las constantes del movimiento (10.15) se ejecuta a trav´es de la ecuaci´on diferencial de las geod´esicas (10.14). De otro lado, la ecuaci´on diferencial de las geod´esicas no es independiente de la ecuaci´on del intervalo; en efecto, para la construcci´on de (10.8) es preciso usar los s´ımbolos de Christoffel, los cuales provienen del tensor m´etrico, el cual proviene de la ecuaci´on del intervalo ds2 = gµν dxµ dxν . 5. Se dispone de un conjunto de elementos de informaci´on: la ecuaci´on diferencial de las geod´esicas, la ecuaci´on del intervalo, y las constantes del movimiento. Este conjunto de elementos de informaci´on es redundante, por 262

las anotaciones consignadas en el numeral 4. 6. Las geod´esicas existen en el espacio antes de que nosotros tracemos sobre ´este alg´ un sistema de coordenadas. As´ı mismo, las constantes del movimiento existen o no existen, independientes del sistema coordenado usado. Otro asunto es si somos capaces de darnos cuenta de si en cierto espacio hay constantes del movimiento. Para apreciar esto regresemos al caso feliz reci´en visto, que es el de un espacio plano bidimensional. Si en vez de (r, θ) us´aramos coordenadas (x, y), el intervalo se escribir´ıa ds2 = dx2 + dy 2 y el tensor m´etrico no ser´ıa (10.16) sino: ·

1 0 0 1

¸

Es claro que el nuevo tensor m´etrico es independiente de x y de y, y por consiguiente hay dos constantes del movimiento. Cuando se usan coordenadas cartesianas (x, y) nos damos cuenta de que hay dos constantes del movimiento; cuando usamos coordenadas cil´ındricas (r, θ) nos damos cuenta de que hay una constante, pero no nos damos cuenta f´acilmente de que hay una segunda constante del movimiento. Para que nos demos cuenta de la existencia de alguna constante del movimiento se debe escoger un sistema coordenado adecuado. Si en un espacio hay m constantes del movimiento, existe un sistema coordenado x¯µ en el que el tensor m´etrico g¯µν es independiente de m coordenadas. Si el espacio es de dimensi´on n entonces, obviamente, m ≤ n. Si m = n, el espacio es plano; en efecto, en este caso existe un sistema coordenado x¯µ en el que el tensor m´etrico g¯µν es independiente de todas las coordenadas; este tensor m´etrico es constante ⇒ su tensor de Riemann es cero ⇒ el espacio es plano. Ejemplo: Averiguar las ecuaciones algebraicas de las geod´esicas de la siguiente geometr´ıa: ds2 = a2 dθ2 + a2 sen2 θ dϕ2 . La constante del movimiento: Para la geometr´ıa dada el intervalo es positivo y podemos simplemente escoger el par´ametro af´ın λ igual a s. Es decir, ² = 1. La m´etrica, dada en la ecuaci´on (9.93), es claramente independiente de dϕ la variable ϕ. Entonces, de acuerdo con (10.15), la cantidad gϕϕ = gϕϕ ϕ˙ dλ 2 2 = a ϕ˙ sen θ es constante del movimiento. Introducimos una constante κ: 263

a ϕ˙ sen2 θ =

1 √ , κ

de donde:

(a ϕ) ˙ −2 = κ sen4 θ

(10.25)

La ecuaci´ on del intervalo: Como ² = 1, la ecuaci´on (10.13) es a2 a2

³ dθ ´2 dλ ³ dθ ´2 dλ

+ a2 sen2 θ

³ dϕ ´2 dλ

= 1

+ a2 sen2 θ ϕ˙ 2 = 1

(10.26)

Truco: dθ dϕ dθ dθ = = ϕ˙ dλ dϕ dλ dϕ

(10.27)

Entonces (10.26) queda as´ı: a2

³ dθ ´2

µ

dϕ dθ dϕ

¶2

ϕ˙ 2 + a2 sen2 θ ϕ˙ 2 = 1 ,

de donde:

+ sen2 θ = (a ϕ) ˙ −2

(10.28)

Desenlace: Al colocar la ecuaci´on (10.25) en (10.28) obtenemos: dθ dϕ

= ± sen θ

Z ±

Z dϕ =

p

κ sen2 θ − 1 .

Integrar:

dθ √ sen θ κ sen2 θ − 1

Las tablas de integrales [14] traen esta integral para κ > 1: cos θ tan(ϕ + ϕ0 ) = ∓ √ κ sen2 θ − 1 No es dif´ıcil convertir esta f´ormula en algo m´as manejable. Para tal efecto 264

dibujemos esta f´ormula en un tri´angulo rect´angulo, de tal manera que uno de los ´angulos agudos sea ϕ + ϕ√0 , el cateto opuesto cos θ, el cateto adyacente √ κ sen2 θ − 1 y la hipotenusa κ − 1 sen θ. De ese dibujo leemos el seno del ´angulo ϕ + ϕ0 : cos θ sen(ϕ + ϕ0 ) = √ κ − 1 sen θ y expandimos sen(ϕ + ϕ0 ) = sen ϕ0 cos ϕ + cos ϕ0 sen ϕ: cos θ sen ϕ0 cos ϕ + cos ϕ0 sen ϕ = √ κ − 1 sen θ 1 sen ϕ0 (a sen θ cos ϕ) + cos ϕ0 (a sen θ sen ϕ) = √ (a cos θ) κ−1 Hasta el momento las coordenadas (θ, ϕ) son signos abstractos, carentes de significado. Sin embargo, si pensamos que ellas son coordenadas esf´ericas, entonces las tres expresiones entre par´entesis en la u ´ltima ecuaci´on representan las coordenadas cartesianas X, Y y Z de los puntos que pertenecen a una superficie esf´erica de radio a: 1 Z sen ϕ0 X + cos ϕ0 Y = √ κ−1 Esta ecuaci´on es de la forma AX + B Y + C Z = 0

Aqu´ı reconocemos claramente la ecuaci´on de un plano que pasa por el centro de la esfera, es decir, X, Y y Z son las coordenadas de los puntos que pertenecen a ese plano; pero como esos puntos tambi´en pertenecen a la superficie esf´erica, ellos configuran la intersecci´ on entre el plano y la superficie esf´erica. Ahora, esa intersecci´on es un c´ırculo m´aximo. Conclusi´on: a trav´es de dos puntos cualesquiera de la esfera pasa un c´ırculo m´aximo; este c´ırculo tiene dos arcos, que son las geod´esicas. 265

El problema inverso. Consideremos el siguiente problema para un esdy pacio bidimensional en coordenadas (x, y): dada la pendiente p(x) = dx de una geod´esica, averiguar una m´etrica. Para resolver este problema basta seguir de atr´as hacia adelante alguno de los dos ejemplos reci´en vistos. No es dif´ıcil verificar que una soluci´on es: ³ ´ ds2 = a f 2 (x) − f (x) p2 (x) (dx)2 + f (x) (dy)2 , es decir:

 ³  gµν = 

´ a f 2 (x) − f (x) p2 (x) 0

(10.29)

 0

 

(10.30)

f (x)

Aqu´ı, a es una constante y f (x) es cualquier funci´on de x. No aspiramos a encontrar la f´ormula general de la m´etrica que corresponde a la pendiente p(x) dada. La propuesta (10.30) es particular: una m´etrica diagonal e independiente de la coordenada y. En esta m´etrica, a−1/2 es la constante del movimiento asociada a la coordenada y. Para probar que (10.30) verdaderamente soluciona el problema, encontremos las geod´esicas de (10.30): Reescribir la ecuaci´ on (10.29): Combinando las ecuaciones (10.13) y (10.29) escribimos ³

2

´

µ 2

a f (x) − f (x) p (x)

dx dλ

¶2

µ + f (x)

dy dλ

¶2 = ²

(10.31)

La constante del movimiento: La m´etrica (10.30) es claramente independidy ente de la variable y, entonces, de acuerdo con (10.15), la cantidad gyy dλ = gyy y˙ = f (x) y˙ es constante del movimiento. Introducimos una constante a: f (x) y˙ =

p ²/a ,

de donde:

²(y) ˙ −2 = a f 2 La ecuaci´ on del intervalo: La ecuaci´on (10.31) es 266

(10.32)

µ ¶2 ³ ´ dx 2 2 a f (x) − f (x) p (x) + f (x) (y) ˙ 2=² dλ

(10.33)

Truco: dx dx dy dx = = y˙ dλ dy dλ dy Entonces la ecuaci´on (10.33) queda as´ı: ³

2

´

µ 2

a f − f p (x) ³

2

´

µ 2

a f − f p (x)

dx dy dx dy

¶2

y˙ 2 + f y˙ 2 = ² ,

¶2

de donde:

+ f = ²y˙ −2

Desenlace: En el lado derecho de la u ´ltima ecuaci´on usamos la ecuaci´on (10.32), para obtener: ³

2

´

µ 2

a f − f p (x) µ

dx dy

¶2

dx dy

¶2

+ f = af 2 ,

es decir:

a f2 − f ´ =³ , a f 2 − f p2 (x)

¶ 1 dx 2 , que es la hip´otesis inicial de este problema. = 2 o sea que dy p (x) Concluimos entonces que la m´etrica de la f´ormula (10.29) es verdaderamente una soluci´on. µ

10.5

Derivada a lo largo de una curva

Apunt´abamos en la p´agina 213 que el diferencial d no es una operaci´on covariante. Ha llegado el momento de definir otra operaci´on, que denotaremos con la letra may´ uscula D, que s´ı es covariante. Consideremos una curva cualquiera, no necesariamente geod´esica, cuyos puntos est´an caracterizados por medio del par´ametro escalar Λ (no hemos querido llamarlo λ, porque el s´ımbolo λ lo reservamos exclusivamente para denotar el par´ametro af´ın de las geod´esicas). Supongamos que en la regi´on del espacio donde ella est´a, 267

tambi´en hay un campo vectorial Aµ . Un concepto importante es la rata de cambio del campo a medida que se recorren los diferentes puntos de la curva. Queremos asignarle a este concepto una cantidad matem´atica, y como estamos en el contexto de las transformaciones de coordenadas, deseamos que tal cantidad sea un tensor bajo el grupo de las transformaciones generalizadas de coordenadas. Nuestro primer intento ser´ıa proponer dAµ /dΛ, pero esta cantidad no es un tensor. Motivados por dAµ /dΛ, pasamos a definir un tensor que se llama la derivada a lo largo de una curva: DAµ dxν = Aµ ; ν DΛ dΛ

(10.34)

N´otese que este es verdaderamente un tensor (un vector), porque es producto de los tensores Aµ ; ν , dxν y dΛ . Ahora, Aµ ; ν = Aµ , ν + Γµ αν Aα , entonces DAµ DΛ

=

ν ∂Aµ dxν µ α dx + Γ A αν ∂xν dΛ dΛ

=

dxν dAµ + Γµ αν Aα dΛ dΛ

(10.35)

En las ecuaciones (10.34) y (10.35), y en lo que sigue, se entiende que xν son las coordenadas de un punto gen´erico de la curva. Al vector (10.35) se le puede tomar de nuevo la derivada a lo largo de la curva: µ ¶ D2 Aµ D DAµ = DΛ2 DΛ DΛ µ ¶ µ ¶ d DAµ DAσ dxρ = + Γµ σρ dΛ DΛ DΛ dΛ Coloquemos (10.35) en la u ´ltima ecuaci´on: D2 Aµ DΛ2

=

2 β d2 Aµ d Γµ αβ α dxβ dAα dxβ µ µ α d x + A + Γ + Γ A αβ αβ dΛ2 dΛ dΛ dΛ dΛ dΛ2

+ Γµ σρ

dxβ dxρ dAσ dxρ + Γµ σρ Γσ αβ Aα dΛ dΛ dΛ dΛ 268

=

ν β d2 Aµ dAα dxβ µ α dx dx µ + Γ A + 2Γ αβ , ν αβ dΛ2 dΛ dΛ dΛ dΛ

+ Γµ αβ Aα

β ρ d2 xβ µ σ α dx dx + Γ Γ A σρ αβ dΛ2 dΛ dΛ

Esta expresi´on vale para cualquier curva. Ahora pensemos que la curva es una geod´esica. Escojamos que Λ sea el par´ametro af´ın λ: ν β D2 Aµ d2 Aµ dAα dxβ µ α dx dx µ = + Γ A + 2Γ αβ , ν αβ Dλ2 dλ2 dλ dλ dλ dλ β ρ d2 xβ µ σ α dx dx + Γ Γ A + Γµ αβ Aα σρ αβ dλ2 dλ dλ

(10.36)

Como es una geod´esica, se cumple la ecuaci´on (10.8): d2 xβ dxκ dxλ β = −Γ κλ dλ2 dλ dλ y usamos esto en el pen´ ultimo t´ermino de la ecuaci´on (10.36): β ν dAα dxβ D2 Aµ d2 Aµ µ µ α dx dx + 2Γ = + Γ A αβ αβ , ν Dλ2 dλ2 dλ dλ dλ dλ

(10.37)

dxβ dxρ dxκ dxλ + Γµ σρ Γσ αβ Aα − Γµ αβ Γβ κλ Aα dλ dλ dλ dλ

10.6

Rαβµν y la curvatura

En esta secci´on veremos por qu´e Rαβµν se llama el tensor de curvatura. Comenzaremos estudiando la rata a la que se separan o acercan dos geod´esicas y de all´ı extraeremos el verdadero significado de la curvatura de un espacio. Se har´a evidente que Rαβµν es el que indica si el espacio es plano o curvo. Desviaci´ on geod´ esica. La noci´on de curvatura se capta f´acilmente al analizar lo que ocurre con dos geod´esicas. Es razonable suponer que en un espacio plano las dos curvas se separan (o se acercan) a ritmo constante. 269

Pero en un espacio curvo el ritmo de separaci´on (o de acercamiento) no es constante. Para determinar si un espacio es curvo en una regi´on, uno puede estudiar dos geod´esicas y determinar si se juntan (o se separan) “aceleradamente”. Pensemos en dos geod´esicas, llamando xµ a los puntos de una de ellas y X µ a los puntos de la otra. Para ambas geod´esicas usamos el mismo par´ametro λ, de modo que las xµ son funciones de λ, as´ı: xµ = xµ (λ), y tambi´en X µ = X µ (λ). A continuaci´ on definimos las funciones ξ µ (λ) de la manera siguiente: ξ µ (λ) = X µ (λ) − xµ (λ)

(10.38)

Usemos la f´ormula (10.8) para escribir las ecuaciones de las dos geod´esicas: d2 xµ dλ2

+ Γµ αβ (x)

dxα dxβ = 0 dλ dλ

d2 X µ dλ2

+ Γµ αβ (X)

(10.39)

dX α dX β = 0 dλ dλ

(10.40)

Ponemos (10.38) en (10.40): d2 xµ d2 ξ µ + + Γµ αβ (x + ξ) dλ2 dλ2

µ

dxα dξ α + dλ dλ

¶µ

dxβ dξ β + dλ dλ

¶ = 0

(10.41)

La cantidad Γµ αβ (x + ξ) se expande en serie de Taylor: Γµ αβ (x + ξ) = Γµ αβ (x) +

∂ µ Γ αβ (x)ξ σ + · · · ∂xσ

Ahora suponemos que las dos geod´esicas son muy cercanas, de modo que en la serie de Taylor tomamos u ´nicamente los dos primeros t´erminos: Γµ αβ (x + ξ) ' Γµ αβ (x) + Γµ αβ , σ (x)ξ σ Colocamos esto en (10.41) y expandimos conservando t´erminos hasta primer orden en ξ: 270

α β d2 xµ d2 ξ µ dxα dxβ µ µ σ dx dx + + Γ + Γ ξ αβ αβ , σ dλ2 dλ2 dλ dλ dλ dλ µ

+ 2Γ

αβ

dξ α dxβ = 0 dλ dλ

(10.42)

Ahora restamos, lado a lado, la ecuaci´on (10.42) menos la ecuaci´on (10.39): α β d2 ξ µ dξ α dxβ µ σ dx dx µ = − Γ ξ − 2 Γ αβ , σ αβ dλ2 dλ dλ dλ dλ

(10.43)

D2 ξ µ . Para esto colocamos (10.43) en (10.37), tras lo Queremos calcular Dλ2 cual se obtiene: α β D2 ξ µ µ µ ω µ ω µ σ dx dx = −(Γ − Γ + Γ Γ − Γ Γ ) ξ ωσ ωα βα , σ βσ , α βα βσ Dλ2 dλ dλ

En la expresi´on dentro del par´entesis reconocemos la definici´on (9.77) del tensor de Riemann: D2 ξ µ Dλ2

D2 ξ µ Dλ2

= −Rµ βασ ξ σ

dxβ dxα ; dλ dλ

= Rµ βσα ξ σ

dxβ dxα dλ dλ

= Rµ ασβ ξ σ

dxα dxβ dλ dλ

usar (9.84):

(10.44)

Anotamos arriba que la curvatura de un espacio se manifiesta en la “acelD2 ξ µ eraci´on” a la que se separan (o se acercan) dos geod´esicas. La ecuaci´on Dλ2 (10.44) dice claramente que la curvatura (la “aceleraci´on”) es una funci´on del tensor de Riemann Rµ ασβ . En aquellos lugares donde Rµ ασβ = 0 el espacio es plano, y en los lugares donde Rµ ασβ 6= 0 el espacio es curvo. Por esta raz´on Rµ ασβ se llama el tensor de curvatura.

271

272

Cap´ıtulo 11

El principio de equivalencia

La idea central de la teor´ıa de la gravitaci´ on de Einstein es la siguiente: la gravitaci´on afecta al tensor m´etrico gµν . El intervalo entre dos eventos cercanos, dado por ds2 = gµν dxµ dxν , depende del tensor m´etrico, y como ´este depende del campo gravitacional, podemos afirmar que las distancias ds2 dependen del campo gravitatorio. En otras palabras, la presencia del campo afecta las distancias entre los eventos. Para captar esta idea pensemos en el espacio que ocupa el sistema solar. El campo gravitatorio en cada punto de ese espacio, y en cada instante, est´a determinado por las trayectorias del Sol, los planetas y todos los otros objetos del sistema solar. Este campo gravitacional tiene una magnitud que depende de la constante G de la gravitaci´ on universal. Imaginemos ahora un proceso matem´atico (no f´ısico) que consiste en “prender” o “apagar” la gravitaci´on. Apagarla es anular paulatinamente la constante G → 0, y prenderla es el proceso opuesto. A medida que el campo se va apagando, gµν se modifica gradualmente y, cuando G llega al valor 0, el tensor gµν llega al valor que tiene en el espaciotiempo plano de la relatividad especial. Despu´es de apagar la gravitaci´on comencemos a prenderla de nuevo: a medida que G crece el campo se instala en el espaciotiempo, y eso se manifiesta como una modificaci´on paulatina de los gµν . No olvidemos que el intervalo entre dos eventos, dado por ds2 = gµν dxµ dxν , depende expl´ıcitamente de gµν , y en consecuencia ds2 va variando a medida que G se prende o se apaga. Este ejemplo imaginario aclara la idea importante que queremos establecer: el campo gravitatorio afecta los intervalos ds2 , es decir, la gravitaci´ on se manifiesta como un hecho geom´etrico. Una vez captada la idea central, se plantean los dos problemas b´asicos de la relatividad general: de qu´e manera la gravitaci´ on afecta las ecuaciones que 273

expresan las leyes fundamentales de la f´ısica y, de otro lado, de qu´e manera los astros, las nubes de galaxias, la energ´ıa en general, determinan al tensor m´etrico. En este cap´ıtulo atacamos el primer problema y reservamos el segundo problema para el pr´oximo cap´ıtulo.

11.1

El postulado de las geod´ esicas

La gravitaci´on influye sobre la geometr´ıa del espaciotiempo, y esta geometr´ıa influye en los fen´omenos f´ısicos. En otras palabras, la gravitaci´ on influye en los fen´omenos a trav´es de la geometr´ıa del espaciotiempo. La gravitaci´ on se manifiesta en los fen´omenos de una manera indirecta: lo que ella hace es alterar las propiedades geom´etricas del espacio y el tiempo, y estas alteraciones afectan el desarrollo de los fen´omenos. Se dice que una part´ıcula est´a en ca´ıda libre cuando est´a sometida u ´nicamente a la interacci´on gravitatoria. ¿De qu´e manera el campo gravitatorio afecta la trayectoria de una part´ıcula en ca´ıda libre? La respuesta de esta pregunta se encuentra en el Postulado de las Geod´esicas, seg´ un el cual las part´ıculas en ca´ıda libre siguen l´ıneas geod´esicas en el espaciotiempo. En la din´amica newtoniana el campo gravitacional afecta la trayectoria de la part´ıcula, y esta influencia se describe mediante la ecuaci´on a = F/m; eso lo conocemos muy bien: la fuerza gravitacional produce una aceleraci´on en la part´ıcula. Pero la din´amica einsteiniana no utiliza el concepto de fuerza: el campo gravitatorio afecta al s´ımbolo de Christoffel Γµ αβ y ´este1 a su vez influye en la ecuaci´on de las geod´esicas. En vez del concepto newtoniano de fuerza gravitacional, la teor´ıa de Einstein propone que la influencia gravitatoria se expresa geom´etricamente: eso es “geometrizar” la fuerza gravitacional. Una vez que se acepta el postulado de las geod´esicas, hay serias razones para pensar que el espaciotiempo es probablemente curvo, y que la gravitaci´on es la causa de la curvatura. Supongamos que una part´ıcula se suelta desde el piso 14 de un edificio, y que en el mismo instante se suelta otra desde el piso 15. Llamemos r1 y r2 a las posiciones de las part´ıculas en cualquier instante t. Si suponemos que no hay atm´osfera, debemos admitir que est´an 1

Tomemos por ejemplo el s´ımbolo Γr θθ en coordenadas (ct, r, θ, ϕ). En el espaciotiempo vac´ıo, plano, de la relatividad especial, se tiene Γr θθ = −r. Sin embargo, si hay una masa M en el origen de coordenadas, se tiene Γr θθ = −r + 2GM/c2 . V´ease la secci´ on 13.2.

274

en ca´ıda libre. Las aceleraciones de las dos part´ıculas se pueden averiguar usando la f´ısica newtoniana, y est´an dadas por GM/r12 y GM/r22 , o sea que la aceleraci´on de una respecto a la otra es GM (1/r12 − 1/r22 ) 6= 0: La aceleraci´on relativa entre las part´ıculas en ca´ıda libre no es cero. Entonces, de acuerdo con el postulado de las geod´esicas, la aceleraci´on relativa entre las geod´esicas no es cero: he aqu´ı la desviaci´on geod´esica que estudiamos en la secci´on 10.6. Vimos en esa secci´on que la desviaci´on geod´esica es el indicador de curvatura, lo que nos lleva a la conclusi´on final: las dos part´ıculas se mueven en un espaciotiempo curvo. Lo m´as razonable es pensar que la Tierra ocasiona esa curvatura. Cualquier proyecto te´orico que adopte el postulado geod´esico se compromete con la posibilidad de que el espaciotiempo sea curvo, y que esta curvatura se debe al campo gravitacional.

11.2

El principio de Galileo

Hemos dicho que un cuerpo est´a en ca´ıda libre cuando sobre ´el act´ ua u ´nicamente la fuerza gravitacional. Los planetas, por ejemplo, est´an en ca´ıda libre; as´ı mismo, si la atm´osfera no existiera, un cuerpo que se soltara desde lo alto de un edificio caer´ıa libremente. Modernamente entendemos estos fen´omenos a la luz del principio de Galileo, que afirma que todos los cuerpos en ca´ıda libre caen de igual manera. En la mec´anica newtoniana el principio de Galileo se organiza al combinar la segunda ley de Newton y la ley de la gravitaci´on universal, que escribimos a continuaci´ on en la forma tradicional: F = Gmg Mg /r2

F = mi a,

(11.1)

Es importante advertir que la masa inercial mi es la que aparece en la segunda ley de Newton, mientras la masa gravitacional mg figura en la fuerza gravitacional. Para la ca´ıda libre igualamos las dos ecuaciones (11.1), obteniendo: a=

mg GMg mi r2

(11.2)

El principio de la ca´ıda de los cuerpos afirma que, para Mg y r dados, la aceleraci´on a es la misma para todos los cuerpos; en vista de la ecuaci´on (11.2) podemos afirmar entonces que el cociente mg G/mi es igual para todos los cuerpos. La constante gravitacional G se define de manera que mg y mi sean num´ericamente iguales: 275

mi = mg De muchas maneras se puede someter el enunciado mi = mg a la prueba experimental. La m´as inmediata es dejar caer objetos de diferentes substancias para ver si en todos los casos se obtiene mi =pmg . Otra forma es con p p´endulos simples; como el per´ıodo es mi /mg 2π L/g, se pueden hacer pruebas con diferentes materiales (aluminio, vidrio, madera, hielo, etc) para ver si mi = mg en todos los casos. Con experimentos en los que intervienen fuerzas ficticias tambi´en se puede cuestionar si mi es verdaderamente igual a mg para objetos de diferente composici´on qu´ımica. Esto fue lo que hizo E¨otv¨os a fines del siglo XIX, obteniendo |mg /mi −1| < 10−9 , y experimentos m´as recientes llegan a |mg /mi − 1| < 10−11 . Conviene recalcar que cuando se determina que mi = mg para un objeto dado no se logra gran cosa ya que, como hemos anotado, el valor de la constante gravitacional G se ajusta precisamente para que eso ocurra. Lo importante es que mi = mg resulte v´alido para todo objeto, cualquiera que sea su composici´on qu´ımica. Pensemos en un conjunto C de part´ıculas en ca´ıda libre que coinciden en alg´ un evento E, y supongamos adicionalmente que entre ellas no hay interacci´on ni choques. De acuerdo con el principio de Galileo, en el evento E todas las part´ıculas de C tienen la misma aceleraci´on y en consecuencia la aceleraci´on relativa entre cualesquiera dos part´ıculas de C es cero. M´as a´ un, si un observador registra que todas las part´ıculas de C tienen aceleraci´ on cero respecto a ´el, entonces ese observador tambi´en est´ a en ca´ıda libre en E.

11.3

Coordenadas geod´ esicas

El proceso de dos transformaciones sucesivas que vimos en la secci´on 9.20 tiene un caso especial, y es cuando se desea que el tensor m´etrico final, evaluado en E , sea el de Minkowski ηµν : Corolario: Es posible [13] erigir unas coordenadas tales que en un evento E: a) la m´etrica sea ηαβ , y b) todos los s´ımbolos de Christoffel sean cero. El sistema coordenado en el que se satisfacen las condiciones de este corolario se llama coordenadas geod´esicas. Estas coordenadas son expresamente construidas para el evento E . Por supuesto que las coordenadas geod´esicas abarcan todo el espaciotiempo, pero son construidas deliberadamente para que en el evento E la m´etrica tome el valor ηµν y los s´ımbolos de Christoffel 276

se vuelvan cero. El tensor m´etrico, en cualquier evento del espaciotiempo, ser´a una matriz 4 × 4 complicada, pero esta matriz se vuelve ηµν en el evento E; as´ı mismo, los s´ımbolos de Christoffel, en otros eventos, no son en general cero, pero se vuelven cero en el evento E. En todo el espaciotiempo el sistema coordenado geod´esico es, en general, curvil´ıneo y no ortogonal; pero en E ocurre algo [15] especial: las coordenadas geod´esicas se cruzan ortogonalmente, formando un sistema de ejes cartesianos. El corolario pone de manifiesto que la m´etrica gµν tiene cierto grado de arbitrariedad. No es muy importante el valor que adopta gµν en un evento dado (valor que podemos hacer igual a ηµν con una simple transformaci´on de coordenadas). Tampoco son muy importantes sus primeras derivadas gµν ,α (que se pueden anular en cualquier punto con una transformaci´on de coordenadas, como vimos al final de la secci´on 9.16). Lo que s´ı es muy importante es el conjunto de las segundas derivadas gµν ,α,β , pues es en ellas donde radica la informaci´on acerca de la curvatura. En efecto, ya hemos visto que con las segundas derivadas de la m´etrica se construye el tensor de Riemann, que es el que representa a la curvatura. Decimos entonces, en paralelo con nuestros comentarios en la p´agina 235, que en un espacio curvo es imposible [16], con un cambio de coordenadas, volver cero todas las segundas derivadas de la m´etrica. Cuando un espacio es curvo, no existe ning´ un sistema coordenado en el que todas las segundas derivadas sean cero. Y si es plano, existen sistemas coordenados en los que todas las segundas derivadas de la m´etrica son cero.

11.4

El principio de equivalencia

Ahora procedemos a combinar las ideas principales de las tres u ´ltimas secciones. Una part´ıcula en ca´ıda libre cumple la ecuaci´on diferencial de las geod´esicas (10.11). Esta ecuaci´on es v´alida en todos los sistemas coordenados, y ahora nos conviene escribirla utilizando coordenadas geod´esicas: d2 x ¯α xµ d¯ xν ¯ α d¯ = 0 + Γ µν dτ 2 dτ dτ Supongamos que esta part´ıcula pasa por el evento E. Esto significa que podemos evaluar en E todos los t´erminos de la u ´ltima ecuaci´on, obteniendo ¯ ¯ d¯ xµ d¯ d2 x ¯ α ¯¯ xν ¯¯ α ¯ + Γ µν (E) = 0 dτ 2 ¯E dτ dτ ¯E 277

¯ α (E) = 0, entonces Pero Γ µν ¯ d2 x ¯ α ¯¯ = 0 dτ 2 ¯E

(11.3)

No olvidemos, tal como vimos en la secci´on 11.3, que en E las coordenadas geod´esicas se cruzan ortogonalmente formando un sistema de ejes cartesianos. Esto indica claramente que (11.3) es la ecuaci´on m´as conocida de la f´ısica elemental: (11.3) es la ecuaci´on de la trayectoria de una part´ıcula en equilibrio. Vemos as´ı que para un observador que erija un sistema de coordenadas geod´esicas centradas en E, las part´ıculas en ca´ıda libre que pasan por E tienen, respecto a ese sistema de referencia, aceleraci´on cero. Entonces, invocando la frase escrita en bastardilla en la p´agina 276, podemos afirmar que ese observador tambi´en est´a en ca´ıda libre. Dig´amoslo as´ı: un observador en ca´ıda libre en E registra que las part´ıculas en ca´ıda libre que pasan por E tienen, respecto a ese observador, aceleraci´on cero. Hay dos situaciones diferentes: 1) De un lado, la part´ıcula libre en la relatividad especial, estudiada en coordenadas cartesianas. 2) De otro lado, la part´ıcula en ca´ıda libre estudiada por un observador en ca´ıda libre que usa coordenadas geod´esicas. Al primer problema le corresponde la ecuaci´on (6.35) y al segundo la ecuaci´on (11.3). La misma ecuaci´on se aplica a dos situaciones diferentes. Uno podr´ıa pensar que las dos situaciones, aunque diferentes, son, de alguna manera, equivalentes. En conclusi´on, un observador en ca´ıda libre en E que use coordenadas geod´esicas, registra que las part´ıculas en ca´ıda libre que pasan por E cumplen la misma ecuaci´ on que satisfac´ıan las part´ıculas libres en ausencia de gravitaci´ on, en la relatividad especial, en coordenadas cartesianas. Pero la ecuaci´on de part´ıcula libre no es la u ´nica ecuaci´on diferencial importante en la f´ısica. Tambi´en hay otras ecuaciones diferenciales importantes, como por ejemplo (6.31), (6.32) y (7.32). En este punto hacemos una suposici´on crucial: asumir que la equivalencia reci´en mencionada se aplica, no s´olo a la ecuaci´on de part´ıcula libre, sino adem´as a todas las ecuaciones tensoriales que expresan leyes f´ısicas en la relatividad especial en coordenadas cartesianas: para un observador en ca´ıda libre en E que use coordenadas geod´esicas, las ecuaciones que expresan las leyes de la f´ısica son las mismas que se cumpl´ıan en ausencia de gravitaci´ on, en la relatividad especial, en coordenadas cartesianas. Este es el Principio de Equivalencia. Con el prop´osito de dar un 278

ejemplo de la utilizaci´on de este Principio, tomemos las tres ecuaciones tensoriales mencionadas (6.31), (6.32) y (7.32); de acuerdo con el Principio de Equivalencia: ¯ ¯ F¯ µν,µ ¯

E

¯ 4π ¯ν ¯¯ = J ¯ c E

¢¯ ¡ F¯µν ,α + F¯αµ,ν + F¯να,µ ¯E = 0 ¯ ¯ T¯µν,ν ¯ = 0 E No olvidemos que en coordenadas geod´esicas, y en E, los s´ımbolos de Christoffel valen cero. Esto implica que en coordenadas geod´esicas, y en E, la operaci´on coma (,) coincide con la operaci´on punto y coma (;). O sea que en las tres u ´ltimas ecuaciones podemos escribir (;) en vez de (,): ¯ ¯ 4π ¯ν ¯¯ ¯ F ;µ ¯ = J ¯ c E E ¢¯ ¡ F¯µν ;α + F¯αµ;ν + F¯να;µ ¯E = 0 ¯ µν ¯ ¯ T ;ν ¯ = 0 ¯ µν

E

Estas ecuaciones tensoriales est´an escritas de manera manifiestamente covariante; por esta raz´on, como son v´alidas en coordenadas geod´esicas, tambi´en han de ser v´alidas en cualquier otro sistema de coordenadas: ¯ ¯ 4π ν ¯¯ F µν ;µ ¯E = J ¯ c E ¡ ¢¯ Fµν ;α + Fαµ;ν + Fνα;µ ¯E = 0 ¯ T µν ;ν ¯E = 0 Estas ecuaciones son v´alidas en el evento E. Pero, como E no es un evento especial, ecuaciones similares deben cumplirse en cualquier otro evento. En consecuencia, podemos eliminar el sub´ındice E: 279

F µν ;µ =

4π ν J c

Fµν ;α + Fαµ;ν + Fνα;µ = 0

(11.4)

T µν ;ν = 0

La regla (,) → (;) El paso de las ecuaciones (6.31)-(6.32)-(7.32) a las ecuaciones (11.4) se hace cambiando la derivada simple (,) por la derivada covariante (;). Esta regla, en general, dice que para escribir la ecuaci´on diferencial de un campo en presencia del campo gravitatorio se siguen dos pasos: el primero es escribir la ecuaci´on diferencial tal como se la conoce familiarmente en la relatividad especial, en coordenadas cartesianas; el segundo paso es cambiar (,) por (;). Esta f´ormula se conoce como la regla cambiar coma por punto y coma. La regla se expresa en palabras tan simples que uno corre el riesgo de creer, equivocadamente, que el paso de unas ecuaciones a las otras es simple. En realidad el paso dista de ser simple, como puede apreciarse en la siguiente observaci´ on: En las ecuaciones (6.31)-(6.32)-(7.32) las coordenadas son cartesianas, no hay campo gravitatorio y las cantidades xµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones de Lorentz. En cambio, en las ecuaciones (11.4) las coordenadas son generales, hay campo gravitatorio y las cantidades dxµ , F µν , J µ y T µν son tensores bajo el grupo de las transformaciones generales de coordenadas. Con esta observaci´on queremos resaltar que (,) → (;) es una regla estrictamente simb´olica, visual.

La ecuaci´ on T µν;ν = 0. Veamos en detalle los pasos que conducen de (7.32) a la u ´ltima de las ecuaciones (11.4). Ante todo, el tensor T µν de la ecuaci´on (7.32) representa todas las formas de energ´ıa-momentum (calor´ıfica, potencial, masas en reposo, etc.) excepto la energ´ıa-momentum del campo gravitatorio. Esto es claro, porque en la relatividad especial no hay campo gravitacional. Ahora, al usar la regla (,) → (;) se llega a la u ´ltima de las ecuaciones (11.4). En esta u ´ltima ecuaci´on T µν significa lo mismo que significaba en (7.32): todas las formas de energ´ıa-momentum, excepto la energ´ıa-momentum del campo gravitatorio. Consignemos esta idea en una frase corta que ser´a importante en la construcci´on de la ecuaci´on del campo gravitatorio en el cap´ıtulo 12: si T µν es el tensor que recoge todas las formas de energ´ıa-momentum que no son gravitatorias, este tensor cumple la ecuaci´ on T µν;ν = 0 en presencia de un campo gravitacional. 280

11.5

El acople m´ınimo

Vamos a ver el principio de equivalencia desde otra perspectiva [11]. Para tal efecto nos planteamos el siguiente ejercicio interesante: tomar las ecuaciones de la relatividad especial escritas en coordenadas cartesianas y, para a˜ nadir los efectos de la gravitaci´on, sumarles a esas ecuaciones algunos otros t´erminos que contengan altas derivadas del tensor m´etrico. Tomemos por ejemplo la ecuaci´on (6.31) para sumarle t´erminos que contengan primeras, segundas, terceras,... derivadas de gµν : F µν ,µ =

4π ν J + [1g] + [2g] + [3g] + · · · c

El s´ımbolo [3g] quiere decir “t´erminos que contienen linealmente la tercera derivada del tensor m´etrico”. Ahora, los t´erminos [1g] son como el s´ımbolo de Christoffel, los t´erminos [2g] son como el tensor de Riemann, los [3g] son como la primera derivada del tensor de Riemann, etc.: F µν ,µ =

4π ν J + [Christ] + [Riem] + [1Riem] + [2Riem] + · · · c

Aqu´ı, [Christ] representa a los t´erminos que contienen al s´ımbolo de Christoffel, [2Riem] representa a los t´erminos que contienen segundas derivadas del tensor de Riemann, etc. Algunos t´erminos de la forma [Riem] podr´ıan ser Rν αβρ F αβ Aρ , Rνβ βα F αρ Aρ , Rαβ F αβ Aν , RF να Aα , etc. Algunos t´erminos de la forma [1Riem] podr´ıan ser R;δ F να Fα δ , Rαβ ;δ Aα Aβ Aδ Aν , etc. El principio de equivalencia afirma que, al incluir los efectos de la gravitaci´ on, los t´erminos [Riem], [1Riem], [2Riem] · ·· no aparecen; dicho de otra manera, que esos t´erminos aparecen multiplicados por unos coeficientes que son cero. Los t´erminos [1Riem], por ejemplo, aparecen del modo 0[1Riem] ; el factor [1Riem] expresa la posibilidad, la legitimidad matem´atica de que la gravitaci´on se acople a los fen´omenos f´ısicos a trav´es de la primera derivada del tensor de Riemann; pero el coeficiente 0 que lo acompa˜ na dice que tal posibilidad, estrictamente matem´atica, no se realiza en el mundo f´ısico. Algunas leyes f´ısicas se expresan mediante ecuaciones diferenciales. El campo gravitatorio no entra en esas ecuaciones diferenciales a trav´es del tensor de Riemann ni a trav´es de ninguna de las derivadas de Rν αβρ . El acople gravitatorio se realiza u ´nicamente a trav´es del s´ımbolo de Christoffel, es decir, 281

a trav´es de la operaci´on punto y coma (;). A esto se le dice el acople m´ınimo: s´olamente a trav´es de los s´ımbolos de Christoffel el campo gravitatorio influye en las ecuaciones tensoriales que expresan a las leyes f´ısicas.

11.6

Ejemplos

Queremos mostrar en ejemplos concretos la manera como aparecen los s´ımbolos de Christoffel cuando se trata de incluir la influencia del campo gravitatorio. Para tal efecto, en las ecuaciones de Maxwell y las leyes de conservaci´ on (6.31)-(6.32)-(7.13)-(7.32) cambiamos coma por punto y coma: F µν ;µ =

4π ν J c

(11.5)

Fµν ;α + Fαµ;ν + Fνα;µ = 0

(11.6)

J µ ;µ = 0

(11.7)

T µν ;µ = 0

(11.8)

Estudiemos primero las dos ecuaciones inhomog´eneas de Maxwell. Utilizando (9.73) en (11.5) se llega a: F µν ,µ + Γµ αµ F αν + Γν µα F µα =

4π ν J c

(11.9)

Ahora, Γν µα es sim´etrico bajo el intercambio µ ­ α, mientras que F µα es antisim´etrico; entonces, de acuerdo con (5.38), el t´ermino Γν µα F µα es cero y la ecuaci´on (11.9) queda as´ı: F µν ,µ + Γµ αµ F αν =

4π ν J c

Utilizando (9.74) en (11.6) se llega a: Fµν ,α − Γρ να Fµρ − Γρ µα Fρν + Fαµ,ν − Γρ αν Fρµ − Γρ µν Fαρ + Fνα,µ − Γρ νµ Fρα − Γρ αµ Fνρ = 0 282

Esta ecuaci´on se puede reescribir as´ı: Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν + Γρ αµ Fνρ ) − (Γρ να Fµρ + Γρ αν Fρµ ) − (Γρ µν Fαρ + Γρ νµ Fρα ) = 0 , es decir: Fµν ,α + Fαµ,ν + Fνα,µ − (Γρ µα Fρν − Γρ µα Fρν ) − (Γρ να Fµρ − Γρ να Fµρ ) − (Γρ µν Fαρ − Γρ µν Fαρ ) = 0 Obs´ervese que en esta ecuaci´on son cero las cantidades contenidas en los tres par´entesis, lo que nos permite escribir Fµν ,α + Fαµ,ν + Fνα,µ = 0. Hemos descubierto, curiosamente, que si en la ecuaci´on Fµν ;α + Fαµ;ν + Fνα;µ = 0 se cambia punto y coma por coma, lo que queda es tambi´en una ecuaci´on covariante: Fµν ;α + Fαµ;ν + Fνα;µ = 0 ⇔ Fµν ,α + Fαµ,ν + Fνα,µ = 0

(11.10)

En otras palabras: la ecuaci´on Fµν ;α + Fαµ;ν + Fνα;µ = 0 no contiene s´ımbolos de Christoffel. Ataquemos ahora la tercera ecuaci´on (11.7) con ayuda de (9.71); se obtiene J µ ,µ + Γµ αµ J α = 0. Finalmente desarrollemos la ecuaci´on (11.8); utilizamos la f´ormula (9.73) y llegamos a T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0. En resumen as´ı son las leyes de conservaci´ on y las ecuaciones de Maxwell en presencia de un campo gravitatorio: J µ ,µ + Γµ αµ J α = 0

(11.11)

T µν,µ + Γµ αµ T αν + Γν αµ T µα = 0

(11.12)

4π ν J c

(11.13)

Fµν ,α + Fαµ,ν + Fνα,µ = 0

(11.14)

F µν ,µ + Γµ αµ F αν =

283

Schwarzschild. Estas cuatro ecuaciones son v´alidas en general, cualquiera que sea el campo gravitacional. Conviene desarrollarlas en detalle para un caso particular. Hay un campo gravitacional muy conocido, que es el causado por una masa puntual M que no tiene carga el´ectrica ni momentum angular. Este se conoce como la soluci´on de Schwarzschild, y lo estudiaremos en el cap´ıtulo 13. Los s´ımbolos de Christoffel de ese campo gravitacional (secci´on 13.2) son: Γ0 01 = Γ0 10 =

s 2r(r − s)

s(r − s) 2r3 = −r + s

s 2r(r − s) = −(r − s) sen2 θ

Γ1 00 =

Γ1 11 = −

Γ1 22

Γ1 33

Γ2 33 = − sen θ cos θ Γ3 13 = Γ3 31 =

Γ2 12 = Γ2 21 =

1 r

1 r

Γ3 23 = Γ3 32 = cot θ

En estas expresiones, s = 2GM/c2 es una medida de la masa M , aunque tiene unidades de longitud. Vemos aqu´ı, de manera patente, que el campo gravitacional afecta a los s´ımbolos de Christoffel. Cuando s = 0 se tiene M = 0, el campo gravitacional se anula y el espaciotiempo se aplana; en tal caso estos s´ımbolos regresan a la forma que ten´ıan en el espaciotiempo plano en coordenadas esf´ericas. No olvidemos que estamos con coordenadas esf´ericas, o sea que, por ejemplo, T 12 significa T rθ , etc. Las leyes de conservaci´ on. Utilizando los s´ımbolos de Christoffel reci´en escritos, las ecuaciones de conservaci´ on (11.11) y (11.12) quedan as´ı: 2 r J + J θ cot θ = 0 r 2 s 1 T µt,µ + T tr + T tθ cot θ = − 2 T tr r 2r 1 − s/r J µ ,µ +

2 rr T + T rθ cot θ − r T θθ − rT ϕϕ sen2 θ r ´ 1 s ³ T rr − sT θθ − sT ϕϕ sen2 θ = − 2 (1 − s/r) T tt − 2r 1 − s/r

T µr,µ +

284

4 rθ T + T θθ cot θ − T ϕϕ sen θ cos θ = 0 r 4 T µϕ,µ + T rϕ + 3T θϕ cot θ = 0 r

T µθ,µ +

Estas cinco ecuaciones est´an escritas de modo sugestivo. Toda dependencia con s aparece en los lados derechos. Este ejemplo muestra claramente que el campo gravitatorio influye en algunas de las ecuaciones diferenciales que expresan a las leyes de conservaci´ on. Si M = 0 se tiene s = 0, el campo gravitacional se anula, los lados derechos de estas ecuaciones se vuelven cero y las ecuaciones regresan a la forma que ten´ıan en el espaciotiempo plano. Las ecuaciones de Maxwell. Acabamos de comentar que la presencia del campo gravitatorio no influye en las dos ecuaciones homog´eneas de Maxwell, debido a que en la ecuaci´on (11.14) no hay s´ımbolos de Christoffel. Veamos ahora las dos ecuaciones inhomog´eneas de Maxwell, contenidas en (11.13). En esta ecuaci´on s´ı hay s´ımbolos de Christoffel y es posible, en principio, que a trav´es de ellos el campo gravitatorio manifieste su presencia. En el caso particular de Schwarzschild, utilizamos los s´ımbolos de Christoffel que escribimos en la p´agina 284. Colocando estos s´ımbolos en las ecuaciones (11.13) se llega, al final, a un resultado curioso: la variable s desaparece. O sea que el campo gravitatorio de Schwarzschild tampoco se manifiesta en las dos ecuaciones inhomog´eneas de Maxwell. En conclusi´on, en el espaciotiempo de Schwarzschild el campo gravitatorio no se manifiesta en ninguna de las ecuaciones de Maxwell.

285

286

Cap´ıtulo 12

La ecuaci´ on del campo gravitatorio La ecuaci´on de Poisson: ∇2 Φ = 4πGρ

(12.1)

es la f´ormula maestra de la gravitaci´ on newtoniana. En el lado izquierdo aparecen las segundas derivadas del campo gravitatorio Φ, y al lado derecho aparece la densidad de masa ρ, que es la fuente, la causa del campo. Si las cantidades que intervienen en esta f´ormula fueran tensores bajo el grupo de las transformaciones generales de coordenadas, tendr´ıamos una ecuaci´on tensorial, y nos sentir´ıamos satisfechos. Pero ni ∇2 , ni Φ ni ρ son tensores, y por eso la f´ormula es insatisfactoria. Queremos construir una ecuaci´on tensorial que sea una generalizaci´on de (12.1). M´as precisamente, una nueva f´ormula en la que todas las cantidades sean tensores y que contenga, como caso particular, a la ecuaci´on (12.1). Se espera que la nueva f´ormula sea la expresi´on de una nueva teor´ıa gravitacional m´as amplia que contenga, como caso l´ımite, a la vieja teor´ıa gravitacional de Newton. Es claro que para generalizar una ecuaci´on no hay un camino u ´nico, sino que se presentan varias posibilidades. En este cap´ıtulo seguiremos el camino de Einstein y llegaremos a la c´elebre ecuaci´on Rµν −

8πG 1 gµν R = 4 Tµν , 2 c

(12.2)

donde Rµν es el tensor de Ricci, R es el escalar de curvatura, Tµν el tensor de energ´ıa y momentum y G = 6.670 × 10−8 cm3 gr−1 seg−2 es la constante de la gravitaci´on universal. Veremos que la ecuaci´on (12.2) surge como una generalizaci´on natural de (12.1). Einstein construy´o esta ecuaci´on en un proceso 287

penoso que le tom´o varios a˜ nos y que concluy´o [17, 18, 19, 20] en noviembre de 1915. Curiosamente, Hilbert se adelant´ o a Einstein y public´o esta f´ormula cinco d´ıas antes [21]. Por tal motivo (12.1) se llama la ecuaci´ on de Hilbert-Einstein. Acabamos de anotar que (12.1) admite varias generalizaciones, o sea que (12.1) ; (12.2). Para recorrer el camino que conduce de (12.1) a (12.2) vamos a proponer algunos argumentos que, aunque no son rigurosos, s´ı son razonables y convincentes. Es aqu´ı, en los argumentos convincentes, donde puede apreciarse el m´erito de la propuesta gravitacional de Einstein.

12.1

El l´ımite newtoniano

Si calculamos el valor num´erico de Φ/c2 en la superficie del Sol o de la Tierra, obtenemos Φ/c2 ≈ −10−6 y −10−9 , respectivamente. Esto indica que en el sistema solar el campo gravitacional es muy d´ebil. Adem´as las velocidades de los planetas y sus sat´elites son muy bajas en comparaci´on con c. El r´egimen de campo d´ebil y bajas velocidades se llama el l´ımite newtoniano. Es aqu´ı, en el l´ımite newtoniano, donde la vieja teor´ıa gravitacional es exitosa. En efecto, la capacidad predictiva y explicativa de esa teor´ıa se ha mostrado en m´ ultiples problemas que ata˜ nen al movimiento de los planetas y sus lunas. La nueva teor´ıa gravitacional que nosotros construyamos debe reproducir los resultados de la vieja teor´ıa en aquellos casos que se encuentran dentro del l´ımite newtoniano.1

12.2

Los 10 potenciales gµν

El campo gravitacional afecta las trayectorias de las part´ıculas y afecta la evoluci´on de los otros campos. En el cap´ıtulo 11 vimos que la gravitaci´ on se acopla con las trayectorias a trav´es de las geod´esicas, y se acopla con los otros campos a trav´es del s´ımbolo de Christoffel Γα µν . La gravitaci´ on podr´ıa ser un asunto geom´etrico: ella se manifiesta a trav´es de las propiedades geom´etricas del espaciotiempo. ¿Cu´al de las propiedades geom´etricas del espaciotiempo expresa al campo gravitacional? Tenemos a nuestra disposici´on muchas cantidades geom´etricas: gαβ , det(g), Γµαβ , gαβ,µ , Γµαβ,δ , Rαβµν , Rβµ , R : ¿cu´al de ellas representa al campo gravitacional? De todas las posibilidades escogeremos a gαβ para representar al campo, basados en una secuencia de 1 Advertencia: Hay muchas situaciones interesantes que no est´ an en el l´ımite newtoniano, como por ejemplo el viaje de un pulso de luz. La velocidad de la luz no es baja.

288

ideas, muy laxa, que expondremos enseguida. De acuerdo con la gravitaci´ on newtoniana, la aceleraci´on de una part´ıcula en ca´ıda libre es −∇Φ:

aceleraci´on ∼

∂Φ ∂x

(12.3)

De otro lado, recordemos la hip´otesis geod´esica que vimos en la secci´on 11.1: las part´ıculas que caen libremente siguen curvas geod´esicas, o sea que cumplen la ecuaci´on (10.11): d2 x dx dx ∼ Γ 2 dτ dτ dτ El lado izquierdo de esta f´ormula es como aceleraci´on, entonces: aceleraci´ on ∼ Γ

Recordemos, de acuerdo con la definici´on (9.57), que Γ es como las derivadas de gµν . O sea que la u ´ltima f´ormula es

aceleraci´on ∼

∂gµν ∂x

(12.4)

Finalmente conectamos los lados derechos de (12.3) y (12.4) para escribir ∂gµν ∂Φ ∼ , es decir, ∂x ∂x gµν ∼ Φ Esta f´ormula asocia el campo gravitacional newtoniano, que es Φ, con el tensor m´etrico: de esta manera se justifica la propuesta de escoger al tensor m´etrico gµν como el campo gravitacional en la teor´ıa que queremos construir. La teor´ıa que buscamos debe coincidir con la vieja teor´ıa gravitacional en el l´ımite newtoniano y por eso esperamos que, en ese l´ımite, gµν coincida con Φ. Pero gµν tiene diez componentes independientes: ¿cu´al de las diez es la que coincide con Φ? 289

12.3

El potencial g00 en coordenadas cartesianas

Para responder esta pregunta regresemos al estudio de una part´ıcula en ca´ıda libre en coordenadas cartesianas xµ = (ct, x, y, z). La ecuaci´on (5.54) muestra que la componente U 0 es mucho mayor que las otras tres U a , o sea que dxa /dτ es despreciable en comparaci´on con dx0 /dτ , y la ecuaci´on (10.11) se convierte en d2 xα dτ 2

dx0 dx0 dτ dτ µ ¶2 dt 2 α = −c Γ 00 dτ ≈ −Γα00

(12.5)

Para desarrollar esta ecuaci´on debemos calcular el s´ımbolo de Christoffel Γα00 . De acuerdo con la definici´on (9.57): 1 Γα00 = g ασ (gσ0,0 + g0σ,0 − g00,σ ) 2 En este momento suponemos, para simplificar el problema, que el campo es est´atico, o sea que todas las derivadas temporales son cero: gσ0,0 = g0σ,0 = 0. En la u ´ltima ecuaci´on s´olo sobreviven las derivadas espaciales g00,b : 1 Γα00 = − g αb g00,b 2

(12.6)

Si el campo es d´ebil podemos escribir gαβ = ηαβ + hαβ ,

(12.7)

donde ηαβ es la m´etrica de Minkowski (5.2) y hαβ es una matriz 4 × 4 en la que todas sus componentes son muy peque˜ nas: |hαβ | ¿ 1. La ecuaci´on 1 1 αb αb (12.6) es entonces Γα00 = − (η +h )(η00,b +h00,b ) = − (η αb +hαb )h00,b = 2 2 1 αb − η h00,b + t´erminos de orden 2, que despreciaremos. La ecuaci´on (12.5) 2 queda aproximadamente 290

d2 xα c2 αb = η h00,b dτ 2 2

µ

dt dτ

¶2

Escribamos esta ecuaci´on para α = 0 y para α = a: d2 t = 0 dτ 2 µ ¶2 d2 r c2 dt = − ∇h00 2 dτ 2 dτ

(12.8)

La primera de estas ecuaciones dice que dt = constante dτ

(12.9)

Dejemos esto all´ı un momento, mientras nos concentramos en la derivada d/dτ . La regla de la derivaci´on en cadena dice que d/dτ = (dt/dτ )(d/dt) , de donde d2 dt d dt d d d = , = 2 dτ dτ dτ dτ dt dτ dt y usando (12.9): d2 = dτ 2

µ

dt dτ

¶2

d2 dt2

Utilizamos esto en el lado izquierdo de (12.8) para escribir d2 r c2 = − ∇h00 dt2 2 De otro lado, la gravitaci´on newtoniana dice que d2 r = −∇Φ, dt2 Igualemos ahora los lados derechos de las dos u ´ltimas ecuaciones: 291

∇h00 = h00 =

2 ∇Φ c2 2Φ + constante c2

La constante de integraci´ on que aparece en el lado derecho de esta ecuaci´on se puede averiguar en cualquier punto del espacio. Escojamos un punto donde Φ sea cero. En ese punto la m´etrica gµν es igual a ηµν , y en consecuencia hµν es cero. Colocando estos valores en la u ´ltima ecuaci´on descubrimos que la constante es cero, o sea que: h00 =

2Φ c2

g00 = 1 +

(12.10) 2Φ c2

en el l´ımite newtoniano

(12.11)

Aprendemos as´ı que de los diez potenciales relativistas hay uno, g00 , que est´a conectado al potencial newtoniano Φ de acuerdo con la u ´ltima ecuaci´on. El an´alisis reci´en hecho establece qu´e es g00 , pero no da informaci´on acerca de los otros nueve potenciales.

12.4

La ecuaci´ on de Hilbert-Einstein

Ha llegado el momento de construir una ecuaci´on tensorial de fuentes para el campo gravitatorio gµν . Con este prop´osito, vamos a apoyarnos en el ejemplo que nos dan las dos grandes ecuaciones de fuentes de la f´ısica cl´asica, que son (12.1) y (6.19). Estas dos ecuaciones tienen varios aspectos en com´ un: al lado derecho aparece la fuente del campo y al lado izquierdo aparecen derivadas del campo. Demos el primer paso diciendo que buscamos una ecuaci´on de la forma: Alguna funci´on de las derivadas de gµν es ∼ ρ

(12.12)

Ahora, ρc2 no es un tensor, sino solamente la componente T00 de alg´ un tensor Tµν de energ´ıa-momentum. Por el momento no tenemos una idea clara de qu´e es este tensor: no estamos seguros de si Tµν contiene o excluye los aportes del campo gravitatorio. Como queremos una ecuaci´on tensorial escribimos Tµν en vez de ρ en el lado derecho de (12.12). Entonces el lado izquierdo tambi´en tiene que ser un tensor de rango 2: 292

Alg´ un tensor de rango 2 que es derivadas de gµν es ∼ Tµν

(12.13)

Las dos ecuaciones cl´asicas que sirven de modelo, (12.1) y (6.19), tienen en el lado izquierdo derivadas del campo. Estas derivadas no son de grado superior a 2, y las derivadas de grado 2 aparecen linealmente. Para seguir el ejemplo queremos proponer ahora una ecuaci´on de ese estilo, o sea que en el lado izquierdo de (12.13) queremos escribir alg´ un tensor de rango 2 con las siguientes propiedades: 1) puede tener gµν y gµν,α 2) debe tener segundas derivadas gµν,α,β y 3) las segundas derivadas gµν,α,β deben aparecer linealmente. Acudimos a los enunciados (9.109) y (9.110) para afirmar que la forma m´as general del lado izquierdo de (12.13) es una combinaci´ on lineal de Rµν , R y gµν : aRµν + b0 gµν R + Λ0 gµν = κ0 Tµν , donde a, b0 , Λ0 y κ0 son constantes. Dividiendo ambos lados por a llegamos a: Rµν + bgµν R + Λgµν = κTµν ,

(12.14)

donde b, Λ y κ son constantes que debemos determinar. Subiendo ´ındices en la u ´ltima ecuaci´on se obtiene: Rµν + bg µν R + Λg µν = κTµν

(12.15)

Averiguar la constante b y precisar qu´ e es Tµν : Si se toma la divergencia covariante (punto y coma) en ambos lados de la u ´ltima ecuaci´on se llega a: Rµν; ν + bg µν R; ν + bg µν; ν R + Λg µν; ν = κTµν; ν En el lado izquierdo los dos u ´ltimos t´erminos son cero debido a la identidad (9.79). Queda: Rµν; ν + bg µν R; ν = κTµν; ν Hasta el momento no hemos tenido necesidad de precisar qu´e es Tµν . De 293

otro lado, la constante b est´ a todav´ıa sin determinar. Resolveremos estas dos ambig¨ uedades con un solo movimiento. Digamos que Tµν re´ une todas las formas de energ´ıa-momentum que no son gravitatorias; la frase escrita en bastardilla en la p´agina 280 afirma que Tµν; ν = 0, de modo que la u ´ltima ecuaci´on es: Rµν; ν + bg µν R; ν = 0 y al comparar esto con la identidad de Bianchi (9.104) descubrimos que b = −1/2 . La ecuaci´on (12.14) queda as´ı: Rµν −

1 gµν R + Λgµν = κTµν 2

(12.16)

Hemos escrito T µν en vez de Tµν para seguir nuestra notaci´on habitual. Quede claro que el T µν que aparece en la ecuaci´on (12.16) recoge todas las formas de energ´ıa-momentum, excepto la contribuci´ on del campo gravitatorio. Por supuesto que el campo gravitatorio tiene energ´ıa y momentum, pero ´estos no hacen parte del T µν de la ecuaci´on (12.16). La constante Λ: La propuesta inicial [20] de Einstein fue con Λ = 0: Rµν −

1 gµν R = κTµν 2

(12.17)

En esta ecuaci´on podemos subir el ´ındice µ para obtener Rµν − 21 g µν R = κT µν . Si adem´as hacemos ν = µ escribimos Rµµ − 12 g µµ R = κT µµ . La traza Rµµ es el escalar de curvatura R, y la traza g µµ es igual a 4. Queda entonces R − 2R = κT µµ : R = −κT µµ

(12.18)

Con este resultado la ecuaci´on (12.17) deviene Rµν

µ ¶ 1 α = κ Tµν − gµν T α 2

En particular, la componente R00 es 294

(12.19)

µ ¶ 1 R00 = κ T00 − g00 T αα 2

(12.20)

La constante κ: Nos queda por determinar la constante κ, y para hacerlo queremos obligar a la gravitaci´on einsteiniana a que contenga a la newtoniana. En particular, haremos que la nueva teor´ıa coincida con la vieja en el l´ımite newtoniano. Para ejecutar este proyecto obligaremos a la ecuaci´on (12.20) a que coincida con (12.1) cuando el campo es d´ebil y las velocidades son bajas: al establecer esta coincidencia quedar´a determinado el valor de la inc´ognita κ. De acuerdo con la ecuaci´on (12.7), las derivadas de gαβ son iguales a las derivadas de hαβ , y en vista del enunciado (9.59) podemos afirmar que Γ es como las derivadas de hµν . En consecuencia los productos Γ Γ son de orden 2 en potencias de hµν y, suponiendo que este campo hµν es d´ebil, podremos despreciar los productos Γ Γ en el lado derecho de la definici´on (9.77): Rλµνσ ≈ Γλµν,σ − Γλµσ,ν El tensor de Ricci Rµν = Rλµνλ es, entonces, Rµν ≈ Γλµν,λ − Γλµλ,ν En el lado derecho usamos la definici´on (9.57) para escribir Rµν =

i i 1 h λρ 1 h λρ g (gρµ,ν + gνρ,µ − gµν,ρ ) − g (gρµ,λ + gλρ,µ − gµλ,ρ ) 2 2 ,λ ,ν

Usamos la f´ormula (12.7) y despreciamos t´erminos cuadr´aticos en hµν ; de esta manera se llega a Rµν

=

i i 1 h λρ 1 h λρ η (hρµ,ν + hνρ,µ − hµν,ρ ) − η (hρµ,λ + hλρ,µ − hµλ,ρ ) 2 2 ,λ ,ν

=

1 λρ η [hνρ,µ,λ − hµν,ρ,λ − hλρ,µ,ν + hµλ,ρ,ν ] 2

Concentrarse en la componente R00 : 295

R00 =

1 λρ η [h0ρ,0,λ − h00,ρ,λ − hλρ,0,0 + h0λ,ρ,0 ] 2

Si el campo es est´atico las derivadas respecto a x0 son cero (recu´erdese que en coordenadas cartesianas x0 = ct) y queda 1 R00 = − η λρ h00,ρ,λ 2 De nuevo, las derivadas respecto a x0 son cero, o sea que en el lado derecho de esta ecuaci´on sobreviven u ´nicamente los ´ındices latinos, y podemos escribir 1 ab 1 R00 = − η h00,a,b , es decir R00 = ∇2 h00 , y en vista de (12.10) llegamos 2 2 finalmente a R00 =

1 2 ∇ Φ c2

(12.21)

Este es el lado izquierdo de (12.20). Ahora transformemos el lado derecho de (12.20) que es: ¶ µ 1 (12.22) κ g0µ g0ν T µν − g00 gαβ T αβ 2 La ecuaci´on (5.58) dice que, a bajas velocidades, p0 À pa . Entonces, de acuerdo con (7.16), podemos afirmar que T 00 À T a0 y T 00 À T ab . Bajo estas condiciones la expresi´on (12.22) es, aproximadamente, µ ¶ 1 1 κ (g00 )2 T 00 − (g00 )2 T 00 = κ(g00 )2 T 00 2 2

(12.23)

De otro lado, apuntamos en la p´agina 166 que T 00 es la densidad de energ´ıa ρc2 , entonces (12.23) es 1 κρc2 (g00 )2 2 Ya podemos igualar las expresiones (12.21) y (12.24): 1 1 2 ∇ Φ = κρc2 (g00 )2 2 c 2 296

(12.24)

De nuevo, para campo d´ebil la ecuaci´on (12.11) da g00 = 1 + ∇2 Φ =

2Φ ≈ 1: c2

1 κρc4 , 2

y comparando con (12.1) descubrimos que κ = 8πG/c4 . La ecuaci´on (12.17) queda finalmente as´ı: Rµν −

1 8πG gµν R = 4 Tµν 2 c

(12.25)

Esta es la ecuaci´ on de Hilbert-Einstein que quer´ıamos construir. De otro lado, la ecuaci´on (12.18) se convierte en R = −

8πG α T α c4

(12.26)

Al poner esto en la ecuaci´on (12.25) llegamos a ¶ µ 8πG 1 αβ α β Tαβ Rµν = 4 gµ gν − gµν g c 2 Obs´ervese que Tαβ = 0



Rµν = 0

(12.27)

Ya hemos dicho que Tαβ recoge todas las formas de momentum y energ´ıa diferentes a las producidas por el campo gravitatorio. Las ecuaciones Tαβ = 0 y Tαβ 6= 0, no dicen nada acerca de la energ´ıa-momentum del campo gravitatorio. Lo que s´ı podemos afirmar es que si en alg´ un evento se cumple Tαβ = 0, cualquier energ´ıa-momentum que en ese evento haya proviene, sin duda, del campo gravitacional. Supongamos por ejemplo que el u ´nico objeto del universo es un astro de radio a. En la regi´on r < a los tensores Tαβ y Rµν son, en general, diferentes de cero. Ahora estudiemos lo que ocurre en la regi´on r > a: 1) Si el planeta tiene cargas o corrientes el´ectricas se genera un campo electromagn´etico y, 297

por consiguiente, hay un Tαβ 6= 0: el tensor Rµν no es, en general, cero. 2) Si el planeta no es fuente de campo electromagn´etico se cumple que Tαβ = 0 y en consecuencia Rµν = 0 . Debemos hacer un comentario acerca de T µν . N´otese que el lado izquierdo de la ecuaci´on (12.25) es sim´etrico bajo el intercambio de los ´ındices µ y ν, lo que quiere decir que Tµν tambi´en tiene que ser sim´etrico (Tµν tiene que ser igual a Tνµ ). Si Tµν no es sim´etrico, la ecuaci´on de Hilbert-Einstein es inconsistente. Al enfrentar cualquier problema particular, debemos revisar juiciosamente que el tensor de energ´ıa-momentum que estamos usando sea verdaderamente sim´etrico. Por ejemplo, el tensor de la ecuaci´on (8.52) es asim´etrico, y por eso no se puede usar en la ecuaci´on de Hilbert-Einstein. Pero el tensor de la ecuaci´on (8.59) s´ı es sim´etrico, y en consecuencia es l´ıcito usarlo en la ecuaci´on (12.25).

12.5

Las coordenadas

Antes de concluir este cap´ıtulo es conveniente que nos detengamos para establecer algunas nociones generales acerca de las soluciones de la ecuaci´on del campo gravitatorio (12.25). Cuando se trata de resolver esta ecuaci´on en un problema particular, es necesario escoger las coordenadas xµ que mejor se ajustan a las condiciones particulares del problema. En principio, la escogencia de las cuatro coordenadas es bastante libre y puede ser, incluso, caprichosa, como la que propone Ohanian [13]: Para las coordenadas espaciales de un punto P se utilizan los rayos de luz de tres estrellas fijas (amarilla, azul y roja) no colineales, como muestra la Figura 12.1; se adoptan como coordenadas espaciales los tres ´angulos que se forman entre los tres rayos que convergen en P . La coordenada temporal se establece con otra estrella (blanca) m´ovil; se adopta como coordenada temporal el ´angulo formado en P por los rayos rojo y blanco. A la coordenada x0 no se le dice tiempo sino, en general, coordenada temporal; esto es entendible, ya que x0 no viene necesariamente en segundos, sino que puede estar dada en metros, en radianes, etc. Tiempo universal y campo constante. Si, en un espaciotiempo dado, es posible escoger un sistema coordenado xµ tal que todas las componentes gµν sean2 independientes de la coordenada temporal x0 , entonces x0 se lla2 En tal caso x0 es una coordenada c´ıclica, y se le asocia una constante del movimiento en las curvas geod´esicas (v´ease la secci´ on 10.3).

298

ma tiempo universal. En tal caso, decimos que el campo gravitatorio es estacionario (tambi´en se le dice constante). El tiempo universal es una coordenada c´ıclica, y en consecuencia las curvas geod´esicas tienen, asociada a x0 , una constante del movimiento. Lo del tiempo universal y el campo constante es s´olo de inter´es acad´emico porque, estrictamente, debemos admitir [22] que s´olo puede ser constante el campo producido por un cuerpo; en efecto, cuando hay varios cuerpos las atracciones mutuas producen unas aceleraciones que hacen que el campo cambie con el transcurso del tiempo. La inversi´ on del tiempo universal. Separemos los ´ındices latinos en la f´ormula del intervalo (9.1): (ds)2 = g00 dx0 dx0 + gab dxa dxb + ga0 dxa dx0 + g0a dx0 dxa

(12.28)

Supongamos que x0 es un tiempo universal. La operaci´on x0 → −x0 modifica as´ı al intervalo: (ds)2 → g00 dx0 dx0 + gab dxa dxb − ga0 dxa dx0 − g0a dx0 dxa

(12.29)

Al comparar (12.28) y (12.29) nos damos cuenta de que, en general, (ds)2 9 (ds)2 . En palabras, el intervalo es, en general, sensible a la inversi´ on del 0 0 tiempo universal x → −x . Pero si ga0 = g0a = 0 en la ecuaci´on (12.29), llegamos a (ds)2 → (ds)2 . aticos son un subconjunto de los estaCampo est´ atico. Los campos est´ cionarios. Si, adem´as de que los gµν sean independientes de la coordenada temporal, se cumple que ga0 = g0b = 0, decimos que el campo no s´olo es estacionario sino adem´as est´atico. En los campos est´aticos el intervalo es insensible a la inversi´on del tiempo universal: (ds)2 → (ds)2 . La diferencia entre estacionario y est´atico se aprecia f´acilmente con un ejemplo. El campo producido por una estrella que no gira es est´atico. Si la estrella gira alrededor de su eje, el campo es estacionario, pero no est´atico. En efecto, la operaci´on x0 → −x0 no ha de afectar el campo de una estrella quieta. Pero si la estrella rota con velocidad angular ω , la inversi´ on del tiempo universal trae como consecuencia ω → − ω , y ´esto a su vez debe afectar al campo producido por la estrella. Modernamente, la distinci´on estacionario-est´atico 299

es importante en el problema de la masa puntual: si la masa rota, el campo es estacionario (soluci´on de Kerr); y si no rota, el campo es est´atico (soluci´on de Schwarzschild). a

ll ari am

azul roja

P

Figura 12.1 Las coordenadas de Ohanian. Las coordenadas espaciales de un punto P son los tres ´angulos que forman en P las luces que provienen de tres estrellas (amarilla, azul y roja). La coordenada temporal es el ´angulo formado en P por los rayos de la estrella roja y de una cuarta estrella m´ovil.

300

Cap´ıtulo 13

La soluci´ on de Schwarzschild

El problema m´as simple de la f´ısica cl´asica es el del universo vac´ıo. El problema que le sigue es el estudio de los efectos causados por la presencia de una part´ıcula puntual. La gravitaci´ on newtoniana resolvi´o este problema con gran ´exito: trescientos a˜ nos de astronom´ıa han confirmado la bondad de la soluci´on de Newton. M´as tarde, en la d´ecada de 1920, la mec´anica cu´antica naciente habr´ıa de resolver de nuevo este problema que se conoce bajo el nombre de ´atomo de hidr´ogeno. El caso de la part´ıcula puntual fue el problema escuela de la f´ısica newtoniana y de la mec´anica cu´antica. Tambi´en en la gravitaci´on Einstein atac´o el problema de la masa puntual. Y as´ı como ocurri´o con la versi´on newtoniana y con la versi´ on cu´antica, este viejo problema fue la escuela de la relatividad general, entren´ o a los cient´ıficos en las sutilezas de la teor´ıa y les exigi´o m´etodos de c´alculo especiales. Einstein resolvi´o este problema en 1915, aunque no en forma exacta, sino aproximada; en esa soluci´on aproximada logr´o explicar la precesi´on del perihelio de Mercurio y pudo predecir la desviaci´on de un rayo de luz al pasar cerca del Sol. Schwarzschild [23] resolvi´o exactamente el problema de la masa puntual en diciembre de 1915, unas pocas semanas despu´es de que Einstein y Hilbert encontraran la ecuaci´on (12.25) de los campos gravitacionales1 .

13.1

Campo is´ otropo est´ atico

Nos proponemos averiguar la forma m´as general que puede tener un campo gravitatorio is´otropo est´atico. Con ese prop´osito vamos a desarrollar sucesi1

Schwarzschild, profesor de la universidad de Gotinga, resolvi´ o el problema mientras prestaba sus servicios como soldado en el frente oriental. Muri´ o cinco meses despu´es, a los 42 a˜ nos de edad, por la infecci´ on de una herida.

301

vamente los casos is´otropo, estacionario y est´atico. Campo is´ otropo. En este caso el intervalo ds2 debe ser un escalar bajo el grupo de las rotaciones en el espacio tridimensional. Para proponer o construir un ds2 debemos acudir a cantidades escalares. ¿Cu´ales son las cantidades escalares disponibles? Con la coordenada temporal ct se producen dos escalares, que son t y dt. De otro lado, con dos vectores A y B se consigue una cantidad escalar mediante el producto punto A · B. Debemos encontrar vectores para ejecutar el producto punto. Disponemos u ´nicamente de los vectores r y dr, y los productos punto entre ellos son r · r, r · dr y dr · dr. En conclusi´on, el intervalo is´otropo m´as general se construye con t, dt, r · r, r · dr y dr · dr : ds2 = {r · r, t}(dt)2 + {r · r, t}r · drdt + {r · r, t}(r · dr)2 + {r · r, t}dr · dr En esta f´ormula la escritura {r · r, t} es una manera corta de decir “alguna funci´on de r · r y de t ”. No se nos escapa que esta notaci´on es ambigua porque podr´ıa sugerir, equivocadamente, que las cuatro funciones {r · r, t} que aparecen en la f´ormula son iguales. Debemos entender que las cuatro funciones {r · r, t} son, en principio, diferentes. Campo is´ otropo estacionario. Sabemos por la secci´on 12.5 que para campos estacionarios las componentes gµν del tensor m´etrico son independientes del tiempo universal, o sea que el intervalo ds2 se simplifica: ds2 = {r · r}(dt)2 + {r · r}r · drdt + {r · r}(r · dr)2 + {r · r}dr · dr Campo is´ otropo est´ atico. Utilizando de nuevo la secci´on 12.5 debemos imponer la condici´on de que las entradas g0a del tensor m´etrico sean cero. Queda: ds2 = {r · r}(dt)2 + {r · r}(r · dr)2 + {r · r}dr · dr ˆ r , dr = dr 1 ˆ r + rdθ 1 ˆ θ + r sen θdϕ 1 ˆ ϕ . Los En coordenadas esf´ericas r = r 1 productos escalares son: r · r = r2 302

r · dr = rdr

³ ´ dr · dr = (dr)2 + r2 (dθ)2 + sen2 θ(dϕ)2 Con estas expresiones regresamos a ds2 : ³ ´ ds2 = {r}dt2 + {r}dr2 + {r} dr2 + r2 (dθ2 + sen2 θdϕ2 ) = {r}dt2 + {r}dr2 + {r}r2 (dθ2 + sen2 θdϕ2 ) Pongamos nombres a las tres funciones {r}: ds2 = D(r)dt2 − E(r)dr2 − F (r)r2 (dθ2 + sen2 θdϕ2 ) Ahora hacemos una transformaci´on de coordenadas (ct, r, θ, ϕ) → (ct, ρ, θ, ϕ), donde la nueva coordenada ρ est´ a definida por medio de la ecuaci´on ρ2 ≡ 2 F (r)r : ds2 = A(ρ)c2 dt2 − B(ρ)dρ2 − ρ2 (dθ2 + sen2 θdϕ2 )

(13.1)

Este intervalo corresponde al tensor m´etrico: 

gµν

   =   

A(ρ)

0

0

0

0

−B(ρ)

0

0

0

0

−ρ2

0

0

0

0

−ρ2 sen2 θ

       

(13.2)

Esta es la m´etrica del problema m´as general de campo est´atico is´otropo. El tensor de Ricci tiene s´olo cuatro componentes no nulas: ´ 1 ³ 00 02 0 0 0 2ρABA − ρBA − ρAA B + 4ABA 4ρAB 2 ´ 1 ³ 00 02 0 0 2 0 2ρABA − ρBA − ρAA B − 4A B 4ρA2 B

R00 = − R11 =

303

R22 = −

´ 1 ³ 0 0 2 − ρBA + ρAB + 2AB − 2AB 2AB 2

R33 = sen2 θR22 Aqu´ı la prima (0 ) quiere decir derivada respecto a ρ. A partir de este momento supondremos que la distribuci´on de momentum y energ´ıa Tµν est´ a concentrada en una regi´on finita del espacio: estamos pensando en una estrella, un planeta, una bola de polvo, etc. Esta distribuci´on de momentum y energ´ıa tiene cierto radio. Vamos a estudiar u ´nicamente la regi´on exterior. Si esta bola de polvo o estrella no es fuente de campo electromagn´etico podemos afirmar, de acuerdo con la discusi´on de la p´agina 298, que los tensores Tµν y Rµν son cero. Al imponer las ecuaciones R00 = 0, R11 = 0 y R22 = 0 se obtiene: 2ρABA00 − ρBA02 − ρAA0 B 0 = −4ABA0

(13.3)

2ρABA00 − ρBA02 − ρAA0 B 0 = 4A2 B 0

(13.4)

−ρBA0 + ρAB 0 + 2AB 2 − 2AB = 0

(13.5)

Obs´ervese que los lados izquierdos de (13.3) y (13.4) son iguales; entonces los lados derechos tambi´en tienen que ser iguales: −4ABA0 = 4A2 B 0 , o sea que AB 0 + BA0 = 0, es decir (AB)0 = 0. Esto significa que: A(ρ)B(ρ) = una constante

(13.6)

Para averiguar el valor de esta constante recordamos que a grandes distancias la m´etrica (13.2) debe coincidir con (9.45). Pues bien, al comparar (13.2) con (9.45) vemos que, a grandes distancias, las funciones A(ρ) y B(ρ) tienden al valor 1, y por consiguiente la constante de la ecuaci´on (13.6) es 1: A(ρ)B(ρ) = 1 B(ρ) =

1 A(ρ)

(13.7)

Al colocar este resultado en la ecuaci´on (13.5) se obtiene ρA0 + A = 1, es decir 304

d (ρA) = 1 dρ La soluci´on de esta ecuaci´on es A=1+

k ρ

(13.8)

donde k es una constante cuyo valor debemos averiguar. Para hacerlo estudiemos la situaci´on a distancias grandes, donde esperamos que se logre el l´ımite newtoniano. El potencial newtoniano es Φ = −GM/r y la ecuaci´on (12.11) dice que A ' 1−

2GM c2 r

2GM k = − 2 . Esto significa que ρ es ρ c r proporcional a r. Lo m´as sencillo es escoger ρ igual a r. Con esta elecci´on la 2GM constante k queda determinada: k = − 2 . Las ecuaciones (13.8) y (13.7) c dan finalmente Al comparar con (13.8) vemos que

A =

2GM 1 = 1− 2 B c r

El intervalo (13.1) y la m´etrica (13.2) son: µ ¶ µ ¶ 2GM 2GM −1 2 2 2 2 2 ds = 1 − 2 c dt − 1 − 2 dr −r (dθ +sen2 θdϕ2 ) (13.9) c r c r 2



gµν

      =      

1−

2GM c2 r

 0

0

0

0

¶ µ 2GM −1 − 1− 2 c r

0

0

0

0

−r2

0

0

0

0

−r2 sen2 θ

305

            

(13.10)

Esta es la soluci´on en la regi´on “de afuera”, en el exterior de la distribuci´on esf´erica de energ´ıa y momentum. De ahora en adelante nos concentraremos en lo que se llama el problema de Schwarzschild: cuando toda la energ´ıamomentum representada por Tµν se acumula en un punto, que es el origen de coordenadas. En tal caso la m´etrica (13.10) ser´a v´alida en todos los puntos del universo, excepto en r = 0 . Ya que la cantidad 2GM/c2 aparece frecuentemente, conviene darle un nombre; se llama el radio de Schwarzschild : s ≡

2GM c2

(13.11)

ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θ dϕ2 ) 

gµν

     =     

1 − s/r

0

0



0

          

− (1 − s/r)−1

0

0

0

−r2

0

0

0

0

−r2 sen2 θ

0

0

0

(13.12)

0

(13.13)

La inversa de esta matriz es 

g

µν

     =     

(1 − s/r)−1 0

0

−(1 − s/r)

0

0

0

0

−r−2

0

0

0

0

−(r sen θ)−2

           

(13.14)

Para s = M = 0 se recupera el tensor m´etrico (9.45) del espacio plano. Antes de cerrar esta secci´on anotemos que, como la constante de la gravitaci´ on G 2 es muy baja, s = 2GM/c toma valores sorprendentemente peque˜ nos. En efecto, cuando M es la masa del Sol se obtiene s ' 3 km., y cuando M es la masa de la Tierra se obtiene s ' 9 mm. 306

13.2

La geometr´ıa del espaciotiempo

Con la m´etrica (13.13) procedemos a calcular los s´ımbolos de Christoffel y las componentes contravariantes del tensor de Riemann. Resulta que las cantidades no nulas son Γ0 01 = Γ0 10 =

s 2r(r − s)

s(r − s) 2r3 = −r + s

s 2r(r − s) = −(r − s) sen2 θ

Γ1 00 =

Γ1 11 = −

Γ1 22

Γ1 33

Γ2 33 = − sen θ cos θ Γ3 13 = Γ3 31 =

Γ2 12 = Γ2 21 =

1 r

1 r

Γ3 23 = Γ3 32 = cot θ

R0101 = R1010 = −R1001 = −R0110 =

s r3

R0202 = R2020 = −R2002 = −R0220 = − R0303 = R3030 = −R3003 = −R0330

s 2r4 (r

− s) s = − 4 2r (r − s) sen2 θ

R1212 = R2121 = −R2112 = −R1221 =

s(r − s) 2r6

s(r − s) 2r6 sen2 θ s = − 7 r sen2 θ

R1313 = R3131 = −R3113 = −R1331 = R2323 = R3232 = −R3223 = −R2332

Todas las componentes del tensor de Ricci son cero, de acuerdo con (12.27), y por consiguiente el escalar de curvatura tambi´en es cero. El espaciotiempo es obviamente curvo, porque algunas componentes del tensor de Riemann no son cero. N´otese, sin embargo, que si s → 0 (es decir, si M → 0) el espaciotiempo se vuelve plano. La larga lista de las componentes no nulas del tensor de Riemann es excesiva, ya que muchas de ellas se obtienen de las otras, utilizando las tres identidades algebraicas (9.83, 9.84, 9.85). En vez de escribir toda la lista, pudimos 307

dar u ´nicamente R0101 , R0202 , R0303 , R1212 , R1313 y R2323 . As´ı mismo, no era necesario dar Γ2 21 , Γ3 31 ni Γ3 32 . De ahora en adelante, para ahorrar espacio, no escribiremos aquellas componentes que pueden averiguarse f´acilmente utilizando las f´ormulas de las identidades algebraicas.

13.3

Subespacios

El triespacio (r, θ, ϕ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un corte de t constante (es decir dt = 0) y lo que queda es un espacio tridimensional. Al poner dt = 0 en las ecuaciones (13.12) y (13.13) queda este espacio tridimensional: ds2 = − (1 − s/r)−1 dr2 − r2 (dθ2 + sen2 θdϕ2 )  gµν

  =  

− (1 − s/r)−1

0

0

0

−r2

0

0

0

−r2 sen2 θ

(13.15)

     

(13.16)

Las componentes covariantes no nulas del tensor de Riemann son

Rrθrθ =

s , 2(r − s)

Rrϕrϕ =

s sen2 θ , 2(r − s)

Rθϕθϕ = −sr sen2 θ

Este triespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el triespacio se aplana) cuando M → 0 . La curvatura de este triespacio es un efecto gravitacional. El biespacio (r, θ). En el cuadriespacio (ct, r, θ, ϕ) podemos hacer un corte de t constante y ϕ constante (es decir dt = dϕ = 0) y lo que queda es un espacio bidimensional. Al poner dt = dϕ = 0 en las ecuaciones (13.12) y (13.13) queda este espacio bidimensional: ds2 = − (1 − s/r)−1 dr2 − r2 dθ2 308

(13.17)

 gµν = 



− (1 − s/r)−1

0

0

−r2



(13.18)

Las componentes covariantes no nulas del tensor de Riemann son: Rrθrθ =

s 2(r − s)

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. El biespacio (θ, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt = dr = 0, queda un espacio bidimensional: ds2 = −r2 dθ2 − r2 sen2 θdϕ2  gµν = 

−r2

0

0

−r2 sen2 θ

(13.19)

 

(13.20)

Las componentes covariantes no nulas del tensor de Riemann son Rθϕθϕ = −r2 sen2 θ Este biespacio, que es una superficie esf´erica, es curvo, porque algunas componentes del tensor de Riemann no son cero. Cuando M → 0 , este biespacio no se aplana: la superficie esf´erica es curva con M 6= 0 y tambi´en es curva con M = 0. La curvatura de esta superficie no es un efecto gravitacional. El biespacio (t, r). Si en las ecuaciones (13.12) y (13.13) hacemos dθ = dϕ = 0, queda un espacio bidimensional: ³ s´ 2 2 ³ s ´−1 2 ds2 = 1 − c dt − 1 − dr r r 309

(13.21)



1 − s/r



0

gµν = 

 −1

0

(13.22)

− (1 − s/r)

Las componentes covariantes no nulas del tensor de Riemann son: Rtrtr =

s r3

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. El biespacio (t, θ). Si en las ecuaciones (13.12) y (13.13) hacemos dr = dϕ = 0, queda un espacio bidimensional: ds2 = (1 − s/r) c2 dt2 − r2 dθ2  gµν = 

1 − s/r

0

0

−r2

 

Todas las componentes del tensor de Riemann son cero, cualquiera que sea el valor de M . Vemos as´ı que el biespacio (t, θ) es plano con M 6= 0 y tambi´en con M = 0. El biespacio (r, ϕ). Si en las ecuaciones (13.12) y (13.13) hacemos dt = dθ = 0, queda un espacio bidimensional: ds2 = − (1 − s/r)−1 dr2 − r2 sen2 θdϕ2  gµν = 

− (1 − s/r)−1

0

0

−r2 sen2 θ

 

Las componentes covariantes no nulas del tensor de Riemann son 310

(13.23)

Rrϕrϕ =

1 s sen2 θ 2 r−s

Este biespacio es curvo, porque algunas componentes del tensor de Riemann no son cero. Pero estas se vuelven cero (y el biespacio se aplana) cuando M → 0. La curvatura de este biespacio es un efecto gravitacional. Para comprender la curvatura de este biespacio podemos simplificar la escritura usando longitudes positivas en (13.23), y concentrarnos en aquellas figuras que est´an en el plano ecuatorial, para lo cual hacemos θ = π/2: dl2 = (1 − s/r)−1 dr2 + r2 dϕ2

(13.24)

Para segmentos radiales hacemos dϕ = 0 en (13.24), y para segmentos de circunferencia hacemos dr = 0: dl =

p

1

1 − s/r dl = rdϕ :

dr :

segmento radial

(13.25)

arco de circunferencia

(13.26)

Calculemos el ´area de la corona comprendida entre los radios r y dr. La distancia entre los dos c´ırculos est´a dada por (13.25), y la longitud de la circunferencia menor se calcula pcon (13.26), y da 2πr. Entonces el ´area de la corona es el producto de 1/ 1 − s/r dr con 2πr: 2πrdr ´ Area =p 1 − s/r

(13.27)

Pero esto difiere del resultado euclidiano, que es 2πrdr. Este ejemplo muestra que el biespacio (r, ϕ) es curvo, mientras s sea diferente de cero. Por supuesto que para M = 0 se tiene s = 0 y el ´area (13.27) se convierte en el valor euclidiano 2πrdr, que es lo que se esperaba, ya que para s = 0 el espacio se aplana.

13.4

Relojes

Un punto en reposo tiene dr = dθ = dϕ = 0, y en consecuencia el intervalo (13.12) queda simplemente: 311

ds2 = c2 (1 − s/r) dt2 Ahora supongamos que en ese punto se encuentra un reloj y llamemos T al tiempo que marca ese reloj que est´a en reposo. El intervalo es: ds2 = c2 dT 2 Combinando las dos u ´ltimas ecuaciones llegamos a dT 2 = (1 − s/r) dt2 , es decir: dT

p = dt 1 − s/r p = dt 1 + 2Φ/c2

(13.28) (13.29)

Aqu´ı, Φ = −GM/r es el potencial gravitacional newtoniano. Si el reloj que est´ a en reposo se encuentra en el infinito, la ecuaci´on (13.28) da dT∞ = p dt 1 − s/∞ = dt. De esta manera se aclara el significado de la coordenada t que hemos usado desde el principio: t es un tiempo universal; un reloj que se encuentra en reposo en r = ∞ marca un tiempo t. La f´ormula del intervalo (13.12) da la longitud tridimensional dl: q dl =

(1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2

La velocidad de un punto m´ovil se puede definir de dos maneras, bien sea usando dt o dT . La cantidad dl/dt es es una velocidad medida con un reloj t lejano, que est´a en el infinito: dl/dt no es una medida local. La cantidad dl/dT es una velocidad medida con un reloj local T que se encuentra en reposo. Esta u ´ltima ser´a llamada velocidad local y le asignaremos el s´ımbolo v, as´ı: v = dl/dT . Saquemos c2 dt2 como factor com´ un en la f´ormula del intervalo (13.12): " 2

ds =

1 1 − s/r − 2 c 312

µ

dl dt

¶2 #

c2 dt2

(13.30)

Esta f´ormula da un resultado interesante para pulsos de luz, ya que si hacemos ds = 0 encontramos p dl = c 1 − s/r , dt o sea que la velocidad no local de la luz, dada por dl/dt, no es c. Afortunadamente la velocidad local, dada por dl/dT , s´ı es c, como veremos enseguida. En vista de (13.28), podemos escribir (dl/dt)2 = (1 − s/r) (dl/dT )2 = (1 − s/r)v 2 , y la ecuaci´on (13.30) se convierte en: ¡ ¢ ds2 = (1 − s/r) 1 − v 2 /c2 c2 dt2

(13.31)

Haciendo ds2 = 0 en esta ecuaci´on se llega a v = c. En palabras: la velocidad de la luz, medida localmente con un reloj en reposo, es c. Concentr´emonos ahora en lo que ocurre con una part´ıcula m´ovil, llamando dτ , como es costumbre, al tiempo que marca un reloj que la acompa˜ na. Hacemos ds2 = c2 dτ 2 en (13.31) para escribir: dτ

p (1 − s/r) (1 − v 2 /c2 ) p = dt (1 + 2Φ/c) (1 − v 2 /c2 ) = dt

(13.32) (13.33)

Esta es una f´ormula general, con tres casos particulares importantes: 1) Cuando el reloj est´a en reposo, dτ = dT y la ecuaci´on (13.32) se convierte en (13.28). 2) Cuando el reloj est´a en el infinito y tiene velocidad v, la ecuaci´on (13.32) se convierte en (2.14). 3) Cuando el reloj est´a en reposo en el infinito, τ = t. La ecuaci´on general (13.33) muestra que el reloj τ se atrasa respecto a t por dos causas diferentes: por tener velocidad, asunto que ya se ha estudiado en la relatividad especial, y por estar en un campo gravitacional. Veamos en detalle este u ´ltimo. La existencia de un tiempo universal t facilita la comprensi´on del espaciotiempo de Schwarzschild, ya que podemos imaginar cortes de simultaneidad. La Figura 13.1 trae tres l´ıneas rectas horizontales; todos los eventos contenidos en la primera l´ınea tienen el mismo valor t = 7; asimismo, todos 313

los eventos contenidos en la segunda l´ınea tienen el mismo valor t = 8, etc. La Figura tambi´en trae dos l´ıneas rectas verticales; una representa a un tripunto fijo (r1 , θ1 , ϕ1 ), y la otra representa a otro tripunto fijo (r2 , θ2 , ϕ2 ). Supongamos ahora que desde el punto (r1 , θ1 , ϕ1 ) se lanza una serie de proyectiles hacia (r2 , θ2 , ϕ2 ), peri´odicamente, y todos ellos se lanzan de la misma manera (con la misma velocidad inicial y la misma inclinaci´on). La Figura muestra, en l´ıneas curvas, las trayectorias de esos proyectiles. Lo interesante es que, debido a que el espaciotiempo de Schwarzschild es est´atico (v´ease la m´etrica (13.13)), las trayectorias de todos los proyectiles son similares, y en consecuencia todas las l´ıneas curvas de la Figura 13.1 son repetitivas. Llamemos ahora ∆t1 al tiempo universal que transcurre entre dos proyectiles sucesivos emitidos en el primer punto, y ∆t2 al lapso entre dos proyectiles sucesivos recibidos en el segundo punto. Como todas las l´ıneas curvas de la Figura 13.1 son similares, es claro que: ∆t1 = ∆t2

(13.34)

Pensemos ahora que en los dos puntos hay dos relojes en reposo, y llamemos T1 y T2 a los tiempos que ellos marcan. El primer reloj mide el tiempo ∆T1 que transcurre entre dos proyectiles sucesivos emitidos y el segundo reloj mide el tiempo ∆T2 que transcurre entre dos proyectiles recibidos. La f´ormula (13.28) dice que: p 1 − s/r1 p = ∆t2 1 − s/r2

∆T1 = ∆t1 ∆T2

Dividir lado a lado esta dos ecuaciones y utilizar la ecuaci´on (13.34): s ∆T2 = ∆T1

1 − s/r2 1 − s/r1

(13.35)

N´otese que r2 < r1 ⇒ ∆T2 < ∆T1 : mientras m´as hundido est´a un reloj en el campo gravitacional, m´as se atrasa. Los relojes se atrasan bien sea a causa del campo gravitatorio o a causa de la velocidad translacional que ellos tengan. Uno podr´ıa preguntarse si 314

acaso la aceleraci´on tambi´en ocasiona alg´ un atraso. La respuesta es no: se han realizado experimentos con aceleraciones extremas en ciclotrones, en los que los relojes (sistemas at´omicos) no registran atrasos debidos a la aceleraci´on. Antes de concluir esta secci´on vamos a completar el estudio de la velocidad local v = dl/dT , escribiendo en detalle sus tres componentes. La f´ormula del intervalo (13.12) da la longitud tridimensional dl y sus tres componentes dlr , dlθ y dlϕ : q dl = (1 − s/r)−1 dr2 + r2 dθ2 + r2 sen2 θ dϕ2 dlr =

dr

p

(13.36)

1 − s/r

dlθ = r dθ dlϕ = r sen θ dϕ Al dividir estas cantidades por dT se obtienen las componentes vr , vθ y vϕ : v = vr = vθ = vϕ =

q dl = vr2 + vθ2 + vϕ2 dT dlr 1 dr = p dT dT 1 − s/r dlθ dθ = r dT dT dlϕ dϕ = r sen θ dT dT

(13.37) (13.38) (13.39) (13.40)

A continuaci´on vamos a deducir una ecuaci´on interesante que combina las variables r, v y vϕ . Si el movimiento se desarrolla u ´nicamente en el plano ecuatorial, vθ = 0 y la ecuaci´on (13.37) dice que vr2 = v 2 − vϕ2 , o sea que: vr2 = 1− c2

Ã

v 2 vϕ2 1− 2 + 2 c c

!

En el segundo t´ermino del lado derecho multiplicar y dividir por (1 − s/r): 315

 " #2  ³ rvϕ /c vr2 s ´  1 − v 2 /c2 1 = 1− 1− + p 2 c r 1 − s/r 1 − s/r r2 Esta ecuaci´on se escribe concisamente as´ı: µ ¶ ³ vr2 s´ J2 = 1− 1− D+ 2 , c2 r r

(13.41)

1 − v 2 /c2 , 1 − s/r

(13.42)

donde D =

J = p

vϕ 1 − s/r c r

Las cantidades D y J son funciones de r, v y vϕ ; en general, D y J van cambiando a medida que el punto m´ovil progresa en su trayectoria. Pero hay una excepci´on importante: cuando la trayectoria del punto m´ovil es una geod´esica, las cantidades D y J se mantienen constantes, es decir, son constantes del movimiento. Esto lo veremos pronto.

13.5

Corrimiento hacia el rojo

Consideremos de nuevo los dos relojes de la secci´on anterior. La frecuencia a la que se emiten los proyectiles es ν1 = 1/∆T1 , y la frecuencia a la que se reciben es ν2 = 1/∆T2 . Si dividimos lado a lado estas dos ecuaciones se obtiene ν2 /ν1 = ∆T1 /∆T2 , y en vista de (13.35) se llega finalmente a: s ν2 = ν1

1 − s/r1 1 − s/r2

(13.43)

Si r2 < r1 entonces ν2 > ν1 : esto se llama corrimiento hacia el azul. Si r2 > r1 entonces ν2 < ν1 , y se llama corrimiento hacia el rojo. Uno se puede figurar, en la imaginaci´on, que mientras la luz baja (hacia la masa M ) se fortalece, aumenta su frecuencia y se corre hacia el azul. As´ı mismo, subir debilita a la luz, le disminuye su frecuencia2 y la corre hacia el rojo. 2

En ´ optica, cuando la luz pasa por materiales transparentes de diversos ´ındices de refracci´ on, su frecuencia y su color no cambian. Pero en la relatividad einsteiniana, cuando la luz pasa por una regi´ on donde hay campo gravitacional, su frecuencia y su color son cambiantes.

316

Pensemos en un pulso de luz emitido en la superficie de una estrella (la coordenada radial de este punto de emisi´on es r1 = R) y recibido en otro punto cuya coordenada radial es r2 = ∞. La f´ormula (13.43) da en este caso ν∞ = νR [1 − s/R]1/2 . Expandir el binomio: ν∞ = νR [1 − s/2R + · · ·]. Si s/R es peque˜ no conservamos los dos primeros t´erminos en esta serie, obteniendo ν∞ = νR [1 − s/2R], es decir ν∞

· ¸ GM = νR 1 − 2 c R

(13.44)

O sea que la frecuencia recibida en r = ∞ es menor que la emitida en la estrella: corrimiento hacia el rojo. En el viaje desde la estrella hasta el infinito, la luz sube de un lugar donde el potencial gravitacional newtoniano Φ = −GM/R es negativo, a otro donde es cero; en este ascenso la luz se debilita, su frecuencia disminuye y su color tira hacia el rojo. ¿Qu´e podr´ıamos decir de la luz que viaja desde el infinito hacia la estrella?: el descenso la fortalece, le aumenta la frecuencia y su color tira hacia el azul. Al subir, la luz se enrojece. Y al bajar se azulea. Para darnos cuenta de la magnitud del corrimiento pongamos en la f´ormula la masa y el radio del Sol: M¯ = 1.99 × 1033 g, R¯ = 6.96 × 1010 cm: ν∞ = ν¯ (1 − 2.12 × 10−6 ) En otras palabras, (ν¯ −ν∞ )/ν¯ es cerca de dos millon´esimas. Esta diferencia es peque˜ na, pero se ha observado. Tambi´en se ha observado el corrimiento hacia el rojo en la luz de otras estrellas, como por ejemplo Sirio y Eridani.3

13.6

Constantes del movimiento

A continuaci´on vamos a estudiar la ca´ıda libre de una part´ıcula de cualquier masa, bien sea m = 0 o m 6= 0. Tal como hemos visto, la trayectoria es una geod´esica. Lo primero es identificar las constantes del movimiento siguiendo 3

Hay tres clases de corrimiento hacia el rojo : 1) Debido a la explosi´ on del espacio (big bang), se corren hacia el rojo la luz de las galaxias y la radiaci´ on de fondo. 2) El del efecto Doppler, causado por la velocidad fuente-receptor y explicado por la relatividad especial en la secci´ on 5.8. Finalmente, 3) el gravitacional, explicado en esta secci´ on por la relatividad general.

317

la regla (10.15). Como x0 y x3 no aparecen en la m´etrica (13.13), podemos asegurar que g0β dxβ /dλ y g3β dxβ /dλ son constantes del movimiento:

g0β

dxβ dλ

= g00

dx0 dt dt = cg00 = c (1 − s/r) dλ dλ dλ

g3β

dxβ dλ

= g33

dx3 dϕ = −r2 sen2 θ dλ dλ

Ajustamos el par´ametro af´ın de manera que la primera constante valga 1 y a la segunda constante la llamamos −J. Escribimos entonces c(1−s/r)dt/dλ = 1 y −r2 sen2 θdϕ/dλ = −J, es decir, dλ = c (1 − s/r) dt J

= r2 sen2 θ

dϕ dλ

(13.45) (13.46)

Vamos a demostrar que el movimiento de la part´ıcula se desarrolla en un plano. Si J es cero en un instante, tambi´en ser´a cero en todos los instantes. Pero J es proporcional a dϕ/dλ, y podemos afirmar en consecuencia que si dϕ/dλ es cero en un instante, tambi´en ser´a cero en todos los instantes. Esto es lo que ocurre si la part´ıcula se mueve en un plano que pasa por los polos norte y sur. Esta idea se generaliza afirmando que si en un instante la part´ıcula se mueve en un plano (cualquiera) que pase por el centro, entonces ella nunca abandonar´a ese plano4 . Para simplificar la escritura conviene que orientemos al eje zeta de modo que el plano del movimiento sea el plano ecuatorial; haciendo θ = π/2, dθ = 0 en las ecuaciones (13.12) y (13.46) se obtiene: ds2 = (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 − r2 dϕ2 J dϕ dλ

= r2 =

dϕ dλ

(13.47) (13.48)

J r2

(13.49)

4

Recordemos la manera como se trata, en mec´ anica newtoniana, el problema de una part´ıcula sujeta a una fuerza central: el torque es cero ⇒ el momentum angular es constante ⇒ el movimiento se desarrolla en un plano.

318

13.7

Una tercera constante del movimiento

De las cuatro ecuaciones (10.8) de las geod´esicas ya hemos ejecutado dos, al identificar las dos constantes del movimiento de la secci´on anterior. Nos falta por considerar las otras dos ecuaciones de las geod´esicas: dxµ dxν d2 x1 1 + Γ =0 µν dλ2 dλ dλ

(13.50)

dxµ dxν d2 x2 2 + Γ =0 µν dλ2 dλ dλ

(13.51)

Utilizando los s´ımbolos Γ0 µν de la p´agina 307, y la escogencia θ = π/2, dθ = 0, es evidente que la ecuaci´on (13.51) se convierte en d2 θ/dλ2 = 0 , lo cual, si bien es cierto, no es u ´til. Nos queda entonces la ecuaci´on (13.50); r usando los coeficientes Γ µν de la p´agina 307 y la condici´on θ = π/2, dθ = 0, obtenemos: d2 r s − 2 dλ 2r(r − s)

µ

dr dλ

¶2

c2 s(r − s) + 2r3

µ

dt dλ

¶2

µ − (r − s)

dϕ dλ

¶2 =0

En el tercer t´ermino usar (13.45) y en el cuarto t´ermino usar (13.49): d2 r s − 2 dλ 2r(r − s)

µ

dr dλ

¶2 +

s(r − s) ³ s ´−2 J 2 (r − s) 1 − − =0 2r3 r r4

Multiplicar ambos lados de esta ecuaci´on por 2r dr d2 r s − 2 r − s dλ dλ (r − s)2

µ

dr dλ

¶3 +

2r dr : r − s dλ

2J 2 dr s dr − =0 (r − s)2 dλ r3 dλ

Reunir los dos primeros t´erminos con un com´ un denominador:

2r(r − s)

dr d2 r −s dλ dλ2 (r − s)2

µ

dr dλ

¶3 + 319

s dr 2J 2 dr − =0 (r − s)2 dλ r3 dλ

El lado izquierdo de esta ecuaci´on tiene tres t´erminos. El primer t´ermino es d r(dr/dλ)2 d r igual a ; el segundo t´ermino es − , y el tercer t´ermino dλ r − s dλ r − s d J2 es . La ecuaci´on es entonces dλ r2  µ ¶2  dr r d  r J2  dλ   − + 2=0  dλ  r − s r−s r 

o sea que la cantidad entre par´entesis es una constante, a la que llamaremos −D: µ ¶2 dr 1− J2 dλ D ≡ − (13.52) s r2 1− r dD = 0 (13.53) dλ La ecuaci´on (13.52) se puede escribir tambi´en as´ı : µ

13.8

dr dλ

¶2

µ ¶ ³ s´ J2 =1− 1− D+ 2 r r

(13.54)

J y D en t´ erminos de r, v y vϕ

Las variables naturales de la cinem´atica son la posici´on y la velocidad. Si nosotros conocemos la posici´on y la velocidad de una part´ıcula en cierto instante, deber´ıamos ser capaces de utilizar esa informaci´on para averiguar los valores de las constantes J y D. En esta secci´on nos proponemos deducir las f´ormulas correspondientes. Para ejecutar esta tarea debemos encontrar inicialmente la relaci´on que existe entre el par´ametro λ y el tiempo local p T : basta combinar las ecuaciones (13.28) y (13.45)para obtener dλ = cdT 1 − s/r. Con este resultado las ecuaciones (13.48) y (13.52) dan: J

1 dϕ = r2 p dT c 1 − s/r 320

D =

1 1− 2 c (1 − s/r) 1 − s/r

µ

dr dT

¶2 r2 − 2 c (1 − s/r)

µ

dϕ dT

¶2

Aqu´ı reconocemos las velocidades locales vr , vϕ y v 2 que hab´ıamos definido en las ecuaciones (13.37), (13.38) y (13.40), lo que nos permite escribir: J

=

D =

vϕ r p 1 − s/r c

(13.55)

1 − v 2 /c2 1 − s/r

(13.56)

Estas son las f´ormulas que busc´abamos. Si sabemos que una part´ıcula en ca´ıda libre pasa por r, y que al pasar por r tiene velocidades locales v y vϕ , entonces las ecuaciones (13.55) y (13.56) nos permiten averiguar los valores de J y D. Los valores r, v y vϕ que la part´ıcula tiene en cierto instante (es decir, las condiciones iniciales) determinan un´ıvocamente la trayectoria futura y pasada: en otros instantes la part´ıcula tiene que ajustar los valores de r, v y vϕ de modo que las cantidades J y D adopten los mismos valores que adoptaron en el instante inicial. Esto de ajustar es lo que quiere decir que J y D sean constantes del movimiento. Cada geod´esica en el espaciotiempo de Schwarzschild est´a caracterizada por dos n´ umeros, que son los valores que adoptan J y D. Una vez que la part´ıcula ha escogido determinada geod´esica (es decir, determinados valores de J y D), no podr´a abandonarla jam´as, ya que abandonarla ser´ıa como cambiar los valores iniciales de J y D. Continuemos con el examen de las ecuaciones (13.55) y (13.56). Es claro que ellas se combinan para producir esta otra relaci´on, que ser´a u ´til dentro de poco: Dr2 1 − v 2 /c2 = J2 vϕ2 /c2

(13.57)

De otro lado, las ecuaciones (13.55) y (13.56) se pueden invertir para expresar v y vϕ en t´erminos de las constantes D y J: v2 c2

³ s´ = 1− 1− D r 321

(13.58)

vϕ2 c2

=

³ s´ J2 1− r r2

(13.59)

Restamos lado a lado estas dos ecuaciones para obtener: µ ¶ ³ v 2 − vϕ2 s´ J2 =1− 1− D+ 2 c2 r r Pero v 2 − vϕ2 = vr2 , entonces µ ¶ ³ vr2 J2 s´ =1− 1− D+ 2 c2 r r

(13.60)

Obs´ervese que p dT dt dr dr dlr vr dr 1 = = 1 − s/r = = , dλ dt dλ dT c(1 − s/r) dT cdT c

(13.61)

o sea que las ecuaciones (13.60) y (13.54) son equivalentes. Observemos tambi´en la diferencia que existe entre las ecuaciones (13.41) y (13.60): en la primera ecuaci´on, las cantidades D y J son, en general, variables, mientras que en la segunda ecuaci´on las cantidades D y J son constantes del movimiento. A grandes distancias, la constante J tiene un significado que es familiar. En efecto, para s/r muy peque˜ no la ecuaci´on (13.55)da cJ ' rvϕ . En palabras, a grandes distancias cJ tiende al momentum angular zeta por unidad de masa. La constante D permite tambi´en algunos comentarios. Para un pulso de luz se tiene v = c, y en en este caso la ecuaci´on (13.56) dice que D = 0. Para part´ıcula masiva la ecuaci´on (13.58) es clara: dado un valor de D, la velocidad local v depende u ´nicamente de la coordenada r. Cuando la part´ıcula se acerca, r disminuye y la velocidad v tiene que aumentar. Esta ecuaci´on es an´aloga a la ecuaci´on newtoniana que dice que la energ´ıa total (que es constante) es la suma de la energ´ıa cin´etica y la energ´ıa potencial. La analog´ıa se confirma al estudiar el comportamiento de D en el l´ımite newtoniano: la ecuaci´on (13.56) es D = (1 − v 2 /c2 )(1 − s/r)−1 = (1 − v 2 /c2 )(1 + s/r + · · ·) 322

→ (1 − v 2 /c2 )(1 + s/r) ' 1 − (v 2 /c2 − s/r) = 1 −

2 c2

µ

¶ 1 2 v + Φ . Vemos 2

1 as´ı que (1 − D)c2 /2 → v 2 + Φ; en palabras, (1 − D)c2 /2 tiende a la energ´ıa 2 total (prerrelativista) por unidad de masa. ¿Cu´ales son los valores num´ericos que adoptan las constantes J y D? Esperamos responder esta pregunta, al menos medianamente, estudiando dos casos bien diferentes: el del planeta Tierra y el de una part´ıcula de alta velocidad que pasa por las cercan´ıas del origen. La Tierra en su ´orbita alrededor del Sol tiene una r promedio de 1.49 × 1013 cm y una velocidad promedio de 0.98 × 10−4 c ; como el s del Sol es 2.93 km, concluimos que J/s ' 5000 y D ' 1 + 0.00000001. Aprendemos que para los planetas solares J/s es un n´ umero muy grande y que D es muy cercano a 1, y mayor que 1. Pensemos ahora en una part´ıcula masiva de alta velocidad, v = 0.8c y r promedio igual a 10s; en este caso se obtiene J/s ' 8 y D ' 0.4.

13.9

Las cuatro variables t, T, τ y λ

Queremos hacer una recopilaci´on de las relaciones que existen entre las cuatro variables t, T, τ y λ. Antes de hacerlo conviene que repasemos el significado de esas variables. t es un tiempo universal. Un reloj en reposo en r = ∞ marca un tiempo t. El tiempo T es el que marca un reloj en reposo en un punto con coordenada radial r. El par´ametro af´ın dλ es el que participa en las ecuaciones de las geod´esicas. Para una part´ıcula masiva el intervalo ds2 es igual a c2 dτ 2 , donde dτ es el tiempo que marca un reloj que acompa˜ na a la part´ıcula. Se puede verificar, con lo expuesto en las p´aginas anteriores, que las relaciones entre las cuatro variables son: dλ = c (1 − s/r) dt c dλ = √ dτ D √ dτ = D (1 − s/r) dt p dT = 1 − s/r dt 323

(13.62) (13.63) (13.64) (13.65)

13.10

dT

=

1 p dτ D (1 − s/r)

(13.66)

dT

=

1 p dλ c 1 − s/r

(13.67)

La ca´ıda vertical

Hagamos una pausa para estudiar una trayectoria simple, que es la que describe una part´ıcula masiva que se suelta desde cierta altura. Este es, sin duda, uno de los problemas m´as importantes de la f´ısica, como lo demuestra el inter´es que Galileo le prest´o al construir las bases de la ciencia moderna. Suponemos que la part´ıcula se suelta desde una altura r0 . Este dato deber´ıa ser suficiente para determinar la constante D; en efecto, haciendo v = 0 en la ecuaci´on (13.56) encontramos D=

1 1 − s/r0

(13.68)

Igualando los lados derechos de las ecuaciones (13.56) y (13.68) se obtiene: s v = c

r0 = s

s/r − s/r0 1 − s/r0 1 − v 2 /c2 s/r − v 2 /c2

(13.69)

(13.70)

Pensemos en este momento en el problema rec´ıproco, el de una part´ıcula masiva que inicialmente est´a en r y que se dispara hacia arriba con una velocidad v. A medida que asciende, su velocidad disminuye hasta que se vuelve cero en r0 . Vemos as´ı que la ecuaci´on (13.69) da respuesta a dos preguntas: a) da la velocidad (en r) que tiene una part´ıcula que se suelta en r0 y, b) da la velocidad vertical que hay que impartirle a una part´ıcula para que alcance una altura m´axima r0 . Del mismo modo, la ecuaci´on (13.70) responde dos preguntas: a) si se sabe que una part´ıcula tiene (en r) una velocidad v hacia abajo, la ecuaci´on nos permite averiguar desde qu´e altura fue soltada, y, b) si una part´ıcula se dispara (en r) hacia arriba, la ecuaci´on dice cu´al es la altura m´axima que ella alcanza. 324

La ecuaci´on (13.69) tiene un caso interesante, y es cuando r0 = ∞: p v = c s/r

para r0 = ∞

(13.71)

En palabras: si, con un disparo vertical, se quiere enviar una part´p ıcula al infinito, se le debe impartir una velocidad local mayor o igual que c s/r. Concentr´emonos ahora en otro aspecto de la ca´ıda vertical, que es el c´alculo del tiempo que transcurre entre r0 y r. Como el movimiento se da u ´nicamente en la direcci´on radial, la constante J es cero y la ecuaci´on (13.54) queda as´ı: µ ¶2 dr = 1 − (1 − s/r)D (13.72) dλ Utilizar la ecuaci´on (13.63): Ã√ !2 ³ D dr s´ =1− 1− D c dτ r

(13.73)

Al tomar ra´ız cuadrada surge un ±; escogemos el signo − porque la part´ıcula est´a cayendo: √ r ³ D dr s´ =− 1− 1− D, c dτ r es decir: rdr

cdτ = − r

D−1 2 sr − r D

y utilizando la ecuaci´on (13.68):

cdτ

rdr

= −r

sr − 325

s 2 r r0

,

cdτ

¶ r r2 r0 = −√ 0 s µ ¶ sr0 r r 2 − r0 r0 r d r0

µ

(13.74)

Llamar x ≡ r/r0 e integrar, asumiendo que el reloj τ comienza a marchar cuando la part´ıcula se suelta: Z

τ

c 0

r2 dτ = − √ 0 sr0

Z

r/r0

1

xdx √ x − x2

(13.75)

La integral del lado derecho se resuelve con ayuda de la f´ormula 2.264.2 de [14], que es Z

p xdx 1 √ = − x − x2 − arc sen(1 − 2x) 2 2 x−x

La ecuaci´on (13.75) es entonces s  µ ¶2 µ ¶ r02  r r 2r π 1 cτ = √ − + + arc sen 1 − sr0 r0 r0 2 r0 4

(13.76)

Tambi´en nos interesa calcular t , el tiempo coordenado, y esto es un poco m´as dif´ıcil. Veamos: en vista de la ecuaci´on (13.62) la ecuaci´on (13.72) es 1 (1 − s/r)2

µ

dr cdt

¶2 = 1 − (1 − s/r)D ,

y utilizando la f´ormula (13.68): 1 (1 − s/r)2

µ

dr cdt

¶2 =1−

de donde despejamos cdt: 326

1 − s/r , 1 − s/r0

p

cdt = −

1 − s/r0 dr p (1 − s/r) s/r − s/r0

(13.77)

Para integrar el lado derecho de esta ecuaci´on conviene [24] hacer el cambio de variable η = arc cos(2r/r0 − 1) , para finalmente llegar a r ¯r ¯ ¯ r0 ¯ r0 ¯ − 1 ¯¯ ¯ s −1+ r ¯ + r ct = s ln ¯¯ r ¯ r r 0 0 ¯ ¯ − 1 − − 1 ¯ ¯ s r   s r µ ¶ µ ¶2 ³ ´ r0 r0 2r r0 r r  s −1  + 1 arc cos −1 + + s 2s r0 s r0 r0 (13.78) Esta es verdaderamente la integraci´ on de la ecuaci´on (13.77); para cerciorarse de ello basta verificar que la ecuaci´on (13.77) se obtiene tomando diferenciales en ambos lados de (13.78). Observemos que el logaritmo en el lado derecho de la ecuaci´on (13.78) diverge en r = s . Esto quiere decir que para llegar a r = s la part´ıcula toma una cantidad infinita de tiempo coordenado t . La Figura 13.4 muestra dos curvas: en trazo continuo el tiempo propio τ dado por la f´ormula (13.76), y en trazo punteado el tiempo coordenado t dado por la f´ormula (13.78). Notoriamente, el tiempo propio τ es una funci´on de buena conducta, mientras que el tiempo coordenado t tiene un comportamiento muy preocupante. En la secci´on 13.19 abordaremos de nuevo este asunto. Finalmente, es interesante anotar que la f´ısica newtoniana da la misma respuesta (13.76). En efecto, en la gravitaci´ on de Newton el potencial gravitacional es −GM/r = −c2 s/2r, y por consiguiente la energ´ıa total para una part´ıcula de masa m es −c2 sm/2r + 12 mu2 . Como esta energ´ıa es una constante del movimiento podemos escribir −

c2 sm c2 sm 1 + mu2 = − + 0, 2r 2 2r0

de donde 327

µ u2 = c2 s

1 1 − r r0



Esta ecuaci´on newtoniana coincide con la ecuaci´on relativista (13.73), o sea que el tiempo newtoniano es el mismo tiempo dado por la ecuaci´on (13.76).

13.11 Definimos

Potencial efectivo µ ¶ s´ J2 V = 1− D+ 2 r r ³

(13.79)

de modo que la ecuaci´on (13.60) es vr2 = 1−V c2

(13.80)

Al tomar la derivada d/dT en ambos lados de esta ecuaci´on se obtiene dV dlr dV dV 2vr dvr =− =− = −vr , o sea que 2 c dT dT dT dlr dlr dvr c2 dV =− dT 2 dlr

(13.81)

Esta ecuaci´on es de la forma “aceleraci´on es menos el gradiente del potencial”, y por esta raz´on V recibe el nombre de potencial efectivo. Como vr2 ≥ 0, el lado derecho de la ecuaci´on (13.80) tambi´en tiene que ser ≥ 0: el movimiento de la part´ıcula est´a permitido solamente en aquellas regiones del espacio donde V ≤ 1. El gr´afico de V versus r es sumamente u ´til. En un mismo gr´afico se traza la funci´on V versus r y se traza una l´ınea horizontal a una altura 1; la part´ıcula puede moverse u ´nicamente en aquellas regiones donde V est´a por debajo de la l´ınea horizontal de altura 1. La ecuaci´on (13.81) corresponde a un problema ficticio unidimensional en el que la fuerza es proporcional a −dV /dr. En aquellas regiones donde V es una funci´on decreciente de r, la fuerza es repulsiva; y all´ı donde V es una funci´on creciente, la fuerza es atractiva. Los puntos de retorno ocurren en aquellos valores de r en los que V = 1. El movimiento circular ocurre cuando se cumplen estas dos condiciones: V = 1 y dV /dr = 0; si d2 V /dr2 < 0, el 328

movimiento circular es inestable, y si d2 V /dr2 > 0 es estable. La Figura 13.2 muestra las posibilidades que tiene un fot´on (D = 0) que tiene un valor de J dado por J = 2.7s ; en la gr´afica, A y B son puntos de retorno: el movimiento es posible u ´nicamente en las regiones r < rA y r > rB ; en la primera regi´on las ´orbitas son ligadas y en la segunda desligadas. La Figura 13.3 es para una part´ıcula masiva que tiene D = 0.5 y J = 2.7s ; tambi´en en esta gr´afica A y B son puntos de retorno: el movimiento es posible u ´nicamente en las regiones r < rA y r > rB ; en la primera regi´on las ´orbitas son ligadas y en la segunda desligadas. El lector seguramente reconoce el mismo m´etodo y los mismos elementos gr´aficos que se usan en mec´anica cl´asica: potencial efectivo, puntos de retorno, pozos de potencial, etc. Hay sin embargo una diferencia importante entre los gr´aficos de la mec´anica cl´asica y los de la soluci´on de Schwarzschild: en los primeros la l´ınea horizontal representa energ´ıa total y es de altura variable, en cambio en los segundos la l´ınea horizontal es de altura fija 1. M´ aximos y m´ınimos de V (r). Calculemos las dos primeras derivadas del potencial efectivo, usando la ecuaci´on (13.79): dV dr

=

d2 V dr2

=

¶ Dr2 2r +3− J2 s ¶ µ 2sJ 2 Dr2 3r − 2 −6+ r5 J s sJ 2 r4

µ

(13.82) (13.83)

En los m´aximos y m´ınimos ocurre que dV /dr = 0. Al hacer dV /dr = 0 en (13.82) se obtiene: Dr2 2r = 0 +3− 2 J s

(13.84)

Las soluciones de esta ecuaci´on son: " # r J2 3Ds2 r= 1± 1− Ds J2

(13.85)

Para que los m´aximos y m´ınimos verdaderamente existan es necesario que 329

los valores dados en la ecuaci´on (13.85) sean cantidades reales, es decir, que 3Ds2 1− sea ≥ 0: J2 J2 ≥1 3Ds2

(13.86)

La f´ormula (13.85) presenta dos valores de r. ¿En cu´al de ellos ocurre un m´aximo y en cu´al un m´ınimo? Para responder esta pregunta debemos evaluar la segunda derivada d2 V /dr2 en los puntos (13.85) y determinar si d2 V /dr2 es negativa o positiva. Al colocar (13.85) en (13.83) se obtiene: 6J 2 s d2 V = dr2 r5

Ã

" # ! r 3Ds2 J2 1± 1− −1 3Ds2 J2

(13.87)

Utilizando (13.86) en (13.87) vemos que con el signo superior se obtiene d2 V /dr2 > 0, y con el signo inferior d2 V /dr2 < 0. Leamos finalmente la ecuaci´on (13.85) as´ı:

r =

r =

" # r 3Ds2 J2 1− 1− Ds J2 " # r J2 3Ds2 1+ 1− Ds J2

V es m´aximo

(13.88)

V es m´ınimo

(13.89)

N´otese que (13.88) es menor que (13.89): si el m´aximo y el m´ınimo de V ocurren (ver condici´on (13.86)), el m´aximo se presenta en las cercan´ıas del origen, y el m´ınimo en las lejan´ıas. Una curva t´ıpica es as´ı: V es cero en r = s y asciende mon´otonamente hasta el r dado por (13.88). All´ı comienza a descender hasta que logra el m´ınimo en el r dado por (13.89). All´ı comienza a ascender de nuevo y tiende asint´ oticamente al valor V = D. Es en este u ´ltimo pozo de potencial donde est´an los planetas del sistema solar. La ecuaci´on (13.85) da los valores de r en t´erminos de las constantes D y J. Tambi´en es deseable expresar estos r en t´erminos de las velocidades locales v y vϕ , y para tal efecto usamos la ecuaci´on (13.57) en (13.84), con lo que se llega al siguiente resultado: 330

3 1 − v 2 /c2 r = + s 2 2vϕ2 /c2

V m´ aximo o m´ınimo

(13.90)

´ Puntos de retorno. Estos ocurren en aquellos valores de r donde vr = 0, es decir: vϕ = v

puntos de retorno

(13.91)

Trayectoria circular. La ´orbita es circular si se cumplen simult´ aneamente las condiciones (13.90) y (13.91). Combinando estas dos ecuaciones obtenemos 1 1 r = 1+ s 2 v 2 /c2

´orbita circular

(13.92)

La trayectoria circular es inestable si V est´ a en el m´aximo, y es estable si V es m´ınimo. En otras palabras, inestable para d2 V /dr2 < 0, y estable para d2 V /dr2 > 0. Investiguemos entonces bajo qu´e condiciones d2 V /dr2 < 0 utilizando la ecuaci´on (13.83): −

3r Dr2 c/2



inestable



r < 3s

331

(13.93)

13.12

Puntos de retorno

En ocasiones lo que se conoce de la trayectoria de una part´ıcula es los puntos de retorno. En esta secci´on nos proponemos aprovechar esa informaci´on para averiguar el valor de las constantes D y J 2 . En los puntos de retorno se hace cero el lado derecho de la ecuaci´on (13.60): µ ¶ ³ J2 s´ D + 2 = 0, 1− 1− r r es decir: r3 −

sD 2 J2 sJ 2 r + r− = 0 D−1 D−1 D−1

(13.94)

Esta es una ecuaci´on de tercer grado y tiene, naturalmente, tres soluciones, que llamaremos r1 , r2 y r3 . Las tres ra´ıces r1 , r2 , r3 son, en general n´ umeros complejos, y denotan puntos verdaderos de retorno cuando son n´ umeros positivos. La ecuaci´on (13.94) se puede escribir de esta otra manera: (r − r1 )(r − r2 )(r − r3 ) = 0

(13.95)

Al expandir todos los productos en esta ecuaci´on se obtiene r3 − (r1 + r2 + r3 ) r2 + (r1 r2 + r2 r3 + r3 r1 ) r − r1 r2 r3 = 0

(13.96)

Ahora comparamos uno a uno los t´erminos de las ecuaciones (13.94) y (13.96), para llegar a:

r1 + r2 + r3 =

sD D−1

(13.97)

r1 r2 + r2 r3 + r3 r1 =

J2 D−1

(13.98)

r1 r2 r3 =

sJ 2 D−1

(13.99)

332

Estas tres ecuaciones se pueden utilizar de dos maneras. La primera es expresar a las ra´ıces r1 , r2 y r3 en t´erminos de las constantes D y J 2 : se obtienen unas ecuaciones sumamente complicadas. La segunda es expresar a las constantes D y J 2 en t´erminos de dos ra´ıces r1 y r2 : sr1 r2 r1 + r2 r1 r2 − s(r1 + r2 ) + s2

r1 r2 − s(r1 + r2 ) + D = J2 =

s (r1 r2 )2 r1 + r2 r1 r2 − s(r1 + r2 ) + s2

(13.100) (13.101)

Es claro que en estas expresiones la pareja r1 , r2 puede ser substituida por r2 , r3 o por r3 , r1 . Entre las tres ra´ıces r1 , r2 y r3 existe una relaci´on muy simple. Para deducirla dividamos ambos lados de (13.99) por s: J2 r1 r2 r3 = s D−1

(13.102)

Igualamos los lados izquierdos de las ecuaciones (13.98) y (13.102) para obtener: 1 1 1 1 + + = , r1 r2 r3 s

(13.103)

· ¸ r3 s s −1 = 1− − s r1 r2

(13.104)

o, equivalentemente:

Los planetas. En el sistema solar los planetas est´an en la zona lejana. La ´orbita de la Tierra, por ejemplo, tiene un radio promedio de 1.49 × 1013 cm. Comparando esto con s = 2.93 × 105 cm nos damos cuenta de que la raz´on entre estas dos cantidades es del orden de 10−8 . Si tomamos r1 y r2 como el perihelio y el apelio de la ´orbita terrestre, vemos que s/r1 y s/r2 son cantidades muy peque˜ nas, del orden de 10−8 . Es razonable despreciar s2 en el denominador de (13.100) y despreciar −s(r1 + r2 ) + s2 en el denominador de (13.101), para escribir esas ecuaciones de esta forma aproximada: 333

D '

µ ¶ sr1 r2 r1 r2 − s(r1 + r2 ) + [r1 r2 − s(r1 + r2 )]−1 (13.105) r1 + r2

J2 '

sr1 r2 r1 + r2

(13.106)

Los factores [ ]−1 que aparecen en (13.104) y (13.105) se expanden con la f´ormula del binomio de Newton y se desprecian los t´erminos en s2 , y as´ı llegamos a estas dos ecuaciones: s r1 + r2 s s ' 1+ + r1 r2

D ' 1+

(13.107)

r3 s

(13.108)

En el caso particular de la ´orbita terrestre los datos astron´omicos son r1 = 1.47 × 1013 cm y r2 = 1.52 × 1013 cm. Entonces: r3 s

' 1 + 3.95 × 10−8

D ' 1 + 0.98 × 10−8 J2 s2

' 0.255 × 108

Con estos resultados el potencial efectivo para la Tierra es: µ ¶ ³ s´ s2 −8 8 V (r) = 1 − 1 + 0.98 × 10 + 0.255 × 10 × 2 r r No es f´acil dibujar, en una sola p´agina, el potencial V (r) en todo el rango 1 ≤ r/s ≤ ∞, debido a que ocurren n´ umeros muy dispares. En r/s = 1 el potencial vale cero y crece r´apidamente para alcanzar el valor V = 3.8 × 106 en r/s = 3/2. All´ı comienza a descender lentamente hasta llegar al m´ınimo: V = 1 − 0.98 × 10−8 en r/s = 0.51 × 108 . Entonces comienza a crecer de nuevo hasta V = 1+0.98×10−8 en r/s = ∞. Los puntos de retorno est´an en r3 /s = 1+3.95×10−8 , en r1 /s = 0.50×108 y en en r2 /s = 0.52×108 . Es claro que en la zona lejana se forma un pozo de potencial, en el que reside nuestro planeta. Este pozo es muy pando y muy angosto. Su profundidad respecto a la l´ınea recta de altura 1 es apenas 0.98 × 10−8 ; nos podemos formar una idea del ancho dividiendo a r2 − r1 sobre r1 , as´ı: (r2 − r1 )/r2 = 0.04: apenas un 4 % . 334

13.13

Eliminaci´ on del par´ ametro af´ın λ

Las coordenadas (r, ϕ) de la part´ıcula son funciones de λ. Queremos eliminar el par´ametro af´ın. Las ecuaciones (10.21) y (10.27) nos ense˜ naron que para tal eliminaci´on debemos intentar una derivaci´ on en cadena. Siguiendo esta recomendaci´on hacemos d/dλ = (dϕ/dλ)(d/dϕ) , y en vista de la ecuaci´on (13.46): d d J = 2 2 dλ r sen θ dϕ Ahora, como todas las trayectorias que estamos estudiando pertenecen al plano ecuatorial: d J d = 2 dλ r dϕ Aplicar ambos lados de esta ecuaci´on a la variable r: dr J dr = 2 , dλ r dϕ y elevando al cuadrado: µ

dr dλ

¶2

J2 = 4 r

µ

dr dϕ

¶2 (13.109)

Igualamos los lados derechos de las ecuaciones (13.54) y (13.109), para obtener µ ¶ µ ¶ ³ J 2 dr 2 s´ J2 =1− 1− D+ 2 , (13.110) r4 dϕ r r es decir: s 1 1 dr =± r2 dϕ J

µ ¶ ³ s´ J2 1− 1− D+ 2 , r r

o tambi´en: 335

(13.111)

1 dr r2 dϕ = ± s µ ¶ ³ 1 s´ J2 1− 1− D+ 2 J r r

(13.112)

Hemos logrado nuestro prop´osito, ya que esta ecuaci´on no muestra ninguna dependencia expl´ıcita con el par´ametro af´ın λ, ni con ning´ un tiempo t, τ ni T.

13.14

La variable u

Hacemos un cambio de variable usual en mec´anica celeste: u ≡ mamos u0 = du/dϕ. La ecuaci´on (13.110) es entonces J 2 u02 = 1 − D + sDu − J 2 u2 + sJ 2 u3

1 , y llar

(13.113)

Tomamos otra derivada respecto a ϕ: µ 00

0

(u + u)u =

¶ sD 3s 2 u u0 + 2J 2 2

(13.114)

En los puntos de retorno ocurre que u0 = 0. En aquellos puntos donde u0 6= 0 podemos dividir ambos lados de (13.114) por u0 para obtener: u00 + u =

sD 3s 2 u : Einstein + 2 2J 2

(13.115)

Comparaci´ on. En este momento es importante establecer una comparaci´on con los resultados [25] de la mec´anica newtoniana: u00 + u =

s 2J 2

:

Newton

(13.116)

Las ecuaciones (13.115) y (13.116) son diferentes, lo que quiere decir que las teor´ıas newtoniana y einsteiniana predicen trayectorias diferentes para las part´ıculas en ca´ıda libre. Recu´erdese en particular un resultado de la geometr´ıa anal´ıtica elemental seg´ un el cual u00 + u = const. positiva es la 336

ecuaci´on general de las curvas c´onicas, y u00 + u = 0 es la ecuaci´on de la l´ınea recta: u00 + u = const. positiva :

c´onicas

(13.117)

u00 + u = 0 :

l´ınea recta

(13.118)

Las ecuaciones (13.116) y (13.117) muestran que en la teor´ıa newtoniana las trayectorias son curvas c´onicas; las ecuaciones (13.115) y (13.117) muestran que en la teor´ıa einsteiniana las trayectorias no son curvas c´onicas. Para mejor comparar las ecuaciones einsteiniana y newtoniana podemos reescribir la ecuaci´on (13.115) de la manera siguiente: u00 + u =

s s(D − 1) 3s 2 u : Einstein + + 2 2J 2J 2 2

(13.119)

Observando las ecuaciones (13.116) y (13.119) nos damos cuenta de que la diferencia entre las trayectorias newtoniana y einsteiniana procede de los dos u ´ltimos t´erminos del lado derecho de (13.119). En algunos casos estos dos t´erminos son de tama˜ no considerable y no pueden despreciarse. ¿Podemos despreciar estos dos t´erminos en el movimiento de los planetas alrededor del Sol? En el caso de la Tierra, al usar los valores num´ericos de la p´agina 334 descubrimos que estos dos u ´ltimos t´erminos son 108 veces m´as peque˜ nos que el primer t´ermino del lado derecho de (13.119). En el caso de Mercurio, por estar m´as cercano al sol, estos dos t´erminos, aunque peque˜ nos, son de un tama˜ no suficiente para producir diferencias observables, tal como veremos m´as tarde cuando estudiemos la precesi´on del perihelio de Mercurio. Antes de cerrar esta secci´on veamos la ecuaci´on de la trayectoria de un pulso de luz, haciendo D = 0 en la ecuaci´on (13.115): u00 + u =

3s 2 u 2

(13.120)

Comparando esta ecuaci´on con (13.118) vemos que, de acuerdo con la teor´ıa einsteiniana, la trayectoria de un pulso de luz no es una l´ınea recta, asunto de primera importancia que trataremos enseguida. 337

13.15

Deflexi´ on de un rayo de luz

Vamos a estudiar la trayectoria de un rayo de luz que incide desde la derecha, como muestra la Figura 13.5. La coordenada r, que inicialmente es infinita, disminuye gradualmente hasta que alcanza un m´ınimo valor r0 . Despu´es de este punto la coordenada r crece mon´otonamente. Claramente r0 es un punto de retorno, y por consiguiente vϕ = v = c, y la ecuaci´on (13.55) da (J/r0 )2 = (1 − s/r0 )−1 . En t´erminos de u0 = 1/r0 esta ecuaci´on se escribe: (Ju0 )−2 = 1 − su0

(13.121)

Por tratarse de la luz, D = 0 y la ecuaci´on (13.113) da u02 = J −2 − u2 + su3 . Dividir ambos lados de esta ecuaci´on por u20 y definir x ≡ u/u0 para escribir: x02 = (Ju0 )−2 − x2 + su0 x3 Utilizar la ecuaci´on (13.121): x02 = 1 − su0 − x2 + su0 x3 = 1 − x2 − su0 (1 − x3 ) · µ 2 = (1 − x ) 1 − su0 x +

1 1+x

¶¸

Como x0 = dx/dϕ, la u ´ltima ecuaci´on se puede escribir de esta otra manera equivalente: dx · µ 2 (1 − x ) 1 − su0 x +

dϕ = ± s

1 1+x

¶¸

· µ ¶¸−1/2 dx 1 = ±√ 1 − su0 x + 1+x 1 − x2 Ahora usamos la f´ormula del binomio de Newton para expandir el factor [ ]−1/2 conservando solamente los dos primeros t´erminos en la serie: 338

· µ ¶¸ 1 dx 1 dϕ ' ± √ 1 + su0 x + 2 1+x 1 − x2 Integrar: Z

Z

ϕ(r0 )

dϕ = ± 0

0

1

· µ ¶¸ 1 1 dx √ 1 + su0 x + 2 1+x 1 − x2

Ã

1 ϕ(r0 ) = ± arc sen x − su0 2 ´ ³π + su0 = ± 2

à p

1−

x2

!!¯1 √ ¯ 1 − x2 ¯ + ¯ ¯ 1+x 0

El doble de este ´angulo es la direcci´on en la que el rayo emerge: 2ϕ(r0 ) = π + 2su0 Si no hubiera la masa M , entonces s ser´ıa cero y se tendr´ıa 2ϕ(r0 ) = π . Esto quiere decir que 2su0 es la deflexi´on ocasionada por M . La llamamos α: α = 2su0 =

2s 4GM = 2 r0 c r0

(13.122)

Usando en (13.122) los valores num´ericos G/c2 = 7.425 × 10−29 cm/g, M = M¯ = 1.99 × 1033 g, y b = R¯ = 6.96 × 1010 cm se obtiene α = 1.74 segundos. Esta cifra, predicha por Einstein [19] en 1915, ha sido confirmada en m´ ultiples ocasiones.

13.16

La precesi´ on an´ omala del perihelio de Mercurio

Se sabe que la ´orbita mercurial no es est´atica, sino que su perihelio rota alrededor del Sol. M´as precisamente, podemos hablar del ´angulo que barre el planeta mientras va del perihelio al apelio. Si se tratara de una elipse perfecta, tal ´angulo ser´ıa π. Pero las observaciones astron´omicas muestran 339

que el ´angulo no es exactamente π, lo que significa que la ´orbita no es exactamente el´ıptica, sino que el perihelio precesa. La velocidad angular de esta precesi´on es 5600.73 segundos de arco cada siglo. La gravitaci´on newtoniana admite dos causas para la precesi´on. La primera (que da cuenta de 5025 seg/siglo) se debe a que las observaciones se hacen desde un sistema m´ovil, rotante, que es la Tierra. La segunda (que da cuenta de 532 seg/siglo) se debe a las perturbaciones ejercidas por los otros planetas, especialmente Venus, Tierra y J´ upiter. Vemos as´ı que la teor´ıa newtoniana da cuenta de 5025 + 532 = 5557 seg/siglo. Pero la precesi´on observada no es 5557 seg/siglo sino 5600.73 seg/siglo. La diferencia, que es 5600.73 − 5557 = 43.11 parec´ıa inexplicable. Y por eso se llam´o “la precesi´on an´omala”del perihelio de Mercurio. La precesi´on an´omala fue un misterio durante 69 a˜ nos. Los astr´onomos buscaron, sin ´exito, una explicaci´on de esta “anomal´ıa”hasta que, por fin, Einstein la pudo explicar [19] en el contexto de su teor´ıa gravitacional. La ecuaci´on (13.113) es u02 =

1 − D sD + 2 u − u2 + su3 J2 J

Escrib´amosla de manera factorizada: u02 = s(u − u1 )(u − u2 )(u − u3 )

(13.123)

Las constantes u1 , u2 y u3 son las soluciones de la ecuaci´on s(u − u1 )(u − u2 )(u − u3 ) = 0 es decir, u1 , u2 y u3 son los puntos de retorno. Pensemos que u1 y u2 son el perihelio y el apelio de Mercurio, y que u3 es el tercer punto de retorno, muy cercano al centro de coordenadas. En este momento escribimos de nuevo la ecuaci´on (13.103) en t´erminos de las cantidades u1 , u2 y u3 : u1 + u2 + u3 = 1/s 340

de donde u3 = 1/s − u1 − u2 . Al poner esta expresi´on en (13.123) se llega a: 02

u

µ ¶ 1 = s(u − u1 )(u − u2 ) u − + u1 + u2 s £ ¤ = −(u − u1 )(u − u2 ) 1 − su − s(u1 + u2 ) · ¸ s(u1 + u2 ) = −(u − u1 )(u − u2 )(1 − su) 1 − 1 − su

Como u0 = du/dϕ, esta ecuaci´on es: ¶¸ · µ s(u1 + u2 ) −1/2 dϕ = ±du −(u − u1 )(u − u2 )(1 − su) 1 − 1 − su Expresar el lado derecho como el producto de tres factores: −1/2

dϕ = ±du [−(u − u1 )(u − u2 )]

−1/2

(1 − su)

¶ µ s(u1 + u2 ) −1/2 1− 1 − su

Los dos u ´ltimos factores se expanden como potencias de su, que es una cantidad peque˜ na, as´ı : 1 1 (1 − su)−1/2 = 1 + su + ... ' 1 + su 2 2 ¶ µ ¡ ¢−1/2 s(u1 + u2 ) −1/2 1− = 1 − s(u1 + u2 )(1 − su)−1 1 − su ' (1 − s(u1 + u2 ))−1/2 1 ' 1 + s(u1 + u2 ) 2 Entonces regresamos a la ecuaci´on de dϕ para escribir: −1/2

dϕ = ±du [−(u − u1 )(u − u2 )]

341

µ ¶µ ¶ 1 1 1 + su 1 + s(u1 + u2 ) 2 2

µ ¶ 1 + 21 su 1 = ± 1 + s(u1 + u2 ) p du 2 −(u − u1 )(u − u2 ) Ya estamos en condici´on de integrar. Se verifica f´acilmente que Z

1 + 21 su 1 p p du = − s −(u − u1 )(u − u2 ) − 2 −(u − u1 )(u − u2 ) µ ¶ 1 u1 + u2 − 2u 1 + s(u1 + u2 ) arc sen 4 u1 − u2

O sea que Z

ϕ(u2 )

ϕ(u1 )

·

¶ µ 1 dϕ = ± 1 + s(u1 + u2 ) × 2

µ ¶ ¸¯ 1 p 1 u1 + u2 − 2u ¯¯u2 − s −(u − u1 )(u − u2 ) − 1 + s(u1 + u2 ) arc sen ¯ 2 4 u1 − u2 u1

¶· µ ¶¸ µ 1 1 ϕ(u2 ) − ϕ(u1 ) = ± 1 + s(u1 + u2 ) −π 1 + s(u1 + u2 ) 2 4 µ ¶ 3 1 2 2 = ∓π 1 + s(u1 + u2 ) + s (u1 + u2 ) 4 8 µ ¶ 3 ' ∓π 1 + s(u1 + u2 ) 4 Escoger el signo positivo: 2 (ϕ(u2 ) − ϕ(u1 )) = 2π +

3π s(u1 + u2 ) 2

El u ´ltimo t´ermino del lado derecho es la precesi´on an´omala: el ´angulo que se corre el perihelio en cada vuelta: ∆ ≡ =

3π s(u1 + u2 ) 2 3πGM (u1 + u2 ) c2 342

Ahora, podemos expresar a u1 y u2 en t´erminos de la excentricidad ² y el semieje mayor b: 1 u1 1 u2

= r1 = (1 − ²)b = r2 = (1 + ²)b ,

∆=

o sea que

6πGM − ²2 )

c2 b(1

(13.124)

Pongamos en la ecuaci´on (13.124) los datos de Mercurio:

∆ =

6π(6.67 × 10−8 )(1.99 × 1033 ) (3 × 1010 )2 (5.79 × 1012 )(1 − 0.2062 )

= 5.01 × 10−7

rad. cada vuelta

Como el per´ıodo es 0.241 a˜ nos = 0.00241 siglos, tenemos:

∆ =

5.01 × 10−7 0.00241

= 44.9

rad. cada siglo

segundos cada siglo

¦¦¦¦¦¦¦¦¦¦¦

La soluci´on de Schwarzschild coincide, a grandes distancias, con la gravitaci´on newtoniana. Esto no puede sorprendernos, ya que al construir la soluci´on relativista nos hemos apoyado firmemente en el potencial gravitacional cl´asico Φ = −GM/c2 r , como puede verse en los pasos que siguen a la ecuaci´on (13.8). A medianas distancias comienzan a notarse las diferencias entre las dos teor´ıas gravitacionales, con efectos como la precesi´on del perihelio de Mercurio. A cortas distancias las diferencias son radicales: cuando 343

la coordenada r es igual a s aparece un horizonte, es decir, una superficie que s´olo se puede cruzar hacia adentro. Para r < s la relatividad predice unos efectos sorprendentes: la coordenada t se vuelve espacialoide, la coordenada r se vuelve temporaloide y el centro r = 0 adquiere la cualidad de atractor inevitable. En lo que resta del cap´ıtulo vamos a estudiar estos efectos curiosos.

13.17

Coordenadas temporaloides y espacialoides

Consideremos de nuevo la trayectoria de un punto que se mueve radialmente. Haciendo dθ = dϕ = 0 en la ecuaci´on (13.12) escribimos: (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = ds2

(13.125)

Para un pulso de luz se tiene ds2 = 0 y para part´ıcula masiva hacemos ds2 > 0 : (1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 = 0 ,

m=0

(13.126)

(1 − s/r) c2 dt2 − (1 − s/r)−1 dr2 > 0 ,

m 6= 0

(13.127)

En la zona exterior, r > s y la cantidad (1 − s/r) es positiva. Podemos dividir ambos lados de la desigualdad (13.127) por (1 − s/r) sin afectar el signo >, para llegar a: c2 dt2 > (1 − s/r)−2 dr2

(13.128)

Esta desigualdad se cumple u ´nicamente si dt 6= 0 . Esto quiere decir que el progreso del movimiento, el desarrollo del fen´omeno, va necesariamente acompa˜ nado de un cambio en la coordenada t, y por esta raz´on t se llama coordenada temporaloide. La desigualdad (13.128) no impone ninguna condici´on sobre dr, el cual puede ser positivo, negativo o cero, y por eso a r le decimos coordenada espacialoide. En la regi´on r > s, la ecuaci´on (13.12) muestra que al diferencial temporaloide dt lo acompa˜ na el factor positivo (1 − s/r), mientras que al diferencial espacialoide dr lo acompa˜ na el factor 344

negativo − (1 − s/r)−1 . Ahora veamos lo que ocurre en la zona interior, r < s : la cantidad (1 − s/r) es negativa. Si multiplicamos ambos lados de la desigualdad (13.127) por (1 − s/r) debemos cambiar el signo > por el signo < , as´ı: dr2 > (1 − s/r)2 c2 dt2

(13.129)

Esta desigualdad se cumple u ´nicamente si dr 6= 0 . Esto quiere decir que el progreso del movimiento, el desarrollo del fen´omeno, va necesariamente acompa˜ nado de un cambio en la coordenada r, y por esta raz´on r se llama coordenada temporaloide. La desigualdad (13.129) no impone ninguna condici´on sobre dt, el cual puede ser positivo, negativo o cero, y por eso a t le decimos coordenada espacialoide. En la regi´on r < s, la ecuaci´on (13.12) muestra que al diferencial temporaloide dr lo acompa˜ na el factor positivo −1 − (1 − s/r) , mientras que al diferencial espacialoide dt lo acompa˜ na el factor negativo (1 − s/r) . Reconocemos as´ı que al pasar del exterior al interior las coordenadas t y r intercambian sus papeles: la coordenada temporaloide se vuelve espacialoide, y la espacialoide se vuelve temporaloide. Esto trae consigo una rotaci´on del cono de luz, como veremos enseguida.

13.18

El cono de la luz

El cono de luz en un evento dado se construye trazando las curvas luminoides, es decir, aquellas que cumplen la condici´on ds = 0. Acto seguido se procede a averiguar en qu´e direcci´on est´a orientado este cono de luz. Con el prop´osito de simplificar el an´alisis, concentr´emonos en las coordenadas (r, θ), de modo que podamos hacer dibujos bidimensionales. Trazamos, cruz´andose en el evento central escogido, los ejes de t y de r, el primero vertical y el segundo horizontal. En seguida se dibuja la L´INEA en el mundo de los eventos que tienen la misma coordenada espacialoide del evento central. La clave est´a en identificar que el cono de luz acoge, rodea a esa L´INEA, y eso determina la orientaci´on del cono: si la L´INEA es vertical, entonces el cono de luz es tambi´en vertical, est´a erguido; y si la L´INEA es horizontal, entonces el cono de luz es tambi´en horizontal, est´a acostado. Veamos:

345

Para la regi´on exterior r > s la Figura 13.6 muestra el cono de luz centrado en el evento A . La l´ınea AB es la trayectoria de un punto que mantiene constante la coordenada espacialoide r . Como esta l´ınea es vertical, el cono debe ser vertical, es decir, el pasado est´a abajo y el futuro arriba. Ning´ un objeto puede viajar del futuro al pasado. Pero en la regi´on interior r < s el an´alisis trae sorpresas. La Figura 13.7 muestra el cono de luz centrado en el evento C . La l´ınea CD es la trayectoria de un punto que mantiene constante la coordenada espacialoide t . Como esta l´ınea es horizontal, el cono debe ser horizontal. Pero debemos adem´as aclarar si el pasado est´a a la izquierda y el futuro a la derecha, como en la Figura 13.8, o si, por el contrario, el pasado est´a a la derecha y el futuro a la izquierda, como en la Figura 13.9. Demostremos que la Figura 13.9 es la correcta. Una part´ıcula masiva que se suelta desde cierta altura sigue la curva punteada ct de la Figura 13.4, y esa curva indica que el fen´omeno progresa de derecha a izquierda; es decir, la relaci´on pasado-futuro es, en la Figura 13.7, la direcci´on derecha-izquierda: la Figura 13.9 es la correcta. Todos los objetos viajan del pasado al futuro, y ninguno viaja del futuro al pasado: en la regi´on interior r < s todos los objetos se mueven hacia el centro r = 0 , y ninguno viaja hacia afuera. El punto r = 0 es el futuro ineludible para todos los objetos que se encuentren en la regi´on interior r < s . Los objetos pueden moverse hacia atr´as o hacia adelante en la coordenada espacialoide, pero s´olo pueden moverse hacia adelante en la coordenada temporaloide. En la regi´on exterior r > s los objetos pueden moverse hacia atr´as o hacia adelante en la coordenada espacialoide r, pero s´olo pueden moverse hacia adelante (hacia t = ∞) en la coordenada temporaloide t . En la regi´on interior r < s los objetos pueden moverse hacia atr´as o hacia adelante en la coordenada espacialoide t, pero s´olo pueden moverse hacia adelante (hacia r = 0) en la coordenada temporaloide r . Estas consideraciones ponen de manifiesto uno de los asuntos m´as intrigantes de la f´ısica te´orica del siglo XX, que es la existencia de huecos negros. Un agujero negro, en general, es una regi´on del espacio a la que se puede entrar, pero no salir: ning´ un objeto puede cruzar hacia afuera la superficie que bordea a la regi´on mencionada. Esa superficie recibe el nombre de horizonte. El hueco negro es un corte en el espaciotiempo, es un aislamiento, una exclusi´on porque, para los objetos que est´an dentro, la regi´on exterior es inaccesible. En el caso particular del espaciotiempo de Schwarzschild, el hueco negro es el sector r < 0 y el horizonte es la superficie esf´erica r = s. 346

13.19

Singularidades

Uno de los resultados m´as curiosos en el problema del cuerpo que se suelta desde cierta altura es que el tiempo coordenado t se vuelve infinito en el horizonte r = s, como muestra la curva de trazo punteado en la Figura 13.4. Si este fuera un efecto f´ısico verdadero, la part´ıcula nunca llegar´ıa al horizonte, contradiciendo nuestras expectativas. Nos preguntamos si este es un efecto f´ısico real, o es acaso un defecto de las coordenadas (ct, r). Para responder la pregunta recordemos que el tiempo propio τ no exhibe ninguna discontinuidad en r = s, como se ve en la curva de trazo continuo de la Figura 13.4. Hay dos tiempos, t y τ , que tienen comportamientos muy diferentes en el horizonte. ¿Cu´al de los dos tiempos es m´as confiable? La respuesta de esta pregunta es enf´atica: τ es m´as confiable porque es un escalar, es decir, una cantidad invariante. En conclusi´on, el hecho matem´atico de que t sea infinito en el horizonte no expresa un hecho f´ısico real, sino que es el resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de t usamos un tiempo sano τ , este tiempo propio resulta perfectamente finito en el horizonte. Hay otro asunto que pone en evidencia el comportamiento patol´ogico de las coordenadas (ct, r) en el horizonte, y es que en r = s algunas componentes del tensor de Riemann Rαβµν valen infinito, tal como puede verse en la secci´on 13.2. Si ´este fuera un efecto f´ısico verdadero, las fuerzas de marea ser´ıan infinitas en r = s, y un cuerpo extenso que atravesara el horizonte sufrir´ıa desgarrones infinitos. Nos preguntamos si ´este es un efecto f´ısico real, o es acaso un defecto de las coordenadas (ct, r). El caso mencionado en el p´arrafo anterior nos mueve a desconfiar de las coordenadas (ct, r), y en consecuencia nos preguntamos si existe acaso otro sistema coordenado en el que el tensor de Riemann sea finito en el horizonte. El hecho es que este otro sistema coordenado existe, y lo llamamos x ¯ en la secci´on 9.21. El lector est´a invitado a reconocer, en la p´agina 249, que todas las componentes ¯ αβµν del tensor de Riemann son finitas y de buena conducta en r = s; esto R quiere decir que en la superficie de Schwarzschild las fuerzas de marea y la desviaci´on geod´esica son finitas. En conclusi´on, el hecho matem´atico de que Rαβµν sea infinito en el horizonte no expresa un hecho f´ısico, sino que es el resultado de usar unas coordenadas (ct, r) que se comportan mal en r = s; si, en vez de (ct, r) usamos unas coordenadas sanas x ¯, el tensor de Riemann αβµν ¯ R queda perfectamente finito en el horizonte. Las coordenadas (ct, r, θ, ϕ) se comportan mal en la superficie r = s. En 347

t´erminos t´ecnicos, esas coordenadas son singulares en r = s. Hagamos una pausa para discutir el asunto de las singularidades en una geometr´ıa cualquiera, no necesariamente la de Schwarzschild. Para estudiar las propiedades geom´etricas de un espacio cualquiera se debe escoger un sistema coordenado, y ´este debe describir adecuadamente la geometr´ıa. Si acaso en alg´ un punto P de ese espacio las coordenadas no describen [16] fielmente la geometr´ıa, decimos que el sistema coordenado es singular en el punto P . Por ejemplo, las coordenadas esf´ericas (θ, ϕ) presentan una singularidad en θ = 0 , porque all´ı la coordenada ϕ es indefinida, ya que puede tomar cualquier valor entre 0 y 2π ; as´ı mismo, estas coordenadas son singulares en θ = π. La singularidad de las coordenadas (θ, ϕ) en θ = 0, π se manifiesta claramente en los mapamundis que usan proyecciones cil´ındricas, que son aquellas en que los paralelos aparecen como l´ıneas rectas horizontales y los meridianos como rectas verticales. La Figura 13.10 muestra uno de esos mapas. All´ı, la l´ınea AB representa al polo norte y CD al polo sur. El error del mapa es grave: el polo norte, que es un punto y tiene extensi´on cero, est´a representado en el mapa por medio de la l´ınea AB , cuya longitud no es cero. Uno se pregunta si este error es un defecto del mapa o es un problema intr´ınseco de la geometr´ıa, y la respuesta es inmediata: desde un punto de vista geom´etrico, los polos norte y sur no tienen ninguna peculiaridad, no hay nada en la geometr´ıa intr´ınseca que haga especiales a los polos; entonces el problema debe ser del mapamundi y la proyecci´ on cil´ındrica falla: las coordenadas (θ, ϕ) son singulares en los polos. De regreso a la geometr´ıa de Schwarzschild, la secci´on 13.2 muestra que el tensor de Riemann diverge5 en r = 0 y en r = s . Ya hemos visto que la singularidad en r = s es espuria, y por eso recibe el nombre de pseudosingularidad. Pero los infinitos que ocurren en r = 0 tienen6 una explicaci´on f´ısica, y es que all´ı la densidad de masa es infinita; no nos sorprende que cuando r tiende a cero el tensor de Riemann y las fuerzas de marea tiendan a valores infinitos.

5

Ya hemos mencionado en la p´ agina 306 que la soluci´ on de Schwarzschild no debe ser v´ alida en el origen de coordenadas r=0, o sea que los Rαβµν de la secci´ on 13.2 no se deben evaluar en r=0. Para ser m´ as cuidadosos deber´ıamos decir que el tensor de Riemann tiende a infinito en el origen. 6 En general, discernir si una singularidad es f´ısica o si, por el contrario, es un defecto del sistema coordenado, es un asunto peliagudo, como tambi´en lo es, en el segundo caso, construir otro sistema coordenado libre de singularidades [26, 27].

348

13.20

Las coordenadas de Kruskal-Szekeres

Hemos visto que en la superficie de Schwarzschild r = s las coordenadas (ct, r, θ, ϕ) presentan varias anomal´ıas indeseables: de un lado, gµν y Rαβµν toman valores infinitos y, de otro lado, tal como muestra la Figura 13.4, la curva de t versus r es discontinua y tiene una as´ıntota. Ya hemos mencionado que estas dificultades no reflejan problemas intr´ınsecos de la geometr´ıa, sino que son defectos exclusivamente achacables a las coordenadas (ct, r, θ, ϕ) . Ser´ıa bueno encontrar un sistema de coordenadas sano, en el que las l´ıneas en el mundo sean continuas y sin as´ıntotas, un sistema coordenado en el que gµν y Rαβµν sean funciones regulares. Se han encontrado varias soluciones a este problema; en efecto, se conocen varios sistemas coordenados que no presentan las anomal´ıas mencionadas, entre los cuales podemos mencionar el de Eddington-Finkelstein, el de Painlev´e-Gullstrand y el de Kruskal-Szekeres. En esta secci´on vamos a presentar este u ´ltimo sistema de coordenadas. Se trata de ejecutar el cambio de coordenadas (ct, r, θ, ϕ) → (v, u, θ, ϕ) , donde las nuevas coordenadas (v, u) est´an definidas de la manera siguiente. En la regi´on r < s : p ct 1 − r/s cosh 2s p ct u = er/2s 1 − r/s senh , 2s v = er/2s

(13.130) (13.131)

y en la regi´on r > s : p ct r/s − 1 senh 2s p ct u = er/2s r/s − 1 cosh 2s v = er/2s

(13.132) (13.133)

Las transformadas inversas son ct = 2s arctanh u/v ,

para r < s

(13.134)

ct = 2s arctanh v/u ,

para r > s

(13.135)

para todo r

(13.136)

(r/s − 1) er/s = u2 − v 2 , 349

La u ´ltima ecuaci´on debe entenderse como una definici´on impl´ıcita de r en t´erminos de las variables v y u . Tomando diferenciales en las ecuaciones (13.130), (13.131), (13.132) y (13.133) llegamos a estas expresiones que son v´alidas para todos los valores de r : dv =

c 1 u dt + (1 − s/r)−1 v dr 2s 2s

du =

c 1 v dt + (1 − s/r)−1 u dr 2s 2s

Elevamos al cuadrado cada una de estas dos ecuaciones y luego restamos lado a lado, obteni´endose: ¤ 1 u2 − v 2 £ 2 c (1 − s/r) dt2 − (1 − s/r)−1 dr2 2 4s 1 − s/r

(dv)2 − (du)2 =

En el lado derecho podemos usar la ecuaci´on (13.12): dv 2 − du2 =

¤ 1 u2 − v 2 £ 2 ds + r2 (dθ2 + sen2 θ dϕ2 ) , 2 4s 1 − s/r

de donde: ds2 = 4s2

1 − s/r (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) u2 − v 2

Finalmente usamos la ecuaci´on (13.136): ds2 = 4s2 ds2 =

1 − s/r (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) r/s (r/s − 1) e

4s3 −r/s e (dv 2 − du2 ) − r2 (dθ2 + sen2 θ dϕ2 ) r

(13.137)

Olvidando las coordenadas angulares (θ, ϕ), la Figura 13.11 muestra el espaciotiempo (v, u). En este dibujo se debe entender que r significa r/s y t 350

significa t/s . La gr´afica es la superposici´on de un conjunto de l´ıneas rectas radiales (que son regiones de t constante) y otro conjunto de hip´erbolas (que son regiones de r constante). Las rectas t = ∞ y t = −∞ parten el espaciotiempo en cuatro cuadrantes: el de la derecha, el de arriba, el de la izquierda y el de abajo. Por razones que expondremos prontamente, el cuadrante de arriba es un agujero negro. El cono de la luz. Consideremos la trayectoria de un punto que se mueve radialmente. Haciendo dθ = dϕ = 0 en la ecuaci´on (13.137) escribimos 4s3 −r/s e (dv 2 − du2 ) = ds2 r

(13.138)

Para un pulso de luz se tiene ds2 = 0 y para part´ıcula masiva hacemos ds2 > 0 : 4s3 −r/s e (dv 2 − du2 ) = 0 , r 4s3 −r/s e (dv 2 − du2 ) > 0 , r

para la luz

(13.139)

part´ıcula masiva

(13.140)

La desigualdad (13.140) quiere decir dv 2 > du2 . Esta desigualdad se cumple u ´nicamente si dv 6= 0 . Vemos as´ı que el progreso del movimiento, el desarrollo del fen´omeno, va necesariamente acompa˜ nado de un cambio en la coordenada v, y por esta raz´on v es una coordenada temporaloide. La desigualdad dv 2 > du2 no impone ninguna condici´on sobre du, el cual puede ser positivo, negativo o cero, y por eso u es una coordenada espacialoide. La coordenada v es temporaloide en todo el espaciotiempo y la coordenada u es espacialoide en todo el espaciotiempo. N´otese, en la ecuaci´on (13.137), 4s3 −r/s e , que al diferencial temporaloide dv lo acompa˜ na el factor positivo r mientras que al diferencial espacialoide du lo acompa˜ na el factor negativo 3 4s −r/s − e . r Ahora nos preguntamos c´omo se dibuja, en la Figura 13.11, la trayectoria de un punto que mantiene constante la coordenada espacialoide u. La respuesta es: se traza una l´ınea vertical. Entonces el cono de luz debe tambi´en ser vertical, con el pasado abajo y el futuro arriba. Los objetos pueden 351

moverse hacia atr´as o hacia adelante en la coordenada espacialoide u , pero s´olo pueden moverse hacia adelante en la coordenada temporaloide v (s´ olo se pueden mover de abajo hacia arriba en la Figura 13.11). Los pulsos de luz satisfacen la ecuaci´on (13.139); esta ecuaci´on dice que du2 = dv 2 , o sea que du = ±1 dv

(13.141)

Esta ecuaci´on tiene un significado interesante, pues dice que las trayectorias de los pulsos de luz tienen una inclinaci´on de ±45 grados en el espacio (v, u) . Recordando que los conos de luz est´an bordeados por trayectorias de pulsos de luz, llegamos a la siguiente conclusi´on: en el espacio (v, u) los conos de luz tienen una apertura angular de 90 grados, as´ı como en la relatividad especial, seg´ un la Figura 2.6. Las trayectorias de las part´ıculas (masivas o no masivas) quedan contenidas dentro del cono de luz, es decir, hacen ´angulos de ≤ 45 grados a lado y lado de la direcci´on vertical en la Figura 13.11. Si dibujamos l´ıneas curvas que en todo punto hacen ´angulos de ≤ 45 grados a lado y lado de la direcci´on vertical en la Figura 13.11, nos damos cuenta de que, en el cuadrante de arriba, TODAS estas trayectorias avanzan hacia valores decrecientes de r , es decir, hacia la hip´erbola r = 0 , lo que significa que este cuadrante es verdaderamente un hueco negro. En el cuadrante derecho, algunas trayectorias de part´ıculas avanzan hacia valores crecientes de r y otras avanzan hacia valores decrecientes de r , lo que significa que este cuadrante es el exterior del hueco negro. La frontera entre el cuadrante derecho y el de arriba, la recta (t = ∞, r = 1) , es la superficie de Schwarzschild, esa “membrana” que s´olo se puede cruzar en una direcci´on. En el cuadrante de abajo TODAS las trayectorias de part´ıculas avanzan hacia valores crecientes de r y penetran en los cuadrantes derecho e izquierdo. Por esta raz´on, al cuadrante de abajo, en un juego de palabras, se le podr´ıa llamar hueco blanco. Esto del hueco blanco es una n ˜apa que nos da la Figura 13.11, pero no podemos precipitarnos a afirmar la existencia real de estos objetos en el universo [13].

352

t=8

t=8

V(r) 1

Dt2

B

A

Dt1 0.5 t=7

t=7

r

2.5 s

1.5 s

Figura 13.1 Las l´ıneas curvas representan una serie de proyectiles que se lanzan peri´odicamente de un punto a otro. Como todos los lanzamientos son id´enticos, las l´ıneas curvas son tambi´en iguales.

Figura 13.2 Potencial efectivo para un pulso de luz con J = 2.7s . Las marcas A y B denotan puntos de retorno.

V(r)

8 t 1 A

B

6

4

t t

2 0.5 r 3s

6s

s

Figura 13.3 Potencial efectivo para part´ıcula masiva con D = 0.5 y J = 2.7s . Las marcas A y B denotan puntos de retorno.

r

Figura 13.4 Un cuerpo se suelta desde cierta altura. En trazo continuo el tiempo propio τ , y en trazo punteado el tiempo coordenado t .

353

t

Futuro B s

r A

Pasado r ro j x

Figura 13.5 Un pulso de luz incide de derecha a izquierda. Su trayectoria se deflecta debido a la presencia de la masa M en el origen de coordenadas.

Figura 13.6 Fuera del hueco negro, el cono de luz est´a erguido: el pasado abajo y el futuro arriba.

t

s

D

r

C

Figura 13.7 Dentro del hueco negro el cono de luz est´a acostado.

Futuro

Futuro

Pasado

C

Figura 13.8 Dentro del hueco negro. ¿Est´a el futuro a la derecha? A

B

C

D

Pasado

C

Figura 13.9 Dentro del hueco negro. ¿Est´a el futuro a la izquierda?

Figura 13.10 Proyecci´ on cil´ındrica: los meridianos son rectas verticales y los paralelos son rectas horizontales. La recta AB representa el polo norte, y recta CD representa el polo sur.

354

8

5

0 r= 7 0. r= 0.9 r=

9

r=

1.0 r= 1.2

r=

t=-

2 1.3 t=

1 .0 9 r= 1.2

-1.

32

t=

2 1.3

55

32 -1.

t=

1

1

r=

t=

8

t =0.5

t=

1 r=

-

t = -0.

t=

t=0

v

.55

t=0

0.55

t=0

0

r=

0.9 r=

-1

0.7 0

t=

- 1 t= r=

8

r=

1

r=

0

-1

8

1

Figura 13.11 Coordenadas de Kruskal-Szekeres. Las regiones de t constante son l´ıneas rectas radiales. Las regiones de r constante son hip´erbolas. El cuadrante superior es un agujero negro.

355

u

356

Ap´ endice A

La constancia de la velocidad de la luz

Al mirar los tres postulados (1.10) que fundamentan a la relatividad especial, no se nos escapa que el principio de la constancia de la velocidad de la luz (que aqu´ı llamaremos cortamente PriVel) es de un car´acter muy diferente a los otros dos. En efecto, el principio de la homogeneidad del tiempo y del espacio (PriHomo) y el principio de la relatividad (PriRel) son extensiones esperadas de ideas que hab´ıan estado presentes en el pensamiento cient´ıfico desde hac´ıa mucho tiempo. De un lado, a comienzos del siglo XVII, justo antes de Newton, ya se aceptaba [28] que el espacio es infinito, homog´eneo e is´otropo. De otro lado, Newton escribe: “The motions of bodies included in a given space are the same among themselves, whether that space is at rest, or moves uniformly forwards in a right line without any circular motion” [29]. El PriVel es inesperado y extra˜ no. Einstein lo introduce abruptamente, sin motivaci´on manifiesta, en la segunda p´agina del art´ıculo en el que presenta su teor´ıa de la relatividad especial [2]. La aparici´on s´ ubita de PriVel lo hace particularmente dif´ıcil de aceptar, o entender. Aunque la evoluci´ on del pensamiento cient´ıfico no es una secuencia suave y continua de pasos cortos, s´ı desear´ıamos creer que el surgimiento de las ideas cient´ıficas tiene alguna motivaci´on. El PriVel carece de esta motivaci´ on. El prop´osito de este cap´ıtulo es un intento de suministrar la motivaci´ on deseada; en efecto demostraremos que PriVel se puede deducir a partir de PriHomo, PriRel y de las ecuaciones de Maxwell. En la secci´on A.1 aplicamos el PriRel a las ecuaciones de Maxwell. Para esto se requiere un conjunto de reglas (transformaciones) que relacionen las coordenadas espaciotemporales de dos observadores inerciales; la secci´on A.2 establece el tratamiento general de esas transformaciones. En la secci´on A.3 regresamos al an´alisis de la secci´on A.1 y probamos que la luz tiene la misma velocidad en todos los 357

sistemas inerciales. Con esto queda cumplido el prop´osito de este cap´ıtulo, pero no podemos perder la oportunidad de dar, muy f´acilmente, otros dos pasos interesantes: en la secci´on A.4 deducimos las transformaciones de Lorentz, y en la secci´on A.5 deducimos las reglas de transformaci´on del campo electromagn´etico.

A.1

El principio de la relatividad

Einstein comienza su art´ıculo estudiando dos fen´omenos: En el Fen´ omeno 1 hay un material que conduce la electricidad (un trozo de metal por ejemplo) en reposo y hay un im´an en las cercan´ıas que se desplaza con una velocidad v respecto al metal. Es claro que en el metal se produce una corriente el´ectrica que llamaremos i1 . En el Fen´ omeno 2 hay un im´an en reposo y, en las cercan´ıas, hay un trozo de metal que se desplaza con una velocidad −v respecto al im´an. Es claro que en el metal se produce una corriente el´ectrica que llamaremos i2 . Si en los dos fen´omenos participan imanes iguales y conductores iguales, y si los arreglos de los dos fen´omenos son similares, podemos afirmar, sin duda, que i1 = i2 . Esto, que i1 sea igual a i2 , es el hecho observado importante, y nos mueve a pensar que los dos fen´omenos son equivalentes. Pero la teor´ıa electromagn´etica de Maxwell, seg´ un se la entend´ıa a finales del siglo XIX y principios del XX, no pod´ıa aceptar la equivalencia de los dos fen´omenos. De hecho, los f´ısicos supon´ıan que las ecuaciones de Maxwell eran v´alidas u ´nicamente para un observador en reposo respecto al ´eter y que, portanto, en el Fen´ omeno 1 es el metal el que est´a en reposo respecto al ´eter (est´a en reposo absoluto), mientras que en el Fen´ omeno 2 el im´an es el que est´a en reposo absoluto. Para los cient´ıficos de la ´epoca los dos fen´omenos mencionados eran esencialmente diferentes. No hab´ıa simetr´ıa entre las dos situaciones.1 Einstein se siente inc´omodo con esta asimetr´ıa, y quiere resolverla. Propone entonces que el PriRel, adem´as de ser v´alido en los fen´omenos de la mec´anica, debe tambi´en ser v´alido en los fen´omenos electromagn´eticos: todos los observadores inerciales deben ser igualmente leg´ıtimos. El viejo observador en reposo respecto al ´eter, el que estaba en “reposo absoluto”, no es m´as importante que los otros. El ´eter no es necesario, como tampoco lo son las nociones de 1

La asimetr´ıa se hac´ıa patente en que, para ellos, en el Fen´ omeno 1 hay un campo el´ectrico (de este campo el´ectrico da cuenta la ecuaci´ on de Maxwell c∇ × E = −∂B/∂t), mientras que en el Fen´ omeno 2 no hay ning´ un campo el´ectrico.

358

reposo absoluto ni espacio absoluto. Para entender que las leyes del electromagnetismo son v´alidas en todos los observadores inerciales se necesitan tres cosas: Primero, averiguar c´omo es la verdadera transformaci´on de coordenadas (t, x, y, z) → (t0 , x0 , y 0 , z 0 ). Segundo, averiguar c´omo es la transformaci´on de los campos (E, B) → (E0 , B0 ). Y tercero, que los pasos Primero y Segundo se unan de modo que las ecuaciones de Maxwell sean covariantes. Einstein decide resolver primero el problema (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) (introduciendo un nuevo principio, el de la velocidad de la luz) y deja para despu´es el problema (E, B) → (E0 , B0 ) y la covariancia de las ecuaciones. Nosotros ahora, en este ap´endice, tomaremos otra ruta: Supondremos que las ecuaciones de Maxwell son covariantes; con ´esto y con PriHomo demostraremos la constancia de la velocidad de la luz, hallaremos c´omo debe ser la transformaci´on (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) y deduciremos la transformaci´on (E, B) → (E0 , B0 ). Para aplicar el PriRel cuantitativamente utilizamos los dos observadores inerciales O y O0 . Para O, dos de las ecuaciones de Maxwell en el vac´ıo son: 1 ∂E c ∂t 1 ∂B c ∂t

= ∇×B

(A.1)

= −∇ × E

(A.2)

Para el observador O0 las ecuaciones correspondientes son 1 ∂E0 c0 ∂t0 1 ∂B0 c0 ∂t0

= ∇0 × B0

(A.3)

= −∇0 × E0

(A.4)

Probaremos que c0 = c, es decir, que la velocidad de la luz es la misma para todos los observadores inerciales. De la ecuaci´on (A.1) tomamos la parte y , y de la ecuaci´on (A.2) tomamos la parte z : 1 ∂t Ey = ∂z Bx − ∂x Bz c 359

(A.5)

1 ∂t Bz = ∂y Ex − ∂x Ey , c donde, tal como hemos hecho en otras ocasiones, ∂t quiere decir Para O0 las ecuaciones correspondientes son: 1 ∂t0 Ey0 = ∂z 0 Bx0 − ∂x0 Bz0 c0 1 ∂t0 Bz0 = ∂y0 Ex0 − ∂x0 Ey0 c0

(A.6) ∂ , etc. ∂t

(A.7) (A.8)

Supondremos que las ecuaciones de Maxwell expresan leyes f´ısicas, de manera que a ellas se aplica el PriRel. En particular, las ecuaciones (A.5) y (A.6) deben ser equivalentes a las ecuaciones (A.7) y (A.8). Debe existir entonces un conjunto de cuatro funciones que expresen las coordenadas primadas (t0 , x0 , y 0 , z 0 ) en t´erminos de las no primadas (t, x, y, z); a esto nos dedicamos enseguida.

A.2

Transformaciones

Recordemos que las cuatro ecuaciones (1.28) se obtuvieron utilizando u ´nicamente los principios de la relatividad y de la homogeneidad del espacio y el tiempo. Reescribamos este conjunto de ecuaciones t0

=

a00 t + a01 x

(A.9)

0

x

=

a11 (x − vt)

(A.10)

0

=

y

(A.11)

z0

=

z

(A.12)

y

Los tres coeficientes desconocidos a00 , a01 y a11 son funciones de la velocidad v, o sea que deber´ıamos escribir, propiamente, a00 (v), a01 (v) y a11 (v). Antes de seguir adelante, probaremos que los coeficientes a00 (v) y a11 (v) satisfacen las siguientes condiciones: a00 (v)

> 0

(A.13)

a11 (v)

> 0

(A.14)

360

a00 (−v)

= a00 (v)

(A.15)

Para probar estas f´ormulas consideremos el plano x = 0 ; de acuerdo con las ecuaciones (A.9) y (A.10), los eventos de este plano satisfacen las ecuaciones t0 = a00 (v) t

(A.16)

x0 = −a11 (v) vt

(A.17)

Para estos eventos la condici´on t > 0 debe implicar que t0 > 0; entonces, en vista de la ecuaci´on (A.16), el coeficiente a00 (v) debe ser positivo; esto prueba la ecuaci´on (A.13). De la misma manera, para estos eventos la condici´on t > 0 debe implicar que x0 < 0; entonces, en vista de la ecuaci´on (A.17), el coeficiente a11 (v) debe ser positivo; esto prueba la ecuaci´on (A.14). Para probar la ecuaci´on (A.15) consideramos otro observador O00 que se mueve, respecto a O, con velocidad v en la direcci´on −x ; en vista de la ecuaci´on (A.16) escribimos: t00 = a00 (−v) t

(A.18)

Ahora, t00 debe ser igual a t0 ; entonces la ecuaci´on (A.18) es t0 = a00 (−v) t . Al comparar esta ecuaci´on con la ecuaci´on (A.16) vemos que a00 (−v) = a00 (v). Esta es la prueba de la ecuaci´on (A.15).

A.3

La velocidad de la luz

En el cap´ıtulo 1 seguimos la exposici´on convencional: se presentan los tres principios de la relatividad especial y a partir de ellos se deducen las transformaciones de Lorentz. Luego, en la secci´on 4.1 y de nuevo en la secci´on 6.5 se dedujeron las transformaciones de los campos electromagn´eticos E y B. Tal como indicamos hace poco, en este Ap´endice tomaremos otra ruta. Asumiremos v´alidos el principio de la homogeneidad del espacio y el tiempo, el principio de la relatividad y algunas de las ecuaciones de Maxwell; y a partir de estos supuestos, deduciremos las transformaciones de Lorentz y deduciremos las reglas de transformaci´on de E y B . Las cuatro ecuaciones (A.9)-(A.12) son una familia de transformaciones. Dos miembros de esta familia son las transformaciones de Galileo y las de 361

Lorentz. La transformaciones galileanas se obtienen haciendo a00 = a11 = 1 y a01 = 0. Demostraremos que las transformaciones de Lorentz se obtienen al aplicar el PriRel a las ecuaciones de Maxwell, es decir, explotando la equivalencia que existe entre las ecuaciones (A.5), (A.6) y las ecuaciones (A.7), (A.8). Para tal efecto, las derivadas no primadas ∂t , ∂x , ∂y , ∂z se expresar´an en t´erminos de las derivadas primadas ∂t0 , ∂x0 , ∂y0 , ∂z 0 , de modo que las ecuaciones (A.5) y (A.6) se “conviertan” en otras ecuaciones que usan derivadas primadas. Al comparar t´ermino a t´ermino las ecuaciones “convertidas” con las ecuaciones (A.7) y (A.8), descubriremos la constancia de la velocidad de la luz. Esto nos llevar´ a a las transformaciones de Lorentz en la secci´on A.4 y a las transformaciones del campo electromagn´etico en la secci´on A.5. Para escribir las derivadas no primadas en t´erminos de las primadas usamos la regla de la derivaci´ on en cadena. Se ve f´acilmente que, usando las ecuaciones (A.9)-(A.12), la regla de la derivaci´ on en cadena da: ∂t = a00 ∂t0 − va11 ∂x0 ∂x = a11 ∂x0 + a01 ∂t0 ∂y = ∂y0

(A.19)

∂z = ∂z 0

Colocamos estas derivadas en las ecuaciones (A.5) y (A.6) para obtener: µ



³ v ´ = ∂z 0 Bx − ∂x0 a11 Bz − Ey (A.20) c µ 0 ¶ ³ 1 c v ´ 0 0 0 0 a B + a c E = ∂ E − ∂ a E − Bz (A.21) ∂ 00 z 01 y y y x x 11 t c0 c c 1 ∂t0 c0

c0 a00 Ey + a01 c0 Bz c

Comparemos estas dos ecuaciones con las ecuaciones (A.7) y (A.8); los campos en la ecuaci´on (A.7) deben ser proporcionales a los campos en la ecuaci´on (A.20): µ Ey0

= f

c0 a00 Ey + a01 c0 Bz c

Bx0 = f Bx

¶ (A.22) (A.23)

362

v Bz0 = f a11 (Bz − Ey ) c

(A.24)

Aqu´ı, f (v) es una funci´on que depende solamente del par´ametro v. De la misma manera, introducimos una funci´on g(v) para comparar la ecuaci´on (A.8) con la ecuaci´on (A.21): µ Bz0

= g

c0 a00 Bz + a01 c0 Ey c

¶ (A.25)

Ex0 = g Ex

(A.26)

v Ey0 = g a11 (Ey − Bz ) c

(A.27)

Las funciones f (v) y g(v) son desconocidas. Pasamos a probar que g(v) = f (v). Para tal efecto notemos que los lados derechos de las ecuaciones (A.22) y (A.27) deben ser iguales: c0 v ga11 Ey − g a11 Bz = f a00 Ey + f a01 c0 Bz c c Los coeficientes de Ey deben ser iguales entre s´ı, y los de Bz tambi´en deben ser iguales entre s´ı: c0 g a11 = f a00 c v −g a11 = f a01 c0 c

(A.28) (A.29)

Del mismo modo, al igualar los lados derechos de las ecuaciones (A.24) y (A.25) obtenemos: c0 f a11 = g a00 c v −f a11 = g a01 c0 c

(A.30)

Con una mirada a las ecuaciones (A.28) y (A.30) nos damos cuenta de que 363

g 2 = f 2 , es decir, g = ±f . Para descubrir cu´al de los dos signos es adecuado, se pone la condici´on g = ±f en la ecuaci´on (A.28), obteni´endose c0 a00 c

a11 = ±

Sin embargo, de acuerdo con las ecuaciones (A.13) y (A.14), los coeficientes a00 y a11 son positivos, o sea que debemos escoger el signo superior: g = +f . Poniendo la condici´on g = f en las ecuaciones (A.28) y (A.29) se obtiene c0 a00 c = a01 c0

a11 = v − a11 c

(A.31)

Estas dos ecuaciones implican que a01 = −

v a00 c2

(A.32)

En vista de las ecuaciones (A.31) y (A.32) y la condici´on g = f , reescribimos las seis ecuaciones de transformaci´on (A.22)-(A.27) de esta manera compacta: Ex0 = f (v) Ex0

(A.33)

Bx0 = f (v) Bx0 Ey0 = f (v) a00 (v) Bz0

c0

³

´

Ey − c ³ c0 = f (v) a00 (v) Bz − c

v Bz c v ´ Ey c

(A.34) (A.35) (A.36)

Demostremos r´apidamente que f (v) debe ser una funci´on par de v. Para tal efecto supongamos que Ey = 0, de modo que la ecuaci´on (A.36) da Bz0 = f (v) a00 (v) 364

c0 Bz c

(A.37)

Ahora consideremos otro observador inercial O00 que se mueve, respecto a O, con velocidad v en la direcci´on −x ; en vista de la ecuaci´on (A.37) escribimos: Bz00 = f (−v) a00 (−v)

c0 Bz c

(A.38)

Claramente, Bz0 y Bz00 deben ser iguales, y podemos formar una nueva ecuaci´on con los lados derechos de las ecuaciones (A.37) y (A.38): f (v) a00 (v)

c0 c0 Bz = f (−v) a00 (−v) Bz , c c

o sea que, apoy´andonos en la ecuaci´on (A.15): f (−v) = f (v)

(A.39)

Para hallar el rec´ıproco del sistema de ecuaciones (A.35) y (A.36) intercambiamos variables primadas y no primadas, y escribimos −v en vez de v: c c0 c = f (−v) a00 (−v) 0 c

Ey = f (−v) a00 (−v) Bz

³

v 0´ B c0 z ³ ´ v Bz0 + 0 Ey0 , c Ey0 +

y usamos las ecuaciones (A.15) y (A.39): c c0 c = f (v) a00 (v) 0 c

Ey = f (v) a00 (v) Bz

³ ´ v Ey0 + 0 Bz0 c ³ v 0´ 0 Bz + 0 Ey c

Finalmente, ponemos estas expresiones de Ey y Bz en el lado derecho de la ecuaci´on (A.35) para obtener: Ey0

=

f 2 a200

·µ ¶ µ ¶ ¸ v2 1 1 0 1 − 0 Ey + v 0 − Bz0 cc c c 365

(A.40)

Ya que Ey0 y Bz0 son variables independientes, los coeficientes de Ey0 en ambos lados de la ecuaci´on deben ser iguales, y los coeficientes de Bz0 tambi´en: 1 =

µ ¶ v2 1− 0 cc 1 1 − c0 c

f 2 a200

0 =

(A.41) (A.42)

La ecuaci´on (A.42) dice que c0 = c

(A.43)

En palabras, la velocidad de la luz es la misma en todos los sistemas de referencia inerciales.

A.4

Las transformaciones de Lorentz

Si usamos la ecuaci´on (A.43) en la ecuaci´on (A.41) se obtiene µ ¶ v2 f 2 a200 1 − 2 = 1 , c y en vista de la ecuaci´on (A.13) llegamos a a00 =

a00 =

γ |f |

1 1 p : |f | 1 − v 2 /c2 (A.44)

1 Aqu´ı estamos usando el s´ımbolo convencional γ = p . Ha llegado 1 − v 2 /c2 el momento de agrupar las ecuaciones (A.31), (A.32), (A.43) y (A.44) para reescribir las ecuaciones de transformaci´on (A.9) y (A.10): t0 = x0 =

γ v (t − 2 x) |f | c γ (x − vt) |f | 366

(A.45) (A.46)

Ahora demostraremos que la funci´on |f | que aparece en estas ecuaciones es 1. Consideremos un pulso de luz que conecta los p eventos (0,0,0,0) y (t, x, y, z). x2 + y 2 + z 2 La velocidad c es espacio sobre tiempo: c = ; de aqu´ı se sigue t que c2 t2 − (x2 + y 2 + z 2 ) = 0

(A.47)

c02 t02 − (x02 + y 02 + z 02 ) = 0

(A.48)

Similarmente:

Queremos escribir esta ecuaci´on en t´erminos de variables no primadas, y para tal efecto ponemos las ecuaciones (A.11), (A.12), (A.43), (A.45) y (A.46) en la ecuaci´on (A.48), obteni´endose as´ı: 1 2 2 (c t − x2 ) − y 2 − z 2 = 0 f2 Al comparar esta ecuaci´on con la ecuaci´on (A.47) descubrimos que f 2 = 1, lo que significa que |f | = 1, y los denominadores de las ecuaciones (A.45) y (A.46) se simplifican. Por u ´ltimo, utilicemos las ecuaciones (A.11), (A.12), (A.45) y (A.46) para escribir la forma final de las transformaciones de Lorentz v x) c2 x0 = γ (x − vt) t0 = γ (t −

y0 = y ,

A.5

(A.49)

z0 = z

Regreso al campo

Hemos probado que |f | = 1, es decir, que f = ±1. Debemos decidir cu´al de los dos signos es el correcto. Si insertamos la condici´on f = ±1 en la ecuaci´on (A.33) se obtiene Ex0 = ±Ex ; el signo inferior no sirve, porque implicar´ıa una inversion incre´ıble Ex0 = −Ex . Por esta raz´on escogemos el signo superior y 367

escribimos f = 1. Ya estamos en condici´on de usar las ecuaciones (A.43) y (A.44) en las transformaciones (A.33)-(A.36), para obtener: Ex0 = Ex ³ v ´ Ey0 = γ Ey − Bz c 0 Bx = Bx ³ v ´ Bz0 = γ Bz − Ey c

(A.50) (A.51) (A.52) (A.53)

Estas son cuatro de las seis ecuaciones de transformaci´on que est´abamos buscando. A´ un nos falta por averiguar las ecuaciones de Ez0 y By0 . Para tal efecto anotemos r´apidamente que, de acuerdo con los resultados obtenidos, las derivadas (A.19) se han simplificado: ∂t = γ ∂t0 − vγ ∂x0 ∂x = γ ∂x0 − (vγ/c2 ) ∂t0 ∂y = ∂y0

(A.54)

∂z = ∂z 0

Estas son, por supuesto, las mismas ecuaciones (1.44). La parte z de la ecuaci´on (A.1) es 1 ∂t Ez = ∂x By − ∂y Bx , c

(A.55)

y la parte z de la ecuaci´on (A.3) es 1 ∂t0 Ez0 = ∂x0 By0 − ∂y0 Bx0 c

(A.56)

Utilizando las derivadas (A.54) en la ecuaci´on (A.55) llegamos a: ³ ³ γ v ´ v ´ 0 0 ∂t Ez + By = γ ∂x By + Ez − ∂y0 Bx c c c Al comparar esta ecuaci´on con (A.56) introducimos una funci´on h(v), desconocida hasta el momento: 368

³ v ´ Ez0 = h(v) γ Ez + By c ³ v ´ 0 By = h(v) γ By + Ez c Bx0 = h(v)Bx En este momento comparamos la u ´ltima ecuaci´on con (A.52), y esto nos muestra que h(v) = 1. Escribamos finalmente las dos ecuaciones que nos faltaban: ³ v ´ Ez0 = γ Ez + By c ³ ´ v By0 = γ By + Ez c

A.6

(A.57) (A.58)

Conclusiones

En su art´ıculo [2], Einstein propone el PriVel y el PriRel, asume el PriHomo y con estas tres bases deduce las transformaciones de Lorentz. Finalmente toma el PriRel, las ecuaciones de Maxwell y las transformaciones de Lorentz reci´en obtenidas, para deducir las transformaciones del campo electromagn´etico. A esta estructura l´ogica la llamaremos la estructura standard de la relatividad. Pero el art´ıculo de Einstein tambi´en se puede leer de atr´as hacia adelante, tal como hemos hecho en este ap´endice: Se asumen el PriHomo y el PriRel; se asume que las ecuaciones de Maxwell verdaderamente representan a las leyes f´ısicas del electromagnetismo, y esto nos permite aplicar el PriRel a las ecuaciones de Maxwell. A partir de aqu´ı se deducen f´acilmente la constancia de la velocidad de la luz, las transformaciones de Lorentz y las transformaciones del campo electromagn´etico. Esta ser´a llamada la otra estructura l´ogica de la relatividad. Queremos resaltar que en la otra estructura la constancia de la velocidad de la luz es un teorema, mientras que en la estructura standard el PriVel es un postulado. Mientras en la standard el PriVel aparece s´ ubitamente, sin motivaci´on expl´ıcita, en la otra estructura la constancia de la velocidad de la luz aparece m´as suavemente, pues es un resultado de otras suposiciones 369

m´as familiares, m´as f´aciles de aceptar. La estructura standard se basa en el PriVel, y refiri´endose este principio a la luz, la estructura standard est´a vinculada al electromagnetismo. Ahora, a˜ nos despu´es, nosotros reconocemos que Einstein podr´ıa haber basado su relatividad, no en el PriVel, sino en esta generalizaci´on: “cualquier part´ıcula no masiva se mueve con una velocidad c que es la misma para todos los observadores inerciales”. Vemos as´ı que la conexi´on entre la estructura standard y el electromagnetismo no es muy fuerte. En cambio, en la otra estructura las ecuaciones de Maxwell para el electromagnetismo juegan un papel esencial. En la comparaci´on entre estas dos estructuras l´ogicas de la relatividad podemos avanzar algunos comentarios: 1. Si se llegara a encontrar alg´ un defecto en la teor´ıa de Maxwell, esto probablemente repercutir´ıa muy fuertemente en la otra estructura, pero quiz´as la estructura standard podr´ıa salir ilesa. Vemos as´ı que la standard es una estructura m´as robusta que la otra. 2. En la otra estructura la relatividad aparece, en cierto modo, como una parte del electromagnetismo. En otras palabras, la relatividad le da realce a la teor´ıa de Maxwell. 3. Hemos usado la covariancia de las ecuaciones de Maxwell para construir la otra estructura. Probablemente no sea equivocado pensar que, usando otras teor´ıas f´ısicas (QCD, por ejemplo), se podr´ıan construir a´ un otras estructuras para la relatividad. 4. La importancia del PriRel ya ha sido ampliamente reconocida durante un siglo. Pero la existencia de otra estructura, o a´ un otras estructuras, nos muestra un PriRel m´as f´ertil: cuando ´este se une a una teor´ıa f´ısica concreta, dan a luz a la teor´ıa de la relatividad. 5. Dar a luz a la relatividad es algo enorme, ya que ´esta establece la m´etrica del espaciotiempo. En efecto, la relatividad contiene las transformaciones de Lorentz, y ´estas dan pie a la m´etrica de Minkowski, que es la m´etrica del espaciotiempo. El espaciotiempo no es una simple acumulaci´ on de eventos, sino que adem´as tiene una m´etrica, una estructura. Vemos as´ı que la m´etrica del espaciotiempo resulta, en parte, del contacto con las leyes f´ısicas, como el electromagnetismo por ejemplo. En nuestra mente, podemos imaginar que el espaciotiempo es una simple yuxtaposici´on de puntos hasta que 370

las leyes de la naturaleza, las que rigen a los objetos f´ısicos, le imprimen a esa yuxtaposici´on una estructura, una m´etrica, una organizaci´on.

371

372

Bibliograf´ıa

[1] H.A. Lorentz: Versuch einer Theorie der elektrischen und optischen Erscheinungen in bewegten K¨ orpern, Leiden,(1905). Traducido al ingl´es como Michelson’s interference experiment, en Referencia [5] [2] A. Einstein: Zur Elektrodynamik bewegter K¨ orper, Annalen der Physik, 17,(1905). Traducido al ingl´es como On the electrodynamics of moving bodies, en Referencia [5]. Existe otra traducci´on al ingl´es: H.M. Schwarz, Am.J.Phys. 45, 18(1977). Internet: http://dbserv.ihep.su/ elan/src/einstein05b/eng.pdf agheit eines K¨ orpers von seinem Energiegehalt [3] A. Einstein: Ist die Tr¨ abh¨ angig?, Annalen der Physik, 17,(1905). Traducido al ingl´es como Does the inertia of a body depend upon its energy-content? en Referencia [5]. Internet: http://dbserv.ihep.su/ elan/src/einstein05c/eng.pdf [4] H.A. Lorentz: Electromagnetic phenomena in a system moving with any velocity less than that of light, Proceedings of the Academy of Sciences in Amsterdam, 6, 1904. Traducido al ingl´es en Referencia [5] [5] The Principle of Relativity, Dover,New York (1952) [6] R. Resnick: Introduction to Special Relativity, Wiley,New York (1968) [7] J.D. Jackson: Classical Electrodynamics, Wiley,New York (1975) [8] Referencia [7], secci´on 11.9 [9] Referencia [7], secci´on 14.1 [10] H. Minkowski: Raum und Zeit, Ponencia en la 80 Asamblea de Cient´ıficos Naturales y M´edicos Alemanes, en Colonia, el 21 de septiembre de 1908. Traducido al ing´es bajo el t´ıtulo Space and Time, en Referencia [5] 373

[11] S. Weinberg: Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity, Wiley,New York (1972) [12] G.B. Thomas: Calculus Wesley,Reading (1965)

and

Analytic

Geometry,

Addison-

[13] H. Ohanian, R. Ruffini: Gravitation and Spacetime, Second Edition, Norton,New York(1994) [14] I.S. Gradshteyn, I.M. Ryzhik: Table of Integrals, Series and Products, Academic Press,New York(1983), f´ormula 2.599.6 [15] D.C. Kay: Tensor Calculus, Schaum’s Outlines, Mc Graw Hill,New York(1988) [16] B.F. Schutz: A first course in general relativity, Cambridge U. Press,Cambridge(1999) [17] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 778-786 [18] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 799-801 [19] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, p.2, pp. 831-839 [20] A. Einstein: Preussische Akademie der Wissenschaften, Sitzungsberichte, 1915, pt.2, pp. 844-847 [21] J. Mehra: Einstein, Hilbert, and The Theory of Gravitation, Reidel,Dordrecht (1974) [22] L.D. Landau, E.M. Lifshitz: Teor´ıa cl´ asica de campos, Revert´e,Barcelona (1966) [23] K. Schwarzschild: Ueber das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie, Preuss.Ak.Wiss.Sitzungsber, 189196(1916) [24] A.P. Lightman, W.H. Press, R.H. Price, S.A. Teukolsky: Problem book in relativity and gravitation, Princeton U. Press,Princeton (1975) [25] H. Goldstein: Mec´ anica Cl´ asica, Aguilar,Madrid(1963), ec. 3-34 374

[26] R. Wald: General Relativity, U. Chicago Press,Chicago (1984) [27] R. Torretti: Relativity and Geometry, Dover, New York(1996) [28] M. Jammer: Concepts of Space (Dover, New York, 1993), p. 110 [29] I. Newton: Mathematical Principles of Natural Philosophy (Encyclopaedia Britannica Inc., Chicago, 1952), Corolary V, p. 19

375

´ Indice Alfab´ etico

Aµ , 148–157, 182, 193–197 Aberraci´ on de la luz, v´ease Luz Absoluto carga el´ectrica, 43 E · B y E 2 − B 2 , 99–101, 159 equilibrio, 81 intervalo, 33, 199 izquierda-derecha, 56 pasado-futuro, 56 Acci´ on, 180, 186 A, 180 Aceleraci´ on, 31, 49, 83, 140, 315 Acelerador, 87, 315 Acople m´ınimo, 281 Adaptadas, v´ease Coordenadas Adici´ on de aceleraciones, 31, 49 de velocidades, 31, 45 Af´ın conexi´ on, v´ease Γµ αβ par´ ametro, v´ease Par´ ametro Agujero blanco, v´ease Schwarzschild Agujero negro, v´ease Schwarzschild Aislado, 15, 169 Alambre recto, 104 Anulando E o B, 108–110 Apelio, v´ease Schwarzschild Arago, 5 ´ Atomo, 74 de hidr´ ogeno, 82, 301 Atraso, v´ease Relojes

observador en, 276, 278 C´ alculo variacional, 177, 253–256 Calor, 73 Cambiar (,) → (;), v´ease Regla Campo de alambre recto, 104 de carga m´ ovil, 102 el´ectrico, 102, 106, 147–159 electromagn´etico, 93–115, 147–159, 170–172, 182, 185–197 en general, 185 gravitatorio, v´ease Campo gravitatorio inducido, 98 magn´etico, 85–89, 102, 106, 147–159 Campo gravitatorio, 273, 287 constante, 299 est´ atico, 296, 299, 302, 314 estacionario, 299, 302 is´ otropo, 301 y ca´ıda libre, 274, 317 y geod´esicas, 274, 317 y leyes f´ısicas, 273, 278 Carga el´ectrica, 43, 297 de alambre recto, 104 densidad, 105 m´ ovil, 102 Cartesianas, v´ease Coordenadas Causalidad, 52, 345, 351 Christoffel, v´ease Γµ αβ C´ıclica, v´ease Coordenadas Ciclotr´ on, 85, 315 Cil´ındricas, v´ease Coordenadas C´ırculo, 311 m´ aximo, 233, 234, 253, 265 Conexi´ on af´ın, v´ease Γµ αβ C´ onicas, 337, 340 no c´ onicas, 337, 340

β, 124 Bianchi, 238, 294 Big-bang, 76, 317 Biot-Savart, 106 Bradley, 4, 144 Ca´ıda libre, 274, 277

376

Cono de la luz, 52, 55, 56, 345, 351 Conservaci´ on de energ´ıa-momentum, 166–175, 189– 197, 280, 284 de la energ´ıa, 69 del momentum, 14, 61–65, 69 del momentum angular, 172–175 del n´ umero de part´ıculas, 163 Constante cosmol´ ogica Λ, 294 Constantes del movimiento, 258–267, 299 en Schwarzschild, v´ease Schwarzschild Continuidad, v´ease Ecuaci´ on Contracci´ on de la longitud, 41, 44, 54 Contravariante, v´ease ´Indices Coordenada espacialoide, 344–346, 351 Coordenada temporal, 298, 302 Coordenada temporaloide, 344–346, 351 Coordenadas adaptadas, 236 cartesianas, 199, 214, 263, 265, 278, 280 c´ıclicas, 259, 260, 263, 266, 299, 317 cil´ındricas, 201, 260, 263 continuas, 185 de Eddington-Finkelstein, 349 de Kruskal-Szekeres, 349 de Ohanian, 298, 300 de Painlev´e-Gullstrand, 349 esf´ericas, 214, 233, 248, 265, 302, 348 geod´esicas, 276, 277 singulares, 348 Corriente de momentum, 164 de part´ıculas, 163 del momentum angular, 172–175 el´ectrica, 110, 143, 164, 297, 358 en alambre recto, 104 en circuito el´ectrico, 107 Corrimiento al azul, 144, 316 Corrimiento al rojo big bang, 317 efecto Doppler, 144, 317 gravitacional, 316 Coulomb, 149 Covariancia de ecuaciones de Maxwell, 111–114, 147– 157, 359, 369 electrodin´ amica, 111–115, 147–159

fuerza de Lorentz, 114 las ecuaciones de las leyes, 220 Covariante ecuaci´ on, 137, 139 ´ındice, 125, 204 manifiestamente, 147 no manifiestamente, 147 Curvo, v´ease Espacio curvo D, 316, 320 Deflexi´ on de la luz, v´ease Schwarzschild δ de Dirac, 162–169, 172 δ de Kronecker, 121, 127, 132, 210, 237 Densidad de carga, 43, 105, 110 de corriente, 161 de energ´ıa, 103, 191, 296 de masa, 287 de momentum, 191 de part´ıculas, 161 lagrangiana, 186 propia, 43 Derecha, 55, 56 Derivada, 133, 210 covariante, 213, 226, 237, 279 en una curva, 267 es tensorial, 134, 211 no es tensorial, 211 simple, 201, 213, 237, 279 Desincronizaci´ on de relojes, 36 Desligada, v´ease Schwarzschild Desviaci´ on de rayo de luz, v´ease Luz geod´esica, v´ease Geod´esica Deuter´ on, 74 Diferencial D s´ı es covariante, 267 d no es covariante, 212, 267 de volumen, 136, 221 Dilataci´ on del tiempo, 37, 44, 55 Dirac, v´ease δ de Dirac Divergencia covariante, 280, 293 de θµν , 170, 192, 196 de J µ , 164, 165 µνδ de Mmec , 172–175 µν de T , 166–175, 189–197, 280 Doppler, v´ease Efecto Doppler

377

E = mc2 , 62, 67, 69–75 Ecuaci´ on tensorial, v´ease Ecuaci´ on covariante Ecuaci´ on covariante, 137, 139, 148, 218, 220, 228, 256, 278, 287 de continuidad, 151, 162, 164, 165 de Euler-Lagrange, 180, 181, 183, 187, 194, 254 de fuentes, 287 de geod´esica, v´ease Geod´esica de Hilbert-Einstein, 288, 292 de Hilbert-Einstein inconsistente, 298 de ondas, 152 de Poisson, 287 de tercer grado, v´ease Schwarzschild del intervalo, 258, 260, 262, 264, 266 Ecuaciones de Maxwell, 6, 93–99, 111– 114, 147–157, 358, 359, 369 en campo grav., 285 homog´eneas, 150, 156, 193 inhomog´eneas, 150, 156, 193 Efecto Doppler, 79, 144, 317 Einstein convenci´ on de, 119 en 1905, 20, 74, 93, 357, 369 en 1912, 51 en 1915, 287, 294, 301, 339, 340 joven, 2 viejo, 74 Electrodin´ amica, 147–159 Electromagnetismo, 2, 6, 93–115 Electr´ on, 82, 87 Energ´ıa-momentum, 166–175, 280, 294, 304, 306 no gravitacional, 280, 294, 297 Energ´ıa, 62, 69–75 de enlace, 74 cin´etica, 65–69 del campo E, B, 103 E¨ otv¨ os, 276 ²αβγδ , 133 Eridani, 317 Escalar, 111, 129, 132, 136, 178, 188, 209, 222, 228, 302 de curvatura R, 230, 244, 287 E · B y E 2 − B 2 , 99–101, 159 Esf´ericas, v´ease Coordenadas Espacialoide, 51, 52, 344–346, 351

Espacio curvo, 233, 234, 250, 269, 274, 307 de Minkowski, 215, 218 de Riemann, 199, 253 de Schwarzschild, v´ease Schwarzschild euclidiano, 233, 234 no euclidiano, 234, 311 plano, 233, 306 Est´ atico, v´ease Campo gravitatorio Estacionario, 253, v´ease Campo gravitatorio ηµν , 120, 215, 276 ´ Eter, 1–11, 13, 358 Euclidiano, v´ease Espacio Euler-Lagrange, v´ease Ecuaci´ on de EulerLagrange Experimento de Michelson-Morley, v´ease Michelson y Morley Extremal, 253 Fase de una onda, 144 Φ, 287, 305, 343 segunda derivada, 287 Filtro de velocidades, 86 F´ısica nuclear, 74 Fisi´ on nuclear, 75 Fizeau, 2 F µν , 155, 193–197, 217 Fot´ on, 68, 74, 75, 79, 142 Frente de onda, 144 Fresnel, 4, 6, 47 Fuerza, 65–69, 82 de Lorentz, 114, 147, 152–154, 157, 182 gravitacional, 274 Fusi´ on nuclear, 75 Futuro, 52, 55, 56, 346, 351 G: constante gravitacional, 273, 275, 287 Galaxias, 76 Galileo, 12, 24, 26, 46, 324, 361 Γµ αβ , 222, 274, 276, 281, 288 Gauge, 148 condici´ on de, 149 de Coulomb, 149 de Lorentz, 149, 150 Gauss, v´ease Teorema de Gauss Geod´esica, 253, 274, 288

378

coordenadas, v´ease Coordenadas desviaci´ on, 269, 275 ecuaci´ on algebraica, 260 ecuaci´ on diferencial, 253, 262, 277 estacionario, 253 extremal, 253 Geod´esico postulado, 274 Geometr´ıa de Riemann, 199–251 de Schwarzschild, v´ease Schwarzschild euclidiana, 33, 132 intr´ınseca, 251 y gravitaci´ on, 273, 288 gµν , 199, 210 de Schwarzschild, v´ease Schwarzschild derivada covariante gµν;α , 229, 293 gµν es como Φ, 289 g00 = 1 + 2Φ/c2 , 290, 305 primera derivada gµν,α , 223, 226, 243, 277, 293 segunda derivada gµν,α,β , 243, 277, 293 altas derivadas, 281 Goldstein, 336 Gradshteyn, 264, 326 Gravitaci´ on comparaci´ on Newton-Einstein, 336 idea central, 273 newtoniana, 275, 287, 295, 301, 336, 343 y geometr´ıa, 273, 288

covariantes, 125, 204 griegos, 119 latinos, 119 libres, 123, 139, 200 Inercia, 73 Inercial, v´ease Observador Interacci´ on, 182, 273, 288 Intervalo, 76, 120, 123, 140, 177, 201, 209, 253, 273, 302 espacialoide, 34, 51, 52 luminoide, 35, 39, 51, 52 negativo, 257 nulo, 257 positivo, 254, 257 temporaloide, 33, 37, 51, 52 Invariante, 132, 136, 139, 178, 188, 209, 222 E · B y E 2 − B 2 , 99–101, 159 Izquierda, 55, 56 J, 316, 318 Jackson, 26, 43, 102 Jacobiano, 222 Jammer, 357 J µ , 143, 151, 216 del polvo, 163 el´ectrica, 164 J´ upiter, 340 Kay, 277 Kerr, 300 kµ , 142 Kronecker, v´ease δ de Kronecker Kruskal, 349

~, 144 Hamilton, v´ease Principio de Hamilton ´ Hidr´ ogeno, v´ease Atomo Hilbert, 288, 301 Hilbert-Einstein, 288, 292 Homogeneidad, v´ease Principio de Horizonte, v´ease Schwarzschild Hueco blanco, v´ease Schwarzschild Hueco negro, v´ease Schwarzschild Huygens, 3

L, 180 L, 178 Lagrangiana, 180, 255, 259 L, 186 Λ, 135, 294 λ, 318, 335 Landau, 299 Levi-Civita, 133, 159 Li´enard-Wiechert, 102 Ligada, v´ease Schwarzschild Lightman, 327 L´ımite newtoniano, 288, 295, 305 L´ınea en el mundo, 51 Local, v´ease Velocidad local

Identidades de Bianchi, v´ease Bianchi ´Indices bajar o subir, 122, 128, 139, 200, 201 contra´ıdos, 123, 200 contravariantes, 125, 204

379

Longitud, 31, 41, 44, 54 propia, 41, 44 Lorentz, 2, 6, 20, 149, 150 Luminoide, 35, 39, 51, 52, 345 Luz aberraci´ on, 4, 31, 79 cono de luz, v´ease Cono de la luz difracci´ on, 3, 4 interferencia, 3, 4, 8–11 polarizaci´ on, 3, 4 rayo de, 3, 301, 337, 338 velocidad, 4, 6–13, 46, 357, 361–366, 369

Nube de part´ıculas cargadas, 110, 169 de polvo, 162 Nuclear, 74

µνδ Mmec , 172–175 Mapamundi, 348 Mareas, 347, 348 Masa, 61–85, 140 gravitacional, 74, 275 inercial, 74, 275 variable, 83 Matriz F µν , 155 Λ, 135, 213 θµν y θµ ν , 196 Mec´ anica cu´ antica, 74, 82, 144, 301 lagrangiana, 177 newtoniana, 1, 2, 61, 65, 67, 69, 83, 86–89, 275, 318, 327, 336, 343 Mehra, 288 Mercurio, 301, 337, 339, v´ease Schwarzschild M´etrica, 370 de Minkowski, 76, 120, 132, 215, 218, 276, 290, 370 de Schwarzschild, v´ease Schwarzschild Michelson y Morley, 2, 8–11, 13 Minkowski, v´ease M´etrica de Minkowski Minkowski H., 50, 51 Momento dipolar el´ectrico, 107 Momentum, 61–73, 141 del fot´ on, 79, 142 Momentum angular, 172–175 Movimiento circular, 85 Mundo, 51

Neutr´ on, 74 Newton, 3, 357 Newtoniana, v´ease Mec´ anica

380

Observador inercial, 7, 13, 15, 93, 140, 177, 202 Observador no inercial, 202, 276, v´ease Ca´ıda libre Ohanian, 236, 240, 276, 298, 300, 352 Onda electromagn´etica, 1, 6, 152 fase de, 144 frente de, 144 Onda-corp´ usculo, 1–8 ´ Optica, 3–11 ´ Orbita desligada, v´ease Schwarzschild ´ Orbita de un rayo de luz, v´ease Schwarzschild ´ Orbita ligada, v´ease Schwarzschild ´ Orbita mercurial, v´ease Schwarzschild ´ Orbita terrestre, v´ease Schwarzschild Pais, 2 Par´ ametro, 39, 177, 254, 267 af´ın, 256, 262, 263, 269, 318, 335 Part´ıcula ca´ıda libre, v´ease Ca´ıda libre de m 6= 0, 257 en campo grav., v´ease Ca´ıda libre en un campo Aµ , 182 forzada, 51, 140, 168, 169, 177 libre, 38, 51, 81, 140, 157, 168, 177, 181, 274 Pasado, 52, 55, 56, 346, 351 Perihelio, v´ease Schwarzschild Planck, 6 Planetas, 330, 333 Plano, v´ease Espacio plano pµ , 141, v´ease Momentum Poisson, 4, 287 Polvo, 162 Postulado geod´esico, 274 Potencia, 154 Potencial efectivo, 328, 334 electrost´ atico, 82, 87 escalar φ, 148, 182 gravitatorio, v´ease Φ pozo de, v´ease Pozo de potencial

vectorial A, 148, 182 Poynting, 104 Pozo de potencial, 330, 334 Precesi´ on del perihelio de Mercurio, v´ease Schwarzschild Press, 327 Price, 327 PriHomo, v´ease Ppio. de homog. de tiempo y espacio Principio de conservaci´ on de la energ´ıa, 69 conservaci´ on del momentum, 61–65, 69 covariancia general, 220 equivalencia, 277 Galileo, 275 Hamilton, 186 Huygens, 3 la homogeneidad del tiempo y el espacio, 12, 14, 357, 360, 369 la relatividad, 2, 12, 13, 94, 111, 138, 139, 357, 359, 360, 369 la velocidad de la luz, 2, 12, 46, 357, 361–366, 369 mundo absoluto, 51 PriRel, v´ease Ppio. de relatividad PriVel, v´ease Ppio. de la vel. de la luz Propio densidad, 43 longitud, 41, 44 tiempo, 31, 37, 44, 55, 110, 140, 178, 257, 311 volumen, 42 Prot´ on, 74, 88 Prototipo, v´ease Vector Puntos de retorno, v´ease Schwarzschild

separaci´ on espacial, 32, 54 separaci´ on temporal, 32, 36, 54 Relojes, 38, 311 atraso gravitacional, 313 atraso por aceleraci´ on, 314 atraso por movimiento, 37, 313 desincronizaci´ on, 36 en el infinito, 313, 323 en reposo, 313, 323 en reposo en el infinito, 313, 323 sincronizaci´ on, 16 Resnick, 20, 62, 69, 104 Ricci Rβµ , 230, 244, 287, 303 Riemann espacio de, 199, 253 Riemann tensor de, 229–244, 277, 347, 348 n2 (n2 − 1)/12 componentes, 232 cinco identidades, 230 es u ´nico, 240, 293 es curvatura, 233, 269 Rotaci´ on de masa puntual, 300 grupo de, 302 Ruffini, 236, 240, 276, 298, 352 Ryzhik, 264, 326 Schroedinger, 82 Schutz, 277, 348 Schwarzschild, 300, 301 ca´ıda libre, 317 ca´ıda libre vertical, 324 cono de luz, 345, 351 consts. del mov., 316, 317, 333 tercera const. del mov., 319 ecuaci´ on de tercer grado, 332 el subespacio (θ, ϕ), 309 el subespacio (r, θ, ϕ), 308 el subespacio (r, ϕ), 310 el subespacio (r, θ), 308 el subespacio (t, θ), 310 el subespacio (t, r), 309 escalar R, 307 espacio de, 248 futuro, 346, 351 geometr´ıa de, 248 horizonte, 344, 346, 347 hueco blanco, 352 hueco negro, 345–348 leyes f´ısicas en, 284

QCD, 370 Rango de un tensor, 129, 207, 209 Red shift, v´ease Corrimiento al rojo Regla (,) → (;), 280 Relatividad especial estructura, 3, 19 motivaci´ on, 2, 357 Relativo frente de onda, 144 izquierda-derecha, 55 pasado-futuro, 55

381

µν Tcan , 189–197 Temporaloide, 51, 52, 344–346, 351 Tensor µνδ Mmec , 172–175 Aµ , 148, 182, 193–197, 203 Aµ Bµ es un tensor, 132, 209 antisim´etrico, 209 asim´etrico, 192, 195 µν , 189–197 can´ onico Tcan de energ´ıa-momentum, 165–175, 189– 197, 280 de Levi-Civita, 159 de momentum angular, 172–175 del campo electromagn´etico, 170, 189– 197 δµ ν es un tensor, 132 ∂ µ ∂µ , 134 ∂µ φ y ∂µ Aν son tensores, 134 ecuaciones, 137, 139 electromagn´etico, 155, 193–197, 217 ²αβγδ es un tensor, 133 escalar, 129, 132 ηµν es un tensor, 132 F µν , 155, 193–197, 217 gµν , 199, 210 J µ , 143, 163, 216 kµ del fot´ on, 142 Levi-Civita, 133 m´etrico, 132, 199, 210, 273 pµ es un tensor, 141 rango de un, 129, 207, 209 Riemann, v´ease Riemann sim´etrico, 166, 175, 192, 195, 209 µν Tcan , 189–197 µν θ , 170, 192, 196 U µ es un tensor, 141 vector, 79, 129 Tensor de Riemann, v´ease Riemann Teor´ıa de la gravitaci´ on, v´ease Gravitaci´ on Teorema de Gauss, 163, 166 de las coordenadas adaptadas, 236 del tensor m´etrico, 244 principal del c´ alculo, 222 Teukolsky, 327 θµν , 170, 192, 196 Thomas, 136 Tiempo T , 311

m´etrica de, 248 mareas, 347, 348 o ´rbita circular, 331 o ´rbita desligada, 329 o ´rbita de un rayo de luz, 337, 338 o ´rbita ligada, 329 o ´rbita mercurial, 337, 339 o ´rbita terrestre, 333, 337 par´ ametro af´ın, 318, 323, 335 pasado, 346, 351 apelio mercurial, 339 perihelio mercurial, 339 apelio terrestre, 333 perihelio terrestre, 333 planetas, 330, 333 potencial efectivo, 328, 334 pozo de potencial, 330, 334 precesi´ on perihelio mercurial, 339 pseudosingularidad, 348 puntos de retorno, 328, 331, 332, 336, 338, 340 radio de, 248, 306 s´ımbolos Γµ αβ , 307 singularidad, 347 subespacios, 308 tensor Rµν , 307 tensor Rα βµν , 307 tiempo τ , 311, 323, 326, 347 tiempo T , 311, 323 tiempo t, 311, 323, 327, 347 tiempo universal, 323 Serie de Taylor, 180, 270 S´ımbolo de Christoffel, v´ease Γµ αβ Simultaneidad, 31, 34, 36, 44, 54, 144, 313 Sincronizaci´ on de relojes, 16 Singularidad, v´ease Schwarzschild Sirio, 317 Sistema f´ısico aislado, 15, 169 no aislado, 169 Snell, 3 Sol, 288, 306, 317, 333, 337, 339 Sonido, 1, 5 Stokes, 6 Szekeres, 349 τ , 37, 178, 311, v´ease Tiempo propio Taylor, v´ease Serie de Taylor

382

τ , 311 t, 311 coordenado, v´ease Coordenada temporal de vida media, 39 propio, 31, 37, 44, 55, 110, 140, 178, 257, 311, 347 universal, 298, 313, 323 inversi´ on, 299 Tierra, 4, 8–11, 288, 306, 323, 333, 337 T µν , 280, 287, 294, 304, 306 asim´etrico, 192, 195, 298 T µν ,ν = 0, 166–175, 280 T µν ;ν = 0, 280, 294 sim´etrico, 166, 175, 192, 195, 298 Torretti, 348 Trabajo, 65–69, 82 Transformaci´ on de p , E , m , F, 76 de E y B, 93–115, 158, 359, 367–369 de F µν , 158 de J µ = (cρ, J), 111 gauge, 148 Transformaciones de coordenadas, 17, 359, 360, 369 de Galileo, 12, 24, 26, 46, 65, 361 de Lorentz, 20–28, 124, 138, 139, 199, 218, 280, 366–367 familia de, 24, 361 generales, 199–251, 280 lineales, 20, 124, 199, 244 no lineales, 202 Translaciones, 188 Trayectoria de una part´ıcula, 16, 39, 140, 164, 177 en campo grav., v´ease Ca´ıda libre

Velocidad de una part´ıcula, 17, 62, 75, 140, 141 Velocidad de un observador, 17, 62 Velocidad local, 312, 315, 321 Venus, 340 Vida media, 39 Virtual, 178 Volumen de nube, 110 diferencial de, 136, 221 propio, 42 Wald, 348 Weinberg, 133, 162, 281 Young, 4

u = 1/r, 336 U µ , 141 Uni´ on de E y B, 101, 119 de espacio y tiempo, 31, 119 Unitario, v´ease Vector Universal, v´ease Tiempo Variacional, v´ease C´ alculo variacional Vector, 79, 125, 129, 203, 209 prototipo, 125, 131, 140, 203, 209 unitario, 85, 142, 143, 214

383

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF