Notas de clase: relatividad general
Short Description
Download Notas de clase: relatividad general...
Description
Fundamentos de Relatividad Gerneral Juan Manuel Tejeiro Sarmiento Profesor Titular Observatorio Astronómico Nacional Facultad de Ciencias Universidad Nacional de Colombia Agosto de 2004
ii
Índice general Introducción
I
VII
Geometría diferencial
1
1. Fundamentos matemáticos 1.1. Espacios topológicos . . . . . . . . . . . . . . . . . . . . . . . 1.2. Espacios métricos . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 2. Variedades 2.1. Variedades diferenciales . . . . . . . . . . 2.2. Espacio tangente . . . . . . . . . . . . . . 2.3. TENSORES . . . . . . . . . . . . . . . . . 2.4. Transformaciones entre variedades . . . . 2.5. Cálculo en variedades . . . . . . . . . . . 2.5.1. Derivada de Lie . . . . . . . . . . . 2.5.2. Conexión y derivada covariante . . 2.5.3. Transporte paralelo . . . . . . . . 2.5.4. Tensor de Riemann . . . . . . . . . 2.5.5. Tensor métrico . . . . . . . . . . . 2.5.6. Relación entre conexión y métrica 2.5.7. Campos de Killing . . . . . . . . .
II
Relatividad General
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
3 3 5 7 15 15 19 27 33 36 39 41 44 48 50 53 55
59
3. Los postulados de la relatividad general 61 3.1. La ley de gravitación universal . . . . . . . . . . . . . . . . . 61 3.2. Postulados de la TGR . . . . . . . . . . . . . . . . . . . . . . 64 iii
iv
ÍNDICE GENERAL 3.3. El tensor métrico y el postulado de causalidad . . . . . . . . . 3.4. Ecuaciones de campo de Einstein . . . . . . . . . . . . . . . .
4. La solución de Schwarzschild 4.1. Métrica para simetría esférica . . . . . . . . . . . . . . 4.1.1. Teorema de Birkhoff . . . . . . . . . . . . . . . 4.1.2. Características de la solución de Schwarzschild 4.2. Pruebas clásicas de la relatividad general . . . . . . . 4.2.1. Corrimiento del perihelio de Mercurio . . . . . 4.2.2. Desviación de la luz por el sol . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
66 73 77 77 84 86 88 88 95
Prefacio Notas de clase para el curso de Galaxias y Cosmología.
v
vi
PREFACE
Introducción En este libro se presentarán los fundamentos de la teoría general de la relatividad. La primera parte está dedicada a la fundamentación matemática necesaria para la formulación rigurosa de la teoría general de la relatividad. En la segunda parte formularemos los postulados de la relatividad y su aplicación a los agujeros negros. La tercera parte está centrada en el modelo estandar de la cosmología.
vii
viii
INTRODUCCIÓN
Parte I
Geometría diferencial
1
Capítulo 1
Fundamentos matemáticos 1.1.
Espacios topológicos
En esta sección se darán algunas definiciones fundamentales sobre espacios topológicos y espacios métricos. Definicion 1 Definición 1.1 Un espacio topológico T es una pareja (T, A), con T un conjunto y A una familia de subconjuntos de T , llamados los abiertos, tales que: T-1: φ, T ∈ A, es decir, el vacío φ y todo el conjunto T son abiertos. T-2: Dada cualquier colección de abiertos aα ∈ A,con α ∈ I, siendo I un conjunto de índices, entonces ∪α∈I aα ∈ A, es decir, unión arbitraria de abiertos es un abierto. T-3: Dada cualquier colección finita de abiertos ai ∈ A, i = 1, 2, ..., n, entonces ∩ni=1 ai ∈ A, es decir, intersección finita de abiertos es abierto. A la familia de abiertos A se le llama la topología de T . Claramente a todo conjunto se le puede asociar una topología, pues basta con definir como los abiertos de T a cualquier subconjunto de T . Esta topología es conocida en la literatura como la topología discreta. Otra posibilidad para definir una topología sobre cualquier conjunto es la llamada topología trivial, cuyos abiertos se reducen al conjunto vacío y a todo el espacio. Estos dos casos extremos de espacios topológicos no son de utilidad práctica, pero nos sirven para ilustrar situaciones y conceptos especiales que surgen en el estudio de los espacios topológicos. Un ejemplo no trivial de una topología lo constituye los números reales R con la llamada topología usual, en donde los abiertos están conformados por todos los intervalos abiertos de la forma (a, b) ⊂ R, con la identificación (a, a) = φ y (−∞, ∞) = R. 3
4
CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS
Definicion 2 Sean T y R espacios topológicos. Una función f : T −→ R
(1.1)
se dice continua, si para cualquier abierto b de R, la imagen inversa f −1 (b) es un abierto de T . Más adelante relacionaremos esta definición de continuidad, con la definición usualmente utilizada en espacios métricos, cuando relacionemos la estructura topológica de un espacio con su estructura métrica. Definicion 3 Sean T y R espacios topológicos. Una función ϕ : T −→ R
(1.2)
se llama un homeomorfismo, si la función ϕ es continua con inversa ϕ−1 : R −→ T
(1.3)
continua. Así, todo homeomorfismo ϕ entre espacios topológicos transforma abiertos de un espacio topológico en abiertos del otro espacio, y en este caso diremos que los dos espacios topológicos son homeomorfos. Veamos dos ejemplos que ilustran porqué los espacios topológicos extremos, el discreto y el trivial, no son de interes práctico. Dada una función ϕ : T −→ R
(1.4)
con R un espacio topológico cualquiera y T el espacio topológico discreto, entonces toda función ϕ es trivialmente continua, pues dado cualquier abierto de R su imagen inversa es un subconjunto de T , que por definición es un abierto, mientras que si T tiene la topología trivial, entonces ninguna función ϕ es continua, dado que los únicos abiertos de T son el vacío y todo el espacio. Definicion 4 Un espacio topológico T se llama de Hausdorf o separable, si para todo par de puntos p, q ∈ T , con p 6= q, existen abiertos U y V de T , con p ∈ U y q∈ V tal que U ∩ V = φ. Claramente el espacio topológico discreto es de Hausdorff, así como los números reales con la topología usual, mientras que un espacio topológico con la topología trivial no es un espacio topológico de Hausdorff.
1.2. ESPACIOS MÉTRICOS
5
Definicion 5 Sea T un espacio topológico y C ⊂ T un subconjunto cualquiera de T . Un recubrimiento abierto de C es una colección de abiertos aα de T con α ∈ I, siendo I un conjunto de índices, tal que C ⊂ ∪α∈I aα . Definicion 6 Un subconjunto C ⊂ T , de un espacio topológico T se llama compacto, si dado cualquier recubrimiento abierto de C, existe un subrecubrimiento finito ai , i = 1, 2, ..., n de C, esto es C ⊂ ∪ni=1 aα . Definicion 7 Un subconjunto A ⊂ T , de un espacio topológico T se llama cerrado, si su complemento, i.e., T \A, es abierto. Claramente, dependiendo de la estructura topológica del espacio, hay conjuntos que son abiertos y cerrados a la vez, por ejemplo cualquier subconjunto de un espacio topológico discreto. También existen subconjuntos que no son ni abiertos ni cerrados, por ejemplo, en los reales con la topología usual, cualquier intervalo semicerrado, es decir de la forma [a, b) o (a, b], no es abierto ni cerrado. Ahora, en todo espacio topológico el vacío y todo el espacio son subconjuntos abiertos y cerrados a la vez, pues ellos son mutuamente complementarios. Se puede mostrar que en un espacio topológico de Hausdorff los únicos conjuntos abiertos y cerrados simultáneamente son el vacío y todo el espacio. En el espacio de los números reales R con la topología usual, cualquier intervalo cerrado de la forma [a, b] es compacto, mientras que cualquier intervalo abierto no lo es. Más generalmente, en R con la topología usual, todo subconjunto cerrado y acotado es compacto. En la siguiente sección se darán las definiciones fundamentales de espacios métricos y su relación con la estructura topológica.
1.2.
Espacios métricos
Definicion 8 Un espacio métrico M es un conjunto de puntos con una función, llamada métrica, d:
M×M (x, y)
−→ 7−→
R d(x, y)
(1.5)
tal que: M-1: ∀x, y ∈ M, se tiene que d(x, y) ≥ 0, y d(x, y) = 0 ⇐⇒ x = y. M-2: ∀x, y ∈ M, se tiene que d(x, y) = d(y, x). M-3: ∀x, y, z ∈ M, se satisface la desigualdad triangular, i.e., d(x, z) ≤ d(x, y) + d(y, z)
(1.6)
6
Rn
CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS Uno de los ejemplos más importantes de espacio métrico lo constituye con la llamada métrica usual, o euclideana, definida como: p (1.7) d(x, y) := (x1 − y 1 )2 + · · · + (xn − yn )2
en donde x = (x1 , ..., xn ), y = (y 1 , ..., y n ). Sobre Rn también es posible definir otras métricas, de hecho infinitas métricas, pues la función à n !1/p X i i p (x − y ) dp (x, y) =
(1.8)
i=1
para cada entero p satisface las propiedaes M − 1 a M −3. El caso particular p = 2, corresponde a la métrica usual. Un caso particular de una métrica, definida como d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y muestra que todo conjunto es metrizable. Esta métrica es trivial y se utiliza solamente para construir contraejemplos. Definicion 9 Sea M un espacio métrico. Una bola abierta B(x; r) de radio r y centro x ∈ M es el conjunto de todos los puntos y ∈ M tales que d(x, y) < r. Un subconjunto A ⊂ M se llama acotado si para todo par de puntos x, y ∈ A existe un número real positivo r tal que d(x, y) < r. Claramente para todo conjunto acotado de un espacio métrico se puede construir una bola centrada en cualquiera de los puntos que contenga al conjunto. Definicion 10 Sean M y N espacios métricos con métricas dM y dN respectivamente. Una función f : M → N se dice continua en un punto x ∈ M si dado cualquier real positivo > 0 simpre es posible encontrar un número real δ > 0 tal que dM (y, x) < δ implica que dN (f (x), d(y)) < . Una función entre espacios métricos continua con inversa continua se llama un homeomorfismo. Para conectar la estructura de espacio métrico con la estructura de espacio topológico definamos: Definicion 11 Sea A ⊂ M , con M un espacio métrico. Entonces A es un subconjunto abierto de M si ∀x ∈ A existe una bola abierta B(x, r) contenida en A.
1.3. ESPACIOS VECTORIALES
7
Es fácil probar, entonces, que los abiertos de un espacio métrico satisfacen las propiedades T − 1, T − 2 y T − 3 de la definición 1 y por lo tanto definen una topología sobre M , llamada la topología inducida. Así, toda métrica induce una topología, pero no toda topología proviene de alguna métrica. Por ejemplo, la métrica trivial d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y induce la topología trivial, pero ninguna métrica induce la topología discreta. Además, la topología usual sobre Rn es la inducida por la métrica usual. De esta forma, cuando se trabaja con espacios métricos siempre se asume la topología inducida por la correspondiente métrica.
1.3.
Espacios vectoriales
Definicion 12 Un grupo (G, ◦) es un conjunto de elementos G sobre el cual está definida una operación interna ◦, es decir, una función de la forma: ◦:
G ×G (g1 , g2 )
−→ 7−→
G g = g1 ◦ g2
(1.9)
tal que G-1: Exista un elemento e ∈ G, llamado la identidad, con la propiedad que para todo elemento g ∈ G, se cumpla que e ◦ g = g ◦ e = g. G-2: Para todo elemento g ∈ G, exista un elemento g −1 ∈ G, llamado el elemento inverso, tal que: g ◦ g −1 = g −1 ◦ g = e. G-3: ∀g1 , g2 , g3 ∈ G se cumple la asociatividad: g1 ◦ (g2 ◦ g3 ) = (g1 ◦ g2 ) ◦ g3 En general se tiene que g1 ◦ g2 6= g2 ◦ g1 , y cuando la igualdad se cumple para todos los elementos del grupo, este se llama un grupo conmutativo. Ejemplos de grupos, los números reales R con la suma, o los números enteros Z con la suma. Otro ejemplo de mucha importancia en física, lo constituye el conjunto de transformaciones de simetría sobre un sistema, con la operación de grupo como la composición de transformaciones. Por una operación de simetría sobre un sistema entendemos una transformación que deja invariante al sistema. Por ejemplo, consideremos una molécula de amoniaco N H3 , constituida por tres átomos de hidrógeno y uno de nitrógeno. La configuración espacial de esta molécula es una pirámide cuya base es un triángulo equilátero determinado por los tres hidrógenos y el vértice lo determina el átomo de nitrógeno. Si rotamos esta molécula en un águlo de 120◦ o de 240◦ alrededor de un eje que pase por el átomo de nitrógeno y que sea perpendicular al plano determinado por los tres hidrógenos, entonces la configuración
8
CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS
espacial de la molécula no cambia, y se dice que la molécula posee el grupo de simetría conformado por los elementos: G = {R(0◦ ), R(120◦ ), R(240◦ )}
(1.10)
en donde R(θ◦ ) significa rotar la molécula θ◦ alrededor de su eje de simetría. El elemento identidad es R(0◦ ) que significa no rotar, el producto de dos rotaciones es otra rotación, R(θ◦ ) ◦ R(ϕ◦ ) = R(θ◦ + ϕ◦ ), e identificando R(0◦ ) ≡ R(360◦ ), los elementos del grupo R(120◦ ) y R(240◦ ) son mutuamente inversos. Este ejemplo lo podemos generalizar al caso de las simetrías de un polígono regular de n lados. En este caso el grupo de simetrías, rotaciones del polígono alrededor de un eje que pasa por su centro, tiene n elementos: 360◦ 360◦ 360◦ ), R(2 ) · · · R((n − 1) )} (1.11) G = {R(0◦ ), R( n n n Consideremos ahora el caso límite de un polígono regular de infinitos lados, es decir el círculo. En este caso el grupo de simetrías contiene un número infinito no numerable de elementos y cada uno de los elementos está representado por una función R(θ◦ ) que representa una rotación en un ángulo θ◦ , en donde θ◦ es un parámetro que toma valores en el intervalo [0, 360] y de nuevo se ha hecho la identificación R(0◦ ) ≡ R(360◦ ). Estos ejemplos de grupos tratados, ilustran los tipos de grupos más comunes que encontramos en diversas aplicaciones: Grupos con un número finito de elementos, como las rotaciones de un polígono regular de n lados, o grupos con un número infinito de elementos, pero numerable, como los enteros con la suma, y grupos con un número infinito no numerable de elementos. Esta última clase de grupos, caracterizados por un parámetro continuo (o varios parámetros continuos, como el grupo de rotaciones tridimensional) constituyen una clase particular de grupos llamados de Lie, los cuales juegan un papel muy importante en la matemática, y en especial en la física. Volveremos sobre ellos más adelante. Definicion 13 Un cuerpo o campo (G, +, ×) es un conjunto de elementos G sobre el cual están definidas dos operación internas +, y ×, llamadas suma y multiplicación respectivamente, tal que (G, +) forma un grupo abeliano, y la operación × satisface las siguientes propiedades: C-1: Exista un elemento 1 ∈ G, llamado la identidad multiplicativa, con la propiedad que para todo elemento g ∈ G, se cumpla que 1 × g = g × 1 = g. C-2: Para cualesquiera tres elementos g1 , g2 , g3 ∈ G, se cumple que la multiplicación se distribuye sobre la suma, i.e., g1 × (g2 + g3 ) = g1 × g2 + g1 × g3 .
1.3. ESPACIOS VECTORIALES
9
C-3: La multiplicación es asociativa y conmutativa, es decir, ∀g1 , g2 , g3 ∈ G, se cumple que: g1 × g2 = g2 × g1 , y g1 × (g2 × g3 ) = (g1 × g2 ) × g3 = g1 × g2 × g3 . El ejemplo más común, e importante de un campo lo constituyen los números reales con la suma y la multiplicación usuales. El concepto de campo es útil para nosotros en el contexto de la siguiente definición: Definicion 14 Un espacio vectorial V, sobre un campo K, es un conjunto de elementos, llamados vectores, con una operación interna + (suma de vectores) tal que: V-1: La suma de vectores es conmutativa: ∀x, y ∈ V, se tiene que x+y = y + x. V-2: La suma de vectores es asociativa: ∀x, y, z ∈ V, se tiene que x + (y + z) = (x + y) + z. V-3: Existe el vector nulo 0 ∈ V, tal que ∀x ∈ V se cumple 0 + x = x. V-4: ∀x ∈ V, existe el vector −x ∈ V, tal que x + (−x) ≡ x − x = 0. Esto significa que el conjunto V con la suma de vectores forma un grupo abeliano. Sobre V está definida una operación externa (multiplicación por un escalar) con el campo K, llamado los escalares, es decir una función de la forma · : K × G −→ G (1.12) (λ, g) 7−→ h = λ · g ≡ λg tal que: V-5: λ(x+y) = λx+λy, para todo par de vectores x, y ∈ V y todo escalar λ ∈ K. V-6: (α + β)x = αx + βy, para todo vector x, y todo par de escalares α, β. V-6: α(βx) = (αβ)x, para todo vector x, y todo par de escalares α, β. V-7: 1x = x, 0x = 0 y (−1)x = −x, en donde 1 es la identidad multiplicativa de K, 0 ∈ K la identidad aditiva y −1 ∈ K el inverso aditivo de 1. El ejemplo más importante de espacio vectorial es Rn sobre los reales. Para construir otros ejemplos importantes por sus aplicaciones, consideremos V y W dos espacios vectoriales sobre el cuerpo de los reales, y definamos una transformación lineal T como una función T :
V v
−→ 7−→
W w = T (v)
(1.13)
10
CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS
tal que: T (αv + βu) = αT (v) + βT (u);
∀v, u ∈ V
y
∀α, β ∈ <
(1.14)
Definamos sobre el conjunto de todas las transformaciones lineales de V en W, i.e., L(V, W) := {T : V → W | T es < − lineal} (1.15) una suma y el producto por un real como: (T1 + T2 )(v) := T1 (v) + T2 (v); (αT )(v) := αT (v);
∀T1 , T2 ∈ L(V, W) y ∀v ∈ V
∀T ∈ L(V, W) , ∀v ∈ V y ∀α ∈ <
(1.16) (1.17)
entonces, claramente T1 + T2 y αT también son transformaciones lineales, i.e., T1 + T2 , αT ∈ L(V, W) (1.18) y por lo tanto el conjunto L(V, W) con estas operaciones es un espacio vectorial real. Un caso de particular importancia es el espacio vectorial L(V, 0, si v 6= 0 y kvk = 0 si v = 0 N-2: kλvk =| λ | kvk N-3: kv + wk ≤ kvk + kwk Toda norma sobre un espacio vectorial induce una métrica definida por: d(v, w) := kv − wk
(1.22)
La última estructura de gran importacia que se puede definir sobre un espacio vectorial es el producto punto, llamado también producto escalar o interno: Definicion 18 Sea V un espacio vectorial real. Definamos un producto interno sobre V como una función h·, ·i tal que: P-1: P-2: P-3: P-4:
V ×V v, w
−→ 7−→
R hv, wi
(1.23)
hv, vi > 0 si v 6= 0 y hv, vi = 0 si v = 0. hv, wi = hw, vi hλv, wi = λ hv, wi hv + w, zi = hv, zi + hw, zi
Las propiedades P-3 y P-4 significan que el producto punto es lineal en su primera componente, y P-2 implica que también es lineal en la segunda componente. Dado un producto punto sobre un espacio vectorial real, entonces sobre él se induce una norma definida por: p (1.24) kvk := hv, vi
y así se induce también una métrica y por ende una topología. Con estas definiciones podemos introducir el concepto de base ortonormal {ei } i = 1, 2, ..., n de un espacio vectorial, en donde los vectores de la base satisfacen la relación: (1.25) hei , ej i = δ ij
12
CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS
siendo δ ij el delta de Kronecker definido como 1 si i = j y cero en los demás casos. De la desigualdad triangular, propiedad N-3 de la norma de obtiene la desigualdad de Cauchy-Schwarz: | hv, wi |≤ kvkkwk
(1.26)
la cual, a su vez, nos permite definir el concepto de ángulo θ entre dos vectores v y w, a través de la relación: cos θ :=
hv, wi kvkkwk
(1.27)
lo cual justifica el nombre de base ortonormal, es decir vectores mutuamente ortogonales y de norma unitaria. Para finalizar esta introducción veamos el concepto de espacio vectorial dual. Para este fin sea L(V,R) el conjunto de todas las transformaciones lineales del espacio vectorial sobre los reales, es decir: L(V, =0 está formado por todos los vectores tangentes a las curvas que están en la superficie f = cte en el punto p. Así df se puede pensar como perpendicular o normal a la superficie f = cte en p.
2.3.
TENSORES
Definicion 36 Definimos el producto cartesiano Πsr de la siguiente forma: Πsr := Tp∗ × Tp∗ × Tp∗ × · · · × Tp∗ × Tp × Tp × Tp × · · · × Tp {z } | {z } | r−veces
(2.56)
s−veces
Donde intervienen r factores Tp∗ y s factores Tp , es decir:
Πsr = {(η 1 , ..., η r , Y1 , ..., Ys ) | η i ∈ Tp∗ , Yj ∈ Tp }
(2.57)
Definicion 37 Un tensor T del tipo (r, s) en p ∈ M es una funcional multilineal sobre Πsr , es decir: T : Πsr −→ R (η 1 , ..., η r , Y1 , ..., Ys ) −→ T (η 1 , ..., ηr , Y1 , ..., Ys ) lineal en cada componente. El espacio de todos los tensores es llamado el producto tensorial Tsr : Tsr := Tp∗ ⊗ Tp∗ ⊗ Tp∗ ⊗ · · · ⊗ Tp∗ ⊗ Tp ⊗ Tp ⊗ Tp ⊗ · · · ⊗ Tp
(2.58)
Tsr = {f : Πsr → R | f es lineal en todas sus componentes} Donde intervienen r factores Tp∗ y s factores Tp .Tenemos que en particular T01 = Tp y T10 = Tp∗ .
28
CAPÍTULO 2. VARIEDADES
Definicion 38 Sean T y T0 ∈ Tsr (p) dos tensores del mismo tipo y definimos la suma por: (T + T0 )(η 1 , ..., η r , Y1 , ..., Ys ) : = T(η 1 , ..., η r , Y1 , ..., Ys ) (2.59) +T0 (η 1 , ..., η r , Y1 , ..., Ys ) y el producto por un escalar α ∈ R como: (αT)(η 1 , ..., η r , Y1 , ..., Ys ) := αT(η 1 , ..., η r , Y1 , ..., Ys )
(2.60)
Con estas reglas Tsr (p) forma un espacio vectorial real de dimensión r +s. Sean Xi ∈ Tp (i = 1, ..., r) y ω j ∈ Tp∗ (j = 1, ..., s). Denotemos por X1 ⊗ X1 ⊗ · · · ⊗ Xr ⊗ ω 1 ⊗ ω2 ⊗ · · · ⊗ ω s al elemento de Tsr (p) el cual transforma al elemento (η 1 , ..., η r , Y1 , ..., Ys ) ∈ Πrs en el número (X1 ⊗X1 ⊗ · · · ⊗Xr ⊗ω 1 ⊗ω 2 ⊗ · · · ⊗ω s )(η 1 , ..., η r , Y1 , ..., Ys )(2.61)
: =< η 1 , X1 > · · · < η r , Xr >< ω 1 , Y1 > · · · < ω s , Ys >
Similarmente, si R ∈ Tsr (p) y S ∈ Tqp (p), entonces denotaremos por R ⊗ S al r+p (p) el cual transforma al elemento (η 1 , ..., η s+q , Y1 , ..., Yr+p ) elemento de Ts+q en el número real (R ⊗ S)(η 1 , ..., ηs+q , Y1 , ..., Yr+p ) 1
s
: = R(η , ..., η , Y1 , ..., Yr )S(η
s+r
, ..., η
(2.62) s+q
, Yr+1 , ..., Yr+p
Con este producto ⊗ el espacio de los tensores en p forma un álgebra sobre R. Lemma 39 Sean {Eα } y {Eα } bases duales de Tp y Tp∗ respectivamente. Entonces (2.63) {Eα1 ⊗Eα2 ⊗ · · · ⊗Eαr ⊗Eβ 1 ⊗Eβ 2 ⊗ · · · ⊗Eβ s } con αi , β i = 1, 2, ...n es una base de Tsr (p). De esta forma, dado T ∈ Tsr (p) escribimos: β1 β2 βs r T = T α1 ····α β ···β Eα1 ⊗Eα2 ⊗ · · · ⊗Eαr ⊗E ⊗E ⊗ · · · ⊗E 1
Donde T α1 ····αβr β
1 2 ···β s
s
son las componentes de T en esta base.
(2.64)
2.3. TENSORES
29
Usualmente T se llama un tensor r veces contravariante y s veces covariante, y las componentes están dadas por: α1 αr r T α1 ····α β ···β = T(E , ..., E , Eβ 1 , ..., Eβ s ) 1
(2.65)
s
El álgebra del espacio vectorial Tsr (p) se puede escribir en términos de las componentes de los tensores en una base dada de la siguiente forma: (T + S)α1 ····αβr ···β 1 α1 ····αr
(αT)
= T α1 ····αβr ···β + S α1 ····αβr ···β
s
1
=
β 1 ···β s
s
1
(2.66)
s
αT α1 ····αβr ···β 1 s
y el álgebra del producto ⊗ como: α1 ····αr+p β 1 ···β s+q
(T ⊗ S)
= T α1 ····αβr ···β S 1
s
αr+1 ····αr+p β s+1 ···β s+q
(2.67)
Si {E0α } y {E0α } son otro par de bases duales de Tp y Tp∗ , ellas pueden ser expandidas en términos de las bases {Eα } y {Eα } en la forma: Eα0 = φα0α Eα α0
E
(2.68)
0 φαα Eα
=
(2.69)
0
Donde φα0α y φαα son matrices n × n no singulares. Puesto que las bases {E0α } y {E0α } son duales, entonces: 0
0
0
δ β α0 = < Eβ , Eα0 >=< φβ β Eβ , φα0α Eα > 0
(2.70)
0
= φβ β φα0α < Eβ , Eα >= φβ β φα0α δ β α 0
= φβ α φα0α 0
Es decir φα0α y φαα son matrices mutuamente inversas. Las componentes de un tensor T ∈ Tsr (p) con respecto a las bases {E0α } y {E0α } son: T
α01 ····α0r β 01 ···β 0s
0
0
= T(Eα1 , ..., Eαr , Eβ 01 , ..., Eβ 0s )
(2.71)
y están relacionadas con las componentes de T en las bases duales {Eα } y { Eα } por: T
α01 ····α0r β 01 ···β 0s
α01 α1
=φ
0
β
β
1
s
· · · φαrαr φβ 0 1 · · · φβ 0 s T α1 ····αβr ···β 1
s
(2.72)
30
CAPÍTULO 2. VARIEDADES
Definicion 40 La contracción de un tensor T del tipo (r, s) con componentes T α1 ····αβr ···β con respecto a las bases duales {Eα } y {Eα } sobre el 1 s primer índice contravariante y el primer índice covariante es definido como el tensor C11 (T) del tipo (r − 1, s − 1) cuyas componentes en las bases dadas sonT α1 ····ααr1 β ···β , es decir: 2
s
C11 (T) := T α1 ····ααr1 β
2 ···β s
Eα2 ⊗ · · · ⊗Eαr ⊗Eβ 2 ⊗ · · · ⊗Eβ s
(2.73)
Veamos que esta operación de contracción es independiente de las bases usadas. Sean {E0α } y {E0α } otras bases duales, entonces: C01 1 (T)
:
=T
α01 ····α0r E 0 α01 ···β 0s α2
α01 α2 ····αr α02 φ 0 α2 α1 β 2 ···β s
= T
γ
γ
2
r
β 02 η2
×φα0 2 · · · φα0 r φ α02 γ2 α2 φα0
= φ
2
0
0
0
β
β
2
s
· · · φαrαr φβ 0 2 · · · φβ 0 s T β 0s
···φ
η s Eγ 2
γ
β
r
2
×
α01 α2 ····αr β 02 β s β 0s η 2 φβ 0 φ ηs T α01 β 2 ···β s s ηs
· · · φαrαr φα0 r φβ 0 2 φ γ
= δ α2 2 · · · δ αrr δ = T
α01 α2 ····αr α01 β 2 ···β s
⊗ · · · ⊗Eγ r ⊗Eη2 ⊗ · · · ⊗Eηs
×Eγ 2 ⊗ · · · ⊗Eγ r ⊗Eη2 ⊗ · · · ⊗E γ
0
⊗ · · · ⊗Eα0r ⊗Eβ 2 ⊗ · · · ⊗Eβ s
α01 α2 ····αr β2 βs η2 φ ηs T α0 β ···β
α01 α2 ····αr E α01 β 2 ···β s α2
1 2
s
×
Eγ 2 ⊗ · · · ⊗Eγ r ⊗Eη2 ⊗ · · · ⊗Eηs
⊗ · · · ⊗Eαr ⊗Eβ 2 ⊗ · · · ⊗Eβ s = C11 (T )
Similarmente se define la contracción sobre cualquier par de índices n y m, es decir Cnm (T ). Definicion 41 La parte simétrica de un tensor T del tipo (2, 0) es el tensor S(T) ∈ T02 (p) definido por: S(T)(η 1 , η2 ) : = 1 {T(η 1 , η 2 ) + T(η 2 , η 1 )}; ∀η 1 , η 2 ∈ Tp∗ 2!
(2.74)
Si denotamos las componentes de S(T)αβ por Tαβ , entonces: S(T)αβ ≡ T (αβ) = S(T)(Eα , Eβ ) 1 {T(Eα , Eβ ) + T(Eβ , Eα )} = 2! o 1 n αβ T + T βα = 2!
(2.75)
2.3. TENSORES
31
En general, se pueden definir las componentes simétricas de un tensor T ∈Tsr (p) sobre cualquier número de índices covariantes o contravariantes, de la siguiente manera: T α1 ····α(βr
1 ···β s )
:=
1 X Tβ ···β 1 s s!
α1 ····αr
(2.76)
(β 1 ···β s )
en donde la suma es sobre todas las permutaciones de los índices β 1 · · · β s , por ejemplo: T α(βγη) =
ª 1 © α T βγη + T αβηγ + T αγ βη + T αβγη + T αη βγ + T αηγβ (2.77) 3!
Un tensor se llama simétrico con respecto a ciertos índices si él coincide con su correspondiente parte simétrica, por ejemplo: Tαβ = T(αβ) ⇐⇒ Tβα = Tαβ
(2.78)
Definicion 42 Similarmente a como se define la parte simétrica, definimos la parte antisimétrica A(T) de un tensor T ∈ T02 (p) por: o 1 n αβ (2.79) T − T βα A(T)αβ ≡ T [αβ] := 2!
y más generalmente de cualquier tensor T ∈ Tsr (p) como: T
[α1 ····αr ]
β 1 ···β s
:=
1 X (−1)p T α1 ····αr r! (α1 ····αr )
β 1 ···β s
(2.80)
donde p es el orden de la permutación. Por ejemplo: T [βγη] =
1 {T βγη − T βηγ + T γ βη − T βγη + T η βγ − T ηγβ } 3!
(2.81)
Un tensor se llama antisimétrico en ciertos índices, si éste es igual a su parte antisimétrica. Si T αβ = T [αβ] es antisimétrico, entonces T (αβ) = 0. Además, dado T ∈ T02 (p), se cumple siempre que; T αβ = T (αβ) + T [αβ]
(2.82)
Un subconjunto particularmente importante de tensores son los del tipo (0, q) los cuales son antisimétricos en todas sus q posiciones: Aq (p) ⊂ Tq0 (p). Claramente q ≤ n, con n la dimensión de la variedad. Al conjunto Aq (p) se
32
CAPÍTULO 2. VARIEDADES
le llama el espacio de las q-formas sobre M en p. Si A y B son dos p- y qformas, podemos definir la (p + q)-forma A ∧ Q, en donde ∧ es el producto tensorial antisimetrizado, A ∧ B :=A(A ⊗ B)
(2.83)
es decir, A ∧ B es el tensor de tipo (0, p + q) cuyas componentes están dadas por: (A ∧ B) α1 ····αp β 1 ···β q := A[α1 ····αp Bβ 1 ···β q ]
(2.84)
Por ejemplo, dados A, B ∈ A1 (p), entonces: (A ∧ B)αβ = A[α Bβ] 1 {Aα Bβ − Aβ Bα } = 2!
(2.85)
(B ∧ A)αβ = B[α Aβ] 1 {Bα Aβ − Bβ Aα } = 2! = (−1)1·1 (A ∧ B)αβ
(2.86)
(A ∧ B) = (−1)p·q (B ∧ A)
(2.87)
Por otro lado:
En general : donde A es una p-forma y B es una q-forma. Si consideramos los escalares como 0-formas, el producto ∧ llamado producto exterior, define un álgebra sobre el espacio de las formas, Λ(p) = n
∪ A(p), llamada el álgebra de Grassmann de las formas. Además, si {Eα }
p=0
es una base de las 1-formas, entonces Eα1 ∧ · · · ∧Eαp es una base de las p-formas, es decir, si A es una p-forma entoces podemos expresar A como A = Aα1 ...αp Eα1 ∧ · · · ∧Eαp donde Aα1 ...αp = A
(2.88)
[α1 ...αp ]
Definicion 43 Un C k -campo tensorial T del tipo (r, s) sobre un subconjunto U ⊂ M es una función que asigna un elemento de Tsr (p) para cada p ∈ U, tal que las componentes de T con repecto a alguna base cordenada definida sobre algun subconjunto abierto de U son funciones de clase C k . Denotaremos, como caso particular, por Ξ(M) al campo vectorial del tipo T01 (p).
2.4. TRANSFORMACIONES ENTRE VARIEDADES
2.4.
33
Transformaciones entre variedades
Definicion 44 Sean M y N variedades m y n dimensionales. Una función φ : M −→ N se llama de clase Ck si dados sistemas de coordenados (ψ α , Uα ) y (ϕβ , Vβ ) enM y N respectivamente, las coordenadas de φ(p) son funciones de clase Ck de las coordenadas de p: m −→ ϕβ ◦ φ ◦ ψ −1 Rn α : ψ α (Uα ) ⊆ R ψ α (p) 7−→ ϕβ (φ(p))
(2.89)
Notemos que si m > n, entonces la funcion ϕβ ◦ φ ◦ ψ −1 α no es uno a uno. Así, en general, esta función no tiene inversa, y en caso de que existiera ésta no será de clase Cr . Por ejemplo, sean M = N = R y sea φ(x) = x3 , entonces φ(x) ∈ C ∞ , y sin embargo φ−1 (x) no es diferenciable en x = 0. Definicion 45 Sea f ∈ F(N ) y φ : M −→ N . Entonces la función φ ˜ induce una función φ ˜ : F(N ) −→ F(M) φ ˜ f 7−→ φf
(2.90)
˜ (p) := f (φ(p)). definida por: φf ˜ convierte funciones De esta manera, φ transforma puntos de M en N y φ de F(N ) en funciones de F(M) linealmente, pues: ˜ φ(αf + g)(p) = (αf + g)φ(p)
(2.91)
= αf (φ(p)) + g(φ(p)) ˜ (p) + φg(p) ˜ = αφf Si λ(t) es una curva sobre M que pasa por p ∈ M, entonces la imagen φ(λ(t)) sobre N es una curva que pasa por φ(p). Definicion 46 Dada φ : M −→ N definamos la transformación φ∗ : Tp M −→ Tφ(p) N X −→ φ∗ X de la siguiente manera: para cada f ∈ F(N ) definida en el punto en φ(p) y cada X ∈ Tp M definimos φ∗ X ∈ Tφ(p) N así: ˜ ) |p = X(f ◦ φ) |p φ∗ X(f ) |φ(p) := X(φf
(2.92)
34
CAPÍTULO 2. VARIEDADES Claramente φ es lineal, pues: φ∗ (αX + Y)(f )
˜ ) |p = (αX + Y)(φf ˜ ) |p +Y(φf ˜ ) |p = αX(φf |
φ(p)
(2.93)
= αφ∗ X(f ) |φ(p) +φ∗ Y(f ) |φ(p)
∂ Así, si ( ∂t )λ |p es el vector tangente a la curva λ en p ∈ M , entonces ∂ φ∗ ( ∂t )λ |φ(p) es el vector tangente a la curva φ ◦ λ en φ(p) ∈ N . φ∗ recibe el nombre de diferencial de φ en p y en algunos textos se nota como dφ.
Definicion 47 Dada φ : M → N y usando la definición de φ∗ definimos la función φ∗ : ∗ N −→ Tp∗ M φ∗ : Tφ(p) De tal manera que la contracción de un vector y una 1-forma sea preserva∗ N , entonces definimos da bajo transformaciones. Es decir, dado Y ∈ Tφ(p) ∗ ∗ φ Y ∈ Tp M de manera que: < φ∗ Y, X >|p =< Y, φ∗ X >|φ(p)
(2.94)
Ahora, si consideramos las funciones F(M) como cero formas, identifi˜ ≡ φ∗ . caremos φ Teorema 48 Una consecuencia de la definición de φ∗ es que: φ∗ (df ) = d(φ∗ f )
(2.95)
Demostracion: Sean X ∈Tp M y f ∈ F(N), entonces: < φ∗ (df ), X >|p =< df, φ∗ X >|φ(p) ˜ ) |p = φ Xf |φ(p) = X(φf
(2.96)
∗
≡ X(φ∗ f ) |p =< d(φ∗ f ), X >|p Como esto vale para todo X ∈ Tp M se sigue que: φ∗ (df ) = d(φ∗ f )
(2.97)
La transformacion φ∗ puede ser extendida naturalmente a tensores contravariantes de M a N por las reglas: φ∗ : T0r (p) −→ T0r (φ(p))
(2.98)
2.4. TRANSFORMACIONES ENTRE VARIEDADES
35
T −→ φ∗ T definida por: ∗ N φ∗ T (η 1 ...η r ) := T (φ∗ η 1 ...φ∗ η r ) |p ; ∀η i ∈ Tφ(p)
(2.99)
De la misma manera φ∗ se generaliza a tensores covariantes de N a M así: φ∗ : Ts0 (φ(p)) −→ Ts0 (p)
(2.100)
T −→ φ∗ T definida por: φ∗ T (X1 ...Xs ) |p = T (φ∗ X1 ...φ∗ Xs ) |φ(p)
(2.101)
Definicion 49 La transformación φ : M −→ N se dice de rango s en p si la dimensión de φ∗ (Tp M) es s. Así, si en p, s = m, entonces φ se llama inyectiva y en este caso se debe cumplir que m ≤ n. Si en p, s = n, φ se llama sobreyectiva y se tiene que m ≥ n. Definicion 50 Una C r −transformación φ : M −→ N se llama una inmersión si ∀p ∈ M, existe una vecindad U alrededor de p, tal que: φ−1 : φ(U) ⊂ N −→ M
(2.102)
es de clase Cr . Por lo tanto si φ es una inmersión de M en N , entonces m ≤ n. Además, por el teorema de la función implícita φ es una inmersión si, y solo si, φ es inyectiva en todo punto p ∈ M, por lo tanto φ∗ : Tp M →φ∗ (Tp M) ⊂ Tφ(p) N
(2.103)
es un isomorfismo. La imagen φ(M) es una subvariedead inmersa en N . i Por ejemplo, toda curva λ : I ⊂ R −→ M es una inmersión si dx (λ(t)) dt 6= 0. Así una subvariedad inmersa en N puede intersectarse a si misma. Esto significa que φ : M −→ N no necesariamente es una función 1-1 de M sobre N , aún cuando φ si es uno a uno cuando se restringe a una vencidad suficientemente pequeña de M. Definicion 51 Una inmersión φ : M → N se llama una inclusión si φ : M → φ(M) ⊂ N es un homeomorfismo. De esta manera una inclusion es una inmersión que además es 1-1. Pero no toda inmersión uno a uno es una inclusión.
36
CAPÍTULO 2. VARIEDADES
Definicion 52 Una transformación φ : M → N se llama un Cr -difeomorfismo si φ es una Cr -transformación, uno a uno, y φ−1 : N → M es una Cr transformación. En este caso m = n y φ es inyectiva y sobre. Por el teorema de la función implícita se ve que si φ∗ es biyectiva en p, entonces φ es un difeomorfismo en una vecindad U de p. Si φ : M → N es un difeomorfismo, entonces φ∗ : Tp M → Tφ(p) N
(2.104)
∗ (φ−1 )∗ : Tp∗ M → Tφ(p) N
(2.105)
y son isomorfismos, y entonces podemos definir una transformación : φ∗ : Tsr (p) −→ Tsr (φ(p))
(2.106)
por: T (η 1 ...η s , X1 ...Xr )
|
p
=: φ∗ T ((φ−1 )∗ η1 ...(φ−1 )∗ η s , φ∗ X1 ...φ∗ X (2.107) r)
∀η i ∈ Tp∗ M y Xi ∈ Tp M
Esta transformación envía tensores del tipo (r, s) sobre M a tensores del tipo (r, s) sobre N y preserva las relaciones de simetría y el álgebra tensorial. Por ejemplo c(φ∗ T) = φ∗ (cT).
2.5.
Cálculo en variedades
Definicion 53 El operador diferenciación exterior d es un operador lineal d : Λr −→ Λr+1
(2.108)
definido por la forma en que el actúa sobre una 0-forma f ∈F(M) < df , X >:= Xf ; ∀X ∈ Tp M
(2.109)
y actuando sobre un campo de r-formas A = Aα1 ···αr dxα1 ∧ · · · dxα campo de (r+1)-formas dA := dAα1 ···αr ∧dxα1 ∧ · · · dxα
r
r
da el
(2.110)
2.5. CÁLCULO EN VARIEDADES
37
Veamos que esta definición de dA es independiente de la base escogida. Consideremos otra base {x0 α }: A = A0α1 ···αr dx0α1 ∧ · · · dx0α
r
(2.111)
Donde las componentes A0α1 ···αr están dadas por: A0α1 ···αr =
∂xα1 ∂xαr · · · Aα ···α ∂x0α1 ∂x0αr 1 r
(2.112)
Así dA en la coordenada primada está dada por: dA = dA0α1 ···αr ∧dx0α1 ∧ · · · dx0α r = ∂xα1 ∂xαr = d( 0α1 · · · 0αr Aα1 ···αr ) ∧ dx0α1 ∧ · · · dx0α r ∂x ∂x ∂xα1 ∂xαr = · · · 0αr dAα1 ···αr ∧dx0α1 ∧ · · · dx0α r ∂x0α1 ∂x ∂ 2 xα1 ∂xα2 ∂xαr = · · · Aα ···α dx0β 1 ∧dx0α1 ∧ · · · dx0α r ∂x0αr 1 r ∂x0β 1 ∂x0α1 ∂x0α2 ∂xα1 ∂ 2 xαr = · · · Aα ···α dx0β 1 ∧dx0α1 ∧ · · · dx0α r (2.113) ∂x0α1 ∂x0β 1 ∂x0αr 1 r Analicemos ahora un término que contenga segundas derivadas: ∂ 2 xαr dx0β 1 ∧dx0α1 ∂x0β 1 ∂x0αr
(2.114)
∂ 2 xαr ∂x0β 1 ∂x0αr
es simétrico en β 1 y α1 , mientras dx0β 1 ∧dx0α1 es antisimétrico, por lo tanto: ∂ 2 xαr dx0β 1 ∧dx0α1 = 0 (2.115) ∂x0β 1 ∂x0αr Entonces: ∂xαr ∂xα1 · · · dAα1 ···αr ∧dx0α1 ∧ · · · ∧ dx0α r ∂x0α1 ∂x0αr ∂xα1 ∂xαr ∂x0α1 α1 ∂x0αr αr = · · · dA ∧ dx ∧ · · · ∧ dx α1 ···αr ∂x0α1 ∂x0αr ∂xα1 ∂xαr ∂xα1 ∂x0α1 ∂xαr ∂x0αr = · · · dAα1 ···αr ∧dxα1 ∧ · · · ∧ dxαr ∂x0α1 ∂xα1 ∂x0αr ∂xαr = dAα1 ···αr ∧dxα1 ∧ · · · ∧ dxαr (2.116)
dA =
Notemos que esta definición no sería independiente de las coordenadas si en vez de usar el producto exterior ∧ se hiciera para el producto tensorial.
38
CAPÍTULO 2. VARIEDADES De la definición se sigue que: d(A ∧ B) = dA ∧ B + (−1)r A ∧ dB; ∀A ∈ Λr ; ∀B ∈ Λs
(2.117)
Dada una 0-forma f , tenemos que en una base coordenada: df = entonces: d(df ) =
∂f dxi ∂xi
∂2f dxj ∧dxi j ∂xi | {z } ∂x | {z }
(2.118)
(2.119)
antisim´ etrico
sim´ etrico
Teorema 54 Para toda p-forma:
d(dA) = 0
(2.120)
La demostración se deja como problema. Lemma 55 Dado un campo vectorial X sobre M, existe una única curva maximal λ(t) sobre M que pasa a través de cada p ∈ M tal que λ(0) = p y cuyo vector tangente en el punto λ(t) es el vector X |λ(t) . Demostración: Si {xi } son coordenadas locales, tal que la curva λ(t) tiene coordenadas i x (t), y el vector X tiene componentes X i en esta base, entonces la curva λ es solución del sistema de ecuaciones diferenciales: dxi = X i (xi (t) · · · xn (t)) dt
(2.121)
Cuya solución está garantizada por el teorema general de las ecuaciones diferenciales ordinarias Definicion 56 El flujo de un campo vectorial X sobre M es una transformacion: φ : M × R −→ M (p, t) −→ φ(p, t) := λp (t) donde λp (t) es la curva integral maximal del campo X que en t = 0 pasa por p∈M .
2.5. CÁLCULO EN VARIEDADES
39
Si en φ(p, t), p es mantenido fijo, entonces φ(p, t) es justamente la curva integral λp (t). Por otro lado, si mantenemos t = cte, φ(p, t) define un difeomorfismo: φt : M −→ M p −→ φt (p) el cual envía un punto p de la variedad al punto φt (p), el cual está localizado una distancia paramétrica t sobre la curva integral λp (t). Lemma 57 φt es un grupo local uniparamétrico de difeomorfismos, es decir φt satisface: i.- φ0 es la identidad: φ0 = id : M −→ M
(2.122)
φt ◦ φs = φt+s
(2.123)
φ−1 t = φ−t
(2.124)
ii.- La ley de composición:
iii.- Existe un inverso: De la definición de un C r −difeomorfismo se sigue que si φt es un difeomorfismo, entonces: (φt )∗ : Tsr (p) −→ Tsr (φt (p)) T −→ (φt )∗ T |φt (p)
2.5.1.
Derivada de Lie
Definicion 58 La derivada de Lie, LX T, de un campo tensorial T con respecto al campo vectorial X es definida por: 1 LX T |p := l´ım {T |p −(φt )∗ T |φt (p) } t→0 t
(2.125)
Lemma 59 Dados T1 , T2 ∈ Tsr (M ), X, Y campos vectoriales sobre M y f ∈ F(M), la derivada de Lie cumple las siguientes propiedades: 1.- LX es R-lineal: LX (T1 + λT2 ) = LX T1 + λLX T2 2.- LX es una derivación, es decir, satisface la regla de Leibniz: LX (T1 ⊗ T2 ) = LX (T1 ) ⊗ T2 + T1 ⊗ (LX T2 )
40
CAPÍTULO 2. VARIEDADES
1. Lemma 60 3.- LX (Tsr (M )) ⊆ Tsr (M ) 4.- LX conmuta con la operación de contracción. 5.- LX f = Xf =< df , X > 6.- Definiendo el conmutador de dos campos vectoriales por [X, Y](f ) := X(Yf ) − Y(Xf ) entonces el conmutador [X, Y] satisface la identidad de Jacobi: [[X, Y], Z] + [[Y, Z], X] + [[Z, X], Y] Esta operacion de conmutación forma la llamada álgebra de Lie del espacio ℵ(M ) 7.- Es fácil comprobar esta álgebra si trabajamos en una base coordenada {xi }, donde X=X i ∂i y Y=Y i ∂i , entonces: [X, Y]f = (X i
j ∂f ∂Y j i ∂X − Y ) ∂xi ∂xi ∂xj
(2.126)
Así, el vector [X, Y] tiene como componentes en la base coordenada {xi }: ∂Y j ∂X j ∂ [X, Y] = (X i i − Y i ) (2.127) ∂x ∂xi ∂xj entonces: LX Y = [X, Y]
(2.128)
8.- LX+λY T =LX T + λLX T + λLY T 9.- L[X,Y] = [LX , LY ] = LX ◦ LY − LY ◦ LX 10.- Las siguientes tres proposiciones son equivalentes: i.- [X, Y] = 0 Lemma 61 ii.- LX ◦ LY = LY ◦ LX iii.- Si φs y ψ t son los difeomorfismos generados por los campos X y Y respectivamente, entonces: φs ◦ ψ t = ψ t ◦ φs
(2.129)
2.5. CÁLCULO EN VARIEDADES
41
Lemma 62 11.- Dado T ∈ Tsr (M ) y una base coordenada {xi }, entonces: (LX T)α1 ····αβr1 ···β s
=
∂T α1 ····αβr ···β 1
s
∂xi
··· − T
αr α1 ····αr−1 ∂X β 1 ···β s ∂xi
+ · · · T α1 ····αβr ···β 1
∂X αi − ··· 1 s ∂xi ∂X i + T α1 ····αiβr ···β 2 s ∂xβ 1
r X i − T iα2 ····α β ···β
∂X i
s−1 i ∂xβ s
(2.130)
Para una prueba de estas propiedades ver por ejemplo ”Foundations of Differential Geometry ”, S. Kobayashi y K. Nomizu. Interscience Publishers. John Wiley & Sons.New York Veamos la interpretación geométrica de LX T. De la propiedad 10 se sigue que si la derivada de Lie de dos campos vectoriales se anula, o equivalentemente, los campos conmutan, entonces si un vector v ∈ Tp M se desplaza una distancia paramétrica t a lo largo de la curva integral de X y luego una distancia s a lo largo de la curva integral del campo Y se llega a un punto q, el cual también se obtiene, si primero se desplaza s a lo largo de la curva integral de Y y luego una distancia t a lo largo de X La derivada de Lie de un campo tensorial LX T depende, no solamente de la dirección del campo vectorial X en p, sino también de la dirección de X en puntos vecinos, y en este sentido es un objeto no local , por lo tanto no es la generalización adecuada del concepto de derivada sobre Rn para escribir las ecuaciones de campo para la física.
2.5.2.
Conexión y derivada covariante
La generalización adecuada de derivada parcial sobre una variedad es la derivada covariante, la cual requiere para su definición de una estructura adicional definida sobre la variedad llamada la conexión. Definicion 63 Una conexión ∇ en un punto p ∈ M es una función la cual asigna a cada campo vectorial X en p un operador diferencial ∇X definido por ∇X : Ξ(M) −→ Ξ(M) Y 7−→ ∇X Y tal que:
42
CAPÍTULO 2. VARIEDADES c-1. ∇X YT es un tensor en el argumento X, i.e. ∇f X+gY Z = f ∇X Z + g∇Y Z ∀f, g ∈ F(M),
(2.131)
∀X, Y, Z ∈ Ξ(M)
esto quiere decir que el opreador ∇X (derivada) en p depende solamente de la dirección de X en el punto p. c-2. ∇X Y es lineal en Y, es decir ∇X (αY + Z) = α∇X Y + ∇X Z ∀α ∈ R,
(2.132)
∀X, Y, Z ∈ Ξ(M)
c-3. ∇X f Y = X(f )Y + ∇X Y ∀f ∈ F(M),
(2.133)
∀X, Y ∈ Ξ(M)
Entonces decimos que ∇X Y es la derivada covariante del campo vectorial Y con respecto a la conexión ∇ en la dirección del vector X en el punto p. De la propiedad c-1 ∇Y es un campo tensorial del tipo (1, 1), la derivada covariante de Y, el cual cuando se contrae con el campo vectorial X produce el vector ∇X Y, así la propiedad c-3 se puede escribir como ∇(f Y) = df ⊗ Y + f ∇Y
(2.134)
Dadas las bases duales {Eα } y {Eα } en alguna vecindad U ⊂ M, denotaremos a las componentes de ∇Y en estas bases como Y;βα , así ∇Y = Y;βα Eα ⊗ Eβ n3
(2.135)
Si n es la dimensión de la variedad, la conexión está determinada por las funciones Γαβγ sobre U ⊂ M:
o equivalentemente
® Γαβγ = Eα , ∇Eβ Eγ
∇Eγ = Γαβγ Eβ ⊗ Eα
(2.136) (2.137)
Así, para un campo vectorial Y su derivada covariante está dada por: ∇Y = ∇(Y α Eα )
= dY α ⊗ Eα + Y α Γβγα Eγ ⊗ Eβ
(2.138)
2.5. CÁLCULO EN VARIEDADES
43
Si tomamos una base dual coordenada {∂α } y {dxα } las componentes de ∇Y están dadas por: ∂Y α + Γαβγ Y γ (2.139) Y;βα = ∂xβ 0
0
Bajo un cambio de base {Eα },{Eα } −→ {Eα },{E α } la ley de transformación de las componentes de la conexión se pueden encontrar con la ayuda de las propiedes c-1, c-2 y c-3 en la definición de conexión: E D 0 0α 0 = E α , ∇E0 Eγ Γβγ β D ¡ ¢E α σ = Φσ E , ∇Φ ρ Eρ Φγτ Eτ β D ¡ ¢E ρ α σ = Φσ E , Φβ ∇Eρ Φγτ Eτ D ¡ ¡ ¢ ¢E = Φασ Eσ , Φβρ Eρ Φγτ Eτ + Φγτ ∇Eρ Eτ © ¡ ¢ ® ®ª = Φασ Φβρ Eσ , Eρ Φγτ Eτ + Φγτ Eσ , ∇Eρ Eτ ¡ ¢ = Φασ Φβρ Eρ Φγ τ hEσ , Eτ i + Φασ Φβρ Φγτ Γσρτ ¡ ¢ = Φασ Φβρ Eρ Φγ τ δ στ + Φασ Φβρ Φγ τ Γσρτ ¡ ¢ = Φασ Φβρ Eρ Φγ σ + Φασ Φβρ Φγτ Γσρτ (2.140) Si se utilizan bases coordenadas, {∂α },{dxα } y {∂α0 },{dx0α }, entonces = ∂x0α /∂xσ y Φγ τ = ∂xτ /∂x0γ , y tenemos que la ley de transformación de las componentes de la conexión toma la forma: Φασ
0
α = Γβγ
∂x0α ∂xρ ∂ 2 xσ ∂x0α ∂xρ ∂xτ σ + Γ ∂xσ ∂x0β ∂x0ρ ∂x0γ ∂xσ ∂x0β ∂x0γ ρτ
(2.141)
Debido al primer término en la anterior ecuación las componentes de la conexión no se transforman como las componentes de un tensor. La derivada covariante puede ser extendida a tensores arbitrarios por las siguientes reglas: q i.- Si T ∈ Trq entonces ∇T ∈ Tr+1 ii.- ∇ es lineal y conmuta con las contracciones. iii.- ∇ es Leipniziana, es decir ∀T, S campos tensoriales cualesquiera se cumple que: ∇(T ⊗ S) = ∇T ⊗ S + T ⊗ ∇S (2.142) iv.- ∀f ∈ F(M) entonces
∇f = df
(2.143)
44
CAPÍTULO 2. VARIEDADES
Para encontrar las componentes de la derivada covariante de un tensor arbitrario consideremos las bases duales {Eα } y {Eβ }, entonces teniendo en cuenta las propiedades ii y iii anteriores, se puede probar que (problema) ∇Eβ Eγ = −Γγβα Eα
(2.144)
y de esta relación, se obtienen las componentes en una base coordenada de la derivada covariante de un tensor: ···αr Tαβ 1···β ;γ = 1
s
···αr ∂Tβα1···β
1 s 2 ···αr + Γαγσ1 Tβσα···β + ... + 1 s ∂xγ α ···α σ α1 ···αr Γαγσr Tβ 1···β r−1 − Γσγβ 1 T σβ ···β − 1
s
2
(2.145)
s
···αr ... − Γσγβ s T βα1···β 1
2.5.3.
s−1 σ
Transporte paralelo
Sea T un campo vectorial y λ una curva sobre la variedad M, entonces definimos DT = ∇∂t T (2.146) ∂t como la derivada covariante del campo T a lo largo de la curva λ, así si X es el vector tangente a la curva λ(t) entonces DTα1 ····αβr ···β 1
∂t
s
= Tα1 ····αβr ···β 1
s ;γ
Xγ
(2.147)
Consideremos el caso particular de un campo vectorial Y y escojamos una base coordenada, en donde la curva λ tiene coordenadas xα (t) y X α = dxα /dt, entonces dxβ DY ∂Y α = + Γαβγ Y γ (2.148) ∂t ∂t dt Definicion 64 Un tensor T se dice transportado paralelamente a lo largo de la curva λ si DT =0 (2.149) ∂t Dada la curva λ(t) con puntos extremos p y q, se sigue de la teoría de las ecuaciones diferenciales que si la conexión ∇ es por lo menos de clase C 1 , entonces se obtiene un único tensor en el punto q transportando paralelamente al tensor dado en el punto p a lo largo de la curva λ. Así el transporte paralelo a lo largo de la curva λ es una transformación lineal del
2.5. CÁLCULO EN VARIEDADES
45
espacio Tsr (p) a Tsr (q), la cual preserva el álgebra tensorial y la operación de contracción y así, en particular, si transportamos paralelamente una base de Tp al punto q obtenemos un isomorfismo entre Tp y Tq . Si la curva es cerrada los puntos p y q pueden coincidir. El caso particular de transportar paralelamente el vector tangente a la curva a lo largo de ella misma nos conduce a la siguiente definición: Definicion 65 Sea X el vector tangente a la curva λ, entonces la curva es una geodésica si su vector tangente es transportado paralelamente a lo largo de la curva, i.e. µ ¶ D ∂ = ∇X X = 0 (2.150) ∂t ∂t λ La condición que el vector tangente a la curva no cambie cuando se transporta paralelamente se puede reemplazar por una condición más débil, pues lo que se exige es que el vector tangente permanezca paralelo a si mismo cuando se transporta a lo largo de la curva, es decir ∇X X = f X
(2.151)
con f una función arbitraria sobre la curva. Sin embargo, no es difícil probar que por una reparametrización de la curva siempre se puede encontrar un f = 0. Consideremos una base coordenada {∂/∂xα } y {dxα }, entonces la ecuación de las geodésicas, teniendo en cuenta las ecuaciones 2.148 y 2.150, toma la forma β γ d2 xα α dx dx =0 (2.152) + Γ βγ dt2 dt dt ˙ Dados el punto y la velocidad inicial de la curva geodésica λ(0) y λ(0) existe una única geodésica maximal λ(t) como una consecuencia de los teoremas de existencia y unicidad de las ecuaciones diferenciales ordinarias, en otras palabras, dado el punto p ∈ M y Xp ∈ Tp M existe una única curva maximal λ(t) tal que λ(0) = 0 y (∂/∂t)λ |t=0 = Xp y la cual depende continuamente de los valores iniciales. Este resultado nos permite definir una base coordenada especial, llamadas coordenadas normales de Riemann, las cuales son de gran utilidad cuando se trabaja localmente, es decir, en una vecindad de un punto de la variedad. Para construir estas coordenadas es necesario definir la transformación exponencial: Definicion 66 Definimos la transformación exponencial M exp : Tp M −→ X 7−→ q = exp(X)
46
CAPÍTULO 2. VARIEDADES
por la relación exp(X) := λ(1)
(2.153)
en donde λ(t) es la única geodésica que pasa por el punto p y tiene vector tangente X. Como se puede demostrar, la transformación exponencial siempre existe y es 1-a-1en alguna vecindad del punto p. Puesto que Tp M es un espacio vectorial real n-dimensional, este es isomorfo a Rn , y lo podemos identificar con él, y así usar la transformación exponencial para definir una carta coordenada en la vecindad del punto p ∈ M, llamada coordenadas normales de Riemann. Asociándole el origen de Rn al punto p, estas coordenadas tienen la propiedad que las geodésicas a través del punto p son transformadas en líneas rectas que pasan a través del origen de Rn . De la ecuación de las geodésicas en coordenadas de Riemann (ver ecuación 2.152) se deduce que las componentes de la conexión se anulan, y es por esta razón que las coordenadas normales de Riemann tienen una especial utilidad para efectos de cálculo, además, como veremos más adelante también tienen un significado físico. Definicion 67 Dada una conexión ∇ sobre la variedad M definimos la torsión como una transformación T : Ξ(M) × Ξ(M) −→ Ξ(M) (X, Y) 7−→ T (X, Y) definida por T (X, Y) := ∇X Y − ∇Y X − [X, Y]
(2.154)
Dos primeras propiedades que se pueden deducir de la definición de la torsión son: T (X, Y) = −T (Y, X) (2.155) T (f X, gY) = f gT (X, Y) ; ∀f, g ∈ F(M) Problema: demostrar estas propiedades. Ayuda: ∇f X gY = f ∇X gY = f X(g)Y + f g∇X Y
(2.156)
(2.157)
[f X, gY] = Lf X gY = f X(g)Y + gLf X Y = f X(g)Y − gLY f X
(2.158)
2.5. CÁLCULO EN VARIEDADES
47
Definicion 68 Definamos el tensor torsión T ∈ T21 por: T(ω, X, Y) := hω, T(X, Y)i
(2.159)
A partir de esta definición, y tomando una base coordenada, veamos que las componentes del tensor torsión están dadas por: α = Γαβγ − Γαγβ Tβγ
(2.160)
Para demostrar esta relación consideremos las bases duales coordenadas {∂/∂xα } y {dxα }. De la definición del tensor torsión tenemos hω, T(X, Y)i = hω, ∇X Y − ∇Y X − [X, Y]i
(2.161)
entonces, de las expresiones para las derivadas covariante y de Lie de un tensor en componentes ∂Y α β X + Γαβγ Y β X γ ∂xβ ¶ µ ∂ ∂X α β α β γ ∇Y X = Y + Γ X Y βγ ∂xβ ∂xα µ α ¶ α ∂Y ∂ β β ∂X [X, Y] = LX Y = X −Y β β ∂x ∂x ∂xα ∇X Y =
entonces
∇X Y − ∇Y X − [X, Y] =
´ ∂ ³¡ ¢ Γαβγ − Γαγβ X β ∂xα
(2.162) (2.163) (2.164)
(2.165)
a partir de la cual se llega a la ecuación 2.160. Si tomamos una base cualquiera {Eα } y {Eβ } el tensor torsión toma la forma ¡ ¢ (2.166) T = Γαβγ − Γαγβ Eα ⊗ Eβ ⊗ Eγ
Definicion 69 Una conexión ∇ se llama libre de torsión si T ≡ 0, o equivalentemente las componentes son simétricas en sus índices inferiores, i.e. si (2.167) Γαβγ = Γαγβ
En lo sucesivo trabajaremos con conecciones libres de torsión, y por lo tanto en este caso se tiene la siguiente relación entre la derivada de Lie y la derivada covariante: (2.168) LX Y = ∇X Y − ∇Y X
48
CAPÍTULO 2. VARIEDADES
que para el caso de un tensor cualquiera, en componentes coordenadas, toma la forma (problema): ···αr (LX T)αβ 11···β s
···αr σα2 ···αr α1 σ = Tβα1···β X;σ − · · · ;σ X − Tβ ···β 1
s
1
α ···α
s
σ
α1 ···αr αr σ −Tβ 2···β r−1 X;σ + Tσβ ···β X;β 1 + 1
s
2
···αr · · · + Tβα1···β 1
s−1
s
σ σ X;β s
(2.169)
También podemos encontrar la relación entre la derivada covariante y la exterior: (2.170) (dA)αβ···γδ = (−1)p A[αβ···γ;δ] o equivalentemente dA = Aαβ···γ;δ dxδ ∧dxα ∧dxβ ∧ · · · ∧dxγ
(2.171)
en donde A es una p-forma. Problema: Demostrar esta relación por inducción. A pesar de estas relaciones entre las derivadas exterior y de Lie con la derivada covariante, las primeras son independientes de la conexión definida sobre la variedad.
2.5.4.
Tensor de Riemann
Volvamos al concepto de transporte a lo largo de una curva. Consideremos una curva cerrada λ y supongamos que partimos de un punto p y transportamos paralelamente al vector Xp a lo largo de la curva, regresando al punto inicial, entonces obtendremos el vector X0p que en general será diferente al vector inicial. Si consideramos, ahora, otra curva δ(t) cerrada que pase también por el punto p y transportamos de nuevo al vector Xp a lo largo de esta nueva curva, obtendremos un vector X00p , que, en general, será diferente a Xp y X0p . Esta no integrabilidad del transporte paralelo corresponde al hecho que, en general, las derivadas covariantes no conmutan. El tensor curvatura de Riemann nos da una ”medida” de esta no conmutatividad. Definicion 70 Definamos la función curvatura por la relación: R : Ξ(M) × Ξ(M) × Ξ(M) −→ Ξ(M) (X, Y, Z) 7−→ R(X, Y, Z) definida por R(X, Y, Z) := ∇X (∇Y Z) − ∇Y (∇X Z) − ∇[X,Y] Z
(2.172)
2.5. CÁLCULO EN VARIEDADES
49
Problema: A partir de esta definición mostrar que la función curvatura es lineal en las tres entradas X, Y y Z. Definicion 71 Definamos el tensor de Riemann R ∈ T13 por la relación: R : Ξ∗ (M) × Ξ(M) × Ξ(M) × Ξ(M) −→ R (ω, X, Y, Z) 7−→ R(ω, X, Y, Z) definido por R(ω, X, Y, Z) = hω, R(X, Y, Z)i
(2.173)
Problema: Eligiendo una base coordenada mostrar que las componentes del tensor de Riemann están dadas por α = Rβγδ
∂Γαδβ ∂xγ
−
∂Γαγβ ∂xδ
+ Γαγσ Γσδβ − Γασδ Γσγβ
(2.174)
Problema: A partir de la definición mostrar que el tensor de Riemann tiene las siguiente propiedades de simetría: α α α = −Rβδγ ⇐⇒ Rβ(γδ) =0 Rβγδ
(2.175)
α α α α R[βγδ] = 0 ⇐⇒ Rβγδ + Rγδβ + Rδβγ =0
(2.176)
Además la derivada covariante del tensor de Riemann satisface las identidades de Bianchi: α =0 (2.177) Rβ[γδ;η] Una contracción del tensor de Riemann nos conduce a otro tensor, el cual juega un papel importante, no solo en la geometría, sino también el la física. Definicion 72 Definimos el tensor de Ricci por: σ Rβδ := Rβσδ
(2.178)
Nota: Se puede probar que el transporte paralelo de un vector cualquiera a lo largo de toda curva cerrada sobre la variedad es localmente integrable, α = 0, ∀p ∈ M; es decir si Xp = X0p para cada p ∈ M, sí y solamente sí Rβγδ en este caso se dice que la conexión es plana.
50
CAPÍTULO 2. VARIEDADES
2.5.5.
Tensor métrico
Definicion 73 Un tensor métrico g en un punto p ∈ M es un tensor simétrico del tipo T20 (p). Así, una métrica sobre M es un campo tensorial simétrico g. Ahora, dada una métrica podemos definir la función ”norma” de un vector X ∈ Tp M, como R |·|g : Tp M −→ p X 7−→ |X|g := |g(X, X)|
(2.179)
A partir de esta definición podemos introducir el concepto de ángulo entre vectores por la relación (si no se presenta inconsistencia no escribiremos el subíndice g para referirse a la norma inducida por la métrica): cos ] (X, Y) :=
g(X, Y) [|g(X, X)| |g(Y, Y)|]1/2
(2.180)
la cual es válida ∀X, Y ∈Tp M, y |X| 6= 0 y |Y| 6= 0. Con estemos llamaremos vectores ortogonales aquellos que cumplan la condición g(X, Y) = 0. Dadas las bases duales {Eα } y {Eβ }, el tensor métrico g en componentes toma la forma g = gαβ Eα ⊗ Eβ α
β
gαβ = g(E , E )
(2.181) (2.182)
Las magnitudes definidas por la métrica en el espacio tangente están relacionadas con las magnitudes sobre la variedad por la siguiente definición: Definicion 74 La longitud del camino estre los puntos de la variedad p = λ(a) y q = λ(b) situados sobre la curva λ(t), con vevtor tangente ∂/∂t, y tal que g(∂/∂t, ∂/∂t) tiene el mismo signo sobre todos los puntos a lo largo de la curva λ(t), está definida por la integral Lab =
Z
a
b
|g(∂/∂t, ∂/∂t)|1/2 dt
(2.183)
En una base coordenada la ecuación anterior toma la forma explícita ¸ Z b· dxα dxβ dt (2.184) gαβ Lab = dt dt a
2.5. CÁLCULO EN VARIEDADES
51
y por esta razón escribiremos, simbólicamente, la distancia a lo largo de una curva entre dos puntos infinitesimalmente cercanos en la forma ds2 = gαβ dxα dxβ
(2.185)
Definicion 75 Una métrica g se llama no degenerada en un punto p de la variedad si no existe un vector no nulo X ∈Tp M tal que g(X, Y) = 0 para todo vector Y ∈Tp M. En términos de componentes coordenadas de g la métrica es no degenerada si (2.186) det |gαβ | 6= 0
En estas condiciones podemos definir un tensor del tipo T02 tal que sus componentes g αβ , en la base coordenada dada, están determinadas por la relación (2.187) g αβ gβγ = δ αγ ¡ αβ ¢ formada con las componentes del tensor es la inversa es decir, la matriz g de la matriz (gαβ ) formada con las componentes de g. A las componentes g αβ se le llaman las componentes contravariantes del tensor métrico, y esta denominación queda justificada, pues la definición 2.187 implica que podemos establecer un isomorfismo entre las componentes covariantes y contravariantes de tensores de la siguiente forma: Lemma 76 Sea g una métrica no degenerada en el punto p∈Tp M, entonces la transformación Tp M −→ Tp∗ M X 7−→ C11 (g ⊗ X)
define un isomorfismo.
Si gαβ y X α son las componentes del tensor métrico g y del vector X, entonces las componentes de la 1-forma C11 (g ⊗ X), que las denotaremos por Xα están dadas por (2.188) Xα = gαβ X β y puesto que la métrica es no degenerada, utilizando la ecuación 2.187 tenemos que podemos despejar las componentes del vector X en términos de las componentes de C11 (g ⊗ X), pues g µα Xα = g µα gαβ X β =
δ µβ X β µ
= X
(2.189)
52
CAPÍTULO 2. VARIEDADES
A esta transformación y su inversa, se le conoce en la literatura como ”subir” y ”bajar” índices. Así, dada una métrica no degenerada podemos hablar de las componentes covariantes Xα y contravariantes X α de un ”vector” X las cuales están relacionadas biunívocamente por las ecuaciones 2.188 y ??. Esta operación se puede extender para subir o bajar cualquier índice tensorial (o índices por aplicación sucesiva de la misma operación). Por ejemplo, consideremos un tensor de rango 3 del tipo T12 , con componentes T αβγ , entonces aplicando las ecuaciones 2.188 y ?? podemos obtener los siguientes tensores: (2.190) T αβγ = g σγ T αβσ T αβγ = gβσ T ασ γ
(2.191)
Tαβγ = gασ gβε T σε γ
(2.192)
T αβ
(2.193)
γ
= gβε g σγ T αε σ
Tα βγ = gασ T σβ γ
(2.194)
Tαβ γ = gασ gβδ g γη T σβη
(2.195)
Tα βγ = gασ g γη T σβη
(2.196)
El isomorfismo inducido por el tensor métrico significa, entonces, que podemos considerar a todos los tensores de tercer rango cuyas componentes están relacionadas por las ecuaciones anteriores, como diferentes representaciones del mismo objeto abstracto T. En lo sucesivo se asumirá ésto para todos los tensores. Es de anotar que en este caso se hace necesario respetar el orden de los índices en las componentes de tensores tanto covariantes como contravariantes. Un caso particular de importancia lo constituye el tensor métrico g, en donde las componentes covariantes gαβ , contravariantes g αβ , y mixtas δ αβ , relacionadas por la ecuación 2.187 constituyen diferentes representaciones del mismo objeto geométrico, el tensor T. Definicion 77 Definimos la signatura del tensor métrico g por: sig.(g) = #de valores propios positivos menos #de valores propios negativos Si el campo tensorial g es no degenerado y continuo, entonces la signatura del tensor métrico g es constante sobre toda la variedad. Siempre es posible elegir una base adecuada {Eα } para el espacio tangente Tp M, de tal forma
2.5. CÁLCULO EN VARIEDADES
53
que las componentes covariantes del tensor métrico tomen los valores ±1, i.e. (2.197) gαβ = g(Eα , Eβ ) = ηαβ en donde los elementos η αβ están definidos por η αβ = diag.(+1, +1, · · ·, +1, −1, −1, · · ·, −1) {z } | {z } | 1 1 (n + s) (n + s) 2 2 en donde s = sig.(g), y n la dimensión de la variedad. Para el caso particular de sig.(g) = n la métrica es definida positiva, y en este único caso el tensor métrico define una métrica en sentido estricto. Otro caso de importancia en física en la métrica con sig.(g) = 2 − n, es decir gµν = diag.(+1, −1, −1, · · ·, −1)
(2.198)
la cual se conoce con el nombre de métrica Lorentziana o Minkowskiana. Esta métria, para efectos de la física es equivalente a otra con signatura n − 2, pues el único valor propio positivo, en el primer caso y negativo en el segundo, se interpreta como la coordenada temporal. En las presentes notas asumiremos la métrica con signatura 2 − n, y definiremos la estructura de conos de luz del espacio-tiempo de la siguiente forma: Definicion 78 Una métrica Lorentziana g sobre la variedad M divide a los vectores no nulos de Tp M en tres clases disjuntas: 1- X ∈ Tp M se llama ”de tiempo” si g(X, X) > 0 2- X ∈ Tp M se llama ”de espacio” si g(X, X) < 0 3- X ∈ Tp M se llama ”de luz o nulo ” si g(X, X) = 0 Si la métrica es no degenerada y continua, los vectores nulos de Tp M forman un doble cono (el cono de luz) el cual separa a los vectores de tiempo de los vectores de espacio.
2.5.6.
Relación entre conexión y métrica
Hasta en momento la conexión y la métrica son dos objetos definidos sobre la variedad de manera independiente. Pero existe una relación entre ellos si consideramos la conexión que deje invariante el producto punto entre vectores, es decir, dada una métrica existe una única conexión libre de teorsión, definida por la condición ∇g = 0 ⇐⇒ gαβ;γ = 0
(2.199)
54
CAPÍTULO 2. VARIEDADES
y así, con esta condición el transporte paralelo de vectores preserva el producto escalar definido por g. Para encontrar la forma explícita de la conexión consideremos la foema explícita de la derivada covariante de un tensor, ecuación 2.145, entonces 0=
∂gαβ − Γσγα g σβ − Γσγβ g ασ ∂xγ
(2.200)
entonces, si definimos Γσγα g σβ = Γβγα
(2.201)
y rotamos siclícamente los índices βγα, y sumamos las dos primeras ecuaciones y substraemos la tercera, y asumiendo que Γσγα = Γσαγ , obtenemos ∂gβγ ∂gαβ ∂gαγ + − γ β ∂x ∂x ∂xα
= Γβγα + Γαγβ + Γγβα + Γαβγ − Γγαβ − Γβαγ = 2Γαβγ = 2gασ Γσβγ
(2.202)
y despejando los elementos de la conexión, llamados los símbolos de Christoffer de segunda clase, obtenemos ½ ¾ ∂gβσ ∂gβγ 1 ασ ∂gγσ α (2.203) + − Γβγ = g 2 ∂xβ ∂xγ ∂xα Con esta conexión métrica el tensor de Riemann tiene las propiedades de simetría adicionales R(αβ)γδ = 0 ⇐⇒ Rαβγδ = −Rβαγδ
(2.204)
Rαβγδ = Rγδαβ
(2.205)
Estas relaciones implican que el tensor de Ricci es simétrico: Rαβ = Rβα
(2.206)
Problema: probar estas relaciones de simetría, y además, mostrar que el número de componentes independientes del tensor de Riemann es n2 (n2 − 1)/12, con n la dimensión de la variedad, y por tanto n(n + 1)/2 de estas componentes pueden estar dadas en términos de las componentes independientes del tensor de Ricci. Para los siguientes casos particulares tenemos: si n = 1 entonces Rαβγδ = 0 si n = 2 entonces Rαβγδ solo tiene una componente independiente, la cual es proporcional al escalar curvatura R. si n = 3 el tensor de Ricci determina completamente al tensor de Riemann.
2.5. CÁLCULO EN VARIEDADES
2.5.7.
55
Campos de Killing
Definicion 79 Un difeomorfismo φ : M −→ M se llama una isometría si este deja la métrica invariante, i.e., si la métrica transformada φ∗ g = g en todo punto de M. Esto implica, entonces, que la transformación φ∗ : Tp M −→ Tφ(p) M preserva el producto escalar: g(X, Y)
|
p
= φ∗ g(φ∗ X, φ∗ Y) |φ(p)
= g(φ∗ X, φ∗ Y) |φ(p)
(2.207)
Ahora, si el grupo uniparamétrico de isomorfismos φt generado por un campo vectorial K es un grupo de isometrias (es decir, si para cada TtT la transformación φt es una isometría), entonces el campo vectorial K se denomina un campo vectorial de Killing. Así, la derivada de Lie de la métrica con respecto al campo vectorial K se anula, LK g = l´ım
t−→0
1 (g − φt∗ g) = 0 t
(2.208)
pues, g =φt∗ g por definición de isometría. Ahora, de la definición de derivada de Lie (2.209) (LK g)αβ = 2K(α;β) Problema: demostrar esta relación. Por lo tanto, un campo vectorial de Killing satisface la ecuación diferencial: Kα;β + Kβ;α = 0
(2.210)
llamada ecuación diferencial de Killing. Inversamente, si K es un campo vectorial que satisface la ecuación diferencial de Killing, entonces Z t d φt∗ g |p = g |p + (φt∗ g |p ) dt0 0 dt 0 por el teorema fundamental del cálculo integral, Z t d (φt0 ∗ ◦ φs∗ g)s=0 |p dt0 = g |p + ds 0
56
CAPÍTULO 2. VARIEDADES
puesto que φt es un grupo uniparámetrico de isomorfismos y así φt∗ ◦ φs∗ = φs∗ ◦ φt∗ = φt+s∗ , ¶ Z tµ d φt0 ∗ ◦ φs∗ g |p dt0 = g |p + ds 0 s=0 Z t ³ ´ = g |p − φt0 ∗ LK g |φ−t |p dt0 0
= g |p
pues de la definición de derivada de Lie se obtiene que (LX Y)α = −
d (φ Y)α dt t∗
(2.211)
por lo tanto Teorema 80 K es un campo vectorial de Killing si y solo si satisface la ecuación diferencial de Killing. Una variedad, en general, no tiene simetrias y así no admite campos vectoriales de Killing. Sin embargo, una variedad especial puede admitir r campos vectoriales de Killing linealmente independientes Ki i = 1, 2, ..., r. Ahora se puede mostrar que el conmutadoe de dos campos de Killing es de nuevo un campo de Killing, i.e., [Ki , Kj ] = clij Kl
(2.212)
Esto significa que el conjunto de campos vectoriales de Killing sobre una variedad dada, forman un álgebra cerrada bajo el producto definido por el conmutador , la cual recibe el nombre del álgebra de Lie asociada a las simetrias de la variedad. Las constantes clij se llaman constantes de estructura del correspondiente grupo de Lie. Además, si n es la dimensión de la variedad, entonces el número r de campos de Killing está acotado, i.e., 0 ≤ r ≤ 12 n(n + 1), así, el grupo local de difeomorfismos generado por estos campos vectoriales de Killing es un grupo de Lie de r parámetros, llamado el grupo de simetrias de la variedad. Una variedad puede poseer otras simetrias, tales como la inversión en un punto, o la reflexión en un plano, pero estas simetrias no están generadas por un campo vectorial de Killing. La conexión de estas simetrias con la física está en el teorema de Noether que establece que para cada simetría de la variedad, generada por un campo vectorial de Killing existe una cantidad dinámica del sistema que se conserva. Una variedad que admite r = 12 n(n + 1) campos vectoriales de Killing, se llama de simetría maximal.
2.5. CÁLCULO EN VARIEDADES
57
Lemma 81 La variedad Lorentziana n-dimensional plana es de simetría maximal. Por variedad plana se quiere decir una variedad para la cual las conecciones son nulas globalmente o equivalentemente el escalar de curvatura se anula en toda la variedad R = 0. Para demostrar este lema veamos en primer lugar que cada campo de Killing dado K (si este existe) está determinado unívocamente por los valores de Kα |p y Kα;β |p en cualquier punto p ∈ M. Para este fin, notemos que el conmutador de las segundas derivadas covariantes del campo K están dadas por: σ Kσ (2.213) Kα;β;γ − Kα;γ;β = −Rαβγ α = 0 para el tensor de Riemann se tiene que, Ahora, de la relación R[βγδ] como K satisface la ecuación de Killing, entonces σ Kσ Kα;β;γ = −Rαβγ
(2.214)
Por lo tanto, dados Kα y Kα;β para algún punto p ∈ M, entonces por la teoría de las ecuaciones diferenciales, conocemos K sobre la variedad. Entonces, para el caso de una variedad plana, esta ecuación se reduce a ∂ 2 Kα =0 ∂xβ ∂xγ
(2.215)
cuya solución general es de la forma Kα (x) = aα + bαβ xβ
(2.216)
con aα y bαβ son constantes de integración, con la condición bαβ = −bβα , lo cual se sigue de la ecuación de Killing. Así, tenemos 12 n(n − 1) constantes independientes bαβ más n constantes aα , lo cual conduce a un total de 12 n(n + 1) campos vectoriales de Killing independientes, los cuales pueden ser escogidos de la siguiente manera: (µ índice de componentes de vectores y j índice que numera los diferentes vectores) (2.217) Kµ(j) (x) = δ jµ ; µ, j = 1, 2, ..., n Kµ(ij) (x) = δ iµ xj − δ jµ xi ; µ, i, j = 1, 2, ..., n
(2.218)
Los n vectores K(i) representan las translaciones y los 12 n(n− 1) vectores K(ij) representan rotaciones, lo cual dada la signatura Lorentziana de la métrica contiene tanto transformaciones de Lorentz puras, como rotaciones espaciales de los ejes.
58
CAPÍTULO 2. VARIEDADES
Parte II
Relatividad General
59
Capítulo 3
Los postulados de la relatividad general En este ca´ ptulo daremos los postulados fundamentales sobre los cuales estábasada la teoria general de la relatividad. En la primera parte mostraremos como, el principio de equivalencia, conduce a una ”geometrización” de la fuerza de gravedad, lo cual nos conducirá a la formulación de los postulados.
3.1.
La ley de gravitación universal
La ley de gravitación universal establece que entre todo par de cuerpos en el universo existe una interacción (fuerza atractiva), la cual solo depende de la posición relativa de los cuerpos y de una propiedad intrínseca, llamada carga o masa gravitacional, la cual satisface la tercera ley de Newton: F1←2 =
G GmG 1 m2 rˆ = −F2←1 r2
(3.1)
G en donde mG 1 y m2 son las masas gravitacionales, r1 y r2 los vectores posición de los cuerpos, r = r2 − r1 , G una constante (la constante de gravitación universal G = 6,67259×10−11 m3 kg−1 s−2 ) y F1←2 es la fuerza que el cuerpo 2 ejerce sobre el 1. A partir de esta expresión, es claro que ésta no está en acuerdo con los principios de la teoría especial de la relatividad, pues la ley de fuerza es independiente del tiempo, y por lo tanto describe una interacción instantanea. Esta situación motivó a Einstein a buscar la forma relativista de la ley de gravitación universal.
61
62CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL Esta ley de gravitación universal de Newton contiene dos postulados fundamentales, los cuales se constituirán en el punto de partida para la formulación de la teoría general de la relatividad: En primer lugar, esta interacción gravitacional es universal, es decir, todos los objetos del universo tienen ”carga gravitacional” (compare la situación con la carga eléctrica). En segundo lugar, si consideramos la fuerza que un cuerpo dado, e.g. la tierra con masa gravitacional MTG , sobre otros, con masa gravitacional mG , y aplicamos la segunda ley de Newton para estudiar el movimiento de estas masas en presencia de la primera, tenemos que GMTG mG rˆ = mI a r2
(3.2)
en donde mI denota la masa inercial del cuerpo con gravitacional mG , entonces la aceleración del curpo debido a MTG está dada por a=
GMTG mG mG rˆ r2 mI
(3.3)
Si fijamos la masa de la tierra, la aceleración de cualquier otro cuerpo depende solamente de la relación entre su masa gravitacional e inercial. Galileo fue el primero en mostrar que la aceleración de un cuerpo cualquiera en un punto dado sobre la superficie terrestre era independiente de su masa inercial, este hecho, conocido como la ley de caida de los cuerpos de Galileo, muestra, por la ecuación anterior, que para todos los cuerpos la relación entre su masa gravitacional y su masa inercial es independiente de la naturaleza (composición, forma, etc) del cuerpo. Este principio, adoptado por Newton, lo que explica la introducción de la constante de gravitación universal, condujo a medir la masa gravitacional en las mismas unidades que la inercial, auncuando los dos conceptos de masa son completamente independientes. Este principio, hoy conocido como el ”Principio de Equivalencia Débil” (PED) implica, entonces, que el movimiento de cualquier cuerpo, independiente de su masa, es el mismo, dadas las mismas condiciones iniciales, posición y velocidad. Otra forma de formular el PED es a través del famoso experimento imaginario (gedanken Experiment) del ascensor. Consideremos un ascensor y un observador en su interior, y supongamos las siguientes dos situaciones: el ascensor está en el espacio libre y es acelerado por alguna fuerza (motores) a 9,8m/s, y el ascensor está en reposo sobre la superficie de la tierra. Entonces, debido a la equivalencia entre masa inercial y gravitacional, dejando
3.1. LA LEY DE GRAVITACIÓN UNIVERSAL
63
caer partículas en el interior del ascensor no se puede determinar si éste se encuentra en reposo en el campo gravitacional, o si está acelerado por una fuerza externa, asumiendo que el escensor es lo suficientemente pequeño para que el campo gravitacional en su interior sea uniforme. Por otra parte, de acuerdo con la teoría especial de la relatividad, y en particular, teniendo en cuenta la equivalencia entre masa y energía, Einstein generalizó el PED y postuló que ningún experimento realizado dentro de la caja podía determinar la diferencia entre un sistema uniformente acelerado y un campo gravitacional uniforme. Este principio se conoce como el ”principio de Equivalencia de Einstein” (PEE). Por ejemplo, consideremos un átomo de hidrógeno, cuya masa es menor que la suma de las masas del electrón y el protón que lo constituyen, pues este es un sistema ligado al cual hay que darle energía para separar a las partículas que lo conforman y la relación entre su masa inercial y gravitacional sigue siendo una constante. Así, de acuerdo con el PEE el campo gravitacional, esto significa que el campo gravitacional se acopla de la misma manera con todas las formas de energía y materia. El PEE tiene consecuencias profundas sobre la estructura del espaciotiempo. En relatividad especial, al igual que en cualquier teoría física que no involucre al campo gravitacional, se parte de la definición de sistema de referencia inercial, considerando una partícula libre, la cual por definición, se encuentra no acelerada. Entonces, con respecto a ella podemos definir el concepto de la clase de sistemas de referencia inerciales, como aquellos para los cuales esta partícula se encuentra en reposo o movimiento uniforme. La descripción matemática de estos sistemas se hace a través de un sistema de reglas y relojes, calibrados adecuadamente, los cuales se extiende a todo el espacio, y conducen a describir el espacio-tiempo como una variedad 4dimensional plana, es decir libre de connección, y para la cual podemos elegir las coordenadas naturales, definidas por las curvas integrales de los campos (j) de Killing Kµ (x) = δ jµ ; µ, j = 1, 2, ..., n. El punto de partida básico para la anterior construcción está en la suposición de considerar la existencia de una partícula libre de fuerzas, con respecto a la cual podemos definir el movimiento acelerado. Dado el caracter universal de la gravedad, todas las formas de materia interactuan gravitacionalmente, no es posible disponer de una par´tcula ”gravitacionalmente neutra” con respecto a la cual podamos definir la aceleración debida a la gravedad. Así, la ”aceleración de la gravedad” no es un concepto que pueda ser definido, y por lo tanto carece de significado experimental, y reemplazaremos el concepto de movimiento libre (no acelerado) por el de sistema en ”caida libre”.
64CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL Así, siguiendo los pasos para construir un sistema de referencia inercial en física no gravitacional, partimos de una partícula en caida libre, es decir, sobre la cual no actuan fuerzas (electromagnéticas, débil, etc). Notemos en este punto de la discusión, que estamos trabajando en el espíritu de Mach, en cuanto a que ya no estamos haciendo referencia a una partícula libre de fuerzas (incluyendo la gravitacional). Si asociamos a esta partícula en caida libre un sistema de reglas rígidas y relojes calibrados de la manera usual, nos encontramos con el problema, debido a la inhomogeneidad del campo gravitacional, que otra partícula en caida libre no seguiría las lineas ”rectas” definidas por el sistema de coordenadas canónicas asociadas al sistema de referencia de la primera partícula, es decir partículas en caide libre en otras regiones del espacio aparecerian como ”aceleradas” con respecto a la primera. El concepto de sistema de referencia inercial asociado a una partícula en caida libre, solo tiene sentido para una región lo suficientemente pequeña en la vecindad de la partícula. Notemos que este hecho corresponde, en el contexto de las variedades, a la existencia en todo punto de la variedad, de un sistema de coordenadas normales de Riemann, con respecto a las cuales se anulan las componentes de la conexión en ese punto. Además que ya no es posible comparar velocidades, aceleraciones, etc. entre partículas localizadas en otras regiones, pues los sistemas de referencia inerciales asociados a las diferentes partículas, son independientes. Este hecho de no poder compara vectores en diferentes puntos de la variedad, significa la dependencia del transporte paralelo de vectores, y por lo tanto la dependencia de la curvatura de la variedad. Aún cuando los argumentos anteriores, sobre el comportamiento de la fuerza de la gravedad (PEE) y su relación intuitiva con las variedades, no es una demostración de la necesidad de describir la gravitación a través de la geometría del espacio-tiempo, estas consideraciones fueron suficientes para que Einstein postulara la idea que la gravitación es una manifestación de la curvatura del espacio-tiempo, y que esta curvatura sería determinada por todas las formas de materia-energía.
3.2.
Postulados de la TGR
Habiendo motivado la geometrización de la fuerza de la gravedad, pasaremos a establecer los cuatro postulados fundamentales de la teoría general de la relatividad. Axiom 82 La variedad espacio-tiempo:
3.2. POSTULADOS DE LA TGR
65
El espacio-tiempo lo constituyen todos los eventos físicos el cual será descrito por el par (M, g), donde M es una variedad suave (C ∞ ) 4-dimensional conectada de Hausdorf y g es una métrica Lorentziana sobre M. Sobre la variedad M están definidos todos los campos de materia que se consideren, por ejemplo, el campo electromagnético, el campo de neutrinos, etc., los cuales describen el contenido de materia en el espacio-tiempo. Los campos de materia obedecen ecuaciones que se expresan como relaciones entre tensores sobre M, en las cuales las derivadas con respecto a las coordenadas son derivadas covariantes, con respecto a la conexión simétrica definida por la métrica g. Si denotamos los campos de materia incluidos en la teoría por Ψα...β (i) γ...δ (x), donde el sibíndice i denota los diferentes campos de materia, entonces, los siguientes dos postulados sobre la naturaleza de los campos Ψα...β (i) γ...δ son comunes a la teoría especial y a la teoría general de la relatividad: Axiom 83 Causalidad local: Las ecuaciones que obedecen los campos de materia deben ser tales que, si U ⊂ M es una vecindad convexa y p, q ∈ U, entonces, una señal puede ser enviada en U entre p y q si y solamente si p y q pueden ser unidos por una c1 − curva contenida en U, cuyo vector tangente en todas partes es diferente de cero y es como de tiempo o como de luz (esta curva se llama no como de espacio). Otra forma equivalente de establecer espe postulado, y físicamente más significativo, se puede dar en términos del problema de Cauchy para los campos de materia: Sea p ∈ U tal que toda curva no como de espacio a través de p intersepta la superficie como de espacio x0 = cte. dentro de U. Sea F el conjunto de puntos en la hipersuperficie x0 = cte. los cuales pueden ser alcanzados por curvas no como de espacio en U a través de p. Entonces, se exige que los valores de los campos de materie en p deben estar unívocamente determinados por los valores del campo y sus derivadas a un orden finitosobre F. Es decir, las ecuaciones de movimiento (ecuaciones diferenciales) que determinan los campos (leyes de la física) involucran derivadas hasta un orden n finito (usualmente hasta orden 2) tienen solución única, la cual está determina por las condiciones de frontera, es decir, el valor de los campos y sus primeras n − 1 derivadas, dadas sobre hipersuperficie interseptada por el cono de luz pasado del punto p. Axiom 84 Conservación local de la energía:
66CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL Existe un tensor simétrico Tµν = Tµν (, ∇Ψi , ...) = Tνµ que es función de los campos de materia y sus derivadas, hasta un orden finito, tal que: i.- Tµν = 0 sobre U ⊂ M abierto, si y solo si Ψi = 0 para todo i sobre U. ii.- T µν ;ν = 0 La primera condición expresa que todos los campos de materia contribuyen a la energía. A partir de la segunda condición, si la variedad espaciotiempo admite un campo vectorial de Killing K entonces, obtenemos una ley de conservación, pues sea pα = T αβ Kβ
(3.4)
las componentes del vector P obtenido por contracción del tensor momentunenergía con el campo de Killing, entonces αβ Kβ;α = 0 pα;α = T αβ ;α Kβ + T
(3.5)
pues T αβ , T µν ;ν = 0 y K satisface la ecuación de Killing, i.e., K(α;β) = 0. Así, si D es una región compacta y orientable, por el teorema de Gauss se tiene que Z Z pα dσ α
∂D
D
pα;α dv = 0
(3.6)
por lo tanto, este resultado se puede interpretar físicamente, pues el flujo de la componente del tensor momentun-energía enla dirección del campo de Killing sobre una superficie cerrada se anula, lo cual es la generalización del teorema de Noether, el cual establece que a toda simetría le corresponde una ley de conservación. En el caso particular de la variedad Lorentziana plana, asociado a los diez vectores de Killing linealmente independientes están las diez leyes de conservación usuales, para la energía, el momentun y el momentun angular total.
3.3.
El tensor métrico y el postulado de causalidad
Consideremos la ecuación de las geodésicas en alguna base coordenada β γ d2 xα α dx dx =0 + Γ βγ ds2 ds ds
(3.7)
en donde s es un parámetro afín. El paránetro afín de una curva geodésica está determinado salvo un factor aditivo y uno multiplicativo constantes, es
3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 67 decir, salvo una transformación de la forma s0 = as + b, con a, b constantes. La libertad de escoger b corresponde a la libertad para elegir el punto inicial de la curva λ(0), y el parámetro a corresponde a la libertad de normalizar el vector tangente a la curva X por un factor de escala constante, X0 = a1 X. Por otra parte, dada una cr −conexión, los teoremas de existencia y unicidad de las ecuaciones diferenciales ordinarias aplicados a la ecaución geodésica muestran que para cualquier punto p ∈ M¡ y X ¢ p¯ ∈ Tp M existe una ∂ ¯ = Xp . Si r ≥ 1 geodésica maximal λX (s) en M, con p = λ(0) y ∂s λ s=0 la geodésica es única y depende continuamente de los valores iniciales. Esta situación nos permite definir la transformación exponencial M exp : Tp M −→ X 7−→ exp(X) := λX (1) siendo λX (0) = p. Es decir, a cada vector X ∈Tp M se le asocia el punto q ∈ M que está a una distancia paramétrica unidad del punto inicial a lo largo de la única geodésica que se inicia en p y cuyo vector tangente es X. Esta transformación exponencial no necesariamente está definida para todos los vectores X ∈Tp M pues la geodésica no necesariamente está definida para todo s. Entonces Definicion 85 Una geodésica λX (s) se llama completa si está definida para todo s. Definicion 86 Una variedad se llama geodésicamente completa si todas las geodésicas sobre M son completas. En este caso la transformación ¡ ∂ exp ¢ ¯ está definida para todo X ∈Tp M. ¯ Séan X ∈Tp M y a ∈ R fijos con ∂s = X, entonces λ s=0 λX [a, b] ⊆ R −→ M s 7−→ λX (as)
tiene velocidad inicial µ ¶ ¯ ¶ ¯ µ ¯ ¯ ∂ d(as) ∂ ¯ ¯ = = aX ∂t λ ¯t=0 ds ∂as λ ¯s=0
(3.8)
así, λX (as) = λaX (s) y por lo tanto la transformación exp(aX) = λaX (1) = λX (a)
(3.9)
68CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL es decir, la transformación exp transforma rectas aX de Tp M en geodésicas sobre M. Si M es geodésicamente completo o no la transformación exp es de rango n en p (n = dim M). Así, por el teorema de la función implícita existe una vecindad abierta V0 del origen de Tp M y una vecindad abierta Vp del punto p ∈ M tal que exp : V0 ⊂ Tp M −→ Vp ⊂ M
es un C r − difeomorfismo de V0 sobre Vp . La vecindad Vp se llama una vecindad normal de p. Además, podemos escoger Vp convexa, esto es, tal que todo punto q ∈ Vp puede ser unido a cualquier otro punto r ∈ Vp por una única geodésica que parte del punto q y que está totalmente contenida en Vp . En el interior de una vecindad normal convexa V es posible escoger coordenadas (x1 , x2 , ..., xn ) con origen en cualquier punto p ∈ V y tomando una base {Eα } de Tp M definimos las coordenadas de un punto r ∈ V por la relación r = exp(xα Eα ), es decir, se asigna al punto r las coordesi nadas del punto exp−1 r con respecto a la base {Eα } de Tp M. Entonces, ¯ ¯ α α Eα = ∂/∂x |p de la ecuación de las geodésicas se obtiene que Γβγ ¯ = 0. p
Estas coordenadas se llaman coordenadas normales centradas en el punto p. Este comportamiento de las geodésicas en una vecindad normal no se da, en general, sobre toda la variedad, pues es posible que dados dos puntos cualesquiera de M no se puedan unir por una geodésica, y por otra parte, algunas de las geodésicas a través de un punto p ∈ M pueden converger a un ”foco” en otro punto de M, por ejemplo las geodésicas sobre una 2-esfera son círculos máximos los cuales convergen siempre al punto antípoda del cual partieron. Consideremos de nuevo el postulado de causalidad. Este postulado sitúa a la métrica g a parte de los otros campos de materia sobre M, dado su carácter geométrico especial. Si {xα } son coordenadas normales en una vecindad del punto p ∈ U ⊂ M y con origen en p, entonces, los puntos en U que pueden ser alcanzados a partir del punto p por curvas no como de espacio en U, son aquellos cuyas coordenadas satisfacen (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 ≥ 0
(3.10)
El contorno de la región determinada por estos puntos está formado por la imagen del cono de luz de p bajo la transformación exponencial, i.e., el conjunto de geodésicas nulas a través de p. Así, observando cuales puntos de U ⊂ M pueden comunicarse con p, se puede determinar el cono nulo Np en Tp M. Conocido Np , la métrica en p se puede determinar salvo un factor conforme, en donde
3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 69 Definicion 87 Dos métricas g y g0 sobre M se llaman conformes, si g0 = Ω2 (x)g
(3.11)
en donde Ω2 (x) es una función suave y no nula, y por lo tanto g0 (X, Y) g(X, Y) = 0 g(Z, W) g (Z, W)
(3.12)
Para determinar la métrica a partir del cono nulo Np , sean X, Y ∈Tp M vectores como de tiempo y como de espacio, respectivamente. Entonces, la ecuación g(X + λY, X + λY) = g(X, X) + 2λg(Y, Y) + λ2 g(X, Y)
(3.13)
tiene dos raices reales λ1 y λ2 , pues el discriminante es positivo, (g(X, X))2 − 4g(X, X)g(Y, Y) > 0
(3.14)
pues g(X, X) > 0 y g(Y, Y) < 0. Por lo tanto, si Np es conocido entonces λ1 y λ2 pueden ser determinados, y de estos valores podemos obtener la relación g(X, X) (3.15) λ1 λ2 = g(Y, Y) i.e., la razón de las magnitudes de un vector como de tiempo y uno como de espacio pueden ser determinadas. Ahora si W, Z son dos vectores no nulos en p, entonces g(W, Z) =
1 (g(W + Z, W + Z) − g(W, W)g(Z, Z)) 2
(3.16)
y por lo tanto, cada una de las magnitudes del lado derecho de la ecuación anterior pueden ser comparadas con las magnitudes de X o de Y y así podemos determinar, por ejemplo, la razón g(W, Z)/g(X, X). Esto significa que la causalidad local permite determinar la métrica, salvo un factor conforme. En la práctica estas medidas se realizan usando el hecho que las señales electromagnéticas viajan sobre geodésicas nulas, un hecho que es consecuencia de las ecuaciones de Maxwell y no de la teoría de la relatividad. Para determinar el factor conforme se hace uso del segundo postulado, dejando así, todos los elementos de la teoría físicamente observables, pues
70CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL podemos comparar los factores conformes en diferentes puntos de la variedad espacio-tiempo M. Esto se obtiene por el hecho que las ecuaciones de conservación T αβ ;β = 0 pueden no cumplirse para una conexión derivada 0 de otra métrica g = Ω2 g. Una forma práctica de determinar el factor conforme es observando pequeñas partículas de prueba libres y determinando sus geodésicas como de tiempo. Por ejemplo, consideremos un conjunto de sistemas idénticos (e.g. los estados electrónicos internos de los átomos) cuyos cambios internos definen el conjunto de eventos a lo largo de las lineas de universo de cada sistema. Si se aisla cada sistema de los campos externos, entonces ellos siguen geodésicas como de tiempo. Si γ(t) es una de las geodésicas con vector tangente (∂/∂t)γ entonces podemos medir la longitud de arco para cualquiera de estos sistemas, y determinar ³ entre eventos vecinos ´ g (∂/∂t)γ , (∂/∂t)γ en cada punto del espacio-tiempo y determinar así, el factor conforme, salvo un factor multiplicatico constante, el cual lo define la escala. Los postulados de causalidad y conservación no nos dicen como construir αβ T para un conjunto de campos de materia dados. Sin embargo existe una manera única y bien definida de calcular el tensor momentun-energía, si las ecuaciones de movimiento para los campos se derivan de una Lagrangiana, como es el caso para los campos de materia usuales y de interés físico. Sea L la densidad Lagrangiana, la cual es función de los campos de materia Ψi , sus derivadas covariantes, hasta un orden finito y de la métrica. Entonces, las ecuaciones de movimiento de los campos se obtienen a partir de la acción Z S = Ldv (3.17) exigiendo que S sea estacionaria bajo variación de los campos en el interior de una región compacta 4-dimensional D, i.e., δS = 0 Esta condición conduce a las ecuaciones de Euler-Lagrange à ! ∂L ∂L ¡ ¢ =0 − ∂Ψ(i) ∂ ∇Ψ(i)
(3.18)
(3.19)
El tensor momentun-energía se obtiene a partir de la densidad lagrangiana L considerando las variaciones de la acción bajo cambios en la métrica: δS 2 Tαβ = p δg |g(x)| αβ
(3.20)
3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 71 Por ejemplo, un campo escalar φ(x), el cual representa partículas de escalares de masa m, sin carga y espín cero, está descrito por la densidad Lagrangiana o n 1p (3.21) |g(x)| g αβ φ;α φ;β − m2 φ2 L= 2 en donde se han utilizado unidades de h/ = 1 y c = 1. Las ecuaciones de Euler-Lagrange para este sistema, conducen a la ecuación de Klein-Gordon ¡ ¢ ¤ + m2 φ = 0 (3.22)
en donde el D’alembertiano está dado por:
¤φ = g αβ φ;αβ
(3.23)
y el tensor momentun-energía es: ³ ´ 1 Tαβ = φ;α φ;β − gαβ g γδ φ;γ φ;δ + m2 φ2 2
(3.24)
Otro ejemplo, de importancia en cosmología, es el de fluido perfecto. Un fluido describe un sistema físico de muchas partículas (1023 que en este límite se puede considerar como un sistema continuo) a través de las cantidades que determinan el sistema, tales como la densidad, presión, temperatura, viscosidad, etc. Aún cuando no hay una definición única de fluido perfecto, este se puede definir como un sistema en el cual no hay conducción térmica ni viscosidad, o como lo describe equivalentemente Wienberg, como un fluido tal que en sus sistema en reposo es isotrópico. En estas condiciones un fluido perfecto es descrito por la función densidad de energía y la densidad de presión. Consideremos, en primer lugar, un gas de partículas en reposo relativo (polvo), así este sistema es descrito como un gas ideal con presión cero. Para un observador inercial todas las partículas se mueven con la misma velocidad, y así con la misma cuadrivelocidad U α . Definamos, entonces, el cuadri-vector flujo (3.25) N α = nU α en donde n es la densidad propia de partículas, i.e., la densidad de partículas medida en el sistema en reposo. Ahora, si todas las partículas tienen la misma masa en reposo m, la densidad de energía propia está dada por: ρ = nmc2
(3.26)
La densidad de energía caracteriza completamente al fluido, pero la anterior ecuación es solamente válida en el sistema en reposo del fluido, así
72CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL para encontrar la expresión covariante de la densidad de energía (válida para cualquier observador inercial), recordemos que mc2 es la componente temporal del cuadri-vector momentun de una partícula en sus sistema en reposo, pα = (mc, 0, 0, 0) y para este sistema N α = nU α = (nc, 0, 0, 0). Por lo tanto la densidad de energía propia corresponde a la componente 00 del tensor p ⊗ N medida en su sistema en reposo, así definimos el tensor momentun-energía para el gas de polvo como: T αβ = pα N β = nmU α U β =
ρ α β U U c2
(3.27)
donde ρ es definida como la densidad de energía en el sistema en reposo. Para el caso más general de un fluido perfecto con presión, asumiremos la definición de Weinberg, como aquel que es isotrópico en su sistema en reposo. Esto significa que T αβ es diagonal, es decir no hay flujo neto de momentun en la dirección ortogonal. Además, sus componentes espaciales deben ser todas iguales, por isotropía: T 11 = T 22 = T 33 . Si llamamos T 00 = ρ la densidad de energía, T ii = p la densidad de presión, tenemos, que las componentes del tensor momentun-energía, en el sistema en reposo están dadas por: ρ 0 0 0 0 p 0 0 T αβ = (3.28) 0 0 p 0 0 0 0 p
la cual, para un sistema de referencia inercial cualquiera, se puede escribir en la forma (con c = 1): T αβ = (p + ρ)U α U β + pη αβ
(3.29)
en donde η αβ es el tensor métrico de Minkowski. La generalización para una variedad con métrica g es directa, T αβ = (p + ρ)U α U β + pg αβ
(3.30)
El tipo de materia específico que se considere, está determinado por la ecuación de estado del sistema, es decir f (p, ρ) = 0, una función que relaciona la densidad de energía y materia, por ejemplo, para un gas de polvo la ecuación de estado es p = 0. Este tensor momentun-energía se puede encontrar a partir de una densidad Lagrangiana. Siguiendo la definición de Weinberg, sea U el campo de cuadrivelocidades y definamos la cuadri-corriente por J = µU, con µ la
3.4. ECUACIONES DE CAMPO DE EINSTEIN
73
α = 0, y la densidad de partículas. La ecuación de continuidad exige que J;α densidad Lagrangiana está dada por:
L = −2µ(1 + ε)
(3.31)
donde ε = ε(µ) es el potencial elástico. La acción S es estacionaria cuando las lineas de flujo se varían, ajustando J para mantener la corriente conservada. Entonces la ecuaciones de Euler-Lagrange conducen a las ecuaciones de movimiento para el fluido: α =0 ρ;α U α + (ρ + p)U;α (ρ + p)U˙ α = −p;β (g αβ + U β U α
(3.32)
donde ρ = µ(1 + ε) es la densidad de energía, y p = µ2 dε/dµ la densidad α U β . Así, la aceleración de las lineas de flujo U ˙ α es de presión, y U˙ α = U;β proporcional al gradiente de presión ortogonal a las lineas de flujo. A partir de la densidad Lagrangiana obtenemos el tensor momentun-energía.
3.4.
Ecuaciones de campo de Einstein
Hasta el presente la métrica g no ha sido especificada. En la teoría especial de la relatividad, la cual no incluye los efectos gravitacionales, la métrica es plana, i.e., g = η. En la discusión al comienzo del capítulo, vimos como la fuerza de la gravedad, por su caracter universal, debe ser excluida como un campo de fuerzas en un espacio plano, si queremos mantener la idea que una partícula libre sigue ”lineas rectas” o que la luz en el vacío es constante. Para mantener el principio de relatividad, es decir, la física es la misma para todos los observadores, o equivalentemente, las leyes de la física deben ser independientes del sistema de coordenadas, las ecuaciones de campo para determinar la métrica deben ser relaciones tensoriales, que involucran a la materia a través del tensor momentun-energía, si queremos que mantener el principio de equivalencia, es decir, si dos campos de materia contribuyen con la misma densidad de energía a un sistema entonces las ecuaciones de campo para la métrica deben conducir al mismo resultado. Por el lado de la geometría, como Hilbert se lo sugirió a Einstein, el único obgeto geométrico, salvo identidades o multiplos, el cual está determinado por el tensor métrico y primeras derivadas de sus componentes, es el tensor de Riemann, o tensores derivados de ellos, y por lo tanto la única posibilidad, es una combinación lineal del tensor de Ricci, el escalar curvatura y una constante, proporcional al tensor momentun-energía, dads las condiciones que sobre el se imponen, que sea simétrico y que satisfaga el principio de conservación local, asi
74CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDAD GENERAL Axiom 88 La métrica sobre la variedad espacio-tiempo (M, g) está determinada por las ecuaciones de campo de Einstein 1 8πG Rαβ − Rgαβ + Λgαβ = 2 Tαβ 2 c
(3.33)
G =constante de gravitación universal. Λ = constante cosmológica Este es un sistema de 10 ecuaciones diferenciales acopladas no lineales para la métrica y sus primeras derivadas. Sin embargo, dado que la divergencia covariante de cada lado de las ecuaciones se satisface independientemente µ ¶ 1 8πG Rαβ − Rg αβ + Λg αβ = 0 = 2 T αβ (3.34) ;α 2 c ;α entonces el número de ecuaciones independientes se reduce a seis. Este es el número correcto de ecuaciones, pues de las diez componentes independientes del tensor métrico, cuatro de ellas se pueden elegir arbitrariamente, pues corresponde al hecho que las componentes del tensor métrico son únicas, salvo una transformación de coordenadas. Así, las ecuaciones de campo de Einstein determinan el tensor métrico, salvo la clase de equivalencia de difeomorfismos Θ : (M, g1 ) −→ (M, g2 ) en donde dos métricas definen el mismo espacio-tiempo si entre las variedades (M, g1 ) y (M, g2 ) existe un difeomorfismo. Para establecer la relación entre las ecuaciones de campo de Einstein y la teoría de la gravitación universal de Newton, consideremos una partícula de prueba que se mueve lentamente (comparado con la velocidad de la luz) en un campo gravitacional débil. Si el campo es débil la métrica se puede escribir en la forma (c = 1) gαβ = ηαβ + hαβ ; |hαβ | R, donde R es el radio de la distribución, y de manera similar a la situación que se presenta en electrostática, el campo eléctrico en el exterior de una distribución esférica de carga, para puntos exteriores, se comporta como el campo de una carga puntual, es decir como si toda la carga estuviera concentrada en el centro y la solución no involucra, en forma explícita, el radio de la distribución. Esta situación la podemos ver mejor en el siguiente resultado debido a Birkhoff, el cual establece que la solución para el exterior de una distribución de masa esférica es la de Schwarzschilod, independientemente que esta distribución esté variando radialmente, es decir si la distribución esta colapsando o expandiéndose. Para ver esto, consideremos una situación en la cual la distribución esférica de masa total m está variando su radio en el tiempo, i.e., R = R(t), y busquemos una solución de las ecuaciones de campo de Einstein para el exterior de esta distribución, es decir en en vacío. Dado que los elementos de simetría utilizados para construir la forma general de la solución buscada, ecuación 4.13, no se ven afectados por el comportamiento del radio de la distribución, podemos asumir que la métrica buscada tiene la forma general g = eh(r,t) c2 dt2 − eg(r,t) dr2 − r2 dΩ2
(4.46)
pero ahora las funciones h(r, t) y g(r, t), deben depender del tiempo. Si procedemos como antes, es decir, si introducimos esta métrica en las ecuaciones de campo, obtenemos una relación similar a la ecuación 4.33 h´+ g´= 0
(4.47)
en donde la prima significa derivada respecto a la coordenada r, entonces integrando h + g = cte(t) = λ (t) . (4.48) en donde ahora la constante de integración puede depender del tiempo. Así, continuando con este procedimiento obtenemos finalmente λ(t)
g=e
¶ ¶ µ µ 2Gm −1 2 2Gm ¡ 0 ¢2 dx − 1− 2 dr − r2 dΩ2 1− 2 c r c r
Si redefinimos la coordenada temporal como Z t˜ = eλ(t) dt
(4.49)
(4.50)
86
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
entonces la métrica toma la forma de Schwarzschlid, es decir la métrica en el exterior de la distribución solo depende de la masa total, y no del radio de la distribución, así este radio sea o no una función del tiempo. Este importante resultado significa que la solución de Schwarzschild obtenida, es la única solución que representa la métrica en el vacío producida por cualquier distribución de materia con simetría esférica.
4.1.2.
Características de la solución de Schwarzschild
La métrica de Schwarzschild representa la solución a las ecuaciones de campo de Einstein para el exterior de una distribución esférica de materia, y por esta razón es válida para r > R, en donde R es el radio de la distribución. Sin embargo en la expresión para la métrica, ecuación 4.45, una ¢2 ¡ aparece 0 se anula singularidad coordenada, en el sentido que el coeficiente de dx y el coeficiente de dr2 diverge a +∞, cuando r −→ 2Gm/c2 por la derecha. A este valor de la coordenada radial, denotado por rs , se le conoce como el radio de Schwarzschild de la distribución rs =
2Gm c2
(4.51)
el cual solo depende de la masa total y por lo tanto es un parámetro que caracteriza la distribución, independientemente del radio R. Si calculamos el valor de este parámetro para un cuerpo como la tierra tenemos 2 × 6,67259 × 10−11 m3 kg−1 s−2 × 5,9742 × 1024 kg (2,99792458 × 108 m s−1 )2 = 8. 870 8 × 10−3 m
rs =
(4.52)
es decir, del orden de 9 milímetros, que en comparación con el radio de la tierra RT = 6,5 ×106 m es despreciable. Esto muestra por qué esta singularidad no es relevante para los objetos celestes usuales. De hecho Schwarzschild notó este problema que surgía en su solución y calculó de nuevo la métrica para una distribución de masa con una densidad de energía constante y obtuvo que el radio de la distribución debería ser mayor a 9rs /8, resultado que lo dejó satisfecho pues aún en este caso la singularidad no jugaba papel alguno. En 1923 Birkhoff mostró que una solución esféricamente simétrica de las ecuaciones de campo en el vacío era necesariamente estática para r > rs , y por lo tanto la solución para cualquier distribución esférica de masa no estática era la de Schwarzschild si r > rs , y por lo tanto el argumento de utilizó Schwarzschild no es válido. Sin embargo dado que rs es muy pequeño
4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA
87
no se esperaba encontrar una distribución de materia en donde el radio de la distribución R fuera mayor que rs . Pues, por ejemplo esto implicaba que un cuerpo como la tierra tuviera una densidad del orden de 3 × 5,9742 × 1024 kg 4π (8. 870 8 × 10−3 m)3 2. 0 × 1030 = kg (4.53) m3 lo cual no se veía factible para la materia ordinaria que se conocía. Un resultado conocido de la ley de gravitación universal de Newton, debido al comportamiento de la fuerza gravitacional con el inverso del cuadrado de la distancia, es el hecho de que la fuerza sobre una masa en el interior de un cascarón esférico de materia se anula. Para ver que sucede en el caso de la relatividad general, consideremos una distribución esférica de materia de radio R, con un hueco interior concéntrico de radio a < R, entonces busquemos una solución de las ecuaciones de campo en el interior de esta cavidad. Es claro que por simetría, podemos seguir el mismo procedimiento que vimos para encontrar la solución de Schwarzschild, y podemos proponer llevar los mismos argumentos hasta plantear la forma general de la solución como (4.54) g = eh(r) c2 dt2 − eg(r) dr2 − r2 dΩ2 ρ =
La primera diferencia que surge con respecto a la solución de Schwarzschild es en la condición asintótica, la cual ya no es más aplicable en el presente caso y por lo tanto en la ecuación 4.34, h + g = k˜ = cte.
(4.55)
la constante k˜ ya no es cero. Así, continuando con el procedimiento encontramos (ecuación 4.40) K2 (4.56) r Para encontrar la solución en el interior del cascarón esférico podemos comparar la solución encontrada en la aproximación post-Newtoniana con el potencial clásico, teniendo en cuenta que el potencial gravitacional Newtoniano en el interior del cascarón es constante (i.e., la fuerza es cero sobre la partícula de prueba), entonces ˜
e−g(r) = e−k eh(r) = 1 −
2φ =⇒ g00 = 1 + 2 ¶ µc K2 ˜ k g00 = e 1 − r
(4.57)
88
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
lo que implica que K2 = 0, y por lo tanto la métrica toma la forma ˜
g = ek c2 dt2 − dr2 − r2 dΩ2
(4.58)
la cual, salvo un factor de escala temporal que depende del potencial constante en el interior del cascarón, se reduce a la métrica Minkowskiana, lo cual representa la versión relativista de la anulación de la fuerza gravitacional en el interior de un cascarón esférico de materia, lo cual es una consecuencia del comportamiento con el inverso al cuadrado de la distancia de la fuerza de gravitación universal. Este resultado justifica ciertas consideraciones Newtonianas que se hacen en cosmología.
4.2.
Pruebas clásicas de la relatividad general
En esta sección analizaremos el movimiento de partículas materiales de prueba y de rayos de luz (fotones) en el campo de una distribución esférica de masa, concentrándonos en dos efctos particulares: el corrimiento del perihelio del planeta Mercurio y la desviación de un rayo de luz que pasa muy cerca de la superficie solar. Estos resultados se han constituido como los paradigmas históricos de las pruebas observacionales de la teoría general de la relatividad.
4.2.1.
Corrimiento del perihelio de Mercurio
Consideremos en primer lugar el cálculo de las geodésicas como de tiempo para la métrica de Schwarzschild, las cuales describen las trayectorias seguidas por partículas materiales (i.e., de masa propia diferente de cero). Estas geodésicas se pueden deducir a partir del elemento de línea por el principio variacional 4.17, en donde ³ ¡ ¢2 ¡ ¢2 rs ´−1 ¡ 1 ¢2 rs ´ ¡ 0 ¢2 ³ x˙ − 1− − r2 x˙ 2 − r2 sin2 θ x˙ 3 (4.59) x˙ F = 1− r r ¡ 0 1 2 3¢ en donde x , x , x , x = (ct, r, θ, ϕ), y x˙ µ = dxµ /ds. Entonces la ecuaciones de Euler-Lagrange están dadas por (µ = 0, 1, 2, 3): µ ¶ d ∂F ∂F (4.60) = ds ∂ x˙ µ ∂xµ Consideremos primero la ecuación para la coordenada x2 = θ, entonces d ³ 2 ˙´ r θ = r2 sin θ cos θϕ˙ 2 (4.61) ds
4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL
89
y por lo tanto, si las condiciones iniciales del movimiento son tales que θ (0) = π/2 y θ˙ (0) = 0 entonces θ (t) = π/2, es decir, si el cuerpo se está moviendo inicialmente en el plano ecuatorial θ = π/2 con θ˙ (0) = 0 entoces el movimiento continua siempre en este plano. Por esta razón siempre podemos elegir los ejes coordenados espaciales con el eje z normal al plano del movimiento. De esta forma asumiremos que θ = π/2 y por lo tanto la funcional F se reduce a ³ rs ´−1 2 rs ´ 2 ˙2 ³ c t − 1− r˙ − r2 ϕ˙ 2 (4.62) F = 1− r r
A partir de esta funcional, las ecuaciones de Euler-lagrange para las coordenadas t y ϕ toman la forma d ¡ 2 ¢ r ϕ˙ = 0 ds rs ´ ˙´ d ³ 2³ c 1− t =0 ds r Estas ecuaciones implican entonces que
(4.63) (4.64)
r2 ϕ˙ = L = cte. (4.65) ³ rs ´ ˙ 1− t = E = cte. (4.66) r Para encontrar la ecuación para la coordenada radial, dividamos (formalmente) el elemento de arco (distancia espacio-tiempo) por ds, entonces ³ rs ´ ˙2 ³ rs ´−1 2 1= 1− t − 1− r˙ − r2 ϕ˙ 2 r r
(4.67)
³ rs ´−1 2 ³ rs ´−1 2 L2 1= 1− E − 1− r˙ − 2 r r r
(4.68)
µ ¶ ³ L2 rs ´ 1 + 2 = E2 r˙ 2 + 1 − r r
(4.69)
y reemplacemos las ecuaciones 4.65 y 4.66 en la ecuación anterior obtenemos
o equivalentemente
Esta ecuación la podemos escribir en la forma r˙ 2 + V (r) = E 2
(4.70)
90
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
en donde el potencial efectivo V (r) está dado por µ ¶ ³ L2 rs ´ 1+ 2 V (r) = 1 − r r
(4.71)
Las ecuaciones 4.65 y 4.66 representan leyes de conservación pues para la métrica de Schwarzschild ∂/∂t y ∂/∂ϕ son campos vectoriales de Killing. Este resultado se puede ver del siguiente teorema: Teorema 90 Sea γ (s) una geodésica con vector tangente u = (∂/∂s) |γ y ζ un campo vectorial de Killing, entonces g (u, ζ) = cte. a lo largo de la geodésica γ (s). Proof. Calculemos la derivada covariante del tensor métrico a lo largo de la curva γ (s), entonces ¶ µ D | γ = ∇u g (u, ζ) g (u, ζ) ∂s = (gµν uµ ζ ν );σ uσ = gµν uµ;σ ζ ν uσ + gµν uµ ζ ν;σ uσ g (∇u u, ζ) + g (u, ∇u ζ) como la curva γ es una geodésica con vector tangente u, por definición ∇u u = 0, y por lo tanto ∇u g (u, ζ) = gµν uµ ζ ν;σ uσ
= uµ uσ ζ ν;σ ¢ 1¡ µ σ = u u ζ µ;σ + uσ uµ ζ σ;µ 2 en donde la última igualdad se obtiene del hecho que los índices µ y σ son mudos. Dado que ζ es un campo vectorial de Killing satisface la ecuación ζ µ;σ + ζ σ;µ = 0 y por lo tanto ¢ 1¡ µ σ u u ζ µ;σ + uµ uσ ζ σ;µ 2 ¢ 1 µ σ¡ u u ζ µ;σ + ζ σ;µ = 2 = 0
∇u g (u, ζ) =
lo cual demuestra el teorema.
4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL
91
Así, para el caso de la métrica de Schwarzschild tenemos que los vectores de Killing ∂/∂t y ∂/∂ϕ tienen componentes (1, 0, 0, 0) y (0, 0, 0, 1) respectivamente y por lo tanto g (u, ∂/∂t) = g00 u0 ³ rs ´ dx0 = 1− r ds ³ rs ´ ˙ t = 1− r = cte.
(4.72)
g (u, ∂/∂ϕ) = g44 u4 dx4 = −r2 ds 2 = −r ϕ˙ = cte.
(4.73)
Aquí estamos interesados en la órbita de la partícula de prueba r = r (ϕ), entonces dr r˙ r´= = (4.74) dϕ ϕ˙ y de las ecuaciones 4.65 y 4.70 tenemos L2 r´= E 2 − V (r) r4
(4.75)
Para integrar esta ecuación realicemos el siguiente cambio de variable u=
1 r
=⇒
r´= −
u´ u2
(4.76)
entonces
E2 − 1 rs + 2 u + rs u3 2 L L diferenciando con respecto a ϕ tenemos u´2 + u2 =
rs 2u´u´+ 2uu´− 2 u´− 3rs u2 u´ = 0 L µ ¶ rs 3 2 2u´ u´+ u − − rs u = 0 2L2 2
(4.77)
=⇒ (4.78)
92
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
Una solución de esta ecuación corresponde a movimiento circular, i.e., u´= 0 implica r = cte.o
u´+ u −
3 rs − rs u2 = 0 2 2L 2
(4.79)
Si comparamos esta ecuación con la obtenida en mecánica Newtoniana
u´+ u −
Gm =0 L2
(4.80)
en donde L = r2
dϕ dt
(4.81)
y notando que r2 ϕ˙ = L la relación entre las dos ecuaciones es rs 2L2
= = =
=
=
=
Gm c2 L2 Gm c2 (r2 ϕ) ˙ 2 Gm ³ ´2 c2 r2 dϕ ds
Gm ³ ´2 dϕ c2 r2 cdt Gm ³ ´2 r2 dϕ dt Gm L2
(4.82)
en donde se ha utilizado la aproximación ds ' cdt válida para velocidades pequeñas en comparación con la velocidad de la luz. Así, teniendo en cuenta la definición del radio de Schwarzschild rs = 2Gm/c2 tenemos que cL = L. Vemos entonces que la ecuación relativista contiene el término adicional 3/2rs u2 , el cual, para el caso de la órbita de Mercurio es pequeño comparado
4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL
93
con el témino rs /2L2 , pues teniendo en cuenta que ds ' cdt, tenemos 3/2rs u2 rs /2L2
= 3L2 u2 1 ¡ 2 ¢2 r ϕ˙ r2 ¶ µ dϕ 2 3 ' 2 r c dt 2 v ' 3 ⊥ c2 ∼ 7, 7 × 10−8 = 3
(4.83)
en donde v⊥ es la velocidad de Mercurio perpendicular al radio vector. Por esta razón podemos resolver la ecuación de movimiento relativista para la órbita de Mercurio, tratando al término 3/2rs u2 como una perturbación. La aproximación de orden cero (Newtoniana) está dada por u(0) =
rs (1 + e cos ϕ) 2L2
(4.84)
en donde la excentricidad e está definida como ¢ 2L2 ¡ a 1 − e2 = rs
(4.85)
siendo a el semi-eje mayor de la órbita. Introduciendo esta solución de orden cero en la ecuación diferencial para la órbita (ecuación 4.79) tenemos 32 rs u2 u´+ u =
rs 3rs3 + (1 + e cos ϕ)2 2L2 8L4
(4.86)
Para encontrar la solución a esta ecuación diferencial no homogénea, notemos que las siguientes tres ecuaciones diferenciales K K cos ϕ u´+ u = (4.87) K cos2 ϕ
poseen las siguientes soluciones particulares K 1 2K
1 2 Kϕ sin ϕ − 16 K cos (2ϕ)
(4.88)
94
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
Puesto que la solución perturbativa u que estamos buscando es de la forma u = u(0) + u(1) , donde u(1) es la solución de la ecuación 4.86, entonces de las tres soluciones particulares la primera K = cte no es de interés, pues solamente cambia los parámetros de la órbita no perturbada y la tercera solución 12 K − 16 K cos (2ϕ) tampoco nos interesa pues en periódica y por lo tanto no es observable. Así, la solución que presenta una perturbación interesante a la órbita no perturbada es la segunda, pues lleva a un cambio secular de la órbita. De esta forma la solución que estamos interesados corresponde a la ecuación diferencial u´+ u =
3r3 rs + s4 e cos ϕ 2 2L 4L
(4.89)
la cual se obteniene a partir de la ecuación 4.86 manteniendo solamente el término en cos ϕ. La solución a esta ecuación diferencial está dada por µ ¶ 3rs2 rs 1 + e cos ϕ + eϕ sin ϕ (4.90) u= 2L2 4L2 Teniendo en cuenta que el término 3rs2 /4L2 es pequeño para órbitas planetarias, pues e.g. 3rs2 4L2
= = '
3rs2 4 (r2 ϕ) ˙ 2 3rs2 4 (r2 ϕ) ˙ 2 3rs2 c2 ³ ´2 4r2 r dϕ dt
∼ 7 × 10−8
(4.91)
para Mercurio, entonces podemos reescribir la ecuación 4.90 3n la forma µ µ ¶¶ 3rs2 rs 1 + e cos ϕ − ϕ (4.92) u= 2L2 4L2 El término 3rs2 ϕ/4L2 introduce un aperiodicidad el la órbita del planeta, la cual tiene como consecuencia un corrimiento en el perihelio de la órbita. El perihelio de una órbita sucede cuando r es un mínimo, o equivalentemente u es un máximo, así u es máximo cuando ¶ µ 3rs2 = 2πn; n ∈ N (4.93) ϕ 1− 4L2
4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL entonces
µ ¶ 3rs2 ϕ' 1+ 2πn 4L2
y por lo tanto perihelios sucesivos ocurren a intervalos de µ ¶ 3rs2 ∆ϕ = 2π 1 + 4L2
95
(4.94)
(4.95)
y así el corrimiento del perielio por revolución para la órbita de Mercurio es 3rs2 4L2 = 42,89´/siglo
δϕ = 2π
(4.96)
El valor medido para Mercurio es de 42,6´± 1,0´/siglo.
4.2.2.
Desviación de la luz por el sol
Para describir las geodésicas nulas el parámetro s no es apropiado puesto que ds = 0. Sea q un parámetro cualquiera, entonces la ecuación de las geodésicas se puede obtener a partir del principio variacional Z dxµ dxν dq = 0 (4.97) δ gµν dq dq De igual forma como procedimos en la sección anterior para obtener las trayectorias de partículas, podemos restringir, sin pérdida de generalidad, el movimiento de los rayos de luz al plano θ = π/2. Entonces las ecuaciones para las coordenadas t y ϕ están dadas por ˜ (4.98) r2 ϕ˙ = cte. = h ³ rs ´ ˙ ˜ 1− t = cte. = L (4.99) r La ecuación para la coordenada r la obtenemos a partir de la condición ds = 0 válida para geodésicas nulas, así ³ ˜2 rs ´−1 2 h rs ´−1 2 ˜ 2 ³ c L − 1− r˙ − 2 = 0 1− r r r
(4.100)
˜ 2 u´2 − h ˜ 2 u2 (1 − rs u) = 0 ˜2 − h c2 L
(4.101)
Eliminando el parámetro q, y haciendo el cambio u (ϕ) = 1/r (ϕ), la ecuación anterior se transforma en
96
CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD
y diferenciando esta ecuación con respecto a ϕ, tenemos µ ¶ 3rs 2 u´ u´+ u − u =0 2
(4.102)
Descartando la solución u = cte. obtenemos finalmente u´+ u =
3rs 2 u 2
(4.103)
Puesto que estamos interesados en la trayectoria de rayos de luz en el campo del sol, y en particular para rayos de luz que pasan cerca a la superficie solar, el término 3rs u/2 es pequeño 3rs u ' 10−6 2
(4.104)
y por lo tanto podemos considerar el término 3rs u2 /2 como una perturbación, así la solución a la ecuación no perturbada u´+ u = 0
(4.105)
u(0) = A cos (ϕ + δ)
(4.106)
está dada por con A y δ constantes de integración. Esta solución representa una línea recta (no hay desviación) y si escogemos el origen de los ejes en el centro del sol, y consideramos un rayo proveniente de y → −∞, y llamamos xm´ın = r0 el punto de máximo acercamiento (que coincide con el parámetro de impacto) entonces la solución no perturbada se puede escribir en la forma 1 cos ϕ r0 r cos ϕ = r0 u(0) =
⇐⇒ (4.107)
Entonces la solución a primer orden en teoría de perturbaciones de la ecuación 4.103 la podemos ecribir como u = u(0) +
3rs v 2
(4.108)
en donde v satisface la ecuación v´+ v = v´+ v =
´2 ³ u(0)
⇐⇒
1 (1 + cos 2ϕ) 2r0
(4.109)
4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL
97
cuya solución es v=
2 1 − cos2 ϕ 3r02 3r02
(4.110)
y por lo tanto la solución hasta términos de orden 3rs /2 toma la forma u=
rs rs 1 cos ϕ − 2 cos2 ϕ + 2 r0 2r0 r0
(4.111)
View more...
Comments