1
##########################################################################################
Ogólna teoria względności
P.A. M. Dirac
John Wiley & Sons, Inc 1975
Tłumaczenie rosyjskie Atomizdat 1975
******************************************************************************************
Tłumaczenie : R. Waligóra
Pierwsze tłumaczenie 2006
Ostatnia modyfikacja : 2020-07-10
Tłumaczenie całości książki
******************************************************************************************
Wst
ęp własny.
Przedstawione tłumaczenie książeczki Diraca, poświęconej Ogólnej Teorii Względności (skrót polski OTW,
ang. General Theory of Relativity – GTR, ros. Общая Теория Относительности – ОТО) stanowi lekturę raczej
dla przygotowanego czytelnika – tj. czytelnika na poziome zaawansowanym.
W pierwszej kolejności należałoby znać podstawy mechaniki analitycznej – formalizm Lagrange’a, podstawy
klasycznej teorii pola oraz, koniecznie podstawy analizy wektorowej i tensorowej, należy również dysponować
podstawową wiedzą z zakresu Szczególnej Teorii względności (skrót polski STW, ang. Special Theory of
Relativity – STR, ros. Специалная Теория Относительности – СТО lub również stosowana nazwa :
Частная Теория Относительности )
Autora niniejszej książeczki raczej nie trzeba nikomu przedstawiać – jest (był) on, bowiem powszechnie znanym
i uznanym fizykiem teoretykiem (można powiedzieć – teoretykiem przez duże T ).
Wykład OTW niżej prezentowany można zaliczyć do klasycznego „tensorowego” wyłożenia tematu.
Dirac daje w pierwszych rozdziałach pewne przygotowanie matematycznego aparatu (klasyczna algebra i
analiza tensorowa) by w końcowych rozdziałach wypełnić ten aparat fizyczną treścią.
Głównym problemem dla niedoświadczonego czytelnika może być swoboda w operowaniu zapisem
indeksowym, oraz pomijanie szczegółów prowadzonych rachunków – co jest raczej typowe dla
zaawansowanych fizyków teoretyków - po co zadawać sobie trud prowadzenia „elementarnych” rachunków ? )
Wobec powyższego wydaje mi się, że przed niniejszą lekturą należałoby również poznać podstawy OTW
zdobywając je przy bardziej „strawniejszych” podręcznikach np. takich chociażby jak :
„Ogólna teoria względności” -- J. Foster , J. D. Nightingale wyd. PWN 1985
Wyłożony aparat matematyczny – rachunek tensorowy na przestrzeniach Riemanna, można przećwiczyć
zapoznając się np. z książkami :
„Rachunek tensorowy” – J. L. Synge, A. Schild PWN 1964
„Elementy analizy tensorowej” – Leszek M. Sokołowski ; WUW 2010
R. Waligóra
******************************************************************************************
Spis tre
ści :
Przedmowa redaktora przekładu
Przedsłowie autora
1) Szczególna teoria względności
2) Nie ortogonalne współrzędne kartezjańskie
3) Współrzędne krzywoliniowe
4) Wielkości nie tensorowe
5) Przestrzeń zakrzywiona
6) Przeniesienie równoległe
7) Symbole Christoffela
8) Geodezyjne
9) Własność stacjonarności geodezyjnych
2
10) Różniczkowanie kowariantne
11) Tensor krzywizny
12) Kryterium płaskiej przestrzeni
13) Tożsamości Bianchi
14) Tensor Ricciego
15) Prawo grawitacji Einsteina
16) Przybliżenie Newtonowskie
17) Grawitacyjne przesunięcie ku czerwieni
18) Rozwiązanie Schwarzschilda
19) Czarne dziury
20) Gęstości tensorowe
21) Twierdzenie Gaussa i Stokesa
22) Współrzędne harmoniczne
23) Pole elektromagnetyczne
24) Modyfikacja równań Einsteina w obecności materii
25) Tensor energii-pędu materii
26) Zasada wariacyjna dla grawitacji
27) Działanie dla ciągłego rozkładu materii
28) Działanie dla pola elektromagnetycznego
29) Działanie dla naładowanej materii
30) Zasada wariacyjna w ogólnym przypadku
31) Pseudo tensor energii-pędu pola grawitacyjnego
32) Jawna postać dla pseudotensora
33) Fale grawitacyjne
34) Polaryzacja fal grawitacyjnych
35) Człon kosmologiczny
******************************************************************************************
Przedmowa redaktora przekładu
Nowa książka jednego z najwybitniejszych fizyków naszych czasów, zagranicznego członka AN ZSSR
P.A.M. Diraca oparta jest na wykładach wygłoszonych przez autora na uniwersytecie stanu Floryda.
Jest ona przeznaczona dla czytelnika rozpoczynającego naukę ogólnej teorii względności OTW Einsteina.
Wyróżniającą się stroną tej książki jest zwarte wyłożenie materiału. W ostatnim czasie pojawiło się wiele
monografii poświęconych OTW, zawierających oprócz jej kluczowych zagadnień szereg zastosowań np.
w astrofizyce, kosmologii. Na tym tle książkę Diraca można nazwać „matematycznym minimum” dotyczącym
OTW.
Wykład zawiera się w ramach tradycyjnej geometrycznej ideologii – teoria grawitacji Einsteina oparta na
geometrii przestrzeni Riemanna. Po przeczytaniu tej książki będzie można bez trudu zorientować się w
zastosowaniach tej teorii. Metody za pomocą których otrzymano niektóre klasyczne rezultaty jawią się
oryginalnymi. W szczególności otrzymano w ogólnej postaci, równania ruchu źródeł o ciągłym rozkładzie pola
zewnętrznego, jako następstwa równań Einsteina i równań odpowiadających im pól.
Książkę tą z zainteresowaniem przeczytają również wszyscy ci którzy pracują aktywnie na obszarze OTW, lub
są związani z tym tematem. Oni zapewne należycie docenią jej zalety.
Przedsłowie autora
Zgodnie z OTW Einsteina, dla opisania fizycznej rzeczywistości potrzebujemy zakrzywionej przestrzeni.
Żeby zagłębić się lepiej w rozumieniu fizycznych prawidłowości, należy ustanowić prawidłową postać równań
koniecznych dla opisania zakrzywionej przestrzeni. Wobec tego należy dobrze rozwinąć złożony matematyczny
aparat. Każdy kto chce zrozumieć teorię Einsteina powinien znać szczegóły funkcjonowania tego aparatu.
Książka ta oparta jest na wykładach wygłoszonych na wydziale fizycznym uniwersytetu stanu Floryda.
Materiał wyłożony jest w niej w dostępnej i zwartej formie. Dla jej zrozumienia nie potrzebne jest posiadanie
wiadomości wychodzących poza fundamentalne idee szczególnej teorii względności STW, oraz rachunek
różniczkowy funkcji pola. To pozwoli czytelnikowi rozwiązującemu zagadnienia OTW pokonać wynikające z
niej trudności z minimalną stratą czasu i energii oraz przygotować się na rozwiązywanie o wiele głębszych i
specjalnych aspektów tego przedmiotu.
******************************************************************************************
3
1) Szczególna teoria względności
Dla opisania fizycznej przestrzeni –czasu potrzebne są cztery współrzędne: czas t i trzy współrzędne
przestrzenne x, y, z. Przedstawmy je w formie
t = x0, x = x1, y = x2, z = x3
tak więc te cztery współrzędne można zapisać w formie x
µ
gdzie wskaźnik
µ
przybiera wartości 0,1, 2, 3.
Indeks
µ
zapisujemy w górnej pozycji aby uczynić zadość regule równowagi indeksów we wszystkich ogólnych
równaniach teorii. Dokładne znaczenie reguły „balansu (równowagi) indeksów” stanie się jasnym nieco później.
Weźmy punkt bliski punktowi rozpatrywanemu czyli x
µ
, niech jego współrzędne będą dane jako x
µ
+ dx
µ
.
Cztery wielkości dx
µ
, opisujące przemieszczenie, można rozpatrywać jako składowe wektora.
Prawa STW pozwalają wprowadzić jednorodne liniowe przekształcenie dx
µ
.
To przekształcenie ma taką postać, aby wielkość
(dx0)2 - (dx1)2 – (dx2)2 – (dx3)2 (1.1)
była inwariantna (wybieramy jednostki w których prędkość światła jest równa : c = 1).
Wszystkie wielkości A
µ
, które przy przekształceniu współrzędnych przekształcają się tak jak dx
µ
, nazywamy
wektorem kontrawariantnym. Inwariantną wielkość
(A0)2 – (A1)2 – (A2)2 – (A3)2 = (A, A) (1.2)
można nazwać kwadratem długości wektora. Jeśli mamy drugi kontrawariantny wektor B
µ
, to istnieje
inwariantny iloczyn skalarny :
A0 B0 – A1 B1 – A2 B2 – A3 B3 = (A, B). (1.3)
Dla wygody takiego zapisu inwariantów wprowadzimy indeksy dolne.
Definiując :
A0 = A
0 ; A
1 =
−
A1 ; A2 =
−
A2 ; A3 =
−
A3 . (1.4)
Tak więc, wyrażenie w lewej części (1.2) możemy zapisać w postaci : A
µ
A
µ
, gdzie domyślnie sumujemy dla
czterech wartości indeksu
µ
.
W takich oznaczeniach wzór (1.3) można przedstawić w postaci:
A
µ
B
µ
lub A
µ
B
µ
.
Cztery wielkości A
µ
wprowadzone za pomocą wyrażeń (1.4) można również rozpatrywać jako składowe
wektora. Prawa transformacji tych wielkości przy zmianie współrzędnych niewiele się różnią od praw
transformacji A
µ
za wyjątkiem znaków. Taki wektor nazywamy wektorem kowariantnym.
Z dwóch kowariantnych wektorów A
µ
i B
µ
można utworzyć szesnaście wielkości A
µ
B
ν
( indeks
ν
, tak jak
wszystkie greckie indeksy w tej książce przebiegają wartości 0, 1, 2, 3 ).
Te szesnaście wielkości obrazują składowe tensora drugiego rzędu. Nazywa się je zwykle „iloczynem
zewnętrznym” wektorów A
µ
B
µ
w odróżnieniu od iloczynu skalarnego (1.3) który nazywa się „iloczynem
wewnętrznym”.
Tensor A
µ
B
ν
stanowi tensor specjalny, ponieważ jego składowe związane są wzajemnie określonymi
zależnościami. Dokonując sumowania wielu tensorów przedstawionych w ten sposób, można otrzymać bardziej
ogólniejszy tensor drugiego rzędu, przykładowo :
T
µν
= A
µ
B
ν
+ A’
µ
B’
ν
+ A’’
µ
B’’
ν
+ ...... (1.5)
Tensor ten charakteryzuje się ważną cechą : przy transformacjach współrzędnych jego składowe przekształcają
się tak jak wielkości A
µ
B
ν
. Można obniżyć jeden z indeksów w T
µν
przyjmując zasadę obniżania indeksów w
każdym członie w prawej części (1.5). Tak otrzymamy : T
µν
lub T
µν
.
4
Obniżając oba indeksy otrzymamy wielkość T
µν
.
W tensorze T
µν
można przyjąć
ν
=
µ
, co prowadzi do T
µµ
.
Wtedy należy przeprowadzić sumowanie po czterech wartościach
µ
. W dalszej części książki zawsze kiedy
występują dwa powtarzające się indeksy będziemy stosować sumowanie po tych indeksach
(tzn. wykorzystujemy umowę sumacyjną Einsteina – przypis własny).
To znaczy, że stosując się do tej zasady, T
µµ
- będzie skalarem tożsamościowo równym T
µµ
.
Można kontynuować tą procedurę i przemnożyć więcej niż dwa wektory z różnymi indeksami.
Takim sposobem zbudujemy tensory wyższego rzędu. Jeśli wszystkie mnożone wektory będą kontrawariantne,
to otrzymany tensor będzie miał tylko górne indeksy. Jeśli natomiast wektory będą posiadać również dolne
indeksy to otrzymamy ogólnie tensor z szeregiem dolnych i szeregiem górnych indeksów.
(tj. tensor mieszany – przypis). Kiedy przyjmiemy, że indeks górny jest równy dolnemu, wtedy zgodnie z
przyjęta umową sumujemy po wszystkich wartościach tego indeksu. Indeks ten to tzw. indeks niemy.
Otrzymamy w tym przypadku tensor który będzie miał dwa swobodne (wolne – przypis własny) indeksy mniej
w stosunku do tensora wyjściowego.
Taką procedurę nazywamy „zawężaniem tensora”.
Tym sposobem, jeśli wychodzimy od tensora czwartego rzędu T
µνρσ
, to zawężając go po indeksach
σ
i
ρ
otrzymamy tensor drugiego rzędu T
µνρρ
, który ma tylko szesnaście składowych odpowiadającym czterem
znaczeniom indeksów
µ
i
ν
.
Dokonując zawężenia jeszcze raz dochodzimy do skalara T
µµρρ
składającego się z jednej składowej.
Teraz staje się jaśniejsze wyrażenie o tzw. „balansie indeksów”.
Każdy swobodny indeks pojawia się w równaniach jeden i tylko raz w każdym członie (składowej ) tego
równania jako indeks dolny lub górny. Indeks, pojawiający się podwójnie w jednym członie równania jest
indeksem niemym i powinien znajdować się jeden raz u góry i jeden raz u dołu składnika.
Taki indeks można zamienić na dowolny inny grecki indeks jeszcze nie wykorzystany w tym członie równania.
Takim sposobem : T
µνρρ
= T
µναα
. Indeks nie powinien pojawiać się więcej niż dwa razy w jednym członie.
2) Nieortogonalne współrz
ędne kartezjańskie
Zanim przejdziemy do matematycznego aparatu OTW, wygodnie jest rozpatrzyć pośredni formalizm STW
zapisany w nieortogonalnych współrzędnych kartezjańskich .
Przy przejściu do osi nieortogonalnych każda z wielkości dx
µ
w wyrażeniu (1.1) okazuje się być liniową funkcją
nowych dx
µ
i forma kwadratowa (1.1) stanowi ogólną formę kwadratową dla nowych dx
µ
, można ją zapisać w
postaci:
g
µν
dx
µ
dx
ν
(2.1)
gdzie w myśl umowy sumacyjnej sumujemy zarówno po
µ
jak i po
ν
.
Współczynniki g
µν
zależne są od wyboru współrzędnych nieortogonalnych kartezjańskich.
Koniecznie musi zachodzić g
µν
= g
νµ
(tj. zakładamy symetrię tensora metrycznego – przypis własny ), tak by
rozróżnienie między g
µν
a g
νµ
nie miało wpływu na formę (2.1).
W takim przypadku mamy tylko dziesięć niezależnych współczynników g
µν
.
Przy przekształceniu współrzędnych cztery współczynniki A
µ
dowolnego kontrawariantnego wektora
przekształcają się tak jak dx
µ
.
Zatem wielkość g
µν
A
µ
A
ν
będzie inwariantem.
Inwariant, ten jest kwadratem długości wektora A
µ
.
Niech B
µ
będzie danym drugim kontrawariantnym wektorem, wtedy A
µ
+
λ
B
µ
także będzie wektorem, dla
dowolnej wartości liczby
λ
. Kwadrat jego długości jest dany wzorem :
g
µν
(A
µ
+
λ
B
µ
) (A
ν
+
λ
B
ν
) = g
µν
A
µ
A
ν
+
λ
(g
µν
A
µ
B
ν
+ g
µν
A
µ
B
ν
) +
λ
2g
µν
B
µ
B
ν
5
Wielkość ta powinna być inwariantem przy wszystkich wartościach
λ
. Stąd wnioskujemy, że współczynniki
przy
λ
0 ,
λ
1 ,
λ
2 są inwariantami. Współczynniki przy
λ
1 mają postać
g
µν
A
µ
B
ν
+ g
µν
A
ν
B
µ
= 2g
µν
A
µ
B
ν
ponieważ, w drugim członie lewej części można zamienić miejscami
µ
i
ν
oraz wesprzeć się założeniem
g
µν
= g
νµ
.
W takim wypadku jasne jest, że g
µν
A
µ
B
ν
jest inwariantem.
Jest to oczywiście iloczyn skalarny wektorów A
µ
i B
ν
.
Niech g - będzie wyznacznikiem g
µν
(tj. wyznacznikiem zbudowanym z współczynników tensora metrycznego
– przypis własny g = det g
µν
).
Wartość g nie powinna być równa zeru, w przeciwnym wypadku cztery osie nie były by liniowo niezależne w
czasoprzestrzeni i nie mogłyby być wybrane w charakterze osi układu współrzędnych.
We współrzędnych ortogonalnych kartezjańskich rozpatrzonych w poprzednim rozdziale elementy diagonalne
g
µν
równe są 1,
−
1,
−
1,
−
1, a elementy nie diagonalne są równe zeru.
Tak więc g =
−
1.
W nieortogonalnych współrzędnych kartezjańskich g powinno być ujemne, ponieważ nieortogonalne
współrzędne mogą być otrzymane z ortogonalnych za pomocą funkcji ciągłych, co skutkuje ciągłą zmianą g ,
oczywiście wartość g może przechodzić przez wartość zerową.
Określmy wielkość A
µ
, będącą wektorem kowariantnym, następującym wzorem :
A
µ
= g
µν
A
µ
(2.2)
Ponieważ g nie jest zerem, to równanie pozwala wyrazić A
µ
przez A
µ
.
Ta zależność ma postać :
A
ν
= g
µν
A
µ
(zasada podnoszenia indeksu – przypis własny) (2.3)
Każda składowa g
µν
jest równa dopełnieniu algebraicznemu odpowiadającej składowej g
µν
w wyznaczniku
macierzy g
µν
podzielonemu przez g .
Tak więc g
µν
= g
νµ
. (symetryczność)
Podstawmy w (2.2) wyrażenie na A
ν
z (2.3). Żeby nie otrzymać trzech jednakowych indeksów w jednym
członie należy zamienić indeks niemy
µ
w (2.3) na jakikolwiek inny indeks greckim na przykład
ρ
.
Tak więc, otrzymamy :
A
µ
= g
µν
g
νρ
A
ρ
To równanie musi być spełnione dla dowolnej czteroskładnikowej wielkości A
µ
, zaznaczmy, że :
g
µν
g
νρ
= g
ρµ
(2.4)
gdzie
g
ρµ
= 1 dla
µ
=
ρ
(2.5)
i
g
ρµ
= 0 dla
µ
≠
ρ
Przy pomocy formuły (2.2) można opuścić, dla dowolnego tensora, dany indeks górny; przy pomocy formuły
(2.3) można dokonać podniesienia, danego dolnego indeksu. Jeśli określony indeks podniesiemy, a następnie
Opuścimy, to zgodnie z (2.4) i (2.5) dany tensor się nie zmieni.
Zauważmy że w g
ρµ
można prosto dokonać zmiany indeksu
µ
z indeksem
ρ
:
g
ρµ
A
µ
= A
ρ
lub zmiany indeksu
ρ
na
µ
:
g
ρµ
A
ρ
= A
µ
.
6
Stosując prawo podniesienia indeksu
µ
w g
µν
otrzymamy
g
αν
= g
αµ
g
µν
To zgadza się z (2.4) jeśli przyjmiemy do wiadomości, że zgodnie z symetrią g
µν
indeksy w g
αν
można pisać
jeden pod drugim. Idąc dalej wedle tej reguły dla indeksu
ν
otrzymamy :
g
αβ
= g
νβ
g
αν
Ten rezultat bezpośrednio wynika z (2.5). Prawa podnoszenia i opuszczania indeksów stosujemy dla wszystkich
indeksów w :
g
µν
, g
µν
, g
µν
.
3) Współrz
ędne krzywoliniowe
Obecnie przejdziemy do układów współrzędnych krzywoliniowych. Rozpatrzmy wielkości które znajdują się
w danym punkcie czasoprzestrzeni. Mogą to być wieloskładnikowe wielkości ze składnikami odniesionymi do
osi współrzędnych w danym punkcie.
Jeśli wielkość ta obecna jest we wszystkich punktach przestrzeni nazywamy ją wielkością polową.
Wielkość polową Q (lub jedna z jej składników, jeśli jest ich wiele) można zróżniczkować po danej z czterech
współrzędnych. Zapiszmy ten rezultat :
∂
Q/
∂
x
µ
= Q,
µ
Indeks dolny po przecinku, zawsze będzie oznaczał takie różniczkowanie. Indeks
µ
umieszczony u dołu tak jak
ten sam indeks umieszczony u góry w lewej części równości znajduje się w mianowniku.
Zmiana Q przy przejściu od punktu x
µ
do punktu bliższego x
µ
+
δ
x
µ
ma postać :
δ
Q = Q,
µ
δ
x
µ
(3.1)
Widać, że umowa o balansie indeksów jest wypełniona. Przyjdzie nam w dalszej części przypisywać danemu
punktowi wektory i tensory z współczynnikami odniesionymi do współrzędnych osi w tym punkcie.
Przy transformacjach współrzędnych składniki takich wielkości przekształcają się zgodnie z prawem podanym w
poprzednim rozdziale jednak, zależnym od przekształcenia współrzędnych w rozpatrywanym punkcie.
Otrzymamy, jak i poprzednio wielkości g
µν
i g
µν
z indeksami dolnymi i górnymi.
Jednak indeksy te nie będą stałe, ale będą się zmieniać od punktu do punktu tj. będą wielkościami polowymi.
Rozpatrzmy rezultat specjalnego przekształcenia współrzędnych. Niech każda z nowych współrzędnych
krzywoliniowych x’
µ
jest funkcją czterech x
µ
. Wygodnie jest pisać x
µ
’, gdzie przecinek stoi przy indeksie
µ
a
nie przy x. Modyfikując x
µ
otrzymujemy cztery wielkości
δ
x
µ
obrazujące wektor kontrawariantny.
Składowe tego wektora w nowych współrzędnych zgodnie z (3.1) mają postać :
δ
x
µ
’ = (
∂
x
µ
’/
∂
x
ν
)
δ
x
ν
= x
µ
’,
ν
δ
x
ν
Stąd otrzymujemy prawo przekształcenia danego wektora kontrawariantnego A
ν
:
A
µ
’ = x
µ
’,
ν
A
ν
(3.2)
Przedstawiając nowy wejściowy układ współrzędnych ze zmienionymi indeksami otrzymujemy :
A
λ
= x
λ
’,
µ
’A
µ
’ (3.3)
Z własności różniczkowania cząstkowego wiadomo, że (zgodnie z oznaczeniami (2.5)) :
(
∂
x
λ
/
∂
x
µ
’)(
∂
x
µ
’/
∂
x
ν
) = g
λν
Tak więc
x
λ
,
µ
’ x
µ
’,
ν
= g
λν
(3.4)
To pozwala zobaczyć spójność (3.2) i (3.3), ponieważ podstawienie (3.2) do prawej części (3.3) daje :
x
λ
,
µ
’ x
µ
’,
ν
A
ν
= g
λν
A
ν
= A
λ
7
Aby wyjaśnić jak przekształca się wektor kowariantny B
µ
zastosujmy warunek inwariantności wielkości
A
ν
B
µ
. Z uwzględnieniem (3.3) zapiszemy to następująco :
A
µ
’B
µ
’ = A
λ
B
λ
= x
λ
,
µ
’ A
µ
’B
λ
’
Ten rezultat powinien być słuszny dla wszystkich czterech wartości A
µ
’, dlatego przyrównując współczynniki
przy A
µ
’ możemy otrzymać :
B
µ
’ = x
λ
,
µ
’B
λ
(3.5)
Formuły (3.2) i (3.5) pozwalają teraz na transformacje dowolnego wektora z daną liczbą indeksów górnych i
dolnych. Współczynniki typu : x
µ
’,
ν
i x
λ
,
µ
’ za każdym razem powinny być wykorzystywane jednorazowo dla
każdego dolnego i górnego indeksu, spełniając umowę o balansie indeksów, przykładowo :
T
α
’
β
’
γ
’ = x
α
’,
λ
x
β
’
,
µ
x
ν
,
γ
’ T
γµ
ν
’ (3.6)
Dowolna wielkość przekształcająca się zgodnie z takim prawem jest tensorem. Równość (3.6) można uważać za
definicje tensora. Zauważmy, że dla tensora istotna jest symetria lub asymetria względem indeksów typu
λ
i
µ
,
ta własność zachowana zostaje przy transformacjach współrzędnych. Wzór (3.4) można przepisać w postaci :
x
λ
,
α
’ x
β
’,
ν
g
α
’
β
’ = g
λν
skąd wynika, że g
λν
jest tensorem .
Dla dowolnych wektorów A
µ
i B
ν
otrzymamy :
g
α
’
β
’A
α
’B
β
’ = g
µν
A
µ
B
ν
= g
µν
x
µ
,
α
’ x
ν
,
β
’ A
α
’B
β
’
Ponieważ jest to słuszne dla wszystkich wartości A
α
’ i B
β
’ wnioskujemy że :
g
α
’
β
’ = g
µν
x
µ
,
α
’ x
ν
,
β
’ (3.7)
Stąd wynika, że g
µν
jest tensorem. Analogicznie można pokazać że g
µν
- jest również tensorem.
Wielkości te nazywamy „tensorami podstawowymi” (fundamentalnymi). Dowolną skalarną wielkość polową
można uważać za funkcje czterech x
µ
jak i również funkcje czterech x
µ
.
Zgodnie z własnościami operacji różniczkowania cząstkowego otrzymamy :
S,
µ
’ = S,
λ
x
λ
,
µ
’
Odpowiednio S,
λ
przekształca się tak jak B
λ
z równania (3.5) i w takim razie różniczka pola skalarnego jest
kowariantnym polem wektorowym.
4) Wielko
ści nie tensorowe
Istnieją wielkości N
µνρ
.... - z różnymi górnymi i dolnymi indeksami, które nie są tensorami.
Przy przekształceniu współrzędnych wielkość tensorowa powinna przekształcać się według prawa (3.6).
W przeciwnym przypadku wielkość ta nie jest tensorem. Tensor odznacza się taką własnością, że kiedy
wszystkie jego składowe stają się zerami w jakimś jednym układzie współrzędnych, to są one zerami również w
innym. Dla wielkości nie będących tensorami taka własność jest nie spełniona.
Indeksy w przypadku wielkości nie tensorowych można podnosić i opuszczać zgodnie z prawami
obowiązującymi dla tensorów.
Tak jak np. dla :
g
αν
N
µνρ
= N
µαρ
Takie zasady jednak nie są w żaden sposób związane z prawami przekształcenia do nowych układów
współrzędnych. Przy określaniu wielkości nietensorowych w ten sposób można nie rozróżniać między dolnymi a
górnymi indeksami. Tensory i nietensory mogą pojawiać się razem w jednym równaniu.
Balans indeksów jest zachowany zarówno nie tensorów jak i tensorów.
8
Twierdzenie dotycz
ące kryterium wielkości tensorowej (twierdzenie ilorazowe)
Niech wielkość P
λµν
, taka że A
λ
P
λµν
będzie tensorem dla danego wektora A
ν
W takim przypadku P
λµν
będzie tensorem. Żeby to udowodnić wprowadzimy
Q
µν
= A
λ
P
λµν
Zgodnie z powyższym Q
µν
jest tensorem dlatego :
Q
βγ
= Q
µ
’
ν
’x
µ
’
,
β
x
ν
’
,
γ
Wtedy:
A
α
P
αβγ
= A
λ
’P
λ
’
µ
’
ν
’x
µ
’
,
β
x
ν
’
,
γ
Ponieważ A
λ
’ – jest wektorem, z (3.2) mamy:
A
λ
’ = A
λ
x
λ
’
,
α
W takim razie :
A
α
P
αβγ
= A
α
x
λ
’
,
α
P
λ
’
µ
’
ν
’x
µ
’
,
β
x
ν
’
,
γ
Ta równość powinna być spełniona dla wszystkich wartości A
α
; w szczególności:
P
αβγ
= P
λ
’
µ
’
ν
’ x
λ
’
,
α
x
µ
’
,
β
x
ν
’
,
γ
Widać z tego, że P
αβγ
jest tensorem .
Twierdzenie jest słuszne dla wielkości o dowolnej liczbie dolnych i górnych indeksów.
5) Przestrze
ń zakrzywiona
Dwuwymiarową, zakrzywioną przestrzeń można sobie wyobrazić jako powierzchnie w przestrzeni euklidesowej
trójwymiarowej. Analogicznie można postąpić w przypadku zakrzywionej czterowymiarowej przestrzeni tj.
można ją przedstawić w płaskiej przestrzeni wielowymiarowej. W tym przypadku zakrzywiona przestrzeń
nazywa się przestrzenią Riemanna. Mały obszar przestrzeni Riemanna jest bliski przestrzeni płaskiej.
Einstein założył, że fizyczna przestrzeń ma właśnie takie własności i dlatego założył geometrie Riemanna jako
podstawę dla teorii grawitacji.
W zakrzywionej przestrzeni nie można wprowadzić systemu współrzędnych prostoliniowych (globalnie –
przypis własny). Musimy korzystać ze współrzędnych krzywoliniowych, takiego typu jakie rozpatrywaliśmy w
rozdziale 3. Formalizm tego rozdziału możemy zastosować do przestrzeni zakrzywionych ponieważ wszystkie
zastosowane tam równania są lokalne co sprawia że są nieczułe na krzywiznę.
Inwariantny interwał ds między punktami x
µ
i bliskim punktem x
µ
+ dx
µ
dany jest wyrażeniem postaci (2.1):
g
µν
dx
µ
dx
ν
Interwał ds dla czasopodobnych punktów jest rzeczywisty dla przestrzennopodobnych – urojony.
We współrzędnych krzywoliniowych, g
µν
zadana jest jako funkcja współrzędnych i określa wszystkie
inwariantne odległości zatem g
µν
zadaje metrykę .
Wielkość g
µν
określa zarówno układ współrzędnych jak i krzywiznę.
9
6) Przeniesienie równoległe
Niech wektor A
µ
będzie zaczepiony w punkcie P. Jeśli przestrzeń jest zakrzywiona pojęcie wektora
równoległego zaczepionego w drugim punkcie Q traci sens, łatwo się o tym przekonać na przykładzie
zakrzywionej powierzchni dwu wymiarowej „zanurzonej” w trójwymiarowej przestrzeni euklidesowej.
Istnieje jednak w punkcie P’ bliskim punktowi P wektor równoległy do wektora A
µ
wyznaczony z
dokładnością do członów drugiego rzędu względem odległości między punktami P i P’.
Tak więc można nadać sens operacji przeniesienia równoległego wektora A
µ
z punktu P do P’ pozostawiającej
ten wektor równoległy sam do siebie i nie zmieniającej jego długości. Przy pomocy operacji przeniesienia
równoległego można w sposób ciągły przenieś wektor wzdłuż danej trajektorii.
Wybierając tę trajektorię (tor, krzywą - przypis własny) od P do Q otrzymamy wektor w punkcie Q, równoległy
w znaczeniu danej wybranej trajektorii wychodzącej z punktu P.
Wybór innej trajektorii może dać zupełnie inny rezultat przeniesienia równoległego. Pojęcie wektora w punkcie
Q, równoległego do wektora wejściowego P nie jest pojęciem absolutnym. Jeśli dokonać przeniesienia
równoległego z punktu P wzdłuż zamkniętej trajektorii to otrzymamy znów wektor w punkcie P, który ogólnie
mówiąc będzie odmienny od wektora początkowego.
Równania dla przeniesienia równoległego wektora można otrzymać zakładając, że nasza czterowymiarowa
przestrzeń fizyczna znajduje się w płaskiej przestrzeni o wyższym wymiarze np. N wymiarowej.
Wprowadzimy w tą N-wymiarową przestrzeń współrzędne prostoliniowe : zn (n = 1,2,...,N ).
Współrzędne te mogą być współrzędnymi nieortogonalnymi.
Dla dwóch bliskich punktów istnieje inwariantna odległość :
ds2 = hnmdz
ndzm (6.1)
gdzie sumowanie po n i po m prowadzimy od 1 do N.
W odróżnieniu od g
µν
wielkości hnm są stałymi.
Z ich pomocą można dokonać opuszczenia indeksów w n-wymiarowej przestrzeni:
dzn = hnmdz
m
Przestrzeń fizyczna obrazowana jest jako czterowymiarowa „powierzchnia” w płaskiej N-wymiarowej
przestrzeni. Każdy punkt x
µ
tej powierzchni określa pewien punkt yn w N-wymiarowej przestrzeni.
Każda współrzędna yn jest funkcją czterech x
µ
. Równania powierzchni zadajemy rugując x
µ
z N funkcji
postaci yn (x). Takich równań jest N- 4. Różniczkując yn (x) względem parametrów x
µ
otrzymujemy:
∂
yn (x) /
∂
x
µ
= yn,
µ
Dla dwóch bliskich punktów powierzchni różniących się o
δ
x
µ
otrzymamy:
∂
yn = yn,
µδ
x
µ
(6.2)
Zgodnie z (6.1) kwadrat inwariantnej odległości między tymi punktami ma postać :
δ
s2 = hnm
∂
yn
∂
ym = hnm y
n,
µ
y
m,
ν
δ
x
µ
δ
x
ν
Ponieważ hnm – są stałymi to
δ
s2 można zapisać w postaci :
δ
s2 = yn,
µ
yn ,
νδ
x
µ
δ
x
ν
oprócz tego
δ
s2 = g
µνδ
x
µ
δ
x
ν
stąd otrzymujemy że :
g
µν
= yn,
µ
yn,
ν
(6.3)
Rozpatrzmy w przestrzeni fizycznej wektor kontrawariantny A
µ
umieszczony w punkcie x.
Składowe tego wektora przekształcają się tak jak
δ
x
µ
z (6.2) i z nich można zbudować odpowiadający im
kontrawariantny wektor : An , w N-wymiarowej przestrzeni przekształcający się tak samo jak :
δ
yn z (6.3)
10
Wtedy:
An = yn,
µ
A
µ
(6.4)
Wektor An oczywiście należy do powierzchni.
Przemieśćmy teraz An w sąsiedni punkt powierzchni x + dx, pozostawiając go równoległym do siebie
(to oznacza, że składowe An pozostają nie zmienne). W skutek krzywizny przestrzeni wektor w punkcie x + dx
już nie przynależy do powierzchni. Jednak jego rzut na powierzchnię określa pewien wektor który należy do
powierzchni.
Dla znalezienia tego rzutu na powierzchnię należy rozłożyć wektor na część tangencjalną (styczną) i normalną,
a następnie część normalną odrzucić :
An = An tan A
n
nor (6.5)
Jeśli oznaczyć jako K
µ
, składowe An tan w układzie współrzędnych x, przynależące do powierzchni,
to zgodnie z (6.4) można zapisać :
An tan = K
µ
yn,
µ
(x + dx) (6.6)
gdzie współczynniki yn,
µ
wzięte są w nowym punkcie x +dx.
Składowa An nor zgodnie ze swoją definicją jest ortogonalna do danego wektora stycznego w punkcie x + dx ,
zatem jest również ortogonalna do dowolnego wektora określonego w prawej części (6.6), niezależnie od
postaci K
µ
. Tak więc :
An nor yn,
µ
(x + dx) = 0
Jeśli następnie pomnożymy (6.5) przez :
yn,
ν
(x + dx)
to człon z An nor zniknie i z udziałem (6.3) otrzymamy :
An yn,
µ
(x + dx) = K
µ
yn,
µ
(x + dx)yn,
ν
(x + dx) = K
µ
g
µν
(x + dx)
W takim razie, z dokładnością do wielkości pierwszego rzędu względem dx znajdujemy :
K
ν
(x + dx) = An[ yn,
ν
(x)+ yn,
ν
,
σ
dx
σ
] = An yn,
µ
[ yn,
ν
+ yn,
ν
,
σ
dx
σ
] = A
ν
+ A
µ
yn,
µ
yn,
ν
,
σ
dx
σ
Ponieważ K
ν
jest rezultatem przeniesienia równoległego A
ν
do punktu x + dx , można podstawić :
K
ν
- A
ν
= dA
ν
Tak, więc dA
ν
oznacza zmianę A
ν
przy przeniesieniu równoległym.
Wtedy otrzymamy :
dA
ν
= A
µ
= dA
ν
yn,
µ
yn,
ν
,
σ
dx
σ
(6.7)
7) Symbole Christoffela
Różniczkując (6.3) otrzymujemy (drugi przecinek przy dwukrotnym różniczkowaniu opuszczamy)
g
µν
,
σ
= yn,
µσ
yn,
ν
+ yn,
µ
yn,
νσ
= yn,
µσ
yn,
µσ
y
n,
ν
+ yn,
νσ
yn,
µ
(7.1)
ponieważ indeks niemy n , w wyniku stałości hnm można podnieść i opuścić .
Zmieniając miejscami
µ
i
σ
w (7.1) otrzymamy :
g
σν
,
µ
= yn,
σµ
yn,
ν
+ yn,
νµ
yn,
σ
(7.2)
Przestawiając
ν
i
σ
w (7.1) otrzymamy :
g
µσ
,
ν
= yn,
µν
yn,
σ
+ yn,
σν
yn,
µ
(7.3)
Teraz dodajmy (7.1) i (7.3) a od wyniku odejmijmy (7.2), następnie podzielmy to przez dwa
W rezultacie otrzymamy :
½ (g
µν
,
σ
+ g
µσ
,
ν
- g
νσ
,
µ
) = yn,
νσ
yn,
µ
(7.4)
11
Zdefiniujmy pewien symbol :
Γµνσ
= ½ (g
µν
,
σ
+ g
µσ
,
ν
−
g
νσ
,
µ
) (7.5)
Tę wielkość nazywamy symbolem Christoffela pierwszego rzędu.
Jest ona symetryczna względem dwóch ostatnich indeksów.
Symbol Christoffela pierwszego rzędu nie jest tensorem. Z (7.5) bezpośrednio wynika :
Γµνσ
+
Γνµσ
= g
µν
,
σ
(7.6)
Teraz jasne jest, że (6.7) można zapisać w postaci :
dA
µ
= A
µ
Γµνσ
dx
σ
(7.7)
To już nie odnosi się do N-wymiarowej przestrzeni, ponieważ symbol Christoffela wyraża się tylko przez tensor
metryczny g
µν
przestrzeni fizycznej. Można pokazać, że długość wektora nie zmienia się przy przeniesieniu
równoległym. W istocie :
d(g
µν
A
µ
A
ν
) = g
µν
A
µ
dA
ν
+ g
µν
A
ν
dA
µ
+A
µ
A
ν
g
µν
,
σ
dx
σ
= A
ν
dA
ν
+ A
µ
dA
µ
+ A
α
A
β
g
µν
,
σ
dx
σ
=
= A
ν
A
µ
Γµνσ
dx
σ
+ A
µ
A
ν
Γνµσ
dx
σ
+ A
α
A
β
g
αβ
,
σ
dx
σ
= A
ν
A
µ
g
µν
,
σ
dx
σ
+ A
α
A
β
g
αβ
,
σ
dx
σ
(7.8)
Dalej :
g
αµ
,
σ
g
µν
+ g
αµ
g
µν
,
σ
= ( g
αµ
g
µν
),
σ
= g
αν
,
σ
= 0.
Mnożąc to przez g
βν
otrzymujemy :
g
αβ
,
σ
=
−
g
αµ
g
βν
g
µν
,
σ
(7.9)
T pożyteczne wyrażenie matematyczne wyraża pochodną g
αβ
przez pochodną g
µν
.
Stąd mamy :
A
α
A
β
g
αβ
,
σ
=
−
A
ν
A
µ
g
µν
,
σ
Tak więc wyrażenie (7.8) staje się zerem. W takim razie długość wektora jest niezmienna.
W szczególności, wektor zerowy (tj. wektor o długości zerowej) przy przeniesieniu równoległym pozostaje
nadal zerowy. Stałość długości wektora przy przeniesieniu równoległym wynika również z rozważań
geometrycznych. Przy rozłożeniu wektora A
µ
na składowe styczne i normalne zgodnie z (6.5) składowa
normalna jest infinitezymalna i ortogonalna do składowej stycznej.
To znaczy, że długość wektora w pierwszym przybliżeniu równa jest długości jego składowej stycznej.
Stałość długości dowolnego wektora pociąga za sobą stałość iloczynu skalarnego g
µν
A
µ
B
ν
dwóch dowolnych
wektorów A i B. Można to pokazać, wykorzystując stałość długości wektora A +
λ
B przy dowolnej wartości
parametru
λ
. Często bywa wygodnie podnieść pierwszy indeks symbolu Christoffela tak aby wyrazić wielkość :
Γµ
νσ
= g
µλΓλνσ
którą nazywamy symbolem Christoffela drugiego rzędu.
Jest on symetryczny względem dwóch dolnych indeksów. Jak wyjaśnialiśmy w rozdziale 4, operacja
podniesienia indeksu określona jest również dla wielkości nie tensorowych.
Wzór (7.7) możemy przepisać w postaci :
dA
α
=
Γµ
νσ
A
α
dx
σ
(7.10)
Jest to standardowy zapis dla składowych kowariantnych.
Wprowadzając drugi wektor B
ν
otrzymujemy :
d( A
α
B
ν
) = 0
dA
ν
dB
ν
=
−
B
ν
dA
ν
=
−
B
ν
Γµ
νσ
A
µ
dx
σ
=
−
B
µ
Γν
µσ
A
ν
dx
σ
Ostatnia równość jest prawdziwa dla dowolnego A
ν
.
Tak więc :
dB
ν
=
−
Γν
µσ
B
µ
dx
σ
(7.11)
Jest to standardowy zapis dla przeniesienia równoległego w składowych kontrawariantnych.
12
8) Geodezyjne
Niech punkt o współrzędnych z
µ
porusza się po jakiejkolwiek trajektorii, wtedy z
µ
będzie funkcją pewnego
parametru
τ
. Zapiszmy :
dz
µ
/d
τ
= u
µ
.
Wektor u
µ
, zgodnie z powyższym będzie określony w każdym punkcie trajektorii.
Zauważmy, że przy poruszaniu się wzdłuż trajektorii wektor u
µ
przemieszcza się za pośrednictwem operacji
przeniesienia równoległego. Wtedy zadanie punktu początkowego i wartości początkowej wektora u
µ
określa
całą trajektorię. W istocie – najpierw musimy przemieścić punkt początkowy, z z
µ
do z
µ
+ u
µ
d
τ
tzn. za
pomocą przeniesienia równoległego przenieść w ten nowy punkt wektor u
µ
, potem znowu przenieść punkt w
kierunku zadanym przez nowy wektor u
µ
itd.
W ten sposób określamy nie tylko trajektorię ale także parametr
τ
wzdłuż niej.
Trajektoria określona w ten sposób nazywamy - geodezyjną .
Jeśli u
µ
w punkcie początkowym jest wektorem zerowym to pozostaje on wektorem zerowym we wszystkich
innych punktach, w tym przypadku trajektorię nazywamy geodezyjną zerową.
Jeśli u w punkcie początkowym jest wektorem czasopodobnym ( u
µ
u
µ
> 0), to pozostaje on czasopodobny we
wszystkich innych punktach, a geodezyjną nazywamy czasopodobną.
Odpowiednio, jeśli - u
µ
w punkcie początkowym jest wektorem przestrzennopodobnym ( u
µ
u
µ
< 0), to
pozostaje on przestrzennopodobny we wszystkich innych punktach, a geodezyjną nazywamy
przestrzennopodobną..
Powróćmy do równania (7.11), podstawmy B
ν
= u
ν
i
dx
σ
= dz
σ
, otrzymujemy równanie geodezyjnej :
dx
ν
/ d
τ
+
Γνµσ
u
µ
dz
σ
/d
τ
= 0 (8.1)
lub
d2z
ν
/ d
τ
2 +
Γνµσ
( dz
µ
/d
τ
) dz
σ
/d
τ
= 0 (8.2)
Dla geodezyjnej czasopodobnej można sprowadzić długość wektora początkowego u
µ
do jedności, mnożąc go
przez odpowiedni czynnik. Do tego potrzebna jest tylko zmiana skali
τ
.
Od teraz wektor u
µ
zawsze będzie miał długość jednostkową.
Przedstawia on sobą wektor prędkości v
µ
= dz
µ
/ds, a parametr
τ
stanowi odpowiednik czasu s.
Równanie (8.1) przyjmuje postać :
dv
ν
/ ds +
Γµνσ
v
µ
v
σ
= 0 (8.3)
a równanie (8.2) postać :
d2z
µ
/ ds2 +
Γµνσ
( dz
ν
/ds ) dz
σ
/ds = 0 (8.4)
Zauważmy, że linia świata cząstek które nie znajdują się pod działaniem jakichkolwiek sił oprócz
grawitacyjnych jest geodezyjną czasopodobną Jest to zamiennik pierwszego prawa Newtona.
Równanie (8.4) jest równaniem zadającym przyspieszenie i jest równaniem ruchu. Zauważmy także, że
trajektoria linii świetlnej jest geodezyjną zerową. Jest ona zadana równaniem (8.2) z pewnym parametrem
τ
wzdłuż trajektorii. W tym przypadku nie należy stosować czasu własnego s ponieważ ds jest zerem.
13
9) Własność stacjonarności geodezyjnych
Geodezyjna, nie będąca zerową odznacza się następującą własnością :
całka ∫ds wzięta wzdłuż odcinka trajektorii o początku w punkcie P i końcu Q przy małych wariacjach
trajektorii z ustalonymi punktami granicznymi pozostaje stała.
Przemieśćmy każdy punkt trajektorii o współrzędnych z
µ
do punktu z
µ
+
δ
z
µ
.
Jeśli przemieszczenie wzdłuż trajektorii oznaczymy jako dx
µ
ds2 = g
µν
dx
µ
dx
ν
to :
2ds
δ
(ds) = dx
µ
dx
νδ
g
µν
+ g
µν
dx
µ
δ
dx
ν
+ g
µν
dx
ν
δ
dx
µ
= dx
µ
dx
ν
g
µν
,
λδ
x
λ
+ 2g
µλ
dx
µ
δ
dx
λ
Oprócz tego :
δ
dx
λ
= d
δ
x
λ
W takim wypadku ponieważ dx
µ
= v
µ
ds
to:
δ
(ds) = [ ½ g
µν
,
λ
v
µ
v
νδ
x
λ
+ g
µλ
v
µ
d
δ
x
λ
/ds] ds
Zatem :
δ
∫
ds = ∫
δ
(ds) = ∫[ ½ g
µν
,
λ
v
µ
v
νδ
x
λ
+ g
µλ
v
µ
d
δ
x
λ
/ds] ds
Całkując przez części i wykorzystując warunek
δ
x
λ
= 0 w punktach granicznych P i Q otrzymujemy :
δ
∫
ds =
∫
[ ½ g
µν
,
λ
v
µ
v
νδ
x
λ
−
(d/ds) (g
µλ
v
µ
)] dx
λ
ds (9.1)
Warunkiem zerowania się (9.1) przy dowolnym
δ
x
λ
są :
(d/ds) (g
µλ
v
µ
) – ½ g
µν
,
λ
v
µ
v
ν
= 0 (9.2)
Dalej :
(d/ds) (g
µλ
v
µ
) = g
µλ
dv
µ
/ ds + g
µλ
,
ν
v
µ
v
ν
= g
µλ
dv
µ
/ ds + ½ ( g
λµ
,
ν
+ g
λν
,
µ
) v
µ
v
ν
Tak więc warunek (9.2) przyjmuje postać :
g
µλ
dv
µ
/ds +
Γλµν
v
µ
v
ν
= 0
Mnożąc to równanie przez g
λσ
możemy zapisać :
dv
σ
/ds +
Γσµν
v
µ
v
ν
= 0
tj. tak jak warunek (8.3) dla geodezyjnej.
Stąd widać ,że dla geodezyjnej wyrażenie (9.1) staje się zerem i
∫
ds = const.
I odwrotnie, jeśli
∫
ds jest stała można pokazać, że trajektoria jest geodezyjną.
W takim razie, warunek stałości
∫
ds można wykorzystać jako określenie geodezyjnej, wykluczając oczywiście
przypadek kiedy jest ona zerowa.
10) Różniczkowanie kowariantne
Niech S –będzie polem skalarnym. Wtedy jak było pokazane w rozdziale 3, S,
ν
- jest wektorem kowariantnym
Dalej, niech A
µ
- będzie polem wektorowym. Czy jego pochodna - A
µ
,
ν
jest tensorem ?
Aby odpowiedzieć na to pytanie zobaczmy jak przekształca się A
µ
,
ν
przy przekształceniach współrzędnych .
‘W oznaczeniach zgodnych z rozdziałem 3 A
µ
przekształca się zgodnie z równaniem (3.5) :
A
µ
, = A
ρ
x
ρ
,
µ
’
I następnie :
A
µ
,
ν
’ = (A
ρ
x
ρ
,
µ
’),
ν
’ = A
ρ
,
σ
x
σ
,
ν
’ x
σ
,
µ
’ + A
ρ
x
ρ
,
µ
’
ν
’
To wyrażenie jest dokładnym prawem przekształcenia tensora - jeśli w prawej części nie występuje ostatni
człon. A to oznacza, że - A
µ
,
ν
nie jest tensorem. Można jednak zmodyfikować operacje różniczkowania tak aby
otrzymać tensor. Weźmy wektor A
µ
w punkcie x i przenieśmy go za pomocą przeniesienia równoległego do
punktu x + dx. Przy tej operacji A pozostaje wektorem.
14
Odejmiemy go od wektora A w punkcie x +dx – różnica także będzie wektorem :
A
µ
(x + dx) – [A
µ
(x) +
Γαµν
A
µ
dx
ν
] = (A
µ
,
ν
−
Γαµν
A
α
)dx
ν
Ta wielkość jest wektorem dla dowolnego wektora dx
ν
, tak więc zgodnie z twierdzeniem ilorazowym (zobacz
rozdział 4) współczynnik : A
µ
,
ν
−
Γαµν
A
α
jest tensorem.
Łatwo sprawdzić bezpośrednio, że przy przekształceniu współrzędnych przekształca się on według prawa
tensorowego. To wyrażenie nazywa się pochodną kowariantną A
µ
i zapisywane jest w formie :
A
µ
:
ν
= A
µ
,
ν
−
Γαµν
A
α
(10.1)
Znak „ : ” (dwukropek) przed dolnym indeksem dalej będzie oznaczał pochodną kowariantną, podobnie jak
przecinek oznacza zwykłą pochodną (tj. pochodną cząstkową – przypis własny ).
Niech B
µ
będzie pewnym drugim wektorem.
Określimy pochodną kowariantną iloczynu wewnętrznego jako:
(A
µ
B
ν
):
σ
= A
µ
:
σ
B
ν
+ A
µ
B
ν
:
σ
(10.2)
Oczywiście, że jest to tensor z trzema indeksami.
Jego jawna postać jest następująca :
(A
µ
B
ν
):
σ
= (A
µ
,
σ
−
Γαµα
A
α
)B
ν
+ A
ν
( B
ν
:
σ
−
Γανσ
B
α
) = (A
µ
B
ν
),
σ
−
Γαµσ
A
α
B
ν
−
−
Γανσ
A
α
B
α
Niech T
µν
- będzie tensorem z dwoma indeksami.
Może on być wyrażony w postaci sumy członów : A
µ
B
ν
tak więc jego kowariantna pochodna przedstawia się
następująco :
T
µν
:
σ
= T
µν
,
σ
−
Γαµσ
T
αν
−
Γανσ
A
µα
(10.3)
Tę zasadę można uogólnić dla przypadku pochodnej kowariantnej tensora z dowolną liczbą dolnych indeksów :
Y
µν
...... :
σ
= Y
µν
...... ,
σ
−
Γ
- człon dla każdego indeksu. (10.4)
W każdym z tych
Γ
- członów należy spełnić warunek balansów indeksów.
To jest warunek konieczny dla jednoznacznego rozmieszczenia indeksów. Pochodną kowariantną skalara
otrzymujemy z ogólnej formuły (10.4) gdzie ilość indeksów Y będzie równa zero :
Y:
σ
= Y ,
σ
(10.5)
Zastosujmy (10.3) do tensora fundamentalnego g
µν
.
Z udziałem (7.6) to daje :
g
µν
:
σ
= g
µν
,
σ
−
Γαµσ
g
αν
−
Γανσ
g
µα
= g
µν
,
σ
−
Γνµσ
−
Γµνσ
= 0
W takim wypadku przy różniczkowaniu kowariantnym g
µν
można rozpatrywać jako stałą.
Wzór (10.2) przedstawia sobą ogólne prawo wykorzystywane przy różniczkowaniu iloczynu.
Zauważmy, że to prawo jest słuszne również dla pochodnej kowariantnej iloczynu skalarnego dwóch wektorów.
Wtedy:
(A
µ
B
µ
),
σ
= A
µ
:
σ
B
µ
+ A
µ
B
µ
:
σ
(10.6)
Stąd, zgodnie z (10.5) i (10.1) otrzymujemy:
(A
µ
B
µ
),
σ
= A
µ
:
σ
B
µ
+ A
µ
(B
µ
,
σ
−
Γαµσ
B
α
)
a następnie :
(A
µ
,
σ
B
µ
),
σ
= A
µ
:
σ
B
µ
−
A
α
Γµασ
B
µ
Ponieważ jest to słuszne dla każdego B
µ
mamy :
A
µ
:
σ
= A
µ
,
σ
+
Γµασ
A
α
(10.7)
Jest to standardowe wyrażenie dla pochodnej kowariantnej wektora kontrawariantnego. Tutaj też pojawia się
symbol Christoffela tak jak w standardowej formule (10.1) dla wektora kowariantnego, jednak ze znakiem plus.
Rozkład indeksów jest zgodny z zasadą równowagi indeksów.
15
Formalizm ten można uogólnić na przypadek kowariantnej pochodnej tensora z daną liczbą dolnych i górnych
indeksów. Człon
Γ
będzie pojawiał się dla każdego indeksu (ze znakiem plus dla indeksu górnego, ze znakiem
minus dla dolnego) . Jeśli zawężyć dwa indeksy to odpowiadające im człony
Γ
skracają się.
Wzór dla pochodnej kowariantnej iloczynu :
(XY) :
σ
= X :
σ
Y + X Y :
σ
(10.8)
jest słuszna dla ogólnego przypadku dowolnych wielkości tensorowych X i Y.
Ponieważ g
µα
przy różniczkowaniu kowariantnym zachowuje się jak stała, indeksy można podnosić i opuszczać
przed różniczkowaniem rezultat będzie taki sam jak by wykonać te operacje po różniczkowaniu.
Pochodna kowariantna dla wielkości nie tensorowych nie ma sensu.
Prawa fizyczne powinny być słuszne we wszystkich rodzajach układów współrzędnych.
To znaczy, że powinny wyrażać się w formie równań tensorowych. Jeśli równania zawierają pochodne wielkości
polowych to powinny być to pochodne kowariantne . Równania polowe otrzymujemy zamieniając zwykłe
pochodne na pochodne kowariantne.
Na przykład równanie D’Alamberta V = 0 dla pola skalarnego V w kowariantnej formie przyjmuje postać :
g
µν
V:
µ
:
ν
= 0
Stosując (10.1) i (10.5) otrzymujemy:
g
µν
(V
,
µ
ν
−
Γαµν
V,
α
) = 0 (10.9)
Nawet rozpatrując problemy w przestrzeni płaskiej (tj. bez udziału pola grawitacyjnego) i wykorzystując
współrzędne krzywoliniowe należy zapisywać równania stosując zapis uwzględniając pochodną kowariantną tak
aby zachować ich postać we wszystkich układach współrzędnych.
11) Tensor krzywizny
Ze wzoru dla różniczkowania iloczynu (10.8) widać, że dla iloczynu różniczkowanie kowariantne jest w pełni
analogiczne do różniczkowania zwykłego. Istnieje ważna własność zwykłego różniczkowania która odznacza się
tym, że przy działaniu dwóch operatorów różniczkowania ich porządek nie ma znaczenia, dla różniczkowania
kowariantnego w ogólnym przypadku taka własność nie zachodzi.
Rozpatrzmy pole skalarne S. Z (10.1) otrzymamy
S :
µ
:
ν
= S :
µ
,
ν
−
Γαµν
S :
α
= S ,
µν
−
Γαµν
S ,
α
(11.1)
Otrzymane wyrażenie jest symetryczne względem indeksów
µ
i
ν
tak więc w tym wypadku porządek
operatorów różniczkowania kowariantnego nie ma znaczenia.
Teraz podziałajmy dwoma operatorami różniczkowania kowariantnego na wektor A
µ
.
Ze wzoru (10.3), gdzie w miejsce T
νσ
wstawiamy A
ν
:
σ
otrzymujemy:
A
ν
:
ρ
:
σ
= A
ν
:
ρ
,
σ
−
Γανσ
A
α
:
ρ
−
Γαρσ
A
ν
:
α
= (A
ν
,
ρ
−
Γανρ
A
α
),
σ
−
Γανσ
(A
α
,
ρ
−
Γβαρ
A
β
)
−
Γαρσ
(A
ν
,
α
−
Γβνα
A
β
) = A
ν
,
ρ
,
σ
,
−
Γανρ
A
α
,
σ
−
Γανσ
A
α
,
ρ
−
Γαρσ
A
ν
,
α
−
A
β
(
Γβνρ
,
σ
−
Γανσ
Γβαρ
−
Γαρσ
Γβνα
)
Przestawiając indeksy
ρ
i
σ
oraz odejmując otrzymane wyrażenie od ostatniego, otrzymujemy:
A
ν
:
ρ
:
σ
−
A
ν
:
σ
:
ρ
= A
β
R
βνρσ
(11.2)
gdzie
R
βνρσ
=
Γβνσ
,
ρ
−
Γβνρ
,
σ
+
Γανσ
Γβαρ
−
Γανρ
Γβασ
(11.3)
Lewa część (11.2) jest tensorem, tak więc i prawa część (11.2) jest tensorem. Jest to słuszne dla dowolnego
wektora A
β
dlatego zgodnie z twierdzeniem ilorazowym (zobacz rozdział 4) R
βνρσ
- jest tensorem.
Tensor ten nazywamy tensorem Riemana-Christoffela lub tensorem krzywizny.
16
Tensor krzywizny charakteryzuje się oczywistą własnością :
R
βνρσ
=
−
R
βνσρ
(11.4)
Z (11.3) bezpośrednio wynika, że :
R
βνρσ
+ R
βρσν
+ R
βσνρ
= 0 (11.5)
Opuścimy indeks
β
(operacja opuszczenia indeksu – przypis własny), w miejsce pierwszego dolnego indeksu.
To daje :
R
µνρσ
= g
µβ
R
βνρσ
= g
µβ
Γβνσ
,
ρ
+
Γανσ
Γµαρ
−
<
ρσ
>
gdzie <
ρσ
> oznacza przedostatnie człony z przestawionymi członami
ρ
i
σ
.
Wtedy z (7.6) otrzymujemy:
R
µνρσ
=
Γµνσ
,
ρ
−
g
µβ
,
ρ
Γβνσ
+
Γνβρ
Γβµσ
−
<
ρσ
> =
Γµνσ
,
ρ
−
Γνβρ
Γβµσ
−
<
ρσ
>
Z udziałem (7.5)
R
µνρσ
= ½ (g
µσ
,
νρ
−
g
µσ
,
νρ
−
g
νρ
,
µσ
+ g
νρ
,
µσ
) +
Γβµσ
Γβνρ
−
Γβµρ
Γβνσ
(11.6)
Teraz widzimy jeszcze pewne własności symetrii tensora krzywizny, mianowicie :
R
µνρσ
=
−
R
νµρσ
(11.7)
oraz
R
µνρσ
= R
ρσµν
= R
σρνµ
(11.8)
Rezultatem wszystkich tych własności symetrii jest to że z 256 składowych tensora R
µνρσ
niezależnych jest
tylko 20 składowych.
12) Kryteria płaskiej przestrzeni
Jeśli przestrzeń jest płaska, to można wybrać prostoliniowy układ współrzędnych, wtedy g
µν
będzie stałą i
odpowiednio R
µνρσ
będzie zerem. I odwrotnie jeśli R
µνρσ
będzie zerem to można pokazać, że przestrzeń jest
płaska. Wektor A
µ
zaczepiony w punkcie x przeniesiemy za pomocą przesunięcia równoległego w punkt x + dx.
Zatem przenieśliśmy go do punktu x + dx +
δ
x.
Jeśli R
µνρσ
- jest zerem, to przy przemieszczeniu A
µ
z x - punktu początkowego w punkt x +
δ
x , a zatem w
punkt : x + dx +
δ
x, rezultat powinien być identyczny. W takim razie przy przemieszczeniu wektora z jednego
punktu do drugiego rezultat nie zależy od trajektorii przemieszczenia.
Przemieszczając za pomocą przesunięcia równoległego wektor początkowy A
µ
z punktu x do wszystkich
możliwych punktów otrzymujemy pole wektorowe spełniające warunek A
µ
:
ν
= 0 tj.
A
µ
,
ν
=
Γσµν
A
σ
(12.1)
Czy możliwe jest przedstawienie takiego pola wektorowego w formie gradientu pewnego skalara ?
Podstawmy w (12.1) A
µ
= S,
µ
Otrzymamy:
S,
µν
=
Γσµν
S,
σ
(12.2)
W skutek symetrii
Γσµν
względem dolnych indeksów, wyrażenia dla S,
µν
i S,
νµ
są jednakowe i równanie
(12.2) jest całkowalne. Wybierzmy cztery niezależne skalary, spełniające (12.2) - w charakterze współrzędnych
x
α
’, nowego układu współrzędnych.
Wtedy :
x
α
’
,
µν
=
Γσµν
x
α
’
,
σ
Zgodnie z prawem transformacyjnym (3.7)
g
µλ
= g
α
’
β
’ x
α
’
,
µ
x
β
’
,
λ
Różniczkując tą zależność po x
ν
znajdujemy uwzględniając (7.6)
g
µλ
,
ν
−
g
α
’
β
’ ,
ν
x
α
’
,
µ
x
β
’
,
λ
= g
α
’
β
’ ( x
α
’
,
µν
x
β
’
,
λ
+ x
α
’
,
µ
x
β
’
,
λν
) =
= g
α
’
β
’ (
Γσµν
x
α
’
,
σ
x
β
’
,
λ
+ x
α
’
,
µ
Γσλν
x
β
’
,
σ
) = g
σλ
Γσµν
+ g
µσ
Γσλν
=
Γλµν
+
Γµλν
= g
µλ
,
ν
17
następnie :
g
α
’
β
’ ,
ν
x
α
’
,
µ
x
β
’
,
λ
= 0
To znaczy, że :
g
α
’
β
’ ,
ν
= 0.
W nowym układzie współrzędnych tensor metryczny jest stały.
W takim razie mamy do czynienia z przestrzenią płaską w prostoliniowym układzie współrzędnych.
13) Tożsamości Bianchi
Zanim rozpatrzymy drugą pochodną kowariantną dowolnego tensora , rozpatrzmy tensor będący iloczynem
skalarnym (iloczynem zewnętrznym – przypis własny) dowolnych wektorów A
µ
i B
τ
:
(A
µ
B
τ
):
ρ
:
σ
= (A
µ
:
ρ
B
τ
+ A
µ
B
τ
:
ρ
) :
σ
= A
µ
:
ρ
:
σ
B
τ
+ A
µ
:
ρ
B
τ
:
ρ
+ A
µ
:
σ
B
τ
:
ρ
+ A
µ
B
τ
:
ρ
:
σ
Teraz zamienimy miejscami
ρ
i
σ
i odejmiemy otrzymaną równość od poprzedniej.
Z udziałem (11.2) daje to :
(A
µ
B
τ
):
ρ
:
σ
- (A
µ
B
τ
) :
σ
:
ρ
= A
α
R
αµρσ
B
τ
+ A
µ
R
ατρσ
B
α
Dowolny tensor T
µτ
można wyrazić jako sumę członów typu A
µ
B
τ
, wtedy powinien on spełniać równość :
T
µτ
:
ρ
:
σ
−
T
µτ
:
σ
ρ
= T
ατ
R
αµρσ
+ T
µα
R
ατρσ
(13.1)
Niech T
µτ
będzie kowariantną pochodną wektora A
µ
:
τ
, wtedy :
A
µτ
:
ρ
:
σ
−
A
µτ
:
σ
:
ρ
= A
α
:
τ
R
αµρσ
+ A
µ
:
α
R
ατρσ
Przestawmy cyklicznie indeksy
τ
,
ρ
,
σ
i dodajmy otrzymane trzy równości.
Z lewej części mamy :
A
µ
:
ρ
:
σ
:
τ
- A
µ
:
σ
:
ρ
:
τ
+ cykliczne przestawienie = (A
α
R
αµρσ
) :
τ
+ cykliczne przestawienie =
= A
α
:
τ
R
αµρσ
+ A
α
R
αµρσ
:
τ
+ cykliczne przestawienie. (13.2)
Prawa część daje :
A
α
:
τ
R
αµρσ
+ cykliczne przestawienie. (13.3)
ponieważ ostatnie człony skracają się (zobacz równość (11.5))
Pierwsze człony w (13.2) i (13.3) skracają się i zostaje :
A
α
R
αµρσ
:
τ
+ cykliczne przestawienie. = 0
Czynnik A
α
jest obecny we wszystkich członach tego równania i może być odrzucony. W rezultacie mamy:
R
αµρσ
:
τ
+ R
αµστ
:
ρ
+ R
αµτρ
:
σ
= 0 (13.4)
Jako dopełnienie warunku symetrii z rozdziału 11 tensor krzywizny powinien spełniać te równania różniczkowe
Te równania znane są pod nazwą – „tożsamości Bianchi”
14) Tensor Ricciego
Zawęźmy R
µνρσ
względem dwóch indeksów. Jeśli zawężenie przeprowadzono względem indeksów dla
których przestawienie sprawia, że R
µνρσ
jest antysymetryczne to jak się rozumie rezultatem będzie zero.
Jeśli natomiast zawężać R
µνρσ
po innych parach indeksów to otrzymamy rezultaty różniące się jeden od
drugiego tylko znakiem. Wynika to z własności symetrii (11.4), (11.7), (11.8).
Przeprowadzimy zawężanie względem pierwszego i ostatniego indeksu.
Otrzymamy :
R
µνρµ
= R
µρ
Tensor ten nazywamy tensorem Ricciego. Mnożąc (11.8) przez g
µσ
znajdujemy, że :
R
νρ
= R
ρν
(14.1)
tj. symetryczny tensor Ricciego.
18
Można zawęzić R
νρ
względem ostatnich dwóch indeksów i przedstawić w postaci :
g
νρ
R
νρ
= R
νν
= R
Wielkość R – jest skalarem, który nazywa się krzywizną skalarną. Jest ona określona w ten sposób, że dla sfery
w przestrzeni trójwymiarowej jest dodatnia, w czym można się upewnić bezpośrednim rachunkiem. Tożsamości
Bianchi (13.4) zawierają pięć indeksów. Zawęźmy je dwukrotnie i otrzymamy zależność z jednym swobodnym
indeksem. Wprowadźmy w (13.4)
τ
=
α
i pomnóżmy przez g
µσ
:
g
µσ
(R
αµρσ
:
α
+ R
αµστ
:
ρ
+ R
αµτρ
:
σ
) = 0 tj.
(g
µσ
R
αµρσ
):
α
+ (g
µσ
R
αµσα
):
ρ
+ (g
µσ
R
αµαρ
):
σ
= 0 (14.2)
i dalej :
g
µσ
R
αµρσ
= g
µσ
g
αβ
R
βµρσ
= g
µρ
g
αβ
R
µβσρ
= g
αβ
R
βσ
= R
ασ
W skutek symetrii R
ασ
można pisać indeksy jeden pod drugim tj. R
ασ
. Wtedy równanie (14.2) przybiera
postać:
R
ασ
:
α
+ (g
µσ
R
µσ
):
ρ
- R:
σ
= 0
lub
2R
ασ
:
α
- R:
σ
= 0
co przedstawia sobą tożsamości Bianchi dla tensora Ricciego. Podnosząc indeks
σ
, możemy zapisać
[R
ασ
−
½ g
σα
R]:
α
= 0 (14.3)
Wyrażenie dla tensora Ricciego, zgodnie z (11.3) w formie jawnej wygląda następująco:
R
µν
=
Γαµα
,
ν
−
Γαµν
,
α
−
Γαµν
Γβαβ
+
Γαµβ
Γβνβ
(14.4)
Pierwszy człon na pierwszy rzut oka wygląda na nie symetryczny względem
µ
i
ν
jednak tak jak ostatnie trzy
jest on symetryczny. Dowód tego faktu wymaga pewnego omówienia .
Aby zróżniczkować wyznacznik g konieczne jest zróżniczkowanie w nim każdego elementu g
λµ
i pomnożenie
go przez dopełnienie algebraiczne g g
λµ
W takim razie :
g,
ν
= g g
λµ
g
λµ
,
ν
(14.5)
Następnie :
Γµνµ
= g
λµ
Γλνα
= 1/2g
λµ
( g
λν
,
µ
+g
λµ
,
ν
−
g
µν
,
λ
) = 1/2g
λµ
g
λµ
,
ν
= 1/2g -1 g ,
ν
= ½ ln(g ),
ν
(14.6)
Stąd wynika, że pierwszy człon w (14.4) jest symetryczny względem
µ
. i
ν
.
15) Prawo grawitacji Einsteina
Do tej pory zawartość książki nosiła czysto matematyczny charakter za wyjątkiem fizycznej uwagi, że
trajektoria cząstki jest geodezyjną. Wiele rezultatów wyłożonych w poprzednich rozdziałach było otrzymanych
w zeszłym (tj. XIX wieku – przypis własny) wieku i odnosiło się do przestrzeni zakrzywionej dowolnej liczby
wymiarów. W przedstawionym formaliźmie liczba wymiarów przestrzeni figuruje tylko o tyle o ile :
g
µµ
= liczba wymiarów
Einstein założył, że w pustej przestrzeni :
R
µν
= 0 (15.1)
W tym zawarte jest prawo grawitacji Einsteina. „Pusta” tutaj oznacza nieobecność materii i brak jakichkolwiek
pól fizycznych za wyjątkiem samego pola grawitacyjnego. Obecność pola grawitacyjnego nie narusza pustki.
Warunek pustej przestrzeni jest z dobrą dokładnością spełniony dla przestrzeni międzyplanetarnej w systemie
Słonecznym i tam można stosować równanie (15.1).
19
Pusta przestrzeń oczywiście spełnia wyrażenie (15.1). Geodezyjne w pustej przestrzeni są liniami prostymi w
takim razie cząstki poruszają się po liniach prostych. W przypadku pustej zakrzywionej przestrzeni prawo
Einsteina nakłada ograniczenia na wartość krzywizny. Wraz z założeniem, że planety poruszają się po
geodezyjnych daje to pewną informację dotyczącą ich ruchu.
Na pierwszy rzut oka Einsteinowskie prawo grawitacji nie ma nic wspólnego z prawem Newtona. Aby jednak
zauważyć analogię należy rozpatrzyć g
µν
jako potencjały opisujące pole grawitacyjne. W odróżnieniu od
jednego Newtonowskiego potencjału w teorii Einsteina jest ich dziesięć. Potencjały te opisują nie tylko pole
grawitacyjne ale również układ współrzędnych. Pole grawitacyjne i układ współrzędnych w teorii Einsteina są
związane nie rozerwalnie i nie udaje się opisać jednego bez drugiego.
Przy rozpatrywaniu składowych g
µν
jako potencjałów równanie (15.1) okazuje się być równaniem pola i
wygląda jak zwykłe równanie w tym sensie, że jest ono równaniem drugiego rzędu, ponieważ drugie pochodne
wchodzą w (14.1) przez symbole Christoffela. Równanie (15.1) odróżnia się jednak od zwykłych równań pola
tym, że jest ono nieliniowe – istotnie nieliniowe. Równania Einsteina są nadzwyczaj złożone i znalezienie ich
dokładnych rozwiązań jest trudne.
16) Przybliżenie Newtonowskie
Rozpatrzymy statyczne pole grawitacyjne w statycznym układzie współrzędnych.
W takim przypadku g
µν
jest stałe w czasie tj. g
µν
0 = 0.
Dalej dla m= 1,2,3 powinno być spełniony warunek :
gm0 = 0
Odpowiednio mamy :
gm0 = 0 ; g00 = (g00 )
-1
i gmn jest macierzą odwrotną względem gmn.
Indeksy łacińskie zawsze przebiegają wartości 1,2,3 .
Stąd znajdujemy, że
Γ
m0n = 0 i stąd również :
Γ
m
0n = 0.
Rozpatrzymy cząstkę poruszającą się z prędkością małą w porównaniu z prędkością światła
Wtedy vm jest małą pierwszego rzędu. Zaniedbując wielkości drugiego rzędu otrzymujemy :
g00(v
0)2 = 1 (16.1)
Cząstka porusza się po geodezyjnej. Równanie geodezyjnej (8.3) z dokładnością do członów pierwszego rzędu
daje :
dvm/ds =
−
Γ
m
00 (v
0)2 =
−
gmn
Γ
m
n00 (v
0)2 = ½ gmn g
00,n (v
0)2
Z dokładnością do członów pierwszego rzędu otrzymamy :
dvm/ds = (dvm/dx
µ
)(dx
µ
/ds ) = ( dvm/dx0)v0
Wtedy z udziałem (16.1) zapisujemy :
dvm/dx0 = ½ gmn g00,n (v
0)2 = gmn (g
00 )
½
, n (16.2)
Ponieważ g
µν
nie zależy od x
0 można opuścić indeks m, co daje zależność :
dvm/dx
0 = (g
00 )
½
, m (16.3)
Widać, że cząstka porusza się tak jak gdyby znajdowała się pod działaniem potencjału (g00 )
½
Przy otrzymaniu tego wyniku nie wykorzystywaliśmy w żaden sposób równań Einsteina.
Teraz dla porównania teorii Einsteina z Newtonowską uwzględnimy prawo Einsteina dochodząc do określenia
równań dla potencjału.
Założymy, że pole grawitacyjne jest polem słabym tak że krzywizna czasoprzestrzeni jest mała. Wtedy można
wybrać układ odniesienia dla którego krzywizna osi współrzędnych (dla każdej z osi trzy ustalone
współrzędne) jest mała. W tym przypadku g
µν
w pierwszym przybliżeniu jest stałe, a g
µν
,
σ
i wszystkie
symbole Christoffela są niewielkie. Równanie Einsteina (15.1) z dokładnością do członów pierwszego rzędu
przyjmuje postać (zobacz (14.4))
Γαµα
,
ν
−
Γαµν
,
α
= 0
20
Zawężając i przestawiając (11.6) względem dwóch indeksów
ρ
i
µ
, oraz odrzucając człony drugiego rzędu
można przekształcić to równanie, do nieco dogodniejszej postaci :
g
ρσ
( g
ρσ
,
µν
−
g
νσ
,
µρ
−
g
µρ
,
νσ
+ g
µν
,
ρσ
) = 0 (16.4)
Wstawmy teraz
µ
=
ν
= 0, oraz wykorzystajmy własność niezależności g
µν
od x0, otrzymamy :
gmn g00, mn = 0 (16.5)
Równanie d’Alamberta (10.9) w przybliżeniu słabego pola przyjmuje postać :
g
µν
V
,
µν
= 0
W statycznym przypadku to wyrażenie przybiera postać równania Laplace'a :
gmn V, mn = 0
Równanie (16.5) oznacza, że g00 spełnia równanie Laplace'a.
Można wybrać jednostki pomiaru czasu tak aby g00 mało różniło się od jedności.
Wtedy możemy założyć :
g00 = 1 + 2V (16.6)
gdzie V – jest niewielkie.
W tym przypadku (g00 )
½ = 1 + V i V jest potencjałem.
Ponieważ V spełnia równanie Laplace'a można go utożsamić z potencjałem newtonowskim, równym – m/r
gdzie m - masa źródła.
Teraz widać, że (16.2) prowadzi do równości :
przyspieszenie =
−
grad V
Ponieważ diagonalne elementy gmn
≅
−
1. To znaczy, że znak przy V był wybrany prawidłowo.
W takim razie prawo Einsteina przechodzi w prawo Newtona , kiedy pole jest słabe i statyczne.
Odpowiednio rezultaty teorii newtonowskiej objaśniające ruchy planet pozostają w mocy.
Przybliżenie statyczności opiera się na fakcie małej w porównaniu z prędkością światła, prędkością ruchu planet
Przybliżenie słabego pola jest dobre ponieważ, przestrzeń niewiele różni się od przestrzeni płaskiej.
Rozpatrzmy skalę niektórych wielkości.
Wartość potencjału V na powierzchni Ziemi jest rzędu 10 –9. W takim razie g00 z wzoru (16.6), jest zbliżone do
jedności. No jednak i to małe odchylenie g00 od jedności prowadzi do znacznych efektów grawitacyjnych
obserwowanych na Ziemi. Jeżeli weźmiemy promień Ziemi rzędu 10 9 cm, to wartość g00,m będzie rzędu
10 –18 [1/cm].
I odpowiednio odchylenie przestrzeni od płaszczyzny będzie skrajnie małe. Jednak aby otrzymać przyspieszenie
w polu grawitacyjnym w pobliżu Ziemi należy pomnożyć to odchylenie przez kwadrat prędkości światła, tj.
przez 9* 10 20 [cm/sek ] 2. Dlatego przyspieszenie (około 10 3 [cm/sek] ) jest odczuwalne, chociaż samo
odchylenie od „płaszczyzny” jest nieskończenie małe, dla tego aby go było można obserwować bezpośrednio.
21
17) Grawitacyjne przesunięcie ku czerwieni
Rozpatrzmy monochromatyczne promieniowanie atomu w stanie spoczynku znajdującego się w statycznym polu
grawitacyjnym. Długość fali światła wypromieniowanego odpowiada określonej wartości
∆
s.
Ponieważ atom jest w stanie spoczynku w statycznym układzie współrzędnych takich jak rozpatrywano w
rozdziale 16 otrzymamy :
∆
s2 = g00 (
∆
x0)2
gdzie
∆
x0 – okres tj. czas między sąsiednimi maksymalnymi amplitudami odniesiony do wybranego układu
współrzędnych.
Przy rozprzestrzenianiu się światła w inną część przestrzeni
∆
x0 się nie zmienia. Wielkość :
∆
x0 – nie jest tym
samym co okres pewnej linii widmowej atomu , znajdującej się w danym punkcie. Taką rolę spełnia
∆
s .
W takim wypadku okres zależy od potencjału grawitacyjnego g00 w tym punkcie gdzie światło było
wypromieniowane:
∆
x0
∼
( g00 )
– ½
Czynnik ( g00 )
– ½ opisuje przesunięcie linii widmowej.
W przybliżeniu newtonowskim (16.6) otrzymamy :
∆
x0
∼
1
−
V
Wartość V jest ujemna w obszarze silnego pola grawitacyjnego na przykład na powierzchni Słońca.
Dlatego światło wypromieniowane na Słońcu ma widmo przesunięte w porównaniu z światłem
wypromieniowanym na Ziemi, w kierunku czerwonej części widma. Ten efekt można było by obserwować dla
światła Słonecznego jeśli by on nie gubił się w efekcie innych mechanizmów fizycznych takich jak efekt
Dopplera wynikający z ruchu promieniujących atomów. Grawitacyjne przesunięcie ku czerwieni jest większe dla
światła białych karłów, gdzie w wyniku wysokiej gęstości materii potencjał grawitacyjny na powierzchni
gwiazdy jest o wiele większy.
18) Rozwiązanie Schwarzschilda
Równania Einsteina dla pustej przestrzeni przedstawiają sobą nadzwyczaj złożone nieliniowe równania, a
znalezienie ich dokładnych rozwiązań jest trudnym zadaniem. Jednak w jednym specjalnym przypadku
rozwiązanie znajdujemy bez większych trudności – jest to przypadek statycznego, sferycznie symetrycznego
pola związanego ze statycznym, sferycznie symetrycznym ciałem.
Warunek statyczności oznacza, że w statycznym układzie współrzędnych g00 nie zależy od czasu x
0 lub t, i
oprócz tego g0m = 0.
W charakterze statycznego układu współrzędnych można wybrać współrzędne sferyczne
x1 = r , x2 =
θ
, x3 =
ϕ
.
Najbardziej ogólne wyrażenie dla ds2 w przypadku symetrii sferycznej ma postać :
ds2 = Uds2
−
Vdr2
−
Wdr2 (d
θ
2 + sin2
θ
d
ϕ
2)
gdzie U, V, W zależą tylko od r.
Nienaruszając symetrii sferycznej można zamienić r na dowolną funkcje zależną od r.
Wykorzystamy tą okoliczność dla maksymalnego uproszczenia wyrażenia na ds2.
Dogodnie będzie sprowadzić mnożnik W do jedności. Wtedy ds2 można zapisać następująco :
ds2 = exp(2
ν
)dt2 – exp(2
λ
)dr2
−
r2d
θ
2
−
r2sin2
θ
d
ϕ
2 (18.1)
gdzie
ν
.
λ
zależą tylko od r.
Funkcje
ν
,
λ
powinny być wybrane tak aby spełniać równania Einsteina.
Za pomocą (18.1) można wyrazić g
µν
przez
ν
i
λ
:
g00 = exp(2
ν
); g11 =
−
exp(2
λ
);
g22 =
−
r2 ; g33 =
−
r2sin2
θ
;
g
µν
= 0 dla
µ
≠
ν
22
Dalej znajdujemy :
g00 = exp(-2
ν
); g11 =
−
exp(-2
λ
);
g22 =
−
r
−
2 ; g33 =
−
r
−
2 sin
−
2
θ
;
g
µν
= 0 dla
µ
≠
ν
Teraz należy wyrazić przez
ν
i
λ
wszystkie symbole Christoffela.
Wiele z nich będzie w takim przypadku zerowymi, a pozostałe przyjmą postać :
Γ
1
00 =
ν
’exp(2
ν
- 2
λ
);
Γ
0
10 =
ν
’;
Γ
1
11 =
λ
’ ;
Γ
2
12 =
Γ
3
13 = r
−
1 ;
Γ
1
22 =
−
r exp(
−
2
λ
) ;
Γ
3
23 = ctg (
θ
);
Γ
1
33 =
−
r sin2
θ
exp(
−
2
λ
) ;
Γ
2
33 =
−
sin
θ
cos
θ
;
gdzie apostrof oznacza różniczkowanie po r.
Wyrażenia te należy podstawić do (14.4). W rezultacie otrzymamy
R00 = (-
ν
’’ +
λ
’
ν
’
−
ν
’2
−
2
ν
’/r ) exp(2
ν
−
2
λ
) (18.2)
R11 =
ν
’’
−
λ
’
ν
’ +
ν
’2
−
2
λ
’/r ) exp(2
ν
-2
λ
) (18.3)
R22 = ( 1 + r
ν
’
−
r
λ
’ ) exp(
−
2
λ
)
−
1 (18.4)
R33 = R22 sin
2
θ
;
(ostatnie składniki R
µν
w tym przypadku są tożsamościowo równe zeru)
Zgodnie z prawem grawitacji Einsteina konieczne jest aby te wyrażenia były zerem.
Zerowanie się (18.2) i (18.3) daje :
λ
’ +
ν
’ = 0
Przy wielkich wartościach r przestrzeń powinna być zbliżona do płaskiej, tak by przy r dążącym do
nieskończoności,
λ
,
ν
dążyły do zera
Odpowiednio otrzymamy :
λ
+
ν
= 0
Z faktu zerowania się (18.4) wnioskujemy, że :
(1+ 2r
ν
’) exp(2
ν
) = 1
lub
[ r exp(2
ν
)]’ = 1
Stąd :
r exp(2
ν
) = r – 2m;
gdzie m – jest stałą całkowania.
Podstawiając ostatnią równość do (18.2) i (18.3) powoduje, że stają się one zerami.
Z tych wyrażeń otrzymujemy wyrażenie dla g00 :
g00 = 1
−
2m/r (18.5)
Dla wielkich wartości r powinno być słuszne Newtonowskie przybliżenie.
Porównanie (18.5) z (16.6) pokazuje że stała całkowania m, która pojawiła się w (18.5) jest niczym innym jak
masą ciała będącego źródłem pola grawitacyjnego. Pełne rozwiązanie równań Einsteina ma postać :
ds2 = (1
−
2m/r)dt2 – (1
−
2m/r)
−
1dr2
−
r2d
θ
2
−
r2sin2
θ
d
ϕ
2 (18.6)
Jest ono znane jako rozwiązanie Schwarzschilda i stosuje się je poza ciałem zadającym pole grawitacyjne
tj. w obszarze gdzie nie ma materii. W takim razie to równanie jest słuszne w przybliżeniu poza powierzchnią
gwiazdy. Dla ruchu planet wokół Słońca rozwiązanie (18.6) daje małe poprawki do teorii Newtonowskiej.
Są one jednak istotne tylko dla Merkurego – najbliższej planety Słonecznej – i objaśniają odchylenie trajektorii
tej planety od trajektorii obliczonej za pomocą teorii Newtona. Ten fakt stał się faktem potwierdzającym
słuszność teorii Einsteina.
23
19) Czarne dziury
Przy r = 2m rozwiązanie (18.6) jest osobliwe, ponieważ dla tego punktu mamy g00 = 0 i g11 =
−∞
.
Można pokazać, że r = 2m jest minimalnym możliwym promieniem ciała o masie m.
Jednak bliższe rozpatrzenie pokazuje, że sprawa wygląda nieco inaczej. Rozpatrzmy cząstkę spadającą na ciało
centralne. Niech jej wektor prędkości jest v
µ
= dz
µ
/ds. Załóżmy, że cząstka spada po promieniu tak, że jest
v2 = v3 = 0.
Jej ruch określony jest równaniem geodezyjnej (8.3) :
dv0 / ds =
−
Γ
0
µν
v
µ
v
ν
= g00
Γ
0
µν
v
µ
v
ν
=
−
g00 g00,1 v
0 v1 =
−
g00 (g00 /ds) v
0
Uwzględniając, że g00 = 1/g00 otrzymujemy :
g00 dv
0/ds + (d g
00 /ds )v
0 = 0
scałkowanie tego równania daje wyrażenie :
g00 v
0 = k
gdzie k – stała całkowania, która równa jest wielkości g00 w początkowym punkcie trajektorii cząstki.
W rozpatrywanym przypadku otrzymamy jak i przedtem
1 = g
µν
v
µ
v
ν
= g00 (v
0)2 + g
11 (v
1)2
Mnożąc to równanie przez g00 oraz wykorzystując zależność g00 g11 =
−
1 otrzymane w poprzednim rozdziale,
znajdujemy :
k2
−
(v1)2 = g00 = 1 – 2m/r
Dla spadającego ciała v1 < 0 i odpowiednio
v1 =
−
(k2 – 1 + 2m/r)1/2
Tak więc
dt/dr = v0/v1 =
−
k (1
−
2m/r)
−
1 (k2 – 1 + 2m/r)½
Niech cząstka znajduje się w pobliżu promienia krytycznego tj. r = 2m +
ε
, gdzie wielkość
ε
jest odpowiednio
mała, tak że człony
ε
2 można odrzucić.
Wtedy :
dt/dr =
−
2m/
ε
=
−
2m/(r
−
2m)
Całkując to wyrażenie otrzymujemy :
t =
−
2m [ln(r
−
2m )] + const.
W takim razie przy t dążącym do 2m, t dąży do nieskończoności tj. dla aby cząstka mogła osiągnąć promień
krytyczny 2m potrzebuje nieskończenie wiele czasu.
Załóżmy, że daleki obserwator obserwuje cząstką wykorzystując światło o określonej częstotliwości.
Światło to doznaje przesunięcia grawitacyjnego ku czerwieni opisywanego czynnikiem
g00
−
½ = (1
−
2m /r )
−
½
Przy osiąganiu przez cząstkę promienia krytycznego ten czynnik dąży do nieskończoności.
Z punktu widzenia dalekiego obserwatora wszystkie procesy fizyczne w cząstce w miarę jak zbliża się ona do
promienia krytycznego r = 2m przebiegają coraz wolniej i wolniej.
Rozpatrzmy teraz obserwatora poruszającego się razem z cząstką . Dla niego przyrost czasu jest tożsamy z ds.
W takim razie :
ds/dr = 1/v1 =
−
(k2 – 1 + 2m/r) ½
Przy r dążącym do 2m wielkość ds/dr dąży do k –1.
Tak więc osiągnięcie przez cząstkę promienia r = 2m zachodzi w skończonym czasie własnym obserwatora.
Jeżeli moment osiągnięcia promienia krytycznego przez obserwatora jest skończony to co będzie działo się z
nim dalej ?
24
Wyraźnie, obserwator będzie swobodnie spadał w pustej przestrzeni poruszając się w stronę coraz mniejszych
wartości promienia r.
Dla tego aby rozpatrzyć przedłużenie rozwiązania Schwarzschilda dla obszarów r < 2m należy wprowadzić
niestatyczny układ współrzędnych g
µν
w tym wypadku będący funkcją współrzędnej czasowej.
Zostawimy tak jak poprzednio współrzędne
θ
i
ϕ
, a w miejsce t i r wprowadzimy
τ
i
ρ
określone wyrażeniami :
τ
= t + f(r) ;
ρ
= t + g(r) (19.1)
gdzie f i g –dowolne funkcje.
Wtedy słuszna będzie następująca równość :
d
τ
2 – 2m/r d
ρ
2 = (dt + f’ dr)2 – 2m/r (dt + g’ dr)2 = (1 – 2m/r)dt2 + 2 (f’ – 2m/r g’)dt dr + (f ’2 – 2m/r g’2 )dr2
= (1 – 2m/r)dt2
−
(1 – 2m/r)
−
1 dr2 (19.2)
Równość tą uzyskujemy wprowadzając funkcje f i g które spełniają warunki :
f’ = (2m/r)g’ (19.3)
(2m/r)g’ – f ’2 = (1 – 2m/r)
−
1 (19.4)
Tutaj apostrof oznacza pochodną po r. Rugując z tych równości f, otrzymujemy :
G’ = (r/2m)1/2 (1 – 2m/r)
−
1 (19.5)
Aby scałkować równanie (19.5) wstawmy r = y2 oraz 2m = a2.
Przy r > 2m będzie zachodzić y > a.
Otrzymujemy :
dg /dy = 2ydg /dr = (2 y4 /a) / ( y2
−
a2 )
skąd otrzymamy :
g = (2/3)a y3 + 2ay
−
a2 ln [(y + a) / (y
−
a)] (19.6)
W rezultacie z (19.3) i (19.5) otrzymamy :
g’ – f ’ = (1
−
2m/r)g’ = (r /2m)½
Scałkowanie daje rezultat :
(2/3) (1/ sqrt (2m)) r3/2 = g – f =
ρ
−
τ
(19.7)
W takim razie
r =
µ
(
ρ
−
τ
)2/3 (19.8)
gdzie
µ
= [(3/2)
√
2m]2/3
Z powyższego wynika, że warunki (19.3) i (19.4) można spełnić.
A to znaczy, że słuszne jest równanie (19.2)
Podstawiając (19.2) do rozwiązania Schwarzschilda (18.6) otrzymujemy :
ds2 = d
τ
2 – 2m / [
µ
(
ρ
−
τ
)2/3 ] d
ϕ
2
−
µ
(
ρ
−
τ
)4/3 (d
ϕ
2 + sin2
θ
d
ϕ
2 ) (19.9)
Promień krytyczny r = 2m zgodnie z (19.7) odpowiada :
ρ
−
τ
= 4m/3.
W metryce (19.9) osobliwość się nie pojawia. Ponieważ metrykę (19.9) można jawnie przekształcić w
rozwiązanie Schwarzschilda przy pomocy przekształcenia współrzędnych jest ona rozwiązaniem równań
Einsteina dla pustej przestrzeni w obszarze r > 2m.
Z faktu nie pojawiania się osobliwości przy r = 2m, oraz z faktu analitycznej ciągłości wnioskujemy, że (19.9)
spełnia równania Einsteina również przy r <= 2m.
Metryka (19.9) jest słuszna aż do punktu r = 0 lub
ρ
−
τ
= 0
Osobliwość pojawia się przy przejściu od nowych współrzędnych do wejściowych (19.1).
Wprowadźmy więc te nowe współrzędne a osobliwość więcej się nie pojawi.
Widać, że rozwiązanie Schwarzschilda dla pustej przestrzeni zostało przedłużone dla obszarów r < 2m .
Jednak ten obszar jest odseparowany od obszaru r > 2m .
Jak nie trudno sprawdzić dany sygnał, nawet świetlny, potrzebuje nieskończonego czasu aby przejść granicę
r = 2m .
W takim razie obszar r < 2m nie jest dostępny bezpośrednio obserwatorowi zewnętrznemu.
25
Ten obszar nazywamy „czarną dziurą” ponieważ materialne ciała mogą wpaść do wnętrza sfery o promieniu
r = 2m (w nieskończonym czasie dla obserwatora zewnętrznego) jednak nic nie może wyjść na zewnątrz.
Pojawia się pytanie, czy istnieje taki obszar w rzeczywistości ?
Odpowiadając można tylko wskazać, że równania Einsteina taką możliwość dopuszczają (obecnie czarne dziury
można obserwować pośrednio – przypis własny).
Masywne gwiazdy mogą zostać ściśnięte do niewielkich rozmiarów, w tym przypadku siły grawitacji są tak
silne, że żadna ze znanych sił fizycznych nie może ich zrównoważyć i tym samym następuje dalsze ściśnięcie
(kolaps – przypis własny ).
Wygląda na to, że ściśnięcie takiego obiektu powinno prowadzić do pojawienia się czarnej dziury.
Dla oddalonego obserwatora proces ściśnięcia (kolapsu) będzie przebiegał w czasie nieskończonym lecz dla
obserwatora związanego z kolapsującą materią czas ten będzie skończony.
20) Gęstości tensorowe
Element czterowymiarowej objętości przy przekształceniu współrzędnych przekształca się według zasady :
dx0’dx1’dx2’ dx3’ = dx0dx1dx2dx3J (20.1)
gdzie J - jakobian ;
J =
∂
( dx0’dx1’dx2’ dx3’ ) /
∂
(dx0dx1dx2dx3) = det x
µ
’,
α
Dla skrócenia zapiszemy (20.1) w formie :
d4x’ = J d4x (20.2)
Przyjmijmy, że :
g
αβ
= x
µ
’,
α
g
µ
’
ν
’x
ν
’,
β
Prawą część tego wyrażenia można rozpatrywać jako iloczyn trzech macierzy w pierwszej macierzy indeks
α
oznacza wiersze,
µ
‘ – kolumny, w drugiej macierzy indeks
µ
’ oznacza wiersze, indeks
ν
’ – kolumny,
w trzeciej macierzy indeks
ν
’ oznacza wiersze, indeks
β
kolumny.
Ten iloczyn jest równy macierzy g
αβ
z lewej części równości.
Odpowiednia zależność powinna mieć miejsce również dla wyznaczników dlatego :
g = Jg’J lub g = J2g’
Dalej, jeżeli g okaże się ujemnie określoną wielkością można ją wyrazić w formie
√−
g, gdzie wyrażenie pod
pierwiastkiem jest dodatnio określone.
W takim razie :
√−
g = J
√−
g’ (20.3)
Niech S będzie pewnym polem skalarnym.
Dla niego S = S’. Wtedy :
∫ S
√−
g d4x = ∫ S
√−
g’ Jd4x = ∫ S’
√−
g’ d4x’
przy założeniu, że obszar całkowania we współrzędnych x’ odpowiada obszarowi całkowania we
współrzędnych x.
Odpowiednio otrzymamy :
∫ S
√−
g d4x = inwariant (20.4)
Wielkość : S
√−
g, której całka jest inwariantem, nazywamy – gęstością skalarną.
Analogicznie dla danego pola tensorowego T
µν
.... wielkość T
µν
....
√−
można nazwać gęstością tensorową.
Kiedy obszar całkowania jest mały ∫T
µν
....
√−
g d4x jest tensorem.
Kiedy obszar całkowania nie jest mały, to ta całka nie będzie tensorem ponieważ przedstawia on sumę tensorów
zadanych w różnych punktach i nie przekształca się zgodnie z jakimkolwiek prostym prawem przy
przekształceniu współrzędnych.
Wielkość:
√−
g , dalej będzie wykorzystywana bardzo często.
26
Ponieważ :
g
−
1g ,
ν
= 2 [
√−
g ]
−
1
√−
g ,
ν
’
to wzór (14.5) daje :
√−
g ,
ν
’ = ½
√−
g g
λµ
g
λµ
,
ν
’ (20.5)
zatem wzór (14.6) można zapisać w postaci :
Γµνµ
√−
g =
√−
g ,
ν
(20.6)
21) Twierdzenie Gaussa i Stokesa
Kowariantna dywergencja A
µ
:
µ
wektora A
µ
w jest skalarem.
Można ją zapisać w postaci :
A
µ
:
µ
= A
µ
,
µ
+
Γµνµ
A
ν
= A
µ
,
µ
+ [
√−
g ]-1 sqrt(.),
ν
A
ν
.
Stąd :
A
µ
:
µ
√−
g = ( A
µ
√−
g ),
µ
(21.1)
Podstawiając w charakterze S w (20.4) A
µ
:
µ
otrzymamy inwariant:
∫ A
µ
:
µ
√−
g d4x = ∫ ( A
µ
√−
g ),
µ
d4x
Jeśli całkę bierzemy po ograniczonej (czterowymiarowej) objętości, to prawą część można przekształcić
zgodnie z twierdzeniem Gaussa w całkę po (trójwymiarowej) granicznej powierzchni tej objętości.
Przy A
µ
:
µ
= 0 otrzymamy (A
µ
√−
g ),
µ
= 0 (21.2)
To prowadzi nas do prawa zachowania a dokładnie do prawa zachowania cieczy, której gęstość ma postać
A0
√−
g, a strumień zadany jest trójwymiarowym wektorem Am
√−
g (m = 1,2,3).
Można scałkować (21.2) względem trójwymiarowej objętości V, przy pewnym ustalonym x0.
W rezultacie otrzymamy:
( ∫ A0
√−
g d3x ), 0 =
−
∫ ( Am
√−
g ), m d
3x
tj. całkę powierzchniowa po granicy objętości V.
Jeśli nie będziemy uwzględniać strumieni przecinających granicę objętości V, to ∫ A0
√−
g d3x będzie stałą.
Tego rezultatu dla wektora A
µ
nie należy ogólnie mówiąc przenosić na tensory o większej liczbie indeksów.
Rozpatrzmy tensor z dwoma indeksami Y
µν
. W płaskiej przestrzeni wykorzystując twierdzenie Gaussa można
przekształcić ∫ Y
µν
,
ν
d4x w całkę powierzchniową, w przestrzeni czterowymiarowej w ogólnym przypadku
nie można przekształcić całki objętościowej ∫ Y
µν
,
ν
d4x , w powierzchniową.
Wyjątek stanowi antysymetryczny tensor : F
µν
=
−
F
νµ
.
W tym przypadku :
F
µν
:
σ
= F
µν
:
σ
+
Γµσρ
F
ρν
+
Γνσρ
F
µρ
Stąd z udziałem (20.6)
F
µν
:
ν
= F
µν
,
ν
+
Γµνρ
F
ρν
+
Γννρ
F
µρ
= F
µν
,
ν
+ sqrt(.) –1 sqrt(.),
ρ
F
µρ
Tak więc
F
µν
:
ν
√−
g = ( F
µν√−
g ),
ν
(21.3)
Odpowiednio, ∫ F
µν
:
ν
√−
g d4x , równe jest całce powierzchniowej i przy warunku F
µν
:
ν
= 0 otrzymujemy
prawo zachowania.
27
Dla tensora symetrycznego Y
µν
= Y
νµ
, jeżeli opuścić jeden z indeksów i prowadzić obliczenia z Y
µν
:
ν
, to
można otrzymać odpowiednie równanie z dodatkowym członem :
Y
µν
:
ν
= Y
µν
,
ν
−
Γαµσ
Y
αν
+
Γνσα
Y
να
Podstawiając
σ
=
ν
oraz wykorzystując (20.6) otrzymamy :
Y
µν
:
ν
= Y
µν
,
ν
+ [
√−
g ] –1
√−
g,
α
Y
µα
Γαµν
Y
µν
Ponieważ Y
αν
jest symetryczny, to można z udziałem (7.6) zamienić
Γαµν
w ostatnim członie wielkością :
½ (
Γαµν
+
Γναµ
) = ½ g
αν
,
µ
W rezultacie można zapisać :
Y
µν
:
ν
√−
g = ( Y
µν
√−
g ),
ν
−
½ g
αβ
,
µ
Y
αβ
√−
g (21.4)
Dla wektora kowariantnego A
µ
mamy wyrażenie :
A
µ
:
ν
−
A
ν
:
µ
= A
µ
:
ν
−
Γρµν
A
ρ
−
( A
ν
:
µ
−
Γρνµ
A
ρ
) = A
µ
,
ν
−
A
ν
,
µ
(21.5)
Rezultat (21.5) można sformułować tak : kowariantna rotacja równa jest zwykłej rotacji.
To sformułowanie jest słuszne tylko dla wektora kowariantnego. Dla wektora kontrawariantnego zgodnie z
zasadą balansu indeksów, rotacji przedstawić nie można.
Podstawmy
µ
= 1,
ν
= 1. Wtedy otrzymamy :
A1: 2
−
A2: 1 = A1: 2
−
A2: 1
Scałkujmy tą równość względem pewnej powierzchni x0 = const. x3 = const.
Zgodnie z twierdzeniem Stokesa mamy :
∫ ∫ (A1: 2
−
A2: 1)dx
1dx2 = ∫ ∫ (A
1,2
−
A2,1)dx
1dx2 = ∫ (A
1dx
1 + A
2dx
2 ) (21.6)
gdzie ostatnia całka jest brana po granicy obszaru.
W takim razie otrzymana całka po konturze zamkniętym równa jest strumieniowi przez powierzchnię ,
ograniczoną tym konturem. Ten rezultat powinien być słuszny nie tylko w układzie współrzędnych w którym
równanie rozpatrywanej powierzchni dane jest x0 = const. x3 = const. ,ale również w przypadku ogólnym
tj. w dowolnym układzie współrzędnych.
Aby otrzymać inwariantny sposób zapisu tego rezultatu , wprowadzimy ogólne wyrażenie dla elementu
dwuwymiarowej powierzchni. Element powierzchni określony dwoma małymi wektorami kontrawariantnymi
ξµ
ζµ
, zadany jest tensorem antysymetrycznym drugiego rzędu :
dS
µν
=
ξµ
ζµ
−
ξν
ζµ
Jeśli
ξµ
i
ζµ
mają postać (0, dx1 ,0,0) i (0, 0, dx2, 0), to dwa składniki dS
µν
przyjmują następującą postać :
dS12 = dx1dx2 ; dS21 =
−
dx1dx2
a pozostałe składniki są zerowe. Lewa cześć (21.6) przyjmuje postać :
∫ A
µ
:
ν
dS
µν
; prawa część (21.6) jest oczywiście dana :
∫ A
µ
dx
µ
dlatego otrzymamy :
½ ∫ ∫ (A
µ
:
ν
−
A
ν
:
µ
) dS
µν
= ∫ A
µ
dx
µ
(21.7)
powierzchnia obwód
28
22) Współrzędne harmoniczne
Równanie a’Alemberta V = 0 dla pola skalarnego V z udziałem (10.9) daje :
g
µν
(V,
µν
−
Γαµν
V,
α
) = 0 (22.1)
W przestrzeni płaskiej w nie ortogonalnym układzie współrzędnych każda z czterech współrzędnych x
λ
czyni
zadość równaniu x
λ
= 0.
W (22.1) można więc w charakterze V podstawić x
λ
. W odróżnieniu od V x
λ
nie jest skalarem, tak więc
otrzymane równanie nie będzie tensorem tj. równanie to jest słuszne jedynie w określonych układach
współrzędnych.
Nakłada ono więc pewne ograniczenia na możliwe współrzędne.
Jeśli w charakterze V podstawimy x
λ
, to V należy zastąpić wielkością x
λ
,
α
= g
λα
Wtedy równanie (22.1) przyjmie postać :
g
µν
Γλµν
= 0 (22.2)
Współrzędne które czynią zadość temu warunkowi nazywamy „współrzędnymi harmonicznymi”.
Aproksymują one współrzędne nieortogonalne z maksymalną dokładnością jaka tylko jest możliwa w
zakrzywionej przestrzeni.
Współrzędne te można wykorzystywać w wielu sytuacjach, jednak bardzo często okazuje się to nie możliwe,
nie stanowią one więc tak dogodnego aparatu jak formalizm tensorowy w dowolnym układzie współrzędnych.
Przy rozpatrywaniu fal grawitacyjnych współrzędne harmoniczne okazują się jednak bardzo pożyteczne.
Z (7.9) i (7.6) otrzymamy w dowolnych współrzędnych :
g
µν
,
σ
=
−
g
µα
g
νβ
(
Γαβσ
+
Γβασ
) =
−
g
νβ
Γµβσ
−
g
µα
Γνασ
(22.3)
Stąd z udziałem (20.6) wynika równość :
( g
µν
√−
g ),
σ
= (
−
g
νβ
Γµβσ
−
g
µα
Γνασ
+ g
µν
Γβσβ
) (22.4)
Zawężając ją względem dwóch indeksów (zakładamy
σ
=
ν
) otrzymujemy :
( g
µν
√−
g ),
ν
=
−
g
νβ
Γµβν
√−
g (22.5)
Widać, że alternatywna forma zapisu warunku harmoniczności dana jest następująco :
( g
µν
√−
g ),
ν
= 0 (22.6)
23) Pole elektromagnetyczne
Równania Maxwella w zapisie standardowym mają postać :
E =
−
(1/c)
∂
A/
∂
t – grad
Φ
(23.1)
H = rot A (23.2)
(1/c)
∂
H/
∂
t =
−
rot E (23.3)
div H = 0 (23.4)
(1/c)
∂
E/
∂
t = rot H
−
4
π
j (23.5)
div E = 4
πρ
(23.6)
Na początku zapiszemy je w czterowymiarowej formie zgodnej ze szczególna teorią względności.
Potencjały A i
Φ
zobrazowane są przez cztero-wektor k zgodnie z równościami :
k0 =
Φ
, km = Am , m= 1,2,3
Wprowadźmy :
F
µν
= k
µ
,
ν
−
k
ν
,
µ
(23.7)
Wtedy zgodnie z (23.1)
E1 =
−
∂
k1/
∂
x0
−
∂
k0/
∂
x1 =
∂
k1 /
∂
x0
−
∂
k0 /
∂
x1 = F10 =
−
F10
I zgodnie z (23.1)
H1 =
−
∂
k3/
∂
x2
−
∂
k2/
∂
x3 =
∂
k3/
∂
x2 +
∂
k2 /
∂
x3 = F23 = F
23
W takim razie sześć składników tensora antysymetrycznego F
µν
określają wielkości polowe E i H.
Z (23.7) wynika , że :
F
µν
,
σ
+ F
νσ
,
µ
+ F
σµ
,
ν
= 0 (23.8)
29
To równanie zawiera w sobie równania Maxwella (23.3) i (23.4).
Dalej, z (23.6) mamy :
F0
µ
,
ν
= F0m , m =
−
Fm0 , m = div E = 4
πρ
(23.9)
Analogicznie z (23.5) otrzymujemy :
F1
ν
,
ν
= F10, 0 + F
12
, 2 + F
13
, 3 =
−
∂
E1/
∂
x0 +
∂
H3 /
∂
x2
−
∂
H2 /
∂
x3 = 4
π
j1 (23.10)
Gęstość ładunku
ρ
, oraz prąd jm obrazują cztero-wektor J
µ
zgodnie z równościami :
J0 =
ρ
, Jm = jm
Wtedy (23.9) i (23.10) zostają sprowadzone do jednego równania :
F
µν
,
ν
= 4
π
J
µ
(23.11)
I tak przedstawiają się równania Maxwella przepisane w formie czterowymiarowej zgodnej ze STW .
Aby przejść do ogólnej teorii względności należy zapisać równania w formie kowariantnej.
Z udziałem równości (21.5) tensor (23.7) można bezpośrednio uogólnić :
F
µν
= k
µ
:
ν
−
k
ν
:
µ
To pozwala określić kowariantne wielkości polowe F
µν
.
Dalej otrzymujemy :
F
µν
:
σ
+ F
µν
,
σ
−
Γαµσ
F
αν
−
Γανσ
F
µα
Dokonując przestawienia cyklicznego indeksów
µ
,
ν
,
σ
, oraz dodając otrzymane tym sposobem równania
otrzymamy (z udziałem (23.8) ) :
F
µν
:
σ
+ F
νσ
:
µ
+ F
σµ
:
ν
= F
µν
,
σ
+ F
νσ
,
µ
+ F
σµ
,
ν
= 0 (23.12)
W rezultacie to równanie Maxwella automatycznie przybiera postać kowariantną.
Pozostaje nam rozpatrzyć równanie (23.11). W ramach OTW jest ono nie słuszne i powinno być zamienione
przez równanie w formie kowariantnej.
F
µν
:
ν
= 4
π
J
µ
(23.13)
Z równości (21.3) która jest słuszna dla dowolnego antysymetrycznego tensora rzędu drugiego otrzymujemy :
( F
µν
√−
g ),
ν
= 4
π
J
µ
√−
g
Stąd bezpośrednio wynika równość :
( J
µ
√−
g ),
µ
= (4
π
) -1 ( F
µν
√−
g ),
µν
= 0
To równanie, analogiczne do (21.2), przedstawia prawo zachowania „elektryczności”
(tj. ogólne prawa zachowania w elektrodynamice – przypis własny ).
Obecność zakrzywienia przestrzeni nie narusza tego prawa , prawo wypełnione jest dokładnie.
24) Modyfikacja równań Einsteina w obecności materii
Przy braku materii równania Einsteina mają postać :
R
µν
= 0 (24.1)
Stąd wynika, że R = 0 w takim razie :
R
µν
−
½ g
µν
R = 0 (24.2)
Jeśli wziąć za wyjściowe równanie (24.2) to drogą zawężania można otrzymać :
R – 2R = 0
i odpowiednio powrócić do (24.1).
W charakterze podstawowych równań dla pustej przestrzeni można wziąć (24.1) jak i (24.2).
W przypadku obecności materii równania te należy koniecznie zmodyfikować.
Załóżmy, że zmodyfikowane równania (24.1) możemy zapiszemy w formie :
R
µν
= X
µν
(24.3)
a (24.2) przyjmują postać :
R
µν
−
½ g
µν
R = Y
µν
(24.4)
gdzie X
µν
i Y
µν
- tensory symetryczne drugiego rzędu wyrażające obecność materii.
30
Teraz widać, że (24.4) – jest bardziej dogodna w zapisie dla dalszych rachunków, ponieważ mają miejsce
tożsamości Bianchi, które pokazują, że:
[ R
µν
−
½ g
µν
R ]:
ν
= 0
Odpowiednio (24.4) pociąga za sobą równość :
Y
µν
:
ν
= 0 (24.5)
Dane pole tensorowe Y
µν
„wytwarzające” materię powinno spełniać powyższy warunek w przeciwnym razie
równania (24.4) będą niezgodne.
Dla wygody wprowadzimy w równaniu (24.4) współczynnik :
−
8
π
i przepiszemy go w formie
R
µν
−
½ g
µν
R =
−
8
π
Y
µν
(24.6)
W dalszej części będzie pokazane że tensor Y
µν
, z tym współczynnikiem należy interpretować jako gęstość i
strumień energii-pędu (pochodzenia nie grawitacyjnego), przy czym Y
µ
0 przedstawia sobą gęstość,
a Y
µ
r – strumień.
W przestrzeni płaskiej równanie (24.5) miało by postać :
Y
µν
:
ν
= 0
i pociągało by za sobą prawo zachowania energii i pędu. W przestrzeni zakrzywionej energia i pęd zachowane
są jedynie w przybliżeniu. Nie spełnienie prawa zachowania, spowodowane jest działaniem pola grawitacyjnego
na materię i obecnością energii i pędu własnego pola grawitacyjnego.
25) Tensor energii-pędu materii
Niech będzie dany pewien rozkład materii, prędkość której zmienia się w sposób ciągły od punktu do punktu.
Jeśli oznaczyć z
µ
jako współrzędną elementu materii, to można wprowadzić wektor prędkości
v
µ
= dz
µ
/ds
który podobnie jak wielkości polowe będzie ciągłą funkcją współrzędnych punktu.
Wektor prędkości posiada następujące własności :
g
µν
v
µ
v
ν
= 1
0 = ( g
µν
v
µ
v
ν
):
σ
= g
µν
( v
µ
v
ν
:
σ
+ v
µ
:
σ
v
ν
) = 2g
µν
v
µ
v
ν
:
σ
(25.1)
Stąd :
v
ν
v
ν
:
σ
= 0 (25.2)
Można wprowadzić pole skalarne
ρ
takim sposobem aby pole wektorowe
ρ
v
µ
określało gęstość i strumień
materii tak jak J
µ
określa gęstość i strumień ładunku elektrycznego innymi słowami, aby
ρ
v
µ
√−
g było
gęstością, a
ρ
vm
√−
g – strumieniem.
Konieczny warunek dla zachowania materii ma postać :
(
ρ
v
µ
√−
g ),
µ
= 0
lub
(
ρ
v
µ
)
:
µ
= 0 (25.3)
W rozpatrywanym przypadku gęstość i strumień energii materii będzie miał postać :
ρ
v0 v0
√−
g
i
ρ
v0 vm
√−
g
a następujące wielkości będą, odpowiednio gęstość i strumień pędu :
ρ
vn v0
√−
g ,
ρ
vn vm
√−
g
31
Podstawmy :
T
µν
=
ρ
v
µ
v
ν
(25.4)
Wtedy
T
µν
√−
g
zawiera gęstość i strumień energii i pędu.
Wielkości tę nazywamy tensorem energii-pędu materii.
Tensor T
µν
jest oczywiście tensorem symetrycznym.
Czy można w charakterze członu materialnego w prawej części równań Einsteina (24.6) wykorzystać T
µν
?
Dla tego potrzebne jest aby spełniona była równość:
T
µν
:
ν
= 0
Z (25.4) otrzymamy :
T
µν
:
ν
= (
ρ
v
µ
v
ν
):
ν
= v
µ
(
ρ
v
ν
)
:
ν
+
ρ
v
ν
v
µ
:
ν
Pierwszy człon w prawej części staje się zerem na mocy prawa zachowania masy (25.3).
Drugi człon znika, jeśli materia porusza się po geodezyjnej, ponieważ w przypadku kiedy zamiast zadać ją tylko
na linii świata, v
µ
określimy ją jako funkcję ciągłą pola, otrzymamy :
dv
µ
/ds =v
µ
,
ν
v
ν
Wtedy (8.3) przybiera postać :
(v
µ
,
ν
+
Γµνσ
v
σ
) v
ν
= 0
lub
v
µ
:
ν
v
ν
= 0 (25.5)
Teraz widać, że tensor energii-pędu materii (25.4) z odpowiednik mnożnikiem liczbowym k, można podstawić
do równań Einsteina (24.4). Wtedy otrzymujemy:
R
µν
−
½ g
µν
R = k
ρ
v
µ
v
ν
(25.6)
Określimy teraz wartość współczynnika k. Przejdziemy, śladem metody wyłożonej w rozdziale 16, prowadzącej
do przybliżenia Newtonowskiego.
Zauważmy, że zawężając (25.6) otrzymamy :
−
R = k
ρ
Wtedy (25.6) można zapisać w postaci :
R
µν
= k
ρ
[ v
µ
v
ν
−
½ g
µν
]
W przybliżeniu słabego pola zgodnie z (16.4) otrzymujemy:
½ g
ρσ
(g
ρσ
,
µν
−
g
νσ
,
µρ
−
g
µρ
,
µσ
+ g
µν
,
ρσ
) = k
ρ
[ v
µ
v
ν
−
½ g
µν
]
Rozpatrzmy pole statyczne, oraz statyczne rozłożenie materii.
W tym przypadku v0 = 1 , vm= 0 .
Zakładając
µ
=
ν
= 0, oraz odrzucając człony drugiego rzędu znajdujemy :
−
½
∇
2g
00 = ½ k
ρ
lub z udziałem (16.6):
∇
2V =
−
½ k
ρ
Dla tego, aby to było zgodne z równaniem Poissona należy wziąć : k =
−
8
π
.
W takim razie równania Einsteina w przypadku poruszającej się materii mają postać :
R
µν
−
½ g
µν
R =
−
8
πρ
v
µ
v
ν
(25.7)
Wtedy, T
µν
zadane przez (25.4) jest zgodne z Y
µν
z równania (24.6)
Warunek zachowania masy (25.3) daje :
ρ
:
µ
v
µ
+
ρ
v
µ
:
µ
= 0
odpowiednio otrzymamy :
∂ρ
/ds = (
∂ρ
/dx
µ
)v
µ
=
−
ρ
v
µ
:
µ
(25.8)
32
Warunek ten ustala prawo zmiany
ρ
wzdłuż linii świata elementu materii.
Przy przejściu od linii świata pewnego elementu do linii świata elementu sąsiedniego zasada (25.8) dopuszcza
dowolną zmianę
ρ
. Znaczy to, że można wybrać tak
ρ
, aby było równe wszędzie zeru oprócz zbioru linii świata
obrazujących rurkę czasoprzestrzenną .
Taki zbiór opisywałby cząstkę o skończonych rozmiarach. Poza cząstką mamy :
ρ
= 0 i odpowiednio stosujemy
równań Einsteina dla pustej przestrzeni.
Zauważmy, że jeśli przyjąć ogólną postać równań pola (25.7), to z nich można wywieść dwa wnioski:
zachowanie masy i ruch materii po geodezyjnych.
Przypomnimy że: [R
µν
−
½ g
µν
R ]:
ν
jest zerem zgodnie z tożsamościami Bianchi, skąd otrzymamy :
(
ρ
v
µ
v
ν
):
ν
= 0
lub
v
ν
(
ρ
v
µ
):
ν
+
ρ
v
ν
v
µ
:
ν
= 0 (25.9)
Pomnóżmy to równanie przez v
µ
. Drugi człon da zero, co wynika z (25.2) i pozostaje (
ρ
v
µ
):
ν
= 0, a to jest
zgodne z zasadą zachowania (25.3). Teraz równanie (25.9) prowadzi do równości :
v
ν
v
µ
:
ν
= 0 tzn. do równania geodezyjnej.
W takim razie nie trzeba robić założenia, że cząstka porusza się po geodezyjnej. Dla małej cząstki ruch wzdłuż
geodezyjnej zapewniony jest przez równania Einsteina dla pustej przestrzeni w obszarze wokół cząstki.
26) Zasada wariacyjna dla grawitacji
Wprowadźmy skalar :
I = ∫ R
√−
g d4x (26.1)
gdzie całkowanie prowadzone jest po określonej czterowymiarowej objętości.
Dodajmy mały przyrost do g
µν
oznaczony jako
δ
g
µν
przyrost ten zachowuje g
µν
, oraz jego pierwsze pochodne
na granicy całkowanego elementu objętości.
Wymaganie:
δ
I = 0 przy dowolnych
δ
g
µν
prowadzi, jak będzie pokazane później, do równań Einsteina dla
pustej przestrzeni.
Z (14.4) otrzymamy :
R = g
µν
R
µν
= R*
−
L
gdzie :
R* = g
µν
(
Γσµσ
,
ν
−
Γσµν
,
σ
) (26.2)
i
L = g
µν
(
Γσµν
Γσσρ
−
Γρµσ
Γσνρ
) (26.3)
Skalar I zawiera drugie pochodne g
µν
ponieważ wchodzą one w R*, jednak te pochodne wchodzą tylko w
formie liniowej i odpowiednio można je wykluczyć całkując przez części.
Otrzymamy zatem :
R*
√−
g = ( g
µν
Γσµσ
√−
g ),
ν
−
( g
µν
Γσµν
√−
g ),
σ
−
( g
µν
√−
g ),
ν
Γσµσ
+ ( g
µν
√−
g ),
σ
Γσµν
(26.4)
Dwa pierwsze człony są pochodnymi zupełnymi i dlatego nie dają one wkładu do I.
Tak więc w (26.4) należy zostawić tylko dwa ostatnie człony. Z udziałem (22.5) i (22.4) przyjmują one postać :
g
νβ
Γµβν
Γσµσ
√−
g + (
−
2g
νβ
Γµβσ
+ g
µν
Γβσβ
)
Γσµν
√−
g s
Jest to zgodne z 2L
√−
g z równania (26.3).
W takim razie dla I otrzymujemy wyrażenie :
I = ∫ L
√−
g d4x
zawierające tylko g
µν
oraz jego pierwsze pochodne.
33
Skalar I jest jednorodną formą kwadratową względem pierwszych pochodnych.
Podstawmy £ = L
√−
g, weźmiemy tę wielkość (z odpowiednik liczbowym czynnikiem, który będzie określony
dalej) w charakterze gęstości działania dla pola grawitacyjnego.
Wielkość £ nie jest gęstością skalarną, jednak wygodniej jest na niej prowadzić rachunki niż na wielkości
R
√−
g będącej gęstością skalarną, ponieważ £ nie zawiera drugich pochodnych g
µν
.
Zgodnie z dynamiką klasyczną działanie jest całką po czasie, lagranżjanu.
W rozpatrywanym przypadku
I = ∫ £
√−
g d4x = ∫ dx0 ∫ £ dx
1dx2dx3
tak, że lagranżjanem oczywiście jest :
∫ £ dx1dx2dx3
W takim wypadku £ można rozpatrywać jako gęstość lagranżjanu (w trzech wymiarach) i jako gęstość działania
(w czterech wymiarach). Składowe g
µν
można uważać jako współrzędne dynamiczne, a ich pochodne po czasie
jako prędkości. Zauważmy również, że lagranżjan jest niejednorodną kwadratową formą względem prędkości,
jak to ogólnie bywa w mechanice klasycznej.
Teraz dokonamy wariacji £. Wykorzystując (20.6) i (22.5) otrzymujemy :
δ
(
Γαµν
Γβαβ
g
µν
√−
g ) =
Γαµν
δ (
Γβαβ
g
µν
√−
g ) +
Γβαβ
g
µν
sqrt(.) δ
Γαµν
=
=
Γαµν
δ( g
µν
√−
g,
α
) +
Γβαβ
δ (
Γαµν
g
µν
√−
g )
−
Γβαβ
Γαµν
δ ( g
µν
√−
g ) =
=
Γαµν
δ( g
µν
√−
g,
α
)
−
Γβαβ
δ( g
αν
√−
g ) ,
ν
−
Γβαβ
Γαµν
δ( g
µν
√−
g ) (26.5)
A zgodnie z (22.3) :
δ
(
Γβµα
Γανβ
g
µν√−
g ) = 2 (δ
Γβµα
)
Γαµβ
g
µν
√−
g +
Γβµα
Γαµβ
δ ( =
Γαµν
δ ( g
µν
√−
g ) =
= 2 δ(
Γβµα
g
µν
√−
g )
Γαµβ
−
Γβµα
Γανβ
δ ( g
µν
√−
g ) =
−
δ( g
νβ
,
α
√−
g )
Γανβ
−
−
Γβµα
Γανβ
δ ( g
µν
√−
g ) (26.6)
Odejmując (26.6) od (26.5) znajdujemy:
δ£ =
Γαµν
δ ( g
µν
),
α
−
Γβαβ
δ ( g
αν
√−
g ),
ν
+ (
Γβµα
Γανβ
−
Γβαβ
Γαµν
) δ ( g
να
√−
g ) (26.7)
Dwa pierwsze człony różnią się od :
−
Γαµν
,
α
δ ( g
µν
√−
g ) +
Γβµβ
,
ν
δ ( g
µν
√−
g )
o pochodną zupełną.
Stąd otrzymamy:
δI = δ ∫ £ d4x = ∫ R
µν
δ ( g
µν
√−
g )d4x (26.8)
gdzie R
µν
zadane jest wzorem (14.4).
Przy dowolnym δ g
µν
wielkości δ( g
µν
√−
g ), także są dowolne i niezależne tak więc żądanie zerowania się
(26.8) przywodzi do równań Einsteina w formie (24.1)
Metodą analogiczną do (7.9) można pokazać, ze :
δ g
µν
=
−
g
µα
g
νβ
δ g
αβ
(26.9)
Odpowiednio z (20.5) otrzymujemy :
δ sqrt(.) = ½
√−
g g
αβ
δ g
αβ
(26.10)
W takim razie :
δ ( g
µν
√−
g ) =
−
[ g
µα
g
νβ
−
½ g
µν
g
αβ
]
√−
g δ g
αβ
34
Wtedy (26.8) można zapisać w innej formie :
δI =
−
∫ R
µν
(g
µα
g
νβ
−
½ g
µν
g
αβ
]
√−
g δg
αβ
d4x =
−
∫ (R
αβ
−
½ g
αβ
R)
√−
g δg
αβ
d4x (26.11)
Żądanie zerowania się (26.11) prowadzi do równań Einsteina w postaci (24.2)
27) Działanie dla ciągłego rozkładu materii
Rozpatrzymy ciągły rozkład materii, prędkość której zmienia się w sposób ciągły od punktu do punktu podobnie
jak było to zrobione w rozdziale 25. Zapiszemy zasadę wariacyjną dla przypadku materii oddziałującej z polem
grawitacyjnym w formie :
δ ( Ig + Im ) = 0 (27.1)
gdzie grawitacyjna część działania Ig zgodna jest z dokładnością do pewnego liczbowego mnożnika k z I z
poprzedniego rozdziału, a Im – jest materialna częścią działania która będzie określona w dalszej kolejności.
Warunek (27.1) powinien prowadzić do równań Einsteina w formie (25.7) dla pola grawitacyjnego w obecności
materii i do równań geodezyjnej dla ruchu materii.
W dalszej części konieczne będzie zbadanie, jak wpływa na Im dowolna wariacja położenia elementu materii.
Rozpatrzenie tego problemu stanie się bardziej jasnym, jeśli najpierw rozpatrzymy czysto kinematyczne wariację
bez związku z metryką g
µν
. W tym przypadku istnieje podstawowa różnica miedzy wektorami
ko- i kontra- wariantnymi, dlatego nie można przechodzić od jednego do drugiego.
Prędkość opisywana jest zależnością współczynników kontrawariantnego wektora u
µ
i nie może być
unormowany bez wprowadzenia metryki.
Dla ciągłego strumienia materii wektor prędkości u
µ
(z pewnym nie znanym mnożnikiem) zadany jest w
każdym punkcie. Można zbudować zgodny z kierunkiem wektora u
µ
kontrawariantny wektor gęstości
ρµ
,
który określa wielkość i prędkość strumienia w postaci:
p0dx1dx2dx3,
równy ilości materii w elemencie objętości : dx1dx2dx3, w określonym momencie czasu, oraz :
p1dx0dx2dx3,
równego ilości materii, która przechodzi przez element powierzchni dx2dx3 przez czas dx0,
Założymy, że ilość materii jest zachowana, wtedy :
p
µ
,
µ
= 0 (27.2)
Niech każdy element materii przemieszcza się z punktu z
µ
do punktu z
µ
+ b
µ
, gdzie b
µ
- wielkość mała
Musimy określić jaka będzie wynikowa zmiana p
µ
w zadanym punkcie x.
Z początku rozpatrzmy przypadek b0 = 0. Zmiana ilości materii znajdującej się w trójwymiarowej objętości V,
równa jest, ze znakiem przeciwnym, ilości materii przechodzącej przez granicę objętości :
δ ∫ v p0dx1dx2dx3 =
−
∫ p0brdSr r = 1,2,3
gdzie dSr oznacza element powierzchni ograniczającej objętość V.
Prawą część tej równości można przekształcić zgodnie z twierdzeniem Gaussa, wtedy otrzymamy :
δ p0 =
−
(p0 br ) , r (27.3)
Teraz rezultat ten należy uogólnić na przypadek b0 ≠ 0 .
Jeśli b
µ
jest proporcjonalne do p
µ
to każdy element materii przemieszcza się wzdłuż swojej linii świata i
odpowiednio wektor p
µ
jest nie zmienny. Uogólnienie (27.3) ma oczywistą, następującą postać:
δp0 = (pr b0 – p0 br ), r
ponieważ przy b0 = 0ostatnie równanie to zgodne jest z (27.3) a przy b
µ
proporcjonalnym do p
µ
, daje δ p0 = 0
35
Wzór ten jest słuszny również dla innych składników p
µ
, tak że końcowy rezultat ma postać :
δp
µ
= (p
ν
b
µ
– p
µ
b
ν
)
,
ν
(27.4)
Przy opisie ciągłego potoku materii, p
µ
jest podstawową wielkością charakteryzującą która powinna wejść do
funkcji działania. Wariacja wielkość p
µ
powinna być zgodna z formułą (27.4), a zatem po odpowiednim
całkowaniu współczynniki przy każdym ze składników b
µ
powinny być przyrównane do zera.
Takie postępowanie przywodzi nas do równań ruchu materii.
Działanie dla izolowanej cząstki o masie m ma postać :
−
m ∫ ds (27.5)
Konieczność wprowadzenia współczynnika –m stanie się jasna jeśli rozpatrzyć przypadek STW dla którego
lagranżjan miał by postać pochodnej po czasie od (27.5) tj. :
L =
−
m ds/dx0 =
−
m [1
−
( dxr/dx0) dxr/dx0 ] ½
(sumowanie przeprowadzamy po r ; r = 1, 2, 3 ), stąd otrzymujemy wyrażenie dla pędu :
∂
L /
∂
(
∂
xr/dx0 ) = m dxr/dx0 ( 1
−
dxn/dx0 dxn/dx0 )
−
½ = m dxr/ds
Działanie dla ciągłego rozkładu materii otrzymamy zamieniając m w (27.5) wielkością : p0dx1dx2dx3 i
całkowaniem :
I m =
−
m ∫ p0dx1dx2dx3ds (27.6)
Aby zapisać I m w bardziej użytecznej formie wprowadzimy tensor metryczny i zastosujemy formułę :
p
µ
=
ρ
v
µ
√−
g (27.7)
gdzie
ρ
- skalar określający gęstość, a v
µ
- wektor jednostkowy zgodny z kierunkiem u
µ
.
Otrzymujemy zgodnie z tym :
I m =
−
∫
ρ
√−
g v0dx1dx2dx3ds =
−
∫
ρ
√−
g dx4 (27.8)
gdzie wprowadzono v0ds = dx0
Taka forma zapisu działania nie jest wygodna dla wariacji ponieważ
ρ
i v
µ
nie są zmiennymi niezależnymi.
Aby można było wykorzystać formułę (27.4)
ρ
i v
µ
powinny być wyrażone przez p
µ
. Z (27.7) znajdujemy :
(p
µ
p
µ
)½ =
ρ√−
g
Tak więc (27.8) przyjmuje postać :
I m =
−
∫ (p
µ
p
µ
)½ dx4 (27.9)
Dla określenia wariacji tego wyrażenia wspomożemy się równością :
δ(p
µ
p
µ
)½ = ½ (p
λ
p
λ
)
−
½ ( p
µ
p
ν
δg
µν
+ 2 p
µ
δp
µ
) = ½
ρ
v
µ
v
ν
√−
g δg
µν
+ v
µ
δp
µ
Teraz z zasady wariacyjnej (27.1) po podstawieniu do niej (26.11) pomnożonego przez współczynnik k
otrzymujemy :
δ (Ig + Im ) =
−
∫ [ k ( R
µν
−
½ g
µν
R ) + ½
ρ
v
µ
v
ν
]
√−
g δg
µν
d4x
−
∫ v
µ
δp
µ
dx4 (27.10)
Przyrównując do zera współczynnik przy δg
µν
oraz wybierając k = (16
π
)–1 otrzymujemy równania Einsteina
(25.7). Ostatni człon (27.10) z udziałem (27.4) i (25.2) daje:
−
∫ v
µ
( p
ν
b
µ
– p
µ
b
ν
)
,
ν
dx4 = ∫ v
µ
,
ν
( p
ν
b
µ
– p
µ
b
ν
)
dx
4 = ∫ (v
µ
,
ν
−
v
ν
,
µ
) p
ν
b
µ
dx4 =
= ∫ (v
µ
:
ν
−
v
ν
:
µ
)
ρ
v
ν
b
µ
√−
g dx4 = ∫ v
µ
:
ν
ρ
v
ν
b
µ
√−
g dx4 (27.11)
Przyrównując do zera współczynnik przy b
µ
otrzymujemy równanie geodezyjnej (25.5)
36
28) Działanie dla pola elektromagnetycznego
Zwykłe wyrażenie dla gęstości działania pola elektromagnetycznego ma postać :
(8
π
) –1 (E2
−
H2 )
Jeśli zapisać je w oznaczeniach czterowymiarowych STW wprowadzonych w rozdziale 23 to otrzymamy :
−
(16
π
) –1F
µν
F
µν
To przywodzi nas do następującego wyrażenia dla inwariantnego działania w OTW :
Iem =
−
(16
π
) –1 ∫ F
µν
F
µν
√−
g dx4 (28.1)
Należy przyjąć do wiadomości że F
µν
= k
µ
,
ν
−
k
ν
,
µ
znaczy to, że Iem jest funkcją tylko g
µν
oraz pochodnych od potencjałów elektromagnetycznych.
Z początku dokonamy wariacji g
µν
zostawiając kσ stałe, wtedy F
µν
(nie F
µν
) jest również stałe.
Z (26.10) i (26.9) otrzymamy :
δ(F
µν
F
µν
√−
g ) = F
µν
F
µν
δ
√−
g + F
µν
F
αβ
√−
g δ(g
µα
g
νβ
) = ½ F
µν
F
µν
(g
ρ
σ
√−
g δ g
ρ
σ –
−
2F
µν
F
αβ
√−
g g
µρ
g
α
σ g
νβ
δg
ρ
σ
W takim razie :
δ(F
µν
F
µν
√−
g ) = [ ½ F
µν
F
µν
g
ρ
σ – 2Fσ
ν
Fσ
ν
]
√−
g δ g
ρ
σ = 8Π E
ρ
σ
√−
g δg
ρ
σ (28.2)
gdzie symetryczny tensor E
ρ
σ zdefiniowany zależnością :
4
π
E
ρ
σ =
−
Fσ
ν
Fσ
ν
+ ¼ g
ρ
σ F
µν
F
µν
(28.3)
jest tensorem energii-pędu pola elektromagnetycznego.
Zauważmy, że w STW mamy:
4
π
E00 = E2 – ½ (E2
−
H2 ) = ½ (E2
−
H2 )
4
π
E01 =
−
F02 F
12
−
F03 F
13 = E2H3
−
E3H2
tj. E00 opisuje gęstość energii, a E0n jest wektorem Pointynga charakteryzującym natężenie strumienia energii.
Wariacja k
µ
przy zadanych g
αβ
z udziałem (21.3) daje :
δ(F
µν
F
µν
√−
g ) = 2F
µν
√−
g δF
µν
= 4F
µν
√−
g δk
µ
,
ν
= 4(F
µν
√−
g δk
µ
) ,
ν
−
4(F
µν
√−
g ),
ν
δk
µ
=
= 4 (F
µν
√−
g δk
µ
),
ν
−
4F
µν
:
ν
√−
g δk
µ
(28.4)
Dodając (28.2), oraz (28.4) i mnożąc rezultat przez
−
16
π
otrzymujemy wyrażenie dla pełnej wariacji:
δIem = ∫ [
−
½ E
µν
δ g
µν
+ (4
π
)–1F
µν
:
µ
δk
µ
]
√−
g d4x (28.5)
29) Działanie dla naładowanej materii
W poprzednim rozdziale było rozpatrzone pole elektromagnetyczne w przypadku braku ładunków.
Aby opisać ładunki należy wprowadzić odpowiedni człon w działaniu.
Dla pojedynczej cząstki z ładunkiem e dopełniający człon w działaniu ma postać :
−
e ∫ k
µ
dx
µ
=
−
e ∫ k
µ
v
µ
ds (29.1)
gdzie całkowanie przeprowadzamy wzdłuż linii świata.
Jeśli cząstka niosąca ładunek jest cząstką punktową, to wynikają pewne trudności związane z tym że jej pole
elektromagnetyczne zawiera osobliwość
(ten problem rozważany jest np. w książce W. Pauliego „Teoria względności” – przypis tłumacza)
Te trudności można obejść, jeśli rozpatrzyć w miejsce nośnika punktowego ładunku ciągły rozkład materii.
Będziemy opisywać taki rozkład materii w ramach formalizmu rozwiniętego w rozdziale 27, zakładając że każdy
element materii jest nośnikiem ładunku.
37
W kinematycznych zadaniach, figurowała kontrawariantna gęstość wektorowa p
µ
określająca gęstość i strumień
materii. Teraz należy wprowadzić kontrawariantną gęstość wektorową J
µ
określającą gęstość i strumień
elektryczności. Te dwa wektory powinny być zgodne co do kierunku.
Przy małych przesunięciach przyrost gęstości wektorowej J
µ
zgodnie z (27.4) można zapisać w następującej
formie :
δJ
µ
= ( J
ν
b
µ
−
J
µ
b
ν
) (29.2)
z samym znaczeniem b
µ
jak w (17.4)
Dla cząstki niosącej ładunek działanie (29.1) w przypadku ciągłego rozkładu naładowanej materii prowadzi
(analogicznie do (27.6)) do :
I q =
−
∫ J0 k
µ
v
µ
dx1dx2dx3ds.
Przy wprowadzaniu metryki zakładamy, zgodnie z (27.7), że :
J
µ
= σ v
µ
√−
g (29.3)
gdzie σ – jest funkcją skalarna określająca gęstość ładunku.
Wtedy działanie przyjmuje postać, analogiczną do (27.8) :
I q =
−
∫ σ k
µ
v
µ
√−
g dx4 =
−
∫ k
µ
J
µ
dx4 (29.4)
W takim razie mamy :
δI q =
−
∫ [J
µ
δk
µ
+ k
µ
(J
ν
b
µ
−
J
µ
b
ν
),
ν
] dx4 = ∫ [
−
σ v
µ
√−
g δk
µ
+ k
µ
,
ν
( J
ν
b
µ
−
J
µ
b
ν
)] dx4 =
= ∫ σ (
−
v
µ
δk
µ
+ F
µν
v
ν
b
µ
)
√−
g dx4 (29.5)
Równania oddziaływania wzajemnego, materii naładowanej z polem grawitacyjnym i elektromagnetycznym
wynikają z ogólnej zasady wariacyjnej :
δ (I g + I m + I em + I q ) = 0 (29.6)
Weźmy sumę wyrażeń (29.5), (28.5) i (27.10) zamieniając ostatni człon w (27.10) na (27.11), oraz przyrównując
do zera sumę współczynników przy wariacjach δg
µν
, δk
ν
, b
µ
.
Jeśli współczynnik przy
√−
g δg
µν
pomnożyć przez
−
16
π
, to otrzymamy :
R
µν
−
½ g
µν
R + 8
π
ρ
v
µ
v
ν
+ 8
π
E
µν
= 0 (29.7)
Równanie (29.7) przedstawia sobą równanie Einsteina (24.6) z Y
µν
złożonym z dwóch członów - tensora
energii-pędu materii, oraz tensora energii-pędu pola elektromagnetycznego.
Współczynnik przy
√−
g δk
µ
daje:
−
σ v
µ
+ (4
π
) –1F
µν
:
ν
= 0
Z (29.3) widać, że σ v
µ
jest zgodne z wektorem prądu J
µ
w takim razie otrzymamy:
F
µν
:
ν
= (4
π
) J
µ
(29.8)
Równanie (29.8) przedstawia sobą równanie Maxwella (23.13) w przypadku obecności ładunków.
Na koniec, dla współczynnika przy
√−
g b
µ
znajdujemy :
ρ
v
µ
:
ν
v
µ
+ σF
µν
v
µ
= 0
lub
ρ
v
µ
:
ν
v
µ
+ F
µν
J
µ
= 0 (29.9)
Drugi człon w (29.9) przedstawia sobą siłę Lorentza, powodującą odchylenie elementu materii od trajektorii
geodezyjnej. Równanie (29.9) wynika z równań (29.7) i (29,8).
Z uwzględnieniem tożsamości Bianchi otrzymujemy :
(
ρ
v
µ
v
ν
+ E
µν
):
ν
= 0 (29.10)
38
Dalej zgodnie z (28.3) oraz z wykorzystaniem (23.12) i ((29.8) mamy :
4
π
E
µν
:
ν
=
−
F
µα
F
ν
α
:
ν
−
F
µα
:
ν
F
ν
α
+ ½ g
µν
F
αβ
F
αβ
:
ν
=
−
F
µα
F
ν
α
:
ν
−
½ g
µρ
F
νσ
(F
ρσ
:
ν
−
F
ρν
:
σ
−
F
νσ
:
ρ
) = 4
π
F
µα
J
α
W takim razie (29.10) przyjmuje postać :
v
µ
(
ρ
v
ν
):
ν
+
ρ
v
ν
v
µ
:
ν
+ F
µα
J
α
= 0 (29.11)
Mnożąc (29.11) przez v
µ
, oraz wykorzystując (25.2) otrzymujemy :
(
ρ
v
ν
):
ν
=
−
F
µα
v
µ
J
α
= 0
(uwzględniono tutaj warunek J
α
=
σ
v
µ
wynikający z tego, że J
α
i v
α
powinny być zgodne co do kierunku)
Wtedy pierwszy człon w (29.11) zeruje się i przychodzimy do (29.9) W takim razie równania wynikające z
zasady wariacyjnej (29.6) nie są nie zależne co jest wynikiem niezwykłym.
Przyczyny takiego wyniku będziemy rozpatrywać w rozdziale 30.
30) Zasada wariacyjna w przypadku ogólnym
Metodę rozwiniętą w rozdziale 29 można uogólnić na przypadek oddziaływania wzajemnego pola
grawitacyjnego z innymi polami oddziałującymi między sobą. Zasadę wariacyjną w ogólnym przypadku można
zapisać w postaci:
δ ( Ig + I’ ) = 0 (30.1)
gdzie Ig – działanie pola grawitacyjnego omówione powyżej, a I’- działanie dla wszystkich pozostałych pól
złożone ze sumy składników – po jednym dla każdego pola.
Wielkim udogodnieniem wykorzystania zasady wariacyjnej jest możliwość łatwego otrzymania poprawnych
równań, dowolnych wzajemnie oddziałujących pól. Należy jedynie znaleźć działanie dla każdego z
rozpatrywanych pól i dołączyć wszystkie te człony do (30.1)
Działanie pola grawitacyjnego Ig = ∫ L d
4x
gdzie L – gęstość lagranżjanu z rozdziału 26 z mnożnikiem (16π )
−
1
Dla grawitacji Ig mamy :
δIg = ∫ [(
∂
L /
∂
g
αβ
) δg
αβ
+ (
∂
L /
∂
g
αβ
,
ν
) δg
αβ
,
ν
] d4x = ∫ [
∂
L /
∂
g
αβ
−
(
∂
L /
∂
g
αβ
,
ν
),
ν
] δg
αβ
d4x
Rozważania z rozdziału 26 które prowadziły do (26.11) pokazują, że :
∂
L /
∂
g
αβ
−
(
∂
L /
∂
g
αβ
,
ν
),
ν
= (16π)-1 ( R
αβ
−
½ g
αβ
R)
√−
g (30.2)
Niech
ϕ
n (n =1, 2, 3), oznacza pole wielkości nie grawitacyjnych.
Zakładając, że każda z
ϕ
n jest składową tensora, którego konkretnie własności są nie istotne.
Wielkość I’ ma postać całki od gęstości skalarnej :
I’ = ∫ L’ d4x
gdzie L’ – funkcja
ϕ
n i ich pierwszych (możliwe również że wyższych) pochodnych.
Wariacja działania daje następujący rezultat :
δ ( Ig + I’ ) = ∫( p
µν
δg
µν
+ Σn χ
n δ
ϕ
n )
√−
g d4x (30.3)
gdzie p
µν
= p
νµ
, tak jak dany człon zawierający δ (pochodna od wielkości polowej) przy pomocy całkowania
przez części można przekształcić w wyrażenie które zawarte jest w (30.3)
W takim razie zasada wariacyjna (30.1) prowadzi do równań pola :
p
µν
= 0 (30.4)
χn = 0 (30.5)
39
Teraz p
µν
składa się z dwóch składników : członu (30.2) zależnego od Ig i członu (oznaczmy go przez N
µν
)
tworzącego L’. Oczywiście : N
µν
= N
νµ
.
Wielkość L’ zwykle nie zawiera pochodnych po g
µν
, w tym przypadku :
N
µν
√−
g =
∂
L’ /
∂
g
µν
(30.6)
Teraz równanie (30.4) przyjmuje postać :
R
µν
−
½g
µν
R
−
(16
π
) N
µν
= 0
A to jest nic innego, jak równanie Einsteina (24.6) z :
Y
µν
=
−
2 N
µν
(30.7)
Stąd widać jaki wkład w prawą część daje każde z pól w zależności od tego (zgodnie z (30.6)) pod jaką postacią
wchodzi g
µν
w działanie dla danego pola.
Dla zgodności równań N
µν
powinno spełniać równość
N
µν
:
ν
= 0.
Tę własność można w ogólnej postaci wyprowadzić z warunku, że I’ jest inwariantne względem przekształceń
współrzędnych pozostawiających niezmienioną granicę powierzchni.
Rozpatrzmy przekształcenie współrzędnych typu :
x
µ
’ = x
µ
+ b
µ
, gdzie b
µ
jest małe oraz jest funkcją x, będziemy szukać wariacji I’ pierwszego rzędu względem
b
µ
. Prawo transformacji dla g
µν
ma (zgodnie z 3.7) postać :
g
µν
(x) = x
α
’
,
µ
x
β
’
,
ν
g
α
’
β
’(x’) (30.8)
gdzie indeksy z apostrofem stoją przy przekształcanym tensorze.
Niech δg
µν
oznacza zmianę g
µν
pierwszego rzędu, nie przy ustalonej wartości pola, a przy ustalonym znaczeniu
współrzędnych w których zadano g
αβ
w ten sposób, że:
g
α
’
β
’(x’) = g
αβ
(x’) + δg
αβ
= g
αβ
(x) + g
αβ
,
σ
b
σ
+ δg
αβ
Mamy dalej :
x
α
’
,
µ
= ( x
α
+ b
α
),
µ
= g
αµ
+ g
α
,
µ
Tak więc z (30.8) wynika, że :
g
µν
(x) = ( g
αµ
+ g
α
,
µ
) ( g
βν
+ g
β
,
ν
) [ g
αβ
(x) + g
αβ
,
σ
b
σ
+ δg
αβ
] = g
µν
(x) + g
αβ
,
σ
b
σ
+ δg
µν
+
+ g
µβ
b
β
,
ν
+ g
αµ
b
α
,
µ
I tak :
δg
µν
=
−
g
µα
b
α
,
ν
−
g
να
b
α
,
µ
−
g
µν
,
σ
b
σ
Określimy teraz wariację I’ przy takiej właśnie zmianie g
µν
, pozostałe pola mają w punkcie x
µ
’ takie wartości
jak do przekształcenia ich w punkcie x
µ
. Wykorzystując (30.6) oraz na podstawie twierdzenia wyrażonego
formułą (21.4) słuszna dla dowolnego symetrycznego tensora drugiego rzędu znajdujemy :
δI’ = ∫ N
µν
δg
µν
√−
g d4x = ∫ N
µν
(
−
g
µα
b
α
,
ν
−
g
να
b
α
,
µ
−
g
µν
,
σ
b
σ
)
√−
g d4x =
= ∫ [2 (N
αµ
√−
g ) ,
ν
−
g
µν
,
α
N
µν√−
g ] b
α
d4x = 2 ∫ (N
αν
:
ν
b
α
√−
g ) d4x
Inwariantność I’ oznacza że wielkość δI’ powinna się zerować przy danych wielkościach b
α
Zgodnie z tym :
N
αν
:
ν
= 0
W skutek tej równość równania pola (30.4) (30.5) nie są niezależne.
40
31) Pseudo tensor energii-pędu pola grawitacyjnego
Wprowadzimy wielkość t
µν
zdefiniowaną zależnością :
t
µν
√−
g s = (
∂
L /
∂
g
αβ
,
ν
) g
αβ
,
µ
−
tg
µν
L (31.1)
Mamy więc :
(t
µν
√−
g ),
ν
= (
∂
L/
∂
g
αβ
,
ν
),
ν
g
αβ
,
µ
+ (
∂
L/
∂
g
αβ
,
ν
) g
αβ
,
µν
−
L ,
µ
I dalej :
L,
µ
= (
∂
L /
∂
g
αβ
) g
αβ
,
µ
+ (
∂
L/
∂
g
αβ
,
ν
) g
αβ
,
νµ
Zgodnie z (30.2) otrzymamy :
(t
µν
√−
g ),
ν
= [(
∂
L /
∂
g
αβ
,
ν
),
ν
−
∂
L /
∂
g
αβ
] g
αβ
,
µ
= (16
π
)-1 ( R
αβ
−
½ g
αβ
R) g
αβ
,
µ
√−
g
Teraz z pomocą równań pola (24.6) otrzymujemy :
(t
µν
√−
g ),
ν
=
−
½ Y
αβ
g
αβ
,
µ
√−
g
w takim razie z (21.4) i warunku Y
µν
:
ν
= 0 otrzymamy :
[(t
µν
+ Y
µν
)
√−
g ],
ν
= 0 (31.2)
Zależności te przywiodły nas do prawa zachowania ,dlatego zachowaną gęstość typu :
(t
µν
+ Y
µν
)
√−
g , należy rozpatrywać w charakterze gęstości energii– pędu.
(Do prawa zachowania (31.2) prowadzi także wyrażenie dla t
µν
√−
g odróżniające się od (31.1) członem
postaci
∂
η
µνα
/
∂
x
α
gdzie η
µνα
=
−
∂
η
µαν
tj. t
µν
określone jest niejednoznacznie.
W rzeczywistości znane jest wiele wyrażeń dla tej wielkości :
Einsteina, Landaua-Lifszyca, Mollera-Mickewicza – przypis tłumacza )
Jak było pokazane Y
µν
przedstawia sobą energię-pęd pól nie grawitacyjnych odpowiednio t
µν
opisuje
energię-pęd pola grawitacyjnego. Jednak t
µν
nie jest wielkością tensorową.
Równanie (31.1) definiujące t
µν
można zapisać w postaci :
t
µν
= (
∂
L /
∂
g
αβ
,
ν
) g
αβ
,
µν
−
g
νµ
L (31.3)
L tutaj nie jest skalarem, ponieważ przy jego wyprowadzaniu musieliśmy dla wykluczenia drugich pochodnych
przekształcać skalar R, który był pierwotnie wybrany w charakterze działania.
Znaczy to, że t
µν
nie może być tensorem.
Wielkość ta otrzymała nazwę – pseudotensor
( pseudotensor energii-pędu – przypis własny)
Przy znajdowaniu wyrażenia dla energii pola grawitacyjnego nie można spełnić jednocześnie następujących
warunków :
1) po dopisaniu do wielkości t
µν
innych form energii pełna energia jest zachowana
2) energia zawarta w określonym (trójwymiarowej) objętości w zadanym momencie czasu nie zależy od
wyboru układu współrzędnych
Przychodzimy zatem do wniosku, że energii pola grawitacyjnego, ogólnie mówiąc nie można zlokalizować.
W najlepszym wypadku można wykorzystywać pseudo tensor spełniający tylko warunek 1) .
To daje przybliżoną informacje o energii grawitacyjnej. (przy czym w szczególnych przypadkach informacja ta
może być dokładna)
41
Zapiszmy całkę :
∫( t
µ
0 + Y
µ
0 )
√−
g dx1dx2dx3 (31.4)
gdzie całkowanie odbywa się względem trójwymiarowej objętości, zawierającej pewien układ fizyczny w danej
chwili czasu.
Można oczekiwać, że jeśli całkowana objętość będzie dążyła do nieskończoności otrzymamy wartość pełnej
energii-pędu, przy czym :
a) całka jest zbieżna
b) strumień przez powierzchnię ograniczającą obszar całkowania dąży do zera.
Wtedy z równania (31.2) widać, że wartości całki (31.4) w danym momencie czasu x0 = a, oraz w pewnym
innym momencie x0 = b są równe. Mało tego, całka ta nie powinna zależeć od wyboru układu współrzędnych,
tak jak można, nie zmieniając współrzędnych w chwili x0 = a przekształcać je w chwili x0 = b.
W takim razie znaleźliśmy jednoznaczne wyrażenie dla zachowania całkowitej energii i pędu.
Warunki a) i b) konieczne dla zachowania całkowitej energii i pędu dla praktycznych, interesujących nas
przypadków są spełnione sporadycznie. Warunki te byłyby spełnione jeśli przestrzeń była by statyczna wewnątrz
skończonej czterowymiarowej rurki. Taka sytuacja jest zrealizowana jeśli pewne ciała materialne rozpoczynają
ruch w określonym momencie czasu i ruch ten wywołuje perturbacje rozprzestrzeniające się wewnątrz (pewnej
rurki czasoprzestrzennej – przypis własny) z prędkością światła. W przypadku zwykłego ruchu układu
planetarnego ruch rozpoczął się nieskończenie dawno temu i warunki a), b) nie są spełnione.
Osobnego omówienia wymaga pytanie o energii fal grawitacyjnych, temu problemowi poświęcony jest
rozdział 33.
32) Jawna postać dla pseudotensora
Wzory (31.1) określające t
µν
można zapisać następująco:
t
µν
√−
g = (
∂
L /
∂
qn ,
ν
) qn,
µ
−
g
νµ
L (32.1)
gdzie qn (n =1,2,3 .... 10 ) odpowiada dziesięciu g
µν
i sumowanie odbywa się po wszystkich znaczeniach n.
Analogicznie (32.1) można przepisać w postaci :
t
µν
√−
g = (
∂
L /
∂
Qm ,
ν
) Qm,
µ
−
g
νµ
L (32.2)
gdzie Qm - dowolne dziesięć niezależnych funkcji qn.
Aby to pokazać zauważmy, że :
Qm,
σ
= (
∂
Qm/
∂
qn )qn ,
σ
Odpowiednio :
∂
L /
∂
qn ,
ν
= (
∂
L /
∂
Qm ,
σ
) (
∂
Qm,
σ
/
∂
qn,
ν
) = (
∂
L /
∂
Qm ,
σ
) (
∂
Qm /
∂
qn )g
νσ
=
= (
∂
L /
∂
Qm ,
ν
) (
∂
Qm /
∂
qn)
Wtedy :
(
∂
L /
∂
qn ,
ν
)qn ,
ν
= (
∂
L/
∂
Qm ,
ν
) (
∂
Qm /
∂
qn )qn,
ν
= (
∂
L /
∂
Qm ,
ν
) Qm ,
µ
skąd wynikają równości (32.1) i (32.2)
Dla otrzymania jawnej postaci t
µν
dogodnie jest wykorzystać wyrażenie (32.2) i wziąć w charakterze Qm
wielkości g
µν
√
.
Teraz można wykorzystać formuły (26.7) z których znajdujemy ( po wprowadzeniu współczynnika 16π ) :
16πδL = (
Γναβ
−
g
βν
Γσασ
) δ (g
αβ√−
g ),
ν
+ s δ (g
αβ√−
g )
gdzie s – pewien współczynnik.
Odpowiednio :
16πt
µν
√−
g = (
Γναβ
−
g
βν
Γσασ
) (g
αβ√−
g ),
µ
−
g
µν
L (32.3)
42
33) Fale grawitacyjne
Rozpatrzmy obszar pustej przestrzeni w której pole grawitacyjne jest słabe i g
µν
jest w przybliżeniu stałe.
Wtedy można stosować równanie (16.4) lub :
g
µν
( g
µν
,
ρσ
−
g
µρ
,
νσ
−
g
µσ
,
νρ
−
g
ρσ
,
µν
) = 0 (33.1)
Wprowadźmy współrzędne harmoniczne. Warunek (22.2) z opuszczonym indeksem
λ
daje :
g
µν
[g
ρµ
,
ν
−
½ g
µν
,
ρσ
] = 0 (32.2)
Zróżniczkujmy to równanie względem x
σ
i odrzućmy człony drugiego rzędu.
W rezultacie otrzymamy :
g
µν
[g
µρ
,
νσ
−
½ g
µν
,
ρσ
] = 0 (32.3)
Zamieniając miejscami
ρ
i
σ
:
g
µν
[g
µσ
,
νρ
−
½ g
µν
,
ρσ
] = 0 (32.4)
Dodając (33.1), (33.3) i (33.4) :
g
µν
g
ρσ
,
µν
= 0
W takim razie każda składowa g
ρσ
spełnia równanie d’Alemberta, rozwiązanie tego równania będzie składać
się z fal rozprzestrzeniających się z prędkością światła. To są właśnie fale grawitacyjne.
Rozpatrzmy energię tych fal. W skutek tego że pseudotensor nie jest tensorem nie otrzymamy w ogólnym
przypadku jasnego rezultatu nie zależącego od wyboru układu współrzędnych. Jednak w jednym specjalnym
przypadku, a mianowicie kiedy wszystkie fale poruszają się w jednym kierunku , można otrzymać „klarowny”
rezultat. Jeśli wszystkie fale poruszają się w kierunku osi x3, to układ współrzędnych można wybrać tak aby
g
µν
zależne było tylko od jednej zmiennej x0 - x3.
Rozpatrzmy bardziej ogólny przypadek kiedy wszystkie składniki g
µν
są funkcjami jednej zmiennej l
σ
x
σ
,
gdzie l
σ
- stałe, spełniające warunek g
ρσ
l
ρ
l
σ
= 0
(odrzucając zmienną część g
ρσ
).
Wtedy otrzymamy :
g
µν
,
σ
= u
µν
l
σ
(35.5)
gdzie u
µν
- pochodna g
µν
po l
σ
x
σ
Oczywiście mamy :
u
µν
= u
νµ
Z warunku harmoniczności (33.2) wynika, że :
g
µν
u
µρ
l
ν
= ½ g
µν
u
µν
l
ρ
= ½ u l
ρ
gdzie u = u
µµ
.
Równość tę można zapisać w postaci :
u
νρ
l
ν
= ½ u l
ρ
(33.6)
lub
[u
µν
−
½ g
µν
u ] l
ν
= 0 (33.7)
Z (33.5) znajdujemy :
Γρµσ
= ½ (u
ρµ
l
σ
+ u
ρσ
l
µ
−
u
µσ
l
ρ
)
Wyrażenie dla L (26.3) we współrzędnych harmonicznych prowadzi do następującej równości:
L =
−
g
µν
Γρµσ
Γσνρ
=
−
¼ g
µν
(u
ρµ
l
σ
+ u
ρσ
l
µ
−
u
µσ
l
ρ
)( u
σµ
l
ρ
+ u
σρ
l
ν
−
u
νρ
l
σ
)
Po przemnożeniu wyrażeń w nawiasach otrzymamy dziewięć członów, jednak nie trudno pokazać, że każdy
z nich jest równy zeru zgodnie z (33.6) oraz warunkiem l
σ
l
σ
= 0.
43
W takim razie gęstość działania jest równa zeru. Analogiczny rezultat ma miejsce w polu elektromagnetycznym,
dla którego, w przypadku fal rozprzestrzeniających się tylko w jednym kierunku, gęstość działania także jest
zerem.
Teraz powinniśmy znaleźć pseudotensor (32.3).
Mamy :
g
µν
,
µ
=
−
g
αρ
g
βσ
g
ρσ
,
µ
= u
αβ
l
µ
√−
g ,
µ
= ½
√−
g g
αβ
g
αβ
,
µ
= ½
√−
g ul
µ
(33.8)
wtedy :
(g
αβ
√−
g ) ,
µ
=
−
[ u
αβ
−
½ g
αβ
u ]
√−
g l
µ
Odpowiednio zgodnie z (33.8) i (33.7) otrzymamy :
Γσασ
(g
αβ
√−
g ) ,
µ
=
√−
g ,
α
[
−
u
αβ
+ ½ g
αβ
u ] l
µ
= 0
W rezultacie otrzymujemy :
16
π
t
µν
=
−
Γναβ
[u
αβ
−
½ g
αβ
u ] l
µ
= ½ (u
να
l
β
+ u
νβ
l
α
−
u
αβ
l
ν
) [ u
αβ
−
½ g
αβ
u ] l
µ
=
=
−
½ [ u
αβ
u
αβ
−
½ u2 ] l
µ
l
ν
(33.9)
Otrzymane wyrażenie dla t
µν
ma postać tensora.
To oznacza, że przy przekształceniu współrzędnych zachowującym charakter pola, tak że g
µν
pozostaje funkcją
tylko jednej zmiennej l
σ
x
σ
(tj. obecne są tylko fale rozprzestrzeniające się tylko w jednym kierunku ),
t
µν
przekształca się jak tensor. Takie przekształcenia współrzędnych mogą składać się tylko z wprowadzonych
współrzędnych falowych, gdzie fale poruszają się w kierunku l
µ
. Ich ogólna postać jest następująca :
x
µ
’ = x
µ
+ b
µ
, gdzie b
µ
- jest funkcją tylko lδ x
δ .
Kiedy mamy fale poruszające się w jednym kierunku energia grawitacyjna może być lokalizowana.
34) Polaryzacja fal grawitacyjnych
Aby pojąć fizyczny sens (33.9) wrócimy do przypadku kiedy fale poruszają się w kierunku osi x3, tak że
l0 = 1 , l1= l2 = 0, l3 =
−
1 oraz wykorzystamy współrzędne zbliżone do współrzędnych STW.
Wtedy z warunku harmoniczności (33.6) wynikają równości:
u00 + u03 = ½ u ; u10 + u13 = 0
u20 + u23 = 0 ; u30 + u33 =
−
½u
Stąd: u00 + u33 = u = u00
−
u11
−
u33
Co oznacza :
u11 + u22 = 0 (34.1)
Oprócz tego :
2u03 =
−
(u00 + u33 )
Teraz z (34.1) otrzymujemy :
u
αβ
u
αβ
−
½ u2 = u002 + u112 + u222 + u332
−
2u012
−
2u022
−
2u032
−
2u122 + 2u232 +2u312
– ½(u00 + u33 )
2 = u
112 + u222 + 2u122 = ½(u11 + u22 )
2 + 2u
122
W takim razie :
16π t 0
0 = ¼ (u
11 + u22 )
2 + u
122 (34.2)
oraz :
t 0
3 = t
0
0
Widać więc, że gęstość energii jest wielkością dodatnio określoną i energia przenoszona jest zgodnie z
kierunkiem osi x3 z prędkością światła.
Dla odpowiedzi na pytanie o polaryzację fal wprowadzimy operator R, obrotu na płaszczyźnie x1x2 działający
na dowolny wektor (A1A2) w następujący sposób :
RA1 = A2 ; RA2 =
−
A1 ;
Wtedy : R2 A1 =
−
A1 tj. wartości własne operatora iR przy działaniu na wektor są równe
±
1
44
Operator R działa na u
αβ
w sposób następujący ;
Ru11 = u21 + u12 = 2u12 ; Ru12 = u22
−
u11 ;
Ru22 =
−
u12
−
u21 =
−
2u12
W takim razie :
R(u11 + u22 ) = 0 i R(u11
−
u22 ) = 4u12 ; R
2 (u
11
−
u22 ) =
−
4 (u11
−
u22 )
Co oznacza, że pod działaniem operatora R , u11 - u22 jest niezmienne, pod działaniem R na, u11
−
u12 lub
u12 iR ma własności własne
±
2.
W takim razie współczynniki u
αβ
dające wkład w energię (34.2) mają spin 2.
34) Człon kosmologiczny
Uogólnione równania pola grawitacyjnego w pustej przestrzeni
R
µν
=
λ
g
µν
(35.1)
gdzie
λ
-jest stałą , rozpatrywał już Einstein.
Równanie to jest równaniem tensorowym tj. może ono być dopuszczone w charakterze prawa przyrody.
Ponieważ równania Einsteina bez członu
λ
charakteryzują się zgodnością z danymi eksperymentalnymi
dla planet układu Słonecznego, stałą
λ
należy dobrać jako dostatecznie małą, tak aby nie wynikały duże
rozbieżności dla danych doświadczalnych.
Wielkość R
µν
zawiera drugie pochodne od g
µν
, co oznacza, że wielkość
λ
ma wymiar (długość) –2.
Aby
λ
była małą wielkością, długość ta powinna być dosyć duża.
Wielkość
λ−
½ – to długość kosmologiczna rzędu promienia wszechświata.
Ten człon dopełniający (
λ
) jest dosyć istotny w teoriach kosmologicznych, jednak dla bliskich obiektów daje
niezwykle mały efekt. Aby uwzględnić ten człon w teorii pola należy wprowadzić w lagranżjanie człon
dopełniający :
Ik = c ∫d
4x gdzie c – odpowiednia stała.
Z (26.10) otrzymamy :
δIk = c ∫ ½g
µν
δg
µν√−
g d4x
Wtedy z zasady wariacyjnej δ( Ig + Ik) = 0 wynika równość :
16π [R
µν
−
½ g
µν
R] + ½ cg
µν
= 0 (35.2)
Z równania (35.1) otrzymujemy R = 4
λ
i następnie R
µν
−
½ g
µν
R =
−
λ
g
µν
.
Przy wyborze c = 32π
λ
, równanie to jest zgodne z (35.2)
Przy oddziaływaniu pola grawitacyjnego z innymi dowolnymi polami pozostaje tylko włączyć człon Ik do
pełnego działania przez co otrzymamy uogólnione równania pola z członem kosmologicznym Einsteina.
##########################################################################################
45
46
****************************************************************************************