################################################################################################
Zastosowanie analizy tensorowej
Aplication of tensor analysis
A. J. McConnell Dover Publications INC New York 1957
Przekład rosyjski Moskwa 1963
************************************************************************************************
Tłumaczenie : R. Waligóra
Pierwsze tłumaczenie : 2008
Ostatnia modyfikacja : 2022-01-20
Tłumaczenie wybranych rozdziałów
************************************************************************************************
************************************************************************************************
Część I - Algebra tensorów
Rozdział I - Oznaczenia i definicje
Paragraf 1 Symbolika indeksowa
Symbolika indeksowa stanowi znaczące narzędzie rachunku tensorowego, czytelnik oswoiwszy się z jego osobliwościami napewno doceni jego walory. Dlatego też obecny rozdział poświęcimy tylko temu systemowi oznaczeń, wykładając krótko jego zastosowanie do teorii wyznaczników, a odłożywszy do następnego rozdziału jego zastosowanie do algebry tensorowej.
Jeśli mamy dany zbiór trzech niezależnych zmiennych to mogą one być oznaczane trzema różnymi literami, np. x, y ,z, jednak wygodniej będzie oznaczyć te zmienne jedną literą, dokonując ich rozróżnienia za pomocą indeksów.
W takim wypadku możemy zapisać te trzy zmienne w formie : x1, x2, x3, lub w bardziej zwartej formie :
xr gdzie r = 1, 2, 3 (1)
Napisaliśmy indeks r na dole (tzw. indeks dolny - przypis własny), jednak równie dobrze moglibyśmy dokonać zapisu na pozycji górnej (tzw. indeks górny - przypis własny) tj. w postaci : x1 , x2, x3 lub
xr gdzie r = 1, 2, 3 (2)
Oczywiście nie należy odczytywać symbolu xr jako r-tej potęgi x. Dalej będziemy wykorzystywać zarówno dolne jak i górne indeksy. W tym rozdziale przypiszemy położeniu indeksu specjalne znaczenie.
W dalszej części zobaczymy że dla naszych celów bardziej dogodna jest forma zapisu (2) a nie (1).
Jednorodną liniową funkcję zmiennych ogólnie zapisać możemy w formie :
3
Σ am xm = a1x1 + a2x2 + a3x3 (3)
m =1
gdzie a1, a2, a3 - to stałe.
W takim razie współczynniki formy liniowej mogą być zapisane w postaci :
ar ; gdzie: r =1, 2, 3
Obiekty które podobnie jak ar i xr zależą tylko od jednego indeksów nazywamy - obiektami pierwszego rzędu,
a oddzielne litery z indeksami x1, x2, x3 i a1, a2, a3, nazywamy „elementami” lub „składowymi” obiektu.
Obiekty pierwszego rzędu mające trzy składowe nazywamy trójwymiarowymi.
Mamy dwa typy obiektów pierwszego rzędu, a mianowicie te z indeksami dolnymi i indeksami górnymi.
Z drugiej strony jednorodna kwadratowa funkcja trzech zmiennych ma postać :
3
Σ amn xmxn = a11x1x1 + a12 x1x2 + a13x1x3 + a21x2x1 + a22x2x2 + a23 x2x3 +
m, n =1
+ a31x3x1 + a32 x3x2 + a33x3x3 (5)
gdzie amn - to stałe.
Widzimy, że współczynniki formy kwadratowej zależą od dwóch indeksów i są zapisane w postaci :
amn ; gdzie : m, n = 1, 2, 3
Obiekty które zależą od dwóch indeksów nazywamy „obiektami drugiego rzędu”.
Z tego, że indeksy można zapisywać na pozycji dolnej i górnej wynika, że obiekty drugiego rzędu mogą być trojakiego rodzajów:
ars , ars , ars ; gdzie : r, s =1, 2, 3 (6)
Jak widać w przytoczonym przypadku każdy taki obiekt ma 9 składowych
Analogicznie można otrzymać obiekty trzeciego rzędu, które będą zależeć od trzech indeksów i mogą przynależeć do czterech typów :
arst , arst , arst , arst ; gdzie : r, s, t =1, 2, 3 (7)
Teraz każdy obiekt zawiera 33 czyli 27 składowych . Możemy oczywiście w analogiczny sposób budować obiekty dowolnego rzędu. Na zakończenie należy wspomnieć o obiekcie nie mającym indeksów tj. „obiekcie zerowego rzędu”. Wzięliśmy liczbę zmiennych w ilości trzech, można jednak wziąć dowolną liczbę zmiennych np. 4, wtedy indeksy będą przybierać wartości od 1 do 4.
Zadania
1. Pokazać, że obiekt piątego rzędu może mieć pięć różnych typów.
2. Jeśli liczba zmiennych równa jest 4 to ile składowych mają obiekty drugiego i trzeciego rzędu ?
Paragraf 2 Umowa sumacyjna
Wprowadzimy teraz dwie ważne umowy dotyczące zapisu indeksowego. W rachunku tensorowym mamy często do czynienia z sumami typu (3) i (5), nie trudno zauważyć, że we fwzorach tych indeksy po których dokonujemy sumowania pojawiają się dwukrotnie. Wzory te można byłoby napisać w sposób bardziej zwarty jeśli opuścić znak sumy - Σ. Może to być wykonane jeśli przyjąć, że znak ten będziemy domyślnie uwzględniali w przypadku kiedy w jednoczłonowym wyrażeniu indeks powtarza się raz na górze raz na dole.
Wtedy (3) można zapisać tak:
amxm = a1x1 + a2x2 + a3x3 (8)
a (5) przyjmie postać :
amn xmxn = a11x1x1 + a12 x1x2 + a13x1x3 + a21x2x1 + a22x2x2 + a23 x2x3 +
+ a31x3x1 + a32 x3x2 + a33x3x3 (9)
Jedyna niedogodnością takiej umowy wynika w tym przypadku kiedy chcielibyśmy wypisać dowolny jeden człon z sum (8) lub (9). Jednak jest to nam potrzebne niezmiernie rzadko i możemy dla tych przypadków umówić się, że wprowadzoną powyżej umowę o sumowaniu (jest to tzw. umowa sumacyjna Einsteina - przypis własny) stosujemy tylko wtedy kiedy powtarzający się indeks zapisany jest małą literą a zastosowanie liter dużych dla powtarzających się indeksów nie będzie oznaczało zastosowania umowy sumacyjnej.
W takim wypadku oddzielne człony sum (8) i (9) będziemy oznaczać :
aM xM , aMN xM xN
Tak więc nasza pierwsza umowa brzmi następująco :
„Powtarzający się indeks zapisany małymi literami łacińskimi oznacza sumowanie od 1 do 3”
Ponieważ, jak powiedziano powtarzający się indeks oznacza sumowanie od 1 do 3 (a ogólnie od 1 do n ), to możemy zastosować dowolne litery łacińskie do oznaczania indeksów - mało tego możemy zmienić zastosowane litery - będzie to bez znaczenia dla wartości rozpatrywanego wyrażenia. W takim wypadku możemy zapisać :
amxm = arxr = a1x1 + a2x2 + a3x3 i amn xm xn = arsxr xs
Z tej przyczyny powtarzające się indeksy nazywamy indeksami „niemymi”.
Indeks, który w dowolnym jednoczłonowym wyrażeniu nie powtarza się nazywamy indeksem „swobodnym”
(lub indeksem „wolnym” - przypis własny). W takim razie wszystkie indeksy z formuł (6) i (7) są indeksami swobodnymi, należy oczywiście zauważyć, że w tych wzorach indeksy swobodne przybierają wartości od 1 do 3.
Ten warunek dla indeksów swobodnych stanowi treść drugiej umowy, mianowicie :
„Indeksy swobodne (tj. nie powtarzające się )zapisane małymi łacińskimi literami przybierają wartości od 1 do 3”
Tak więc obiekt drugiego rzędu będziemy zapisywać teraz w formie : ars
bez jakiegokolwiek dopełniającego warunku o wartościach indeksów r, s. Innymi słowy : ars oznacza jedną z dziewięciu składowych typu:
a11 a12 a13
a21 a22 a23
a31 a32 a33
Zadania
1. Wypisać pełny układ liniowych równości zadanych wyrażeniem :
ars xrxs = br
2. Ile członów zawiera suma :amnpxmxnzp ?
3. Pokazać, że arss jest obiektem pierwszego rzędu, a nastepnie wypisać wszystkie jego składowe.
Paragraf 3. Suma, iloczyn i zawężanie obiektów
W algebrze obiektów wielo indeksowych mamy trzy główne rodzaje operacji.
Operacje te nazywamy odpowiednio : dodawaniem, iloczynem i zawężaniem
a) Dodawanie.
Operację tę stosujemy tylko do obiektów tego samego rzędu i typu. Jeśli mamy dane dwa obiekty tego samego rzędu i typu i jeśli dodamy każdą składową pierwszego obiektu z odpowiadającą tej składowej składową drugiego obiektu to oczywiście otrzymamy obiekt o tym samym rzędzie i typu co obiekty których składowe dodawaliśmy. Wynikiem dodawania będzie pewna suma. Zatem jeśli arst i brst są dwoma obiektami trzeciego rzędu to obiekt crst określony równością :
crst = arst + arst (10)
jest sumą arst i brst .
Oczywiście mówimy tutaj o sumie algebraicznej, dlatego odejmowanie możemy rozumieć jako przypadek szczególny dodawania. Oprócz tego operacja ta może być rozszerzona bezpośrednio na przypadek dowolnej ilości obiektów pod warunkiem, że są one tego samego typu.
b) Iloczyn.
Jeśli weźmiemy dwa obiekty pewnego dowolnego rzędu i przemnożymy każdą składową pierwszego obiektu przez każdą składową drugiego obiektu, to otrzymamy obiekt którego rząd będzie równy sumie rzędów tych dwóch wejściowych obiektów, obiekt który otrzymamy w rezultacie tej operacji nazywamy iloczynem dwóch obiektów. Przykładowo jeśli arst - jest obiektem trzeciego rzędu i bmn - jest obiektem drugiego rzędu to obiekt crmnst którego składowe określone są równością :
crmnst = arst bmn (11)
jest obiektem piątego rzędu i jest iloczynem arst i bmn. Taka operacja może być oczywiście stosowana do dowolnej ilości obiektów.
c) Zawężanie.
Operację zawężania wyjaśnimy na przykładzie. Weźmy obiekt piątego rzędu: arpstu posiadający - jak widać - dolne i górne indeksy. Jeśli teraz założymy, że u jest równe p otrzymamy obiekt : arpstp, tak wiec p będzie teraz indeksem powtarzającym się czyli zgodnie z umowa sumacyjną dokonamy sumowania względem niego od 1 do 3. Po tym sumowaniu otrzymamy nowy obiekt zgodnie z następująca równością :
3
arpstp = Σ arpstp = ar1st1 + ar2st2 + ar3st3 (12)
p=1
Widać, że nasz nowy obiekt (12) jest obiektem trzeciego rzędu tj. jego rząd jest o dwa rzędy niższy niż obiektu pierwotnego. Ta operacja może być powtórzona kilka razy tj. możemy przeprowadzać zawężanie względem dowolnej pary indeksów gdzie jeden z nich będzie indeksem dolnym a drugi górnym. W przytoczonym wyżej przykładzie możemy dokonać zawężania raz jeszcze po indeksach r i t, otrzymując obiekt pierwszego rzędu :
3
arpsrp = Σ arpsrp
r,p=1
Mamy jeszcze jedną operację nazywaną - iloczynem wewnętrznym, operacja ta właściwie nie jest operacją nową, a złożeniem dwóch już poznanych operacji tj. iloczynu i zawężania.
Dokonując operacji wzięcia iloczynu wewnętrznego najpierw mnożymy dane dwa obiekty a następnie zawężamy ten iloczyn względem jednego górnego indeksu pierwszego składnika iloczynu i jednego dolnego indeksu drugiego składnika. Zatem iloczyn wewnetrzny dwóch obiektów : arst i bmn będzie na przykładowo równy :
3
crms = arspbmp = Σ arspbmp
p =1
Paragraf 4 Obiekty symetryczne i antysymetryczne
Jeśli mamy obiekt amn z dwoma dolnymi indeksami to może się zdarzyć, że każda ze składowych nie zmieni się co do wielkości i znaku przy zamianie miejscami indeksów tj.
amn = anm
Taki obiekt nazywamy „symetrycznym”.
W bardziej ogólnym przypadku obiekt mający daną ilość dolnych indeksów nazywamy symetrycznym względem dwóch z nich jeśli jego składowe nie zmieniają się przy zamianie miejscami tych indeksów. Obiekt nazywamy „absolutnie symetrycznym” względem dolnych indeksów jeśli przy zamianie miejscami dowolnych dwóch indeksów jego składowe nie zmienią się. Obiekt absolutnie symetryczny trzeciego rzędu będzie spełniał zależności :
amnp = ampn = anmp = anpm = apmn = apnm
Z drugiej strony obiekt amn nazywamy „antysymetrycznym” jeśli zamiana miejscami indeksów powoduje zmianie znaku składowych, oczywiście bez zmiany wartości tych składowych, w takim przypadku mamy :
amn = − anm
Wypiszmy te równości w jawnej postaci :
a11 = − a11 czyli a11 = 0 , a22 = − a22 czyli a22 = 0 , a33 = − a33 czyli a33 = 0 ,
a12 = − a21 a23 = − a32 a31 = − a13
Obiekt może być antysymetryczny względem dowolnych dwóch dolnych indeksów lub też względem wszystkich par indeksów wtedy to, nazywamy go obiektem „absolutnie antysymetrycznym”. Absolutnie antysymetryczny obiekt trzeciego rzędu powinien spełniać następujące zależności :
amnp = − ampn = − anmp = anpm = apmn = − apnm
Naturalnie wszystko to co zostało powiedziane o obiektach symetrycznych i antysymetrycznych względem indeksów dolnych możemy bezpośrednio przenieś na obiekty posiadające indeksy górne.
Zadania
1. Ile różnych składowych zawiera absolutnie symetryczny obiekt trzeciego rzędu ?
2. Pokazać, że antysymetryczny obiekt trzeciego rzędu ma tylko sześć różnych od zera składowych jednakowych co do wielkości.
3. Udowodnić, że jeśli amn jest antysymetryczny to:
amnpxmxn = 0 i odwrotnie jeśli spełnione jest to równanie dla wszystkich wartości zmiennej xr, to amn jest antysymetryczny.
4. Jeśli ars jest obiektem drugiego rzędu spełniającym równość :
bars + casr = 0 pokazać, że albo b = − c i ars jest symetryczny albo b = c i ars jest antysymetryczny
(Podpowiedź, równanie może zostać zapisane w formie basr + cars = 0 ponieważ oba indeksy r,s przybierają te same wartości od 1 do 3. Możemy następnie dodać te równania otrzymując :
(b + c) (ars + asr ) = 0 stąd odpowiednio albo b = − c albo ars = − asr
Paragraf 5 Antysymetryczny obiekt trzeciego rzędu - symbol Kroneckera
Niech arst - będzie obiektem antysymetrycznym trzeciego rzędu tj. jego składowe są zmienne co do znaku ale nie co do wartości absolutnej przy zmianie dowolnych dwóch indeksów. Zgodnie z tym jego składowe mogą mieć tylko trzy następujące różne wartości :
0, kiedy dane dwa indeksy są równe
+a123 , kiedy rst stanowią parzystą permutację liczb 1,2,3
-a123 , kiedy rst stanowią nieparzystą permutację liczb 1,2,3
Oznaczmy przez erst obiekt antysymetryczny składowe którego mają wartości 0, +1, −1
i będziemy go nazywać e-obiektem.
Niech e123 = +1, jeśli arst - jest obiektem antysymetryczny trzeciego rzędu, to :
arst = a123 erst (13)
Można oczywiście określić odpowiedni e-obiekt dla indeksów górnych tj. erst składowe którego mają te same wartości, co i erst .
Jak dalej zobaczymy te dwa obiekty mają wielkie znaczenie dla teorii wyznaczników.
Z dwóch obiektów erst i erst możemy otrzymać inne obiekty za pomocą operacji iloczynu i zawężania.
Mnożąc te obiekty otrzymujemy :
erstemnp = δrstmnp (14)
Obiekt δrstmnp przyjmuje następujące wartości :
0, kiedy dwa lub więcej dolnych (lub górnych) indeksów są jednakowe
+1, kiedy rst i mnp stanowią permutację parzystą
-1 , kiedy rst i mnp stanowią permutację nieparzystą
Teraz zawęzimy obiekt δrstmnp w taki sposób aby otrzymać obiekt czwartego rzędu :
δrsmn = δrspmnp= δrs1mn1 + δrs2mn2 + δrs3mn3 (15)
Po pierwsze widzimy, że wyrażenie to jest równe zeru jeśli r jest równe s lub jeśli m jest równe n. Po drugie jeśli nadamy r i s odpowiednie wartości np. odpowiednio 1,2 to z (15) widzimy, że :
δ12mn = δ123mn3
i odpowiednio δ12mn będzie znikał jeśli m,n są kombinacją 1,2, następnie dla permutacji parzystej będzie równe +1, a -1 dla permutacji nieparzystej.
Jeśli dokonamy zawężenia δrsmn i pozdzielimy przez dwa otrzymany rezultat to otrzymamy obiekt drugiego rzędu :
δrm = ½ δrnmn = ½ (δr1m1 + δr2m2 + δr3m3 ) (16)
wstawiając w δrm r =1 otrzymamy :
δ1m = ½ (δ12m2 + δ13m3 )
Widzimy że δ1m znika jeśli m ≠ 1, jeśli m = 1 to δ1m = +1.
Analogiczny rezultat otrzymamy jeśli wstawić r równe 2 lub 3. Odpowiednio δrm ma wartości :
0, jeśli r ≠ m
+1 , jeśli r = m
Wszystkie te δ-obiekty ogólnie nazywamy „symbolami Kroneckera”.
Zadania
1. Wykazać, że : δrr = 3, δrstmst =2δrm , δrstrst = 3!
2. Wykazać, że : δrstimn = δrstnim = δrsmn
3. Wykazać prawdziwość następujących równości :
δrsas = ar , δrsmnamn = ars − asr
δrstmnpamnp = arst - arts + asrt + atrs - atsr
(aby udowodnić słuszność drugiej równości nadajmy r,s określone wartości R, S.
Wiemy, że δRSmn zeruje się za wyjątkiem przypadku w którym m,n przyjmuje wartości R, S i wtedy mamy :
δRSRS = − δRSSR = 1
Zgodnie z umową dotyczącą indeksów zapisanych dużymi literami mamy :
δRSmn amn = δRSSRaRS + δRSSR aSR = aRS - aSR
co jest naszym rezultatem.
Analogicznie dowodzimy również następne równości.
Paragraf 6 Wyznacznik zbudowany z obiektów drugiego rzędu ars
Pokażemy teraz w jaki sposób nasz system oznaczeń indeksowych może być zastosowany do teorii wyznaczników. Wyznacznik elementami którego są składowe obiektu |ars |
|a11 a12 a13 |
|ars | = |a21 a22 a23 | (17)
|a31 a32 a33 |
( teraz indeks górny oznacza wiersz, a dolny - kolumnę) Jeśli rozwinąć go względem kolumn to będzie on równy :
3
Σ ± ai1aj2 ak3
i,j, k =1
gdzie i,j,k wyrażają permutacje liczb 1,2,3 a znak plus lub minus stawiamy w zależności od parzystości lub nieparzystości tej permutacji.
Przypominając własności e-obiektów widzimy, że wyznacznik jest równy :
Σ eijkai1aj2 ak3
lub wykorzystując umowę sumacyjną :
|ars | = eijkai 1aj 2 ak 3 (18)
Jeśli rozwinąć wyznacznik względem wierszy można zauważyć, że otrzymamy podobny wzór
|ars | = eijk a1i a2j a3 k (19)
Rozpatrzmy obiekt :
eijkair ajs akt (20)
Udowodnimy na początku, że jest on obiektem absolutnie antysymetrycznym względem r, s, t.
Indeksy i,j,k są indeksami niemymi i jak zauważyliśmy wcześniej litera oznaczająca indeks niemy nie jest istotna. Odpowiednio zatem, nie zmieni się wartość sumy jeśli zamienimy k na indeks i, a i na k.
W takim razie mamy :
eijk air ajs akt = ekji akr ajs ai t = ekji aii ajs akr = − eijk aii ajs akr
ponieważ zmiana miejscami dwóch indeksów weijk zmienia znak tego obiektu.
Odpowiednio (20) zmienia znak jeśli r i t zamienić miejscami. Otrzymamy ten sam rezultat jeśli zmienimy miejscami dowolne dwa indeksy r,s,t co kończy nasz dowód. Oprócz tego (20) daje nam wartość |ars | kiedy r, s, t przybierają szczególne wartosci 1,2,3 odpowiednio z równości (13) możemy napisać :
eijk air ajs akt = |amn | erst (21)
I analogicznie :
eijk ari asj atk = |amn | erst (22)
Przyjęliśmy, że indeksy górne oznaczają wiersze a dolne kolumny. Równości (21) i (22) odpowiednio pokazują, że zamiana miejscami dowolnych dwóch wierszy lub kolumn zmienia znak wyznacznika jednak ale nie zmienia jego wartości absolutnej. W szczególności jeśli dwa wiersze lub dwie kolumny są jednakowe wyznacznik staje się zerem.
Jako przykład siły tej metody oznaczeń udowodnimy znane twierdzenie o iloczynie dwóch wyznaczników.
Niech elementami tych wyznaczników będą obiekty : ars i brs. Wtedy :
|ars | × | brs | = |ars | eijk bi1 bj2 bk3 = emnp ami anj apk bi1 bj2 bk3 = emnp(ami bi1 )
(anj bj2 ) (apk bk3 )
Odpowiednio jeśli zapiszemy :
crs = arm bms = ar1b1s + ar2 b2s + ar3 b3s
to otrzymamy :
|ars | × | brs | = emnpcm1cn2 cp3 = |crs |
co dowodzi wzoru dla iloczynu dwóch wyznaczników :
| ars | × | brs | = | arm bms | (23)
Zadania
1. Udowodnić, że |δrs | = 1
2. Udowodnić, że jeśli arm bms = δrs to |ars | jest wielkością odwrotną do | brs |
3. Jeśli brs ma własność : brm bms = δrs to udowodnić, że; | bms | = ± 1
4. Udowodnić, że :
δrstijk aim ajn akp = |ars | δrstmnp
δrstijk air ajs akt = 3! | ars |
5. Rozpatrzyć analogiczne wyniki dla wyznaczników dla przypadku kiedy indeksy przybierają wartości od 1 do 4
(Dla tego przypadku zobaczymy, że e-obiekty są obiektami czwartego rzędu i mamy cztery typy symboli Kroneckera)
Paragraf 7 Dopełnienie algebraiczne elementu wyznacznika
Jeśli wyznacznik (17) rozpisać w pełnej formie to widać, że dany element ari pojawia się po jednym razie w pewnej liczbie składników tego rozkładu. Współczynnik przy ari w takim rozkładzie nazywamy „dopełnieniem algebraicznym” elementu ari i oznaczamy go Ari .
Nasz cel polega na tym aby znaleźć jawne wyrażenie dla dopełnienia algebraicznego Ari.
Rozpatrzmy element ar1.
Z równości (18) widać że jeśli jego dopełnienie algebraiczne jest postaci :
erst as2 at3 to może być zapisane w postaci :
e123erst as2 at3 = (1/2!) e1jkerst asj atk = (1/2!) δ1jkrst asj atk
lub
A1r = (1/2!) e1jkerst asj atk
Podobny rezultat otrzymamy dla dopełnień algebraicznych : A2r , A3r .
Tym sposobem widać, że dopełnienie algebraiczne elementu ari można zdefiniować wzorem :
Air = (1/2!) δijkrst asj atk (24)
Otrzymawszy wyrażenia dla dopełnień algebraicznych Air możemy teraz znaleźć rozkład
wyznacznika względem elementów danej kolumny lub wiersza.
Rozpatrzmy obiekt amr Aim
Mamy :
amr Aim = (1/2!) δijkmstamr asj aik = (1/2!) eijk emstamr asj aik = (1/2!) eijk erjk | apq | =
= (1/2!) | apq | δijkrjk
Odpowiednio jeśli oznaczyć wyznacznik przez A to :
amr Aim = A δir (25)
Wzór ten daje rozkład wyznacznika względem r-tej kolumny. Czytelnik bez trudu dowiedzie analogicznej tożsamości :
aim Amr = A δir (26)
która jest rozkładem wyznacznika względem i-tego wiersza .
Wyrażenia te mogą być zapisane w nieco innej formie, która później okaże się bardzo użyteczna. Jeśli A nie jest równe zeru to możemy napisać :
air = Air / A
tj. air jest dopełnieniem algebraicznym elementu ari w A podzielonym przez A.
Wzory (25) i (26) przyjmują postać :
amr aim = aim amr = δir (27)
Ćwiczenia
1. Wyrazić dopełnienia algebraiczne stowarzyszone przez elementy dopełnienia algebraicznego.
Dopełnieniem algebraicznym stowarzyszonym z dopełnieniem algebraicznym A nazywamy wyznacznik elementy którego równe są Air .
Oznaczmy przez A~ i A~ ri wyznacznik stowarzyszony i jego dopełnienie algebraiczne. Chcemy wyrazić te elementy przez A i jego elementy. Mamy, zgodnie z prawem mnożenia wyznaczników :
A~ A = | Aim amr | = | A δir | = A3 | δir | = A3
Odpowiednio jeśli A ≠ 0
A~ = A2
Stosując (25) do wyznacznika stowarzyszonego otrzymamy :
A~ ri Ais = δrs A~
Jeśli pomnożymy tą równość przez asj i zsumujemy po s od 1 do 3 otrzymamy :
A~ ri δij A = arj A~
tj.
A~ rj A = arj A~ arj A2
Czyli w rezultacie otrzymujemy żądany wynik :
A~rj = A arj
2. Udowodnić, że :
erst Air = eijk asj aik i eijk Air = erst asj aik
3. Udowodnić, że :
eijmn amr ans = air ajs - ajrais = δijkrst Atk
4. Udowodnić, że :
A= (1/3!) δijkrst ari asj atk ajs i amr Arm = 3A
5. Udowodnić, że :
∂A/ ∂ari = Air
Paragraf 8 Równania liniowe
Układ trzech równań liniowych może być zapisany w następującej formie :
a11 x1 + a12 x2 + a13 x3 = b1
a21 x1 + a22 x2 + a23 x3 = b2
a31 x1 + a32 x2 + a33 x3 = b3
Wykorzystując umowę sumacyjną otrzymamy :
arm xm = br (28)
Znajdźmy rozwiązanie tego układu.
Założymy w pierwszej kolejności, że A ≠ 0, wtedy jeśli pomnożyć (28) przez Air i dokonać sumowania po r od 1 do 3 otrzymamy :
Airarmxm = Airbr
lub
Aδimxm = Aimbm (29)
Jednak mamy :
δimxm = xi
tak więc odpowiednio dzieląc (29) przez A otrzymujemy :
xi = (Aimbm) / A (30)
Łatwo sprawdzić przez bezpośrednie podstawienie, że (30) jest rozwiązaniem zadanego układu równań , widzimy również że jest to rozwiązanie jedyne. Jeśli A=0 ale nie wszystkie dopełnienia algebraiczne elementów wyznacznika są równe zeru to z (29) widać że układ równań jest sprzeczny z wyjątkiem przypadku kiedy Aim bm = 0
Jeśli ma to miejsce to: Air ( ars xs − br ) = 0 .
Stąd widać że równania (28) są liniowo zależne. W takim razie powinniśmy szukać rozwiązań tylko dwóch równań, ponieważ trzecie będzie wtedy spełnione automatycznie. Interesujący przypadek mamy, kiedy w (28)
br = 0. Wtedy widzimy, że przy A ≠ 0 układ równań ma jedyne rozwiązanie xr = 0.
Jeśli A= 0 to równania nie są niezależne wtedy można znaleźć niezerowe wartości xr które spełniają układ równań.
W takim razie równość A = 0 jest warunkiem koniecznym i wystarczającym aby układ równań armxm = 0 posiadał niezerowe rozwiązania.
Zadania
1. Pokazać, że jeśli wszystkie dopełnienia algebraiczne Air równe są zeru to
airajs = ajais i układ równań (28) jest sprzeczny za wyjątkiem przypadku kiedy
biajr = bjair
2. Jeśli warunki zadania 1. są spełnione to pokazać, że te trzy równania są równoważne jednemu równaniu
************************************************************************************************
Rozdział II - Tensory
Paragraf 1 Przekształcenia liniowe
Niech zmienne x1, x2, x3 przekształcają się (transformują się) w nowe zmienne x'1, x'2, x'3 za pomocą przekształcenia liniowego postaci :
x'1 = c11 x1 + c12 x2 + c13 x3
x'2 = c21 x1 + c22 x2 + c23 x3
x'3 = c31 x1 + c32 x2 + c33 x3
gdzie crs - to stałe .
Stosując umowę o sumowaniu możemy ten układ równań zapisać w następującej formie :
x'r = crs xs (1)
Zakładamy, że wyznacznik tego przekształcenia c = | crs | nie jest równy zeru.
Niech γrs będzie dopełnieniem algebraicznym elementu crs w wyznaczniku c, podzielonym przez c.
Wtedy :
crm γms = γrm cms = δrs (2)
możemy zatem rozwiązać układ równań (1) względem x :
xr = γrm x'm (3)
To pokazuje że dane przekształcenie jest przekształceniem odwracalnym tj. jeśli crs = δrs to mamy :
x'r = xr tj. przekształcenie tożsamościowe.
Jeśli przejdziemy najpierw od zmiennych xr do zmiennych x'r za pomocą (1) a następnie od zmiennych xr' do zmiennych xr'' przy pomocy przekształcenia:
x''r = c'rs x's
to zauważymy, że przejście od xr do x''r zadane jest wzorem :
x''r = c''rs xs
gdzie
c''rs = c'rm cms
Jest również przekształceniem liniowym.
Mówimy, że zbiór przekształceń tworzy grupę kiedy spełnia on następujące warunki :
1. jeśli przekształcenia od xr do x'r oraz od x'r do x''r należą do tego zbioru to przekształcenie od xr do x''r również należy do tego zbioru
2. zbiór przekształceń zawiera przekształcenie tożsamościowe oraz przekształcenia odwracalne
W takim razie zbiór przekształceń liniowych tworzy grupę
Zadania
1. Udowodnić, że γ = | γrs | = 1/c
2. Udowodnić, że |c''rs | = |c'rs | |crs |
Paragraf 2 Inwarianty, wektory ko- i kontrawariantne
Postawmy teraz następujące pytanie. Niech będą dane obiekty różnych rzędów z którymi spotykaliśmy się w poprzednich rozdziałach. Według jakich reguł powinny przekształcać się te obiekty jeśli zmienne w nich występujące przekształcają się za pomocą przekształceń liniowych. To pytanie prowadzi nas do definicji tensora.
Tensor jest szczególnym przypadkiem obiektu rozpatrywanego w poprzednim rozdziale, którego składowymi są liczby lub funkcje które przy przekształceniach liniowych zmiennych (1) przekształcają się według pewnego ściśle określonego prawa. Istnieją tensory zerowego, pierwszego, drugiego, trzeciego itd. rzędu, tak samo jak istnieją wszelkie inne obiekty tych rzędów.
Z początku rozpatrzymy obiekt zerowego rzędu tj. po prostu liczbę lub funkcję. Jeśli ten obiekt ma jedną i tylko jedną wartość w nowych zmiennych x'r i w starych zmiennych xr to nazywamy go „skalarem” lub „inwariantem” lub „tensorem zerowego rzędu” . Odpowiednio jeśli „a” jest inwariantem , to :
a' = a (4)
gdzie a' - jest wartością danego obiektu w nowych zmiennych.
Rozpatrzymy teraz obiekt „pierwszego” rzędu . Prostszym typem takiego obiektu jest zbiór samych zmiennych a mianowicie xr. Składowe tego obiektu przekształcają się według wzoru :
x'r = crs xs
Wzór ten daje jeden ze sposobów za pomocą którego możemy przekształcać obiekt pierwszego rzędu.
Dany obiekt - składowe którego przekształcają się według tego prawa nazywamy „tensorem kontrawariantnym pierwszego rzędu, lub wektorem kontrawariantnym.
W takim razie ar jest wektorem kontrawariantnym jeśli przy przekształceniach zmiennych (1) jego składowe przekształcają się według wzoru :
ar = crs as (5)
Mamy również drugi sposób przekształcenia elementów obiektu pierwszego rzędu .
Widzieliśmy że współczynniki formy liniowej zmiennych x także obrazują obiekt pierwszego rzędu.
W takim razie współczynniki formy liniowej amxm są składowymi obiektu ar .
Zakładamy że składowe ar przekształcają się w taki sposób aby forma liniowa amxm pozostała inwariantna względem przekształceń zmiennych (1). Jeśli oznaczymy przez x'r nowe składowe obiektu ar (po przekształceniu) to otrzymamy :
a'm x'm = amxm
ta forma liniowa jest inwariantem. Tak więc z (3) wynika :
a'm x'm = am γpm x'p
Ponieważ indeks niemy może być oznaczony dowolną literą to ten układ równań można zapisać w postaci :
(a'p − am γpm ) x'p = 0
Jeśli to wyrażenie jest spełnione dla wszystkich wartości zmiennych x'r to powinna być spełniona równość :
a'r = γrm am (6)
To przekształcenie oczywiście jest inne niż przekształcenie żadne wzorem (5).
Obiekt pierwszego rzędu składowe którego przekształcają się według tego prawa nazywamy „tensorem kowariantnym pierwszego rzędu”. W takim razie mamy dwa typy tensorów pierwszego rzędu i umawiamy się że ich rozróżnienia dokonujemy za pomocą położenia indeksu. Jeśli tensor kontrawariantny oznaczymy indeksem górnym to tensor kowariantny oznaczymy dolnym. Innymi słowy - indeks górny oznacza kowariantność a dolny kowariantność.
Zadania
1. Pokazać, że :
ar = (∂x'r / ∂xs) as ; a'r = (∂xs / ∂x'r ) as ,
2. Sprawdzić formuły :
ar = γmr a'm ; ar = crm a'm
3. Pokazać, że jeśli ϕ jest inwariantną funkcją zmiennych xr to obiekt ∂ϕ / ∂xr jest wektorem kowariantnym
4. pokazać, że różniczki zmiennych dxr obrazują wektor kontrawariantny
Paragraf 3 Tensory dowolnego rzędu
Naszym następnym krokiem będzie zbadanie obiektów wyższego niż pierwszy rzędu i rozpatrzenie pytania o prawo ich przekształcenia.
Rozpatrzmy obiekt drugiego rzędu. Prostszym przykładem takiego obiektu jest iloczyn dwóch wektorów lub ogólnie obiektów pierwszego rzędu. Taki iloczyn może mieć trzy formy :
iloczyn dwóch wektorów kontrawariantnych
iloczyn dwóch wektorów kowariantnych
iloczyn wektora ko- i kontrawariantnego
Przykład : (ar bs ) jest obiektem drugiego rzędu który jest jak widać iloczynem dwóch wektorów kontrawariantnych
ar i bs. Składowe tego obiektu w nowych zmiennych zadane są wzorami :
( a'rb's ) = (cmr am )(cns bn ) = cmr cns (am bn )
Odpowiednio obiekt drugiego rzędu ars może mieć prawo przekształcenia postaci :
a'rs = cmr cns amn (7)
Obiekt którego składowe przekształcają się według tego prawa nazywamy „tensorem kontrawariantnym drugiego rzędu”. Jest on oznaczany przy pomocy dwóch górnych indeksów.
Przykład : (arbs) jest obiektem drugiego rzędu który jest iloczynem dwóch wektorów kowariantnych ar i bs.
Jego składowe w nowych zmiennych będą następujace :
( a'rb's) = (γrm am )(γsn bn ) = γrm γsn (am bn )
Odpowiednio obiekt drugiego rzędu ars może mieć prawo przekształcenia postaci :
a'rs = γrm γsn amn (8)
Obiekt którego składowe przekształcają się według tego prawa nazywamy „tensorem kowariantnym drugiego rzędu” Jest on oznaczany przy pomocy dwóch dolnych indeksów.
3) Przykład końcowy : (arbs) jest obiektem drugiego rzędu który jest iloczynem dwóch wektorów - kontrawariantnego ar i kowariantnego bs. Jego składowe w nowych zmiennych będą nastepujace :
( a'rb's) = (cmr am )(γsn bn ) = cmr γsm (am bn )
Odpowiednio, zatem obiekt drugiego rzędu ars może mieć prawo przekształcenia postaci :
a'rs = cmr γsn amn (9)
Obiekt którego składowe przekształcają się według tego prawa nazywamy „tensorem mieszanym drugiego rzędu” Jest on oznaczany przy pomocy jednego górnego i jednego dolnego indeksu.
Zapewne nie będzie trudne, dla czytelnika uogólnienie tych definicji na obiekty dowolnego rzędu. Rozpatrzmy, dla przykładu tensor trzeciego rzędu. Oczywiście jednym z przykładów takiego tensora jest iloczyn trzech wektorów. Weźmy więc obiekt ar bsct zgodnie z prawem przekształcenia wektorów otrzymamy :
( a'rb'sc't) = (cmr am )(γsn bn) (γlp cp) = cmr γsn γlp (am bn cp)
Odpowiednio obiekt arst może być przekształcony zgodnie z prawem :
a'rst = cmr γsn γlp amnp (10)
Obiekt którego składowe przekształcają się według tego prawa nazywamy „tensorem mieszanym trzeciego rzędu” - jeden raz kontrawariantny i dwa razy kowariantny.
(mówimy również że jest to tensor mieszany typu (1,2) - gdzie pierwsza liczba w nawiasie oznacza krotność kontrawariantności a druga kowariantności - przypis własny)
W charakterze mnemotechnicznego prawa zapisu i pomocy w zapamiętywaniu przekształceń tensorów można przedstawić co następuje :
a) typowym przykładem wektora kontrawariantnego jest xr, wszystkie kontrawarintne wektory przekształcają się według tego prawa co xr
b) Typowym wektorem kowariantnym jest ∂ϕ/ ∂xr gdzie ϕ jest inwariantną funkcją zmiennych xr i wszystkie kowariantne wektory przekształcają się według tego prawa co
∂ϕ / ∂xr
c) Typowym tensorem dowolnego rzędu jest iloczyn wektorów następującego typu:
dla każdego kontrawariantnego (lub górnego) indeksu bierzemy wektor kontrawariantny w charakterze jednego z czynników oraz dla każdego kowariantnego (lub dolnego) indeksu bierzemy odpowiednio wektor kowariantny jako kolejny składnik iloczynu.
Zauważmy, że każda składowa tensora w nowych zmiennych jest kombinacją liniową jego składowych w starych zmiennych. Odpowiednio, zatem jeśli wszystkie składowe tensora w układzie zmiennych wejściowych są równe zeru to będą one równe zeru w każdym innym układzie zmiennych. Jest to najważniejsza cecha tensorów.
Inną ważną cechą którą należy podkreślić jest pewna „dowolność tensorów”. Możemy wziąć w charakterze składowych tensora w pewnym układzie współrzędnych dany układ liczb w potrzebnej ich ilości i określić jego składowe w dowolnych innych układach współrzędnych za pomocą układu równań liniowych wyrażających prawo przekształcenia danego tensora.
W takim razie jeśli chcemy otrzymać tensor trzeciego rzędu w przestrzeni trójwymiarowej postaci : 1,2 możemy wziąć dowolny układ 9 liczb arst w charakterze składowych tensora w zmiennych xr , wtedy składowe a'rst w zmiennych x'r będą określone układem równości (10)
Zadania
1. Napisać prawo przekształcenia dla różnych typów tensorów czwartego rzędu.
2. Pokazać, że ∂2ϕ /∂xr∂xs jest tensorem kowariantnym drugiego rzędu jeśli ϕ jest inwariantną funkcją względem xr
3. Pokazać, że jeśli mamy wyrażenie postaci : arst = brs ct wiążące tensory arst i brs w pewnym układzie zmiennych to ta sama tożsamość ma miejsce w dowolnym innym układzie zmiennych.
4. Pokazać, że δrs , δrsmn ,δrstmnp są tensorami tj. że symbole Kroneckera są tensorami.
(ten wniosek wynika z równania (2) )
5. Pokazać, że jeśli tensor w pewnym układzie zmiennych jest symetryczny (lub antysymetryczny ) to w dowolnym, innym układzie zmiennych będzie również symetryczny (lub antysymetryczny)
Paragraf 4 Dodawanie, mnożenie i zawężanie (kontrakcja) tensorów
W poprzednim rozdziale widzieliśmy, że dodanie odpowiadających sobie składowych dwóch obiektów jednego tego samego rzędu i typu daje inny obiekt tego samego rzędu i typu .
W takim razie jeśli mamy dwa obiekty trzeciego rzędu arst i brst , to równanie :
crst = arst + brst (11)
określa trzeci obiekt nazywany sumą tych, dwóch wejściowych obiektów.
Później pokażemy, że jeśli arst i brst , są tensorami trzeciego rzędu to i crst jest tensorem trzeciego rzędu.
Dla składowych w nowym układzie zmiennych mamy :
c'rst = a'rst + b'rst = cmr γsn γt p amnp + cmr γsn γt p bmnp = cmr γsn γtp
(amnp + bmnp ) = cmr γsn γt p cmnp
co dowodzi naszego stwierdzenia.
W takim razie operacja „dodawania” zastosowana do dwóch tensorów daje tensor tego samego rzędu i typu. Wszystko to co powiedzieliśmy jest słuszne także i dla odejmowania jako szczególnego przypadku dodawania .
Z tych rezultatów bezpośrednio wynika, że układ równań :
amr = bmr
stanowi taka zwane „równanie tensorowe”. Pod tą nazwa należy rozumieć to, że jeśli te równości są słuszne w pewnych dowolnych układach zmiennych, to są one słuszne i we wszystkich innych. Aby to udowodnić należy po prostu zauważyć, że w tensorze ( amr − bmr ) w jednym z układów zmiennych wszystkie składowe są równe zeru i odpowiednio ma to miejsce we wszystkich innych układach zmiennych.
Zauważyliśmy wcześniej, że przy pomnożeniu każdej składowej jednego obiektu przez składową drugiego, otrzymamy obiekt którego rząd będzie równy sumie rzędów czynników iloczynu. W takim razie jeśli arst jest obiektem trzeciego rzędu a bqp - obiektem drugiego rzędu , to obiekt cqstpr będący iloczynem obiektów wejściowych określony zależnością :
cqstpr = bqpastr (12)
jest obiektem piątego rzędu.
Pozostawiamy czytelnikowi w charakterze ćwiczenia udowodnienie tego, że jeśli astr i bqp są tensorami to cqstpr jest tensorem piątego rzędu z odpowiednio rozłożonymi indeksami dolnymi i górnymi.
Działanie mnożenia zastosowane do tensorów daje w wyniku również tensor. Należy również zauważyć, że w działaniach mnożenia i dodawania indeksy dolne pozostają dolnymi a górne górnymi.
Na koniec rozpatrzymy operacje „zawężania” zobaczymy, że operacja ta zastosowana do tensorów daje znowu tensor. Weźmy tensor mieszany dla uproszczenia np. trzeciego rzędu i oznaczmy go asrr. Jeśli przypomnimy sobie, że indeks niemy oznacza sumowanie od 1 do 3 to oczywiste jest, że rząd obiektu zmniejszy się o dwa za sprawą zsumowania jednego indeksu ko- a drugiego kontra- wariantnego. Pokażemy, że zawężony tensor jest również tensorem.
Oznaczając jak zwykle przekształcone składowe literkami z apostrofem; mamy :
a'str = cmr γsn γtpanpm
Dokonując zawężania po „r” i „t” otrzymujemy następujące wyrażenie:
a'str = cmr γsn γtpanpm = δmp γsn anpm = γsnanpp
które to pokazuje, że bs = asrr jest tensorem kowariantnym.
I tak widzimy, że trzy elementarne operacje : dodawanie, mnożenie i zawężanie - są operacjami tensorowymi, i dowolna ich kombinacja wykonana nad zadanymi tensorami przywodzi naturalnie do tensorów.
Często możemy rozpoznać charakter tensorowy pewnego zadanego obiektu zauważając, że jest on wynikiem operacji nad znanymi tensorami. Przykładowo : jeśli amn i bmn - są dwoma tensorami to amnbmn będzie inwariantem ponieważ jest on wynikiem mieszanej operacji mnożenia i zawężania dwóch tensorów (zawężamy względem pary indeksów)
Zadania
1. Pokazać, że astr brp jest tensorem trzeciego rzędu
2. Pokazać, że równości : (astr + bstp ) xt = ksr są układem równań tensorowych
Paragraf 5 Odwrotna cecha tensorowa (kryterium charakteru tensorowego) (twierdzenie ilorazowe)
Nich będzie dany układ równań postaci :
Astr Bst = Cr
wiążący obiekty Astr Bst i Cr
Jeśli wiadomo, że Astr i Bst są tensorami, określonymi przez rozkład ich indeksów, to możemy założyć, że Cr również jest tensorem, ponieważ jest on wynikiem złożonej operacji mnożenia i zawężania dwóch tensorów.
Ważnym zagadnieniem jest umiejętność rozpoznania tensorów tak zwanym, odwrotnym sposobem : mianowicie jeśli wiemy, że Cr i Bst - są tensorami to czy możemy założyć, że Astr jest również tensorem.
Istnieje następująca cecha którą teraz przedstawimy w prostej formie, która jednak może być uogólniona na obiekt dowolnego rzędu. Jeśli mamy daną zależność:
A(r,s,t)Bst = Cr (13)
W której wiadomo, że Cr jest pewnym określonym tensorem a Bst - dowolnym tensorem to A(r,s,t) także jest tensorem który może być przedstawiony jako Astr
W celu udowodnienia tego twierdzenia zbudujmy przekształcenie liniowe typu (1) zmiennych xr i x'r gdzie apostrof nad literką odnosi się do nowych zmiennych. Mamy :
A(r,s,t)B'st = C'r= csrCm = csr A(r,s,t) Bnp i
Bnp = γsn γtp B'st
Dlatego :
[A'(r,s,t) - cmr γsn γtpA(m,n,p)] B'st = 0 (14)
Jednak Bst jest dowolnym tensorem i odpowiedniozatem B'st jest również tensorem. Dlatego wszystkie współczynniki przy Bst w (14) powinny być równe zeru, lub A'(r,s,t) = cmr γsn γtpA(m,n,p)
To jednak pokazuje, że A(r,s,t) jest tensorem trzeciego rzędu i jego prawidłowy zapis ma postać : Astr
Ważne jest aby zauważyć, że tensor Bst może być dowolnym tensorem symetrycznym lub antysymetrycznym.
Istnieje ważny szczególny przypadek, udowodnionego twierdzenia. Załóżmy, że xr yr zr - to trzy dowolne wektory z których dwa pierwsze są kontrawariantne a ostatni kowariantny.
Jeśli wiemy, że Astr xsytzr jest inwariantem to na podstawie w/w twierdzenia możemy stwierdzić, że Astr jest tensorem trzeciego rzędu tj. współczynniki inwariantnej formy wieloliniowej o zmiennych xr yr zr przedstawiają tensor. Tą własność niekiedy przyjmuje się jako definicję tensora , z niej łatwo wyprowadzić prawo przekształcenia tensorów przy liniowych przekształceniach zmiennych.
Zadania
1. Udowodnić, że jeśli w zależności (13) Bst jest tensorem symetrycznym a Cr jest dowolnym tensorem to
[A(r,s,t) + A(r,t,s)] jest tensorem Jako konsekwencje wyprowadzić to, że jeśli A(r,s,t) jest obiektem symetrycznym względem indeksów s, t to A(r,s,t) jest tensorem.
2. Udowodnić, że jeśli w zależnościach (13) Bst jest tensorem antysymetrycznym a Cr jest dowolnym tensorem to [A(r,s,t) − A(r,t,s)] jest tensorem. A jeśli A(r,s,t) jest obiektem antysymetrycznym względem s,t to A(r,s,t) jest tensorem
3. Udowodnić, że jeśli amn xm xn jest inwariantem a amn - obiektem symetrycznym to amn jest tensorem
Paragraf 6 Pseudotensory
Rozszerzymy obecnie definicje tensora , wprowadzając nowe pojecie tensora „względnego” lub „pseudotensora”.
Do tej pory obiekt astr nazywaliśmy tensorem jeśli przekształcał się on według następującego prawa :
a'str = cmr γsn γtpanpm (15)
Przekształcenie samych zmiennych xr w zmienne x'r miało postać :
xr = γsr xs (16)
przy czym wyznacznik tego przekształcenia
γ = | γji | ≠ 0 (17)
Rozszerzymy obecnie pojecie tensora na obiekt astr który przekształca się według prawa :
a'str= (γ)M cmr γsn γtpanpm (18)
gdzie pod wyrażeniem (γ)M rozumiemy wyznacznik γ podniesiony do potęgi M.
Prawo przekształcenia (18) różni się od (15) tylko składnikiem (γ)M. Prawo przekształcenia (15) jest tylko szczególnym przypadkiem prawa (18), odpowiadającym M = 0, tak więc widzimy, że nowe prawo zawiera w sobie stare. Obiekt który przekształca się według (18) nazywamy pseudotensorem, a liczbę M - jego „wagą”.
Tensory o których mówiliśmy do tej pory miały wagę równą zeru, chcąc je odróżnić od pseudotensorów nazywamy je tensorami „absolutnymi” lub „właściwymi”.
Ogólnie pod słowem tensor będziemy rozumieć tensor właściwy, jeśli wyraźnie nie określimy, że chodzi nam o pseudotensor. Pseudo tensory rzędu zerowego i pierwszego nazywamy odpowiednio pseudo skalarami i pseudowektorami . Będziemy w przeważającej większości zajmować się wektorami właściwymi i skalarami.
Ważne jest zauważyć, że jeśli znamy pewien dowolny pseudoskalar o wadze jeden to możemy natychmiastowo przekształcić dany pseudotensor w tensor właściwy. Otóż załóżmy, że wielkość K jest pseudoskalarem o wadze 1 i że astr jest pseudotensorem o wadze M. Prawo przekształcenia wielkości K' zdefiniowane jest zależnością :
K' = γ K
I odpowiednio
K'M = (γ)M KM
Innymi słowy KM jest pseudoskalarem o wadze M. Oprócz tego:
a'str = (γ)M cmr γsn γtpanpm
odpowiednio więc :
(K'-M a'str ) = cmr γsn γtp (K-M anpm)
tj. (K-M astr) jest tensorem właściwym. W związku z tym będziemy wszędzie gdzie to tylko możliwe wykorzystywać ten sposób przekształcenia pseudotensorów w tensory właściwe, tak więc zgodnie z tym będziemy prawie zawsze mieć do czynienia z tensorami właściwymi.
Pozostawiamy czytelnikowi sprawdzenie następujących własności pseudotensorów : (przypominających oczywiście własności tensorów)
1. Dodawanie. Jeśli dodajemy odpowiadające sobie składowe dwóch pseudotensorów jednego i tego samego rzędu i typu oraz mających tą samą wagę M otrzymujemy pseudotensor o wadze M, który jest sumą dwóch wejściowych tensorów
2. Iloczyn. Jeśli przemnożymy każdą składową pseudotensora o wadze M i rzędu m, przez każdą składową pseudotensora o wadze N i rzędzie n otrzymamy pseudotensor o wadze M+ N i rzędzie m + n który nazywamy iloczynem dwóch wejściowych pseudotensorów
3. Zawężanie. W rezultacie operacji zawężania względem górnego i dolnego indeksu otrzymamy pseudotensor o tej samej wadze co pseudotensor wejściowy jednak o rzędzie mniejszym o dwa.
4, Kryterium charakteru tensorowego dla pseudotensorów. Jeśli mamy zależność :
A(r,s,t)Bst = Cr
gdzie wiadomo, że Cr jest pseudotensorem o wadze W, a Bst jest dowolnym pseudotensorem o wadze N, to A(r,s,t) jest pseudotensorem o wadze W-N który należy oznaczać Astr.
Dowód tych własności jest prawie taki sam jak dla tensorów właściwych jedyna różnica jest w tym, że należy do praw przekształceń wprowadzić dodatkowy mnożnik.
Zadania
1, Sprawdzić czy erst i erst - są pseudotensorami o wadze odpowiednio −1 i 1
Ze wzorów (21) i (22) mamy :
(1/γ) erst = emnp cmr cns cpt i γ erst = emnp γrm γsn γtp
Równości te mogą być zapisane w postaci :
erst = (γ)−1 γrm γsn γtp emnp i erst = γ cmr cns cpt emnp
W takim razie e-obiekty mają takie same składowe w danym układzie zmiennych , mianowicie : 0, 1,−1 w zależności od permutacji indeksów. Odpowiednio e-obiekty również w układzie zmiennych xr' mogą być oznaczane przez erst
i erst. Dlatego dwie ostatnie równości dają prawo przekształcenia e-obiektów i widzimy bezpośrednio, że erst jest pseudotensorem kowariantnym trzeciego rzędu o wadze -1 a erst jest pseudotensorem kontrawariantnym trzeciego rzędu o wadze 1.
2. Wywieść z zadania 1 to, że symbole Kroneckera są tensorami właściwymi.
3. Pokazać, że jeśli wszystkie składowe pseudotensora równe są zeru w jednym układzie zmiennych to będą one równe zeru w każdym innym układzie zmiennych.
4. Pokazać, że jeśli wszystkie składowe dwóch pseudotensorów tego samego rzędu i o tej samej wadze są równe w jednym układzie zmiennych to są one równe w każdym innym układzie zmiennych.
( Dwa tensory składowe których są równe wzajemnie w danym układzie zmiennych nazywamy - „równymi”)
5. Pokazać, że jeśli astr jest pseudotensorem zależnym od parametru α to pochodna tego pseudotensora względem tego parametru jest pseudotensorem tego samego rzędu.
(Ten rezultat otrzymujemy drogą różniczkowania równania określającego prawo przekształcenia tensora, zauważając, że cnm są stałymi)
Paragraf 7 Przekształcenia w ogólnej formie
Do tej pory rozpatrywaliśmy tylko liniowe przekształcenia zmiennych i określiliśmy tensory różnych typów tylko względem takich przekształceń. Teraz wprowadzimy bardziej ogólne przekształcenia zmiennych i zobaczymy czy możemy rozciągnąć definicję tensora tak aby zawierała również tę nowe przekształcenia.
Załóżmy, że wzory przekształceń mają postać :
x'r = fr (x1 , x2 , x3 ) (19)
gdzie f1 f2 f3 są dowolnymi funkcjami. Zakładamy również, że funkcje z którymi będziemy mieć do czynienia są odpowiedniej klasy - tj. są odpowiednio do potrzeb różniczkowalne. oraz, że przekształcenie (19) jest odwracalne.
Tak więc możemy napisać wzór dla przekształcenia odwrotnego postaci :
xr= gr (x'1, x'2 , x'3 ) (20)
Aby to przekształcenie było odwracalne konieczne i dostateczne jest aby wyznacznik :
c = | ∂x'r / ∂xs| ≠ 0 (21)
jest to tzw. Jakobian przekształcenia.
Należy zauważyć, że przekształcenie liniowe (1) jest tylko szczególnym przypadkiem ogólnego przekształcenia (19), mianowicie kiedy funkcje w prawej części (19) są jednorodne i liniowe.
Jeśli weźmiemy różniczki od (19) i od (20) to otrzymamy :
dx'r = (∂x'r / ∂xs)dxs (22)
dxr = (∂xr / ∂x's )dxs' (23)
Jeśli przyjąć :
csr = ∂x'r / ∂xs ; γsr = ∂xr / ∂x's (24)
To równania (22) i (23) przyjmą postać :
dx'r = csr dxs ; dxr = γsr dx's
Innymi słowy, przekształcenie różniczek jest liniowe - analogicznie przekształceniom (1) i (3)
Istotna różnica polega na tym, że teraz współczynniki c i γ są zmiennymi funkcjami x'r lub xr
Zadania
1. Pokazać, że układ równań (19) jest grupą
2. Udowodnić, że :
(∂x'r / ∂xm) (∂xm / ∂x's ) = δsr = (∂xr / ∂x'm ) (∂x'm / ∂xs)
3. Udowodnić, że :
| ∂x'r / ∂xs | = 1/ | ∂xr / ∂x's |
4. Pokazać, że jeśli założymy, że ∂x'r / ∂xs są stałe to otrzymamy ogólne przekształcenie liniowe zmiennych.
Paragraf 8 Tensory a przekształcenia ogólnego typu
Określimy teraz jaki jest związek między tensorami a wprowadzonymi w poprzednim paragrafie przekształceniami w ogólnej formie (19).
Jeśli dany mamy zbiór funkcji, obrazujących obiekt pewnego typu, mówimy, że ten obiekt jest tensorem względem przekształceń (19) jeśli jest on tensorem względem liniowych przekształceń różniczek (22), (23)
Podobnie będzie dalej, jeśli obiekt astr będzie pseudotensorem o wadze M względem ogólnego przekształcenia jeśli jego składowe a'str w nowych zmiennych spełniają zależności:
a'str = |∂xi / ∂x'j |M (∂x'r / ∂xm) (∂xn / ∂xs') (∂xp / ∂x't ) anpm (25)
(dla pewnej wygody mnemotechicznej warto zapamiętać pewną zależność : indeksy wolne r,s,t z apostrofem w prawej części przynależą do liter z apostrofem w obiekcie a'str ) dla wszystkich wartości zmiennych.
Jak i poprzednio tensory rzędu jeden oraz zerowego nazywamy odpowiednio wektorami i skalarami a pseudotensory o wadze zero nazywamy tensorami właściwymi. Tak jak przekształcenie liniowe jest tylko szczególnym przypadkiem ogólnego przekształcenia , to wszystkie obiekty które są tensorami względem ogólnych przekształceń są również tensorami względem przekształceń liniowych. Jednak twierdzenie odwrotne jest nie słuszne : istnieją obiekty które są tensorami względem przekształceń liniowych a nie są tenorami względem przekształceń w ogólnej formie. Przykładowo same zmienne są wektorami względem przekształceń liniowych jednak nie są wektorami względem przekształceń postaci (19). Z budowy wzorów (25), które określają tensor widzimy, że wszystkie czysto algebraiczne w swoim charakterze operacje można stosować w równej mierze zarówno do tensorów względem ogólnego przekształcenia tak jak stosowaliśmy je do tensorów względem liniowego przekształcenia. Odpowiednio ważne są wszystkie otrzymane rezultaty dotyczące dodawania, mnożenia ,i zawężania oraz dotyczące kryterium charakteru tensorowego. Zazwyczaj jednak swoją uwagę będziemy poświęcać tensorom właściwym i pod słowem „tensor” będziemy rozumieć właśnie tensor właściwy. Prawo przekształcenia tensora właściwego astr ma postać :
a'str = (∂x'r / ∂xm) (∂xn / ∂x's ) (∂xp / ∂x't ) anpm (26)
Czytelnik może łatwo sprawdzić następujące stwierdzenia:
1. Typowym wektorem kontrawariantnym jest dxr
2. Typowym wektorem kowariantnym jest ∂ϕ /∂xr gdzie ϕ jest skalarem właściwym.
3. Typowy tensor dowolnego rzędu można otrzymać przez przemnożenie odpowiedniej ilości wektorów ko- i kontrawariantnych tak jak to już stwierdzono wcześniej.
Należy zauważyć, że jeśli astr jest tensorem składowe którego są funkcjami zmiennych to obiekt złożony z ich pochodnych względem xr nie będzie tensorem. Wynika to z tego, że rezultat który otrzymaliśmy dla tensorów względem przekształcenia liniowego teraz nie jest słuszny ponieważ wielkości ∂xr'/ ∂xs teraz nie są stałymi a pewnymi funkcjami zmiennych. W samej rzeczy różniczkując (26) otrzymujemy :
(∂a'str / ∂x'u ) = (∂x'r / ∂xm)(∂xn / ∂x's )(∂xp/ ∂x't )(∂xq / ∂x'u )(∂anpm / ∂xq) +
+ (∂x'r / ∂xm)(∂xn / ∂x's )(∂2xp/ ∂x't∂x'u )anpm + (∂x'r / ∂xm)(∂2xn/ ∂x's ∂x'u )
(∂xp / ∂x't )anpm + (∂2x'r / ∂xm∂xq)(∂xn/ ∂x's )(∂xp / ∂x't )(∂xq/ ∂x'u )anpm
to pokazuje, że pochodne nie spełniają prawa przekształcenia tensorów.
Zadania
1. Napisać prawa przekształcenia tensorów pierwszego, drugiego i trzeciego rzędu biorąc pod uwagę dla każdego rzędu wszystkie możliwe typy.
2. Pokazać, że jeśli ϕ jest skalarem właściwym to ∂ϕ / ∂xr jest wektorem kowariantnym
3. Pokazać, że jeśli amn jest obiektem symetrycznym i amndxmdxn jest inwariantem to amn jest tensorem kowariantnym.
************************************************************************************************
Część II - Geometria analityczna w formaliźmie tensorowym
Rozdział III - Współrzędne afiniczne
Paragraf 1 Współrzędne i tensory
Jeśli mamy zadane trzy wzajemnie ortogonalne płaszczyzny, przecinające się w punkcie O , to jak wiadomo położenie danego punktu P w przestrzeni jednoznacznie określone jest trzema liczbami, wyrażającymi długość odcinków które są rzutami prostokątnymi z punktu P na zadane płaszczyzny, przy czym każdej z tych liczb przypisany jest odpowiedni znak.
Oznaczmy przez : OY2Y3 , OY3Y1 , OY1Y2 zadane płaszczyzny, a przez (y1, y2,y3) liczby wyrażające długość wspomnianych wyżej rzutów prostokątnych (z odpowiednimi znakami). Wtedy te trzy liczby nazywamy współrzędnymi kartezjańskimi prostokątnymi punktu P, zadane płaszczyzny - płaszczyznami współrzędnych , linie proste OY1, OY2, OY3 - osiami współrzędnych, punkt O - początkiem współrzędnych.
Zadajmy teraz przekształcenie liniowe współrzędnych (y1, y2,y3 ) do nowych zmiennych
(x1, x2,x3) :
x1 = α11 y1 + α12 y2 + α13 y3
x2 = α21 y1 + α22 y2 + α23 y3
x3 = α31 y1 + α32 y2 + α33 y3
Stosując umowę sumacyjną możemy te równania zapisać następująco:
xr = αrs ys (1)
Zakładamy że wyznacznik |αrs | ≠ 0 i odpowiednio można rozwiązać (1) również względem y
yr = α'rs xs (2)
Otrzymujemy stąd, że każdemu punktowi przestrzeni jednoznacznie odpowiada zbiór liczb xr
I odwrotnie każdemu zbiorowi liczb xr odpowiada jednoznacznie jeden punkt przestrzeni. Dlatego zmienne xr można rozpatrywać jako współrzędne punktu przestrzeni. Te współrzędne otrzymane są przez liniowe przekształcenie współrzędnych ortogonalnych kartezjańskich ys ,nazywamy je współrzędnymi afinicznymi punktowymi lub po prostu współrzędnymi afinicznymi.
Wiadomo, że równanie płaszczyzny przechodzącej przez początek układu współrzędnych w prostokątnym kartezjańskim układzie współrzędnych jest równaniem liniowym postaci:
αm ym = 0 (3)
Dlatego z (1) widać, że x1= 0, x2= 0, x3 = 0 są równaniami trzech płaszczyzn przechodzących przez punkt 0. Płaszczyzny te będziemy nazywali „płaszczyznami współrzędnych” układu xr
Wzajemne przecięcia tych płaszczyzn wyznaczają trzy linie proste przechodzące przez punkt 0, linie te będziemy nazywać osiami współrzędnych. Oczywiście osie współrzędnych przedstawić możemy za pomocą trzech par równań :
x2= 0; x3= 0; x1 = 0
x3= 0; x1= 0; x2 = 0
Będziemy oznaczać te osie odpowiednio: OX1, OX2, OX3 . Początkiem współrzędnych nazwiemy punkt o współrzędnych x1 = 0; x2 = 0; x3 = 0 z (2) widzimy, że początek układu współrzędnych xr pokrywa się z początkiem układu ortogonalnego kartezjańskiego. Innymi słowy - położenie początku współrzędnych nie zmienia się przy przekształceniach (1).
Jeśli mamy dwa układy współrzędnych afinicznych xr oraz x'r to z zależności (1) i (2) oczywiste jest, że te dwa układy zmiennych możemy związać zależnościami liniowymi postaci:
x'r = crsxs (4)
gdzie crs - to stałe, i zależności te mogą być rozwiązane względem xr :
xr = γrsx's (5)
W takim razie , przejście od jednego układu afinicznego do drugiego jest równoważny liniowemu przekształceniu zmiennych. Możemy zatem odpowiednio określić tensory, wektory , oraz inwarianty (skalary) względem przekształceń afinicznych zmiennych. Przykładowo: Arst będzie tensorem trzeciego rzędu - jeśli jego składowe w nowym układzie współrzędnych zdefiniowane są równaniem :
A'rst = cr mγn sγpt Amnp (18)
Zadania
1. Pokazać, że podstawowy ortogonalny kartezjański układ współrzędnych yr należy do zbioru afinicznych układów współrzędnych
Paragraf 4 Odległość między dwoma punktami i tensor metryczny, e-obiekty
Niech P i Q będą dwoma punktami których współrzędne afiniczne są równe xr1 i xr2
Jeśli yr1 i yr2 są ich współrzędnymi w pierwotnym układzie kartezjańskim ortogonalnym to jak wiadomo odległość δ między P i Q określona jest zależnością :
δ2 = (PQ)2 = (y11 − y12)2 + (y21− y22)2 + (y31− y32)2
Jednak z wprowadzonej w poprzednim paragrafie zależności :
yr = αr's' xs
możemy otrzymać :
yr1 = α'rm xm1 ; yr2 = α'rm xm2
mamy zatem :
δ2 = gmn (xm1 − xm2)(xn1 − xn2) (10)
gdzie wprowadzono oznaczenie :
gmn = α'1mα'1n + α'2m α'2n + α'3mα'3n = α'rmα'rn (11)
(umowę sumacyjną należy tutaj stosować względem dwóch górnych indeksów)
Zauważmy, że gmn jest obiektem symetrycznym tj.
gmn = gnm
W szczególności odległość od punktu O do P którego współrzędne są równe xr określone są zależnością :
δ2 = gmn xmxn (12)
δ - jest skalarem i odpowiednio gmn xmxn również jest skalarem. Ponieważ gmn jest obiektem symetrycznym a xr jest dowolnym wektorem kontrawariantnym, to na podstawie twierdzenia o charakterze tensorowym wnioskujemy, że gmn jest tensorem kowariantnym.
Będziemy go nazywać „tensorem fundamentalnym” lub „tensorem metrycznym”. Zauważmy, że forma kwadratowa (12) jest dodatnio określona i jest równa zeru tylko w tym przypadku jeśli xr = 0. Oznaczmy przez g wyznacznik |gmn | i przez Gmn dopełnienie algebraiczne gmn w g. Wtedy 3!g = erst emnp grm gsn gtp ; 2! Grs = ermn espq gmp gsq
Ponieważ erst jest pseudotensorem o wadze 1 , to g jest pseudoskalarem o wadze 2, a Grs - pseudotensorem o wadze 2. Oprócz tego z (11) mamy :
G = | α'rm α'rn | = | α'rm|2
Dlatego g jest dodatnio określone i różne od zera. Odpowiednio jeśli podzielimy Grs przez g i oznaczymy wynik jako grs, to otrzymamy ważny rezultat , który wyrazimy następująco :
Obiekt grs którego składowe są dopełnieniem algebraicznym grs podzielonymi przez g jest tensorem kontrawariantnym właściwym.
Oprócz tego jeśli założymy :
εrst = √g erst ; εrst = [1/ √g ] erst (13)
to bezpośrednio widać, że te obiekty są tensorami właściwymi które będziemy nazywać
ε-obiektami lub ε-tensorami.
Jeśli dany mamy kontrawariantny wektor Ar to możemy związać z nim skalar przy pomocy równości :
A = (gmn AmAn )1/2 (14)
A - nazywamy „modułem” lub „długością wektora”Ar . Podobnie określamy moduł lub długość kontrawariantnego wektora Br. Odpowiednie równanie ma postać :
B = (gmn BmBn )1/2 (15)
Wektorem jednostkowym nazywamy wektor którego długość jest równa jedności., jeśli λr i μr - są wektorami jednostkowymi, to mamy :
gmn λmλn = 1 ; gmn μmμn = 1
Wektory jednostkowe niekiedy nazywamy „wersorami”
(lub po staremu „ortami” - przypis własny)
Zadania
1. Udowodnić, że gsmgmr = grm gms = δrs
2. Udowodnić, że odległości punktów bazy od początku układu współrzędnych określone może być zależnościami:
OE1 = sqrt(g11) , OE2 = sqrt(g22) , OE3 = sqrt(g33) ,
3. Udowodnić, że równości g11 = g22 = g33 są warunkami koniecznymi i wystarczającymi tego aby układ współrzędnych był kartezjański.
Paragraf 6 Tensory stowarzyszone
Wprowadzimy teraz ważne operacje podniesienia i opuszczenia indeksów w tensorach, operacje te prowadzą do nowych tensorów.
Niech Ar będzie dowolnym wektorem kontrawariantnym. Jeśli pomnożymy go przez tensor gmn a następnie zawężymy to otrzymamy wektor kowariantny grmAm który będziemy oznaczać : Ar
W takim razie mamy :
Ar = grmAm (21)
Widzimy zatem, że indeks górny zmienił się na dolny. Jest to jest operacja „opuszczania indeksu”.
Teraz weźmiemy wektor kowariantny Ar i podniesiemy indeks przez pomnożenie tego wektora przez tensor gmn a następnie zawężenie. Mamy
grmAm = grmgnmAn = δrn An = Ar (22)
Odpowiednio jeśli na początku opuścimy indeks a następnie go podniesiemy posługując się dopiero co wprowadzoną zasadą to otrzymamy na powrót tensor wejściowy. W takim wypadku proces podniesienia i opuszczenia indeksów jest procedurą odwracalną.
Dwa wektory Ar i Ar powstałe w sposób omówiony powyżej nazywamy „wektorami stowarzyszonymi” i dla ich oznaczenia zwykle wykorzystujemy jedną i tą samą literkę A. Wektory te są bardzo ściśle ze sobą związane.
Rozpatrzmy teraz kowariantny tensor Ars Ma on dwa indeksy które można podnieść. Jeśli chcielibyśmy podnieść pierwszy indeks należy pomnożyć go przez gmn a następnie zawęzić względem pierwszego indeksu . Zapiszmy tę procedurę następująco :
Ars = grmAms (23)
(Uwaga ! Aby można było odróżnić który indeks został podniesiony lub opuszczony stawiamy kropkę na odpowiedniej pozycji indeksów górnych i dolnych - w tekście tłumaczonym stosuje „naturalną” kolejność indeksów wynikającą z możliwości edytora )
Operację podniesienia drugiego indeksu zapiszemy w sposób analogiczny :
Ars = gsmAmn (24)
Możemy również dokonać podniesienia obu indeksów zgodnie ze wzorem :
Ars = grmgsnAmn (25)
Jeśli Ars jest symetryczny, to jak łatwo pokazać Ars i Ars są tożsame i mogą być zapisane jednym i drugim sposobem. Pozostawiamy czytelnikowi aby sformułował prawa opuszczania i podnoszenia indeksów dla tensora drugiego rzędu oraz pokazanie, że jeśli zostaną opuszczone oba indeksy w (23) - (25) to powrócimy do pierwotnego tensora.
Wyżej wymienione operacje możemy oczywiście uogólnić na tensory dowolnego rzędu. Zilustrujemy to na następującym przykładzie Niech Arst będzie tensorem kontrawariantnym.
Po opuszczeniu drugiego indeksu otrzymamy :
Arst = gsmArmt (26)
Wszystkie tensory otrzymane jeden z drugiego w taki sposób nazywa się „tensorami stowarzyszonymi”. W temacie tym interesujące są dwa rezultaty.
1. W danym jednomianie gdzie pojawia się indeks niemy możemy podnieść ten indeks lub go opuścić bez zmiany wartości tego jednomianu. Przykładowo mamy :
Ars Br = grmAms grn Bn = δmn Ams Bn = Ams Bm = Ars Br
Widzimy, że indeks niemy „r” podnosimy i opuszczamy wskazanym sposobem.
2. Jeśli w każdym członie równania tensorowego mamy dowolny indeks wolny, otrzymamy równoważne równanie opuszczając lub podnosząc ten indeks w każdym członie.
Przykładowo układ równań :
Arst = Brs At
Równoważny jest układowi :
grmAmst = grmBmsCt
lub układowi :
Arst = BrsCt
Z którego widać, że indeks „r” został w każdym członie podniesiony.
Zadania
1. Pokazać, że długość dowolnego wektora i jego wektora stowarzyszonego są równe
2. Pokazać, że jeśli A jest długością Ar to A2 = Ar Ar
3. Pokazać, że jeśli dwa wektory Ar i Br mają długość A i B to Ar Br = AB cos(ϕ) gdzie ϕ jest kątem między kierunkami Ar i Br
4. Pokazać, że w ortogonalnym kartezjańskim układzie współrzędnych wektory stowarzyszone mają jedne jednakowe składowe.
Paragraf 7 Iloczyn skalarny i wektorowy wektorów
Niech OA i OB. Będą dwoma odcinkami zadającymi wektory Ar , Br długość ich jest równa odpowiednio A i B.
Jeśli ϕ jest kątem między tymi kierunkami to :
gmn AmBn = AB cos(ϕ) (27)
Inwariant gmn AmBn nazywamy „iloczynem skalarnym” wektorów Ar , Br i jak nam już wiadomo możemy go zapisać również w następujących równoważnych formach :
gmn AmBn = AmBm = AmBm = gmn AmBn
gdzie Ar , Br są wektorami stowarzyszonymi.
Jeśli λr jest wersorem o kierunku Br to otrzymujemy :
gmn Amλn = Amλm = Acos(ϕ) (28)
Jednak Acos(ϕ) jest rzutemOA na kierunek OB. Odpowiednio rzut Ar na kierunek λr wyraża się w postaci : Amλm .
Rozpatrzmy następnie wektor :
Cr = εrmn AmBn (29)
Wektor tak określony ma taki kierunek aby orientacja równoległoboku zbudowanego na wektorach Ar , Br , Cr była dodatnia. Wektor (29) nazywamy „iloczynem wektorwym” wektorów Ar , Br . Jeśli oznaczymy νr wersor ortogonalny do Ar i Br to możemy zapisać :
εrmn AmBn = ABsin(ϕ) (31)
************************************************************************************************
Część III - Analiza tensorowa i geometria różniczkowa
Rozdział XI - Współrzędne krzywoliniowe
Paragraf 1 Ogólne układy współrzędnych
Położenie punktu w przestrzeni określamy jego współrzędnymi w ortogonalnym kartezjańskim układzie współrzędnych; będziemy oznaczać taki układ współrzędnych następująco : (y1, y2 , y3 ).
W poprzednim paragrafie określiliśmy i stosowaliśmy liniowe przekształcenie otrzymując układ współrzędnych afinicznych. Teraz rozpatrzymy ogólniejsze przekształcenie i zobaczymy jakiego typu współrzędne otrzymamy.
Rozpatrzmy przekształcenie :
xr = fr (y1,y2 ,y3 ). (1)
gdzie f1, f2 , f3 - to pochodne funkcji po y, które to funkcje przyjmujmy jako funkcje klasy Cn. Wiadomo, że jeśli wyznacznik :
| ∂xr / ∂xs | = ∂(x1,x2 ,x3 ) / ∂(y1,y2 ,y3 ). (2)
jest różny od zera to przekształcenie (1) jest odwracalne tj. można rozwiązać (1) względem y :
yr = gr(x1,x2 ,x3 ). (3)
Ze wzorów (1) i (3) widać, że danemu zbiorowi yr odpowiada tylko jeden zbiór xr określający punkty w przestrzeni jednoznacznie, dlatego nazwiemy je „współrzędnymi krzywoliniowymi punktu”.
W dalszej kolejności spróbujemy rozjaśnić ten termin.
W pierwszej kolejności wyjaśnimy jaki sens geometryczny mają te współrzędne. Rozpatrzmy równanie :
f1(y1,y2 ,y3 ) = const. (4)
To jest równanie powierzchni i jeśli nadawać stałej różne wartości to otrzymamy zbiór (rodzinę) powierzchni. W takim razie równanie x1 = const. daje rodzinę powierzchni i jeśli mówimy, że punkt ma współrzędną x1 to oznacza, że leży on na określonej powierzchni z rodziny (4). Analogicznie x2 = const. i x3 = const. są równaniami innych powierzchni i jeśli mówimy, że punkt ma współrzędne x2 ,x3 to znaczy, że leży on na określonych powierzchniach tych dwóch rodzin. Innymi słowy jeśli zadać trzy rodziny powierzchni to położenie danego punktu P określone jest zadaniem trzech powierzchni z takich ich rodzin, że punkt P jest punktem ich przecięcia.
Oprócz tego warunek, że wyznacznik (2) jest różny od zera wyraża ten fakt, że trzy powierzchnie wybrane z różnych rodzin przecinają się w jednym i tylko jednym punkcie i w takim razie określają położenie punktu w sposób jednoznaczny.
Powierzchnie: x1 = const. , x2 = const. i x3 = const nazywamy „powierzchniami współrzędnych” lub krótko :
„xn-powierzchnią”
Przecięcia tych powierzchni obrazują trzy krzywe przechodzące przez punkt P , przy czym na każdej z danych powierzchni leżą dwie z nich . Te krzywe nazywamy „krzywymi współrzędnych”. Wzdłuż krzywej która jest przecięciem x1-powierzchni z x2-powierzchnią zmienia się tylko x1 a inne współrzędne pozostają stałe. Analogicznie będziemy określać pozostałe dwie krzywe współrzędnych x2 i x3. Jak łatwo zauważyć linie współrzędnych będą rzeczywiście liniami „krzywymi” więc nazwa „współrzędne krzywoliniowe” jest w pełni uzasadniona.
Jeśli weźmiemy dowolny drugi układ współrzędnych krzywoliniowych xr' to będzie on związany z yr zależnościami postaci (1) i (3). Odpowiednio xr i xr' powinny być związane zależnościami :
x'r = x'r(x1,x2 ,x3 ). (5)
xr = xr (x'1,x'2 ,x'3 ). (5)
tj. przekształcenie układu współrzędnych krzywoliniowych jest przekształceniem funkcjonalnym. Oprócz tego wyznacznik
| ∂x'r / ∂xs | = | ∂x'r / ∂xm | | ∂xm / ∂xs |
jest różny od zera. Oczywiste jest, że współrzędne afiniczne są przypadkiem szczególnym współrzędnych krzywoliniowych, mianowicie funkcje fr w (1) są liniowe.
Paragraf 2 Pola tensorowe
Rozpatrywaliśmy już tensory przy ogólnych przekształceniach funkcjonalnych. Przykładowo obiekt arst jest pseudotensorem o wadze M, kontrawariantny względem r i kowariantny względem s i t ,względem przekształcenia (5) jeśli jego przekształcone składowe a'rst spełniają równość:
a'rst = | ∂xi / ∂x'j |M (∂x'r / ∂xm )(∂xn / ∂x's )(∂xp / ∂x't )amnp (6)
Należy teraz przypomnieć jedną osobliwości której do tej pory nie rozpatrywaliśmy w przypadku przekształceń liniowych. Współczynniki ∂x'r / ∂xm w (6) są funkcjami xr a to znaczy, że również x'r.
Dlatego jeśli arst i a'rst - są dwoma zbiorami wielkości spełniających (6) w jednym, dowolnym punkcie, to te równości będą ogólnie mówiąc nie spełnione w innych punktach. Innymi słowy arst są składowymi tensora w punkcie xr i ogólnie mówiąc nie są składowymi tensora w pewnym dowolnym innym punkcie. To oznacza, że tensory i własności tensorowe teraz tj. przy przekształceniach współrzędnych krzywoliniowych związane są z danym punktem.
W takim razie wszystkie operacje algebraiczne które opisaliśmy do tej pory odnoszą się do tensorów w jednym i tym samym punkcie i nie mogą być stosowane do tensorów związanych z różnymi punktami tj. dla tego aby operacja mnożenia dwóch tensorów dawała w wyniku tensor należy określić te mnożone tensory w jednym i tym samym punkcie.
Załóżmy znowu, że arst są funkcjami xr , jednak - co nowe- a'rst, które też będą funkcjami od xr, spełniają równość (6) w każdym punkcie gdzie określono funkcje xr .
W takim razie w każdym punkcie pewnego obszaru przestrzeni mamy zadany tensor , taki zbiór tensorów nazywamy „polem tensorowym”. W dalszym ciągu będziemy mieć do czynienia głównie z polami tensorowymi jednak dla wygody będziemy je nazywać prosto - tensorami - w tych przypadkach kiedy nie będzie to prowadziło do nieporozumień.
Odpowiednio kiedy będziemy mówić, że tensor jest określony w pewnym obszarze przestrzeni będziemy mieć na myśli to, że w tym obszarze określono pole tensorowe. Tak jak i zwykłe tensory ,pola tensorowe mogą być różnych rzędów. W takim wypadku mogą istnieć pola skalarne (inwariantne) oraz pola wektorowe.
Najważniejszym dla nas przypadkiem jest przykład kiedy w równości (6) M = 0 tj. kiedy tensory są tensorami właściwymi wszystkie tensory z jakimi będziemy mieć dalej do czynienia należy uważać za tensory właściwe chyba, że powiedziano inaczej.
Zadania
1. Udowodnić, że :
erst = |∂xi / ∂x'j |−1 emnp (∂xm / ∂x'r )(∂xn / ∂x's )(∂xp / ∂x't )
erst = |∂xi / ∂xj'| emnp (∂x'r / ∂xm)(∂x's / ∂xn)(∂x'i / ∂xp)
tj., że erst i erst są pseudotensorami o wadze odpowiednio -1 i +1
2. Udowodnić, że symbole Kronekera są tensorami właściwymi.
3. Udowodnić, że różniczki dxr obrazują tensor kontrawariantny pierwszego rzędu (wektor)
Paragraf 3 Element liniowy i tensor metryczny , ε-obiekty
Niech P będzie punktem o współrzędnych xr i niech Q będzie punktem sąsiednim o współrzędnych xr + dxr. Oznaczmy nieskończenie małą odległość PQ przez ds i nazwijmy „ds” - elementem długości lub elementem liniowym, znajdziemy następnie wyrażenie na ds. wyrażone przez różniczki dxr. Jeśli powrócimy do kartezjanskiego układu współrzędnych w którym współrzędne punktów P i Q będą równe odpowiednio yr i yr + dyr to z infinittezymalnego równoległoboku o wierzchołku w punkcie P i długościami boków równymi dy1, dy2, dy3
widzimy, że (zobacz rysunek 1) :
ds2 = (dy1)2 + (dy2)2 +(dy3)2 = (dyi) (dyi).
Ponieważ dyi = (∂yi / ∂xr ) dxr to :
ds2 = gmndxm dxn (7)
Rys. 1
gdzie wprowadziliśmy oznaczenie :
gmn= (∂yi / ∂xm ) (∂yi / ∂xn ) (8)
Zauważmy, że teraz sumowanie przeprowadzamy względem dwóch indeksów.
Ostatnia równość pokazuje, że gmn jest symetryczne i ponieważ ds. jest inwariantem, to z (7) wynika, że gmndxm dxn także jest inwariantem przy dowolnym kontrawariantnym wektorze dxr. Stąd wynika, że gmn jest tensorem kowariantnym drugiego rzędu. Tensor ten nazywamy „tensorem fundamentalnym” lub „tensorem metrycznym”.
Jeśli oznaczymy przez „g” wyznacznik |gmn| a przez Gmn dopełnienie algebraiczne gmn , to możemy zauważyć, że :
3!g = erst emnp grm gsn gtp (9)
2! Gmn = empq enrs gpr gqs (9)
Jednak erst jest pseudotensorem o wadze 1, odpowiednio zatem, g jest pseudoskalarem o wadze 2, a Gmn jest pseudotensorem o wadze 2.
Oprócz tego z (8) widzimy, że :
g = |gmn| = |(∂yi / ∂xm )|2
skąd wnioskujemy, że g jest różne od zera i dodatnie. Dlatego możemy napisać :
gmn = Gmn / g (10)
tj. gmn jest dopełnieniem algebraicznym gmn podzielonym przez g, w takim wypadku jest oczywiste, że gmn jest tensorem kontrawariantnym właściwym. Oczywiste jest również, że obiekty :
εrst = √g erst ; εrst = (1/√g ) erst (11)
są tensorami właściwymi - tensory te nazywamy ε-obiektami.
Niech będzie dany wektor kontrawariantny Ar. Możemy zbudować skalar A w sposób następujący :
A = (gmn AmAn )1/2 (12)
Skalar A nazywamy „długością wektora Ar” w sposób analogiczny określamy długość wektora kontrawariantnego :
B = (gmn BmBn )1/2 (13)
Wektor jednostkowy zatem to wektor którego długość równa jest jedności. Jeśli równość (7)
Podzielić przez ds2 to od razu widać, że :
gmn (dxm /ds) (dxn /ds) = 1 (14)
i otrzymujemy, że dxr /ds jest wektorem jednostkowym.
Zadania
3. Pokazać, że forma kwadratowa gmn dxmdxn jest dodatnio określona
4. Pokazać, że wektor Ar /A jest wektorem jednostkowym
************************************************************************************************
Rozdział XII - Różniczkowanie kowariantne
Paragraf 1 Pole wektorów równoległych. Symbole Christoffela
Krzywą w przestrzeni określamy jako miejsce geometryczne punktów, których współrzędne zależą tylko od jednego parametru. Niech AB będzie daną krzywą i niech współrzędne danego punktu P na tej krzywej będą funkcją
parametru t. Jeśli w danym punkcie krzywej zbudujemy pewien wektor a następnie w każdym innym punkcie tej krzywej zbudujemy wektor o tej samej długości i równoległy do wektora pierwotnego to mówimy że wzdłuż tej krzywej określiliśmy pole wektorowe Xr - jego składowe będą funkcją t. Nasze zadanie polega na znalezieniu równania które powinno spełniać takie pole wektorowe.
Wróćmy do pierwotnego kartezjańskiego ortogonalnego układu współrzędnych yr i niech Yr - będą składowymi pola w tym układzie. Ponieważ w ortogonalnym kartezjańskim układzie współrzędnych składowe wektorów równoległych są jednakowe to Yr są stałe wzdłuż krzywej i odpowiednio pochodna po t Yr jest równa zeru.
Mamy jednak :
Yi = Xm (∂yi / ∂xm )
Dlatego, różniczkując po t , otrzymujemy :
(dXm /dt)(∂yi / ∂xm) + Xm (∂2yi / ∂xm∂xn) (∂xn / dt) = dYi /dt = 0
mnożąc to równanie przez grp(∂yi / ∂xp) i po sumujac względem i od 1 do 3 otrzymamy z wykorzystaniem (8) - wzór z poprzedniego paragrafu, mamy :
dXr /dt + grp(∂2yi / ∂xm∂xn)(∂yi / ∂xp)Xm (∂xn / dt) = 0 (1)
(sumowanie względem indeksu górnego niemego)
Teraz rozpatrzmy wyrażenie (∂2yi / ∂xm∂xn)(∂yi / ∂xp). Wykorzystując (8) i różniczkując te równości względem xp otrzymujemy :
(∂gmn / ∂xp) = (∂2yi / ∂xm∂xp)(∂yi / ∂xn) +(∂yi / ∂xn)(∂2yi / ∂xp∂xn) (2)
przy czym te równości są słuszne jeśli m,n,p przybierają dowolne wartości 1,2,3
Dokonajmy w (2) dwukrotnego przestawienia cyklicznego indeksów m, n, p i odejmijmy równość (2) od sumy otrzymanych przez powyższą operacje, równości, otrzymamy :
(∂gnp / ∂xm ) + (∂gpm / ∂xn ) - (∂gmn / ∂xp ) = 2 (∂2yi / ∂xm∂xn)(∂yi / ∂xn) (3)
Wprowadzimy następujące oznaczenia :
Γp, mn = ½ ( ∂gnp / ∂xm + ∂gpm / ∂xn − ∂gmn / ∂xp ) (4)
( Trójindeksowe symbole Christoffela można również oznaczać w postaci :
[mn, p] = Γp, mn {pmn} = Γpmn
Symbole Christofela nie są tensorami.
Podstawiając (3) do (1) oraz wykorzystując (4) otrzymujemy :
dXr /dt + grp Γp, mn Xm (dxn / dt) = 0
Jeśli wprowadzimy oznaczenie :
Γrmn = grp Γp, mn (5)
To równanie (1) przyjmie następującą, końcową postać :
(dXr /dt ) + Γrmn Xm (dxn / dt) = 0 (6)
Pole wektorów równoległych wzdłuż krzywej AB powinno spełniać to równanie różniczkowe.
Z teorii równań różniczkowych wiadomo, że jeśli pole wektorowe Xr spełnia (6) na krzywej AB oraz ma zadaną wartość w jednym z punktów na tej krzywej to jest ono określone w sposób zupełny i jednoznaczny na całej tej krzywej. Widzimy zatem, że pole które jest rozwiązaniem (6) jest jedynym rozwiązaniem postawionego problemu.
Można również pokazać (co również zrobiliśmy), że słuszne jest twierdzenie odwrotne tj. dane pole wektorowe na krzywej AB spełniające (6) jest polem wektorów równoległych.
Obiekty Γp, mn i Γrmn określone wzorami (4) i (5) odgrywają bardzo ważną rolę.
Nazywane są one „symbolami Christoffela - odpowiednio pierwszego i drugiego rodzaju” lub symbolami trójindeksowymi. Jedną z ich ważniejszych własności jest to, że są one symetryczne względem indeksów m i n.
Jeśli weźmiemy dowolny wektor w danym punkcie i zbudujemy w każdym punkcie przestrzeni wektory równoległe do niego to jak już można się domyślić zbudujemy pewne pole wektorów równoległych Xr , składowe tego pola będą funkcjami współrzędnych xr .
Dalej, jeśli weźmiemy dowolną krzywą przechodzącą przez punkt P to wektory tego pola na tej krzywej będą
spełniać (6).
Teraz jednak mamy :
dXr /dt = (∂Xr / ∂xn )dxn / dt
ponieważ Xr jest funkcją xr to (6) przyjmuje postać :
[(∂Xr / ∂dxn ) + Γrmn Xm] (dxn / dt) = 0
Ta zależność powinna być spełniona przez wszystkie krzywe wychodzące z P tj. dla wszystkich wartości wektora dxn / dt w punkcie P. Odpowiednio pole wektorów równoległych spełnia równanie :
(∂Xr /∂dxs ) + Γrms Xm = 0 (7)
Stwierdzenie odwrotne jest również prawdziwe.
Zadania
1. Pokazać, że Γp, mn i Γrmn są symetryczne względem m i n .
2. Pokazać, że we współrzędnych afinicznych symbole Christoffela są tożsamościowo równe zeru
(wszystkie g - są stałe)
Paragraf 2 Absolutna i kowariantana pochodna wektora
Teraz możemy rozpatrzyć problem o którym już wspomnieliśmy , mianowicie o różniczkowaniu tensorów a dokładnie o takiej postaci wzorów na różniczkowanie tensorów aby w wyniku ich działania powstawał nowy tensor. Na początku ograniczymy się do rozpatrzenia skalarów i wektorów - właściwych.
Przypadek skalarów jest dosyć prosty. Jeśli ϕ - jest funkcją skalarną parametru t, to jak wiadomo w nowych współrzędnych ϕ' = ϕ i odpowiednio :
dϕ'/dt = dϕ /dt (8)
skąd widać, że dϕ/dt - jest skalarem.
Dalej, jeśli ϕ - jest funkcją skalarną zmiennej xr to :
∂ϕ'/∂xr' = (∂ϕ /∂xm)(∂xm/∂xm') (9)
co pokazuje, że ∂ϕ /∂xr - jest wektorem kowariantny . W takim razie zwykłe pochodne skalara dają nam skalary i wektory bez żadnych dopełniających wzorów.
Rozpatrzmy teraz przypadek wektora kowariantnego postaci Xr określonego na krzywej C.
Odpowiednio jest on funkcją parametru t. Weźmy dowolny wektor kontrawariantny Ar w pewnym punkcie na tej krzywej oraz odpowiednie do tego wektora pole wektorów równoległych tj. Ar jest polem wektorów równoległych wzdłuż krzywej C, spełniające oczywiście równanie (6). W danym punkcie C obiekt ( Xr Ar ) jest skalarem i dlatego jego pochodna po t jest również skalarem. Jednak :
d/dt ( Xr Ar ) = dXr /dt Ar + Xr d/dt (Ar) = dXr /dt Ar − Γrmn Xr Am (dxn/dt)
odpowiednio otrzymujemy, że :
[ (dXr /dt) − Γmrn Xm dxn/dt ] Ar - jest skalarem.
Jednak Ar jest dowolnym polem wektorów równoległych i dlatego według twierdzenia ilorazowego otrzymujemy, że :
( dXr /dt ) − Γmrn Xm dxn/dt - jest wektorem kowariantnym.
Zdefiniujmy pochodna absolutną wektora Xr względem t przez zależność :
DXr / Dt = (def) (dXr /dt ) − Γmrn Xm (dxn/dt)
Tak więc aby otrzymać nowy wektor przy pomocy różniczkowania należy do zwykłej pochodnej wektora dodać pewną ilość członów zawierających symbole Christoffela.
Rozpatrzmy równanie wektorowe :
DXr / Dt = (dXr /dt ) − Γmrn Xm (dxn/dt ) = 0 (11)
Jeśli jest ono słuszne w dowolnym układzie współrzędnych, to jest ono słuszne również w dowolnym innym układzie współrzędnych. Jeśli układ współrzędnych jest kartezjański, to gmn - są wartościami stałymi i symbole Christoffela są tożsamościowo równe zeru.
W tym przypadku (11) przyjmuje postać :
dXr /dt = 0
skąd wynika, że składowe Xr obrazują pole wektorów równoległych wzdłuż C, a (11) jest równaniem które powinno spełniać pole wektorów równoległych kowariantnych wzdłuż tej krzywej.
W przypadku pola kontrawariantnego Xr wzdłuż krzywej pozostawiamy czytelnikowi pokazanie, że :
DXr / Dt = (def) (dXr /dt ) − Γrmn Xm (dxm/dt ) (12)
jest wektorem kontrawariantnym który nazywamy pochodną absolutną Xr po t.
(Aby tego dowieść należy wziąć dowolne kowariantne pole wektorów równoległych Ar i postępować tak jak było pokazane w przypadku wektorów kowariantnych )
Przejdziemy teraz do pewnych pól określonych w całej przestrzeni. Niech Xr będzie takim właśnie polem wektorów kontrawariantnych, weźmy jakąkolwiek krzywą (sparametryzowana przez t ) wychodzącą z punktu P.
Wiemy, że (12) jest wektorem kontrawariantnym. Ponieważ
dXr / dt = (∂Xr / ∂xs)(dxs/dt) , Γrmn Xm (dxn/dt ) = Γrms Xm (dxs/dt )
to :
[ (∂Xr / ∂xs ) + Γrms Xm] (dxs/dt) - jest wektorem kontrawariantnym
Jest to słuszne dla wszystkich krzywych wychodzących z punktu P tj. dla wszystkich wartości
dxs/dt w punkcie P i odpowiednio (zgodnie z twierdzeniem ilorazowym) wyrażenie w nawiasie kwadratowym jest tensorem, kontrawariantny względem r i kowaraintnym względem s. Ten tensor nazywamy „pochodną kowariantną wektora Xr„ Pochodną kowariantną wektora Xr względem xs , będziemy oznaczać symbolicznie :
Xr,s .
W takim razie mamy :
Xr,s = (def) (∂Xr / ∂xs ) + Γrms Xm (13)
W analogiczny sposób możemy pokazać, że jeśli Xr - jest polem wektorowym określonym w całej przestrzeni to :
Xr,s = (def) (∂Xr / ∂xs ) + Γmrs Xm (14)
Jest tensorem kowariantnym względem r i s, który nazywamy „pochodną kowariantną wektora Xr”
Zadania
1. Udowodnić słuszność równości:
d/dt (gmnXm Xn ) = 2 gmnXm (DXn /Dt)
2. Pokazać, że DXr /Dt = 0 jeśli Xr,s = 0 - są równaniami pola wektorów równoległych
Paragraf 3 Absolutna i kowariantana pochodna tensora
Teraz rozszerzymy rezultaty poprzedniego paragrafu na różniczkowanie tensorów dowolnego rzędu.
Przykładowo niech Xrst - będzie tensorem trzeciego rzędu określonym wzdłuż pewnej krzywej sparametryzowanej za pomocą t. Wiemy już, że dXrst /dt nie jest tensorem, naszym zadaniem będzie znaleźć sposób zmiany pochodnej tak aby otrzymać w wyniku tensor.
Weźmy trzy dowolne wektory równoległe : Ar , Br , Cr określone wzdłuż wspomnianej krzywej.
Wtedy w każdym punkcie tej krzywej wielkość Xrst ArBsCt jest skalarem i odpowiednio jego pochodna po t będzie skalarem. Mamy więc :
d/dt (Xrst ArBsCt ) = ( dXrst /dt )(ArBsCt ) + Xrst (dAr/dt) BsCt + Xrst Ar(dBs/dt) Ct + Xrst ArBs(dCt /dt)
Wektory równoległe spełniają (6) oraz (11) jeśli zatem za pomocą tych równości wykluczymy z tego równania wektory Ar , Br , Cr to otrzymamy :
d/dt (Xrst ArBsCt ) = [(dXrst /dt ) + Γrmn Xmst (dxn/dt) − Γmsn Xrmt (dxn/dt) − Γmnt Xrsm (dxn/dt)] ArBsCt
Z prawej strony równania mamy skalar, a Ar ,Bs ,Ct są dowolnymi wektorami, zatem z twierdzenia ilorazowego wynika, że wyrażenie w nawiasie kwadratowym jest tensorem i to tensorem tego samego typu co Xrst .
Oznaczmy ten tensor jako DXrst / Dt i nazwijmy go „pochodną absolutną tensora Xrst względem t”.
W takim razie otrzymamy :
DXrst / Dt = (dXrst /dt ) + Γrmn Xmst (dxn/dt) − Γmsn Xrmt (dxn/dt) − Γmnt Xrsm (dxn/dt) (15)
Zakładamy jak i powyżej, że Xrst - jest polem tensorowym określonym w całej przestrzeni i że składowe tego tensora są funkcjami od xr. Jeśli teraz weźmiemy dowolną krzywą przechodzącą przez punkt P, to jak wiadomo wyrażenie (15) wzdłuż tej krzywej będzie tensorem. A ponieważ :
dXrst /dt = ( ∂Xrst / ∂xu ) (dxu /dt)
to prawą część (15) możemy przepisać w postaci :
[(∂Xrst /∂xu) + Γrmu Xmst − Γmsu Xrmt − Γmtu Xrsm ] (dxu/dt)
To wyrażenie również określa tensor. Otrzymany rezultat jest słuszny dla wszystkich krzywych przechodzących przez punkt P tj. dla wszystkich wartości dxr/dt w punkcie P.
Odpowiednio wyrażenie w nawiasie kwadratowym jest tensorem, mającym o jeden więcej kowariantny indeks niż tensor wejściowy Xrsm Ten tensor nazywamy „pochodną kowariantną tensora Xrsm” , i oznaczamy go symbolicznie jako : Xrst; u
gdzie średnik oznacza różniczkowanie po xu.
W takim razie otrzymujemy:
Xrst; u = (∂Xrst /∂xu) + Γrmu Xmst − Γmsu Xrmt − Γmtu Xrsm (16)
Opisana metoda jest dosyć ogólna i może być zastosowana do otrzymania pochodnej absolutnej i kowariantnej tensorów dowolnego typu.
Zadania
1. Udowodnić równość :
Xr; s - Xs; r = (∂Xr /∂xs) − (∂Xs /∂xr)
Paragraf 4 Zachowanie zasad zwykłego rachunku różniczkowego. Lemat Ricciego
Ze zwykłego rachunku różniczkowego znane są zasady znajdowania pochodnej sumy i iloczynu funkcji.
Pokażemy teraz, że te same prawa stosowane są do znajdowania pochodnej absolutnej i kowariantnej sumy i iloczynu tensorów. Oprócz tego zauważymy, że jeśli nasz układ jest afiniczny to wszystkie gmn są stałe a zatem symbole Christoffela są tożsamościowo równe zeru. Dlatego jak wynika z (15) i (16) w afinicznym układzie współrzędnych pochodna absolutna tensora pokrywa się z pochodną zwykłą a pochodna kowariantna pokrywa się z pochodną cząstkową. Dlatego jeśli daną mamy pewną zależność wiążącą zwykłe i cząstkowe pochodne tensorów we współrzędnych afinicznych to po prostu możemy zamienić pochodne zwykłe na absolutne i cząstkowe na kowariantne, otrzymamy po tej operacji odpowiadające wejściowemu tensorowe równanie, które jest słuszne w dowolnym układzie współrzędnych.
Przykładowo załóżmy, że trzy tensory Ars ,Brs ,Cr i ich pochodne związane są równaniem :
dArs / dt = (∂Brs /∂xt) Cr
słusznym w afinicznym układzie współrzędnych. Stąd widzimy, że równość:
DArs / Dt = Brs, t Cr
która jest równaniem tensorowym, słusznym w pewnym specjalnym afinicznym układzie współrzędnych i dlatego jest również słuszne w dowolnym krzywoliniowym układzie współrzędnych.
Rozpatrzmy sumę dwóch tensorów Ars ,Brs :
Crs = Ars + Brs
Jeśli te tensory są funkcjami parametru t, to :
dCrs / dt = (dArs / dt ) + (dBrs /dt )
i w szczególności równośćta jest słuszna w dowolnym afinicznym układzie współrzędnych. Dlatego równość :
DCrs / Dt = ( DArs / Dt ) + ( DBrs / Dt ) (17)
Jest słuszna w dowolnym układzie współrzędnych. W taki sposób można udowodnić równość
Crs; t = Ars; t + Brs; t (18)
Te dwa wzory pokazują, że zwykłe zasady różniczkowania sumy pozostają słuszne również dla absolutnego i kowariantnego różniczkowania.
Rozpatrzmy następnie iloczyn dwóch tensorów Ars , Brst i dla ogólności załóżmy, że iloczyn ten zawężono
względem m :
Crst = Arm + Bmst
Poprzez zwykłe różniczkowanie otrzymujemy :
dCrst / dt = (dArm / dt )Bmst + Arm + (dBmst / dt)
Równość ta w szczególności jest słuszna w dowolnym afinicznym układzie współrzędnych.
Stąd od razu otrzymujemy równość tensorową :
DCrst / Dt = (DArm / dt )Bmst + Arm + (DBmst / Dt) (19)
Słuszną w dowolnym układzie współrzędnych. Analogicznie :
Crst; u = Arm; u Bmst + Arm Bmst; u (20)
To pokazuje, że zwykłe zasady różniczkowania są słuszne również dla iloczynu tensorów.
Posługując się zasadami absolutnego i kowariantnego różniczkowania tensorów dochodzimy do pewnych ważnych twierdzeń, o których w tej chwili wspomnimy.
Weźmiemy tensor metryczny grs, wiemy, że jego składowe w afinicznym układzie współrzędnych są stałymi, odpowiednio w takich współrzędnych mamy :
(∂grs / ∂xt ) = 0
dlatego w dowolnym układzie współrzędnych słuszne jest następujące równanie tensorowe :
grs; t = 0 (21)
tj. pochodna kowariantna tensora metrycznego jest równa tożsamościowo zeru
Ten ważny rezultat znany jest jako lemat Ricciego. W taki sposób można również udowodnić że pochodna kowariantna tensora stowarzyszonego grs jest także tożsamościowo równa zeru.
ε-obiekty i symbole Christoffela są stałe w dowolnym AUW (afinicznym układzie współrzędnych) zatem odpowiednio:
εrst; u = εrst; u = δrs; u = δrpst; u = 0 (22)
Innymi słowy pochodne kowariantne ε-obiektów i symboli Christoffela są tożsamościowo równe zeru.
Z rezultatów tych w sposób prosty wynika, że przy znajdowaniu pochodnej absolutnej i kowariantnej dowolnej kombinacji tensorów metrycznych , ε-obiektów i symboli Christoffela można je traktować jako stałe.
Dla przykładu udowodnimy, że tensor można zawężać zarówno przed jak i po różniczkowaniu kowariantnym, przy czym wartość pochodnej kowariantnej przy takiej operacji będzie niezmienna. Na początku zauważmy, że operacja zawężania tensora względem dwóch indeksów jest równoważna pomnożeniu tensora przez δrs a następnie zawężeniu tj.
Amrm = δpq Aqrp.
Ponieważ symbole Kroneckera przy różniczkowaniu kowariantnym można traktować jako stałe mamy :
(δpq Aqrp); s = δpq (Aqrp); s
co dowodzi naszego stwierdzenia.
Zadania
1. Udowodnić równość :
D/Dt ( gmn XmYn) = gmn (DXm/Dt )Yn + gmn Xm ( DYn/Dt )
2. Pokazać, że podniesienie i obniżenie indeksu może być zrobione zarówno przed jak i po operacji różniczkowania absolutnego i kowariantnego.
3. Udowodnić równość:
∂ /∂xr (gmn XmYn) = Xm; rYm + XmYm; r
4. Udowodnić, że jeśli X -jest długością wektora Xr to :
X; r = (Xm; rXm) / X
Paragraf 5 Dywergencja i rotacja wektora. Laplasjan
Niech będzie dany wektor Xr , wiadomo że Xr; s - jest jego pochodną kowariantną i jest tensorem mieszanym.
Tak więc możemy określić skalar :
Φ = Xr; r (23)
Teraz popatrzmy jakie wartości może przybierać Φ w kartezjańskim układzie współrzędnych. Jak wiadomo w układzie tym pochodna może być zamieniona ze zwykłą pochodną cząstkową
Odpowiednio mamy więc równość:
Φ = (∂X1/∂x1) + (∂X2/∂x2) + (∂X3/∂x3)
Wyrażenie to nazywamy dywergencją wektora Xr , w ogólniejszym układzie współrzędnych dywergencję określamy wzorem (23). Jeśli weźmiemy wektor stowarzyszony X r to oczywiste jest, że Φ może być wyrażony w równoważnej postaci :
Φ = gmn Xm; n (24)
która to określa dywergencje przez kowariantne składowe wektora.
Dalej, jeśli istnieje funkcja skalarna ϕ taka, że wektor kowariantny Xr określony może być wzorem :
Xr = (∂ϕ /∂xr) = ϕ; r
to wektor Xr nazywamy „gradientem ϕ”. W tym przypadku dywergencję Xr oznaczamy
Δϕ = gmn ϕ; mn (25)
W ortogonalnym kartezjańskim układzie współrzędnych (25) przechodzi w :
Δϕ = [(∂2ϕ / ( ∂x1)2] + [(∂2ϕ / ( ∂x2)2] + [(∂2ϕ / ( ∂x3)2]
Wyrażenie to nazywamy „laplasjanem ϕ”. Odpowiednio w dowolnym układzie współrzędnych laplasjan ϕ określony jest wzorem (25).
Na koniec weźmiemy pochodna kowariantną Xr; s wektora kowariantnego Xr, i zbudujemy wektor :
Rr = εrst Xr; s (26)
Wektor ten nazywamy rotacją wektora Xr. Aby znaleźć jej postać w układzie ortogonalnym kartezjańskim zauważmy że w układzie tym εrst = erst, a pochodna kowariantna przechodzi w pochodna cząstkową.
Dlatego składowe wektora Rr można wyrazić następująco :
[(∂X3 /∂x2 ) - (∂X2 /∂x3)] , [(∂X1 /∂x3 ) - (∂X3 /∂x1)] , [(∂X2 /∂x1 ) - (∂X1 /∂x2)] ,
Należy zauważyć, że jeśli Xr - jest gradnientem funkcji ϕ to Xr; s = Xs; r i otrzymujemy, że rotacja gradientu jest tożsamościowo równy zeru.
Zadania
1. Pokazać, że : Γs; rt + Γr; st = (∂grs /∂xt )
2. Pokazać, że : Γt; rs = gmt Γmst
Paragraf 6 Tensor Rirmanna-Christoffela. Tożsamości Lame'
Ponieważ pochodna kowariantna tensora jest tensorem, to można wziąć ponownie pochodną kowariantną otrzymanego tensora. Tensor, otrzymany poprzez dwukrotne kowariantne różniczkowanie nazywamy „drugą pochodną kowariantną” oczywiste jest również, że możemy wziąć pochodne kowariantne dowolnego rzędu.
Rozpatrzmy drugą pochodną kowariantną dowolnego wektora Xr :
Xr; st = (∂Xr; s /∂xt ) − Γmrt Xm; s − Γmst Xr; m = (∂2Xr / ∂xs∂xt ) − Γmrs (∂Xm /∂xt) - Γmrt (∂Xm /∂xs ) -
− Γmst (∂Xr /∂xt ) - Xm [ (∂ /∂xt ) Γmrs −Γmrp Γpst − Γmsp Γprt ]
Przestawmy w tym wzorze s i t i odejmijmy te dwa wyrażenia. Wykorzystując własność symetrii symboli Christoffela otrzymujemy :
Xr; st - Xr; ts = Rprst Xp (27)
gdzie wprowadziliśmy oznaczenie :
Rprst = (∂ /∂xs )Γprt − (∂ /∂xi) Γprs + Γmrt Γpms − Γmrs Γpmt (28)
W równości (27) po lewej stoi oczywiście tensor i dlatego po prawej powinien być również tensor.
Jednak Xp - jest dowolnym wektorem, dlatego wykorzystując twierdzenie ilorazowe wnioskujemy, że Rprst - jest tensorem, tensor ten nazywamy „tensorem Riemanna -Christoffela.
Zauważmy, że tensor ten zbudowany jest tylko z gmn i jego pochodnych do drugiego rzędu włącznie.
Opuszczając indeks p, otrzymujemy tensor stowarzyszony :
Rprst = gmn Rmrst
Znajdziemy wyrażenie dla tego tensora stowarzyszonego.
Mamy zatem :
gpm(∂ /∂xs)Γmrt = (∂ /∂xs)(gpm Γmrt ) − Γmrt ∂gpm/∂xs = (∂ /∂xs)Γp, rt - Γmrt(Γm, ps + Γp, ms )
Jednak :
Rprst = gmn Rmrst = gpm (∂ /∂xs)Γmrt − gpm (∂ /∂xt)Γmrs + ΓmrtΓp, ms +ΓmrsΓp, mt
Wykorzystując poprzednią równość otrzymujemy :
Rprst = (∂ /∂xs )Γp, rt − (∂ /∂xt)Γp, rs + ΓmrsΓm, pt +ΓmrtΓm, ps (29)
Jeśli podstawimy do powyższej równości wyrażenie dla symboli Christoffela (4) to przyjmie ona postać :
Rprst = ½ [(∂2gpt / ∂xr ∂xs ) + (∂2grs / ∂xp ∂xt ) − (∂2gps / ∂xr ∂xt ) − (∂2grt / ∂xp ∂xs ) +
+ gmn (Γm, rs Γn, pt − Γm, rt Γn, ps ) (30)
Z (30) widzimy, że tensor Rprst spełnia warunki :
Rprst = − Rrpst (31)
Rprst = − Rprts (31)
Rprst = Rstpr (31)
Pierwsze dwie równości wyrażają ten fakt, że Rprst jest antysymetryczny względem indeksów p, r, a także
względem s, t.
Wprowadzimy oznaczenie:
Sij = ¼ εikl εjmn Rklmn (32)
Jeśli pomnożymy tą równość przez εipr εjst i posumujemy względem i, j od 1 do 3 to w wyniku własności antysymetrii tensora Rprst otrzymamy :
εiprεjst Sij = ¼ δkipr δmnstRklmn = ½ δmnstRprmn = Rprst
W takim razie :
Rprst = εiprεjst Sij (33)
Wykorzystując ostatnią z równości (31) otrzymujemy :
Sij = ¼ εikl εjmn Rklmn = ¼ εikl εjmn Rmnkl = ¼ εjmn εikl Rmnkl = Sji
Stąd wynika, że Sij - jest tensorem symetrycznym. Otrzymaliśmy wniosek, że w przestrzeni trójwymiarowej tensor Riemana-Christoffela można wyrazić przez tensor symetryczny drugiego rzędu Sij .
Wróćmy do równości (27) i popatrzmy jaką postać przyjmie to równanie tensorowe w kartezjańskim układzie współrzędnych . Ponieważ w tym przypadku pochodną kowariantną
można zamienić na pochodną cząstkową, łatwo zauważyć, że po lewej stronie tej równości będzie stało wyrażenie :
(∂2Xr / ∂xs ∂xt ) − (∂2Xr / ∂xt ∂xs )
Jednak jest ono tożsamościowo równe zeru ponieważ różniczkowanie cząstkowe jest operacją przemienną. Odpowiednio z prawej strony także powinno być zero, a ponieważ wektor Xr jest wektorem dowolnym to :
Rprst = 0 (34)
tj. tensor Riemanna - Christoffela jest równy zeru (przyczyną zerowania się tego tensora jest to, że nasza przestrzeń jest euklidesowa i dopuszcza istnienie kartezjańskiego układu współrzędnych. W geometrii różniczkowej mamy do czynienia z bardziej ogólnymi przestrzeniami w którym tensor ten nie jest równy zeru)
Dlatego z równości (32) otrzymujemy :
Sij = 0 (35)
I odwrotnie jeśli Sij jest tożsamościowo równe zeru to z (33) widać, że Rprst także się zeruje.
Warunków (35) jest sześć i tensor metryczny gmn powinien je spełniać jako tożsamości.
Te warunki nazywają się „tożsamościami Lamego”
Zadania
1. Pokazać, że : S11 = (1/g) R2323 , S23 = (1/g) R3112 , itd.
Zadania do rozdziału XII
1. Rozpisać w pełnej formie równanie tensorowe: grs, t = 0 a następnie sprawdzić, że :
(∂grs /∂xt ) + gms Γrmt + gmrΓsmt = 0
2. Rozpisać w pełnej formie równość tensorową εrst, p = 0 a następnie podstawiając za r, s, t = 1,2,3 udowodnić, że :
[ ∂log(√g )] /∂xp = Γmmp
3. Wykorzystując rezultaty zadania1, 2 udowodnić równość:
(1/g) [∂(√g ) grs) / ∂xp] + Γrmn gmn = 0
4. Udowodnić, że kowariantne składowe rotacji wektora Xr w ogólnym układzie współrzędnych są równe :
( 1/√g ) [(∂X3 /∂x2) − (∂X2 /∂x3)] , (1/√g )] [(∂X1 / ∂x3) − (∂X3 / ∂x1)] , (1/√g ) [(∂X2 /∂x1) − (∂X1 /∂x2)]
5. Pokazać, że dywergencja Xr jest postaci :
Xr; r = ( 1/√g ) (∂/ ∂xr) √g Xr
(formuła ta jest bardzo dogodna do dalszych obliczeń)
6. Pokazać, że laplasjan ϕ określony jest ogólnym wzorem :
Δϕ = ( 1/√g) (∂/ ∂xr)[ √g grs( ∂ϕ/∂xr )]
************************************************************************************************
Rozdział XIII - Krzywe w przestrzeni
Paragraf 1 Wektor styczny do krzywej
Krzywa w przestrzeni jest miejscem geometrycznym współrzędne którego są funkcjami jednego parametru. W takim razie współrzędne punktu na krzywej C określone są równaniami typu :
xr =xr(t) (1)
Z (7) (z rozdziału XI ) widać, że długość s krzywej spełnia równanie :
(ds /dt)2 = gmn (dxm/dt)(dxn/dt)
i odpowiednio długość drogi s określona jest całką :
t
s = ∫ [gmn (dxm/dt)(dxn/dt)]1/2dt (2)
t0
Weźmiemy s w charakterze parametru wzdłuż C, wtedy otrzymamy :
gmn (dxm/ds)(dxn/ds) = 1 (3)
skąd widać, że dxr/ds jest wektorem jednostkowym.
Niech P - będzie punktem na krzywej C i xr - będzie jej współrzędnymi, Q - punktem sąsiadującym, leżącym na
C i odpowiadający wzrostowi długości drogi ds, wtedy współrzędne punktu Q są równe xr +dxr.
Wektor lim(PQ→ /ds ) nazywamy „wektorem stycznym” oznaczamy go przez λr.
W takim razie:
dxr/ds = λr (4)
Przy czym z (3) widać, że λr - jest wektorem jednostkowym stycznym do krzywej C.
Paragraf 2 Wektor normalny. Normalna główna i binormalna
Dany wektor ortogonalny do wektora stycznego nazywamy „normalnym wektorem krzywej”
Odpowiednio warunkiem tego, że μr - jest wektorem normalnym do krzywej C jest :
gmn λmμn = 0 (5)
Ponieważ λm - jest wektorem jednostkowy , to :
gmn λmλn = 1
i jeśli weźmiemy pochodną absolutną tego wyrażenia to otrzymamy:
gmn λm (Dλn /Ds) = 0
To wyrażenie pokazuje, że wektor Dλn /Ds jest wektorem normalnym do krzywej.
Oznaczmy wektor jednostkowy o kierunku Dλn /Ds przez μr. Wtedy :
μr = (1/ χ ) ( Dλr /Ds ) (χ >0) (6)
gdzie χ wybrano tak aby μr był wektorem jednostkowym. Ten wektor normalny nazywamy „normalnym głównym” krzywej C, a χ - jej krzywizną w rozpatrywanym punkcie.
Dalej - ponieważ μr jest wektorem jednostkowym totak samo jak dla λr. można udowodnić, że jego pochodna absolutna Dμr /Ds jest ortogonalna do μr. Jeśli weźmiemy od obu części równości (5) pochodne absolutne względem s
to otrzymamy:
gmn (Dλm /Ds) μn + gmn λm(Dμn /Ds ) = 0
lub
gmn λm(Dμn /Ds) = − gmn (Dλm /Ds)μn = − χ gmn μmμn = − χ
Równość tą można przepisać do postaci:
gmn λm(Dμn /Ds + χ λn) = 0
skąd widać, że wektor :
(Dμr /Ds ) + χ λr
jest ortogonalny do λr.
Oprócz tego mamy równość:
gmn μm(Dμn /Ds + χ λn) = 0
z której widać, że (Dμn /Ds ) + χ λn jest ortogonalny μr. Dlatego wektor jednostkowy νr którego możemy określić równością :
νr = (1/τ)(Dμr /Ds + χ λr) (7)
jest ortogonalny zarówno do λr jak i do μr. Wielkość τ wybrano tak aby νr był wektorem jednostkowym.
W takim razie widać że λr, μr, νr, są wzajemnie ortogonalną trójką wektorów.
Znak τ nie zawsze jest dodatni, wybieramy go w ten sposób aby spełniony był warunek :
εijkλiμjνk = 1 (8)
Innymi słowy wektory λr, μr, νr, powinny obrazować dodatnio zorientowaną lub prawą trójkę
Wektor νr nazywamy „binormalnym” do krzywej C w rozpatrywanym punkcie, a τ - „skręceniem”
(torsją - przypis własny) krzywej.
Zadania
1. Udowodnić, że χ = [gmn(Dλm /Ds) (Dλn / Ds)]1/2
Paragraf 3 Wzory Freneta
Ponieważ νr jest prostopadły do λr i μr oraz spełnia warunek (8) to można pokazać, że :
νr = εrmnλm μn
odpowiednio
Dνr / Ds = εrmn(Dλm / Ds) μn + εrmnλm(Dμn / Ds) (9)
Jeśli w (6) i (7) dokonać zmiany indeksów i rozpisać te równości względem Dλr / Ds. i
Dμr / Ds to będziemy mieli :
Dλr / Ds = χ μr
Dμr / Ds = τνr − χ λr
Podstawiając te równości do (9) otrzymamy :
Dνr /Ds = εrmnχ μm μn + εrmnλm(τνr − χ λr ) = τ εrmnλmνn = τμr
Porównując te wzory z (6) i (7) otrzymamy następujące równania:
Dλr /Ds = χ μr (10)
Dμr /Ds = τ μr − χ λr (10)
Dνr /Ds = − τ μr (10)
Są to wzory Freneta - wiążą one wielkości χ , τ, λr, μr, νr
Paragraf 4 Równanie prostej
Jeśli wektor Xr określony jest wzdłuż krzywej, to jego składowe powinny być zadane poprzez funkcje długości drogi krzywej s. Widzieliśmy, że jeśli Xr - jest polem wektorów równoległych zadanym wzdłuż krzywej to powinno ono spełniać równość tensorową :
DXr/Ds = (dXr /ds) + ΓrmnXm(dxn /ds) = 0 (11)
Jego składowe kowariantne Xr spełniają analogiczne równanie tensorowe :
DXr/Ds = (dXr /ds) − ΓmrnXm(dxn /ds) = 0 (12)
Możemy wykorzystać ten rezultat dla otrzymania równania prostej w dowolnym układzie współrzędnych.
Wektor styczny na linii prostej zawsze ma jeden i ten sam kierunek tj. obrazuje pole wektorów równoległych i powinien spełniać (11). Wektor styczny jednostkowy jest dany następująco :
λr = dxr /ds
Odpowiednio równanie linii prostej będzie dane:
Dλr/Ds = (d2xr /ds2 ) + Γrmn (dxm/ds)(dxn/ds) = 0 (13)
Możemy otrzymać to równanie również w inny sposób, mianowicie: zauważmy, że (13) jest równaniem tensorowym i w kartezjańskim układzie współrzędnych przechodzi w
d2xr /ds2 = 0
Co jest oczywiście równaniem linii prostej w tym układzie współrzędnych.
Ze wzorów Freneta wynika, że (13) wyraża prosty fakt równości zeru krzywizny tj. prosta ma zerową krzywiznę.
To jest charakterystyczną własnością prostej.
************************************************************************************************
Rozdział XIV - Wewnętrzna geometria powierzchni
Paragraf 1 Współrzędne krzywoliniowe na powierzchni
Niech (y1 ,y2 ,y3 ) będą (tak jak wcześniej ) współrzędnymi kartezjańskimi punktu.
Z definicji - powierzchnią nazywamy miejsce geometryczne punktów których współrzędne są funkcjami dwóch niezależnych parametrów. W takim razie równania powierzchni będą dane następująco
yr = yr (u1, u2 ) r = 1,2,3 (1)
gdzie u1, u2 - są parametrami. Innymi słowy dany punkt na powierzchni jednoznacznie określony jest dwoma liczbami u1, u2. Odpowiednio możemy nazwać te liczby współrzędnymi punktu na powierzchni.
Przy tym należy przypomnieć, że 1 i 2 - są indeksami oznaczającymi różne współrzędne a nie wykładnikami potęg.
Rozpatrzmy sens geometryczny współrzędnych ( u1, u2 ).
Jeśli u2- traktować jako stałe i zmieniać wartość u1 to punkt (1) jako zależny od jednego parametru opisuje pewną krzywą.
Krzywa ta całkowicie leży na powierzchni. Jeśli będziemy u2 nadawać różne wartości to otrzymamy zbiór krzywych na tej powierzchni. Krzywe te nazywamy „u1-krzywymi” ponieważ wzdłuż tych krzywych zmienia się tylko parametr u1, równaniem tego zbioru krzywych jest u2 = const., odpowiednio zatem, jeśli mówimy, że punkt P ma współrzędne
u20 to oznacza to, że punkt P leży na pewnej określonej u1 -krzywej a mianowicie na :
u2 = u20
W taki sam sposób otrzymujemy drugą rodzinę (zbiór) krzywych u1 = const. wzdłuż których zmienia się tylko parametr u2 , krzywe te nazywamy „u2-krzywymi”.
Łatwo zauważyć, że każdy punkt powierzchni określony jest jako przecięcie dwóch krzywych przynależących do różnych rodzin. Z geometrycznego punktu widzenia współrzędne (u1, u2 ) określają dwie krzywe po jednej z każdej rodziny które przechodzą przez ten punkt. W dalszym ciągu dla skrócenia będziemy nazywać u1-krzywą i u2-krzywą tj. krzywe współrzędnych u1, u2 - układem współrzędnych krzywoliniowym na powierzchni.
Wszystkie własności powierzchni które można opisać nie odwołując się do przestrzeni w której zanurzona jest ta powierzchnia, nazywamy „wewnętrznymi własnościami powierzchni”
a opisem tych własności zajmuje się geometria wewnętrzna powierzchni.
Tą geometrią właśnie zamierzamy się obecnie zająć. Dla tego celu współrzędne krzywoliniowe ( u1, u2 ) są najbardziej użyteczne.
Oczywiście istnieje nieskończenie wiele możliwych układów współrzędnych za pomocą których można zdefiniować punkty na powierzchni. W rzeczywistości możemy wziąć w charakterze krzywych współrzędnościowych dowolne dwie rodziny które spełniają następujący warunek :
każda krzywa z jednej rodziny przecina każdą krzywą z drugiej rodziny w jednym i tylko jednym punkcie.
Jeśli u'1, u'2 będą innym układem współrzędnych na powierzchni to
u'1, u'2 będą funkcjami tylko u1, u2 i odwrotnie tj. istnieje przekształcenie funkcjonalne postaci:
u'1 = f( u1, u2 ) , u'2 = f( u1, u2 ) (2)
przy czym przekształcenie to jest odwracalne :
u1 = ϕ( u'1, u'2 ) , u2 = ϕ( u'1, u'2 ) (3)
Zadania
1. Pokazać, że powierzchnię y3 = f( y1, y2 ) można przedstawić w formie parametrycznej w następujący sposób :
y1 = u1, y2 = u2, y3 = f(u1, u2 )
Jaki kształt mają krzywe współrzędnych ?
Paragraf 2 Wprowadzenie greckich indeksów. Tensory na powierzchni
Widzieliśmy, że współrzędne krzywoliniowe na powierzchni są dwie, i dlatego mieliśmy do czynienia z dwoma zmiennymi (u1, u2 ). Do tej pory dla oznaczenia zmiennych , których było trzy wykorzystywaliśmy indeksy łacińskie przy czym mieliśmy dwie zasady dotyczące tych indeksów a mianowicie : indeks swobodny przybierał wartości
od 1 do 3, indeks niemy oznaczał sumowanie od 1 do 3. Okazuje się, że wygodnie jest stosować oznaczenia indeksowe także i dla zmiennych postaci (u1, u2 ), aby nie zmieniać niczego w oznaczeniach dla indeksów łacińskich , będziemy dla naszych celów stosować indeksy greckie .
Wtedy nasze zmienne można zapisać tak:
uα gdzie α = 1,2 (4)
Wprowadzimy dwie zasady dotyczące indeksów greckich.
1) Powtarzający się indeks dla greckich liter oznacza sumowanie od 1 do 2.
2) Indeks - grecki - wolny przybiera wartości od 1 do 2
Nietrudno zauważyć, że wszystko co powiedzieliśmy w rozdziale I można teraz powtórzyć z pewnymi zmianami dotyczącymi indeksów greckich. Przykładowo obiekt drugiego rzędu będzie teraz oznaczany przez aαβ i będzie się składał z ułożonych w pewnym porządku liczb
a11 , a12
a11 , a12
Tak jak wcześniej otrzymujemy :
2
aαβ uαuβ = Σ aαβ uαuβ = a11(u1)2 + a12 u1u2 + a21 u2u1 + a22 (u2)2
α,β =1
Antysymetryczne e-obiekty w indeksach greckich są obiektami drugiego rzędu :
eαβ i eαβ , zdefiniowanymi następująco :
e11 = e22 = 0 , e12 = − e21 = 1 (5)
e11 = e22 = 0 , e12 = − e21 = 1 (5)
Istnieją dwa symbole Kroneckera określone następująco :
δαβλμ = eαβeλμ ; δαλ = δαβλβ (6)
Pierwszy symbol równy jest zeru jeśli kombinacje α, β i λ, μ nie są permutacjami liczb 1,2 w pozostałych przypadkach jest on równy +1 dla jednakowych permutacji oraz -1 jeśli permutacje są różne. Drugi symbol posiada zwykłe własności tj. jest równy zeru jeśli α i β nie są wzajemnie równe i jest równy 1 jeśli α i β są równe.
Czytelnik może samodzielnie rozwinąć teorię wyznaczników drugiego rzędu w sposób analogiczny jak to zrobiliśmy w rozdziale I.
Przekształcenia (2) i (3) możemy skrótowo przedstawić w postaci :
u'α = fα ( u1, u2 ) , uα = ϕα ( u'1, u'2 ) (7)
Odpowiednio, możemy zatem zbudować teorie tensorów dowolnego rzędu względem przekształceń tych zmiennych. Teoria ta jest analogiczna do teorii tensorów dla zmiennych xr, przykładowo obiekt trzeciego rzędu aαβγ będzie pseudotensorem o wadze M, kontrawariantnym względem α i kowariantnym względem β, γ jeśli jego składowe w nowych zmiennych a'αβγ będą spełniać zależność :
a'ρστ = | (∂uμ / ∂u'ν ) |M (∂u'ρ / ∂uα ) (∂uβ / ∂u'σ )(∂uγ / ∂u'τ ) aαβγ (8)
Twierdzenia algebry tensorowej udowodnione w rozdziale II są oczywiście słuszne i teraz, słuszne są również wprowadzone poprzednio określenia pól tensorowych. Jeśli w (8) M = 0 to tensor aαβγ nazywa się, tak jak przedtem - tensorem właściwym, ta klasa tensorów pozostaje dla nas najważniejsza.
Jeśli chcielibyśmy wprowadzić dla tensorów z greckimi i łacińskimi indeksami rozróżnienie terminologiczne to możemy nazwać te pierwsze „tensorami na powierzchni” ponieważ są one tensorami względem przekształceń współrzędnych na powierzchni, a drugie „tensorami przestrzennymi” ponieważ są one tensorami względem przekształceń współrzędnych w przestrzeni.
Paragraf 3 Element długości i tensor metryczny
Niech P- będzie punktem na powierzchni o współrzędnych uα , a Q - punktem sąsiednim o współrzędnych uα + duα. Oznaczmy przez yr i yr +dyr współrzędne kartezjańskie w przestrzeni, punktów P i Q. Wtedy z równań (1) otrzymujemy :
dyr = (∂yr / ∂uα)duα (9)
Niech ds - będzie odległością między P i Q, wtedy :
3
ds2 = Σ (dyr )2
1
Wykorzystując (9) otrzymujemy:
ds2 = aαβ duα duβ (10)
gdzie wprowadzono oznaczenie :
3
aαβ = (∂yr /∂uα ) (∂yr /∂uβ ) = Σ (∂yr /∂uα ) (∂yr /∂uβ ) (11)
r = 1
Stąd widać, że aαβ jest symetryczną względem swoich indeksów, funkcją współrzędnych uα
Ponieważ ds - jest skalarem to z (10) wynika, że aαβ duα duβ - jest także skalarem, a duα - jest dowolnym kontrawariantnym wektorem. Dlatego z twierdzenia ilorazowego wynika, że aαβ jest kowariantnym tensorem drugiego rzędu, tensor ten nazywamy tensorem fundamentalnym” lub „tensorem metrycznym” jak bowiem widać z (10) długość elementu drogi na powierzchni jest właśnie określona poprzez ten tensor.
Jeśli oznaczymy przez „a” wyznacznik |aαβ | i poprzez aαβ dopełnienie algebraiczne aαβ dzielone przez a, to analogicznie jak wcześniej możemy pokazać, że aαβ jest tensorem kontrawariantnym przy czym :
aαβ aαβ = δαν (12)
Jeśli zbudujemy obiekty :
εαβ = √a eαβ εαβ = (1/√a ) eαβ (13)
to one również będą tensorami, nazwiemy je ε-obiektami.
Długość lub moduł A kontrawariantnego wektora Aα określimy równością :
A = (aαβ Aα Aβ )1/2 (14)
Analogicznie możemy określić moduł wektora Bα :
B = (aαβ Bα Bβ )1/2 (15)
Wektorem jednostkowym nazywamy wektor którego długość równa jest jeden i odpowiednio wektor λα jest wektorem jednostkowym jeśli spełnia równanie:
aαβ λα λβ = 1 (16)
Dzieląc (10) przez ds2 otrzymujemy :
aαβ (duα /ds) (duβ /ds ) = 1 (17)
w takim razie duα / ds jest wektorem jednostkowym.
Z pomocą tensorów aαβ i aαβ możemy, tak jak wcześniej dokonywać operacji podniesienia i opuszczenia indeksów w taki sam sposób jak to określone zostało dla przypadku tensorów w przestrzeni.
Paragraf 5 Krzywe geodezyjne
Dowolna krzywa na powierzchni określona jest poprzez zadanie współrzędnych uα jako funkcji jednego parametru t. Dlatego równanie krzywej ma postać:
uα = fα (t) (26)
Długość krzywej między punktami A i B jest określona wzorem :
B
L = ∫ [aαβ (duα /dt) (duβ /dt )]1/2 dt (27)
A
Rozpatrzmy krzywe przechodzące przez dwa stałe punkty A i B. Spośród wszystkich takich krzywych istnieje tylko jedna krzywa która ma najmniejszą długość. Ta krzywa nazywa się
„geodezyjną między punktami A i B”. Jeśli nasza powierzchnia jest płaska to geodezyjną jest linia prosta.
Naszym zadaniem będzie znalezienie równania linii geodezyjnej przechodzącej przez punkty A i B.
Oznaczmy przez Г linię geodezyjną przechodzącą przez A i B, weźmiemy następnie krzywą sąsiednią do Г (także przechodzącą przez A i B) i oznaczmy ją Г'. Określimy punkty Г' w taki sposób, że jeśli punkty :
P o współrzędnych uα i P' o współrzędnych uα' są punktami sąsiadującymi odpowiednio na krzywych Г i Г' ,to wektor PP' - będzie małym wektorem
Ten wektor można zapisać w postaci εωα, gdzie ε- to nieskończenie mały mnożnik, a ωα - skończony kontrawariantny wektor wtedy :
uα' = uα + εωα (28)
Oczywiste jest, że ωα - jest funkcją parametru t, która to staje się zerem w punktach A i B.. W takim razie długość krzywej L' krzywej Г' między punktami A i B, jest funkcją ε i może być przedstawiona w postaci szeregu Taylora względem potęg ε.
Zauważmy, że przy ε = 0 krzywa Г' pokrywa się z Г, mamy zatem :
L' = L + ε(∂L' / ∂ε )0 + ½! ε2(∂2L' / ∂ε2 )0 + .......... (29)
indeks 0 oznacza, że ε powinno być równe zeru po zróżniczkowaniu.
Drugi człon w prawej części (29) nazywamy „pierwszą wariacją długości L” i zwykle oznaczamy ją δL.
Ponieważ Г jest linią geodezyjną to jej długość jest mniejsza niż długość dowolnej innej krzywej przechodzącej przez A i B. Innymi słowy L' osiąga minimum przy ε = 0 i odpowiednio zgodnie z zwykłymi prawami rachunku różniczkowego (∂L'/∂ε )0 powinna równać się zeru tj. pierwsza wariacja δL jest równa zeru jeśli Г - jest linią geodezyjną.
Znajdziemy jawne wyrażenie dla wariacji δL, wtedy z warunku, że znika ona dla wszystkich krzywych sąsiednich dojdziemy do równania linii geodezyjnej.
Niech :
ϕ(u, du/dt) =[aαβ (duα / dt) (duβ / dt )]1/2 .... (30)
wtedy :
ϕ' = ϕ(u', du'/dt ) = ϕ[ u + εω, u + ε(dω/dt) ]
i
(∂ϕ'/∂ε )0 = (∂ϕ / ∂uα )ωα + [ ∂ϕ / ∂(duα /dt)] (dωα /dt)
a ponieważ :
A
L' = ∫ ϕ' dt
B
to :
A
δL = ε(∂L' /∂ε )0 = ε ∫ {(∂ϕ / ∂uα )ωα + [ ∂ϕ /∂(duα /dt)] (dωα /dt)} dt
B
Całkując to wyrażenie otrzymujemy :
A B B
∫ [(∂ϕ / ∂uα )ωα ]dt = (∂ϕ / ∂(duα /dt)) | - ∫ d/dt {[∂ϕ / ∂(duα /dt)] }ωα dt (31)
B A A
Ponieważ ωα w punktach A i B jest zerem to mamy :
δL = ε ∫ [ (∂ϕ / ∂uα ) - d/dt [(∂ϕ / ∂(duα /dt))] ωα dt (31)
To jest wyrażenie dla pierwszej wariacji.
Jeśli Г - jest geodezyjną to δГ powinno być równe zeru dla wszystkich krzywych sąsiednich przechodzących przez
A i B tj. prawa część w (31) powinna znikać dla dowolnych wartości wektora ωα na krzywej Г. Dlatego powinna być spełniona równość:
d/dt {[∂ϕ / ∂(duα /dt)] } − (∂ϕ / ∂uα ) = 0 (32)
Te równania różniczkowe wraz z warunkiem, że krzywa Г przechodzi przez dane punkty A i B w ogólności określają krzywą Г. Dlatego są one równaniami tej krzywej. Napiszemy te równania w jawnej postaci :
[ ∂ϕ / ∂(duα /dt)] = [aαβ (duβ /dt )] /ϕ ,
∂ϕ / ∂duα = (1/2ϕ)( ∂aβγ /∂duα ) (duβ /dt )(duγ /dt )
i wtedy (32) przyjmuje postać :
d/dt { [aαβ (duβ /dt )] / ϕ} - (1/2ϕ)( ∂aβγ /∂duα ) (duβ /dt ) = 0
Do tej pory parametr t wzdłuż krzywej Г był całkowicie dowolny.
Uprościmy znacznie rachunki jeśli weźmiemy w charakterze parametru długość drogi s linii geodezyjnej.
W tym przypadku (30) przejdzie ϕ =1 wzdłuż Г a równania Г przyjmą wobec tego postać :
d/ds (aαβ (duβ /ds ) − ½ ( ∂aβγ /∂duα )(duβ / ds )(duγ /ds ) = 0
lub:
aαβ (d2 uβ /ds2 ) + ( ∂aβγ /∂duγ )(duβ /ds )(duγ /ds ) - ½ ( ∂aβγ /∂duα )(duβ /ds ) (duγ /ds ) = 0
Jeśli wprowadzimy oznaczenie:
Γγ, αβ = ½ [( ∂aβγ / ∂duα ) + ( ∂aαγ / ∂duβ ) − ( ∂aαβ / ∂duγ )] (33)
To powyższe równanie można zapisać następująco:
aαβ (d2uβ /ds2 ) + Γα, βγ (duβ /ds )(duγ /ds ) = 0
Podnosząc indeks α, dojdziemy do końcowej postaci tego równania:
(d2uα /ds2 ) + Γαβγ (duβ /ds )(duγ /ds ) = 0 (34)
gdzie podstawiliśmy:
Γαβγ = aαδ Γδ, βγ (35)
Wyrażenia (33) i (35) nazywamy symbolami Christoffela na powierzchni.
Porównując je z wcześniej wprowadzonymi symbolami widzimy, że występuje w nich składnik aαβ na takiej samej zasadzie jak dla symboli Christoffela w przestrzeni występował składnik grs .
Oprócz tego wiemy, że linia o najmniejszej długości lub inaczej linia geodezyjna między dwoma punktami w przestrzeni jest prostą z (13) widać, że równanie geodezyjnej na powierzchni ma taka sama postać.
Paragraf 6 Przekształcenie symboli Christoffela. Współrzędne geodezyjne
Rozpatrzmy dwa układy współrzędnych uα i u'α i znajdziemy w jaki sposób związane są między sobą symbole Christoffela w tych dwóch układach.
Weźmy linię geodezyjną Γ i niech uα i u'α - będą współrzędnymi pewnego punktu leżącego na tej geodezyjnej zadanymi w dwóch różnych układach współrzędnych. Współrzędne te są funkcjami drogi s krzywej Γ przy czym s jest skalarem. Wtedy :
du'α /ds = (du'α /duρ )(duρ /ds ) (36)
a po dwukrotnym zróżniczkowaniu :
d2 u'α'/ds2 = (∂u'α/ ∂uρ )(d2uρ /ds2 ) + (∂2u'α/∂uρ∂uσ )(duρ/ ds )(duσ /ds ) (37)
Ponieważ punkt leży na geodezyjnej więc słuszne są równości :
d2 u'α/ds2 = − Γ'αβγ (du'β/ds )(du'γ /ds )
d2 uρ /ds2 = − Γρστ (duσ /ds )(duτ /ds )
Po podstawieniu tych równości do (37) otrzymujemy :
Γ'αβγ (du'β /ds )(du'γ /ds ) = (∂u'α/∂uρ ) Γρστ (duσ /ds )(duτ /ds ) - (∂2u'α/∂uσ∂uτ ) (duσ/ ds )(duτ /ds )
Wykorzystując (36) otrzymujemy :
[(∂2u'α/∂uσ∂uτ ) − Γρστ (∂u'α/ ∂uρ ) + Γ'αβγ(∂u'β/ ∂uσ )(∂u'γ/ ∂uτ )] (duσ /ds ) (duτ /ds ) = 0 (38)
Linia geodezyjna Γ jest wybrana całkowicie dowolnie co oznacza, że równanie (38) jest słuszne dla wszystkich
(duρ / ds ), a ponieważ współczynniki przy (duσ /ds )(duτ /ds ) w (38) są symetryczne względem σ i τ to powinna być spełniona równość :
(∂2u'α/∂uσ∂uτ ) − Γρστ (∂u'α/ ∂uρ ) + Γ'αβγ(∂u'β/ ∂uσ )(∂u'γ/ ∂uτ ) = 0 (39)
Równanie to wyraża związek między symbolami Christoffela zdefiniowanymi w dwóch różnych układach współrzędnych. Ponieważ w symbole te wchodzą drugie pochodne cząstkowe zmiennych uα'względem uσ to symbole Christoffela nie są tensorami. W takim wypadku wychodząc ze wzoru :
(duα /ds ) = (∂uα / ∂u'ρ)(du'ρ/ds )
otrzymamy zależność odwrotną :
(∂2uα /∂u'σ∂u'τ ) - Γ'ρστ (∂uα / ∂u'ρ ) + Γαβγ(∂uβ/ ∂u'σ )(∂uγ / ∂u'τ ) = 0 (40)
Widzieliśmy, że we współrzędnych afinicznych w trzech wymiarach tensor metryczny grs ma stałe składowe i odpowiednio w tym układzie współrzędnych symbole Christoffela są wszystkie równe zeru.
Na powierzchni w ogólności nie można znaleźć takich współrzędnych (za wyjątkiem powierzchni które dają się odwzorować jednoznacznie na płaszczyznę), jednak pokażemy, że zawsze można tak układ współrzędnych aby wszystkie symbole Christoffela były w nim w określonym punkcie O równe zeru.
Takiego typu współrzędne nazywamy „współrzędnymi geodezyjnymi” w punkcie O.
Niech uα - będzie dowolnym układem współrzędnych i niech uαo - będzie współrzędnymi zadanego punktu O w tym układzie. Jeśli istnieje taki układ współrzędnych uα' , że wszystkie symbole Christoffela zdefiniowane w nim są w danym punkcie O równe zeru to z równania (40) można zobaczyć, że wtedy w tym punkcie powinno być :
(∂2uα /∂u'σ∂u'τ ) + Γαβγ(∂uβ/ ∂u'σ )(∂uγ / ∂u'τ ) = 0 (41)
i odwrotnie jeśli spełnione są te równania to wszystkie symbole Γ'ρστ są w punkcie O równe zeru.
Dokonajmy zmiany zmiennych postaci :
uα = uαo + u'α - ½ (Γαστ )0 u'σu'τ (42)
Widzimy, że współrzędne punktu O w nowym układzie współrzędnych będą : uα'= 0 tak więc w punkcie O jest :
(∂uα / ∂u'ρ ) = δαρ
Dlatego :
(∂2uα /∂u'σ∂u'τ ) = − (Γαστ)0
to pokazuje, że równość (41) w danym punkcie jest spełniona. Odpowiednio więc nowe współrzędne są współrzędnymi geodezyjnymi w punkcie O. Należy podkreślić, że symbole Christoffela we współrzędnych geodezyjnych w ogólności nie wszędzie są równe zeru a tylko w zadanym punkcie.
Paragraf 7 Przeniesienie równoległe względem powierzchni
Niech C - będzie krzywą na powierzchni i niech w każdym punkcie tej krzywej będzie zdefiniowany wektor Xα. Współrzędne uα każdego punktu C i składowe pola wektorowego
Xα są funkcjami parametru t. Jeśli weźmiemy inny układ współrzędnych u'α to składowe X'α pola wektorowego w nowych współrzędnych określone będą równaniami transformacyjnymi postaci:
X'α = (∂u'α / ∂uσ ) Xσ (43)
które również są funkcjami parametru t. Różniczkując po t (43) otrzymujemy :
dX'α / dt = (∂u'α / ∂uσ ) (dXσ /dt) + (∂2u'α / ∂uσ ∂uτ ) Xσ ( duτ /dt )
Jeśli podstawimy do (43) wartość wyrażenia (∂2u'α / ∂uσ ∂uτ ) z (39) to otrzymamy:
dX'α / dt = (∂u'α / ∂uσ ) (dXσ /dt) + Γρστ (∂u'α / ∂uρ ) Xσ ( duτ /dt ) - Γ'αβγ (∂u'β /∂uσ )(∂u'γ / ∂uτ ) Xσ ( duτ /dt )
wykorzystując (43) możemy przepisać to równanie następująco:
dX'α / dt + Γ'αβγ X'β ( duγ / dt ) = (∂u'α / ∂uρ ) [ (dXσ / dt) + Γρστ Xσ( duτ /dt )] (44)
Równość ta pokazuje, że wyrażenie :
δXα /δt = dXα /dt + Γαβγ Xβ( duγ /dt ) (45)
jest wektorem kontrawariantnym, który nazywamy pochodną absolutną wektora Xα na powierzchni . Rozpatrzmy równanie:
δXα /δt = dXα / dt + Γαβγ Xβ( duγ /dt ) = 0 (46)
Jest to równanie wektorowe i odpowiednio jeśli jest ono słuszne w jakimkolwiek układzie współrzędnych to będzie ono słuszne w drugim układzie współrzędnych. Ponieważ (46) jest równaniem różniczkowym pierwszego rzędu, to jeśli wektor Xα zadany jest w dowolnym punkcie krzywej D to (46) definiuje wektor Xα jednoznacznie w każdym innym punkcie tej krzywej. W taki właśnie sposób określiliśmy w sposób jednoznaczny pole wektorowe wzdłuż krzywej C. Nietrudno zauważyć, że (46) ma tą sama postać co (6) z rozdziału XII paragrafu1, (6) jest równaniem które spełnia pole wektorów równoległych wzdłuż krzywej . Dlatego mówimy, że układ wektorów na powierzchni zdefiniowany równaniem (46) jest polem wektorów równoległych na powierzchni. Stwierdzenie to stanowi definicje nowego pojęcia - „przeniesienia równoległego wektora na powierzchni”.
Należy podkreślić, że pole wektorów równoległych na powierzchni określone jest wzdłuż krzywej leżącej na tej powierzchni. Odpowiednio jeśli mamy zadane dwa punkty A i B na powierzchni a w punkcie A zadany jest wektor Xα to możemy określić wektor równoległy do tego wektora w punkcie B tylko w tym przypadku kiedy zadana jest pewna krzywa łącząca A i B, w ogólności ten wektor równoległy w punkcie b będzie zależny od postaci (charakteru) tej krzywej. Możemy powyższe stwierdzenia sformułować nieco inaczej, mianowicie :
niech na powierzchni zadany będzie pewien kontur zamknięty (krzywa zamknięta) i niech w pewnym punkcie tego konturu będzie zadany dowolny wektor. Zbudujemy wzdłuż tego konturu pole wektorów równoległych na powierzchni. Oczywiście a priori nie ma żadnych podstaw sądzić, że po obiegnięciu konturu wektor końcowy będzie równy wejściowemu wektorowi. W rzeczywistości przeniesienie równoległe wektora po zamkniętym konturze na powierzchni przy dojściu do punktu wejściowego ogólnie mówiąc prowadzi do innego wektora.
Paragraf 8 Absolutne i kowariantne różniczkowanie tensorów na powierzchni
Będziemy rozpatrywać zadanie analogiczne do zadania rozpatrywanego w rozdziale XII dla tensorów na powierzchni a mianowicie zajmiemy się budową nowych tensorów przy pomocy operacji różniczkowania pól tensorowych zadanych na powierzchni. Określając pole wektorów równoległych wzdłuż krzywej na powierzchni możemy wykorzystać rezultaty
otrzymane dla pól wektorowych w przestrzeni, dlatego ograniczymy się do zwięzłego omówienia tensorów na powierzchni. Jeśli Xαβγ - jest tensorem na powierzchni określonym wzdłuż krzywej C to jego składowe są funkcjami jednego parametru t, tak więc wielkości :
δXαβγ /δt = dXαβγ /dt + Γαστ Xαβγ (duτ /dt ) − Γσβτ Xασγ (duτ /dt ) − Γστγ Xαβσ (duτ /dt ) (47)
jest tensorem tego samego rzędu i typu co i Xαβγ, tensor ten nazywamy „pochodną absolutną Xαβγ wzgledem parametru t”. Jeśli Xαβγ - jest polem tensorowym określonym na całej powierzchni to jego składowe są funkcjami
uα, wtedy wielkości:
Xαβγ; δ = (∂Xαβγ / ∂uα) + Γασδ Xαβγ − Γσβδ Xασγ − Γσγδ Xαβδ (48)
obrazują tensor mający o jeden kowariantny indeks więcej niż Xαβγ.
Tensor ten nazywamy „pochodną kowariantną tensora Xαβγ”
Operacja kowariantnego różniczkowania jest oznaczana tak jak to było w przypadku tensorów w przestrzeni tj. średnikiem.
Rozpatrzmy współrzędne geodezyjne w danym punkcie O powierzchni. W takich współrzędnych symbole Christoffela w punkcie O znikają, tak więc z (47) i (48) od razu wynika, że w punkcie O pochodna absolutna i kowariantna tensora jest tożsama z pochodną zwykłą. (co prowadzi w konsekwencji do możliwości stosowania reguł takich jakim podlegają wyrażenia dla różniczkowania cząstkowego)
Paragraf 9 Tensor Riemana - Christoffela. Krzywizna Gaussa powierzchni.
Niech Xα - będzie polem wektorów kowariantnych, określonym na całej powierzchni , jego pochodna kowariantna jest dana :
Xα; β = (∂Xα / ∂uβ ) − Γσαβ Xσ
Ponieważ Xα, β - jest tensorem możemy znowu zróżniczkować go kowariantnie.
W ten sposób otrzymamy nowy tensor nazywany „drugą pochodną kowariantną Xα”.
Oznaczmy ja przez : Xα; βγ
W dalszym ciągu przekonamy się, że jest ona niesymetryczna względem β i γ.
Tak jak już to pokazaliśmy wcześniej możemy napisać :
Xα; βγ − Xα; γβ = Rδαβγ Xδ (49)
gdzie:
Rδαβγ = (∂/∂uβ) Γδαγ − (∂/∂uγ) Γδαβ + Γσαγ Γδβσ − Γσαβ Γδγσ (50)
Równanie (49) pokazuje, że Rδαβγ jest tensorem a z (50) widać, że tensor ten zależy tylko od tensora metrycznego i jego pochodnych. Tensor ten nazywa się „tensorem Riemana - Christoffela” na powierzchni. Jeśli dokonamy opuszczenia indeksu δ to otrzymamy tensor stowarzyszony :
Rδαβγ = aδσRσαβγ
Odznacza się on następującymi własnościami symetrii ;
Rδαβγ = − Rδαγβ
Rδαβγ = − Rαδβγ
tj. Rδαβγ jest antysymetryczny względem δ, α i β, γ
Rozpatrzmy skalar :
K= ½ εδαεβγ Rδαβγ (51)
Skalar ten jest inwariantem względem przekształceń współrzędnych krzywoliniowych na powierzchni. Jeśli pomnożymy to równanie przez ελμεστ to otrzymamy :
Kελμεστ = ¼ δδαλμδβγστ Rδαβγ
Wskutek antysymetrii tensora Rδαβγ otrzymamy :
δδαλμδβγστ Rδαβγ = 4Rλμστ
i odpowiednio :
Rλμστ = Kελμεστ (52)
To pokazuje, że tensor Riemana - Christoffela można wyrazić przez skalar K i ε-obiekty.
Skalar K nazywamy „krzywizną Gaussa powierzchni”. Określa on wewnętrzne własności powierzchni i zależny jest tylko od tensora metrycznego i jego pochodnych.
Zadania
1. Pokazać wykorzystując (52), że K= R1212 /a
Wzór ten pozwala wyznaczyć K w pewnych szczególnych przypadkach.
Paragraf 10 Krzywizna geodezyjna krzywej na powierzchni
Niech C - będzie krzywą na powierzchni i niech w charakterze parametru będzie wybrana długość drogi s tej krzywej, mierzona od dowolnego ustalonego punktu na tej krzywej
Wtedy krzywą można określić równaniem :
uα = uα (s) (53)
mamy również zależność :
aαβ (duα /ds) (duα /ds) =1 (54)
która spełniona jest w każdym punkcie krzywej. Jeśli P - jest punktem na krzywej o współrzędnych uα, a Q - jest punktem sąsiednim na tej krzywej odpowiadającym wzrostowi parametru o ds , to nieskończenie mały wektor PQ→ ma składowe uα + duα .
W takim razie wektor styczny do C jest szczególnym przypadkiem wektora PQ→ mianowicie jest to ten wektor przy
Q dążącym do P określony jest on wyrażeniem duα /ds.
Oprócz tego jest to wektor jednostkowy co od razu widać z (54). Zgodnie z tym wektor jednostkowy styczny do krzywej λα można określić w sposób następujący:
λα = duα /ds (55)
Ponieważ λα - jest wektorem jednostkowym w każdym punkcie krzywej C to :
aαβλα λβ = 1
Jeżeli weźmiemy pochodną absolutną względem s ,obu stron tego równania otrzymamy:
aαβλα (δλβ/ δs) = 0
Skąd widać, że wektor δλβ/ δs jest ortogonalny do λα.
Odpowiednio, jeśli oznaczymy przez μσ wektor jednostkowy ortogonalny do λα to :
δλβ/ δs = σ μσ (56)
gdzie σ - to pewien skalar.
Wybierzmy kierunek μα w taki sposób aby zwrot (λα, μα ) był dodatnio określony, wtedy wektor μα
spełnia warunek :
eαβλα μβ = + 1 (57)
Kiedy w taki sposób ustalimy skierowanie μα równanie (56) określa σ w sposób jednoznaczny nie tylko co do wielkości ale i co do znaku.
Wektor μα nazywamy wektorem jednostkowym normalnym do krzywej C, a skalar σ nazywamy „krzywizną geodezyjną” krzywej na powierzchni.
W zależności od wyboru μα mamy :
μα = εαβλβ ; λα = εαβμβ (58)
Znajdziemy pochodną absolutną po s od obu stron pierwszej równości;
δμα/ δs = εαβ(δλβ / δs) = εαβσ μβ = − σ εαβμβ = − σ λα
W takim razie mamy następujące wzory :
δλα/ δs = σμα (59)
δμα/ δs = − σλα (59)
Wzory te oczywiście charakteryzują się pewnym podobieństwem do wzorów Freneta.
Paragraf 11 Różniczkowe parametry Beltramiego
Jeśli ϕ i ψ - są dwoma funkcjami skalarnymi współrzędnych na powierzchni i jeśli oznaczymy przez ϕ, a i ψ, a - ich pochodne cząstkowe względem μα tj. :
ϕ, a = (∂ϕ /∂uα ) ; ψ, a = (∂ψ /∂uα ) (60)
to te pochodne będą wektorami kowariantnymi.
Odpowiednio wielkość :
∇(ϕ, ψ) = aαβ ϕ, α ψ, β (61)
będzie skalarem i nazywa się „różniczkowym parametrem Beltramiego” tych dwóch funkcji.
Jeśli podstawić ϕ = ψ to z (61) otrzymamy skalar :
∇ϕ = ∇(ϕ, ϕ) = aαβ ϕ, α ϕ, β (62)
który nazywamy „pierwszym różniczkowym parametrem Beltramiego funkcji ϕ”.
Symbol ∇ϕ czytamy jako „nabla ϕ”
Jeśli Xα - jest wektorem kontrawariantnym na powierzchni to możemy wziąć jego pochodną a następnie zawęzić względem dwóch indeksów, wtedy otrzymamy Xα, α .
Jest to oczywiście skalar, wypiszmy go w jawnej postaci :
Xα; α = (∂Xα /∂uα ) + Γαβα Xβ (63)
Ten skalar analogicznie do (23) (paragraf 5, rozdział XII) można nazwać „dywergencją wektora Xα na powierzchni”. Wykorzystując w wyrażenie :
Γββγ = ∂ log(√a ) /∂uγ
otrzymujemy:
Γαβα = (1/√a ) (∂√a /∂uβ )
Tak więc dywergencję wektora Xα można zapisać w postaci :
Xα; α = (1/√a ) ∂/∂uα (√a Xα ) (64)
Wzór ten jest szczególnie dogodny dla wielorakich obliczeń.
W przypadku szczególnym, kiedy pod Xα rozumiemy wektor aαβ ϕ, β a ϕ - jest inwariantną funkcją współrzędnych na powierzchni, to jego dywergencja ma postaci:
Xα; α = aαβ ϕ, βα = aαβ ϕ, αβ
Skalar ten nazywa się „drugim różniczkowym parametrem Beltramiego funkcji ϕ”, i jest on oznaczany : ∆ϕ
Mamy zatem :
∆ϕ = aαβ ϕ, αβ (65)
Wykorzystując (64) można to zapisać w następującej formie:
∆ϕ = (1√a ) ∂/∂uα (√a aαβ ∂ϕ /∂uβ ) (66)
Zadania
1. Udowodnić, że :
∇(u1) = a22 /a , ∇(u) = a11 /a , ∇(u1,u2) = − a12 /a
2. Wzór Beltramiego dla krzywizny geodezyjnej krzywej.
Udowodnić, że jeśli krzywa zdefiniowana jest równością ϕ = 0, to jej krzywizna geodezyjna jest równa :
σ = − [ ∆ϕ /√ (∇ϕ )] − ∇[ϕ, 1/√(∇ϕ)]
Paragraf 12 Twierdzenie Greena na powierzchni
Rozpatrzmy zamknięty kontur C na powierzchni. Określmy w pierwszej kolejności dodatnie zorientowanie konturu. Jeśli weźmiemy kontur określony krzywymi u1= 0, u2 = 0, u1 = 1, u2 = 1, to powiemy o orientacji dodatniej kiedy obchodzimy ten kontur zgodnie z wymienioną kolejnością krzywych, mówimy o orientacji ujemnej dla obejścia w kolejności odwrotnej. Zgodnie z tym możemy określić orientacje dowolnego konturu.
Oznaczmy obszar lezący wewnątrz konturu jako S. Z twierdzenia Greena wiadomo, że jeśli P i Q - są funkcjami współrzędnych to :
∫ ∫ ∂P /∂u1du1du2 = ∫ P du2/ ds (67)
S C
∫ ∫ ∂Q / ∂u2du1du2 = − ∫ Q du1/ ds (67)
S C
Kierunek okrążania konturu C przy całkowaniu przyjmujemy jako dodatni.
Niech teraz Xα - będzie polem wektorowym określonym na całej powierzchni S i niech ds - będzie elementem powierzchni tj. :
ds = √a du1du2
wtedy :
∫ ∫ Xα,α ds = ∫ ∫ Xα, α √a du1du2
S S
Z (64) otrzymujemy :
Xα,α = ( 1/√a) ∂/∂uα (√a Xα)
Odpowiednio :
∫ ∫ Xα,α ds = ∫ ∫ ∂ /∂uα (√a Xα) du1du2 =
S S
= ∫ ∫ {∂ /∂u1 (√a X1) + ∂ /∂u2(√aX2] du1du2 =
S
= ∫ √a [ X1(du2 /ds) − X2(du1/ds)]ds = εαβ Xα(duβ/ds) ds
C
Jeśli oznaczymy przez μα wektor jednostkowy normalnej krzywej C skierowany do wnętrza krzywej, to jego składowe kowariantne będą określone zależnością :
μα = − εαβ (duβ /ds)
W takim razie wzór Greena
∫ ∫ Xα, α ds = − ∫ Xα μα ds (68)
S C
Podstawmy w tej równości Xα = aαβ ϕ, β ψ gdzie ϕ, ψ - są skalarnymi funkcjami współrzędnych na powierzchni. Wtedy :
Xα,α = aαβ ϕ, β ψ, α + aαβ ϕ, βα ψ = ∇(ϕ, ψ) + ψ∆ϕ
i (68) przejdzie w :
∫ ∫ ∇(ϕ, ψ) dS = − ∫ ψ (ϕ, α μα )ds − ∫ ∫ ψ∆ϕ dS (69)
S C S
Zadania
1. Udowodnić, że :
∫ ∫ (ϕ∆ψ − ψ∆ϕ )dS + ∫ (ϕψ, α − ψϕ, α )μα ds = 0
S C
2. Przeniesienie równoległe wektora po zamkniętym konturze.
Pokazać, że jeśli z zadanego punktu na krzywej C rozpoczniemy przenosić równolegle zadany wektor wzdłuż konturu zamkniętego C to po powrocie do punktu początkowego będzie on tworzył kąt α z wektorem wejściowym gdzie :
α = ∫ ∫ K dS
gdzie całkowanie prowadzimy na całej powierzchni S
3. Twierdzenie Gaussa.
Pokazać w sposób geometryczny, że jeśli wektor zostanie przeniesiony równolegle względem trójkąta określonego przez trzy linię geodezyjne A,B,C to kąt α z poprzedniego punktu jest równy :
A' + B' + C' - π ; gdzie : A' , B' , C' - to kąty trójkąta
Odpowiednio :
E = A' + B' + C'- π = ∫ ∫ K dS
S
E -nazywamy odchyleniem (dewiacją ) trójkąta
4. Twierdzenie Boneta
Udowodnić, że jeśli σ - jest krzywizną geodezyjną krzywej (konturu) C to :
∫ σ dS = ∫ ∫ K ds = 2 π
C S
************************************************************************************************
Część IV - Zastosowania analizy tensorowej w mechanice i fizyce
Rozdział XVII - Dynamika punktu
Paragraf 1 Równania ruchu
Załóżmy, że mamy dany punkt materialny P porusza się w przestrzeni, i niech jego położenie określone jest w układzie współrzędnych krzywoliniowych, współrzedne którego oznaczymy
xr. W miarę zmiany czasu t, punkt P będzie opisywał w przestrzeni pewna krzywą, nazywaną „trajektorią punktu” (torem punktu). Równania tej krzywej w ogólności są zdefiniowane przez współrzędne w funkcji czasu tj. :
xr = xr (t) (1)
Jeśli przejdziemy do innego układu współrzędnych krzywoliniowych x'r za pomocą równań transformujących postaci :
x'r = fr(x1,x2 ,x3 ) (2)
to współrzędne punktu P w nowym układzie, będą określone również jako funkcje od t,.
Rozpatrzmy obiekt :
vr = dxr /dt (3)
W nowych współrzędnych x'r odpowiednio mamy :
v'r = dx'r/dt = ∂x'r/∂xs = dxs/dt = (∂x'r/∂xs) vs
Równania te wyrażają ten fakt, że wielkości (3) są składowymi wektora kontrawariantnego.
Jeśli współrzędne były by kartezjańskimi, prostokątnymi to (3) przekształciłyby się w składowe prędkości punktu P względem osi współrzędnych. (czyli rzuty prędkości na osie układu współrzędnych - przypis własny ) Dlatego (3) nazywamy wektorem prędkości uogólnionej punktu materialnego (nie mylić z prędkościami uogólnionymi z mechaniki analitycznej chociaż między tymi wielkościami występują dosyć ścisłe związki - przypis własny). Wektor vr jest funkcją czasu, i możemy wziąć jego pochodną absolutną po t.
Tę operację określa wektor :
fr = δvr /δt = d2xr /dt2 + Γrmn (dxm /dt )(dxn /dt ) (4)
gdzie Γrmn - jest symbolem Christoffela.
Kiedy układ współrzędnych jest ortokartezjański symbole Christoffela są wszystkie równe zeru i wektor fr przyjmuje postać :
fr = d2xr /dt2
Są to składowe przyspieszenia względem trzech osi współrzędnych. Dlatego (4) nazywamy wektorem uogólnionego przyspieszenia punktu.
Masa punktu materialnego jest oczywiście wielkością nie zależną od wykorzystywanego układu współrzędnych i jest skalarem. Będziemy ją oznaczać przez M.
Jeśli swobodny punkt materialny podlega działaniu sił to zgodnie z drugim prawem Newtona
wiemy, że siła i przyspieszenie mają jednakowe skierowanie i wielkość siły (w odpowiednich jednostkach) równa jest iloczynowi masy i przyspieszenia. Odpowiednio jeśli rozpatrzymy równanie wektorowe :
Qr = Mfr (5)
gdzie Qr - jest wektorem kontrawariantnym, to zauważymy, że wielkości Qr definiują całkowicie siły, zarówno co do wartości jak i skierowania. Dlatego wektor Qr nazywamy wektorem siły uogólnionej, a równania (5) są równaniami ruchu we współrzędnych krzywoliniowych. We współrzędnych kartezjańskich równanie (5) przyjmuje znaną postać :
Qr = M (d2xr / dt2 )
gdzie : Q1 ,Q2 ,Q3 - są składowymi siły względem trzech osi współrzędnych.
Paragraf 2 Praca i energia. Równania Lagrange'a drugiego rzędu
W poprzednim paragrafie wprowadziliśmy pojęcie siły uogólnionej pod postacią wektora kontrawariantnego, jednak może on być wprowadzony również, jako wektor kowariantny za pomocą pojęcia pracy.Wiadomo, że jeśli układ współrzędnych x'r jest układem ortokartezjańskim to siła której składowe są równe Q'r ( punkt przyłożenia przemieszcza się pod działaniem tej siły o δx'r ) wykonuje pracę równą :
δW = Q'1δx'1 + Q'2δx'2 + Q'3δx'3
Ponieważ w ortokartezjańskich współrzędnych wektor stowarzyszony Q'r ma dokładnie takie same składowe jak Q'r, to wyrażenie dla δW przyjmuje postać :
δW = Q'rδx'r
Z zależności wiążących x'r i xr otrzymujemy, że δW można napisać również w formie funkcji liniowych względem δxr. W takim razie :
δW = Qrδxr (6)
Z drugiej strony δW jest skalarem więc z (6) wynika, że współczynniki tej formy liniowej Qr
obrazują wektor kowariantny. Dalej- z tego, że jego składowe w układzie ortokartezjańskim są składowymi wektora siły wynika, że Qr jest wektorem kowariantnym siły uogólnionej we współrzędnych krzywoliniowych xr . Składowe ko- i kontrawariantne są zatem związane wzorami postaci :
Qr = grsQs ; Qr = grsQs ;
Jeśli Qr dxr - jest różniczką zupełną to siła uogólniona nazywa się „potencjałem” i możemy napisać w takim
przypadku :
W = ∫ Qrdxr (7)
Funkcję W, która określona jest zależnością (7) określoną z dokładnością do stałej, nazywa się „funkcją siły”.
Zwykle wykorzystujemy funkcje V nazywana „funkcją potencjalną” funkcja ta określona jest zależnością (7).
Z (7) wynika, że :
Qr = − ∂V/∂xr (8)
Rozpatrzmy teraz energię kinetyczną punktu materialnego. Jest ona równa ½ Mv2 gdzie v- jest modułem prędkości.
v2 = gmnvmvn , gdzie gmn - jest tensorem metrycznym układu, w przyjętych współrzędnych krzywoliniowych.
Odpowiednio energia kinetyczna T jest równa :
T = ½ M gmnvmvn = ½ Mgmn(dxm /dt)(dxn /dt) (9)
Pochodna cząstkowa T po dxr/dt będzie równa :
∂T/∂(dxr /dt) = Mgrm(dxm /dt)
Odpowiednio zatem :
d/dt [∂T /∂ (dxr /dt)] =M [ grm(d2xm /dt2 ) + (∂grm /∂xn ) (dxm / dt)(dxn /dt)
Z drugiej strony biorąc pochodną cząstkową T po xr otrzymujemy :
∂T /∂xr = ½ M(∂gmn /∂xr ) (dxm / dt)(dxn /dt)
Z tych równań widzimy, że :
d/dt [∂T /∂ (dxr /dt)] − ∂T /∂xr = M {grm(d2xm /dt2 ) + ½ [(∂grm /∂xn ) + (∂grn /∂xm ) −
− (∂gmn /∂xr )] + (dxm /dt)(dxr /dt)} = M[ grm(d2xm /dt2 ) + Γr, mn (dxm /dt)(dxn /dt)]
gdzie Γr, mn - jest symbolem Christoffela pierwszego rodzaju.
Dlatego mamy :
d/dt [∂T /∂(dxr /dt)] − ∂T /∂xr = M grs[ (d2xs /dt2 ) + Γsmn (dxm /dt)(dxn /dt)]
Patrząc na (4) widzimy, że prawa część równa jest M grs fs.
Oznaczając kowariantne składowe wektora przyspieszenia uogólnionego przez fr otrzymujemy :
M fr = d/dt [∂T /∂(dxr /dt)] − ∂T /∂xr (10)
Wzór ten jest dogodny w zapisie, kiedy chcemy znaleźć wektor uogólnionego przyspieszenia w dowolnym układzie współrzędnych.
Równania ruchu (5) teraz możemy zapisać w formie kowariantnej :
d/dt [∂T /∂(dxr /dt)] − ∂T /∂xr = Qr (11)
Równania te znane są jako równania Lagrange'a drugiego rodzaju.
Jeśli siły są potencjalne to równanie to przyjmuje postać :
d/dt [∂T /∂ (dxr /dt)] − ∂T /∂xr = − ∂V /∂ xr
lub równoważnie:
d/dt [∂L /∂(dxr /dt)] − ∂L /∂xr = 0 (12)
gdzie : L = T − V (13)
Funkcja L nazywa się „funkcją Lagrange'a” (lagranżjanem)
Zadania
1. Znaleźć składowe kowariantne wektora przyspieszenia uogólnionego we współrzędnych sferycznych.
W tych współrzędnych element liniowy dany jest następująco:
ds2 = (dx1)2 + (dx2)2 + (x1)2 sin(x1) (dx3)2
Odpowiednio energia kinetyczna będzie dana :
T= ½ M (dxs /dt)2 = ½ M{(dx1/dt )2 + [x1(dx2/dt )]2 + x1(sin(x2(dx3/dt ))]2 }
Dlatego
M f1 = d/dt [∂T /∂ (dx1/ dt)] − ∂T /∂x1 = M[(d2x1/dt2 ) − x1(dx2/dt )]2 − x1(sin(x2(dx3/dt ))2]
M f2 = d/dt [∂T /∂ (dx2/ dt)] − ∂T /∂x2 = M{d/dt [(x1)2 (dx2/dt)2] − (x1)2 sin(x2) cos(dx2/dt) (dx3/dt )2 }
M f3 = d/dt [∂T /∂ (dx3/ dt)] − ∂T /∂x3 = M{d/dt [x1sin((x2)2 )(dx3/dt )]}
2. Pokazać, że warunkiem potencjalności siły jest :
Qr, s - Qs, r = 0
3. Całka energii. Wyprowadzić z równań ruchu zależność :
T + V = h
gdzie h - jest stałą. Zależność ta nazywa się całką energii
Mamy odpowiednio :
dT/dt = d/dt [ 1/2Mgmnvmvn ] = M gmnvmfn = Mfmvm = − ∂V /∂xm (dxm / dt) = − dV/dt
całkując otrzymamy : T = h − V
Paragraf 3 Ruch punktu po krzywej
Niech krzywa będzie zadana równaniami postaci:
xr = xr(s) (14)
gdzie s - to długość krzywej. Zakładamy, że punkt materialny porusza się po tej krzywej i jest to ruch bez tarcia.
Naszym zadaniem będzie znalezienie równania ruchu tego punktu.
Niech λr, μr, νr - będą wektorami jednostkowymi w kolejności : stycznej, normalnej i binormalnej, a χ ,τ - będą odpowiednio krzywizną i skręceniem krzywej.
Wielkości te związane są między sobą wzorami Freneta postaci :
λr= dxr/ ds , δλr/ δs = χμr, δμr/ δs = τ νr - χμr, δνr/ δs = − τ νr (15)
Z drugiej strony jeśli oznaczyć moduł prędkości uogólnionej przez v to otrzymamy :
vr= dxr/ dt = (dxr/ds ) (ds /dt ) = vλr
ponieważ v = ds /dt . Biorąc pochodną absolutną od obu części tego równania względem parametru t otrzymujemy :
fr= δvr/ δt = (dv/dt) λr + v (δλr/ δt) = (dv/dt) λr + v (δλr/ δs) (ds /dt )
skąd wykorzystując (15) otrzymujemy :
fr= (dv/dt)λr + v2χμr (16)
W takim razie wektor przyspieszenia jest komplanarny (współpłaszczyznowy) z wektorem stycznym i wektorem głównej normalnej , a jego składowe w tych kierunkach są dane :
dv/ dt i v2χ
Niech Qr będzie zewnętrzną siłą uogólnioną, działającą na punkt materialny , Rr - to siły reakcji. Wtedy (Qr + Rr ) będzie wypadkową sił działających na punkt materialny a równania ruchu będą postaci :
Mfr= Qr + Rr lub Qr + Rr = M(dv/dt)λr + Mv2χμr
Jednak :
dv/dt = (dv/ds)(ds/dt) = v(dv/ds) = ½ d/ds(v2)
ponieważ energia kinetyczna jest równa : T = ½ Mv2 to mamy :
Qr + Rr = (dT/ds)λr + 2Tχμr (17)
Ponieważ nie uwzględniamy siły tarcia, to wektor Rr jest ortogonalny do krzywej i odpowiednio Rr λr = 0.
Mnożąc (17) kolejno przez λr , μr , νr dochodzimy do następujących równań :
Rr λr = dT/ds (18)
Qr μr + Rr μr = 2T χ (18)
Qr νr = − Rr νr (18)
Z pierwszego równania (18) otrzymamy :
T = ∫ Qr λr ds = ∫ Qr (dxr/ds)ds = − ∫ (dV/ds) ds (dla sił potencjalnych)
Lub T + V = h gdzie h - jest stałą (19)
Jest to tzw. „całką energii” , stała h - jest całkowitą energią mechaniczną. Równość (19) wyraża prawo zachowania energii. Jeśli krzywa jest naturalnym torem punktu materialnego to Rr = 0
Wtedy z (17) widzimy, że wektor siły powinien być komplanarny ze styczną i główną normalną.
Dlatego razem z całką energii powinna być spełniona zależność :
Qr = (dT/ds)λr + 2Tχμr (20)
Zadania
1. Pokazać, że jeśli siła ma kierunek stycznej do toru punktu materialnego to tor powinien być linią prostą
Paragraf 4 Ruch punktu po powierzchni
Rozpatrzymy teraz ruch punktu materialnego zachodzący na powierzchni zakładając brak tarcia.
Niech u1 ,u2 - będą współrzędnymi krzywoliniowymi na powierzchni i niech równanie tej powierzchni będzie zadane wzorem ;
xr = xr(u1 ,u2 ) (21)
Mamy następnie:
vr = dxr/ dt = (∂xr/ ∂uα ) (duα / dt ) = xrα (duα / dt )
Wprowadźmy oznaczenie:
vα = (duα / dt )
wtedy otrzymamy:
vr = xrα vα (22)
vα - będziemy nazywać wektorem prędkości uogólnionej na powierzchni, a vr - wektorem prędkości uogólnionej w przestrzeni. Obliczmy pochodną absolutną po t od wyrażenia (22) :
fr= δvr/ δt = xrα (δvα/δt) + xrα, β vα vβ
Jeśli wstawimy fα = δvα/δt i wykorzystamy wzory Gaussa to otrzymamy :
fr= xrα fα + bαβ vα vβξr (23)
gdzie bαβ - to współczynniki drugiej podstawowej formy kwadratowej na powierzchni, ξr - to wektor jednostkowy normalny do powierzchni. fα - będziemy nazywać wektorem przyspieszenia uogólnionego na powierzchni.
Niech Qr - będzie wektorem uogólnionej siły zewnętrznej działającej na punkt materialny i niech Rr - będzie reakcją powierzchni skierowana zgodnie z normalna do powierzchni.
Wtedy równania ruchu będą następujące :
Qr + Rr = Mfr = Mxrα fα + Mbαβ vα vβξr = Mxrα fα + Mv2 bαβ λα λβξr
gdzie : λα - jest wektorem jednostkowym stycznym do toru .
Mnożąc to równanie przez ξr otrzymujemy :
Qrξr + Rrξr = 2T bαβ λα λβ (24)
Mnożąc te równania przez grs xsβ i uwzględniając, że Rr jest wektorem normalnym do powierzchni otrzymamy:
grsQr xsβ = Mgrsxrα xsβ fα = M aαβ fα = Mfβ
Jeśli oznaczymy wektor na powierzchni Qr xrα przez Qα to równość ta przyjmie postać :
Qβ = Mfβ (25)
Rozpatrzmy na początku wektor Qα . Jeśli punkt materialny doznaje małego przemieszczenia
δuα na powierzchni to elementarna praca sił będzie równa:
δW = Qrδxr = Qrxrαδuα = Qαδuα
Jeśli siły są potencjalne to :
Qα = - ∂V / ∂uα (26)
gdzie V- to funkcja potencjału.
Energia kinetyczna może być wyrażona w postaci ;
T = ½ M aαβ vα vβ = ½ Maαβ (duα /dt )(duβ /dt)
I nie trudno udowodnić, że :
d/dt [∂T/∂(duα /dt )] − ∂T/∂uα = Maαβ[(d2 uβ /dt2 ) + Γβμν (duμ /dt)(duν /dt)] = Maαβfβ
Odpowiednio :
M fβ = d/dt (∂T/∂(duα /dt )) − ∂T/∂uα (27)
Co oznacza, że równania ruchu mogą być zapisane w formie :
d/dt [∂T/∂(duα /dt )] − ∂T/∂uα = Qα = − ∂V/ ∂uα (28)
lub w formie równoważnej:
d/dt [∂L /∂(duα /dt )] − ∂L /∂uα = 0 (29)
gdzie L - jest funkcją Lagrange'a
Paragraf 5 Zasada najmniejszego działania. Tor jako linia geodezyjna
Widzieliśmy, że punkt materialny o masie M, na który działa układ sił o potencjale V posiada następujące równania ruchu:
d/dt [∂T/∂(dxr /dt )] − ∂T/∂xr = − ∂V /∂xr (30)
gdzie T -jest energią kinetyczną.
Oprócz tego istnieje całka energii :
T + V = h (31)
gdzie h - to stała, nazywana „energią całkowitą”
Rozpatrzmy wszystkie krzywe przechodzące przez dwa stałe punkty A i B. Całka :
B
A = sqrt(2M) ∫ [(h- V) gmn (dxm /dλ )(dxn /dλ) ] ½ dλ (32)
A
gdzie λ - jest parametrem zmiennym wzdłuż, h - jest stałą wziętą wzdłuż dowolnej z tych krzywych krzywej ma określoną wartość którą nazywamy „działaniem” wzdłuż krzywej AB.
Chcemy udowodnić następujące założenie nazywane „zasadą stacjonarnego działania” mianowicie:
ze wszystkich krzywych przechodzących przez A i B ta krzywa dla której działanie jest stacjonarne jest trajektorią punktu materialnego, poruszającego się pod działaniem układu sił o potencjale V i posiadającym stałą energię
całkowitą h.
Z rachunku wariacyjnego wiadomo, że równania krzywej przechodzące przez punkty A i B dla której całka :
B
∫ ϕ(x, x' )dλ , xr' = dxr /dλ (33)
A
posiada stacjonarną wartość będzie dane następująco :
d/dλ (∂ϕ /dxr')− ∂ϕ/∂xr = 0 (34)
Możemy tego dowieść w ten sam sposób jaki był używany dla uzyskania równań linii geodezyjnej na powierzchni.Odpowiednio otrzymamy układ równań :
d/dt {[(h − V) grs x's ] / ϕ } - [(h - V) /2ϕ] (∂gmn /∂xr ) x'm x'n + ½ {(∂V/∂xr ) [(gmn x'mx'n /ϕ ] } = 0
DO równania tego wprowadzimy w miejsce λ, nową niezależną zmienna t, zdefiniowaną za pomocą równości:
dt / dλ = sqrt(M) ϕ / sqrt(2) ( h − V) (35)
Otrzymamy wtedy :
M d/dt [ grs / (dxs /dt )] - ½ M [(∂gmn / ∂xr )(dxm /dλ )(dxn /dλ)] + (∂V / ∂xr ) = 0
Równania te w szczególności są zgodne z równaniami (30) w których t - jest czasem. Odpowiednio krzywa wzdłuż której działanie jest stacjonarne jest istotnie torem punktu poruszającego się pod działaniem siły o potencjale V. Z drugiej strony podnosząc równość (35) do kwadratu otrzymujemy :
M gmn (dxm /dt )(dxn /dt) = 2(h - V)
A to pokazuje, że h jest energią całkowitą i jest stała wzdłuż toru.
Pokażemy teraz w sposób geometryczny ruch w którym tor będzie linią geodezyjną.
Weźmy specjalnego typu przestrzeń trójwymiarową , punkty której będą postawione w relacji wzajemnie jednoznacznej z punktami zwykłej przestrzeni tak aby można było wybrać xr w charakterze współrzędnych tej nowej przestrzeni. Oprócz tego przyjmiemy element liniowy tej nowej przestrzeni w postaci :
dS2 = 2M(h -V) ds2 = 2M(h -V)gmndxm dxn (36)
gdzie : ds - jest elementem liniowym zwykłej przestrzeni.
W takim razie każdej krzywej zwykłej przestrzeni odpowiada pewna krzywa w nowej przestrzeni i działanie wzdłuż krzywej będzie :
B B
A = ∫ (ds /dλ ) dλ = | S
A A
Odpowiednio działanie równe jest długości krzywej w nowej przestrzeni. Oprócz tego tor jest
krzywą ekstremalną, zdefiniowaną równaniem :
δA = δS = 0
Naturalnie rozwiązaniem tego równania jest oczywiście krzywa o najmniejszej długości lub krzywa geodezyjna w nowej przestrzeni.
Zadania do rozdziału XVII
1. Wektor pędu.
Podstawmy pr = (∂T/∂(dxr /dt )). Pokazać, że pr - jest wektorem oraz pokazać, że
T = 1/ 2M (gmn pm pn )
2. Równania ruchu w postaci Hamiltona.
Podstawmy H= T + V i wyraźmy H przez xr i pr .
Pokazać, że równania ruchu mogą być zapisane w formie :
dxr/dt = ∂H/∂pr ; dpr/dt = − ∂H/∂dxr
************************************************************************************************
Rozdział XIX - Elektryczność i magnetyzm
Paragraf 1 Twierdzenie Greena
Zanim przejdziemy do rozpatrzenia matematycznego teorii elektryczności i magnetyzmu rozpatrzymy dwa ważne twierdzenia dotyczące przekształcenia całek objętościowych w całki powierzchniowe oraz całek powierzchniowych w krzywoliniowe.
Niech w przestrzeni będzie dany układ współrzędnych prostokątny kartezjański (x, y, z).
W tych współrzędnych twierdzenie Greena jak wiadomo sformułowane jest następująco :
Jeśli S - jest powierzchnią zamkniętą ograniczająca objętość V a P,Q, R - są trzema funkcjami jednorodnymi, ciągłymi i mającymi pochodne cząstkowe pierwszego rzędu na objętości to :
∫ ∫ ∫ (∂P/∂x + ∂Q/∂y + ∂R/∂z )dτ = ∫ ∫ (lP + mQ + nR)dσ (1)
V S
gdzie l, m, n - to kosinusy kierunkowe normalnej zewnętrznej do S, dτ element objętości , dσ -element powierzchni
na S.
Wynik ten łatwo jest udowodnić całkując wzdłuż prostych równoległych do osi współrzędnych. Weźmy ogólny krzywoliniowy układ współrzędnych xr i sformułujemy twierdzenie Greena w tych współrzędnych. Wiemy, że wektor można określić jeśli wziąć w charakterze jego składowych w dowolnym układzie współrzędnych trzy dowolne liczby i w charakterze jego składowych we wszystkich innych układach liczby spełniające prawo przekształcenia wektorów.
Określimy wektor Fr tak aby w układzie współrzędnych (x, y, z) jego składowe były P, Q, R.
Określamy w ten sposób pole wektorowe, ponieważ wektor jest funkcja współrzędnych.
Jeśli dalej przez Fr; s oznaczymy pochodną kowariantna od Fr tj. jeśli :
Fr; s = ∂Fr/∂xs + ΓrpsFp
to Fr; r - jest skalarem.
Odpowiednio jego wyrażenie w układzie (x, y, z) jest dane :
Fr,r = ∂P/∂x + ∂Q/∂y + ∂R/∂z (2)
Wynika to z tego, że w kartezjańskim układzie współrzędnych symbole Christoffela są równe zeru.
Skalar Fr;r nazywany jest dywergencją wektora Fr.
Oznaczmy wektor jednostkowy zewnętrznej normalnej do S jako vr. Składowe tego wektora we współrzędnych kartezjańskich są : l, m, n. Rozpatrzmy skalar Frvr zdefiniowany następująco :
gpq Fpvq = Pl + Qm+ Rn (3)
Twierdzenie Greena w zapisie tensorowym będzie następujące :
∫ ∫ ∫ Fr; r dτ = ∫ ∫ Frvr dσ (4)
V S
Całkę po prawej często nazywa się „strumieniem wektora Fr przez powierzchnię S” .
W takim razie strumień wektora Fr przez powierzchnię S jest równy całce objętościowej od dywergencji wektora Fr.
Twierdzenie może być rozciągnięta na obszar lezący między kilkoma powierzchniami jeśli tylko Fr spełnia pewne warunki w nieskończoności. Możemy przedstawić twierdzenie Greena w innej formie. Niech ϕ i ψ będą funkcjami skalarnymi. Wprowadzimy dla wygody oznaczenia:
ϕr = ∂ϕ / ∂xr , ψr = ∂ψ / ∂xr
Jeśli podstawimy :
Fr = grsFs = ϕψr (5)
to :
Frr = grsFr; s = grs(ϕψr; s + ϕsψr )
gdzie ψr; s jest pochodna kowariantną po ψr. Skalar grsψr; s często oznaczany przez Δψ i nazywamy go laplasjanem funkcji ψ.
We współrzędnych kartezjańskich ma on postać :
Δψ = grsψr, s = ∂2ψ / ∂x2 + ∂2ψ / ∂y2 + ∂2ψ / ∂z2 (6)
Obiekt grsϕr ψs jest obiektem skalarnym i oznaczamy go przez : ∇ (ϕ, ψ ).
We współrzędnych kartezjańskich ma on postać :
∇ (ϕ, ψ ) = grsϕr ψs = (∂ϕ/∂x) (∂ψ/∂x) + (∂ϕ/∂y) (∂ψ/∂y) + (∂ϕ/∂z) (∂ψ/∂z) (7)
Mamy zatem :
Fr; r = ϕ Δψ + ∇ (ϕ, ψ) (8)
Tak więc twierdzenie Greena ma postać:
∫ ∫ ∫ ∇ (ϕ, ψ)dτ = ∫ ∫ ϕvrψr dσ − ∫ ∫ ∫ ϕ Δψ dτ (9)
V S V
Paragraf 2 Twierdzenie Stokesa
Drugie ważne twierdzenie znane jest jako twierdzenie Stokesa, dotyczy ono przekształcenia całki krzywoliniowej w całkę powierzchniową. We współrzędnych kartezjańskich twierdzenie to wypowiadamy następująco:
Jeśli S - jest pewną powierzchnią ograniczoną konturem C i jeśli P, Q, R - to trzy funkcje ciągłe i mające pochodne cząstkowe pierwszego rzędu na S to :
∫ [P(dx/ds) + Q(dy/ds) + R(dz/ds)]ds = ∫∫{l [(∂R / ∂y) - (∂Q / ∂z) ] + m [(∂P / ∂z) - (∂R / ∂x) ]
C S
+ n [(∂Q / ∂x) - (∂P / ∂y) ] }dσ (10)
gdziecałka krzywoliniowa jest brana po całym konturze C a l, m, n - to kosinusy kierunkowe normalnej do S.
Później sformułujemy to twierdzenie we współrzędnych krzywoliniowych.
Weźmiemy znów wektor Fr składowe którego w układzie (x,y,z) są równe P, Q, R Składowe wektora stowarzyszonego w tym układzie są równe P,Q, R - ponieważ we współrzędnych kartezjańskich nie ma różnicy między składowymi ko- i kontrawariantnymi. Pochodna kowariantna Fr; s wektora Fr jest tensorem drugiego rzędu i odpowiednio obiekt :
Fr = − εrst Fr; s (11)
jest wektorem kontrawariantnym.
εrst - jest kontrawariantnym ε-obiektem tj. εrst równy jest + 1/√g lub - 1/√g w zależności od tego czy r, s, t jest parzystą lub nieparzystą permutacją liczb 1,2,3 oraz jest równy zeru przy wszystkich innych wartościach r, s, t.
Wektor (11) zwykle nazywa się rotacją Fr- jego składowe we współrzędnych kartezjańskich prostokątnych są następujące :
∂R/∂y − ∂Q/∂z ; ∂P/∂z − ∂R/∂x ; ∂Q/∂x − ∂P/∂y ;
Odpowiednio - oznaczając przez vr wektor jednostkowy normalny widzimy, że Gr vr jest skalarem który w układzie (x,y,z) określamy zależnością :
Gr vr = − εrst Fr; s vr = l( ∂R/∂y - ∂Q/∂z ) + m( ∂P/∂z − ∂R/∂x ) + n( ∂Q/∂x − ∂P/∂y)
Ponieważ dxr / ds jest wektorem jednostkowym stycznym do krzywej C , to Fr (dxr /ds) jest skalarem który w kartezjańskim układzie współrzędnych wyrazić możemy następująco :
Fr (dxr /ds) = P(dx/ds) + Q(dy/ds.) + R(dz/ds)
Dlatego twierdzenie Stokesa w zapisie tensorowym ma postać:
∫ Fr (dxr /ds) = − ∫∫ −εrst Fs, t vr dσ (12)
Całkę po lewej stronie nazywamy cyrkulacją (krążeniem) wektora Fr wzdłuż krzywej C.
Paragraf 3 Pole elektrostatyczne
Wiemy że pole elektrostatyczne w danym punkcie wytwarzane przez pewną ilość ładunków w próżni określone jest funkcja potencjalną V :
V = ¼ π Σ (e/r) (13)
(jeśli ładunki są punktowe)
e - jest ładunkiem elektrycznym, a r - jest odległością danego punktu do ładunku e.
Jeśli ładunki są rozłożone w sposób ciągły na powierzchni, to wyrażenie dla V przyjmuje postać :
V = ¼ π ∫ ∫ ∫ ρ/r dτ + ¼ π ∫ ∫ μ/r dσ (14)
V S
gdzie: ρ - jest objętościową a μ - powierzchniową gęstością ładunku.
Gęstość ρ będzie oczywiście równa zeru w danym punkcie w którym nie ma objętościowego rozkładu ładunków i analogicznie μ będzie zerem w danym punkcie gdzie nie ma ładunków powierzchniowych. Oznaczmy wektor natężenia pola elektrycznego przez Er , tak że :
Er = − ∂V/∂dxr (15)
Przy czym teraz przyjęto krzywoliniowy układ współrzędnych dxr .
Twierdzenie Gaussa mówi, że strumień wektora natężenia pola elektrycznego przez jakąkolwiek powierzchnię równy jest ładunkowi elektrycznemu zawartemu wewnątrz tej objętości, mamy zatem :
∫ ∫ Er vr dσ = ∫ ∫ ∫ ρ dτ + ∫ ∫ μ dσ
S V Σ
gdzie Σ - to powierzchnia wewnątrz S na której rozłożono ładunek.
Z twierdzenia Gaussa wynika, że :
∫ ∫ Er vr dσ = ∫ ∫ ∫ Er, r dτ − ∫ ∫ [(Er vr )1 + (Er vr )2 ] dσ
S V Σ
indeksy 1,2 dotyczą przeciwnych stron powierzchni Σ.
Odpowiednio :
∫ ∫ ∫ (Er, r − ρ )dσ = ∫ ∫ ∫ Er, r dτ − ∫ ∫ [(Er vr )1 + (Er vr )2 ] dσ
S V Σ
Ten rezultat jest słuszny dla dowolnej powierzchni S. A to znaczy, że dla każdego punktu powierzchni mamy :
grs Er, s = Er, r = ρ (16)
przy czym ρ równe jest 0 tam gdzie niema ładunków elektrycznych.
Oprócz tego na powierzchni Σ na której rozłożony jest ładunek elektryczny z gęstością powierzchniową μ będzie :
(Er vr )1 + (Er vr )2 + μ = 0 (17)
to jest podstawowe równanie pola elektrycznego.
Paragraf 4 Dielektryki
Jeśli ładunki elektryczne istnieją w pewnym materialnym środowisku to równania poprzedniego paragrafu należy zmodyfikować. Pole elektryczne w tym przypadku określamy dwoma wektorami :
Wektorem natężenia pola elektrycznego Er który jest równy gradientowi funkcji potencjalnej V wziętej ze znakiem minus tj.
Er = − ∂V/∂dxr = − Vr (18)
Wektorem Dr - który nazywamy „wektorem przesunięcia” Wektor Dr charakteryzuje się taką własnością, że jego strumień przez daną powierzchnię równy jest ładunkowi zawartemu wewnątrz tej powierzchni.
Tak jak poprzednio (wzór (16))można za pomocą twierdzenia Greena udowodnić że w całej przestrzeni :
grs Dr, s = Dr, r = ρ (19)
przy czym w tych punktach gdzie nie ma ładunków elektrycznych ρ = 0, na powierzchni Σ na której ładunki rozłożone są z gęstością μ mamy:
(Dr vr )1 + (Dr vr )2 + μ = 0 (20)
gdzie indeksy 1,2 dotyczą przeciwnych stron powierzchni Σ.
Wektory Er i Dr związane są między sobą w taki sposób, że jeśli zadany jest jeden z nich to i zadany będzie drugi tj. są funkcjami liniowymi jeden drugiego o postaci :
Dr = εs r Es (21)
gdzie εs r - jest funkcją jedynie współrzędnych. Zależność (21) pokazuje, że εs r jest tensorem mieszanym drugiego rzędu nazywamy go „tensorem dielektrycznym”.
Rozpatrzymy następnie jednorodny dielektryk. To znaczy, że jeśli w dwóch różnych punktach istnieją jednakowe natężenia pola elektrycznego to w tych punktach również wektory Dr także powinny być równe. Inaczej mówiąc jeśli wektory natężenia elektrycznego przedstawiają stałe pole wektorów równoległych to wektory przesunięcia także przedstawiają podobne pole. Warunkiem tego, że Er przedstawiają takie pole jest : E r; s = 0
gdzie E r; s - jest pochodną kowariantną ; taki sam warunek musi spełniać Dr.
Różniczkując kowariantnie (21) względem xt otrzymujemy :
Dr; t = εs r Es; t + εs r; t Es
odpowiednio warunkiem jednorodności dielektryka jest :
εs r; t = 0 (22)
tj. pochodna kowariantna od εsr powinna być równa zeru w każdym punkcie .
Jeśli dielektryk jest izotropowy to wektory Er i Dr powinny mieć jednakowe kierunki co pociąga za sobą zależność :
εrs = εδr s (23)
gdzie ε - jest skalarem a δrs - jest symbolem Kroneckera.
Jeśli środowisko jest jednorodne i izotropowe to z (22) i (23) widać, że ε jest stałe we wszystkich punktach tego środowiska. W tym przypadku ε nazywamy „stałą dielektryczną”.
Równania (18) - (21) są podstawowymi równaniami pola elektrycznego w dielektryku anizotropowym. Jednak niekiedy wykorzystujemy inny wektor. Ten wektor określony jest równością :
Pr = Dr − Er (24)
i nazywa się „wektorem polaryzacji” Oczywiście, że :
Pr = (εsr − δs r ) Es (25)
zatem składowe wektora polaryzacji mogą być wyrażone jako liniowe składowe wektora natężenia pola elektrycznego. Tensor (εsr − δs r ) nazywamy „tensorem podatności dielektrycznej”.
Paragraf 5 Pole magnetyczne
Jeśli w punkcie P umieścimy elementarny magnes to potencjał Ω wytwarzanego pola magnetycznego w danym punkcie przestrzeni określony jest zależnością :
Ω = ¼ π Im ∂/∂xm (1/r)
gdzie Ir - jest momentem magnetycznym, a r - jest odległością od pewnego punktu do P. Potencjał przy dowolnym rozmieszczeniu elementarnych magnesów równy jest:
Ω = ¼ π ∫ ∫ ∫ Im ∂/∂xm (1/r) dτ (26)
V
gdzie : Irdτ - jest momentem magnetycznym elementu objętości dτ, nazywanym „wektorem namagnesowania”.
Wykorzystując twierdzenie Greena równość (26) można zapisać w postaci:
Ω = ¼ π ∫ ∫ Im vm dσ/r - ¼ Π ∫ ∫ ∫ Im, m dτ/r (27)
S V
Stąd widać, że potencjał wywołany jest obecnością materii magnetycznej o gęstości objętościowej ρ i powierzchniowej μ gdzie :
ρ = − Im, m (28)
μ = Im vm (28)
Wektor natężenia pola magnetycznego określamy zależnością :
Hr = − ∂Ω/∂xr = − Ωr (29)
Z (29) i (27) wynika, że :
gmn Hm, n = − gmn Ωm, n = − ΔΩ = − gmn Im, n
lub
gmn (Hm + Im ), n = 0
Odpowiednio wektor Br określamy równaniem :
Br = Hr + Ir (30)
otrzymujemy zatem :
gmn Bm, n = 0 (31)
Wektor Br nazywamy „wektorem indukcji magnetycznej” a równanie (31) pokazuje, że dywergencja wektora indukcji magnetycznej jest równa zeru.
Pewna część materii magnetycznej w rozpatrywanym polu może pozostawać w spoczynku,
będziemy oznaczać gęstość momentu magnetycznego stałej części pola przez : I0r
Pozostała część magnetyzmu jest indukowana przez pole magnetyczne i dlatego zależy od wektora natężenia pola magnetycznego Hr . Tą zależność będziemy zakładać jako zależność liniową. Dlatego :
Ir = I0r + λsr Hs
Tensor λsr nazywamy „tensorem podatności magnetycznej”. Wykorzystując to wyrażenie możemy napisać:
Br = I0r + μsr Hs (32)
gdzie : μsr = λsr δsr
Tensor μsr nazywamy „tensorem przenikalności magnetycznej”. Równania (29)- (32) są podstawowymi równaniami pola magnetycznego. Jeśli stałe pole magnetyczne nie występuje to oczywiście mamy : I0r = 0
Paragraf 6 Równania pola elektromagnetycznego
Prąd elektryczny w przewodniku wyrażony jest wektorem ir , który nazywamy „wektorem prądu”. Wektor ten ma taka własność, że zmianę strumienia elektryczności przez element powierzchni dσ - prostopadły do wektora jednostkowego λr - możemy wyrazić przez wielkość : ir λr dσ.
Prawo Ohma mówi, że wektor prądu jest liniową funkcją wektora natężenia pola elektrycznego Er . W takim razie :
ir = χrs Es (33)
gdzie składowe χrs są funkcjami tylko współrzędnych. Widzimy, że χrs jest tensorem drugiego rzędu , nazywamy go „tensorem przewodności”.
Jeśli środowisko jest jednorodne to :
χrs; t = 0
a jeśli środowisko jest izotropowe to : χrs = χ grs
Prąd elektryczny w przewodniku niekiedy nazywany jest „prądem przewodzenia” w odróżnieniu od innych postaci prądu elektrycznego z jakimi spotkamy się później.
Załóżmy, że ośrodek znajduje się w stanie spoczynku i może się ono składać z dielektryków i przewodników w których ładunki elektryczne mogą się przemieszczać.
Chcemy znaleźć równania pola elektromagnetycznego w tych warunkach.
Pole elektromagnetyczne określone jest następującymi wektorami :
wektorem natężenia pola elektrycznego Er .
wektorem przesunięcia Dr . Z tymi dwoma wektorami związany jest wektor polaryzacji :
Pr = Dr − Er .
wektorem indukcji magnetycznej Br , który spełnia równanie :
gmn Bm, n = 0
wektorem Ir . Wektor ten razem z Br określa nowy wektor
Hr = Br − Ir .
który nazywamy wektorem natężenia pola magnetycznego wektora „pełnego” prądu Cr .
Wektor ten zawiera trzy różne postacie wektora prądu :
- wektor prądu przewodzenia związany z Er prawem Ohma.Wektor prądu przewodzenia dany jest χrs Es , gdzie χrs - jest tensorem przewodności środowiska.
wektor prądu „przesunięcia” który określony jest zależnością :
∂Dr /∂t
- wektorem „prądu konwekcji”, który wynika dzięki ruchowi ładunków elektrycznych w środowisku.
Przykładowo jeśli ładunek elektryczny gęstości objętościowej ρ ma prędkość vr
to wektor prądu równy jest : ρvr .
Pierwszym podstawowym prawem pola elektromagnetycznego jest „prawo Faradaya”, które mówi, że siła elektromotoryczna wyindukowana w pewnym konturze jest proporcjonalna ze znakiem minus do strumienia indukcji magnetycznej przechodzącego przez ten kontur. SEM w konturze L dane jest za pomocą całki krzywoliniowej :
∫ Es (dxr /ds )ds
L
Dlatego prawo Faradaya możemy zapisać w postaci :
∫ Es (dxr /ds )ds = − (1/c) ∂ /∂t ∫ Br vr dσ. (34)
L S
gdzie S- to dowolna powierzchnia, napięta na konturze L.
Stosując twierdzenie Stokesa do całki krzywoliniowej otrzymujemy:
∫ ∫ [ (∂Br /c∂t ) − εrst Es; t ] vr dσ = 0
S
To równanie jest słuszne dla dowolnej powierzchni S, dlatego :
(1/c) (∂Br / ∂t) = − εrst Es; t (35)
tj. prędkość zmiany Br jest równa iloczynowi rotacji wektora Er przez c, wziętemu ze znakiem minus.
Jest to pierwsze wektorowe równanie pola elektromagnetycznego.
Drugim podstawowym prawem jest „prawo Ampera” mówiące, że całka od wektora natężenia pola magnetycznego wzięta po konturze zamkniętym jest proporcjonalna do strumienia wektora prądu przez powierzchnię ograniczoną tym konturem. W naszych oznaczeniach będzie miała ona następującą postać :
∫ Hr (dxr /ds )ds = 1/c ∫ ∫ Cr vr dσ. (36)
L S
Stosując twierdzenie Stokesa otrzymujemy :
(1/c )Cr = − εrst Hs; t (37)
tj. wektor prądu równy jest iloczynowi c przez rotacje wektora Hr.
Jest to drugie równanie wektorowe pola elektromagnetycznego. D
o tych dwóch równań wektorowych powinniśmy dodać dwa równania skalarne :
gmn Dm, n = ρ (38)
gmn Bm, n = 0 (38)
które jak widzieliśmy są słuszne dla pól statycznych.
Równania (35), (37) i (38) są układem równań pola elektromagnetycznego.
Wektory Dr Er Br Hr są związane zależnościami :
Dr = εsrEs (39)
Br = μsrHs (39)
************************************************************************************************
1