Dość tego. Wybacz mi, Newtonie; odkryłeś bodaj jedyną drogę, która była w Twoich czasach dostępna nawet dla człowieka o największych zdolnościach i wyobraźni. Pojęcia, które stworzyłeś, nadal kierują naszym myśleniem o fizyce, aczkolwiek wiemy już, że w dążeniu do głębszego zrozumienia związków będziemy musieli zastąpić je pojęciami bardziej oderwanymi od sfery bezpośredniego doświadczenia.
Kiedy studiowałem najbardziej fascynująca dziedziną fizyki była teoria Maxwella. O jej rewolucyjności stanowiła przejście od oddziaływań na odległość do pól jako obiektów podstawowych. W teorii Maxwella okazało się, że światło jest zjawiskiem elektromagnetycznym, co dało powiązanie prędkości światła z elektrycznym i magnetycznym absolutnym układem jednostek oraz współczynnika refrakcji ze stałą dielektryczną, jak również pozwoliło znaleźć jakościową relację pomiędzy współczynnikiem odbicia a współczynnikiem przewodności metalicznej ciał - to było jak objawienie. Oprócz przejścia od teorii pola czyli wyrażenia elementarnych praw przez równania różniczkowe, Maxwell potrzebował tylko jednego jedynego kroku o charakterze hipotezy - wprowadzenia elektrycznego prądu przesunięcia w próżni i w dielektrykach oraz jego magnetycznego efektu - innowacja praktycznie wymuszona przez formalne własności równań różniczkowych. W tym momencie nasuwa mi się uwaga, że para Faraday-Maxwell odznacza się niezwykłym podobieństwem do pary Galileusz-Newton - pierwszy z każdej pary intuicyjnie chwyta związki, drugi precyzyjnie je formułuje i stosuje ilościowo.
Zrozumienie teorii elektromagnetycznej utrudniała w tym okresie następująca okoliczność. Elektryczne i magnetyczne „natężenia pól” i „przesunięcia” były traktowane jako równie elementarne zmienne, a pusta przestrzeń jako specjalny przypadek ciała dielektrycznego. Za nośnik pola uważano materię, a nie przestrzeń. Z tego wynikało, że nośnik pola może się poruszać, co naturalnie odnosiło się także do „próżni” (eteru). Na tym podstawowym założeniu oparta jest całkowicie elektrodynamika ciał w ruchu Hendrika A. Lorentza. Według niego pole istnieje tylko w pustej przestrzeni. Zbudowana z atomów materia jest jedynym nośnikiem ładunków elektrycznych; pomiędzy cząstkami materii istnieje pusta przestrzeń nośnik pola elektromagnetycznego, które jest wytworzone przez położenia i prędkości punktowych ładunków przenoszonych przez cząstki materii. Dielektryczność, przewodnictwo itp. Są określone wyłącznie przez rodzaj mechanicznych wiązań pomiędzy cząstkami, z których zbudowane są ciała. Cząstki-ładunki wytwarzają pole, które z kolei oddziałuje siłami na ładunki cząstek, a ruchy tych ostatnich są określone przez prawa Newtona. Jeśli porówna się to z systemem Newtona, zmiana polega na tym, że oddziaływanie na odległość zostało zastąpione przez pole, które opisuje także promieniowanie. Grawitacje zwykle pomija się ze względu na jej relatywną słabość; jej wyłączenia było zawsze przez wzbogacenie struktury pola, czyli rozszerzenie praw polowych Maxwella. Fizyk obecnej generacji uważa punkt widzenia, do którego doszedł Lorentz, za jedyny możliwy; w tamtych czasach był to jednakże zaskakujący i śmiały krok, bez którego dalszy rozwój nie byłby możliwy.
Jeśli się spojrzy krytycznie na tę fazę rozwoju teorii, uderza w niej dualizm, polegający na tym, że punkt materialny w sensie newtonowskim oraz pole jako kontinuum są traktowane równorzędnie, jako pojęcia elementarne. Energia kinetyczna i energia pola jawią się jako rzeczy ze swej istoty odrębne. To wydaje się szczególnie niezadowalające, ponieważ zgodnie z teorią Maxwella pole magnetyczne poruszającego się ładunku elektrycznego reprezentuje bezwładność. Dlaczego zatem nie całą bezwładność? Wtedy pozostałaby tylko energia pola, a cząsteczka byłaby jedynie obszarem szczególnie wysokiej gęstości energii pola. Wtedy można by mieć nadzieję na wyprowadzenie pojęcia masy punktowej oraz równań ruchu cząstek z równań pola - niezadowalający dualizm byłby usunięty.
Lorentz dobrze o tym wiedział. Z równań Maxwella nie da się jednak wyprowadzić znajdującej się w równowadze elektryczności, jaką jest cząstka. Mogłyby tego dokonać jedynie jakieś nieliniowe równania pola. Nie istniała jednak metoda, która pozwalałaby szukać takich równań bez popadania w awanturniczą dowolność. W każdym razie można było mieć nadzieję, że podążając drogo tak skutecznie wytyczoną przez Faradaya i Maxwella, znajdzie się nowe, pewne fundamenty całej fizyki.
Rewolucja rozpoczęła się przez wprowadzenie pola w żadnym razie się na tym nie zakończyła. Na przełomie stulecia, niezależnie od powyższego, pojawił się drugi zasadniczy kryzys, z którego konsekwencji zdano sobie sprawę dzięki badaniom Maxa Plancka nad promieniowaniem cieplnym(1900). Historia tego zdarzenia jest tym bardziej godna uwagi, że przynajmniej w pierwszej fazie nie wpłynęły na nie żadne niespodziewane odkrycia eksperymentalne.
Kirchhoff odkrył, na podstawie przesłanek termodynamicznych, że gęstość energii oraz rozkład spektralny promieniowania wewnątrz wnęki otoczonej nieprzenikalnymi ścianami o temperaturze T nie mogą zależeć od materiału, z którego wykonane są ściany. Oznacza to, że monochromatyczna gęstość promieniowania ρ jest uniwersalną funkcją częstości ν i temperatury T. Powstał zatem interesujący problem wyznaczenia tej funkcji ρ(ν,T ). Co można wywnioskować o tej funkcji z przesłanek teoretycznych? Zgodnie z teorią Maxwella, promieniowanie musi wywierać na ściany ciśnienie, określone przez całkowitą gęstość energii. Boltzmann wywnioskował z tego, na drodze czysto termodynamicznych rozważań, że całkowita gęstość energii promieniowania (
) jest proporcjonalna do T 4. w ten sposób znalazł on teoretyczne uzasadnienie prawa odkrytego uprzednio doświadczalnie przez Stefana i powiązał je z podstawami teorii Maxwella, Wien odkrył, że uniwersalna funkcja ρ dwu zmiennych ν i T musi mieć formę:
gdzie ƒ(ν/T ) jest uniwersalną funkcją jednej zmiennej ν/T . Było jasne, że teoretyczne wyznaczenie tej uniwersalnej funkcji ƒ posiada fundamentalne znaczenie - przed takim właśnie zadaniem stanął Planck. Staranne pomiary pozwoliły dość dokładnie wyznaczyć funkcję ƒ. Opierając się na tych pomiarach, Planck znalazł wyrażenie, które całkiem dobrze odtwarzało wyniki:
,
gdzie h i k są dwoma uniwersalnymi stałymi, z których pierwsza stanowi zalążek teorii kwantowej. Ze względu na mianownik, wzór ten wygląda dość osobliwie. Czy dało się go wyprowadzić teoretycznie? Planck potrafił znaleźć to wyprowadzenie; jego niedoskonałości początkowo przeszły nie zauważone, co było bardzo fortunne dla naszego rozwoju fizyki. Gdyby ten wzór był prawdziwy, umożliwiłby, z pomocą teorii Maxwella, obliczenie średniej energii E quasi-monochromatycznego oscylatora znajdującego się w polu promieniowania:
.
Planc wolał wyliczyć tę ostatnią wielkość teoretycznie. W zadaniu tym chwilowo nie była pomocna ani termodynamika, ani teoria Maxwella. Wzór ten miał wszakże jeden bardzo zachęcający aspekt. Dla wysokich wartości temperatury (przy ustalonym ν) prowadził do wyrażenia:
E=kT.
To samo wyrażenie dawała kinetyczna teoria gazu dla średniej energii masy punktowej, oscylującej w jednym wymiarze. Dawała ona mianowicie:
E=(R/N)T,
gdzie R oznacza stałą gazową, a N ilość cząsteczek w gramocząsteczce, z czego można wyliczyć bezwzględny rozmiar atomu. Porównując te dwa wyrażenia dostaje się:
N=R/k.
Jedna stała we wzorze Plancka daje zatem dokładnie rozmiar atomu. Wartość liczbowa była zadowalająco zgodna z - swoją drogo mało dokładnymi - wynikami kinetycznej teorii gazów.
Planck nie miał wątpliwości, że to wielki osiągnięcie. Sprawa ta ma jednak drugą stronę medalu, co początkowo Planck na szczęście przeoczył. To samo rozumowanie prowadzi do wniosku, że związek E=kT musi być słuszny także dla niskich temperatur. W tym wypadku jednak wzór Plancka i stała h musiałyby pójść na śmietnik. Z istniejącej teorii należałoby wnioskować, że: albo teoria gazów daje fałszywą średnią energię kinetyczną oscylatora co prowadzi do odrzucenia mechaniki, albo teoria Maxwella daje błędną średnia energię kinetyczną oscylatora, co prowadziłoby do odrzucenia teorii Maxwella. W tych warunkach najbardziej prawdopodobne jest, że obie teorie są prawdziwe tylko w granicy, w ogólności są zaś fałszywe; tak faktycznie jest, o czym się wkrótce przekonamy. Gdyby Planck doszedł do takiego wniosku, prawdopodobnie nie dokonałby swego wielkiego odkrycia, ponieważ jego rozumowanie zostałoby pozbawione podstaw.
wróćmy do rozumowania Plancka. Na podstawie kinetycznej teorii gazów Boltzmann odkrył, że - pomijając stały czynnik - entropia jest równa logarytmowi „prawdopodobieństwa” rozważanego stanu. Tym samym zidentyfikował naturę procesów, które w sensie termodynamicznym są „nieodwracalne”. Tymczasem z punktu widzenia mechaniki molekularnej wszystkie procesy są odwracalne. Jeżeli stan zdefiniowany w ramach teorii molekularnej nazwie się stanem mikroskopowym lub - krótko - mikrostanem, a stan opisany w kategoriach termodynamicznych makrostanem, to wtedy do makrostanów należy olbrzymia liczba (Z) mikrostanów. Z jest zatem miara prawdopodobieństwa danego makrostanu. Idea ta jest niezwykle ważna także dlatego, że jej stosowalność nie ogranicza się do mikroskopowego opisu na podstawie mechaniki. Planck to rozumiał i zastosował zasadę Boltzmanna do układu składającego się z bardzo wielu rezonatorów o tej samej częstości ν. Stan makroskopowy jest dany przez całkowita energie drgań wszystkich rezonatorów, stan mikroskopowy przez ustalenie (chwilowej) energii pojedynczego rezonatora. Aby móc wyrazić ilość mikrostanów należących do makrostanu skończoną wartością, Planck podzielił całkowitą energię na dużą, ale skończoną liczbę jednakowych elementów ξ i zapytał: na ile sposobów można przydzielić te elementy rezonatorom? Logarytm tej liczby daje entropię, a zatem (poprzez termodynamikę) temperaturę systemu. Planck otrzymałby swój wzór, gdyby wybrał ξ =hν jako rozmiar elementów energii ξ. Decydującym krokiem, od którego zależy wynik, jest wybór określonej skończonej wartości ξ, a zatem nie przechodzenie do granicy ξ=0. Z tego rozumowania nie wynika w sposób rzeczywisty, że jest ono sprzeczne z podstawami mechaniki i elektrodynamiki, na których zresztą cały wywód się opiera. W rzeczywistości wywód ten implicite zakłada, że energia może być emitowana i absorbowana przez pojedynczy rezonator tylko w „kwantach” o wielkości hν, a zatem, że energia promieniowania, może być przekazywana w kwantach - co stanowi sprzeczność z mechaniką i elektrodynamiką - być może nieco mniejsza. Albowiem wyrażenie na gęstość energii promieniowania , chociaż zgodne z równaniami Maxwella, nie jest w żadnym razie następstwem tych równań. Wyrażenie to dostarcza ważnych wartości średnich co widać z faktu, że oparte na nim prawa Stefana-Boltzmanna oraz Wiena są zgodne z doświadczeniem.
wszystko to było dla mnie zupełnie jasne wkrótce po opublikowaniu fundamentalnej pracy Plancka, toteż nawet nie mając czym zastąpić mechaniki klasycznej, dostrzegłem konsekwencje prawa promieniowania temperaturowego dla efektu fotoelektrycznego i innych podobnych zjawisk transformacji energii promieniowania, jak również dla ciepła właściwego (zwłaszcza) ciał stałych. Jednak wszystkie moje wysiłki, aby dostosować teoretyczne podstawy fizyki do tych nowych odkryć, spełzły na niczym. Czułe się, jakby grunt usunął mi się spod nóg i nigdzie nie było widać solidnego fundamentu, na którym by można oprzeć konstrukcję. Uważałem i do dziś uważam za cud, że ten pełen sprzeczności i niepewny fundament okazał się dla człowieka o tak wyjątkowym instynkcie i subtelności jak Bohr wystarczający do odkrycia podstawowych praw linii spektralnych i powłok atomowych, a zarazem ich znaczenia dla chemii. Widzę w tym najwyższy stopień muzykalności w dziedzinie myśli.
Wkrótce po 1900 roku, czyli niedługo po pionierskiej racy Plancka, tego typu rozważania jasno mi uświadomiły, że ani mechanika, ani elektrodynamika nie może być (z wyjątkiem przypadków granicznych) absolutnie dokładna. Coraz bardziej wątpiłem w możliwość odkrycia prawdziwych praw przez próby ich konstruowania w oparciu o znane fakty. Im dłużej i z większym uporem próbowałem, tym bardziej dochodziłem do przekonania, że do poprawnych wyników może doprowadzić tylko odkrycie uniwersalnej zasady formalnej. Przykład widziałem w termodynamice. Uniwersalna zasada miała tam postać następującego twierdzenia: prawa natury są takie, że nie da się skonstruować perpetuum mobile (pierwszego i drugiego rodzaju). Jak zatem odkryć taką uniwersalną zasadę? Po dziesięciu latach rozważań wyłoniła się ona z paradoksu na który natknąłem się już w wieku szesnastu lat: jeżeli podążam za promieniem światła z prędkością c (prędkość światła w próżni), powinienem widzieć promień jako nieruchome, przestrzenne oscylujące pole elektromagnetyczne. Takiego zjawiska nie da się jedna zaobserwować, na co wskazuje zarówno doświadczenie, jak i równania Maxwella. Od samego początku było dla mnie intuicyjnie jasne, że z punktu widzenia takiego obserwatora wszystko musi podlegać takim samym prawom, którym podlega obserwator nieruchomy. Skąd ten pierwszy obserwator mógłby wiedzieć lub ustalić, że znajduje się w szybkim ruchu jednostajnym?
Jak widać, paradoks ten zwiera już zarodek szczególnej teorii względności. Oczywiście dzisiaj każdy wie, że wszelkie próby satysfakcjonującego wyjaśnienia tego paradoksu były skazane na niepowodzenie, dopóki nie uzmysłowiono sobie, że w podświadomości zakorzeniony jest aksjomat bezwzględnego charakter czasu bądź równoczesności. Rozpoznanie tego aksjomatu i jego arbitralności praktycznie oznacza rozwiązanie problemu. Na właściwą drogę, prowadzącą do odkrycia tej kluczowej kwestii naprowadziła mnie w dużej mierze lektura pism filozoficznych Davida Hume'a i Ernsta Macha.
Należy sobie uświadomić, co w fizyce oznaczają współrzędne przestrzenne i moment czasowy zdarzenia. Fizyczna interpretacja współrzędnych przestrzennych zakłada istnienie sztywnego układu odniesienia, który ponadto musiał znajdować się w mniej lub bardziej określony stanie ruchu (układ inercjalny). W danym kładzie inercjalnym współrzędne oznaczały wyniki pewnych pomiarów dokonanych za pomocą sztywnych (stacjonarnych) prętów. (Należy zawsze mieć na uwadze, że chociaż założenie o istnieniu sztywnych prętów opiera się na doświadczeniu, ze swej istoty jest założeniem arbitralnym). Przy takiej interpretacji współrzędnych przestrzennych jednym z problemów fizyki staje się pytanie o stosowalność geometrii Euklidesowej.
Jeżeli analogiczną metodą próbuje się zinterpretować moment czasowy zdarzenia, potrzebny jest sposób mierzenia odcinka czasu (wewnętrznie zdeterminowany cykliczny proces realizowany przez układ o dostatecznie małych wymiarach przestrzennych). Spoczywający względem układu inercjalnego zegar określa czas lokalny (czas własny). Czasy własne wszystkich punktów przestrzeni wyznaczają „czas” należący do wybranego układu inercjalnego, jeżeli istnieje sposób wzajemnego „nastawienia” tych zegarów. Widać, że nie ma apriorycznej konieczności, aby ta zdefiniowane „czasy” zgadzały się ze sobą. Zostałoby to zauważone o wiele wcześniej, gdyby ten fakt, że w praktyce codziennego życia światło (dzięki wysokiej wartości c) pozwala uznać istnienie bezwzględnej równoczesności.
Założenia o istnieniu (w zasadzie) prętów pomiarowych i zegarów (idealnych czy też doskonałych) nie są niezależne od siebie, ponieważ sygnał świetlny odbijający się od końców sztywnego pręta stanowi idealny zegar, pod warunkiem, że postulat stałej prędkości światła w próżni nie prowadzi do sprzeczności.
Powyższy paradoks można zatem sformułować następująco. W oparciu o reguły klasycznej mechaniki, dotyczące związków miedzy współrzędnymi przestrzennymi i momentami zdarzeń, przy przejściu od jednego układu inercjalnego do drugiego dwa założenia
stałość prędkości światła
niezależność praw fizyki (w szczególności prawa stałej prędkości światła) od wyboru układu inercjalnego
są wzajemnie sprzeczne (niezależnie od faktu, że każde z osobna jest potwierdzone przez doświadczenie).
Kluczem do szczególnej teorii względności jest zrozumienie, że założenia (1) i (2) nie są sprzeczne, jeżeli dla przekształceń współrzędnych i momentów zdarzeń przyjmie się nowego typu zależności („przekształcenie Lorentza”). Przy danej fizycznej interpretacji współrzędnych i czasu nie jest to bynajmniej kwestia konwencji, lecz postulat uwzględniający pewne sprawdzone doświadczenie i weryfikowalne hipotezy, które dotyczą zachowania się ruchomych prętów i zegarów.
Niniejszy postulat zawiera uniwersalną zasadę szczególnej teorii względności: prawa fizyki są niezmiennicze względem przekształcenia Lorentza (przy przejściu od jednego układu inercjalnego do innego dowolnego układu inercjalnego). Jest to zasada ograniczająca dla praw natury, porównywalna do zasady ograniczającej, która mówi, że nie istnieje perpetuum mobile i która tanowi podstawę termodynamiki.
Najpierw uwaga o związku teorii z „czterowymiarowa przestrzenią”. Rozpowszechnione jest błędne przekonanie, że szczególna teoria względności odkryła, lub od nowa wyprowadziła, czterowymiarowe kontinuum fizyczne. Naturalnie nie odpowiada to prawdzie. Mechanika klasyczna również opiera się na czterowymiarowym kontinuum przestrzeni i czasu. Jednak w czterowymiarowym kontinuum fizyki klasycznej podprzestrzenie o ustalonej wartości czasu cechuje bezwzględna realność fizyczna, niezależna od wyboru układu odniesienia. Stad czterowymiarowe kontinuum rozkładania się w naturalny sposób w trójwymiarowe i jednowymiarowe (czas), zatem czterowymiarowy punkt widzenia nie narzuca się jako konieczny. Natomiast szczególna teoria względności stworzyła formalną zależność, wiążącą z jednej strony współrzędne przestrzenne, a z drugiej - współrzędną czasową; zależność ta stanowi własność praw natury, w których pojawiają się współrzędne przestrzenne i czasowe.
Istotny wkład Minkowskiego do teorii polega na następującym odkryciu: stwierdzenie niezmienniczości prawa względem przekształcenia Lorentza dotychczas wymagało przeprowadzenia tego przekształcenia; Minkowski sformułował formalizm, w którym forma matematyczna danego prawa gwarantuje jego niezmienniczość. Opracowując czterowymiarowy rachunek tensorowy, Minkowski osiągnął dl przestrzeni czterowymiarowej to samo, co zwykły rachunek wektorowy daje dla trzech wymiarów przestrzennych. Ponadto pokazał on, że przekształcenie Lorentza (z wyjątkiem odmiennego znaku wynikającego ze szczególnego charakteru czasu) jest niczym jak tylko obrotem układ współrzędnych w przestrzeni czterowymiarowej.
Na początek uwaga krytyczna na temat scharakteryzowanej powyżej teorii. Uderza w niej to, że wprowadza (oprócz czterowymiarowej przestrzeni) dwie kategorie obiektów: (1) pręty pomiarowe i zegary oraz (2) wszystkie pozostałe obiekty, na przykład pole elektromagnetyczne, punkt materialny itd. W pewnym sensie jest to niekonsekwencja: ściśle rzecz biorąc, pręty pomiarowe i zegary powinny pojawić się jako rozwiązania podstawowych równań (obiekty składające się z ruchomych układów atomowych), a nie jako byty teoretycznie samoistne. Procedura ta jest jednakże uzasadniona, ponieważ od początku było jasne, że postulaty teorii nie są dostatecznie silne, aby z ich wyprowadzić dostatecznie samowystarczalne i niearbitalne równania, na których dałoby się oprzeć teorię prętów pomiarowych i zegarów. Nie chcąc unikać fizycznej interpretacji współrzędnych (co samo w sobie byłoby niemożliwe), lepiej pozostawić ten brak konsekwencji - pod warunkiem jej wyeliminowania na późniejszym etapie rozwoju teorii. Nie należy jedna usprawiedliwiać opisanej powyżej praktyki, która polega na wyobrażaniu sobie odległości jako szczególnego rodzaju obiektów fizycznych, istotowo różnych od innych wielkości fizycznych.
Szczególna teoria względności zawdzięcza swe istnienie równaniom Maxwella dla pola elektromagnetycznego. Z kolei te ostatnie można w zadowalający sposób formalnie zrozumieć jedynie przez pryzmat szczególnej teorii względności. Są to najprostsze równania niezmiennicze względem przekształcenia Lorentza, które da się sformułować dla tensora antysymetrycznego wyprowadzonego z pola wektorowego. Samo w sobie byłoby to zadowalające, gdybyśmy nie wiedzieli ze zjawisk kwantowych, że teoria Maxwella nieprawidłowo ujmuje energetyczne własności promieniowania. Jednakże nawet szczególna teoria względności nie daje żadnej wskazówki, jak w sposób naturalny zmodyfikować teorię Maxwella. Także na pytanie Macha: „Czym układy inercjalne wyróżniają się spośród wszystkich układów odniesienia?”, teoria ta nie daje żadnej odpowiedzi.
Że szczególna teoria względności jest tylko pierwszym krokiem, po którym w sposób konieczny przyjdą dalsze, stało się dla mnie przy okazji moich prób rozszerzenia teorii na grawitację. W mechanice klasycznej, interpretowanej w kategoriach pola, potencjał grawitacyjny pojawia się jako pole skalarne (najprostsza teoretyczna możliwość dla pola o jednej składowej). Skalarną teorię pola grawitacyjnego można łatwo sformułować w postaci niezmienniczej względem grupy przekształceń Lorentza. Naturalny wydaje się zatem następujący program: całkowite pole fizyczne składa się z pola skalarnego (grawitacja) oraz pola wektorowego (pole elektromagnetyczne); późniejsze odkrycia mogą ewentualnie spowodować konieczność wprowadzenia bardziej skomplikowanych rodzajów pola, ale na razie nie musimy się tym martwić.
Możliwość realizacji tego programu była od samego początku wątpliwa, ponieważ teoria musiałaby połączyć następujące rzeczy:
Z ogólnych rozważań szczególnej teorii względności było jasne, że masa bezwładna układu fizycznego rośnie wraz z całkowitą energią (zatem, na przykład, z energią kinetyczną).
Dzięki bardzo precyzyjnym eksperymentom (w szczególności dzięki doświadczeniom Eotvosa z wagą skręceń) wiedziano z bardzo dużą dokładnością, że masa ciężka ciała jest równa masie bezwładnej.
Z (1) i (2) wynika, że ciężar układu zależy w sposób zupełnie określony od jego całkowitej energii. Jeżeli teoria nie spełnia tego w sposób naturalny, należy ją odrzucić. Warunek ten można zręczniej wyrazić następująco: przyspieszenie układu spadającego swobodnie w danym polu grawitacyjnym nie zależy od natury układu (w szczególności od jego energii wewnętrznej).
Okazało się, że w ramach zarysowanego programu tego prostego układu rzeczy nie da się przedstawić, a przynajmniej nie w naturalny sposób. To mnie przekonało, że w ramach szczególnej teorii względności nie ma miejsca dla zadowalającej teorii grawitacji.
Przyszło mi wtedy do głowy coś takiego: równoważność masy ciężkiej i bezwładnej, a tym samym niezależność przyspieszenia spadania od natury spadającej substancji, może być wyrażona następująco: w polu grawitacyjnym (o małych rozmiarach przestrzennych) przedmioty zachowują się tak jak w przestrzeni bez grawitacji, jeżeli zamiast „układu inercjalnego” wprowadzi się układ odniesienia względem niego przyspieszony.
Jeżeli zinterpretuje się zachowanie ciała względem układu przyspieszonego jako skutek „rzeczywistego” (a nie tylko pozornego) pola grawitacyjnego, można uważać ten układ za „inercjalny” w takim samym sensie jak układ wyjściowy.
Jeżeli zatem pole grawitacyjne przestrzennie nieograniczone jest fizycznie możliwe, pojecie układu inercjalnego staje się całkowicie puste. Zupełnie traci sens również pojęcie „przyspieszenia względem przestrzeni”, a wraz z nim zasada bezwładności oraz paradoks Macha.
Równoważność masy ciężkiej i bezwładnej prowadzi zatem w naturalny sposób do wniosku, że podstawowy postulat szczególnej teorii względności (niezmienniczość praw względem przekształcenia Lorentza) jest zbyt wąski, czyli że należy wyprowadzić niezmienniczość praw także względem nieliniowych przekształceń w czterowymiarowym kontinuum
Był to rok 1908. Dlaczego konstrukcja szczególnej teorii względności zajęła kolejne siedem lat? Główny powód był taki, że niełatwo jest uwolnić się od przekonania, iż współrzędne muszą mieć bezpośrednie znaczenie metryczne. Zmiana zaszła mniej więcej w następujący sposób.
Zaczynamy od pustej, pozbawionej pola przestrzeni, która w szczególnej teorii względności pojawia się - w odniesieniu do układu inercjalnego - jako najprostsza ze wszystkich wyobrażalnych sytuacji fizycznych, jeśli teraz wyobrazimy sobie układ nieinercjalny wprowadzony przy założeniu, że nowy układ jest jednostajnie przyspieszony względem układu inercjalnego (w notacji trójwymiarowej) w jednym kierunku (dogodnie zdefiniowanym), to w odniesieniu do tego układu istnieje statyczne równoległe pole grawitacyjne. Układ odniesienia może być wybrany jako sztywny układ euklidesowy w trójwymiarowym sensie metrycznym. Jednak czasu, w którym pole to jest statyczne, nie mierzą jednakowo ustawione stacjonarne zegary. Na tym szczególnym przykładzie widać, że współrzędne tracą swoje bezpośrednie znaczenie metryczne, jeżeli dopuści się nieliniowe przekształcenia współrzędnych. A to jest konieczne, jeśli podstawy teorii mają zapewnić równoważność masy ciężkiej i bezwładnej oraz przezwyciężyć paradoks Macha dotyczący układów inercjalnych.
Jeśli musimy zrzec się przypisywania współrzędnym bezpośredniego znaczenia metrycznego (różnice współrzędnych = mierzalne odległości lub czasy), nie unikniemy traktowania jako równoważne wszystkich układów współrzędnych, powstałych przez ciągłe przekształcenia współrzędnych .
Ogólna teoria względności wynika zatem z następującej zasady: prawa naturalne wyróżniają równania kowariantne względem grupy ciągłych przekształceń współrzędnych. Grupa ta zastępuje grupę przekształceń Lorentza szczególnej teorii względności, która tworzy podgrupę tej pierwszej.
Powyższy postulat sam w sobie oczywiście nie wystarcza jako punkt wyjścia do wyprowadzenia podstawowych równań fizyki. W zasadzie można by nawet zakwestionować twierdzenie że postulat sam w sobie istotnie ogranicza prawa fizyki, ponieważ zawsze da się tak sformułować prawo stworzone pierwotnie dla jakichś układów współrzędnych, aby stało się formalnie ogólnie kowariantne. Ponadto z góry widać, że można sformułować nieskończoną liczbę praw polowych, które posiadałyby własność kowariantności. Heurystyczna doniosłość ogólnej zasady względności polega na tym, że prowadzi ona do poszukiwań takich układów równań, które są najprostsze z możliwych w ogólnym sformułowaniu kowariantnym; wśród nich musimy szukać równań pola dla przestrzeni fizycznej. Pola, które mogą być w ten sposób wzajemnie przekształcone, opisują tę samą rzeczywistość.
Podstawowe pytanie brzmi tutaj: jaką naturę matematyczna maja zmienne (funkcje współrzędnych), które pozwalają wyrazić fizyczne własności przestrzeni („strukturę”)? Dopiero potem jakie równania są spełnione przez te zmienne?
Nie możemy dzisiaj odpowiedzieć na te pytania z całkowitą pewnością. Drogę wyznaczoną przez pierwsze sformułowanie ogólnej teorii względności można scharakteryzować następująco: Chociaż nie wiemy, za pomocą jakich zmiennych polowych (struktury) można scharakteryzować przestrzeń fizyczną, znamy dokładnie jeden szczegółowy przypadek: przestrzeń „bezpolową” w szczególnej teorii względności. Owa przestrzeń cechuje się tym, że dla odpowiednio dobranego układu współrzędnych wyrażenie
ds2=dx1 2+dx2 2+dx3 2-dx4 2 (1)
dotyczące dwóch sąsiednich punktów, stanowi mierzalną wielkość (kwadrat odległości), a zatem a realny sens fizyczny. W dym innym układzie wielkość ta jest wyrażona następująco:
ds2=gikdxidxk (2)
gdzie wskaźniki przebiegają od 1 do 4, a gik tworzy tensor symetryczny. Jeżeli po przekształceniu pola (1) pierwsze pochodne gik względem współrzędnych nie znikają, to istnieje pole grawitacyjne względem tego układu współrzędnych w sensie przedstawionym powyżej, aczkolwiek dość szczególnego typu. Dzięki badaniom Riemanna nad n-wymiarowymi przestrzeniami metrycznymi, to szczególne pole można niezmienniczo opisać jak następuje:
(1) Znika tensor krzywizny Riemanna Riklm, zbudowany ze współczynników metryki (2).
(2) Trajektoria punktowej masy względem układu inercjalnego (dla którego (1) jest spełnione) jest linią prostą, a zatem ekstremalną (geodezyjną). To ostatnie stwierdzenie jest już wszakże charakterystyką prawa ruchu opartą a (2).
Uniwersalne prawo dla przestrzeni fizycznej musi być uogólnieniem prawa scharakteryzowanego powyżej. Założyłem teraz, że uzdolnienie to przebiega w dwóch krokach:
czyste pole grawitacyjne
ogólne pole (które zawiera także zmienne w jakiś sposób odpowiadające polu elektromagnetycznemu).
Przypadek (a) cechował się tym, że polem można opisać przez metrykę Riemanna (2), czyli przez tensor symetryczny, przy czym nie istnieje (poza skalą infinitezymalną) reprezentacja typu (1). To oznacza, że w przypadku (a) tensor Riemanna nie znika. Jasne jest zatem, że w tym wypadku musi być spełnione prawo polowe, które uogólnia (osłabia) to prawo. Jeśli to uogólnione prawo ma być równaniem różniczkowym drugiego rzędu i liniowym względem drugich pochodnych, to tylko równanie uzyskane pojedyncze zwężenie
0=Rkl=gimRiklm
wchodzi w rachubę jako pole w przypadku (a). Co więcej, naturalne wydaje się założenie, że także w przypadku (a) linia geodezyjna reprezentuje prawo ruchu punktu materialnego.
Wydawało mi się wtedy, że próby poszukiwania reprezentacji dla całkowitego pola (b) oraz sformułowania praw dla niego są beznadziejne. Wolałem zatem opracować roboczy schemat formalny dla reprezentacji całkowitej rzeczywistości fizycznej; było to potrzebne do zbadania, przynajmniej wstępnie, użyteczności podstawowej idei ogólnej teorii względności. Oto do czego doszedłem.
W teorii Newtona prawo dla pola grawitacji można zapisać jako:
Δ∅=0
(∅ = potencjał grawitacyjny), które jest spełnione wszędzie tam, gdzie znika gęstość materii ρ. W ogólności mamy (równanie Poissona)
Δ∅=4πρ (ρ = gęstość masy).
W relatywistycznej teorii pola grawitacyjnego miejsce Δ∅ zajmuje Rik. Po prawej stronie będziemy musieli zastąpić ρ również przez tensor. Ponieważ ze szczególnej teorii względności wiemy, że (bezwładna) masa jest równoważna energii, będziemy musieli umieścić po prawej stronie tensor gęstości energii - a ściślej, tensor całkowitej gęstości energii, która nie należy do czystego pola grawitacyjnego. W ten sposób otrzymuje się równanie pola
Rik-1/2gikR=-kTik.
Drugi człon po lewej stronie wynika z rozważań formalnych; lewa strona jest bowiem zapisana w takie formie, aby jej dywergencja znikała tożsamościowo, w sensie absolutnego rachunku różniczkowego. Prawa strona jest formalną syntezą wielu rzeczy, których zrozumienie w teorii pola jest wciąż problematyczne. Ani przez moment nie miałem wątpliwości, że to ujęcie było jedynie prowizorką, mającą na celu znalezienie zwartego sformułowania dla ogólnej zasady względności. Była to w zasadzie tylko teoria pola grawitacyjnego, nieco sztucznie wyabstrahowana z całego pola o nieznanej jeszcze strukturze.
Jeśli cokolwiek w tak zarysowanej teorii - z wyjątkiem postulatu niezmienniczości równań względem grupy ciągłych przekształceń współrzędnych - można uznać za definitywne, to z pewnością jest to przypadek czystego pola grawitacyjnego i jego związek z metryczną strukturą przestrzeni. Dlatego w dalszych rozważaniach będziemy rozpatrywać jedynie równania dla czystego pola grawitacyjnego.
Osobliwość tych równań polega z jednej strony na ich osobliwej strukturze, a szczególnie na ich nieliniowości względem zmiennych i ich pochodnych, a z drugiej strony - na niemal zniewalającej konieczności, z jaka to skomplikowane prawo polowe determinuje grupa przekształceń. Gdyby pozostać przy szczególnej teorii względności, czyli przy niezmienniczości względem grupy Lorentza, to równanie Rik=0 byłby niezmiennicze także w ramach tej węższej grupy. Jednak z punktu widzenia węższej grupy nie byłby powodu ujmować grawitacji za pomocą tak skomplikowanej struktury, jak tensor symetryczny gik. Jeśli jednak istniałyby po temu dostateczne podstawy, to wtedy gik daje ogromną liczbę teorii polowych, które wszystkie są niezmiennicze względem przekształcenia Lorentza (ale nie względem grupy ogólnej). Nawet jeżeli spośród wszystkich niezmienniczych (względem grupy Lorentza) praw przypadkiem zgadnie się właśnie to prawo, które należy do grupy ogólnej, nie przyniesie ono równie wyczerpującego zrozumienia, co ogólna zasada względności. Z punktu widzenia grupy Lorentza, dwa rozwiązania byłyby błędnie uważane za fizycznie różne, jeżeli można je wzajemnie w siebie przekształcić za pomocą nieliniowego przekształcenia współrzędnych, podczas gdy z punktu widzenia ogólnej grupy są one jedynie różnymi reprezentacjami tego samego pola.
Jedna uwaga dotycząca struktury i grupy. To oczywiste, że w zasadzie teoria uchodzi za ty doskonalszą, im „prostszą” postuluje strukturę i im szersza jest grupa, względem której równania pola są niezmiennicze. Widać, że te dwa dezyderaty kolidują ze sobą. Na przykład: zgodnie ze szczególna teorią względności (grupa Lorentza) można sformułować kowariantne prawo dla najprostszej wyobrażalnej struktury (pole skalarne), podczas gdy w ogólnej teorii względności (szersza grupa ciągłych przekształceń współrzędnych) niezmiennicze prawo polowe istnieje tylko dla bardziej skomplikowanej struktury tensora symetrycznego. Podaliśmy już powody fizyczne, dla których niezmienniczość względem szerszej grupy musi być w fizyce spełniona (byłoby naiwną niekonsekwencją pozostać z węższą grupą i równocześnie opierać relatywistyczną teorię grawitacji na bardziej skomplikowanej (tensorowej) strukturze. Grzech pozostaje grzechem, nawet jeśli dopuszczają się go ludzie skądinąd czcigodni): z czysto matematycznego punktu widzenia nie widzę potrzeby rezygnowania z prostszej struktury na rzecz ogólności grupy.
Grupa ogólnej teorii względności jest pierwszą, która wymaga, aby najprostsze niezmiennicze prawo nie było liniowe i jednorodne względem zmiennych polowych i ich pochodnych. Jest to niezmiernie ważne z następującego powodu. Jeśli teoria pola jest liniowa (i jednorodna), to suma dwu rozwiązań także jest rozwiązaniem, na przykład w równaniach Maxwella dla próżni. W takiej teorii nie można wyprowadzić z równań pola postaci oddziaływania między strukturami, które oddzielnie stanowią rozwiązania układu. Dlatego wszystkie dotychczasowe teorie wymagały, oprócz równań pola, także specjalnych równań dla ruchu ciał materialnych pod wpływem pól. To prawda, że w relatywistycznej teorii grawitacji prawo ruchu (linia geodezyjna) było początkowo postulowane niezależnie, oprócz równań pola. Później okazało się, że prawo ruchu nie musi (i nie może) zostać przyjęte niezależnie, gdyż jest ono implicite zawarte w równaniach pola grawitacyjnego.
Sens tej bardzo skomplikowanej sytuacji można zobrazować następująco. Pojedynczy punkt materialny w spoczynku będzie reprezentowany przez pole grawitacyjne, które jest wszędzie skończone i regularne, z wyjątkiem położenia, w którym ten punkt się znajduje: tam pole ma osobliwość. Jeśli policzy się pole należące do dwu punktów materialnych w spoczynku, całkując równania pola, to oprócz osobliwości w miejscach położenia obu punktów pole bezie także posiadać linię punktów osobliwych, łączącą te punkty. Można jednak przyjąć, że w wyniku ruchu punktów materialnych wytworzone przez nie pole grawitacyjne nie będzie osobliwe nigdzie, z wyjątkiem samych punktów. To właśnie opisują w przybliżeniu praw Newtona. Można zatem powiedzieć: masy poruszają się w taki sposób, że rozwiązanie równań pola nie jest osobliwe nigdzie z wyjątkiem punktów położenia mas. Ta własność równań grawitacyjnych wiąże się nierozdzielnie z ich nieliniowością, a to z kolei wynika z szerszej grupy przekształceń.
Tu oczywiście można od razu postawić zarzut: jeżeli osobliwości są dozwolone w miejscach położenia punktów materialnych, to co uzasadnia zakaz ich pojawiania się gdzie indziej? Zarzut ten byłby usprawiedliwiony, gdyby równania grawitacji uznać za równania dla całkowitego pola. Należy zatem powiedzieć, że i bliżej cząstki materialnej, tym bliżej jej pole różni się od czystego pola grawitacyjnego. Gdybyśmy znali równania dla całkowitego pola, usielibyśmy postawić wymóg, aby cząsteczki były reprezentowane jako całkowicie wolne od osobliwości rozwiązania zupełnych równań pola. Tylko wtedy ogólna teoria względności byłaby zupełna.
Fizyka jest próbą rzeczywistości jako czegoś, co istnieje niezależnie od naszej świadomości. W tym sensie mówi się o „fizycznej rzeczywistości”. W fizyce przedkwantowej nikt nie miał żadnych wątpliwości, jak należy to rozumieć. W teorii Newtona rzeczywistością był punkt materialny w przestrzeni i czasie, w teorii Maxwella - pole w przestrzeni i czasie. W mechanice kwantowej sytuacja jest mniej przejrzysta. Na pytanie: czy funkcja ψ w teorii kwantowej stanowi realny fakt w tym samym sensie, co układ punktów materialnych albo pole elektromagnetyczne - nie da się bez wahania odpowiedzieć prostym „tak” lub „nie”. Dlaczego? Tym, co daje funkcja ψ (w danym momencie), jest prawdopodobieństwo znalezienia się określonej fizycznej wielkości q (albo p) w określonym przedziale, jeżeli zmierzę ją w chwili t. Prawdopodobieństwo traktuje się tutaj jako empirycznie wyznaczalną, a zatem z całą pewnością „realną” wielkość, którą mogę zmierzyć, jeśli wielokrotnie sporządzę funkcję ψ i za każdym razem wykonam pomiar q. Ale co z pojedynczym pomiarem q? Czy dany indywidualny układ miał tę wartość q także przed wykonaniem pomiaru? Na to pytanie nie ma zdecydowanej odpowiedzi w ramach (istniejącej) teorii, ponieważ proces pomiaru powoduje skończone zaburzenie układu z zewnątrz; jest zatem do pomyślenia, że system otrzymuje określoną, zmierzoną wartość liczbową q (lub p) przez sam proces pomiaru. Na potrzeby dalszych rozważań wyobraźmy sobie dwóch fizyków, A i B, którzy mają różne poglądy na kwestię realności opisu sytuacji fizycznej przez funkcję ψ.
Indywidualny układ posiada (przed pomiarem) określona wartość q (lub p) dla wszystkich zmiennych, a konkretnie te wartość, która została wyznaczona przez pomiar. Na tej podstawie fizyk A powie: Funkcja ψ nie jest zupełnym opisem rzeczywistego stanu układu, a jedynie to, co wiemy o układzie z poprzednich pomiarów.
Indywidualny układ nie posiada (przed pomiarem) określonej wartości q (lub p). Zmierzona wartość powstaje w procesie pomiaru zgodnie z prawdopodobieństwem właściwym dla funkcji ψ. Na tej podstawie fizyk B powie (a przynajmniej może powiedzieć): Funkcja ψ stanowi wyczerpujący opis realnej sytuacji fizycznej.
A teraz przedstawmy obu fizykom następującą sytuację. Niech będzie dany układ, który w momencie t naszej obserwacji składa się z dwu przestrzennie oddzielnych, słabo oddziałujących (w sensie fizyki klasycznej) części S1 i S2. całkowity układ opisuje w kategoriach mechaniki kwantowej znana funkcja ψ, powiedzmy ψ12.. wszyscy teoretycy kwantowi zgodzą się teraz z następującym stwierdzeniem: jeśli wykonamy pełny pomiar S1, to z wyników pomiaru oraz funkcji ψ12 uzyskam całkowicie określoną funkcję ψ2 dla układu S1. Stan ψ2 zależy od rodzaju pomiaru, który wykonałem w układzie S1.
Wydaje mi się więc, że można mówić o realnym stanie podukładu S2. Przed pomiarem S1 wiemy o tym stanie jeszcze mniej niż o układzie opisanym funkcją ψ. Przy jednym
założeni musimy wszakże, moim zdaniem, bezwarunkowo się upierać: rzeczywisty stan układu S2 nie podlega żadnym ingerencjom ze strony układu S1, który jest od niego przestrzennie izolowany. Zależnie od rodzaju pomiaru, jaki wykonam w układzie S1, otrzymam całkiem różne funkcje ψ dla drugiej części układu (ψ2, ψ21 …). Jednakże realny stan układu S2 musi być niezależny od losów układu S1. Dla tego samego układu S2 można zatem znaleźć (zależne od wyboru pomiaru na S1) różne rodzaje funkcji ψ. (Uniknąć tej konkluzji można jedynie albo przyjmując, że pomiar S1 zmienia - telepatycznie - realny stan układu S2, albo przecząc, jakoby przestrzennie rozdzielone układy były opisywane przez niezależne realne stany. Obie alternatywy wydają mi się absolutnie nie do przyjęcia).
Jeżeli fizycy A i B zaakceptują to rozumowanie, to B będzie zmuszony wycofać swe stanowisko, zgodnie z którym funkcja ψ stanowi zupełny opis układu, gdyż w tym wypadku nie byłoby możliwe przypisanie dwu różnych funkcji ψ jednemu stanowi układu S2.
statystyczny charakter teorii byłby zatem tylko konsekwencją niekompletności opisu w mechanice kwantowej, co podważałoby zasadność założenia, że przyszłe podstawy fizyki muszą być oparte na statystyce.
Moim zdaniem, współczesna mechanika kwantowa, oparta na pewnych ugruntowanych pojęciach zapożyczonych z klasycznej mechaniki, stanowi optymalne sformułowanie zależności, które opisują zjawiska kwantowe. Sądzę jednak, że teoria ta nie stanowi użytecznego punktu wyjścia dalszego rozwoju. W tej kwestii moje oczekiwania różnią się od oczekiwań współczesnych fizyków, przekonanych, że istotnych aspektów zjawisk kwantowych (jawnie nieciągłe i nieokreślone czasowo zmiany stanu układu, równocześnie korpuskularny i falowy charakter elementarnych nośników energii) nie da się przedstawić w ramach teorii opisującej rzeczywisty stan obiektów za pomocą ciągłych funkcji przestrzennych, dla których są spełnione równania różniczkowe. Uważają on również, że tą metodą nie da się zrozumieć atomowej struktury materii i promieniowania. Oczekują, że równania różniczkowe, wchodzące w rachubę dla tej teorii, nie dostarczają żadnych rozwiązań, które byłyby regularne (nieosobliwe) w całej przestrzeni czterowymiarowej. Przede wszystkim sądzą jednak, że jawnie ciągły charakter procesów elementarnych może być opisany tylko przez teorię zasadniczo statystyczną, która opisuje nieciągłe zmiany układu przez ciągłe zmiany prawdopodobieństw dopuszczalnych stanów układu.
na wszystkie pozostaję uwagi nie pozostaję obojętny. Nasuwa się jednak zasadnicze pytanie, które można by sformułować następująco: jakie przedsięwzięcia przy obecnym stanie teorii rokują największe nadzieje na sukces? Kierunek moich oczekiwań wyznaczają doświadczenia z teorią grawitacji. Moim zdaniem równania te dają większą szansę na coś dokładnego niż wszystkie inne równania fizyki. Dla porównania weźmy równania Maxwella dla pustej przestrzeni. Ich sformułowanie jest zgodne z danymi doświadczalnymi dla nieskończenie słabego pola elektromagnetycznego. To empiryczne pochodzenie z góry przesądza o liniowości tych równań; jednakże, jak wspomniałem powyżej, prawdziwe prawa nie mogą być liniowe. Prawa liniowe spełniają zasadę superpozycji, zatem nie mogą zawierać twierdzeń o oddziaływaniach cząsteczek elementarnych. Prawdziwe prawa nie mogą być liniowe jak również nie mogą być z liniowych wyprowadzone. Teoria grawitacji nauczyła mnie jeszcze jednej rzeczy: nawet z najbardziej bogatego zbioru faktów empirycznych nie można wyprowadzić tak skomplikowanych równań. Teoria może być empirycznie potwierdzona, ale nie istnieje droga od doświadczenia do konstrukcji teorii. Równania tak skomplikowane jak równania pola grawitacyjnego mogą być sformułowane jedynie poprzez odkrycie logicznie prostej zasady matematycznej, która całkowicie lub prawie całkowicie określa równania. Po uzyskaniu tych warunków formalnych w postaci dostatecznie silnej do skonstruowania teorii wystarczy minimalna znajomość faktów; w przypadku teorii grawitacji jest to czterowymiarowość oraz tensor symetryczny jako wyrażenie dla struktury przestrzeni; warunki te, w połączeniu z niezmienniczością względem grupy ciągłych przekształceń, praktycznie determinują równania.
Naszym zadaniem jest znalezienie równań dla całkowitego pola. Ich struktura musi być uogólnieniem tensora symetrycznego. Grupa nie może być większa niż grupa ciągłych przekształceń współrzędnych. Jeśli wprowadzi się bogatszą strukturę, to grupa nie będzie determinować równań ta silnie, jak to czyni struktura symetrycznego. Najpiękniej byłby, gdyby ponownie udało się rozszerzyć grupę, tak jak przy przejściu od szczególnej do ogólnej teorii względności. Próbowałem między innymi oprzeć się na zespolonych przekształceniach współrzędnych, ale wszystkie te starania zawiodły, podobnie jak jawne lub ukryte zwiększenie liczby wymiarów przestrzeni, pomysł (autorstwa Kaluzy), który w swoim wariancie rzutowym ma zwolenników nawet dzisiaj. Ograniczymy się do przestrzeni czterowymiarowej i do grupy ciągłych rzeczywistych przekształceń współrzędnych. Po wielu latach bezskutecznych poszukiwań za logicznie najbardziej zadowalające uważam rozwiązanie, które przedstawiam poniżej.
W miejsce symetrycznego tensora gik(gik=gki) wprowadza się tensor niesymetryczny gik, zbudowany z części symetrycznej sik oraz rzeczywistej lub czysto urojonej części antysymetrycznej aik, tak że:
Gik=sik+aik.
Z punktu widzenia grupy kombinacja s i a jest całkowicie dowolna, ponieważ tenory s i a oddzielnie zachowują charakter tensorowy. Okazuje się jednak, że niesymetryczny tensor gik (jako całość) odgrywa w konstrukcji nowej teorii rolę analogiczną do symetrycznego tensora gik w teorii czystego pola grawitacyjnego.
Tu uogólnienie struktury przestrzeni wydaje się naturalne także z punktu widzenia naszej wiedzy fizycznej, ponieważ wiemy, że pole elektromagnetyczne wiąże się z tensorem antysymetrycznym.
Dla teorii grawitacji konieczne jest, aby z symetrycznego tensora gik dało się utworzyć skalar
, a także kontrawariantny tensor gik zgodnie z definicją
Gikgik=δk1 (δk1 = tensor Kroneckera).
Związki te można identycznie zdefiniować dla niesymetrycznego tensora gik, łącznie z gęstościami tensorowymi.
W teorii grawitacji koniecznie jest ponadto, aby dla danego symetrycznego pola gik można było zdefiniować pole
, symetryczne w dolnych wskaźnikach, które - z geometrycznego punktu widzenia - rządzi przesunięciem równoległym wektora. Analogicznie - dla niesymetrycznego gik można zdefiniować za pomocą wzoru
(A)
który jest zgodny z odpowiadającą mu relacją symetrycznego g, tylko tutaj należy oczywiście zwrócić uwagę na położenie dolnych wskaźników dla g i Γ.
Zupełnie tak samo, jak w teorii z symetrycznym tensorem gik, można z Γ utworzyć krzywiznę Rklm1, a z niej zwężoną krzywiznę Rkl. W rezultacie, stosując zasadę wariacyjną oraz (A), można znaleźć równania pola:
(
(B1)
(B2)
Rik=0 (C1)
Rkl,m+Rlm,k+Rmk,l=0 (C2)
Jeżeli (A) jest spełnione, to równania (B1) i (B2) wynikają z siebie nawzajem. Rkl oznacza symetryczną, a Rkl oznacza asymetryczną część Rkl.
Jeżeli antysymetryczna część gik znika, to równania te redukują się do (A) i (C1), czyli do przypadku czystego pol grawitacyjnego.
Sądzę, że równania te stanowią najbardziej naturalne uogólnienie równań grawitacji. Udowodnienie ich fizycznej użyteczności jest zadaniem niezwykle trudnym, ponieważ nie wystarczy przybliżenie. Pytanie brzmi: jakie rozwiązanie tych równań jest nieosobliwe w całej przestrzeni?
1