Pochodna i całka w fizyce - spis treści
Pochodna
Całka
Uwagi wstępne
Językiem w jakim fizyka opisuje rzeczywistość jest matematyka. Wiemy dobrze, że związki między wielkościami fizycznymi podawane są w postaci różnego rodzaju równań. Celem niniejszego kursu jest przedstawienie dwóch podstawowych pojęć analizy matematycznej, które mają zasadnicze znaczenie we wszystkich działach fizyki – pochodnej i całki. Ponieważ interesuje nas fizyczny kontekst tych pojęć, nie będziemy koncentrować się na matematycznej precyzji. Zamiast tego spróbujemy zobaczyć, w jaki sposób różniczkowanie i całkowanie pojawia się w naturalny sposób przy opisie otaczającej nas rzeczywistości. Wobec powyższego, nie należy traktować zamieszczonych tutaj materiałów jako równoważnych dla klasycznego wykładu podstaw analizy matematycznej. Jest to raczej forma równoległego uzupełnienia, mająca na celu przybliżenie fizycznego znaczenia pojęć poznawanych na kursie matematyki.
Podstawowym obiektem analizy matematycznej jest funkcja. Zakładamy, że czytelnik zna definicję tego pojęcia. Będziemy używać różnych oznaczeń dla zapisania funkcji, zależnie od tego, który sposób zapisu jest w danym zagadnieniu wygodniejszy. I tak, jeśli dana jest funkcja przekształcająca elementy t należące do zboru T, w elementy x należące do X, to oznaczyć ją możemy np. symbolem f. Możemy także użyć zapisu f(t), jeśli chcemy podkreślić nazwę zmiennej zależnej. (Ściśle rzecz biorąc f(t) jest wartością funkcji f w punkcie t. Niemniej niekiedy stosuje się ten zapis dla określenia funkcji jako takiej). Wreszcie, jeśli chcemy zaznaczyć zarówno nazwę zmiennej zależnej jak i niezależnej, wówczas możemy zastosować oznaczenie x(t). Każdy z tych sposobów zostanie wykorzystany w niniejszym kursie.
Pochodna jako styczna do wykresu
W fizyce współzależność dwóch wielkości opisujemy bardzo często przy użyciu funkcji i ich wykresów. W powyższym przykładzie na osi poziomej odkładamy czas, a na pionowej położenie poruszającego się jabłuszka. Uruchom animację przyciskiem w lewym dolnym rogu rysunku.
Rozważmy dwie wielkości: x oraz t. (Możemy sobie wyobrazić, że t oznacza czas odliczany od jakiejś umownej chwili początkowej, zaś x jest położeniem punktu poruszającego się po „osi liczbowej” tak jak na rysunku obok. Jednak równie dobrze x i t mogą być przypisane do innych wielkości fizycznych). Jeśli z pewnych względów chcemy traktować x jako wielkość zależną od t, wówczas wprowadzamy funkcję x(t). (Oczywiście, żeby była ona poprawnie określona, każdej wartości t musi być przypisana dokładnie jedna wartość x).
Możemy sobie zadać następujące pytanie. O ile zmienia się x jeśli t zmienimy o niewielką wartość Δt rozpoczynając od t0? Oznaczmy tę zmianę wielkości x symbolem Δx. Na wykresie Δt i Δx utworzą trójkąt, którego przeciwprostokątna leży na prostej „niemalże stycznej” do wykresu funkcji (porównaj z rysunkiem poniżej). Z podstawowej trygonometrii wiemy, że tangens nachylenia owej „niemalże stycznej” wynosi Δx/Δt. Stosunek Δx/Δt nazywamy ilorazem różnicowym. W miarę jak zmniejszamy Δt wspomniana styczność staje się coraz dokładniejsza. Graniczna wartość ilorazu różnicowego, gdy Δt dąży do zera, to właśnie pochodna funkcji x(t) w punkcie t0. Oznaczymy ją1 (sposób ten jest szczególnie popularny w fizyce) jako . Z wykresu widzimy natychmiast, że wartość pochodnej w danym punkcie jest równa tangensowi nachylenia stycznej do wykresu w tym punkcie.
Pochodna jako styczna. Przesuwając czerwone punkty zaobserwuj, jak w miarę zmniejszania Δt przerywana prosta coraz dokładniej pokrywa się z prostą styczną do wykresu w punkcie t0, a iloraz różnicowy przechodzi w pochodną.
1Symbole dt i dx mają tutaj oznaczać nieskończenie małą (czasem mówimy – infinitezymalną) zmianę t oraz odpowiadającą jej nieskończenie małą zmianę x. Należy sobie zdawać sprawę, że traktowanie owych infinitezymalnych „liczb” dx i dt tak jak wszystkich innych liczb rzeczywistych prowadzi do rozmaitych problemów matematycznych. Z tego powodu matematycy wolą oznaczać pochodne symbolami w rodzaju x'(t0). Nasze oznaczenie ma tę zaletę, że od razu przypomina nam z jakiego granicznego ilorazu wzięła się dana pochodna.
Funkcja pochodna, pochodne wyższych rzędów
Przesuwając czerwony punkt można obserwować zmiany wartości funkcji f(x) i jej pochodnej. Wzór określający f(x) można zmieniać.
Obliczając pochodną danej funkcji x(t) we wszystkich możliwych punktach możemy utworzyć nową funkcję, przypisującą każdemu punktowi t wartość pochodnej w tym punkcie. Funkcję tę nazywamy funkcją pochodną i oznaczamy symbolem . (Jeśli chcemy wskazać, że interesuje nas wartość pochodnej w konkretnym punkcie t0, wówczas możemy zastosować zapis
). Mając funkcję pochodną możemy również dla niej obliczyć funkcję pochodną. Będzie to pochodna drugiego rzędu, którą oznaczymy jako
(zwróć uwagę na położenie symbolu 2 w liczniku i mianowniku). Analogicznie tworzymy pochodne jeszcze wyższych rzędów, oznaczane jako
.
Znając wzór określający funkcję x(t), możemy wyznaczyć wzór na funkcję pochodną, korzystając z kilku stosunkowo prostych zasad. Wyłożenie i opanowanie tych zasad pozostawimy dla stosownego kursu matematyki. (Należy jednak wyraźnie podkreślić, że sprawne obliczanie pochodnych jest czymś, co każdy student studiów inżynierskich powinien opanować).
Pochodna jako prędkość
Położenie poruszającego się jabłuszka jest opisane funkcją x(t). Strzałka zaczepiona w środku jabłuszka oznacza jego chwilowy wektor prędkości. Ten sam wektor, poruszając się z upływem czasu po osi t, zakreśla funkcję pochodną oznaczoną kolorem zielonym. Uruchom animację przyciskiem w lewym dolnym rogu.
Zastanówmy się teraz nad bardziej „fizyczną” interpretacją pochodnej. W dotychczasowych rozważaniach stwierdziliśmy, że wybrane przez nas zmienne x oraz t możemy sobie wyobrażać jako położenie oraz czas. Iloraz różnicowy Δx/Δt jest wówczas stosunkiem przesunięcia jakiego doświadcza ciało, do czasu w którym owo przesunięcie nastąpiło. Z elementarnego kursu kursu kinematyki wiemy, że „przesunięcie przez czas” to nic innego jak średnia prędkość ciała w przedziale czasu od t0 do t0+Δt. W miarę jak zmniejszamy Δt, iloraz różnicowy opisuje średnią prędkość odpowiadającą coraz krótszemu odstępowi czasu. W sytuacji granicznej Δt→0 iloraz różnicowy przechodzi w pochodną, która odpowiada prędkości chwilowej dla t0.
Zwróćmy uwagę, na naturalny związek między dwiema interpretacjami pochodnej, które poznaliśmy. Duża wartość pochodnej, to duże nachylenie stycznej do wykresu, a co za tym idzie gwałtowne zmiany wartości funkcji. Jeśli funkcją jest zależność położenia od czasu, to oczywiście gwałtowne zmiany położenia są powiązane z dużą prędkością. Odwrotnie, jeśli mała pochodna oznacza małą prędkość, wówczas położenie słabo zmienia się z czasem, a zatem wykres x(t) będzie nachylony do osi czasu pod niewielkim kątem.
W fizyce dość często możemy spotkać się z sytuacjami, w których interesuje nas zależność jakiejś wielkości, niekoniecznie położenia, od czasu. Powiedzmy, że jest ona opisana funkcją Y(t). Przez analogię do powyższego przypadku prędkości kinematycznej, funkcję pochodną dY/dt nazywamy „prędkością zmiany Y”. Jeśli, na przykład, znamy funkcję T(t) określającą zależność temperatury pewnego ciała od czasu, to wartość pochodnej tej funkcji określa nam, z jaką prędkością zmienia się temperatura. I znowu – duża wartość pochodnej dT/dt informuje nas o gwałtownych zmianach temperatury, zaś wartości dT/dt bliskie zeru sygnalizują, że temperatura pozostaje niemalże stała.
Informacje jakie możemy uzyskać dzięki funkcji pochodnej
Przesuwając położenie czerwonego punktu stwierdź następujące fakty.
Znikanie pochodnej w punkcie t=0.5 odpowiada mnimum funkcji x(t).
Znikanie pochodnej w punkcie t=1.5 nie jest powiązane z ekstremum funkcji x(t).
Funkcja jest stała w przedziale (-1;0.5) czemu odpowiada zerowanie się pochodnej w tym przedziale.
Znak pochodnej określa, czy funkcja jest rosnąca, czy też malejąca.
Włącz animację przyciskiem w lewym dolnym rogu i zaobserwuj jak stwierdzone wyżej własności przekładają się na ruch jabłuszka. Odnieś to do opisanej w tekście fizycznej interpretacji pochodnej jako prędkości.
Podsumujemy teraz informacje które możemy „wyciągnąć” z funkcji pochodnej. Podane niżej reguły są zazwyczaj zapisywane jako precyzyjne twierdzenia, my pozostaniemy przy mniej formalnym sposobie opisu. Ustalmy pewną funkcję x(t).
Jeśli funkcja ma w punkcie t0 minimum lub maksimum to =0.
Odwrotnie być może, ale nie musi: pochodna funkcji może w pewnym miejscu przyjąć wartość 0, podczas gdy funkcja nie ma tym miejscu ekstremum.
Jeśli pochodna jest równa 0 dla wszystkich punktów z pewnego przedziału (t1;t2), to funkcja w tym przedziale jest stała.
Dodatnia wartość pochodnej oznacza, że funkcja w okolicach danego punktu rośnie.
Ujemna wartość pochodnej informuje, że funkcja w pobliżu danego punktu maleje.
Przypuśćmy, że funkcja x(t) opisuje zależność położenia ciała od czasu. Jaka jest fizyczna interpretacja powyższych stwierdzeń?
W chwili, w której ciało osiąga lokalnie maksymalne (lub minimalne) położenie, jego prędkość jest równa 0.
Z faktu, że ciało w danej chwili spoczywa, nie wynika, że punkt w którym się znajduje jest ekstremum jego położenia.
Jeśli prędkość jest równa 0 w przedziale czasu od (t1;t2), to ciało w tym przedziale czasu nie zmienia swego położenia.
Dodatnia wartość prędkości oznacza, że ciało porusza się zgodnie z wybranym kierunkiem osi x.
ujemna wartość prędkości oznacza, że ciało porusza się przeciwnie do wybranego kierunku osi x.
Równania zawierające pochodne
Przekonaliśmy się już, że pochodne mogą być pomocne do analizy przebiegów zmienności funkcji opisujących zjawiska fizyczne. Zastanowimy się teraz, dlaczego pochodne w naturalny sposób pojawiają się w rozmaitych równaniach fizycznych. Dzieje się tak, ponieważ przy rozważaniu niewielkich przyrostów wielkości fizycznych, relacje między owymi przyrostami bardzo często można sprowadzić do zależności linowych.
Rozważmy dwie wielkości: y oraz x. Ustalamy, że x będzie zmienną niezależną, natomiast y – zależną. Chcemy stwierdzić jaką postać ma funkcja y(x). W tym celu analizujemy w jaki sposób niewielka zmiana Δx powoduje zmianę Δy. Zapiszmy zależność między między Δx oraz Δy w postaci
gdzie konkretną postać współczynników a wyprowadzamy z podstawowych zasad fizycznych, albo po prostu w sensowny sposób postulujemy. Podkreślmy, że współczynniki a mogą zależeć zarówno od x, jak i od odpowiadającej mu wartości y. Podzielmy powyższą równość stronami przez Δx. Dostajemy
Spróbujmy teraz przejść do granicy Δx→0. Jest to możliwe tylko wtedy, gdy a0 jest równe 0, bowiem w przeciwnym wypadku wyrażenie a0/Δx produkowałoby nieskończoną wartość granicy. A zatem dla a0=0, przy przejściu granicznym po lewej stronie pojawi się pochodna funkcji y(x), a po prawej „przeżyje” wyłącznie wyraz a1, gdyż (Δx)k→0, dla k=1,2,...,n-1. Wobec tego otrzymujemy zależność
Jest to równanie, w którym niewiadomą jest funkcja y(x), pojawiająca się zarówno bezpośrednio (strona prawa), jak i poprzez swoją funkcję pochodną (strona lewa). Równania tego typu nazywamy równaniami różniczkowymi. Ich rozwiązywanie bywa niekiedy zadaniem trudnym, a szukaniem odpowiednich metod postępowania zajmuje się osobna gałąź matematyki.
Przedstawiona powyżej konstrukcja opisuje najprostszy model rozumowania, które prowadzi do fizycznych równań zawierających pochodne. Mimo to, może się ona wydawać nieco abstrakcyjna. Zobaczmy „jak to działa” na konkretnym przykładzie.
Przykład 1 - pochłaniane światła w częściowo przeźroczystym ośrodku
Pochłanianie światła w częściowo przeźroczystym ośrodku. Objaśnienia w tekście obok.
Rozważmy grubą płytę z częściowo przeźroczystego materiału. Z jednej strony pada na nią światło o natężeniu I0. Interesuje nas w jaki sposób zmienia się natężenie światła wewnątrz płyty, albo (co na jedno wychodzi) jak zależy natężenie światła opuszczającego płytę od grubości płyty. Wprowadźmy oś x prostopadle do powierzchni płyty. Szukamy funkcji I(x) opisującej natężenie światła w zależności od odległości. Wyodrębnijmy w płycie cienką warstwę o grubości Δx. Postulujemy, że zmiana natężenia światła po przejściu przez cienką warstwę jest proporcjonalna zarówno do grubości tej warstwy, jak i do natężenia światła wchodzącego do warstwy (postulat ten można uzasadnić fizycznie). W postaci matematycznej zależność taką zapiszemy jako
gdzie μ oznacza współczynnik proporcjonalności, a znak minus zapewnia, że natężenie światła spada po przejściu przez warstwę. Po podzieleniu stronami przez Δx i przejściu do granicy Δx→0 otrzymujemy równanie różniczkowe na funkcję I(x)
Jeśli μ nie zależy od x wówczas można je łatwo rozwiązać. Poszukiwana funkcja ma postać
Stanowi ona rozwiązanie naszego problemu. Co więcej okazuje się, że dane eksperymentalne w dobry sposób zgadzają się z powyższym wzorem.
Informacje jakie możemy uzyskać dzięki funkcji pochodnej
Przesuwając położenie czerwonego punktu stwierdź następujące fakty.
Znikanie pochodnej w punkcie t=0.5 odpowiada mnimum funkcji x(t).
Znikanie pochodnej w punkcie t=1.5 nie jest powiązane z ekstremum funkcji x(t).
Funkcja jest stała w przedziale (-1;0.5) czemu odpowiada zerowanie się pochodnej w tym przedziale.
Znak pochodnej określa, czy funkcja jest rosnąca, czy też malejąca.
Włącz animację przyciskiem w lewym dolnym rogu i zaobserwuj jak stwierdzone wyżej własności przekładają się na ruch jabłuszka. Odnieś to do opisanej w tekście fizycznej interpretacji pochodnej jako prędkości.
Podsumujemy teraz informacje które możemy „wyciągnąć” z funkcji pochodnej. Podane niżej reguły są zazwyczaj zapisywane jako precyzyjne twierdzenia, my pozostaniemy przy mniej formalnym sposobie opisu. Ustalmy pewną funkcję x(t).
Jeśli funkcja ma w punkcie t0 minimum lub maksimum to =0.
Odwrotnie być może, ale nie musi: pochodna funkcji może w pewnym miejscu przyjąć wartość 0, podczas gdy funkcja nie ma tym miejscu ekstremum.
Jeśli pochodna jest równa 0 dla wszystkich punktów z pewnego przedziału (t1;t2), to funkcja w tym przedziale jest stała.
Dodatnia wartość pochodnej oznacza, że funkcja w okolicach danego punktu rośnie.
Ujemna wartość pochodnej informuje, że funkcja w pobliżu danego punktu maleje.
Przypuśćmy, że funkcja x(t) opisuje zależność położenia ciała od czasu. Jaka jest fizyczna interpretacja powyższych stwierdzeń?
W chwili, w której ciało osiąga lokalnie maksymalne (lub minimalne) położenie, jego prędkość jest równa 0.
Z faktu, że ciało w danej chwili spoczywa, nie wynika, że punkt w którym się znajduje jest ekstremum jego położenia.
Jeśli prędkość jest równa 0 w przedziale czasu od (t1;t2), to ciało w tym przedziale czasu nie zmienia swego położenia.
Dodatnia wartość prędkości oznacza, że ciało porusza się zgodnie z wybranym kierunkiem osi x.
ujemna wartość prędkości oznacza, że ciało porusza się przeciwnie do wybranego kierunku osi x.
Równania zawierające pochodne
Przekonaliśmy się już, że pochodne mogą być pomocne do analizy przebiegów zmienności funkcji opisujących zjawiska fizyczne. Zastanowimy się teraz, dlaczego pochodne w naturalny sposób pojawiają się w rozmaitych równaniach fizycznych. Dzieje się tak, ponieważ przy rozważaniu niewielkich przyrostów wielkości fizycznych, relacje między owymi przyrostami bardzo często można sprowadzić do zależności linowych.
Rozważmy dwie wielkości: y oraz x. Ustalamy, że x będzie zmienną niezależną, natomiast y – zależną. Chcemy stwierdzić jaką postać ma funkcja y(x). W tym celu analizujemy w jaki sposób niewielka zmiana Δx powoduje zmianę Δy. Zapiszmy zależność między między Δx oraz Δy w postaci
gdzie konkretną postać współczynników a wyprowadzamy z podstawowych zasad fizycznych, albo po prostu w sensowny sposób postulujemy. Podkreślmy, że współczynniki a mogą zależeć zarówno od x, jak i od odpowiadającej mu wartości y. Podzielmy powyższą równość stronami przez Δx. Dostajemy
Spróbujmy teraz przejść do granicy Δx→0. Jest to możliwe tylko wtedy, gdy a0 jest równe 0, bowiem w przeciwnym wypadku wyrażenie a0/Δx produkowałoby nieskończoną wartość granicy. A zatem dla a0=0, przy przejściu granicznym po lewej stronie pojawi się pochodna funkcji y(x), a po prawej „przeżyje” wyłącznie wyraz a1, gdyż (Δx)k→0, dla k=1,2,...,n-1. Wobec tego otrzymujemy zależność
Jest to równanie, w którym niewiadomą jest funkcja y(x), pojawiająca się zarówno bezpośrednio (strona prawa), jak i poprzez swoją funkcję pochodną (strona lewa). Równania tego typu nazywamy równaniami różniczkowymi. Ich rozwiązywanie bywa niekiedy zadaniem trudnym, a szukaniem odpowiednich metod postępowania zajmuje się osobna gałąź matematyki.
Przedstawiona powyżej konstrukcja opisuje najprostszy model rozumowania, które prowadzi do fizycznych równań zawierających pochodne. Mimo to, może się ona wydawać nieco abstrakcyjna. Zobaczmy „jak to działa” na konkretnym przykładzie.
Przykład 1 - pochłaniane światła w częściowo przeźroczystym ośrodku
Pochłanianie światła w częściowo przeźroczystym ośrodku. Objaśnienia w tekście obok.
Rozważmy grubą płytę z częściowo przeźroczystego materiału. Z jednej strony pada na nią światło o natężeniu I0. Interesuje nas w jaki sposób zmienia się natężenie światła wewnątrz płyty, albo (co na jedno wychodzi) jak zależy natężenie światła opuszczającego płytę od grubości płyty. Wprowadźmy oś x prostopadle do powierzchni płyty. Szukamy funkcji I(x) opisującej natężenie światła w zależności od odległości. Wyodrębnijmy w płycie cienką warstwę o grubości Δx. Postulujemy, że zmiana natężenia światła po przejściu przez cienką warstwę jest proporcjonalna zarówno do grubości tej warstwy, jak i do natężenia światła wchodzącego do warstwy (postulat ten można uzasadnić fizycznie). W postaci matematycznej zależność taką zapiszemy jako
gdzie μ oznacza współczynnik proporcjonalności, a znak minus zapewnia, że natężenie światła spada po przejściu przez warstwę. Po podzieleniu stronami przez Δx i przejściu do granicy Δx→0 otrzymujemy równanie różniczkowe na funkcję I(x)
Jeśli μ nie zależy od x wówczas można je łatwo rozwiązać. Poszukiwana funkcja ma postać
Stanowi ona rozwiązanie naszego problemu. Co więcej okazuje się, że dane eksperymentalne w dobry sposób zgadzają się z powyższym wzorem.
Całka oznaczona a pole powierzchni pod wykresem
Zmieniając ilość części na które dzielony jest przedział [a,b], zaobserwuj jak suma pól powierzchni prostokątów coraz dokładniej przybliża pole powierzchni pod wykresem. Krawędzie przedziału [a,b] można przesuwać.
Dowiedzieliśmy się już, dlaczego pochodne odgrywają istotną rolę w fizyce. Czas zapoznać się z następnym matematycznym narzędziem fizyki – całką.
Zacznijmy od postawienia następującego problemu. Powiedzmy, że mamy pewną funkcję f, przyjmującą wartości dodatnie. Interesuje nas pole powierzchni obszaru ograniczonego wykresem funkcji, osią x oraz pionowymi prostymi x=a i x=b, tak jak na rysunku obok. Poza kilkoma specjalnymi przypadkami (np. funkcji linowej), powyższe zadanie wydaje się być dość trudne. Możemy podjąć próbę oszacowania interesującego nas pola w sposób zgrubny. Podzielmy przedział [a,b] na n części poprzez wprowadzenie punktów x1, … xn+1 w ten sposób, że
x1=a≤x1≤…≤xn≤xn+1=b
Szerokości poszczególnych fragmentów oznaczmy jako Δx1=x2-x1, … Δxn=xn+1-xn. Oprzyjmy teraz na każdym fragmencie Δxi prostokąt o wysokości f(xi). Widzimy, że suma pól powierzchni prostokątów przybliża poszukiwane pole powierzchni pod wykresem. Zapiszmy ową sumę jako
W miarę jak zwiększamy liczbę części, na które dzielimy przedział [a,b], Sn coraz lepiej oddaje wielkość, którą chcemy wyznaczyć (o ile podział na części jest coraz „drobniejszy” tzn. maksymalna długość części dąży do zera). Graniczną wartość Sn, dla n→∞, nazywamy całką oznaczoną z funkcji f(x). Liczba a nosi nazwę dolnej, zaś b - górnej granicy całkowania. (Żąda się ponadto, aby wartość całki nie zależała od sposobu, w jaki dzielimy przedział [a,b]. Dla funkcji ciągłych nie musimy się tym problemem przejmować). Całkę oznaczoną zapisujemy przy użyciu symbolu
Założyliśmy powyżej, że rozważana funkcja przyjmuje wartości dodatnie. Jeśli to założenie nie jest spełnione, wówczas całka oznaczona jest zdefiniowana w dokładnie ten sam sposób - jako granica sum Sn, przy n→∞. Należy sobie zdawać sprawę, że w takim przypadku interpretacja całki przy użyciu pola powierzchni nie jest bezpośrednia. Dzieje się tak, ponieważ fragmenty wykresu funkcji leżące pod osią x, dają ujemny wkład do wartości całki. Przyjmujemy ponadto konwencję, w myśl której zamiana granic całkowania (górnej z dolną) powoduje odwrócenie znaku całki. Sytuację tę można przeanalizować na zamieszonym poniżej przykładzie.
Przesuwając punkty a oraz b zaobserwuj ujemne wartości całki dla fragmentów wykresu funkcji leżących pod osią x. Ustawiając punkt b po lewej stronie a (tzn. zadając b mniejsze od a) przetestuj konwencję dotyczącą zamiany granic całkowania.
Całkowanie jako operacja odwrotna do różniczkowania
Wartość funkcji f w punkcie x' jest zdefiniowana jako całka oznaczona z funkcji g w granicach od x0 do x'. Przesuwając punkt x' możemy obserwować zależność f(x'). Funkcja f jest również przykładem całki nieoznaczonej z funkcji g. Zmieniając punkt x0 , od którego rozpoczynamy całkowanie, przesuwamy wykres funkcji f w kierunku osi OY. Sytuacja ta ilustruje określenie całki nieoznaczonej wyłącznie z dokładnością do stałej.
Aby przekonać się jaki jest związek między pochodną a całką, zastanówmy się ile wynosi całka oznaczona z funkcji pochodnej
Korzystając z definicji całki oznaczonej możemy przybliżyć powyższe wyrażenie sumą
gdzie Δx1 … Δxn są szerokościami przedziałów wyznaczanych przez punkty x1, x2 … xn, x'. Z drugiej strony, z definicji pochodnej, wartości …
możemy przybliżyć jako odpowiednie ilorazy różnicowe Δf1/Δx1 … Δfn/Δxn, gdzie Δfk oznacza zmianę wartości funkcji w przedziale o szerokości Δxk (tzn. Δf1=f(x2)-f(x1), Δf2=f(x3)-f(x2) … Δfn=f(x')-f(xn)). Po podstawieniu do wzoru otrzymujemy
Zauważmy, że otrzymane przez nas wyrażenie nie zależy od sposobu w jaki dzielimy przedział [x1,x'] i powyższy wynik pozostaje w mocy przy przejściu granicznym n→∞. Wnioskujemy zatem, że
W ten sposób stwierdzamy, że całkowanie jest operacją odwrotną do różniczkowania, gdyż funkcja zadana wzorem jest, z dokładnością do stałej równej f(x1), tożsama z funkcją f. Znaleźliśmy przy okazji sposób, w jaki można obliczać całki z dowolnej funkcji g - należy odnaleźć funkcję f, której pochodna jest równa g, a następnie wykorzystać wyprowadzony powyżej wzór. Takie rozumowanie prowadzi nas do pojęcia całki nieoznaczonej z funkcji g. Oznaczamy ją jako
i definiujemy jako funkcję f (noszącą nazwę funkcji pierwotnej), taką, że . Całka nieoznaczona nie jest określona jednoznacznie, a jedynie z dokładnością do stałej. Faktycznie, dodając do f dowolną liczbę c obserwujemy, że
. Wprowadzając oznaczenie
możemy zapisać związek między całką oznaczoną a nieoznaczoną
W praktyce obliczanie całek, tzn. odnajdywanie funkcji pierwotnej, bywa czasami trudne. Co gorsza, w przeciwieństwie do różniczkowania, nie istnieje jeden uniwersalny algorytm pozwalający obliczyć całkę z dowolnego wyrażenia zbudowanego z funkcji elementarnych. Omówienie różnych metod całkowania pozostawiamy stosownemu wykładowi z matematyki. Warto wiedzieć, że w internecie dostępne są bezpłatne narzędzia pozwalające obliczać nawet bardzo skomplikowane całki. Jednym z nich jest strona integrals.wolfram.com.
Całka jako narzędzie do „sumowania”
Jedno z najpowszechniejszych zastosowań całki oznaczonej w fizyce polega na wykorzystaniu jej jako narzędzia, które realizuje ideę „sumowania nieskończenie wielu, nieskończenie małych kawałków". Ogólny schemat takiego rozumowania można przedstawić następująco.
Obserwujemy, że pewną wielkość A można oszacować jako sumę dużej ilości niewielkich składników A≈ΔA1+ … +ΔAn, przy czym dla każdego z nich da się zapisać przybliżoną zależność w postaci
gdzie f oznacza funkcję określoną dla zmiennej x należącej do pewnego przedziału [a,b]. Wartości tej funkcji obliczamy w punktach xk, dzielących przedział [a,b] na fragmenty o szerokości Δxk. O powyższej zależności wiemy, że jest tym dokładniejsza, im mniejsze przyrosty ΔA i Δx rozważamy. Bardzo często myśl tę wyraża się stosując (nieformalny z matematycznego punktu widzenia) zapis z użyciem wielkości infinitezymalnych
Biorąc coraz większą ilość, coraz mniejszych przyrostów ΔA, przechodzimy do przypadku granicznego
Jednak z definicji całki oznaczonej wiemy, że powyższa granica to po prostu
Oznacza to, że wyznaczanie A sprowadziliśmy do obliczenia odpowiedniej całki.
Powyższy opis stanie się zapewne nieco bardziej zrozumiały gdy zastosujemy go do konkretnych przykładów.
Przykład 1 - Praca w sprężaniu izotermicznym i adiabatycznym
Sprężanie gazu od objętości V1 do V'.
W szczelnym naczyniu wyposażonym w tłok znajduje się gaz. W stanie początkowym zajmuje objętość V1 i znajduje się pod ciśnieniem p1. Następnie, przesuwając tłok, sprężamy go do objętości V'. Interesuje nas obliczenie pracy, którą trzeba w tym procesie wykonać nad gazem. Możemy ją wyznaczyć w następujący sposób.
Z elementarnego kursu mechaniki wiemy, że siła F przesuwając ciało zgodnie ze swoim kierunkiem i zwrotem na niewielką odległość Δx wykonuje pracę ΔW=FΔx. Aby nieco sprężyć gaz przesuwając tłok o Δx, musimy działać siłą równoważącą siłę parcia gazu, której wartość wynosi pS, gdzie S jest polem powierzchni tłoku, a p ciśnieniem gazu w naczyniu. A zatem przesuwając tłok o Δx wykonujemy pracę ΔW=pSΔx. Z drugiej strony SΔx = -ΔV (w naszym procesie dodatnim przyrostom Δx odpowiada zmniejszanie objętości, co tłumaczy obecność znaku minus). Ostatecznie ΔW = -pΔV. Powyższa zależność ma charakter przybliżony, gdyż nie uwzględnia zmian ciśnienia podczas przesuwania tłoka o Δx i jest tym dokładniejsza im mniejsze ΔV uwzględniamy. W postaci infinitezymalnej możemy ją zapisać jako dW=-pdV. Całkowitą pracę wykonaną przy przesuwaniu tłoka obliczymy jako sumę prac pochodzących od niewielkich przesunięć Δxi
Zależność tę czynimy coraz dokładniejszą poprzez dzielenie procesu na coraz większą ilość, coraz mniejszych przesunięć Δx. W granicy otrzymujemy całkę
Postać funkcji p(V) zależy od rodzaju gazu i sposobu w jaki przeprowadzamy sprężanie. Omówimy dwa szczególne przypadki.
Jeśli ścianki naczynia wykonane są z materiału dobrze przewodzącego ciepło, a sprężanie odbywa się bardzo powoli, wówczas możemy uważać, że gaz w naczyniu pozostaje w równowadze termicznej z otoczeniem. Innymi słowy, nasz proces jest izotermiczny (przebiega w stałej temperaturze T). Dla gazu doskonałego zależność p(V) wynikać będzie z równania stanu p1V1/T=pV/T i dana będzie wzorem
Wstawiając tę funkcję pod całkę otrzymujemy
Załóżmy dla odmiany, że ścianki naczynia dobrze izolują je pod względem termicznym od otoczenia, zaś samo sprężanie przebiega szybko. W takiej sytuacji proces sprężania przebiega bez wymiany ciepła z otoczeniem, czyli jest adiabatyczny. Dla gazu doskonałego, w przemianach tego rodzaju zachodzi związek , gdzie κ jest różną od jedności stałą, zależną od budowy cząsteczek gazu. Ze związku tego otrzymujemy wzór na p(V).
Obliczając całkę z powyższej funkcji dostajemy
Przykład 2 - Uśrednianie po czasie
Powiedzmy, że dana jest funkcja f(t), gdzie t oznacza czas odmierzany od pewnej chwili t=0. Zastanówmy się w jaki sposób możemy rozsądnie zdefiniować wartość średnią funkcji w przedziale [t1,t'], którego szerokość oznaczymy jako T=t'-t1. Wprowadzając punkty t1<t2< … <tn<t' podzielmy nasz przedział na fragmenty o szerokościach Δt1, … Δtn na tyle małych, że funkcja praktycznie nie zmienia swojej wartości wewnątrz każdego z nich. Przybliżymy teraz szukaną wartość średnią poprzez średnią ważoną wartości funkcji w punktach t1, … tn, z wagami zadanymi poprzez szerokości Δt1, … Δtn.
Nasze przybliżenie jest tym sensowniejsze, im drobniej dzielimy przedział [t1,t'], gdyż uwzględniamy wówczas wartości funkcji w coraz większej liczbie punktów. Przechodząc do granicy n→∞ otrzymujemy satysfakcjonującą definicję średniej.
Zastosujmy ją do szczególnego przypadku funkcji v(t) opisującej zależność prędkości od czasu dla ciała poruszającego się wzdłuż osi x. Wiemy dobrze, że v(t)=dx/dt. Z drugiej strony znamy już związek między całkowaniem i różniczkowaniem. Wykorzystując tę wiedzę możemy obliczyć średnią wartość prędkości jako
Otrzymany rezultat jest całkowicie zgodny ze „zwykłą" definicją prędkości średniej, określającą ją jako stosunek przesunięcia jakiego doznaje ciało do czasu, w którym owo przesunięcie nastąpiło.
Całki w przestrzeni trójwymiarowej
Omówiliśmy do tej pory definicję całki funkcji rzeczywistej określonej na przedziale [a,b]. Poznaliśmy związek całkowania z różniczkowaniem i przekonaliśmy się w jaki sposób stanowi ono realizację idei „sumowania nieskończenie wielu, nieskończenie małych kawałków”. Przejdziemy teraz do przedstawienia trzech typów całek w przestrzeni trójwymiarowej - określonych na krzywej, powierzchni i w pewnej objętości. Pojęcia te mają zasadnicze znaczenie w fizyce właśnie z tego względu, że pozwalają realizować koncepcję sumowania wielkości infinitezymalnych. Skoncentrujemy się na przedstawieniu kluczowych idei, natomiast sformułowanie ścisłych twierdzeń i definicji pozostawimy odpowiedniemu wykładowi analizy matematycznej. Następnie przejdziemy do przykładów, w których przekonamy się o fizycznej użyteczności wprowadzonych pojęć. Zobaczymy także, w jaki sposób wyznaczanie wartości nowych rodzajów całek można sprowadzić do obliczania całek na przedziałach.
Całka krzywoliniowa
Powiedzmy, że dana jest pewna „przyzwoita1” krzywa K i określona wzdłuż niej ciągła funkcja f. (Oczywiście, nic nie szkodzi jeśli funkcja f jest określona także poza krzywą, np. w całej przestrzeni). Całkę z funkcji f po krzywej K wprowadzamy następująco. Dzielimy krzywą K na niewielkie fragmenty o długości Δlk. Mnożymy długość Δlk przez wartość funkcji fk odpowiadającą danemu fragmentowi i sumujemy wszystkie iloczyny.
Czyniąc podział coraz drobniejszym przechodzimy do granicy, dla której wartość powyższej sumy przechodzi w całkę. Możemy owo przejście zapisać symbolicznie jako
Wyrażenie dl należy rozumieć jako długość infinitezymalnego fragmentu krzywej K. Nazywa się je czasami elementem długości. Jeśli krzywa K jest zamknięta, wówczas można ten fakt podkreślić stosując zapis
Wspomnijmy jeszcze, że powyższy opis dotyczy przypadku określanego jako całka krzywoliniowa nieskierowana lub pierwszego rodzaju. Całek skierowanych (drugiego rodzaju) nie będziemy omawiać.
Całka powierzchniowa
Przypadek całkowania po powierzchniach jest pod wieloma względami analogiczny. Niech dana będzie „przyzwoita2” powierzchnia P i określona na niej ciągła funkcja f. Powierzchnię P szatkujemy na niewielkie fragmenty ΔSk, w obrębie których nasza funkcja pozostaje niemalże stała i przyjmuje wartość fk. Tworzymy sumę
Przechodzimy do granicy, biorąc coraz drobniejsze3 podziały i otrzymujemy w ten sposób całkę z funkcji f po powierzchni P. Zapisujemy ją jako
Można także spotkać oznaczenie z pojedynczym znakiem całki
Symbol dS oznacza element powierzchni i należy go rozumieć jako pole infinitezymalnego fragmentu powierzchni P. Również i w tym przypadku stosuje się zapis
lub po prostu
dla powierzchni zamkniętych. Tak określona całka bywa nazywana całką powierzchniową niezorientowaną lub pierwszego rodzaju. Także i tym razem pomijamy przypadek całki zorientowanej (drugiego rodzaju).
Całka objętościowa
Znając określenia całek krzywoliniowych i powierzchniowych łatwo się domyślić w jaki sposób tworzymy całki objętościowe. Dla zadanego obszaru4 O i określonej na nim funkcji f postępujemy bardzo podobnie jak w powyższych przypadkach. Obszar O dzielimy na małe fragmenty o objętościach ΔVk. Danemu fragmentowi odpowiada wartość funkcji fk. Tworzymy sumę
i biorąc coraz drobniejsze podziały, przechodzimy do granicy5, która definiuje całkę
Także i w tym przypadku niektórzy stosują zapis z pojedynczym znakiem całki. Wyrażenie dV interpretujemy jako objętość infinitezymalnego fragmentu obszaru O i nazywamy elementem objętości.
Obliczanie powyższych typów całek sprowadza się najczęściej do podania parametryzacji krzywej, powierzchni lub obszaru, umieszczeniu jej w wyrażeniu podcałkowym i zbadaniu w jaki sposób infinitezymalne zmiany parametrów generują element długości, powierzchni lub objętości. Otrzymuje się wówczas jedną, dwie lub trzy całki „zwykłe”, które można obliczyć przez wyznaczanie funkcji pierwotnej. Zademonstrujemy tę procedurę na kilku prostych przykładach, ilustrujących jednocześnie fizyczne zastosowania całek.
1Przez krzywą „przyzwoitą” możemy rozumieć taką, która nie przecina samej siebie, jest ciągła i prostowalna. Prostowalność oznacza z grubsza, że krzywą zajmującą skończony obszar przestrzeni można rozprostować do skończonego odcinka. W szczególności nie są prostowalne krzywe, które w pobliżu jakiegoś punktu wykonują nieskończenie wiele, niegasnących oscylacji (kliknij aby zobaczyć przykład). Powyższe wymagania można czasami osłabiać.
2Tym razem „przyzwoitość” może oznaczać, że powierzchnia jest dwustronna (kliknij aby poznać przykład powierzchni jednostronnej), gładka, ograniczona gładkim konturem i nie przecina samej siebie. Również i w tym przypadku można niekiedy powyższe żądania osłabiać.
3Przechodząc do granicy musimy tworzyć podziały w ten sposób, aby średnice fragmentów były coraz mniejsze i dążyły do zera. Średnica fragmentu, to (z grubsza) odległość między najbardziej od siebie oddalonymi punktami wchodzącymi w skład danego fragmentu. Przykładem niedopuszczalnego przechodzenia do granicy byłoby tworzenie pasków o coraz mniejszej szerokości, ale stałej długości.
4Obszar O musi oczywiście spełniać pewne warunki, aby całka była dobrze określona. Wystarczy na przykład, żeby powierzchnia ograniczająca obszar całkowania była gładka.
5Podobnie jak dla całek powierzchniowych musimy zadbać, aby średnice fragmentów dążyły do zera.
Przykłady wykorzystania całek krzywoliniowych, powierzchniowych i objętościowych
Przykład 1 - Pole elektryczne wytwarzane przez naładowany półokrąg
Rysunek 1. Jednorodnie naładowany drut w kształcie półokręgu K. Fragment dl wytwarza pole elektryczne dE, które rozkładamy na składowe dEx i dEy. Składowa dEx znosi się ze składową dE'x pochodzącą od fragmentu dl', umieszczonego symetrycznie względem pionowej kropkowanej osi. Zwroty zaznaczonych wektorów odpowiadają przypadkowi, w którym na drucie zgromadzony jest ładunek dodatni.
Rozważmy naładowany jednorodnie ładunkiem Q cienki drut K w kształcie półokręgu o promieniu r0, tak jak na rysunku 1. Chcemy obliczyć natężenie pola elektrycznego w punkcie P będącym środkiem okręgu, którego połową jest rozważany drut. Jeśli wyodrębnimy w drucie infinitezymalny fragment o długości dl, wówczas będzie nań przypadał ładunek dq=Q dl/(πr0). Pole elektryczne dE, które wytwarza ów fragment w punkcie P rozłożyć możemy na dwie prostopadłe składowe dEx i dEy. Zauważmy, że symetria układu zapewnia nam, że nie musimy się zajmować składową dEx. Faktycznie, dla każdego infinitezymalnego fragmentu półokręgu możemy znaleźć inny, leżący symetrycznie względem prostej dzielącej półokrąg na połowę, który wytwarza składową pola dE'x o takim samym kierunku i wartości, lecz przeciwnym zwrocie (porównaj z rysunkiem). Zajmiemy się zatem wyłącznie składową dEy. Fragment o długości dl możemy traktować jak ładunek punktowy. Z elementarnego kursu elektrostatyki wiemy, że długość wektora dE wynosi
Wobec tego wartość składowej dEy dana jest wzorem
gdzie θ oznaczacza kątowe położenie danego fragmentu półokręgu oraz przyjęliśmy, że dodatnie wartości dEy odpowiadają zwrotowi „od drutu”, jak na rysunku. Całkowita wartość Ey jest sumą składników dEy pochodzących od wszystkich fragmentów półokręgu. Możemy ją zapisać jako
Otrzymaliśmy zatem całkę krzywoliniową, z wyrażenia, w którym wzdłuż K zmienia się kąt θ. Najłatwiej obliczyć ją we współrzędnych biegunowych r, θ. Nasz drut można wówczas opisać zależnościami: r=r0 oraz 0≤θ≤π. Aby przeprowadzić rachunki, musimy wyznaczyć postać elementu długości dl. Trzeba się w tym celu zastanowić, jak infinitezymalna zmiana parametru θ wpływa na długość infinitezymlanego fragmentu półokręgu. Ze wzoru na długość łuku otrzymujemy, że przyrost kąta dθ generuje fragment o długości dl=r0dθ. Oznacza to, że możemy powyższą całkę przepisać jako
Nasz problem został zatem sprowadzony do całki z funkcji określonej na przedziale zmiennej θ. Jej obliczenie nie jest trudnym zadaniem.
Powyższy wynik stanowi rozwiązanie naszego zagadnienia. Zwróćmy uwagę, że całkowanie po krzywej K sprowadziło się do szczególnie prostej całki oznaczonej dzięki temu, że skorzystaliśmy ze współrzędnych biegunowych, które najlepiej współgrają z symetrią rozważanego drutu. Rachunki można również przeprowadzić we współrzędnych kartezjańskich x, y. Otrzyma się wówczas oczywiście taki sam wynik, jednak droga do niego będzie trudniejsza.
Przykład 2 - Pole elektryczne w osi naładowanego cylindra
Rysunek 2.
a) Współrzędne walcowe r, θ, z. Dla dowolnego punktu A: r oznacza odległość A od osi z, θ jest kątem między osią x a promieniem wodzącym rzutu A na płaszczyznę xy, zaś z pozostaje bez zmian.
b) Pole elektryczne wytwarzane przez fragment cylindra o powierzchni dS. Zwroty zaznaczonych wektorów odpowiadają przypadkowi, w którym na cylindrze zgromadzony jest ładunek dodatni.
c) Powierzchnia dS jest „prostokątem” zakreślanym przez infinitezymalne przyrosty dθ i dz. Jego boki mają długość dz i r0dθ, a zatem dS=r0dθdz.
Pozostajemy w obrębie elektrostatyki. Tym razem chcemy obliczyć natężenie pola elektrycznego, wytwarzanego przez jednorodnie naładowany ładunkiem Q cylinder P, w punktach leżących na osi cylindra. Średnica cylindra wynosi r0 , a wysokość h. Podobnie jak poprzednio, całkowite pole wyznaczymy jako sumę wkładów pochodzących od infinitezymalnych - teraz dwuwymiarowych - fragmentów cylindra. Nasze rozważania przeprowadzimy we współrzędnych walcowych r, θ, z, w których dla dowolnego punktu A w przestrzeni: r oznacza odległość A od osi z, θ jest kątem między osią x a promieniem wodzącym rzutu A na płaszczyznę xy, zaś z jest tą samą wielkością co we współrzędnych kartezjańskich (porównaj z rysunkiem 2a). Współrzędne te wprowadzamy w ten sposób, że oś cylindra pokrywa się z osią z, natomiast płaszczyzna z=0 dzieli cylinder na połowę. Cylinder P można teraz opisać jako zbiór punktów o współrzędnych spełniających zależności r=r0, 0≤θ<π oraz -h/2≤z≤h/2.
Nietrudno zauważyć (rysunek 2b), że dla punktów leżących na osi walca, wektor natężenia pola będzie równoległy do tej osi, gdyż pozostałe składowe znikają na mocy symetrii układu. Ustalmy punkt M leżący się na osi z, którego współrzędną względem tej osi oznaczymy jako zm. Rozważmy fragment powierzchni walca o powierzchni dS, znajdujący się w odległości l od M. Składowa dEz pola pochodzącego od tego fragmentu jest równa
gdzie dE oznacza długość wektora pola elektrycznego, natomiast α jest jego nachyleniem do osi z. Jeśli położenie fragmentu opisane jest współrzędnymi walcowymi r0, θ, z wówczas
oraz
Wiemy także, że
gdzie dq jest ładunkiem zgromadzonym na fragmencie. Pole powierzchni cylindra wynosi 2πr0h. Z jednorodności rozkładu ładunku otrzymujemy, że na powierzchnię o polu dS przypadać będzie ładunek dq=Q dS/2πr0h. Uwzględniając ponadto wzór na l dostajemy
i ostatecznie
Sumując wkłady dEz zapiszmy poszukiwane natężenie pola jako całkę
Całkę tę zamierzamy sprowadzić do dwóch całek po zmiennych walcowych z i θ. Powstaje pytanie jaki element powierzchni dS odpowiada infinitezymalnym przyrostom dz i dθ. Łatwo zauwżyć (rysunek 2c), że przyrosty te wycinają na powierzchni cylindra „prostokąt” o bokach dz i r0dθ. Wnioskujemy stąd, że dS=r0dθdz. Ostatecznie
Powyższą całkę dość łatwo obliczyć. Rozbijmy ją na dwie całki „zwykłe”
Odnajdujemy funkcje pierwotne
i otrzymujemy ostateczny wzór na poszukiwane natężenie pola
Zauważmy na koniec, że otrzymane rozwiązanie spełnia zależności Ez(0)=0 oraz Ez(-zm)=-Ez(zm), które naturalnie wynikają z symetrii układu i można je otrzymać bez przeprowadzania jakichkolwiek obliczeń. Rozwiązując problemy, w których pojawiają się nietrywialne rachunki, warto na koniec skonfrontować uzyskany wynik z zależnościami tego typu. Pozwala to od razu wychwycić część możliwych błędów (choć oczywiście nie wszystkie).
Przykład 3 - Moment bezwładności kuli
Rysunek 3.
a) Kula we współrzędnych sferycznych. Zmienna r oznacza odległość od początku układu współrzędnych, θ jest kątem nachylenia promienia wodzącego punktu do osi z, natomiast φ oznacza kąt między osią x a rzutem promienia wodzącego na płaszczyznę xy.
b) Infinitezymalne przyrosty dr, dθ, dφ generują „prostopadłościan” zaznaczony na niebiesko. Długość odcinka AD wynosi dr, natomiast łuk AC ma długość rdθ. Łuk AB jest zakreślany przez odcinek S'A o długości rsinθ. Wobec tego długość AB wynosi rsinθdφ. W przypadku infinitezymalnym objętość powstałej bryły możemy obliczyć stosując wzór na objętość prostopadłościanu. Mnożąc długości AB, AC i AD otrzymujemy dV=r2sinθ drdθdφ.
Obliczmy moment bezwładności jednorodnej kuli B o promieniu r0 i masie M względem osi obrotu przechodzącej przez jej środek. W tym celu podzielmy kulę na infinitezymalne fragmenty o masie dm. Każdy fragment traktujemy jak masę punktową, której moment bezwładności jest równy dI=l2dm, gdzie l jest odległością danego fragmentu od osi obrotu. Całkowity moment bezwładności kuli jest sumą wkładów dI pochodzących od wszystkich fragmentów. Zapisujemy go zatem jako całkę
przy czym masę dm wyraziliśmy jako iloczyn gęstości ρ i objętości dV. Widzimy, że jeśli ρ jest stałe (a założylismy, że kula jest jednorodna), wówczas nasze zagadnienie sprowadza się do obliczenia całki po kuli B z kwadratu funkcji l(x,y,z), opisującej odległość danego punktu od osi obrotu. Stosunkowo łatwo można tę całkę wyznaczyć korzystając ze współrzędnych sferycznych r, θ, φ, gdzie dla dowolnego punktu w przestrzeni: r oznacza odległość od początku układu współrzędnych, θ jest kątem nachylenia promienia wodzącego punktu do osi z, natomiast φ oznacza kąt między osią x a rzutem promienia wodzącego na płaszczyznę xy (porównaj z rysunkiem 3a). Współrzędne te wpowadzamy w ten sposób, by środek kuli leżał w początku układu współrzędnych, a oś z pokrywała się z osią obrotu. Możemy wówczas rozważaną kulę opisać jako zbiór punktów spełniająych zależności 0≤r≤r0, 0≤θ≤π oraz 0≤φ<2π. Korzystając z elementarnej trygonometrii nietrudno spostrzec, że odległość l dana jest wzorem l=rsinθ. Przepisujemy zatem naszą całkę jako
Potrzebujemy jeszcze wyznaczyć postać elementu objętości dV. Ponieważ będziemy chcieli całkę po B przedstawić jako całkowanie po trzech „zwykłych” zmiennych r, θ, φ, więc musimy określić objętość jaką generują infinitezymalne przyrosty dr, dθ, dφ. Analizując sytuację na rysunku 3b nietrudno spostrzec, że powstaje wówczas „prostopadłościan” o objętości dV=r2sinθ drdθdφ. Wstawiając ten wynik do wzoru na całkę otrzymujemy
Pamiętając, że przed znak całki można wyłączać wielkości nie zależące od zmiennej po której całkujemy, przekształcamy całkę do postaci
Pozostaje nam wykonać trzy „zwykłe” całkowania
W ten sposób otrzymujemy ostateczny wzór na poszukiwany moment bezwładności
gdzie w ostatnim przejściu wykorzystaliśmy związek .