12. Funkcje wielu zmiennych
12.1. Przestrzenie metryczne
Definicja 12.1 (metryka, odległość). Niech X będzie zbiorem niepustym. Metryką w zbiorze
X nazywamy dowolną funkcję d : X ×X −→ R
+
= [0, +∞), spełniającą następujące warunki:
1. ∀x, y ∈ X : d(x, y) = 0 ⇐⇒ x = y;
2. ∀x, y ∈ X : d(x, y) = d(y, x) (warunek symetrii);
3. ∀x, y, z ∈ X : d(x, y) + d(y, z) d(x, z) (warunek trójkąta).
Parę (X, d) nazywamy przestrzenią metryczną. Dla dowolnych x, y ∈ X, liczbę d(x, y) na-
zywamy odległością punktów x i y oraz mówimy, że punkty x i y są oddalone od siebie
o d(x, y).
Definicja 12.2 (kula, kula domknięta). Niech (X, d) będzie przestrzenią metryczną. Kulą
o środku w punkcie x
0
∈ X i promieniu r 0 nazywamy zbiór:
K(x
0
, r)
df
=
n
x ∈ X : d(x
0
, x) < r
o
.
Kulą domkniętą o środku w punkcie x
0
∈ X i promieniu r 0 nazywamy zbiór:
K(x
0
, r)
df
=
n
x ∈ X : d(x
0
, x) ¬ r
o
.
Definicja 12.3 (Metryka euklidesowa). Niech X = R
N
oraz niech
d(x, y)
df
=
v
u
u
t
N
X
i=1
(x
i
− y
i
)
2
,
gdzie x = (x
1
, . . . , x
N
) oraz y = (y
1
, . . . , y
N
).
Para (R
N
, d) jest przestrzenią metryczną. Funkcję d nazywamy metryką euklidesową
w R
N
, zaś parę (R
N
, d) nazywamy przestrzenią metryczną euklidesową.
Uwaga 12.1. W przestrzeni R
3
metryka euklidesowa ma postać:
d(x, y) =
q
(x
1
− y
1
)
2
+ (x
2
− y
2
)
2
+ (x
3
− y
3
)
2
,
gdzie x = (x
1
, x
2
, x
3
), y = (y
1
, y
2
, y
3
).
Definicja 12.4. Niech (X, d) będzie przestrzenią metryczną, niech x
0
∈ X oraz A ⊆ X.
Zbiór U ⊆ X nazywamy otwartym, jeśli każdy punkt zbioru U zawiera się w U wraz
z pewną kulą, czyli
∀x ∈ U ∃r > 0 : K(x, r) ⊆ U.
12.2. Granica i ciągłość funkcji wielu zmiennych
Definicja 12.5. Niech (X, d), (Y, ρ) będą przestrzeniami metrycznymi oraz niech funkcja
f : X → Y .
Mówimy, że g ∈ Y jest granicą funkcji f : X → Y w punkcie x będącym punktem
skupienia dziedziny funkcji f , jeśli
∀ε > 0∃δ > 0 : ∀y : 0 < d(x, y) < δ =⇒ ρ(g, f (y)) < ε.
Mówimy, że funkcja f : X → Y jest ciągła w punkcie x, jeśli
∀ε > 0∃δ > 0 : ∀y : d(x, y) < δ =⇒ ρ(f (x), f (y)) < ε.
45
Uwaga 12.2. Z istnienia granic iterowanych
lim
x→a
lim
y→b
f (x, y)
lim
y→b
lim
x→a
f (x, y)
i równości tych granic nie wynika istnienie granicy funkcji f w punkcie (a, b).
Uwaga 12.3. Jeśli funkcja f : R × R → R ma granicę w punkcie (a, b), to istnieją obie granice
iterowane
lim
x→a
lim
y→b
f (x, y)
lim
y→b
lim
x→a
f (x, y)
i są równe granicy funkcji f w punkcie (a, b), tzn.
lim
(x,y)→(a,b)
f (x, y).
Twierdzenie 12.1. Niech X, Y będą przestrzeniami metrycznymi i niech f : X → Y będzie
funkcją. Wówczas następujące warunki są równoważne:
1. funkcja f jest ciągła w punkcie a ∈ X,
2. istnieje granica lim
x→a
f (x) i jest równa wartości funkcji f (a).
Twierdzenie 12.2. Niech X, Y, Z będą przestrzeniami metrycznymi.
Złożenie g ◦ f : X → Z funkcji ciągłych f : X → Y i g : Y → Z jest funkcją ciągłą.
Twierdzenie 12.3. Jeśli f : X → R oraz g : X → R są funkcjami ciągłymi, to suma f + g
oraz iloczyn f · g są funkcjami ciągłymi. Ponadto odwrotność
1
g
: Z 3 x 7→
1
g(x)
∈ R oraz
iloraz
f
g
: Z 3 x 7→
f (x)
g(x)
∈ R są funkcjami ciągłymi na zbiorze Z := X \ {x ∈ X : g(x) = 0}.
Twierdzenie 12.4 (twierdzenie Weierstrassa). Jeśli f : X → R jest funkcją ciągłą określoną
na zbiorze zwartym X (domknięym i ograniczonym), to istnieją punkty a, b ∈ X, w których
funkcja f osiąga kresy:
kres dolny inf{f (x), x ∈ X} = f (a)
i kres górny sup{f (x), x ∈ X} = f (b).
12.3. Poziomice
Definicja 12.6. Niech f : X → R będzie funkcją określoną na przestrzeni metrycznej X
o wartościach rzeczywistych.
Poziomicą funkcji f odpowiadającą wartości a ∈ R nazywamy zbiór
{f = a} = {x ∈ X : f (x) = a},
Przykład 12.1. Jeśli z równania hiperboloidy jednowpowłokowej
x
2
+ y
2
− z
2
= 1
wyznaczymy z, z > 0, to otrzymamy funkcję f dwóch zmiennych, określoną wzorem:
z = f (x, y) =
q
x
2
+ y
2
− 1,
której poziomicami są okręgi x
2
+ y
2
= 1 + a
2
.
46
Rys. 1. Hiperboloida jednopowłokowa x
2
+ y
2
− z
2
= 1 i jej poziomice
12.4. Pochodna kierunkowa i pochodne cząstkowe
Definicja 12.7. Niech X będzie przestrzenią wektorową nad K (K = R lub K = C).
Odwzorowanie k · k : X −→ R
+
nazywamy normą w X, jeśli:
1. ∀x ∈ X :
kxk = 0 ⇐⇒ x = O;
2. ∀x ∈ X, λ ∈ K :
kλxk = |λ| · kxk (jednorodność);
3. ∀x, y ∈ X :
kx + yk ¬ kxk + kyk (subaddytywność).
Parę (X, k · k) nazywamy przestrzenią unormowaną.
Uwaga 12.4. W przestrzeni wektorowej R
N
nad R możemy wprowadzić normę euklidesową:
kxk
df
=
v
u
u
t
N
X
i=1
x
2
i
,
x = (x
1
, . . . , x
N
) ∈ R
N
Twierdzenie 12.5. Jeśli (X, k · k) jest przestrzenią unormowaną, d : X × X −→ R
+
jest
funkcją zadaną przez d(x, y)
df
= kx − yk, to (X, d) jest przestrzenią metryczną. Mówimy, że
d jest metryką zadaną przez normę k · k.
Uwaga 12.5. Każda przestrzeń unormowana jest przestrzenią metryczną, ale nie odwrotnie.
Różnica polega na tym, że w przestrzeni metrycznej nie ma wprowadzonych działań doda-
wania elementów tej przestrzeni i mnożenia ich przez skalary, a w przestrzeni wektorowej
możemy dodawać wektory i mnożyć je przez liczby.
Definicja 12.8. Niech A ⊂ X będzie otwartym podzbiorem przestrzeni unormowanej X.
Niech v ∈ X, v 6= 0 będzie ustalonym niezerowym wektorem tej przestrzeni.
Mówimy, że funkcja f : A → R ma w punkcie a pochodną kierunkową w kierunku wektora
v, jeśli istnieje granica ilorazu różnicowego:
lim
h→0
f (a + hv) − f (a)
h
.
Granicę tę oznaczamy symbolem ∂
v
f (a) i nazywamy pochodną kierunkową funkcji f w kie-
runku wektora v w punkcie a.
Uwaga 12.6. Zbiór {a + tv, t ∈ R} jest prostą przechodzącą przez punkt a równoległą do
wektora v, stąd pochodna ∂
v
f (a) jest pochodną w punkcie t = 0 funkcji jednej zmiennej
47
rzeczywistej t 7→ f (a + tv). Można zatem powtórzyć jednowymiarowy warunek konieczny
istnienia ekstremum w punkcie, w którym istnieje pochodna kierunkowa funkcji.
Twierdzenie 12.6. Niech A ⊂ X będzie otwartym podzbiorem przestrzeni unormowanej X
i niech v ∈ X, v 6= 0. Jeśli funkcja f : A → R osiąga ekstremum w punkcie a ∈ A i istnieje
pochodna kierunkowa ∂
v
f (a), to pochodna ta zeruje się.
Definicja 12.9. Niech X = R
n
i niech e
1
= (1, 0, 0, . . . , 0), e
2
= (0, 1, 0, . . . , 0), . . ., e
n
=
(0, 0, 0, . . . , 1) będą wersorami osi. Niech A będzie otwartym podzbiorem przestrzeni R
n
.
Pochodne kierunkowe (o ile istnieją) ∂
e
1
f (a), ∂
e
2
f (a), ..., ∂
e
n
f (a) funkcji f : A → R w kie-
runku wersorów osi {e
1
, e
2
, . . . , e
n
} nazywamy pochodnymi cząstkowymi funkcji f w punkcie a.
Pochodną cząstkową funkcji (x
1
, x
2
, . . . , x
n
) 7→ f (x
1
, x
2
, . . . , x
n
) ∈ R w kierunku wektora e
i
oznaczamy tradycyjnie symbolem:
∂f
∂x
i
(a),
∂
∂x
i
f (a), f
x
i
(a) lub f
0
x
i
(a).
W przypadku, gdy nie numerujemy współrzędnych argumentu funkcji (x, y, z) 7→ f (x, y, z)
pochodne cząstkowe oznaczamy symbolami
∂f
∂x
(a),
∂f
∂y
(a),
∂f
∂z
(a).
Twierdzenie 12.7 (warunek konieczny istnienia ekstremum). Jeśli funkcja f : A → R
osiąga ekstremum w punkcie a ∈ A, w którym istnieją pochodne cząstkowe
∂
∂x
k
f (a), k ∈
{1, 2, . . . , n}, to pochodne te zerują się w tym punkcie, tj.
∂
∂x
k
f (a) = 0
dla
k = 1, 2, . . . , n.
Uwaga 12.7. Dla funkcji f (x, y) dwóch zmiennych mamy pochodne cząstkowe w punkcie
a = (x
0
, y
0
):
∂f (x
0
, y
0
)
∂x
= lim
h→0
f (x
0
+ h, y
0
) − f (x
0
, y
0
)
h
∂f (x
0
, y
0
)
∂y
= lim
h→0
f (x
0
, y
0
+ h) − f (x
0
, y
0
)
h
W tym przypadku pochodne cząstkowe f
x
(x
0
, y
0
), f
y
(x
0
, y
0
) oznaczają odpowiednio tan-
gensy kątów α, β, jakie tworzy z osiami Ox i Oy styczna w punkcie P (x
0
, y
0
, f (x
0
, y
0
)) do linii,
wzdłuż których płaszczyzny x = x
0
i y = y
0
przecinają powierzchnię o równaniu z = f (x, y).
Przykład 12.2. Obliczmy pochodne cząstkowe rzędu pierwszego dla funkcji
f (x, y) = x cos
q
x + ln xy
Mamy
∂f
∂x
= 1 · cos
q
x + ln xy + x · (− sin
q
x + ln xy)
1
2
√
x + ln xy
1 +
y
xy
!
∂f
∂y
= x(− sin
q
x + ln xy)
1
2
√
x + ln xy
1
xy
· x
!
48
- 2
0
2
y
- 2
0
2
x
- 5
0
5
z
- 2
0
2
y
- 2
0
2
x
- 5
0
5
z
Rys. 2. Interpretacja graficzna pochodnej cząstkowej
Uwaga 12.8. Dla funkcji dwóch zmiennych z = f (x, y) wektor
~
n =
"
∂z(a)
∂x
,
∂z(a)
∂y
, −1
#
jest wektorem normalnym płaszczyzny stycznej do powierzchni z = f (x, y) w punkcie a =
(x
0
, y
0
, z
0
), stąd równanie tej płaszczyzny ma postać:
z
x
(a)(x − x
0
) + z
y
(a)(y − y
0
) − (z − z
0
) = 0
Przykład 12.3. Dla powierzchni o równaniu z = x
2
y +3y wyznaczyć w punkcie P (1, −1, z
0
)
równanie płaszczyzny stycznej do tej powierzchni.
Ponieważ
∂z
∂x
= 2xy
∂z
∂y
= x
2
+ 3,
stąd ~
n = [−2, 4, −1] oraz z
0
= f (1, −1) = −4, zatem
π : −2(x − 1) + 4(y + 1) − (z + 4) = 0,
czyli
−2x + 4y − z + 2 = 0
12.5. Pochodne cząstkowe wyższych rzędów
Definicja 12.10. Rozważmy funkcję
∂f
∂x
i
, która punktowi x ∈ U przyporządkowuje pochod-
ną cząstkową funkcji f po zmiennej x
i
w punkcie a, czyli funkcję
∂f
∂x
i
: U 3 a 7→
∂f
∂x
i
(a) ∈ R.
Jeśli w punkcie a ∈ U istnieje pochodna cząstkowa funkcji
∂f
∂x
i
po zmiennej x
j
, to mówi-
my, że funkcja f ma pochodną cząstkową rzędu drugiego po zmiennych x
i
oraz x
j
. Pochodną
tę oznaczamy symbolem
∂
∂x
j
∂
∂x
i
f (a), bądź
∂
2
∂x
j
∂x
i
f (a) lub
∂
2
f (a)
∂x
j
∂x
i
.
49
Gdy i = j piszemy
∂
2
f (a)
∂x
2
i
zamiast
∂
2
f (a)
∂x
i
∂x
i
.
Uwaga 12.9. Jeśli f : R
n
3 (x, y, z, . . . , t) 7→ f (x, y, z, . . . , t) ∈ R jest funkcją n zmiennych,
to często zamiast pisać
∂
2
f (a)
∂x
2
,
∂
2
f (a)
∂x∂y
,
∂
2
f (a)
∂x∂z
, . . . ,
piszemy
f
xx
(a), f
xy
(a), f
xz
(a), . . . ,
bądź
f
0
xx
(a), f
0
xy
(a), f
0
xz
(a), . . .
Lemat 12.1 (Schwarza). Jeśli f : R
n
⊃ U 3 x 7→ f (x) ∈ R jest funkcją, która w punkcie
a ∈ U ma ciągłe pochodne cząstkowe
∂
∂x
j
∂
∂x
i
f oraz
∂
∂x
i
∂
∂x
j
f , to w punkcie a są one równe,
tj.
∂
∂x
j
∂
∂x
i
f (a) =
∂
∂x
i
∂
∂x
j
f (a).
Przykład 12.4. Obliczmy pochodne mieszane rzędu trzeciego dla funkcji
f (x, y) = e
2x
y
2
Mamy
∂
3
f
∂x∂y∂x
=
∂
∂x
∂
∂y
∂
∂x
e
2x
y
2
!
=
∂
∂x
∂
∂y
2e
2x
y
2
!
=
∂
∂x
4e
2x
y =
= 8e
2x
y
∂
3
f
∂x
2
∂y
=
∂
∂y
∂
∂x
∂
∂x
e
2x
y
2
!
=
∂
∂y
∂
∂x
2e
2x
y
2
!
=
∂
∂y
4e
2x
y
2
=
= 8e
2x
y
∂
3
f
∂y∂x
2
=
∂
∂x
∂
∂x
∂
∂y
e
2x
y
2
!
=
∂
∂x
∂
∂x
2e
2x
y
!
=
∂
∂x
4e
2x
y =
= 8e
2x
y
Definicja 12.11. Załóżmy, że istnieją kolejno pochodne cząstkowe
∂
α
n
∂x
α
n
n
. . .
∂
α
2
∂x
α
2
2
∂
α
1
∂x
α
1
1
f
. . .
!
(a)
i nie zależą od kolejności różniczkowania. Mówimy wówczas, że funkcja f ma pochodną
cząstkową
∂
|α|
f (a)
∂x
α
:=
∂
α
n
∂x
α
n
n
. . .
∂
α
2
∂x
α
2
2
∂
α
1
∂x
α
1
i
f
. . .
!
(a)
rzędu |α| = α
1
+ α
2
+ · · · + α
n
w punkcie a. Pochodną tę notujemy też symbolem D
α
f (a).
50
12.6. Pochodne cząstkowe w fizyce. Elementy teorii pola
Definicja 12.12. Niech f : D → R będzie funkcją określoną na pewnym zbiorze otwartym
D ⊂ R
n
. Załóżmy, że w pewnym punkcie a ∈ D istnieją pochodne cząstkowe
∂f
∂x
1
(a),
∂f
∂x
2
(a),
. . . ,
∂f
∂x
n
(a).
Wektor grad f (a) =
∂f
∂x
1
(a),
∂f
∂x
2
(a), . . . ,
∂f
∂x
n
(a)
!
∈ R
n
nazywamy gradientem funkcji f
w punkcie a.
Wektor ten oznaczamy też symbolem nabla: ∇f (a).
Punkt a, w którym wyznaczamy gradient funkcji f , można także zapisać w formie indeksu
dolnego: grad
a
f, ∇
a
f .
Uwaga 12.10. Jeśli funkcje f, g : R
n
⊃ D → R mają w punkcie a ∈ D pochodne cząstkowe
∂f
∂x
i
(a),
∂g
∂x
i
(a), i = 1, 2, . . . , n, to:
1. grad (f + g)(a) = grad f (a) + grad g(a),
2. grad (f g)(a) = g(a)grad f (a) + f (a)grad g(a).
Twierdzenie 12.8. Jeśli w punkcie a ∈ D ⊂ R
n
istnieje pochodna kierunkowa ∂
v
f (a)
w kierunku wektora v, to można ją przedstawić w postaci:
∂
v
f (a) =
∂f (a)
∂x
1
w
1
+
∂f (a)
∂x
2
w
2
+ . . .
∂f (a)
∂x
n
w
n
= grad f (a) ◦ v
∗
,
gdzie w = (w
1
, w
2
, . . . , w
n
) jest wersorem wektora v, tzn. w = v
∗
.
Przykład 12.5. Obliczymy gradient funkcji f (x, y, z) = x
2
y + 3xy
2
+ xz + z
2
+ z w punkcie
P (−1, 1, 0).
Ponieważ
∂f
∂x
= 2xy + 3y
2
+ z
∂f
∂y
= x
2
+ 6xy
∂f
∂z
= x + 2z + 1,
stąd grad f (P ) = (1, −5, 0).
Przykład 12.6. Obliczymy w punkcie P (1, 1, 2) pochodną funkcji f (x, y, z) = z ln(
x
y
) w kie-
runku wektora v = (−1, 3, 2).
Ponieważ
∂f
∂x
= z
1
x
y
·
1
y
=
z
x
∂f
∂y
= z
1
x
y
·
−x
y
2
= −
z
y
∂f
∂z
= ln
x
y
!
,
stąd grad f (P ) = (2, −2, 0).
Wersorem w wektora v jest w = v
∗
= (
−1
√
14
,
3
√
14
,
2
√
14
), ponieważ kvk =
√
14, zatem
∂
v
f (P ) = grad f (P ) ◦ v
∗
= (2, −2, 0) ◦ (
−1
√
14
,
3
√
14
,
2
√
14
) = −
8
√
14
.
51
Uwaga 12.11. Jeśli przez ϕ oznaczymy kąt między wektorem v i grad f (a), to z definicji
iloczyny skalarnego i z tego, że v
∗
jest wersorem, tzn. kv
∗
k = 1, wynika, że
∂
v
f (a) = kgrad f (a)kkv
∗
k cos ϕ = kgrad f (a)k cos ϕ,
zatem pochodna kierunkowa w kierunku wektora gradientu jest największa (cos ϕ = 1).
Wektor gradientu wskazuje więc kierunek największego wzrostu wartości funkcji.
Uwaga 12.12. W fizyce funkcję f : R
3
→ R o wartościach liczbowych nazywa się funkcją ska-
larną, natomiast funkcję F : R
3
→ R
3
nazywa się polem (wektorowym). Przykładem funkcji
skalarnych są np. temperatura, potencjał pola grawitacyjnego. Przykładem pola wektorowego
jest pole grawitacyjne.
Definicja 12.13. Pole wektorowe F : R
3
⊃ D → R
3
nazywamy polem potencjalnym, jeśli
istnieje funkcja skalarna U : D → R, taka że grad U (a) = F (a) w dowolnym punkcie a zbioru
otwartego D ⊂ R
3
.
Funkcję U nazywamy wówczas potencjałem pola wektorowego F .
Przykład 12.7. Pole grawitacyjne F (~
r) = −
k
r
3
~
r jest polem potencjalnym. Potencjałem
tego pola jest funkcja skalarna U (~
r) =
k
r
, gdzie ~
r = (x, y, z) oraz r = k~
rk =
q
x
2
+ y
2
+ z
2
.
Licząc pochodne cząstkowe funkcji U (x, y, z) =
k
√
x
2
+ y
2
+ z
2
=
k
r
określonej w zbiorze
otwartym D = R
3
\ {0}, czyli wszędzie w przestrzeni R
3
poza początkiem układu współrzęd-
nych, mamy :
∂
∂x
U (~
r) =
∂
∂x
k
r
= −
k
r
2
·
∂r
∂x
= −
k
r
2
·
2x
2r
= −
k
r
3
x
∂
∂y
U (~
r) =
∂
∂y
k
r
= −
k
r
2
·
∂r
∂y
= −
k
r
2
·
2y
2r
= −
k
r
3
y
∂
∂z
U (~
r) =
∂
∂z
k
r
= −
k
r
2
·
∂r
∂z
= −
k
r
2
·
2z
2r
= −
k
r
3
z,
czyli
grad U (~
r) = grad U (x, y, z) = (−
k
r
3
x, −
k
r
3
y, −
k
r
3
z)
= −
k
r
3
(x, y, z) = −
k
r
3
~
r
= F (~
r).
Definicja 12.14. Dywergencją pola wektorowego F = (F
x
, F
y
, F
z
) : R
3
⊃ D → R
3
w punkcie
a ∈ D nazywamy liczbę
div F (a) =
∂F
x
∂x
(a) +
∂F
y
∂y
(a) +
∂F
z
∂z
(a),
o ile istnieją pochodne cząstkowe
∂F
x
∂x
(a),
∂F
y
∂y
(a),
∂F
z
∂z
(a).
Jeśli w dowolnym punkcie a ∈ D dywergencja div F (a) = 0, to pole wektorowe F nazy-
wamy polem bezźródłowym.
Przykład 12.8. Pole grawitacyjne F (~
r) = −
k
r
3
~
r jest polem bezźródłowym w R
3
\ {0}.
W dowolnym punkcie ~
r = (x, y, z) 6= 0 mamy
52
∂F
x
∂x
(~
r) =
∂
∂x
−
k
r
3
x
!
= −k
∂x
∂x
1
r
3
+ x
∂
∂x
1
r
3
!
= −k
1
r
3
+ x ·
(−3)
r
4
∂r
∂x
!
= −k
1
r
3
−
3x
2
r
5
!
i podobnie
∂F
y
∂y
(~
r) = −k
1
r
3
−
3y
2
r
5
!
oraz
∂F
z
∂z
(~
r) = −k
1
r
3
−
3z
2
r
5
!
.
Stąd
div F (~
r) =
∂F
x
∂x
(~
r) +
∂F
y
∂y
(~
r) +
∂F
z
∂z
(~
r)
= −k
1
r
3
−
3x
2
r
5
!
− k
1
r
3
−
3y
2
r
5
!
− k
1
r
3
−
3z
2
r
5
!
= −k
3
r
3
−
3(x
2
+ y
2
+ z
2
)
r
5
!
= −k
3
r
3
−
3r
2
r
5
!
= 0.
Definicja 12.15. Rotacją pola wektorowego F = (F
x
, F
y
, F
z
) : R
3
⊃ D → R
3
w punkcie
a ∈ D nazywamy wektor
rot F (a) =
∂F
z
∂y
(a) −
∂F
y
∂z
(a),
∂F
x
∂z
(a) −
∂F
z
∂x
(a),
∂F
y
∂x
(a) −
∂F
x
∂y
(a)
!
.
Wektor ten oznaczamy też symbolem ∇ × F (a), przy czym × oznacza iloczyn wektorowy
wektora ∇ =
∂
∂x
,
∂
∂y
,
∂
∂z
!
oraz wektora F (a) = (F
x
(a), F
y
(a), F
z
(a)).
Jeśli w każdym punkcie a ∈ D rotacja rot F (a) = 0, to pole wektorowe F nazywamy
bezwirowym.
Przykład 12.9. Pole grawitacyjne F (~
r) = −
k
r
3
~
r jest polem bezwirowym w R
3
\ {0}.
W dowolnym punkcie ~
r = (x, y, z) 6= 0 mamy
∂
∂y
F
z
(~
r) =
∂
∂y
− k
1
r
3
z
!
= −kz
∂
∂y
1
r
3
!
= −kz
(−3)
r
4
∂r
∂y
= 3kz
y
r
5
= zy
3k
r
5
oraz podobnie
∂
∂z
F
y
(~
r) = yz
3k
r
5
.
Pierwsza współrzędna wektora rotacji jest więc równa zeru, gdyż
∂F
z
∂y
(~
r) −
∂F
y
∂z
(~
r) = zy
3k
r
5
− yz
3k
r
5
= 0.
W ten sam sposób sprawdzamy, że również druga i trzecia współrzędna wektora rotacji
zerują się:
∂F
x
∂z
(~
r) −
∂F
z
∂x
(~
r) = xz
3k
r
5
− zx
3k
r
5
= 0
∂F
y
∂x
(~
r) −
∂F
x
∂y
(~
r) = yx
3k
r
5
− xy
3k
r
5
= 0.
Stąd rot F (~
r) = 0 dla ~
r 6= 0.
12.7. Różniczka zupełna
Definicja 12.16. Niech f jest funkcją n zmiennych określoną w otoczeniu U punktu (x
1
, x
2
, . . . , x
n
)
i niech ∆x
i
oznacza przyrost zmiennej niezależnej x
i
, i = 1, 2, . . . , n.
Przyrostem zupełnym ∆f (x) funkcji f w punkcie x, odpowiadającym przyrostom ∆x
1
,
∆x
2
, . . ., ∆x
n
nazywamy różnicę wartości funkcji w punkcie x i x + ∆x
∆f (x) = f (x) − f (x + ∆x)
53
Definicja 12.17. Mówimy, że funkcja n zmiennych jest różniczkowalna w punkcie x, je-
żeli w dowolnie małym otoczeniu U punktu x przyrost zupełny ∆f (x) tej funkcji można
przedstawić w postaci
∆f (x) =
n
X
i=1
A
i
∆x
i
+ ε%,
gdzie A
i
, i = 1, 2, . . . , n są pewnymi stałymi, ε = ε(∆x
1
, ∆x
2
, . . . , ∆x
n
), % = k∆xk =
q
(∆x
1
)
2
+ (∆x
2
)
2
+ . . . (∆x
n
)
2
, przy czym ε → 0, gdy % → 0.
Twierdzenie 12.9. Jeżeli funkcja n zmiennych jest różniczkowalna w punkcie x, to istnieją
w tym punkcie skończone pochodne cząstkowe
∂f (x)
∂x
i
,
i = 1, 2, . . . , n,
oraz przyrost zupełny tej funkcji w punkcie x można przedstawić w postaci:
∆f (x) =
n
X
i=1
∂f (x)
∂x
i
∆x
i
+ ε%,
Definicja 12.18. Różniczką zupełną df (x) funkcji f o n zmiennych nazywamy liniowy skład-
nik przyrostu zupełnego ∆f (x), zatem
df (x) =
n
X
i=1
∂f (x)
∂x
i
∆x
i
Uwaga 12.13. Ponieważ dla zmiennych niezależnych x
1
, x
2
, . . . , x
n
, mamy dx
1
= ∆x
1
, dx
2
=
∆x
2
, . . . dx
n
= ∆x
n
, więc
df (x) =
n
X
i=1
∂f (x)
∂x
i
dx
i
Uwaga 12.14. Dla dostatecznie małych przyrostów ∆x
i
, i = 1, 2, . . . , n słuszny jest wzór
przybliżony:
∆f (x) ≈ df (x),
stąd maksymalny błąd bezwzględny ∆f wartości funkcji możemy obliczyć ze wzoru:
∆f =
n
X
i=1
∂f (x)
∂x
i
∆x
i
Przykład 12.10. Okres wahania T wahadła prostego jest dany wzorem
T = 2π
s
l
g
,
gdzie l oznacza długość wahadła, a g przyspieszenie grawitacyjne. Ocenić błąd ∆T , jeśli l i
g są obarczone błędami dl i dg.
Ponieważ
∂T
∂l
= 2π
1
2
q
l
g
·
1
g
= π
r
g
l
·
1
g
,
∂T
∂g
= 2π
1
2
q
l
g
·
−
l
g
2
!
= −π
r
g
l
·
l
g
2
,
54
więc
dT = π
r
g
l
dl
g
−
ldg
g
2
!
,
zatem maksymalny błąd bezwzględny wynosi:
∆T = π
r
g
l
∆l
g
+
l∆g
g
2
!
,
a maksymalny błąd względny
∆T
T
=
1
2
∆l
l
+
∆g
g
!
,
czyli jest równy połowie maksymalnych błędów względnych popełnionych przy pomiarach l
i g.
Przykład 12.11. Długość krawędzi prostopadłościanu wynoszą a = 3 ± 0, 2 cm, b = 4 ±
0, 2 cm, c = 12 ± 0, 1 cm. Znajdziemy długość przekątnej prostopadłościanu i podamy do-
kładność jej obliczenia.
Długość przekątnej
d = d(a, b, c) =
√
a
2
+ b
2
+ c
2
.
Aby wyznaczyć maksymalny błąd bezwzględny obliczamy pochodne cząstkowe:
∂d
∂a
=
a
√
a
2
+ b
2
+ c
2
,
∂d
∂b
=
b
√
a
2
+ b
2
+ c
2
,
∂d
∂c
=
c
√
a
2
+ b
2
+ c
2
,
zatem
∂d(3, 4, 12)
∂a
=
3
13
,
∂d(3, 4, 12)
∂b
=
4
13
,
∂d(3, 4, 12)
∂c
=
12
13
,
więc maksymalny błąd względny wynosi
∆d =
a∆a + b∆b + c∆c
√
a
2
+ b
2
+ c
2
=
1
13
(3 · 0, 2 + 4 · 0, 2 + 12 · 0, 1) = 0, 2,
stąd d = 13 ± 0, 2 cm.
Maksymalny błąd względny
∆d
d
=
a∆a + b∆b + c∆c
a
2
+ b
2
+ c
2
≈ 0, 015 = 1, 5%
Definicja 12.19. Różniczką zupełną rzędu drugiego d
2
f (x)funkcji f w obszarze D ⊂ R
n
nazywamy różniczkę zupełną różniczki zupełnej pierwszego rzędu tej funkcji w obszarze D,
czyli
d
2
f (x) = d(df (x)).
Uwaga 12.15. Ponieważ
df (x) =
n
X
i=1
∂f (x)
∂x
i
dx
i
,
zatem
d
2
f (x) =
n
X
j=1
∂
∂x
j
"
n
X
i=1
∂f (x)
∂x
i
dx
i
#
dx
j
stąd
d
2
f (x) =
n
X
j=1
n
X
i=1
∂
2
f (x)
∂x
i
∂x
j
dx
i
dx
j
55
Uwaga 12.16. Oznaczając dx =
dx
1
dx
2
..
.
dx
n
różniczkę d
2
f (x) możemy zapisać w postaci macie-
rzowej:
d
2
f (x) =
h
dx
1
dx
2
. . . dx
n
i
∂
2
f (x)
∂x
2
1
∂
2
f (x)
∂x
1
∂x
2
. . .
∂
2
f (x)
∂x
1
∂x
n
∂
2
f (x)
∂x
2
∂x
1
∂
2
f (x)
∂x
2
2
. . .
∂
2
f (x)
∂x
2
∂x
n
..
.
..
.
. ..
..
.
∂
2
f (x)
∂x
n
∂x
1
∂
2
f (x)
∂x
n
∂x
2
. . .
∂
2
f (x)
∂x
2
n
dx
1
dx
2
..
.
dx
n
Definicja 12.20. Macierz
H
f
(x) =
∂
2
f (x)
∂x
2
1
∂
2
f (x)
∂x
1
∂x
2
. . .
∂
2
f (x)
∂x
1
∂x
n
∂
2
f (x)
∂x
2
∂x
1
∂
2
f (x)
∂x
2
2
. . .
∂
2
f (x)
∂x
2
∂x
n
..
.
..
.
. ..
..
.
∂
2
f (x)
∂x
n
∂x
1
∂
2
f (x)
∂x
n
∂x
2
. . .
∂
2
f (x)
∂x
2
n
nazywamy hesjanem lub macierzą Hessego funkcji f
Uwaga 12.17. Hesjan jest macierzą symetryczną i przy jego pomocy można zapisać różniczkę
zupełną drugiego rzędu w następującej postaci:
d
2
f (x) = (dx)
T
H
f
(x)dx.
Zapis ten oznacza, że różniczka zupełna drugiego rzędu jest formą kwadratową względem
przyrostów dx
1
, . . . , dx
n
.
Definicja 12.21. Macierz symetryczną A nazywamy określoną dodatnio (ujemnie), jeśli
skojarzona z nią forma kwadratowa jest określona dodatnio (ujemnie).
Definicja 12.22. Minorem głównym macierzy A = [a
ij
]
n×n
nazywamy minor o postaci:
a
11
a
12
. . . a
1i
a
21
a
22
. . . a
2i
..
.
..
.
. .. . . .
a
i1
a
i2
. . . a
ni
dla i = 1, 2, . . . , n
tzn.
A
1
= a
11
,
A
2
=
a
11
a
12
a
21
a
22
,
A
3
=
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
, . . . , A
n
= det A
Twierdzenie 12.10 (kryterium Sylvestra). Forma kwadratowa o macierzy skojarzonej A
jest:
1. dodatnio określona ⇐⇒ A
k
> 0
∀k = 1, 2, . . . , n
2. ujemnie określona ⇐⇒ (−1)
k
A
k
> 0
∀k = 1, 2, . . . , n
56
3. półokreślona dodatnio ⇐⇒ A
k
0
∀k = 1, 2, . . . , n
4. półokreślona ujemnie ⇐⇒ (−1)
k
A
k
0
∀k = 1, 2, . . . , n
5. nieokreślona, gdy nie zachodzi żaden z powyższych przypadków
Przykład 12.12. Zbadamy określoność formy kwadratowej
Φ(x) = −x
2
1
+ 4x
1
x
2
− 5x
2
2
+ 2x
2
x
3
− 4x
2
3
Macierz formy kwadratowej Φ ma postać:
A =
−1
2
0
2
−5
1
0
1
−4
,
ponieważ
Φ(x) = x
T
Ax =
h
x
1
x
2
x
3
i
−1
2
0
2
−5
1
0
1
−4
x
1
x
2
x
3
Obliczając kolejne minory główne, mamy:
A
1
= −1 < 0,
A
2
=
−1
2
2
−5
= 1 > 0,
A
3
=
−1
2
0
2
−5
1
0
1
−4
= −3 < 0,
zatem forma kwadratowa jest ujemnie określona
Definicja 12.23. Niech D ⊂ R
n
jest zbiorem otwartym oraz f : D → R jest funkcją
różniczkowalną.
Każdy punkt a ∈ D, spełniający warunki:
∂f (a)
∂x
k
= 0,
k = 1, 2, . . . n
nazywamy punktem stacjonarnym funkcji f .
Twierdzenie 12.11. Niech D ⊂ R
n
oraz funkcja f : D → R.
Jeśli f ma w pewnym otoczeniu punktu stacjonarnego x
0
∈ D ciągłe wszystkie pochod-
ne rzędu pierwszego i drugiego, to w punkcie x
0
funkcja ma ekstremum lokalne, gdy forma
kwadratowa
d
2
f (x
0
) =
n
X
j=1
n
X
i=1
∂
2
f (x
0
)
∂x
i
∂x
j
dx
i
dx
j
jest określonego znaku i ekstremum to jest
1. maksimum lokalnym, gdy forma ta jest określona ujemnie,
2. minimum lokalnym, gdy forma jest określona dodatnio.
Jeżeli forma kwadratowa d
2
f (x
0
) nie jest określona, to w punkcie stacjonarnym a nie ma
ekstremum.
Przykład 12.13. Wyznaczymy ekstrema lokalne funkcji
f (x, y) = x
3
+ 3xy
2
− 15x − 12y
57
Z warunku koniecznego ekstremum otrzymujemy układ równań:
∂f
∂x
= 3x
2
+ 3y
2
− 15 = 0
∂f
∂y
= 6xy − 12 = 0
Z drugiego równania mamy y =
2
x
, stąd podstawiając do pierwszego równania, dostajemy:
x
2
+
4
x
2
= 5,
stąd
x
4
− 5x
2
+ 4 = 0
zatem x = ±1 lub x = ±2. Otrzymujemy zatem cztery punkty stacjonarne:
A(1, 2),
B(−1, −2),
C(2, 1),
D(−2, −1)
Wyznaczamy teraz hesjan H
f
(x, y). Ponieważ
∂
2
f
∂x
2
= 6x,
∂
2
f
∂x∂y
=
∂
2
f
∂y∂x
= 6y,
∂
2
f
∂y
2
= 6x,
zatem
H
f
(x, y) =
"
6x 6y
6y
6x
#
H
f
(1, 2) =
"
6
12
12
6
#
,
H
f
(−1, −2) =
"
−6
−12
−12
−6
#
H
f
(2, 1) =
"
12
6
6
12
#
,
H
f
(−2, −1) =
"
−12
−6
−6
−12
#
stąd macierz H
f
(2, 1) jest dodatnio określona, a macierz H
f
(−2, −1) jest ujemnie określona.
Natomiast macierze H
f
(1, 2) i H
f
(−1, −2) są nieokreślone. Punkt (2, 1) jest zatem punktem
minimum lokalnego funkcji f , a punkt (−2, −1) punktem maksimum lokalnego. Mamy zatem:
f
min
(2, 1) = −28
f
max
(−2, −1) = 28.
58