§ 0.12. Ekstrema warunkowe
55
§ 0.12. Ekstrema warunkowe
W tym rozdziale będziemy badać ekstrema funkcji f określonych na otwar-
tych podzbiorach R
m
przy dodatkowym warunku postaci F (x) = 0, gdzie
F = (F
1
, . . . , F
k
) będzie funkcją o wartościach w R
k
, k < m (przyjmujemy
umowę, że wektor zerowy (0, 0, . . . , 0) będziemy oznaczać również symbolem
0). Zapisany w postaci wektorowej warunek F (x) = 0 jest więc równoważny
z ciągiem skalarnych warunków F
1
(x) = 0, . . . , F
k
(x) = 0.
Jeśli funkcja F jest ciągła, to zbiór A =
{x ∈ R
m
: F (x) = 0
} jest domknięty
jako przeciwobraz zbioru jednopunktowego
{0} (zbiór jednopunktowy jest
zawsze domknięty) przy odwzorowaniu ciągłym. Jeśli ponadto A jest ogra-
niczony, to jest zwarty, a wtedy funkcja ciągła przyjmuje na nim największą
i najmniejszą wartość.
Funkcję f obciętą do zbioru A będziemy oznaczać f
|A
.
Różniczkę odwzorowania F w punkcie x
0
oznaczamy przez DF (x
0
). Rząd
odwzorowania to rząd jego macierzy (można udowodnić, że jest niezależny
od wyboru bazy). Odwzorowanie jest klasy C
1
w zbiorze otwartym G, gdy
jego różniczka jest odwzorowaniem ciągłym. Warunkiem koniecznym i do-
statecznym na to jest ciągłość pochodnych cząstkowych wszystkich funkcji
F
1
, F
2
, . . . , F
n
.
Poniższe twierdzenie zawiera warunek konieczny na to, by punkt x
0
∈ A był
punktem krytycznym (stacjonarnym) funkcji f
|A
. Umożliwia zatem sporzą-
dzenie listy punktów, w których ta funkcja może (ale nie musi) przyjmować
ekstremum).
Twierdzenie 1 (Lagrange’a). Niech G
⊂ R
m
będzie zbiorem otwartym,
f: G → R. Ponadto niech F : G → R
k
, gdzie k < m, będzie funkcją klasy
C
1
. Oznaczmy
K = {x ∈ G: F (x) = 0}.
Jeśli funkcja f
|K
przyjmuje lokalne ekstremum w punkcie x
0
∈ K oraz
(i) f jest różniczkowalna w punkcie x
0
,
(ii) rząd DF (x
0
) = k,
to istnieją takie λ
1
, . . . λ
k
∈ R, że
grad f (x
0
) + λ
1
grad F
1
(x
0
) + . . . + λ
k
grad F
k
(x
0
) = 0.
(1)
Uwaga 2. Jeśli wprowadzimy funkcję
L(x) = f(x) + λ
1
F
1
(x) + . . . + λ
k
F
k
(x),
x ∈ R
m
,
to równanie (1) zapisze się w postaci grad L(x) = 0. Funkcję L nazywamy
funkcją Lagrange’a, a liczby λ
1
, . . . λ
k
— mnożnikami Lagrange’a.
56
Rafał Sztencel: Wykłady z Analizy Matematycznej dla WNE
Równanie (1) ma następującą interpretację geometryczną: gradient funk-
cji f jest równy
−λ
1
F
1
(x
0
)
− . . . − λ
k
F
k
(x
0
), jest zatem prostopadły do
zbioru K. Wobec tego funkcja f , mówiąc obrazowo, nie ma jak urosnąć
(ani zmaleć).
Przykład 3 (Lemniskata Bernoulliego). Znajdziemy największą i naj-
mniejszą wartość funkcji f (x, y) = x na krzywej K o równaniu
(x
2
+ y
2
)
2
= 2c
2
(x
2
− y
2
),
(2)
gdzie c > 0 jest parametrem.
R o z w i ą z a n i e. Jeśli dla (x, y)
∈ R
2
zdefiniujemy
F (x, y) = (x
2
+ y
2
)
2
− 2c
2
(x
2
− y
2
),
to K =
{(x, y): F (x, y) = 0}. Funkcja F : R
2
→ R jest klasy C
1
, a w
szczególności jest ciągła, zatem zbiór K jest domknięty. Jest on ponadto
ograniczony, bowiem dla x
2
+ y
2
> 0 z równania (2) otrzymujemy
x
2
+ y
2
= 2c
2
·
x
2
− y
2
x
2
+ y
2
2c
2
,
wobec tego K zawiera się w kole o środku (0, 0) i promieniu c
√
2.
Wykazaliśmy, że zbiór K jest zwarty. W takim razie funkcja ciągła f przyj-
muje na nim najmniejszą i największą wartość. Ponadto funkcja f jest
różniczkowalna na R
2
.
I. Zbadamy teraz, czy na krzywej K są punkty osobliwe. Mamy
grad F (x, y) = (4x(x
2
+ y
2
)
− 4xc
2
, 4y(x
2
+ y
2
) + 4yc
2
) =
= (4x(x
2
+ y
2
− c
2
), 4y(x
2
+ y
2
+ c
2
)).
Warunek grad F (x, y) = (0, 0) jest równoważny z układem równań
(x
2
+ y
2
)x = c
2
x,
(x
2
+ y
2
)y =
−c
2
y.
Z drugiego równania wynika, że y = 0, w przeciwnym razie bowiem byłoby
0 < x
2
+ y
2
=
−c
2
< 0; gdy y = 0, pierwsze równanie sprowadza się do
x
3
= c
2
x. Zatem x = 0 lub x
2
= c
2
. W ostatnim przypadku nie jest jednak
spełnione równanie krzywej (2). Mamy więc x = y = 0.
Jedynym punktem osobliwym jest punkt (0, 0). Obliczamy f (0, 0) = 0.
II. Zakładamy, że (x, y)
= (0, 0), wtedy grad F (x, y) = (0, 0) i w celu wy-
znaczenia punktów podejrzanych o ekstremum możemy zastosować twier-
dzenie 1 (sprawdziliśmy, że spełnione są jego założenia, w szczególności
(ii)). Równanie (1) przybiera postać
(1, 0) + λ(4x(x
2
+ y
2
− c
2
), 4y(x
2
+ y
2
+ c
2
)) = (0, 0),
(3)
§ 0.12. Ekstrema warunkowe
57
i wraz z równaniem krzywej K (2) daje następujący układ równań:
1 + 4λx(x
2
+ y
2
− c
2
) = 0,
4λy(x
2
+ y
2
+ c
2
) = 0,
(x
2
+ y
2
)
2
− 2c
2
(x
2
− y
2
) = 0.
Z pierwszego równania wynika, że λ
= 0 i x = 0, zatem drugie równanie daje
y = 0, i wtedy z trzeciego równania wynika, że x
2
= 2c
2
, czyli x =
±c
√
2.
Są więc kolejne dwa punkty podejrzane o ekstremum: (c
√
2, 0) i (
−c
√
2, 0).
Obliczamy f (c
√
2, 0) = c
√
2, f (
−c
√
2, 0) =
−c
√
2. Porównanie z wartością
f w znalezionym wcześniej punkcie osobliwym pokazuje, że c
√
2 i
−c
√
2 są
odpowiednio największą i najmniejszą wartością funkcji f na krzywej K.
Uwaga 4. a) Podobnie można wyznaczyć największą i najmniejszą war-
tość funkcji g(x, y) = y na krzywej K. Układ równań przybiera wtedy
postać
4λx(x
2
+ y
2
− c
2
) = 0,
1 + 4λy(x
2
+ y
2
+ c
2
) = 0,
(x
2
+ y
2
)
2
− 2c
2
(x
2
− y
2
) = 0.
Jak poprzednio, widzimy, że λ
= 0 i y = 0. Jeśli x = 0, to trzecie równanie
daje y
4
=
−2c
2
y
2
, a stąd y = 0. Zatem x
= 0, i z pierwszego równania
x
2
+ y
2
= c
2
. Wtedy z trzeciego równania mamy x
2
− y
2
=
1
2
c
2
. Stąd
x
2
=
3
4
c
2
i y
2
=
1
4
c
2
. Mamy zatem cztery punkty, w których współrzędna y
przyjmuje najmniejszą i najmniejszą wartość: (
±
√
3
2
c, ±
1
2
c). Punkt osobliwy
(0, 0) — jak poprzednio — nic nie wnosi.
Zauważmy jeszcze, że nie wyznaczaliśmy niewiadomej λ (co jest zresztą
banalne), bowiem rozwiązywanie układu równań ma sens do chwili, gdy
pojawi się lista punktów podejrzanych o ekstremum (najlepiej skończona).
b) Uzyskane dotychczas wyniki pozwalają na stwierdzenie, że lemniskata
Bernoulliego zawiera się w prostokącie P =
{(x, y): |x| c
√
2,
|y|
1
2
c}.
Więcej można się dowiedzieć przy użyciu współrzędnych biegunowych. Po
podstawieniu
x = r sin θ,
y = r cos θ,
r > 0,
równanie lemniskaty przyjmuje postać
r = c
√
2 cos 2θ,
co już umożliwia narysowanie krzywej i stwierdzenie, że w punkcie osobli-
wym (0, 0) krzywa ma samoprzecięcie.
Przykład 5. Wyznaczyć największą i najmniejszą wartość funkcji
f(x, y, z) = 11x + 11y − z
58
Rafał Sztencel: Wykłady z Analizy Matematycznej dla WNE
na zbiorze H wyznaczonym przez układ równań
x
2
+ y
2
+ z
2
= 171,
x + y + z = 21.
R o z w i ą z a n i e. Niech
F
1
(x, y, z) = x
2
+ y
2
+ z
2
− 171,
F
2
(x, y, z) = x + y + z
− 21.
Definiujemy F (x, y, z) = (F
1
(x, y, z), F
2
(x, y, z)).
Wtedy H =
{(x, y, z) ∈ R
3
: F (x, y, z) = 0
}. Nietrudno zobaczyć, że zbiór
H jest zwarty, jako domknięty i ograniczony. Jeszcze łatwiej zobaczyć, że
jest on po prostu okręgiem. W takim razie ciągła funkcja f przyjmuje na
H największą i najmniejszą wartość.
Funkcja f jest różniczkowalna na R
3
, zaś F : R
3
→ R
2
jest klasy C
1
.
I. Sprawdzimy, czy istnieją punkty osobliwe. Wektory grad F
1
= (2x, 2y, 2z)
i grad F
2
= (1, 1, 1), które tworzą macierz różniczki funkcji F , są na H
liniowo niezależne (nie są po prostu równoległe — gdyby były, mielibyśmy
x = y = z = 7, x
2
+ y
2
+ z
2
= 147
= 171).
W tak prostym przypadku być może nie opłaca się badanie rzędu macierzy
2x 2y 2z
1 1 1
.
Gdyby jej rząd był mniejszy niż 2, wszystkie trzy minory rzędu 2 musiałyby
znikać. Wtedy x
− y = 0, y − z = 0 i x − z = 0, co prowadzi do uzyskanego
już powyżej warunku.
Zatem wszystkie punkty na okręgu H są regularne.
II. Możemy teraz zastosować twierdzenie 1. Wyznaczamy funkcję Lagrange’a:
L(x, y, z) = f(x, y, z) + λ
1
F
1
(x, y, z) + λ
2
F
2
(x, y, z) =
= 11x + 11y
− z + λ
1
(x
2
+ y
2
+ z
2
− 171) + λ
2
(x + y + z
− 21).
Równania grad L(x, y, z) = 0, F (x, y, z) = 0 prowadzą do układu równań
11 + 2λ
1
x + λ
2
= 0,
11 + 2λ
1
y + λ
2
= 0,
−1 + 2λ
1
z + λ
2
= 0,
x
2
+ y
2
+ z
2
= 171,
x + y + z = 21
.
Widać, że λ
1
= 0 (w przeciwnym razie równanie drugie i trzecie byłyby
sprzeczne), z dwóch pierwszych równań wynika, że x = y. Udało się więc
nie wyznaczać mnożników Lagrange’a, bowiem układ równań
2x
2
+ z
2
= 171,
2x + z = 21
,
§ 0.12. Ekstrema warunkowe
59
łatwo rozwiązać, otrzymując x = y = 5 i z = 11, albo x = y = 9 i z = 3.
Znaleźliśmy dwa punkty podejrzane o ekstremum:
f(5, 5, 11) = 99,
f(9, 9, 3) = 195.
Ostatecznie 195 jest największą, a 99 najmniejszą wartością f na H.
Przykład 6. Wyznaczyć największą i najmniejszą wartość funkcji
f(x, y, z) = 2x + 2y − 3z
na zbiorze H wyznaczonym przez układ równań
x
2
+ y
2
+ z
2
= 2,
xy + yz + zx = −1.
R o z w i ą z a n i e. Niech
F
1
(x, y, z) = x
2
+ y
2
+ z
2
− 2,
F
2
(x, y, z) = xy + yz + zx = 1.
Definiujemy F (x, y, z) = (F
1
(x, y, z), F
2
(x, y, z)).
Wtedy H =
{(x, y, z) ∈ R
3
: F (x, y, z) = 0
}. Zbiór H jest zwarty, jako
domknięty podzbiór sfery. W takim razie ciągła funkcja f przyjmuje na H
największą i najmniejszą wartość.
Zbadamy teraz, czy w H istnieją punkty osobliwe. Mamy
grad F
1
(x, y, z) = (2x, 2y, 2z),
grad F
2
(x, y, z) = (y + z, z + x, x + y).
Operacje elementarne na macierzach nie zmieniają rzędu, mamy zatem
rank
2x
2y
2z
y + z z + x x + y
= rank
2x
2y
2z
x + y + z x + y + z x + y + z
=
= rank
x y z
0 0 0
1,
bowiem
(x + y + z)
2
= x
2
+ y
2
+ z
2
− 2(xy + yz + zx) = 0,
(4)
gdy (x, y, z)
∈ H, czyli każdy punkt zbioru H jest osobliwy!
Nie możemy zatem zastosować twierdzenia Lagrange’a. Zobaczmy, do czego
prowadzi próba rozwiązania równań grad L = 0, grad F = 0. Ponieważ
grad f (x, y, z) = (2, 2,
−3), więc równanie (1) ma postać:
(2, 2,
−3) + λ
1
(2x, 2y, 2z) + λ
2
(y + z, z + x, x + y) = (0, 0, 0).
60
Rafał Sztencel: Wykłady z Analizy Matematycznej dla WNE
Otrzymujemy układ równań skalarnych:
2 + λ
1
x + λ
2
(y + z) = 0,
2 + λ
1
y + λ
2
(x + z) = 0,
−3 + λ
1
z + λ
2
(x + y) = 0.
Dodajemy równania stronami:
1 + λ
1
(x + y + z) + 2λ
2
(x + y + z) = 0.
Ale na mocy (4) x + y + z = 0, gdy (x, y, z)
∈ H, czyli 1 = 0 — sprzeczność
pokazuje, że układ równań grad L = 0, F = 0 nie ma rozwiązań.
Zależność (4) może jednak nasunąć pomysł, jak wyjść z kłopotów. Wynika
z niej bowiem, że zbiór H mozna zdefiniować inaczej:
H = {(x, y, z): x
2
+ y
2
+ z
2
− 2 = 0, x + y + z = 0}.
Wystarczy teraz zmienić definicję funkcji F
2
:
F
2
(x, y, z) = x + y + z,
grad F
2
= (1, 1, 1).
Zbadamy, czy w H są punkty osobliwe:
rank
2x 2y 2z
1 1 1
= rank
x y z
1 1 1
= 2,
gdyby bowiem wszystkie minory stopnia 2 były równe zeru, mielibyśmy
x y
1 1
= x − y = 0, etc.
zatem x = y = z, ale x + y + z = 0, więc x = y = z = 0, a wtedy
x
2
+ y
2
+ z
2
= 0, co przeczy definicji zbioru H.
Punktów osobliwych zatem nie ma. Oto nowe równanie (1):
(2, 2,
−3) + λ
1
(2x, 2y, 2z) + λ
2
(1, 1, 1) = (0, 0, 0).
Wynika stąd, że λ
1
= 0, a zatem x = y. Z definicji zbioru H otrzymujemy
teraz 2x + z = 0, i 2x
2
+ z
2
= 2. Zatem z =
−2x i 3x
2
= 1. Łatwe rachunki
dają dwa rozwiązania:
1
3
,
1
3
, −2
1
3
,
,
−
1
3
, −
1
3
, 2
1
3
,
.
Największą i najmniejszą wartością funkcji f na H są odpowiednio 10
1
3
,
−10
1
3
.
§ 0.12. Ekstrema warunkowe
61
Kolejny przykład ilustruje to samo zjawisko.
Przykład 7. Wyznaczyć największą i najmniejszą wartość funkcji
f(x, y, z) = x + y + z
na zbiorze H wyznaczonym przez układ równań
x
2
+ y
2
+ z
2
= 1,
x
2
+ y
2
= 1.
R o z w i ą z a n i e. Niech
F
1
(x, y, z) = x
2
+ y
2
+ z
2
− 1,
F
2
(x, y, z) = x
2
+ y
2
− 1.
Definiujemy F (x, y, z) = (F
1
(x, y, z), F
2
(x, y, z)) i
H = {(x, y, z) ∈ R
3
: F (x, y, z) = 0
}.
Jak w poprzednim przykładzie, H jest zwarty i ciągła funkcja f przyjmuje
na nim największą i najmniejszą wartość.
Rozwiązujemy układ równań grad L = 0, grad F = 0. Ponieważ grad f (x, y, z) =
(1, 1, 1), więc równanie (1) ma postać:
(1, 1, 1) + λ
1
(2x, 2y, 2z) + λ
2
(2x, 2y, 0) = (0, 0, 0).
Równowazny mu układ równań skalarnych:
1 + 2λ
1
x + 2λ
2
x = 0,
1 + 2λ
1
y + 2λ
2
y = 0,
1 + 2λ
1
z = 0.
jest sprzeczny, bo z definicji zbioru H wynika, że z = 0. Ale możemy zdefi-
niować zbiór H inaczej:
H = {(x, y, z): x
2
+ y
2
− 1 = 0, z = 0}.
Zmieniamy definicję funkcji F
2
:
F
2
(x, y, z) = z,
grad F
2
= (0, 0, 1).
Zbadamy teraz, czy w H istnieją punkty osobliwe. Mamy
grad F
1
(x, y, z) = (2x, 2y, 0),
grad F
2
(x, y, z) = (0, 0, 1).
62
Rafał Sztencel: Wykłady z Analizy Matematycznej dla WNE
Badamy rząd macierzy utworzonej z gradientów F
1
i F
2
:
rank
2x 2y 0
0 0 1
= rank
x y 0
0 0 1
.
Rząd ostatniej macierzy jest równy 2, gdyby bowiem wszystkie minory stop-
nia 2 znikały, mielibyśmy
x 0
0 1
= x = 0,
y 0
0 1
= y = 0,
a to jest niemożliwe, bo x
2
+ y
2
= 1.
Punktów osobliwych zatem nie ma. Oto nowe równanie (1):
(1, 1, 1) + λ
1
(2x, 2y, 0) + λ
2
(0, 0, 1) = (0, 0, 0).
Wynika stąd, że λ
1
= 0, a zatem x = y. Dalej, 2x
2
= 1, i otrzymujemy dwa
rozwiązania:
1
2
,
1
2
, 0
,
−
1
2
, −
1
2
, 0
.
Największą i najmniejszą wartością funkcji f na H są odpowiednio
√
2 i
−
√
2.
W obu przykładach źródło trudności było to samo: zbiór H był częścią
wspólną dwóch powierzchni stycznych. Dlatego gradienty funkcji F
1
i E
2
były równoległe, a każdy punkt H — osobliwy. Osobliwość ta była jednak
pozorna, bo H można było zdefiniować jako część wspólną przecinających
się powierzchni.