Funkcje wielu zmiennych cia glość, różniczkowalność
Podajemy tu kilka definicji i twierdzeń (z dowodami, które w wiekszości zostana
pominiete na wyk lości
ladzie), które pozwola mówić o cia g i różniczkowalności funk-
cji wielu zmiennych. Z konieczności jest to tylko przegla d najważniejszych spośród
najbardziej podstawowych zagadnień. Definicji kuli wielowymiarowej nie podam na
wyk ale jest ono wygodne i powszechnie stosowane, wiec je tu umieszczam.
ladzie,
Definicja 16.1 (kuli k wymiarowej) *
Kula otwarta o środku p i promieniu r > 0 nazywamy zbiór
B(p, r) = {x " IRk: x - p < r} ,
kula domknieta o środku p i promieniu r > 0 zbiór
B(p, r) = {x " IRk: x - p d" r} .
Jasne jest, że jednowymiarowa kula otwarta o środku w punkcie p " IR i pro-
mieniu r > 0 jest przedzia o środku w punkcie p i d
l lugości 2r . Jednowymiarowa
kula domknieta ośrodku w punkcie p i promieniu r > 0 to po prostu przedzia
l
domkniety o środku w punkcie p i d
lugości 2r . W tym wymiarze kula domknieta
różni sie od otwartej (o tym samym środku i promieniu) jedynie dwoma punktami.
Jasne jest, że dwuwymiarowa kula otwarta o środku p " IR2 i promieniu r > 0 jest
ko o środku p i promieniu r jednak bez punktów brzegowych , tj. bez punktów,
lo
których odleg od p równa jest dok r . Kula domknieta o środku p i pro-
lość ladnie
mieniu r > 0 to ko z brzegiem o środku p i promieniu r . Trójwymiarowa kula
lo
otwarta to po prostu kula bez punktów brzegowych, a kula domknieta to kula z punk-
tami brzegowymi. Widać wiec, że te nazwy motywowane sa terminologia stosowana
do przestrzeni trójwymiarowej. Mimo, że może sie komuś wydawać śmiesznym nazy-
wanie przedzia kula , to jednak warto zap taka cene za jednolita terminologie
lu lacić
stosowana w odniesieniu do przestrzeni różnych wymiarów, to u formu
latwia lowanie
zarówno twierdzeń jak i ich dowodów.
Definicja 16.2 (zbioru otwartego w IRk )
Zbiór G nazywamy otwartym wtedy i tylko wtedy, gdy dla każdego punktu p " G
istnieje liczba dodatnia r taka, że B(p, r) ‚" G , czyli gdy z tego, że x - p < r
wynika, że x " G .
Jasne jest, że ca przestrzeń k wymiarowa jest zbiorem otwartym, w tym kon-
la
kretnym przypadku można przyja ć np. r = 13 . Również zbiór pusty jest otwarty.
*angielskie s ball
lowo:
1
Funkcje wielu zmiennych Micha Krych
l
Wynika to sta d, że jeśli poprzednik implikacji jest fa (czyli p " " ), to z tej
lszywy
nieprawdy już wszystko wynika w szczególności istnienie liczby r > 0 . Oczywiście
znów to rozumienie s wynika nie zawsze jest zgodne z potocznym, ale przyjeto
lowa
wynikanie w ten w sposób interpretować. Również otwarta kula k wymiarowa
laśnie
w przestrzeni k wymiarowej jest zbiorem otwartym: jeśli q " B(p, r) , to przyj-
muja c = r - q - p , otrzymujemy B(q, ) ‚" B(p, r) , bo jeÅ›li x - q < ,
to x - p d" x - q + q - p < + q - p = r . Z tego ostatniego zdania
wynika, że przedzia otwarty jest otwartym podzbiorem prostej. Natomiast odcinek
l
bez końców otwartym podzbiorem p
laszczyzny nie jest, bo przecież żaden jego punkt
nie jest środkiem dwuwymiarowej kuli, czyli ko zawartego w tym odcinku, bo od-
la
cinek w ogóle żadnego ko nie zawiera. Widzimy wiec, że to czy zbiór jest otwarty,
la
czy też nie, zależy nie tylko od samego zbioru, lecz również od tego z jakiego punktu
widzenia jest on rozpatrywany! Czytelnik sprawdzi bez trudu, że p
laszczyzna bez jed-
nego punktu, p laszczyzna bez skończenie
laszczyzna bez skończenie wielu punktów, p
wielu prostych sa otwartymi podzbiorami p
laszczyzny. Trójka t otwartym podzbiorem
p lo
laszczyzny nie jest, bo żadne ko o środku w punkcie leża cym na boku trójka ta za-
warte w trójka cie nie jest. Natomiast trójka t bez boków i wierzcho jest zbiorem
lków
otwartym, bo każdy punkt nie leża cy na boku trójka ta jest środkiem ko zawartego
la
w trójka cie bez boków. Podobnie kwadrat nie jest otwartym podzbiorem p
laszczyzny,
ale staje sie otwarty po usunieciu boków wraz z wierzcho Obszar nad parabola
lkami.
y = x2 , czyli zbiór takich punktów (x, y) , że y > x2 jest otwartym podzbiorem
p lożony
laszczyzny. Również obszar z z takich punktów (x, y) , że y < x2 jest otwarty.
Analogiczne przyk można rozważyć w przestrzeni trójwymiarowej, co pozosta-
lady
wiamy czytelnikom w charakterze prostego ćwiczenia.
Definicja 16.3 (zbioru domknietego w przestrzeni IRk )
Zbiór F ‚" IRk jest domkniety wtedy i tylko wtedy, gdy zbiór Rk \F jest otwarty.
Podane poprzednio przyk zbiorów otwartych daja od razu przyk zbiorów
lady lady
domknietych: z tego, że ca przestrzeń IRk jest zbiorem otwartym wnioskujemy
la
natychmiast, że zbiór pusty jest domkniety. Z tego, że zbiór pusty jest otwarty
wynika, że ca przestrzeń jest zbiorem domknietym. Ponieważ kula otwarta jest
la
zbiorem otwartym, wiec dope kuli otwartej jest zbiorem domknietym. Zbiory
lnienie
skończone sa domkniete, prosta jest podzbiorem domknietym p
laszczyzny, przestrzeni
trójwymiarowej. Jasne jest też, że k wymiarowa kula domknieta jest podzbiorem
domknietym przestrzeni IRk . To stwierdzenie uzasadnimy. Niech q " B(p, r) , tzn.
/
2
Funkcje wielu zmiennych Micha Krych
l
q - p > r . Niech = q - p - r . Oczywiście > 0 . Niech x " B(q, ) , tzn.
x - q < = q - p - r . Sta d wynika, że r < q - p - x - q d" x - p , co
oznacza, że x " B(p, r) , a wiec B(q, ) )" B(p, r) = " . Wykazaliśmy wiec, że kula
/
B(q, ) jest zawarta w dope kuli B(p, r) , a ponieważ q oznacza tu dowolny
lnieniu
punkt dope lnienie
lnienia kuli B(p, r) , wiec dope to jest otwarte, zatem sama kula
B(p, r) jest zbiorem domknietym w IRk .
Zbiory otwarte maja swoja charakteryzacje wewnetrzna nie ma konieczności
badania dope zbioru. W podobny sposób można scharakteryzować zbioru do-
lnienia
mkniete. Przyda sie nam do tego pojecie granicy cia gu punktów.
Definicja 16.4 (granicy cia gu punktów przestrzeni euklidesowej)
Cia g (pn) jest zbieżny do granicy p wtedy i tylko wtedy, gdy lim pn -p = 0 .
n"
Widać, że definicja ta różni sie od definicji cia gu liczbowego bardzo nieznacznie:
w przypadku cia gu wysta pi wartość bezwzgledna różnicy wyrazu cia gu i granicy,
la
w przypadku cia gu punktów przestrzeni mówimy o odleg wyrazu cia gu od grani-
lości
cy. Widać wyraznie, że różnica obu definicji jest raczej kosmetyczna niż merytoryczna
wartość bezwzgledna różnicy dwu liczb to przecież odleg miedzy nimi, jeśli
lość
o liczbach myślimy jak o punktach prostej.
Twierdzenie 16.5 (charakteryzuja ce zbiory domkniete)
Zbiór F jest domkniety wtedy i tylko wtedy, gdy z tego że punkty p1 , p2 , . . . należa
do zbioru F oraz p = lim pn wynika, że również p " F .
n"
Dowód. Za óżmy najpierw, że zbiór F jest domkniety, czyli że zbiór IRk \ F jest
l
otwarty. Niech p = lim pn i niech punkty cia gu (pn) należa do zbioru F . Jeśli
n"
p " F , to ponieważ zbiór IRk \ F jest otwarty, wiec istnieje taka liczba r > 0 , że
/
B(p, r) ‚" IRk \ F . Wobec tego w kuli B(p, r) nie ma punktów cia gu (pn) , bo one
leża w zbiorze F , a to oznacza, że dla każdej liczby naturalnej n zachodzi nierówność
pn -p e" r , wbrew temu, że lim pn -p = 0 . Za óżmy teraz, że zbiór F spe
l lnia
n"
warunek opisany w treści zadania i nie jest domkniety, tzn. jego dope nie jest
lnienie
otwarte. Istnieje wiec punkt p " IRk \ F taki, że żadna kula o środku p nie jest
1
1
zawarta w zbiorze IRk \ F . Niech pn " B(p, ) )" F . Mamy wiec pn - p < ,
n
n
zatem lim pn - p = 0 , czyli lim pn = p i wobec tego musi też być p " F ,
n" n"
wbrew uczynionemu za l
lożeniu. Dowód zosta zakończony.
Z twierdzenia tego wynika natychmiast, że np. zbiór IR2\{(0, 0)} nie jest zbiorem
3
Funkcje wielu zmiennych Micha Krych
l
1
domknietym. Mamy bowiem lim ( , 0) = (0, 0) " IR2 \ {(0, 0)} , chociaż oczywiście
/
n
n"
1
(n , 0) " IR2 \ {(0, 0)} . W taki sam sposób można wykazać, że zbiór Q z ze
lożony
wszystkich liczb wymiernych nie jest domknietym podzbiorem prostej: każda liczba
niewymierna jest granica cia gu liczb wymiernych. Zauważmy, że zbiór ten nie jest
również otwarty, bo również każda liczba wymierna może przedstawiona jako granica
cia gu liczb niewymiernych. Widzieliśmy wiec, że istnieja zbiory, które sa jednocześnie
otwarte i domkniete ( IRk i " ), istnieja też zbiory, które nie sa ani otwarte ani do-
mkniete!
Twierdzenie 16.6 (charakteryzuja ce zbieżność cia gów w IRk )
Cia g (pn) punktów przestrzeni k wymiarowej jest zbieżny do punktu p " IRk wtedy
i tylko wtedy, gdy lim pi,n = pi dla i = 1, 2, . . . , k , tu pn = (p1,n, p2,n, . . . , pk,n)
n"
dla n = 1, 2, . . . i p = (p1, p2, . . . , pk) .
Dowód. Dla każdego i " {1, 2, . . . , k} zachodzi nierówność:
|pi,n - pi| d" |p1,n - p1|2 + |p2,n - p2|2 + · · · + |pk,n - pk|2 = pn - p ,
z której wynika od razu, że jeśli lim pn = p , to lim pi,n = pi dla każdego i "
n" n"
{1, 2, . . . , k} . W druga strone twierdzenie wynika natychmiast z definicji odleg
lości:
pod pierwiastkiem jest k sk lożenia.
ladników i każdy z nich da ży do 0, co jest treścia za
Dowód zosta zakończony.
l
Twierdzenie to pozwala w istocie rzeczy sprowadzać badanie zbieżności cia gu
punktów przestrzeni k wymiarowej do badania zbieżności k cia gów liczbowych.
Istotna role w przypadku cia gów liczbowych gra twierdzenie Bolzano Weierstrassa.
lo
Gwarantowa ono możliwość wybierania podcia gów zbieżnych z cia gów ograniczo-
lo
nych. Twierdzenie to pozostaje w mocy w przypadku wielowymiarowym. Przed sfor-
mu
lowaniem tego twierdzenia wypada powiedzieć, że cia g (zbiór) nazywamy ogra-
niczonym, jeśli wszystkie jego wyrazy (elementy) znajduja sie w pewnej kuli. Przy-
pomnijmy, że w jednowymiarowym przypadku kulami sa przedzia wiec ta defini-
ly,
cja to po prostu uogólnienie definicji stosowanej w przypadku jednowymiarowym.
Warto od razu zauważyć, że jeśli cia g punktów przestrzeni IRk jest ograniczony, to
również cia gi liczbowe: utworzony z jego pierwszych wspó
lrzednych, utworzony z dru-
gich wspó
lrzednych itd. sa zbieżne. Czytelnik bez trudu stwierdzi, że jeśli wszystkie
cia gi utworzone ze wspó
lrzednych o ustalonym numerze sa ograniczone, to również
cia g punktów przestrzeni k wymiarowej jest ograniczony. Twierdzenie to nie by
lo
omówione w czasie wyk tu jednak je zamieszczam w przekonaniu, że niektórym
ladu,
studentom zapoznanie sie z nim u nauke matematyki.
latwi
4
Funkcje wielu zmiennych Micha Krych
l
Twierdzenie 16.7 (Bolzano Weiertrassa, przypadek wielowymiarowy)
Z każdego ograniczonego cia gu (pn) punktów przestrzeni IRk można wybrać podcia g
zbieżny do pewnego punktu p " IRk , tzn. istnieje ściśle rosna cy cia g (nj) liczb
naturalnych taki, że zachodzi równość lim pn = p .
j
j"
Dowód. Z poprzedniego twierdzenia wynika, że trzeba wybrać cia g (nj) w taki
sposób, by wszystkie cia gi p1,n , p2,n ,. . . , pk,n by zbieżne. Twierdzenie
ly
j j j
Bolzano Weierstrassa jest prawdziwe dla cia gów liczbowych, zatem istnieje cia g (nj)
taki, że cia g (p1,n ) jest zbieżny, ale nie wiemy nic o nastepnych k - 1 cia gach:
j
(p2,n ) , (p3,n ) , itd. Możemy jednak skorzystać z tego, że wszystkie podcia gi cia gu
j j
zbieżnego też sa zbieżne i to do tej samej granicy. Zasta pimy wiec cia g wyjściowy (pn)
cia giem (pn ) (wiec pierwsze wspó
lrzedne tworza cia g zbieżny) i z tego cia gu wybie-
j
rzemy podcia g (pn ) w taki sposób, by cia g (p2,n ) by zbieżny. Jest to możliwe, bo
l
j j
cia g (p2,n ) jest ograniczony, wiec możemy zastosować jednowymiarowe twierdzenie
j
Bolzano Weiertrassa. Uzyskamy wiec w ten sposób cia g (pn ) , którego pierwsze i
j
drugie wspó
lrzedne tworza cia gi zbieżne.* Wystarczy te procedure zastosować jesz-
cze kolejno k - 2 razy, by uzyskać podcia g, którego wszystkie wspó
lrzedne: pierwsze,
drugie, itd. tworza cia gi zbieżne, dzieki czemu również sam podcia g jest zbieżny.
Dowód zosta zakończony.
l
Podamy teraz jedna z najważniejszych definicji tej cześci wyk
ladu.
Definicja 16.8 (zbioru zwartego)
Zbiór C nazywamy zwartym wtedy i tylko wtedy, gdy z każdego cia gu punktów
zbioru C można wybrać podcia g zbieżny do punktu leża cego w zbiorze C .
Zbiory zwarte moga być definiowane w taki sposób w nieco ogólniejszej sytuacji
niż rozpatrywana przez nas, moga to być mianowicie podzbiory tzw. przestrzeni me-
trycznych. Podamy teraz twierdzenie, które w ogólnej sytuacji nie jest prawdziwe,
ale jest prawdziwe i bardzo użyteczne w przypadku tych zbiorów, którymi zajmować
sie bedziemy w tej przysz
lości.
Twierdzenie 16.9 (charakteryzuja ce zbiory zwarte w przestrzeni IRk )
Zbiór C ‚" IRk jest zwarty wtedy i tylko wtedy, gdy jest domkniety i ograniczony.
Dowód. Za óżmy, że zbiór C ‚" IRk jest zwarty. JeÅ›li C nie jest ograniczony, to dla
l
każdej liczby naturalnej n istnieje taki punkt pn " C , że pn " B(0, n) . Oznacza to,
/
że pn e" n . Ponieważ C jest zbiorem zwartym, wiec z cia gu (pn) wybrać można
*Pierwsze bo podciag ciagu zbieżnego jest zbieżny, drugie bo tak wybieramy.
5
Funkcje wielu zmiennych Micha Krych
l
podcia g zbieżny (pn ) do pewnego punktu p " C . Sta d wynika, że cia g pn - p
j j
jest zbieżny do 0, wiec jest ograniczony. Zachodzi nierówność pn d" p + pn -p ,
j j
a z niej i ze zdania poprzedniego wynika, że cia g pn jest ograniczony, co oczywiście
j
przeczy temu, że pn e" nj . Wykazaliśmy wiec, że podzbiór zwarty przestrzeni IRk
j
musi być ograniczony. Teraz wykażemy, że musi być również domkniety. Za óżmy, że
l
nie jest domkniety. Wtedy istnieje cia g (pn) punktów zbioru C zbieżny do punktu
p " C . Wszystkie podcia gi cia gu (pn) sa oczywiście zbieżne do punktu p , wiec nie
/
można wybrać z tego cia gu podcia gu, którego granica należa do C . Wobec tego
laby
podzbiór zwarty przestrzeni IRk musi być też domkniety. Czas na dowód implikacji
przeciwnej. Zak
ladamy teraz, że zbiór C ‚" IRk jest domkniety i ograniczony. Niech
(pn) bedzie cia giem punktów zbioru C . Na mocy twierdzenia Bolzano Weierstrassa
można zeń wybrać podcia g (pn ) zbieżny do pewnego punktu p . Ponieważ zbiór
j
C jest domkniety a wyrazy cia gu (pn ) sa elementami zbioru domknietego C , wiec
j
również jego granica, czyli punkt p jest elementem zbioru C . Wykazaliśmy wiec,
że z cia gu punktów zbioru C można wybrać podcia g zbieżny do punktu leża cego w
zbiorze C , a to oznacza, że C jest zbiorem zwartym. Dowód zosta zakończony.
l
Interesuja nas nie tylko zbiory, ale również funkcje, w tym funkcje cia g Defi-
le.
nicja cia gowa (Heinego) cia g funkcji przenosi sie na przypadek wielowymiarowy
lości
bez żadnych zmian. JeÅ›li A ‚" IRk i f: A - IRl jest funkcja okreÅ›lona na zbiorze A ,
to f jest cia g w punkcie p " IRk wtedy i tylko wtedy, gdy z tego, że lim pn = p ,
la
n"
pn " A wynika, że lim f(pn) = f(p) . Można również przeformu definicje
lować
n"
otoczeniowa (Cauchy ego): funkcja f: A - IRl jest cia g w punkcie p " A wte-
la
dy i tylko wtedy, gdy dla każdej liczby µ > 0 istnieje taka liczba ´ > 0 , że jeÅ›li
q " A i q - p < ´ , to f(q) - f(p) < µ . Ponieważ definicje te nie różnia
sie od podawanych w przypadku jednowymiarowym, wiec dowód ich równoważności
pomijamy, zreszta nie różni sie on od dowodu w przypadku jednowymiarowym niczym
istotnym. Warto też dodać, że jeśli funkcje f, g sa cia g i odpowiednia operacja na
le
nich jest zdefiniowana, to cia g sa również funkcje f Ä… g , f · g (iloczyn skalarny),
le
f ×g (iloczyn wektorowy), f-1 (np. jeÅ›li wartoÅ›ciami funkcji sa macierze odwracalne
i f(x)-1 oznacza macierz odwrotna do macierzy f(x) ), f ć% g (z funkcji f z
lożenie
funkcja g ). Natomiast funkcja odwrotna do funkcji cia g może nie być cia g jeśli
lej la:
" "
f(t) = (2 + cos t) cos(t 2), (2 + cos t) sin(t 2), sin t ,
to funkcja f jest różnowartościowa, wiec ma funkcje odwrotna , ale ta funkcja odwrot-
na nie ma ani jednego punktu cia g
lości.
6
Funkcje wielu zmiennych Micha Krych
l
Dzieki twierdzeniu Bolzano Weierstrassa pozostaje też w mocy
Twierdzenie 16.10 (Weierstrassa o osia ganiu kresów przez funkcje cia g
la )
JeÅ›li f: C - IR jest funkcja cia g w każdym punkcie zbioru zwartego C ‚" IRk , to
la
istnieja punkty p, q " C takie, że dla każdego punktu x " C zachodzi nierówność
podwójna f(p) d" f(x) d" f(q) , czyli f(p) jest najmniejsza wartościa funkcji f zaś
f(q) najwieksza .
Twierdzenie to ma kapitalne znaczenie. Pozwala ono stwierdzać, że np. poszuki-
wana przez nas najwieksza wartość funkcji istnieje, co zwalnia nas z obowia zku prze-
prowadzania czesto k
lopotliwych rozumowań w konkretnych sytuacjach. Już w przy-
padku funkcji jednej zmiennej by podane przyk jego stosowania. Teraz mieć
ly lady
to bedzie jeszcze wieksze znaczenie, bo trudniej w przypadku funkcji wielu zmien-
nych mówić o jej monotoniczności niż w jednowymiarowym przypadku, zreszta gdy
zbiór jest skomplikowany, może to być w ogóle niewykonalne ( w prostych sytuacjach
można rozpatrywać dana funkcje wielu zmiennych kolejno jako funkcje zmiennej x1 ,
potem jako funkcje zmiennej x2 , . . . ). Przyk pojawia sie nieco pózniej.
lady
Zajmiemy sie teraz różniczkowaniem funkcji wielu zmiennych. Zaczniemy od
pojecia pochodnej cza stkowej, bo jest ono najprostszym z tych, którymi przyjdzie
nam sie zaja ć. W tym rozdziale, jeśli nie napiszemy wyraznie, że jest inaczej, funk-
cja f: G - IRl bedzie okreÅ›lona na zbiorze otwartym G ‚" IRk . Bedziemy starać
sie przenieść twierdzenia użyteczne dla optymalizacji funkcji o wartościach rzeczywi-
stych, czyli dla znajdowania ich wartości najmniejszych oraz najwiekszych. W nie-
których przypadkach pojecie pochodnej cza stkowej nam wystarczy, a w niektórych
zmuszeni zostaniemy do użycia pojecia różniczki funkcji, które zdefiniujemy pózniej.
Definicja 16.11 (pochodnej cza stkowej)
Pochodna cza stkowa pierwszego rzedu odwzorowania f: G - IRl ze wzgledu na
f(p+hei)-f(p)
zmienna xi , 1 d" i d" k , w punkcie p " G , nazywamy granice lim ,
h
h0
o ile istnieje; ei " IRk to wektor, którego wszystkie wspó
lrzedne z wyja tkiem i tej
sa równe 0 a i ta równa jest 1: ei = (0, . . . , 0, 1, 0, . . . , 0) . Te pochodna cza stkowa
"f
oznaczamy symbolem (p) .
"xi
4
Przyk 16.1 Niech f(x) = x1 + 2x3 + x3ex . Z definicji pochodnej cza stkowej
lad
2
wynika, że zachodzi nastepuja cy wzór:
"f f(x + he1) - f(x) f(x1 + h, x2, x3, x4) - f(x1, x2, x3, x4)
(x) = lim = lim =
"x1 h0 h h0 h
7
Funkcje wielu zmiennych Micha Krych
l
4 4
x1 + h + 2x3 + x3ex - (x1 + 2x3 + x3ex )
2 2
= lim = 1 .
h0 h
"f
Pochodna funkcji f obliczamy traktuja c x1 jako argument funkcji f przy jed-
"x1
noczesnym traktowaniu zmiennych x2 , x3 , x4 jako sta (parametrów). Oblicza-
lych
"f "f
4
ja c analogicznie otrzymujemy jeszcze trzy równości: (x) = 6x2 , (x) = ex ,
2
"x2 "x3
"f
4
(x) = x3ex .
"x4
r r cos Õ
Przyk 16.2 Niech f = tym razem wspó
lad lrzedne punktów
Õ r sin Õ
piszemy pionowo, co jak sie okaże pózniej ma sens. Obliczymy pochodna tej
funkcji wzgledem zmiennej r :
r + h r (r + h) cos Õ r cos Õ
f - f -
Õ Õ (r + h) sin Õ r sin Õ
"f
r
= lim = lim =
Õ
"r h0 h h0 h
cos Õ cos Õ
= lim = .
sin Õ sin Õ
h0
Teraz kolej na pochodna wzgledem zmiennej Õ :
r r r cos(Õ + h) r cos Õ
f - f -
Õ + h Õ r sin(Õ + h) r sin Õ
"f
r
= lim = lim =
Õ
"Õ h0 h h0 h
ëÅ‚ öÅ‚
r cos(Õ+h)-r cos Õ
lim
h
-r sin Õ
h0
íÅ‚ Å‚Å‚
= = .
r sin(Õ+h)-r sin Õ
r cos Õ
lim
h
h0
Widzimy wiec, że w przypadku odwzorowania o wartościach w IR2 otrzymaliśmy
wektor, a nie liczbe! Rezultat ten jest dok taki, jakiego należa sie spodziewać.
ladnie lo
Jeśli funkcja o wartościach w przestrzeni IRl ma w punkcie pochodna wzgledem jed-
nej ze swych k zmiennych, to ta pochodna cza stkowa jest wektorem l wymiarowym.
W
laściwie na tym można by skończyć, ale warto jeszcze otrzymany rezultat zinter-
pretować fizycznie.* Można myśleć, że wartościa funkcji f jest punkt p
laszczyzny od-
0 0
dalony o r od punktu lub wektor zaczynaja cy sie w punkcie i kończa cy
0 0
r r cos Õ
sie w punkcie f = traktujemy wiec liczby r i Õ jako tzw.
Õ r sin Õ
wspó laszczyzny. Przy obliczaniu pochodnej wzgledem
lrzedne biegunowe punktu p
* Do przeczytania dalszej cześci tego przyk wystarczy rozumieć pojecie predkości znane z
ladu
lekcji fizyki w szkole.
8
Funkcje wielu zmiennych Micha Krych
l
r traktujemy zmienna Õ jako sta Możemy interpretować zmienna r jako czas.
la .
r + h (r + h) cos Õ
Po zmianie czasu o h znajdujemy sie w punkcie f = .
Õ (r + h) sin Õ
Znalezliśmy sie wiec w punkcie leża cym na tej samej pó
lprostej wychodza cej z punktu
(0, 0) , ale w innej odleg od pocza tku uk wspó lości
lości ladu lrzednych. Zmiana odleg
równa jest zmianie czasu. Wobec predkość skalarna powinna być równa 1 a wektor
predkości powinien być równoleg do pó
ly lprostej, po której porusza sie punkt. Wektor
cos Õ 0
jest równoleg do pó i przechodza cej
ly lprostej wychodza cej z punktu
sin Õ 0
r cos Õ
przez punkt . Jego d to 1. Jest to wektor równy predkości wektorowej
lugość
r sin Õ
poruszaja cego sie punktu. Podobnie można zinterpretować pochodna wzgledem Õ .
Tym razem r sie nie zmienia, natomiast zmienia sie ka t jaki tworzy wektor o pocza tku
0 r cos Õ
i końcu z osia odcietych (pozioma osia uk wspó
ladu lrzednych).
0 r sin Õ
W tej sytuacji Õ oznacza zarówno czas jak i ten ka t. Wobec tego ruch odbywa
0
sie po okregu o środku i promieniu r . Chwilowa predkość wektorowa jest
0
wiec wektorem stycznym do tego okregu. D tego wektora to oczywiście r , bo
lugość
"f
r -r sin Õ
predkość ka towa równa jest 1. Wektorowi = przys obie
luguja
Õ r cos Õ
"Õ
te w
lasnoÅ›ci. Jest on wektorem predkoÅ›ci chwilowej w tym ruchu w momencie Õ .
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
r r cos Õ cos È
Å‚Å‚ íÅ‚ Å‚Å‚
Przyk 16.3 Niech fíÅ‚ Õ = r cos Õ sin È . Tym razem należy myÅ›leć
lad
È r sin Õ
o tzw. wspó lościa ladu
lrzednych sferycznych: liczba r jest odleg od pocza tku uk
ëÅ‚ öÅ‚
0
íÅ‚ Å‚Å‚
wspó
lrzednych, Õ szerokoÅ›cia geograficzna na sferze o Å›rodku 0 i promie-
0
niu r , zaÅ› È d
lugościa geograficzna na tej sferze. Obliczamy pochodne cza stkowe
wzgledem kolejnych zmiennych:
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚ ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
r cos Õ cos È r -r sin Õ cos È
"f "f
íÅ‚ Å‚Å‚= íÅ‚ Å‚Å‚ íÅ‚ Å‚Å‚= íÅ‚ Å‚Å‚
Õ cos Õ sin È , Õ -r sin Õ sin È ,
"r "Õ
È sin Õ È r cos Õ
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
r -r cos Õ sin È
"f
íÅ‚ Å‚Å‚= íÅ‚ Å‚Å‚
Õ r cos Õ cos È .
"È
È 0
9
Funkcje wielu zmiennych Micha Krych
l
ëÅ‚ öÅ‚
r
"f
íÅ‚ Å‚Å‚,
Pierwsza z nich, Õ to wektorowa predkość w ruchu jednostajnym po promie-
"r
È
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
0 r cos Õ cos È
íÅ‚ Å‚Å‚ íÅ‚ Å‚Å‚
niu wychodza cym z punktu 0 i przechodza cym przez punkt r cos Õ sin È ;
0 r sin Õ
ëÅ‚ öÅ‚
r
"f
íÅ‚ Å‚Å‚,
druga z nich, Õ to predkość wektorowa w ruchu po po
ludniku z predkościa
"Õ
È
ka towa 1 (zachowujemy promień sfery i d geograficzna , jedynie szerokość geo-
lugość
ëÅ‚ öÅ‚
r
"f
íÅ‚ Å‚Å‚, to predkość w ruchu po równoleżniku
graficzna zmienia sie); trzecia to Õ
"È
È
z predkościa ka towa 1 (zachowujemy promień sfery i szerokość geograficzna , jedy-
nie d geograficzna zmienia sie). W pierwszym przypadku predkość skalarna
lugość
ëÅ‚ öÅ‚
0
íÅ‚ Å‚Å‚
równa jest 1, bo czas równy jest odleg od punktu 0 , w drugim predkość
lości
0
skalarna równa jest promieniowi po
ludnika (bo predkość ka towa jest równa 1) czyli
r , w trzecim natomiast predkość skalarna równa jest promieniowi równoleżnika (bo
predkość ka towa również w tym przypadku równa jest 1) czyli r cos Õ . OczywiÅ›cie te
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
r r
"f
íÅ‚ Å‚Å‚, "f íÅ‚ Å‚Å‚
predkoÅ›ci skalarne równe sa odpowiednio d Õ
lugoÅ›ciom wektorów Õ
"r "Õ
È È
ëÅ‚ öÅ‚
r
"f
íÅ‚ Å‚Å‚.
i Õ
"È
È
0, jeśli x = 0 = y;
x
Przyk 16.4 Niech f = xy Funkcja ta nie
lad
, jeśli x = 0 lub y = 0.
y
x2+y2
0 x
1
jest cia g w punkcie , bowiem dla x = 0 mamy f = i jednocześnie
la
2
0 x
0 0
1
f = 0 = . Oznacza to, że jeśli zbliżamy sie do punktu wedruja c wzd
luż
2
0 0
0
prostej o równaniu y = x , to wartości badanej funkcji nie da ża do 0 = f .
0
Oczywiście jest to jedyny punkt niecia g tej funkcji. Zbadamy teraz kwestie ist-
lości
nienia pochodnych cza stkowych funkcji f . We wszystkich punktach z wyja tkiem
0
punktu pochodne cza stkowe istnieja , co wynika od razu z twierdzeń pozwa-
0
laja cych na obliczanie pochodnej funkcji jednej zmiennej rzeczywistej. Również w
10
Funkcje wielu zmiennych Micha Krych
l
0
punkcie funkcja f ma pochodne cza stkowe. Wykażemy to. Mamy
0
h 0
f - f
0 0
0 - 0
lim = lim = 0 .
h0 h h0 h
"f "f
0 0
Wykazaliśmy, że = 0 . W taki sam sposób wykazujemy, że = 0 .
0 0
"x "y
"f y3 - x2y
x
Zauważmy jeszcze, że jeśli x = 0 lub y = 0 , to = wynika to
y
"x
(x2 + y2)2
natychmiast z twierdzenia o pochodnej ilorazu dwu funkcji jednej zmiennej. Analo-
"f x3 - xy2
x
gicznie = . Zachecamy czytelnika do samodzielnego sprawdzenia
y
"y
(x2 + y2)2
tych wzorów oraz do sprawdzenia, że pochodne cza stkowe, które w znalezliśmy,
laśnie
0
sa niecia g w punkcie .
le
0
Przyk czwarty pokazuje, że stwierdzenie istnienia pochodnych cza stkowych
lad
w jakimÅ› punkcie, a nawet w ca dziedzinie funkcji nie pozwala jeszcze zbyt wiele
lej
na temat tej funkcji wywnioskować z istnienia pochodnych cza stkowych nie wynika
nawet cia g funkcji! Jasne jest, że potrzebne nam sa w
lość lasności pozwalaja ce na
stwierdzanie cia g funkcji i co wiecej na stwierdzanie, że jej zachowanie w ma
lości lym
otoczeniu punktu różniczkowalności jest w przybliżeniu takie jak funkcji liniowej. To
jest podstawowa idea w rachunku różniczkowym. Stosowaliśmy rozumowania oparte
na tej w idei wielokrotnie w przypadku funkcji jednej zmiennej. To one dopro-
laśnie
wadzi nas do sformu
ly lowania twierdzeń pozwalaja cych na ustalanie w jakich prze-
dzia funkcja różniczkowalna jest monotoniczna, w jakich punktach może mieć
lach
lokalne ekstrema itd. Podamy teraz definicje różniczkowalności funkcji wielu zmien-
nych i warunek wystarczaja cy dla różniczkowalności.
Definicja 16.12 (funkcji różniczkowalnej w punkcie)
Funkcja f: G - IRl określona na zbiorze G otwartym w IRk jest różniczkowalna
w punkcie p " G wtedy i tylko wtedy, gdy istnieje taka macierz L , że
f(p+h)-f(p)-Lh
lim = 0 .
h
h0
Wtedy macierz L nazywamy różniczka funkcji f w punkcie p i oznaczamy symbo-
lem Df(p) lub df(p) lub f (p) .
Pochodna cza stkowa obliczana jest po to, by uzyskać informacje o tym jak zmie-
nia sie funkcja w kierunku jednej z osi uk wspó
ladu lrzednych. Różniczke, o ile ist-
nieje, obliczamy po to, by dowiedzieć sie jak zachowuje sie funkcja w ca otoczeniu
lym
11
Funkcje wielu zmiennych Micha Krych
l
punktu. Pojeciem pośrednim jest pochodna kierunkowa.
Definicja 16.13 (pochodnej kierunkowej)
Pochodna funkcji f: G - IRl w punkcie p , w kierunku wektora v nazywamy
granice
f(p + tv) - f(p)
lim ,
t0
t
jeśli ta granica istnieje. Te pochodna oznaczamy symbolem fv(p) .
Jasne jest, że w uogólniliśmy pojecie pochodnej cza stkowej:
laśnie
"f
(p) = fe (p) .
i
"xi
Pochodna kierunkowa w kierunku wektora v obliczana jest po to, by ocenić tempo
zmian funkcji w otoczeniu punktu p na prostej przechodza cej przez punkt p rów-
noleg do wektora v . W punktach różniczkowalności funkcji pochodna kierunkowa
lej
można latwo znalezć po obliczeniu różniczki funkcji.
Twierdzenie 16.14 (Fermata)
Jeśli p jest punktem wewnetrznym dziedziny G funkcji f: G - R , f(p) jest
najwieksza lub najmniejsza wartościa funkcji f i istnieje fv(p) , to fv(p) = 0 .
Dowód. Ponieważ p leży wewna trz zbioru G , wiec istnieje taka liczba ´ > 0 , że
jeÅ›li |t| < ´ , to p+tv " G . Ponieważ f(p) jest najwieksza wartoÅ›cia funkcji f , wiec
dla każdej liczby t , dla której 0 < |t| < ´ , zachodzi nierówność f(p + th) d" f(p) .
f(p+tv)-f(p) f(p+tv)-f(p)
Z niej wynika, że jeÅ›li -´ < t < 0 , to e" 0 oraz d" 0 ,
t t
gdy 0 < t < ´ . Pierwsza nierówność powoduje, że fv(p) e" 0 . Z drugiej wynika, że
fv(p) d" 0 . La cza c obie otrzymujemy fv(p) = 0 .
Twierdzenie 16.15 (o istnieniu pochodnej kierunkowej w punktach
różniczkowalności funkcji)
Jeśli funkcja f: G - IRl jest różniczkowalna w punkcie p " G , v " IRk , to funkcja
f ma w punkcie p pochodna kierunkowa w kierunku wektora v i zachodzi równość:
fv(p) = Df(p)v .
Dowód. Mamy
f(p+tv)-f(p) f(p+tv)-f(p)-Df(p)(tv) tv
lim = lim · + Df(p)v = Df(p)v
t tv t
t0 t0
tv
skorzystaliśmy tu z tego, że iloczyn wyrażenia , ograniczonego, i wyrażenia
t
da ża cego do 0 ma granice 0 oraz z tego, że Df(p)(tv) = tDf(p)v i oczywiście z
12
Funkcje wielu zmiennych Micha Krych
l
tego, że f jest różniczkowalna w punkcie p , z czego wynika od razu, że
f(p + tv) - f(p) - Df(p)(tv)
lim = 0 .
t0
tv
W ten sposób zakończyliśmy dowód tego twierdzenia.
Z tego twierdzenia wynika w szczególności, że przy ustalonym punkcie p po-
chodna fv(p) jest liniowa funkcja wektora v oczywiście pod warunkiem różniczko-
walnoÅ›ci funkcji f w tym punkcie. Oznacza to, że fÄ…v+²w(p) = Ä…fv(p) + ²fw(p)
dla dowolnych liczb rzeczywistych Ä…, ² i dowolnych wektorów v, w " Rk .
0 x
x2y
Czytelnik zechce sprawdzić, że jeśli f = 0 i f = , gdy przynajmniej
0 y x2+y2
jedna z liczb x , y jest różna od 0, to fv(0) = f(v) dla każdego wektora v " IRk .
W tym przypadku pochodna w kierunku wektora v w punkcie 0 nie jest wiec liniowa
funkcja wektora v , a co za tym idzie funkcja f nie jest różniczkowalna w punkcie 0 .
Zachecamy do sprawdzenia, że f jest w tym punkcie cia g
la.
Powtórzmy: z różniczkowalności funkcji w punkcie wynika istnienie pochod-
nych kierunkowych w tym punkcie we wszystkich kierunkach, w szczególności ist-
nienie pochodnych cza stkowych. Z istnienia pochodnych cza stkowych nie wynika na-
xy
wet cia g funkcji widzieliśmy to na przyk funkcji . Można podać
lość ladzie
x2+y2
przyk funkcji która w pewnym punkcie ma pochodne kierunkowe we wszystkich
lad
kierunkach i to równe 0 i jednocześnie nie jest cia g w tym punkcie. Oznacza to,
la
że zbadanie zachowania sie funkcji na prostych przechodza cych przez dany punkt
to jedynie wstep do zbadania zachowania sie tej funkcji w otoczeniu tego punktu.
Tych kwestii nie bedziemy jednak dok analizować, bo to wykracza znacznie
ladnie
poza potrzeby wiekszości chemików.
Definicja 16.16 (gradientu funkcji)
Wektor grad f(p) nazywamy gradientem funkcji f różniczkowalnej w punkcie p ,
jeÅ›li Df(p)v = grad f(p) · v dla każdego wektora v " Rk .
-
--------------------
"f "f "f
Z definicji wynika od razu, że grad f(p) = (p), (p), . . . , (p) róż-
"x1 "x1 "xk
nica miedzy gradientem i różniczka jest na tym etapie czysto formalna. Różniczka to
macierz (ewentualnie przekszta liniowe), a gradient to wektor.
lcenie
Rozważmy teraz funkcje f: G - IR różniczkowalna w punkcie p " G . Niech v
i w oznaczaja takie wektory, że v = grad f(p) i w = grad f(p) . Mamy wtedy
fv(p) = Df(p)v = v · grad f(p) = v · w d" v · w = w 2 = fw(p) .
Wykazaliśmy wiec
13
Funkcje wielu zmiennych Micha Krych
l
Twierdzenie 16.17 (o kierunku najszybszego wzrostu funkcji)
Pochodna funkcji f w kierunku gradientu funkcji w danym punkcie p jest najwieksza
spośród wszystkich pochodnych w tym punkcie w kierunku wektorów o d
lugości
grad f(p) .
Zwykle mówimy, że gradient wskazuje kierunek najszybszego wzrostu funkcji, bo
pochodna mierzy tempo zmian funkcji, jeśli pochodna jest dodatnia to funkcja rośnie.
Rozważanie jedynie wektorów o danej d
lugości jest konieczne, bo fąv(p) = ąfv(p)
dla dowolnego punktu p , dowolnego wektora v i dowolnej liczby rzeczywistej Ä… ,
a my chcemy porównywać tempo wzrostu funkcji wzd prostych przechodza cych
luż
przez punkt p oczywiście przy za
lożeniu, że po każdej prostej poruszamy sie z ta sama
predkościa podany w tym zdaniu wzór stwierdza po prostu, że zmiana predkości
poruszania sie po prostej przechodza cej przez p powoduje wzrost predkości zmian
funkcji w takim samym stosunku. W istocie rzeczy s gradient nie jest niezbedne
lowo
w tym wyk ale ponieważ jest ono używane powszechnie we wszystkich jezykach,
ladzie,
wiec my też go unikać nie bedziemy.
Twierdzenie 16.18 (o różniczce z
lożenia dwu funkcji)
Za óżmy, że funkcja g jest różniczkowalna w punkcie p a funkcja f w punkcie g(p)
l
oraz że z
lożenie f ć%g jest zdefiniowane, tj. dziedzina funkcji f zawiera zbiór wartości
funkcji g . Wtedy z
lożenie f ć% g jest różniczkowalne w punkcie p i zachodzi równość:
D(f ć% g)(p) = Df(g(p)) · Dg(p) , tu kropka oznacza mnożenie macierzy.
g(p+h)-g(p)-Dg(p)h
Dowód. Niech r(h) = dla h = 0 i r(0) = 0 . Wobec tego
h
g(p + h) = g(p) + Dg(p)h + r(h) · h . Różniczkowalność funkcji g w punkcie p to
po prostu cia g funkcji r w punkcie 0 .
lość
Analogicznie różniczkowalność funkcji f w punkcie g(p) to cia g funkcji ,
lość
f(g(p)+H)-g(p)-Df((p))H
zdefiniowanej za pomoca równości (H) = i (0) = 0 , w
H
punkcie 0 .
Mamy teraz
f(g(p + h)) = f(g(p)) + Df(g(p)) g(p + h) - g(p) +
g(p
+ g(p + h) - g(p) · + h) - g(p) =
= f(g(p)) + Df(g(p)) Dg(p)h + r(h) h +
Dg(p)h + r(h) h =
+ Dg(p)h + r(h) h ·
= f(g(p)) + Df(g(p))Dg(p)h +
Dg(p) h + r(h) .
+ h · Df(g(p))r(h) + Dg(p)h + r(h) h ·
h
Dg(p) h + r(h) jest ograniczone oraz że zachodzi
Jasne jest, że wyrażenie
h
14
Funkcje wielu zmiennych Micha Krych
l
równość lim Df(g(p))r(h) + Dg(p)h + r(h) h = 0 , a sta d już wynika,
latwo
h0
Dg(p) h + r(h) = 0 , czyli że
że lim Df(g(p))r(h) + Dg(p)h + r(h) h ·
h
h0
f(g(p+h))-f(g(p))-Df(g(p))Dg(p)h
lim = 0 , a to oznacza, że
h
h0
D(f ć% g)(p) = Df(p) · Dg(p) .
Dowód zosta zakończony.
l
Jeśli studenci zechca , to moga zauważyć, że ten dowód w istocie rzeczy sugeruje,
że można (i w rzeczywistości należy) myśleć o wydzielaniu cześci sta ( f(g(p)) ),
lej
a nastepnie liniowej ( Df(g(p))Dg(p)h ) przekszta gdy usi znalezć jego
lcenia, lujemy
różniczke w danym punkcie. Można to prześledzić na jakimś przyk czego w
ladzie,
tym miejscu nie zrobimy, ale zachecamy czytelników do samodzielnego znalezienia co
najmniej jednej pochodnej w ten sposób.
Nastepne twierdzenie podamy bez dowodu.
Twierdzenie 16.19 (o różniczce funkcji odwrotnej)
Za óżmy, że funkcja f: G - IRl jest różniczkowalna w punkcie p zbioru otwartego
l
G ‚" IRk , że jej zbiór wartoÅ›ci jest otwarty w IRl , że różniczka Df(p) jest macierza
odwracalna oraz że funkcja f jest różnowartościowa i funkcja odwrotna f-1 jest
cia g w punkcie f(p) . Wtedy funkcja f-1 jest różniczkowalna w punkcie f(p)
la
i zachodzi równość D(f-1)(p) = (Df(p))-1 .
Warto jedynie zaznaczyć, że g ównym problemem w tym twierdzeniu jest istnie-
l
nie różniczki przekszta odwrotnego. Sam wzór jest konsekwencja twierdzenia o
lcenia
pochodnej z
lożenia dwu funkcji ( f i f-1 ).
Dwa ostatnie twierdzenia pokazuja , że należy myśleć o pochodnej (różniczce)
funkcji wielu zmiennych jako o macierzy. Dodać należy, że twierdzenie o różniczce
z l
lożenia dwu funkcji to jedna z g ównych przyczyn, dla których mnożenie macierzy
jest zdefiniowane w w taki sposób.
laśnie
Pokażemy jedno z licznych zastosowań tego twierdzenia. Niech ł: (-1, 1) - Rk
bedzie funkcja różniczkowalna . Wtedy wektor ł (t0) jest styczny w punkcie ł(t0) do
obrazu funkcji ł , czyli do krzywej z ze wszystkich punktów postaci ł(t) , gdzie
lożonej
t " (-1, 1) . Należy myśleć, że w chwili t poruszaja cy sie punkt materialny znajduje
sie w miejscu ł(t) . W takiej sytuacji naturalnym pomys jest przyjecie, że wek-
lem
tor ł (t) to wektor predkości chwilowej w momencie t . Oczywiście predkość jest
styczna do drogi. Te kilka zdań to oczywiście agitacja, ale jedna z definicji wektora
15
Funkcje wielu zmiennych Micha Krych
l
stycznego do krzywej to w one (po opuszczeniu treści fizycznej, która jest przy-
laśnie
czyna przyjecia w takiej definicji wektora stycznego) . W szczegó wchodzić
laśnie ly
nie bedziemy z braku czasu.
Za óżmy, że f: Rk - R i ł: (-1, 1) - Rk sa funkcjami różniczkowalnymi
l
oraz że istnieje taka liczba c , że f ł(t) = c dla t " (-1, 1) . Wtedy
0 = (f ć% Å‚) (0) = Df Å‚(0) · Å‚ (0) = grad f Å‚(0) · Å‚ (0) .
Wykazaliśmy, że wektory grad f ł(0) i ł (0) sa prostopad Jeśli poprowadzi-
le.
my przez punkt p := ł(0) wszystkie możliwe krzywe różniczkowalne, to otrzymamy
wszystkie wektory styczne do powierzchni f(x) = c w punkcie p . Każdy z nich
jest prostopad do gradientu funkcji f w punkcie p . Oznacza to, że gradient jest
ly
prostopad do p
ly laszczyzny * Jeśli ten gradient jest niezerowy, to możemy znalezć
równanie p
laszczyzny stycznej .
Przyk 16.5 Niech f(x, y) = y - sin x i niech c = 0 . Zbiór M zdefiniowany
lad
1
równaniem 0 = f(x, y) to wykres funkcji sinus. Niech p = (Ą , ) . Mamy wiec
6 2
Ä„ 1 1 Ä„
f( , ) = - sin = 0 , czyli p " M . Wektory styczne do zbioru M (czyli do
6 2 2 6
sinusoidy) w punkcie p sa prostopad do wektora
le
"
Ä„ 1 Ä„ 3
grad f( , ) = (- cos , 1) = (- , 1) .
6 2 6 2
Jeśli punkt (x, y) leży na stycznej do M w punkcie p , to
" "
3 Ä„ 1 3 Ä„ 1
0 = (- , 1) · (x - , y - ) = - (x - ) + (y - ) .
2 6 2 2 6 2
Czytelnik bez trudu rozpozna równanie prostej stycznej do sinusoidy w punkcie
Ä„ 1
p = ( , ) , które poprzednio otrzymywaliśmy nieco inaczej. Zauważy też, że w przy-
6 2
padku wykresu dowolnej funkcji różniczkowalnej otrzymany na opisanej teraz drodze
rezultat bedzie identyczny z uzyskiwanym przez skorzystanie z definicji prostej stycz-
nej do wykresu funkcji podanej w pierwszym semestrze.
Przyk 16.6 Niech f(x, y, z) = x2 + y2 + z2 i niech c = 14 . Niech M bedzie
lad
zbiorem z
lożonym z tych punktów (x, y, z) , dla których zachodzi równość
14 = c = f(x, y, z) = x2 + y2 + z2 .
Oczywiście p := (1, -2, 3) " M . Zbiór M jest sfera , której środkiem jest punkt
"
(0, 0, 0) i której promień jest równy 14 . Znajdziemy p
laszczyzne styczna do tej
sfery w punkcie p = (1, -2, 3) . Mamy grad f(1, -2, 3) = (2, -4, 6) .
Jeśli (x, y, z) " , to
*To nie zawsze jest p l
laszczyzna, np. zwykle wymiar równy jest k-1 , wiec dla k>3 mówimy na ogó
o przestrzeni stycznej do powierzchni f(x)=c .
16
Funkcje wielu zmiennych Micha Krych
l
0 = (x - 1, y + 2, z - 3) · (2, -4, 6) = 2(x - 1) - 4(y + 2) + 6(z - 3) .
Otrzymaliśmy równanie p
laszczyzny stycznej do sfery M w punkcie (1, -2, 3) .
Przyk 16.7 Uk równań y = 0 i (x - 7)2 + z2 = 25 opisuje okra g o środku
lad lad
w punkcie (7, 0, 0) i promieniu 5 leża cy w p
laszczyznie wyznaczonej przez osie OX
i OZ . Równanie (x-7)2 + z2 = 25 możemy przepisać w postaci 14x = x2 + z2 +24 .
Z tego równania wynika, że 196x2 = (x2 + z2 + 24)2 przy czym to ostatnie równanie
równoważne jest poprzedniemu przy za
lożeniu, że x e" 0 . Zastepuja c x2 w równaniu
196x2 = (x2 + z2 + 24)2 przez x2 + y2 otrzymujemy równanie powierzchni powsta
lej
w wyniku obrotu okregu (x - 7)2 + z2 = 25 leża cego w p l
laszczyznie y = 0 wokó osi
OZ ta powierzchnia wygla da jak napompowana detka, np. rowerowa; matematycy
zwa ja torusem. Tak otrzymane równanie tej powierzchni ma postać
2
196(x2 + y2) = x2 + y2 + z2 + 24 .
Latwo można przekonać sie, że jednym z punktów tej powierzchni jest p := (6, 8, 4) .
2
Niech f(x, y, z) = x2 + y2 + z2 + 24 - 196(x2 + y2) . Jasne jest, że równanie torusa
można zapisać jako f(x, y, z) = 0 . Zachodzi równość
grad f(x, y, z) = 2x(x2 +y2 +z2)-392x, 2y(x2 +y2 +z2)-392y, 2z(x2 +y2 +z2) . Z
niej wynika, że grad f(6, 8, 4) = (-960, -1080, 928) . Równanie p
laszczyzny stycznej
ma wiec postać:
0 = (x-6, y -8, z -4)·(-960, -1280, 928) = -960(x-6)-1280(y -8)+928(z -4) .
Po podzieleniu przez 32 otrzymujemy -30(x - 6) - 40(y - 8) + 29(z - 4) , czyli
30x + 40y - 29z - 384 = 0 .
Uwaga 16.20 (na deser) Najprostsze funkcje to liniowe.
Jeśli f(x, y) = Ax + By + C , to grad f(x, y) = []A, B] . Wynika sta d, że
wektor (A, B) jest prostopad do prostej stycznej zbioru opisanego równaniem
ly
0 = f(x, y) = Ax + By + C , czyli do prostej Ax + By + C = 0 .
Jeśli f(x, y, z) = Ax+By +Cz +D , to grad f(x, y, z) = (A, B, C) , wiec wektor
(A, B, C) jest prostopad do p
ly laszczyzny stycznej do zbioru opisanego równaniem
0 = f(x, y, z) = Ax + By + Cz + D , wiec do p
laszczyzny Ax + By + Cz + D = 0 .
To akurat wiemy od dawna. Okaza sie jednak, że jest to szczególny przypadek
lo
ogólniejszego twierdzenia.
x
xy
Przyk 16.8 Niech f = . Znajdziemy kresy tej funkcji w zbiorze
lad
y x2+y2
IR2 \{0} . Zauważmy najpierw, że jeśli t = 0 , to f(tx) = f(x) dla dowolnego x = 0 ,
w
lasność ta nazywana jest jednorodnościa stopnia 0 funkcji. Wynika sta d, że w celu
17
Funkcje wielu zmiennych Micha Krych
l
znalezienia kresów funkcji f wystarczy rozpatrywać jej wartości w punktach dowol-
nie ustalonego okregu o środku w punkcie 0 , np. okregu o promieniu 1. Okra g ten jest
oczywiście zbiorem domknietym i ograniczonym, czyli zwartym. Wobec tego nasza
funkcja przyjmuje w jakimś punkcie tego okregu swa najwieksza wartość i w jakimś
innym punkcie tego okregu swa wartość najmniejsza . Wobec tego, że funkcja ta jest
jednorodna stopnia 0, ta najmniejsza wartość jest najmniejsza wartościa w ca
lej
dziedzinie funkcji i przyjmowana jest nie tylko w jednym punkcie, ale we wszyst-
kich punktach prostej przechodza cej przez ten punkt i 0 , z wyja tkiem oczywiście
punktu 0 , w którym funkcja nie jest zdefiniowana. To samo można powiedzieć o
wartości najwiekszej.
x x
"f y3-x2y "f x3-xy2
Mamy = oraz = . Widać, że gradient jest wek-
"x y (x2+y2)2 "y y (x2+y2)2
torem zerowym wtedy i tylko wtedy, gdy x2 = y2 , czyli gdy x = Ä…y . Podsta-
x
x
1
wiaja c x = ąy otrzymujemy f = oraz f = -1 . Wynika sta d, że naj-
x 2 -x 2
1 1
wieksza wartościa tej funkcji jest zaś najmniejsza - . Szukanie kresów zosta
lo
2 2
zakończone.
Nadmienić wypada, że rozwia zane przed chwila zadanie można rozwia zać nic
o pochodnych nie wiedza c. Znajdziemy kres górny wartości funkcji. Mamy znalezć
x 0
xy
najmniejsza liczbe k , taka że jeśli = zachodzi nierówność d" k , tzn.
y 0 x2+y2
1 1·1 1
kx2 - xy + ky2 e" 0 . Oczywiście k e" = . Dla k = nierówność przybiera
2 12+12 2
1 1 1
postać: 0 d" x2 - xy + y2 = (x - y)2 , wiec jest prawdziwa. Sta d od razu wynika,
2 2 2
-x x
xy
1
że liczba jest kresem górnym funkcji . Z równości f = -f wynika
2 x2+y2 y y
natychmiast, że kresem dolnym funkcji f jest -1 .
2
x -y
x2-y2
Uwaga: okaza sie, że grad f = , wiec ten wektor jest prostopad
lo ly
y (x2+y2)2 x
x x
do wektora , wobec tego pochodna kierunkowa w kierunku wektora i każdego
y y
do niego równoleg równa jest 0, zatem funkcja f jest sta na pó
lego la lprostej wycho-
x
dza cej z 0 i przechodza cej przez korzystaliśmy z tego w rozwia zaniu, a teraz
y
pokazaliśmy inne, bardziej uczone uzasadnienie tego stwierdzenia.
x
xy
Przyk 16.9 Niech f = . Funkcja ta jest poprawnie określona
lad
y x2-2xy+9y2
w zbiorze IR2 \ {0} , bo x2 - 2xy + 9y2 = (x - y)2 + 5y2 = 0 wtedy i tylko wtedy,
x 0
gdy y = 0 = x - y , czyli gdy = . Znajdziemy kresy tej funkcji w zbiorze
y 0
IR2 \ {0} . Podobnie jak w poprzednim przyk f(tx) = f(x) dla dowolnych
ladzie
t = 0 i x = 0 , wiec w celu znalezienia kresów funkcji f wystarczy rozpatrywać jej
wartości w punktach dowolnie ustalonego okregu o środku w punkcie 0 , np. okregu
18
Funkcje wielu zmiennych Micha Krych
l
o promieniu 1. Okra g ten jest oczywiście zbiorem domknietym i ograniczonym, czyli
zwartym. Wobec tego nasza funkcja przyjmuje w jakimÅ› punkcie tego okregu swa
najwieksza wartość i w jakimś innym punkcie tego okregu swa wartość najmniej-
sza . Ta najmniejsza wartość jest najmniejsza wartościa w ca dziedzinie funkcji i
lej
przyjmowana jest nie tylko w jednym punkcie, ale we wszystkich punktach prostej
przechodza cej przez ten punkt i 0 , z wyja tkiem oczywiście punktu 0 , w którym
funkcja nie jest zdefiniowana. To samo dotyczy wartości najwiekszej.
x x
"f 9y3-x2y "f x3-9xy2
Mamy = oraz = . Widać, że gradient
"x y (x2-2xy+9y2)2 "y y (x2-2xy+9y2)2
jest wektorem zerowym wtedy i tylko wtedy, gdy x2 = 9y2 , czyli gdy x = Ä…3y .
3y 3y
1
Podstawiaja c x = ą3y otrzymujemy f = oraz f = -1 . Wynika sta d, że
y 4 -y 4
1 1
najwieksza wartościa tej funkcji jest zaś najmniejsza - . Szukanie kresów zosta
lo
4 8
zakończone.
Nadmienić wypada, że rozwia zane przed chwila zadanie może rozwia zać liceali-
sta, który nic o pochodnych nie wie.
Znajdziemy kres górny wartości funkcji, czyli taka najmniejsza liczbe k " R , że
x 0
xy
jeśli = , to d" k , tzn. kx2 - (2k + 1)xy + 9ky2 e" 0 . Oczywiście
y 0 x2-2xy+9y2
1 1·1
k e" = > 0 . Aby nierówność kx2-(2k+1)xy+9ky2 e" 0 by spe
la lniona
8 12-2·1·1+9·12
dla wszystkich liczb x przy ustalonych k i y , wyróżnik trójmianu kwadratowego nie
może być dodatni:
0 e" " = (2k + 1)2y2 - 36k2y2 = y2(2k + 1 - 6k)(2k + 1 + 6k) = y2(1 - 4k)(1 + 8k),
1 1
co oznacza, że 1 - 4k d" 0 , czyli k e" . Dla k = nierówność przybiera postać:
4 4
xy
1 `&
e" , czyli x2 - 2xy + 9y2 e" 4xy , tzn. 0 d" x2 - 6xy + 9y2 = (x - 3y)2 ,
4 x2-2xy+9y2
xy
1
wiec jest prawdziwa. Liczba jest zatem kresem górnym funkcji .
4 x2-2xy+9y2
x 0
xy
Jeśli nierówność e" k zachodzi dla wszystkich " R2 \ { } ,
x2-2xy+9y2 y 0
(-1)·1
1
to k d" = - < 0 , wiec k musi być liczba ujemna . Nierówność
(-1)2-2(-1)·1+9·12 12
xy
e" k jest równoważna nierówności kx2 - (2k + 1)xy + 9ky2 d" 0 ,a ta za-
x2-2xy+9y2
chodzi dla wszystkich x " R przy ustalonym y i k < 0 , gdy
0 e" " = (2k+1)2y2 -36k2y2 = y2(2k+1-6k)(2k+1+6k) = y2(1-4k)(1+8k), wiec
xy
gdy 1 + 8k d" 0 , czyli gdy k d" -1 . Nierówność e" -1 jest równoważna
8 x2-2xy+9y2 8
nierówności 0 d" x2 + 6xy + 9y2 = (x + 3y)2 , wiec jest prawdziwa. Oznacza to, że
xy
kresem dolnym funkcji jest liczba -1 .
x2-2xy+9y2 8
Przyk 16.10 Znajdziemy najmniejsza i najwieksza wartość wyrażenia xy2z3
lad
`&
Mianownik jest dodatni: x2-2xy+9y2>0 , gdy x = 0 lub y = 0
19
Funkcje wielu zmiennych Micha Krych
l
za
lożywszy, że x, y, z e" 0 i x + y + z = 6 .
x x
y y
Niech C = : x e" 0, y e" 0, z e" 0, x + y + z = 6 i f = xy2z3 .
z z
Funkcja f jest cia g na IR3 , wiec również na zbiorze C . Zbiór C jest ograniczony,
la
x
y
bo jeśli punkt znajduje sie zbiorze C , to 0 d" x d" 6 , 0 d" y d" 6 , 0 d" z d" 6 . Jest
z
x
n
yn
też domkniety, to jeśli " C , czyli xn e" 0 , yn e" 0 , zn e" 0 , xn+yn+zn = 6 oraz
zn
x x
xn
y
yn y
lim = , to również 0 d" x , 0 d" y , 0 d" z i x + y + z = 6 , czyli " C .
z
n"
zn z
Ograniczony i domkniety podzbiór IR3 jest zwarty, wiec funkcja cia g określona
la
na tym zbiorze przyjmuje w jakimś jego punkcie wartość najmniejsza i w jakimś
punkcie wartość najwieksza . C oczywiście nie zawiera żadnej kuli, wiec nie można
tu stosować twierdzenia o zerowaniu sie gradientu w punktach lokalnego ekstremum.
Można natomiast wyznaczyć jedna z trzech zmiennych za pomoca dwu pozosta
lych,
y
np. x = 6-y-z i rozważyć funkcje dwu zmiennych: g = (6-y-z)y2z3 na zbiorze
z
y
D = : 0 d" y, 0 d" z, y + z d" 6 . Zbiór D , podobnie jak C , jest zwarty. Funk-
z
cja g jest cia g w każdym punkcie p
la laszczyzny, wiec również w punktach zbioru D
i wobec tego przyjmuje w jakimś punkcie tego zbioru wartość najmniejsza i w ja-
kimś punkcie wartość najwieksza . Latwo zauważyć, że zbiór D jest trójka tem
0 6 0
prostoka tnym równoramiennym którego wierzcho sa punkty , i .
lkami
0 0 6
Na brzegu tego trójka ta, czyli w punktach prostej y = 0 , w punktach prostej
z = 0 oraz w punktach prostej y + z = 6 funkcja g przyjmuje wartość 0.
Wewna trz trójka ta przyjmuje wartości dodatnie. Wobec tego jej najmniejsza
wartościa jest liczba 0, a wartość najwieksza jest przyjeta w pewnym punkcie we-
wnetrznym. W tym punkcie wewnetrznym gradient funkcji g jest równy 0 .
y -y2z3 + 2yz3(6 - y - z)
Mamy grad g = . Obie wspó
lrzedne maja być
z -y2z3 + 3y2z2(6 - y - z)
równe 0, a ponieważ szukamy punktów wewna trz trójka ta D , wiec y > 0 i z > 0 , za-
-y + 2(6 - y - z) = 0, 3y + 2z = 12,
tem musza być spe równości czyli
lnione
-z + 3(6 - y - z) = 0, 3y + 4z = 18.
Wynika sta d, że z = 3 i y = 2 . Ponieważ wartość najwieksza jest przyjmowana
2
w pewnym punkcie, a jedynym kandydatem jest punkt , wiec najwieksza wartościa
3
2
funkcji g na zbiorze D jest liczba g = (6 - 2 - 3)2233 = 108 .
3
x
Przyk 16.11 Niech f = xy2e-x-2y . Znajdziemy kresy tej funkcji w pierw-
lad
y
x
szej ćwiartce uk wspó
ladu lrzednych, tj. w zbiorze C = : x e" 0, y e" 0 . We
y
wszystkich punktach brzegu zbioru funkcja przyjmuje wartość 0, wewna trz wartości
20
Funkcje wielu zmiennych Micha Krych
l
sa dodatnie. Kresem dolnym jest wiec 0. Zajmiemy sie kresem górnym. Zachodzi
x
y2(1-x)
równość grad f = e-x-2y . Jedynym punktem zerowania sie gradientu
y xy(2-2y)
1
funkcji f wewna trz dziedziny jest punkt . Wartość funkcji w tym punkcie równa
1
t2
jest e-3 . Z wzoru et = 1 + t + + · · · wynika, że w pierwszej ćwiartce uk
ladu
2!
(x+2y)4
wspó . Sta d wynika, że
lrzednych zachodzi ex+2y e"
4!
x
xy2 4!xy2
4!
f = xy2e-x-2y = d" d" < e-3 ,
y ex+2y (x+2y)4 x+2y
gdy x + 2y > 4!e3 . Wobec tego kres górny funkcji w pierwszej ćwiartce jest taki sam
x
jak w zbiorze : x e" 0, y e" 0, x + 2y d" 4!e3 . Ten ostatni zbiór jest zwarty,
y
wiec funkcja f , jako cia g przyjmuje w jakimś jego punkcie wartość najwieksza ,
la,
która jest oczywiście wieksza lub równa e-3 . Wobec tego, że na brzegu tego zbioru
zachodzi co najmniej jedna z równości: x = 0 , y = 0 , x + 2y = 4!e3 , wartość naj-
wieksza przyjmowana jest w punkcie wewnetrznym. W tym punkcie gradient musi
1
być wektorem zerowym. Wobec tego jest to punkt . Wobec tego kresem górnym
1
1
tej funkcji jest liczba f = e-3 . Zadanie zosta rozwia zane.
lo
1
Drugi sposób znalezienia kresu górnego.
Do momentu znalezienia gradientu rozumujemy tak, jak poprzednio. Mamy wiec
x
"f
= y2(1 - x)e-x-2y . Jeśli wiec potraktujemy y jako sta to wraz ze wzrostem
la ,
"x y
x funkcja f rośnie na przedziale [0, 1] i maleje na pó
lprostej [1, +") . Wobec tego
1
jej najwieksza wartościa jest f = y2e-1-2y .
y
Teraz znajdujemy najwieksza wartość funkcji y2e-1-2y na pó
lprostej [0, ") .
1
"f
Pochodna jest funkcja = 2y(1-y)e-1-2y , której wartości sa dodatnie na prze-
"y y
dziale (0, 1) , a ujemne na pó
lprostej (1, ") . Wobec tego funkcja y2e-1-2y rośnie
na przedziale [0, 1] , a na pó
lprostej [1, ") maleje. Jej najwieksza wartościa jest
1
wiec liczba f = e-3 .
1
To zadanie można od razu sprowadzić do poszukiwania wartości najwiekszych i naj-
mniejszych funkcji jednej zmiennej, bo interesuja ca nas funkcja jest iloczynem dwu
funkcji nieujemnych: funkcji xe-x zmiennej x oraz funkcji y2e-2y zmiennej y, ta
obserwacja oczywiście upraszcza rozwia zanie!
x
2
Przyk 16.12 Niech f = (x + 3y)e-x -3y . Znajdziemy kresy tej funkcji
lad
y
x
w pierwszej ćwiartce uk wspó : x e" 0, y e" 0 .
ladu lrzednych, tj. w zbiorze C =
y
Zauważmy, że we wszystkich punktach zbioru C wartości funkcji sa liczbami nie-
0
ujemnymi przy czym tylko w punkcie wartościa jest 0, w pozosta punktach
lych
0
wartości sa dodatnie. Wynika sta d od razu, że kresem dolnym funkcji jest liczba 0.
21
Funkcje wielu zmiennych Micha Krych
l
Znajdziemy kres górny funkcji f . Rozpoczniemy od znalezienia gradientu funkcji:
x 1-2x(x+3y)
2
grad f = · e-x -3y . Gradient ten równy jest 0 wtedy i tylko wtedy,
y 1-x-3y
1 1
gdy x = i jednocześnie y = . Wartościa funkcji w tym punkcie jest e-3/4 .
2 6
2
(x2+3y)2
t2
Z wzoru et = 1 + t + + · · · wynika, że jeÅ›li x, y e" 0 , to ex +3y e" . Sta d
2! 2!
" "
" "
x
2
22+62 x2+y2 40 x2+y2
2!(x+3y) 2x+6y
f = (x + 3y)e-x -3y d" = d" = .
y (x2+3y)2 x4+6x2y+9y2 x4+6x2y+9y2 x4+6x2y+9y2
Mianownik jest suma sk
ladników stopnia 2 lub wiekszego, wobec tego dla dużych
argumentów powinien być dużo wiekszy od licznika. Za óżmy, że x + y > 10 , x e" 0
l
oraz y e" 0 . Wykażemy, że wtedy zachodzi nierówność x4 + 6x2y + 9y2 e" x2 + y2 :
x4 + 6x2y + 9y2 - (x2 + y2) = x4 + (6y - 1)x2 + 8y2 e"
e" x4 + 6(10 - x) - 1 x2 = x2(x2 - 6x + 59) = x2 (x - 3)2 + 50 e" 0 .
"
"
"
x
40 x2+y2
40
"
Wobec tego f d" = . Jeśli x + y > 100, x e" 0, y e" 0 , to
y x2+y2
x2+y2
"
x
1 40 1 1 3
"
x2 + y2 e" (x + y)2 > 5000 , wiec f d" < < = 1 - d" e-3/4 .
2 y 10 4 4
5000
Wobec tego kres górny funkcji f w zbiorze C jest równy kresowi górnemu tej funkcji
x
w zbiorze D = : x e" 0, y e" 0, x + y d" 100 . D jest zbiorem zwartym, wiec
y
kres górny funkcji f jest jej wartościa w pewnym punkcie tego zbioru. Może to być
punkt wewnetrzny, w którym gradient jest równy 0 lub też punkt z brzegu tego
zbioru. W punktach brzegu musi zachodzić jedna z trzech równości x = 0 , y = 0 ,
x + y = 100 . Ostatni przypadek nie jest interesuja cy, bo już wykazaliśmy, że w ta-
1/2
kich punktach wartości funkcji sa mniejsze niż f = e-3/4 . Za óżmy wiec, że
l
1/6
2
y = 0 . Mamy teraz do czynienia z wyrażeniem xe-x , którego pochodna równa jest
2
1
"
(1 - 2x2)e-x , wiec jest dodatnia w przedziale (0, ) natomiast w każdym punkcie
2
2
1
"
pó
lprostej ( , +") pochodna ta jest ujemna. Wynika sta d, że wyrażenie xe-x
2
1
"
przyjmuje swa najwieksza wartość w punkcie x = . Ta najwieksza wartościa jest
2
1
"
e-1/2 . Liczba ta jest mniejsza niż e-3/4 , można to sprawdzić bez użycia sprzetu
2
elektronicznego podnosza c obie liczby do potegi 4 i korzystaja c z nierówności e < 4 .
Musimy jeszcze zbadać wyrażenie ye-3y . Jego pochodna to (1 - 3y)e-3y , jest ona
1
dodatnia na przedziale (0, ) , ujemna na pó
lprostej (1 , +") , zatem wyrażenie to
3 3
1 1
przyjmuje swa wartość najwieksza w punkcie y = i wartość ta jest równa e-1 i
3 3
jest ona mniejsza niż e-3/4 . Wykazaliśmy w ten sposób, że kresem górnym funkcji
1/2
f w zbiorze C jest liczba e-3/4 = f .
1/6
Drugi sposób znalezienia kresu górnego.
Podobnie jak w poprzednim przyk możemy znalezć kres górny funkcji f ba-
ladzie
22
Funkcje wielu zmiennych Micha Krych
l
2
daja c kolejno dwie funkcje jednej zmiennej. Potraktujemy wyrażenie (x+3y)e-x -3y
jako funkcje zmiennej y , a x e" 0 jako parametr. Pochodna tego wyrażenia to
x
2
"f
= 3(1 - x - 3y)e-x -3y . Jeśli x e" 1 , to pochodna ta jest ujemna dla y > 0 ,
"y y
2
wiec wyrażenie (x+3y)e-x -3y maleje ze wzrostem zmiennej y , wiec jego najwieksza
2
1-x
wartościa jest xe-x . Jeśli 0 d" x < 1 , to w przedziale (0, ) pochodna jest dodat-
3
nia a na pó
lprostej (1-x, +") ujemna, wobec tego w tym przypadku najwieksza
3
2 2
jego wartościa jest x + 31-x e-x -3(1-x)/3 = e-x +x-1 . Trzeba teraz znalezć kres
3
2
górny funkcji zmiennej x określonej w przedziale [0, 1) wzorem e-x +x-1 a na
2
pó
lprostej [1, +") wzorem xe-x . W pierwszym przypadku możemy skorzystać
1 3
z równości -x2 + x - 1 = -(x - )2 - , a w drugim stwierdzamy po obliczeniu
2 4
pochodnej, że na interesuja cej nas pó
lprostej [1, +") funkcja maleje. Sta d wynika,
1
że najwieksza wartościa tej funkcji zmiennej x jest wartość w punkcie x = i jest
2
ona równa e-3/4 .
x
2
Przyk 16.13 Niech f = (x + y)e-x -3y . Znajdziemy kresy tej funkcji
lad
y
x
w pierwszej ćwiartce uk wspó
ladu lrzednych, tj. w zbiorze C = : x e" 0, y e" 0 .
y
Bedziemy postepować tak, jak w przyk poprzednim, bo funkcja jest podobna.
ladzie
x 1-2x(x+y)
2
Mamy grad f = ·e-x -3y . Ten gradient zeruje sie jedynie w punkcie
y 1-3x-3y
3/2
, który to punkt leży poza pierwsza ćwiartka . Wewna trz pierwszej ćwiartki
-7/6
funkcja jest dodatnia, na brzegu też, z wyja tkiem punktu 0 , w którym wartościa f
jest liczba 0. Wobec tego kresem dolnym jest 0. Należy znalezć kres górny. Mamy
2
(x2+3y)2 1
ex +3y e" = (x4 + 6x2y + 9y2) w każdym punkcie zbioru C . Jeśli za
lożymy
2! 2
1 1
dodatkowo, że x + y e" 10 , to (x4 + 6x2y + 9y2) e" (x2 + y2) , co wykazaliśmy
2 2
w poprzednim przyk Wobec tego
ladzie.
"
"
"
x
2
2 2 x2+y2
2(x+y)
"2 2
f = (x + y)e-x -3y d" d" = .
y x2+y2 x2+y2
x2+y2
1 "
2 2 1
Mamy f = 2e-4 > > = . JeÅ›li wiec x2 + y2 e" 2 2 · 50 x, y e" 0 Ò!
1 34 100 50
x 1
x + y e" x2 + y2 , to f < f , zatem kres górny funkcji f w zbiorze C równy
y 1
jest kresowi górnemu funkcji f w zbiorze
"
x
D = : x2 + y2 d" 2 2 · 50, x e" 0, y e" 0 .
y
Ten zbiór jest zwarty, wiec kres górny funkcji cia g f w tym zbiorze jest jej wartościa
lej
w pewnym punkcie tego zbioru. Nie może to być jego punkt wewnetrzny, bo gradient
sie nie zeruje. Musi wiec to być punkt brzegowy. W gre wchodza teoretycznie trzy
"
możliwoÅ›ci: x2 + y2 = 2 2 · 50 , x = 0 i y = 0 . Pierwsza zosta już wykluczona,
la
23
Funkcje wielu zmiennych Micha Krych
l
"
bo w punktach dla których x2 + y2 = 2 2·50 , wartość funkcji f jest mniejsza niż
1
jej wartość w punkcie . Jeśli x = 0 , to mamy do czynienia z wyrażeniem ye-3y ,
1
1
którego najwieksza wartościa jest e-1 , co można latwo sprawdzić (zob. przyk
lad
3
2
poprzedni). Jeśli y = 0 , to mamy do czynienia z wyrażeniem xe-x , które przyjmuje
1 1
" "
swa najwieksza wartość w punkcie , wartość ta równa jest e-1/2 . Ta ostatnia
2 2
1
liczba, wieksza niż e-1 , jest kresem górnym funkcji f w zbiorze D , wiec również
3
w zbiorze C . Podobnie jak w poprzednich przyk można rzecz ca sprowadzić
ladach la
do kolejnego badania dwu funkcji jednej zmiennej rzeczywistej, najpierw np. zmien-
nej y , potem zmiennej x . Zachecamy czytelnika do samodzielnego rozwia zania tego
zadania drugim sposobem.
Zadanie rozpatrywane w tym przyk jest pozornie prawie tożsame z poprzednim.
ladzie
Jednak czasem pozory myla !
Przyk 16.14 Wykażemy, że gradient funkcji f zdefiniowanej wzorem
lad
x
f = 2(1 - e2y + x2)3 - 3(1 - e2y + x2)2 - 24x2e2y
y
zeruje sie w dok jednym punkcie, że w tym punkcie funkcja ma lokalne maksi-
ladnie
mum w lu).
laściwe, chociaż jest nieograniczona z góry (i z do
x
Zaczniemy od kresów. Mamy f = 2x6 - 3x4 - 24x2 - +" , zatem
---
0
x"
sup f = +" . Mamy też
0
f = 2(1 - e2y)3 - 3(1 - e2y)2 = (1 - e2y)2 2(1 - e2y) - 3 - -" ,
---
y
y"
bo 1 - e2y - -" , zatem inf f = -" . Kresy znalezliśmy bez trudu.
---
y"
Przejdziemy do ekstremów lokalnych. Znajdziemy najpierw pochodne cza stkowe,
bo w punkcie, w którym funkcja ma lokalnie najmniejsza ba dz lokalnie najwieksza
wartość pochodne cza stkowe zeruja sie. Maja wiec zachodzić równości
x
"f
0 = = 6(1 - e2y + x2)2 - 6(1 - e2y + x2) - 24e2y · 2x oraz
"x y
x
"f
0 = = 6(1 - e2y + x2)2 - 6(1 - e2y + x2) + 24x2 · (-2e2y) .
"y y
Ponieważ dla każdego y " IR zachodzi e2y > 0 , wiec musi zachodzić równość
0 = 6(1 - e2y + x2)2 - 6(1 - e2y + x2) + 24x2
Sta d wynika, że
0 e" 6(1 - e2y + x2)2 - 6(1 - e2y + x2) > 6(1 - e2y + x2)2 - 6(1 - e2y + x2) - 24e2y ,
x
"f
a wobec tego z równości 0 = = . . . wynika, że x = 0 . Sta d i z równości
"x y
x
"f
= 0 wnioskujemy, że 6(1 - e2y)2 - 6(1 - e2y) = 0 , zatem 1 - e2y = 1 lub
"y y
1-e2y = 0 . Pierwsza równość nigdy nie zachodzi, wiec 1-e2y = 0 , czyli y = 0 . Jest
wiec tylko jeden punkt, w którym gradient badanej funkcji jest wektorem zerowym.
24
Funkcje wielu zmiennych Micha Krych
l
1
Funkcja może mieć ekstremum lokalne jedynie w tym punkcie. Jeśli x2 + y2 < ,
100
to |1 - e2y + x2| < 1 , zatem |1 - e2y + x2|3 d" |1 - e2y + x2|2 , przy czym równość
x 0
ma miejsce jedynie wtedy, gdy 1 - e2y + x2 = 0 . Jeśli dodatkowo = , to
y 0
x
f = 2(1-e2y +x2)3 -3(1-e2y +x2)2 -24x2e2y d" -(1-e2y +x2)2 -24x2e2y < 0 .
y
0
Oznacza to, że liczba f jest najwieksza spośród wartości przyjmowanych w kole
0
0
1
zdefiniowanym nierównościa x2+y2 < , wiec w punkcie funkcja f ma lokalne
100 0
maksimum w
laściwe.
Zagadka: jak wygla da wykres tej funkcji ?! to drobne ćwiczenie na wyobraznie,
wykres to powierzchnia dwuwymiarowa w trójwymiarowej przestrzeni, ma on jeden
szczyt lokalne maksimum, żadnych prze dolin , bo gradient jest nieze-
leczy ,
rowy, a jednak pnie sie dowolnie wysoko w góre i opada dowolnie nisko w dó
l.
W teorii różniczkowania funkcji jednej zmiennej rzeczywistej kluczowa role od-
grywa twierdzenie Lagrange a o wartości średniej. Nie jest ono niestety prawdziwe
lo
nawet dla funkcji jednej zmiennej rzeczywistej, której wartościami sa punkty p
lasz-
czyzny.
cos t - sin t
Przyk 16.15 Niech f(t) = . Wtedy Df(t) = . Mamy również
lad
sin t cos t
1
f(2Ä„) = = f(0) . Gdyby twierdzenie Lagrange a by prawdziwe w takiej wersji,
lo
0
jak dla funkcji o wartościach rzeczywistych, to istnia taka liczba c " (0, 2Ą) ,
laby
0 - sin c
że = f(2Ä„) - f(0) = f (c) · (2Ä„ - 0) = 2Ä„ , a to jest niemożliwe, bo
0 cos c
sin2 c + cos2 c = 1 , wiec liczby cos c i sin c nie zeruja sie dla jednego c .
Twierdzenie 16.21 (Lagrange a o wartości średniej)
Niech f: G - Rl bedzie funkcja określona na zbiorze otwartym G ą" Rk i niech
p, q " G . Za óżmy, że ca odcinek o końcach p, q jest zawarty w zbiorze G . Dla
l ly
pewnej liczby t " (0, 1) zachodzi wtedy nierówność
f(p) - f(q) d" p - q · Df p + t(q - p) ;
jeśli M jest macierza , która ma l wierszy i k kolumn, to M oznacza najmniejsza
taka liczbe nieujemna , że nierówność M · v d" M · v zachodzi dla każdego
k
l
wektora v " Rk . Zachodzi nierówność M d" m2 , gdzie przez
i=1 j=1 i,j
mi,j oznaczyliśmy ten wyraz macierzy M , który stoi na przecieciu i tego wiersza
z j ta kolumna .
Dowód. Niech v1, v2, . . . , vk beda kolejnymi wspó v
lrzednymi wektora " Rk . Wte-
dy z nierówności Schwarza wynika, że
2
l k l k k 2
M = mi,jvj d" m2 · vj =
v 2
i=1 j=1 i=1 j=1 i,j j=1
25
Funkcje wielu zmiennych Micha Krych
l
k 2 l k l k
= vj · m2 = · m2 ,
v 2
j=1 i=1 j=1 i,j i=1 j=1 i,j
k
l
zatem M d" m2 · .
v v
i=1 j=1 i,j
Niech Õ(t) = f(q) - f(p) · f(p + t(q - p)) - f(p) . Õ jest funkcja różnicz-
kowalna określona na [0, 1] , bo f jest funkcja różniczkowalna określona na zbiorze
zawieraja cym odcinek o końcach p, q . Mamy też
Õ (t) = f(q) - f(p) · Df(p + t(q - p)) · (q - p) .
Z twierdzenia Lagrange a o wartości średniej wynika, że istnieje liczba t " (0, 1) , dla
której zachodzi równość
Õ(1) - Õ(0) = Õ (t) · (1 - 0) = f(q) - f(p) · Df(p + t(q - p)) · (q - p) .
Ponieważ Õ(0) = 0 i Õ(1) = f(q)-f(p) · f(p+(q-p))-f(p) = f(q)-f(p) 2 ,
wiec
f(q) - f(p) 2 = f(q) - f(p) · Df(p + t(q - p)) · (q - p) d"
d" f(q) - f(p) · Df(p + t(q - p)) · q - p ,
zatem
f(q) - f(p) d" Df(p + t(q - p)) · q - p .
Z otrzymanej nierówności teza wynika natychmiast.
Udowodnione twierdzenie nie daje dok
ladnego wzoru na f(q)-f(p) , ale pozwala
oszacować te różnice za pomoca pochodnych cza stkowych, wiec spe te role, która
lnia
spe twierdzenie Lagrange a o wartości średniej w przypadku funkcji jednej zmien-
lnia
nej rzeczywistej.
Zajmiemy sie teraz pochodnymi wyższego rzedu, konkretnie drugiego. Niech
f: G - R bedzie funkcja , która ma pochodne cza stkowe pierwszego rzedu w ca
lym
zbiorze otwartym G .
Ograniczymy sie w istocie rzeczy do pochodnych funkcji o wartościach rzeczywi-
stych. Nie ma najmniejszego k ze zdefiniowaniem pochodnych cza stkowych dru-
lopotu
giego rzedu. Jeśli funkcja f: G - R ma w zbiorze otwartym G pochodne cza stkowe
pierwszego rzedu, to możemy pytać o to, czy maja one pochodne cza stkowe.
Definicja 16.22 (pochodnych cza stkowych wyższego rzedu)
"f
Jeśli pochodna cza stkowa ma w punkcie p " G pochodna cza stkowa wzgledem
"xi
zmiennej xj , to te pochodna nazywamy pochodna cza stkowa drugiego rzedu funkcji
"2f
f w punkcie p wzgledem zmiennych xi , xj i oznaczamy symbolem (p) .
"xj"xi
"2f
Jeśli i = j , to mówimy o pochodnej mieszanej. Jeśli i = j , to piszemy (p) .
"x2
i
Analogicznie definiowane sa pochodne cza stkowe wyższych rzedów.
26
Funkcje wielu zmiennych Micha Krych
l
x
"2f "2f "2f
Jeśli f = x2 + 11xy + 37y2 , to (p) = 2 , (p) = 74 , (p) = 11 ,
y "x2 "y2 "y"x
x x
"2f "f "f
(p) = 11 , bo = 2x + 11y i = 11x + 74y . Przyk na razie nie
ladów
"x"y "x y "y y
bedziemy mnożyć, bo w istocie rzeczy nie ma w nich nic istotnie nowego, po prostu
obliczamy nastepne pochodne.
Definicja 16.23 (macierzy drugiej różniczki)
Macierza drugiej różniczki funkcji f: G - R w punkcie p nazywamy macierz
"2f "2f
(p) , jeśli pochodne (p) istnieja dla i, j " {1, 2, . . . , k} .
"xi"xj "xi"xj
Z definicji wynika, że macierz drugiej różniczki jest macierza kwadratowa . Na
ogó jest ona symetryczna, tzn. w różnych sytuacjach symetrii może nie być, ale jest
l
tak w przypadku funkcji zdefiniowanych wzorami o czym mówi nastepuja ce
Twierdzenie 16.24 (Schwarza o symetrii drugiej różniczki)
"2f "2f
Jeśli funkcja f: G - R ma pochodne mieszane (p) i (p) w każdym
"xi"xj "xj"xi
punkcie p zbioru G i obie te pochodne sa cia g w punkcie q " G , to sa w tym
le
punkcie równe:
"2f "2f
(q) = (q) .
"xi"xj "xj"xi
Dowód. Ponieważ mowa jest o pochodnych wzgledem xi oraz wzgledem xj , wiec
można myśleć o funkcji dwu zmiennych, pozosta zmienne i tak traktowane sa jako
le
parametry. Dalej zak
ladamy wiec, że G ‚" R2 , piszemy x zamiast xi oraz y zamiast
a u
xj . Niech q = i h = . Ponieważ zak
ladamy, że zbiór G jest otwarty, wiec
b v
dla dostatecznie ma h określić możemy liczbe
lych
u a+u a+u a
a
g = f - f - f + f .
v b+v v b+v b
a+u a+u
Traktuja c f - f jako funkcje zmiennej u przy ustalonym v możemy
b+v v
zastosować jednowymiarowe twierdzenie Lagrange a o wartości średniej: istnieje wiec
u a+tu a+tu
"g "g
liczba t " (0, 1) , taka że g = u - . Traktuja c teraz u i t jako
v "x b+v "x b
sta a v jako zmienna możemy znów skorzystać z twierdzenia o wartości średniej:
le
u a+tu
"2f
istnieje wiec liczba s " (0, 1) , taka że g = vu . Ustalaja c najpierw v
v "y"x b+sv
a potem u stwierdzimy w taki sam sposób, że istnieja liczby Ä, à " (0, 1) , takie że
u a+Ä
"2f u
g = uv . Przyjmuja c teraz u = v w obu równościach otrzymujemy:
v "x"y b+Ãv
u a+tu a u a+Äu a
"2f "2f "2f "2f
1 1
lim g = lim = , lim g = lim = .
u2 u "y"x b+sv "y"x b u2 u "x"y b+Ãv "x"y b
u0 u0 u0 u0
Ponieważ lewe strony sa równe, wiec prawe też. Dowód zosta zakończony.
l
Od tej pory nie musimy wiec pamietać na czym dok polega różnica miedzy
ladnie
"2f "2f
symbolami i . Ostrzegamy jednak, że to twierdzenie, jak każde inne,
"xi"xj "xj"xi
27
Funkcje wielu zmiennych Micha Krych
l
ma za lad
lożenia. Na wszelki wypadek podamy standardowy przyk wskazuja cy na
konieczność pamietania o tych za
lożeniach.
Przyk 16.16 Niech
lad
x 0, jeśli x = 0 = y;
f =
x2-y2
y
xy , jeśli x2 + y2 > 0.
x2+y2
x 0
"f "f
Korzystaja c z definicji pochodnej stwierdzamy, że = x oraz = -y .
"y 0 "x y
"2f "2f
Sta d już latwo wynika, że (0) = 1 = -1 = (0) . Widzimy wiec, że może sie
"x"y "y"x
zdarzyć, że pochodne mieszane sa różne, ale w przypadkach, którymi bedziemy sie
zajmować, beda spe za
lnione lożenia twierdzenia o symetrii drugiej różniczki!
Uwaga 16.25 W dowodzie twierdzenia o symetrii drugiej różniczki pochodna mie-
szana zosta wyrażona jako granica podwójnego ilorazu różnicowego , w którym nie
la
wystepuje żadna pochodna pierwszego rzedu. W liczniku wystepuje różnica drugiego
rzedu :
a+u a+u a a+u a+u a
a a
f - f - f + f = f - f - f - f =
b+v v b+v b b+v v b+v b
a+u a+u a
a
= f - f - f - f
b+v b+v v b
Przypomina to o tym, że druga pochodna mierzy tempo zmian tempa zmian funkcji.
W jednym wymiarze zwia zane to by wypuk funkcji, tu sytuacja jest nieco
lo lościa
bardziej skomplikowana, bo mówimy jedynie o pochodnych cza stkowych. Widać jed-
nak, że rozważamy najpierw zmiany wartości funkcji odpowiadaja ce zmianie jednego
argumentu (np. y ) odpowiadaja ce różnych wartościom innego argumentu (w tym
przypadku x ), a potem ich różnice. To ważna interpretacja.
W rachunku różniczkowym najważniejsza idea to przybliżanie funkcji funkcja
liniowa , wystepuje ona już w definicji pochodnej. Nastepny krok to przybliżanie wie-
lomianami odpowiedniego stopnia, gdy przybliżenia liniowe sa niewystarczaja ce. Od-
powiednie twierdzenia zawieraja wzór Taylora z różnymi postaciami reszty. Zajmiemy
sie teraz tym wzorem w przypadku funkcji wielu zmiennych i wielomianów drugiego
stopnia. Warto od razu stwierdzić, że można używać wielomianów wyższego stopnia,
ale nie chcemy komplikować wzorów, zreszta , wg. wiedzy autora, wielomiany Taylora
stopnia wyższego niż 2 nie sa zbyt czesto używane. Druga przyczyna tego ograniczenia
jest wiara autora w to, że ktoś kto zrozumia jak można stosować wielomiany Taylora
l
wyższych stopni w jednym wymiarze i wielomiany stopnia drugiego w wielu wymia-
rach, nie bedzie mieć trudności z użyciem wielomianów Taylora stopnia wyższego niż
2 w przypadku funkcji wielu zmiennych.
28
Funkcje wielu zmiennych Micha Krych
l
Definicja 16.26 (drugiego wielomianu Taylora i drugiej reszty)
Za óżmy, że funkcja f: G - R ma pochodne cza stkowe drugiego rzedu w punkcie
l
p " G . Drugim wielomianem Taylora funkcji f w punkcie p nazywamy wielomian
zmiennych h1 , h2 ,. . . , hk :
k k
"f 1 "2f
f(p) + (p)hi + (p)hihj .
"xi 2 "xi"xj
i=1 i,j=1
Druga reszta nazywamy różnice
ëÅ‚ öÅ‚
k k
"2f
íÅ‚f(p) + "f (p)hi + 1
r2(h) = f(p + h) - (p)hihjłł .
"xi 2 "xi"xj
i=1 i,j=1
"2f
Zauważmy, że jeśli choć jedna z pochodnych (p) jest różna od 0, to stopień
"xi"xj
drugiego wielomianu Taylora jest równy 2.
x x x
"f "f
Przyk 16.17 Niech f = ex+3y . Wtedy = ex+3y , = 3ex+3y ,
lad
y "x y "y y
x x x
"f2 "2f "2f
zatem = ex+3y , = 3ex+3y i = 9ex+3y . Wobec tego drugi
"x2 y "x"y y "y2 y
wielomian Taylora funkcji f w punkcie 0 wygla da tak:
1
1 + 1 · h1 + 3 · h2 + 1 · h2 + 3 · h1h2 + 3 · h2h1 + 9 · h2 =
1 2
2
1 9
= 1 + h1 + 3h2 + h2 + 3h1h2 + h2 .
1 2
2 2
Najważniejsze, choć bardzo proste, twierdzenie brzmi prawie tak samo jak w jed-
nowymiarowym przypadku, ale my wzmocnimy nieco za
lożenia, bo konsekwentnie
unikamy pojecia różniczki drugiego rzedu.
Twierdzenie 16.27 (G.Peano)
Jeśli funkcja f: G - R ma pochodne drugiego rzedu w zbiorze G i sa one cia g
le
w każdym punkcie zbioru G , to dla każdego p " G zachodzi równość:
r2(h)
lim = 0 .
h 2
h0
Dowód. Potraktujemy r2 jako funkcje zmiennej h . Zachodza wtedy nastepuja ce
k "2f
"r2 "f "f
równości r2(0) = 0 , (h) = (p + h) - (p) - (p)hj , a sta d wy-
j=1
"hi "xi "xi "xi"xj
"2r2 "2f "2f
nika już że (h) = (p + h) - (p) . Z cia g pochodnych
latwo, lości
"hi"hj "xi"xj "xi"xj
"2r2
cza stkowych drugiego rzedu wynika, że lim (h) = 0 , oczywiście r2 zależy od
"hi"hj
h0
p , ale ten punkt jest w ca rozumowaniu ustalony. Teraz twierdzenie o wartości
lym
Å›redniej: r2(h) = r2(h) - r2(0) d" h sup Dr2(Äh) . Zastosujemy to samo
0d"Äd"1
29
Funkcje wielu zmiennych Micha Krych
l
"r2 "r2
twierdzenie raz jeszcze tym razem do funkcji . Mamy (0) = 0 wynika
"hi "hi
to natychmiast z wzoru na pochodne cza stkowe funkcji r2 , zatem
D "r2 (ÃÄh) d"
"r2 "r2 "r2
(Äh) = (Äh) - (0) d" Äh sup
"hi "hi "hi "hi
0d"Ãd"1
D "r2 (ÃÄh)
d" h sup
"hi
0d"Ãd"1
Ponieważ norma macierzy można oszacować przez pierwiastek kwadratowy z sumy
"2r2
kwadratów wspó (h) = 0 , wiec zachodzi równość
lczynników macierzy i lim
"hi"hj
h0
D "r2 (ÃÄh) = 0 oraz
lim
"hi
h0
k
2
r2(h)
1 1 "r2
d" sup Dr2(Äh) d" sup (Äh) d"
h 2 h h "hi
0d"Äd"1 0d"Ä d"1
i=1
2
k
D "r2 (ÃÄh) --- 0
d" sup sup
-
"hi
h0
0d"Ä d"1 0d"Ãd"1
i=1
Te szacowania kończa dowód.
Dowód twierdzenia Peano podaliśmy g ównie po to, by raz jeszcze uświadomić
l
czytelnikom, że pochodna s do oszacowania tempa zmian funkcji.
luży
Przejdziemy teraz do twierdzenia, które pozwala w wielu przypadkach ustalić
czy w punkcie zerowania sie gradientu funkcja ma lokalne ekstremum czy też nie.
Twierdzenie 16.28 (o lokalnych ekstremach funkcji dwukrotnie różniczkowalnej)
Za óżmy, że funkcja f: G - R ma w zbiorze G pochodne cza stkowe drugiego rzedu
l
"2f
oraz że sa one cia g Niech grad f(p) = 0 . Niech D2f(p) = (p) bedzie
le.
"xi"xj
macierza drugiej różniczki funkcji f w punkcie p . W tej sytuacji
a. jeśli forma kwadratowa zdefiniowana macierza D2f(p) jest dodatnio określona,
czyli gdy dla każdego wektora = 0 zachodzi nierówność
v
k k "2f k "2f
· D2f(p) · = vi · (p)vj = (p)vivj > 0
v v
i=1 j=1 "xi"xj i,j=1 "xi"xj
to funkcja f ma w punkcie p lokalne minimum w
laściwe;
b. jeśli forma kwadratowa zdefiniowana macierza D2f(p) jest ujemnie określona*,
to funkcja f ma w punkcie p lokalne maksimum w
laściwe;
c. jeśli istnieja takie wektory v " Rk oraz w " Rk , że
v · D2f(p)v < 0 < w · D2f(p)w ,
to w punkcie p funkcja f nie ma lokalnego ekstremum: w dowolnym otoczeniu
tego punktu znajduja sie punkty x , takie że f(p) > f(x) oraz punkty y , takie
*tzn. forma kwadratowa zdefiniowana macierza przeciwna, -D2f(p) , jest dodatnio określona
30
Funkcje wielu zmiennych Micha Krych
l
że f(y) > f(p) .
Dowód. a. Zbiór z z wektorów o d
lożony lugości 1 jest ograniczony (to sfera!) i
domkniety, wiec funkcja (cia g przypisuja ca wektorowi liczbe · D2f(p)v
la) v v
przyjmuje w jakimÅ› jego punkcie swa najmniejsza wartość. Niech µ bedzie ta naj-
x
mniejsza wartościa . Jeśli = 0 i = , to = 1 , zatem
x v v
x
x 1
x
µ d" · D2f(p)v = · D2f(p) = · D2f(p) ,
v x x
x x x 2
a sta d wynika, że µ · d" · D2f(p) dla każdego wektora " Rk . OczywiÅ›cie
x 2 x x x
µ > 0 . Z twierdzenia Peano wynika, że istnieje liczba ´ > 0 , taka że jeÅ›li < ´ ,
h
µ
to |r2( < . Wobec tego
h)| h 2
2
k k
"f "2f
1
f(p + h) = f(p) + (p)hi + (p)hihj + r2( =
h)
"xi 2 "xi"xj
i=1 i,j=1
k
"2f
1
= f(p) + (p)hihj + r2( = f(p) + D2f(p) · h + r2( .
h) h h)
2 "xi"xj
i,j=1
JeÅ›li 0 < < ´ , to wartość bezwzgledna trzeciego sk
h ladnika jest mniejsza niż
sk drugi, wiec ich suma jest dodatnia niezależnie od znaku r2( . To kończy
ladnik h)
dowód tego, że w kuli B(p, ´) najmniejsza wartość funkcja f przyjmuje w punkcie
p i w żadnym innym, wiec ma ona w punkcie p lokalne minimum w
laściwe.
b. Stosujemy udowodniona już cześć twierdzenia do funkcji -f .
c. Niech g(t) = f(p + tv) . Ponieważ G jest zbiorem otwartym, wiec tym wzorem
funkcje g możemy zdefiniować na pewnym przedziale otwartym zawieraja cym liczbe
0. Funkcja g jest dwukrotnie różniczkowalna, bo f ma pochodne drugiego rzedu.
k "f
Z twierdzenia o pochodnej z (p + t ,
lożenia wynika latwo, że g (t) = v)vi
i=1 "xi
wobec tego że grad f(p) = 0 , zachodzi równość g (0) = 0 . Mamy też
ëÅ‚ öÅ‚
k k k
"f2 "f2
íÅ‚
g (t) = (p + t vi = (p + t ,
v)vjłł v)vivj
"xj"xi "xj"xi
i=1 j=1 i,j=1
zatem g (0) = D2f(p) · < 0 . Ponieważ g (0) = 0 > g (0) , wiec funkcja g ma
v v
w punkcie 0 lokalne maksimum w
laściwe, zatem w dowolnym otoczeniu punktu p
znajduja sie punkty, w których wartości funkcji f sa mniejsze niż f(p) . Wynika
sta d, że funkcja f nie ma w punkcie (p) lokalnego minimum. Możemy rozważyć
teraz funkcje g zdefiniowana wzorem g(t) = f(p + tw) . Rozumuja c dok tak,
Ü Ü ladnie
jak przed chwila przekonujemy sie, że ma ona w punkcie 0 lokalne minimum w
laściwe,
wiec w dowolnym otoczeniu punktu p znajduja sie punkty, w których wartości sa
wieksze niż f(p) , zatem funkcja f nie ma w punkcie p maksimum lokalnego. Mamy
31
Funkcje wielu zmiennych Micha Krych
l
wiec do czynienia z siod a nie z lokalnym ekstremum.
lem
Wniosek 16.29 (z dowodu twierdzenia o lokalnych ekstremach.)
Jeśli g(t) = f(p+t i funkcja f ma pochodne cza stkowe drugiego rzedu w otoczeniu
v)
k
"f2
punktu p i sa one cia g w punkcie p , to g (0) = (p)vivj .
le
"xj"xi
i,j=1
Wniosek ten mówi, że wartość drugiej różniczki w punkcie p na wektorze v jest
druga pochodna badanej funkcji ograniczonej do prostej przechodza cej przez punkt
p , równoleg do wektora v .
lej
Czytelnik zwróci uwage na to, że dowód cześci a. twierdzenia w istocie rzeczy po-
lega na tym, że sprawdzamy iż zachodzi ono dla wielomianów stopnia 2 lub mniejsze-
go, a nastepnie stwierdzeniu, że przy dostatecznie dobrych za
lożeniach o wielomianie
kwadratowym reszta nie ma wp na teze, bo po prostu jest za ma Oczywiście
lywu la.
twierdzenie ma charakter lokalny, o czym doskonale świadczy przyk który zreszta
lad,
za chwile przypomnimy funkcja tam wystepuja ca ma dwa lokalne minima, ale
żadne z nich nie jest minimum globalnym, którego zreszta nie ma, bo funkcja nie jest
ograniczona z do W cześci c. okaza sie, że z za wynika istnienie prostej prze-
lu. lo lożeń
chodza cej przez p , po ograniczeniu do której funkcja ma lokalne minimum w
laściwe
i drugiej prostej przechodza cej przez p , po ograniczeniu do której funkcja ma mak-
simum w lo
laściwe. Takie zjawisko nie mog oczywiście wysta pić w przypadku funkcji
jednej zmiennej. Może sie też zdarzyć, że forma drugiej różniczki jest pó
lokreślona,
np. dodatnio. Oznacza to, że D2f(p) · e" 0 zamiast ostrej nierównoÅ›ci mamy
v v
tylko nieostra Wtedy nic sie nie da wywnioskować bez dalszego badania funkcji: funk-
cja x4 + y4 ma w punkcie 0 minimum w
laściwe, zreszta globalne, funkcja -x4 - y4
ma w punkcie 0 maksimum w
laściwe, globalne, funkcja x4 - y4 ma w punkcie 0
siod - w dowolnym otoczeniu punktu 0 przyjmuje zarówno wartości mniejsze niż
lo
f(0) jak i wartości wieksze niż f(0) . W każdym z tych trzech przypadków zachodza
równości
"f "f "f2 "f2 "f2
0 = f(0) = (0) = (0) = (0) = (0) = (0) ,
"x "y "x2 "x"y "y2
wiec z punktu widzenia twierdzenia o lokalnych ekstremach te funkcje sa nierozróż-
nialne. Autor spotyka sie wielokrotnie ze studentami, którzy chcieli bez g
l lebszego
zastanowienia sie rozszerzać zakres twierdzenia o lokalnych ekstremach, ale wypi-
sywane tezy by nieprawdziwe. Oczywiście twierdzenie to można uogólnić, ale nie
ly
jest to zbyt proste i co gorsza efekty uogólnienia nie sa warte zachodu, bo otrzymy-
wane warunki sa zbyt skomplikowane, by je pamietać. Ważniejsze jest zrozumienie
32
Funkcje wielu zmiennych Micha Krych
l
podanej wersji i jej dowodu, bo wtedy w konkretnych sytuacjach, nawet nie objetych
twierdzeniem, można zastosować jego dowód!
x
y
Przyk 16.18 Niech f = x2+2y2+3z2-4x+8y-12z . Jasne jest, że funkcja
lad
z
x
0
nie jest ograniczona z góry: lim f = +" . Nie jest jasne czemu równy jest kres
x+" 0
dolny funkcji i czy jest on jej wartościa . Jeśli kres jest wartościa funkcji określonej na
ca przestrzeni, to gradient tej funkcji w punkcie, w którym jest on przyjmowany jest
lej
x
2x-4
y
4y+8
wektorem zerowym. Mamy grad f = . Jasne jest, że ten wektor równy
z
6z-12
2
-2
jest 0 wtedy i tylko wtedy, gdy x = 2 , y = -2 i z = 2 . Mamy f = -24 . Jeśli
2
wiec kres dolny jest wartościa funkcji, to musi być równy -24 . Wykażemy, że tak jest
x
y
w rzeczywistości. f + 24 = (x - 2)2 + 2(y + 2)2 + 3(z - 2)2 e" 0 , co kończy dowód.
z
W istocie rzeczy do znalezienia kresów rachunek różniczkowy w tym zadaniu nie by
l
potrzebny, w rzeczywistości funkcja f w ostatnim kroku zosta potraktowana jako
la
suma 3 wielomianów kwadratowych, każdy innej zmiennej, które zosta sprowadzone
ly
do postaci kanonicznych! Rachunek różniczkowy pomaga tu jedynie ustalić, jaki punkt
jest podejrzany o to, że w nim kres jest osia gany, ale oczywiście te hipoteze można
sformu nie licza c żadnych pochodnych.
lować
x
Przyk 16.19 Niech f = 2x2 - 4xy + 10y2 - 20x + 68y . Podobnie jak
lad
y
x
w przyk poprzednim widać, że lim = +" , zatem funkcja nie jest ograni-
ladzie
0
x+"
czona z góry, czyli jej kresem górnym jest +" . Jeśli kres dolny tej funkcji jest jej
wartościa , to w punkcie, w którym jest przyjmowany, gradient funkcji f jest wekto-
x
4x- 4y-20
rem zerowym. Mamy grad f = . Ma wiec być
y -4x+20y+68
4x - 4y - 20 = 0 = -4x + 20y + 68 .
Rozwia zuja c ten uk dwóch równań liniowych z dwiema niewiadomymi otrzymu-
lad
jemy x = 2 , y = -3 . Jedynym kandydatem na punkt, w którym móg być
lby
2
osia gniety kres dolny tej funkcji, jest wiec punkt . Niech u = x - 2 , v = y + 3 .
-3
Mamy wiec
x u+2
f = f = 2(u + 2)2 - 4(u + 2)(v - 3) + 10(v - 3)2 - 20(u + 2) + 68(v - 3) =
y v-3
= 2u2 - 4uv + 10v2 - 122 = 2(u - v)2 + 8v2 - 122
ostatnie przekszta to po prostu sprowadzenie wielomianu kwadratowego
lcenie
zmiennej u , którego wspó
lczynniki zależa od parametru v , do postaci kanonicznej.
Jasne jest, że najmniejsza wartościa otrzymanego wyrażenia jest liczba -122 oraz
33
Funkcje wielu zmiennych Micha Krych
l
że wartość ta jest przyjmowana jedynie wtedy, gdy u = v i v = 0 , tzn. u = 0 = v .
Podobnie jak w poprzednim przyk można by nie obliczać pochodnych, lecz
ladzie lo
potraktować od razu funkcje jako wielomian kwadratowy zmiennej u z parametrem
v , sprowadzić go do postaci kanonicznej i rzecz ca zakończyć.
la
x
Przyk 16.20 Niech f = 2x2 - 4xy + y2 - 20x + 14y .
lad
y
x
Ponieważ lim = +" , wiec sup f = +" . Postepuja c tak jak w poprzed-
0
x+"
x 0
4x-4y-20
nim przyk znajdujemy grad f = . Ten wektor równy jest
ladzie
y -4x+2y+14 0
wtedy i tylko wtedy, gdy x = 2 i y = -3 . Podstawmy x = u + 2 , y = v - 3 . Wtedy
x
f = 2(u+2)2-4(u+2)(v-3)+(v-3)2-20(u+2)+14(v-3) = 2u2-4uv+v2-41 =
y
= 2(u - v)2 - v2 - 41 .
W odróżnieniu od przyk poprzednich wyrażenie 2(u - v)2 - v2 bywa ujemne,
ladów
wiec liczba -41 nie jest kresem dolnym funkcji f . Mamy
v
f = -v2 - 41 - -" ,
---
v
v"
zatem kresem dolnym funkcji f jest -" , co oznacza, że funkcja f nie jest ogra-
niczona również z do Oczywiście również w tym przyk użycie pochodnych
lu. ladzie
nie jest konieczne, można od razu potraktować funkcje jako wielomian zmiennej x
zależny od parametru y .
Przyk 16.21 Teraz uogólnimy rezultaty trzech ostatnich przyk Mieliś-
lad ladów.
my w każdym z nich do czynienia z konkretnym wielomianem drugiego stopnia dwu
zmiennych, czyli z funkcja f , która można zdefiniować wzorem
x
f = Ax2 + 2Bxy + Cy2 + 2Dx + 2Ey + F ,
y
przy za
lożeniu, że co najmniej jedna z liczb A , B , C jest różna od 0; dwójki we
wspó
lczynnikach pojawiaja sie ze wzgledu na wygode oraz tradycje. Wyrażenia x2 ,
xy , y2 nazywamy jednomianami drugiego stopnia zmiennych x i y (dla ustalenia
stopnia iloczynu dodajemy stopnie czynników, nawet jeśli jeden wielomian zależy od
x a drugi od y ).
Rozważymy kolejno trzy przypadki: AC -B2 > 0 , AC -B2 = 0 , AC - B2 < 0 .
Pierwszy z nich nazywany jest eliptycznym, drugi parabolicznym, a trzeci hiperbo-
x Ax+By+D
licznym. Mamy grad f = 2 . W przypadku eliptycznym i w przypadku
y Bx+Cy+E
hiperbolicznym istnieje dok jeden punkt, w którym grad f jest wektorem ze-
ladnie
rowym, w przypadku parabolicznym takiego punktu może nie być albo jest ich nie-
Ä… 0
skończenie wiele. Jeśli grad f = , to po zastosowaniu podstawienia x = u+ą ,
² 0
y = v + ² otrzymujemy wielomian kwadratowy zmiennych u , v , w którym cześć
34
Funkcje wielu zmiennych Micha Krych
l
kwadratowa ma te same wspó
lczynniki A , B , C , natomiast cześć liniowa znika, o
wyrazie wolnym nic powiedzieć nie można. Po podstawieniu otrzymujemy funkcje
0
zmiennych u i v , której gradient jest wektorem zerowym w punkcie 0 = , a wiec
0
funkcje postaci Au2 + 2Buv + Cv2 + F .
Przypadek eliptyczny.
Ponieważ AC - B2 > 0 , wiec AC > 0 , zatem A = 0 = C . Możemy wobec tego
napisać:
2
B B2
Au2 + 2Buv + Cv2 + F = A u + v - v2 + Cv2 + F =
A A
2
B AC-B2
= A u + v + v2 + F .*
A A2
Jeśli A > 0 , to funkcja f przyjmuje w punkcie 0 wartość F , a w pozosta punk-
lych
tach wartości wieksze niż F wynika to sta d, że kwadrat liczby rzeczywistej = 0
jest dodatni, zaś 02 = 0 . Najmniejsza wartościa funkcji f w tym przypadku jest
liczba F , jest ona przyjmowana w jednym tylko punkcie (zerowania sie gradientu),
funkcja jest oczywiście nieograniczona z góry. Przypadek A < 0 jest w pe analo-
lni
giczny, nierówności zmieniaja kierunki, wiec w tym przypadku funkcja ma wartość
najwieksza , a z do nie jest ograniczona.
lu
Przypadek hiperboliczny.
Teraz może zdarzyć sie, że A = 0 = C . Jeśli tak jest, to wprowadzamy nowe zmienne
y y
x+ x-
x = x + y oraz y = x - y , czyli x = oraz y = . Po podstawieniu cześć
2 2
B B B B
kwadratowa wygla da tak: x2 - y2 . Przyjmuja c A = , B = 0 oraz C =
2 2 2 2
otrzymujemy znów wielomian kwadratowy, dla którego AC - B2 < 0 , przy czym
A = 0 . Możemy wiec od razu za że A = 0 , co uchroni nas przed zmiana
lożyć,
oznaczeń nie zmniejszaja c przy tym ogólności rozważań. Przyjmujemy wiec dalej, że
A > 0 . Przekszta tak jak w przypadku eliptycznym otrzymujemy
lcaja c
u 2
B B2
f = Au2 + 2Buv + Cv2 + F = A u + v - v2 + Cv2 + F =
v A A
2
B AC-B2
= A u + v + v2 + F .
A A2
u
Oczywiście lim f = +" , zatem funkcja f nie jest ograniczona z góry. Mamy też
0
u"
-vB/A
lim f = -" , wiec również z do ta funkcja nie jest ograniczona. Kresem
lu
v
v"
dolnym tej funkcji jest wiec -" , a górnym +" . Wykres tej funkcji jest dwuwymia-
rowa powierzchnia w przestrzeni trójwymiarowej przypominaja ca wygla dem prze
lecz
w górach, co mi lem.
lośnikom jazdy konnej kojarzyć może sie z siod Omówmy to nieco
*Wyróżnik wielomianu Au2+2Buv+Cv2 zmiennej u równy jest 4v2 B2-AC , wiec gdy v =0 , to
( )
wielomian ten nie ma pierwiastków!
35
Funkcje wielu zmiennych Micha Krych
l
dok
ladniej. Jeśli v = 0 , to rozważamy funkcje Au2 + F , której wykresem jest pa-
rabola skierowana ramionami ku górze. Jeśli ograniczymy nasza uwage do prostej o
B AC-B2
równaniu u + v = 0 , to otrzymamy funkcje v2 + F , której wykresem jest
A A
parabola skierowana ramionami ku do Ta druga ma punkt wspólny z pierwsza ,
lowi.
po prostu jest podwieszona na pierwszej, ale znajduje sie w innej p
laszczyznie piono-
B B
wej*, mianowicie zawieraja cej prosta u+ v = 0 . Zmiana wielkości u+ v powoduje
A A
przesuniecie zwisaja cej paraboli do góry wzd paraboli Au2 . Wykres naszej funkcji
luż
sk sie wiec z parabol zwisaja cych z paraboli Au2 + F w dó równoleg do
lada l, lych
B
prostej u + v = 0 , umieszczonych w p
laszczyznach pionowych.
A
Jasne jest, że w tym przypadku funkcja w punkcie zerowania sie gradientu nie
ma ani lokalnego maksimum ani lokalnego minimum: wedruja c z punktu 0 w kie-
runku prostej v = 0 zwiekszamy wartość funkcji, zaś wedruja c w kierunku prostej
B
u + v = 0 zmniejszamy wartość funkcji.
A
Przypadek paraboliczny
Podobnie jak w przypadku eliptycznym co najmniej jedna z liczba A , C musi być
różna od 0, bo gdyby obie by zerami, to z równości AC - B2 = 0 wynika że
ly loby,
również B = 0 , co nie jest możliwe w świetle naszego za
lożenia. Bez straty ogólności
możemy przyja ć, że A = 0 , a nawet A > 0 . Przypadek A < 0 pozostawiamy
czytelnikowi. Mamy wiec
Au2 + 2Buv + Cv2 + 2Du + 2Ev + F =
2 B2
B D BD D2
= A u + v + + C - v2 + 2 E - v + F - =
A A A A A
2
B D BD D2
= A u + v + + 2 E - v + F - .
A A A A
BD BD
Mamy wiec dwa przypadki E - = 0 i E - = 0 .
A A
D2
W pierwszym przypadku funkcja przyjmuje najmniejsza wartość F - w każ-
A
dym punkcie prostej Au + By + D = 0 i oczywiście jest nieograniczona z góry.
u
W drugim przypadku funkcja jest nieograniczona z góry: lim f = +" . Jest
0
u"
też nieograniczona z do bowiem jedna z granic
lu,
-(Bv+D)/A -(Bv+D)/A
lim f , lim f
v v
v" v-"
równa jest -" , a druga jest +" . W tych przypadkach wykres funkcji można wy-
BD
obrazić sobie jako doline: w przypadku E - = 0 dno doliny jest poziome, a
A
BD
w przypadku E - = 0 nie.
A
* Jeśli B=0 , to te pionowe p le,
laszczyzny sa prostopad pierwsza ma równanie v=0 , a druga u=0
36
Funkcje wielu zmiennych Micha Krych
l
Uwaga 16.30
W przypadku funkcji jednej zmiennej podaliśmy kryterium pozwalaja ce na stwier-
dzenie, czy funkcja ma w punkcie zerowania sie pochodnej lokalne ekstremu czy też
nie. Podobne twierdzenia można formu dla funkcji dwu i wiekszej liczby zmien-
lować
nych. Szczególnie ważny jest przypadek najprostszy, gdy problem można wyjaśnić
badaja c pochodne drugiego rzedu. Zajmiemy sie tym nieco pózniej. Wypada jednak
stwierdzić, że twierdzenia omówione w ostatnim przyk stanowia podstawe do
ladzie
sformu
lowania odpowiednich tez w przypadku funkcji dwu zmiennych.
Ostatni przyk zawiera dowód twierdzenia Sylvestera (zob. nastepne twierdze-
lad
nie) w przypadku funkcji dwu zmiennych. Udowodnimy zreszta to twierdzenie za
chwile, by przekonać czytelnika, że nic tajemniczego w nim nie ma, choć oczywiście
jego dowód nie jest konieczny do zdania egzaminu z matematyki przez studenta che-
mii.
Twierdzenie 16.31 (Sylvestera o formach kwadratowych dodatnio określonych)
Niech f bedzie forma kwadratowa określona przez macierz symetryczna A = (ai,j)
wymiaru k , tzn. dla dowolnych i, j " {1, 2, . . . , k} zachodzi równość ai,j = aj,i ,
zatem
k
f(x) = (Ax) · x = ai,jxixj ,
i,j=1
kropka oznacza tu iloczyn skalarny. Niech Ml = det(ai,j)i,jd"l . Wtedy f(x) > 0 dla
x = 0 wtedy i tylko wtedy, gdy Ml > 0 dla l = 1, 2, . . . , k . Mówimy wtedy, że forma
f jest dodatnio określona.
Dowód. (J.Musielak)*
Zastosujemy indukcje wzgledem k . Dla k = 1 mamy f(x) = a1,1x2 , zatem
forma jest dodatnio określona wtedy i tylko wtedy, gdy a1,1 > 0 .
Dla k = 2 mamy
f(x) = a1,1x2 + a1,2x1x2 + a2,1x2x1 + a2,2x2 = a1,1x2 + 2a1,2x1x2 + a2,2x2 .
1 2 1 2
Oczywiście musi być a1,1 = f(e1) > 0 , czyli musi być M1 > 0 . Funkcje f możemy
potraktować jako wielomian kwadratowy zmiennej x1 zależny od parametru x2 .
Ma on przyjmować jedynie wartości dodatnie dla x2 = 0 . Warunkiem koniecznym i
dostatecznym na to jest, jak wiadomo z nauki w liceum,
"
0 < - = a1,1a2,2x2 - a2 x2 = (a1,1a2,2 - a2 )x2 ,
2 1,2 2 1,2 2
4
*Wg. ksiażki Mostowskiego i Starka, Elementy Algebry Wyższej, Warszawa, PWN 1963, wyd 5. Poda-
jemy ten w dowód, bo jest on chyba najbardziej elementarny z tych, które autor widzia wymaga
laśnie l,
jedynie podstawowych wiadomości o wielomianach kwadratowych jednej zmiennej i wyznacznikach.
37
Funkcje wielu zmiennych Micha Krych
l
czyli M2 > 0 .
Za óżmy teraz, że teza zachodzi dla wszystkich form kwadratowych określonych
l
na przestrzeni wymiaru mniejszego niż k + 1 . Wykażemy, że zachodzi również dla
form określonych na przestrzeni wymiaru k . Mamy
ëÅ‚ öÅ‚
k+1 k+1
f(x) = a1,1x2 + 2x1 íÅ‚ a1,jxjÅ‚Å‚ + ai,jxixj .
1
j=2 i,j=2
Warunkiem koniecznym i dostatecznym na to, by f(x) > 0 dla x = 0 jest a1,1 > 0
oraz
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚2
k+1 k+1
"
íÅ‚
0 < - = a1,1 íÅ‚ ai,jxixjÅ‚Å‚ - a1,jxjÅ‚Å‚ =
4
i,j=2 j=2
k+1 k+1 k+1
= a1,1ai,jxixj - a1,ia1,jxixj = bi,jxixj ,
i,j=2 j=2 i,j=2
gdzie bi,j = a1,1ai,j - a1,ia1,j . Ostatnie wyrażenie jest forma kwadratowa k zmien-
nych, wiec na mocy za
lożenia indukcyjnego warunkiem koniecznym i dostatecznym
jego dodatniej określoności jest
b2,2 b2,3 . . . b2,k+1
b3,2 b3,3 . . . b3,k+1
b2,2 b2,3
| b2,2 | > 0 , > 0 , . . . , > 0 .
. . .
.
. . . .
b3,2 b3,3
.
. . .
bk+1,2 bk+1,3 . . . bk+1,k+1
Dla l " {2, . . . , k + 1} mamy
b2,2 b2,3 . . . b2,l
b3,2 b3,3 . . . b3,l
0 < =
. . .
.
. . . .
.
. . .
bl,2 bl,3 . . . bl,l
a1,1a2,2 - a2 a1,1a2,3 - a1,2a1,3 . . . a1,1a2,l - a1,2a1,l
1,2
a1,1a3,2 - a1,2a1,3 a1,1a3,3 - a2 . . . a1,1a3,l - a1,3a1,l
1,3
= =
. . .
.
. . . .
.
. . .
a1,1al,2 - a1,2a1,l a1,1a3,l - a1,3a1,l . . . a1,1al,l - a2
1,l
1 a1,2 a1,3 . . . a1,l
0 a1,1a2,2 - a2 a1,1a2,3 - a1,2a1,3 . . . a1,1a2,l - a1,2a1,l
1,2
0 a1,1a3,2 - a1,2a1,3 a1,1a3,3 - a2 . . . a1,1a3,l - a1,3a1,l .
1,3
=
. . . .
.
. . . . .
.
. . . .
0 a1,1al,2 - a1,2a1,l a1,1a3,l - a1,3a1,l . . . a1,1al,l - a2
1,l
Ostatnia równość wynika z tego, że wyznacznik można obliczać rozwijaja c go wzgle-
dem pierwszej kolumny. Teraz pomnożymy pierwszy wiersz przez a1,2 i dodamy do
drugiego, potem pierwszy wiersz przez a1,3 i dodamy do trzeciego, itd. Ponieważ te
38
Funkcje wielu zmiennych Micha Krych
l
operacje nie zmieniaja wartości wyznacznika, wiec otrzymamy
1 a1,2 a1,3 . . . a1,l
a1,2 a1,1a2,2 a1,1a2,3 . . . a1,1a2,l
a1,3 a1,1a3,2 a1,1a3,3 . . . a1,1a3,l
0 < .
. . . .
.
. . . . .
.
. . . .
a1,l a1,1al,2 a1,1al,3 . . . a1,1al,l
Pomnożymy teraz pierwszy wiersz przez liczbe a1,1 > 0 , nie zmienia to znaku wy-
znacznika, bo mnożenie wiersza przez liczbe to to samo, co mnożenie wyznacznika
przez te liczbe. W otrzymanym wyznaczniku wszystkie wyrazy w kolumnach drugiej,
trzeciej itd. zawieraja czynnik a1,1 , wiec z tych kolumn można go wy co ozna-
la czyć,
cza podzielenie wyznacznika przez liczbe al-1 > 0 . Znak pozostaje niezmieniony, a
1,1
a1,1 a1,2 a1,3 . . . a1,l
a1,2 a2,2 a2,3 . . . a2,l
a1,3 a3,2 a3,3 . . . a3,l Tym samym zakończyliśmy
otrzymany wyznacznik to .
. . . .
.
. . . . .
.
. . . .
a1,l al,2 al,3 . . . al,l
dowód.
Przyk 16.22 Rozważymy trzy funkcje
lad
2
1
f(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + (y + 1)2(y - 2)2 ,
4
2
1
g(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + y2(y + 3)2 ,
4
2
1
h(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + (y + 1)2(y + 3)2 .
4
Znajdziemy ich lokalne ekstrema oraz kresy.
Zachodza równości
"f
(x, y) = -e2x -e2x + (y + 1)2(y - 2)2 ,
"x
"f
(x, y) = 30y(y + 3)(y + 1)(y - 2) + (y + 1)(y + 2)(2y - 1) -e2x + (y + 1)2(y - 2)2
"y
"g
(x, y) = -e2x -e2x + y2(y + 3)2 ,
"x
"g
(x, y) = 30y(y + 3)(y + 1)(y - 2) + (y + 1)(y + 2)(2y + 3) -e2x + y2(y + 3)2 ,
"y
"h
(x, y) = -e2x -e2x + (y + 1)2(y + 3)2 ,
"x
"h
(x, y) = 30y(y + 3)(y + 1)(y - 2) + 2(y + 1)(y + 2)(y + 3) -e2x + (y + 1)2(y + 3)2 .
"y
Znajdziemy punkty krytyczne funkcji f, g, h , czyli punkty, w których ich gra-
dienty sa wektorami zerowymi.
"f
Z równości = 0 wynika, że -e2x + (y + 1)2(y - 2)2 = 0 , a z niej i z równości
"x
"f
= 0 wynika, że y(y+3)(y+1)(y-2) = 0 . Musi wiec być spe jedna z czterech
lniona
"y
równości y = 2 , y = 0 , y = -1 , y = -3 . Trzeba znalezć odpowiadaja ce tym
wartoÅ›ciom zmiennej y wartoÅ›ci zmiennej x . Prowadzi to do równoÅ›ci e2x = 32 · 02 ,
39
Funkcje wielu zmiennych Micha Krych
l
e2x = 12 · (-2)2 , e2x = 02 · (-3)2 i e2x = (-2)2 · (-5)2 . Ani pierwsze ani trzecie
równanie nie ma rozwia zań. Z drugiego wynika, że x = ln 2 . Z czwartego z kolei
wnioskujemy, że x = ln 10 . Znalezliśmy wiec wszystkie punkty krytyczne funkcji f .
Sa dwa takie punkty: (ln 2, 0) i (ln 10, -3) . W żadnym innym punkcie funkcja f
lokalnego ekstremum nie ma.
Znajdziemy pochodne cza stkowe drugiego rzedu, a raczej drugie wielomiany Tay-
lora tych funkcji. Niech x = ln 2 + u . Mamy
f(x, y) = f(ln 2 + u, y) =
2
1
= 6y5 + 15y4 - 50y3 - 90y2 + -e2(ln 2+u) + (y + 1)2(y - 2)2 =
4
2
1
= 6y5 + 15y4 - 50y3 - 90y2 + -4e2u + (y2 - y - 2)2 =
4
= 6y5 + 15y4 - 50y3 - 90y2 +
2
1 4u2 8u3
+ -4(1 + 2u + + + · · ·) + 4 + 4y - 3y3 - 2y3 + y4 =
4 2! 3!
1
= -90y2 - 50y3 + 15y4 + 6y5 + (-8u + 4y + · · ·)2 =
4
= -90y2 + 16u2 - 16uy + 4y2 + · · · = 16u2 - 16uy - 86y2 + · · · .
Opuściliśmy wszystkie cz które nie maja wp na wspó
lony, lywu lczynniki przy jedno-
mianach stopnia 2 , tzn przy u2, uy, y2 .
Twierdzenie o lokalnych ekstremach pozwala na stwierdzenie, że ponieważ wyra-
żenie (forma kwadratowa) 16u2 - 16uy - 86y2 przyjmuje czasem wartości dodatnie,
np. dla u = 1 i y = 0 , a czasem ujemne, np. dla u = 0 i y = 1 , wiec funkcja w punk-
cie (ln 2, 0) nie ma ani lokalnego maksimum, ani lokalnego minimum. Mówimy w tym
przypadku o siodle.
Teraz zajmiemy sie okolica punktu (ln 10, -3) . Przyjmiemy, że x = ln 10 + u i
y = -3 + v . Wtedy
f(x, y) = f(ln 10+u, -3+v) = 6(-3+v)5 +15(-3+v)4 -50(-3+v)3 -90(-3+v)2 +
2
1
+ -e2(ln 10+u) + (-3 + v + 1)2(-3 + v - 2)2 =
4
= 6(-3)5 + 15(-3)4 - 50(-3)3 - 90(-3)2 +
+ 6 · 5 · (-3)4v + 15 · 4 · (-3)3v - 50 · 3 · (-3)2v - 90 · 2 · (-3)v +
5 4 3
+ 6 · · (-3)3v2 + 15 · · (-3)2v2 - 50 · · (-3)v2 - 90v2 + · · · +
2 2 2
2
4u2
+1 -100(1 + 2u + + · · ·) + (4 - 4v + v2)(25 - 10v + v2) =
4 2!
1
= 297 - 450v2 + · · · (-200u + · · · - 140v + · · ·)2 =
4
1
= 297 - 450v2 + (-200u - 140v)2 + · · · =
4
= 297 + 10000u2 + 14000uv + 4450v2 + · · · .
Jasne jest, że wyrażenie 10000u2 + 14000uv + 4450v2 bywa dodatnie, np. gdy przyj-
40
Funkcje wielu zmiennych Micha Krych
l
miemy u = 1, v = 0 . Bywa również ujemne np. dla u = 14, v = -20 . Wobec w
punkcie (ln 10, -3) funkcja f ma siod
lo.
Kres górny funkcji f równy jest +" , bo
1
lim f ln (y + 1)(y - 2) , y = lim (6y5 + 15y4 - 50y3 - 90y2) = +" .
2
y" y"
Kres górny funkcji f równy jest -" , bo
1
lim f ln (y + 1)(y - 2) , y = lim (6y5 + 15y4 - 50y3 - 90y2) = -" .
2
y-" y-"
Teraz zajmiemy sie funkcja g . Oczywiście obliczenia sa bardzo podobne, wiec
podamy tylko wyniki i wycia gniemy wnioski.
Gradient funkcji g zeruje sie w dwóch punktach: (ln 2, -1) i (ln 10, 2) .
Podstawiaja c x = u + ln 2 i y = v - 1 otrzymujemy
g(x, y) = g(u + ln 2, v - 1) = -31 + 16u2 + uv + 94v2 + · · · .
Wyrażenie 16u2 +uv+94v2 jest dodatnie dla dowolnie wybranych liczb u, v z wyja t-
kiem u = 0 = v . Jeśli bowiem potraktujemy je jako wielomian kwadratowy zmiennej
u z parametrem v , to jego wyróżnik równy bedzie " = v2 - 4 · 16 · 94v2 , wiec
wyróżnik ten jest ujemny dla v = 0 ; jasne jest, że gdy v = 0 , to jedynym u , dla
którego 16u2 + uv + 94v2 = 0 jest liczba 0 . Wobec tego funkcja g ma lokalne
minimum w punkcie (ln 2, -1) .
Podstawiaja c x = u + ln 10 i y = v + 2 otrzymujemy
g(x, y) = g(u + ln 10, v + 2) = 328 + 10000u2 - 14000uv + 5350v2 + · · · .
Wyrażenie 10000u2 - 14000uv + 5350v2 jest dodatnie dla dowolnie wybranych liczb
u, v z wyja tkiem u = 0 = v , bo
(-14000v)2 -4·10000·5350v2 = (196 000 000-214 000 000)v2 = -18 000 000v2 < 0 .
Wobec tego funkcja g ma lokalne minimum w punkcie (ln 10, 2) . Podobnie jak dla
funkcji f wykazujemy, że kresem górnym funkcji g jest +" , a kresem dolnym
-" . Innych punktów krytycznych ta funkcja nie ma. Prosze spróbować wyobrazić
sobie wykres funkcji g . Jest to niez ćwiczenie na zrozumienie sytuacji.
le
Gradient funkcji h zeruje sie w dwóch punktach: (ln 3, 0) i (ln 15, 2) .
Podstawimy najpierw x = u + ln 3 . Mamy wtedy
h(x, y) = h(u + ln 3, y) = 6y5 + 15y4 - 50y3 - 90y2 +
2
1
+ -e2(u+ln 3) + (y + 1)2(y + 3)2 =
4
= 81u2 - 216uy + 54y2 + · · · .
Wyrażanie 81u2-216uy+54y2 bywa dodatnie, np. gdy y = 0 = u ; bywa też ujemne,
np. gdy u = y = 0 . Wobec tego w punkcie (ln 3, 0) funkcja h ma siod
lo.
Teraz kolej na punkt (ln 15, 2) . Podstawimy x = u + ln 15 , y = 2 + v . Po pewnych
41
Funkcje wielu zmiennych Micha Krych
l
rachunkach otrzymujemy
h(x, y) = h(u + ln 3, 2 + v) = 6(2 + v)5 + 15(2 + v)4 - 50(2 + v)3 - 90(2 + v)2 +
2
1
+ -e2(u+ln 3) + (2 + v + 1)2(2 + v + 3)2 =
4
= -328 + 50625u2 - 54000uv + 14850v2 + · · · .
Ponieważ 540002 - 4 · 50625 · 14850 = -91125000 < 0 , wiec wyrażenie 50625u2 -
54000uv+14850v2 traktowane jako wielomian kwadratowy zmiennej u z parametrem
v nie ma pierwiastków rzeczywistych, wiec przyjmuje jedynie wartości dodatnie z
wyja tkiem przypadku v = 0 , w którym ma jeden pierwiastek podwójny u = 0 . W
tej sytuacji funkcja ma lokalne minimum w punkcie (ln 15, 2) .
Tak jak w przypadku funkcji f z
latwościa stwierdzamy, że kres górny funkcji
h równy jest +" , a dolny -" .
Podsumowanie: w przypadku funkcji jednej zmiennej ekstrem wystepowa na
ly
zmiane; w przypadku funkcji dwu zmiennych, tym bardziej w przypadku funkcji
wiekszej ich liczby może być zupe inaczej. Wynika to z tego, że struktura geo-
lnie
metryczna p lożona
laszczyzny jest bardziej z niż struktura prostej, a w wyższych wy-
miarach te efekty sa jeszcze silniejsze. Nie bedziemy w te kwestie wchodzić g
lebiej.
Jednak wypada podkreślić, że nie wolno zbyt szybko wycia gać wniosków i zbytnio
wierzyć swej intuicji, bo ona może zawieść. Trzeba korzystać z twierdzeń, które sa
prawdziwe zwracaja c uwage na to, czy za lnione.
lożenia sa spe
Uwaga 16.32 Rozumowania z ostatniego przyk (bezpośrednio przed ta uwaga )
ladu
można skrócić bardzo istotnie traktuja c każda z trzech rozważanych tam funkcji
jako sume wielomianu 6y5 + 15y4 - 50y3 - 90y2 zmiennej y i kwadratu pewnej
funkcji dwu zmiennych. Bez trudu stwierdzamy, że w punktach -3 i 0 wielomian
6y5+15y4-50y3-90y2 ma lokalne maksima, a w punktach -1 i 2 lokalne minima.
Kwadrat funkcji jakiejkolwiek w punkcie, w którym przyjmuje wartość 0 ma swoje
minimum i to nie tylko lokalne. Sta d od razu wynika, że funkcja g ma w punktach
(ln 2, -1) i (ln 10, 2) lokalne minima oba sk
ladniki maja tam lokalne minima!
Minima te sa w
laściwe, bo w żadnym innym punkcie funkcja g lokalnego minimum
nie ma, gdyż jej jedynymi punktami krytycznymi sa te dwa punkty. Zachecamy do
zastosowania tej metody w przypadku funkcji f i funkcji h .
Zadania
16. 01 Zbadać cia g odwzorowania f : IR3 IR2 określonego nastepuja co:
lość
xy x2y2z2
f(x, y, z) = , , gdy (x, y, z) = (0, 0, 0) i f(0, 0, 0) = (0, 0) .
1 + z2 x2 + y2 + z2
16. 02" Niech f(x, y) = xy dla x > 0 i y > 0 . Pokazać, że nie można określić funkcji
42
Funkcje wielu zmiennych Micha Krych
l
w (0, 0) tak, aby by ona cia g w tym punkcie.
la la
x2y
16. 03 Definiujemy funkcje f : IR2 IR za pomoca wzorów: f(x, y) = , gdy
x4 + y2
(x, y) = (0, 0) oraz f(0, 0) = 0 . Pokazać, że obciecie f do dowolnej prostej
przechodza cej przez (0, 0) jest funkcja cia g na tej prostej, mimo że funkcja f
la
nie jest cia g w (0, 0) .
la
16. 04" Zbiór S = {x " IRk: f(x) = f(x0)} nazywamy poziomica (warstwica ) prze-
chodza ca przez punkt x0 funkcji f: IRk IR . Pokazać, że poziomice funkcji
cia g sa domkniete w IRk .
lej
16. 05 Obliczyć pochodne cza stkowe funkcji
2
x
(a) f(x, y) = e-x -2xy+4 , (b) f(x, y) = arctan( ) ,
y
k
(c) f(x, y, z) = ex sin y + ey sin(2z) + ez sin(3x) ,f(x) = x = x2 , dla x = 0 ,
(d)
i
i=1
k
(e) f(x) = e-x·x, dla x " IRk , gdzie x · x = x2 .
i
i=1
16. 06 Narysować nastepuja ce zbiory (w odpowiedniej przestrzeni, R2 lub R3 ):
a. A = {(x, y): |x| - |y| d" 1} ,
b. B = {(x, y): 0 < x + y d" 1, y e" x2} ,
c. C = {(x, y): 0 < x + y d" 1, y e" x2 + 1} ,
d. D = {(x, y): x2 + 2x + y2 - 4y e" -1, 9x2 + 16y2 d" 144} ,
e. E = {(x, y, z): x e" 0, y e" 0, z e" 0, x + 2y + 3z = 6} ,
f. F = {(x, y, z): x e" 0, y e" 0, z e" 0, x + 2y + 3z < 6} ,
g. G = {(x, y, z): x2 + y2 = 4z2, x2 + y2 + z2 = 9} ,
h. H = {(x, y, z): x2 + y2 d" 4z2, x2 + y2 + z2 d" 9} ,
i. I = {(x, y, z): x2 + y2 = 4, x2 + y2 + z2 d" 9} ,
j. J = {(x, y, z): x2 + y2 d" 4, x2 + y2 + z2 d" 9} ,
k. K = {(x, y, z): x2 + y2 d" 4, x2 + y2 + z2 > 9} ,
l. L = {(x, y, z): x2 + y2 < z, x2 + y2 + z2 d" 1} ,
m. M = {(x, y, z): x2 - y2 = z, x2 + y2 + z2 d" 1} ,
n. N = {(x, y, z): x2 + y2 d" 4, x2 + y2 - z2 d" 1} ,
o. O = {(x, y, z): x2 + y2 d" 4, z2 - x2 - y2 d" 1} ,
p. P = {(x, y, z): xy d" 0, x2 + z2 d" 1}
r. R = {(x, y, z): x e" 0, y e" 0, z e" 0, x + y + z < 3} ,
s. S = {(x, y, z): x e" 0, y e" 0, z e" 0, x + y + 2z e" 6, x + y + z d" 6} ,
43
Funkcje wielu zmiennych Micha Krych
l
t. T = {(x, y, z): x e" 0, y e" 0, z e" -6, x + y + 2z e" 6, x + y + z d" 6} ,
u. U = {(x, y, z): |x| d" 1, |y| d" 1, |z| d" 1, x2 + y2 + z2 e" 1} ,
v. V = {(x, y, z): |x| d" 1, |y| d" 1, |z| d" 1, x2 + y2 + z2 > 1} ,
w. W = {(x, y, z): |x| d" 1, |y| d" 1, |z| d" 1, x2 + y2 + z2 = 1} .
16. 07" Wyjaśnić, które ze zbiorów zdefiniowanych w zadaniu 6 sa otwarte, które domk-
niete, które ograniczone, które zwarte, a które wypuk
le.
x
16. 08" Cia g normy. Pokazać, że - y d" x - y .
lość
16. 09" Wypuk normy. Pokazać, że ąx + (1 - ą)y d" ą x + (1 - ą) y dla
lość
0 d" ą d" 1 . Pokazać, że kule B(x0, r) , B(x0, r) sa zbiorami wypuk Zbiór
lymi.
A jest wypuk jeśli każdy odcinek, którego końce leża w zbiorze A jest zawarty
ly,
w A .
16. 10 Znalezć kierunek najszybszego wzrostu funkcji f , czyli jej gradient, w punkcie
P dla:
y
(a) f(x, y) = arctan( ) , p = (1, -2)(b) f(x, y, z) = xy2z3 , p = (2, 2, 2) ;
;
x
(c) f(x, y, z) = ex-y-z , p = (5, 2, 3) ; f(x, y, z) = x + 2y + 3z , p = (1, 1, 1) .
(d)
Uwaga: dla funkcji f zależnej od 3 zmiennych zachodzi równość: grad f(p) =
"f "f "f
="f(p) = (p), (p), (p) , analogicznie w przypadku dwu zmiennych.
"x "y "z
16. 11" Pokazać, że niżej zdefiniowana funkcja jest różniczkowalna w (0, 0) :
x3+y3
"
, jeżeli (x, y) = (0, 0);
x2+y2
f(x, y) =
0, jeżeli (x, y) = (0, 0).
a funkcja
x3+y3
, jeżeli (x, y) = (0, 0);
x2+y2
f(x, y) =
0, jeżeli (x, y) = (0, 0).
jest cia g w punkcie (0, 0) , ale różniczkowalna w tym punkcie nie jest.
la
"
3
16. 12" Pokazać, że funkcja f(x, y) = xy nie jest różniczkowalna w (0, 0) , chociaż
istnieja obie pochodne cza stkowe w tym punkcie.
16. 13 Znalezć punkty zerowania sie gradientu funkcji f i wyjaśnić, w których z nich
ma ona lokalne minima, w których lokalne maksima, a w których nie ma lo-
kalnego ekstremum, jeśli
(a) f(x, y, z) = x2 + y2 + z2 + 2x + 4y - 6z ;
(b) f(x, y) = x3 + 3xy2 - 15x - 12y ;
(c) f(x, y, z) = x3 + y2 + z2 + 12xy + 2z ;
4y2 z2 2
(d) f(x, y, z) = x + + + ;
x y z
44
Funkcje wielu zmiennych Micha Krych
l
(e) f(x, y, z) = xy2z3(6 - x - 2y - 3z) ;
(f) f(x, y) = 3x8 + 3y8 + 8x3y3 ;
(g) f(x, y) = y2 + 3x2y - x3y ;
(h) f(x, y) = y2 + y4 + 3x4 - 4x3 - 12x2 ;
(i) f(x, y) = x5y7(13 - x - y) ;
(j) f(x, y) = -x4 + y4 + 4x2y - 2y2 ;
w otoczeniu punktu (0, 0) rozważyć zachowanie sie funkcji f na paraboli y =
x2 .
(k) f(x, y) = x4 - y4 - 2x3 - 2xy2 + x2 + y2 .
1
16. 14 Niech f(x, y, z) = · 3(x + y)3 - 18x2 - 36xy - 54y2 - 9z2 + 2 .
9
Znalezć punkty krytyczne f , tj. te, w których
grad f(x, y, z) = (x + y)2 - 4x - 4y, (x + y)2 - 4x - 12y, -2z
jest wektorem zerowym. Wyjaśnić, w których z tych punktów funkcja f ma
lokalne minima, w których lokalne maksima, a w których nie ma lokalnego eks-
tremum.
2
1
16. 15" Niech f(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + (y + 1)2(y - 2)2 ,
4
2
1
g(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + y2(y + 3)2 .
4
Znalezć punkty zerowania sie gradientu obu funkcji i wyjaśnić, w których punk-
tach funkcje maja lokalne minima, w których lokalne maksima, a w których nie
ma lokalnego ekstremum. Wykazać, że funkcje f i g nie sa ograniczone ani z
góry ani z do
lu.
16. 16 Zobaczmy, co sie może wydarzyć w wymiarze wiekszym niż 1 :
(a) Wykazać, że funkcja (1 + ey) cos x - yey ma nieskończenie wiele maksimów
lokalnych, chociaż nie ma żadnego minimum lokalnego.
2
1
(b) Niech f(x, y) = 6y5 + 15y4 - 50y3 - 90y2 + -e2x + (y + 1)2(y + 3)2 .
4
Znalezć kresy funkcji f i punkty, w których funkcja ta ma lokalne ekstrema.
"f
Można skorzystać z równości: (x, y) = -e2x -e2x + (y + 1)2(y + 3)2 i
"x
"f
(x, y) = 30y(y + 3)(y + 1)(y - 2) +
"y
+ 2(y + 1)(y + 2)(y + 3) -e2x + (y + 1)2(y + 3)2 .
xy2
16. 17 Znalezć kresy funkcji f w pierwszej ćwiartce, jeśli f(x, y) = .
4x2+y4+4
xy2-1
16. 18" Niech f(x, y) = . Znalezć kres górny i kres dolny wartości funkcji
4x2+y4+4
f w pierwszej ćwiartce uk wspó
ladu lrzednych. Wyjaśnić, czy funkcja f ma
wewna trz pierwszej ćwiartki uk wspó
ladu lrzednych lokalne ekstrema.
45
Funkcje wielu zmiennych Micha Krych
l
"f (y2+2x)(y4-2xy2+4) "f 2y(y2+2x)(2x2+2-xy2)
Informacja: = , = .
"x (4x2+y4+4)2 "x (4x2+y4+4)2
16. 19" Niech p, q, r " R2 oznaczaja trzy niewspó
lliniowe punkty. Niech f(x) =
x - p + x - q + + x - r dla x " R2 , tzn. f(x) jest suma odleg
lości
punktu x od danych punktów p, q, r . Wykazać, że jeśli f(x0) jest najmniejsza
wartościa funkcji f: R2 - [0, ") , to albo x0 jest jednym z punktów p, q, r ,
- - -
2Ä„
albo ka ty miedzy wektorami x--p, x--q, x-- r sa równe .
- - -
3
16. 20 Znalezć kres dolny i kres górny funkcji f , f(x, y, z) = (3x+2y +z)e-(6x+5y+3z) ,
na zbiorze E = {(x, y, z): x > 0, y > 0, z > 0} .
16. 21 Znalezć kres dolny i kres górny funkcji f , f(x, y, z) = (3x+2y +z)e-(6x+5y+3z) ,
na zbiorze E = {(x, y, z): x > 0, y > 0, z > 0} .
16. 22 Niech f(x, y) = x2y5(8 - x - y) . Znalezć wszystkie punkty zerowania sie gra-
dientu funkcji f i wyjaśnić, w których z nich funkcja f ma lokalne ekstrema
i jakiego typu, a w których lokalnych ekstremów ta funkcja nie ma. Znalezć
sup{f(x, y): 0 d" x, 0 d" y, x + y d" 10} .
16. 23 Niech f(x, y) = x6y5(12 - x - y) . Znalezć wszystkie punkty zerowania sie gra-
dientu funkcji f i wyjaśnić, w których z nich funkcja f ma lokalne ekstrema i
jakiego typu, a w których lokalnych ekstremów ta funkcja nie ma. Znalezć
sup{f(x, y): 0 d" x, 0 d" y, x + y d" 10}
i sup{f(x, y): 0 d" x, 0 d" y, x + y d" 12} .
16. 24 Niech f(x, y) = x4y2(7 - 4x - 2y) . Znalezć wszystkie punkty zerowania sie
gradientu funkcji f i wyjaśnić, w których z nich funkcja f ma lokalne ekstrema
i jakiego typu, a w których lokalnych ekstremów ta funkcja nie ma.
Znalezć sup{f(x, y): 0 d" x, 0 d" y, x + y d" 1} ,
inf{f(x, y): 0 d" x, 0 d" y, x + y d" 1}
i sup{f(x, y): 0 d" x, 0 d" y, x + y d" 2} .
16. 25 Niech f(x, y) = x3y2(6 - x - 6y) . Znalezć wszystkie punkty zerowania sie gra-
dientu funkcji f i wyjaśnić, w których z nich funkcja f ma lokalne ekstrema
i jakiego typu, a w których lokalnych ekstremów ta funkcja nie ma. Znalezć
sup{f(x, y): 0 d" x d" 10, 0 d" y d" 2} .
16. 26 Znalezć punkty zerowania sie gradientu funkcji x5y7(13 - x - y) i wyjaśnić,
w których z nich ma ona lokalne minima, w których lokalne maksima, a
w których nie ma lokalnego ekstremum. Znalezć kresy funkcji f na zbiorze
{(x, y): |x|, |y| d" 10} .
16. 27 Znalezć kres dolny i kres górny funkcji xy - x - y + 3 , na zbiorze E , jeśli E
jest trójka tem domknietym o wierzcho (0, 0) , (2, 0) , (0, 4) .
lkach
46
Funkcje wielu zmiennych Micha Krych
l
16. 28 Znalezć kres dolny i kres górny funkcji x2 + y2 - xy , na zbiorze
E = {(x, y): |x| + |y| d" 1} .
16. 29 Znalezć kres dolny i kres górny funkcji xy2 , na zbiorze
E = {(x, y): x2 + y2 d" 3} .
2
16. 30 Znalezć kres dolny i kres górny funkcji (1 + x2)e-x -y2 , na p
laszczyznie R2 .
16. 31 Niech f(x, y, x) = 3x + 2y - z , g(x, y, x) = 3x + 2y + z , T niech ozna-
cza czworościan o wierzcho A = (1, 1, 0) , B = (1, 2, 2) , C = (2, 1, 3) ,
lkach
D = (3, 2, 4) . Znalezć najwieksza i najmniejsza wartość każdej z funkcji f, g na
czworościanie T . W ilu punktach funkcje f, g przyjmuja wartości ekstremalne
na czworościanie T .
16. 32 Niech f(x, y, z) = x4 + y5 + z6 , g(x, y, z) = 6x6 + 4y4 + 2z2 . Mamy
grad f(0, 0, 0) = (0, 0, 0) = grad g(0, 0, 0) .
Która z funkcji f, g ma w punkcie (0, 0, 0) lokalne ekstremum i dlaczego?
16. 33 Niech h(x, y) = ay(ex - 1) + x sin x - cos y . Dla jakich a " R funkcja h ma
lokalne ekstremum w punkcie (0, 0) , a dla jakich lokalnego ekstremum w tym
punkcie nie ma?
Wskazówka: Dla pewnego a badanie drugiej różniczki może nie pozwolić na
stwierdzenie, czy w punkcie (0, 0) funkcja ma lokalne ekstremum, czy też nie;
w tym przypadku warto zainteresować sie prosta przechodza ca przez (0, 0) ,
z z takich punktów (u, v) , że
lożona
"2h "2h "2h
(0, 0)u2 + 2 (0, 0)uv + (0, 0)v2 = 0 .
"x2 "x"y "y2
16. 34 Niech f(x, y) = x4 + y4 + 2x2y2 - 2x2 + 2y2 + 1 .
Znalezć punkty krytyczne funkcji f .
Wyjaśnić, w których punktach krytycznych funkcja f ma lokalne maksima,
w których lokalne minima, a w których siod
la.
Znalezć najmniejsza i najwieksza wartość funkcji f w kole
K = {(x, y): x2 + y2 d" 4}.
16. 35 Niech f(x, y) = x2 + (xy - 1)2 dla (x, y) " R2 ,
Q := {(x, y): -1 d" x d" 1 i - 1 d" y d" 1} .
Znalezć wszystkie punkty zerowania sie gradientu funkcji f i wyjaśnić, czy f
ma w tych punktach lokalne maksima, lokalne minima lub siod
la.
Znalezć najmniejsza i najwieksza wartość funkcji f w kwadracie Q .
Znalezć najmniejsza i najwieksza wartość funkcji f w p
laszczyznie R2 lub wy-
kazać, że jedna z nich lub obie nie istnieja .
16. 36 Niech f(x, y) = 8y2 + 6x2y - x3y .
47
Funkcje wielu zmiennych Micha Krych
l
Znalezć punkty krytyczne funkcji f .
Wyjaśnić, w których punktach krytycznych funkcja f ma lokalne maksima, w
których lokalne minima, a w których siod
la.
Znalezć najmniejsza i najwieksza wartość funkcji f w prostoka cie
R = {(x, y): -1 d" x d" 6, -3 d" y d" 1}.
16. 37 Niech f(x, y) = y2 + 3x2y - x3y dla (x, y) " R2 ,
Q := {(x, y): -1 d" x d" 4 i - 3 d" y d" 1} .
Znalezć wszystkie punkty zerowania sie gradientu funkcji f i wyjaśnić, czy f
ma w tych punktach lokalne maksima, lokalne minima lub siod
la.
Znalezć najmniejsza i najwieksza wartość funkcji f w kwadracie Q .
Znalezć najmniejsza i najwieksza wartość funkcji f w p
laszczyznie R2 lub wy-
kazać, że jedna z nich lub obie nie istnieja .
16. 38 Niech f(x, y) = x3 - 12xy + 8y3 . Znalezć najmniejsza i najwieksza wartość
funkcji f w zbiorze T = {(x, y): 0 d" x d" 4, 0 d" y d" 4 i x + y d" 4} .
Narysować zbiór T .
16. 39 Niech f(x, y) = x2 + 3xy2 - xy3 . Znalezć najmniejsza i najwieksza wartość
funkcji f w prostoka cie R = {(x, y): -3 d" x d" 0 i - 1 d" y d" 3} .
16. 40 Niech f(x, y) = 2x2y + xy2 - 12xy . Znalezć najmniejsza i najwieksza wartość
funkcji f w prostoka cie Q = {(x, y): -1 d" x d" 6 i - 1 d" y d" 12} .
16. 41 Niech f(x, y) = x2y + xy2 - 3xy . Znalezć najmniejsza i najwieksza wartość
funkcji f w kwadracie Q = {(x, y): -1 d" x d" 13 i - 1 d" y d" 13} .
48
Wyszukiwarka
Podobne podstrony:
ch11 12 rr zm rozdzustawa 12 2010 zm ustawy o stos P do KKch11 12 szeregi potch11 12 zespch11 12 macierzech11 (12)ch11 12 rr uzm sta I rzch11 12 rr ukladych11 12 pochodnech11 12 geoman2ch11 12 pochodne wyzszych rz248 12Biuletyn 01 12 201412 control statementswięcej podobnych podstron