Idczak D Badania operacyjne w logistyce

background image

Badania Operacyjne w Logistyce

kierunek Informatyka, studia I stopnia, III rok

wyklad

1

Programowanie nieliniowe

1.1

Funkcje jednej zmiennej

W rozdziale tym przypomnimy wybrane fakty dotycz ˛

ace minimalizacji funkcji jednej

zmiennej.

1.1.1

Istnienie rozwi ˛

aza´

n - twierdzenie Weierstrassa

Rozwa˙zmy zadanie postaci

J(u) → min .,

u ∈ U

(1)

gdzie J : U → R, U ⊂ R jest ustalonym zbiorem.

Punkt u

∈ U nazywamy punktem lokalnego minimum funkcji J na zbiorze U

(lokalnym rozwi ˛

azaniem zadania (1)), je´sli istnieje przedział otwarty V , zawieraj ˛

acy

punkt u

, taki, ˙ze

J(u

) ≤ J(u)

dla dowolnego u ∈ V ∩ U. Punkt u

∈ U nazywany jest punktem minimum global-

nego funkcji J na zbiorze U , gdy powy˙zsza nierówno´s´c jest spełniona przez wszystkie

punkty u ∈ U . Zbiór wszystkich punktów minimum globalnego funkcji J na zbiorze

1

background image

U oznaczamy symbolem U

. Kres dolny warto´sci funkcji J na zbiorze U oznaczamy

symbolem J

, t.zn. J

= inf

u

∈U

J(u).

Zanim sformułujemy klasyczne twierdzenie o istnieniu punktu minimum global-

nego, podamy okre´slenie funkcji półci ˛

agłej z dołu.

Mówimy, ˙ze funkcja J : U → R jest półci ˛agła z dołu w punkcie u

0

∈ U, je´sli dla

dowolnego ε > 0 istnieje przedział otwarty V , zawieraj ˛

acy punkt u

0

, taki, ˙ze

J(u

0

) − ε ≤ J (u)

dla dowolnego u ∈ V ∩ U . Mówimy, ˙ze J jest półci ˛agła z dołu na zbiorze U, je´sli

jest półci ˛

agła w ka˙zdym punkcie u ∈ U.

Mo˙zna pokaza´c, ˙ze funkcja J : U → R jest półci ˛agła z dołu w punkcie u

0

∈ U

wtedy i tylko wtedy, gdy dla dowolnego ci ˛

agu (u

n

) ⊂ U takiego, ˙ze lim

n

→∞

u

n

= u

0

zachodzi

J(u

0

) ≤ lim inf

n

→∞

J(u

n

).

Klasycznym wynikiem jest nast ˛epuj ˛

ace twierdzenie o istnieniu minimum global-

nego funkcji jednej zmiennej, nazywane twierdzeniem Weierstrassa.

Twierdzenie 1 (Weierstrassa) Je´sli funkcja J : [a, b] → R jest półci ˛

agła z dołu

na [a, b], to istnieje punkt minimum globalnego u

∈ [a, b].

1.1.2

Warunki konieczne - zasada Fermata

Prawdziwa jest nast ˛epuj ˛

aca zasada Fermata.

Twierdzenie 2 (Fermata) Je´sli u

jest punktem lokalnego minimum funkcji J:(a, b) →

R

i funkcja J ma w punkcie u

pochodn ˛

a J

(u

), to

J

(u

) = 0.

(2)

1.1.3

Warunki dostateczne

Jeden z warunków dostatecznych na to, by punkt u

był punktem lokalnego mini-

mum funkcji J:(a, b) → R opisuje poni˙zsze twierdzenie.

2

background image

Twierdzenie 3 Je´sli funkcja J : (a, b) → R ma w punkcie u

∈ (a, b) pochodn ˛

a

drugiego rz ˛

edu J

′′

(u

), przy czym J

(u

) = 0 i J

′′

(u

) > 0, to u

jest punktem

lokalnego minimum funkcji J na (a, b).

Uwaga 4 Je´sli spełnione s ˛

a zało˙zenia powy˙zszego twierdzenia, to punkt u

, o którym

mowa 3w powy˙zszym twierdzeniu, jest punktem ´scisłego minimum lokalnego funkcji

J, t.zn. istnieje przedział otwarty V taki, ˙ze u

∈ V oraz

J(u

) < J(u)

dla dowolnego u ∈ V , u = u

.

Uwaga 5 Analogicznie definiuje si ˛

e punkt (´scisłego) maksimum lokalnego i maksi-

mum globalnego. Warunek konieczny istnienia maksimum lokalnego w punkcie jest

taki sam, jak w przypadku minimum, natomiast w warunku dostatecznym stosown ˛

a

nierówno´s´c nale˙zy zast ˛

api´c nierówno´sci ˛

a odwrotn ˛

a.

1.1.4

Zało˙zenie wypukło´sci

Niech I ⊂ R b ˛edzie przedziałem (otwartym, domkni ˛etym lub jednostronnie domkni ˛e-

tym). Funkcj ˛e J : I → R nazywamy wypukł ˛

a, gdy

J(αu

1

+ (1 − α)u

2

) ≤ αJ(u

1

) + (1 − α)J (u

2

)

dla dowolnych α ∈ [0, 1], u

1

, u

2

∈ I.

Wa˙zne własno´sci funkcji wypukłych opisuj ˛a poni˙zsze dwa twierdzenia.

Twierdzenie 6 Niech dana b ˛

edzie funkcja wypukła J : I → R. Wówczas, ka˙zdy

punkt minimum lokalnego jest punktem minimum globalnego.

Dowód. Niech u

∈ I b ˛edzie punktem minimum lokalnego, t.zn. istnieje przedział

otwarty V taki, ˙ze u

∈ V oraz

J(u

) ≤ J(u)

3

background image

dla dowolnego u ∈ I ∩ V . Przypu´s´cmy, ˙ze u

nie jest punktem minimum globalnego,

t.zn. istnieje punkt u ∈ I taki, ˙ze

J(u) < J(u

).

Rozwa˙zmy punkty u

α

postaci u

α

= αu

+ (1 − α)u, gdzie α ∈ [0, 1]. Z wypukło´sci

przedziału I wynika, ˙ze u

α

∈ I dla dowolnego α ∈ [0, 1]. Ponadto, dla α ∈ (0, 1)

dostatecznie bliskich jedno´sci u

α

∈ V i w konsekwencji u

α

∈ I ∩ V , przy czym

J(u

α

) ≤ αJ(u

) + (1 − α)J(u) < αJ(u

) + (1 − α)J(u

) = J(u

).

Przeczy to lokalnej optymalno´sci punktu u

.

Przy zało˙zeniu wypukło´sci prawdziwe jest nast ˛epuj ˛ace odwrócenie twierdzenia

Fermata.

Twierdzenie 7 (odwrócenie twierdzenia Fermata) Niech dana b ˛

edzie funkcja

wypukła J : (a, b) → R. Je´sli J

(u

) = 0, to u

jest punktem minimum globalnego

funkcji J na (a, b).

1.1.5

Metody numeryczne - metoda łamanych

Opiszemy teraz jedn ˛

a z wielu metod numerycznych słu˙z ˛acych do przybli˙zonego

wyznaczania punktów minimum globalnego funkcji jednej zmiennej okre´slonej na

ograniczonym przedziale domkni ˛etym [a, b] ⊂ R.

Mówimy, ˙ze funkcja J : [a, b] → R spełnia warunek Lipschitza, je´sli istnieje stała

L > 0 taka, ˙ze

|J(u) − J(v)| ≤ L |u − v|

dla dowolnych u, v ∈ [a, b]. Łatwo pokaza´c, ˙ze je´sli a = a

0

< a

1

< ... < a

n

= b

jest podziałem przedziału [a, b] i funkcja J spełnia warunek Lipschitza na ka˙zdym

przedziale [a

i

−1

, a

i

] ze stał ˛

a L

i

, to J spełnia warunek Lipschitza na przedziale [a, b]

ze stał ˛

a L = max

1≤i≤n

L

i

. Ponadto, je´sli J jest ró˙zniczkowalna na [a, b] i jej pochodna

4

background image

J

jest ograniczona na [a, b], to J spełnia warunek Lipschitza na [a, b] ze stał ˛

a L =

sup

u

∈[a,b]

|J

(u)|.

Niech dana b ˛edzie funkcja J : [a, b] → R spełniaj ˛

aca warunek Lipschitza ze stał ˛

a

L. Ustalmy dowolny punkt u

0

i rozwa˙zmy funkcj ˛e g(·, u

0

) jednej zmiennej u ∈ [a, b]

postaci

g(u, u

0

) = J(u

0

) − L |u − u

0

| =

J (u

0

) + Lu − Lu

0

; u < u

0

J (u

0

) − Lu + Lu

0

; u ≥ u

0

.

Jest to funkcja kawałkami liniowa, której wykres jest łaman ˛

a, składaj ˛

ac ˛

a si ˛e z dwóch

odcinków prostych o współczynnikach kierunkowych L, −L, ł ˛

acz ˛

acych si ˛e w punkcie

(u

0

, J(u

0

)). Z warunku Lipschitza wynika natychmiast, ˙ze

g(u, u

0

) = J(u

0

) − L |u − u

0

| ≤ J(u)

dla dowolnego u ∈ [a, b]. A wi ˛ec wykres funkcji J le˙zy powy˙zej łamanej i ma z ni ˛a

punkt wspólny (u

0

, J(u

0

)). Oznaczmy p

0

(u) = g(u, u

0

). Niech u

1

∈ [a, b] b ˛edzie

takim punktem, ˙ze

p

0

(u

1

) = min

u

∈[a,b]

p

0

(u)

(oczywi´scie u

1

= a lub u

1

= b). Okre´slmy now ˛

a funkcj ˛e

p

1

(u) = max{g(u, u

1

), p

0

(u)}, u ∈ [a, b].

Punkt u

2

∈ [a, b] niech b ˛edzie taki, ˙ze

p

1

(u

2

) = min

u

∈[a,b]

p

1

(u).

Załó˙zmy, ˙ze w wy˙zej opisany sposób utworzyli´smy sko´nczony ci ˛ag punktów u

0

, u

1

,

...,u

n

i funkcji p

0

, p

1

,...,p

n

−1

. Wówczas okre´slamy funkcj ˛e

p

n

(u) = max{g(u, u

n

), p

n

−1

(u)} = max

0≤i≤n

g(u, u

i

), u ∈ [a, b],

i punkt u

n

+1

przy pomocy warunku

p

n

(u

n

+1

) = min

u

∈[a,b]

p

n

(u)

5

background image

(je´sli wybór punktu u

n

+1

przy pomocy powy˙zszego warunku nie jest jednoznaczny,

wybieramy dowolny punkt spełniaj ˛

acy ten warunek).

Wykresem funkcji p

n

jest łamana, zło˙zona z odcinków prostych o współczyn-

nikach kierunkowych równych −L, L. Oczywi´scie,

p

n

−1

(u) = max

0≤i≤n−1

g(u, u

i

) ≤ max

0≤i≤n

g(u, u

i

) = p

n

(u)

dla u ∈ [a, b]. Ponadto, z faktu, ˙ze

g(u, u

i

) ≤ J(u)

dla u ∈ [a, b], i = 0, ..., n, wynika, ˙ze

p

n

(u) ≤ J (u)

dla u ∈ [a, b], n = 0, 1, ...

Mamy nast ˛epuj ˛

ace

Twierdzenie 8 Je´sli funkcja J spełnia warunek Lipschitza na przedziale [a, b] i

J

:= inf

u

∈[a,b]

J(u), to ci ˛

ag (u

n

) otrzymany przy pomocy metody łamanych ma nast ˛

epu-

j ˛

ace własno´sci:

1) lim

n

→∞

J(u

n

) = J

2) 0 ≤ J (u

n

+1

) − J

≤ J(u

n

+1

) − p

n

(u

n

+1

), n = 0, 1, ...

3) lim

n

→∞

ρ(u

n

, U

) = 0, gdzie ρ(u

n

, U

) = inf

u

∈U

|u

n

− u|

(oczywi´scie, U

= ∅).

1.2

Funkcje wielu zmiennych - cz ˛

e´s´c I

Rozwa˙zmy zadanie postaci

J(u) → min .,

u ∈ U

(3)

gdzie J : U → R, U ⊂ R

n

jest ustalonym zbiorem.

6

background image

1.2.1

Istnienie rozwi ˛

aza´

n - twierdzenie Weierstrassa

Okre´slenie funkcji półci ˛

agłej z dołu i charakteryzacja "ci ˛

agowa" takich funkcji s ˛

a,

po zast ˛

apieniu przedziału kul ˛

a w przypadku definicji, takie same, jak w przypadku

funkcji jednej zmiennej. Podobnie rzecz ma si ˛e z definicj ˛

a (´scisłego) minimum,

maksimum lokalnego. Dla przykladu, punkt u

∈ U nazywamy punktem lokalnego

minimum funkcji J na zbiorze U (lokalnym rozwi ˛

azaniem zadania (3)), je´sli istnieje

kula K(u

, r) taka, ˙ze

J(u

) ≤ J(u)

dla dowolnego u ∈ K(u

, r) ∩ U .

W dalszym ci ˛

agu przydatna b ˛edzie nast ˛epuj ˛

aca charakteryzacja funkcji pół-

ci ˛

agłych z dołu na zbiorze domkni ˛etym.

Lemat 9 Niech U ⊂ R

n

b ˛

edzie zbiorem domkni ˛

etym. Funkcja J : U → R jest

półci ˛

agła z dołu na zbiorze U wtedy i tylko wtedy, gdy dla dowolnego c ∈ R zbiór

M (c) = {u ∈ U ; J(u) ≤ c}

jest zbiorem domkni ˛

etym.

Mamy nast ˛epuj ˛

ace twierdzenia o istnieniu rozwi ˛

aza´n optymalnych.

Twierdzenie 10 (Weierstrassa) Je´sli U ⊂ R

n

jest zbiorem zwartym i funkcja

J : U → R jest półci ˛

agła z dołu na zbiorze U , to istnieje punkt minimum globalnego

funkcji J na zbiorze U.

Dowód. Niech (u

k

) ⊂ U b ˛edzie ci ˛

agiem minimalizuj ˛

acym, t.zn. lim

k

→∞

J(u

k

) = J

=

inf

u

∈U

J(u) ∈ R ∪ {−∞}. Ze zwarto´sci zbioru U wynika, ˙ze istniej ˛a podci ˛ag (u

k

i

) oraz

punkt u

∈ U takie, ˙ze lim

i

→∞

u

k

i

= u

. Wówczas,

J

≤ J(u

) ≤ lim inf

i

→∞

J (u

k

i

) = lim

i

→∞

J(u

k

i

) = lim

k

→∞

J(u

k

) = J

.

St ˛

ad wynika, ˙ze J(u

) = J

∈ R.

7

background image

Twierdzenie 11 (Weierstrassa) Je´sli U ⊂ R

n

jest zbiorem domkni ˛

etym i nieogranic-

zonym, funkcja J : U → R jest półci ˛

agła z dołu oraz

lim

k

→∞

J (u

k

) = ∞

dla dowolnego ci ˛

agu (u

k

) ⊂ U takiego, ˙ze lim

k

→∞

|u

k

| = ∞ (mówimy w takim przypadku,

˙ze funkcja J jest koercytywna), to istnieje punkt minimum globalnego funkcji J na

U .

Proof. Z nieograniczono´sci zbioru U wynika, ˙ze istnieje ci ˛ag (u

k

) ⊂ U taki, ˙ze

lim

k

→∞

|u

k

| = ∞. St ˛

ad i z zało˙zenia wynika, ˙ze lim

k

→∞

J(u

k

) = ∞. Niech v ∈ U b ˛edzie

takim punktem, ˙ze J(v) > J

= inf

u

∈U

J(u) (taki punkt istnieje w´sród punktów u

k

,

k ∈ N). Rozwa˙zmy zbiór

M (J(v)) = {u ∈ U; J (u) ≤ J(v)}.

Jest to zbiór niepusty. Z Lematu 9 wynika, ˙ze M(J(v)) jest zbiorem domkni ˛etym. Z

koercytywno´sci J wynika jego ograniczono´s´c. Zatem, funkcja J, zaw ˛e˙zona do zbioru

M (J(v)), ma punkt minimum globalnego na zbiorze M (J(v)). Oczywi´scie jest to

te˙z punkt minimum globalnego funkcji J na zbiorze U.

1.2.2

Warunki konieczne - zasada Fermata

Rozwa˙zmy zadanie (3). Mamy nast ˛epuj ˛ace:

Twierdzenie 12 (zasada Fermata) Je´sli U ⊂ R

n

jest zbiorem otwartym i u

jest punktem lokalnego minimum funkcji J : U → R, przy czym istnieje gradient

∇J(u

) = (

∂J

∂u

1

(u

), ...,

∂J

∂u

n

(u

)), to

∇J(u

) = 0.

(4)

Dowód.

Istnienie gradientu funkcji J w punkcie u

oznacza istnienie, dla dowol-

nego i = 1, ..., n, pochodnej funkcji

ϕ

i

: (−δ, δ) ∋ t → J(u

+ te

i

) ∈ R

8

background image

w punkcie t = 0, gdzie δ jest pewn ˛

a liczb ˛

a dodatni ˛

a, e

i

jest i-tym wektorem jednos-

tkowym. Poniewa˙z u

jest punktem lokalnego minimum funkcji J, wi ˛ec punkt 0 jest

punktem minimum lokalnego funkcji ϕ

i

i w konsekwencji

ϕ


i

(0) = 0, i = 1, ..., n.

A wi ˛ec ∇J(u

) = (ϕ

1

(0), ..., ϕ

n

(0)) = 0, co ko´nczy dowód.

Przyklad 13 Niech v

1

,...,v

m

∈ R

n

b ˛

ed ˛

a ustalonymi punktami w przestrzeni R

n

.

Nale˙zy znale´z´c punkt, dla którego suma kwadratów odległo´sci od tych punktów jest

najmniejsza. Innymi słowy, nale˙zy znale´z´c punkt minimum globalnego funkcji

J(u) =



m

i

=1



u − v

i





2

na przestrzeni R

n

.

Łatwo sprawdzi´c, ˙ze gradient ∇J(u) funkcji J w dowolnym punkcie u ∈ R

n

jest

postaci

∇J(u) = 2



m

i

=1



u − v

i



.

Zatem, warunek (4) przyjmuje posta´c

mu −



m

i

=1

v

i

= 0.

i w konsekwencji jedynym punktem podejrzanym o globalne minimum jest punkt

u

=

1

m



m

i

=1

v

i

.

Jest to oczywi´scie tak˙ze jedyny punkt podejrzany o lokalne minimum.

Poniewa˙z

J(u) = m |u|

2

− 2m u, u

 +



m
i

=1



v

i





2

dla u ∈ R

n

, wi ˛

ec

J(u) ≥ m |u|

2

− 2m |u| |u

| +



m
i

=1



v

i





2

−→

|u|→∞

.

To oznacza, ˙ze funkcja J spełnia warunek z Twierdzenia 11 na przestrzeni R

n

i, w

konsekwencji, istnieje punkt minimum globalnego funkcji J na R

n

. Ostatecznie wi ˛

ec,

punkt u

jest jedynym punktem minimum globalnego funkcji J na R

n

.

9

background image

1.2.3

Warunki dostateczne

U˙zyteczne jest nast ˛epuj ˛ace

Twierdzenie 14 (warunki dostateczne drugiego rz ˛

edu) Niech U ⊂ R

n

b ˛

edzie

zbiorem otwartym, funkcja J : U → R niech b ˛

edzie klasy C

2

(t.zn. posiadaj ˛

ac ˛

a na

U ci ˛

agłe wszystkie pochodne cz ˛

astkowe rz ˛

edu drugiego) oraz ∇J(u

) = 0.

Je´sli macierz

2

J(u

) =

2

J

∂u

i

∂u

j

(u

)

1≤i,j≤n

jest dodatnio okre´slona, tzn.

2

J(u

)h, h

>

0 dla dowolnego h = 0 (równowa˙znie, det

2

J

∂u

i

∂u

j

(u

)

1≤i,j≤k

> 0 dla dowolnego

k = 1, ..., n), to u

jest punktem ´scisłego minimum lokalnego funkcji J na U .

Je´sli macierz

2

J(u

) =

2

J

∂u

i

∂u

j

(u

)

1≤i,j≤n

jest ujemnie okre´slona, tzn.

2

J(u

)h, h

<

0 dla dowolnego h = 0 (równowa˙znie, (−1)

k

det

2

J

∂u

i

∂u

j

(u

)

1≤i,j≤k

> 0 dla dowolnego

k = 1, ..., n), to u

jest punktem ´scisłego maksimum lokalnego.

Je´sli iloczyn skalarny

2

J(u

)h, h

przyjmuje warto´sci zarówno dodatnie jak i

ujemne, to J nie ma w punkcie u

ani minimum lokalnego ani maksimum lokalnego.

Przyklad 15 Zauwa˙zmy, ˙ze macierz drugich pochodnych

2

J(u) funkcji J z Przykładu

13, w dowolnym punkcie u ∈ R

n

jest postaci

2

J(u) = 2mI,

gdzie I jest macierz ˛

a jednostkow ˛

a wymiaru n × n. To oznacza, ˙ze J jest klasy

C

2

. Ponadto, stosuj ˛

ac powy˙zszy warunek dostateczny, stwierdzamy, ˙ze punkt u

jest

punktem ´scisłego minimum lokalnego funkcji J na przestrzeni R

n

. Z jednoznaczno´sci

minimum globalnego (por. Przykład 13) wynika, ˙ze jest to punkt ´scisłego minimum

globalnego funkcji J na R

n

.

1.2.4

Zało˙zenie wypukło´sci

Mówimy, ˙ze zbiór U ⊂ R

n

jest wypukły, gdy spełniony jest warunek

αx + (1 − α)y ∈ U

10

background image

dla dowolnych α ∈ [0, 1], x, y ∈ U .

Mówimy, ˙ze funkcja J : U → R, gdzie U ⊂ R

n

jest zbiorem wypukłym, jest

wypukła, gdy spełniony jest warunek

J(αx + (1 − α)y) ≤ αJ(x) + (1 − α)J(y)

dla dowolnych α ∈ [0, 1], x, y ∈ U .

Podamy teraz trzy twierdzenia pozwalaj ˛

ace rozstrzyga´c o wypukło´sci funkcji

ró˙zniczkowalnych. Przypomnijmy, ˙ze mówimy, i˙z funkcja J : R

n

⊃ K(u

, ε) → R

jest ró˙zniczkowalna w punkcie u

, je´sli istnieje wektor a ∈ R

n

taki, ˙ze

J(u

+ h) − J(u

) = a, h + o(h)

dla 0 < |h| < ε

1

, gdzie o : (−ε

1

, ε

1

) \ {0} → R, 0 < ε

1

< ε, jest tak ˛

a funkcj ˛

a,

˙ze lim

h

→0

o

(h)

|h|

= 0 (funkcja o(·) zale˙zy od u

). Łatwo wida´c, ˙ze w takim przypadku

a = ∇J (u

).

Ponadto, mówimy, ˙ze funkcja J : U → R okre´slona na zbiorze U ⊂ R

n

(niekoniecznie

otwartym) jest klasy C

1

, je´sli jest ró˙zniczkowalna w ka˙zdym punkcie tego zbioru i

wszystkie pochodne cz ˛

astkowe pierwszego rz ˛edu funkcji J s ˛

a funkcjami ci ˛

agłymi na

U (gdy zbiór U jest otwarty, wystarczy ˙z ˛ada´c jedynie ci ˛agło´sci na U wszystkich

pochodnych cz ˛

astkowych pierwszego rz ˛edu).

Twierdzenie 16 Niech U ⊂ R

n

b ˛

edzie zbiorem wypukłym, J : U → R - funkcj ˛

a

klasy C

1

. Wówczas, funkcja J jest wypukła na U wtedy i tylko wtedy, gdy

J(u) ≥ J (v) + ∇J(v), u − v

(5)

dla dowolnych u, v ∈ U.

Twierdzenie 17 Niech U ⊂ R

n

b ˛

edzie zbiorem wypukłym, J : U → R - funkcj ˛

a

klasy C

1

. Wówczas, funkcja J jest wypukła na U wtedy i tylko wtedy, gdy

∇J(u) − ∇J(v), u − v ≥ 0

dla dowolnych u, v ∈ U.

11

background image

Mamy tak˙ze

Twierdzenie 18 Niech U ⊂ R

n

b ˛

edzie zbiorem wypukłym, V - zbiorem otwartym

zawieraj ˛

acym U , J : V → R - funkcj ˛

a klasy C

2

. Wówczas, je´sli

2

J(u)h, h

≥ 0

dla dowolnych u ∈ U , h ∈ R

n

, to J jest wypukła na U .

Podobnie, jak w przypadku funkcji jednej zmiennej, prawdziwe jest nast ˛epuj ˛

ace

twierdzenie.

Twierdzenie 19 Je´sli funkcja J : U → R jest wypukła, to ka˙zdy punkt lokalnego

minimum funkcji J na zbiorze U jest punktem jej minimum globalnego.

Kolejne twierdzenie nazywane jest kryterium optymalno´sci dla funkcji wypukłych

na zbiorze wypukłym.

Twierdzenie 20 (kryterium optymalno´sci dla funkcji wypukłych) Niech U ⊂

R

n

b ˛

edzie zbiorem wypukłym, J : U → R - funkcj ˛

a klasy C

1

. Wówczas, je´sli punkt

u

∈ U jest punktem minimum globalnego, to

∇J(u

)), u − u

 ≥ 0

(6)

dla dowolnego u ∈ U, przy czym je´sli u

∈ IntU, to warunek (6) równowa˙zny jest

warunkowi

∇J(u

) = 0.

Je´sli ponadto, funkcja J jest wypukła na U i u

∈ U , to warunek (6) jest wystarcza-

j ˛

acy na to, aby punkt u

był punktem minimum globalnego.

Dowód.

Załó˙zmy, ˙ze punkt u

jest punktem minimum globalnego. Wówczas, z

rózniczkowalno´sci funkcji J w punkcie u

mamy

0 ≤ J(u

+ α(u − u

)) − J(u

) = α ∇J(u

)), u − u

 + o(α),

12

background image

sk ˛

ad

0 ≤ ∇J(u

)), u − u

 +

o(α)

α

dla dostatecznie małych α > 0 (tutaj o(α) jest tak ˛

a funkcj ˛

a, ˙ze

o

(α)

α

→ 0 gdy α → 0).

Przechodz ˛

ac w powy˙zszej nierówno´sci z α do 0, otrzymujemy ˙z ˛adana nierówno´s´c.

Je´sli u

∈ IntU, to dla dowolnego e ∈ R

n

istnieje ε

0

o tej własno´sci, ˙ze u

+ εe ∈ U

dla |ε| < ε

0

. Stosuj ˛

ac warunek (6) do punktów postaci u = u

+ εe z ε ∈ (0, ε

0

),

dostajemy

∇J(u

), e ≥ 0

dla dowolnego e ∈ R

n

. To oznacza, ˙ze ∇J(u

) = 0.

Załó˙zmy teraz, ˙ze funkcja J jest wypukła i spełniony jest warunek (6). Wówczas,

z warunku (5) zastosowanego do punktu v = u

otrzymujemy

J(u) − J (u

) ≥ ∇J(u

)), u − u

 ≥ 0

dla dowolnego u ∈ U , co oznacza, ˙ze u

jest punktem minimum globalnego.

Uwaga 21 Druga cz ˛

e´s´c powy˙zszego kryterium optymalno´sci jest uogólnieniem odwróce-

nia twierdzenia Fermata (przy zało˙zeniach wypukło´sci i gładko´sci funkcji J).

1.2.5

Metody numeryczne - metoda gradientowa

Rozwa˙zmy zadanie bez ogranicze´n

J(u) → min

u ∈ R

n

,

zakładaj ˛

ac, ˙ze funkcja J : R

n

→ R jest klasy C

1

.

Korzystaj ˛

ac z definicji ró˙zniczkowalno´sci funkcji J oraz nierówno´sci Cauchy’ego

- Buniakowskiego (− |∇J(u)| |v| ≤ ∇J (u), v ≤ |∇J(u)| |v| dla dowolnego v ∈ R

n

,

przy czym je´sli ∇J(u) = 0, to prawa nierówno´s´c jest równo´sci ˛

a tylko dla v =

α∇J(u), a lewa nierówno´s´c - tylko dla v = −α∇J(u), gdzie α ≥ 0), mo˙zna pokaza´c,

˙ze je´sli ∇J(u

) = 0, to kierunkiem najszybszego spadku warto´sci funkcji J w punkcie

13

background image

u

jest kierunek antygradientu −∇J(u

) (tzn. dla dowolnego h ∈ R

n

\ {0}, h =

−∇J(u

), |h| = |∇J (u

)|, istnieje τ

1

> 0 takie, ˙ze

J(u

+ τ (−∇J(u

))) < J (u

+ τ h)

dla 0 < τ < τ

1

). Na tym spostrze˙zeniu opiera si ˛e konstrukcja tzw. metody gradien-

towej - metody wyznaczania przybli˙zonych rozwi ˛aza´n powy˙zszego zadania. Podamy

teraz opis jednego z wariantów tej metody.

Niech dany b ˛edzie dowolny punkt u

0

∈ R

n

. Rozwa˙zmy ci ˛ag (u

k

)

k

∈N∪{0}

okre´slony

w sposób rekurencyjny wzorem

u

k

+1

= u

k

− α

k

∇J(u

k

), k = 0, 1, ...,

(7)

gdzie α

k

> 0 dla k = 0, 1, ... jest tzw. krokiem k-tej iteracji.

Uwaga 22 Je´sli ∇J(u

k

) = 0, to α

k

> 0 mo˙zna wybra´c tak, by spełniona była

nierówno´s´c J(u

k

+1

) < J (u

k

) (

1

). Je´sli ∇J(u

k

) = 0, to post ˛

epowanie nale˙zy prz-

erwa´c (ci ˛

ag tworzony zgodnie z powy˙zszym wzorem b ˛

edzie stały). Punkt u

k

jest

wówczas punktem spełniaj ˛

acym warunek konieczny istnienia minimum funkcji J na

przestrzeni R

n

. Warto przypomnie´c, ˙ze gdy funkcja J jest wypukła, ka˙zdy punkt, w

którym gradient zeruje si ˛

e, jest punktem minimum globalnego funkcji J na R

n

.

Sposób ustalania warto´sci parametru α

k

wyznacza wariant metody gradientowej.

Opiszemy teraz dwa takie warianty. Symbolem J

k

, k = 0, 1, ..., oznaczmy funkcj ˛e

postaci

J

k

: [0, ∞) ∋ α −→ J(u

k

− α∇J(u

k

)) ∈ R.

1

Z okre´slenia ró˙zniczkowalno´sci funkcji J w punkcie u:

J

(u + h) = J(u) + ∇J(u), h + o(u, h), h ∈ R

n

,

wynika, ˙ze

J

(u

k+1

) − J(u

k

) = α

k

[− |∇J (u

k

)|

2

+

o

k

k

−1

k

] < 0

dla dostatecznie małych warto´sci α

k

>

0, gdzie

o

k

(α) = o(u

k

,

−α∇J(u

k

))

14

background image

Metod ˛

a najszybszego spadku nazywamy wariant, w którym krok α

k

> 0 ustalany

jest na podstawie warunku

inf

α

≥0

J

k

(α) = J

k

k

)

(8)

(zgodnie z Uwag ˛

a 22, je´sli powy˙zszy kres dolny jest osi ˛agany przez funkcj ˛e J

k

oraz

∇J(u

k

) = 0, to punktem realizuj ˛

acym ów kres jest punkt α

k

> 0).

Przyklad 23 Rozwa˙zmy zadanie badane w Przykładach 13 i 15, z punktami v

1

=

(1, 2), v

2

= (2, 4), v

3

= (3, 3), t.zn.

J : R

2

∋ u −→



u − v

1





2

+



u − v

2





2

+



u − v

3





2

∈ R.

Jak zauwa˙zyli´smy w Przykładzie 13,

∇J(u) = 2(3u − (v

1

+ v

2

+ v

3

)) = (6x − 12, 6y − 18)

dla u = (x, y) ∈ R

2

. Ustalmy punkt pocz ˛

atkowy u

0

= (0, 0). Wówczas, ∇J(u

0

) =

(−12, −18) oraz

J

0

:

[0, ∞) ∋ α −→ J((0, 0) − α∇J (0, 0)) = J(12α, 18α)

= |(12α, 18α) − (1, 2)|

2

+ |(12α, 18α) − (2, 4)|

2

+ |(12α, 18α) − (3, 3)|

2

= (12α − 1)

2

+ (18α − 2)

2

+ (12α − 2)

2

+ (18α − 4)

2

+ (12α − 3)

2

+ (18α − 3)

2

∈ R

Jest to funkcja kwadratowa, która osi ˛

aga swój kres dolny w punkcie α

0

=

1
6

. W

konsekwencji,

u

1

= (0, 0) −

1
6

(−12, −18) = (2, 3)

oraz

∇J(2, 3) = (6 · 2 − 12, 6 · 3 − 18) = (0, 0).

Tworzenie kolejnych punktów ci ˛

agu (u

k

) nale˙zy przerwa´c, poniewa˙z pocz ˛

awszy od u

1

ci ˛

ag ten b ˛

edzie stały. Zauwa˙zmy te˙z, ˙ze funkcja J jest wypukła, bowiem

2

J(u)h, h

= 2 · 3 Ih, h = 6 |h|

2

≥ 0

15

background image

dla dowolnych u ∈ R

2

, h ∈ R

2

. A wi ˛

ec z odwrócenia zasady Fermata (przy zało˙zeniu

wypukło´sci i gładko´sci) wynika, ˙ze punkt (2, 3) jest punktem minimum globalnego.

Jest to zgodne z konkluzj ˛

a przykładów 13 i 15, poniewa˙z

u

=

1
3

(v

1

+ v

2

+ v

3

) =

1
3

(6, 9) = (2, 3).

Je´sli nie jest mo˙zliwe wyznaczenie punktu α

k

spełniaj ˛

acego równo´s´c (8), to mo˙zna

za α

k

przyj ˛

a´c punkt, który realizuje powy˙zszy kres dolny z dokładno´sci ˛a δ

k

> 0. A

mianowicie, niech dla dowolnego k = 0, 1, ... liczba α

k

> 0 b ˛edzie taka, ˙ze

inf

α

≥0

J

k

(α) ≤ J

k

k

) ≤ inf

α

≥0

J

k

(α) + δ

k

.

(9)

Z okre´slenia kresu dolnego i z ci ˛

agło´sci funkcji J

k

wynika, ˙ze α

k

> 0 spełniaj ˛

ace (9)

istnieje.

W monografii [V] udowodnione jest nast ˛epuj ˛

ace

Twierdzenie 24 (o zbie˙zno´sci metody gradientowej) Załó˙zmy, ˙ze szereg




k

=0

δ

k

jest zbie˙zny, funkcja J jest wypukła, ró˙zniczkowalna, przy czym gradient ∇J jest

funkcj ˛

a spełniaj ˛

ac ˛

a warunek Lipschitza na R

n

, tzn. istnieje stała L ≥ 0 taka, ˙ze

|∇J(u) − ∇J(y)| ≤ L |u − y| , u, y ∈ R

n

.

Załó˙zmy te˙z, ˙ze dla pewnego u

0

zbiór M

δ

(u

0

) = {u ∈ R

n

; J (u) ≤ J(u

0

) + δ},

gdzie δ =




k

=0

δ

k

, jest ograniczony. Wówczas, J

= inf

u

∈R

n

J(u) > −∞, U

= {u ∈

R

n

; J (u) = J

} = ∅, ci ˛

ag (u

k

)

k

∈N∪{0}

okre´slony warunkami (7)-(9) jest taki, ˙ze

lim

k

→∞

J(u

k

) = J

oraz

lim

k

→∞

ρ(u

k

, U

) = 0,

gdzie ρ(u

k

, U

) = inf

u

∈U

|u

k

− u|.

Dowód. Fakt, ˙ze

J

= inf

u

∈R

n

J(u) > −∞ oraz U

= {u ∈ R

n

; J(u) = J

} = ∅

16

background image

wynika ze zwarto´sci zbioru M

δ

(u

0

), ci ˛

agło´sci J i twierdzenia Weierstrassa. Oczywi´s-

cie U

⊂ M

δ

(u

0

).

Je´sli ∇J(u

k

) = 0 dla pewnego k ≥ 0, to u

k

= u

k

+1

= ... i teza twierdzenia

jest oczywista na mocy Twierdzenia ??. Mo˙zemy wi ˛ec zało˙zy´c, ˙ze ∇J(u

k

) = 0 dla

dowolnego k ≥ 0. Poniewa˙z

J(u

k

+1

) = J

k

k

) ≤ inf

α

≥0

J

k

(α) + δ

k

≤ J(u

k

− α∇J(u

k

)) + δ

k

dla dowolnego α ≥ 0, to (

2

)

J(u

k

) − J(u

k

+1

) ≥ J(u

k

) − J(u

k

− α∇J(u

k

)) − δ

k

≥ α |∇J(u

k

)|

2

− α

2

|∇J(u

k

)|

2

L

2

− δ

k

= α(1 − α

L

2

) |∇J(u

k

)|

2

− δ

k

dla α ≥ 0 i k = 0, 1, ... St ˛

ad

J(u

k

) − J(u

k

+1

) ≥ max

α

≥0



α(1 − α

L

2

)



|∇J(u

k

)|

2

− δ

k

=

1

2L

|∇J(u

k

)|

2

− δ

k

(10)

dla k = 0, 1, ... i w konsekwencji

J(u

k

+1

) ≤ J(u

k

) + δ

k

(11)

dla k = 0, 1, ... Poniewa˙z

J(u

k

) ≥ J

> −∞,

wi ˛ec (

3

) istnieje granica

J

≤ lim J(u

k

) < ∞.

2

Korzystamy tu z nierówno´sci (zastosowanej do punktów u = u

k

− α∇J(u

k

), v = u

k

)

|J(u) − J(v) − ∇J(v), u − v| ≤

L

2

|u − v|

2

prawdziwej dla dowolnych punktów u, v ∈ U , o ile funkcja J jest ró˙zniczkowalna na zbiorze wy-

pukłym U i gradient ∇J jest lipschitzowski ze stał ˛

a L (por. [V, Lemat 2.3.1]).

3

Jesli ci ˛

ag liczbowy (a

k

) jeswt taki, ˙ze

a

k+1

≤ a

k

+ δ

k

, k

= 0, 1, ...

przy czym δ

k

≥ 0,



δ

k

<

∞, to istnieje granica lim a

k

<

∞. Je´sli ci ˛

ag (a

k

) jest tak˙ze ograniczony

z dołu, to lim a

k

∈ R.

17

background image

W konsekwencji lim(J(u

k

) − J(u

k

+1

)) = 0 i z (10) wynika, ˙ze lim ∇J(u

k

) = 0.

Zauwa˙zmy tak˙ze, ˙ze z (11) wynika, i˙z

J(u

k

) ≤ J(u

0

) +



k

−1

i

=0

δ

k

≤ J(u

0

) + δ

dla dowolnego k = 1, 2, ..., t.zn.

u

k

∈ M

δ

(u

0

)

(12)

dla dowolnego k = 1, 2, ...

Zauwa˙zmy teraz, ˙ze dla dowolnego u

∈ U

z nierówno´sci (5) wynika, i˙z

0 ≤ J(u

k

) − J

= J(u

k

) − J(u

) ≤ ∇J(u

k

), u

k

− u



≤ |∇J(u

k

)| |u

k

− u

| ≤ R |∇J(u

k

)|

dla k = 1, 2, ..., gdzie R jest stał ˛

a ograniczaj ˛

aca moduły elementów zbioru M

δ

(u

0

).

Ze zbie˙zno´sci lim ∇J(u

k

) = 0 wynika, ˙ze

lim J(u

k

) = J

.

Ze zwarto´sci zbioru M

δ

(u

0

) i (12) wynika, ˙ze istnieje podci ˛ag (u

k

i

) ci ˛

agu (u

k

), który

jest zbie˙zny do pewnego punktu u ∈ M

δ

(u

0

). Z ci ˛

agło´sci J wynika, ˙ze J(u) = J

, co

oznacza, ˙ze u ∈ U

i tym samym lim ρ(u

k

i

, U

) = 0. St ˛

ad wynika, ˙ze lim ρ(u

k

, U

) = 0

(wystarczy zaprzeczy´c temu).

1.3

Funkcje wielu zmiennych - cz ˛

e´s´c II

1.3.1

Warunki konieczne - zasady mno˙zników Lagrange’a

Rozwa˙zmy zadanie postaci

J(u) → inf ,

u ∈ U = {u ∈ R

n

; f

i

(u) = θ, i = 1, ..., m}

(13)

gdzie J : R

n

→ R, f

i

: R

n

→ R, i = 1, ..., m.

18

background image

Mówimy, ˙ze punkt u

∈ U jest punktem lokalnego minimum dla zadania (13),

je´sli istnieje kula K(u

, r) taka, ˙ze dla dowolnego punktu u ∈ K(u

, r), spełniaj ˛

acego

ograniczenia

f

i

(u) = θ, i = 1, ..., m,

spełniona jest nierówno´s´c

J (u

) ≤ J(u).

Przypomnijmy

Twierdzenie 25 (o funkcji uwikłanej) Niech dane b ˛

ed ˛

a funkcje g

i

= g

i

(w, z) :

R

s

+n

→ R, i = 1, ..., n, klasy C

1

oraz punkt (a, b) ∈ R

s

+n

taki, ˙ze

g

i

(a, b) = 0, i = 1, ..., n

det[

∂g

i

∂z

j

(a, b)]

1≤i,j≤n

= 0.

Wówczas istnieje δ > 0 i funkcja z = z(w) = (z

1

(w), ..., z

n

(w)) : K(a, δ) → R

n

klasy

C

1

taka, ˙ze

z(a) = b,

g

i

(w, z(w)) = 0, w ∈ K(a, δ), i = 1, ..., n.

Twierdzenie 26 (pierwsza zasada mno˙zników Lagrange’a) Je´sli funkcje J, f

i

,

i = 1, ..., m, s ˛

a klasy C

1

na R

n

i punkt u

jest punktem lokalnego minimum dla zada-

nia (13), to istniej ˛

a liczby (mno˙zniki Lagrange’a) λ

0

, λ

1

, ..., λ

m

∈ R, nie wszystkie

równe zero i takie, ˙ze

λ

0

∇J(u

) +



m
i

=1

λ

i

∇f

i

(u

) = 0.

(14)

Je´sli dodatkowo wektory ∇f

i

(u

), i = 1, ..., m, s ˛

a liniowo niezale˙zne, to λ

0

= 0 i

mo˙zna przyj ˛

a´c λ

0

= 1.

Dowód. Warunek dany w tezie twierdzenia oznacza liniow ˛

a zale˙zno´s´c wektorów

∇J(u

), ∇f

1

(u

), ..., ∇f

m

(u

)

19

background image

w przestrzeni R

n

. Przypu´s´cmy, ˙ze warunek ten nie jest spełniony, tzn. powy˙zsze wek-

tory s ˛

a liniowo niezale˙zne. Oznacza to, ˙ze m + 1 ≤ n. W przypadku, gdy m + 1 < n

mo˙zemy uzupełni´c (i uzupełniamy) układ wektorów ∇J(u

), ∇f

1

(u

), ..., ∇f

m

(u

)

wektorami d

m

+1

, ..., d

n

−1

tak, by układ wektorów ∇J(u

), ∇f

1

(u

), ..., ∇f

m

(u

), d

m

+1

, ..., d

n

−1

był układem liniowo niezale˙znym w R

n

.

Rozwa˙zmy teraz funkcje (gdy m + 1 = n, nie rozwa˙zamy ostatniej grupy funkcji)

g

0

(t, u) = J(u) − J (u

) + t,

g

i

(t, u) = f

i

(u), i = 1, ..., m,

g

i

(t, u) = d

i

, u − u

 , i = m + 1, ..., n − 1,

okre´slone na R

1+n

.

Łatwo wida´c, ˙ze powy˙zszy układ funkcji spełnia zało˙zenia

twierdzenia o funkcji uwikłanej z punktem (a, b) postaci (0, u

). Z twierdzenia tego

wynika, ˙ze istnieje δ > 0 i funkcja u = u(t) = (u

1

(t), ..., u

n

(t)) : (−δ, δ) → R

n

klasy

C

1

(wykorzystamy tylko ci ˛

agło´s´c funkcji u) taka, ˙ze

u(0) = u

oraz

J(u(t)) = J(u

) − t,

f

i

(u(t)) = 0, i = 1, ..., m,

dla t ∈ (−δ, δ). To oznacza w szczególno´sci, ˙ze dla t ∈ (0, δ) punkty u(t) spełniaj ˛a

ograniczenia typu równo´sci wyst ˛epuj ˛

ace w zadaniu (13), przy czym

J(u(t)) = J (u

) − t < J(u

).

Przeczy to optymalno´sci punktu u

, gdy˙z u(t) → u

, gdy t → 0.

Przypu´s´cmy teraz, ˙ze λ

0

= 0. Wówczas



m
i

=1

λ

i

∇f

i

(u

) = 0

przy czym λ

i

= 0 dla pewnego i ∈ {1, ..., m}. Jest to sprzeczne z liniow ˛

a nieza-

le˙zno´sci ˛a wektorów ∇f

i

(u

), i = 1, ..., m.

20

background image

Przyklad 27 Nale˙zy znale´z´c na okr ˛

egu jednostkowym w przestrzeni R

n

, o ´srodku

w punkcie 0, punkt, dla którego suma kwadratów odległo´sci od danych punktów

v

1

,...,v

m

∈ R

n

jest najmniejsza. Innymi słowy, nale˙zy znale´z´c punkt minimum glob-

alnego funkcji

J(u) =



m

i

=1



u − v

i





2

na zbiorze opisanym równo´sci ˛

a

f

1

(u) = |u|

2

− 1 = 0.

(15)

Z twierdzenia Weierstrassa wynika, ˙ze funkcja J osi ˛

aga na zbiorze opisanym równo´s-

ci ˛

a (15) minimum globalne, które jest oczywi´scie te˙z minimum lokalnym. Je´sli u jest

tym punktem, to istniej ˛

a mno˙zniki Lagrange’a λ

0

, λ ∈ R, nie wszystkie równe zero i

takie, ˙ze

λ

0

∇J(u

) + λ

1

∇f

1

(u

) = 0,

czyli

λ

0

2m(u − u

) + λ

1

2u = 0,

(16)

gdzie u

=

1

m



m
i

=1

v

i

.

Przypadek λ

0

= 0 jest niemo˙zliwy, bo

0

, λ

1

) = 0 i |u|

2

= 1. Mo˙zna wi ˛

ec zało˙zy´c,

˙ze λ

0

= 1.

Rozwa˙zmy dwa przypadki.

1

0

u

= 0. Z (16) wynika, ˙ze

(m + λ)u = mu

.

(17)

St ˛

ad z kolei wynika, ˙ze u = 0 oraz u = αu

dla pewnego α = 0. Wówczas

1 = |u| = |α| |u

| ,

sk ˛

ad

|α| =

1

|u

|

21

background image

i w konsekwencji

u =

u

|u

|

lub u = −

u

|u

|

.

Poniewa˙z

J(u) = m |u|

2

− 2m u, u

 +



m
i

=1



v

i





2

(18)

wi ˛

ec wida´c, ˙ze rozwi ˛

azaniem jest punkt u =

u

|u

|

.

2

0

u

= 0. Wówczas z (18) wynika, ˙ze funkcja J jest stała na zbiorze (15) i, w

konsekwencji, ka˙zdy punkt okr ˛egu jednostkowego jest punktem minimum globalnego

funkcji J na tym˙ze okr ˛egu.

Uwaga 28 Fakt, ˙ze λ

0

= 0 mo˙zna zauwa˙zy´c, korzystaj ˛

ac z drugiej cz ˛

e´sci zasady

mno˙zników Lagrange’a. Rzeczywi´scie, ∇f

1

(u) = 2u i je´sli u jest punktem minimum

lokalnego na okr ˛

egu jednostkowym, to w szczegolno´sci u = 0 i jednoelementowy układ

∇f

1

(u) jest układem liniowo niezale˙znym.

Rozwa˙zmy teraz zadanie z ograniczeniami mieszanymi

J(u) → inf ,

u ∈ U = {u ∈ R

n

; f

i

(u) = θ, i = 1, ..., m, h

k

(u) ≤ 0, k = 1, ..., s}

(19)

Wprowadzaj ˛

ac nowe zmienne w

1

,...,w

s

, rozwi ˛

azywanie zadania (19) mo˙zna zast ˛api´c

rozwi ˛

azywaniem zadania postaci



J (u, w) = J(u) → inf



f

i

(u, w) = f

i

(u) = θ, i = 1, ..., m

h

k

(u, w) = w

2

k

+ h

k

(u) = 0, k = 1, ..., s

,

(20)

gdzie w = (w

1

, ...w

s

). Dokładniej, je´sli punkt u

jest punktem lokalnego minimum

dla zadania (19), to punkt (u

, w

), gdzie w

= (w

1

, ..., w

s

), w

k

=



−h

k

(u

), k =

1, ..., s, jest punktem lokalnego minimum dla zadania (20). Na odwrót, je´sli punkt

(u

, w

) jest punktem lokalnego minimum dla zadania (20), to punkt u

jest punktem

lokalnego minimum dla zadania (19).

22

background image

Przyklad 29 Znale´z´c na kuli jednostkowej o ´srodku w punkcie 0 punkt, dla którego

suma kwadratów odległo´sci od danych punktów v

1

,...,v

m

∈ R

n

jest najmniejsza. In-

nymi słowy, nale˙zy znale´z´c punkt minimum globalnego funkcji

J(u) =



m

i

=1



u − v

i





2

na zbiorze opisanym nierówno´sci ˛

a

f

1

(u) = |u|

2

− 1 ≤ 0.

(21)

Z twierdzenia Weierstrassa wynika, ˙ze taki punkt istnieje.

Z Przykładu 13 wynika, ˙ze punktem globalnego minimum funkcji J na przestrzeni

R

n

jest punkt u

=

1

m



m
i

=1

u

i

. Je´sli wi ˛

ec |u

| ≤ 1, to jest to punkt globalnego

minimum na zbiorze opisanym nierówno´sci ˛

a (21).

Załó˙zmy wi ˛

ec, ˙ze |u

| > 1. Wprowad´zmy pomocnicz ˛

a zmienn ˛

a w i wyznaczmy

punkty "podejrzane" o minimum lokalne funkcji



J(u, w) =



m

i

=1



u − v

i





2

na zbiorze opisanym równo´sci ˛

a

h

1

(u, w) = w

2

+ |u|

2

− 1 = 0.

(22)

Z postaci funkcji 

J i 

h

1

wynika, ˙ze

λ

0

∇ 

J(u, w) + λ

1

∇

h

1

(u, w) = (λ

0

2m(u − u

) + λ

1

2u, λ

1

2w).

Z zasady mno˙zników Lagrange’a wynika wi ˛

ec, ˙ze je´sli punkt (u, w) jest punktem

minimum lokalnego funkcji 

J na zbiorze opisanym równo´sci ˛

a (22), to istnieje punkt

0

, λ

1

) taki, ˙ze

λ

0

m(u − u

) + λ

1

u = 0,

λ

1

w = 0,

w

2

+ |u|

2

= 1,

23

background image

0

, λ

1

) = 0.

Przy λ

0

= 0 powy˙zszy układ (równa´n i nierówno´sci) nie posiada rozwi ˛

azania. Za-

łó˙zmy wi ˛

ec, ˙ze λ

0

= 1. Wówczas

(m + λ

1

)u = mu

, λ

1

w = 0, w

2

+ |u|

2

= 1

i, jak zało˙zyli´smy,

|u

| > 1.

Przypadek λ

1

= 0 jest niemo˙zliwy. Je´sli natomiast λ

1

= 0, to w = 0 i w kon-

sekwencji „podejrzanymi” punktami lokalnego minimum dla zadania pomocniczego

s ˛

a dwa punkty (

u

|u

|

, 0) oraz (−

u

|u

|

, 0). Oznacza to, ˙ze rozwi ˛

azaniem zadania wyj´s-

ciowego jest punkt

u

|u

|

lub

u

|u

|

. Z postaci (18) funkcji J wynika, ˙ze jedynym

rozwi ˛

azaniem zadania wyj´sciowego jest punkt

u

|u

|

.

Prawdziwe jest tak˙ze nast ˛epuj ˛ace

Twierdzenie 30 (druga zasada mno˙zników Lagrange’a) Je´sli funkcje J, f

i

,

i = 1, ..., m, h

k

, k = 1, ..., s s ˛

a klasy C

1

na R

n

i punkt u

jest punktem lokalnego

minimum dla zadania (19), to istniej ˛

a mno˙zniki Lagrange’a λ

0

, λ

1

, ..., λ

m

, µ

1

, ..., µ

s

R

, nie wszystkie równe zero i takie, ˙ze

λ

0

≥ 0, µ

1

≥ 0, ..., µ

s

≥ 0

λ

0

∇J(u

) +



m
i

=1

λ

i

∇f

i

(u

) +



s
k

=1

µ

k

∇h

k

(u

) = 0

µ

k

h

k

(u

) = 0, k = 1, ..., s.

Przyklad 31 Znale´z´c punkt minimum globalnego funkcji

J(u) =



m

i

=1



u − v

i





2

na zbiorze opisanym nierówno´sci ˛

a

h

1

(u) = |u|

2

− 1 ≤ 0

24

background image

przy pomocy drugiej zasady mno˙zników Lagrange’a. Jak zostało ju˙z stwierdzone, z

klasycznego twierdzenia Weierstrassa wynika, ˙ze powy˙zsze zadanie posiada rozwi ˛

azanie,

przy czym je´sli |u

| ≤ 1, to rozwi ˛

azaniem tym jest u

.

Załó˙zmy wi ˛

ec, ˙ze |u

| > 1. Z Twierdzenia 30 wynika, ˙ze je´sli u jest punktem

minimum lokalnego, to istniej ˛

a mno˙zniki Lagrange’a λ

0

≥ 0, λ

1

≥ 0, nie znikaj ˛

ace

jednocze´snie i takie, ˙ze

λ

0

∇J(u) + λ

1

∇h

1

(u) = λ

0

2m(u − u

) + 2λ

1

u = 0,

λ

1

(|u|

2

− 1) = 0

(23)

i

|u| ≤ 1.

Przypadek λ

0

= 0 jest niemo˙zliwy, wi ˛

ec mo˙zemy zało˙zy´c, ˙ze λ

0

= 1. Zatem pierwsz ˛

a

z powy˙zszych nierówno´sci mo˙zemy zapisa´c w postaci

(m + λ

1

)u = mu

.

St ˛

ad wynika, ˙ze u = αu

, sk ˛

ad

|α| |u

| ≤ 1, czyli |α| ≤

1

|u

|

(bo |u| ≤ 1). Przypu´s´cmy, ˙ze |α| <

1

|u

|

. Wówczas

|u|

2

− 1 = |α|

2

|u

|

2

− 1 <

1

|u

|

2

|u

|

2

− 1 = 0,

sk ˛

ad, wobec (23), λ = 0 i w konsekwenscji u = u

, co jest niemo˙zliwe, bowiem

|u

| > 1. Zatem |α| =

1

|u

|

, czyli punktami „podejrzanymi” s ˛

a

u

|u

|

lub

u

|u

|

. Znów z

postaci (18) funkcji J wynika, ˙ze jedynym rozwi ˛

azaniem zadania jest punkt

u

|u

|

.

1.3.2

Warunki dostateczne

Twierdzenie 32 Niech dane b ˛

edzie zadanie

J(u) → inf ,

u ∈ U = {u ∈ R

n

; f

i

(u) = θ, i = 1, ..., m}

25

background image

Załó˙zmy, ˙ze funkcje J, f

i

, i = 1, ..., m s ˛

a klasy C

2

na R

n

, t.zn. maj ˛

a na R

n

ci ˛

agłe

wszystkie pochodne cz ˛

astkowe do rz ˛

edu drugiego wł ˛

acznie. Je´sli istnieje punkt u

∈ U

i mno˙zniki Lagrange’a λ

0

, λ

1

, ..., λ

m

∈ R nie wszystkie równe zero i takie, ˙ze λ

0

≥ 0,

spełniony jest warunek

λ

0

∇J(u

) +



m
i

=1

λ

i

∇f

i

(u

) = 0

oraz



0

[

2

J

∂u

j

∂u

k

(u

)]

1≤j,k≤n

+

m



i

=1

λ

i

[

2

f

i

∂u

j

∂u

k

(u

)]

1≤j,k≤n

)h, h



> 0 (< 0)

dla wszystkich h = 0 takich, ˙ze

∇J(u

), h ≤ 0 (≥ 0),

(24)

∇f

i

(u

), h = 0, i = 1, ..., m,

(25)

to u

jest punktem ´scisłego lokalnego minimum (maksimum) funkcji J na zbiorze U.

Dowód.

Załó˙zmy, ˙ze dla punktu u

spełnione s ˛

a zało˙zenia twierdzenia i przy-

pu´s´cmy, ˙ze punkt ten nie jest punktem ´scisłego minimum lokalnego. Istnieje wówczas

ci ˛

ag (u

k

) taki, ˙ze

u

k

= u

,

f

1

(u

k

) = 0, ..., f

m

(u

k

) = 0,

J(u

k

) ≤ J(u

)

dla k = 1, 2, ... i u

k

→ u

, gdy k → ∞. Punkt u

k

mo˙zna zapisa´c w postaci

u

k

= u

+ |u

k

− u

|

u

k

− u

|u

k

− u

|

= u

+ t

k

e

k

,

gdzie t

k

= |u

k

− u

| → 0, e

k

=

u

k

−u

|u

k

−u

|

. Poniewa˙z |e

k

| = 1 dla k = 1, 2, ..., bez

zmniejszania ogólno´sci rozwa˙za´n mo˙zna zało˙zy´c, ˙ze istnieje punkt e

0

taki, ˙ze e

k

→ e

0

,

|e

0

| = 1.

26

background image

Z ró˙zniczkowalno´sci funkcji J, f

i

, i = 1, ..., m otrzymujemy

0 ≥ J(u

k

) − J(u

) = ∇J(u

), e

k

 t

k

+ o

0

(u

k

− u

),

0 = f

i

(u

k

) − f

i

(u

) = ∇f

i

(u

), e

k

 t

k

+ o

i

(t

k

)

dla i = 1, ..., m, k = 1, 2, ... (tutaj o

i

(u) dla i = 0, 1, ..., m jest tak ˛

a funkcj ˛

a, ˙ze

o

i

(u)

|u|

→ 0, gdy |u| → 0). Dziel ˛

ac obie strony powy˙zszych równo´sci i nierówno´sci

przez t

k

i przechodz ˛

ac do granicy, otrzymujemy

0 ≥ ∇J(u

), e

0

 ,

0 = ∇f

i

(u

), e

0

 .

A wi ˛ec punkt e

0

spełnia warunki (24), (25).

Oznaczmy teraz

L(u) = λ

0

J(u) +



m
i

=1

λ

i

f

i

(u), u ∈ R

n

.

Jest to oczywi´scie funkcja klasy C

2

taka, ˙ze ∇L(u

) = 0. Ponadto,

L(u

k

) = λ

0

J(u

k

) +



m
i

=1

λ

i

f

i

(u

k

) = λ

0

J(u

k

) ≤ λ

0

J(u

)

= λ

0

J(u

) +



m
i

=1

λ

i

f

i

(u

) = L(u

)

dla k = 1, 2, ... St ˛

ad i z dwukrotnej ró˙zniczkowalno´sci L otrzymujemy

0 ≥ L(u

k

) − L(u

) =

1
2

t

2
k

2

L(u

)e

k

, e

k

+ α(u

k

− u

)

dla k = 1, 2, ... (tutaj α(u) jest tak ˛

a funkcj ˛

a, ˙ze

α

(u)

|u|

2

→ 0, gdy |u| → 0). Dziel ˛

ac

powy˙zsz ˛a nierówno´s´c stronami przez t

2

k

i przechodz ˛

ac do granicy, otrzymujemy



0

[

2

J

∂u

j

∂u

k

(u

)]

1≤j,k≤n

+

m



i

=1

λ

i

[

2

f

i

∂u

j

∂u

k

(u

)]

1≤j,k≤n

)e

0

, e

0



=

2

L(u

)e

0

, e

0

≤ 0,

przy czym, przypomnijmy,

0 ≥ ∇J(u

), e

0

 ,

0 = ∇f

i

(u

), e

0

 , i = 1, ..., m.

Jest to sprzeczne z zało˙zeniem twierdzenia i tym samym ko´nczy dowód twierdzenia.

27

background image

Uwaga 33 Korzystaj ˛

ac z warunku dostatecznego zamiast twierdzenia Weierstrassa

w Przykladzie 27, mo˙zna wykaza´c, ˙ze, gdy u

= 0, znaleziony punkt podejrzany u =

u

|u

|

jest punktem minimum globalnego. Istotnie, w tym przypadku mamy (λ

0

= 1,

λ

1

= m(|u

| − 1)) i w konsekwencji

λ

0

[

2

J

∂u

j

∂u

k

(

u

|u

|

)]

1≤j,k≤n

+

m



i

=1

λ

i

[

2

f

i

∂u

j

∂u

k

(

u

|u

|

)]

1≤j,k≤n

) = 2mI+2m(|u

|−1)I = 2m |u

| I.

Jest to macierz dodatnio okre´slona, wi ˛

ec z powy˙zszego twierdzenia o warunkach

dostatecznych wynika, ˙ze u =

u

|u

|

jest punktem ´scisłego lokalnego minimum funkcji

J na zbiorze U . Tak samo mo˙zna pokaza´c, ˙ze u = −

u

|u

|

jest punktem ´scisłego

maksimum lokalnego. Zatem, u =

u

|u

|

jest jedynym punktem minimum lokalnego.

1.3.3

Zało˙zenie wypukło´sci - twierdzenie Kuhna-Tuckera

Rozwa˙zmy nast ˛epuj ˛ace zadanie

J(u) → inf ,

u ∈ U = {u ∈ R

n

; u ∈ A, f

i

(u) ≤ θ, i = 1, ..., m}

(26)

gdzie A ⊂ R

n

, J, f

i

: R

n

→ R, i = 1, ..., m.

Mówimy, ˙ze punkt u

∈ U jest rozwi ˛

azaniem globalnym zadania (26), je´sli

J(u

) ≤ J(u)

dla dowolnego u ∈ U .

Dowód kolejnego twierdzenia oparty jest na nastepuj ˛

acym klasycznym wyniku o

odzielaniu.

Lemat 34 Niech D b ˛

edzie niepustym wypukłym podzbiorem przestrzeni R

m

takim,

˙ze 0 /

∈ D. Wówczas istnieje wektor (a

1

, ..., a

m

) ∈ R

m

\ {0} taki, ˙ze

m



i

=1

a

i

x

i

≥ 0

dla dowolnego (x

1

, ..., x

m

) ∈ D.

28

background image

Poni˙zsze twierdzenie pokazuje, ˙ze tak˙ze w przypadku zadania (26), przy do-

datkowych zało˙zeniach wypukło´sci, warunek konieczny istnienia minimum jest warunk-

iem dostatecznym

Twierdzenie 35 (Kuhna-Tuckera) Niech J, f

1

,...,f

m

: R

n

→ R b ˛

ed ˛

a funkcjami

wypukłymi i A ⊂ R

n

- zbiorem wypukłym. Je´sli u

jest rozwi ˛

azaniem globalnym zada-

nia (26), to istniej ˛

a mno˙zniki Lagrange’a λ

0

≥ 0, λ

1

≥ 0,...,λ

m

≥ 0 nie znikaj ˛

ace

jednocze´snie i takie, ˙ze

λ

0

J (u

) +

m



i

=1

λ

i

f

i

(u

) = min

u

∈A

0

J(u) +

m



i

=1

λ

i

f

i

(u))

(27)

λ

i

f

i

(u

) = 0, i = 1, ...m.

(28)

Jesli ponadto istnieje punkt u ∈ A taki, ˙ze

f

i

(u) < 0, i = 1, ..., m,

(29)

to λ

0

= 0 i mo˙zna przyj ˛

a´c λ

0

= 1. Na odwrót, je´sli istniej ˛

a λ

0

> 0, λ

1

≥ 0,...,λ

m

≥ 0

i punkt u

∈ U taki, ˙ze

λ

0

J(u

) +

m



i

=1

λ

i

f

i

(u

) = min

u

∈A

0

J(u) +

m



i

=1

λ

i

f

i

(u)),

λ

i

f

i

(u

) = 0, i = 1, ...m,

to u

jest rozwi ˛

azaniem globalnym zadania (26).

Dowód twierdzenia.

Konieczno´s´c. Niech u

b ˛edzie rozwi ˛

azaniem globalnym

zadania (26). Bez zmniejszania ogólno´sci rozwa˙za´n mo˙zemy zało˙zy´c, ˙ze

J(u

) = 0.

Rozwa˙zmy nast ˛epuj ˛acy zbiór

C = {µ = (µ

0

, µ

1

, ..., µ

m

) ∈ R

1+m

; istnieje punkt u ∈ A taki, ˙ze

J (u) < µ

0

oraz f

i

(u) ≤ µ

i

dla i = 1, ..., m}.

29

background image

Zbiór C jest niepusty. Istotnie, wystarczy rozwa˙zy´c punkt µ = (1, 0, ..., 0),

który nale˙zy do C, bowiem J(u

) = 0 < 1, f

i

(u

) ≤ 0, i = 1, ..., m oraz u

∈ A.

Zbiór C jest wypukły. Istotnie, niech (µ

1

0

, µ

1

1

, ..., µ

1

m

) ∈ C, (µ

2

0

, µ

2

1

, ..., µ

2

m

) ∈ C,

u

1

, u

2

∈ A b ˛ed ˛

a takie, ˙ze

J(u

1

) < µ

1

0

, J(u

2

) < µ

2

0

,

f

i

(u

1

) ≤ µ

1
i

, f

i

(u

2

) ≤ µ

2
i

, i = 1, ...m.

Wówczas, dla dowolnego α ∈ (0, 1) mamy

αu

1

+ (1 − α)u

2

∈ A

J(αu

1

+ (1 − α)u

2

) ≤ αJ(u

1

) + (1 − α)J(u

2

) < αµ

1

0

+ (1 − α)µ

2

0

,

f

i

(αu

1

+ (1 − α)u

2

) ≤ αf

i

(u

1

) + (1 − α)f

i

(u

2

) ≤ αµ

1
i

+ (1 − α)µ

2
i

, i = 1, ..., m.

Oznacza to, ˙ze

α(µ

1

0

, µ

1

1

, ..., µ

1
m

) + (1 − α)(µ

2

0

, µ

2

1

, ..., µ

2
m

) ∈ C.

0

/

∈ C. Istotnie, w przeciwnym bowiem razie istniałby punkt u ∈ A taki, ˙ze

J(

u) < 0,

f

i

(

u) ≤ 0, i = 1, ...m,

co przeczyłoby temu, ˙ze u

jest rozwi ˛

azaniem zadania (26).

Zatem, z twierdzenia o oddzielaniu wynika istnienie punktu (λ

0

, λ

1

, ..., λ

m

) ∈

R

1+m



{0} takiego, ˙ze

m



i

=0

λ

i

µ

i

≥ 0

(30)

dla (µ

0

, µ

1

, ..., µ

m

) ∈ C.

λ

i

≥ 0, i = 0, 1, ..., m. Istotnie, ustalmy bowiem dowolne ε > 0, wska´znik i

0

{0, 1, ..., m} i rozwa˙zmy punkt postaci µ

ε

= (ε, ..., ε, 1, ε, ..., ε) ∈ R

1+m

, którego i

0

-

owa współrz ˛edna jest równa 1. Oczywi´scie, µ

ε

∈ C (wystarczy rozwa˙zy´c punkt

u

∈ A). A wi ˛ec z ostatniej nierówno´sci

λ

i

0

≥ −ε

m



i

=0, i =i

0

λ

i

,

30

background image

co, wobec dowolno´sci ε > 0, oznacza, ˙ze λ

i

0

≥ 0.

Mno˙zniki λ

i

, i = 1, ..., m, spełniaj ˛

a warunek (28). Ustalmy dowolny wska´znik

i

0

∈ {1, ..., m}. Je´sli f

i

0

(u

) = 0, to oczywi´scie λ

i

0

f

i

0

(u

) = 0. Przypu´s´cmy wi ˛ec,

˙ze f

i

0

(u

) < 0 i rozwa˙zmy punkt µ

δ

= (δ, 0, ..., 0, f

i

0

(u

), 0, ..., 0) ∈ R

1+m

z dowol-

nie ustalon ˛

a liczb ˛

a δ > 0 i i

0

-ow ˛

a współrz ˛edn ˛

a równ ˛

a f

i

0

(u

). Oczywi´scie µ

δ

∈ C

(wystarczy rozwa˙zy´c punkt u

∈ A). Z nierówno´sci (30) wynika, ˙ze

λ

i

0

f

i

0

(u

) ≥ −λ

0

δ,

co, wobec dowolno´sci δ > 0, oznacza, ˙ze

λ

i

0

f

i

0

(u

) ≥ 0,

czyli λ

i

0

≤ 0. Wobec faktu, ˙ze λ

i

0

≥ 0, mamy wi ˛ec równo´s´c λ

i

0

= 0 i w konsekwencji

λ

i

0

f

i

0

(u

) = 0.

Spełniony jest warunek (27). Niech u ∈ A. Rozwa˙zmy punkt postaci (J(u)+

δ, f

1

(u), ..., f

m

(u)) ∈ R

1+m

, gdzie δ > 0 jest dowolnie ustalone. Oczywi´scie punkt ten

nale˙zy do zbioru C (wystarczy rozwa˙zy´c punkt u). Zatem, korzystaj ˛ac z nierówno´sci

(30), mamy

λ

0

J(u) +

m



i

=1

λ

i

f

i

(u) ≥ −λ

0

δ.

St ˛

ad, wobec dowolno´sci δ > 0,

λ

0

J(u) +

m



i

=1

λ

i

f

i

(u) ≥ 0

dla u ∈ A. Ponadto z (28) i faktu, ˙ze J(u

) = 0 mamy

0 = λ

0

J(u

) +

m



i

=1

λ

i

f

i

(u

).

(31)

A wi ˛ec

λ

0

J(u

) +

m



i

=1

λ

i

f

i

(u

) = min

x

∈A

0

J(u) +

m



i

=1

λ

i

f

i

(u)).

(32)

31

background image

Przypu´s´cmy teraz, ˙ze spełniony jest warunek (29), t.zn. istnieje punkt u ∈ A taki,

˙ze

f

i

(u) < 0, i = 1, ..., m,

oraz λ

0

= 0. Wówczas z (31) wynika, ˙ze

λ

0

J(u) +

m



i

=1

λ

i

f

i

(u) =

m



i

=1

λ

i

f

i

(u)

< 0 =

m



i

=1

λ

i

f

i

(u

) = λ

0

J(u

) +

m



i

=1

λ

i

f

i

(u

),

co jest sprzeczne z (32). Zatem λ

0

> 0.

Dostateczno´s´c. Załó˙zmy, ˙ze istniej ˛a mno˙zniki λ

0

, λ

1

, ..., λ

m

≥ 0 takie, ˙ze λ

0

> 0

i spełnione s ˛

a warunki (27), (28), przy czym u

∈ A, f

1

(u

) ≤ 0,...,f

m

(u

) ≤ 0.

Bez zmniejszania ogólno´sci rozwa˙za´n mo˙zemy zało˙zy´c, ˙ze λ

0

= 1. Wówczas, dla

dowolnego u ∈ A takiego, ˙ze f

i

(u) ≤ 0, i = 1, ..., m, mamy

J(u) ≥ J (u) +

m



i

=1

λ

i

f

i

(u) ≥ J(u

) +

m



i

=1

λ

i

f

i

(u

) = J(u

).

Oznacza to, wobec dowolno´sci u ∈ A takiego, ˙ze f

i

(u) ≤ 0, i = 1, ..., m, i˙z u

jest

rozwi ˛

azaniem globalnym zadania (26).

Uwaga 36 Łatwo wida´c, ˙ze przy zało˙zeniach wypukło´sci (podobnie, jak wcze´sniej)

ka˙zde rozwi ˛

azanie lokalne zadania (26) jest jego rozwi ˛

azaniem globalnym.

Z faktu, ˙ze w przypadku funkcji wypukłej na przestrzeni R

n

punkt, w którym

jest ona ró˙zniczkowalna jest punktem minimum globalnego wtedy i tylko wtedy, gdy

gradient w tym punkcie znika, wynika nast ˛epuj ˛

acy

Wniosek 37 Niech J, f

1

,...,f

m

: R

n

→ R b ˛

ed ˛

a funkcjami wypukłymi i ró˙zniczkowal-

nymi w punkcie u

. Je´sli u

jest rozwi ˛

azaniem globalnym zadania (26) ze zbiorem

A = R

n

, to istniej ˛

a mno˙zniki Lagrange’a λ

0

≥ 0, λ

1

≥ 0,...,λ

m

≥ 0 nie znikaj ˛

ace

jednocze´snie i takie, ˙ze

λ

0

∇J(u

) +



m
i

=1

λ

i

∇f

i

(u

) = 0,

32

background image

λ

i

f

i

(u

) = 0, i = 1, ...m.

Je´sli ponadto istnieje punkt u ∈ R

n

taki, ˙ze

f

i

(u) < 0, i = 1, ..., m,

to λ

0

= 0 i mo˙zna przyj ˛

a´c λ

0

= 1.

Na odwrót, je´sli istniej ˛

a λ

0

> 0, λ

1

≥ 0,...,λ

m

≥ 0, takie, ˙ze

λ

0

∇J(u

) +



m
i

=1

λ

i

∇f

i

(u

) = 0,

λ

i

f

i

(u

) = 0, i = 1, ...m,

f

1

(u

) ≤ 0, ..., f

m

(u

) ≤ 0,

to u

jest rozwi ˛

azaniem globalnym zadania (26) ze zbiorem A = R

n

.

Drug ˛

a cz ˛e´s´c powy˙zszego twierdzenia mo˙zna traktowa´c jako odwrócenie drugiej

zasady mno˙zników Lagrange’a (przy zało˙zeniu wypukło´sci).

Przyklad 38 Rozwa˙zmy zadanie z Przykładu 31:

J(u) =



m

i

=1

|u − v

i

|

2

→ min .,

u ∈ U = {u ∈ R

n

; h

1

(u) = |u|

2

− 1 ≤ θ}

w przypadku, gdy |u

| > 1, gdzie u

=

1

m



m

i

=1

v

i

Korzystaj ˛

ac z przeprowadzonej

tam analizy i nie korzystaj ˛

ac z twierdzenia Weierstrassa, stwierdzamy, ˙ze punktami

"podejrzanymi" s ˛

a

u

|u

|

i

u

|u

|

, przy czym odpowiednie mno˙zniki Lagrange’a (λ

1

)

wynosz ˛

a m(|u

| − 1), m(− |u

| − 1), odpowiednio; oczywi´scie λ

0

= 1 w obu przypad-

kach. Łatwo wida´c, ˙ze "trójka"

λ

0

= 1, λ

1

= m(|u

| − 1),

u

|u

|

spełnia warunki dane w drugiej cz ˛

e´sci powy˙zszego wniosku i tym samym jest rozwi ˛

azaniem

zadania. Aby stwierdzi´c, ˙ze punkt

u

|u

|

nie jest rozwi ˛

azaniem wystarczy na przykład

porówna´c warto´sci funkcji J w obu znalezionych punktach.

33

background image

1.3.4

Metody numeryczne - metoda projekcji gradientu

Mówimy, ˙ze funkcja J : U → R, gdzie U jest wypukłym podzbiorem R

n

, jest silnie

wypukła, je´sli istnieje stała κ > 0 taka, ˙ze

J(αu + (1 − α)v) ≤ αJ(u) + (1 − α)J (v) − α(1 − α)κ |u − v|

2

dla α ∈ [0, 1], u, v ∈ U . Mo˙zna pokaza´c, ˙ze J jest silnie wypukła na U ze stał ˛a κ

wtedy i tylko wtedy, gdy funkcja g(u) = J(u) − κ |u|

2

jest wypukła na U.

Symbolem P

U

(u) oznaczamy rzut punktu u ∈ R

n

na wypukły i domkni ˛ety zbiór

U ⊂ R

n

, t.zn. punkt nale˙z ˛acy do zbioru U i spełniaj ˛acy warunek

|u − P

U

(u)| = inf

v

∈U

|u − v| .

Metod ˛e projekcji gradientu, słu˙z ˛ac ˛a do numerycznego rozwi ˛azywania minimaliza-

cyjnych zada´n z ograniczeniami, opisuje poni˙zsze twierdzenie. Dowód tego twierdzenia

mo˙zna znale´z´c w [V].

Twierdzenie 39 (o zbie˙zno´sci metody projekcji gradientu) Niech U ⊂ R

n

b ˛

edzie zbiorem wypukłym i domkni ˛

etym, J : U → R - funkcjonałem klasy C

1

,

ograniczonym z dołu, którego gradient spełnia warunek Lipschitza (ze stał ˛

a L). Je´sli

(u

k

) ⊂ R

n

jest ci ˛

agiem okre´slonym wzorem rekurencyjnym

u

k

+1

= P

U

(u

k

− α

k

∇J(u

k

)), k = 0, 1, ...,

(33)

przy dowolnie ustalonym u

0

∈ U, gdzie parametr α

k

, k = 0, 1, ..., jest taki, ˙ze

ε

0

≤ α

k

2

L + 2ε

(34)

(tutaj ε

0

, ε s ˛

a ustalonymi dodatnimi parametrami metody), to ci ˛

ag (J(u

k

)) jest

nierosn ˛

acy oraz

lim

k

→∞

u

k

− u

k

+1

 = 0.

(35)

Je´sli, dodatkowo, J jest silnie wypukły na U, to ci ˛

ag (u

k

) jest zbie˙zny do u

- jedynego

punktu minimum funkcji J na U, przy czym istnieje stała c ≥ 0 taka, ˙ze

u

k

− u



2

c

k

, k = 1, 2, ...

(36)

34

background image

Uwaga 40 Stał ˛

a c mo˙zna wyznaczy´c (por. [V]).

Przyklad 41 Rozwa˙zmy zadanie

J(u = (u

1

, u

2

)) = (u

1

− 1)

2

+ (u

2

+ 1)

2

→ min ,

u ∈ U = {u = (u

1

, u

2

) ∈ R

2

; f

1

(u) = −u

1

≤ θ, f

2

(u) = −u

2

≤ θ}

Aby rozwi ˛

aza´c to zadanie, zastosujemy metod ˛

e projekcji gradientu, z punktem pocz ˛

atkowym

u

0

= (0, 0).

Zauwa˙zmy, ˙ze gradient ∇J(u

1

, u

2

) = (2(u

1

− 1), 2(u

2

+ 1)) funkcji J spełnia

warunek Lipschitza ze stał ˛

a L = 2:



∇J(u

1

, u

2

) − ∇J(v

1

, v

2

)



 =



(2(u

1

− 1), 2(u

2

− 1)) − (2(v

1

− 1), 2(v

2

− 1))





=



(2(u

1

− v

1

), 2(u

2

− v

2

))



 = 2



(u

1

, u

2

) − (v

1

, v

2

)



 .

Przyjmuj ˛

ac ε

0

=

1
4

, ε = 3 wida´c, ˙ze musi by´c α

k

=

1
4

dla dowolnego k = 0, 1, ...

Mamy

∇J(u

0

) = ∇J(0, 0) = (−2, 2)

i w konsekwencji

u

1

= P

U

((0, 0) −

1
4

(−2, 2)) = P

U

(

1
2

, −

1
2

) = (

1
2

, 0) = (1 − (

1
2

)

1

, 0).

Podobnie,

∇J(u

1

) = ∇J(

1
2

, 0) = (−1, 2)

i w konsekwencji

u

2

= P

U

((

1
2

, 0) −

1
4

(−1, 2)) = P

U

(

3
4

, −

1
2

) = (

3
4

, 0) = (1 − (

1
2

)

2

, 0).

Poka˙zemy, korzystaj ˛

ac z zasady indukcji matematycznej, ˙ze

u

k

= (1 − (

1
2

)

k

, 0), k = 0, 1, ...

35

background image

Istotnie, wzór jest prawdziwy dla k = 0. Załó˙zmy, ˙ze jest prawdziwy dla ustalonej

liczby naturalnej k ≥ 0. Wówczas,

u

k

+1

= P

U

(u

k

− α

k

∇J(u

k

)) = P

U

((1 − (

1
2

)

k

, 0) −

1
4

(2(1 − (

1
2

)

k

) − 2, 2 · 0 + 2)

= P

U

(1 − (

1
2

)

k

1
2

(1 − (

1
2

)

k

) +

1
4

· 2), 0 −

1
4

· 2) = P

U

(1 − (

1
2

)

k

+

1
2

(

1
2

)

k

, −

1
2

)

= P

U

(1 − (

1
2

)

k

(1 −

1
2

), −

1
2

) = P

U

(1 − (

1
2

)

k

+1

, −

1
2

) = (1 − (

1
2

)

k

+1

, 0)

Zatem, korzystaj ˛

ac z silnej wypukło´sci funkcji J na zbiorze U, a nawet R

2

(bo

J(u

1

, u

2

) − |(u

1

, u

2

)|

2

= −2u

1

+ 2u

2

+ 2), stwierdzamy, ˙ze ci ˛

ag (u

k

) jest zbie˙zny

do jedynego rozwi ˛

azania u

. Tym samym

u

= lim u

k

= lim(1 − (

1
2

)

k

, 0) = (1, 0).

36


Wyszukiwarka

Podobne podstrony:
Badania operacyjne w logistyce Nieznany
Jadczak R Badania operacyjne, Wykład 4 Optymalizacja w logistyce
Jadczak R Badania operacyjne, Wykład 1 Optymalizacja w logistyce
Jadczak R Badania operacyjne, Wykład 2 Optymalizacja w logistyce
Jadczak R - Badania operacyjne Wykład 3, Optymalizacja w logistyce
Jadczak R Badania operacyjne, Wykład 3 Optymalizacja w logistyce
Jadczak R Badania operacyjne, Wykład 4 Optymalizacja w logistyce
Badania operacyjne wyklad 2 id Nieznany
badania operacyjne 3 id 76767 Nieznany (2)
Lab 1 Analiza wrazliwosci, Materiały AGH- zarządzanie finansami, badania operacyjne
progr siec, Materiały Ekonomiczna, badania operacyjne
Kolorowanie grafów, badania operacyjne
bo2T, Szkoła, Semestr 3, Semestr 3, Badania operacyjne
badania operacyjne 5
badania operacyjne poss intro i Nieznany (2)
Badania operacyjne, zadanie id Nieznany (2)
Projekt Badania operacyjne

więcej podobnych podstron