Entropia w Układach Dynamicznych II Downarowicz skrypt p16


Entropia w układach dynamicznych
Åšrodowiskowe studia doktoranckie
Uniwersytet Jagielloński
Kraków, marzec-kwiecień 2013
Tomasz Downarowicz
Część II
Entropia topologiczna i zasada wariacyjna
1 Wstęp
Zacznijmy od poczÄ…tku.
Zadajemy komuś pytanie, na które możliwa jest pewna skończona liczba
l odpowiedzi. Na przykład.  Jak masz na imię? Możliwe odpowiedzi, to l-
elementowe rozbicie przestrzeni  wszystkiego, co się może potem wydarzyć . Jak
wiemy, entropia tego rozbicia (średnia ilość informacji z otrzymanej odpowiedzi)
zależy od rozkładu prawdopodobieństwa na przestrzeni i nie przekracza log l w
przypadku, gdy wszystkie odpowiedzi sÄ… jednakowo prawdopodobne.
Wiemy też jednak, że rozkład prawdopodobieństwa jest sprawą subiektywną,
zależną od wiedzy obserwatora o sytuacji. Tak naprawdę w praktyce prawie
nigdy nie jest ono a priori dokładnie zdefiniowane. Jeśli lekarz mówi, po badaniu
USG ciężarnej kobiecie, że  na 80% będzie to dziewczynka , to podany procent
jest czystÄ… spekulacjÄ…, oszacowaniem na oko, tym co siÄ™ lekarzowi zdaje na
podstwie niewyraznego obrazka. Równie dobrze mógłby on powiedzieć 70% lub
90%. Jeśli pózniej okaże się, że to jednak chłopiec, prawdopodobnie będzie starał
się przekonać pacjentkę, że mówił 50%.
A zatem dobrze byłoby w praktyce nie opierać się na bliżej nieokreślonym
prawdopodobieństwie lecz na czymś bardziej pewnym. Jedyną rzeczą, którą mo-
żemy ustalić na pewno jest liczba możliwych odpowiedzi l. Można więc przyjąc
log l jako rodzaj kombinatorycznej entropii rozbicia. ZaletÄ… takiego parametru
jest to, że nie zależy ona od rozkładu prawdopodobieńtwa, a mimo to coś nam
mówi o ich entropiach  jest on bowiem równy maksimum entropii przy różnych
rozkładach.
Hcomb(P) = max{Hµ(P) : µ - miara probabilistyczna na X}.
Otóż, tę samą zależność będziemy próbowali przenieść na topologiczne układy
dynamiczne w odniesieniu do entropii dynamicznej. Zależności tego typu noszą
wspólne miano zasad wariacyjnych.
Pewien problem, na jaki się przy tym natkniemy, to występowanie w ukła-
dach topologicznych efektu tzw. logiki rozmytej. Na przykład gdy ktoś robi sobie
test ciążowy, to ma co prawda tylko dwie możliwości, które powinny być rozpo-
znawalne przy pomocy kolorów próbnika: biały  brak ciąży, czerwony  ciąża.
Ale zdarza się (i to zapewne nader często), że kolor próbnika jest różowy. Jak
obliczyć ilość uzyskanej wtedy informacji?
1
2 Entropia Kołmogorowa Sinaia  uzupełnienie
Musimy najpierw uzupełnić naszą wiedzę na temat entropii dynamicznej w
układach teorio-miarowych. Przypomnijmy, że teorio-miarowym układem dy-
namicznym nazywamy czwórkÄ™ (X, A, µ, T ), gdzie (X, A, µ) jest standardowÄ…
przestrzeniÄ… probabilistycznÄ…, a T : X  transformacjÄ… mierzalnÄ… zachowu-
jącą miarę. Jeśli w przestrzeni X wprowadzimy skończone rozbicie mierzalne
P = {A1, . . . , Al}, to dostaniemy faktor symboliczny naszego ukladu zwany
procesem generowanym przez P. Dla takich procesów zdefiniowaliśmy entropię
dynamicznÄ…
1
h(µ, T, P) = lim H(µ, Pn),
n
n"
n -i
gdzie przez Pn oznaczaliśmy połączenie T (P). Dla takiej entropii udo-
i=0
wodniliśmy Twierdzenie Shannona McMillana Breimana.
Chcemy teraz uniezależnić się od rozbicia i określić entropię układu dyna-
micznego. Rolę tę spełnia tzw. entropia Kołmogorowa Sinaia zdefiniowana na-
stępująco
Definicja 4.1.1 Entropią Kołmogorowa Sinaja układu dynamicznego
(X, A, µ, T ) nazywamy liczbÄ™
h(µ, T ) = sup h(µ, T, P),
P
gdzie P przebiega wszystkie A-mierzalne rozbicia skończone (lub, co daję rów-
noważną definicję, rozbicia przeliczalne o skończonej entropii statycznej). Jeśli
transformacja lub miara, lub obie te rzeczy są ustalone, to będziemy używać
alternatywmych oznaczeÅ„ h(µ), h(T ), h(A).
Jako interpretację tego pojęcia możemy powiedzieć, że jeśli traktujemy rozbi-
cie jako rodzaj rozdzielczości teorio-miarowej naszej obserwacji układu, i jeśli już
rozumiemy entropię procesu przy ustalonym rozbiciu, to entropia Kołmogorowa
Sinaja określa maksymalną entropię procesu, jaką możemy uzyskać w układzie
dynamicznym zmieniając dowolnie tę rozdzielczość. Okazuje się bowiem, że cho-
ciaż entropie statyczne rozbić skończonych nie są ograniczone, to jednak ich
entropie dynamiczne mogÄ… okazać siÄ™ ograniczone. Tak wiÄ™c h(µ, T ) to maksy-
malna średnia ilość informacji po przestrzeni i czasie, jaką dostacza nam układ
niezależnie od tego z jaką rozdzielczością go obserwujemy.
Jeśli teraz B jest podniezmienniczym sigma-ciałem, to możemy zdefiniować
entropię warunkową układu względem faktora:
Definicja 4.1.5 EntropiÄ… warunkowÄ… ukÅ‚adu dynamicznego (X, A, µ, T )
względem faktora (czyli sigma ciała podniezmienniczego) B nazywamy liczbę
h(µ, T |B) = sup h(µ, T, P|B).
P
Alternatywne oznaczenia, to h(µ|½), h(T |S), h(A|B), gdzie ½ i S oznaczajÄ…
odpowiednio miarę i transformację na faktor-przestrzeni atomów sigma-ciała B.
2
Fakt 4.1.6 h(A|B) + h(B) = h(A).
Dowód: Równość jest trywialna, gdy h(B) = ", gdyż jest oczywiste z definicji,
że h(A) h(B). W pozostałych przypadkach mamy udowodnić wzór  substrak-
tywny h(A|B) = h(A) - h(B). Niech P i Q przebiegajÄ… wszystkie rozbicia
skończone odpowiednio A- i B-mierzalne. Wtedy
h(A) - h(B) = sup h(P) - sup h(Q) = inf sup(h(P) - h(Q)) =
Q
P Q P
inf sup(h(P (" Q) - h(Q)) sup inf(h(P (" Q) - h(Q)) =
Q Q
P P
sup inf(h(P|Q)) = sup h(P|B) = h(A|B).
Q
P P
Z drugiej strony, mamy też
h(A|B) = sup inf(h(P (" Q) - h(Q)) sup inf(h(P) - h(Q)) = h(A) - h(B).
Q Q
P P
Podamy teraz listę własności entropii Kołmogorowa Sinaja (bez dowodów,
które są natychmiastowymi konsekwencjami analogicznych własności dla entro-
pii procesów). Poniżej, B, C i D są poniezmienniczymi pod-sigma-ciałami A.
Fakt 4.1.7
h(B (" C|D) = h(B|C (" D) + h(C|D),
B C =Ò! h(B|D) h(C|D)
C D =Ò! h(B|C) h(B|D)
h(B (" C|D) h(B|D) + h(C|D),
h(B|D) h(B|C) + h(C|D).
Mamy też  zasadę potęgową (tu również dowód wynika natychmiast z ana-
logicznej zasady dla procesów).
Fakt 4.1.14 Dla każdego n 0 (a dla działań odwracalnych również dla
n ujemnych) mamy
n
h(T ) = |n|h(T ).
Dowód wynika natychmiast z Faktu 2.4.19 przez nałożenie supremum po rozbi-
ciach.
0
Twierdzenie (Kołmogorowa Sinaja) Jeśli P jest generatorem (tzn. PN =
A), to
h(µ, T ) = h(µ, T, P).
Dowód wynika natychmiast z Faktu 2.4.1.
3
3 Rozdzielczość topologiczna
Przechodzimy do części topologicznej naszych rozważań. Przez topologiczny
układ dynamiczny będziemy rozumieć parę (X, T ), gdzie X jest przestrzenią
metryczną zwartą, a T : X X jest transformacją ciągłą. Przede wszystkim,
trzeba wiedzieć, że na mocy twierdzenia o punkcie stałym Bogolubowa Kryłowa
w takim układzie zawsze istnieje przynajmniej jedna miara (borelowska, proba-
bilistyczna) T -niezmiennicza. Wtedy ukÅ‚ad (X, Aµ, µ, T ) jest teorio-miarowym
ukÅ‚adem dynamicznym (Aµ oznacza sigma-ciaÅ‚o zbiorów borelowskich uzupeÅ‚-
nione dla miary µ). Miar niezmienniczych może być wiele (nawet nieprzeliczal-
nie wiele), tak więc jeden układ topologiczny najczęściej integruje w sobie wiele
układów teorio-miarowych.
W zasadzie chcielibyśmy wprowadzić topologiczną funkcję informacji i en-
tropię topologiczną w oparciu o wcześniej zasygnalizowaną ideę entropii kobina-
torycznej, opartej na liczeniu (niepustych) elementów rozbicia odpowiadającego
odpowiedziom na jakieÅ› pytanie (wyniki jakiegoÅ› pomiaru). W pewnych przy-
padkach rzeczywiście można tak zrobić i my wrócimy do tego prostego pomysłu
przy omawianiu entropii ukladów zero-wymiarowych. Jednak w ogólnym przy-
padku przestrzeni metrycznej zwartej patrzenie na rozbicia mierzalne kłóci się
ze strukturÄ… topologicznÄ… przestrzeni  po prostu funkcje charakterystyczne ele-
mentów rozbicia na ogół nie są ciągłe, tak więc rozbicie  rozrywa przestrzeń
zmieniając niejako jej topologię. Mówiąc ściślej, odwzorowanie faktorujące z na-
szego układu w układ symboliczny uzyskany przy pomocy rozbicia nie jest wtedy
ciągłe. Aby lepiej zrozumieć ideę funkcji informacji i entropii topologicznej mu-
simy omówić dokładniej interpretację pojęcia  rozdzielczości topologicznej .
Przypuśćmy, że dokonujemy pomiaru jakiejś wielkości, która może przyjmo-
wać wartości z odcinka [0, 1]. Nasze zdolności rozdzielcze są ograniczone, dlatego
nie będziemy odróżniać wyników mało od siebie odległych, powiedzmy bliższych
sobie niż pewien . Wtedy  klasą nierozróżnialności wyniku x będzie odcinek
otwarty (x - , x + ). Zauważmy, że klasy różnych wyników nie są rozłączne 
relacja nierozróżnialności, choć jest zwrotna i symetryczna, nie jest przechodnia,
a więc nie jest relacją równoważności.
W zwiÄ…zku z tym proponowane sÄ… dwa sposoby obliczania funkcji informa-
cji z takiego pomiaru. Pierwszy to policzyć ile maksymalnie wyników możemy
rozróżnić i uznać logarytm z tej liczby jako (stałą na całej przestrzeni) funkcję
informacji. Inna możliwość, to policzyć ile minimalnie klas nierozróżnialności
wystarczy, aby pokryć całą przestrzeń (i przyjąć logarytm tej liczby jaką naszą
stałą funkcję informacji). Oba sposoby różnią się nieznacznie (na przykład jeśli
1
jest nieco większy od to maksymalnie możemy rozróżnić dwa elementy  np.
2
1
0 i 1, ale już jedna klasa  np. punktu  pokrywa cały odcinek). Inny sposób
2
liczenia, ktory jast jakby ekstraktem z powyższych dwóch sposobów, poznamy
za chwilÄ™.
4
4 Pokrycia otwarte
Przez pokrycie będziemy rozmumieć rodzinę zbiorów otwartych, których
suma jest całą przestrzenią X. Na przykład U(1, ) oznaczać będzie pokrycie
wszystkimi kulami o promieniu . Formalnie nie ma przeszkód, aby elemen-
tem pokrycia był zbiór pusty. Podpokryciem pokrycia U nazwiemy każdą pod-
rodzinÄ™ V ‚" U, która jest pokryciem. Ze zwartoÅ›ci wynika, że każde pokrycie
posiada podpokrycie skończone, dlatego można zdefiniować parametr skończony
N(U) jako minimalną liczność podpokrycia skończonego. Podpokrycie V o tej
liczności spełnia N(U) = N(V) = #V. Pokrycie spełniające ostatnią równość
N(V) = #V nazwiemy optymalnym. Pokrycie V jest optymalne wtedy i tylko
wtedy, gdy dla każdego V " V istnieje punkt pokryty wyłącznie przez V (oczy-
wiście zbiór pusty nie może być elementem pokrycia optymalnego).
Powiemy, że pokrycie V jest wpisane w pokrycie U (co zapiszemy przez
V U, jeśli każdy element rozbicia V jest zawarty w pewnym elemencie rozbicia
U. Natomiast połączenie rozbić U, V zdefiniowane jest tak samo jak dla rozbić:
U (" V = {U )" V : U " U, V " V}.
Zwróćmy uwagę na istotne różnice pomiędzy relacją i operacją (" dla
rozbić dla pokryć. Po pierwsze jeśli V U, to wcale nie musi być tak, że każdy
element U jest sumą elementów V. Co prawda zawsze jest U (" V U, ale
aby zachodziła tu równość nie wystarczy, żeby V U (potrzebny jest o wiele
mocniejszy warunek); na przykład U (" U na ogół nie równa się U. Po drugie
liczność V może być mniejsza nić liczność U; na przykład każde popokrycie
pokrycia U jest weń wpisane. Mamy jednak następujące zależności dotyczące
paramertu N(U):
Fakt 6.1.2
U V =Ò! N(U) N(V),
N(U (" V) N(U)N(V),
N(U (" U) = N(U),
-1
N(T (U)) N(U).
W ostatnim punkcie mamy na myśli transformację ciągłą T : X X. Za-
uważmy, że przeciwobraz pokrycia jest pokryciem. Ponadto, jeśli T jest surjek-
-1
cjÄ…, to N(T (U)) = N(U).
Dowody sÄ… elementarne.
W kontekście układu dynamicznego zadanego przez transformację T jak wy-
żej będziemy pisać, podobnie jak dla rozbić
n

-i
Un = T (U).
i=0
Z pokryciem U zwiążemy jeszcze dwa parametry: średnicę i liczbę Lebes-
gue a:
5
Definicja ÅšrednicÄ… pokrycia U oznaczonÄ… diam(U) nazwiemy supremum
średnic jego elementów. Jego liczba Lebesgue a, oznaczana Leb(U), to maksy-
malna ´ > 0, taki że każda kula o promieniu ´ mieÅ›ci siÄ™ w caÅ‚oÅ›ci w którymÅ›
elemencie pokrycia U (nietrudno wykazać, że w przestrzeni zwartej taka liczba
dodatnia istnieje).
Oczywiście Leb(U) diam(U) oraz
U(1,Leb(U)) U U(1,diam(U)).
5 Informacja i entropia topologiczna  definicje
W układzie dynamicznym (X, T ) wprowadzamy ciąg metryk dn wzorem
i i
dn(x, y) = max d(T x, T y)
i=0,...,n-1
Oczywiście d1 = d i metryki te rosną wraz n, jednak wszystkie są sobie równo-
ważne. Kule w tej metryce oznaczać będziemy przez Bn(x, ) i nazywać (n, )-
kulami (Bowena). Pokrycie wszystkimi (n, )-kulami oznaczymy przez U(n, ).
Podamy teraz dwie definicje informacji i entropii topologicznej (Dinaburg
1970, Bowen 1971):
Zbiór E nazwiemy (n, )-rozdzielonym, jeśli dn(x, y) dla dowolnych
x, y " F , x = y. Ze zwartości wynika łatwo, że przy ustalonych n i , licz-

ności zbiorów (n, )-rozdzielonych są wspólnie ograniczone przez pewną liczbę
skończoną, którą oznaczymy przez s(n, ). Zbiór (n, )-rozdzielony o tej liczności
nazwiemy maksymalnym.
Definicja 6.1.1 Definiujemy kolejno
H1(n, ) = log s(n, )
1
h1(T, ) = lim sup H1(n, ),
n
n"
h1(T ) = lim Ä™! h1(T, ).
0
Interpretujemy to następująco: liczba s(n, ) to maksymalna ilość orbit, jaką
jesteśmy w stanie rozróżnić posługując się urządzeniem obserwacyjnym o roz-
dzielczości . Zatem możemy przyjąć logarytm tej liczby jako (stałą na całej
przestrzeni) funkcję informacji uzyskanej w n krokach. Dalej już postępujemy
dokładnie tak samo jak w przypadku miarowym: H1(n, ) jest średnią informa-
cją w n krokach (teraz nie mamy ustalonej miary, ale do uśrednienia stałej nie
trzeba jej ustalać  po prostu jest to ta sam stała), h1(T, ) to średni przyrost
entropii w jednym kroku (nie mamy jednak zagwarantowanego istnienia granicy)
 jest to odległy analog entropii dynamicznej procesu przy ustalonym rozbi-
ciu, wreszcie h1(T ) to supremum tego, co można uzyskać dowolnie poprawiając
rozdzielczość, a więc analog entropii Kołmogorowa Sinaja.
6
Kolejna defincja (również tych samych autorów) korzysta z pojęcia rozpina-
nia. Zbiór E nazwiemy (n, )-rozpinającym, jeśli stanowi on -sieć w metryce dn,
czyli jeśli dla dowolnego x " X istnieje y " E, taki że d(x, y) < . Innymi słowy
(n, )-kule wokól elementów E pokrywają X (są podpokryciem U(n, )). Rzecz
jasna, istnieją skończone zbiory (n, )-rozpinające i ich minimalną liczność ozna-
czymy przez r(n, ). Zbiór rozpinający o tej liczności nazwiemy minimalnym.
Definicja 6.1.2 Definiujemy kolejno
H2(n, ) = log r(n, )
1
h2(T, ) = lim sup H2(n, ),
n
n"
h2(T ) = lim Ä™! h2(T, ).
0
Interpretacja jest niemal identyczna, jak poprzednio, z tą tylko różnicą, że
liczba r(n, ) to minimalna ilość n-orbit, jaka wystarcza, aby zakwalifikować
dowolną inną n-orbitę jako nierozróżnialną z jedną z nich. To też jest w pewnym
sensie liczba rozróżnialnych n-orbit w układzie.
Podamy teraz trzecią definicję, która jest najogólniejsza, nie korzysta bo-
wiem z pojęcia metryki (a zatem można ją stosować nawet w przestrzeniach
niemetryzowalnych). Historycznie rzecz ujmując pojawia się ona najwcześniej
(Adler Konheim McAndrew 1965), jednak dobrze jest widzieć ją jako uogólnie-
nie defincji poprzedniej.
Definicja 6.1.3 Definiujemy kolejno
H3(n, U) = log N(Un)
1
h3(T, U) = lim H3(n, U),
n"
n
h3(T ) = sup h3(T, U).
U
Tym razem możemy napisać granicę, gdyż ciąg H3(Un) jest podaddytywny,
co wynika łatwo z wcześniejszych zależności: N(U (" V) N(U)N(V) oraz
-1
N(T (U)) N(U).
Interpretacja jest następująca: elementy pokrycia U to  klasy nierozróżnial-
ności . Liczba N(Un) to, jak poprzednio, minimalna liczba orbit, jaka wystarcza,
aby zakwalifikować dowolną inną n-orbitę jako nierozróżnialną z jedną z nich.
Poprzednia defnicja jest prawie szczególnym przypadkiem tej pokryciowej, jeśli
Un zastąpimy przez U(n, ). Nie jest to ściśle szczególny przypadek, gdyż pokrycie
n
U(n, ) jest jedynie podpokryciem, a nie tym samym co U(1, ).
Uwaga. W przestrzeni metrycznej zawsze można znalezć ciąg pokryć Uk,
taki że dla każdego innego pokrycia U dostatecznie dalekie Uk jest weń wpisane.
Dodatkowo możemy żądać, aby Uk+1 Uk. Mówimy wtedy o rozdrabniającym
7
ciągu pokryć. W takim przypadku supremum po U w ostatniej definicji można
zastąpić granicą wstępującą po Uk.
Entropię topologiczną definiuje się w oparciu o następujące twierdzenie, jako
wspólną wartość liczb h1(T ), h2(T ) i h3(T ) i oznacza przez h(T ).
Twierdzenie 6.1.8 W topologicznym układzie dynamicznym zachodzą
równości
h1(T ) = h2(T ) = h3(T ).
Dowód: Jak wiemy, zbiór E jest (n, )-rozpinający, wtedy i tylko wtedy, gdy
(n, )-kule wokół jego elementów stanowią podpokrycie U(n, ), które z kolei jest
n
wpisane (jako podpokrycie) w U(1, ). Zatem
r(n, ) = N(U(n, )) Nn(U(1, )).
Dalej, jeśli dla jakiegoś pokrycia Leb(U), to U(1, ) U, więc
Nn(U(1, )) N(Un).
Następnie zauważmy, że maksymalny zbiór (n, )-rozdzielony musi być (n, )-
rozpinajÄ…cy, zatem
s(n, ) r(n, ).
Wreszcie, jeśli diam(V) < , to elementy Vn zawierają po co najwyżej jednym
elemencie ze zbioru (n, )-rozdzielonego, co implikuje, że
N(Vn) s(n, ).
Z powyższych nierówności wynika, że
h3(T, V) h1(T, ) h2(T, ) h3(T, U).
Teraz wystarczy nałożyć w suprema: najpierw po V, potem po , na końcu po
U, i dostajemy tezÄ™.
Uwaga: Teraz widać, że jeśli w definicjach h1(T, ) i h2(T, ) w miejsce
lim supn zastosujemy lim infn, to wartości entropii h1(T, ) i h2(T ) nie ulegną
zmianie.
6 Własności entropii topologicznej
PodukÅ‚adem ukÅ‚adu (X, T ) nazywamy ddowlny podzbiór domkniÄ™ty Y ‚" X
taki, że T (Y ) ‚" Y (czyli podniezmienniczy). Wtedy (Y, T ) (formalnie powinno
się pisać T |Y ) jest układem dynamicznym. Z kolei faktorem (topologicznym)
układu (X, T ) nazywamy dowolny inny układ (Y, S) jeśli istnieje odwzorowanie
faktorujące ciągłe z X na Y (defnicja odwzorowania faktorującego jest taka
sama jak w przypadku teorio-miarowym).
8
Fakt 6.2.1, 6.2.2 Entropia podukładu i entropia faktora są nie większe
od entropii danego układu.
Dowód: Maksymalny zbiór (n, )-rodzielony w podukładzie jest (n, )-rodzie-
lony w całym układzie (być może tu już nie jest maksymalny). Przeciwobraz
pokrycia optymalnego w faktorze jest pokryciem optymalnym w rozszerzeniu i
ma tę samą liczność (bo odwzorowanie faktorujące jest surjekcją). Supremum w
definicji entropii w rozszerzeniu uwzględnia między innymi pokrycia podniesione
z faktora (ale nie tylko te). To już implikuje żądaną nierówność.
Fakt 6.2.3
n
h(T ) = |n|h(T ).
Dowód przebiega identycznie jak dla entropii miarowej.
Fakt 6.2.4
h(T, Un) = h(T, U).
Dowód. Co prawda nie zachodzi równość pokryć (Un)m i Un+m, ale pokrycia
te majÄ… tÄ… samÄ… liczbÄ™ N(·) (na tego samego powodu, co N(U (" U) = N(U)).
Tak więc dzieląc ich logarytm przez m i przechodząc z m do nieskończoności
otrzymamy tÄ… samÄ… granicÄ™ co dla Um.
Wniosek (Analog tw. Kołmogorowa Sinaja): Jeśli U jest generatorem topo-
logicznym (tzn. ciÄ…g Un jest rozdrabniajÄ…cy), to h(T ) = h(T, U).
7 Miary niezmiennicze
Twierdzenie (Bogolubov Kryłow 1937) W każdym topologicznym ukła-
dzie dynamicznym (X, T ) istnieje przynajmniej jedna (borelowska probabili-
-1
styczna) miara T -niezmiennicza (tzn., taka że µ(T (A)) = µ(A) dla każdego
zbioru borelowskiego A).
Dowód: Z twierdzenia Riesza możemy traktować miary probabilistyczne jako
funkcjonały nieujemne unormowane na C(X). Z twierdzenia Banacha-Alaoglu,
zbiór miar probabilistycznych P(X) jest zwarty w *-słabej topologii. Jest on
również wypukły, a T działający na miarach przeprowadza P(X) w siebie i jest
w tej topologii ciÄ…gÅ‚y. Wybieramy dowolnÄ… miarÄ™ ½ " P(X) i patrzymy na ciÄ…g
średnich
n-1

1
i
µn = T ½.
n
i=0
Są to elementy P(X). Zauważmy, że
n
½ T ½ 2
µn - T µn) = + ,
n n n
Niech µ bÄ™dzie dowolnym punktem skupienia (w *-sÅ‚abej topologii) ciÄ…gu µn.
Ze zwartości P(X), taka miara probabilistyczna istnieje. Wtedy, dla dowolnej
9
1
unormowanej funkcji f " C(X) i dowolnego > 0 istnieje n > , takie że

| f dµ - f dµn| < oraz | f ć% T dµ - f ć% T dµn| < . Przypomnijmy też,
jak działa operator T na miarach:

f dT µ = f ć% T dµ.
Zatem, mamy




f dµ - f dT µ





f dµ - f dµn + f dµn - f dT µn + f dT µn - f dT µ

2
+ f · µn - T µn + 2 + < 4 .
n

Ponieważ jest dowolny, wykazaliÅ›my, że f dµ - f dT µ = 0. To oznacza, że
µ - T µ jest funkcjonaÅ‚em zerowym na C(X), co implikuje, że jest to po prostu
miara zerowa, zatem µ = T µ, czyli wskazaliÅ›my miarÄ™ T -niezmienniczÄ….
Zbiór miar niezmienniczych będziemy oznaczać przez PT (X). Jest on rów-
nież wypukły i *-słabo zwarty (i oczywiście niepusty). Metrykę w tym zbiorze
(równoważną z *-słabą topologią) można zadać w następujący sposób. Trzeba
wybrać i ustalić ciąg funkcji unormowanych (fn)n 1 o tej własności, że zbiór
k
{fn ć% T : n 1, k 0} jest liniowo gęsty w C(X). Następnie ustalić ciąg
sumowalny liczb dodatnich (cn)n 1. I wtedy możemy położyć


"


d"(µ, ½) = cn fn dµ - fn d½ .

n=1
De facto warunek sumowalności można osłabić. Wystaczy, żeby szereg funkcyjny

cn|fn| był zbieżny punktowo i wspólnie ograniczony. Szczegóły uzasadnienia
n
tego stwierdzenia pominiemy.
Uwaga: Jeśli Ą : (X, T ) (Y, S) jest  odwzorowaniem faktorującym mię-
dzy topologicznymi układami dynamicznymi (czyli ciągłą surjekcją z X na Y
spełniającą Ą ć% T = S ć% Ą, to odwzorowanie indukowane na miarach (również
oznaczmy je przez Ä„ i przypomnijmy, że (Ä„µ)(A) = µ(Ä„-1(A)) dla zbioru A
borelowskiego w Y ) jest ciągłą afiniczną surjekcją z PT (X) na PS(Y ).
Dowód: Niech µ " PT (X). Wezmy zbiór A borelowski w Y . Mamy
-1
S(Ä„µ)(A) = µ(Ä„-1S-1(A)) = µ(T Ä„-1(A)) = µ(Ä„-1(A)) = (Ä„µ)(A),
czyli Ä„µ jest S-niezmiennicza. CiÄ…gÅ‚ość w *-sÅ‚abych topologiach: Niech µn zbie-
gajÄ… sÅ‚abo do µ. Wtedy dla dowolnej f " C(Y ) mamy

f d(Ä„µn) = f ć% Ä„ dµn f ć% Ä„ dµ = f d(Ä„µ).
10
Afiniczność jest oczywista. Nietrywialna jest tylko surjektywność. Niech ½ "
PS(Y ). Istnieje miara (niekoniecznie niezmiennicza) µ " P(X), taka że Ä„µ = ½.
Wynika to wprost z twierdzenia Hahna Banacha o przedÅ‚użaniu funkcjonaÅ‚u: ½
zadaje na podprzestrzeni {f ć% Ä„ : f " C(Y )} ‚" C(X) funkcjonaÅ‚ F½(f ć% Ä„) =

f d½. Ten funkcjonaÅ‚ po przedÅ‚użeniu do miary nieujemnej unormowanej na
C(X) bÄ™dzie szukanÄ… miarÄ… µ. Teraz postÄ™pujemy tak, jak w dowodzie twierdze-
n-1 i
1
nia Bogolubova KryÅ‚owa; Å›rednie µn = T µ majÄ… punkt skupienia µ0
n i=0
bÄ™dÄ…cy miarÄ… niezmienniczÄ…. Ponieważ Ä„µ jest miarÄ… S-niezmienniczÄ… ½, wiÄ™c
n-1 n-1 n-1 n-1

1 1 1 1
i
Ä„µn = Ä„T µ = SiÄ„µ = Si½ = ½ = ½
n n n n
i=0 i=0 i=0 i=0
(dla każdego n), a z ciÄ…gÅ‚oÅ›ci Ä„ na miarach, również Ä„µ0 = ½, co koÅ„czy dowód.
JeÅ›li µ jest miarÄ… niezmienniczÄ… w topologicznym ukÅ‚adzie dynamicznym
(X, T ), to otrzymujemy teorio-miarowy ukÅ‚ad dynamiczny (X, Aµ, µ, T ), gdzie
Aµ jest sigma-ciaÅ‚em zbiorów borelowskich uzupeÅ‚nionym wzglÄ™dem miary µ
(uzupełnienie stosujemy tylko po to, żeby otrzymać standardową przestrzeń pro-
babilistycznÄ…). UkÅ‚ad ten posiada swojÄ… entropiÄ™ KoÅ‚mogorowa Sinaja h(µ, T ).
Pamiętajmy, że na ogół układ topologiczny może posiadać wiele miar niezmien-
niczych. Związek pomiędzy entropią topologiczną układu, a entropiami Kołmo-
gorowa Sinaja jego miar niezmienniczych ustala poniższe twierdzenie, uważane
za jedno z kluczowych (obok twierdzenia Shannona McMillana Breimana) w
teorii entropii układów dynamicznych.
Twierdzenie (Zasada wariacyjna)
h(T ) = sup{h(µ, T ) : µ " PT (X)}.
Dowód podamy w kolejnych rozdziałach, ale ograniczymy się do przypadku,
gdy X jest przestrzeniÄ… zero-wymiarowÄ….
8 Dynamika i miary niezmiennicze w wymiarze
zero
Aby zrozumieć dynamikę w przestrzenich zero-wymiarowych trzeba przede
wszystkim zrozumieć dynamikę symboliczną.
Definicja Układem symbolicznym nazwiemy dowolny układ (X, T ), gdzie
0
X ‚" ›N jest domkniÄ™tym zbiorem podniezmienniczym na transformacjÄ™  prze-
suniÄ™cie (ang. shift) Ã((xn)n"N ) = (xn+1)n"N , › jest zbiorem skoÅ„czonym
0 0
(zwanym alfabetem), a T jest właśnie tą transformacją (obciętą do X).
Powyżej, w zbiór › traktujemy jako przestrzeÅ„ dyskretnÄ… (jest ona zwarta),
0
a w ›N stosujemy topolgiÄ™ produktowÄ… (która, na mocy tw Tichonowa, też jest
zwarta).
11
0
Zauważmy, że w tzw. peÅ‚nym ukÅ‚adzie symbolicznym (w którym X› = ›N )
rozbicie na cylindry nad współrzÄ™dnÄ… zerowÄ… {[a] : a " ›} (które również ozna-
czymy przez ›) jest rozbiciem na zbiory otwarto-domkniÄ™te, w szczególnoÅ›ci jest
to więc pokrycie otwarte. Pokrycie to jest generatorem topologicznym. Jeśli teraz
ograniczymy się do podukładu X (a więc dowolnego układu symbolicznego), to
rozbicie ›|X (› zrelatywizowane do X  dalszej części bÄ™dziemy pomijać pisanie
 |X ) jest nadal jego rozbiciem. To samo dotyczy (zrelatywizowanych) pokryć
›n. Zatem każde z takich pokryć ma jedyne podpokrycie optymalne otrzymane
poprzez odrzucenie zbiorów pustych. Czyli parametr N(›n) (na X) liczy ile
cylindrów z ›n kroi siÄ™ niepusto z X. Dlatego wprowadzimy oznaczenie
›n(X) = {B " ›n : [B] )" X = "}.

Interpretacja tego zbioru jest taka, że sÄ… to bloki dÅ‚ugoÅ›ci n nad alfabetem ›
które występują w X (wystarczy aby wystąpił on w co najmniej jednym elemen-
cie (xn)n"N " X na jakiejkowliek pozycji  wtedy stosujÄ…c wielokrotnie  shift
0
zobaczymy go w jakimś elemencie X na pozycjach od zera do n-1, czyli właśnie
[B] )" X = "). Jak już powiedzieliÅ›my, zbiór ›n(X) stanowi optymalne podpo-

krycie X pokrycia ›n, a ponieważ › jest generatorem topologicznym (również
w X), więc mamy poniższy niezwykle prosty wzór na entropię topologiczną:
1
h(X, T ) = h(X, T, ›) = lim log #›n(X).
n
n
Podobnie, jeÅ›li ustalimy dowolnÄ… miarÄ™ niezmienniczÄ… µ " PT (X), to miara ta
jest również miarÄ… niezmienniczÄ… peÅ‚nego ukÅ‚adu symbolicznego (X›, Ã), i ›
traktowana teraz jako rozbicie mierzalne jest generatorem (teorio-miarowym).
Zatem mamy wzór
h(µ, T ) = h(µ, Ã) = h(µ, Ã, ›).
Tak więc licząc entropię czy to topologiczną, czy to Kołmogorowa Sinaja jakiejś
miary niezmienniczej, wystarczy patrzeć na  pokrycio-rozbicie ›.
Jeśli teraz mamy dowolny układ zero-wymiarowy, to co prawda nie musi on
być układem symbolicznym (do tegu musiałby jeszcze być on ekspanywny), ale
zawsze istnieje w nim ciąg rozbić (pokryć) otwarto-domkniętych, które łącznie
generują zarówno topologię jak i sigma-ciało zbiorów borelowskich. Aby odróżnić
te rozbicia od zwykÅ‚ych rozbić (które sÄ… tylko mierzalne) oznaczymy je przez ›k.
Każde takie rozbicie generuje proces, a zarazem układ symboliczny, w którym
›k staje siÄ™ alfabetem. Przez ›k(X) oznaczymy, jak poprzednio, zbiór bloków,
które wstępują w tym układzie symbolicznym. Mamy wtedy podobne wzory na
entropie, jak dla układów symbolicznych, z tym tylko, że we wzorach pojawi się
rozsnÄ…ca granica po k:
1
h(X, T ) = lim Ä™! h(X, T, ›k) = lim Ä™! lim log #›n(X),
k
n
n
k k
oraz, dla każdej miary niezmienniczej µ na X,
h(µ, T ) = lim Ä™! h(µ, T, ›k).
k
12
Przyjrzyjmy się jeszcze miarom niezmienniczym w układzie symbolicznym.
Ponieważ są to miary niezmiennicze również w pełnym układzie symbolicznym
0
nad danym alfabetem, można od razu zaÅ‚ożyć, że patrzymy na ukÅ‚ad (›N , Ã).
Każda miara niezmiennicza przypisuje wartości cylindrom nad blokami skończo-
nymi i wartości te nie zależą od miejsca zaczepienia cylindra. Zatem miara jest
zdeterminowana poprzez swoje wartości na cylindrach zaczeopinych na współ-
rzędenej zerowej. Zgodnie z konwencją, zbiór takich cylindrów długości n bę-
dziemy po prostu oznaczać przez ›n. TopologiÄ™ *-sÅ‚abÄ… w zbiorze miar nie-
zmienniczych układu symbolicznego można zmetryzować przy pomocy takiej
oto metryki:

d"(µ, ½) = lim |µ(B) - ½(B)|
n
B"›n
(granica istnieje, gdyż powyższy ciąg jest ograniczony przez 2 i nietrudno prze-
konać się, że jest niemalejący). Wynika z tego następująca interpretacja bliskości
miar: dwie miary µ i ½ sÄ…  blisko jeÅ›li wszystkim dostatecznie dÅ‚ugim cylindrom
nadają podobne wartości:
n
" >0 "n,´ ("B"› |µ(B) - ½(B)| < ´) =Ò! d"(µ, ½) <
oraz
n
" >0 "n,´ d"(µ, ½) < =Ò! ("B"› |µ(B) - ½(B)| < ´)
(jednak dobór n i ´ do może być w obu przypadkach inny, dlatego nie piszemy
jednego zdania logicznego z równoważnością).
Udowodnimy teraz następujący prosty fakt
Fakt 7.2.4 Funkcja entropii KoÅ‚mogorowa Sinaja µ h(µ, Ã) jest gór-
nie półciągła w topolgii *-słabej na zbiorze wszystkich miar niezmienniczych
0
peÅ‚nego ukÅ‚adu symbolicznego (›N , Ã).
Dowód: Mamy

1
h(µ, Ã) = h(µ, Ã, ›) = lim “! ·(µ(B)).
n
n
B"›n
Dla każdego cylindra B funkcja µ µ(B) jest ciÄ…gÅ‚a (gdyż 1B jest ciÄ…gÅ‚a jako
funkcja charakterystyczna zbioru otwarto-domkniÄ™tego, a µ(B) to caÅ‚ka z tej
funkcji). Funkcja · jest ciÄ…gÅ‚a. Dalej mamy sumÄ™ skoÅ„czonÄ… i dzielenie przez
stałą. Zatem mamy tu granicę malejącą ciągu funkcji ciągłych, a to jest funckja
górnie półciągła.
9 Zasada wariacyjna w wymiarze zero
Podamy teraz dowód zasady wariacyjnej w układach zero-wymiarowych. Do-
wód w przypadku ogólnym jest o wiele bardziej skomplikowany. Istnieje też
13
sposób aby twierdzenie to uogólnić z przypadku zero-wymiarowego na dowolny,
jednak on również wymaga skomplikowanej konstrukcji tzw. zero-wymiarowych
rozszerzeń pryncypialnych. Dlatego w ramach tego kursu ograniczymy się do
przypadku zero-wymiarowego.
Główna część dowodu dotyczy układów symbolicznych.
Dowód zasady wariacyjnej dla układów symbolicznych: Dowód nierówności
w jedną stronę jest natychmiastowy. Mamy pokazać, że entropia Kołmogorowa
Sinaja dowolnej miary niezmienniczej µ w ukÅ‚adzie symbolicznym (X, Ã) nad
alfabetem › jest nie wiÄ™ksza od jego entropii topologicznej. Mamy
1
h(µ, T ) = h(µ, Ã, ›) = lim H(µ, ›n).
n
n
Ponieważ miara µ jest niesiona przez X (dopeÅ‚nienie X ma miarÄ™ zero), wiÄ™c
H(µ, ›n) = H(µ, ›n(X)) log #›n(X), a co za tym idzie,
1
h(µ, T ) lim log #›n(X) = h(X, T ).
n
n
Dowód w drugÄ… stronÄ™ jest nieco trudniejszy. Skonstruujemy miarÄ™ µ, takÄ…
że h(µ, T ) = h(X, T ) (czyli miarÄ™ o maksymalnej entropii). Ustalmy n i niech
Xn oznacza zbiór wszystkich ciągów uzyskanych jako nieskończone konkatenacje
bloków z ›n(X), z których pierwszy jest zaczepiony na współrzÄ™dnej zerowej.
OczywiÅ›cie X ‚" Xn. Jak Å‚atwo widać, zbiór Xn jest niezmienniczy pod dzia-
Å‚aniem Ãn w sensie równoÅ›ci Ãn(Xn) = Xn natomiast pod dziaÅ‚aniem à mamy
taki oto cykl ciÄ…g surjekcji
Xn Ã(Xn) Ã2(Xn) · · · Ãn-1(Xn) Xn.
Zatem każda z przestrzeni Ãi(Xn) jest Ãn-niezmiennicza.
Na Xn mamy specjalnÄ… miarÄ™ Ãn-niezmienniczÄ…, mianowicie miarÄ™ Berno-
ulliego µ(0), która wszystkim blokom B " ›n(X) przypisuje równe wartoÅ›ci
n
(#›n(X))-1 (a konkatenacjom m takich bloków wartość (#›n(X))-m). Za-
uważmy, że takie konkatenacje to właśnie połączenie m kolejnych przeciwobra-
zów przez Ãn rozbicia ›n, co możemy zapisać jako (›n)m (tutaj pierwszy wy-
kÅ‚adnik  n  odnosi siÄ™ do dziaÅ‚ania à a drugi  m  do dziaÅ‚ania Ãn). Entropia
tego rozbicia dla tej miary wynosi zatem
H(µ(0), (›n)m) = log(#›n(X))m = m log #›n(X),
n
a entropia dynamiczna
1
h(µ(0), Ãn, ›n) = lim m log #›n(X) = log #›n(X).
n
m
m
Miara µ(0) jest przenoszona przez kolejne iteracje Ãi (i = 1, 2, . . . , n-1) na miary
Ãn-niezmiennicze µ(i) niesione przez zbiory Ãi(Xn), a nastÄ™pnie po n iteracjach
wraca jako µ(0) na Xn. Zatem każda z miar µ(i) (i = 0, . . . , n - 1) jest faktorem
14
teorio-miarowym każdej innej z tych miar (miary te są słabo izomorficzne). To
wystarcza, aby stwierdzić, że majÄ… one jednakowe entropie (pod dziaÅ‚aniem Ãn).
Miara µn zdefiniowana jako ich Å›rednia
n-1

1
µn = µ(i)
n
n
i=0
jest zarówno Ãn-, jak i Ã-niezmiennicza. Jej entropiÄ™ pod dziaÅ‚aniem Ãn wzglÄ™-
dem rozbicia ›n obliczymy z afinicznoÅ›ci entropii dynamicznej
n-1

1
h(µn, Ãn, ›n) = h(µ(i), Ãn, ›n) = h(µ(0), Ãn, ›n) = log #›n(X).
n n
n
i=0
Z kolei do obliczenia entropii miary µn pod dziaÅ‚aniem à wzglÄ™dem › zastosu-
jemy zasadę potęgową:
1 1
h(µn, Ã, ›) = h(µn, Ãn, ›n) = log #›n(X).
n n
Ponieważ › jest generatorem, to jest to samo, co entropia KoÅ‚mogorowa Sinaja
h(µn, Ã). Niech µ oznacza dowlny punkt skupienia ciÄ…gu µn (w zwartym zbio-
rze miar Ã-niezmienniczych peÅ‚nego ukladu symbolicznego nad alfabetem ›. Z
górnej półciągłości funkcji entropii w układzie symbolicznym wynika, że
1
h(µ, Ã) lim inf h(µn, Ã) = lim log #›n(X) = h(X, T ).
n
n n
JeÅ›li wykażemy, że mira µ jest niesiona przez X, to bÄ™dzie to koniec dowodu.
Trzeba wiÄ™c pokazać, że dopeÅ‚nienie X ma miarÄ™ µ zero. DopeÅ‚nienie to, jako
zbiór otwarty w przestrzeni ośrodkowej, jest przeliczalną sumą zbiorów bazo-
wych, czyli cylindrów otwarto-domkniętych. Wystarczy więc pokazać, że miara
dowolnego cylindra C (dowolnej długości m) rozłącznego z X, czyli (jako blok)
nie wystÄ™pujÄ…cego w X (a wiÄ™c nie należącego do ›m(X)) jest zero. Ponieważ
miara zbioru otwarto-domkniętego jest ciągłą funkcją miary, wystarczy poka-
zać, że µn(C) 0 po n, czyli, że µn(C) jest maÅ‚e dla dużego n. Pokażemy o
wiele wiÄ™cej, że ½(C) jest maÅ‚e dla dowolnej miary ½ niesionej przez zbiór Ã-

niezmienniczy Xn = Xn *" Ã(Xn) *" · · · *" Ãn-1(Xn). Wystarczy to pokazać dla
miar ergodycznych, gdyż w każdym układzie topologicznym każda miara nie-
zmiennicza jest granicÄ… kombinacji liniowych miar ergodycznych (to wynika z
twierdzenia Kreina Milmana i tego, że miary ergodyczne, to to samo co punkty
ekstremalne zbioru miar niezmienniczych). Zatem niech ½ oznacza miarÄ™ ergo-

dycznÄ… na Xn. Do oszacowania liczby ½(C) skorzystamy z twierdzenia ergo-

dycznego. Ponieważ Xn jest podzbiorem Xn miary dodatniej, istnieje x " Xn
speÅ‚niajÄ…cy tezÄ™ twierdzenia ergodycznego dla miary µn i zbioru C, tzn. taki,
że ½(C) jest równe Å›redniej czÄ™stoÅ›ci odwiedzin orbity punktu x w cylindrze
C. Ale ta częstość, to to samo co częstość, z jaką blok C występuje w ciągu
symbolicznym, jakim jest x. Ponieważ C nie należy do ›n(X), nie może on
wystÄ™pować w żadnym bloku z rodziny ›m(X), a skoro x jest konkatenacjÄ…
15
takich bloków, to C może występować tylko na  złączeniach bloków z rodziny
›m(X), czyli pozycjach zaczepionych w miejscach poprzedzajÄ…cych takie zÅ‚Ä…cze-
nia (które występują okresowo co n) o co najwyżej m. To oznacza, że częstość
m
jego występowania nie przekracza , co jest, (przy ustalonym m i dowolnie
n
dużym n) liczbą małą. To kończy cały dowód.
Instytut Matematyki i Informatyki, Politechnika Wrocławska
Wybrzeże Wyspiańskiego 27, 50-370 Wrocław
e-mail: downar@pwr.wroc.pl
16


Wyszukiwarka

Podobne podstrony:
DYNAMIKA II
Mechanika zestaw 10 Dynamika II
Euroatraktor 03 Lozinski o Losowych Układach Dynamicznych p4
Uklady Dynamiczne Zad ser II p1
Mechanika Techniczna I Skrypt 1 7 1 Przedmiot dynamiki
dynamika budowli skrypt PG
101 praktycznych skryptow na strone WWW Wydanie II
09 Linux Skrypty powłoki część II
078 Pomocnik dynamika układow I i II rzedu a położenie biegunowidq68
PHP i MySQL Dynamiczne strony WWW Szybki start Wydanie II

więcej podobnych podstron