NowoczesneMetodySterowania UkładyRegulacjiZeSprzężeniemOdZmiennychStanu

Materiały pomocnicze do ćwiczeń
z Nowoczesnych metod sterowania
część 3: Układy regulacji ze sprzężeniem od zmiennych
stanu.
ĆW.7. Dobór sprzężeń od zmiennych stanu. LQR regulator.
ĆW.8. Regulacja LQG z modelem zaklóceń stochastycznych.
Jan Leszczyński
Katedra Automatyki i Elektroniki
Politechnika Bialostocka.
BIAAYSTOK, 2001
2
ĆW.7. Dobór sprzężeń od zmiennych stanu. LQR regulator.
W trakcie projektowania i badań symulacyjnych sygnalizowane są podstawowe problemy
związane z syntezą obserwatora i regulatora w układach sterowania ze sprzężeniem zwrotnym
od zmiennych stanu. Przedmiotem zainteresowania jest zarówno problematyka syntezy zo-
rientowanej na położenie wartości własnych układu wynikowego, jak i syntezy zorientowanej
na optymalizację kwadratowego wskaznika jakości procesu przejściowego.
Przeprowadzane są m.in. badania związku między rezultatami optymalnej syntezy obwodu
regulacji a relacjami między współczynnikami wagowymi w stosowanym przy tym kwadrato-
wym wskazniku jakości.
PRZED ĆWICZENIEM:
1. Należy rozszerzyć zakres znajomości specjalizowanych m-funkcji bloku programowego
dla lub
dla w wersji 5.3) pakietu Control ukierunkowanego tematycznie na proble-
my ciąglej i dyskretnej LQR regulacji i powtórzyć materiał teoretyczny na temat opisu
wlasności obiektu dynamicznego przy pomocy zmiennych stanu.
Pytania kontrolne:
Jakie obliczenia możemy zrealizować przy pomocy m-funkcji:
? Jakie argumenty wejściowego wymagane są do działania każdej z nich?
Czy istnieje w ramach pakietu możliwość bezpośredniego rozwiązania rów-
nania Riccatiego?
W jaki sposób możemy najprościej zamodelować w Simulinku obiekt dynamiczny
o zadanych równaniach stanu i macierz współczynników wzmocnień regulatora?
Jaką postać przyjmują równania stanu i równania wyjścia obiektu liniowego? Jakie ce-
chy posiada macierz stanu przy zastosowaniu fazowego układu zmiennych stanu?
W jaki sposób można przejść z opisu ciągłego obiektu dynamicznego w konwencji zmien-
nych stanu na opis dyskretny w tejże konwencji?
2. Należy także powtórzyć (ukierunkowując powtórzenie przy pomocy zestawień A, B i C)
glówne, znane z wykladu, metody syntezy regulatora ze sprzężeniem od zmiennych stanu
3
i problematykę syntezy obserwatora Leunbergera. Kluczowym tematem jest tu problem
syntezy regulatorów kwadratowo optymalnych LQR (ang. Linear Quadratic Regulator).
W ramach tego powtórzenia warto jest sięgnąć do wykladów lub podręczników z Teorii
sterowania w celu przypomnienia, na tle metody programowania dynamicznego Bellmana
i zasady maksimum Pontriagina, podstaw optymalizacji dynamicznej.
Pytania kontrolne:
Jakie analogie występują w metodyce rozwiązania zadań syntez regulatora i obserwatora
w układzie regulacji ze sprzężeniami od zmiennych stanu?.
W jaki sposób proces syntezy regulatora i obserwatora w układzie sterowania został
rozwiązany przez Ackermana.
Jakie cechy posiadają macierze określające formy kwadratowe ze wskaznika jako-
ści regulacji? W jaki sposób możemy zinterpretować elementy diagonalne tych macierzy?
Jakie wskazniki jakości są zwykle stosowane w zadaniach optymalizacji dynamicznej?
Wymień główne właściwości układów regulacji z regulatorem LQR.
METODYKA BADAC I PROGRAMOWANIE:
Model obiektu sterowania jest, podobnie jak w poprzednich ćwiczeniach, ustalany za
pośrednictwem jego transmitancji Laplace a. Model ten należy przeksztalcić do modelu dys-
kretnego dynamiki ze zmiennymi stanu w ukladzie fazowym. Możemy skorzystać przy tym
z możliwości automatycznych transformacji ujętych w pakiecie Control Matlaba, lub
poslużyć się programem analogicznym do stosowanego w ćwiczeniach poprzednich.
Syntezę obserwatora i regulatora ustalającego polożenie biegunów wynikowego
ukladu regulacji w wyniku zastosowania sprzężeń zwrotnych od zmiennych stanu przeprowa-
dzamy przy pomocy przedstawionej niżej m-funkcji . Zaprogramowano ją przy zasto-
sowaniu przedstawionych w zestawieniu A wzorów obliczeniowych Ackermana. Jest to,
wśród metod syntezy ukierunkowanych na polożenie biegunów ukladu regulacji, metoda naj-
prościej realizowalna. Posiada ona jednak pewne wady (nie jest stabilna numerycznie) przy
rozwiązywaniu zadań znacznej wymiarowości.
4
Uzyskiwany program wydaje się być na tyle prostym, że nie wymaga szerszych komenta-
rzy. Wyraznie widoczny jest podzial na dwie odrębne części , związane z syntezą regulatora
i obserwatora. Sprawdzane są warunki sterowalności i obserwowalności obiektu sterowania.
Syntezę regulatora LQR (i optymalnego estymatora stanu) minimalizującego kwadra-
towy wskaznik jakości w zadaniu skokowego przestawienia wartości zmiennej regulowanej
możemy przeprowadzić poslugując się bezpośrednio jedną ze standartowych m-funkcji.
umieszczonych w pakiecie Control Matlaba:
Wspólczynniki wzmocnień regulatora K i macierz P rozwiązania równania Riccati ego
możemy wyliczyć automatycznie stosując [K,P]= lqr(A, B, Q, R); .
Instrukcja: [K,P,E]= dlqr(A, B, Q, R); rozwiązuje LQ problem w postaci
dyskretnej, a macierz E podaje jednocześnie wartości wlasne wynikowej macierzy stanu
i[ALQ].
W programie m-funkcji: lqr2(A, B, Q, R) zawarto numerycznie sprawniejszą
wersję algorytmu (metoda Schura) rozwiązania równania Riccati ego.
5
Przy pomocy: [K,P,E]= lqry(A, B, C, D, Q, R); , a także jej odpowiedni-
ka w wersji dyskretnej: [K,P,E]= dlqry(A, B, C, D, Q, R); możemy roz-
wiązać zadanie optymalnej syntezy regulatora zorientowanej na wskaznik kwadratowy
w którym formę kwadratową zmiennych stanu: f(x)=xT Q x, zastąpiono formą kwa-
dratową wyjść obiektu regulowanego f(y)= yT Q y. Macierze C,D pochodzą tu
z równania wyjścia obiektu: y= Cx + Du.
Należy podkreślić, że zakres dzialań ujmowany w ramach syntezy na podstawie wskaz-
ników kwadratowych różni się w poszczególnych wersjach Matlaba. Równolegle do pro-
blematyki syntezy LQR regulatorów rozwiązano tu równoważne, dualne problemy syntezy
estymatorów zmiennych stanu. W ramach pakietu Control umieszczono także m-funkcje
znajdujące rozwiązanie równań macierzowych Lapunowa i Riccartiego w wersjach ciąglej
i dyskretnej (o nazwach odpowiednio: lyap i dlyap , a także: care i dare ).
Rozwiązanie równania Riccartiego stanowi, jak wiadomo, podstawę syntezy liniowych ukla-
dów dynamicznych przy kwadratowych wskaznikach jakości.
Ocenę jakości uzyskiwanych i modelowanych w trakcie ćwiczenia ukladów regulacji
przeprowadzamy różnymi sposobami (np. zapas jego stabilności ukladu możemy oszacować
przy pomocy charakterystyk Bode a, lub polożeniem pary biegunów dominujących ukladu).
Istotną rolę w ocenie jakości mogą odegrać także wskazniki calkowe ITEA i CE. Rzeczą po-
żądaną jest zaprogramowanie, na tle pakietu Control,sekwencji automatycznie realizowa-
nych obliczeń związanych z określeniem tych wlasności. Przyklad fragmentu m-funkcji tego
typu o nazwie analizaur (tj. ANALIZA Ukladu Regulacji) przytoczono poniżej.
funktion [zstab,bdom,wsprz]= analizaur (A, B, C, K);
6
Badania obliczeniowe. W trakcie badań obliczeniowych projektujemy kolejne, kwadra-
towo - optymalizowane uklady regulacji (LQR) stosując określoną strategię zmian relacji
między wspólczynnikami wagowymi polożonymi diagonalnie w macierzach Q i R. W roli
przykladu przedstawimy program (w postaci m-pliku ), przy pomocy którego mo-
żemy zbadać zależność podstawowych wlasności ukladu z regulatorem LQR od wagi kwa-
dratu sterowania we wskazniku jakości.
w zale" no" ci
% od wagi kwadratu sterowania w wska" niku jako" ci.
analizaur
[zstab , bdom , wsprz ]= (A, B, C, K);
end
Zadania modelowania w Simulinku w ramach danego ćwiczenia odzwierciedla
przedstawiony na rys.1 model ukladu z regulatorem LQR. Warto zwrócić tu uwagę na sposób
rozdzielenia przy pomocy demultipleksera sygnalu wyjściowego i (z zalożenia)
mierzonych zmiennych stanu obiektu sterowania.
7
1
Rys. 1. Jedna z wersji modelowania ukladu regulacji ze sprzężeniem od zmiennych stanu w .
PROGRAM ĆW.7
1. Należy zamodelować w Simulinkuzadany obiekt dynamiczny SISO z zaprojektowanym
regulatorem i obserwatorem a następnie sprawdzić, startując z różnych wartości początko-
wych i przy zastosowaniu różnych oddzialywań zewnętrznych, poprawność jego dzialania.
Przy projektowaniu, w wyniku zastosowania wzorów Ackermana, ustalamy polożenie bie-
gunów wynikowego ukladu regulacji.
Wynik symulacji należy przekazać w formie charakterystycznych przebiegów przejściowych
zmiennych stanu sterowanego obiektu i obserwatora zmiennych stanu.
2. Należy przeprowadzić program badań ukierunkowany na zbadanie polożenia biegunów
wynikowego ukladu regulacji z regulatorem LQR od elementów diagonalnych w macie-
rzach Q, R kwadratowego wskaznika jakości.
Wskazówki. Badania prowadzimy na przykladzie zadania sterowania przy zastosowaniu re-
gulatora LQR astatycznym obiektem trzeciego rzędu, np. o transmitancji:
Konstruujemy przy tym sieć dzialań wg idei zawarte w programie obliczeń :
8
A. Generujemy wyjściową macierz Q i wspólczynnik R.
B. Konstruujemy instrukcję cyklu z regularną zmianą określonego elementu w macierzy Q
pamiętając o tym, że z zalożenia jest to macierz symetryczna. Inne elementy są przy tym
ustalone.
C. Sprawdzamy za każdym obiegiem, po wygenerowaniu wspólczynników sprzężeń LQR
polożenie biegunów wynikowego ukladu regulacji. Polożenie to zapamiętujemy w macie-
rzy wynikowej.
D. Po zakończeniu cyklu wynik przedstawiamy graficznie. Uzyskujemy przy tym rezultat
o charakterze zbliżonym do linii pierwiastkowych.
Element jest w trakcie obliczeń elementem stalym. Z zadaniem roz-
wiązywanym w ramach przedstawionego wcześniej powinna być związana
pierwsza faza obliczeń. Następnie po wyborze i ustaleniu zmieniamy stopniowo, sko-
kami element Po wyborze i ustaleniu zmieniamy z kolei skokowo
element odnotowując także związany z tych charakter przesunięć biegunów
ukladu.
Dodatkowo możemy odnotowywać inne informacje na temat uzyskiwanych ukladów re-
gulacji, np.
poziom wspólczynników sprzężeń w macierzy wzmocnień regulatora (mierzony
np. za pośrednictwem normy odpowiedniego wektora) ;
poziom (znanych z poprzednich ćwiczeń) wskazników ITEA i CE uzyskiwanych
w trakcie symulacji odpowiedzi ukladu na skok jednostkowy.
Wyniki badań przedstawiamy w formie tabelarycznej i graficznie.
Czy w trakcie realizacji badań, patrząc przez pryzmat tych wskazników, zdarza się uzy-
skać układy sterowania o własnościach zdominowanych przez inne?
3. Należy ocenić odporność jednego z ukladów regulacji, wybranego spośród uzyskiwanych
w trakcie poprzednich badań w ćwiczeniu, na +25% zmiany stalych czasowych sterowa-
nego obiektu. Na ile pogorszyć się mogą przy tym wskazniki jakości (mierzone np. przy
pomocy m-funkcji analizaur ) układu regulacji?
9
SPRAWOZDANIE POWINNO ZAWIERAĆ zwięzle i czytelnie przekazane wyniki prze-
prowadzonych badań. Glówne tematy (samodzielnie sformulowanych!) uwag i komentarzy
ujęto w przedstawionych niżej pytaniach.
Y
Y Jak zależy norma modułu wektora wzmocnień regulatora od lokalizacji biegunów układu
regulacji. Jakie wnioski praktyczne wynikają z tej zależności?
Y
Y W jaki sposób na główne własności układu z regulatorem LQR wpływa wartość współ-
czynnika wagowego formy kwadratowej sterowań w kwadratowym wskazniku jakości?
Jak zmienia się przy tym położenie biegunów układu regulacji?
Y
Y Jak, w świetle przeprowadzonych badań, możemy scharakteryzować odporność układu
LQ regulacji na zmiany parametrów obiektu sterowania.
10
ĆW.8. LQG regulacja z modelem zakłóceń stochastycznych.
Przeprowadzane są badania układu regulacji LQG (ang. Linear Quadratic Gaussian). Ste-
rowany obiekt dynamiczny reprezentowany jest tu modelem stanu i modelem oddziaływujących
nań zakłóceń o charakterze gaussowskim. Dopuszcza się przy tym, że pomiary wyjścia mogą być
zniekształcane szumem pomiarowym o znanych charakterystykach probabilistycznych. Rolę ob-
serwatora stanu w tym układzie odgrywa stacjonarny filtr Kalmana. Badanie właściwości tego
filtru jest głównym zadaniem realizowanym w trakcie ćwiczenia. Przeprowadzane są także ba-
dania symulacyjne pozwalające szacować jakościowo skutki niezgodności stosowanych modeli
z rzeczywistością.
PRZED ĆWICZENIEM:
Należy rozszerzyć zakres znajomości specjalizowanych m-funkcji pakietu programowego
Control w kierunku problematyki estymacji stanu w warunkach stochastycznych. Warto
zapoznać się także ze modelami ukladów sterowania przeznaczonymi do badania LQG regu-
lacji w ramach programów demonstracyjnych Simulinka. Umieszczono je w zestawie
o nazwie LQG demos w ramach biblioteki: . Material teore-
tyczny, który należy powtórzyć przed ćwiczeniem związany jest glównie z podstawowymi
modelami stacjonarnych procesów stochastycznych (funkcja korelacji, gęstość widmowa,
modele parametryczne klasy ARMA) i zadaniem optymalnej filtracji sygnalów. Proces po-
wtarzania ukierunkowujemy treścią zestawień C, D.
Pytania kontrolne:
Jakie obliczenia możemy zrealizować przy pomocy m-funkcji:
? Jakie argumenty wejściowe wymagane są do działania każdej z nich?
Czy istnieje, w ramach , możliwość bezpośredniego zastosowania w mode-
lowanym układzie bloku estymatora Kalmana?
W jaki sposób wyznacza się funkcję autokorelacji dyskretnych stacjonarnych procesów
stochastycznych? Jak utworzyć, korzystając z tej funkcji, macierz autokorelacyjną?
W jakiej sytuacji rozwiązanie optymalnej filtracji minimalnowariancyjnej prowadzi do
filtru stacjonarnego?
11
W jaki sposób można jakościowo określić związek między wariancją zakłóceń pomiaru
wyjścia, a wzmocnieniem filtru optymalnego?
Jakie analogie istnieje między rozwiązaniem zadania znalezienia regulatora LQR, a roz-
wiązaniem zadania optymalnej filtracji ?
METODYKA BADAC I PROGRAMOWANIE:
Model obiektu sterowania jest zbliżony do zastosowanego w ćwiczeniu poprzednim.
Dodatkowym elementem jest wygenerowanie i wprowadzanie zaklóceń i szumów pomiaro-
wych o zadanych wlasnościach.
Syntezę regulatora i obserwatora w ćwiczeniu przeprowadzamy korzystając ze spe-
cjalizowanych m-funkcji zawartych w ramach pakietu Control Matlaba. Problemy
syntezy regulatora w metodyce LQG są adekwatne z poznanym w ćwiczeniu wcześniejszym
regulatorem LQR. W pakiecie Control znajdujemy także szereg m-funkcji związanych
z rozwiązaniem zadania syntezy części ukladu sterowania związanego z nadążną estymacją
stanu obiektu. Np. stosując m-funkcję: lqe(A,G,C,Q,R) (nazwa po-
chodzi od skrótu ang. linear quadratic estimator) możemy automatycznie wyliczyć:
" wektor L wspólczynników wzmocnień filtru Kalmana w wersji ciąglej,
" macierz P rozwiązania równania Riccati ego,
" wartości wlasne E wynikowej macierzy stanu, które są jednocześnie biegunami uzy-
skanego ukladu sterowania).
Argumenty wejściowe danej m-funkcji wynikają z równań stanu i wyjścia obserwowanego
obiektu:
{równanie stanu}
{równanie wyjścia}
a także z charakterystyk zaklóceń i szumów pomiarowych:
Przy rozwiązaniu zadania syntezy filtru Kalmana w wersji dyskretnej analogiczną do
rolę pelni dlqe . Przy pomocy m-funkcji o nazwach: lqe2 , dlqe2 rozwiązujemy te
12
same problemy konstrukcji estymatora stanu przy zastosowaniu jednak bardziej stabilnej
metody numerycznej (algorytm Schura) rozwiązywania równań macierzowych Riccati ego.
Równanie Riccartiego stanowi, jak wiadomo, podstawę syntezy ukladów dynamicznych
optymalnych w sensie wskaznika kwadratowego.
Stosując natomiast m-funkcje o nazwach: lqew , dlqew , rozwiązujemy problem syntezy
stochastycznej wersji estymatora stanu z nieco ogólniejszym, niż poprzedni, modelem wply-
wu zaklóceń:
x[k+1] = Ax[k] + Bu[k] + G v[k];
y[k] = Cx[k] + Du[k] + Hv[k] + w[k];
Zaklócenia oddzialywujące na stan sterowanego obiektu mogą wplywać tu bezpośrednio
również na wielkość wyjściową. Wlasności zaklóceń określane są tu w ten sam sposób, przy
pomocy analogicznych wektorów i macierzy , co poprzednio.
Dodajmy, że po wyznaczeniu macierzy sprzężeń korekcyjnych L otrzymanie macierzy wy-
nikowego modelu ukladu ulatwiają m-funkcje: estim(A,B,C,D,L) i odpowiednio dys-
kretna destim(A,B,C,D,L) . Ulatwiają one programowanie procesu symulacji ukladu
z estymatorem stanu.
Zadania modelowania w Simulinku w ramach danego ćwiczenia odzwierciedla
przedstawiony na rys.2 model ukladu z regulatorem LQG. Zostal on zaczerpnięty z programu
demonstracyjnego na ten temat. Warto zwrócić uwagę na sposób podlączenia sygnalu wej-
ściowego i mierzonych wyjścia obiektu sterowania (typu SISO) do bloku estymatora Kalma-
na, a także na sposób wypracowywania astatyczności ukladu. Sygnal zadany jest tu porów-
nywany z poziomem wielkości regulowanej. Uzyskana różnica (pomiarowy bląd regulacji)
jest calkowana, stanowiąc następnie dodatkową zmienną stanu od której także ksztaltowane
jest sprzężenie zwrotne. Zagwarantowanie asymtotycznej stabilności calego ukladu regulacji
gwarantuje jednocześnie wyzerowanie ustalonego uchybu regulacji.
Do wejść zaklóceń i szumów pomiarowych podlączamy generatory przebiegów
stochastycznych.
.
13
Uklad LQG regulacji
+
+
Rys. 2. Jedna z wersji modelowania ukladu LQG w . W celu wyeliminowania uchybu
w stanie ustalonym wprowadzono tu obw ód z czlonem calkującym.
PROGRAM ĆW.8
1. Należy przeprowadzić badania symulacyjne mające na celu jakościowe i ilościowe porów-
nanie przebiegów zmiennych stanu obiektu dynamicznego x(k) i przebiegów ich ocen
xest(k) w ukladzie obserwatora w obecności zaklóceń o losowym charakterze v(t),
w(t) i przy deterministycznym, okresowym sygnale wejściowym. Stosujemy przy tym
jeden spośród ukladów sterowania ze sprzężeniem od zmiennych stanu z ćwiczenia po-
przedniego, uzupelniając model stanu sterowanego procesu o obecność:
wejścia niesterowalnego oddzialywania v(t) wplywającego bezpośrednio, w na-
stępnym takcie, na poziom zmiennej stanu z najstarszym indeksem;
wejścia w(t)addytywnych zaklóceń sprzężonych z pomiarem wielkości wyjściowej.
W celu wysterowania tych wejść stosujemy generatora przebiegów Wyni-
ki badań przedstawiamy w postaci graficznej ujmującej porównania przebiegów sygnalów
w różnych punktach ukladu sterowania i tabelarycznie ujmując relacje między wariancją
niezgodności stanu: x(k) i wyjścia y(k) z ich oszacowaniami xest(k), yest(k),
a wariancją odzialywujących zaklóceń.
2. Zrealizować analogiczny do poprzedniego program badań symulacyjnych, tym razem jed-
nak dla ukladu regulacji skonstruowanego w metodyce LQG. Jakość sterowania
i estymacji stanu oceniamy porównując odpowiednio wariancje blędów regulacji
14
i wariancje różnic między wielkością regulowaną y(k) z wynikiem estymacji
yest(k).
3. Przeprowadzamy badania obliczeniowe mające na celu określenie zależności polożenia
wartości wlasnych i normy wektora wzmocnień stacjonarnego estymatora Kalmana od po-
ziomu zaklóceń wejściowych v(t) i wyjściowych w(t). Czy rozmieszczenie biegunów
estymatora zależy od poziomu zakłóceń wejściowych v(t) i wyjściowych w(t)? W jaki spo-
sób, jakościowo, możemy scharakteryzować tę zależność? Czy istnieją tu pewne analogie z,
badanym w ćwiczeniu poprzednim, rozmieszczeniem biegunów układu sterowania
z regulatorem LQR przy zmianach wagi sterowania w kwadratowym wskazniku jakości?
Wskazówki. Program badań obliczeniowo symulacyjnych należy konstruować analogicznie
do opisanego w p.2 ćwiczenia poprzedniego. Centralne miejsce w tym programie zajmuje
znalezienie, przy pomocy funkcji standartowych Matlaba dla zadanych macierzy kowa-
riancji szumów i zaklóceń, wektora optymalnych wspólczynników wzmocnień stacjo-
narnego estymatora stanu Kalmana.
4. Należy przeprowadzić badania symulacyjne mające na celu jakościową ocenę odporności
stacjonarnego estymatora stanu Kalmana na niezgodność charakterystyk oddzialywań za-
klócających i szumów z przyjmowanymi w trakcie syntezy zalożeniami. W tym celu
sprawdzamy odporność jednego z ukladów estymatora stanu, stosowanego w trakcie po-
przednich badań w ćwiczeniu, na zmiany wariancji zaklóceń i szumów pomiarowych. ste-
rowanego obiektu. Wspólczynniki wzmocnień stacjonarnego obserwatora pozostawiamy
przy tym bez zmian. Na ile pogarszają się w trakcie zmian wariancji wskazniki jakości es-
tymatora i całego układu regulacji?
SPRAWOZDANIE POWINNO ZAWIERAĆ zwięzle i czytelnie przekazane wyniki,
a także komentarze do przeprowadzonych badań symulacyjnych, m. in.:
Wyrażenie w postaci graficznej zależności normy modułu wektora wzmocnień w filtrze
Kalmana od poziomu wariancji addytywnych zakłóceń wejściowych i szumów pomiaro-
wych wielkości wyjściowej sterowanego obiektu.
Wyniki badań filtru Kalmana m.in. w postaci charakterystycznych przebiegów zmiennych
stanu i ich przybliżeń.
15
Jak przemieszczają się bieguny układu ze stacjonarnym filtrem Kalmana przy zmianach
poziomu addytywnych zakłóceń na wejściu sterowanego obiektu.
Czy estymacja sygnału wyjściowego jest, w sensie średniokwadratowym, lepsza niż bez-
pośredni pomiar?
Teksty opracowanych i stosowanych w trakcie ćwiczenia programów a także schematy
blokowe ukladów modelowanych w Simulinku.
16
Zestawienie A.
Synteza obserwatora stanu. Wzory Ackermana.
Zalóżmy, że stacjonarny i obserwowalny obiekt dynamiczny opisują równania liniowe:
dx(t)/dt = A x(t) + B u(t);
y(t) = Cx(t).
Stawiane jest zadanie rekonstrukcji stanu x(t) przy znajomości sygnalu sterowania
u(t) i sygnalów wyjściowych y(t). Nie wszystkie zmienne stanu podlegają bowiem
pomiarom: dim(x)> dim(y).
Problem ten możemy rozwiązać konstruując uklad dynamiczny opisany równaniem:
dxo(t)/dt = Ao xo(t) + Ko y(t) + z;
w którym przez: xo(t) oznaczono bieżącą ocenę wektora stanu, a macierze Ao , Ko po-
siadają wymiary analogiczne do wymiarów macierzy A, B w równaniu wyjściowym. Odej-
mując stronami oba równania stanu otrzymamy prędkość zmiany blędu oszacowania:
de(t)/dt = A x(t)- Ao xo(t) - Ko y(t) + B u(t)- z.
Po przyjęciu: z(t)= Bu(t) i podstawieniu: y(t)= Cx(t); wyrażenie to przyjmuje
formę:
de(t)/dt = [A - Ko C] x(t) - Ao xo(t);
sugerującą wybór macierzy stanu w projektowanym ukladzie w postaci: Ao=[A-KoC].
Otrzymujemy bowiem wówczas szczególnie proste równanie wynikowe dynamiki blędów
oceny zmiennych stanu:
de(t)/dt = Ao e(t) = [A - Ko C] e(t).
17
Blędy te dążą asymptotycznie do zera, jeżeli tylko części rzeczywiste wartości wlasnych ma-
cierzy stanu obserwatora Ao są ujemne, a same zmienne stanu mają wartości ustalone.
Problem syntezy obserwatora sprowadza się więc do doboru wspólczynników (wzmoc-
nień) w macierzy Ko. Konkretyzując dzialania, możemy je np. prowadzić go w ten sposób by
macierz [A - Ko C] miala wartości wlasne polożone w miejscach zadeklarowanych
przez projektanta. Przytoczymy jeden ze sposobów rozwiązania tego zadania. W wersji tej
zaklada się indywidualną lokalizację s*i każdej wartości wlasnej obserwatora obiektu ste-
rowanego.
Etap 1 . Znajdujemy transformatę macierzy tranzycyjnej obserwowanego obiektu:
Ś(s) = [ sI A] -1 ;
a następnie wektor (wymiar macierzy Cjest [1 x m]):
�(s) = C Ś(s).
Etap 2. Podstawiając kolejno do �(s) miejsca pożądanej lokalizacji wartości wlasnych
(s=s*i, i=1,2,...n) otrzymujemy n (wymiar wektora stanu) liniowo nieza-
leżnych wierszy macierzy �(s*i).
Etap3. Wyliczając wartość wyrażenia:
Ko = - [�(s* i )]-1 ones(n,1);
otrzymujemy wspólczynniki wzmocnienia w macierzy wejścia obserwatora. Jest to
równoważne z zakończeniem procesu jego syntezy.
Sprawdzić obliczenia możemy za pośrednictwem wyliczenia: eig([A - Bo C]).
Obliczenia wedlug tego algorytmu nie jest latwo zautomatyzować. Przy realizacji dzialań
na pierwszym, zapewne najtrudniejszym etapie należaloby poslużyć się językiem programo-
wania wyposażonym w możliwość realizacji obliczeń symbolicznych. W ramach Matlaba
możliwości tego typu stwarza pakiet oprogramowania do Symbolic z jądrem Maple a.
Zakladając np. macierze stanu i wyjścia sterowanego obiektu w postaci : A = [0 2;0 3];
C = [1 0];odpowiednie instrukcje przyjęlyby tu następującą postać:
fi = inverse(sym('s, -2; 0, s-3')); psi = symmul ( [1 0] , fi).
18
Istnieje jednak również wersja umożliwiająca automatyzację (bez dzialań symbolicz-
nych) rozwiązania przedstawionego zadania syntezy obserwatora. Prostszy, choć numerycz-
nie nie najdoskonalszy, sposób zautomatyzowania obliczeń możemy uzyskać na podstawie
tzw. wzoru Ackermana:
K0 = ([0, 0, ...,0, 1] [C| CA| ... |CAn-2 | CAn-1 ]-1 Ś(A))T;
Wzór ten, jak widzimy, pozwala wyznaczyć wspólczynniki wzmocnienia różnic wyjść
obiektu i obserwatora jako transpozycji (symbol (.)T) ostatniego wiersza iloczynu odwrotności
macierzy obserwowalności i wartości wielomianu wzorcowego:
Ś(s) = (s- s*1) (s- s*2)... (s- s*n);
przy podstawieniu: s=A. Umożliwia on bezpośrednio wykorzystanie sprawności Matlaba
w zakresie przeksztalceń macierzowych W szczególności istnieje tu możliwość obliczenia
wartości wielomianu od danej macierzy przy pomocy standardowej m-funkcji polyvalm .
Po automatyzacji obliczeń glównym problemem pozostaje wybór polożenia biegunów
obserwatora. Powinno się zachować tu kompromis między (interpretowalną poprzez lokaliza-
cję biegunów) szybkością dzialania projektowanego ukladu umożliwiającą co prawda sku-
teczne, szybkie niwelowanie różnic w ocenie zmiennych stanu w stosunku do rzeczywistości,
a sprzężoną z tym z reguly tendencją do znacznych wartości wspólczynników wzmocnień, co
prowadzi z kolei do wzrostu wplywu szumów i innych zaklóceń pomiaru wielkości wyjścio-
wych. Nieco inne, skuteczne obliczeniowo podejście, do zbliżonej problematyki estymacji
stanu w warunkach znajomości modelu oddzialywań stochastycznych uzyskujemy w ramach
optymalnej teorii filtracji. Teoria ta jest sformulowana na podstawie kwadratowych wskazni-
ków jakości. Elementy jej przedstawiono w następnym zestawieniu.
Ze względu na znaną cechę dualności zadań syntezy regulatora i obserwatora istnieje
również analogiczny do przedstawionego wzór Ackermana dotyczący takiego doboru wspól-
czynników wzmocnień w obwodach sprzężeń zwrotnych od zmiennych stanu, by bieguny
wynikowego ukladu regulacji zajęly ustalone pozycje {s*i}.
19
KR = [0, 0, ...,0, 1] [ B| AB| ... | An-2B| An-1B]-1 Ś(A);
We wzorze tym macierz obserwowalności obiektu zastąpiona zostala swoim odpowied-
nikiem - macierzą sterowalności, a wielomian wzorcowy ma sprzężony sens merytoryczny.
Samo zadanie wyboru polożenia biegunów ukladu regulacji ma również szereg istotnych
aspektów wspólnych z tym samym zadaniem dla ukladu obserwatora. Podkreślmy jednak, że
polożenie biegunów obu części ukladu (regulatora i obserwatora) wspólpracujących w ramach
rozwiązania danego zadania sterowania można planować zupelnie niezależnie. Wspólne rów-
nanie charakterystyczne takiego ukladu:
det(sI-A + BKR ) det(sI-A + K0 C) = 0;
zawiera bowiem dwa niezależne skladniki iloczynu. Program syntezy ukladu regulacji może
zawierać w związku z tym niezależne obliczenia wektorów wzmocnień regulatora i obserwa-
tora.
Zauważmy także, że konstrukcja obserwatora powinna być raczej oszczędną . W zasa-
dzie powinien on występować w postaci zredukowanej, dotyczącej jedynie zmiennych stanu
nie podlegających pomiarom. Obecność pelnego obserwatora zmiennych stanu zwiększa aż
dwukrotnie (tj. do 2n) rząd równoważnego ukladu dynamicznego w porównaniu do rzędu
obiektu sterowanego przy jego udziale. Z drugiej strony jednak, patrząc pragmatycznie, są to
zmienne stanu natury obliczeniowej, związane wylącznie z metodyką prowadzenia obliczeń
w systemie cyfrowym.
20
Zestawienie B.
Sterowanie kwadratowo - optymalne. Własności LQ regulacji.
Zadanie regulacji kwadratowo optymalnej (w wersji dyskretnej) polega na takim
doborze wspólczynników sprzężeń zwrotnych od zmiennych stanu: u(k) = - Kx(k);
dla liniowego obiektu dynamicznego:
x(k+1) = A x(k) +B u(k);
by zminimalizować sumaryczny kwadratowy wskaznik jakości:
J = Ł { xT(k)Q x(k) + uT(k)R u(k)};
w którym: Q > 0; R > 0 ; są macierzami kwadratowymi wymiaru zmiennych stanu
i sterowań . Istnieją dwie glówne wersji tego zadania W jednej z nich sumowanie odbywa
się w nie ograniczonym czasie: k=0,1,2,...,". W drugiej wersji natomiast przedzial
czasowy optymalizacji jest ograniczony: k=0,1,2,...,kr .
Zastosowany wskaznik ma charakter uniwersalny. Wskazniki o zbliżonym charakte-
rze, z ważeniem kwadratów uchybu i wielkości sterującej stosowane są w wielu zadaniach
sterowania. Występuje tu kombinacja dwu sprzężonych skladowych: skladowej xT(k)Q x(k)
określającej jakość sterowania i skladowej uT(k)R u(k)}; interpretowanej jako jej koszty.
W podstawowej interpretacji pierwsza ze skladowych jest związana z merytorycznym wyra-
żeniem (kwadratu) odleglości w przestrzeni stanu do punktu docelowego ( w zadaniu przyj-
muje się, że docelowo xk=0) przy pomocy nie ujemnie określonej formy kwadratowej. Inter-
pretacja tego typu pozwala projektantowi wyrazić stopień realizacji celu sterowania w każdej
chwili czasowej wektor stanu, jak wiemy, przekazuje pelną informację o sterowanym
obiekcie.
Ważną zaletą wlaśnie tej postaci wskaznika jest możliwość uzyskania rozwiązania dane-
go zadania optymalizacji w stosunkowo nieskomplikowanej postaci analitycznej. Rozwiąza-
nie to, w przypadku integralnego ujęcia we wskazniku pelnej trajektorii (kr = ") prowadzi do
stacjonarnej wersji regulatora, w której w której wszystkie wspólczynniki wzmocnienia
21
przyjmują określone stale wartości: K = const. Rzadziej stosowana jest wersja skończonego
przedzialu czasowego optymalizacji w której wspólczynniki wzmocnienia regulatora liniowe-
go zmieniają się w czasie w sposób zależny m.in. od przedzialu optymalizacji.
Twierdzenie nt. rozwiązania problemu liniowo kwadratowego.
Jeżeli para macierzy A, B z równania stanu: x(k+1)=A x(k)+B u(k); obiektu jest
sterowalną, tj.
rank ([ B| AB| ... | An-2B| An-1B]) = 0;
to optymalny ciąg sterowań {u(k)}, przy k"[0, "), który minimalizuje wskaznik kwa-
dratowy: J = Ł { xT(k) Q x(k) + uT(k) R u(k)}; uzyskuje się w rezulta-
cie zastosowania ujemnych sprzężeń zwrotnych w postaci:
u(x(k)) = - K x(k) = - (R + BT P B)-1 BT P A x(k);
W wyrażeniu tym macierz Pjest symetryczną macierzą dodatnio określoną do której zbiega
się rozwiązanie równania rekurencyjnego:
P(k)= A P(k+1) AT + Q AT P(k+1)B [BTP(k+1)B + R]-1 BT P(k+1)A;
gdy k ", przy dowolnym warunku końcowym: P(N) = PN >0. Macierz rozwiązania P
spelnia zatem równanie algebraiczne:
P = A P AT + Q AT P B [BTP B + R]-1 BT P A.
Optymalna wartość wskaznika jest przy takim uksztaltowaniu sprzężeń zwrotnych równa
wartości formy kwadratowej: f(x) = xT(k)P x(k); w punkcie startowym, tj. dla:
x(k)= x(0).
Przedstawione twierdzenie podaje w istocie przepis na wyznaczenie wspólczynników
wzmocnień regulatora dla liniowego ukladu dynamicznego. Można je udowodnić za pośred-
nictwem obu glównych metod rozwiązywania problemów optymalizacji dynamicznej; tj. przy
22
pomocy programowania dynamicznego, lub zasady maksimum [1, 3 ]. W przypadku rozp a-
trywania skończonego horyzontu oceny sterowania, lub niestacjonarnych równań sterowane-
go procesu regulator staje się niestacjonarnym K(k). Regulator wyznaczony przy pomocy
tego twierdzenia nazywany jest LQR (ang. linear quadratic regulator ) regulatorem, a dany
sposób sterowania LQ regulacją.
Istnieje analogiczne twierdzenie o kwadratowo optymalnej regulacji dla ukladów cią-
glych w którym model stacjonarnego obiektu stanowi uklad liniowych równań różniczko-
wych stanu, a funkcję podcalkową we calkowym wskazniku jakości stanowi równoważna
suma dwu form kwadratowych. Zgodnie z tym twierdzeniem stacjonarne wspólczynniki
sprzężeń zwrotnych LQ regulacji dla sygnalów analogowych wyliczane są poprzez:
u(x) = - K x = - R-1 BT P x.
Symetryczna i dodatnio określona macierz P jest przy tym (gdy rozważany horyzont cza-
sowy sterowania tr ") rozwiązaniem algebraicznego równania Riccati ego:
PA +AT P P B R-1 BT P + Q = 0;
Przedstawimy krótko, w punktach, niektóre wlasności LQ regulacji utrzymując się
glównie w konwencji ukladu ciąglego.
Uklad regulacji z LQR regulatorem opisują równania z macierzą stanu ALQ:
dx/dt = ALQ x = {A- KB]x = [A - R-1 BT P B]x, x(0)= x0 .
Asymptotyczna stabilność ukladu zamkniętego jest gwarantowana. Co więcej, wykazano
również, że dla transmitancji widmowej polączenia szeregowego obiektu SISO
z regulatorem (ozn. GLQR(j�)) gwarantowane jest spelnienie nierówności:
|1+GLQR(j�)|>1; dla każdej częstotliwości.
Nierówność ta, w interpretacji graficznej na plaszczyznie amplitudowo - fazowej, odpo-
wiada braku możliwości znalezienia się jakiegokolwiek fragmentu charakterystyki
GLQR(j�)we wnętrzu kola o promieniu jednostkowym i środku w punkcie (-1, 0). Impli-
kuje to istnienie gwarancji przynajmniej 600 zapasu fazy przy ocenie zapasu stabilności
23
ukladu. Co więcej, wynika stąd możliwość nieograniczonego wzrostu wzmocnienia ukla-
du w kierunku wytyczanym przez wektor wzmocnień regulatora przy zachowaniu jego
stabilności.(dlaczego?).
Należy podkreślić, że wymiarowość (liczba wejść i wyjść) sterowanego obiektu MIMO
nie wplywa na postać rozwiązania LQ regulacji. Klasyczne metody syntezy nie są, jak
wiadomo, zbyt sprawne z tego punktu widzenia. Wymiar determinującej regulator macie-
rzy P(rozwiązanie równania Riccati ego) wynika wylącznie z rzędu sterowanego obiektu.
Zastosowanie LQ regulacji nie zapewnia automatycznie zerowego uchybu w stanie usta-
lonym. Wlasności astatyczne ukladu można zagwarantować wprowadzając do modelu ste-
rowanego obiektu dodatkowe zmienne stanu związane z calkowaniem wielkości regulo-
wanych. Jeden ze sposobów rozwiązania tego problemu widoczny jest na rys.2.
Zastosowanie regulatora LQR automatycznie przesuwa bieguny sterowanego obiektu gl ę-
biej w lewo plaszczyzny liczb zespolonych, w rejony związane ze wzrostem szybkości
przebiegów dynamicznych. Wykazano bowiem prawdziwość nierówności:
! !
!|i[A]| < !|i[ALQ]|;
związanej z wartościami wlasnymi i [.] macierzy stanu sterowanego obiektu i ukladu za-
mkniętego z regulatorem ( ! jest tu symbolem iloczynu obejmowanych nim skladników).
!
LQ regulacja jest zródlem skutecznych metod automatycznego projektowania liniowych
ukladów sterowania za pośrednictwem programu komputerowego. Glównym problemem
numerycznym może być jedynie uzyskanie dostatecznie dokladnego rozwiązania macie-
rzowego równania Riccati ego. Problem ten rozwiązywany jest zresztą coraz skuteczniej
dzięki opracowaniu sprawnych, stabilnych metod numerycznych i ciągle rosnącym moż-
liwościom techniki cyfrowej.
Techniczna prostota i jednoznaczność rozwiązania zadania LQ regulacji podkreśla wagę
podstawowego problemu doboru form kwadratowych we wskazniku. Glównym proble-
mem merytorycznym w trakcie syntezy LQR jest, jak już sygnalizowano, wybór wspól-
czynników wagi we wskazniku jakości. Teoretycznie rzecz ujmując wskaznik zawiera
24
niezależnych elementów w macierzach Q i R. Nie znane są,
oczywiście, reguly prowadzące do jednoznacznego jego rozwiązania. Można natomiast,
korzystając ze względnej prostoty rozwiązania już sformulowanego zadania i możliwości
jakie daje symulacja uzyskanego ukladu LQ regulacji, stosować różnego typu metody
ukierunkowanego przeglądu wielu wersji wskaznika, generując Q,R coraz lepiej polo-
żone z punktu widzenia zalożeń wyjściowych i celów stawianych w zadaniu sterowania.
Pomocniczą rolę może odegrać zbiór Pareto konstruowany na tle par wskazników sprzę-
żonych. Wskazniki tego typu stosowano już (np. w postaci ITAE/CE) w ćwiczeniu zwią-
zanym z optymalizacją regulatora PID.
Niekiedy rozważa się również zastosowanie nietypowych wersji wskaznika kwadratowe-
go. Wybór macierzy Q może być ulatwiony np. przez fakt uwzględnienia we wskazniku
wzorcowego modelu dynamiki: x(k+1)=A* x(k):
J = Ł { xT(k)(A-A*)T Q (A-A*) x(k) + uT(k) R u(k)}.
Uzyskujemy w ten sposób pomost do PP regulacji wartości wlasne wzorcowej macierzy
stanu mogą znajdować się w ustalonych miejscach.
W najbardziej ogólnej wersji wskaznika przestrzeń stanu i sterowań może być uwzględ-
niana we wskazniku lącznie. Przy zapisie w konwencji Matlabaotrzymujemy wówczas:
J = Ł { [x(k), u(k)]T [Q, S; S, R] [x(k), u(k)]}.
Wprowadzenie dodatkowej macierzy S dodatkowo zwiększa rozmaitość potencjalnych
sformulowań zadania.
Inna wersja zadania LQ regulacji związana z modyfikacją równania Riccati ego w celu
zagwarantowania lokalizacji wartości wlasnych macierzy stanu wynikowego ukladu
w lewej pólplaszczyznie, w odleglości równej przynajmniej � od osi liczb urojonych (� -
stopień stabilności ukladu). Dla ukladu ciąglego zmodyfikowane równanie przyjmuje
w tej sytuacji postać:
P(A + �I) + (A + �I)T P P B R-1 BT P + Q = 0;
25
w której przez Ioznaczono macierz jednostkową.
Znajomość dostatecznie dokladnego modelu sterowanego procesu jest warunkiem zgod-
ności wymienionych wyżej teoretycznych zalet LQ regulacji z praktycznie osiąganymi
rezultatami projektowania. Niepewność modelu rodzi konieczność stosowania przedsię-
wzięć zwiększających odporność ukladu na zmiany modelu. Przedsięwzięcia tego typu
mogą wiązać się ze zmianą wytycznych wyjściowych projektowania (np. odpowiednia
zmiana elementów wagowych we wskazniku, zastosowanie ostrożniejszego , trudniej-
szego modelu sterowanego procesu, czy też przyjęcie zawyżonego poziomu szumów po-
miarowych itp.), lub z zastosowaniem dodatkowych obliczeń już w trakcie projektowa-
nia.
26
Zestawienie C.
Podstawowe informacje na temat filtru Kalmana.
Filtr Kalmana jest rekurencyjną siecią dzialań przeznaczoną do estymacji wektora stanu
ukladu dynamicznego przy uwzględnieniu niekontrolowanych oddzialywań probabilistycz-
nych i szumów pomiarowych.
Dobrze znanym jest ten fakt, że na następne polożenie wektora stanu: x(k) =
[x1(k),x2(k),... xn(k)]T, dyskretnego obiektu dynamicznego znajdującego się
pod wplywem wymuszeń sterujących i zaklócających może wplywać bezpośrednio:
bieżące polożenie w przestrzeni stanu: x(k);
aktualny poziom kontrolowanego oddzialywania u(k);
niekontrolowany wektor zaklóceń o charakterze stochastycznym v(k)o wymiarze zgod-
nym z wymiarem zmiennych stanu.
Przyjęcie zalożenia o liniowości obiektu prowadzi to do równań różnicowych stanu
w postaci:
x(k+1) = A(k)x(k) + B(k)u(k) + v(k);
w której macierze stanu A(k) i wejść B(k) wyrażono uwzględniając możliwość ich
zmian w czasie. W podstawowej wersji zadania zaklada się także niezależność poszczegól-
nych skladowych wektora zaklóceń v(k). Macierz korelacyjna tych zaklóceń ma, przy
spelnieniu tego warunku, postać macierzy diagonalnej R(k)=[ qi,j(k)], wyrażanej np.
za pośrednictwem wyrażenia:
E{vi(k) vTj(k)} = ri,j(k) �i,j,
27
w którym: i,j stanowią indeksy skladowych wektora v(k), a przez �i,j oznaczono sym-
bol delty Kroneckera (�i,j=1, gdy: i=j; �i,j=0, gdy: i`"j). Elementy ri,i(k) są
z zalożenia dodatnie. Pomiary zmiennej wyjściowej także mogą być obarczone addytywnymi
zaklóceniami:
y(k+1) = C(k)x(k) + D(k)u(k) + w(k);
o analogicznych wlaściwościach: E{wi(k)wTj(k)}= qi,j(k)�i,j ; (qi,i(k)>0). Zwy-
kle, stawiając zadanie wyklucza się również skorelowanie zaklóceń pomiarowych z aktyw-
nymi: E{vi(k)wjT(k)} = 0.
Skladowe wektora stanu w tych warunkach są reprezentowane poprzez stochastyczne
ciągi czasowe. Zadanie znalezienia optymalnego w sensie najmniejszych kwadratów filtru
predykcyjnego dla wektora zmiennych stanu xest(k+1) w momencie k - tym, przy znanym
pomiarze y(k) wyjścia ma trójskladnikowe rozwiązanie rekurencyjne. W pierwszej fazie
każdego etapu obliczeń z reguly wyznaczana jest aktualna wartość wektorowego wspólczyn-
nika wzmocnienia:
K(k) = P(k) C(k)T ( R(k) + C(k) P(k) C(k)T )-1;
Znajomość aktualnego wektora K(k) pozwala na wyznaczenie poprawki oceny zmien-
nych stanu. Poprawka ta jest proporcjonalna do różnicy między pomiarem wielkości wyj-
ściowej i jej oceną uzyskaną na poprzednim etapie obliczeń:
xest(k+1)=A(k)xest(k)+B(k)u(k)+K(k)(y(k) C(k)xest(k) D(k)u(k));
W trzeciej ( i ostatniej ) fazie każdego etapu obliczeń następuje nowe oszacowania ma-
cierzy wariancyjno - kowariancyjnej niezgodności ocen i pomiarów:
P(k+1)=A(k)(P(k) K(k)C(k)P(k))A(k)T + B(k)*Q(k)*B(k),
co pozwala na rozpoczęcie (po opóznieniu wynikającym z określonego czasu próbkowania)
obliczeń następnego etapu.
28
Rekurencyjna sieć dzialań tego typu nazywana jest algorytmem estymacji optymalnej,
lub równaniami filtru predykcyjnego Kalmana. Przytoczymy kilka komentarzy na temat roz-
wiązania zadania filtracji tego typu.
Wektor wspólczynników wzmocnienia w ukladzie rozważanego filtru K(k), ogólnie
rzecz biorąc, zmienia się w czasie. Dla stacjonarnych i stabilnych dynamicznych obiek-
tów liniowych, w których zarówno macierze w równaniach stanu i wyjść są ustalone:
A(k)=A; B(k)=B; C(k)=C; jak i niezmienne są wlasności stochastycznych od-
dzialywań zaklócających środowiska: Q(k)=Q; R(k)=R; macierz wariancyjno-
kowariancyjna P(k) dąży docelowo do postaci ustalonej. Zjawisko to prowadzi do
ustalenia się z uplywem czasu elementów wektora wzmocnień K(k)= K. Mówimy
wówczas o filtrze stacjonarnym.
Przy znajomości charakteryzujących zaklócenia, dodatnio określonych macierz Q, R ist-
nieje możliwość wyliczenia a priori wzmocnień filtru stacjonarnego za pośrednictwem
rozwiązania macierzowego, algebraicznego równania Riccatiego:
P = A P AT + Q A P CT [CPCT + R]-1 C P AT ;
Równanie to wynika z przytoczonych wyżej zależności realizowanych w pierwszej i trze-
ciej fazie obliczeń, po podstawieniu ustalonych macierzy: A, B, C, Q, R. Można
wykazać, że uzyskiwana w rezultacie jego rozwiązania macierz P jest dodatnio określo-
na, a otrzymany na tej podstawie filtr o ustalonym wzmocnieniu, jest filtrem stabilnym.
W przedstawionej predykcyjnej wersji filtru zaklada się znajomość w momencie oblicza-
nia nowego oszacowania wektora stanu jedynie pomiar wyjścia y(k) z poprzedniego
taktu. Możemy jednak sformulować także wersję uwzględniającą znajomość wyjścia
z taktu bieżącego: y(k+1). Prowadzi to do rekurencyjnej wersji algorytmu filtru esty-
mującego bieżący stan obiektu dynamicznego w postaci (przy stacjonarnych macierzach
A,B,C,D):
xest(k+1) = Axest(k)+Bu(k)+K(k+1)(y(k+1) CA(k)xest(k) Du(k)).
29
Obie wymienione wersje opracowania informacji bieżącej stanowią rozwinięcie klasycz-
nego schematu rekurencyjnego algorytmu identyfikacji typu:
cest(k) = cest (k-1) + K(k)( y(k) u(k)* cest (k-1));
co oznacza, że: nowy wektor ocen = poprzedni wektor ocen +
+ aktualizowany wektor wspó" czynników wzmocnie" *
* (wynik pomiaru ocena y(k) na bazie aktualnego modelu).
Aktualnie znanych jest wiele opracowań uogólniających teorię filtracji Kalmana. Rozwią-
zano szereg zadań filtracji z oslabieniem zalożeń początkowych. Warto wymienić uzyska-
nie rozwiązań obejmujących m.in.
- zalożenie o skorelowanych między sobą zaklóceniach kolorowych,
- przypadek nieznanych i równolegle estymowanych w trybie nadążnym macierzy kowa-
riancyjnych zaklóceń,
- sytuację z równoleglą identyfikacją modelu samego obserwowanego ukladu.
W zadaniach sterowania filtr Kalmana może odgrywać rolę obserwatora pozwalającego
na stochastycznie optymalne (w sensie uśrednionych realizacji wskaznika kwadratowego
jakości estymacji) odtwarzanie na bieżąco wszystkich, nawet niedostępnych pomiarowo,
zmiennych stanu obiektu sterowania. W związku z tym pakiety oprogramowania wspo-
magającego projektowanie ukladów regulacji z reguly wyposażone są w procedury po-
zwalające na zautomatyzowanie procesy syntezy wersji stacjonarnych tych filtrów. Przed
ich zastosowaniem należy zwrócić uwagę na wersję zalożeń wyjściowych przyjętych w
ramach rozwiązywanego zadania syntezy estymatora.
30
Zestawienie D.
Synteza regulatora na podstawie modelu zmiennych stanu.
LQG regulacja.
Regulacja ze sprzężeniami od zmiennych stanu wymaga pomiarów lub odtworze-
nia wielkości fizycznych przyjętych za zmienne stanu. W przypadku niedostępności zmien-
nych stanu, przy ksztaltowaniu obwodu regulacji należy rozwiązać dwa zadania: zadanie
syntezy obserwatora i zadanie syntezy regulatora. Rozpatrzmy je jednocześnie. W sytuacji
deterministycznej, model liniowego obiektu sterowania zawiera n równań stanu i m
(mdx(t)/dt = A x(t) + B u(t);
y(t) = C x(t).
Wymiary macierzy A, B, C, D wynikają z wymiarowości wektorów x, y, u. Zalóż-
my, że obiekt jest sterowalny i obserwowalny. Spelnione są więc następujące warunki:
rank([ B| AB| ... | An-2B| An-1B]) = n;
rank([C| CA| ... |CAn-2 | CAn-1 ]) = n;
Jest to warunek konieczny i dostateczny, by oba wymienione zadania posiadaly rozwiązanie.
W zadaniu syntezy obserwatora zalecany jest wybór równań w postaci:
dxo(t)/dt = A xo(t) + B u(t) + L (y(t) C xo(t));
Jest to ogólna postać równania odtworzenia stanu. Konkretne zadanie syntezy sprowadza się
do doboru wektora ( lub macierzy - w przypadku wielu, m>1 wyjść sterowanego obiektu)
wspólczynników wzmocnień L. Oba rozpatrzone poprzednich zestawieniach wersje ukladu
odtwarzającego zmienne stanu: obserwator Luenbergera i filtr Kalmana mieszczą się w tej
klasie.
31
Realizując obliczenia wedlug tego równania w czasie rzeczywistym posiadamy (w prak-
tyce lepsze lub gorsze) przybliżenia zmiennych stanu. Pozwala to, przy zalożeniu liniowej
struktury ukladu, rozwiązywać zadanie syntezy regulatora na podstawie stanu obserwatora
x0(t). Synteza regulatora sprowadza się więc także do doboru wektora ( lub macierzy przy
wielowymiarowym r>1wektorze sterowań) wspólczynników wzmocnień K:
u(t) = F(x0(t)) = - K x0(t).
Uzyskiwany w ten sposób zamknięty uklad sterowania reprezentują równania stanu, które
możemy zapisać (z zastosowaniem konwencji Matlabaprzy zapisie macierzy) w postaci:
[dx/dt, dx0/dt]T = [A, -BK; LC, A-BK+LC] [x, x0]T ;
Wybór zmiennych stanu nie jest jednoznaczny. Wybierając wektor zmiennych stanu w posta-
ci: [x,e]T = [ x, x - x0]T ; uzyskuje się uklad równań:
[dx/dt, de/dt]T = [A -BK, +BK; 0, A-LC] [x, e]T ;
z macierzą stanu o zerowej jednej z podmacierzy. Wielomian charakterystyczny tej macierzy
można więc rozbić na dwa niezależne skladniki:
det(sI - A + BK ) det( sI - A + LC) = 0.
Potwierdza to z jednej strony formalną niezależność zadań syntezy regulatora i obserwatora,
z drugiej zaś potwierdza istnienie silnych analogii (określanej jako dualizm syntezy) w trakcie
ich rozwiązywania.
W zestawieniu A przedstawiono rozwiązanie dualne w sytuacji deterministycznej, kon-
struowane na podstawie ustalenia polożenia biegunów obu projektowanych skladników ukla-
du regulacji. Rozważmy problem syntezy, przy zalożeniu istotności czynników stochastycz-
nych. Czynniki te uwzględnia się w modelu sterowanego procesu za pośrednictwem dwu
wektorów losowych v(t), w(t):
dx(t)/dt = A x(t) + B u(t) + v(t);
y(t) = C x(t) + w(t);
32
i przyjęciu zalożenia o probabilistycznej niezależności poszczególnych skladowych tych
wektorów:
E{[v(k),w(k)][vT(k),wT(k)]} = [Rv 0; 0 Rw ] = R = [ri,j(k)],
Diagonalne elementy macierzy Rsą dodatnie ( ri,i(k)>0), natomiast elementy mieszczące
się poza diagonalną zerowe: ri,j(k)=0.
W ramach LQG regulacji (ang. linear quadratic gaussian) syntezę regulatora prze-
prowadza się na podstawie rozwiązania zadania optymalnego sterowania ze wskaznikiem
kwadratowym (regulator LQR). Problem odtworzenia stanu rozwiązuje się natomiast na pod-
stawie rozwiązania zadania optymalnej filtracji również na bazie kwadratowych wskazników
jakości estymacji.
Kwadratowo optymalny (LQR) regulator uzyskuje się (zestawienie B) w wyniku ustalania
oddzialywania sterującego na podstawie stanu ukladu:
u(t) = - KR x(t) = - R-1 BT PR x(t);
przy czym: - R,Q (R>0, Q>0) są macierzami określającymi formy kwadratowe we wskaz-
niku;
- macierz PR jest nieujemnie (PR >0) określonym rozwiązaniem algebraicznego
równania Riccati ego:
PR A +AT PR PR B R-1 BT PR + Q = 0;
Kwadratowo optymalnym filtrem jest z kolei (zestawienie C) filtr Kalmana estymujący
bieżący stan obiektu dynamicznego Sprowadza się on do obliczenia wektora wzmocnień
w przedstawionym wyżej równaniu rekurencyjnym odtworzenia stanu:
K0 = P0 CT Rw-1 ;
Obliczenie K0 możemy zrealizować po rozwiązaniu algebraicznego równania Riccati ego
w postaci:
P0 A +AT P0 P0 B Rw-1 BT P0 + Rv = 0;
33
Z przedstawianych wyrażeń wynika następujący uklad analogicznych macierzy w zadaniach
syntezy kwadratowo - optymalnego sterowania i kwadratowo optymalnej estymacji stanu:
B �! CT, K �! LT, Q �! Rv, R �! Rw .
34
UWAGI BIBLIOGRAFICZNE i LITERATURA.
Synteza ukladów regulacji ze sprzężeniem od zmiennych stanu ukierunkowana na ustale-
nie biegunów wynikowego ukladu regulacji jest klasycznym problemem teorii sterowania i
przedmiotem rozważań przynajmniej jednego rozdzialu w klasycznych podręcznikach teorii
regulacji (np. [1], [3], [6]). Podobnie rzecz ma się z LQ regulacją, chociaż wyprowadzenie
wzorów na postać LQR regulatora polączone z przedstawieniem podstawowych problemów
sterowania optymalnego spotykane jest nie zawsze. Wyjątkowo przejrzyście tematykę tę uj-
mują klasyczne podręczniki ([1], [3]). W [2] natomiast można odnalezć zwięzle i jasno
przedstawione problemy filtracji z teorią estymatora Kalmana wlącznie. Filtracja optymalna
jest tematem szeroko omawianym w wielu książkach i podręcznikach poświęconych przetwa-
rzaniu sygnalów i diagnostyce ukladów monitorowania i sterowania. Za przyklad mogą po-
slużyć tu [7], [8].
[1] T. Kaczorek, Teoria ukladów regulacji automatycznej, WNT, Warszawa, 1995
[2] P. de Larminat, Y. Thomas : Automatyka uklady liniowe. T.2, Identyfikacja. WNT,
Warszawa, 1983
[3] P. de Larminat, Y. Thomas : Automatyka uklady liniowe. T.3, Sterowanie. WNT, War-
szawa, 1983
[4] J.Nowakowski, Podstawy automatyki, T.2, Wyd. PG, Gdańsk, 1994
[5] T. Kaczorek, Wektory i macierze w automatyce i elektrotechnice, WNT, Warszawa, 1998
[6] Y.Takahahi, M.J.Rabins, D.M.Auslander, Sterowanie i systemy dynamiczne, WNT, War-
szawa, 1976
[7] L. Rutkowski, Filtry adaptacyjne i adaptacyjne przetwarzanie sygnalów, WNT, Warszawa,
1994
35

Wyszukiwarka

Podobne podstrony:
NowoczesneMetodySterowania UkładyNieliniowe
Nowoczesne uklady sterowania
Mudry energetyczne układy dłoni(1)
uklady rownan (1)
Zakażenia mikrobiologiczne nowoczesne metody ich wykrywania w przemysle spożywczym
PRZERZUTNIKI I UKŁADY SEKWENCYJNE
Nowoczesne meble w atrak
Układy napęd lista1 3 3 8 15
Miały być nowoczesne dowody osobiste wyszło jak zawsze
15 Język Instruction List Układy sekwencyjne Działania na liczbach materiały wykładowe
układy zasilania instalacji
Człowiek jako całość Układy funkcjonalne
Uklady prostownicze
uklady bilansu 13
Układy pracy generatorów stosowanych w elektrowniach wiatrowych

więcej podobnych podstron