background image

Akademia Górniczo-Hutnicza

Katedra Robotyki i Mechatroniki

Identyfikacja i analiza sygnałów

Laboratorium 11

Ocena jakości estymatorów

background image

Ocena jakości estymatorów w identyfikacji obiektów dynamicznych

Przy identyfikacji modeli układów dynamicznych, oprócz znalezienia (wyestymowania) para-
metrów modelu, musimy również sprawdzić na ile model przez nas uzyskany jest poprawny. 
Znaczy to jak dobrze naśladuje rzeczywisty układ, który modelujemy. Służy do tego szereg na-
rzędzi, które są stosowane w zależności od typu modelu. W czasie niniejszego laboratorium stu-
denci zapoznają się z następującymi sposobami oceny jakości estymatorów:
- dla modeli parametrycznych: kryterium Akaike, funkcja kowariancji i wyznaczanie przedzia-
łów ufności,
- dla modeli nieparametrycznych: funkcja koherencji i wskaźniki FRAC i RVAC,
- dla modeli modalnych: kryterium MAC i pochodne CoMAC i MACCo. 

Modele parametryczne

Kryterium   informacyjne  Akaike  –   zaproponowane   przez   Hirotsugu  Akaike   pod   nazwą 
kryterium informacyjne w 1971 roku. Jest miarą dobroci dopasowania modeli statystycznych. 
Bazuje na pojęciu entropii w efekcie pokazujące względną miarę utraty informacji, gdy dany 
model jest wykorzystywany do opisu rzeczywistości obrazuje związek pomiędzy stopniem 
złożoności modelu  a jego dokładnością. AIC kryterium jest testem pozwalającym na wybór 
najlepszego modelu. Dla danego zestawu danych tworzymy grupę modeli, które oceniamy 
przy pomocy AIC i wybieramy najlepszy czyli ten, który ma najniższą wartość AIC. Akaike 
zaproponował, aby wybierać ten model dla którego najmniejsza jest wartość:

)

ln(

2

2

L

k

AIC

=

gdzie:

k - liczba parametrów modelu. 

L – estymowane prawdopodobieństwo, przy założeniach danego modelu, uzyskania 
takiej właśnie wartości obserwacji j jaka była naprawdę uzyskana

PRZYKŁAD

Dla układu o jednym stopniu swobody i parametrach m,c,k równych odpowiednio 7, 0.7, 700 

m=7, c=0.7, k=700

zbuduj model w przestrzeni stanów, 

A=[0 1;-k/m -c/m];

B=[0; 1/m];
C=[1 0];

D=0;
SSmodel=ss(A,B,C,D);

background image

dokonaj jego symulacji przy wymuszeniu losowym,

t=[0:0.01:5];
u=3*rand(size(t));

y=lsim(SSmodel, u, t);

otrzymane wyniki zaszumiamy szumem losowym o rozkładzie normalnym, średniej zero i 
amplitudzie równej 0.1 amplitudy zakłócanego sygnału,

for

 c=1:length(u)

     u(c)=u(c)*(0.9+0.1*randn(1));

end

;

 

for

 c=1:length(y)

     y(c)=y(c)*(0.9+0.1*randn(1));

end

;

dla tak przygotowanych sygnałów dokonujemy identyfikacji modeli typu ARX, ARMAX, BJ 
i PEM,

Dane=iddata(y,u',0.01);
ARXmodel=arx(Dane,[2,2,0]);

ARMAXmodel=armax(Dane,[2,2,2,0]);
BJmodel=bj(Dane,[2,2,2,2,0]);

PEMmodel=pem(Dane,[2,2,2,2,2,0]);

następnie przy pomocy kryterium AIC sprawdzamy, który model jest najlepszy:

KryteriumAIC=aic(ARXmodel,ARMAXmodel,BJmodel,PEMmodel)

Powyższy kod pozwala na uzyskanie następującego wyniku:

KryteriumAIC =
  -15.4129  -16.2133  -15.8715  -15.8103

Wynika z tego, iż dla tak prostego modelu i przyjętych rzędów modeli najlepszym modelem 
jest ARMAX.

Innym sposobem oceny modeli parametrycznych jest wyznaczenie dla nich przedziałów ufno-
ści. Niech zmienna X ma rozkład w populacji z nieznanym parametrem θ. Z populacji wybie-
ramy próbę losową (X

1

X

2

, ..., X

n

). Przedziałem ufności (θ - θ

1

, θ + θ

2

) o współczynniku uf-

ności 1 - α nazywamy taki przedział (θ - θ

1

, θ + θ

2

), który spełnia warunek:

P

1

 < θ < θ

2

) = 1 − α

gdzie: θ

1

 i θ

2

 są funkcjami wyznaczonymi na podstawie próby losowej.

Współczynnik ufności 1 - α jest wielkością, którą można interpretować w następujący spo-
sób: jest to prawdopodobieństwo, że rzeczywista wartość parametru θ w populacji znajduje 

background image

się w wyznaczonym przez nas przedziale ufności. Im większa wartość tego współczynnika, 
tym szerszy przedział ufności, a więc mniejsza dokładność estymacji parametru. Im mniejsza 
wartość 1 - α, tym większa dokładność estymacji, ale jednocześnie tym większe prawdopodo-
bieństwo popełnienia błędu. Wybór odpowiedniego współczynnika jest więc kompromisem 
pomiędzy dokładnością estymacji a ryzykiem błędu. W praktyce przyjmuje się zazwyczaj 
wartości zależne od parametru 

σ

 - czyli odchylenia standartowego.

Odchylenie standardowe  –  klasyczna  miara  zmienności, obok  średniej arytmetycznej  naj-
częściej stosowane pojęcie  statystyczne. Intuicyjnie rzecz ujmując, odchylenie standardowe 
mówi, jak szeroko wartości jakiejś wielkości są rozrzucone wokół jej  średniej. Im mniejsza 
wartość odchylenia tym obserwacje są bardziej skupione wokół średniej. Odchylenie standar-
dowe jest pierwiastkiem kwadratowym z wariancji. Pojęcie odchylenia zostało wprowadzone 
przez pioniera statystyki, Karla Pearsona w 1894 roku. Odchylenie standardowe zmiennej lo-
sowej oznacza się tradycyjnie przez σ (małe greckie sigma) i definiuje jako pierwiastek kwa-
dratowy
 wariancji. Jest ono dane wzorem:

( )

(

)

(

)

2

X

E

X

E

=

σ

gdzie: E(X) jest wartością oczekiwaną X.

Metody   estymacji   parametrów   modeli   parametrycznych   pozwalają   na   jednoczesne 
wyznaczenie   macierzy   kowariancji   uzyskanych   parametrów.   Miarą   zmienności   zmiennej 
losowej   w   statystyce   jest   wariancja   definiowana   jako,  średnia   arytmetyczna  kwadratów 
odchyleń poszczególnych wartości zmiennej od jej  wartości oczekiwanej. Gdy rozważamy 
kilka zmiennych losowych ich zależność liniową określa funkcja kowariancji:

{ }

(

)

{ }

(

)

{

}

y

E

y

x

E

x

E

y

x

Cov

C

xy

=

=

)

,

(

gdzie:  C

xy

 – kowariancja pomiędzy zmiennymi x i y,

E – wartość oczekiwana

Mając   macierz   kowariancji   na   głównej   przekątnej   możemy   znaleźć   wartości   wariancji 
kolejnych parametrów modelu, a z nich pierwiastkując policzyć odchylenia standardowe. Jak 
już   powiedziano   przedziały   ufności   wyznacza   się   na   podstawie   znajomości   odchylenia 
standartowego. I tak wyróżnić możemy: metodę 1 σ gdzie, dla rozkładu normalnego, 68,3 % 
populacji próby losowej znajduje się w założonych przedziałach ufności, metodę 2 σ gdzie 
mamy 95,4 % i wreszcie metodę 3 σ gdzie mamy 99,7 % próby w przedziale ufności.

Modele modalne

W   ocenie   poprawności   estymacji   modeli   modalnych   stosuje   szereg   kryteriów. 
Najpopularniejszym z nich jest MAC (Modal Assurance Criterion). Wyznaczenie go polega 
na wyliczaniu relacji między dwoma wektorami modalnymi wg następującego wzoru:

{ }{ }

{ }{ }

(

)

{ } { }

(

)

*

'

'

*

2

*

'

'

,

ES

r

T

ES

r

test

r

test

r

ES

r

test

r

r

r

V

V

V

V

V

V

MAC

=

background image

Przyjmuje on wartość od 0 do 1. Wysoka wartość MAC wskazuje, że dwa porównywane 
wektory modalne są podobne. Ma to duże znaczenie przy wyborze najlepszego modelu do 
dalszych   analiz   oraz   przy   dostrajaniu   modeli   numerycznych   do   wyników   eksperymentu. 
Zgodność  modeli  eksperymentalnych   i  numerycznych  ma  kapitalne  znaczenie  w procesie 
wirtualnego prototypowania, gdzie odpowiednie dostrojenie modelu MES jest podstawowym 
warunkiem   umożliwiającym   przeprowadzenie   poprawnych   symulacji.   W   przypadku,   gdy 
model nie będzie dostrojony – zgodny z rzeczywistością wyniki obliczeń przeprowadzanych z 
zastosowaniem   takiego   modelu   nie   będą   wiarygodne.   Pochodnymi   kryterium   MAC   są 
MACCo i CoMAC.
Do   wskazania,   które   stopnie   swobody   mają   największy   wpływ   na   wartość   MAC   służy 
kryterium MACCo (Modal Assurance Criterion Contribution). Pokazuje ono, które stopnie 
swobody należy usunąć z modelu (wektorów modalnych), aby wartość MAC wzrosła do 
zadanego poziomu. Pozwala to na wskazanie miejsc o najwyższej wrażliwości na zakłócenia i 
eliminację błędnych pomiarów.
Aby porównać, w jaki sposób poszczególne stopnie swobody są ze sobą skorelowane posłu-
żyć należy się wskaźnikiem CoMAC (Coordinated Modal Assurance Criterion). Sprawdza on 
podobieństwo wektorów własnych obu modeli dla wszystkich PDW w kolejnych kierunkach 
pomiarowych. Rysunek poniżej przedstawia przykładowe wartości wskaźnika CoMAC – war-
tości bliskie 1 oznaczają dobrze skorelowane stopnie swobody.

background image

Modele nieparametryczne

Przejdźmy   teraz   do   oceny   modeli   nieparametrycznych.   Podstawowym   modelem 
nieparametrycznym jest widmowa funkcja przejścia układu dynamicznego. Funkcją pochodną 
do niej jest funkcja koherencji zwyczajnej. Funkcja ta informuje nas jaka część odpowiedzi 
dynamicznej   układu   (użytej   do   estymacji   WFP)   została   wywołana   przez   mierzone 
wymuszenie układu (również użyte do estymacji WFP). Innymi słowy daje ona pogląd na to 
na   ile   odpowiedź   układu   wywołana   była   danym   wymuszeniem.   Funkcja   koherencji 
zwyczajnej oznaczana jest przez 

γ

pq

2

 I jest wyliczana z następującego wzoru:

gdzie: GXF

pq

 wzajemna gęstość widmowa mocy pomiędzy odpowiedzią mierzoną w punkcie 

p a wymuszeniem zadawanym w punkcie q. 
Funkcja   koherencji   zwyczajnej   jest   określana   w   dziedzinie   częstotliwości   I   przyjmuje 
wartości   od   0   do   1.   Jest   ona   równa   1   dla   danej   częstotliwości   gdy   zmierzona   gęstość 
widmowa mocy jest wywołana całkowicie i jedynie przez zmierzoną gęstość widmową mocy 
wymuszenia.  Wartość   koherencji   mniejsza   niż   1   wskazuje,   że   zmierzona   odpowiedź   jest 
większa   od   tej   wywołanej   danym   wymuszeniem.   Może   to   być   spowodowane   działaniem 
innych źródeł, szumem pomiarowym lub nieliniowościami w układzie. Gdy wartość funkcji 
koherencji   jest   niska   do   poprawnej   estymacji   WFP   potrzebnych   jest   znacznie   więcej 
uśrednień.   Gdy   wartość   koherencji   jest   równa   zero,   odpowiedź   układu   jest   całkowicie 
wywołana przez źródła inne inż. Mierzone. Generalnie koherencja może być uznawana za 
miarę   udziału   szumu   w   pomiarach.   Na   rysunku   poniżej   pokazano   przykładowy  przebieg 
funkcji koherencji dla danej WFP.

background image

0

5 0

1 0 0

1 5 0

2 0 0

2 5 0

3 0 0

- 3 0

- 2 5

- 2 0

- 1 5

- 1 0

- 5

0

5

1 0

H z

d

B

(m

*s

-

2

/N

)

l e f t : 3 :     Y   :   l e f t : 3 :     Y

0

5 0

1 0 0

1 5 0

2 0 0

2 5 0

3 0 0

0

0 . 1

0 . 2

0 . 3

0 . 4

0 . 5

0 . 6

0 . 7

0 . 8

0 . 9

1

H z

/

l e f t : 3 :     Y   :   l e f t : 3 :     Y

Na   powyższym   rysunku   widać   wyraźnie,   że   wartości   koherencji   dla   danego   pomiaru   są 
odpowiednie dla zakresu częstotliwości 35 – 256 Hz. Poniżej tego pasma odpowiedź układu 
nie była powodowana jedynie przez mierzone wymuszenie. Rysunek ten pokazuje też inne 
ważne zjawisko, mianowicie spadek wartości koherencji w częstotliwościach rezonansowych 
i antyrezonansowych układu. 

Istnieją   też   kryteria,   które   pozwalają   na   porównywanie   modeli   nieparametrycznych   (np. 
WFP) uzyskanych w różnych eksperymentach i badaniach symulacyjnych w celu wyłonienia 
najlepszego modelu, bądź znalezienia zgodności pomiędzy modelem eksperymentalnym (rze-
czywistym) i numerycznym, zbudowanym np. przy pomocy MES.  Z grupy tych kryteriów 
wybrano  RVAC (Response Vector Assurance Criterion)  i  FRAC (Frequency Response 
Assurance Criterion)

Pierwsze kryterium rozpatruje wektory wartości amplitud WFP dla wszystkich stopni swobo-
dy w danej częstotliwości. Następnie liczony jest MAC między wektorem stworzonym z WFP 
z pierwszego pomiaru i wektorem WFP pochodzących z innego pomiaru lub wysyntezowa-
nych przy pomocy modelu ES. Operacja ta powtarzana jest dla całego zakresu częstotliwości i 
z uzyskanych wartości  MAC tworzony jest wykres w dziedzinie częstotliwości. Wartości 
RVAC bliskie 1 wskazują na duże podobieństwo WFP w danej częstotliwości. 

background image

RVAC(

ω

) = MAC({E

test

 (

ω

)},{U

fem

(

ω

)})

FRAC wyliczany jest ze wzoru:

( )

{

}

( )

{

}

( )

{

}

( )

{

}

( )

{

}

( )

{

}









=

*

*

2

*

)

(

test

j

i

test

j

i

ES

j

i

ES

j

i

test

j

i

ES

j

i

j

H

H

H

H

H

H

FRAC

ω

ω

ω

ω

ω

ω

gdzie: {H(

ω

i

)

j

} jest wektorem opisującym WFP dla stopnia swobody j dla zakresu częstotli-

wości 

ω

i

. Dobrze skorelowane WFP dają FRAC bliski 1. 

Ponieważ model elementów skończonych nieco zawyża sztywność obiektu, dlatego następuje 
przesunięcie w górę częstotliwości PDW. Efektem tego mogą być niskie wartości FRAC 
mimo faktycznego podobieństwa. Należy więc dobrać taką wartość współczynnika przesunię-
cia, WFP aby częstotliwości drgań własnych dla obu modeli się pokryły. Aby znaleźć najlep-
szą zgodność WFP, ustala się pewien zakres zmienności współczynnika przesunięcia i spraw-
dza, która wartość daje najlepsze wyniki. 

background image

Zadania do samodzielnego wykonania:

1. Zamodeluj analogicznie jak w przykładzie układ z rysunku poniżej i przeprowadź jego 
symulację wymuszając go szumem losowym. Przebiegi czasowe zarówno wejścia (siła f

1

jak i wyjścia (przemieszczenia x

2

) zapisz i dodaj do nich szum losowy o wartości amplitu-

dy = 20 % amplitudy sygnału zaszumianego. Następnie dokonaj estymacji parametrów 
modeli typu AR, OE i PEM i porównaj te modele przy pomocy kryterium AIC. Skomentuj 
wyniki.

Dane: M

1

 = 10, M

2

 = 7, C

1

 = 0.7, C

2

 = 0.9, C

3

 = 0.7, K

1

 = 120, K

2

 = 200, K

3

 = 170

2. Dla modelu z zadania 1 dokonaj estymacji WFP. Następnie zmień sztywności K

1

 i K

o około 10 % i ponownie dokonaj syntezy WFP. Porównaj otrzymane charakterystyki przy 
pomocy kryteriów FRAC i RVAC.

3. Zastosuj przebiegi wejścia (siła f

1

) jak i wyjścia (przemieszczenia x

2

) z zadania 1 do 

estymacji funkcji koherencji zwyczajnej (oba przebiegi bez zakłóceń). Następnie dodaj do 
przebiegu wyjścia szum losowy o amplitudzie  30 % amplitudy sygnału zaszumianego i 
ponownie policz funkcję koherencji zwyczajnej. Czy 30 % szum na wyjściu spowodował 
adekwatny spadek wartości funkcji koherencji?

4. Wygeneruj dwa zestawy 7 siedmioelementowych wektorów losowych. Dla wygenero-
wanych wektorów wyznacz macierz wskaźników MAC. Następnie weź tylko pierwszy ze-
staw i policz autoMAC (MAC pomiędzy dwoma identycznymi zestawami wektorów). Na-
stępnie do pierwszego zestawu wektorów dodaj szum losowy o wartości około 10 % am-
plitudy zakłócanych wektorów i jeszcze raz policz MAC pomiędzy zestawem wektorów 
bez i z zakłóceniem.