Aproksymacja średniokwadratowa dyskretna
Wprowadzenie
Danych jest (n+1) różnych punktów x0, x1, ... , xn z przedziału *a,b+ oraz wartości pewnej
funkcji y = f(x) w tych punktach
y0 = f(x0) , y1 = f(x1) , .... , yn = f(xn).
W przybliżeniach interpolacyjnych przyjmuje się , że funkcja przybliżająca F w punktach
xi pokrywa się z wartościami funkcji f. Wymóg ten jest często niedogodny, gdy wartości
f określone są empirycznie (np. są wynikami pomiarów). Wtedy wartości te mogą byd
obarczone błędami, i wówczas żądanie, aby szukana funkcja F przyjmowała dokładnie te
wartości nie ma sensu.
Zajmiemy się teraz zagadnieniem bardziej ogólnym, w którym warunek, aby funkcja
przybliżana i funkcja przybliżająca przyjmowały dokładnie te same wartości w punktach
xi , nie musi byd spełniony.
Przyjmujemy, że funkcja przybliżająca F jest określona przez zależnośd
F(x) = F(x; a0, a1, .... , am)
od (m+1) parametrów a0, a1, ... , am , przy czym
Ogólnie , zagadnienie aproksymacji na zbiorze punktów X = {x0, x1, ... , xn } polega na
wyznaczeniu parametrów a0, a1, ... , am tak, aby odległości yi (i = 0,1, ... ,n) od F były
minimalne. Sposób wyznaczania parametrów zależy od tego, jak rozumiemy to kryterium.
Aproksymacja średniokwadratowa dyskretna
Niech = ( 0, 1, , ... , m) będzie układem (m+1) funkcji określonych na przedziale *a,b+.
Będziemy rozważad zadanie aproksymacji liniowej polegające na przybliżaniu funkcji f
kombinacjami liniowymi funkcji j (j = 0, 1, ... , m)
Termin "liniowy" odnosi się do liniowej zależności F od parametrów aj ; nie wymagamy,
aby F zależała liniowo od x.
W aproksymacji średniokwadratowej dyskretnej, lub inaczej w metodzie najmniejszych
kwadratów, współczynniki aj dobieramy tak, aby wyrażenie
zwane odchyleniem średniokwadratowym, miało najmniejszą wartośd.
Funkcję Fm , dla której H osiąga minimum nazywamy m-tą funkcją optymalną (względem
układu na zbiorze X).
Zadanie znajdowania funkcji aproksymacyjnej Fm sprowadza się do znalezienia minimum
funkcji (m+1) zmiennych. Poszukiwane wartości współczynników wyznaczamy z warunków
zerowania się pochodnych cząstkowych
= 0 , k = 0, 1, ... , m
Powyższe równości tworzą układ (m+1) równao liniowych z (m+1) niewiadomymi
a0, a1, ... , am , zwany układem równao normalnych
Ga = b,
gdzie G = [Gi,j] (i,j = 0, 1, ... , m) , a = [a0, a1, ... , am ]T, b = [b0, b1, ... , bm ]T ,
,
(i,j = 0, 1, ... , m).
Macierz G, zwana macierzą Grama, jest macierzą kwadratową stopnia (m+1).
Można zapisad
G = MTM i b = MTy,
gdzie y = [y0, y1, ... , yn ]T i
Uwaga. Macierz G jest nieosobliwa wtedy i tylko wtedy, gdy rząd macierzy M
jest równy (m+1).
Stąd wynika, że
Twierdzenie. Jeżeli rząd macierzy M jest równy (m+1), to istnieje dokładnie jedna m-ta
funkcja optymalna (w sensie aproksymacji średniokwadratowej dyskretnej).
Błąd średniokwadratowy oblicza się ze wzoru
Gdy m = n i rząd M jest równy (n+1), to n-ta funkcja optymalna jest funkcją interpolującą
funkcji f opartą na węzłach X. Wówczas odchylenie średniokwadratowe H i błąd średnio-
kwadratowy są równe 0. Interpolacja jest jedną z metod aproksymacji - nazywana jest
często aproksymacją interpolacyjną.
Przyjmując m n tracimy własności wygładzania "zakłóconych" wartości yi , jakie ma
aproksymacja średniokwadratowa. W praktyce, najczęściej m jest znacznie mniejsze niż n.
Aproksymacja wielomianowa i trygonometryczna
Funkcje
określają postać funkcji aproksymującej. Rozpatrzymy wielomiany algebraiczne
i funkcje trygonometryczne
Jeżeli funkcje
są wielomianami stopnia j (j = 0, 1, 2 , ... , m), to Fm jest wielomianem stopnia
co najwyżej m. Wtedy funkcję optymalną Fm nazywamy m-tym wielomianem (algebraicznym)
optymalnym.
W przypadku jednomianów
, już dla niedużych m (m>5) układ równao normalnych
jest źle lub bardzo źle uwarunkowany (W13). W przypadku przybliżeo wielomianowych
z wyjątkiem , gdy m jest bardzo małe, nie należy stosowad takiego wyboru funkcji
. Należy
stosowad tzw. wielomiany Grama ; omówienie tych problemów przekracza ramy wykładu.
Uwaga. Przy aproksymacji takimi wielomianami macierz G jest macierzą diagonalną.
W zagadnieniach aproksymacji często spotykamy się z przypadkiem, gdy yi są wartościami
pomiarowymi pewnego zjawiska , o którym wiadomo, że ma przebieg okresowy. Wtedy
do aproksymacji korzystniej jest stosowad wielomiany trygonometryczne, a nie algebraiczne.
Niech
(
).
Rozważamy na odcinku [0,2] aproksymację trygonometryczną postaci
na zbiorze równoodległych punktów
i = 0, 1, .... , n
Na tym zbiorze punktów macierz Grama jest macierzą diagonalną. Ponadto
j = 1, 2, ... ,k
Powiedzmy, że mamy ustalony układ funkcji = ( 0 , 1 , , ... , m , ...) . Liczbę funkcji
przybliżających, czyli wartośd (m+1), ustalamy na podstawie analizy modelu badanego
zjawiska lub wyznaczając kolejne funkcje optymalne Fm (m = 0, 1, 2 , ..... ) i obliczając
kwadrat średniego błędu
gdzie Hm jest odchyleniem średniokwadratowym dla m-tej funkcji optymalnej Fm. Obliczenia
te prowadzimy tak długo, aż
maleje w sposób istotny. Wartośd m, po której
już niemaleje znacznie, wyznacza układ funkcji przybliżających 0, 1, , ... , m .
m
n
Fm x
( )
0
m
j
a
j
j x
( )
H a
0
a
1
....
a
m
0
n
i
y
i
Fm x
i
2
0
n
i
y
i
0
m
j
a
j
j x
i
2
a
k
H
2
0
n
i
y
i
0
m
j
a
j
j xi
k xi
G
i j
0
n
k
i x
k
j x
k
b
i
0
n
k
i x
k
y
k
M
0 x
0
0 x
1
.
.
0 x
n
1 x
0
1 x
1
.
.
1 x
n
.
.
..
.
.
.
.
.
.
.
m x
0
m x
1
.
.
m x
n
1
n
1
0
n
i
y
i
F x
i
2
j
j
j x
( )
x
j
j
1 sin x
( )
cos x
( )
sin 2 x
(
)
cos 2 x
(
)
....
sin k x
(
)
cos k x
(
)
(
)
2 k
n
F
2 k
1
x
( )
a
0
1
k
j
a
j
cos j x
(
)
b
j
sin j x
(
)
x
i
2
i
n
1
a
0
1
n
1
0
n
i
y
i
a
j
2
n
1
0
n
i
y
i
cos j x
i
b
j
2
n
1
0
n
i
y
i
sin j x
i
m
2
H
m
n
m
m
2
m
2