<j<0
Metoda analizy regresyjnej
Charakterystyka ta aprotćsymuje rzeczywistą charakterystykę obiektu (5:1), niewyznaczalną z powodu niemierzalności zakłóceń zlt z2,..., zP w kolejnych chwilach n(n =1,2, ..., N)..
Rys Wielowymiarowy obiekt badany
i;.-;:-.f Aby' wyznaczyć optymalnie współczynniki b0,b1}...,' bK naszego ..modelu -matematycznego (5^)? należy przyjąć kryterium dobroci tego modelu, np. w postaci . funkcji-; •
)jłjjy 'SR-== SR[{xly x2, ...,xN)}; {xi?Xii•••,xn}] . . 'y \■ (5s4)T
określającej odległość [5.21] między zbiorami wartości wielkości wyjścipwych {1i, x2,Xh] obiektiT^Sd) i wyjściowych {xly x2, •••, xN) modelu&■&).
‘ . .W praktyce bardzo dogodnym kryterium jest po prostu odległość euklidesowa w przestrzeni N-wymiarowej, która sprowadza zadania wyznaczenia optymalnego zestawu współczynników b0, bly..., bK modelu (5.-3) do minimalizacji wyrażenia
, . w . .♦ u . _____
' . sr -XI “ S o> •••> W • ' (5'5)
. v .«»/ ....... ...... • ■ ... ... ......■......
znanego od dawna w matematyce jako postulat lub zasada najmniejszej sumy kwadratów błędów. ... ... . . . - •
Zasada tą stanowi podstawę analizy rcgresyjnej. •.....•
..''I -ł- ■ [rp\A^-<^ C,, di. Ko -]k.
. '. ,: ■*» '
•' ? Zasada najmniejszej sumy kwadratów
Jeżeli jednak spróbujemy wyznaczyć współczynniki b0 i by we wzorze (5.6), przyjmując jednocześnie u — un oraz x= xn, przy czym n— 1,2.....9, to otrzymamy 9 równań . '
(5.7)
kYs. 5.2. Pomiary rozpuszczalności x azotanu sody \v.znlcżności od temperatury u
bo+bLUn n= 1,2,..., 9
Tablica 5.1
n |
wn |
xn |
1 |
0 |
66,1 |
2 |
4 |
71,0 • |
3 ' |
1° |
76,3 \ |
4 |
1'5 i:-; :1' |
- 80,6 |
5 ■- |
21 |
. 85,7 |
' • 6 |
.. ' .29 . ■ • |
* 92,9: |
7 |
36 ' |
99,4 |
8 |
51 |
113,6 ‘ |
9 |
68 |
125,1 |
o dwóch niewiadomych b0 i bt, przy czym równania te stanowią układ sprzeczny. Sprzeczność tych równań może być spowodowana bądź niedoskonałością teorii zakładającą zależność liniową, bądź błędami pomiarów, bądź łącznie jednym i drugim. Należy więc przyjąć związek (5.6) w postaci
(5.8)
(5.9)
x *= b0-\-byii-\-c .== x+e przy czym e oznacza błąd, natomiast x = bo+byU • .•
jest aproksymacją-rzeczywistego nieznanego związku. Podstawiając do wzoru (5.8) hasze obserwacje u„, xn(n = 1,2,..., 9) otrzymujemy odpowiednik układu równań (5;7) w postaci 9 równań ' • •••>••>»-
’ . (5.10)
= b0+bx u„+,en .. «:== l, 2, ..., 9
o 11 niewiadomych b0f bly e1} e2, Jest oczywiste, że nie można obliczyć
rzeczywistych wartości parametrów b0 i byy bez względu na liczbę obserwacji N. Można-jedynie wyznaczyć pewne oceny'rzeczywistych‘wartości parametrów, które będą na ogół tym lepsze, im większa będzie liczba obserwacji N.
Należy znaleźć taki sposób wyznaczania wartości b0 i bl y aby wartości bezwzględne błędów en były łącznic małe. . ...........
"■ Najprostszy pod względem rachunkowym okazał się postulat! najmniejszej sumy kwadratów błędów '
(5.11)
Sr = 2 e" = mIn
Zasada najmniejszej sumy. kwadratów błędów [5.11, 5.20], zwana często zasadą najmniejszych kwadratów, została wprowadzona do matematyki przez Le-gendre’a (1806 r.) i Gaussa (1809 r.). ’ ..•■• ■ - '■ •
Zasadę tę omówimy na klasycznym przykładzie [5.11] D. I. Mendelejewa z „Podstaw chemii” (1906 r.) dotyczącym rozpuszczalności x azotanu sodu w zależności od temperatury u.-Wyniki doświadczenia, zawierającego jY = 9 obserwacji,' podaje tabl. 5.1 oraz ilustruje.rys.'.5.2.jr •.?:ovvvv-: '.' Na podstawie rozważań teoretycznych, bądź na'podstawie, analizy danych' doświadczalnych (rys. 5.1), można przyjąć zależność liniową rozpuszczalności a1 od temperatury u w postaci . . :• • •