O pomiarach i ich błędach
Jak postępować w takiej sytuacji? Błędu pomiaru, jeśli ma on naturę niesystematyczną (tzn.
jest dziełem przypadku) nie sposób uniknąć. Możemy jednak zminimalizować jego wpływ na
wyniki modelowania poprzez wykorzystanie w procesie modelowania większej niż
niezbędnie konieczna liczby pomiarów.
Teraz wypowiemy ważne zaklęcie, przywołując imię Gaussa, wielkiego niemieckiego
matematyka. Spośród wielu jego dokonań, jednym z najważniejszych było „wymyślenie”, czy
też może raczej odkrycie rozkładu, opisującego statystyki częstości cech w wielkich
populacjach, np. rozkład błędu pomiaru tej samej wielkości przez wiele urządzeń
pomiarowych, lub rozkład wielu niezależnych pomiarów tym samym urządzeniem. Załóżmy
więc, że błędy pomiaru prędkości i czasu mają rozkład normalny (Gaussa) o zerowej
wartości oczekiwanej (jak na rysunku poniżej). Co więcej, pomiary prędkości i czasu mają
rozkład wartości taki, że ich wartości oczekiwane są równe rzeczywistym. [Więcej informacji
o zmiennych losowych, rozkładach i innych pojęciach statystyki można znaleźć sięgając do
felietonów nt. zarządzania ryzykiem, również na CIRE].
Gdybyśmy dokonywali niezależnego wielokrotnego pomiaru czasu i położenia (np. za
pomocą ogromnej ilości urządzeń pomiarowych), wówczas średnia wartość pomiarów
odpowiadałaby rzeczywistej wartości mierzonej wielkości. Ale tak nie jest – czas płynie
nieodwracalnie, a my mamy dokładnie jeden zegarek i taśmę mierniczą. Nie należy się tym
zniechęcać – nadal możemy korzystać z przywołanego imienia Gaussa i uczynić pożytek
z posiadanej dużej liczby par pomiarów (x, t), poprawiając jakość szacowania v i x0.
Mylić się jest rzeczą ludzką, czyli twórcze wykorzystanie błędu w modelowaniu
Konsekwencją błędów pomiaru (x, t) może być błąd szacowania v i x0, co będzie skutkować
błędami predykcji położenia. A teraz Czytelniku, wzmóż czujność! Za chwilę dokonamy
bardzo ważnego zabiegu myślowego, który będzie nam towarzyszył przy każdym tekście
poświęconym aproksymacji.
Załóżmy, że mamy już jakiś model (tzn. wartości v i x0) – możemy go uzyskać np. po
„wejrzeniu w sufit”. Model ten daje predykcję
xm=x0
m+vmt
Pomiar czasu t jest obarczony błędem niesystematycznym (rozkład Gaussa). Jeśli „sufitowe”
wartości x0
m, vm są zgodne z rzeczywistymi, wówczas wartość xm obliczona z modelu różni
się od wartości x pomierzonej, a rozkład różnic (xm – x) jest – jak nietrudno się domyśleć –
Gaussowski o wartości oczekiwanej równej zeru.
Co się stanie wówczas, gdy mieliśmy pecha i „odczytaliśmy z sufitu” niewłaściwe wartości
x0
m, vm? Gauss i w tym przypadku nie zawiedzie – różnice (xm – x) będą nadal miały rozkład
Gaussa, jednak wartość oczekiwana będzie różna od zera – pojawi się błąd systematyczny.
Można to zaobserwować na poniższym rysunku. Linią ciągłą zaznaczono wartość
rzeczywistą położenia (nieznaną zarówno podczas pomiarów, jak i modelowania), niebieskim
trójkątem – wynik jego pomiaru, czerwonym kwadratem – aproksymację z modelu idealnego,
zaś zielonym kółkiem – aproksymację z modelu nieidealnego. Widać, że pomiary „trzymają
się” w otoczeniu wartości rzeczywistej, podobnie zresztą wynik modelowania z modelem
idealnym. Mamy tu zresztą do czynienia z sytuacją, gdy pomiar czasu jest obarczony
mniejszym błędem niż pomiar położenia. Ponieważ czas jest wejściem naszego modelu, a
prędkość jest niewielka, błąd aproksymacji położenia obiektu wyznaczonego z modelu jest
mniejszy niż błąd pomiaru tego położenia. Model odbiegający parametrami od rzeczywistych
(nieidealny) nawet optycznie odbiega od pomiarów (nie mówiąc o rzeczywistości, której nie
zawsze znamy).
Tradycyjna technika modelowania matematycznego polega na poszukiwaniu takiego
aproksymatora, którego błąd, odniesiony do obserwacji wartości modelowanej, ma zerową
wartość oczekiwaną. A zatem chodzi o to, aby model dający początkowo ciąg zielonych
kółek przekształcić tak, by zakończyć na modelu generującym ciąg czerwonych
kwadracików.
Omówienie technik pozwalających na dokonanie powyższego zabiegu (rozpoczynając od
technik regresji liniowej) zawrzemy w kolejnych odcinkach cyklu.