Opracowanie bezpośrednich wyników pomiarów.
Doświadczenie uczy, że przy wielokrotnym pomiarze jakiejś wielkości, otrzymujemy rozbieżne wyniki, mimo wszelkiej staranności obserwatora. Zakładamy przy tym, że poszczególny pomiar był dokonywany z dostateczną ścisłością, tzn. ze ścisłością odpowiadającą precyzji użytego narzędzia.
Z doświadczenia o rozbieżności wyników wypływa oczywisty wniosek, że żaden z poszczególnych pomiarów nie dał prawdziwego wyniku, że każdy pomiar obarczony był jakimś błędem.
Błąd średni pojedynczego spostrzeżenia.
Średni błąd pojedynczego spostrzeżenia należy do określonego rodzaju, który spełnia najlepiej wszystkie wymagania stawiane miernikowi dokładności. Ten rodzaj błędu został zaproponowany przez Gaussa i jego pełna nazwa brzmi - średni błąd kwadratowy pojedynczego spostrzeżenia. Najczęściej używaną nazwą jest jednak bardzo zwięzłe określenie ( błąd średni ), co w niektórych przypadkach może wywołać nieporozumienia i dlatego należy tej nazwy używać tylko wówczas, gdy takie nieporozumienia są wykluczone.
Błąd średni pojedynczego spostrzeżenia oznaczamy literą (m) i jest on określany wzorem :
wzór (1).
W oparciu o wzór (1) możemy powiedzieć następująco: błąd średni pojedynczego spostrzeżenia jest pierwiastkiem kwadratowym z przeciętnej wartości kwadratów błędów prawdziwych. Postać wzoru (1) jest jednak niewygodna przy praktycznych zastosowaniach, gdyż wymaga znajomości błędów prawdziwych (ε) , które jak wiadomo prawie nigdy nie są znane. W celu wyrażenia tego błędu sięgamy do wzoru (2):
wzór (2).
Wzór (2) jest niezwykle użyteczny, gdyż pozwala zastąpić wyrazy, w których występują błędy prawdziwe, przez wyrazy, w których występują błędy pozorne (wartości zawsze da się obliczyć). Tym sposobem, podstawiając wzory (1) i (2) otrzymamy bardzo wygodny w praktyce wzór na błąd średni pojedynczego spostrzeżenia a mianowicie:
wzór (3).
Wzór (3) jest prawie wyłącznie stosowany, a w każdym razie najczęściej stosowanym wzorem do obliczenia błędu średniego pojedynczego spostrzeżenia, tego powszechnie uznanego, najważniejszego miernika dokładności pomiarów inżynieryjnych.
Do obliczenia błędu średniego pojedynczego spostrzeżenia przy użyciu wzoru (3) możemy zastosować kilka metod. Począwszy ręcznego obliczenia- jednak mogłoby one być dość niewygodne ze względu na występujący we wzorze pierwiastek. Jednak używając kalkulatora pozbywamy się tego problemu. Dla własnej wygody i pewnej automatyzacji procesu obliczeniowego możemy napisać program liczący. Do tego celu możemy użyć takich aplikacji jak EXEL czy MATHCADitp. Do obliczeń można użyć dowolnych programów statystycznych, takich jak .............itp.
Błąd średni funkcji zależnych wyników pomiarów
Pomiarem nazywa się proces fizyczny porównywania wartości danej wielkości z wartością tej wielkości przyjętą umownie za jednostkę miary. Wynik pomiaru jest liczbą mianowaną, wyrażającą stosunek wartości danej wielkości fizycznej do wartości przyjętej za jednostkę.
Z praktyki wiadomo, że przy powtarzaniu pomiarów tej samej wielkości, tym samym instrumentem, z taką samą starannością, z reguły nie uzyskujemy identycznych wyników. Świadczy to o tym, że wyniki pomiarów różnią się od wartości prawdziwej. Różnicę między wynikiem pomiaru L i prawdziwą wartością LP mierzonej wielkości nazywamy błędem prawdziwym wyniku pomiaru i oznaczamy literą ε.
Ze względu na źródło pochodzenia błędy można podzielić na instrumentalne, osobowe oraz wywołane wpływem czynników zewnętrznych. Wszystkie błędy, bez względu na źródło ich pochodzenia, można podzielić na dwie klasy, tj. na błędy systematyczne i błędy przypadkowe. Błędy systematyczne wpływają na wynik pomiaru według ściśle określonych zasad. W omawianej klasie błędów można wyodrębnić: błędy systematyczne stałe (zachowujące stały znak i stałą wartość) oraz błędy systematyczne zmienne (zmieniające swoją wartość w trakcie pomiarów według ściśle określonego prawa). Błędy systematyczne mogą być z łatwością wykryte oraz wyeliminowane z wyników pomiarów, np. przez zastosowanie odpowiedniego sposobu pomiaru.
Błędy przypadkowe są to takie błędy, które przy zaistnieniu określonych warunków towarzyszących pomiarowi mogą wystąpić lub nie, mogą też przyjmować dowolny znak i dowolną wartość. Do klasy błędów przypadkowych zaliczymy również błędy grube, mimo że bardzo często wyodrębnia się je w specjalną grupę W przeciwieństwie do błędów systematycznych, błędów przypadkowych nie można wyeliminować z wyników pomiarów. Do badania błędów przypadkowych wykorzystywane są metody rachunku prawdopodobieństwa i statystyki matematycznej. Przedmiotem badań obu tych działów matematyki są, jak wiadomo, prawidłowości rządzące masowymi zjawiskami losowymi (przypadkowymi).
Zdarzeniem w rachunku prawdopodobieństwa nazywamy wynik każdego doświadczenia. Zdarzenie, które przy zaistnieniu S określonych warunków, może zajść, jest zdarzeniem losowym (przypadkowym).
Zdarzenie składające się z jednego zdarzenia elementarnego, należącego przestrzeni E, jest zdarzeniem prostym. W odróżnieniu od zdarzenia prostego zdarzenie złożone składa się co najmniej z dwóch zdarzeń elementarnych.
Zdarzenie, które zachodzi zawsze, ilekroć tylko zaistnieje zespół S określonych warunków, nazywamy zdarzeniem pewnym. Będziemy je oznaczali przez U. Drugim granicznym przypadkiem zdarzenia losowego jest zdarzenie niemożliwe, tj. takie zdarzenie, które mimo zaistnienia zespołu S warunków nigdy nie zachodzi.
Aksjomatyczna definicja prawdopodobieństwa
Aksjomat I. Każdemu zdarzeniu A przyporządkowana jest określona liczba P(A), zwana prawdopodobieństwem zdarzenia A spełniająca warunek
Aksjomat II. Prawdopodobieństwo zdarzenia pewnego równa się jedności
P(U) = 1.
Aksjomat III. Prawdopodobieństwo sumy przeliczalnej liczby zdarzeń, parami wykluczających się, równa się sumie prawdopodobieństw tych zdarzeń
Jednym z podstawowych pojęć rachunku prawdopodobieństwa jest zmienna losowa . Zmienna losowa jest to funkcja rzeczywista X = X (e), określona na przestrzeni E zdarzeń elementarnych, mająca następującą własność :
Dla każdego x є R ( { e: X (e)<x} є K ), gdzie K jest borelowskim ciałem zdarzeń, tj. zbiorem, zawierającym poza zdarzeniami A,B,C, ... również ich sumy, różnice i iloczyny, a także zdarzenie pewne i zdarzenie niemożliwe.
Funkcja X(e) będąca zmienną losową powinna więc charakteryzować się tym, że dla każdej liczby rzeczywistej x zbiór zdarzeń elementarnych e є E, dla których X(e)<x, powinien być zdarzeniem losowym. Pojęcie zmiennej losowej można zatem utożsamiać z przyporządkowaniem pewnych liczb poszczególnym wynikom doświadczenia. Zmienna losowa jest więc pewnego rodzaju charakterystyką liczbową zdarzeń przypadkowych, odzwierciedlającą wpływ zmian warunków towarzyszących każdemu doświadczeniu. Zmienne losowe oznaczamy na ogół dużymi literami z końca alfabetu X,Y,....
Wartości jakie te zmienne przybierają nazywać będziemy realizacjami zmiennych losowych lub krótko realizacjami i oznaczać odpowiednio małymi literami x,y,... Jedną ze zmiennych losowych najczęściej spotkanych w praktyce jest wynik pomiaru L lub błąd prawdziwy ε.
Prawdopodobieństwo tego, że zmienna x przybierze wartość x nazywa się rozkładem prawdopodobieństwa zmiennej losowej X.. Rozkład prawdopodobieństwa stanowi pełną charakterystykę zmiennej losowej. Niekiedy jednak wygodniej operować pewnymi parametrami dającymi dostatecznie dobre wyobrażenie o rozkładzie zmiennej losowej. Do najczęściej stosowanych w praktyce należą dwie grupy parametrów. Parametry pierwszej grupy dotyczą pewnych wartości zmiennej, które można uważać za punkty centralne rozkładów i noszą nazwę miar położenia. Parametry drugiej grupy, zwane miarami rozproszenia dają wyobrażenie o tym, jak bardzo poszczególne wartości zmiennej losowej odchylają się od owego centrum rozkładu.
Najważniejszym parametrem należącym do pierwszej grupy jest wartość oczekiwana zmiennej losowej, zwana też wartością przeciętną lub wartością średnią. Do miar rozproszenia należą wariancja i odchylenie standardowe oraz odchylenie przeciętne.
Wartością oczekiwaną zmiennej skokowej X o danym rozkładzie prawdopodobieństwa
P(k) = P(X = xk)
jest wyrażenie
w którym sumowanie względem k rozciąga się na wszystkie wartości xk. W przypadku gdy zmienna X przyjmuje nieskończenie wiele wartości, warunkiem istnienia wartości oczekiwanej jest zbieżność szeregu
Wartością oczekiwaną zmiennej ciągłej X o gęstości prawdopodobieństwa f(x) jest
pod warunkiem zbieżności całki
W podobny sposób definiuje się wartości oczekiwane funkcji zmiennej losowej.
Wartością oczekiwaną funkcji φ(x) zmiennej losowej X typu skokowego o rozkładzie prawdopodobieństwa
p(k) = P(X = xk),
jest wyrażenie
pod warunkiem zbieżności szeregu
Wartością oczekiwaną funkcji φ(x) zmiennej ciągłej X o gęstości prawdopodobieństwa f(x) jest
pod warunkiem zbieżności całki
Rozproszenie zmiennej losowej X związane jest z jej odchyleniem od wartości oczekiwanej
Z = X - E(X).
Z uwagi na to, że dla każdej zmiennej losowej
E(Z) = E[X - E(X)] = 0,
za podstawową charakterystykę rozproszenia zmiennej przyjęto jej wariancję definiowaną jako wartość oczekiwana kwadratu odchylenia zmiennej losowej od jej wartości oczekiwanej
V(X) = E(Z2) = E[X - E(X)]2.
Wariancję zmiennej X można też wyrazić w postaci
V(X) = E{X2 - 2XE(X) + [E(X)]2} = E(X2) - 2E[XE(X)] + E[E(X)]2,
stąd
V(X) = E(X2) - [E(X)]2.
Zgodnie z definicją wartości oczekiwanej funkcji zmiennej losowej, wariancję zmiennej skokowej można przedstawić jako
a wariancję zmiennej ciągłej w postaci
W praktyce bardzo często rolę miary rozproszenia zmiennej losowej spełnia odchylenie standardowe, definiowane jako dodatnia wartość pierwiastka kwadratowego z wariancji
W zastosowaniach geodezyjnych wykorzystuje się niekiedy również odchylenie przeciętne. Jest ono definiowane jako wartość oczekiwana bezwzględnej wartości odchylenia zmiennej losowej od jej wartości oczekiwanej
Przy założeniu, że zmienna X jest zmienną skokową, odchylenie przeciętne wyraża się wzorem
W przypadku gdy X jest zmienną ciągłą, mamy
Funkcja zmiennej jednowymiarowej.
Zajmijmy się wyznaczeniem wartości oczekiwanej oraz wariancji funkcji Y zmiennej losowej X
Y = φ(X).
Rozwińmy tę funkcję w szereg Taylora, w punkcie X = E(X). Mamy
Y =φ(X) = φ[E(X)] + φ'[E(X)][X - E(X)] + 1/2φ''[E(X)] [X - E(X)]2 +...
W praktyce, jak wiadomo, wartości zmiennej koncentrują się wokół wartości oczekiwanej. W związku z tym w trakcie linearyzacji funkcji wyższe potęgi odchyleń X - E(X) mogą być pomijane. Ograniczając rozwinięcie w szereg do pierwszej potęgi odchylenia zmiennej od jej wartości oczekiwanej, mamy
E(Y) = E[φ(X) ≈ φ[E(X)] + φ'[E(X)] E[X - E(X)],
E(Y) = E[φ(X)] ≈ φ[E(X)].
Wariancja zmiennej Y przybiera postać
V(Y) = V[φ(X)] = V {φE(X)]} + V{φ'[E(X)] [X - E(X)},
skąd
V(Y) = {φ'[E(X)}2V(X).
Funkcja zmiennej dwuwymiarowej
Niech zmienna losowa Z będzie funkcją zmiennych X i Y
Z = φ(X,Y).
Dokonując linearyzacji funkcji przy takich samych założeniach jak w poprzednim przypadku, mamy
Wartość oczekiwana zmiennej Z wynosi
Wariancja zmiennej Z przybiera następującą postać :
Stąd
Funkcja zmiennej n-wymiarowej
Wyniki uzyskane przy rozpatrywaniu funkcji zmiennej losowej dwuwymiarowej mogą być uogólnione na przypadek funkcji zmiennej n-wymiarowej
Wartość oczekiwana zmiennej U wynosi
Wariancję zmiennej U można wyrazić w postaci
Uzyskany wzór na wariancję funkcji liniowej zmiennych losowych ma związek z często stosowanym w praktyce prawem przenoszenia się błędów średnich.
Przyjmijmy, że dana jest funkcja
n wyników pomiarów. Zastępując wariancje zmiennych Li kwadratami błędów średnich m2i , a współczynniki korelacji zmiennych Li i Lj wartościami estymatorów rij , wzór zapisany wyżej przyjmie postać
Wzór ten wyraża kwadrat błędu średniego funkcji zależnych wyników pomiarów.
Do wykonania obliczeń powyższego błędu najkorzystniej jest użyć programu do obliczeń matematycznych jak np. Mathcad. Program ten daje szerokie możliwości wykonywania szybkich obliczeń. Posiada wbudowane algorytmy wykonywania działań na macierzach, szybkiego liczenia pochodnych funkcji dowolnego typu nawet tych bardzo złożonych. Pozwala ponadto na wprowadzanie danych i wykonywanie obliczeń z określoną dokładnością, dzięki możliwości określania ilości znaków dziesiętnych branych do obliczeń. Oczywiście wszystkie inne działania matematyczne tkj. całkowanie, sumowanie wielu składników, logarytmowanie czy liczenie granic są również możliwe z pełną automatyzacją i dużymi często bardzo intuicyjnymi udogodnieniami. Dane będące wynikami pomiarów mogą być np. zapisywane w postaci aktywnych tabel, z których program będzie automatycznie wybierał odpowiednie wartości i wykonywał na nich obliczenia zgodnie z zapisanym w arkuszu algorytmem. Możemy poza tym wstawiać do arkusza elementy tekstowe i graficzne, które w postaci komentarzy czy wykresów lub schematów mocno uczytelniają rozważany problem, ułatwiając jego zrozumienie i przyswojenie. W przypadku mojego zadania najwięcej trudności może sprawiać liczenie wielu pochodnych różnych funkcji, które mogą być niekiedy mocno złożone, zwłaszcza jeżeli analizujemy funkcję wielu zmiennych. Ponadto kłopotliwe i pracochłonne są działania na macierzach, które w powyższych obliczeniach mogą przyjmować często duże wymiary. Wydaje się zatem, że wykorzystanie Mathcad'a jest rozwiązaniem najlepszym z możliwych, gdyż uwalnia liczącego od wykonywania uciążliwych działań zostawiając mu jedynie konieczność wprowadzenia danych, oraz napisania algorytmu obliczeń, który ma jednak postać schematyczną tzn. operuje na ogólnych wzorach, natomiast podstawowe działania matematyczne są już zdefiniowane. Nie musimy zatem zajmować się ich rozpisywaniem co oszczędza nasz czas i zmniejsza ryzyko popełnienia błędu w rozpisywaniu algorytmu. Oczywiście gdybyśmy chcieli stworzyć aplikację roboczą do wykonywania obliczeń błędu średniego funkcji zależnych wyników pomiarów, korzystnym byłoby napisanie programu w jednym ze znanych i powszechnie wykorzystywanych językach programowania tkj. Np. Delphi, czy C++. Trzeba tu jednak otwarcie powiedzieć, że nie unikniemy problemu rozpisywania wielu obliczeń na części składowe, gdyż na poziomie języka programowania automatyzacja jest niewielka i większość algorytmów wykonuje jedynie działania podstawowe. Korzyści z napisania programu mogą nam jednak zrekompensować czas poświęcony na jego stworzenie. Uzyskujemy bowiem bardzo dużą automatyzację i przede wszystkim optymalnie skonfigurowany interfejs użytkownika, czego w Mathcadzie niestety nie możemy uzyskać.
Uważam, że względu na złożoność powyższych obliczeń oraz dużą informatyzację i powszechne wykorzystanie komputerów w pracach geodezyjnych, rozwiązanie problemu z pomocą klasycznych środków jak np. wszelkiego typu kalkulatory, czy nawet arkusz kalkulacyjny Excel jest zupełnie niecelowe i niepraktyczne. Pomijając już bowiem sam fakt pracochłonności, efekty tych działań są często tworami jednorazowymi i nie mogą być wykorzystane ponownie.
Średni błąd średniej arytmetycznej.
W praktyce geodezyjnej spotykamy się na ogół rzadziej z potrzebą obliczania średniego błędu funkcji złożonej z wielu zmiennych, częściej z zadaniem obliczenia średniego błędu pewnych prostych funkcji, zarówno jednej jak i wielu zmiennych. Wprowadzenie wzoru na średni błąd średniej arytmetycznej oprzeć można tak jak każdy inny szczególny przypadek na wzorze ogólnym:
wzór (4)
Słownie wyrazimy wzór (4) następująco; Błąd średni dowolnej funkcji różniczkowalnej równa się pierwiastkowi kwadratowemu z sumy iloczynów pochodnych cząstkowych podniesionych do kwadratu i pomnożonych przez odpowiednie kwadraty błędów średnich wielkości bezpośrednio pomierzonych.
Średnią arytmetyczną określa jak wiadomo następująca zależność:
wobec czego wszystkie pochodne cząstkowe mają jednakową postać
, ... ,
podstawiając to do wzoru (4) i oznaczając średni błąd średniej arytmetycznej przez (M) otrzymujemy:
wzór (5)
Zauważmy jeszcze, że średnie błędy poszczególnych spostrzeżeń ml są sobie równe, ponieważ z samej definicji wynika, że średnia arytmetyczna dotyczy szeregu wartości, odnoszących się do tej samej wielkości, a otrzymanych w drodze pomiarów jednakowo dokładnych czyli:
Po przekształceniu wzoru (5) otrzymujemy:
wzór (6)
Słownie wyrazimy wzór (6) następująco: średni błąd średniej arytmetycznej równa się średniemu błędowi pojedynczego spostrzeżenia, podzielonemu przez pierwiastek kwadratowy z liczby spostrzeżeń. Ze wzoru wynika, że im większa jest liczba spostrzeżeń, z których obliczono średnią arytmetyczną, tym mniejszy jest jej błąd średni, czyli tym większa jest dokładność, z jaką została wyznaczona. Przyjmując m=1 obliczę średni błąd średniej arytmetycznej dla kolejnych spostrzeżeń.
n |
1 |
2 |
3 |
4 |
5 |
8 |
10 |
20 |
50 |
100 |
M |
1 |
0,71 |
0,58 |
0,5 |
0,45 |
0,38 |
0,32 |
0,22 |
0,14 |
0,1 |
wykres (1)
Krzywa z wykresu (1) zbliża się asymptotycznie do osi odciętych, tzn. przy dostatecznie dużych (n) błąd średni (M) przyjmuje wartości dowolnie małe. Z wykresu widać wyraźnie , że tylko w przedziale pierwszych 10 spostrzeżeń następuje znaczny spadek wartości błędu (M), czyli poważniejszy wzrost dokładności. Dalsze zwiększanie liczby spostrzeżeń jest raczej bezcelowe, a na pewno nieekonomiczne.
Jeśli chodzi o obliczanie średniego błędu średniej arytmetycznej to sprawa ma się podobnie jak w przypadku błędu średniego pojedynczego spostrzeżenia.
Spostrzeżenia bezpośrednie o różnej dokładności (wagi).
Zdarza się często, że mamy do czynieni ze spostrzeżeniami (pomiarami), do których mamy różne stopnie zaufania- względna wiarygodność wyników pomiarów nie jest taka sama, gdyż jedna wielkość była mierzona z większą a inna z mniejszą precyzją. Można mieć różny stopień zaufania do wyników pomiarów nawet w przypadku gdy były jednakowo dokładne, lecz gdy wyniki zostały wyprowadzone z różnej liczby spostrzeżeń. Stopień zaufania powinien być odwrotnie proporcjonalny do błędu, lub do pewnej potęgi błędu. Liczbowy wyraz stopnia zaufania nazywa się wagą.
Waga spostrzeżenia jest to liczba dodatnia, odwrotnie proporcjonalna do kwadratu błędu średniego tego spostrzeżenia. Wyraża się wzorem:
wzór (7).
Gdzie: c- współczynnik proporcjonalności, p- waga spostrzeżenia, m- średni błąd pojedynczego spostrzeżenia
Celem wyrażenia wagi spostrzeżenia poprzez konkretną liczbę, trzeba wpierw przyjąć jakieś jednostkowe spostrzeżenie, którego waga równa jest jedności ( p=1). Tym sposobem wyznaczony zostaje współczynnik proporcjonalności (c ). Błąd średni takiego spostrzeżenia, któremu przypisano wagę 1, nazywa się błędem średnim spostrzeżenia typowego lub błędem spostrzeżenia o jednostkowej wadze i oznacza się go symbolem m0.
lub
gdzie i = 1,2,...,n wzór (8)
Najczęściej spotykamy się z określeniem wagi jako liczby wyrażanej wzorem:
Jednakże, gdy w rozważaniach występuje szereg obserwacji niejednakowo dokładnych, to trzeba te obserwacje scharakteryzować wspólnym błędem średnim m0. Zamiast szeregu n -obserwacji o różnej dokładności, możemy rozpatrywać szereg obserwacji o równej dokładności. Aby tego dokonać, należy sprowadzić wszystkie spostrzeżenia do jednej wagi. Przy zastosowaniu wzoru (8) i podstawieniu błędów prawdziwych w miejsce średnich otrzymamy:
Przy wykorzystaniu wzorów (1) i (3) do powyższego szeregu, otrzymamy błąd średni spostrzeżenia o jednakowej wadze, czyli błąd średni spostrzeżenia typowego:
gdy zastąpimy błędy prawdziwe, błędami pozornymi to otrzymamy:
wzór (9)
Słownie wyrazimy wzór (9): średni błąd spostrzeżenia typowego równa się pierwiastkowi z sumy kwadratów błędów pozornych, mnożonych przez odpowiednie wagi, podzielonych przez liczbę spostrzeżeń nadliczbowych.