2. Elementy teorii błędów. Przedziały ufności
W praktyce pomiarowej występują trzy rodzaje błędów:
grube,
systematyczne,
przypadkowe.
Według kryterium metody pomiaru obserwacje mogą być:
bezpośrednie,
pośrednie.
Według kryterium dokładności wyniki pomiaru dzielimy na:
jednakowo dokładne,
różnodokładne.
Cel zagadnień wyrównawczych:
wyznaczenie wartości najprawdopodobniejszych,
oszacowanie dokładności obserwacji pojedynczych, względnych, wartości przeciętnych oraz funkcji wyznaczonych analizowanych zmiennych.
Podstawowymi parametrami opisującymi zmienną losową x są: wartość przeciętna
(2.1)
i odchylenie standardowe σx
(2.2)
W zadaniach praktycznych odchylenie standardowe σx zastępowane jest jego estymatorem. Wartość ta wyznaczona jest na podstawie wyników pomiaru i w tej postaci nazywana jest błędem średnim. W zadaniach geodezyjnych (tylko) oznaczana przez m. W innych dyscyplinach określana jest mianem błędu standardowego i oznaczana jest symbolem s.
(2.3)
Rozkład normalny. Rozkład empiryczny w miarę wzrostu liczby danych przyjmuje kształt rozkładu normalnego o funkcji gęstości opisanej wartością przeciętną oraz odchyleniem standardowym.
(2.4)
Zmienna standaryzowana. Wprowadzenie tzw. zmiennej standaryzowanej t
(2.5)
przy założeniu σ = 1 przekształca wzór (2.4) do postaci
(2.6)
Rys. 2.1. Funkcja gęstości rozkładu normalnego zmiennej standaryzowanej
Dystrybuanta. Przy rozwiązywaniu zadań praktycznych wykorzystywana jest dystrybuanta
(2.7)
(2.8)
Dystrybuanta określa prawdopodobieństwo wystąpienia wartości zmiennej x w przedziale <- ∞, x2 〉, jak na rys. 2.2.
Rys. 2.2. Dystrybuanta rozkładu normalnego. Rzędna D(t = 0,8) jest miarą powierzchni zakreślonej na rys. 2.1.
Przedziały ufności. Aby wyznaczyć prawdopodobieństwo P, że zmienna x znajdzie się w przedziale <x1, x2〉 należy wyznaczyć dystrybuanty dla obu wartości zmiennej x po ich uprzedniej standaryzacji wzorem (2.5). Szukane prawdopodobieństwo P{x1 < x < x2} jest różnicą wartości prawdopodobieństw.
P{x1 <x <x2 } = P(x2) - P(x1) = D(t2) - D(t1) (2.9)
Zadania praktyczne rozwiązuje się za pomocą tablic.
Przykład 2.1. Dla zbioru danych stanowiącego wynik pomiaru odległości {145.33, 145.39, 145.30} obliczyć prawdopodobieństwo P{ x ჱ 145.39 }
Dla podanych wartości wyznaczamy:
wartość przeciętną dśr = 145,34
błąd standardowy pojedynczej obserwacji m = 0,045
zmienną standaryzowaną
Rys. 2.3. Ilustracja do przykładu 2.1
Z tablic dystrybuanty rozkładu normalnego dla zmiennej t = 1.11 odczytujemy P(t) = 0,279. Szukane prawdopodobieństwo wynosi
P{x1<x<x2}= 0,5 + 0,366 = 0,866
Przykład 2.2. Obliczyć prawdopodobieństwo P {145.33 ს xśr ს 145.36} dla wyników obserwacji jak w przykładzie 2.1.
Podobnie jak w przykładzie 2.1 parametry rozkładu wynoszą dśr = 145,34, m = 0,045 , mśr = 0,026. Stąd
Rys. 2.5. Ilustracja do przykładu 2.3
Z tablic odczytujemy P(t1) = 0,149 oraz P(t2) = 0,279, stąd
P{145.38 ს xśr ს 145.45} = P(t1) + P(t2) = 0,428
P{145.38 ს xśr ს 145.45} = 0,428
Przykład 2.3. Dla zmiennej α obliczyć przedział ufności <α1, α2〉 o prawdopodo-bieństwie P = 0,90, dla danych {112.71g, 112,75g, 112,76g}, przy założeniu, że |α1| = |α2|.
Wartość przeciętna αśr i błąd standardowy m wyznaczone dla zbioru danych wynoszą:
αśr = 112,74g, m = 0,026g.
Ponieważ przedmiotem analizy jest tylko zmienna α nie ma potrzeby wyznaczania błędu mśr. Dla P/2 (przedział jest symetryczny), w tablicy dystrybuanty rozkładu normalnego znajdujemy tα = 1,65. Wartość α1 wyznaczana jest ze wzoru na zmienną standaryzowaną.
Szukany przedział wyznaczają granice ს112.70, 112.78〉.
13
_
_
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
- 2 - 1 0 1 2 t
xśr
D(t)
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
- 2 - 1 0 1 2 t
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
2 1 0 1 2 t
1.0
0,5
1.0 D(t)
D(t = 0,8)
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
2mśr mśr 0 mśr 2mśr
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
2m m 0 m 2m
1.0
0,5
_
_
_
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
- 2 - 1 0 1 2 t
0.5 P(t)
t = 0,8
_
_
_
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
2 1 0 1 2 t
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
2ၳ ၳ 0 ၳ 2ၳ
0,4
0,2
_
_
_
_
x
x
D(t)
x
P
__
_
0,5
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
- 2 - 1 0 1 2 t
ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ ჯ
- 2ၳ - ၳ 0 ၳ 2ၳ