Rozkład normalny
Jest to rozkład najczęściej spotykany w praktyce.. Funkcja gęstości prawdopodobieństwa dla zmiennej losowej o rozkładzie normalnym, zwanym także rozkładem Gaussa, określona jest wzorem
gdzie * jest dowolną liczbą rzeczywistą a * dowolną liczbą dodatnią. Wykres funkcji f(x) przedstawia tzw. krzywa Gaussa.
Z definicji funkcji gęstości wynika, że pole pod krzywą, niezależnie od jej kształtu, jest zawsze równe 1. Kształt i położenie krzywej określają dwa parametry:
- wartość oczekiwana
- wariancja
Ponieważ rozkład normalny jest najczęściej pojawiającym się rozkładem w biometrii, dla wygody przyjęto oznaczenie wskazujące na to, że zmienna losowa X ma rozkład normalny postaci:
X * N ( *,
).
Wśród nieskończenie wielu rozkładów normalnych szczególną rolę odgrywa rozkład normalny standaryzowany z wartością oczekiwaną równą 0 i wariancją 1, czyli rozkład N (0, 1), którego funkcja gęstości ma postać
Jeśli X * N ( *,
), to zmienna losowa Z postaci
ma rozkład normalny standaryzowany.
Estymator
Na podstawie obserwacji, które znalazły się w próbie uzyskuje się oceny parametrów populacji, czyli wartości estymatorów parametrów opisujących populację. Estymatorem jest każda funkcja obserwacji, która służy do oszacowania parametru. O ile wartość parametru jest liczbą opisującą populację, o tyle wartość estymatora jest liczbą uzyskaną na podstawie obserwacji, które znalazły się w próbie.
Średnia arytmetyczna jest estymatorem wartości oczekiwanej.
Wariancja z próby jest estymatorem wariancji w populacji
Inne rozkłady
Charakterystyki próby, jako funkcje obserwacji są zmiennymi losowymi o określonych rozkładach.
Jeśli próba pochodzi z populacji, w której cecha ma rozkład normalny z parametrami
, a ponadto próba jest mała, tzn. n < 30, to zmienna losowa postaci
gdzie
i s są średnią i odchyleniem standardowym obliczonym na podstawie n- elementowej próby, posiada rozkład t - Studenta z n-1 stopniami swobody. Gdy próba jest duża, czyli n * 30, wówczas rozkład t - Studenta przechodzi w rozkład normalny, a zatem zmienna losowa
będzie miała rozkład normalny standaryzowany.
Przy takich samych założeniach jak wcześniej iloraz
ma rozkład chi -kwadrat z n-1 stopniami swobody.
W sytuacji, gdy badamy dwie populacje i z każdej z nich pobieramy próbę, to iloraz
gdzie
i
dotyczą pierwszej populacji i pobranej z niej próby, a
i
dotyczą drugiej populacji i pobranej z niej próby posiada rozkład F- Snedecora z
oraz
stopniami swobody.
Estymacja przedziałowa
Średnia arytmetyczna i wariancja z próby są tzw. estymatorami punktowymi, bowiem oceniają nieznany parametr poprzez konkretną wartość liczbową. Obok estymatorów punktowych w statystyce wprowadza się także tzw. estymatory przedziałowe.
Przedziałem ufności nazywamy losowy, uzyskany na podstawie próby przedział, w którym z przyjętym prawdopodobieństwem (ufnością) leży nieznany parametr, czyli zachodzi następująca relacja
.
Przedział ufności dla wartości oczekiwanej
Rozważmy przypadek populacji, w której badana cecha ma rozkład normalny z wartością oczekiwaną * i wariancją *2. Z populacji tej pobieramy n -elementową próbę i na jej podstawie wyznaczamy oszacowania nieznanych parametrów.
Przedział ufności, dla wartości oczekiwanej przy ustalonym współczynniku ufności przyjmuje postać
gdzie
jest wartością z tablic t-Studenta dla n-1 stopni swobody, spełniającą warunek
, wielkość 1-* nazywamy współczynnikiem ufności.
Uwaga 1 : jeśli próba jest próba dużą (n>30), to w miejsce wartości
podstawiamy wartość u* z tablic rozkładu normalnego.
Uwaga 2: jeśli wariancja populacji jest znana, to w miejscu wartości krytycznej dla rozkładu t podstawiamy u* a oszacowanie wariancji czyli s zastępujemy przez σ.
Przykład 1
Obserwowano średnią temperaturę kwietnia w latach 1988 - 2000. Uzyskano dane:
15,3 15,7 13,3 18,5 16,6 14,9 15,1 14,3 15,0 13,8 13,7 13,9 17,6. Zbudować 95% przedział ufności dla wartości oczekiwanej.
n = 13, 1-* = 0.95
(14.26; 16.15)
Przedział ufności dla wariancji
Przypadek I
Jeśli próba jest mała (n<30), to przedział ufności dla wariancji wyznacza się ze wzoru
gdzie
są wartościami z rozkładu
spełniającymi następujące zależności
oraz
.
Przykład 2
Zbudować 90% przedział ufności dla danych z przykładu 1.
( 0.89; 3.59 )
Przypadek II
Jeśli próba pobrana z populacji jest duża (n*30), to w miejsce przedziału ufności dla wariancji konstruuje się przedział ufności dla odchylenia standardowego zgodnie ze wzorem
gdzie
jest wartością z tablic rozkładu normalnego spełniającą warunek
.
Przykład 3
Obserwowano średnią temperaturę kwietnia w latach 1961 - 2000. Okazało się, że odchylenie standardowe badanej cechy obliczone na podstawie tych danych jest równe 1.25. Zbudować 95% przedział ufności dla odchylenia standardowego średniej temperatury kwietnia.
Przedział ufności dla wskaźnika struktury
Wskaźnik struktury określa częstość występowania badanego stanu w populacji. Do oszacowania wskaźnika struktury pobieramy próbę z populacji i oznaczamy w niej liczbę elementów (osobników) posiadających daną cechę. Jeśli w n- elementowej próbie takich osobników jest m, to oszacowaniem wskaźnika struktury jest
Na tej podstawie szacuje się wskaźnik struktury według następującego wzoru
.
Przykład 4
W pewnej populacji badano liczbę osób palących. Wśród 400 zbadanych osób 80 było palących. Z dokładnością 99% chcemy oszacować metodą przedziałową wskaźnik osób palących w tej populacji.
W rozważanym przykładzie mamy m = 80, n = 400 oraz
. Stąd granice przedziału są równe:
,
czyli nieznany procent osób palących z prawdopodobieństwem 0.99 mieści się w przedziale ( 14.8; 25.2 ).
5