statystyka wykłady, Wyklad5-6, Rozkład normalny


Rozkład normalny

Jest to rozkład najczęściej spotykany w praktyce.. Funkcja gęstości prawdopodobieństwa dla zmiennej losowej o rozkładzie normalnym, zwanym także rozkładem Gaussa, określona jest wzorem

0x01 graphic

gdzie * jest dowolną liczbą rzeczywistą a * dowolną liczbą dodatnią. Wykres funkcji f(x) przedstawia tzw. krzywa Gaussa.

Z definicji funkcji gęstości wynika, że pole pod krzywą, niezależnie od jej kształtu, jest zawsze równe 1. Kształt i położenie krzywej określają dwa parametry:

- wartość oczekiwana 0x01 graphic

- wariancja 0x01 graphic

0x08 graphic

0x08 graphic

0x01 graphic

Ponieważ rozkład normalny jest najczęściej pojawiającym się rozkładem w biometrii, dla wygody przyjęto oznaczenie wskazujące na to, że zmienna losowa X ma rozkład normalny postaci:

X * N ( *, 0x01 graphic
).

Wśród nieskończenie wielu rozkładów normalnych szczególną rolę odgrywa rozkład normalny standaryzowany z wartością oczekiwaną równą 0 i wariancją 1, czyli rozkład N (0, 1), którego funkcja gęstości ma postać

0x01 graphic

Jeśli X * N ( *, 0x01 graphic
), to zmienna losowa Z postaci

0x01 graphic

ma rozkład normalny standaryzowany.

Estymator

Na podstawie obserwacji, które znalazły się w próbie uzyskuje się oceny parametrów populacji, czyli wartości estymatorów parametrów opisujących populację. Estymatorem jest każda funkcja obserwacji, która służy do oszacowania parametru. O ile wartość parametru jest liczbą opisującą populację, o tyle wartość estymatora jest liczbą uzyskaną na podstawie obserwacji, które znalazły się w próbie.

Średnia arytmetyczna jest estymatorem wartości oczekiwanej.

Wariancja z próby jest estymatorem wariancji w populacji

Inne rozkłady

Charakterystyki próby, jako funkcje obserwacji są zmiennymi losowymi o określonych rozkładach.

Jeśli próba pochodzi z populacji, w której cecha ma rozkład normalny z parametrami 0x01 graphic
, a ponadto próba jest mała, tzn. n < 30, to zmienna losowa postaci

0x01 graphic

gdzie 0x01 graphic
i s są średnią i odchyleniem standardowym obliczonym na podstawie n- elementowej próby, posiada rozkład t - Studenta z n-1 stopniami swobody. Gdy próba jest duża, czyli n * 30, wówczas rozkład t - Studenta przechodzi w rozkład normalny, a zatem zmienna losowa

0x01 graphic

będzie miała rozkład normalny standaryzowany.

Przy takich samych założeniach jak wcześniej iloraz

0x01 graphic

ma rozkład chi -kwadrat z n-1 stopniami swobody.

W sytuacji, gdy badamy dwie populacje i z każdej z nich pobieramy próbę, to iloraz

0x01 graphic

gdzie 0x01 graphic
i 0x01 graphic
dotyczą pierwszej populacji i pobranej z niej próby, a 0x01 graphic
i 0x01 graphic
dotyczą drugiej populacji i pobranej z niej próby posiada rozkład F- Snedecora z 0x01 graphic
oraz 0x01 graphic
stopniami swobody.

Estymacja przedziałowa

Średnia arytmetyczna i wariancja z próby są tzw. estymatorami punktowymi, bowiem oceniają nieznany parametr poprzez konkretną wartość liczbową. Obok estymatorów punktowych w statystyce wprowadza się także tzw. estymatory przedziałowe.

Przedziałem ufności nazywamy losowy, uzyskany na podstawie próby przedział, w którym z przyjętym prawdopodobieństwem (ufnością) leży nieznany parametr, czyli zachodzi następująca relacja

0x01 graphic
.

Przedział ufności dla wartości oczekiwanej

Rozważmy przypadek populacji, w której badana cecha ma rozkład normalny z wartością oczekiwaną * i wariancją *2. Z populacji tej pobieramy n -elementową próbę i na jej podstawie wyznaczamy oszacowania nieznanych parametrów.

Przedział ufności, dla wartości oczekiwanej przy ustalonym współczynniku ufności przyjmuje postać

0x01 graphic

gdzie 0x01 graphic
jest wartością z tablic t-Studenta dla n-1 stopni swobody, spełniającą warunek 0x01 graphic
, wielkość 1-* nazywamy współczynnikiem ufności.

Uwaga 1 : jeśli próba jest próba dużą (n>30), to w miejsce wartości 0x01 graphic
podstawiamy wartość u* z tablic rozkładu normalnego.

Uwaga 2: jeśli wariancja populacji jest znana, to w miejscu wartości krytycznej dla rozkładu t podstawiamy u* a oszacowanie wariancji czyli s zastępujemy przez σ.

Przykład 1

Obserwowano średnią temperaturę kwietnia w latach 1988 - 2000. Uzyskano dane:

15,3 15,7 13,3 18,5 16,6 14,9 15,1 14,3 15,0 13,8 13,7 13,9 17,6. Zbudować 95% przedział ufności dla wartości oczekiwanej.

n = 13, 1-* = 0.95

(14.26; 16.15)

Przedział ufności dla wariancji

Przypadek I

Jeśli próba jest mała (n<30), to przedział ufności dla wariancji wyznacza się ze wzoru

0x01 graphic

gdzie 0x01 graphic
są wartościami z rozkładu 0x01 graphic
spełniającymi następujące zależności

0x01 graphic
oraz 0x01 graphic
.

Przykład 2

Zbudować 90% przedział ufności dla danych z przykładu 1.

( 0.89; 3.59 )

Przypadek II

Jeśli próba pobrana z populacji jest duża (n*30), to w miejsce przedziału ufności dla wariancji konstruuje się przedział ufności dla odchylenia standardowego zgodnie ze wzorem

0x01 graphic

gdzie 0x01 graphic
jest wartością z tablic rozkładu normalnego spełniającą warunek 0x01 graphic
.

Przykład 3

Obserwowano średnią temperaturę kwietnia w latach 1961 - 2000. Okazało się, że odchylenie standardowe badanej cechy obliczone na podstawie tych danych jest równe 1.25. Zbudować 95% przedział ufności dla odchylenia standardowego średniej temperatury kwietnia.

Przedział ufności dla wskaźnika struktury

Wskaźnik struktury określa częstość występowania badanego stanu w populacji. Do oszacowania wskaźnika struktury pobieramy próbę z populacji i oznaczamy w niej liczbę elementów (osobników) posiadających daną cechę. Jeśli w n- elementowej próbie takich osobników jest m, to oszacowaniem wskaźnika struktury jest

0x01 graphic

Na tej podstawie szacuje się wskaźnik struktury według następującego wzoru

0x01 graphic
.

Przykład 4

W pewnej populacji badano liczbę osób palących. Wśród 400 zbadanych osób 80 było palących. Z dokładnością 99% chcemy oszacować metodą przedziałową wskaźnik osób palących w tej populacji.

W rozważanym przykładzie mamy m = 80, n = 400 oraz 0x01 graphic
. Stąd granice przedziału są równe:

0x01 graphic
,

czyli nieznany procent osób palących z prawdopodobieństwem 0.99 mieści się w przedziale ( 14.8; 25.2 ).

5



Wyszukiwarka

Podobne podstrony:
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 3 Rozkład normalny
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 6 Rozkład normalny i prawd
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Rozkład normalny i prawd
Wykład3 rozkład normalny
wyklad 4 rozklad normalny
tablice statystyczne wartosci krytyczne rozkladu normalnego
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 9b Rozkład normalny
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 6c Rozkład normal
STATYSTYKA WYKŁAD wybrane rozkłady zmiennych lsoowych
Rajfura A, Statystyka Wyklad 04 ROZKLAD CIAGLY 2012 13
04 Wykład 4 Charakterystyka rozkładu normalnegoid 4819
statystyka wykład
statystyka wyklady, Szkoła WSTiH

więcej podobnych podstron