20
WYKŁAD 2. ROZKŁADY ZMIENNYCH LOSOWYCH
Jeśli n jest duże, to —jest bliskie jedynki, a więc s2 i S2 różnią się nieznacznie. Ważne są następujące własności:
EX = EX,
EŚ2 = D2X.
Oznacza to, że przeciętna wartość średniej empirycznej z próby jest równa średniej teoretycznej (patrz str. 11) cechy w populacji generalnej, a przeciętna wartość wariancji empirycznej „z daszkiem" z próby jest równa wariancji teoretycznej cechy w populacji generalnej. Wynika stąd, że statystyki określone wzorami (2.3.1) - (2.3.7) mogą służyć do oszacowania odpowiednich parametrów teoretycznych.
Ogólnie: statystyki służące do szacowania nieznanych parametrów rozkładu cechy w populacji generalnej na podstawie próby, nazywa się estymatorami. O estymatorach będzie mowa w wykładzie 3. Dla porównania estymatorów z prawdziwymi wartościami parametrów służą statystyki:
Jt X-EX r U =-vn , a |
(2.3.8) |
X - EX /- |
(2.3.9) |
2 nS2 |
(2.3.10) |
Wzoru (2.3.8) używamy, gdy znane jest O, a wzoru (2.3.9), gdy a jest nieznane.
Dalej potrzebne będzie jeszcze pojęcie rozkładu chi-kwadrat Pearsona. Zmienna losowa o tym rozkładzie tradycyjnie oznaczana jest symbolem x2- Zmienna losowa x2 ma rozkład chi-kwadrat o n stopniach swobody, gdy jest sumą kwadratów niezależnych zmiennych losowych o rozkładzie normalnym N(0,1), tzn.
X2 = X? + X| + • • • + X2,
gdzie X,- są niezależne i mają rozkłady normalne N(0,1). Wtedy Ex2 = n oraz D2^2 = 2n. Tablice rozkładu chi-kwadrat ułożone są tak, że dla danych n i a, 0 < a < 1 podawane są wartości liczb Xa takie, że
Wartości te są podawane dla n ^ 30. Dla większych n rozkład chi-kwadrat jest zbliżony do rozkładu normalnego N (n, V2n^j.
Przy pomocy rozkładu chi-kwadrat i rozkładu normalnego N(0,1) definiuje się rozkład t-Studenta. Zmienna losowa o tym rozkładzie tradycyjnie oznaczana jest symbolem t lub T. Zmienna losowa t ma rozkład Studenta o n stopniach swobody, gdy wyraża się wzorem
gdzie X ma rozkład N(0,1), a x2 ma rozkład chi-kwadrat o n stopniach swobody oraz X i x2 są niezależne.
Tablice rozkładu Studenta ułożone są tak, że dla danych n i a, 0 < a < 1 podawane są wartości liczb ta takie, że