ROZKŁAD t-STUDENTA
Rozkład standaryzowany t, jest rozkładem wartości Z, czyli standaryzowanych średnich z wielu prób, o średniej z populacji p. = 0 i błędzie standardowym o = 1. Gdy pobrana z populacji próba jest duża, możemy zamiast błędu standardowego populacji a użyć błędu standardowego s próby. Co jednak należy robić w sytuacji, gdy próba jest niewielka, a my dysponujemy tylko błędem standardowym s z próby ?
Jeśli z populacji o rozkładzie normalnym pobieramy próby N-elementowe. to dla każdej takiej próby można obliczyć statystykę t:
/ Sx
Rozkład wartości t dla prób N-elementowych, z populacji o rozkładzie normalnym jest zgodny z teoretycznym rozkładem L Ten teoretyczny rozkład jest rozkładem symetrycznym, ale nieco odmiennym od rozkładu normalnego. Dla każdej wielkości próby N jest on inny; przy próbach małych jest on bardzo spłaszczony, przy próbach dużych zbliża się do rozkładu normalnego.
Spójrzmy na rozkład t dla wartości N= 10, czyli dla df = 9. W tablicach podane są wartości krytyczne t dla danego poziomu istotności . Dla poziomu istotności 0.05 wartość krytyczna wynosi t= 2.262. Jest ona zatem większa od wartości krytycznej dla rozkładu normalnego wynoszącej 1.96 . Wynika to właśnie z tego. że wartości t obliczamy opierając się na małych próbach i na błędzie standardowym próby, a nie populacji. Dlatego im większa próba tym mniejsze wartości krytyczne t dla danego poziomu istotności. Rozkładem granicznym rozkładu t dla dużych prób jest rozkład normalny.
Rozkład t ma duże znaczenie praktyczne, ponieważ wielkość pojedynczej próby rzadko przekracza 100 pomiarów i zwykle parametry populacji takie jak średnia i odchylenie standardowe nie są znane. Dysponujemy jedynie średnimi i odchyleniami z próby. Rozkładem t możemy się posługiwać tak jak rozkładem normalnym wówczas, gdy nie znamy błędu standardowego populacji i dysponując nawet małymi próbami. Pamiętać jednak należy o ważnym założeniu wymaganym przy stosowaniu tego rozkładu : próba musi pochodzić z populacji o rozkładzie normalnym.
Obliczanie przedziału ufności :
Wyobraźmy sobie, że dysponujemy 15 czaszkami samców kozic z Tatr, o średniej długości X = 198,1 mm i odchyleniu standardowym s = 15,2 mm i chcemy określić przedział ufności dla tej próby. Zakładamy, że te 15 pomiarów czaszek stanowi niezależną próbę losową z populacji generalnej o rozkładzie normalnym.
=3.92.
Znając odchylenie standardowe s i wielkość próby N, obliczamy błąd standardowy próby : si
Liczba stopni swobody wynosi df= N-l= 15-1= 14 . Aby obliczyć 95% przedział ufności, stosujemy poziom istotności 0.05 dla test dwustronnego i df= 14. Dla tych wartości, wartość krytyczna t= 2,145.
Dolna granica przedziału ufności wynosi X -sil = 198,1 - 3,92- 2,145 = 189,7
Natomiast granica górna . X + S^t = 198,1 + 3.92 ■ 2,145 = 206,5. Przedziały ufności zapisuje się zwykle jako średnią ± przedział ufności, czyli dla 95% przedziału ufności; 198,1 ± 8,4.