Rozpoczniemy od teorii. Przede wszystkim należy sobie uzmysłowić, że średnia x obliczona z próby jest zmienną losową. Losując np. kilka 31-osobowych grup pracowników przemysłu w wieku 30...40 lat uzyskamy kilka prób pobranych z tej samej populacji. Średnie ciśnienie skurczowe x w każdej z tych grup będzie zapewne trochę inne. Uzyskane w ten sposób średnie x są kilkoma realizacjami zmiennej losowej którą, można nazwać „średnią z 31-elementowcj próby pobranej losowo z populacji”. Z teorii wiemy, że wartością oczekiwaną tej zmiennej losowej jest nieznana nam średnia p populacji generalnej
£(*) = P
Innymi słowy, wszystkie średnie z prób grupują się wokół rzeczywistej średniej z populacji. Grupują się tym bliżej, im mniejszy był rozrzut w samej populacji generalnej oraz im większa była liczebność próby. Z teorii wynika bowiem, że wariancja średniej z próby /ł-clementowej wyraża się wzorem:
a2(x)=j (4.1)
gdzie:
a2 — wariancja w populacji generalnej.
Teoria mówi nam poza tym, że jeżeli populacja ma rozkład normalny to także średnia z próby ma rozkład normalny. Co więcej, jeśli nawet rozkład populacji nic jest normalny, to rozkład średniej z próby w miarę wzrostu liczebności próby bardzo szybko dąży do rozkładu normalnego ze średnią p (gdzie p — rzeczywista średnia w populacji) i wariancją
~ (por.rys.4.1).
Wszystkie te wyniki — teoretycznie bardzo ważne dla zrozumienia własności zmiennej losowej: „średnia z próby n-elementowej" — byłyby również bardzo użyteczne dla celów estymacji przedziałowej, gdybyśmy znali rzeczywistą wartość wariancji o2 w populacji generalnej. Wtedy moglibyśmy skorzystać z faktu, że zmienna losowa x ma rozkład
<T2
normalny ze średnią p i wariancją —, czyli że zmienna
u = (4.2)
a '
ma znany dobrze z literatury standaryzowany rozkład normalny. Ponieważ jednak a2 zwykle nic jest znane, pozostaje nam wykorzystać zmienną t określoną wzorem:
40