o liczbę niezależnych równań wiążących te niewiadome. Gdybyśmy mieli 5 niewiadomych i układ trzech równań liniowych z tymi niewiadomymi, to moglibyśmy arbitralnie przyjąć wartości dwu niewiadomych, a pozostałe trzy byłyby określone poprzez równania — układ taki miałby 2 stopnie swobody. Obliczając oszacowanie wariancji z próby o liczebności n obserwacji korzystamy ..po drodze" z jednego równania, a mianowicie z zależności
x- ‘m 1 n
która pozwoliła nam wyliczyć średnią. Dysponujemy wobec tego nie n lecz n-1 niezależnymi odchyleniami od średniej x. Inaczej mówiąc mamy do dyspozycji n-1 stopni swobody, gdyż jeden straciliśmy dla wyznaczenia średniej — i właśnie taką wartość musimy użyć do nieobciążonego estymatora wariancji. Gdybyśmy znali prawdziwą średnią populacji i posługiwali się odchyleniami od tej rzeczywistej średniej — nie byłoby straty jednego stopnia swobody. Jak się przekonamy później (por. np rozdz. 7) ogólna formuła na oszacowanie wariancji da się sprowadzić do poniższego zapisu:
oszacowanie _ suma kwadratów odchyleń od pewnej wartości wariancji liczba stopni swobody
Na zakończenie rozważań o oszacowaniu wariancji warto podać pewną tożsamość, użyteczną przy praktycznych obliczeniach:
Użyteczność tej tożsamości wynika z faktu, że zamiast najpierw wyliczać średnią x i potem sumować odchylenia (x,-jf)2 — co wymaga dwukrotnego przeglądania zbioru danych — możemy raz analizować dane, wyznaczając dwie sumy pomocnicze Lr, oraz z których potem bez trudu określimy wartość średnią i odchylenie standardowe.
3.2.3 Obliczanie miar rozrzutu dla szeregów rozdzielczych
Zostaną teraz podane wzory na obliczanie odchylenia przeciętnego, wariancji i odchylenia standardowego dla danych w postaci szeregów rozdzielczych. Wzory te oparto na założeniu, że wszystkie obserwacje należące do danej klasy rozłożone są równomiernie na długości przedziału klasowego, a wobec tego można dla celów obliczeniowych traktować je tak, jakby były skupione w środku przedziału klasowego. Założenie takie (gdy nic jest spełnione) daje nieco zawyżone wartości miar rozrzutu.
36