gdzie o2 tttnacza wariancję w populacji, p — 'rvdnui w populacji, a A'. \
elementów populacji. Sumowanie, co jest oczywiste. obejmuje wszystkie den, populacji. Definicja ta pokazuje, że wariancja <r jest średnia arytmctyc/m, \\ kość (X - m»; jest kwadratem odchylenia od średniej. Dzieląc sumę Ił A M, ,
Vr. otrzymujemy średni kwadrat odchylenia
W praktyce wariancja w populacji jest zazwyczaj nieznana i musi zost.a cowana na podstawie danych / próby. Wariancje z próby stosowana jako cm>m <r wyraża wzór
gdzie y jest wariancja z próby albo estymatorem o* uzyskanym / próby średnia z próby. N zaś jest liczba pomiarów w próbie
Wielu autorów we wzorze definiującym wariancję z próby j dzieli I (.Y przez iV. a nie przez N - I Oczywiście, jeżeli /V jest liczba duża. różnica w w,,, jaca z zastosowania A' zamiast N - I będzie niewielka. W wielu jednak synu,
N nie jest liczba duża i różnica ta jest nie bez znaczenia. Na czym polega im różnicy między zastosowaniem JV i Ar - I? Wartość otrzymana przez podzieli: sumy kwadratów przez M czyli Z (A' - JCf/N. daje obciążony estymator o2. W un. ta określa <r. obciążona jest jednak systematycznym błędem. Co znaczy tu sb. obciążona? Znaczy ono. że na dłuższa metę, gdybyśmy mieli pobierać liczne pn o liczebności N z populacji o średniej p. obliczać s* dla każdej próby, posługuj, się Al. i uzyskiwać średnia wartość s\ wartość ta nie zbliżałaby się stopniowo cor_ bardziej do wartości cT. lecz wykazywałaby systematyczna tendencję do oddala' się od O*. Jest ona obciążona. Stopień tego obciążenia równy jest (;V 1 )/A \
tomiast gdy I (X - X): dzielimy przez Al- 1. otrzymujemy nie obciążony estyrna:. rr Taki estymator nie będzie wykazywał systematycznej tendencji do tego. by h\. większym bądź mniejszym niż ar2.
Wariancja jest statystyka operującą jednostkami podniesionymi do kwadratu k żeli (AT- A'! jest pomiarem wyrażonym w centymetrach, to wielkość (A’ - Aj wyr.i/n jest w centymetrach kwadratowych. Z wielu względów biodaej pożądane jest {*>•■ giwamc się pomiarami nie wyrażonymi w jednostkach podniesionych do kwadra:, lecz w jednostkach pierwotnych. Osiągamy to. wyciągając pierwiastek kwadratów \ wariancji W wy niku oirzymujemy odchylenie standardowe.
Odchylenie standardowe w populacji wyraża się wzorem:
a odchylenie standardowe / próby wzorem:
' N - I
Rozpatrzmy przykład. Jc/et, odchylenie standardowe ilorazu mtcl.gencp w grupie studentów wynmi 15. oznace ,n 15 punktu na skal, II fezdś średni 11 w grupie studentów wynos, 100, a pcw,cn konkretny student ma 11 równy 130. to student ten jest o 30 jednostek skal, I I . |uh dwa odchylenia standardowe po^ wyżej średniej.
Jakie znaczenie można przypisać wyrażeniu ,v - | w odróżnieniu od IV jest liczba pomiarów. nątomiaM W - I jest liczb* odchyleń od .redmej. które mo*a lit swob«Kjnię zmieniać. Rozważmy dla przykładu pomiary 7. H , 15. Ich brednia równa jest 10. odchylenia /xś od średniej wynos/* -3. -2. *5. Surru odchyleń od średniej zawsze równa jest 0. a zatem (-3) ♦ (-2) ♦ <5, = 0 Ponieważ uk jes: to jeżeli znamy dowolne dwa odchylenia, tr/ccic jest ustalone Nie może oę ono zmieniać.
W przykładzie tym suma kwadratów odchyleń od średniej równajet9-4>
♦ 25 = 38. Aczkolwiek tę sumę kwadratów otrzymuje się przez dodanie do siebie trzech odchyleń podniesionych do kwadratu, to tylko dwa / nich maj* swobodę zmieniania się. Liczbę wartości, które maj* swobodę zmieniania się. nazywamy liczb* stopni swobody. Mówi się. że z wielkości* na przykład I <X - XV zwijane jest N - I stopni swobody , ponieważ spośród iV odchyleń podniesionych do kwa-drutu, z których wielkość ta się składa. N - I może się zmieniać Słuszność wymagania. by w dctinicji miary zmienności sumę kwadratów dzielić przez liczbę wartości, które maj* swobodę zmieniania się. jest w pewnym stopniu intuicyjnie uchwytna Pojęcie stopni swobody jest bardzo użytecznym i powszechnie przyjętym pojęciem w statystyce, /.ostanie ono omówione szczegółowo w dalszych rozdziałach tej książki.
W tym. co pow iedziano dotychczas, definicja w ariancji została wyprowadzona / rozważań nad odchyleniami «h1 średniej arytmetycznej. Inne możliwe podejście, być może bardziej elementarne, polega na wyjściu od rozwa/ań nad różnicami między każd* wartością a każd* inn* wartości*. W przypadku tylko dwóch pomiarów. .Y| i Xi, mamy do czynienia z różnic* .V, - X W przy padku trzech pomiarów. X,. X2 i A\. mamy do czynienia z różnicami .Y, - X:. X, .Y . i X: - X-.. Uogólniając, dla ;V pomiarów liczba takich różnic wynosi N(N - li/2.
Na przykład dla pomiarów I. 4. 7. 10 i 13 różnice między każdym pomiarem a każdym innym pomiarem wynoszą: -3. -6. -9. -12, -3. -6. -9. -3. -6 i -3. Zwróćmy uwagę, że znak różnicy zalczy od uporządkowania pomiarów Jeżeli otrzymujemy sumę kwadratów różnic między każdym pomiarem j każdym innym pomiarem i dzielimy tę sumę przez liczbę tych ró/mc. wynik jest sclsIc związany z wielkości* .v\ jest to mianowicie dwukrotność v W naszym przykładzie suma kwadratów różnic równa jest 450. Dzielimy tę sumę przez 10 i otrzy mujemy 45.0. Jest to wielkość równa podwojonej wariancji 22.5, obliczonej według wzoru i5 3,. Ogólnie rzecz biorąc, w zapisie algebraicznym można to uj*c następująco:
mzM = 2r. (5-4)
N(N- iy2
89