13
Materiały do kursu STATYSTYKA I ZASTOSOWANI A KOMPUTERÓW - semestr zimowy 2000/2001.
STATYSTYKI OPISOWE ROZKŁADÓW
Oczywiście możemy oceniać „na oko” różnice pomiędzy rozkładami czy grupami wyników, ale zdecydowanie lepszym pomysłem jest posługiwanie pewnymi wielkościami, które służą nam do opisu charakterystyki rozkładu czy grupy wyników. Do tego celu służą nam statystyki opisowe, które możemy podzielić na miary tendencji centralnej opisujące przeciętne wyniki oraz miary dyspersji opisujące ich rozproszenie.
Podstawowe statystyki opisowe można pogrupować na miary tendencji centralnej, opisujące przeciętne wyniki oraz miary dyspersji opisujące rozproszenie wyników.
Średnia arytmetyczna M = -
wyniki
Xt+X2+... + XN
N
, gdzie Xl,X2,...,XN to konkretne
Przykład: 5 osób piszących test uzyskało odpowiednio: 2,2,6,7,8 punktów. Średnia wynosi 5 punktów (2 + 2 + 6 + 7 + 8 = 25; 25 dzielone pizez 5 osób daje średnią 5).
Wartość średnia nie jest wystarczającą wielkością do opisu rozkładu punktów, możemy mieć np. wyniki 5, 5, 5, 5, 5 i średnia również jest rów na 5, w ięc musimy posługiwać się dodatkowo wielkością opisującą rozproszenie wyników' wokół średniej.
Średnia ma trzy istotne własności :
1. Jest wrażliwa na ekstremalne wyniki, np. gdyby w grupie osób przeciętnie zarabiających znalazł się miliarder to średnia zarobków' w tej grupie źle reprezentowałaby wysokość zarobków.
2. Suma odchyleń wszy stkich wyników od średniej równa jest zero, co zapisujemy:
£ (X . - M ) = 0
np. korzystając z powyższego przykładu z testem, opuszczając dla uproszczenia indeksy :
£(X - M) = (2-5)+(2-5)+(6-5)+(7-6)+(8-5) = -3-3+1+2+3 = 0.
3. Suma kwadratów' odchyleń wszystkich wyników od stałej jest minimalna, kiedy ta stała jest
średnią, co możemy zapisać —M)2 = minimum .
Mediana to wartość przeciętna zmiennej na skali co najmniej porządkowej. Wartość ta dzieli na połowę uporządkowane wyniki od najmniejszego do największego, tak że poniżej niej znajduje się co najmniej 50% wyników. W naszym przykładzie z testem, medianą jest wartość 6, bo poniżej i powyżej tej wartości znajdują się po dwa wyniki: 2, 2, 6. 7, 8.
Modalna (dominanta) to wartość najczęściej występująca. W naszym przykładzie jest to wartość 2 występująca dwukrotnie.