6
1 Podstawowe* miary stystyc/.m*. . .
Inną miarą przeciętną pozycyjną jest mediana. Jest to taka wartość cechy, która dzieli zbiór obserwacji na połowę (tzn. 50% danych ma wartości mniejsze lub równe medianie)
Me gdy n jest nieparzyste ^ ^
\ 5 (*? + * J+i) ( Sdy n Jest parzyste
Mediana jest w większym stopniu niż średnia odporna na obserwacje odstające (obserwacje o wartościach znacznie odbiegających od pozostałych, np. zbyt małe lub zbyt duże w porównaniu do reszty obserwacji, w j. ang. zwane outtiers). Wadą mediany jest to, że przy jej obliczaniu nie są brane pod uwagę wszystkie obserwacje, a jedynie ich porządek, oraz jedna lub dwie „środkowe” obserwacje.
Mediana jest szczególnym przypadkiem innej miary położenia - kwartyla. Kwartyle dzielą zbiór obserwowanych wartości cechy statystycznej na ćwiartki. Mamy zatem pierwszy kwartyl (lub dolny kwartyl, 25% obserwacji) Q\, drugi kwartyl (medianę, 50% obserwacji) = Me i trzeci kwartyl (górny kwartyl, 75% obserwacji) Qz\
gdy n|4 gdy n + 3|4 gdy n + 2|4 gdy n+ 1|4
(1.3)
gdzie odpowiednio m 1,3 dla Qi
Uogólnieniem kwartyli są kwantyle, które dzielą zbiór obserwacji na określone części (np. dla kwantyla o rzędzie 0,95 otrzymujemy taką wartość cechy, dla której 95% obserwacji ma wartości od niej mniejsze lub równe). Czasami wykorzystuje się też pojęcie percentyla, przy podawaniu miejsca podziału w procentach, a nie w postaci ułamka (np. percentyl 95% odpowiada kwantylowi 0,95).
Jeśli w zbiorze obserwacji jedna wartość występuje najczęściej, to nazywamy ją wartością modalną (lub modą, dominantą) i oznaczamy przez D.
Uwaga! Zazwyczaj przyjmuje się, że jeśli kilka wartości obserwowanej cechy występuje tak samo często, ale częściej niż inne wartości, to dominanta nie jest wtedy określona. W niektórych podręcznikach przyjmuje się jednak inną umowę i w takich przypadkach definiuje kilka wartości modalnych.
Miary zmienności (rozrzutu) informują o zmienności (zróżnicowaniu) obserwacji w szeregu statystycznym.
Najważniejszą z nich jest wariancja, podająca średnią kwadratów różnic (odchyleń) pomiędzy poszczególnymi obserwacjami a średnią:
s2= . (1.4)
Uwaga! Wzór ten obowiązuje dla sytuacji, gdy posiadane przez nas dane (obserwacje z szeregu statystycznego) opisują całą rozpatrywaną populację (wariancja populacyjna). Jeśli nasze obserwacje obejmują tylko część przypadków