Każda średnia obliczona z próby o liczebności N stanowi estymator sted,. w populacji Średnia w populacji jest wartością, która obliczono by. gdyby rno/ii byfc> dokonanie pomiarów wszystkich elementów populacji. Różnice między wam.., nu z ptóby a wartością W populacji omówiono w rozdziale I. C harakiery ,t>. 7. cechą średniej jest to, ze w przypadku większości rozkładów jest ona dokładnie: bąSB skuteczniejsza jako estymator średniej w populacji aniżeli takie nu.uy i. cp centralnej, jak mediana i wartość modalna jako estymatory odpowiadając >v.t wartości w p«»pulacji Średnia jest najmniej podatna na błąd Jest to tedna / ; laęCWTćtórei icst ona najczęściej stosowaną miarą tendencji centralnej Do tego twierdzenia przekraczałby zakres tej książki.
Omówiliśmy szereg cech średniej arytmetycznej. Jakie jest znaczenie t> cech? Dlaczego trzeba je omawiać? Fakt. że suma odchyleń od średniej równa K 0, poważnie upraszcza postać wielu dzialaiT~algebraicznych. Każdy c/.Ton • TawTer^umiTódiniytfn ód średnięJTzTnika ToT“'c suma kwadratów odchyleń średniej jest najmniejsza, pozwala sformułować alternatywną definicję średni-. średnia jest to mŁzi miara tendencji centralnej, od której kwadrat odchyleń > 'najmniejszy. W istocie średnia jest miarą łcndcpcji centralnej w sensie na,nu, SzyćlHćwadratóss Metoda najmniejszych kwadratów ma ogromne znaczenie w m.; ty Sty cc i jest stosowana na przykład przy dopasowywaniu prostych i krzywy, Średnią można uważać za punkt określony metodą najmniejszych kwadratów Fak: ze średnia z próby stanowi lepszy estymator parametrujłopulacji aniżeli inne miar tendencji centralnej, ma znaczenie zasadnicze. W całej statystyce zajmujemy formułowaniem twierdzeń o wartościach charakteryzujących populację, upicrau się na naszej wiedzy o wartościach charakteryzujących próbę. Oczywiście im d. kładmejsze są te twierdzenia, tym lepiej.
Inną powszechnie stosowaną miarą tendencji centralnej jest mediana. Media: jest wartością dzielącą wszystkie pomiary na pól. czyli tak. że połowa pomiaru 'nmFsci się poniżej niej. a poło w iTp<> wyżej Rozważmy następujące wartości zmier nej X uporządkowane według rang. gdzie R określa rangę, a N jest liczbą nieparzystą:
X 2 7 16 19 20 25 27
# 1 2 3 4 5 6 7
W przykładzie tym medianą jest 19. Odpowiada ona randze środkowej. Trzy pomiary mieszczą się poniżej niej. a trzy powyżej Gdy dodamy jeszcze jeder. gomiar. na przykład 31. wówczas,ALsiaic sic liczba parzyffif tmedmne określa mc zgodnie z przyjętym zwyczajem, dowolnie, średnią arytmetyczną z dw. wartości smdkowych. 19 i 20. a więc i l‘J * 20J/2 |ó,5
W przypadku niektórych zbiorów danych pojawiają się problemy z oblicza nietn mediany Rozpatrzmy następujące wartości zmiennej X:
I 2345/>7^ <t ,0
Dla łych 10 wartości mus.my określić laki punki, by pniowa pomiarów rme ściła sic p<łwyżcj niego, a połowa ponilej Możemy tu zastmnwać dwie różne procedury Wybór procedury należy od tego. czy zmienna traktujemy ;uko cu,.-Uj czy jako nieciągłą. Jeżeli zmienna w naszym przykładzie jest ciągła, możemy przyjąć. że wartości 8 zajmują przedział od 7.5 do %JS Medianę określamy wówcza* przez interpelację Umową. W tsm przypadku interpolujemy dwie trzecie dpr-gt W kierunku przedziału, tak ul lic punkt powyżej i pomZej którego Ujęta s* po
połowic pomiarów Mediana równa jest w« 5 ♦ 0.67 /eh nMnmćut
zmienna jest nieciągła i może przyjmować wartości tylko -.pośród bćzbcałkowitych, to za medianę przyjmujemy wynik odpowiadający randze środkowej, równej tS + \/l W naszym przykładzie. jeżeli dane są nieciągłe, mediana równa jest 3.
Gdy pewne wartości zmiennej występują więcej niż jeden raz. i zmienna jest nieciągła, medianę oblicza się metodą stosowaną przy obliczaniu mediany dla danych pogrupowanych w postaci rozkładu liczebności, opisaną w rozdziale 4 7
Obliczanie mediany dla danych pogrupowanych w postaci rozkładu liczebności polega na określeniu takiej wartości zmiennej, by połowa pomiarów mieściła się powyżej niej. a połowa poniżej. Metoda ta zostanie przedstawiona na przykładzie danych / tabeli 4.2.
Tabela 4.2. Rozkład liczebności wyników testu psychologicznego
- > |
-^ [ |
3 -1 |
Podział |
Liczebność |
Liczebność |
klasowy |
skumulowana | |
45-49 >. |
1 |
76 |
40-44 r’ |
2 |
75 |
35-39 |
3 |
73 |
30-34 |
6 |
70 |
25-29 |
K |
64 |
20-24 |
17 |
56 |
15-19 |
26 |
39 |
10-14 |
11 |
13 |
5-9 |
2 | |
0-4 |
Ó |
6 |
Razem |
76 |
Wykonujemy następujące kroki: Po pierwsze, zapisujemy liczebności skumulowane jak w kolumnie 3. Po drugie, określamy wielkość SI2. czyli połowę przypadków. W naszym przykładzie jest to 38. Po trzecie, odszukujemy przedział kia.
75