Poniżej na przykładzie zostanie omówiony sposób liczenia średniej arytmetycznej w szeregu szczegółowym. Oto treść zadania.
Zadanie
Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:
Polecenie:
Podaj wartość i interpretację: średniej arytmetycznej.
Rozwiązanie:
Moja definicja średniej arytmetycznej jest następująca.
Średnia arytmetyczna działa jak socjalizm. Zabiera tym, co mają najwięcej i daje tym, co mają najmniej, tak, aby wszyscy mieli po równo.
Na szczęście w statystyce nie musimy się zastanawiać czy to dobrze czy źle.
Pytanie brzmi:
Jaka jest średnia ocena z zaliczenia?
Oto wzór na średnią arytmetyczną:
Sprawdźmy czy mamy wszystkie potrzebne elementy.
xi oznacza oceny poszczególnych studentów. Stojący wcześniej znak sumy oznacza, że musimy wszystkie oceny zsumować. Dodajemy do siebie zatem po kolei
Suma wszystkich ocen wynosi 44. Czyli mamy:
n oznacza liczebność zbiorowości. Naszą zbiorowością są badani studenci. Ilu było studentów? Tyle co ocen, czyli 11. Zatem nasza zbiorowość liczy 11 elementów. Czyli:
n = 11
Chyba już mamy wszystkie brakujące elementy. Możemy zatem podstawiać do wzoru.
Czyli średnia arytmetyczna równa się 4. Czas na interpretację.
Interpretacja średniej arytmetycznej.
Średnia ocena z zaliczenia to czwórka.
Poniżej na przykładzie zostanie omówiony sposób liczenia dominanty w szeregu szczegółowym. Oto treść zadania.
Zadanie
Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:
Polecenie:
Podaj wartość i interpretację: dominanty.
Rozwiązanie:
Dominanta czyli wartość, która dominuje. Wartość, która występuje najczęściej.
Ale jaka wartość?
Kilka linijek wyżej napisałem, że wszystko, co liczymy i interpretujemy dotyczy cechy zmiennej. W naszym przypadku oceny z zaliczenia. Czyli aby odnaleźć wartość dominanty wystarczy odpowiedzieć sobie na pytanie: jaka ocena dominuje? Jaka ocena występuje najczęściej? Jaką ocenę studenci otrzymywali najczęściej?
Rzut oka na oceny studentów i już wiemy, że najczęściej studenci otrzymywali z zaliczenia piątki. Czyli dominanta równa się 5. Tak! To takie proste! Dominantę oznaczamy dużą literą D. Zatem możemy zapisać:
D = 5
Interpretacja dominanty.
Studenci najczęściej otrzymywali z zaliczenia piątkę.
lub
Najczęściej występującą oceną z zaliczenia była piątka.
A co jeśli np. trójek byłoby tyle samo co piątek? Wówczas nie ma dominującej oceny, czyli nie ma dominanty!
Poniżej na przykładzie zostanie omówiony sposób liczenia mediany w szeregu szczegółowym. Oto treść zadania.
Zadanie
Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:
Polecenie:
Podaj wartość i interpretację: mediany.
Rozwiązanie:
Mediana nazywana jest wartością środkową. Oznaczamy ją tak:
Me
Mediana jest to wartość cechy zmiennej, jaką posiada jednostka stojąca pośrodku uporządkowanego szeregu.
W naszym zadaniu jest to ocena jaką dostał student stojący pośrodku uporządkowanego szeregu. Jakiego szeregu? O co chodzi?
Wyobraź sobie, że przed Tobą stoi naszych 11 studentów. Aby obliczyć medianę pierwsze, co musisz zrobić to ustawić ich rosnąco według ocen. Mówiąc bardziej fachowo musimy uporządkować szereg (naszych studentów) rosnąco (od najmniejszej wartości do największej) według cechy zmiennej (oceny z zaliczenia). Czyli student z najniższą oceną idzie na lewą stronę. I tak po kolei ustawiasz studentów od tego, który dostał najniższą ocenę do tego, który otrzymał najwyższą ocenę.
Nasz szereg po uporządkowaniu wygląda tak:
Gdy mamy już szereg uporządkowany musimy znaleźć studenta, który stoi dokładnie po środku. Jest na to odpowiedni wzór. Wzór na pozycję mediany. Oto on:
Literki „poz” to zapewne skrót od słowa „pozycja”.
Małe n już znamy. To liczebność naszej zbiorowości. Zbiorowość liczyła 11 studentów. Mamy zatem:
Szukamy zatem w szeregu studenta nr 6. Pytamy się tego studenta jaką otrzymał oceną. On grzecznie (w końcu student) odpowiada, że dostał 4. Czyli nasza mediana wynosi 4. Zapiszemy to tak:
Me = 4
Czas na interpretację mediany.
Interpretacja mediany.
50% studentów otrzymało ocenę 4 lub mniej, pozostałe 50% otrzymało ocenę 4 lub więcej.
Spójrz na rysunek czy ta interpretacja ma sens. Skoro student nr 6 stoi po środku to na lewo od niego jest połowa studentów, prawda? Czyli 50%. To samo na prawo od niego. Też jest połowa czyli 50%.
Jak widać ci na lewo od naszego środkowego stuenta (mediany) otrzymali oceny 4, 3 i 2… czyli 4 lub mniej. A ci na prawo otrzymali oceny 4 i 5 czyli 4 lub więcej.
Być może przyszła Ci do głowy myśl. A co jeśli studentów byłoby 10. Jak wtedy znaleźć środkowego?
Odpowiedź jest prosta. Zaczynamy tak samo jak przed chwilą, czyli od uporządkowania studentów rosnąco według ocen.
Powiedzmy, że z naszej grupy studentów odchodzi student z dwójką. Wówczas oceny studentów (po uporządkowaniu) wyglądają następująco:
Następnie obliczamy pozycję mediany wzorem podanym wcześniej.
n = 10
Szukamy, zatem studenta nr 5 i pół. Oczywiście nie ma takiego studenta. Co wtedy robimy? To proste. Szukamy studenta numer 5 i studenta numer 6. Dodajemy ich oceny do siebie i dzielimy na pół. Wynik, jaki otrzymamy będzie naszą medianą. Student piąty otrzymał czwórkę, student szósty otrzymał piątkę. Mamy zatem:
Interpretacja mediany.
50% studentów otrzymało ocenę 4,5 lub mniej, pozostałe 50% otrzymało ocenę 4,5 lub więcej
Witam w drugiej lekcji. Aby nie powtarzać w kółko tego samego zakładam, że przerobiłeś już lekcję pierwszą i pewne podstawowe pojęcia są Ci już znane. Jeżeli jeszcze nie miałeś przyjemności przerobienia materiału z lekcji pierwszej gorąco Ciebie zachęcam, aby zrobić to teraz.
Po tym wstępie czas zacząć naszą kolejną lekcję statystyki. Statystyki ludzkim głosem.
Zadanie
W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:
Polecenia:
Podaj wartość i interpretację: średniej arytmetycznej.
Rozwiązanie:
Wzór na średnią arytmetyczną w szeregu rozdzielczym punktowym wygląda następująco:
Zacznijmy od mianownika. Litera n jest już nam znana. Oznaczamy nią liczebność zbiorowości. Naszą zbiorowość tworzą studenci. Jest ich w grupie 100, zatem:
n = 100
W liczniku jest znany już nam znak sumy
. Oznacza on, że dla każdego wiersza naszej tabeli musimy przemnożyć elementy pierwszej kolumny (xi) przez elementy drugiej kolumny (ni) i na końcu wszystko zsumować.
Czyli w liczniku mamy:
Skoro mamy już licznik i mianownik podstawiamy wszystko do wzoru:
Czyli nasza średnia równa się 2. Czas na interpretację.
Interpretacja średniej arytmetycznej.
Studenci opuszczali średnio dwie godziny zajęć ze statystyki.
Zadanie
W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:
Polecenia:
Podaj wartość i interpretację: dominanty.
Rozwiązanie:
Przyjrzyjmy się tabelce raz jeszcze. Pamiętaj, że wszystkie obliczenia i interpretacje dotyczą cechy zmiennej, którą jest w naszym zadaniu liczba opuszczonych zajęć ze statystyki. Odpowiedzmy sobie na pytanie, ile godzin statystyki studenci opuszczali najczęściej? Jaka liczba nieobecności dominowała?
Dwunastu studentów nie opuściło żadnych zajęć. Jedną godzinę opuściło szesnastu studentów. Już widzisz dominantę? Tak! Dwie godziny jest liczbą nieobecności, która dominuje. Aż 48 studentów opuściło dwie godziny. Czyli 2 jest dominantą.
D = 2
Interpretacja dominanty.
Studenci najczęściej opuszczali dwie godziny zajęć ze statystyki.
lub
Najczęstszą liczbą nieobecności były dwie godziny
Medianę przedstawiłem w lekcji pierwszej. Tutaj, aby nie komplikować niepotrzebnie sprawy przedstawię sam sposób jej wyliczania w szeregu rozdzielczym punktowym.
Zadanie
W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:
Polecenia:
Podaj wartość i interpretację: mediany.
Rozwiązanie:
Jak pamiętasz zapewne z lekcji pierwszej liczenie mediany zaczynamy od uporządkowania obserwacji od najmniejszej do największej. Sprawdźmy czy już to zostało zrobione.
W pierwszym wierszu „są” studenci, którzy w ogóle nie opuścili zajęć. W drugim znajdziemy tych, którzy opuścili jedną godzinę. W trzecim dwie godziny i tak dalej. Wniosek: szereg jest już uporządkowany.
Drugim krokiem było policzenie pozycji mediany. Wzór jest już nam znany:
Mamy zatem:
Mediana jest na pozycji 50,5.
Teraz będzie coś nowego. Dodajemy nową kolumnę do naszej tabeli i oznaczamy ją jako nisk (lub nicum). Będziemy w niej dodawać po kolei elementy z kolumny drugiej (ni). I tak w pierwszym wierszu przepisujemy do kolumny nisk wartość 12. W drugim wierszu do 12 dodajemy liczbę z drugiego wiersza drugiej kolumny (czyli 16) i mamy razem 28. Następnie do 28 dodajemy liczbę z trzeciego wiersza dugiej kolumny (48). 28 i 48 daje razem 76. I tak dalej aż do końca tabeli. W ostatnim wierszu kolumny nisk powinniśmy otrzymać liczbę równą liczebności zbiorowości (czyli n = 100).
Teraz w kolumnie nisk patrząc od góry sprawdzamy w którym wierszu po raz pierwszy zawiera się liczba 50,5 (czyli pozycja mediany).
50,5 zawiera się po raz pierwszy w liczbie stojącej w trzecim wierszu (w 76). Czyli interesującym nas wierszem jest wiersz trzeci. Ponieważ chcemy poznać medianę, czyli liczbę godzin, jaką opuścił student środkowy przejeżdżamy palcem w lewo do kolumny pierwszej (xi). W trzecim wierszu w pierwszej kolumnie jest 2. Czyli nasza mediana wynosi 2.
Interpretacja.
50% studentów opuściło 2 godziny zajęć lub mniej, pozostałe 50% studentów opuściło 2 godziny zajęć lub więcej.
Zadanie:
Roczne płace pracowników pewnego zakładu w Gdańsku w 2007r. kształtowały się następująco:
Polecenie:
Oblicz i podaj interpretację średniej arytmetycznej.
Rozwiązanie:
Na początku określmy zbiorowość statystyczną, jednostkę statystyczną i cechę zmienną.
Zbiorowość statystyczną tworzą pracownicy. Jednostką statystyczną jest jeden pracownik. Cechą zmienną ilościową ciągłą są roczne płace.
Przyjrzyjmy się tabeli. Z pierwszego wiersza możemy odczytać, że 9 pracowników ma roczne zarobki od 4 do 8 tys. zł. W drugim wierszu widzimy, że 14 pracowników zarabia rocznie od 8 do 12 tys. zł. I tak dalej i tak dalej.
Oto wzór na średnią arytmetyczną dla szeregu rozdzielczego przedziałowego.
n oznacza liczebność badanej zbiorowości. Naszą zbiorowość tworzą pracownicy. Pracowników jest 50 zatem:
n = 50
We wzorze pojawił się nowy znaczek
. Oznacza on środki poszczególnych przedziałów.
Pierwszy przedział to zarobki od 4 do 8 tys. zł. Aby znaleźć środek tego przedziału musimy dodać do siebie dolną (4) i górną (8) wartość przedziału a następnie podzielić przez 2.
W ten sposób otrzymaliśmy środek pierwszego przedziału. W analogiczny sposób obliczamy środki kolejnych przedziałów. Następnie dodajemy nową kolumnę do naszej tabeli (kolumna
).
Teraz pójdzie już z górki. Zapominany o pierwszej kolumnie (xi0-xi1). Dla nas ważne w tej chwili są kolumny
i ni. Patrzymy na wzór. W liczniku znany nam już znak sumy „mówi”, że mamy dla każdego wiersza przemnożyć elementy kolumny
przez odpowiednie elementy kolumny ni. Tworzymy nową kolumnę, którą oznaczamy
* ni i wykonujemy odpowiednie obliczenia.
Na końcu sumujemy wyniki otrzymane w kolumnie
* ni. Wynik podstawiamy do wzoru.
Interpretacja średniej arytmetycznej
Średnie roczne zarobki w zakładzie wynoszą 13,28 tys. zł.
Zakładam, że przerobiłeś już wcześniejsze lekcje i wiesz co to jest dominanta. W przeciwnym razie gorąco zachęcam Ciebie do przerobienia materiału z poprzednich lekcji.
Tutaj tylko przypomnimy sobie jednym zdaniem, że dominanta to wartość cechy zmiennej, która występuje w badanej zbiorowości najczęściej (czyli właśnie dominuje!).
Teraz czas już zacząć zadanie i obliczyć dominantę w szeregu rozdzielczym przedziałowym. Oto jego treść:
Zadanie:
Roczne płace pracowników pewnego zakładu w Gdańsku w 2007r. kształtowały się następująco:
Polecenie:
Oblicz i podaj interpretację dominanty.
Rozwiązanie:
Na początku określmy zbiorowość statystyczną, jednostkę statystyczną i cechę zmienną.
Zbiorowość statystyczną tworzą pracownicy. Jednostką statystyczną jest jeden pracownik. Cechą zmienną ilościową ciągłą są roczne płace.
Na dobry początek przyjrzyjmy się tabeli. Z pierwszego wiersza możemy odczytać, że 9 pracowników ma roczne zarobki od 4 do 8 tys. zł. W drugim wierszu widzimy, że 14 pracowników zarabia rocznie od 8 do 12 tys. zł. I tak dalej i tak dalej.
Jak już zapewne pamiętasz dominanta to wartość cechy zmiennej, która dominuje, która występuje najczęściej. W naszym zadaniu cechą zmienną są roczne zarobki. Jakie zarobki występują w zakładzie najczęściej? Oczywiście zarobki z przedziału od 8 do 12 tys. zł. Takie wynagrodzenie otrzymuje największa część pracowników (aż 14) czyli zarobki z tego przedziału dominują.
Wiemy zatem, że dominanta znajduje się w przedziale od 8 do 12 tys. zł. Ten przedział nazwiemy przedziałem dominanty.
Ale ile dokładnie zarabia każda z tych 14 osób? Ile wynosi dominanta? Tego niestety nie wiemy. Ale z pomocą przyjdzie nam wzór na dominantę dla szeregu rozdzielczego przedziałowego. Oto on:
Omówimy sobie teraz znaczenie poszczególnych symboli.
xio - oznacza dolną wartość przedziału dominanty. W naszym zadaniu xio = 8
nio - oznacza liczebność przedziału dominanty. Ile osób znajduje się w przedziale dominanty? W przedziale dominanty znajduje się 14 pracowników, zatem nio = 14.
ni-1 - oznacza liczebność przedziału poprzedzającego przedział dominanty. Czyli po prostu liczebność przedziału poprzedniego. W naszym zadniu ni-1 = 9.
ni+1 - jak się zapewne domyślasz oznacza liczebność przedziału następującego po przedziale w którym znajduje się dominanta. Czyli liczebność przedziału następnego. Mamy zatem ni+1 = 12.
cio - oznacza rozpiętość (szerokość) przedziału dominanty. Jaka jest szerokość przedziału od 8 do 12? Najprościej można to policzyć odejmując od górnej wartości przedziału (12) dolną (8). Czyli cio = 12 - 8 = 4.
Podstawiamy wszystko do wzoru i wykonujemy odpowiednie obliczenia.
Interpretacja dominanty
Najczęściej pracownicy zarabiali rocznie 10,86 tys. zł.