Średnia arytmetyczna, Statystyka


Średnia arytmetyczna. Szereg szczegółowy.

Poniżej na przykładzie zostanie omówiony sposób liczenia średniej arytmetycznej w szeregu szczegółowym. Oto treść zadania.

Zadanie

Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:

Polecenie:

Podaj wartość i interpretację: średniej arytmetycznej.

Rozwiązanie:

Moja definicja średniej arytmetycznej jest następująca.

Średnia arytmetyczna działa jak socjalizm. Zabiera tym, co mają najwięcej i daje tym, co mają najmniej, tak, aby wszyscy mieli po równo.

Na szczęście w statystyce nie musimy się zastanawiać czy to dobrze czy źle.

Pytanie brzmi:

Jaka jest średnia ocena z zaliczenia?

Średnią arytmetyczną oznaczamy symbolem

0x01 graphic

Oto wzór na średnią arytmetyczną:

Sprawdźmy czy mamy wszystkie potrzebne elementy.

to znak sumy. Czyli będziemy coś dodawać.

xi oznacza oceny poszczególnych studentów. Stojący wcześniej znak sumy oznacza, że musimy wszystkie oceny zsumować. Dodajemy do siebie zatem po kolei

Suma wszystkich ocen wynosi 44. Czyli mamy:

n oznacza liczebność zbiorowości. Naszą zbiorowością są badani studenci. Ilu było studentów? Tyle co ocen, czyli 11. Zatem nasza zbiorowość liczy 11 elementów. Czyli:

0x01 graphic

0x01 graphic

n = 11

Chyba już mamy wszystkie brakujące elementy. Możemy zatem podstawiać do wzoru.

0x01 graphic

Czyli średnia arytmetyczna równa się 4. Czas na interpretację.

Interpretacja średniej arytmetycznej.

Średnia ocena z zaliczenia to czwórka.

Dominanta. Szereg szczegółowy.

Poniżej na przykładzie zostanie omówiony sposób liczenia dominanty w szeregu szczegółowym. Oto treść zadania.

Zadanie

Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:

0x01 graphic

Polecenie:

Podaj wartość i interpretację: dominanty.

Rozwiązanie:

Dominanta czyli wartość, która dominuje. Wartość, która występuje najczęściej.

Ale jaka wartość?

Kilka linijek wyżej napisałem, że wszystko, co liczymy i interpretujemy dotyczy cechy zmiennej. W naszym przypadku oceny z zaliczenia. Czyli aby odnaleźć wartość dominanty wystarczy odpowiedzieć sobie na pytanie: jaka ocena dominuje? Jaka ocena występuje najczęściej? Jaką ocenę studenci otrzymywali najczęściej?

Rzut oka na oceny studentów i już wiemy, że najczęściej studenci otrzymywali z zaliczenia piątki. Czyli dominanta równa się 5. Tak! To takie proste! Dominantę oznaczamy dużą literą D. Zatem możemy zapisać:

D = 5

Interpretacja dominanty.

Studenci najczęściej otrzymywali z zaliczenia piątkę.

lub

Najczęściej występującą oceną z zaliczenia była piątka.

A co jeśli np. trójek byłoby tyle samo co piątek? Wówczas nie ma dominującej oceny, czyli nie ma dominanty!

Mediana. Szereg szczegółowy.

Poniżej na przykładzie zostanie omówiony sposób liczenia mediany w szeregu szczegółowym. Oto treść zadania.

Zadanie

Grupa studentów studiujących w Sopocie w styczniu 2008 roku pisała zaliczenie ze statystyki. Oto oceny z tego zaliczenia:

0x01 graphic

Polecenie:

Podaj wartość i interpretację: mediany.

Rozwiązanie:

Mediana nazywana jest wartością środkową. Oznaczamy ją tak:

Me

Mediana jest to wartość cechy zmiennej, jaką posiada jednostka stojąca pośrodku uporządkowanego szeregu.

W naszym zadaniu jest to ocena jaką dostał student stojący pośrodku uporządkowanego szeregu. Jakiego szeregu? O co chodzi?

Wyobraź sobie, że przed Tobą stoi naszych 11 studentów. Aby obliczyć medianę pierwsze, co musisz zrobić to ustawić ich rosnąco według ocen. Mówiąc bardziej fachowo musimy uporządkować szereg (naszych studentów) rosnąco (od najmniejszej wartości do największej) według cechy zmiennej (oceny z zaliczenia). Czyli student z najniższą oceną idzie na lewą stronę. I tak po kolei ustawiasz studentów od tego, który dostał najniższą ocenę do tego, który otrzymał najwyższą ocenę.

Nasz szereg po uporządkowaniu wygląda tak:

0x01 graphic

Gdy mamy już szereg uporządkowany musimy znaleźć studenta, który stoi dokładnie po środku. Jest na to odpowiedni wzór. Wzór na pozycję mediany. Oto on:

0x01 graphic

Literki „poz” to zapewne skrót od słowa „pozycja”.

Małe n już znamy. To liczebność naszej zbiorowości. Zbiorowość liczyła 11 studentów. Mamy zatem:

0x01 graphic

Szukamy zatem w szeregu studenta nr 6. Pytamy się tego studenta jaką otrzymał oceną. On grzecznie (w końcu student) odpowiada, że dostał 4. Czyli nasza mediana wynosi 4. Zapiszemy to tak:

Me = 4

Czas na interpretację mediany.

Interpretacja mediany.

50% studentów otrzymało ocenę 4 lub mniej, pozostałe 50% otrzymało ocenę 4 lub więcej.

Spójrz na rysunek czy ta interpretacja ma sens. Skoro student nr 6 stoi po środku to na lewo od niego jest połowa studentów, prawda? Czyli 50%. To samo na prawo od niego. Też jest połowa czyli 50%.

Jak widać ci na lewo od naszego środkowego stuenta (mediany) otrzymali oceny 4, 3 i 2… czyli 4 lub mniej. A ci na prawo otrzymali oceny 4 i 5 czyli 4 lub więcej.

Być może przyszła Ci do głowy myśl. A co jeśli studentów byłoby 10. Jak wtedy znaleźć środkowego?

Odpowiedź jest prosta. Zaczynamy tak samo jak przed chwilą, czyli od uporządkowania studentów rosnąco według ocen.

Powiedzmy, że z naszej grupy studentów odchodzi student z dwójką. Wówczas oceny studentów (po uporządkowaniu) wyglądają następująco:

0x01 graphic

Następnie obliczamy pozycję mediany wzorem podanym wcześniej.

n = 10

0x01 graphic

Szukamy, zatem studenta nr 5 i pół. Oczywiście nie ma takiego studenta. Co wtedy robimy? To proste. Szukamy studenta numer 5 i studenta numer 6. Dodajemy ich oceny do siebie i dzielimy na pół. Wynik, jaki otrzymamy będzie naszą medianą. Student piąty otrzymał czwórkę, student szósty otrzymał piątkę. Mamy zatem:

0x01 graphic

Interpretacja mediany.

50% studentów otrzymało ocenę 4,5 lub mniej, pozostałe 50% otrzymało ocenę 4,5 lub więcej

Średnia arytmetyczna. Szereg rozdzielczy punktowy.

Witam w drugiej lekcji. Aby nie powtarzać w kółko tego samego zakładam, że przerobiłeś już lekcję pierwszą i pewne podstawowe pojęcia są Ci już znane. Jeżeli jeszcze nie miałeś przyjemności przerobienia materiału z lekcji pierwszej gorąco Ciebie zachęcam, aby zrobić to teraz.

Po tym wstępie czas zacząć naszą kolejną lekcję statystyki. Statystyki ludzkim głosem.

Zadanie

W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:

0x01 graphic

Polecenia:
Podaj wartość i interpretację: średniej arytmetycznej.

Rozwiązanie:

Wzór na średnią arytmetyczną w szeregu rozdzielczym punktowym wygląda następująco:

0x01 graphic

Zacznijmy od mianownika. Litera n jest już nam znana. Oznaczamy nią liczebność zbiorowości. Naszą zbiorowość tworzą studenci. Jest ich w grupie 100, zatem:

n = 100

W liczniku jest znany już nam znak sumy 0x01 graphic
. Oznacza on, że dla każdego wiersza naszej tabeli musimy przemnożyć elementy pierwszej kolumny (xi) przez elementy drugiej kolumny (ni) i na końcu wszystko zsumować.

0x01 graphic

Czyli w liczniku mamy:

0x01 graphic

Skoro mamy już licznik i mianownik podstawiamy wszystko do wzoru:

0x01 graphic

Czyli nasza średnia równa się 2. Czas na interpretację.

Interpretacja średniej arytmetycznej.

Studenci opuszczali średnio dwie godziny zajęć ze statystyki.

Dominanta. Szereg rozdzielczy punktowy.

Zadanie

W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:

0x01 graphic

Polecenia:
Podaj wartość i interpretację: dominanty.

Rozwiązanie:

Przyjrzyjmy się tabelce raz jeszcze. Pamiętaj, że wszystkie obliczenia i interpretacje dotyczą cechy zmiennej, którą jest w naszym zadaniu liczba opuszczonych zajęć ze statystyki. Odpowiedzmy sobie na pytanie, ile godzin statystyki studenci opuszczali najczęściej? Jaka liczba nieobecności dominowała?

Dwunastu studentów nie opuściło żadnych zajęć. Jedną godzinę opuściło szesnastu studentów. Już widzisz dominantę? Tak! Dwie godziny jest liczbą nieobecności, która dominuje. Aż 48 studentów opuściło dwie godziny. Czyli 2 jest dominantą.

D = 2

Interpretacja dominanty.

Studenci najczęściej opuszczali dwie godziny zajęć ze statystyki.

lub

Najczęstszą liczbą nieobecności były dwie godziny

Mediana. Szereg rozdzielczy punktowy.

Medianę przedstawiłem w lekcji pierwszej. Tutaj, aby nie komplikować niepotrzebnie sprawy przedstawię sam sposób jej wyliczania w szeregu rozdzielczym punktowym.

Zadanie

W styczniu 2008 roku zbadano grupę studentów Wydziału Ekonomicznego UG studiujących w Sopocie. Zapytano ich m.in. o liczbę opuszczonych zajęć ze statystyki w semestrze zimowym. Wyniki przedstawia poniższa tabela:

0x01 graphic

Polecenia:
Podaj wartość i interpretację: mediany.

Rozwiązanie:

Jak pamiętasz zapewne z lekcji pierwszej liczenie mediany zaczynamy od uporządkowania obserwacji od najmniejszej do największej. Sprawdźmy czy już to zostało zrobione.

W pierwszym wierszu „są” studenci, którzy w ogóle nie opuścili zajęć. W drugim znajdziemy tych, którzy opuścili jedną godzinę. W trzecim dwie godziny i tak dalej. Wniosek: szereg jest już uporządkowany.

Drugim krokiem było policzenie pozycji mediany. Wzór jest już nam znany:

0x01 graphic

Mamy zatem:

0x01 graphic

Mediana jest na pozycji 50,5.

Teraz będzie coś nowego. Dodajemy nową kolumnę do naszej tabeli i oznaczamy ją jako nisk (lub nicum). Będziemy w niej dodawać po kolei elementy z kolumny drugiej (ni). I tak w pierwszym wierszu przepisujemy do kolumny nisk wartość 12. W drugim wierszu do 12 dodajemy liczbę z drugiego wiersza drugiej kolumny (czyli 16) i mamy razem 28. Następnie do 28 dodajemy liczbę z trzeciego wiersza dugiej kolumny (48). 28 i 48 daje razem 76. I tak dalej aż do końca tabeli. W ostatnim wierszu kolumny nisk powinniśmy otrzymać liczbę równą liczebności zbiorowości (czyli n = 100).

0x01 graphic

Teraz w kolumnie nisk patrząc od góry sprawdzamy w którym wierszu po raz pierwszy zawiera się liczba 50,5 (czyli pozycja mediany).

50,5 zawiera się po raz pierwszy w liczbie stojącej w trzecim wierszu (w 76). Czyli interesującym nas wierszem jest wiersz trzeci. Ponieważ chcemy poznać medianę, czyli liczbę godzin, jaką opuścił student środkowy przejeżdżamy palcem w lewo do kolumny pierwszej (xi). W trzecim wierszu w pierwszej kolumnie jest 2. Czyli nasza mediana wynosi 2.

Interpretacja.

50% studentów opuściło 2 godziny zajęć lub mniej, pozostałe 50% studentów opuściło 2 godziny zajęć lub więcej.

Średnia arytmetyczna. Szereg rozdzielczy przedziałowy.

Zadanie:

Roczne płace pracowników pewnego zakładu w Gdańsku w 2007r. kształtowały się następująco:

0x01 graphic

Polecenie:
Oblicz i podaj interpretację średniej arytmetycznej.

Rozwiązanie:

Na początku określmy zbiorowość statystyczną, jednostkę statystyczną i cechę zmienną.

Zbiorowość statystyczną tworzą pracownicy. Jednostką statystyczną jest jeden pracownik. Cechą zmienną ilościową ciągłą są roczne płace.

Przyjrzyjmy się tabeli. Z pierwszego wiersza możemy odczytać, że 9 pracowników ma roczne zarobki od 4 do 8 tys. zł. W drugim wierszu widzimy, że 14 pracowników zarabia rocznie od 8 do 12 tys. zł. I tak dalej i tak dalej.

Oto wzór na średnią arytmetyczną dla szeregu rozdzielczego przedziałowego.

0x01 graphic

n oznacza liczebność badanej zbiorowości. Naszą zbiorowość tworzą pracownicy. Pracowników jest 50 zatem:

n = 50


We wzorze pojawił się nowy znaczek 0x01 graphic
. Oznacza on środki poszczególnych przedziałów.

Pierwszy przedział to zarobki od 4 do 8 tys. zł. Aby znaleźć środek tego przedziału musimy dodać do siebie dolną (4) i górną (8) wartość przedziału a następnie podzielić przez 2.

0x01 graphic

W ten sposób otrzymaliśmy środek pierwszego przedziału. W analogiczny sposób obliczamy środki kolejnych przedziałów. Następnie dodajemy nową kolumnę do naszej tabeli (kolumna 0x01 graphic
).

0x01 graphic

Teraz pójdzie już z górki. Zapominany o pierwszej kolumnie (xi0-xi1). Dla nas ważne w tej chwili są kolumny 0x01 graphic
i ni. Patrzymy na wzór. W liczniku znany nam już znak sumy „mówi”, że mamy dla każdego wiersza przemnożyć elementy kolumny 0x01 graphic
przez odpowiednie elementy kolumny ni. Tworzymy nową kolumnę, którą oznaczamy 0x01 graphic
* ni i wykonujemy odpowiednie obliczenia.

0x01 graphic

Na końcu sumujemy wyniki otrzymane w kolumnie 0x01 graphic
* ni. Wynik podstawiamy do wzoru.

0x01 graphic

Interpretacja średniej arytmetycznej

Średnie roczne zarobki w zakładzie wynoszą 13,28 tys. zł.

Dominanta. Szereg rozdzielczy przedziałowy.

Zakładam, że przerobiłeś już wcześniejsze lekcje i wiesz co to jest dominanta. W przeciwnym razie gorąco zachęcam Ciebie do przerobienia materiału z poprzednich lekcji.

Tutaj tylko przypomnimy sobie jednym zdaniem, że dominanta to wartość cechy zmiennej, która występuje w badanej zbiorowości najczęściej (czyli właśnie dominuje!).

Teraz czas już zacząć zadanie i obliczyć dominantę w szeregu rozdzielczym przedziałowym. Oto jego treść:

Zadanie:

Roczne płace pracowników pewnego zakładu w Gdańsku w 2007r. kształtowały się następująco:

0x01 graphic

Polecenie:
Oblicz i podaj interpretację dominanty.

Rozwiązanie:

Na początku określmy zbiorowość statystyczną, jednostkę statystyczną i cechę zmienną.

Zbiorowość statystyczną tworzą pracownicy. Jednostką statystyczną jest jeden pracownik. Cechą zmienną ilościową ciągłą są roczne płace.

Na dobry początek przyjrzyjmy się tabeli. Z pierwszego wiersza możemy odczytać, że 9 pracowników ma roczne zarobki od 4 do 8 tys. zł. W drugim wierszu widzimy, że 14 pracowników zarabia rocznie od 8 do 12 tys. zł. I tak dalej i tak dalej.

Jak już zapewne pamiętasz dominanta to wartość cechy zmiennej, która dominuje, która występuje najczęściej. W naszym zadaniu cechą zmienną są roczne zarobki. Jakie zarobki występują w zakładzie najczęściej? Oczywiście zarobki z przedziału od 8 do 12 tys. zł. Takie wynagrodzenie otrzymuje największa część pracowników (aż 14) czyli zarobki z tego przedziału dominują.

Wiemy zatem, że dominanta znajduje się w przedziale od 8 do 12 tys. zł. Ten przedział nazwiemy przedziałem dominanty.

Ale ile dokładnie zarabia każda z tych 14 osób? Ile wynosi dominanta? Tego niestety nie wiemy. Ale z pomocą przyjdzie nam wzór na dominantę dla szeregu rozdzielczego przedziałowego. Oto on:

0x01 graphic

Omówimy sobie teraz znaczenie poszczególnych symboli.

xio - oznacza dolną wartość przedziału dominanty. W naszym zadaniu xio = 8

nio - oznacza liczebność przedziału dominanty. Ile osób znajduje się w przedziale dominanty? W przedziale dominanty znajduje się 14 pracowników, zatem nio = 14.

ni-1 - oznacza liczebność przedziału poprzedzającego przedział dominanty. Czyli po prostu liczebność przedziału poprzedniego. W naszym zadniu ni-1 = 9.

ni+1 - jak się zapewne domyślasz oznacza liczebność przedziału następującego po przedziale w którym znajduje się dominanta. Czyli liczebność przedziału następnego. Mamy zatem ni+1 = 12.

cio - oznacza rozpiętość (szerokość) przedziału dominanty. Jaka jest szerokość przedziału od 8 do 12? Najprościej można to policzyć odejmując od górnej wartości przedziału (12) dolną (8). Czyli cio = 12 - 8 = 4.

Podstawiamy wszystko do wzoru i wykonujemy odpowiednie obliczenia.

0x01 graphic

Interpretacja dominanty

Najczęściej pracownicy zarabiali rocznie 10,86 tys. zł.



Wyszukiwarka