PARAMETRY STATYSTYCZNE - to wielkości liczbowe, które służą do opisu struktury zbiorowości statystycznej w sposób systematyczny
Zadania parametrów statystycznych
Określenie przeciętnego rozmiaru i rozmieszczenia wartości zmiennej- za pośrednictwem miar położenia
Określenie granic obszaru zmienności wartości zmiennej- za pośrednictwem miar zmienności
Określenie skupienia i spłaszczenia (w stosunku do krzywej normalnej) oraz stopnia zmiany od idealnej asymetrii- za pośrednictwem miar asymetrii i koncentracji
MIARY POŁOŻENIA
MIARY POZYCYJNE
MIARY PRZECIĘTNE
MIARY POZYCYJNE
modalna
kwartyl pierwszy
mediana (kwartyl drugi)
kwartyl trzeci
decyle
MIARY PRZECIĘTNE
średnia arytmetyczna
średnia harmoniczna
średnia geometryczna
inne
Miary przeciętne - charakteryzują średni lub typowy poziom wartości cechy, wokół których skupiają się wszystkie pozostałe wartości analizowanej cechy
ŚREDNIĄ ARYTMETYCZNĄ
definiuje się jako sumę wartości cechy mierzalnej podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej.
ŚREDNIA NIEWAŻNA STOSOWANA DLA SZEREGÓW SZCZEGÓŁOWYCH
gdzie:
n - liczebność zbiorowości próbnej (próby),
xi - wariant cechy
Dwóch pracowników wykonuje detale tego samego typu. Przeprowadzono obserwację czasu wykonania pięciu detali przez robotnika A i dziesięciu detali przez robotnika B i otrzymano następujące szeregi szczegółowe opisujące czas wykonania detalu:
dla robotnika A: 12, 15, 15, 18, 20
dla robotnika B: 10, 10, 12, 12, 15, 15, 18, 20, 21, 21
Korzystając z wzoru na obliczenie średniej :
W pewnym doświadczeniu medycznym bada się czas snu pacjentów leczonych na pewną chorobę. Zmierzono u n=12 losowo wybranych pacjentów czas snu
i otrzymano następujące wyniki
(w minutach): 435,389,533,324,561,395,416,500,499,397,356,398.
Należy obliczyć średni czas snu:
ŚREDNIA ARYTMETYCZNA WAŻONA- wyznacza się w szeregach rozdzielczych punktowych i w szeregach rozdzielczych z przedziałami klasowymi
SZEREG ROZDZIELCZY PUNKTOWY
SZEREG ROZDDZIELCZY Z PRZEDZIAŁAMI KLASOWYMI
Ćwiczenie
Dziesięć osób czekających przed gabinetami lekarskimi w przychodni zapytano, ile razy korzystały z porad lekarskich w ciągu ubiegłego roku kalendarzowego. Uzyskane informacje przedstawiono w postaci następującego szeregu rozdzielczego
Oblicz ile razy w roku przeciętnie korzystały z porad lekarza badane osoby?
Liczba porad | Liczba osób |
---|---|
0 1 2 3 4 6 |
1 1 2 2 3 1 |
Razem | 10 |
Jeżeli znamy średnie arytmetyczne dla pewnych
r-grup i na tej podstawie chcemy wyznaczy średnią arytmetyczną dla wszystkich grup łącznie wykorzystujemy wówczas następujący wzór:
Korzystając z powyższego wzoru możemy obliczy średni czas wykonania detalu przez robotnika A i B. Obliczona w ten sposób średnia nazywa się średnią ważona, wyznaczona na podstawie
średnich cząstkowych :
Wybrane właściwości średniej arytmetycznej
suma wartości cechy jest równa iloczynowi średniej i liczebności zbiorowości:
lub dla szeregu rozdzielczego
średnia arytmetyczna spełnia warunek:
suma odchyleń poszczególnych wartości cechy od średniej równa się zero
Suma kwadratów odchyleń poszczególnych wartości cechy od średniej jest minimalna
Lub
średnia arytmetyczna jest wrażliwa na skrajne wartości cechy, a więc np. na wartości cechy jednostek przypadkowo włączonych do próby
średniej arytmetycznej nie można obliczać w szeregach, w których udział liczebności (częstości) w przedziałach klasowych otwartych jest duży, do określenia przeciętnego poziomu zjawiska stosuje się wówczas parametry pozycyjne.
średnia arytmetyczna z próby, przy zachowaniu warunków że próba jest reprezentacyjna jest dobrym przybliżeniem wartości przeciętnej.
Średnia arytmetyczna jest miarą prawidłową jedynie w odniesieniu do zbiorowości jednorodnych, o niewielkim zróżnicowaniu wartości zmiennej. Średniej tej nie należy stosować w przypadku rozkładów skrajnie asymetrycznych, bimodalnych i wielomodalnych.
ŚREDNIĄ HARMONICZNĄ
stosuje się wtedy, gdy wartości cechy są podane w przeliczeniu na stałą jednostkę innej zmiennej, czyli w postaci wskaźników natężenia, np. prędkość pojazdu w km/h ; pracochłonność w szt/min. ; gęstość zaludnienia w osobach / km2 .
Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności wartości zmiennych. W przypadku szeregów szczegółowych (wyliczających) średnią harmoniczną liczy się ze wzoru:
Dla szeregów rozdzielczych przedziałowych średnią harmoniczną liczy się następująco:
ŚREDNIĄ GEOMETRYCZNĄ
stosuje się w badaniach średniego tempa zmian zjawisk, a więc gdy zjawiska są ujmowane dynamicznie.
Przykład:
Z danych o ludności pewnego miasta wynika, że w trzech kolejnych okresach liczba ludności wynosiła odpowiednio : 5000, 7500, 8250. Obliczmy średni przyrost względny ludności:
Wartości cechy (współczynniki względne) w tym zadaniu będą następujące:
Zgodnie z wzorem na obliczenie średniej geometrycznej średni przyrost ludności w trzech kolejnych latach wynosił
MODALNA Mo (dominanta D, moda, wartość najczęstsza)
jest to wartość cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej
Dla szeregów szczegółowych oraz szeregów rozdzielczych punktowych modalna odpowiada wartości cechy o największej liczebności (częstości).
W szeregach rozdzielczych z przedziałami klasowymi bezpośrednio można określić tylko przedział, w którym modalna występuje, jej przybliżoną wartość wyznacza się graficznie z histogramu liczebności (częstości)
gdzie:
m - numer przedziału (klasy), w którym występuje modalna,
X0m dolna granica przedziału, w którym występuje modalna,
nm - liczebność przedziału modalnej, tzn. klasy o numerze m,
nm-1; nm+1 - liczebność klas poprzedzającej i następnej, o numerach m – 1 i m + 1,
hm - rozpiętość przedziału klasowego, w którym występuje modalna
KWANTYLE
definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części. Pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach.
KWARTYL DRUGI – MEDIANA Me
dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa
MEDIANA – SZEREG SZCZEGÓŁOWY
Przykład:
wiek kobiet przyjętych w październiku 1999 na oddział położniczy z przyczyn nagłych można przedstawić w postaci następującego szeregu statystycznego:
18, 57, 34, 32, 29, 31, 19, 19, 27, 26, 26, 22, 23, 26, 26, 34, 26,
Teraz należy ten szereg uporządkować:
18, 19, 19, 22, 23, 26, 26, 26, 26, 26,27, 29, 31, 32, 34, 34, 57.
Szereg ten składa się z 17 wartości zmiennych. Wartością środkową – medianą- w tym przypadku będzie wartość znajdująca się na pozycji 9, czyli Me =26
Przykład:
Weźmy pod uwagę tym razem wiek kobiet przyjętych w październiku 1999 roku na oddział położniczy w sposób zaplanowany.
Po uporządkowaniu szereg opisujący wiek tych kobiet przedstawia się następująco: 19,21,22,28,28,29
Jak widać tym razem mamy 6 przypadków, czyli ilość parzystą. Wartościami środkowymi będą wielkości z pozycji 3 i 4 , czyli 22 i 28. Medianą zatem będzie średnia arytmetyczna z tych dwóch liczb, czyli 25.
W przypadku szeregu rozdzielczego przedziałowego medianę wyznacza się metodą graficzną lub rachunkową. W metodzie graficznej wykorzystuje się wykres krzywej liczebności skumulowanej.
Jeżeli dane są przedstawione za pomocą szeregu rozdzielczego punktowego (cecha skokowa) – medianą jest pierwsza wartość, której odpowiada co najmniej połowa skumulowanej liczebności.
MEDIANA – SZEREG ROZDZIELCZY
GDZIE
m - numer przedziału (klasy), w którym występuje mediana,
X0m dolna granica przedziału, w którym występuje mediana
nm - liczebność przedziału mediany, tzn. klasy o numerze m,
suma liczebności przedziałów poprzedzających przedział mediany, czyli liczebność skumulowana,
hm - rozpiętość przedziału klasowego, w którym jest mediana,
NMe - pozycja mediany, czyli
Zastosowanie mediany
W mikrobiologii do ustalenia przeciętnej liczby drobnoustrojów.
W hematologii – do ustalania przeciętnej wartości erytrocytów lub leukocytów we krwi.
Przy ustalaniu przeciętnej przeżywalności pooperacyjnej oraz dożywalności po leczeniu wielu nieuleczalnych dotychczas chorób (np. po operacjach nowotworów złośliwych).
KWARTYL PIERWSZY Q1
dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q1, a 75% równe bądź wyższe od tego kwartyla
KWARTYL TRZECI Q3
dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi trzeciemu Q3, a 25% równe bądź wyższe od tego kwartyla
DECYLE
Np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pierwszego