WYKŁAD 4
Rozkład normalny
powierzchnia pod krzywą równa się jedności
Średnia arytmetyczna = medianie = dominancie
ramiona zbliżają się do nieskończoności
średnia określa szczyt krzywej a odchylenie standardowe spłaszczenie 2/3 powierzchni (68,26%) = 1 odchylenie standardowe od średniej
95,46% = 2 odchylenia standardowe od średniej
Rozkład normalny
asymetria
prawostronna
przykład
przykład
przykład
Miary koncentracji
Uzupełnieniem opisu rozkładu są miary koncentracji.
Istnieje bowiem ścisły związek pomiędzy koncentracją a rozproszeniem: im mniejsze rozproszenie tym większa koncentracja. I na odwrót.
Zjawisko koncentracji może być rozważane jako nierównomierny podział ogólnej sumy wartości cechy pomiędzy poszczególne jednostki badanej zbiorowości.
Miary koncentracji
Do oceny stopnia koncentracji stosujemy dwie metody:
1.
Metoda numeryczna – wyznaczanie odpowiednich wskaźników liczbowych (współczynnik skupienia inaczej kurtoza, współczynnik koncentracji Lorenza).
2.
Metoda graficzna – wykreślanie i analiza tzw. krzywej koncentracji Lorenza.
Miary koncentracji
Współczynnik skupienia (kurtoza)
Kurtoza (K) należy do klasycznych miar koncentracji.
Uwaga!!! Jest ona pracochłonna w liczeniu
gdzie: s – odchylenie
standardowe
Miary koncentracji
Licznik powyższego ułamka (m4 ) wyliczamy odmiennie dla każdego sposobu pogrupowania
materiału statystycznego. I tak:
szereg szczegółowy szereg rozdzielczy punktowy
Miary koncentracji
szereg rozdzielczy przedziałowy
Miary koncentracji
Im większa wartość kurtozy (K ), tym większa koncentracja (diagram wyższy i smuklejszy).
Zjawiska społeczne, gospodarcze, przyrodnicze ... są najczęściej opisywane tzw. rozkładem normalnym
K
urtoza w rozkładzie normalnym jest z awsze równa trzy (K =3
).
W praktyce policzoną kurtozę porównujemy z kurtozą rozkładu normalnego. I tak jeżeli: K>3 - rozkład badanej cechy jest wyższy i smuklejszy od rozkładu normalnego K<3 - odwrotnie; niższy i bardziej rozłożysty
przykład
przykład
WNIOSEK
K<3 koncentracja wokół średniej stawki godzinowej w firmie A jest mniejsza niż w przypadku rozkładu normalnego (diagram jest niższy i bardziej rozłożysty niż w rozkładzie normalnym); rozproszenie jest większe niż w rozkładzie normalnym.
Miary koncentracji
Krzywa koncentracji Lorenza
Dane pogrupowane są w szereg rozdzielczy przedziałowy.
Krzywą koncentracji Lorenza rysujemy wykorzystując:
skumulowaną częstość dla liczebności (wi sk) oraz
skumulowaną częstość dla wartości cechy (zi sk);
wartość cechy obliczamy w każdej klasie jako iloczyn ni zi (tak jak przy liczeniu średniej) Obie częstości wyrażamy w % .
Kwadrat w którym rysujemy krzywą Lorenza ma powierzchnię 100x100=10000
Miary koncentracji
Miary koncentracji
Krzywą Lorenza otrzymujemy nanosząc na powyższym wykresie dla każdej klasy punkt o współrzędnych (wisk ,zisk ).
Następnie łączymy te punkty odcinkami. Punkt (wisk ,zisk ) łączymy dodatkowo z punktem (0 , 0).
Im większa jest powierzchnia pola (a), tym większa jest koncentracja w badanym zjawisku.
Miary koncentracji
Aby liczbowo wyrazić wielkość koncentracji wyliczamy tzw. współczynnik koncentracji Lorenza (KL).
Jest on równy stosunkowi pola (a) do pola powierzchni połowy kwadratu (5000):
KL → 1 oznacza silną koncentrację
KL → 0 oznacza słabą koncentrację
Miary koncentracji
Ponieważ łatwiej jest policzyć pole (b), to pole (a) wyznaczamy z różnicy a=5000-b .
Pole (b) jest sumą pól trapezów prostokątnych (dla pierwszej klasy jest to trójkąt prostokątny).
Ostateczny wzór na współczynnik koncentracji Lorenza (KL) ma postać: Miary koncentracji
wzory
Pole trapezu
P trapezu = 1/2 ∙ suma podstaw trapezu ∙ wysokość trapezu wzory
Pole trójkąta
P ∆ = ½ Podstawa ∙ wysokość
PRZYKŁAD
PRZYKŁAD
średnia liczba mieszkańców miasta
PRZYKŁAD
PRZYKŁAD
PRZYKŁAD
PRZYKŁAD
PRZYKŁAD
Pole (b) wynosi 1532,0.
Współczynnik koncentracji Lorenza wynosi:
W grudniu 1992 ludność Polski zamieszkująca miasta miała tendencję do koncentrowania się w miastach o średniej wielkości 24,4 tys. mieszkańców.
Potwierdzają to:
duża wartość współczynnika koncentracji KL
wyraźny „brzuch” krzywej koncentracji.
Miary koncentracji