Statystyka ściąga (6 stron) IEFXT4WWBA2VXFI3K6XJIWGYHKPVE6NOWBPMRYA


Statystyka - nauka zajmująca się badaniem prawidłowości zjawisk ( procesów) masowych przy pomocy metod ilościowych. Przez badania statystyczne rozumiemy poznanie struktury określonej zbiorowości statystycznej.

Zbiorowość generalna, zbiorowość próbna.

Zbiorowość statystyczna - nazywamy zbiór dowolnych elementów (przedmiotów i faktów) podobnych pod względem określonych cech (ale nie identycznych) i poddanych badaniom statystycznym.

Bezpośrednie obserwacji lub pomiarowi podlegają elementy składowe zbiorowości (obiekty badane) zwane jednostkami statystycznymi.

Zbiorowość próbna (próba) jest to podzbiór populacji generalnej. Próba podlega badaniu statystycznemu, a wnioski badania są uogólnione na całą zbiorowość generalną.

Liczbę elementów próby oznaczamy przez n. Próba jest mała albo n≤30 duża dla n>30

Aby uzyskane wyniki badań próby można odnieść do zbiorowości generalnej musi być reprezentatywna. Próba wybrana w sposób losowy i dostatecznie duża nazywa się reprezentatywna. Jej struktura jest podana do struktury generacji.

Rodzaje badania statystycznego.

Całkowite (wyczerpujące) - gdy obserwacji podlegają wszystkie elementy zbiorowości generalnej.

Częściowe - gdy obserwacji podlega część zbiorowości generalnej.

Rodzaje badań częściowych:

  1. badania reprezentatywne

  2. badania monograficzne

  3. badania ankietowe

ad 1. w sposób losowy wybieramy próbę i na postawie jej badań wnioskujemy o całości (zbiorowości generalnej). Metoda ta polega na szacowaniu nieznanych parametrów zbiorowości generalnej na podstawie wyników uzyskanych z badania próbki

ad 2. badany jest pojedynczy przypadek np. jedna wieś czy gmina

ad 3. nie badamy zbiorowości statystycznej bezpośrednio lecz zwracamy się do różnych instytucji lub osób z prośbą o wypełnienie odpowiedniej ankiety.

Badanie statystyczne - mogą być obarczone błędami.

Błędy statystyczne - popełnione celowo lub w skutek awarii urządzenia. Są one groźne mogą zniekształcić badania.

Błędy przypadkowe - w trakcie badania nie mają większego wpływu na wynik

Jednostki statystyczne charakteryzują się pewnymi właściwościami, które nazywamy cechami statystycznymi.

Rodzaje cech:

  1. cechy niemierzalne (jakościowe) - są one określone słownie, np.: płeć, rozmieszczenie terytorialne

  2. cechy mierzalne (ilościowe) - są to właściwości, które można zmierzyć i wyrazić za pomocą liczby

Cechy mierzalne będziemy nazywać zmiennymi losowymi i oznaczymy przez x, y, z, a wartości cech przez xi, yi, zi

Zmienne losowe dzielimy na :

Opracowanie i prezentacja materiału statystycznego.

Zebrany surowy materiał statystyczny nie nadaje się jeszcze do dalszych badań, należy go najpierw odpowiednio pogrupować. Grupowanie to polega na podziale niejednakowych zbiorowości na możliwie jednorodne grupy pod względem pewnych ustalonych kryteriów. Zależy ono oczywiście od celu badania, a także od charakteru wybranych cech.

Ze względu na badanie grupowe dzielimy na:

  1. typologiczne

  2. wariancyjne

  3. analityczne

Po sklasyfikowaniu danych statystycznych według jakiegoś kryterium otrzymujemy szereg statystyczny.

Szeregi statystyczne dzielimy na:

  1. szczegółowe

  2. rozdzielcze

  3. czasowe

Szczegółowe - najczęściej stosowany jest wtedy, gdy liczba jednostek objętych badaniem jest mała (10, 20 osób)

Rozdzielcze - stanowi zbiorowość statystyczną podzieloną na klasy wg określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z klas. Szeregi rozdzielcze dzielimy na: punktowe i przedziałowe.

Punktowy szereg rozdzielczy - buduje się wówczas, gdy liczba wariantów badanej cechy niewielka, a każdy z tych wariantów występuje kilka razy w badanej zbiorowości.

Szereg rozdzielczy przedziałowy - stanowi zbiorowość statystyczną podzieloną na klasy wg określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z klas.

W szeregach rozdzielczych do określenia struktury badanej zbiorowości stosuje się wskaźnik struktury (częstość, liczebność względna czy odsetki) 0x01 graphic

mi - iloczyn sprzyjających cech

n - ilość wszystkich możliwych cech

przy czym 0x01 graphic

Skumulowany wskaźnik struktury

0x01 graphic
i=1,2, ..... k

Do szeregów statystycznych zaliczamy również szeregi czasowe.

Rodzaje szeregów czasowych:

  1. szeregi czasowe okresów - ujmuje zjawiska w tygodniu, miesiącu, roku

  2. szeregi czasowe momentów - ujmują wielkość zjawiska w danym momencie

Konstrukcja szeregu rozdzielczego z przedziałami klasowymi.

  1. określenie empirycznego obszaru zmienności (rozstępu) cechy

  2. ustalenie liczby przedziałów klasowych (k) i ich długości (h) najczęściej wg wzoru: 0x01 graphic

zaś

0x01 graphic

Uwaga!!! Istotne jest ustalenie granic poszczególnych klas.

Prezentacja pierwszej klasy. Jej granice dolne to z reguły minimalna wartość liczby lub cechy.

Prezentacja graficzna szeregów statystycznych.

Najczęściej stosuje się wykresy:

    1. liniowe (diagramy i krzywe liczebności)

    2. powierzchniowe

    3. słupkowe

Miary tendencji centralnej:

Są najczęściej rozpowszechnionymi miarami statystycznymi używanymi w praktyce. Podają one pomocą jednej liczby charakterystykę poziomu wartości zmiennej czyli tendencję centralną (stąd nazwa miary tendencji centralnej)

Miary te dzielimy na:

  1. przeciętne miary klasyczne (średnia arytmetyczna, średnia geometryczna, średnia harmoniczna)

  2. przeciętne miary pozycyjne (dominanta i kwestyle) wśród których szczególnie wyróżniamy kwastyl drugi tzn. medianę

  3. miary zmienności (rozproszenia i dyspersji)

  4. miary asymetrii

  5. miary koncentracji

Średnia arytmetyczna jest sumą wartości cechy mierzalnej podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej tzn.: 0x01 graphic

Jest to średnia arytmetyczna nieważna (prosta). Jest wykorzystana dla szeregów indywidualnych dla szeregu rozdzielczego punktowego

0x01 graphic

gdzie: k - liczba klas

ni -liczebność poszczególnych klas

Dla szeregu rozdzielczego z przedziałami klasowymi

0x01 graphic
Xi - środek przedziału klasowego

Jeżeli w miejsce względne (ni) podstawimy wskaźnik struktury to średnia arytmetyczna ważona przyjmuje postać. 0x01 graphic
lub 0x01 graphic

Własności:

  1. średnia arytmetyczna jest wypadkową wszystkich wartości zmiennych i spełnia warunek:

0x01 graphic
Xmin < 0x01 graphic
< Xmax

  1. Suma odchyleń poszczególnych wartości zmiennej (cechy) od średniej jest równa zeru.

0x01 graphic
lub 0x01 graphic

  1. Suma kwadratów odchyleń poszczególnych wartości cechy (zmiennej) od średniej jest minimalna.

0x01 graphic
lub 0x01 graphic

  1. Średnią arytmetyczną oblicza się w zasadzie dla szeregów o zamkniętych przedziałach klasowych.

  2. Średnia arytmetyczna jest wrażliwa na skrajne wartości cechy są to tzw. Obserwacje przypadkowe.

  3. Średniej arytmetycznej nie powinno się obliczać, gdy w szeregu występują nietypowe wartości.

Jeżeli znamy średnią arytmetyczną dla pewnych n- grup i chcemy wyznaczyć średnią arytmetyczną dla wszystkich grup łącznie, wówczas:

gdzie:

0x01 graphic
- arytm. Dla wszystkich grup łącznie

xi - średnia arytmetyczna w i-tej grupie

ni - liczebność tej grupy

n - suma liczebności we wszystkich grupach 0x01 graphic

Średnia harmoniczna - jest to odwrotność średniej arytmetycznej

Odwrotności liczb dla szeregu szczegółowego:

0x01 graphic

dla szeregu indywidualnego

0x01 graphic

Przykład:

W ciągu 8 godzin obserwowano parę 5 robotników. Robotnik A zużył na wykonanie 1 elementu 4min, B- 6min., C- 12min. Obliczyć ile czasu zużyją średnio ci robotnicy na wykonanie 1 elementu.

Średnia geometryczna - określa się wg wzoru:

gdzie:

x1 - indywidualny indeks łańcuchowy

n - liczba tych indeksów

Średnią arytmetyczną stosuje się wtedy, gdy zjawiska są ujmowane dynamicznie

Dominanta (wartość najczęstsza, modalna) oznaczamy ją symbolem Mo lub b - jest to wartość cechy, która występuje najczęściej w badanej zbiorowości. Do szeregów rozdzielczych z przedziałami klasowymi przybliżoną wartość modalnej wyznacza się ze wzoru lub graficznie z histogramu liczebności interpolacyjnego. Analitycznie modalną wyznacza się ze wzoru:

gdzie:

xm - dolna granica przedziału w którym występuje modalne (dominanta)

nm - liczebność przedziału w którym występuje modalna

nm-1 - liczebność klasy poprzedzającej przedział modalny

nm+1 - liczebność klasy następnej w przedziale modalnej

hn - rozpiętość przedziału klasowego, w którym występuje modalna

Dominantę obliczamy gdy:

Kwartyle - są to wartości cechy badanej zbiorowości przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek. Części te pozostają w stosunku do siebie w określonych proporcjach.

Szeregi, w których wyznacza się kwartyle muszą być uporządkowane w ciąg monotoniczny (rosnący lub malejący). Do najczęściej stosowanych kwartyli należą: kwartyle, decyle, centyle.

KWARTYLE

Kwartyl pierwszy a1 - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartość cechy nie większą niż a1, a 75% nie mniejszą od tego kwartyla.

Kwartyl drugi (mediana Me) - dzieli zbiorowość uporządkowaną na dwie równe części. Połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od mediany.

Kwartyl trzeci a3 - dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek ma wartość cechy nie wyższe, a 25% nie niższe niż kwartyl trzeci.

Prezentowane dotychczas metody statystyczne dotyczyły analiz struktury zbiorowości ze względu na jedną cechę (zmienną).

Obecnie zajmiemy się badaniem zbiorowości, która charakteryzowana jest za pomocą więcej niż jednej zmiennej (cechy) i zmienne te wzajemnie się warunkują.

Celem takiego badania jest stwierdzenie, czy między badanymi zmiennymi zachodzą określone zależności, czy są to zależności prostoliniowe czy krzywoliniowe, jaka jest ich siła, kształt i kierunek.

Współzależności między zmiennymi może być:

  1. funkcyjna - gdy określonej wartości zmiennej X odpowiada dokładnie jedna i tylko jedna wartość zmiennej X

  2. statystyczna (probalistyczna) - jest to zależność między dwiema zmiennymi losowymi polegająca na tym że wraz ze zmianą jednej zmiennej, zmienia się rozkład prawdopodobieństwa drugiej zmiennej.

Zależność statystyczna (korelacyjna) jest szczególnym przypadkiem zależności stochastycznej.

W zależności korelacyjnej określonym wartością jednej zmiennej są przypadkowe pewne średnie wartości drugiej zmiennej.

Metody badania współzależności

Dana jest populacja generalna, w której interesują nas cechy mierzalne (x, y) traktowane jako zmienne losowe.

Jeżeli są nieznane pewne parametry rozkładu dwuwymiarowej zmiennej.

Jeżeli są nieznane pewne parametry rozkładu dwuwymiarowej zmiennej losowej (x, y) to powstaje problem wyznaczenia ich oszacowań.

Podobnie jak przy badaniu ze względu na jedną cechę oszacowania te wyznacza się z prób.

Przy badaniu ze względu na dwie cechy próbkę stanowi n par (x, y), i=1, ...n których pierwsza jest zaobserwowaną wartością cechy x, druga zaś cechy y.

Traktując (x, y) jako współrzędne punktu na płaszczyźnie można próbką przedstawić graficznie w postaci tzw. Diagramu korelacyjnego.

Korelacja liniowa dodatnia Korelacja liniowa ujemna

Korelacja krzywoliniowa Brak korelacji

Dla dużych próbek w celu stwierdzenia istnienia lub braku związku korelacyjnego buduje się tablicę korelacyjną.

Nij - liczba obserwacji (jednostek), które posiadają jednocześnie wariant xi cechy x i wariant yi cechy y.

N - liczebność próby,

Ni, Nj - rozkłady szeregowe odpowiednio zmiennej x oraz y

Przykład brzegowy zmiennej x tworzy pierwsza i ostatnia kolumna tabeli, rozkład brzegowy zmiennej y pierwszy i ostatni wiersz.

Zmienna losowa x przyjmuje K wariantów (i=1, ....k)

Zmienna losowa y przyjmuje L wariantów (i=1, ....l)

Symbol nj oznacza liczbę jednostek, które mają wariant yi zmiennej y, natomiast ni - liczbę jednostek, które mają wariant xi zmiennej x.

W tablicy korelacyjnej oprócz rozkładów brzegowych zmiennej (x, y) są rozkłady warunkowe. Rozkład warunkowy przedstawia strukturę wartości jednej zmiennej (x lub y) pod warunkiem, że druga zmienna przyjęła określoną wartość.

Rozkład warunkowy zmiennej x zapisujemy x\y = yj

Rozkład warunkowy zmiennej y zapisujemy y\x = xi

Średnie arytmetyczne z rozkładów brzegowych

Średnie arytmetyczne rozkładów warunkowych

Na podstawie tablicy korelacyjnej można stwierdzić, czy związek między zmiennymi x i y jest liniowy.

Związek jest liniowy, jeżeli różnice między średnimi warunkowymi danej zmiennej obliczonymi dla konkretnych wariantów drugiej zmiennej są takie same tzn.

Siłę, kierunek i kształt związku korelacyjnego można stwierdzić na postawie oceny stopnia skupienia lub rozproszenia liczebności nij tablicy korelacyjnej gdy warianty zmiennych x i y ułożone są w tablicy rosnąco, to skupianie się liczebności wzdłuż przekątnej biegnącej od lewego górnego do prawego dolnego rogu tablicy świadczy o istnieniu korelacji dodatniej i prostoliniowej.

Odwrotny układ liczebności (od prawego górnego do lewego dolnego rogu tabeli), świadczy o istnieniu korelacji ujemnej prostoliniowej.

Skupienie się liczebności w tablicy korelacyjnej w innym charakterystyczny sposób (kształt paraboli, funkcji wykładniczej) może świadczyć o istnieniu korelacji krzywoliniowej.

Gdy zaś liczebności rozrzucone są chaotycznie po całym polu tablicy, to między zmiennymi nie ma zależności korelacyjnej

Charakter i siłę zależności korelacyjnej możemy wyrazić:

  1. Obliczając odpowiednie miary ścisłości związku korelacyjnego.

  2. Wyznaczając funkcje regresji.

Badanie ścisłości związku korelacyjnego.

Siłę zależności dwóch zmiennych można wyrazić liczbowo, stosując odpowiednie mierniki np.:

10 wskaźnik korelacyjny Pearsona (stosunek korelacji)

20 współczynnik korelacji liniowej Pearsona

30 współczynnik korelacji rang Spearmana

Ad 10 wskaźnik korelacyjny Pearsona zmiennej y względem x ma postać (y - zmienna zależna)

Wskaźnik korelacyjny Pearsona zmiennej v względem y (x - zmienna zależna)

S(x) i S(y) - odchylenie standardowe zmiennych x i y

Natomiast odchylenia standardowe średnich grupowych czyli warunkowych wyrażają się wzorem:

Gdzie:

, - są średnimi warunkowymi zmiennymi x i y (obliczanymi na podstawie tablicy korelacyjnej)

, - są średnimi ogólnymi obliczonymi dla odpowiednich zmiennych, przy wykorzystaniu rozkładów brzegowych.

Wskaźniki eyx i exy przyjmują wartość z przedziału [0,1] (1e) gdy są równe zero - cechy są nieskorelowane .

Ad 20 gdy są równe 1 zachodzi między nimi zależność funkcyjna.

Na ogół exy ≠ eyx z wyjątkiem przypadków 10 i 20

Współczynnik korelacji liniowej Pearsona.

-1<rxy<1

Kowariancja (w u (x, y)) jest średnią arytmetyczną iloczynu odchyleń poszczególnych zmiennych od ich średnich arytmetycznych.

w u (x, y)=0 brak zależności korelacyjnej,

w u (x, y)<0 ujemna zależności korelacyjnej,

w u (x, y)>0 dodatnia zależności korelacyjnej.

Współczynnik korelacji liniowej jest to średnia geometryczna dwóch współczynników regresji liniowej

Współczynnik korelacji rxy przyjmuje zawsze taki sam znak jaki mają współczynniki regresji.

Współczynniki regresji a1, b1 mają zawsze jednakowe znaki:

Przyjmuje się, że korelacje między dwoma cechami jest:

Nie wyrażona, gdy (r) ≤ 0,3

Średnie, gdy 0,3 < (r) < 0,5

Wyraźna, gdy (r) ≥ 0,5

Zachodzi zależność funkcyjna, gdy (r) = 1(korelacja doskonała)

Współczynnik korelacji rang Spearmana.

Obliczenia rozpoczynamy od uporządkowania wyjściowych informacji według rosnących (malejących) wariantów jednej z cech. Tak uporządkowanym wartościom nadajemy numery kolejnych liczb naturalnych. Czynności te nazywa się rangowaniem.

Di - różnice między rangami odpowiadających sobie wartości cechy xi, yi (i=1, ...n)

N - liczba obserwacji

Liniowa funkcja regresji.

Przez analizę regresji rozumiemy metodę badania wpływu zmiennych uznanych za objaśniające (niezależne) na zmianę uznaną za objaśnioną (zależną).

Model zależności stochestycznej.

Y f(x, ) (1)

y- zmienna zależności (objaśniona)

x - zmienna niezależna (objaśniająca)

q - składnik losowy (błąd) określający odchylenia przypadkowe wartości zmiennej y od wartości funkcji regresji.

Nadrzędnym badaniem zależności (1) jest:

E((y)x=xi)= (xi); i=1,...n (3)

E (x) y=yi i=1, ... n

Gdzie:

X1Y1 - to kolejne obserwacje zmiennej x i y.

Graficznym obrazem funkcji (xi) i 2(yi) są linie łamane, zwane empirycznymi liniami regresji. Funkcje 1(x1) i 2(yi) mogą być dowolnego typu tzn. mogą mieć kształt liniowy, potęgowy i wykładniczy, wielomianowy.

W badaniach praktycznych najczęściej wykorzystuje się liniowe funkcje regresji y1= (x)

Regresje zmiennej y względem zmiennej x I rodzaju

Gdzie:

Y1 - teoretyczne wartości funkcji regresji y1= (x)

0 1 - parametry strukturalne liniowej funkcji regresji y względem x

- składnik losowy (błąd) jest zmienną losową oraz

Analogicznie regresjie zmiennej x względem zmiennej y ma postać również pierwszego rodzaju.

Parametry strukturalne modelu nieznane i mogą być oszacowane na podstawie wyników badania (zaobserwowanych wartości zmiennej x oraz y). Metoda które daje dobre oszacowanie tych parametrów jest metoda najmniejszych kwadratów (MNK). Daje ona najlepsze liniowe nieobciążone estymatory parametrów regresji o możliwie najmniejszej

Erystomery najmniejszych kwadratów:

A0, B0 - szacuje 0, 0

A1, B1 - szacuje 1, 1

Oszacowanym równaniem regresji jest:

Y1=a0+a1x

Lub

X1=b0+b1y

Gdzie:

X1,y1 - są to wartości teoretyczne zmiennych x oraz y

A0, b0, a1, b1 - są ocenami nieznanych parametrów 0, 1, 0, 1

Różnice między wartościami empirycznymi y i a teoretycznymi y11 nazywamy resztami i oznaczamy:

Na czym polega metoda najmniejszych kwadratów:

Zatem szacowanie nieznanych parametrów sprowadza się do znalezienia takiej linii prostej aby:

  1. odchylenie wartości empirycznych od teoretycznych miały charakter losowy tzn.: były statystycznie nieistotne.

  2. Suma kwadratów tych odchyleń (reszt) była minimalna.

  1. Miary przeciętne

Medianę w szeregach uporządkowanych wyznacza się ze wzoru:

Przykład:

Dwóch pracowników wykonuje metale tego samego typu. Przeprowadzono obserwację czasu wykonywania gięcia metali przez robotnika a i dziesięć metali przez robotnika b i otrzymano następujące szeregi szczegółowe opisujące czas wykonania metali (w minutach).

Dla robotnika a: 12,15, 15, 18, 20, 21, 21 Robotnik a zużył 80 min. Na wykonanie 5 metali. Robotnik b zużył 154 minut na wykonanie 10 metali. Znaleźć średni czas wykonania jednego metalu przez robotnika a. Średni czas wykonania jednego metalu przez robotnika b, oraz Me, Q1, Q3.

Rozwiązanie:

W szeregach rozdzielczych przedzielonych medianą wyznacza się ze wzoru:

Gdzie:

M - numer przedziału (klasy) w którym występuje mediana

Xm - dolna granica przedziału, w którym występuje mediana

Hm - rozpiętość przedziału klasowego, którym jest mediana

nme - pozycja mediany

Pozycje mediany - (jednostki środkowej) ustala się na poziomie połowy liczebności próby:

Sposób wyznaczania kwartyli Q1 i Q3

Dla szeregów szczególnych - kwartyle Q1 i Q3 wyznacza się tak jak mediane. W szeregach rozdzielczych wyznaczenie kwartyli poprzedza ustalenie ih pozycji według wzoru:

Dla szeregów rozdzielczych z przedziałami klasowymi stosujemy wzory:

Gdzie:

M - numer przedziału, w którym występuje odpowiadający mu kwartyl.

Xm - dolna granica przedziału.

N - liczebność przedziału, w którym występuje dolny kwartyl.

M - rozpiętość przedziału, w którym występuje dany kwartyl.

Miary zmienności.

Miary zmienności (rozproszenia, dyspersja) charakteryzują stopień zróżnicowania jednostek zbiorowości pod względem badanej cechy. Podobnie jak miary przeciętne, określamy je na klasyczne i pozycyjne.

Do miar zmienności klasycznych zaliczamy.

Do miar zmienności pozycyjnych zaliczamy:

Uwaga!!!

Współczynnik zmienności w zależności od techniki obliczania może być miarą dyspersji klasyczną lub pozycyjną.

Warjancja, odchylenie standardowe, odchylenie przeciętne.

Warjancja - to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.

Dla szeregów szczegółowego warjancję wyznacza się wg wzoru.

Dla szeregu rozdzielczego punktowego:

Dla szeregu rozdzielczego z przedziałami klasowymi:

Własności warjancji:

gdzie:

k - liczba grup na jaką podzielono badaną populacje

n - liczebność zbiorowości

Si2 - średnia arytmetyczna ważona z warjancją wewnątrz grupowych

- średnia arytmetyczna całej populacji

- średnia arytmetyczna i - tej grupy

- warjancje średnich grupowych (warjancje między grupowe)

Odchylenie standardowe - jest pierwiastkiem kwadratowym z warjancji.

Parametr ten określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.

Typowy obszar zmienności określa wzór:

W obszarze tym mieści się około 2/3 wszystkich jednostek badanej zbiorowości statystycznej.

Odchylenie przeciętne - jest średnią arytmetyczną bezwzględnych wartości odchyleń poszczególnych wartości zbiorowości statystycznej od średniej arytmetycznej.

Dla szeregu szczegółowego

Dla szeregu rozdzielczego punktowego

Dla szeregu rozdzielczego przedziałowego

R = xmax - xmin

Mierzymy poziom zróżnicowania tylko części jednostek badanej zbiorowości tzn. po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych. Odchylenie to mierzymy więc średnią rozpiętości w połowie obszaru zmienności.

Typowy obszar zmienności (w zależności od mediany)

Współczynnik zmienności

Lub przy wykorzystywaniu miar pozycyjnych

Współczynnik zmienności jest wielkością nie uwarunkowaną przyjmuje się, że jeżeli współczynnik zmienności jest < 10% to cechy wykazują małe zróżnicowanie. Współczynnik zmienności stosuje się wtedy, gdy chcemy porównać kilka zbiorowości pod względem tej samej cechy lub tej samej zbiorowości pod względem kilku różnych cech.

Miary asymetrii

W wielu sytuacjach badanie średniego poziomu cechy i rozproszenia jej wartości nie wystarcza do analizy zbiorowości. Istotne jest jeszcze stwierdzeniem, czy większość badanych jednostek ma wartość cechy powyżej czy poniżej przeciętnego poziomu. Problem ten wiąże się z oceną asymetrii (skośności) rozkładu.

Asymetrię najładniej jest określić następująco:

asymetria prawostronna

lub asymetria lewostronna

Miarą określającą kierunek i siłę asymetrii jest współczynnik asymetrii (miara niemianowana). Współczynnik ten w zależności od miar klasycznych czy pozycyjnych wyraża się wzorem:

Wartość współczynnika -1<As<1- przy bardzo silnej asymetrii może przekroczyć nieznacznie ±1

Dla rozkładu umiarkowanie asymetrycznego zachodzi związek:

Miary koncentracji - statystyczny opis struktury zjawisk masowych można również przeprowadzić pod względem badania siły koncentracji.

Rozróżnia się dwa rodzaje koncentracji

Miarą skupienia obserwacji wokół średniej jest współczynnik skupienia (kurioza).

Przy czym:

Im wyższa wartość współczynnika k, tym większa koncentracja wartości cechy wokół średniej gdy:

k=3 - rozkład normalny

k>3 - rozkład jest wysmukły

k<3 - rozkład spłaszczony

Współczynnik ekscesu.

Informuje, czy koncentracja wartości zmiennej wokół średniej w danym rozkładzie jest większa czy też mniejsza w zbiorowości o rozkładzie normalnym.

Ze zjawiskiem koncentracji drugiego rodzaju mamy do czynienia wówczas, gdy występuje nierównomierny podział łącznego funduszu cechy (np. dochodu, produkcji) pomiędzy poszczególne jednostki zbiorowości (np. indywidualne osoby, zakłady produkcyjne) itp.

Koncentracja - jest tu związana z asymetrią i dyspersją im większa asymetria i zróżnicowanie jednostek tym większa jest koncentracja.

Dwa skrajne przypadki: to brak koncentracji oraz koncentracja zupełna

W rzeczywistości zjawiska te raczej nie występują. W praktyce statystycznej stosuje się zwykle dwie metody zjawisk:

Metoda graficzna polega na wykreśleniu tzw. Wieloboku koncentracji Lorenza.



Wyszukiwarka

Podobne podstrony:
statystyka ściąga wzory
Wnioskowanie statystyczne ściąga D6B4JQ75G5T3M73CHPOI7P6EFHU5KSVYOKQFV3Q
STATYSTYKA- ściąga, statystyka z demografią
Mikroekonomia - Sciaga (5 stron po 3 kolumny), Zarządzanie UMK, I rok, Mikroekonomia
Statystyka [25 stron], Statystyka opisowa
Socjolologia ściąga (5 stron) 3CSZF32WUSJVRLFUYX2Y6S3JAIZALJ572BUWCQI
statystyka sciąga
Finanse publiczne ściąga (8 stron) NX7LOSH35A6QJ525HJXD6PAHIZS7QCJCSWWFQOQ
statystyka ściąga
statystyka ściąga, Automatyka i robotyka air pwr, IV SEMESTR, statystyka stosowana
Finanse publiczne ściąga (9 stron) UICJTYQH6WJT27XF772PLYCBVONISCGJSQZUIIY
statystyka sciaga
Bankowość - ściąga (5 stron)
ściągi prawo, Prawo - sciaga (8 stron)
statystyka sciaga, PK, Statystyka

więcej podobnych podstron