1.CECHY
Zmienne;
a)jakościowe (opisowe)
-dwudzielna(2 warianty np. płeć)
-wielodzielna(ponad 2 warianty)
b)ilościowe(liczbowe)
-skokowa(1,2,3…)
-ciągłe (1,5 .4,2 ….)
2.
a) Spis- okresowe lub częstsze(doraźne) badanie wszystkich jednostek w ściśle określonym momencie czasu - inwentaryzacja- ustalenie stanu oraz stopnia zużycia majątku w ściśle określonym czasie
b)Rejestracja bieżąca- sukcesywne rejestrowanie zdarzeń (nr ewidencja urodzeń,rozwodów,zatrudnienia itd..na ich podstawie sporządzana jest sprawozdawczość.
3.Grupowanie statystyczne;
a) typologiczne- na podst. Cech jakościowych
b)wariancyjne- na podst. Cech ilościowych
4.SZEREGI STATYSTYCZNE
a)szczegółowy- uporządkowany ale nie pogrupowany materiał
b)rozdzielczy-zbiorowość rozdzielona na części wg wariantów cechy(ni i xi)
c)strukturalny-pogrupowana wg wariantów cechy jakościowej zbiorowość
d)punktowy-pogrupowana wg wariantów cechy ilościowej zbiorowość
e)przedziałowy (ROZDZIELCZY WIELOSTOPNIOWY)- zbiorowość pogrupowana wg cechy ciągłej sklasyfikowane w formie przedziałów
rozstęp- najwyższa i najniższa wartość cechy
Błąd grupowania jeśli;
-pusty min.1 przedział
-zbyt duża część zbiorowości w jednym przedziale
5.WYKRESY STATYSTYCZNE
a) punktowe- szeregi; szczegółowe, rozdzielcze,punktowe;
b)obrazkowe-szeregi; strukturalne(oparte na cesze jakościowej)
c)powierzchniowe- postać figur płaskich(kwadraty,prostokąty,koła),wielkość i struktura zbiorowości,szeregi; strukturalne, przedziałowe(histogram-przylegające do siebie prostokąty), czasowe i przestrzenne
d)liniowe-linia, szeregi; czasowe, przedziałowe(krzywa liczebności), punktowe(wielobok liczebności)
e)mapowe-przestrzenne zróżnicowanie zjawisk, szeregi; geograficzne, mogą przedstawić badane zjawisko za pomocą skali barwnej( kartogram) lub łączyć mapę z wykresami powierzchniowymi lub obrazkowymi (kartodiagram)
f)złożone-łączy odmienne formy graficzne np. wykres liniowy i powierzchniowy, przedstawia zmiany poziomu i struktury zjawisk w czasie(wykres warstwowy),lub efekt nakładania się zjawisk logicznie powiązanych (wykres saldowy)
wykresy prezentujące szereg rozdzielczy przedziałowy- histogram, krzywa liczebności
1.SZEREGI ROZDZIELCZE
a)strukturalny-rozkład cechy jakościowej
b)punktowy(jednostopniowy)- rozkład cechy ilościowej
c)przedziałowy (wielostopniowy)-rozkład cechy ilościowej
Analiza; przy jakościowych-stosowanie wskaźników struktury, ilościowych-różnorodne sposoby prezentacji i analizy rozkładu
2.TYPY ROZKŁADÓW EMPIRYCZNYCH (WYKRESY SYMETRUCZNE I ASYMETRYCZNE)
a) symetryczne
-oś symetrii- punkt centralny,określa stopień koncentracji.(im szersza linia tym mniejsza koncentracja)
b)asymetryczne;
-prawostronnie-dużo jednostek posiada niskie wartości cechy, niewiele obserwacji przy wysokich wartościach. Im bliżej początku układu współrzędnych tym silniejsza asymetria
-lewostronnie-niewiele jednostek posiadających niskie wartości cechy
c)rozkład bimodalny-posiadający 2 punkty skupienia
d)siodłowy (w kształcie litery U)- 2 punkty skupienia na krańcach wykresu
e) równomierny (pozioma linia) – we wszystkich przedziałach występuje taka sama liczba obserwacji
3.Analizując rozkład cechy mierzalnej weź pod uwagę
tendecję centralną-przeciętny poziom
Dyspersję-zróżnicowanie
Asymetrię-skośność
Koncentrację- kurioza
Do oceny powyższych własności służą parametry klasyczne-do symetrycznych i umierkowanie asymetrycznych(obliczane na podstawie wszystkich obserwacji) i pozycyjne-silnie asymetryczne i o otwartych przedziałach klasowych(na podst. Ich miejsca w szeregu lub częstotliwości występowania).
4.MOMENTY
-miary klasyczne obliczone na podstawie wszystkich obserwacji
a) Moment rzędu – średnia arytmetyczna z podniesionych do potęgi tego rzędu odchyleń wartości cechy od stałej.
jeżeli za stałą przyjmiemy 0 otrzymamy moment zwykły
jeżeli za stałą przyjmiemy średnią arytmetyczną otrzymamy moment centralny
b)moment 1zwykły to średnia arytmetyczna
c)moment 2 centralny-wariancja
d)moment 3 centralny- asymetria
e)moment 4 centralny- miara spłaszczenia(skupienia wokół średniej)
5.MIARY POŁOŻENIA
a) wypadkowe-średnia arytmetyczna
b)typowe-dominanta=moda(ma sens przy analizie szeregów strukturalnych) i punktowych
c)pozycyjne-mediana, kwartyl 1 i 3, decyl 1
6.MIARY ŚREDNIE- opisują tendencję centralną
Dominanta(moda)- jaki poziom cechy jest najczęstszy
-nie może =0 (jest opisana funkcją kwadratową)
-wartość typowa, miara położenia
-wartość cechy która występuje najczęściej
-hisogram
Średnia pozycyjna-mediana-poziom cechy środkowej jednostki
-wartość środkowa
-krzywa liczebności skumulowanych
Średnia arytmetyczna-średni poziom cechy na jednostkę
DLA SZEREGÓW ROZDZIELCZYCH PRZEDZIAŁOWYCH
D<Me<X
X<Me<D
7.KWANTYLE-wartości cech u jednostek zbiorowości w określonym miejscu szeregu.-pozycyjna miara położenia,najcześciej obliczamy je w analizie szeregów silnie asymetrycznych z otwartymi przedziałami
–mediana(wartość środkowa)
-kwartyle(ćwiartkowa)
-decyle(dziesiętna)
-Szereg szczegółowy- uporządkować ciąg, wskazać pozycję jednostki, jeśli jest dokładnie w śrdoku obliczyć jako średnią jednostek
-Szereg rodzielczy- ustalić pozycję kwanty la(na podstawie liczebności skumulowanych odnajdujemy przedział w jakiej znajduje się jednostka)
8.KWARTYLE-wartości ćwiatkowe, dzielą uporządkowaną rosnąco zbiorowość na 4 równe części
a)KWARTYL 1 Q1-wartość cechy którą posiada 1/4 szeregu 25% ma wartości nie większe niż Q1, a 75% nie mniejsze.
b)KWARTYL Q2 (MEDIANA)- połowa zbiorowości ma wartości nie większe a połowa nie mniejsze od Q2=Me
c)KWARTYL3 Q3- wartość cechy w ¾ przedziału- 75% nie większe, 25% nie mniejsze od Q3
W szeregach rozdzielczych punktowych wyznaczamy pozycja Q1 i Q3 a następnie znajdujemy przedziały, w przedziałowych po wyznaczeniu pozycji Q1 i Q3 i znajdujemy przedziały
9.DECYLE- pozycyjne miary położenia, dzielą szereg na 10 równych części- SZEREGI ROZDZIELCZE.
Obliczamy D1 i D9 .
żeby obliczyć rozkład wynagrodzeń obliczamy wszystkie decyle
Miary dyspersji
NATĘŻENIE ZRÓŻNICOWANIA CECHY <porównywanie rozkładów>
->miary zróżnicowania,rozproszenia,zróżnicowania (czym różnią się od siebie badane jednostki)
miary klasyczne<wypadkowe różnic cechy> i pozycyjne<różnica dwuch wartości cechy zajmującyc szczególną pozycję w szeregu, wynaczane na podstawie kwantyli>
1.KLASYCZNE MIARY DYSPERSJI
-PUNKT ODNIESIENIA-średnia arytm. Więc miary są liczone jako średnie z odchyleń
a)wariancja –średnia rytm z kwadratów odchyleń od średniej- MOMENT 2 CENTRALNY,dla szeregów szczegółowych obliczana jako parametr nieważony
-przyjmuje wartości większe od 0- im większa jej wartość tym większe zróżnicowanie cechy
b)odchylenie standardowe- średnia z odchyleń od średniej
- wielkość odchylenia standardowego do średniej rytm.i mnożąc iloraz przez 00 otrzymam współczynnik zmienności (s/x)*100=V(s)
c) współczynnik zmienności- ocenia natężenie zróżnicowania cechy w zbiorowości.Im większy współczynnik tym większe zróżnicowanie.
d)odchylenie przeciętne- średnia z bezwzględnych odchyleń od średniej.
D<lub równe s
JEŻELI BADANY SZEREG MA TENDECJĘ CETRALNĄ ,odhylenie standardowe może być wykorzystane do wyznaczenia typowego obszaru zmienności czyli tych wartości cechy które występują u większości jednostek. Typowy obszar zmienności wyznacza średnia arytmetyczna i odchylenie standardowe.
POZYCYJNE MIARY DYSPERSJI
Wyznaczane na podstawie pozycji jednostek.
A)ROZSTĘP(tj. obszar zmienności)- wyznaczony przez najwyższą i najniższą wartość cechy. Najbardziej ogólna miara dyspersji opierająca się na skrajnych wartościach. NIE DA SIĘ OBLICZYĆ DLA OTWARTYCH PRZEDZIAŁÓW,ale można wtedy obliczyć rozstęp decylowy(D9-D1)-> ta miara pokazuje 80% oszaru środkowych jednostek
Rozstęp kwartylowy-(Q3-Q1)-dot.zmienności 50% środkowych zbiorowości.służy do obliczenia odchylenia ćwiartkowego. Odchylenie ćwiartkowe-POŁOWA Z POŁOWY OBSZARU ŚRODKOWYCH JEDNOSTEK.Jak chcesz policzyć względną miarę dyspersji przyrównaj odchylenie ćwiartkowe do odpowiedziej średniej tj mediany.
MIARY ASYMETRII
Asymetria dodatnia(przy niższych wartościach), ujemna (przy wyższych)
a)szereg symetryczny- liczebności rozłożone równomiernie po obu stronach średniej rytm. W środku rozkładu znajduje się D,Me i x. relacja; x=Me=D
b)asymetria dodatnia- skupienie przy wartościach cechy niższych od średniej więc x-D>0 a relacja wygląda tak; D<Me<x
c)asymetria ujemna- wartości cechy wyższe od średniej więc x-D<0 a relacja; x<Me<D
d)natężenie=siła ;
klasyczne;
-moment trzeci względny-szeregi rozdzielcze punktowe i przedziałowe, kiedy można obliczyć średnią, najpierw obliczamy moment trzeci centralny
µ3=0 SZEREG SYMETRYCZNY- odchylenie dodatnie i ujemne znoszą się nawzajem
µ3>0 SZEREG O ASYMETRII DODATNIEJ-odchylenia dodatnie przeważają nad ujemnymi
µ3<0 SZEREG O ASYMERII UJEMNEJ- wiadomo. ;)
Moment trzeci względny jest ilorazem momentu 3 centralnego i odchylenia standardowego^3
znajduje się w przedziale -2<α3<2.Im bliżej 0 tym słabsza asymetria, im bardziej się oddala tym większe natężenie.
Współczynniki asymetrii;
a)OBLICZANY NA PDSTAWIE ŚREDNIEJ I DOMINANTY A(x), przyjmuje wartości w przedziale (-1,1), wyłącznie do szeregów rozdzielczych przedziałowch, oby nie punktowe.
=0 szereg symetryczny
>0 szereg asymetrii dodatniej
<0 szereg o ujemnej asymetrii
b)na podstawie kwartyli- szereg o przedziałach otwartych, forma zapisu wynika z silnej asymetrii rozkładu i występują wartości skrajne. Wtedy właśnie go używamy. Zakładamy że odległość oby kwartyli od Mediany jest taka sama, w szeregu asymetrii + Q1 jest bliżej Me niż Q3, a jeżeli asymetria jest ujemna odwrotnie
c) współczynnik asymetri wykorzystujący decyle- A(D). D1 jest tak samo oddalony od Me jak D9.Przedział <-1,1>
Q3-Me=Me-Q1 symetryczny
Q3-Me>Me-Q1 asymetria prawostronna
Q3-Me<Me-Q1 asymetria lewostronna
MIAR ASYMETRII NIE MOŻNA PORÓWNYWAĆ.
Miary spłaszczenia;
KUROZA wynika ze stopnia skupienia obserwacji wokół średniej, szeregi symetryczne, umiarkowanie asymetryczne czyli charakteryzujące się tendencją centralną.
Przy silnym skupieniu otrzymamy rozkład wysmukły(wysoki chudy), przy słabym spłaszczony(mały gruby). Tj krzywa liczebności
A)moment czwarty centralny- średnia z odchyleń wartości cechy od średniej^4,ocena koncentracji wokół średniej.
µ4=3 – koncentracja normalna, rozkład normalny( w kształcie dzwony, w punkcie centralnym jest średnia, mediana i dominanta czyli średnia jest wartością cechy najczęstszej. Jej kształt wyznacza średnia i odchylenie.
µ4<3 –koncentracja poniżej 68%(normalnej), rozkład spłaszczony
µ4>3 – koncentracja większa od normalnej, rozkład wysmukły
TU WYKRES WALNIJ Z 82 STRONY
JEŻELI NIE MOŻEMY OBLICZYĆ ŚREDNIEJ W PRZEDZIAŁACH OTWARTYCH;
Posługujemy się wskaźnikiem spłaszczenia <kurtozy> opartym na kwanty lach W(k)
=0,263 ROZKŁAD NORMALNY
>0,263 ROZKŁAD SPŁASZCZONY
<0,263 ROZKŁAD WYSMUKŁY
OCENA NIERÓWNOMIERNOŚCI PODZIAŁU GLOBALNEJ WARTOŚCI CECHY W ZBIOROWOŚCI
Chodzi o koncentracje(np.rozmieszczenie ludności w Polsce)-decydują o niej proporcje między liczebnościami poszczególnych przedziałów i globalną wartością cechy w poszczególnych przedziałach szeregu. Można określić podział za pomocą krzywej Lorenza- im koncentracja jest silniejsza tym krzywa Lorenza oddala się od linii równomiernego podziału.
Miarą koncentracji jest współczynnik koncentracji- przedział od <0,1>, jeśli jest słaba to pole a jest małe i wartości są blisko 0.
Porównywanie rozkładów
względny wskaźnik podobieństwa struktur ” Z”, <0,1>,
z=1 porównywane struktury są identyczne
z=0 są zupełnie różne
szeregi rozdz.punktowe- wykres słupkowy, krzywa liczebności
szeregi rozdz.przedziałowe- krzywa liczebności
Zestawienie parametrów rozkładu charakterystyka liczbowa opisujących własnyci
ANALIZA WSPÓŁZALEŻNOŚCI
1.metody badania związków między cechami
Jeżeli obie badane cechy są ilościowe a przynajmniej jedna z nich to oceniamy związki między nimi metodami korelacji i regresji.
Korelacja=współzależność,współwystępowanie; forma tabelaryczna(szeregi,tablice), graficzna(diagram korelacyjny) oraz parametryczną (opis liczbowy)
Jeżeli zmiany wartości obu cech przebiegają w tym samym kierunku (razem rosną lub razem maleją) jest to korelacja dodatnia, jeżeli na odwrót to ujemna.
a)diagram korelacyjny
-związek funkcyjny liniowy- punkty ułożone wzdłuż linii prostej, konkretnym wartościom jednej cechy są ściśle przyporządkowane wartości drugiej cechy, kąt nachylenia punktów do osi OX 90 stopni, więc zależność jest dodatnia(rosną wartości X a wraz z nimi Y)
-związek korelacyjny dodatni-punkty są nachylone pod kątek ostrym,konkretnym wartościom jednej cechy odpowiada kilka wartości drugiej cechy,średnie wykazują określoną tendencję. Obie wartości albo rosną razem albo razem maleją.
- związek funkcyjny liniowy o kierunku ujemnym-kąt rozwarty do osi OX, rosnącym wartościom jednej cechy odpowiadają malejące wartości drugiej cechy
-brak związku- punkty rozrzucone
-Związek korelacyjny krzywoliniowy- punkty wzdłuż linii krzywej
IM MNIEJSZY ROZRZUT PUNKTÓW TYM SILNIEJSZA KORELACJA.
Współczynnik korelacji do kwadratu to współczynnik determinacji- jaka część jednej cechy jest wyjaśniona drugą cechą. Współczynnik indeterminacji na odwrót.
Stosunki korelacyjne Pearsona- Miary wykorzystywane do analizy związków liniowych i krzywoliniowych korelacji dla oy cech ilościowych lub niezależnej jakościowej.
Współczynnik korelacji liniowej Pearsona- onena współzależności między dwiema cechami.
Stosunki korelacyjne wykazują silne związki ale nie informują o kierunku.
Regresja=oddziaływanie cechy zmiennej niezależnej na zależną. FUNKCJE REGRESJI; wpływ X na Y y^=f(x) i na odwrót.
Obie metody są ze sobą powiązane i się uzupełniają.