stat-w., statystyka matematyczna(1)


STATYSTYKA - wykłady

L.Gruszczyński „Elementy statystyki dla socjologów”

Dr. Pactwa - pon. i wtorek 09:30 - 11:00 (pok. 217)

  1. (08.X)

    1. Statystyka - jest to nauka zajmująca się metodami ilościowymi badania prawidłowości zjawisk masowych

    1. Badanie statystyczne - ogół prac mających na celu poznanie struktury badanej zbiorowości statystyczne.

    1. Zbiorowość statystyczna - zbiór dowolnych elementów, osób, przedmiotów lub faktów, podobnych pod względem określonych cech, ale nie identycznych i poddanych badaniu statystycznemu

      1. zbiorowość generalna (populacja) - wszystkie elementy, będące przedmiotem badania, co do których chcemy formułować wnioski

      2. zbiorowość próbna (próba) - podzbiór populacji generalnej obejmujący część jej elementów wybranych w określony sposób. (wybór celowy i kwotowy lub losowo)

    1. Rodzaje badania statystycznego:

      1. całkowite (wyczerpujące) - gdy obserwacji poddane są wszystkie jednostki populacji generalnej (np. powszechny spis ludności)

      2. częściowe (próba)

    1. Rodzaje cech statystycznych - właściwości jednostek statystycznych:

      1. mierzalne - (ilościowe, kwantyfikowalne) można je wyrazić przy pomocy odpowiednich jednostek fizycznych(cm, kg itp.)

          • cechy quasi-ilościowe, wyrażające natężenie cechy

  1. niemierzalne - (jakościowe) są zwykle określanie słownie(płeć, wykształcenie, wiek)

  2. skokowe - (dyskretne) przyjmują skończony lub przeliczany zbiór wartości na danej skali liczbowej (ilość dzieci)

  3. ciągłe - przyjmują każdą wartość z określonego przedziału liczbowego (waga)

    1. Cele badania statystycznego -

          • poznanie rozkładu zbiorowości pod względem wybranych cech

          • ustalenie jakiego rodzaju związki występują między cechami (współzależność cech)

          • porównywanie i porządkowanie obiektów wielorodnych

          • poznanie dynamiki zbiorowości

    1. Etapy badania statystycznego:

      1. przygotowanie badań

          • sformułowanie celu badawczego (postawienie pytań i hipotez)

          • określenie rzeczowego, przestrzennego i czasowego zasięgu badań

          • rodzaje wykorzystywanego materiału badawczego i metod jego gromadzenia

          • określenie sposobu opracowania i prezentacji zebranego materiału

          • określenie metod analizy tego materiału

          • określenie reguł wnioskowania

  1. gromadzenie materiału badawczego - materiał pierwotny (pozyskany przez nas) lub wtórny (już istniejący)

  2. opracowanie i prezentacja zebranego materiału

  • opis statystyczny (analiza badanej zbiorowości) - oblicznie miar czyli charakterystyk opisowych badanej zbiorowości (statystyka opisowa)

  • wnioskowanie statystyczne - zastosowanie testów na podstawie których dokonuje się uogólnień do całe zbiorowości

    1. 15.X

      1. Grupowanie statystyczne:

        1. grupowanie typologiczne - ma na celu wyróżnienie jednorodnych grup jakościowych

        2. grupowanie wariancyjne - ma na celu uporządkowanie badanej zbiorowości i poznanie jej struktury. Polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych

      1. Szeregi statystyczne - występują przy użyciu grupowania wariancyjnego. Jest to ciąg wielkości statystycznych uporządkowanych według określonego kryterium. Rodzaje szeregów statystycznych:

        1. szereg szczegółowy - uporządkowanych ciąg wartości badanej cechy statystycznej, w wypadku małej ilości danych. Można go uporządkować malejąco lub rosnąco.

        2. szereg rozdzielczy - zbiorowość statystyczne podzielona na części (klasy) według określonej cechy mierzalnej jakościowej lub ilościowej, z podaniem liczebności dla każdej z wyodrębnionych klas (rozkład empiryczny)

            • szereg rozdzielczy I typu - każdy wariant cechy stanowi osobną klasę

            • szereg rozdzielczy II typu - występują przedziały „od/do”, które zawsze mają dolną granicę (xd) i górną. Różnica między dolną a górną granicą to rozpiętość przedziału (l).

      1. Przedstawienie graficzne wyników

        1. histogram (wykres słupkowy)- zbiór prostokątów, których podstawy są wyznaczone na osi odciętych, stanowiąc rozpiętości poszczególnych przedziałów klasowych. Natomiast wysokości są określone na osi rzędnych, przez liczebności odpowiadające poszczególnym przedziałom klasowym

        2. wielobok liczebności - linia łamana powstała z połączenia punktów, których współrzędnymi są środki przedziałów klasowych (xi`), czyli średnia arytmetyczna (dolna granica +górna granica / 2)

        3. szereg skumulowany - szereg powstały z szeregu rozdzielczego przez kolejne dodawanie (kumulowanie) przedziałów klasowych oraz odpowiadających im wartości (ncum)

      1. Opis struktury badanej grupy - opisujemy przy pomocy parametrów. Jednym z nich są miary tendencji centralnej:

        1. średnie klasyczne:

            • średnia arytmetyczne

    0x01 graphic

        1. średnie pozycyjne (zajmują w szeregu szczególną pozycję)

            • dominanta - wartość tej zmiennej, która w szeregu statystycznym występuje najczęściej

    0x01 graphic

    xd = dolna granica przedziału najliczniejszego

    l = rozpiętość przedziału najliczniejszego

    n0 = liczebność najliczniejszego przedziału

    nn-1 = liczebność przedziału poprzedzającego najliczniejszy

    nn+1 = liczebność przedziału po najliczniejszym

    Q1 - wartość szeregu dzieląca zbiorowość na dwie części tak, że 1\4 ≤ Q1 3\4

    0x01 graphic

    Q3 - wartość szeregu dzieląca zbiorowość na dwie części tak, że 3\4 ≤ Q1 1\4

    0x01 graphic

    0x01 graphic

    xd = dolna granica przedziału mediany

    n\2 = wyraz środkowy

    ncum-1 = liczebność skumulowana w przedziale poprzedzającym przedział mediany

    nM = liczebność zwykła przedziału mediany

    1. 22.X

      1. Miary rozproszenia (zróżnicowania): Pozwalają na uogólnienie różnic w wartościach cechy, zaobserwowanych u jednostek w badanej zbiorowości. Klasyczne (odchylenie klasyczne, wariancja, odchylenie standardowe, współczynnik zmienności) i pozycyjne (rozstęp, odchylenie ćwiartkowe, współczynnik zmienności dla miar pozycyjnych)

        1. klasyczne:

            • odchylenie przeciętne (odchylenie średnie) - średnia arytmetyczna bezwzględnych wartości odchyleń wartości cechy od średniej arytmetycznej szeregu. Kolejność postępowania:

              • wyliczamy średnią arytmetyczną szeregu

              • od poszczególnych wartości zmiennej odejmujemy obliczoną średnią

              • obliczone odchylenia sumujemy ignorując znaki

              • dzielimy przez liczebność szeregu

    0x01 graphic

    0x01 graphic

    0x01 graphic

    l = rozpiętość przedziału klasowego

    0x01 graphic

    0x01 graphic

        1. pozycyjne:

    0x01 graphic

    0x01 graphic

    0x01 graphic

    M = mediana

    Q = odchylenie ćwiartkowe

    1. 29.X

      1. Miary asymetrii

        1. asymetria rozkładu- określana przez porównywanie xA, m i D:

            • jeżeli xA=M=D - szereg symetryczny.

            • jeżeli xA>M>D - rozkład o asymetrii prawostronnej

            • jeżeli xA<M<D - rozkład o asymetrii lewostronnej

        1. rozkłady symetryczne - to takie, w których obserwacje rozłożone są równomiernie po obu stronach osi symetrii.

        1. rozkłady asymetryczne -

            • I - większość obserwacji znajduje się w przedziałach położonych bliżej początku szeregu, większość cech ma wartości i niskich nominałach.

            • II - przedział klasowy zawierający największą liczbę obserwacji przesunięty jest w prawo - w ostatnich przedziałach

            • Rozkłady bimodalne - dwa wyraźne punkty skupienia

    0x08 graphic
    0x08 graphic

    0x08 graphic

    0x08 graphic
    0x08 graphic

    0x08 graphic

    0x08 graphic

    0x08 graphic

    0x08 graphic

        1. miernik skośności - jest podstawowym miernikiem asymetrii rozkładu

    0x01 graphic

        1. współczynnik skośności - siła i kierunek skośności

    0x01 graphic

    Ws∈ (-1, 1)

    S = odchylenie standardowe

    Ws = 0 - symetria

        1. pozycyjna miara asymetrii

    0x01 graphic

    As∈ (-1,1)

    As∈ (-1,0> - asymetria lewostronna

    As∈ <0,1) - asymetria prawostronna

        1. moment centralny trzeci w jednostkach standardowych - najdokładniejsza miara, bo uwzględnia wszystkie wartości

    0x01 graphic

    0x01 graphic

    0x01 graphic
    α3∈ (-2,2) - im bliższy 0 tym asymetria jest słabsza

      1. Miary koncentracji - jak bardzo poszczególne obserwacje skupiają się wokół średniej arytmetycznej:

        1. kurtoza

    0x01 graphic

    0x01 graphic

    K∈(-3,3) - jeżeli K= 3 rozkład normalny

    1. 5.XI.

      1. Rozkład normalny

        1. pole powierzchni pod krzywą wynosi 1, takie też jest prawdopodobieństwo, że zmienna znajdzie się w przedziale zawierającym się pod krzywą, czyli (-∞,+∞). Sigma (δ) to odchylenie standardowe w rozkładzie normalnym i od (-δ,+δ) znajduje się 68,26% przypadków (po 34,13% po każdej stronie osi symetrii)

        1. Oś symetrii rozkładu normalnego to średnia arytmetyczna (= mediana = dominanta). Dany jest rozkład normalny X: N(xA, δ)

    0x01 graphic

    1. 21.XI.

      1. Estymacja parametrów - rodzaj wnioskowania polegający na szacowaniu parametrów populacji generalnej na podstawie statystyk z próby.

        1. estymacja punktowa - znalezienie konkretnej liczby dla każdego szacowanego parametru.

    0x01 graphic

    D(Tn) - błąd standardowy szacunku

    T - konkretna wartość statystyki tego parametru w próbie

        1. estymacja przedziałowa - wyznaczenie przedziału, w którym z pewnym prawdopodobieństwem znajduje się parametr estymowany. Występuje tu przedział ufności i współczynnik ufności, a długość przedziału ufności wynosi:

    0x01 graphic

    Q - szacowany parametr

    P = 1-α - współczynnik ufności

    t +/-zαD(Tn) - granice przedziału ufności

    zα - zmienna standaryzowana (wartość krytyczna)

    0x01 graphic

    0x01 graphic

    1. Testy 2

        1. dla tabeli, dane ilościowe i jakościowe

    1. 0x01 graphic

    2. 0x01 graphic

    ne - liczebności empiryczne, rzeczywiście zaobserwowane w pomiarach

    nt - liczebności teoretyczne, oczekiwane w poszczególnych komórkach

    0x01 graphic

    k - kolumny

    w - wiersze

    2obl > ℵ2α - nie ma przesłanek do przyjęcia H0, przyjmujemy H1

        1. dla szeregu, dane ilościowe (rozkład normalny)

    0x01 graphic

    ss = k - r - 1; gdzie r to liczba parametrów, a k to liczba kolumn

    0x01 graphic

    1. Siła korelacji

      1. Współczynnik korelacji c Pearsona. <-1;1> , siła związku:

    0x01 graphic

      1. Współczynnik korelacji r:

    0x08 graphic
    0x01 graphic

    mniejsza z różnic (k - 1) lub (w - 1)

      1. Współczynnik korelacji V2

    0x08 graphic
    0x01 graphic

    mniejsza z różnic (k - 1) lub (w - 1)

      1. Związek między cechami ilościowymi - współczynnik korelacji r Pearsona

    0x01 graphic

    r = 0 - nie ma związku

    r = 1 - związek całkowity dodatni (jak jeden w rośnie to drugi też)

    r = -1 - związek całkowity ujemny

    0< r >1 - korelacja dodatnia niedoskonała

    -1< r >0 - korelacja ujemna niedoskonała

    0< r >0,2 - bardzo słaba

    0,2< r >0,3 - słaba

    0,3< r >0,5 - średnia

    0,5< r >0,7 - silna

    0,7< r >1 - bardzo silna

    1. LICZENIE ZADANIA Z DANYMI ILOŚCIOWYMI W TABLICY KORElACJI

      1. Wyznaczamy środki przedziałów klasowych xi i yi.

      2. Wyznaczamy punkty wyjściowe (arbitralne) x0 i y0, czyli środki przedziałów przedziału środkowego (w przypadku liczby parzystej np.4 wziąć drugi lub czwarty).

      3. Obliczamy wartości odchyleń ui i vi, poszczególnych środków przedziałów klasowych od ich punktów arbitralnych wg: 0x01 graphic

    0x01 graphic

      1. Obliczamy iloczyny odchyleń i właściwych im liczebności w przedziałach (niui i nivi)

      2. Obliczamy iloczyny kwadratów odchyleń i liczebności w przedziałach

      3. Obliczamy iloczyny odchyleń cechy x i cechy y: uivi (dla każdej komórki) a liczebności te zapisujemy w lewych górnych rogach komórki tablicy

      4. Wpisany w lewym górnym roku iloczyn (uivi) mnożymy przez liczebność a wynik mnożenia wpisujemy w prawym dolnym rogu komórki

      5. Wpisany w prawych dolnych rogach komórek iloczyny - niuivi - sumujemy w poziomie i pionie a wyniki sumowań zapisujemy w ostatnim wierszu i ostatniej kolumnie i to też sumujemy

      6. Sprawdzamy poprawność obliczeń poprzez porównanie sumy w ostatnim wierszu i ostatniej kolumnie. Powinny się równać.



    Wyszukiwarka

    Podobne podstrony:
    Kordecki W, Jasiulewicz H Rachunek prawdopodobieństwa i statystyka matematyczna Przykłady i zadania
    ESTYMACJA STATYSTYCZNA duża próba i analiza struktury, Semestr II, Statystyka matematyczna
    stata kolos, statystyka matematyczna(1)
    ESTYMACJA STATYSTYCZNA2 duża próba i analiza struktury(2), Semestr II, Statystyka matematyczna
    (10464) L.Zaręba- Metody badań w socjologii IIIS, Zarządzanie (studia) Uniwersytet Warszawski - doku
    02 Statystyka Matematyczna Zmienna Losowa Ciągłaid 3789
    statystyka matematyczna - I poprawka, wsfiz - magisterskie, I semestr, statystyka matematyczna Kusze
    Weryfikacja hipotez 3 (2 średnie), Semestr II, Statystyka matematyczna
    zmienna losowa ciągła, statystyka matematyczna(1)
    STATYSTYKA MATEMATYCZNA, Dokumenty(1)
    statystyka matematyczna - ściąga z teorii na egzamin, Zootechnika (UR Kraków) - materiały, MGR, Stat
    STATYSTYKA MATEMATYCZNA Opracowanie na kolokwium
    Elementy statystyki matematycznej wykorzystywane do opracowywania wielkości wyznaczanych, Geodezja i
    Statystyka matematyczna, 4-część, Analiza regresyjna

    więcej podobnych podstron