stat exam[1]


ELEMENTY RACHUNKU PRAWDOPODOBIEŃSTWA

Rachunek prawdopodobieństwa zajmuje się badaniem praw rządzących zdarzeniami losowymi.

Doświadczenie nazywamy losowym, jeżeli pomimo sprecyzowania warunków, w których jest ono realizowane nie jesteśmy w stanie przewidzieć jego wyniku.

Z każdym doświadczeniem losowym związany jest zbiór tzw. zdarzeń elementarnych i oznaczamy przez omegę (Ω). Zdarzenia elementarne (oznaczamy małą omegą ω) mają własności:

Przykłady:

  1. rzucamy monetą - zbiór zdarzeń elementarnych Ω składa się z dwóch elementów ω1 i ω2 (orzeł lub reszka)

Ω = { ω1, ω2}

  1. rzucamy kostka symetryczną do gry - elementów jest sześć: Ω = { ω12345,ω6}

ωi - zdarzenie polegające na wyrzuceniu i-oczek gdzie i 0x01 graphic
{1,2,3,4,5,6}

  1. dwukrotny rzut monetą - Ω = {(o,o);(o,r);(r,o);(r,r)}

  2. obserwowanie jakości towaru (towar dobrej jakości, towar złej jakości) Ω = { ω1, ω2}

  3. rzut monetą do momentu wyrzucenia reszki (możliwości jest nieskończenie wiele)

Ω = { ω1, ω23,...}, gdzie ω1- wyrzucenie reszki za pierwszym razem; ω2- wyrzucenie reszki za drugim razem...

  1. wybieramy losowo punkt z odcinka o końcach 0-1 (nieskończenie wiele rozwiązań - nie przeliczamy zdarzeń elementarnych) Ω = { ω} gdzie ω to zdarzenie polegające na wylosowaniu liczby z przedziału 0-1

Każdy podzbiór przestrzeni zdarzeń elementarnych nazywamy zdarzeniem losowym (np. zdarzenie polegające na wyrzuceniu parzystej liczby oczek Ω = { ω2, ω46})

Definicja 1: Różnicą zdarzeń A i B (A-B, A\B) nazywamy zdarzenie polegające na zajściu zdarzenia A i nie zajściu zdarzenia B.

Definicja 2: Sumą lub alternatywą zdarzeń A i B (A0x01 graphic
B) nazywamy zdarzenie polegające na zajściu przynajmniej jednego z tych zdarzeń.

Definicja 3: Koniunkcją lub iloczynem zdarzeń A i B (A0x01 graphic
B) nazywamy zdarzenie polegające na tym, że zawiera te i tylko te zdarzenia elementarne, które sprzyjają jednocześnie zdarzeniu A i B.

Definicja 4: Dopełnienie (zdarzenie przeciwne). Niech A będzie zdarzeniem dowolnym,

Ω - przestrzenią zdarzenia to różnicę Ω\A nazywamy zdarzeniem przeciwnym do zdarzenia A (A').

Definicja 5: Mówimy, że zdarzenie A pociąga zdarzenie B (lub B jest następstwem zdarzenia A), jeżeli każde zdarzenie elementarne sprzyjające zdarzeniu A sprzyja zdarzeniu B.

Definicja: Niech Ω będzie przestrzenią zdarzeń elementarnych, 2 zbiorem wszystkich podzbiorów Ω. Niepustą klasę F0x01 graphic
2 nazywamy 0x01 graphic
-ciałem (ciałem przeliczalnie addytywnym) jeśli:

A1: A0x01 graphic
F 0x01 graphic
A'0x01 graphic
F

A2: A1,A2,… 0x01 graphic
F0x01 graphic
A10x01 graphic
A20x01 graphic
...0x01 graphic
F, gdzie0x01 graphic

Fakt:

  1. A1,A2,… 0x01 graphic
    F0x01 graphic
    0x01 graphic

  2. Ft - 0x01 graphic
    -ciała, t0x01 graphic
    F0x01 graphic
    0x01 graphic
    - 0x01 graphic
    -ciało

  3. 0x01 graphic
    Ø, 0x01 graphic
    2 to istnieje najmniejsze 0x01 graphic
    -ciało zawierające 0x01 graphic
    . [azywa się 0x01 graphic
    -ciało generowane i oznaczamy 0x01 graphic
    (0x01 graphic
    )].

0x01 graphic
(0x01 graphic
) = 0x01 graphic
{F:F-0x01 graphic
-ciało, 0x01 graphic
0x01 graphic
F}

Definicja aksjomatyczna prawdopodobieństwa: Niech Ω będzie przestrzenią zdarzeń elementarnych. F - 0x01 graphic
-ciałem tej przestrzeni. Prawdopodobieństwem nazywamy dowolną funkcję P działającą z 0x01 graphic
-ciała F (P: F0x01 graphic
R) do zbioru liczb rzeczywistych spełniającą warunki:

B1: P(A) 0x01 graphic
0 dla każdego A0x01 graphic
F

B2: P(Ω) = 1

B3: dla dowolnego ciągu zdarzeń A1, A2, ... parami wykluczających się zachodzi:

P(A10x01 graphic
A20x01 graphic
...) = 0x01 graphic

Trójkę (Ω, F, P) nazywamy przestrzenią probabilistyczną, natomiast parę (Ω, F) przestrzenią mierzalną, zaś dowolny element 0x01 graphic
-ciała zdarzeniem losowym.

WŁASNOŚCI:

C1: P(A') = 1-P(A)

C2: A, B 0x01 graphic
F 0x01 graphic
P(A0x01 graphic
B) =P(A) + P(B) - P(A0x01 graphic
B)

C3: A1,A2,…An0x01 graphic
F

P(A10x01 graphic
A20x01 graphic
... 0x01 graphic
An) = 0x01 graphic

C4: 0x01 graphic

C5: 0x01 graphic

C6: P(A)0x01 graphic
1

C7: Jeśli przestrzeń Ω jest co najwyżej przeliczalna (Ω={0x01 graphic
, 0x01 graphic
,...}) i określone są prawdopodobieństwa zdarzeń jednoelementowych P({0x01 graphic
}) = p1, P({0x01 graphic
}) = p2,..., przy czym pi > 0, i = 1, 2,..., 0x01 graphic
, to prawdopodobieństwo dowolnego zdarzenia A = {0x01 graphic
, 0x01 graphic
,...} jest równe:

P(A) = pi1 + pi2 + ...

C8: Definicja klasyczna prawdopodobieństwa: Jeżeli Ω = {0x01 graphic
, 0x01 graphic
,...,0x01 graphic
} oraz wszystkie zdarzenia jednoelementowe są tak samo prawdopodobne (P({0x01 graphic
}) = P({0x01 graphic
}) =...= P({0x01 graphic
})=0x01 graphic
) to prawdopodobieństwo dowolnego zdarzenia k (A = {0x01 graphic
}) to prawdopodobieństwo jest równe:

P(A) = 0x01 graphic

Gdy Ω jest nieprzeliczalny, to prawdopodobieństwo dowolnego zdarzenia A wyrażamy przez równość:

0x01 graphic
, gdzie m - miara Lebesque'a

Definicja prawdopodobieństwa warunkowego: Niech (Ω, F, P) będzie przestrzenią probabilistyczną; A, B 0x01 graphic
F; P(B) > 0. Prawdopodobieństwem warunkowym zdarzenia A (lub liczbę zdarzenia A pod warunkiem B) nazywamy liczbę:

0x01 graphic

Definicja niezależności: Zdarzenia A i B nazywamy niezależnymi 0x01 graphic
0x01 graphic

Jeśli P(A) > 0, P(B) > 0 to warunkiem koniecznym i dostatecznym na to, by zdarzenia były niezależne jest: P(A/B) = P(A) i P(B/A) = P(B)

Definicja: Zdarzenia A1,A2,…An nazywamy wzajemnie (zespołowo) niezależnymi, jeśli dla dowolnego ciągu m-elementarnego, m0x01 graphic
n zachodzi:

P(Ai10x01 graphic
Ai20x01 graphic
... 0x01 graphic
Aim) = P(Ai1) · … · P(Aim)

Definicja prawdopodobieństwa całkowitego: niech (P, F, Ω) będzie przestrzenią probabilistyczną. Jeśli B jest dowolnym zdarzeniem zaś A1,A2,…An spełnia warunki:

D1: zdarzenia wykluczają się parami Ai 0x01 graphic
Aj = Ø, i=j, i, j = 1,...,m

D2: A10x01 graphic
A20x01 graphic
... 0x01 graphic
An = Ω

D3: P(Ai) > 0; i = 1, 2,...,n

to 0x01 graphic

Twierdzenie Bayesa: Jeśli B jest dowolnym zdarzeniem, zaś A1,...,An spełniają warunki D1, D2, D3, to dla dowolnego k = 1, 2, 3,...,n:

0x01 graphic

ZMIENNE LOSOWE JEDNOWYMIAROWE

Zmienna losowa i jej dystrybuanta

Definicja: Niech (P, F, Ω) będzie przestrzenią probabilistyczną, zmienną losową nazywamy dowolną funkcję X określoną na przestrzeni zdarzeń elementarnych Ω o wartościach ze zbioru liczb rzeczywistych spełniającą warunek: dla dowolnej liczby rzeczywistej x, zbiór zdarzeń elementarnych 0x01 graphic
, które spełniają nierówność X(0x01 graphic
) < x jest zdarzeniem losowym. {0x01 graphic
: X(0x01 graphic
) < x} 0x01 graphic
F

UWAGA!!!

Jeśli Ω jest zbiorem skończonym, to dowolny podzbiór jest zdarzeniem. Zatem dowolna funkcja X: Ω0x01 graphic
R jest zmienną losową.

Definicja dystrybuanty: Niech (P, F, Ω) będzie przestrzenią probabilistyczną, X - zmienną losową. Dystrybuantą zmiennej losowej X nazywamy funkcję FX: R0x01 graphic
R określoną następująco:

FX(x) = P(X < x) = P({0x01 graphic
: X(0x01 graphic
) < x})

Jeśli wiadomo, o jaką zmienną losową chodzi to omijamy indeks X!!!

WŁASNOŚCI DYSTRYBUANTY:

E1: 0x01 graphic

E2: 0x01 graphic
; 0x01 graphic

E3: F jest funkcją niemalejącą, tzn. x < y 0x01 graphic
F(x) 0x01 graphic
F(y)

E4: F jest funkcją co najmniej lewostronnie ciągłą, tzn. 0x01 graphic
dla dowolnego x00x01 graphic
R.

E5: 0x01 graphic

E6: 0x01 graphic

WNIOSEK: Dystrybuanta jest ciągła w punkcie x0 0x01 graphic
P(X=x0) = 0

Zmienna losowa typu skokowego

Definicja: Mówimy, że zmienna losowa X jest typu skokowego (dyskretnego), jeżeli istnieje co najwyżej przeliczalny zbiór jej wartości.

WX = {x1, x2, ...}

Wówczas określone są prawdopodobieństwa P(X=Xi) = pi, pi > 0, i=1, 2,... oraz 0x01 graphic

Liczby x1, x2,... nazywane są punktami skokowymi, natomiast p1, p2,... skokami.

UWAGA!!!

Jeśli dane są prawdopodobieństwa z jakimi zmienna losowa przyjmuje swoje wartości to mówimy, że znany jest rozkład prawdopodobieństwa tej zmiennej losowej:

xi

x1

x2

pi

p1

p2

FAKT: Dystrybuantę zmiennej losowej typu skokowego można wyznaczyć ze wzoru:

F(x) = P(X <x) = 0x01 graphic

Przykłady typowych rozkładów zmiennych losowych typu skokowego:

  1. Rozkład równomierny - prawdopodobieństwa są jednakowe

  2. xi

    x1

    x2

    ...

    xn

    pi

    0x01 graphic

    0x01 graphic

    0x01 graphic

    1. Rozkład jednopunktowy

    2. xi

      a

      pi

      1

      1. Rozkład zero - jedynkowy

      2. xi

        0

        1

        pi

        q

        p

        p + q = 1

        1. Rozkład dwumianowy z parametrami n i p > 0 (Rozkład Bernoulliego)

        0x01 graphic
        ; k = 0, 1, 2,..., n

        1. Rozkład geometryczny - na zbiorze skończonym

        0x01 graphic
        ; q + p = 1; k = 1, 2,...

        1. Rozkład Poissona z parametrami 0x01 graphic
          > 0

        0x01 graphic
        ; k = 0, 1, 2,...

        Uwaga!!!

        Dla bardzo dużych n rozkład dwumianowy może być przybliżony do rozkładu Piossona. Zazwyczaj, gdy n 0x01 graphic

        Zmienna losowa typu ciągłego

        Definicja: Niech (F, P, Ω) będzie przestrzenią probabilistyczną. Zmienną losową X określoną na tej przestrzeni nazywamy ciągłą (absolutnie ciągłą), jeżeli jej dystrybuanta jest postaci:

        F(x) = 0x01 graphic
        , gdzie f to nieujemna funkcja całkowalna.

        Funkcję f nazywamy GĘSTOŚCIĄ zmiennej losowej X. Powiemy, że dany jest rozkład prawdopodobieństwa zmiennej losowej X, jeżeli dana jest funkcja gęstości lub jej dystrybuanta.

        Gęstość prawdopodobieństwa musi spełniać warunek: 0x01 graphic

        Własności:

        F1: Jeśli x jest punktem ciągłości funkcji gęstości to F'(x) = f(x)

        F2: Dla dowolnego a0x01 graphic
        R:

        P(X=a) = 0 w przypadku zmiennej typu ciągłego!!!

        F3: P(a0x01 graphic

        F4: 0x01 graphic

        Przykłady typowych rozkładów zmiennej losowej typu ciągłego:

        1. Rozkład jednostajny na [a,b]

        f(x) = 0x01 graphic

        x0x01 graphic
        (0x01 graphic
        F(x) = 0

        0x01 graphic
        F(x) = 0x01 graphic

        0x01 graphic
        F(x) = 0x01 graphic

        1. Rozkład wykładniczy z parametrami 0x01 graphic
          > 0

        f(x) = 0x01 graphic
        0x01 graphic
        0x01 graphic

        x0x01 graphic
        F(x) = 0

        x > 0 F(x) = 0x01 graphic

        1. Rozkład normalny (Gaussa) z parametrami m, 0x01 graphic
          0x01 graphic
          0x01 graphic

        f(x) = 0x01 graphic

        F(x) = 0x01 graphic

        Jest to rozkład symetryczny i zapisujemy go: N(m,0x01 graphic
        .

        Charakterystyki liczbowe zmiennej losowej:

        1. Definicja średniej: Wartością oczekiwaną (średnią, przeciętną, nadzieją matemat.) zmiennej losowej X określonej na przestrzeni probabilistycznej (Ω, F, P) nazywamy liczbę E(X) daną wzorem:

        0x08 graphic

        przy założeniu, że szereg oraz całka po prawej stronie są zbieżne bezwzględnie (mają sens), tzn.:

        0x01 graphic
        ; 0x01 graphic

        WŁASNOŚCI ŚREDNIEJ:

        G1: E(c)=c; c-stała

        G2: E(a ∙X) = a ∙ E(X)

        G3: E(X + b) = E(X) + b

        G4: E(X - E(X)) = 0 to E(X) - E(X) = 0

        G5: E(X + Y) = E(X) + E(Y)

        G6: E(X ∙ Y) = E(X) ∙ E(Y), gdy X i Y są niezależne.

        X i Y są niezależne 0x01 graphic
        ,0x01 graphic
        dla dowolnych x, y 0x01 graphic

        1. Definicja wariancji: Wariancją zmiennej losowej X nazywamy liczbę określoną następująco:

        0x01 graphic

        Fakt:

        0x01 graphic

        Dowód:

        0x01 graphic

        WŁASNOŚCI WARIANCJI:

        H1: D2 (c) = c

        H2: D2 (a ∙ X) = a2 ∙ D2 (X)

        H3: D2 (X+b) = D2 (X)

        H4: D2 (X + Y) = D2 (X) + D2 (Y), gdy X I Y są niezależne

        1. Definicja odchylenia: Odchyleniem standardowym zmiennej losowej X nazywamy liczbę:

        0x01 graphic

        Standaryzacja zmiennej losowej

        Definicja: Zmienną losową X, dla której E(X) = 0 i D2 (X) = 1, nazywamy zmienną losową standaryzowaną.

        Twierdzenie: Niech X będzie zmienną losową, dla której E(X) < 0x01 graphic
        i D2 (X) > 0, wtedy zmienna losowa:

        0x01 graphic

        jest zmienną standaryzowaną.

        Dowód:

        0x01 graphic

        WEKTORY LOSOWE

        Definicja: n-wymiarową zmienną losową (n-wymiarowym wektorem losowym) określonym na przestrzeni probabilistycznej (Ω, F, P) nazywamy dowolną funkcję X: Ω0x01 graphic
        taką, że dla dowolnego x0x01 graphic
        0x01 graphic
        .

        0x01 graphic

        X = (X1, X2,...,Xn)

        Definicja dystrybuanty: Dystrybuantą wektora losowego X = (X1, X2,...,Xn) nazywamy funkcję F: Rn 0x01 graphic
        R określoną następująco;

        F(x1, x2,...,xn) = 0x01 graphic

        Własności:

        1. F jest funkcją niemalejącą względem każdej ze zmiennych

        2. F jest funkcją co najmniej lewostronnie ciągłą ze względu na każdą zmienną

        3. 0x01 graphic
          , gdzie k = 1, 2,...,n

        4. 0x01 graphic
          , gdzie k = 1, 2,...,n

        ZMIENNE LOSOWE DWUWYMIAROWE

        1. Zmienne losowe dwuwymiarowe typu skokowego.

        Definicja: Dwuwymiarową zmienną losową (X, Y), która przyjmuje co najwyżej przeliczalnie wiele wartości (xi, yi) odpowiednio z prawdopodobieństwami

        P(X = xi, Y = yi) = pij

        przy czym 0x01 graphic
        , nazywamy zmienną losową dwuwymiarową typu skokowego.

        Y X

        y1

        y2

        yj

        pi.

        x1

        p11

        p12

        ...

        p1j

        x2

        p21

        p22

        ...

        p2j

        ...

        ...

        ...

        ...

        xi

        pi1

        pi2

        ...

        pij

        p.j

        P(X = xi) = 0x01 graphic

        P(Y = yj) = 0x01 graphic

        Definicja: Rozkład prawdopodobieństwa wyznaczony przez funkcję prawdopodobieństwa określoną wzorem:

        P(X = xi) = pi. = 0x01 graphic

        nazywamy rozkł. brzegowym zmiennej X w rozkładzie dwuwymiarowej zmiennej (X, Y)

        F1(x) = 0x01 graphic
        oraz F2(x) = 0x01 graphic

        Definicja: Rozkład prawdopodobieństwa wyznaczony przez funkcję prawdopodobieństwa określoną wzorem:

        P(X = xi / Y = yi) = 0x01 graphic

        analogicznie dla Y: P(Y = yj / X = xi) = 0x01 graphic

        Dystrybuanta rozkładu warunkowego:

        0x01 graphic
        0x01 graphic

        2. Dwuwymiarowa zmienna losowa typu ciągłego.

        Definicja: Dwuwymiarową zmienną losową (X, Y) nazywamy typuciągłego jeśli istnieje nieujemna funkcja f : R20x01 graphic
        R taka, że dystrybuantę tej zmiennej da się zapisać jako całkę:

        0x01 graphic

        WŁASNOŚCI:

        J1: 0x01 graphic

        J2: W punktach ciągłości funkcji f zachodzi równość, że

        0x01 graphic

        J3: Prawdopodobieństwo, że 0x01 graphic

        Definicja: Rozkład prawdopodobieństwa wyznaczony przez funkcję f1[f2]: R0x01 graphic
        R określoną następująco:

        0x01 graphic

        nazywamy rozkładem brzegowym zmiennej X [Y] w rozkładzie dwuwymiarowej zmiennej losowej (X,Y).

        Wnioski:

        1. Dystrybuantę rozkładu brzegowego zmiennej losowej X wyznaczamy następująco;

        0x01 graphic

        1. Dystrybuantę zmiennej losowej Y wyznaczamy podobnie, tzn.:

        0x01 graphic

        Niezależność zmiennych losowych

        Definicja: Zmienne losowe (X,Y) nazywamy niezależnymi, jeżeli dla dowolnych x,y0x01 graphic
        zdarzenia:0x01 graphic
        i 0x01 graphic
        są niezależne, tzn.:

        0x01 graphic

        Fakt:

        1. X i Y są niezależne 0x01 graphic
          F(x,y) = F1(x) ∙ F2(y) dla dowolnych (x,y) 0x01 graphic
          .

        2. (X,Y) skokowe to:

        X, Y są niezależne 0x01 graphic
        P(X = xi; Y = yj) = P(X = xi) ∙ P(Y = yj)

        pij = pi. ∙ p.j dla dowolnego i, j

        1. (X,Y) ciągłe to:

        X, Y niezależne0x01 graphic
        f(x, y) = f1(x) ∙ f2(y) dla dowolnego (x, y) 0x01 graphic

        Charakterystyki liczbowe Zmiennej (X, Y)

        Definicja kowariancji: Kowariancją zmiennej losowej (X,Y) nazywamy liczbę:

        0x01 graphic
        o ile ona istnieje.

        WŁASNOŚCI:

        K1: COV(X, Y) = E(X ∙ Y) - E(X) - E(Y)

        K2: COV(X, Y) = D2(X)

        K3: COV (X, Y) = COV(Y, X)

        Fakt:

        1. X, Y są niezależne, jeśli COV(X, Y) = 0

        2. Jeśli D2(X), D2(Y) i COV(X, Y) istnieją to:

        D2(X + Y) = D2(X) + D2(Y) + 2COV(X, Y)

        D2(X - Y) = D2(X) + D2(Y) - 2COV(X, Y)

        Definicja korelacji: Liczbę 0x01 graphic
        nazywamy współczynnikiem korelacji zmiennej X,Y o ile D2(X) > 0, D2(Y) = 0 i istnieje COV(X, Y).

        0x01 graphic

        Statystyka - nauka zajmująca się opisywaniem i analizowaniem zjawisk masowych. Dzieli się na:

        • Statystykę opisową - zajmuje się sposobami gromadzenia, prezentacji i opisu danych.

        • Statystykę matematyczną - wnioskowanie o właściwościach całej zbiorowości na podstawie całej jej części przy wykorzystaniu elementów teorii rachunku prawdopodobieństwa.

        1. Podstawowe pojęcia.

        Zbiorowość statystyczna (populacja generalna) - zbiór nieidentycznych jednostek, które posiadają przynajmniej jedną wspólną cechę ze względu na cel badania. Zbiorowość ta powinna być jednorodna i jednoznacznie określona.

        Zbiorowość jednorodna - zbiorowość, której elementy podlegają wpływom tych samych przyczyn głównym oraz różnych przyczyn ubocznych. Różnice między jednostkami w tej zbiorowości mają charakter ILOŚCIOWY. (W zbiorowości niejednorodnej różnice mają charakter JAKOŚCIOWY).

        Jednostka statystyczna - element zbiorowości badanej.

        Rodzaje badań:

        1. Badania całkowite, gdy badaniu podlegają wszystkie jednostki populacji generalnej.

        2. Badania częściowe, gdy badaniu podlega skończony podzbiór populacji generalne. Podzbiór ten nazywa się PRÓBKĄ.

        Pożądane jest, aby próbka była reprezentacją populacji w tym sensie, że częstość występowania badanych cech w próbce nie powinna znacznie różnić się od częstości występowania tych cech w populacji.

        Próba losowa prosta n-elementowa - próbka pobrana z populacji w taki sposób, że przed jej pobraniem każdy n-elementowy podzbiór populacji miał takie same szanse wylosowania (losowanie ze zwrotem).

        Podział prób:

        • n ≤ 30 próbka mała

        • n > 30 próbka duża

        Cechy podlegające badaniu dzielimy na:

          • Mierzalne - dające się wyrazić liczbowo (wzrost, waga, itp.)

          • Niemierzalne - nie można wyrazić liczbowo (kolor włosów)

        Rachunek prawdopodobieństwa

        Statystyka

        Zmienna losowa

        Cecha

        Prawdopodobieństwo

        Częstość względna

        Dystrybuanta zmiennej losowej

        Dystrybuanta empiryczna

        Rozkład zmiennej losowej

        Rozkład empiryczny

        1. Analiza danych.

        Szereg statystyczny szczegółowy - szereg wartości cechy zapisanych w kolejności, w jakiej jednostki statystyczne losowano do próbki.

        Szereg statystyczny rozdzielczy - dwie kolumny lub dwa wiersze, gdzie w jednej uporządkowane są warianty cechy zwane KLASAMI a w drugiej odpowiadające im LICZEBNOŚCI, czyli liczby jednostek posiadających dany wariant cechy.

        Rodzaje szeregów rozdzielczych:

        • Punktowy - tworzony dla cechy skokowej (liczba rodzeństwa, oceny)

        • Przedziałowy - tworzony dla cechy ciągłej (waga, wzrost) lub skokowej w przypadku dużej liczby jej wariantów.

        Przykłady

        1. Zbadano wydajność 15 robotników pewnej brygady w dniu 30. 11 1991 i otrzymano następujące wyniki w sztukach na godzinę:

        10,12,11,12,12,13,14,10,11,11,12,12,13,13,11

        Jest to cecha skokowa (bo w sztukach), szereg szczegółowy, próbka mała (n ≤ 30), a jednostką statystyczną są robotnicy.

        1. struktura 225 rodzin Pomorza Zachodniego wg liczby dzieci do 24 lat pozostających na utrzymaniu w 1995r. była następująca:

        Liczba dzieci

        xi

        Liczba rodzin

        ni

        Częstość względna (0x01 graphic
        )

        Liczebność skumulowana

        Dystrybuanta empiryczna

        0

        25

        0,11

        25

        0,11

        1

        45

        0,2

        70

        0,31

        2

        60

        0,27

        130

        0,58

        3

        30

        0,13

        160

        0,71

        4

        20

        0,09

        180

        0,8

        5

        18

        0,08

        198

        0,88

        6

        12

        0,05

        210

        0,93

        7

        15

        0,07

        225

        1

        • 225

        Jest to szereg rozdzielczy, cecha skokowa, próbka duża (n > 30)

        0x08 graphic

        Dystrybuanta empiryczna =

        Rozkład cechy badanej zbiorowości:

        0x08 graphic
        0x08 graphic

        0x08 graphic

        0x08 graphic
        0x08 graphic

        0x08 graphic
        0x08 graphic
        0x08 graphic

        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic
        0x08 graphic

        1. Roczne sumy opadów w wybranych 300 stacjach meteorologicznych w Polsce w latach 1981-1990 przedstawia szereg:

        Roczne opady (mm) xi

        Liczba stacji ni

        410-440

        5

        440-470

        11

        470-500

        24

        500-530

        50

        530-560

        70

        560-590

        40

        590-620

        35

        620-650

        25

        650-680

        16

        680-710

        14

        710-740

        10

        300

        0x08 graphic

        Rozkłady empiryczne:

        1. Symetryczne i niesymetryczne

        2. Jednomodalne i wielomodalne

        3. Siodłowe

        4. Równomierne

        0x08 graphic
        Dla cechy skokowej:

        0x08 graphic

        0x08 graphic

        Dla cechy ciągłej:

        Teoria estymacji

        1. Podstawowe formy wnioskowania statystycznego:

          1. Estymacja - szacowanie nieznanych parametrów bądź ich funkcji rozkładu zmiennej losowej (cechy) w populacji.

          2. Weryfikacja - sprawdzanie prawdziwości postawionych hipotez statystycznych

        Dowolne n-elementowe próbki wylosowane z populacji zazwyczaj są różne. Zatem wygodnie jest traktować wartości x1, x2,...,xn cechy X jako realizację ciągu zmiennych losowych X1, X2,...,Xn. Jeżeli dodatkowo zmienne te są niezależne i każda z nich ma taki sam rozkład jak zmienna losowa badana w populacji X, to ciąg zmiennych losowych X1, X2,...,Xn nazywamy próbą prostą. Natomiast x1, x2,...,xn nazywamy zaobserwowaną próbą losową lub po prostu próbką.

        1. Estymatory i ich własności.

        Niech zmienna losowa X ma nieznany rozkład zależny od parametru 0x01 graphic
        (Theta). Chcemy na podstawie próby prostej X1,...,Xn oszacować nieznany parametr0x01 graphic
        .

        Statystyka - to również każda jednoznacznie zdefiniowana funkcja g(X1,...,Xn) próby losowej. Statystyka jest także zmienną losową mającą swój własny rozkład zależny od postaci funkcji g oraz od rozkładu zmiennych X1,...,Xn.

        Estymator - dowolna statystyka, której wartości przyjmujemy za ocenę parametru 0x01 graphic
        .

        Ocena estymatora - konkretna wartość liczbowa przyjęta przez estymator na podstawie wyników próbki.

        Własności:

        (Tn = Tn(X1,...,Xn))

        1. Zgodność - Definicja: Estymator Tn nazywamy zgodnym estymatorem parametru 0x01 graphic
          , jeżeli dla dowolnego 0x01 graphic
          > 0 granica 0x01 graphic
          .0x01 graphic
          zbieżność wg prawdopodobieństwa.

        2. Nieobciążoność - definicja: Estymator Tn nazywamy nieobciążonym estymatorem parametru 0x01 graphic
          , jeżeli E(Tn) = 0x01 graphic
          .

        3. Obciążoność - definicja: Jeżeli estymator Tn ma wartość oczekiwaną i E(Tn) 0x01 graphic
          , to nazywa się estymatorem obciążonym. Natomiast różnicę Bn(0x01 graphic
          ) = E(Tn) - 0x01 graphic
          nazywamy obciążeniem estymatora Tn. Jeżeli 0x01 graphic
          to estymator Tn nazywamy asymptotycznie nieobciążonym.

        Twierdzenie: Jeśli estymator Tn parametru 0x01 graphic
        spełnia własności:

        a) D2(Tn) 0x01 graphic
        (n0x01 graphic
        );

        b) jest estymatorem nieobciążonym lub asymptotycznie nieobciążonym;

        to Tn jest estymatorem zgodnym.

        1. Efektywność - definicja: Jeżeli Tn i Tn* są estymatorami nieobciążonymi parametru0x01 graphic
          o skończonych wariancjach oraz 0x01 graphic
          to estymator Tn nazywamy efektywniejszym od estymatora Tn*.

        Definicja: Estymator Tn o najmniejszej wariancji spośród wszystkich estymatorów nieobciążonych parametru 0x01 graphic
        nazywamy estymatorem najefektywniejszym (efektywnym).

        Uwaga!!!

        Dla dowolnego rozkładu (oprócz rozkładu jednostajnego) można wykazać, że wariancja estymatora nieobciążonego Tn spełnia nierówność Rao - Cramera:

        0x01 graphic

        gdzie f to funkcja gęstości dla zmiennej losowej ciągłej lub funkcja prawdopodobieństwa dla zmiennej losowej skokowej.

        Niech Tn* będzie estymatorem najefektywniejszym parametru 0x01 graphic
        oraz Tn estymatorem nieobciążonym tego parametru. Liczbę:

        0x01 graphic
        ; 0x01 graphic

        nazywamy efektywnością estymatora Tn.

        Jeżeli 0x01 graphic
        to estymator Tn nazywamy asymptotycznie najefektywniejszym (asymptotycznie efektywnym).

        Estymacja punktowa - punktowa ocena nieznanego parametru rozkładu, przy czym nie można udzielić odpowiedzi, jaka jest dokładność tej oceny. Polega na wyborze optymalnego estymatora spośród wszystkich estymatorów badanego parametru 0x01 graphic
        i wyznaczeniu jego wartości na podstawie próby losowej. Wartość tę przyjmujemy jako najlepszą ocenę parametru 0x01 graphic
        .

        Nieznany parametr estymacji

        Estymator

        Własności

        Dla jakiej rodziny rozkładów

        1.Wartość oczekiwana

        E(X) = m

        X = 0x01 graphic

        Zgodny, nieobciążony

        Rozkład dowolny, dla rozkładu N(m,0x01 graphic
        ) najefektywniejszy

        Mediana

        0x01 graphic

        Zgodny, asymptotycznie nieobciążony

        Rozkład dowolny

        2.Wariancja D2 (X) = 0x01 graphic
        , gdy znane m.

        0x01 graphic

        Zgodny, nieobciążony

        Rozkład dowolny, dla rozkładu N(m,0x01 graphic
        ) najefektywniejszy

        3.Wariancja D2 (X) = 0x01 graphic
        , gdy nieznane m.

        0x01 graphic

        Zgodny, nieobciążony

        Rozkład dowolny, dla rozkładu N(m,0x01 graphic
        ) najefektywniejszy

        4.Wskaźnik struktury w populacji p.

        0x01 graphic
        ; k - liczba jednostek posiadających wyróżnioną cechę

        Zgodny

        Rozkład dwupunktowy

        Estymacja przedziałowa - polega na wyznaczaniu takich przedziałów liczbowych, aby z prawdopodobieństwem bliskim 1 można było oczekiwać, że prawdziwa wartość nieznanego parametru zawiera się wewnątrz tego przedziału.

        Definicja przedziału ufności: Przedziałem ufności dla parametru0x01 graphic
        na poziomie ufności 1-0x01 graphic
        nazywamy przedział liczbowy (0x01 graphic
        1, 0x01 graphic
        2) spełniający warunki:

        1. Końce tego przedziału są funkcjami próby losowej prostej, tzn. 0x01 graphic
          1= 0x01 graphic
          1(X1,...,Xn), 0x01 graphic
          2 = 0x01 graphic
          2(X1,...,Xn).

        2. Prawdopodobieństwo pokrycia przez ten przedział nieznanego parametru 0x01 graphic
          wynosi

        1-0x01 graphic
        , tzn. P0x01 graphic
        .

        Liczbę 1-0x01 graphic
        nazywamy współczynnikiem ufności.

        1. Konstrukcja przedziału ufności dla wartości oczekiwanej badanej populacji.

        Model I

        Badana cecha X ma w populacji rozkład normalny z parametrami m i 0x01 graphic
        , przy czym 0x01 graphic
        jest znane. Chcemy na podstawie n-elementowej próby losowej prostej oszacować przedziałową wartość przeciętną w populacji.

        E(X) = m; (X1, X2,...,Xn) ~N(m, 0x01 graphic
        ); X ~N(m, 0x01 graphic
        );

        Estymatorem E(X) w populacji jest średnia arytmetyczna z próby, która ma rozkład normalny z parametrami m i 0x01 graphic
        0x01 graphic
        (X ~N(m, 0x01 graphic
        )).

        Standaryzując średnią arytmetyczną otrzymamy nową zmienną U:

        0x01 graphic
        ,gdzie N(0, 1)

        Konstruujemy przedział liczbowy dla zmiennej U tak, aby 0x01 graphic
        :

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic
        odczytujemy z tablic dystrybuanty rozkładu normalnego z tej właśnie zależności.

        Model

        Rozkład cechy X

        Przedział ufności

        Statystyka użyta do konstrukcji

        Wartości krytyczne

        I

        Rozkład normalny N(m,0x01 graphic
        )

        0x01 graphic
        - znane

        0x01 graphic

        0x01 graphic

        rozkład N(0, 1)

        0x01 graphic

        z tablic dystrybuanty rozkładu normalnego

        II

        Rozkład normalny N(m,0x01 graphic
        )

        0x01 graphic
        - nieznane

        0x01 graphic

        0x01 graphic

        Rozkład Studenta

        0x01 graphic

        z tablic Studenta

        III

        Rozkład dowolny lub zbliżony do normalnego (duża próba)

        0x01 graphic

        0x01 graphic

        Rozkład N(0, 1)

        0x01 graphic

        z tablic dystrybuanty rozkładu normalnego

        1. Przedziały ufności dla wariancji / odchylenia standardowego.

        Model

        Rozkład cechy X

        Przedział ufności

        Statystyka użyta do konstrukcji

        Wartość krytyczna

        I

        Rozkład normalny N(m,0x01 graphic
        )

        m, 0x01 graphic
        - nieznane(mała próba)

        0x01 graphic

        0x01 graphic

        rozkład 0x01 graphic
        (chi)

        0x01 graphic

        Z tablic 0x01 graphic

        II

        Rozkład normalny N(m,0x01 graphic
        )

        m, 0x01 graphic
        - nieznane(duża próba)

        0x01 graphic

        0x01 graphic

        Rozkład N(0, 1)

        0x01 graphic

        z tablic dystrybuanty rozkładu normalnego

        1. Przedział ufności dla wskaźnika struktury.

        Model

        Rozkład cechy X

        Przedział ufności

        Statystyka użyta do konstrukcji

        Wartość krytyczna

        I

        Rozkład dwupunktowy z parametrem p

        0x01 graphic

        0x01 graphic

        asymptotycz. normalny N(0,1)

        0x01 graphic

        z tablic dystrybuanty rozkładu normalnego

        Testy statystyczne

        1. Hipoteza statystyczna - każde przypuszczenie dotyczące rozkładu badanej cechy w populacji. Dzielimy na:

          1. parametryczne (dotyczą parametru rozkładu badanej cechy)

          2. nieparametryczne (dotyczą postaci rozkładu)

        2. Test statystyczny - każda jednoznacznie sformułowana zasada postępowania pozwalająca stwierdzić, czy badaną hipotezę należy odrzucić, czy nie.

        H0 - hipoteza bezpośrednio sprawdzana (zakłada brak jakichkolwiek różnic)

        H1 - hipoteza alternatywna

        Budowa testu:

        W populacji generalnej badana jest cecha X. H0 dotyczy rozkładu tej cechy. Na podstawie próby losowej prostej X1,...,Xn należy sprawdzić hipotezę H0. Budowa testu najogólniej ujmując jest następująca:

        1. Wybieramy pewną statystykę Zn = Zn(X1,...,Xn) zwaną statystyką testową lub sprawdzianem.

        2. Wybieramy liczbę 0x01 graphic
          zwaną poziomem istotności testu. Liczba ta powinna być bliska 0 gdyż oznacza prawdopodobieństwo odrzucenia hipotezy H0, gdy jest ona prawdziwa.

        3. Wyznaczamy zbiór K zwany zbiorem krytycznym (odrzuceń hipotezy H0) taki, że prawdopodobieństwo, iż statystyka Zn przyjmuje wartości z tego zbioru przy założeniu, że H0 jest prawdziwa, wynosi 0x01 graphic
          .

        0x01 graphic

        Rodzaje błędów decyzji:

        1. Błąd pierwszego rodzaju - polega na odrzuceniu hipotezy H0, gdy jest ona prawdziwa. Prawdopodobieństwo tego błędu oznaczamy 0x01 graphic
          i nazywamy poziomem istotności.

        2. Błąd drugiego rodzaju - polega na przyjęciu H0, gdy jest fałszywa. Prawdopodobieństwo tego błędu oznaczamy 0x01 graphic
          .

        Sytuacja

        Decyzja

        H0 prawdziwa

        H0 fałszywa

        Przyjęcie H0

        Decyzja poprawna

        Decyzja błędna (błąd II rodzaju)

        Odrzucenie H0

        Decyzja błędna (błąd I rodzaju)

        Decyzja poprawna

        Aby sprawdzić weryfikowaną hipotezę H0, przy ustalonej hipotezie alternatywnej, mając wybraną statystykę testową, poziom istotności oraz zbiór krytyczny, należy pobrać próbkę z populacji i wyznaczyć wartość statystyki Zn dla tej próbki. Możliwe są następujące decyzje:

        a) 0x01 graphic
        odrzucamy hipotezę H0 (przyjmujemy H1)

        b) 0x01 graphic
        przyjmujemy H0 (odrzucamy H1)

        Uwaga!!!

        Decyzje te są właściwe tylko dla małych 0x01 graphic
        i 0x01 graphic
        . Przy ustalonym poziomie istotności wartość 0x01 graphic
        jest bardzo duża albo niemożliwa do wyznaczenia. W takich sytuacjach bezpieczniej jest zamiast decyzji, Ze przyjmujemy H0, podjąć decyzję ostrożniejszą - nie ma podstaw do odrzucenia hipotezy H0.

        Parametryczne testy istotności

        Większość stosowanych w praktyce testów statystycznych nie uwzględnia błędu II rodzaju. Wówczas na podstawie wyników próbki losowej możliwe jest podjęcie decyzji o odrzuceniu hipotezy H0 lub stwierdzenie, że brak jest podstaw do jej odrzucenia. Takie testy nazywamy testami istotności. Podstawowa wada testu to brak decyzji o przyjęciu H0.

        Jeżeli 0x01 graphic
        to oznacza, że zrealizowało się zdarzenie o bardzo małym prawdopodobieństwie, czyli praktycznie niemożliwe do zrealizowania się podczas jednej próbki.

        Jeżeli 0x01 graphic
        to prawdopodobieństwo tego zdarzenia jest > 0x01 graphic
        . Można więc stwierdzić, że nie ma podstaw do odrzucenia hipotezy H0, gdyż podczas jednej próbki losowej zrealizowało się doświadczenie, które nie przeczy tej hipotezie.

        W testach istotności pożądane jest takie formułowanie hipotezy H0. aby było większe podejrzenie co do jej fałszywości niż prawdziwości.

        Weryfikacja hipotezy wartości średniej w populacji

        W populacji badana jest cecha X. Na podstawie próby losowej prostej X1,...,Xn przy ustalonym poziomie istotności 0x01 graphic
        , chcemy sprawdzić hipotezę H0 : m = m0

        Model I

        X ~N(m, 0x01 graphic
        ); 0x01 graphic
        - znane

        Nr testu

        Hipotezy

        Statystyka testująca

        Obszar krytyczny

        Wartość krytyczna

        1

        H0: m = m0

        H0: m 0x01 graphic
        m0

        0x01 graphic

        0x01 graphic

        0x01 graphic

        2

        H0: m = m0

        H0: m < m0

        0x01 graphic

        0x01 graphic

        3

        H0: m = m0

        H0: m > m0

        0x01 graphic

        0x01 graphic

        z dystrybuanty rozkładu normalnego

        0x01 graphic
        odrzucamy

        0x01 graphic
        nie ma podstaw do odrzucenia H0

        (I MODEL)

        Definicja: Kwantylem rzędu p nazywamy taką wartość Xp zmiennej losowej X, dla której zachodzi równanie:

        F(Xp) = p (dla zmiennej losowej typu ciągłego)

        0x08 graphic

        0x01 graphic

        (II MODEL)

        Definicja: Jeśli 0x01 graphic
        jest cechą populacji o rozkładzie normalnym N(m, 0x01 graphic
        ), gdzie parametry rozkładu są znane, to statystyka testowa

        0x01 graphic

        przy założeniu prawdziwości hipotezy zerowej H0: m = m0 ma rozkład t Studenta z n-1 stopniami swobody.

        Obszary krytyczne K dla odpowiednich hipotez alternatywnych zbieramy w tablicy:

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa tn

        Obszar krytyczny

        K

        H0: m = m0

        H0: m 0x01 graphic
        m0

        0x01 graphic

        0x01 graphic

        H0: m < m0

        0x01 graphic

        0x01 graphic

        H0: m > m0

        0x01 graphic

        gdzie 0x01 graphic
        jest kwantylem rzędu 0x01 graphic
        rozkładu t studenta z n-1 stopniami swobody.

        (III MODEL)

        Definicja: Jeśli cecha X populacji ma nieznany rozkład lecz parametry m, 0x01 graphic
        istnieją, to dla dużych n (n0x01 graphic
        100; n0x01 graphic
        50; n0x01 graphic
        30) statystyka

        0x01 graphic

        ma rozkład w przybliżeniu normalny N(1, 0).

        Dla dużych n będziemy szacować 0x01 graphic
        , gdzie

        0x01 graphic

        Zatem w tym przypadku statystyka testowa będzie:

        0x01 graphic

        przy założeniu prawdziwości hipotezy H0.

        Obszary krytyczne dla odpowiednich hipotez alternatywnych zbierzemy w tablicy:

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa tn

        Obszar krytyczny

        K

        H0: m = m0

        H0: m 0x01 graphic
        m0

        0x01 graphic

        0x01 graphic

        H0: m < m0

        0x01 graphic

        H0: m > m0

        0x01 graphic

        Testy związane z wariancją

        1. Weryfikowanie hipotez statystycznych dla wariancji (lub odchylenia standardowego)

        Rozpoznajemy populację i pewną cechę X, dla której parametry m = E(X) i 0x01 graphic
        = D2(X) nie są znane. Będziemy używać statystykę 0x01 graphic
        .

        (I MODEL)

        Definicja: Jeśli cecha X ma rozkład normalny N(m, 0x01 graphic
        ) o nieznanych parametrach m i 0x01 graphic
        , to statystyka testowa

        0x01 graphic

        przy założeniu prawdziwości hipotezy H0: 0x01 graphic
        (lub H0: 0x01 graphic
        ) ma rozkład 0x01 graphic
        z n-1 stopniami swobody.

        Obszary krytyczne dla odpowiednich hipotez alternatywnych zbierzemy w tablicy:

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa 0x01 graphic

        Obszar krytyczny

        K

        H0: 0x01 graphic

        (H0: 0x01 graphic
        )

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        gdzie 0x01 graphic
        jest kwantylem rzędu0x01 graphic
        rozkładu0x01 graphic
        z n-1 stopniami swobody.

        (II MODEL)

        Definicja: Jeśli cecha X ma rozkład normalny N(m, 0x01 graphic
        ) o nieznanych parametrach, n0x01 graphic
        50 to statystyka testowa

        0x01 graphic

        ma rozkład N(0x01 graphic
        ;1) przy założeniu prawdziwości hipotezy zerowej 0x01 graphic

        Obszary krytyczne dla odpowiednich hipotez alternatywnych zbierzemy w tablicy:

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa 0x01 graphic

        Obszar krytyczny

        K

        H0: 0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        Weryfikacja hipotezy o wskaźniku struktury

        Definicja: Jeśli cecha X ma rozkład 0-1 o nieznanym parametrze p, to statystyka testowa

        0x01 graphic

        ma przy założeniu prawdziwości hipotezy 0x01 graphic
        i n0x01 graphic
        rozkład normalny N(0,1).

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa 0x01 graphic

        Obszar krytyczny

        K

        H0: 0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        gdzie m - ilość elementów wyróżnionych w próbce n-elementowej.

        Weryfikacja hipotezy o wartości przeciętnej w dwóch populacjach

        (I MODEL)

        Definicja: Jeśli badana cecha X ma w obu populacjach rozkłady normalne 0x01 graphic
        i 0x01 graphic
        oraz m1 i m2 są nieznane, a 0x01 graphic
        i 0x01 graphic
        są znane to

        0x01 graphic

        ma przy założeniu prawdziwości hipotezy zerowej H0: m1=m2 rozkład normalny N(0,1).

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa 0x01 graphic

        Obszar krytyczny

        K

        H0: 0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        (II MODEL)

        Definicja: Jeśli przy założeniach 0x01 graphic
        tablica testu nie różni się od tablicy z I modelu.

        (III MODEL)

        Definicja: Jeśli cecha X ma w dwóch populacjach rozkłady normalne 0x01 graphic
        i 0x01 graphic
        odpowiednio o nieznanych parametrach, to przy założeniu 0x01 graphic
        , statystyka

        0x01 graphic

        ma rozkład t-Studenta z (n1+n2 - 2) stopniami swobody przy założeniu prawdziwości hipotezy zerowej H0: 0x01 graphic
        .

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa tn

        Obszar krytyczny

        K

        H0: 0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        gdzie t(0x01 graphic
        ) jest kwantylem rzędu 0x01 graphic
        rozkładu t-Studenta z 0x01 graphic
        stopniami swobody.

        (IV MODEL)

        Definicja: Jeśli pewna populacja jest poddana badaniu statystycznemu ze względu na cechę X dwa razy: przed i po pewnym działaniu na populację, to otrzymane próbki (X1',...,Xn') - przed działaniem i (X1'',...,Xn'') - po działaniu, są zależne?

        Wtedy weryfikujemy hipotezę H0: m1 - m2 = 0 wobec hipotez alternatywnych H1: m1 - m20x01 graphic
        0

        dla próbki (X1,...,Xn) określonej wzorem: xi = xi' - xi'' dla 0x01 graphic
        . Stosujemy testy dla jednej średniej (m0 = 0)

        Weryfikacja hipotezy o równości dwóch wariancji

        Definicja: Jeśli cecha X ma w dwóch populacjach rozkłady normalne N(m1, 0x01 graphic
        ) i N(m2, 0x01 graphic
        ) o nieznanych parametrach, to statystka testowa

        0x01 graphic

        ma rozkład Snedecora z n1-1 i n2-1 stopniami swobody przy założeniu prawdziwości hipotezy zerowej H0: 0x01 graphic
        (H0: 0x01 graphic
        ).

        Opis testowy:

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa

        Obszar krytyczny

        K

        H0: 0x01 graphic

        (H0: 0x01 graphic
        )

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        (0x01 graphic
        )

        0x01 graphic

        0x01 graphic

        gdzie 0x01 graphic
        jest kwantylem rzędu 0x01 graphic
        rozkładu Snedecora z 0x01 graphic
        stopniami swobody.

        Weryfikacja hipotezy o równości dwóch wskaźników struktury

        Definicja: Jeśli cecha X ma w dwóch populacjach rozkład 0-1 z nieznanymi parametrami p1 i p2 oraz n10x01 graphic
        100 i n20x01 graphic
        100, statystyka:

        0x01 graphic
        ; gdzie 0x01 graphic
        oraz 0x01 graphic

        M1 i M2 - zmienne losowe, których wartościami są ilości wyróżnionych elementów w populacji 1 i 2 odpowiedzi?

        przy założeniu prawdziwości hipotezy zerowej H0 : p1 = p2.

        Hipoteza zerowa H0

        Hipoteza alternatywna H1

        Statystyka testowa 0x01 graphic

        Obszar krytyczny

        K

        H0: 0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        H1: 0x01 graphic

        0x01 graphic

        Badanie statystyczne ze względu na dwie cechy

        Przy badaniu populacji za względu na dwie cechy chcemy uzyskać informacje dotyczące siły zależności między cechami oraz kształt (postać) tej zależności.

        Próbki z badań są postaci (xi, yi) i 0x01 graphic
        i w celu wstępnego oszacowania zależności tworzymy tzw. DIAGRAM KORELACYJNY nanosząc punkty na płaszczyznę, np.

        0x08 graphic

        Podstawowymi pojęciami występującymi przy badaniu zależności między 2 cechami są korelacja i regresja.

        KORELACJA - dostarcza informacji na temat siły związku między 2 cechami. Najczęściej stosowany jest współczynnik korelacji 0x01 graphic
        mierzący siłę zależności liniowej: 0x01 graphic
        ; zależność jest silna gdy: 0x01 graphic
        . [Gdy 0x01 graphic
        to cechy X i Y są nieskorelowane - mogą być zależne].

        REGRESJA - ma na celu określenie zależności funkcyjnej między cechami X i Y. Celem jest wyznaczenie takiej funkcji g by można było szacować 0x01 graphic
        . Funkcja g może być liniowa lub krzywoliniowa.

        UWAGA 1!!!

        Jeśli 0x01 graphic
        to 0x01 graphic
        , ale korelacja nic nie mówi o wartościach współczynników a i b (poza znakiem liczby a).

        UWAGA 2!!!

        Jeśli cechy X i Y mają w populacji rozkład normalny to wektor (X, Y) ma dwuwymiarowy rozkład normalny i regresja jest liniowa.

        Estymacja, testy dla współczynnika korelacji

        W wyniku prawdopodobieństwa wiadomo, że dla dowolnych zmiennych losowych X i Y współczynnik korelacji liniowej wyraża się wzorem:

        0x01 graphic

        Estymatorem zgodnym współczynnika korelacji między cechami X i Y jest statystyka R określona wzorem:

        0x01 graphic
        ; gdzie 0x01 graphic

        UWAGA 1!!!

        Estymator R jest obciążony, gdyż E(R)0x01 graphic
        .

        UWAGA 2!!!

        Realizacją estymatora R zwaną współczynnikiem korelacji z próbki wyznaczamy ze wzorów:

        0x01 graphic
        ; 0x01 graphic

        lub

        0x01 graphic

        UWAGA 3!!!

        Gdy 0x01 graphic
        , dane z próbki (xi, yi) grupuje się w dwuwymiarowy szereg przedziałowy rozdzielczy zwany tablicą korelacyjną:

        X Y

        y1 dolne-y2 górne

        y2 dolne-y2 górne

        x1 dolne-x1 górne

        n11

        n12

        x2 dolne-x2 górne

        n21

        n22

        Estymacja współczynników liniowej funkcji regresji

        W wyniku prawdopodobieństwa współczynniki liniowej funkcji regresji II rzędu 0x01 graphic
        wyznaczamy ze wzoru:

        0x01 graphic

        0x01 graphic

        Estymatorami A i B współczynników 0x01 graphic
        i 0x01 graphic
        są:

        0x01 graphic
        i 0x01 graphic

        (Estymatory są zgodne i nieobciążone).

        Realizacje a i b z próbki wyznaczamy ze wzoru:0x01 graphic
        i 0x01 graphic
        , gdzie a jest współczynnikiem kierunkowym (Dla przyrostu cechy X o jednostkę otrzymamy przyrost cechy Y o wartość „a” jednostek).

        0x01 graphic

        dla zmiennej typu skokowego

        dla zmiennej typu ciągłego

        liczebność skumulowana

        n

        ni

        Diagram liczebności

        60 50 40 30 20 10

        xi

        0 1 2 3 4 5 6 7

        0x01 graphic

        Histogram liczebności

        Symetryczny

        Umiarkowanie asymetrycznie prawostronnie

        Umiarkowanie asymetryczny lewostronnie

        Skrajnie asymetryczny prawostronnie

        Skrajnie asymetryczny lewostronnie

        Bimodalny

        Równomierny

        Siodłowy

        Symetryczny

        Umiarkowanie asymetryczny prawostronnie

        Skrajnie asymetryczny prawostronnie

        Umiarkowanie asymetryczny lewostronnie

        Skrajnie asymetryczny lewostronnie

        Bimodalny

        Wielomodalny

        Siodłowy

        Równomierny

        Xp

        p

        silna zależność typu liniowego

        słaba zależność hiperboliczna

        brak zależności



        Wyszukiwarka

        Podobne podstrony:
        pytania przykladowe exam zaoczne(1)
        prezentacja 1 Stat 2014
        A dane,inf,wiedza,uj dyn stat proc inf w zarz 2008 9
        stat 10 2
        stat
        CCNA Practice Certification Exam
        EXAM szst
        exam z farmy 2014 (uzupełniony)
        History of Great Britain exam requirements
        inst pneumatyczna su-22 wnioski przemek, PWR [w9], W9, 5 semestr, aaaOrganizacja SEM5, Od sebka, Wyp
        EXAM Law in Britain
        zagadnienia exam prof Piątek
        Exam id 166218 Nieznany
        Mat Stat WykĹ ad 3 (2013L)(1)
        CCNA 2 Final Exam v
        2 stat zadania
        1 stat wyklad
        CCNA Final Exam

        więcej podobnych podstron