Statystyka matematyczna, 2.8 2.12, Metody Statystyczne


  1. Elementy rachunku prawdopodobieństwa.

    1. Zdarzenie losowe, częstość względna, prawdopodobieństwo, działania na zdarzeniach.

    2. Prawdopodobieństwo warunkowe, prawdopodobieństwo łączne, zdarzenia niezależne.

    3. Zmienne losowe, zmienne ciągłe i dyskretne, rozkład prawdopodobieństwa, dystrybuanta, gęstość prawdopodobieństwa.

    4. Momenty zmiennej losowej ciągłej i dyskretnej, wartość oczekiwana a wartość najbardziej prawdopodobna, wariancja / odchylenie standardowe.

    5. Rozkład normalny, rozkład równomierny, rozkład wykładniczy, parametry rozkładów.

    6. Wielowymiarowe zmienne losowe, gęstość, dystrybuanta, momenty.

    7. Zmienne losowe nieskorelowane, kowariancja, kowariancja unormowana, macierz kowariancji.

    8. Proces stochastyczny, realizacja procesu stochastycznego, gęstość prawdopodobieństwa, wartość oczekiwana, wariancja / dyspersja.

    9. Funkcje korelacji własnej, wzajemnej, unormowana funkcja korelacji wzajemnej procesów stochastycznych.

    10. Stacjonarny proces stochastyczny, własności.

    11. Procesy ergodyczne, hipoteza ergodyczna, własności stochastyczne po czasie i po zbiorze.

    12. Średnie po czasie: wartość oczekiwana, wariancja, funkcja autokorelacji, funkcja korelacji wzajemnej.

  2. Elementy statystyki matematycznej.

    1. Populacja generalna (zbiorowość generalna) - zbiorowość, której elementy (realizacje) obserwujemy.
      Próba (zbiorowość próbna) - zaobserwowany zespół elementów zbiorowości generalnej.
      Próba losowa - utworzona w sposób losowy zabezpiecza przed tendencyjnością próby.
      Statystyka matematyczna - wnioskowanie o (cechach) zbiorowości generalnej na podstawie znajomości próby (dzielimy na estymacje i weryfikacje hipotez statystycznych). Wnioski te są słuszne tylko wtedy, gdy próba jest podobna do zbiorowości generalnej, czyli gdy próba jest reprezentatywna (w przeciwieństwie do tendencyjnej).

    2. Teoria estymacji (szacowania) - wnioskowanie o własnościach rozkładu prawdopodobieństwa zbiorowości generalnej na podstawie próby. Postuluje się znajomość klasy rozkładów, do której należy nieznany rozkład badanej zbiorowości generalnej i na podstawie próby ocenia się, z którym konkretnie rozkładem z zadanej klasy rozkładów mamy doczynienia w badanej zbiorowości generalnej.
      Estymacja parametryczna - elementy klasy możliwych rozkładów zbiorowości generalnej mogą różnić się tylko wartościami parametrów, estymuje się wówczas te wartości parametrów.
      Estymacja nieparametryczna - elementy klasy możliwych rozkładów zbiorowości generalnej mogą się różnić nie tylko wartościami parametrów lecz także postacią funkcyjną rozkładu, estymacji podlega wówczas cała funkcja rozkładu.
      Estymacja punktowa - określa się pewną funkcję próby i wartości tej funkcji przyjmuje się za najlepsze oszacowanie prawdziwej wartości parametru zbiorowości generalnej.
      Estymacja przedziałowa - na podstawie próby znajduje się pewien przedział liczbowy, który zawiera w sobie prawdziwą wartości parametru zbiorowości generalnej z przyjętym z góry prawdopodobieństwem.

    3. Zadania weryfikacji hipotez statystycznych - tworzenie reguł umożliwiających rozstrzygnięcie czy dana hipoteza statystyczna jest słuszna czy nie.
      Hipoteza statystyczna - przypuszczenie dotyczące nieznanego rozkładu zbiorowości generalnej.
      Hipoteza prosta (pojedyncza) - dotyczy jednego konkretnego rozkładu prawdopodobieństwa.
      Hipoteza złożona
      - obejmuje więcej niż jeden rozkład prawdopodobieństwa.

    4. Testy statystyczne wynikają z weryfikacji hipotez, dzielimy je na: parametryczne i nieparametryczne.
      Testy parametryczne
      - do weryfikacji hipotez o nieznanych parametrach rozkładu o znanej postaci funkcyjnej.
      Testy nieparametryczne - do weryfikacji hipotez, w których nie ma założeń o postaci funkcyjnej rozkładu.

    5. Przestrzeń prób - zbiór punktów w przestrzeni N-wymiar., gdzie punkt w przestrzeni to próba losowa (x1, x2, ... , xN).
      Statystyka (zmienna losowa) - zmienna losowa S będąca funkcją obserwowanej zmiennej losowej wielowymiarowej (X1, X2, ... , XN), której realizacją jest próba (x1, x2, ... , xN): S = f (X1, X2, ... , XN).
      Statystyka służy do szacowania parametrów zbiorowości generalnej na podstawie próby. Najważniejsze parametry z próby to wartość oczekiwana z próby i wariancja z próby.

    6. Wartość oczekiwana z próby - 0x01 graphic

      Wariancja z próby - 0x01 graphic

    7. Rozkład chi-kwadrat
      Zmienna losowa 0x01 graphic
      - suma kwadratów N niezależnych zmiennych losowych Xi (i=1,...,N) o jednakowych rozkładach normalnych N(0,1) - zmienne o rozkładzie chi-kwadrat o N stopniach swobody. 0x01 graphic

      Jeden parametr charakterystyczny rozkładu - liczba stopni swobody N. Dla N>>1 rozkład chi-kwadrat upodabnia się do rozkładu normalnego. E (χ2) = N var (χ2) = 2N

      0x01 graphic

      Zmienna losowa utworzona z ciągu N niezależnych zmiennych losowych normalnych X1, X2, ... , XN o jednakowych rozkładach N(m, δ) o znanych parametrach m i δ 0x01 graphic
      ma rozkład chi-kwadrat o N stopniach swobody.

      Rozkład t-studenta
      Zmienna losowa 0x01 graphic
      , przy czym U i 0x01 graphic
      są zmiennymi losowymi niezależnymi stochastycznie, U ma rozkład normalny N(0,1), a 0x01 graphic
      ma rozkład chi-kwadrat o N stopniach swobody , nazywa się zmienną losową t-studenta o N stopniach swobody.
      Gęstość prawdopodobieństwa SN(x) zmiennej losowej t-studenta jest zbliżona do gęstości rozkładu normalnego (jest bardziej spłaszczona). Dla N>30 rozkład t-studenta upodabnia się do rozkładu normalnego N(0,1).
      0x01 graphic


      Zmienna losowa 0x01 graphic
      ma rozkład t-studenta o (N-1) stopniach swobody.
      Rozkład F-Sendecora
      Zmienna losowa 0x01 graphic
      , przy czym 0x01 graphic
      i 0x01 graphic
      są zmiennymi losowymi niezależnymi stochstycznie o rozkładach chi-kwadrat odpowiednio o M i N stopniach swobody, ma rozkład F-Sendecora.
      Rozkład F-Sendecora ma 2 parametry: M i N.

    1. Estymacja punktowa i przedziałowa, estymator, estymata, estymator nieobciążony i obciążony.

Estymacja punktowa

Rozkład rozpatrywanej zbiorowości generalnej X jest scharakteryzowany za pomocą dystrybuanty F(x; q1,q2,...,qK) o nieznanych parametrach q1,q2,...,qK (np. parametry q1 = m, q2= σ2). Dla próby losowej (x1,x2,...,xk) tworzymy statystyki S1,S2,...,Sk będące funkcjami zmiennej losowej (X1,X2,...,XN) (której realizacją jest próba losowa) Sk = fk(X1,X2,...,XN) = 0x01 graphic
k=1,...,K

0x01 graphic
-estymator parametru qk

Wartości statystyk - estymaty parametrów qk

sk=fk(x1, x2,….,xN)=0x01 graphic
k-1,…,K

0x01 graphic
-estymata (ocean) parametru qk

Estymator 0x01 graphic
- nieobciążony jeśli E(0x01 graphic
)=qk

Estymator 0x01 graphic
-obciążony E(0x01 graphic
)0x01 graphic
qk

Obciążenie estymatora 0x01 graphic
: 0x01 graphic

    1. Estymatory wartości oczekiwanej, wariancji z próby - wersja offline.

Estymator wartości oczekiwanej m zbiorowości generalnej X o dystrybuanci F(x,m):

estymator 0x01 graphic
-wartość oczekiwana z próby

0x01 graphic
- estymator nieobciążony wartości oczekiwanej m

E(0x01 graphic
)=0x01 graphic
0x01 graphic

estymator wariancji 0x01 graphic
zbiorowości generalnej X o dystrybuancie F(x, 0x01 graphic
).

0x01 graphic
- estymator obciążony

obciążenie: 0x01 graphic
- obciążenie ujemne ->estymator daje przeciętnie zbyt małe oszacowania parametru 0x01 graphic

estymator nieobciążony wariancji

0x01 graphic

uwaga: jeśli wartość oczekiwana m=E(X) jest znana (a nie estymowana jako 0x01 graphic
) to estymator wariancji

0x01 graphic
jest nieobciążony.

Estymator 0x01 graphic
- efektywny jeśli ma małą wariancję (rozrzut ocen 0x01 graphic
parametru qk jest mały)

    1. Przedział ufności, poziom ufności, szacowanie przedziału ufności dla wartości oczekiwanej i wariancji.

Estymacja przedziałowa

Przedział ufności dla parametru qk - taki przedział liczbowy domknięty o którym z założonym z góry prawdopodobieństwem (1-α) można twierdzić, że zawiera on parametr qk. Dla przedziału ufności : 0x01 graphic
gdzie α=const. Zwykle α=0.05 lub α=0.01.

Prawdopodobieństwo (1-α) - poziom ufności.

Konkretnej realizacji (x1,x2,….,xN) zmiennej losowej (X1,X2,…,XN) przy zadanym przedziale ufności (1-α) odpowiada przedział 0x01 graphic
. Innej realizacji będzie odpowiadał na ogół odpowiedni inny przedział. Granice przedziału dla oszacowania parametru qk są zmiennymi losowymi.

0x01 graphic

0x01 graphic

długość przedziału ufności 0x01 graphic
dla parametru qk także jest zmienną losową.

Jeżeli poziom ufności (1-α) bliski 1 to duże prawdopodobieństwo, że w przedziale ufności jest zawarta prawdziwa wartość parametru qk.

α - prawdopodobieństwo popełnienia błędu.

Im większa liczba obserwacji N w próbie, tym węższe są przedziały ufności.

Szacowanie przedziału ufności dla wartości oczekiwanej zbiorowości generalnej X o rozkładzie normalnym N(m,σ).

Wartość średnia 0x01 graphic
ma rozkład normalny 0x01 graphic
. Zmienna losowa unormowana 0x01 graphic
ma rozkład normalny N(0,1).

Z tablic dystrybuanty rozkładu normalnego N(0,1) można znaleźć K takie, że: 0x01 graphic

0x08 graphic

0x08 graphic

Przedział ufności dla wartości oczekiwanej m na poziomie ufności (1-α) : 0x01 graphic
- gdy znamy dystrybuantę σ lub gdy N jest bardzo duże i można zamiast σ przyjmować ocenę dyspersji SN.

Jeśłi tak nie jest - można wyznaczyć przedział ufności posługując się zmienną losową 0x01 graphic
o rozkładzie Studenta o (N-1) stopniach swobody.

Szacowanie przedziału ufności dla wariancji σ2 zbiorowości generalnej X o rozkładzie normalnym N(m,σ) - w oparciu o zmienną losową 0x01 graphic
która ma rozkład chi kwadrat o (N-1) stopniach swobody.

0x08 graphic
Na podstawie tablic dystrybuanty rozkładu chi-kwadrat o (N-1) st.swob. - wyznacza się dwie liczby K1 i K2 (patrz rysunek) takie, że: 0x01 graphic
przy czym zwykle przyjmuje się 0x01 graphic
(**)

Przedział ufności dla estymatora o rozkładzie chi kwadrat na poziomie istotności α

Po przekształceniu (**) otrzymujemy przedział ufności dla wariancji σ2 na poziomie ufności (1-α) 0x01 graphic
.

    1. Testy statystyczne, hipoteza zerowa, hipoteza alternatywna.

Weryfikacja hipotez statystycznych polega na podjęciu decyzji o przyjęciu lub odrzuceniu hipotezy.

Hipoteza zerowa - sprawdzana hipoteza mówiąca, że wartość nieznanego parametru q rozkładu zbiorowości generalnej X wynosi q0

H0 : q=q0

Hipotezy przciwstawne - hipotezy alternatywne H1 : q=q1

Hipoteza zerowa - sprawdzana na podstawie N-elementowej próby (x1, x2,..., xN), będącej realizacją zmiennej losowej (X1, X2, ... XN).

Tworzymy statystykę 0x01 graphic
-estymator nieznanego parametru q.

Jeżeli wartość 0x01 graphic
(estymata) - niewiele różna od wartości q0 , to hipoteza jest bardzo wiarygodna. Jeżeli 0x01 graphic
znacznie odbiega od q0 - hipoteza mało wiarygodna.

Test - pewna funkcja określona na przestrzenie próby; wartościami tej funkcji są decyzje d0 i d1 orzekające „przyjąć hipotezę H0” lub „odrzucić hipotezę H0”.

Statystyka 0x01 graphic
przekształca wielowymiarową przestrzeń próby w jednowymiarową przestrzeń statystyki. Przestrzeń statystyki można podzielić na dwa dopełniające się obszary Ω0 i Ω1. Zbiór Ω0 wartości 0x01 graphic
bliskich wartości q0 - obszar przyjęcia hipotezy H0 ; zbiór Ω1 wartości 0x01 graphic
odległych od wartości q0 - obszar odrzucenia hipotezy H0 , albo obszarem krytycznym.. Decyzja d o przyjęciu lub odrzuceniu hipotezy H0 - zgodnie ze wzorem: 0x01 graphic

Wartość 0x01 graphic
-została wyznaczona na podstawie próby losowej, dlatego przy podejmowaniu decyzji możliwe jest popełnienie błędu.

    1. Błąd I rodzaju, błąd II rodzaju, moc testu, poziom istotności testu.

Błąd I rodzaju - polega na odrzuceniu prawdziwej hipotezy zerowej. Jego prawdopodobieństwo wynosi: 0x01 graphic
Inaczej jest to prawdopodobieństwo przyjęcia decyzji o hipotezie H1 przy hipotezie prawdziwej H0

Błąd II rodzaju - błąd polegający na przyjęciu fałszywej hipotezy alternatywnej, a jego prawdopodobieństwo wynosi: 0x01 graphic

Jednoczesna minimalizacja opbu prawdopodobieństw błędów jest niemożliwa, dlatego zwykle z góry ustalamy prawdopodobieństwo α na ustalonym poziomie 0.05 lub 0.01 i następnie spośród możliwych obszarów krytycznych Ω1 spełniających warunek 0x01 graphic
wybieramy taki obszar, dla którego prawdopodobieństwo α popełnienia błędu II rodzaju będzie mniejsze.

0x01 graphic
gdzie Ω=Ω0 + Ω1 (przestrzeń statystyki)

Moc testu - prawdop. odrzucenia sprawdzonej hipotezy H0 w przypadku gdy jest prawdziwa hipoteza alternatywna H1, czyli prawdop. przyjęcia hipotezy alternatywnej H1 gdy jest ona prawdziwa :

0x01 graphic
Najleprzy test - najmocniejszy.

Poziom istotności testu - prawdop. α, określające prawdopodobieństwo przypadkowego odrzucenia prawdziwej hipotezy zerowej H0

    1. Testy istotności, testy parametryczne, testy nieparametryczne.

    2. Estymatory rekursywne (online) wartości oczekiwanej i wariancji z próby.

    3. Estymatory adaptacyjne wartości oczekiwanej i wariancji z próby.

  1. Analiza regresywna.

    1. Zależność stochastyczna, korelacja, regresja, funkcja regresji I i II rodzaju.

    2. Regresja liniowa - przykłady liniowych funkcji regresji dla obiektów liniowych i nieliniowych.

    3. Metoda najmniejszych kwadratów - wersja offline.

    4. Obciążenie estymatora według metody najmniejszych kwadratów, macierz kowariancji, wybuch macierzy kowariancji.

    5. Badanie istotności statystycznej modelu.

    6. Metoda uogólnionych najmniejszych kwadratów - wersja offline.

    7. Estymator rekursywny (online) według metody najmniejszych kwadratów, „nasycenie estymatora”.

    8. Estymator adaptacyjny według metody najmniejszych kwadratów, adaptacja przez zapominanie wykładnicze.

U

K

-K

1-α

0x01 graphic

1-α

α/2

α/2

x

hN(x)



Wyszukiwarka

Podobne podstrony:
12. Metody oczyszczania białek (1), Biotechnologia w Ochronie Środowiska
MATEMATYKA 12 2010
12.Metodyka szkol.BHP -załącznik, Studia, Zarządzanie, Ergonomia
edukacja matematyczna 12 11r
12.Metody KD, Pedagogika, Andragogika
matematyczna analiza metody ryzyka zał.1, Zarządzanie, Sem III, FINANSE PRZEDSIĘBIORSTW
Definicja i wlasnosci, Matematyka studia, Metody operatorowe w równaniach różniczkowych
12 Metody dochodowe wycenyid 13530
Matematyka 12 id 283095 Nieznany
Matematyka 9 12 06 ćwiczenia
12 Metody mechaniczne zapobiegania ciążyid 13277 ppt
12 Metody regulacji urodzeńid 13278 ppt
matematyka 12
MATEMATYKA 12 2010r
12 metody grupowego poradnictwa zawodowego metoda edukacyjna
Opracowanie Matematyka 12
Testy - wykład 12.metody badań, pedagogika, Metodoloia badań

więcej podobnych podstron