statystyka+1+wyk b3ad+ + 9cci b9ga 5C4QHXF3UK74LMAFIT5WGWFVGKKVACWV5IDOJHI


STATYSTYKA jest nauką zajmującą się badaniem prawidłowości występujących w zjawiskach, czyli takich, które mogą teoretycznie niezliczoną ilość Przedmiotem badania statystycznego jest zbiór obiektów powiązanych ze sobą logicznie lecz nie identycznych z punktu widzenia badanych cech. Zbiór ten nazywa się zbiorowością statystyczną, a jego elementy jednostkami statystycznymi. Należy zauważyć, że w badaniu statystycznym nie mają znaczenia same elementy badanego zbioru obiektu, a tylko pewne cechy tych elementów zwane cechami statystycznymi. Z tego powodu niekiedy w statystyce elementy utożsamia się z cechami.

STATYSTYKA OPISOWA zajmuje się badaniem zbiorowości statystycznych na podstawie obserwacji całkowitej, obejmującej wszystkie jednostki zbiorowości zwanej też populacją generalną. Badanie całkowite nie zawsze jest możliwe, zdarza się, że:

1. zbiorowość statystyczna jest bardzo duża lub nieskończona

2. badanie jednostki statystycznej powoduje jej zniszczenie np.: badanie wytrzymałości na rozciąganie

3. badanie jednostek jest kosztowne lub pracochłonne

W takich wypadkach trzeba się ograniczyć do badania częściowego obejmującego tylko pewien podzbiór populacji generalnej zwany próbą.Często na podstawie danych z próby chcemy coś wnioskować o rozkładzie danej cechy w całej populacji. Podstawowym warunkiem poprawności takiego wnioskowania jest to, aby elementy próby wybrane zostały w drodze losowania, wówczas taką próbę traktujemy jako miniaturę populacji macierzystej. Charakterystyki obliczone z tej próby powinny być w przybliżeniu równe analogicznym charakterystykom w całej populacji.

Istnieją różne schematy losowania elementów do próby. Nauka zajmująca się tym zagadnieniem nazywa się metodą reprezentacyjną.

STATYSTYKA MATEMATYCZNA jest nauką o metodach wnioskowania o rozkładach cech statystycznych (zmiennej losowej) na podstawie wyników badania częściowego, w którym wybór jednostki jest losowy.Zasadniczym aparatem jakim się posługuje statystyka matematyczna jest rachunek prawdopodobieństwa. W statystycznych zastosowaniach rachunku prawdopodobieństwa pojęcie zmiennej losowej używa się w kontekście: dana jest populacja złożona z dużej liczby elementów, interesujemy się jakąś cechą charakteryzującą elementy tej zbiorowości. Przypuśćmy, że do badania ma być losowo jeden element, wówczas nieznaną jeszcze wartość cechy na tym elemencie traktujemy jako pewną zmienną losową X, o pewnym nieznanym rozkładzie reprezentowanym przez dystrybuantę F(X). Gdy element zostanie wylosowany , a wartość cechy na tym elemencie zmierzona, wówczas wartość tę traktujemy jako realizację tej zmiennej losowej i oznaczamy X(ω) lub x dla pewnego ustalonego zdarzenia elementarnego ω, przy czym zdarzenie to jest tu teoretycznym odpowiednikiem elementów jakie mogą zostać wylosowane. Gdy do badania ma być wylosowanych n elementów to podobnie jak wyżej wartość cechy na tych nie wylosowanych elementach traktujemy jako n zmiennych losowych X1, X2, . . . Xn. Natomiast wartości cechy uzyskane dla konkretnych wylosowanych elementów jako realizację losowych X1(ω), X2(ω), . . . Xn(ω) lub x1,x2,...xn tych zmiennych losowych. W tym przypadku zdarzenie elementarne jest odpowiednikiem wszelkich możliwych układów n elementów jakie mogą zostać wylosowane.

Zbiór wszystkich możliwych realizacji tej próby nazywać będziemy przestrzenią próby.

Przykład zastosowania ststystyki matemj:

Na potrzeby przemysłu obuwniczego przeprowadza się pomiary długości stóp losowej grupy osób i na tej podstawie wnioskuje się zapotrzebowanie rynku na poszczególne rozmiary obuwia. W tym przykładzie populację generalną stanowi ogół potencjalnych nabywców obuwia, próbę tworzy wybrana losowo grupa osób podlegająca badaniu. Cechą statystyczną jest długość stopy.

Podstawowym pojęciem w statystyce matematycznej jest pojęcie statystyki czyli zmiennej losowej będącej funkcją elementów próby losowej X1, X2, . . . Xn np.:

0x08 graphic
0x01 graphic

0x08 graphic
0x01 graphic

WNIOSKOWANIE STATYSTYCZNE

Wyróżniamy dwa główne kierunki wnioskowania statystycznego:

  1. estymacja

  1. weryfikacja hipotez statystycznych

Problemy statystyczne charakteryzują się tym, że rozkład prawdopodobieństwa danej cechy nie jest zwykle znany, a posiadane informacje pozwalają jedynie wyróżnić pewną rodzinę rozkładów 0x01 graphic
do której ten rozkład należy.

Rozkłady z rodziny P indeksowane są parametrem 0x01 graphic
należącego do zbioru 0x01 graphic
zwanego przestrzenią parametrów. Przykładem takiej rodziny rozkładów jest rodzina rozkładów normalnych, którą można zapisać: 0x01 graphic
i dlatego w tym przykładzie 0x01 graphic
, natomiast przestrzeń parametrów 0x01 graphic
.

Celem wnioskowania statystycznego jest wyróżnienie najbardziej wiarygodnej wartości 0x01 graphic
(jest to zadaniem estymacji punktowej) lub przynajmniej takiego podzbioru przestrzeni 0x01 graphic
, o którym można powiedzieć, że zawiera 0x01 graphic
(jest to zadaniem estymacji przedziałowej i testowania hipotez statystycznych). Rozkłady statystyk z próby (średniej, wariancji, frakcji lub wskaźnika struktury), znajomość rozkładów różnych statystyk jest wykorzystywana przy budowie reguł wnioskowania statystycznego.

Tw. Niech X1, X2, . . . Xn będzie ciągiem zmiennych losowych niezależnych, o jednakowym rozkładzie normalnym z parametrami 0x01 graphic
wówczas statystyka

0x01 graphic

ma rozkład normalny z parametrami 0x01 graphic
co zapisujemy w skrócie 0x01 graphic

Tw. <Twierdzenie Fishera> Jeżeli X1, X2, . . . Xn są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym z parametrami 0x01 graphic
, to:

  1. zmienne losowe postaci:

0x08 graphic
0x01 graphic

0x08 graphic
0x01 graphic

  1. zmienna losowa 0x01 graphic
    ma rozkład chi-kwadrat o n-1 stopniach swobody, co zapisujemy w skrócie

0x01 graphic

  1. zmienna losowa postaci 0x01 graphic
    ma rozkład studenta o n-1 stopniach swobody, co zapisujemy w skrócie 0x01 graphic
    : Sn-1

Tw. (twierdzenia tego używa się do testowania) Jeżeli X1, X2, . . . Xn1 oraz Y1, Y2, . . . Yn2 są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym przy czym:

0x01 graphic
dla k = 1,2...n1

0x01 graphic
dla l = 1,2...n2, to: zmienna postaci

0x01 graphic
,

gdzie

0x01 graphic
0x01 graphic

0x01 graphic
0x01 graphic

ma rozkład studenta o 0x01 graphic
stopniach swobody co zapisujemy 0x01 graphic

Tw. Jeżeli X1, X2, . . . Xn1 oraz Y1, Y2, . . . Yn2 są niezależnymi zmiennymi losowymi o jednakowych rozkładach normalnych z wariancjami 0x01 graphic
(wartości oczekiwane mogą być dowolne), to zmienna losowa postaci

0x01 graphic

0x01 graphic
- wariancja w całej zbiorowosci

ma rozkład Fishera-Snedecora o n1-1, n2-1 stopniach swobody , gdzie

0x01 graphic

0x01 graphic
- wariancja z próby, skorygowana (jest zmienną losową)

0x01 graphic

Tw.Jeżeli X1, X2, . . . Xn są niezależnymi zmiennymi losowymi o rozkładzie normalnym z parametrami 0x01 graphic
, to zmienne losowe S2 oraz S mają asymptotyczne rozkłady normalne (czyli rozkłady zbieżne do rozkładu normalnego dla 0x01 graphic
) z następującymi parametrami:

0x01 graphic

0x01 graphic

TEORIA ESTYMACJI

Zajmuję się metodami szacowania parametrów rozkładu populacji (tzn. parametrów rozkładu badanej cechy populacji) lub szacowania postaci funkcyjnej określającej ten rozkład np.: szacowanie dystrybuanty.

Estymacja parametryczna to szacowanie nieznanych parametrów rozkładu populacji w przypadku gdy wiemy do jakiej rodziny należy rozkład badanej cechy np.: wiemy, że badana cecha ma rozkład normalnymi chcemy oszacować parametry tego rozkładu.

Estymacja nieparametryczna jeżeli nie znamy klasy rozkładów do której należy rozkład badanej cechy to procesy szacowania parametrów bądź postaci funkcyjnej rozkładu zaliczamy do estymacji nieparametrycznej.

Estymacja punktowa polega na podaniu jednej wartości będącej oszacowaniem danego, interesującego nas parametru populacji. Liczba ta nazywana jest oceną parametru i jest wartością pewnej statystyki, której własności upoważniają nas do wykorzystania jej w celu oszacowania danego parametru. Nosi ona nazwę estymatora tego parametru.

Def. Estymatorem parametru 0x01 graphic
nazywamy dowolną statystykę, służącą do oszacowania parametru 0x01 graphic
, której rozkład zależy od tego parametru.

Estymowanie służy do przybliżania prawdziwej wartości parametru. Spośród estymatorów tego samego parametru wybieramy te, które charakteryzują, się pewnymi pożądanymi własnościami. Do własności tych należą:

Def. Estymator Tn parametru 0x01 graphic
jest estymatorem nieobciążonym jeśli zachodzi równość E(Tn)= 0x01 graphic

Własność nieobciążoności zapewnia otrzymanie ocen parametrów wolnych od błędu systematycznego jeżeli E(Tn)≠ 0x01 graphic
to estymator Tn jest estymatorem obciążonym, a różnica E(Tn) - 0x01 graphic
to obciążenie estymatora

Jeśli obciążenie jest dodatnie to estymator daje oceny przeciętnie zawyżone w stosunku do rzeczywistej wartości parametru 0x01 graphic
.

Jeżeli obciążenie jest ujemne to estymator daje oceny przeciętnie zaniżone w stosunku do rzeczywistej wartości parametru 0x01 graphic
.

Def. Estymatorem asymptotycznie nieobciążonym nazywamy taki estymator Tn parametru 0x01 graphic
, dla którego zachodzi:

0x01 graphic

Def. Estymator Tn parametru 0x01 graphic
, jest estymatorem zgodnym jeśli spełniony warunek:

0x01 graphic
0x01 graphic

Oznacza to, że estymator Tn jest stochastycznie zbieżny, czyli zbieżny według prawdopodobieństwa do parametru 0x01 graphic
(0x01 graphic
).

Wynika z tego, że im większa jest próba tym większe jest prawdopodobieństwo dowolnie małej różnicy między wartością estymatora a szacowanym parametrem.

Tw. Jeżeli estymator Tn jest estymatorem niobciążonym lub asymptotycznie nieobciążonym i jeżeli warianvcja tego estymatora spełnia warunek 0x01 graphic
to estymator Tn jest estymatorem zgodnym.

Własność nioebciążoności i zgodności estymatora parametru 0x01 graphic
zapewniają oscylowanie wartości estymatora wokół rzeczywistej wartości parametru, ważna jest jednak także wariancja tego estymatora. Związana jest z tym własność efektywności estymatora.

Def.Niech 0x01 graphic
i 0x01 graphic
będą nieobciążonymi estymatorami tego samego parametru 0x01 graphic
. Mówimy, że są one tak samo efektywne jeżeli wariancje tych estymatorów są równe:0x01 graphic

Estymator 0x01 graphic
jest bardziej efektywny od estymatora 0x01 graphic
, jeżeli zachodzi nierówność: 0x01 graphic

Twierdzenie < Rao - Cramera >(do badania efektywności estymatorów)

Jeżeli Tn jest estymatorem nieobciążonym parametru 0x01 graphic
rozkładu populacji, którego funkcja gęstości lub funkcja prawdopodobieństwa jest dwukrotnie różniczkowalna ze względu na parametr 0x01 graphic
, to 0x01 graphic

gdzie „f” oznacza funkcję gęstości w przypadku, gdy badana cecha ma rozkład ciągły w populacji, lub funkcję prawdopodobieństwa, gdy cecha ma w populacji rozkład skokowy.

Def.Estymator nieobciążony 0x01 graphic
jest estymatorem najefektywniejszym parametru 0x01 graphic
jeżeli w klasie estymatorów nieobciążonych tego parametru ma on najmniejszą wariancję, tzn.:

0x01 graphic
0x01 graphic

gdzie 0x01 graphic
jest dowolnym nieob. est. θ.

------------------------------------------------------

Jeżeli w klasie estymatorów nieobciążonych danego parametru 0x01 graphic
znany jest estymator najefektywniejszy 0x01 graphic
oraz jego wariancja 0x01 graphic
, to można porównywać efektywność dowolnego nieobciążonego estymatora 0x01 graphic
parametru 0x01 graphic
z efektywnością estymatora 0x01 graphic
.

Współczynnik

0x01 graphic
jest miarą efektywności estymatora Tn

Łatwo zauważyć, że 0x01 graphic
dla estymatora najefektywniejszego.

Natomiast dla dowolnego innego estymatora nieobciążonego współczynnik ten zawiera się w przedziale <0;1>

------------------------------------------------------

Def. Estymator 0x01 graphic
parametru 0x01 graphic
nazywamy estymatorem asymptotycznie najefektywniejszym, jeżeli

0x01 graphic

Def. Estymator 0x01 graphic
parametru 0x01 graphic
nazywamy estymatorem dostatecznym jeżeli funkcja gęstości postaci:0x01 graphic
łącznego rozkładu próby X1,X2...Xn można rozłożyć na następujący iloczyn:

KRYTERIUM FAKTORYZACJI

0x01 graphic
,

gdzie

0x01 graphic
- jest funkcją wyników próby zależną od wartości estymatora 0x01 graphic
ale niezależną od szacowanego parametru 0x01 graphic
.

0x01 graphic
- jest funkcją gęstości estymatora

W przypadku rozkładu skokowego definicja jest analogiczna. Tylko 0x01 graphic
oznacza łączną funkcję rozkładu prawdopodobieństwa próby, a 0x01 graphic
- funkcję rozkładu prawdopodobieństwa estymatora.

W przypadku próby prostej wzór 0x01 graphic
możemy zapisać

0x01 graphic

Def. Estymator 0x01 graphic
parametru 0x01 graphic
nazywamy estymatorem niezmienniczym względem rodziny przekształceń G, jeżeli dla 0x01 graphic
spełniony jest warunek: 0x01 graphic

Przykład:

Średnia arytmetyczna z próby 0x01 graphic
będąca estymatorem wartości oczekiwanej badanej cechy z populacji generalnej jest estymatorem niezmienniczym względem wszystkich permutacji ciągu X1....Xn ponieważ 0x01 graphic
0x01 graphic

METODY WYZNACZANIA ESTYMATORÓW

  1. metoda momentów

  2. metoda najmniejszych kwadratów (MNK)

  3. metoda największej wiarygodności (MNW)

  4. metoda bayessowska

  5. metoda minimaksowa

Metoda momentów

To najstarsza z metod wyznaczania estymatorów. Polega na przyjęciu momentu z próby za oszacowanie odpowiedniego momentu populacji generalnej. Inaczej: Jeżeli szacujemy parametr 0x01 graphic
, który jest momentem k-tego rzędu badanej cechy populacji generalnej, to za estymator tego parametru przyjmujemy moment tego samego rzędu z próby. Np.: dla oszacowaniamomentu zwykłego pierwszego rzędu badanej cechy w populacji generalnej czyli parametru E(X) bierzemy estymator tego parametru, którym jest pierwszy moment zwykły z próby czyli 0x01 graphic
. Dla oszacowania k-tego momentu zwykłego cechy X w populacji generalnej, czyli parametru E(Xk) bierzemy odpowiedni k-ty moment zwykły z próby czyli estymator postaci0x01 graphic

Metoda momentów daje estymatory zgodne , ale często mało efektywne, a nawet mające małą efektywność asymptotyczną.

Metoda najmniejszych kwadratów

Jest stosowane do wyznaczan iaestymtorów

parametrów funkcji określających zależność

między zmiennymi losowymi (cechami)

Niech h(x; 0x01 graphic
)będzie funkcją określającą zależności między cechą Y a cechami (X1, X2,...Xp)=X.

Niech ciąg (x1,y1)( x2,y2) ....( xn,yn) stanowi realizację n - elementowej próby prostej pobranej z populacji.

Estymatorem parametru 0x01 graphic
otrzymanym metodą najmniejszych kwadratów nazywamy taki estymator parametru 0x01 graphic
,którego wartość (ozn. 0x01 graphic
) minimalizuje następującą funkcję:

0x01 graphic
,

tzn, że jeśli wstawię 0x01 graphic
, to funkcja osiągnie minimum

0x01 graphic

Własności estymatorów znalezionych tą metodą zależą od postaci funkcji h. Jeżeli jest to funkcja liniowa, to estymatory te są nieobciążone, zgodne i najefektywniejsze w klasie estymatorów liniowych.

Metoda największej wiarygodności.

Estymatorem najwiarygodniejszym (uzyskanym metodą największej wiarygodności) parametru 0x01 graphic
, jest taka statystyka, dla której tzw. funkcja wiarygodności próby osiąga maksimum.

Funkcją wiarygodności dla n - elementowej próby prostej nazywamy funkcję postaci:

0x01 graphic

gdzie

f - funkcja gęstości

p - funkcja prawdopodobieństwa

Wynika stąd, że estymatory największej wiarygodności możemy wyznaczyć tylko wtedy, gdy wiemy, do jakiej klasy rozkładów należy rozkład badanej cechy, tzn. znamy ogólną postać funkcji „f” lub „p”, lae nie znamy jej parametru 0x01 graphic
od którego ta funkcja zależy.

Metoda największej wiarygodności opiera się na spostrzeżeniu, że bardziej prawdopodobne realizują się częściej. Można więc przypuszczać, że zaobserwowane wyniki próby x1,x2,...xn to realizacje najbardziej prawdopodobnego zdarzenia przy danym 0x01 graphic
.

Szukamy więc takiej wartości 0x01 graphic
, dla której funkcja wiarygodności osiąga maksimum.

W praktyce zamiast wyznaczać maximum funkcji „L” wyznaczamy maximum funkcji „lnL” (ponieważ obie funkcje maję te same punkty stacjonarne(to samo maximum) a lnL jest łatwiejsza do policzenia).

Własności MNW- estymatorów: są asymptotycznie nieobciążone, zgodne i asymptotycznie najefektywniejsze. Ponadto MNW- estymatory mają rozkład asymptotycznie normalny z parametrami:

0x01 graphic

Tw. Jeżeli istnieje najefektywniejszy oraz dostateczny estymator parametru 0x01 graphic
to można go otrzymać metodą MNW

------------------------------------------------------

Estymację punktowa polega na podaniu jednej liczby, zwanej oceną szacowanego parametru, będącej wartością estymatora tego parametru o możliwie dobrych własnościach. Estymacja punktowa jest obarczona z reguły pewnym błędem. Ponieważ najczęściej w praktycznych zastosowaniach estymator Tn badanego parametru 0x01 graphic
jest zmienną losową ciągłą z czego wynika 0x01 graphic
(prawdopodobieństwo, że Tn będzie równy 0x01 graphic
równe jest 0 ).

------------------------------------------------------

ESTYMACJA PRZEDZIALOWA

W estymacji przedziałowej podaje się nie jedną ale pewien zbiór ocen szacowanego parametru, inaczej mówiąc jest to przedział liczbowy, który z zadanym prawdopodobieństwem pokrywa (obejmuje) szacowany parametr 0x01 graphic
.

Prawdopodobieństwo, że wyznaczony przedział pokrywa szacowany parametr 0x01 graphic
jest zadawane z góry i określone jest mianem współczynnika ufności oznaczonego symbolem 0x01 graphic
.Najczęściej 0x01 graphic
przyjmuje wartość 0,99, nigdy poniżej 0,9)

Jest oczywiste, że im większy przyjmiemy współczynnik ufności, tym większe jest prawdopodobieństwo, że szacowany parametr znajduje się w wyznaczonym przedziale liczbowym (zwanym przedziałem ufności), tym szerszy jest również przedział ufności, tzn. pogarsza się precyzja estymacji przedziałowej.

Dowodzi się, że przeciętnie na krótsze, przy danej liczebności próby, przedziały ufności otrzymuje się gdy wykorzystuje się przy budowie przedziału estymator o największej wiarygodności.

Aby skonstruować przedział ufności dla konkretnego parametru rozkładu populacji, trzeba posłużyć się właściwym dla danego parametru estymatorem Tn o znanym rozkładzie prawdopodobieństwa reprezentowanym przez funkcję prawdopodobieństwa h(tn; 0x01 graphic
). Przedziały ufności można budować zarówno na podstawie małych prób, gdy znamy dokładny rozkład estymatora Tn jak i na podstawie dużych prób wykorzystując do tego celu rozkład graniczny estymatora Tn.

PRZEDZIAŁ UFNOSCI DLA WARTOSCI SREDNIEJ

Stosunkowo najczęściej szacowanym parametrem rozkładu cechy X w populacji generalnej jest wartość oczekiwana (wartość średnia, E(X), 0x01 graphic
). Jak wiadomo za najlepszy estymator parametru 0x01 graphic
jest średnia arytmetyczna z próby. Jest to dla każdego rozkładu populacji estymator nieobciążony i zgodny parametru 0x01 graphic
. Dokładny rozkład prawdopodobieństwa tego estymatora zależy od rozkładu badanej cechy w populacji generalnej. Natomiast rozkład graniczny (tj. dla dużych prób 0x01 graphic
) jest jednakowy, niezależny od typu rozkładu cechy X w populacji. Dla dużych prób prostych średnia arytmetyczna 0x01 graphic
ma zawsze asymptotyczny rozkład normalny z parametrami 0x01 graphic
, gdzie n - liczebność próby, 0x01 graphic
- odchylenie standardowe cechy X w populacji generalnej. Na tym granicznym rozkładzie estymatora 0x01 graphic
opiera się budowę przedziału ufności z dużej próby dla parametru 0x01 graphic
. Natomiast dla małych prób przedziały ufności dla parametru 0x01 graphic
buduje się opierając się na dokładnym rozkładzie tego estymatora.

------------------------------------------------------------------------------------------------------------

Wyznaczanie wzoru na przedzial ufnosci dla wartosci sredniej n<30, σ-znana

Załóżmy, że cecha X ma w populacji generalnej rozkład 0x01 graphic
, gdzie 0x01 graphic
- jest znane. Srednia arytmetyczna z próby prostej 0x01 graphic
pobranej z tej populacji ma również rozkład normalny 0x01 graphic
=0x01 graphic
, natomiast statystyka 0x01 graphic
ma rozkład N(0;1), jest to dokładny (nie graniczny) rozkład tej statystyki.

Przypuśćmy, że chcemy wyznaczyć przedział ufności dla parametru 0x01 graphic
w tym modelu, przyjmując określoną z góry wartość współczynnika ufności [1-α]. Ponieważ zmienna losowa U ma rozkład normalny standaryzowany więc z tablic tego rozkładu odczytujemy taką liczbę 0x01 graphic
, aby zachodziło 0x01 graphic

0x08 graphic
Podstawmy : 0x01 graphic
i mamy, że 0x01 graphic

0x08 graphic
0x01 graphic

Otrzymaliśmy wzór na przedział ufności dla parametru 0x01 graphic
, tj. średniej wartości cechy w populacji o rozkładzie normalnym. Krańce tego przedziału określone są przez następujące zmienne losowe:

0x01 graphic
- lewy kraniec przedziału

0x01 graphic
- prawy kraniec przedziału

Warto zauważyć, że przedział ufności ma przy zadanym współczynniku ufności stałą długość równą 0x01 graphic
. Widać stąd, że przy zwiększaniu współczynnika ufności długość przedziału ufności rośnie, co jest niekorzystnym zjawiskiem (pogorszenie precyzji oszacowania). Może się zdarzyć, że dla stosunkowo małej liczebności próby otrzymany przedział ufności będzie tak szeroki, że starci praktycznie wartość estymacyjną. Można jednak poprawić precyzję oszacowania, zwiększając odpowiednio liczebność próby, ponieważ długość przedziału ufności jest odwrotnie proporcjonalna do liczebności próby..

Zagadnienie wyznaczania minimalnej liczebności próby potrzebnej do otrzymania ustalonej z góry precyzji estymacji przedziałowej dla parametru c rozwiązuje się następująco:

Należy znaleźć taką ;liczebność próby n aby długość przedziału ufności nie przekraczała z góry zadanej liczby, którą oznacza się 2d.

0x01 graphic

liczbę d nazywamy maksymalnym błędem szacunku.

Przekształcając powyższą nierówność otrzymujemy:0x01 graphic

Wyznaczanie wzoru na przedzial ufnosci dla wartosci sredniej n≥30, μ,S-nieznane

Niech X1....Xn będzie próbą prostą pobraną z populacji o rozkładzie 0x01 graphic
o nieznanych 0x01 graphic
. Z twierdzenia Fishera wiemy, że statystyka :

0x01 graphic
, gdzie

0x01 graphic
; 0x01 graphic

ma rozkład Studenta o n-1stopniach swobody. Oznaczmy., przez 0x01 graphic
kwantyl rzędu 0x01 graphic
tego rozkładu, to jest taką liczbę, dla której: 0x01 graphic

Wówczas mamy: 0x01 graphic
- gdzie 0x01 graphic
jest zadane z góry 0x01 graphic

1)0x01 graphic

Przedział ufności dla parametru 0x01 graphic
: 0x01 graphic
(2)

Przedział ten pokrywa parametr0x01 graphic
z prawdopodobieństwem 0x01 graphic
.

Korzystając z faktu, że: 0x01 graphic
, gdzie 0x01 graphic
- wariancja skorygowana, stąd równoważny zapis do (1) postaci: 0x01 graphic
(3)

i równoważny do (2) przedział ufności parametru 0x01 graphic
jest postaci: 0x01 graphic
(4)

Rozpiętość przedziału ufności określonego (2) wynosi 0x01 graphic
, a połowa rozpiętości 0x01 graphic
. Wielkość tę nazywamy maksymalnym błędem oszacowania. Na podstawie tego wzoru można określić (przynajmniej w przybliżeniu) niezbędną liczebność próby potrzebną, by oszacować parametr 0x01 graphic
w taki sposób aby maksymalny błąd oszacowania nie przekroczył z góry zadanej wartości d , wymaga to rozwiązania równości : 0x01 graphic

stąd: 0x01 graphic
(5)

Stosując analogiczny sposób postępowania w odniesieniu do zapisu (4) otrzymamy następującą nierówność: 0x01 graphic
(6)

Zauważmy, że wyznaczenie niezbędnej liczebności próby na podstawie nierówności (5) lub (6) wymaga określenia:

  1. wartości kwantyla 0x01 graphic

  2. wartości warincji z próby 0x01 graphic
    (0x01 graphic
    ).

Obliczeń tych dokonuje się na podstawie 0x01 graphic
elementowej próby wstępnej.

Wyznaczanie wzoru na przedzial ufnosci dla wartosci sredniej n<30, μ,σ-nieznane

Załóżmy, że badana cecha ma w populacji generalnej dowolny rozkład o nieznanej wartości oczekiwanej 0x01 graphic
i nieznanej wariancji 0x01 graphic
. Niech dana będzie próba prosta X1,....,Xn pobrana z tej populacji. Z twierdzenia Lindeberga - Levy'ego wiemy, że zmienna losowa 0x01 graphic
ma graniczny (standardowy) rozkład N(0;1). Oznacza to, że dla dostatecznie dużej próby rozkład zmiennej losowej U jest w przybliżeniu normalny 0x01 graphic
. W praktyce przyjmuje się , że przybliżenie to jest zadowalające już dla 0x01 graphic
. Ponadto ponieważ statystyka 0x01 graphic
jest estymatorem zgodnym parametru 0x01 graphic
więc dla dużych n parametr 0x01 graphic
możemy zastąpić przez 0x01 graphic
i dalej postępować podobnie jak w MODELU 1. W rezultacie otrzymujemy: 0x01 graphic
,

gdzie 0x01 graphic
jest kwantylem rzędu 0x01 graphic
rozkładu normalnego standaryzowanego N:(0;1) innymi słowy 0x01 graphic
jest taką liczbą, dla której: 0x01 graphic

Stąd przedział ufności dla parametru 0x01 graphic
jest w tym modelu następujący: 0x01 graphic

================================================================

Wyznaczanie wzoru na przedzial ufnosci dla wariancji ( odchylenia standardowego ) n<30, S2-nieznane

Niech X1,....,Xn będzie próbą prostą z populacji o rozkładzie 0x01 graphic
, gdzie 0x01 graphic
są nieznane. Z twierdzenia Fishera wiadomo, że statystyka 0x01 graphic
ma rozkład chi-kwadrat o n-1 stopniach swobody. Oznaczmy, przez c1 kwantyl rzędu 0x01 graphic
, a przez c2 kwantyl 0x01 graphic
tego rozkładu. Innymi słowy c1 jest taką liczbą, dla której: 0x01 graphic

a c2 , taką, dla której 0x01 graphic

Liczby c1 , c2 odczytuje się z tablic rozkładu chi-kwadrat. Wówczas mamy:

0x01 graphic

Z=nS22 (podstawiamy)

0x01 graphic

0x01 graphic
(7)

Korzystając z tego , że 0x01 graphic
otrzymujemy równoważny do (7) zapis:

0x01 graphic

stąd przedział ufności dla parametru σ2 jest postaci 0x01 graphic
lub 0x01 graphic

Przedział ten pokrywa parametr σ2 z prawdopodobieństwem 0x01 graphic
.

------------------------------------------------------------------------------------------------------------

Wyznaczanie wzoru na przedzial ufnosci dla wariancji ( odchylenia standardowego ) n≥30, S-znane

Niech X1,....,Xn będzie próbą prostą z populacji o rozkładzie 0x01 graphic
, gdzie 0x01 graphic
są znane. Z twierdzenia 9 (drugi wykład) wiadomo, że statystyka S ma asymptotyczny rozkład normalny z parametrami 0x01 graphic
, co zapisujemy 0x01 graphic
. Oznacza to, że dla dostatecznie dużej próby 0x01 graphic
statystyka S ma w przybliżeniu rozkład 0x01 graphic
, a co za tym idzie statystyka 0x01 graphic
ma w przybliżeniu N(0;1). Wówczas 0x01 graphic

0x01 graphic

0x01 graphic

Ostatecznie więc przedział ufności dla parametru 0x01 graphic
(czyli odchylenia standardowego w populacji) jest postaci: 0x01 graphic

Przedział ten pokrywa parametr 0x01 graphic
z prawdopodobieństwem 0x01 graphic

================================================================

Wyznaczanie wzoeu na przedzial ufnosci dla frakcji (wskaźnika struktury)

Rozważmy następujący przykład. Załóżmy, że pewna frakcja „p” wyborców jest zdecydowana poprzeć dane ugrupowanie w najbliższych wyborach. Wartość parametru „p” nie jest jednak znana. Wiemy tylko, że znajduje się w przedziale domkniętym <0;1>.

W celu oszacowania parametru „p” przeprowadzamy ankietę wśród „n” losowo wybranych osób. Ankieta przewiduje odpowiedzi TAK i Nie na pytanie „Czy będziesz na nich głosował?”. Przyporządkowując dla TAK „1” oraz „0” dla NIE. Ciąg zer i jedynek zaobserwowanych w próbie możemy potraktować jako realizację „n” - niezależnych zmiennych losowych X1,X2, . . . Xn , każda o jednakowym rozkładzie zerojedynkowym z parametrem „p” 0x01 graphic
. Niech „k” oznacza liczbę jedynek w próbie zauważmy, że k jest zmienną losową obrazującą liczbę sukcesów w serii n niezależnych doświadczeń ( serii n losowań ). Zatem k ma rozkład dwumianowy z parametrami n i p. 0x01 graphic

Tym samym zmienna losowa 0x01 graphic
ma rozkład dwumianowy postaci: 0x01 graphic
, co można sprawdzić:

0x01 graphic
; 0x01 graphic

Rozkład dwumianowy jest rozkładem dokładnym statystyki 0x01 graphic
, natomiast jej rozkładem granicznym jest dla 0x01 graphic
jak wiemy rozkład normalny z tymi samymi parametrami co zapisujemy: 0x01 graphic

Oznacza to, że statystyka 0x01 graphic
ma graniczny rozkład normalny N(0,1) co zapisujemy 0x01 graphic
. Oznacza to innymi słowy, że dla dostatecznie dużej próby (n>100) rozkład zmiennej losowej możemy dostatecznie dobrze przybliżyć do rozkładu normalnego standaryzowanego. Wyznaczymy przedział ufności dla parametru „p” opierając się na rozkładzie granicznym statystyki „U”.

Niech 0x01 graphic
oznacza kwantyl rzędu 0x01 graphic
rozkładu normalnego standaryzowanego, tj. taką liczbę, że

0x01 graphic

mamy więc 0x01 graphic
po podstawieniu wartości statystyki U mamy, że 0x01 graphic
Zauważmy, że wyrażenie 0x01 graphic
jest wariancją statystyki 0x01 graphic
. W przypadku dużej próby iloraz ten możemy dobrze przybliżyć oszacowaniem próbą: 0x01 graphic

mamy więc po przekształceniu wzoru powyższego wyrażenie:

0x01 graphic

stąd przedział ufności

0x01 graphic

Przedział ten pokrywa parametr „p” z prawdopodobieństwem 0x01 graphic
. Niezbędną liczebność próby potrzebną do oszacowania parametru „p” z zadanym maksymalnym błędem oszacowania możemy wyznaczyć ze wzoru:

0x01 graphic
, gdzie 0x01 graphic

0x01 graphic
oznaczają przybliżone wartości parametrów p i q ..

W przypadku, gdy wielkości te nie są znane za 0x01 graphic
przyjmuje się wartość maksymalną

0x01 graphic

mamy wówczas: 0x01 graphic

DYSTRYBUANTA EMPIRYCZNA I JEJ PRZEDZIAL UFNOSCI

Niech X będzie zmienną losową o rozkładzie z ciągłą dystrybuantą F(X).

Dystrybuantą empiryczną Fn(X) - odpowiadającą próbie prostej z populacji o ciągłym rozkładzie z dystrybuantą F(X) nazywamy funkcję

0x01 graphic

gdzie:

0x01 graphic
oznaczają wartości zrealizowane w próbie, uporządkowane w kolejności niemalejącej

k - oznacza łączną liczbę obserwacji w próbie, które są mniejsze od danej wartości 0x01 graphic

Funkcja Fn(X) - jest

  1. niemalejąca

  2. lewostronnie ciągła

  3. 0x01 graphic

  4. 0x01 graphic

A więc posiada takie same własności jak dystrybuanta rozkładu prawdopodobieństwa. Dlatego też nazywamy tę funkcję dystrybuantą. Przymiotnik „empiryczna” wskazuje na fakt, że jest zbudowana na podstawie wyników eksperymentu, z więc próby. Dla ustalonej wartości „x” funkcja Fn(X) jest zmienną losową, gdyż dla danego „x” w próbie może być, 0,1,2...n wartości mniejszych od „x”.

W związku z powyższym zmienna losowa Fn(X) ma rozkłąd dwumianowy o funkcji prawdopodobieństwa postaci:

0x01 graphic

k=1...n

F(x) - prawdopodobieństwo, że pojedyncza obserwacja w próbie jest mniejsza od „x”. Przy budowie obszaru krytycznego korzystamy z twierdzenia Gliwienki.

Tw.Gliwienki: Załóżmy, że populacja generalna jest badana ze względu na cechę X o ciągłej dystrybuancie F(x). Z populacji tej wylosowano próbę prostą x 1 .....x n, której odpowiada ciąg dystrybuant empirycznych Fn(x). Wówczas ciąg dystrybuant empirycznych 0x01 graphic
przy 0x01 graphic
jest jednostajnie zbieżny do dysrybuanty F(x) z prawdopodobieństwem 1. Co zapisujemy :

0x01 graphic
,

gdzie:

0x01 graphic
- maksymalna odległość między funkcjami.

Rozkład zmiennej 0x01 graphic
(rozkład dokładny i graniczny) jest znany i stablicowany. Możemy więc tę statystykę wykorzystać do budowy przedziału ufności dystrybuanty F(x). Niech 0x01 graphic
będzie kwantylem rzędu 0x01 graphic
rozkładu granicznego statystyki 0x01 graphic
czyli takiej liczby , dla której:

0x01 graphic
, mamy więć

0x01 graphic

0x01 graphic

a więc:

0x01 graphic

inaczej można to przedstawić:

0x01 graphic

0x01 graphic

0x01 graphic

Otrzymaliśmy wzór na obszar ufności (pas ufności) dla dystrybuanty F(x). Brzegi tego obszaru są funkcjami schodkowymi.

UWAGA: Jeżeli przy wyznaczaniu przedziału ufności otrzymamy lewy kraniec mniejszy od zera , to przyjmujemy jego wartość równą zero. Natomiast jeśli otrzymamy prawy koniec większy od jedynki, to przyjmujemy za jego wartość jeden.

to są statystyki

są niezależnymi zm. los.



Wyszukiwarka

Podobne podstrony:
statystyka+2+wyk b3ad+ + 9cci b9ga VKNMHDTTP5VXUJNGGEFESVPLJX7U7YGDNCAMBLQ
atom 2c+uk b3ad 2cwi b9zania+ + 9cci b9ga KGLJP5JUEHVNKFKTJL4N5TVEMY6PTHZB6QUZ27A
IiE, Mat Statystyka,Wyk 4
KZ = iso 8859 2 q Wyk=B3ad = 2010
KZ = iso 8859 2 q Wyk=B3ad = 2018
wska 9fniki+poziomu+gospodarowania+ + 9cci b9ga N6RZTISND6QESJI2D34LHQZGRZ7USYLFPBARN4Y
zarz b9dzanie+produkcj b9+ + 9cci b9ga A7MWXCKB2PU3RG4XWX3RH2JK3DV4IBTJH6RSCKQ
9cci b9ga+hp NDAMPFUKRLHN3OAWFSO77YPGSHSWVQ7ACLANIMI
9cci b9ga+z+marketingu GURTSLEDJ3H2GZOAX7BVATYB4D572YJTD4XUSRA
rachunkowo 9c e6+bankowa+ +wyk b3ad+1+ 2816 11 2005 29 OLCPLSAV2E6GCT5FOI3SHOBIYYNTNVORFOT3BMY
zarz b9dzanie+ + 9cci b9ga xg6l3ozrw4ycluypzpge4vsahbmubhhu7pba7gi xg6l3ozrw4ycluypzpge4vsahbmubhhu7
KZ = iso 8859 2 q Wyk=B3ad = 2007
KZ = iso 8859 2 q Wyk=B3ad = 2008
zarz b9dzanie+finansami+ + 9cci b9ga GYYSDHCNJHGRPA3NWDYZSORHZDM5X65TEQPZ56Q
fizyka+ 9cci b9ga PYRAOUCEQHOI22SASOE6X4VYOWN3LW6IP6XZ34Q

więcej podobnych podstron