Statystyka opisowa (2)


Elementy Statystyki Opisowej

Szereg rozdzielczy, histogram, łamana częstości

Niech 0x01 graphic
będzie n-elementową próbką. Rozstępem z próbki nazywamy

0x01 graphic

Przy większej liczności próbki (n 30), w celu ułatwienia analizy danych, wartości liczbowe próbki grupuje się w klasach (najczęściej o jednakowej długości), przyjmując uproszczone założenie, że wszystkie wartości znajdujące się w danej klasie są identyczne ze środkiem klasy.

Liczba klas - k.

Liczność próbki n

Liczba klas k

30 - 60

6 - 8

60 - 100

7 -10

100 - 200

9 -12

200 - 500

11 - 17

500 - 1500

16 - 25

Na ogół nie stosuje się liczby klas k większej od 30.Długość klasy - b.

0x01 graphic

Punkty stanowiące granice poszczególnych klas ustala się z dokładnością do /2, gdzie jest dokładnością pomiaru. Oznaczmy przez 0x01 graphic
liczność i-tej klasy. Oczywiście 0x01 graphic
.

Szereg rozdzielczy (Frequency Tabulation).

Szeregiem rozdzielczym nazywamy ciąg par 0x01 graphic
, gdzie 0x01 graphic
jest środkiem i-tej klasy. Ciąg 0x01 graphic
nazywamy rozkładem liczności badanej cechy przy danej liczbie k klas.

Przykład. Wkładka topikowa bezpiecznika o natężeniu znamionowym 20A winna, zgodnie z normą, wytrzymać bez przepalenia się natężenie 28A w ciągu 1 godziny. W celu sprawdzenia zgodności z normą, z partii wkładek topikowych tego typu pobrano losowo 40 sztuk i zanotowano czasy przepalenia się wkładki przy natężeniu prądu 28A. Otrzymano następujące wyniki w minutach:

51 58 64 69 61 56 41 48 56 61

75 55 46 57 70 55 47 62 55 60

54 57 65 60 53 54 49 58 62 59

53 50 58 63 64 59 52 51 65 60

Dla przedstawionej próbki zbudować szereg rozdzielczy oraz narysować histogram i łamaną częstości.

Rozwiązanie. Zauważmy, że 0x01 graphic
oraz 0x01 graphic
. Zatem rozstęp z próbki R = 34. Ponieważ liczność próbki n = 40, to wygodnie jest przyjąć liczbę klas k = 7 oraz szerokość klasy b = 5. Tym samym otrzymujemy następujący szereg rozdzielczy:

Nr klasy i Klasa 0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

1 40.500 45.500 43.000 1 .0250 1 .0250

2 45.500 50.500 48.000 5 .1250 6 .1500

3 50.500 55.500 53.000 10 .2500 16 .4000

4 55.500 60.500 58.000 12 .3000 28 .7000

5 60.500 65.500 63.000 9 .2250 37 .9250

6 65.500 70.500 68.000 2 .0500 39 .9750

7 70.500 75.500 73.000 1 .0250 40 1.0000

gdzie 0x01 graphic
oraz 0x01 graphic
są licznościami i częstościami łącznymi odpowiednio.

Miary opisowe : wyznaczanie wielkości najbardziej reprezentatywnych, rozproszenia , skośności i spłaszczenia badanej cechy.

Przykład. Załóżmy, że stajemy przed następującym problemem promocji. W wyniku odejścia jednego z kierowników zwolniło się odpowiednie stanowisko i na to miejsce chcemy przeszeregować jednego z naszych pracowników. Wszyscy pracownicy naszej firmy po pierwszym roku pracy przechodzą test mający ocenić ich przydatność na stanowisku kierowniczym. Jednakże ostatnio sam test uległ zmianie i część pracowników jest oceniona według nowej skali ocen. Zasadą jest, że promuje się pracownika, który osiągnąl najlepszy wynik. Okazało się, że jest dwóch kandydatów o wynikach 143 (nowy test) oraz 29 (stary test). Oczywiście nie byłoby w porządku poddawanie nowemu testowi pracownika, który osiągnął wynik 29. W jaki sposób porównać te dwa wyniki? Jakie dodatkowe informacje musimy uzyskać, żeby to porównanie było możliwe?

Miary środka rozkładu - wyznaczanie wielkości najbardziej reprezentatywnych.

Średnia (Average):

0x01 graphic
lub 0x01 graphic
dla danych pogrupowanych w klasy.

Mediana (Median):

0x01 graphic
lub 0x01 graphic
dla danych pogrupowa­nych, gdzie m oznacza numer klasy mediany, 0x01 graphic
- lewy koniec klasy mediany a 0x01 graphic
uporządkowaną próbkę.

Moda (Mode):

Wartością modalną (modą, dominantą) 0x01 graphic
próbki 0x01 graphic
o powtarzających się wartościach nazywamy najczęściej powtarzającą się wartość, o ile istnieje, nie będącą 0x01 graphic
ani też 0x01 graphic
. W przypadku danych pogrupowanych modą nazywamy środek najliczniejszej klasy za wyjątkiem klas skrajnych. Jeżeli w szeregu rozdzielczym najliczniejszymi są obie klasy skrajne, to szereg rozdzielczy nazywamy antymodalnym typu U, a środek najmniej licznej klasy antymodą. Gdy najliczniejsza jest jedna z klas skrajnych, wtedy szereg rozdzielczy nazywamy antymodalnym typu J. W przypadku, gdy istnieje więcej niż jedna wartość modalna to rozkład takiej cechy nazywamy rozkładem wielomodalnym.

Przykład (cd.) Ponieważ n = 40 to

0x01 graphic
. Natomiast dla danych pogrupowanych otrzymujemy

0x01 graphic
, ponieważ m = 4. Oczywiście 0x01 graphic
= 58.

0x01 graphic

Dla próbki z populacji o rozkładzie symetrycznym wszystkie miary środka rozkładu dają wartości zbliżone, tzn. 0x01 graphic
. Natomiast dla rozkładów asymetrycznych mamy następującą zależność empiryczną : 0x01 graphic
.

0x01 graphic
0x01 graphic

UWAGA: Dla małych prób średnia jest wrażliwa na zmiany w próbce. Dodanie jednej bardzo dużej albo bardzo małej wartości może dramatycznie zmienić wartość średniej. Dlatego dla małych prób mediana jest znacznie odporniejsza na występowanie w próbce wartości nietypowych (outliers).

Miary rozproszenia Rozstęp z próbki (Range):

0x01 graphic

Wariancja (Variance):

0x01 graphic
lub 0x01 graphic
dla danych pogrupowanych.

Odchylenie standardowe (Standard Deviation):

0x01 graphic
.

Rozstęp międzykwartylowy (Interquartile Range):

0x01 graphic
,

gdzie 0x01 graphic
i 0x01 graphic
są odpowiednio dolnym i górnym kwartylem zdefiniowanymi następująco:

0x01 graphic
, 0x01 graphic
.

p-ty q-kwantyl (Quantile):

0x01 graphic
.

Na przykład dla p = 1 i q = 2 mamy medianę, a dla p = 1 i p = 3 oraz q = 4 oba kwartyle. Dla q = 10 mamy decyle a dla q = 100 percentyle.

Odchylenie pseudostandardowe (Pseudo-Standard Deviation):

0x01 graphic
, 1.35 jest odchyleniem międzykwartylowym dla rozkładu N(0,1).

Jeżeli PSD < s to badana cecha ma "tłuste ogony". W przypadku PSD > s rozkład ma "wybrzuszenie" w środku. Tylko dla PSD s oraz symetrii można uznać, że dane pchodzą z rozkładu normalnego.

Współczynnik zmienności (Coefficient of Variation):

0x01 graphic
.

Dystrybuanta empiryczna, momenty empiryczne, skośność i spłaszczenie.

Dystrybuanta empiryczna:

0x01 graphic
,

jest to dystrybuanta zmiennej losowej o rozkładzie jednostajnym na zbiorze wartości próbki.

Moment zwykły rzędu l :

0x01 graphic
lub 0x01 graphic
dla danych pogrupowanych.

Moment centralny rzędu l :

0x01 graphic
lub 0x01 graphic
dla danych pogrupowanych.

Oczywiście 0x01 graphic
oraz 0x01 graphic
.

Współczynnik skośności (Skewness):

0x01 graphic
, w STATGRAFIE 0x01 graphic
.

Wspólczynnik ten charakteryzuje skośność rozkładu badanej cechy. W praktyce przyjmuje się, że dla 0x01 graphic
< 0.5 rozkład jest symetryczny natomiast dla 0x01 graphic
> 1 mocno skośny. Znak współczynnika wskazuje, w którą stronę jest skośna cecha. Dla wartości dodatniej mamy skośność w prawo a dla ujemnej w lewo.

Współczynnik skośności standaryzowany (Standardized Skewness):

0x01 graphic
.

Indeks skośności Pearsona (Pearson Index of Skewness):

0x01 graphic
.

Wartości indeksu I interpretuje się podobnie jak wartości współczynnika 0x01 graphic
. Indeks ten jest wygodną oceną skośności w sytuacji, gdy nie dysponujemy specjalnym programem obliczeniowym, gdyż nie potrzeba obliczać wartości trzeciego momentu centralnego.

Współczynnik spłaszczenia - kurtoza (Kurtosis):

0x01 graphic
w STATGRAFIE 0x01 graphic
.

Dla cechy o rozkładzie normalnym lub podobnym kurtoza w przybliżeniu jest równa zeru. Wartości mniejsze od zera świadczą o spłaszczeniu rozkładu w porównaniu do rozkładu normalnego, natomiast wartości dodatnie o tym, że rozkład ma pik.

Kurtoza standardowa (Standard Kurtosis):

0x01 graphic
.

Standaryzacja wartości w próbce (z-score):

0x01 graphic
.

Operacja ta jest operacją przeskalowania danych. W przypadku dwóch różnych próbek o rozkładach symetrycznych zbliżonych do rozkładu normalnego pozwala na porówny­wanie między sobą ich wartości. Korzystając z własności rozkładu normalnego można przypuszczać, że dla próbki o rozkładzie zbliżonym do normalnego prawie wszystkie 0x01 graphic
3, około 95% 0x01 graphic
2 a około 68% 0x01 graphic
1. Dlatego też warunek 0x01 graphic
> 3 przyjmuje się jako kryterium wykrycia wartości nietypowej (outlier).

Box and Whisker Plot.

0x01 graphic

Przy tworzeniu wykresu typu Box-and-Whisker Plot trzy środkowe linie odpowiadają wartościom kwartyli oraz mediany odpowiednio. Szerokość "pudełka" równa jest zatem rozstępowi międzykwartylowemu IQR. Długości "wąsów" zależą od rozkładu wartości w próbce i równe są odpowiednio odległości najmniejszej wartości w próbce mieszczącej się w przedziale o szerokości 1.5IQR na lewo od dolnego kwartyla oraz odległości naj­większej wartości w próbce mieszczącej się w przedziale o szerokości 1.5IQR na prawo od górnego kwartyla. Wszyskie wartości poza wymienionym przedziałem traktowane są jako wartości nietypowe. Przy czym rozróżnia się wartości ekstremalnie nietypowe (większe od 0x01 graphic
lub mniejsze od 0x01 graphic
). Wykres ten po raz pierwszy wprowadzony przez J.Tukeya w 1977 roku jest czasami nazywany wykresem pięciu liczb (five-number summary), ponieważ przedstawione są na nim kwartyle, mediana oraz war­tości ekstremalne w próbce. Jest to najprostszy sposób zobrazowania danych przy pomocy miar pozycyjnych.

Rozwiązanie problemu promocji.

Z zebranych wyników pierwszego testu mamy 0x01 graphic
= 22.6, 0x01 graphic
= 22.9 oraz s = 2.8. Podobnie osoby, które przeszły drugi test uzyskały wyniki 0x01 graphic
= 107.8, 0x01 graphic
= 104.9 oraz s = 17.4. W obu przypadkach testowi poddano po kilkuset pracowników. Ponieważ zarówno w pierwszym jak i w drugim przypadku moduł indeksu skośności jest mniejszy od 0.5 (dla pierwszego testu I = - 0.32 dla drugiego I = 0.5) można przyjąć, że oceny mają rozkłady symetryczne. Obliczmy wartości standaryzowane dla obu wybranych pra­cowników:

0x01 graphic
oraz 0x01 graphic
.

Z porównania obu liczb wynika, że pierwszy pracownik uzyskał relatywnie lepszą ocenę.

Wartości nietypowe (Outliers):

Większość standardowych metod wnioskowania statystycznego zakłada, że mamy do czynienia z próbką z rozkładu normalnego. Ponieważ praktycznie 100% obserwacji z populacji o rozkładzie normalnym zawiera się w przedziale [0x01 graphic
-3s , 0x01 graphic
+3s], to obserwacje nie wpadające do tego przedziału traktowane są jako obserwacje nietypowe. Jeśli nie jest prawdą, iż cecha ma rozkład normalny to obliczone z próbki wartości średniej i odchylenia standardowego nie dają pełnego obrazu rozkładu badanej cechy. Zaobserwowanie nietypowych wartości ekstremalnych w próbce, tzw. outliers może spowodować problem w ich interpretacji. Otóż wartości nietypowe mogą sygnalizować fakt, iż próbka nie pochodzi z rozkładu normalnego lub, że nastąpił błąd przy zbieraniu danych (zły pomiar lub błąd w zapisie). W większości przypadków wartości nietypowe są wynikiem rzeczywistego mechanizmu losowego i nie można ich pomijać z rozważań. jednak wówczas wartości średniej i odchylenia standardowego mogą być obciążone błędem. Jeżeli wartości nietypowe skupiają się po jednej stronie średniej to następuje przesunięcie średniej, jeżeli są rozłożone symetrycznie to średnia może być dobrym oszacowaniem środka rozkładu, ale odchylenie standardowe może być zbyt duże. Zarówno średnia jak i odchylenie standardowe nie są odporne na efekt występowania wartości nietypowych.

Pierwszym krokiem przy sprawdzaniu normalności badanej cechy jest ustalenie czy wśród danych zebranych w próbce występują wartości nietypowe, jeśli tak to czy można je przypisać popełnionym błędom w trakcie zbierania danych. Jeśli nie, to znaczy że cecha ma rozkład skośny (wartości nietypowe układają się po jednej stronie) lub ma "długie ogony" (long-tailed). W obu przypadkach używanie średniej i odchylenia standardowego do oceny odpowiednich parametrów jest bardzo ryzykowne.

Wykrywanie wartości nietypowych.

Najprostszym sposobem wykrywania wartości nietypowych jest stwierdzenie czy leżą w przedziale trzech odchyleń standardowych wokół średniej, tzn. czy wartości po standaryzacji są większe co do wartości bezwzględnej od 3. Jednak jak to zostało stwierdzone powyżej takie postępowanie może być obarczone błędem. Inne podejście do tego problemu zaproponował Tukey jest to tzw. Box-and-Whisker Plot, który został omówiony wcześniej.

Dane ucięte i winsorowskie (Trimmed and Winsorized Data Sets):

Łatwość wyznaczania procedur wnioskowania statystycznego dla średniej i odchylenia standardowego w porównaniu z medianą i kwartylami, spowodowała poszukiwania przez statystyków możliwości adaptowania zbioru danych w ten sposób, żeby można było je liczyć. C.P. Winsor zauważuł, że większość danych empirycznych jest zbliżona do danych normalnych w środku zmienności a odstępstwa pojawiają się zwykle na brzegach. W przypadku, gdy wartości nietypowe są jedynym powodem odstępstwa od normalności to usunięcie ich z próby może spowodować rozwiązanie problemu, oczywiście pod warunkiem, że badana cecha ma rozkład symetryczny. Powstaje pytanie ile danych usunąć. Zwykle usuwa się po 10% próbki z obu stron, tzn. po 0x01 graphic
obserwcji najmniejszych i największych. W MINITAB-ie ucina się po 5% z obu stron. W dalszym ciągu średnią i odchylenie standadowe dla danych uciętych będziemy oznaczać przez 0x01 graphic
i 0x01 graphic
odpowiednio. Nie zawsze takie postępowanie jest zadawalające. Ma to szczególne znaczenie dla małych licznych próbek przy ocenie odchylenia standardowego, które w praktyce może być znacznie większe niż obliczone dla danych uciętych. Wówczas dokonujemy tzw. winsoryzacji danych tzn. zastąpienia danych odrzucanych wartością najmniejszą lub największą z próbki uciętej. Tym samym nie zmieniamy liczności próbki, a jedynie dokonujemy zawężenia rozstępu z próbki. Średnią i odchylenie standadowe dla danych wisoryzowanych będziemy oznaczać przez 0x01 graphic
i 0x01 graphic
odpowiednio.

Przykład. Wybrano losowo 25 osób osiągających dochody powyżej 4 tys. PLN miesięcznie i uzyskano następujący rozkład częstości:

Wiek

29

33

37

38

39

40

42

43

45

47

50

59

66

Częstość

1

1

3

4

2

3

2

2

3

1

1

1

1

Wyznaczyć średni wiek.

Rozwiązanie. 0x01 graphic
= 42, s = 7.64. 0x01 graphic
= 38 oraz 0x01 graphic
= 58, zatem IQR = 5 a PSD = 3.7. Korzystając z wykresu Box-and-Whisker Plot stwierdzamy, że są dwie obserwacje nietypowe: 66 i 59. W celu wyznaczenia średniej uciętej odrzucamy po 3 obserwacje z każdej strony 0x01 graphic
=40.84 a 0x01 graphic
= 3.10. Nowy zbiór danych nie ma już wartości nietypowych. W obu przypadkach mediana jest równa 40. Pomimo, że dane po ucięciu są symetryczne to w dalszym ciągu PSD(T) = 5.19 < 0x01 graphic
co świadczy o dużych ogonach. Poniżej podane zostały obliczenia wykonane przy użyciu pakietu MINITAB.

MTB > print c1

C1

29 33 37 37 37 38 38 38 38 39 39 40 40

40 42 42 43 43 45 45 45 47 50 59 66

MTB > boxplot c1

-----------

-------------I + I------- * *

-----------

+---------+---------+---------+---------+---------+------C1

28.0 35.0 42.0 49.0 56.0 63.0

MTB > describe c1

N MEAN MEDIAN TRMEAN STDEV SEMEAN

C1 25 42.00 40.00 41.52 7.64 1.53

MIN MAX Q1 Q3

C1 29.00 66.00 38.00 45.00

MTB > print c2 # dane ucięte po 5% z obu stron

C2

37 37 37 38 38 38 38 39 39 40 40 40 42

42 43 43 45 45 45 47 50

MTB > boxplot c2

---------------------

----I + I----------------------------

---------------------

----+---------+---------+---------+---------+---------+--C2

37.5 40.0 42.5 45.0 47.5 50.0

MTB > describe c2

N MEAN MEDIAN TRMEAN STDEV SEMEAN

C2 21 41.095 40.000 40.842 3.673 0.802

MIN MAX Q1 Q3

C2 37.000 50.000 38.000 44.000

Wnioskowanie statystyczne.

Model statystyczny, podstawowe problemy statystyki matematycznej

Statystyka matematyczna jest działem probabilistyki i podobnie jak w rachunku prawdopodobieństwa zajmuje się badaniem modeli matematycznych (probabilistycznych) pewnych zjawisk losowych. Statystyka jest ściśle związana z rachunkiem prawdopodobieństwa, jednakże jej punkt widzenia jest odmienny. W rachunku prawdopodobieństwa mamy przestrzeń probabilistyczną z jednoznacznie określonym rozkładem prawdopodobieństwa, który następnie wykorzystujemy do wyznaczania prawdopodobieństw interesujących nas zdarzeń losowych. W statystyce natomiast nie zakłada się pełnej znajomości rozkładu prawdopodobieństwa, który jest cechą statystyczną elementów badanej zbiorowości (populacji generalnej). Punktem wyjścia każdego badania statystycznego jest wylosowanie (czasem przeprowadzenie pewnych doświadczeń) z całej populacji pewnej skończonej (czasami losowej) liczby n elementów i zbadanie ich ze względu na określoną cechę (zmienną losową) X. Zawsze zakładamy, że o X posiadamy pewną wiedzę a priori, tzn. że prawdziwy rozkład prawdopodobieństwa P zmiennej losowej X należy do pewnej klasy rozkładów prawdopodobieństwa P. W wyniku zaobserwowania n realizacji 0x01 graphic
cechy X chcemy uściślić naszą wiedzę o P.

Przykład. Przedmiotem badania jest symetria pewnej monety. Dokonujemy n rzutów w wyniku, których otrzymujemy k (0 k n) orłów. Jeżeli oznaczymy przez X losową liczbę orłów uzyskanych w n niezależnych rzutach, to

0x01 graphic
,

gdzie p(0,1) jest (nieznanym) prawdopodobieństwem wypadnięcia orła w jednym rzucie. Przykładowe pytania jakie możemy stawiać to : "ile wynosi p?" i "czy moneta jest symetryczna (czy p=0.5)?". Pierwsze pytanie jest pytaniem o ocenę wartości nieznanego parametru rozkładu prawdopodobieństwa badanej cewchy. Ta część wnioskowania statystycznego, która zajmuje się odpowiedziami na tego rodzaju pytania nosi nazwe teorii estymacji. Drugie pytanie jest przykładowym problemem weryfikacji (badania prawdziwości) hipotez statystycznych.

Dowolne dwie n-elementowe próbki z tej samej populacji są na ogół różne. Zatem wnioskowanie statystyczne, oparte na częściowej informacji, dostarcza jedynie wniosków wiarygodnych - a nie absolutnie prawdziwych. Wygodnie jest zatem próbkę, tzn. ciąg liczbowy 0x01 graphic
traktować jako realizację pewnego ciągu zmiennych losowych 0x01 graphic
, gdzie 0x01 graphic
, jest zmienną losową o zbiorze wartości i-tego spośród n wylosowanych elementów.

Model statystyczny.

Punktem wyjścia w naszych rozważaniach będzie zawsze pewien element losowy X (zmienna losowa, skończony lub nieskończony ciąg zmiennych losowych) odpowiadający wynikowi eksperymentu czy obserwacji, który będziemy nazywali próbą. Zbiór wartości X elementu losowego X nazywamy przestrzenią próby. W dalszym ciągu będziemy zakładali, że X jest pewnym skończonym lub nieskończonym zbiorem przeliczalnym, albo pewnym obszarem w przestrzeni 0x01 graphic
. Niech P = 0x01 graphic
będzie rodziną rozkładów prawdo­podobieństwa na przestrzeni prób X , indeksowaną pewnym parametrem . Dokładniej, P jest rodziną rozkładów prawdopodobieństwa na odpowiednim -ciele zdarzeń losowych. Jednakże przy naszym założeniu o przestrzeni prób X, będzie to -ciało wszystkich podzbiorów albo -ciało podzbiorów borelowskich, dlatego też nie będziemy tego specjalnie podkreślali. Zauważmy, że dopóki nic nie zakładamy o zbiorze indeksów , to parametryzacja rodziny rozkładów P odbywa się bez straty ogólności, ponieważ jako parametr rozkładu PP można przyjąć sam rozkład P. Zawsze będziemy zakładali, że rozkłady są identyfikowalne, tzn. dla 0x01 graphic
mamy 0x01 graphic
.

Definicja. Parę 0x01 graphic
nazywamy przestrzenią statystyczną, a każde odwzorowanie 0x01 graphic
k-wymiarową statystyką.

Jeżeli X = 0x01 graphic
, gdzie 0x01 graphic
jest ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie prawdopodobieństwa 0x01 graphic
na X, to próbę tę nazywamy prostą próbą losową o liczności n, a odpowiadająca jej przestrzeń statystyczna jest przestrzenią produktową 0x01 graphic
.

Przykład. Skonstruujmy przestrzeń statystyczną dla eksperymentu, w którym dokonujemy n niezależnych rzutów monetą. Wynik pojedynczego rzutu jest zmienną losową o rozkładzie dwupunktowym. Złóżmy, że prawdopodobieństwo orła w pojedynczym rzucie jest równe (0,1). Zdefiniujmy zmienną losową opisującą wynik i-tego rzutu, 1 i n:

0x01 graphic

Wówczas X = {0,1}, a 0x01 graphic
. Przestrzeń statystyczna jest przestrzenią produktową 0x01 graphic
.

Możliwy jest także inny sposób zdefiniowania przestrzeni statystycznej, całkowicie równoważny wyżej opisanemu, gdzie przestrzeń prób X jest zbiorem wszystkich zero-jedynkowych ciągów n-wyrazowych 0x01 graphic
, a prawdopodobieństwo

0x01 graphic
.

Przykład. Dokonujemy n niezależnych pomiarów pewnej wielkości . Każdy pomiar jest obarczony błędem losowym , który jest zmienną losową o rozkładzie normalnym N(0,). Skonstruować przestrzeń statystyczną.

Jest oczywistym, że wynik i-tego pomiaru 0x01 graphic
ma rozkład normalny N(,). Zatem mamy do czynienia z przestrzenią statystyczną :

0x01 graphic
,

lub inaczej

0x01 graphic
.

W dalszym ciągu będziemy zakładali, że mamy do czynienia z prostą próbą losową o liczności n, tzn. z ciągiem niezależnych zmiennych losowych 0x01 graphic
o jednako­wym rozkładzie prawdopodobieństwa 0x01 graphic
i dystrybuancie F.

Dystrybuanta empiryczna i jej własności.

W rozdziale poświęconym statystyce opisowej wprowadziliśmy pojęcie dystrybuanty empirycznej dla próbki. Uogólnimy to pojęcie na przypadek, gdy mamy próbę losową. Wówczas dystrybuanta empiryczna jest staystyką, czyli zmienną losową, zdefiniowaną następująco:

0x01 graphic

Dla każdego ustalonego x0x01 graphic
, zmienne losowe 0x01 graphic
są niezależne i mają jednakowy rozkład Bernoulliego b(1,F(x)). Korzystając z własności rozkładu Bernoulliego oraz stosując do ciągu 0x01 graphic
mocne prawo wielkich liczb oraz centralne twierdzenie graniczne otrzymujemy następujące własności:

dla dowolnego x0x01 graphic

0x01 graphic
,

0x01 graphic
,

0x01 graphic
dla każdego t0x01 graphic
, gdzie oznacza dystrybuantę standardowego rozkładu normalnego.

Można powiedzieć, że własności te wyjaśniają sens w jakim próba losowa 0x01 graphic
odtwarza rozkład, z którego pochodzi. Na zakończenie podamy bez dowodu klasyczne już twierdzenie Gliwienki - Cantelliego mówiące o jednostajnej zbieżności dystrybuanty empirycznej do dystrybuanty teoretycznej.

Twierdzenie Gliwienki - Cantelliego. Jeżeli próba losowa 0x01 graphic
pochodzi z rozkładu o dystrybuancie F, to

0x01 graphic
.

Statystyka 0x01 graphic
nosi nazwę statystyki Kołmogorowa. Twierdzenie Gliwienki - Cantelliego mówi, że 0x01 graphic
z prawdopodobieństwem 1 przy 0x01 graphic
.

Statystyki dostateczne.

Podstawowym problemem statystyki matematycznej jest stwierdzenie na podstawie zaobserwowanej próby, który rozkład z rodziny rozkładów 0x01 graphic
jest rozkładem właściwym, tzn. jaka jest prawdziwa wartość parametru . Ponieważ nośnikiem informacji o jest próba powstaje pytanie czy wszystkie informacje zawarte w próbie są istotne i czy nie jest możliwe ich zredukowanie. Okazuje się, że odpowiedź na to pytanie jest twierdząca. Wprowadzimy za chwilę jedno z fundamentalnych pojęć w statystyce - pojęcie dostateczności. Najpierw przykład ilustrujący ten problem.

Przykład. Rozważmy ponownie eksperyment polegający na n-krotnym rzucie monetą. Jeżeli jest prawdopodobieństwem orła, to jak to pokazaliśmy wcześniej rozkład prawdopodobieństwa na przestrzeni próby ma postać

0x01 graphic
.

Niech T oznacza statystykę równą liczbie orłów w próbie, tzn.

0x01 graphic

Rozkład tej statystyki jest dobrze znanym rozkładem dwumianowym:

0x01 graphic
, gdzie t = 0,1,...,n.

Nietrudno sprawdzić, że rozkład warukowy próby pod warunkiem T = t nie zależy od 0x01 graphic

Fakt ten można zinterpretować w następujący sposób: gdy wiemy, że T = t, to informacja o tym, który z 0x01 graphic
punktów przestrzeni próby faktycznie się zrealizował, nie wnosi żadnej informacji o parametrze . Innymi słowy liczba sukcesów w schemacie Bernoulliego niesie pełną informację o wartości prawdopodobieństwa sukcesu niezależnie od tego w jakiej kolejności te sukcesy się pojawiały. Można zatem powiedzieć, że T jest statystyką dostateczną dla parametru .

Definicja. Statystyka T nazywa się statystyką dostateczną dla rodziny rozkładów P (statystyką dostateczną dla ), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy 0x01 graphic
nie zależy od .

Przykład. Jeżeli 0x01 graphic
jest próbą losową, to dla każdego zdarzenia losowego A oraz dla każdego punktu 0x01 graphic
z przestrzeni próby mamy

0x01 graphic
.

Ponieważ to prawdopodobieństwo nie zależy od , to próba jest zawsze statystyką dostateczną.

Prosty sposób rozpoznawania, czy dana staystyka jest statystyką dostateczną daje następujące kryterium faktoryzacyjne.

Twierdzenie. Statystyka T jest dostateczna wtedy i tylko wtedy, gdy gęstość rozkładu prawdopodobieństwa próby 0x01 graphic
można przedstawić w postaci

0x01 graphic
,

gdzie funkcja h nie zależy od , a funkcja 0x01 graphic
, zależna od , zależy od 0x01 graphic
tylko przez wartość statystyki T.

Dowód. (Przypadek rozkładów dyskretnych).

() Przypuśćmy, że statystyka T jest dostateczna. Zatem 0x01 graphic
nie zależy od . Ponieważ dla 0x01 graphic
mamy 0x01 graphic
, to

0x01 graphic
.

Tym samym otrzymujemy

0x01 graphic
,

czyli dowodzoną faktoryzację.

() Załóżmy, że faktoryzacja jest prawdziwa. Ustalmy x oraz t. Dla 0x01 graphic
mamy 0x01 graphic
, co nie zależy od . Niech 0x01 graphic
. Wtedy

0x01 graphic

co również nie zależy od .

Przykład. Niech 0x01 graphic
będzie prostą próbą losową z rozkładu 0x01 graphic
.

a) Niech 0x01 graphic
będzie rozkładem Bernoulliego, =(0,1). Wówczas

0x01 graphic
.

przyjmując 0x01 graphic
, 0x01 graphic
oraz 0x01 graphic
stwierdzamy, że liczba sukcesów w schemacie Bernoulliego jest statystyką dostateczną.

b) Niech 0x01 graphic
będzie rozkładem normalnym, 0x01 graphic
. Gęstość próby

0x01 graphic

Zatem 0x01 graphic
jest statystyką dostateczną.

c) Niech 0x01 graphic
będzie rozkładem jednostajnym na przedziale (0,), 0x01 graphic
. Wówczas gęstość próby można przedstawić w postaci

0x01 graphic

Zatem na mocy kryterium faktoryzacji statystyka 0x01 graphic
jest statystyką dostateczną dla rodziny rozkładów jednostajnych U(0,), 0x01 graphic
.

Każda statystyka dostateczna tworzy pewne rozbicie przestrzeni prób, generowane przez jej warstwice. Niech S i T będą dwiema różnymi statystykami. Jeżli rozbicia generowane przez te statystyki są identyczne (tzn. -ciała generowane przez nie są identyczne 0x01 graphic
), to nazywamy je statystykami równoważnymi. Oczywiście, jeżeli 0x01 graphic
, to istnieje taka funkcja h, że 0x01 graphic
. Naturalnym jest pytanie o to, czy dla danej rodziny rozkładów istnieje taka statystyka dostateczna, która generuje "najgrubsze" rozbicie przesrzeni prób (największa kompresja danych bez straty informacji o rodzinie rozkładów). Odpowiedź na to pytanie jest pozytywna.

Definicja. Statystykę dostateczną S nazywamy minimalną statystyką dostateczną, jeżeli dla każdej statystyki dostatecznej T istnieje taka funkcja h, że 0x01 graphic
, tzn. 0x01 graphic
.

Dowód istnienia minimalnej statystyki dostatecznej pomijamy, ponieważ wymaga wprowadzenia bardziej zaawansowanego aparatu matematycznego. Zajmiemy się teraz problemem konstruowania minimalnych statystyk dostatecznych. Oto jeden ze sposobów. Jeżeli T jest statystyką dostateczną a S minimalną statystyką dostateczną, to na mocy kryterium faktoryzacyjnego dla dowolnych punktów x i 0x01 graphic
przestrzeni prób iloraz

0x01 graphic

nie zależy od parametru wtedy i tylko wtedy, gdy punkty te należą do tej samej warstwicy statystyki T. Z definicji minimalnej statystyki dostatecznej wynika, że generuje ona najgrubsze rozbicie przestrzeni prób o tej własności, ponieważ 0x01 graphic
implikuje 0x01 graphic
. Udowodniliśmy zatem następujące twierdzenie.

Twierdzenie. Statystyka S jest minimalną statystyką dostateczną jeżeli dla dowolnych punktów x i 0x01 graphic
przestrzeni prób 0x01 graphic
wtedy i tylko wtedy, gdy iloraz 0x01 graphic
nie zależy od .

Od razu możemy zauważyć, że wszystkie statystyki dostateczne rozważane w poprzednim przykładzie są minimalnymi statystykami dostatecznymi.

Niech 0x01 graphic
będzie uporządkowaną próbą 0x01 graphic
.

Definicja. k-tą statystyką pozycyjną (porządkową) 0x01 graphic
, nazywamy k-tą co do wielkości wartość 0x01 graphic
w próbie 0x01 graphic
, ciąg statystyk pozycyjnych 0x01 graphic
nazywamy wektorem statystyk pozycyjnych (porządkowych).

Nietrudno zauważyć, że jeżeli 0x01 graphic
jest prostą próbą losową z dowolnej rodziny rozkładów 0x01 graphic
, to ciąg statystyk pozycyjnych zawsze jest statystyką dostateczną.

Przykład. Rozważmy rodzinę rozkładów logistycznych { L(a,b) : 0x01 graphic
} o gęstościach

0x01 graphic

Iloraz gęstości dla dwóch różnych prób losowych

0x01 graphic

nie zależy od parametrów a i b wtedy i tylko wtedy, gdy punkty 0x01 graphic
oraz 0x01 graphic
różnią się jedynie uporządkowaniem, co dowodzi iż dla rodziny rozkładów logistycznych wektor statystyk porządkowych jest minimalną statystyką dostateczną.

Podobnie można pokazać, że statystyka porządkowa jest minimalną statystyką dostateczną dla rodziny { C(a,b) : 0x01 graphic
} rozkładów Cauchy'ego o gęstościach:

0x01 graphic

Statystyki swobodne i zupełne.

Definicja. Statystykę 0x01 graphic
nazywamy statystyką swobodną (swobodną pierwszego rzędu) jeżeli jej rozkład (wartość oczekiwana 0x01 graphic
) nie zależy od .

Definicja. Mówimy, że rodzina rozkładów 0x01 graphic
pewnego elementu losowego X jest zupełna, jeżeli prawdziwy jest następujący warunek:

0x01 graphic

Statystyka T jest zupełna, jeżeli rodzina jej rozkładów jest zupełna.

Innymi słowy można powiedzieć, że dla statystyki zupełnej jedynymi funkcjami tej statystyki o wartościach oczekiwanych niezależnych od parametru są funkcje stałe. Zatem można przypuszczać, że maksymalna redukcja danych bez straty informacji zawartej w próbie o parametrze rozkladu następuje wówczas, gdy statystyka dostateczna jest zupełna. Nie można wówczas podać żadnej (różnej od stałej) funkcji zupełnej statystyki dostatecznej, której wartość oczekiwana byłaby niezależna od . Obrazowo mówiąc z zupełnej statystyki dostatecznej nie można już "wycisnąć" żadnych zbędnych informacji.

Twierdzenie. Jeżeli T jest statystyką dostateczną zupełną, to jest minimalną statystyką dostateczną.

Dowód. Pomijamy problem istnienia minimalnej statystyki dostatecznej. Niech S będzie minimalną statystyką dostateczną. Pokażemy, że T i S są równoważne. Z definicji minimalnej dostateczności istnieje taka funkcja h, że S= h(T). Wystarczy zatem pokazć istnienie takiej funkcji g, że T=g(S). Z definicji warunkowej wartości oczekiwanej mamy 0x01 graphic
, czyli 0x01 graphic
. Wyrażenie 0x01 graphic
jest funkcją statystyki T ponieważ S=h(T). Z zupełności T otrzumujemy zatem, że 0x01 graphic
prawie wszędzie 0x01 graphic
, czyli istnieje taka funkcja g, że T=g(S).

Pozostaje do rozstrzygnięcia jeszcze jedno pytanie - czy każda minimalna statystyka dostateczna jest zupełna? Odpowiedż na to pytanie jest negatywna. Oznacza to, że w pewnych sytuacjach z minimalnej statystyki dostatecznej można "wycisnąć" coś co nie zależy od .

Przykład. Rozważmy rodzinę rozkładów Cauchyego {C(,1), R1}. Dla tej rodziny rozkładów wektor statystyk porządkowych 0x01 graphic
jest minimalną statystyką dostateczną. Jednakże z uwagi na fakt, że jest parametrem położenia to różnica 0x01 graphic
ma rozkład niezależny od , a więc jest różną od stałej statystyką swobodną. Tym samym statystyka porządkowa nie jest zupełna.

Rodziny wykładnicze rozkładów.

Rozważmy rodzinę rozkładów prawdopodobieństwa 0x01 graphic
. Przez 0x01 graphic
oznaczmy funkcję gęstości rozkładu 0x01 graphic
w przypadku, gdy jest to rozkład typu ciągłego lub funkcję prawdopodobieństwa dla rozkładu dyskretnego.

Definicja. Rodzinę rozkładów prawdopodobieństwa 0x01 graphic
nazywamy rodziną wykładniczą, jeżeli dla każdego 0x01 graphic
gęstość (funkcja prawdopodobieństwa) 0x01 graphic
ma postać

0x01 graphic

gdzie 0x01 graphic
są funkcjami liniowo niezależnymi oraz

0x01 graphic

jest pewnym k-wymiarowym zbiorem w Rk.

Przykład. a). Rodzina rozkładów Bernoulliego 0x01 graphic
jest wykładnicza. Istotnie, funkcję prawdopodobieństwa możemy zapisać jako

0x01 graphic

b). Rodzina rozkładów normalnych 0x01 graphic
jest rodziną wykładniczą, ponieważ gęstość prawdopodobieństwa można przedstawić w postaci

0x01 graphic

Bez straty ogólności możemy założyć, że rozkłady z rodziny wykładniczej mają naturalną parametryzację

0x01 graphic

gdzie jest pewnym k-wymiarowym zbiorem w Rk.

Twierdzenie. Jeżeli 0x01 graphic
, Rk jest wykładniczą rodziną rozkładów, dla której

0x01 graphic

to 0x01 graphic
jest statystyką dostateczną zupełną.

Z ostatniego twierdzenia oraz z własności funkcji wykładniczej wynika natychmiast następujące twierdzenie.

Twierdzenie. Jeżeli 0x01 graphic
jest prostą próbą losową z rozkładu 0x01 graphic
należącego do wykładniczej rodziny rozkładów 0x01 graphic
, to

0x01 graphic

jest minimalną, zupełną statystyką dostateczną.

Twierdzenie to w prosty sposób pozwala wyznaczać minimalne, zupełne statystyki dostateczne dla wykładniczych rodzin rozkładów.

Przykład. a) Dla próby losowej z rozkładu Bernoulliego z rodziny 0x01 graphic
mamy

0x01 graphic

Zatem statystyka

0x01 graphic

jest minimalną, zupełną statystyką dostateczną.

b) Podobnie dla próby losowej z rozkładu normalnego z rodziny 0x01 graphic
minimalną, zupełną statystyką dostateczną jest

0x01 graphic
0x01 graphic

ponieważ gęstość próby jest równa

0x01 graphic

c) Niech 0x01 graphic
będzie prostą próbą losową z rozkładu gamma z rodziny 0x01 graphic
, wówczas

0x01 graphic

Zatem statystyka

0x01 graphic

jest minimalną, zupełną statystyką dostateczną dla próby z rozkładu gamma.

Estymacja punktowa - sformułowanie problemu.

Niech cecha X ma rozkład prawdopodobieństwa 0x01 graphic
z pewnej rodziny rozkładów 0x01 graphic
, gdzie jest nieznanym parametrem. Naszym zadaniem jest wskazanie tego rozkładu, tzn. oszacowanie nieznanej wartości parametru . Niech 0x01 graphic
będzie prostą próbą losową z rozkładu 0x01 graphic
. Jak wiadomo z własności dystrybuanty empirycznej próba losowa wraz ze wzrostem liczby obserwacji coraz lepiej przybliża nieznany rozkład. Zatem jedyne co możemy zrobić, to znaleźć oszcowanie parametru na podstawie zaobserwowanych wartości próby losowej. Zadanie to można sformułować nieco uogólniej jako zadanie szacowania wartości pewnej funkcji g od parametru . W dalszym ciągu będziemy rozważali jedynie przypadek, gdy funkcja g jest funkcją rzeczywistą o wartościach w 0x01 graphic
, 0x01 graphic
.

Definicja. Każdą statystykę 0x01 graphic
służącą do oceny wartości funkcji 0x01 graphic
, nazywamy estymatorem parametru 0x01 graphic
.

Oczywiście nie wszystkie statystyki, które mogą być używane do estymacji 0x01 graphic
są jednakowo dobre. Podstawowym czynnikiem, który będzie decydował o tym czy dany estymator jest lepszy od drugiego estymatora będzie odpowiednio zdefiniowany błąd estymacji, czyli odległość estymatora od wartości estymowanej. W dalszym ciągu ograniczymy się do przypadku tzw. błędu średniokwadratowego, najczęściej używanego w teorii estymacji.

Definicja. Błędem średniokwadratowym estymatora 0x01 graphic
parametru 0x01 graphic
, nazywamy wyrażenie

0x01 graphic

W teorii estymacji błąd średniokwadratowy nosi nazwę ryzyka 0x01 graphic
estymatora 0x01 graphic
przy kwadratowej funkcji straty 0x01 graphic
. Ideałem byłoby wyznaczenie takiego estymatora, który minimalizawałby błąd średniokwadratowy jednostajnie dla wszystkich rozkładów prawdopodobieństwa z rodziny 0x01 graphic
. Niestety przy tak ogólnym sformułowaniu problemu jest to niemożliwe. Wystarczy zauważyć, że estymatory stałe, postaci 0x01 graphic
dają dla 0x01 graphic
ryzyko równe 0, także przy innej (niekoniecznie kwadratowej) funkcji straty. Problem ten można rozwiązać na przykład przez odpowiednie ograniczenie klasy rozważanych estymatorów tak, aby w nowej klasie minimum funkcji ryzyka istniało. Jest to znany zabieg jaki stosuje się w wielu problemach optymalizacyjnych. W statystyce zwykle nakłada się na estymatory wymaganie tzw. nieobciążoności.

Definicja. Estymator 0x01 graphic
parametru 0x01 graphic
nazywamy estymatorem nieobciążonym (EN) (asymptotycznie nieobciążonym), jeżeli dla każdego 0x01 graphic
mamy

0x01 graphic

Warunek ten mówi, że średnio estymator daje wartość estymowanego parametru. Oczywiście klasa estymatorów nieobciążonych nie zawiera estymatorów stałych, które z praktycznego punktu widzenia są niepotrzebne. Niestety, w pewnych przypadkach założenie nieobciążoności eliminuje także estymatory, które moglibyśmy uznać za dobre. Zwróćmy uwagę na fakt, że dla estymatora nieobciążonego jego błąd średniokwadratowy jest po prostu jego wariancją. Tym samym w klasie estymatorów nieobciążonych problem wyznaczenia estymatora, dla którego błąd średniokwadratowy jest najmniejszy jest problemem wyznaczenia estymatora o minimalnej wariancji (ENMW). Cytowane poniżej dwa twierdzenia pozwalają efektywnie wyznaczać ENMW.

Twierdzenie Rao-Blackwella. Niech T będzie statystyką dostateczną dla rodziny 0x01 graphic
rozkładów prawdopodobieństwa na przestrzeni próby X i niech 0x01 graphic
będzie dowolnym nieobciążonym estymatorem pewnego parametru 0x01 graphic
. Wówczas 0x01 graphic
jest również estymatorem nieobciążonym, a jego wariancja jest jednostajnie nie większa od wariancji estymatora 0x01 graphic
, tzn. 0x01 graphic
.

Dowód. Nieobciążońość estymatora 0x01 graphic
jest oczywista i wynika z własności warunkowej wartości oczekiwanej oraz nieobciążoności estymatora 0x01 graphic
. Mianowicie

0x01 graphic
.

Druga część tezy wynika z tzw. nierówności Jensena, która mówi, że dla dowolnej funkcji wypukłej h oraz dowolnej wielkości losowej X mamy 0x01 graphic
0x01 graphic
. Kładąc 0x01 graphic
oraz 0x01 graphic
otrzymujemy

0x01 graphic
0x01 graphic

Odejmując od obu stron ostatniej nierówności 0x01 graphic
dostajemy dowodzoną nierówność dla wariancji.

Załóżmy dodatkowo, iż statystyka dostateczna T jest zupełna. Wówczas z zupełności wynika, że estymator nieobciążony będący funkcją statystyki T, o którym mowa w twierdzeniu Rao-Blackwella jest jedynym estymatorem nieobciążonym 0x01 graphic
w klasie estymatorów będących funkcjami od T. Zatem jest on estymatorem nieobciążonym o minimalnej wariancji ( ENMW[0x01 graphic
] ).

Twierdzenie Lehmanna-Scheffégo. Jeżeli statystyka T jest statystyką dostateczną zupełną dla rodziny 0x01 graphic
rozkładów prawdopodobieństwa na przestrzeni próby X oraz 0x01 graphic
jest dowolnym nieobciążonym estymatorem parametru 0x01 graphic
, to 0x01 graphic
jest ENMW[0x01 graphic
].

Twierdzenie to można także sformułować w ten sposób, że jeżeli statystyka T jest dostateczną zupełną to dla dowolnej funkcji rzeczywistej g, statystyka 0x01 graphic
jest ENMW swojej wartości oczekiwanej.

Oba cytowane powyżej twierdzenia są podstawowym narzędziem przy konstrukcji estymatorów nieobciążonych o minimalnej wariancji. Wystarczy znać dowolny estymator nieobciążony oraz statystykę dostateczną zupełną. Jedyna trudność techniczna to umiejętność wyznaczenia warunkowej wartości oczekiwanej estymatora nieobciążonego pod warunkiem statystyki dostatecznej.

Przykład. a) Dla próby losowej z rozkładu Bernoulliego z rodziny 0x01 graphic
, jak to wcześniej pokazaliśmy, średnia z próby

0x01 graphic

jest minimalną, zupełną statystyką dostateczną. Jednocześnie średnia z próby zawsze jest jest estymatorem nieobciążonym wartości oczekiwanej (o ile istnieje) populacjji generalnej, ponieważ

0x01 graphic

Zatem na podstawie twierdzenia Lehmanna-Scheffégo 0x01 graphic
jest ENMW[].

b) Podobnie dla próby losowej z rozkładu normalnego z rodziny 0x01 graphic
( i nieznane) minimalną, zupełną statystyką dostateczną jest 0x01 graphic
. Zauwżmy, że dla dowolnej cechy o wartości oczekiwanej 0x01 graphic
= i odchyleniu standardowym 0x01 graphic
=, wariancja empiryczna jest nieobciążonym estymatorem wariancji tej cechy, tzn.

0x01 graphic

Tym samym na podstawie twierdzenia Lehmanna-Scheffégo 0x01 graphic
jest ENMW[] a 0x01 graphic
jest ENMW[0x01 graphic
].

c) Dla rodziny rozkładów normalnych ze znaną wartością oczekiwaną statystyką dostateczną zupełną jest

0x01 graphic

ponieważ

0x01 graphic

Nietrudno sprawdzić, że 0x01 graphic
jest nieobciążonym estymatorem wariancji a zatem jest ENMW[0x01 graphic
] dla rodziny rozkładów normalnych ze znaną wartością oczekiwaną.

W literaturze bardzo często dla estymatora ENMW używa się określenia estymator najefektywniejszy. Wiąże się to z tzw. pojęciem efektywności estymatorów nieobciążonych. Otóż okazuje się, że przy pewnych dość ogólnych założeniach o rodzinie rozkładów można wyznaczyć ograniczenie dolne na wariancję estymatorów nieobciążonych. Wówczas możliwe będzie porównanie wariancji każdego badanego estymatora z kresem dolnym wariancji estymatorów nieobciążonych. Odpowiednie pojęcia wprowadzimy jedynie dla przypadku, gdy jest parametrem liczbowym a przestrzeń parametrów 0x01 graphic
jest przedziałem na prostej.

Definicja. Wielkość

0x01 graphic

nazywamy informacją Fishera o parametrze zawartą w próbie X, gdzie 0x01 graphic
oznacza funkcję gęstości rozkładu 0x01 graphic
w przypadku, gdy jest to rozkład typu ciągłego lub funkcję prawdopodobieństwa dla rozkładu dyskretnego.

Uwaga. Jeżeli 0x01 graphic
jest prostą próbą losową to informacja Fishera zawarta w próbie

0x01 graphic

gdzie 0x01 graphic
oznacza informację Fishera zawartą w pojedynczej obserwacji.

Twierdzenie Craméra-Rao. Niech 0x01 graphic
będzie rodziną rozkładów na przestrzeni próby, parametrem liczbowym a przestrzeń parametrów 0x01 graphic
przedziałem na prostej. Jeżeli spełnione są pewne warunki regularności, to wariancja każdego estymatora nieobciążonego 0x01 graphic
parametru spełnia nierówność

0x01 graphic

przy czym równość zachodzi wtedy i tylko wtedy, gdy

0x01 graphic

wtedy 0x01 graphic

Twierdzenie. Jeżeli 0x01 graphic
jest prostą próbą losową z populacji o rozkładzie normalnym 0x01 graphic
, to

a) 0x01 graphic
ma rozkład normalny 0x01 graphic
;

b) 0x01 graphic
, ma rozkład chi-kwadrat 0x01 graphic
z (n-1) stopniami swobody, gdzie 0x01 graphic
;

c) 0x01 graphic
ma rozkład t[n-1] t-Studenta z (n-1) stopniami swobody;

d) statystyki 0x01 graphic
i 0x01 graphic
są niezależne.

Dowód. Własność a) jest oczywista i wynika stąd, że kombinacja liniowa zmiennych losowych o rozkładzie normalnym ma rozkład normalny.

b) i d). Bez straty ogólności można założyć, że =0 a =1. Istotnie

0x01 graphic

gdzie 0x01 graphic
jest prostą próbą losową z populacji o rozkładzie N(0,1). Rozważmy następujące przekształcenie ortonormalne ( 0x01 graphic
)

0x01 graphic

Zgodnie z założeniem

0x01 graphic

Ponieważ przekształcenie ortonormalne jest izometrią, to

0x01 graphic

gdzie 0x01 graphic
oznacza n-wymiarową normę euklidesową. Oczywiście 0x01 graphic
jest wektorem normalnym 0x01 graphic
. Wystarczy zauważyć, że wektor wartości oczekiwanych 0x01 graphic
a macierz kowariancyjna

0x01 graphic

Zatem zmienne losowe 0x01 graphic
, i=1,...,n są niezależne o jednakowym rozkładzie N(0,1). Macierz C została zdefiniowana w ten sposób, że

0x01 graphic

Jednocześnie mamy

0x01 graphic

Ponieważ 0x01 graphic
, to

0x01 graphic

Tym samym 0x01 graphic
, ma rozkład chi-kwadrat 0x01 graphic
i jest niezależne od 0x01 graphic
.

c) Podobnie, bez straty ogólności, możemy założyć, że =0 a =1. 0x01 graphic
jest ilorazem dwóch niezależnych zmiennych losowych, jednej o standardowym rozkładzie normalnym i drugiej będącej pierwiastkiem z ilorazu zmiennej o rozkładzie chi-kwadrat z (n-1) stopniami swobody podzielonej przez (n-1). Zatem jest to rozkład t-Studenta z (n-1) stopniami swobody.

Testy zgodności i jednorodności.

Przykład.

W połowie 1985 roku Coca Cola Bottling Company postanowiła zmienić recepturę swojego napoju. Wywołało to wiele dyskusji, niekiedy bardzo gorących, pomiędzy zwolennikami starej i nowej formuły Coca Coli. Przeprowadzono wiele różnych degustacji, bardziej lub mniej oficjalnych. Podzczas jednej z takich degustacji w McGuire's Irish Pub w Pensacola na Florydzie poddano testowi 25 osób. Każdej z tych 25 osób podano trzy różne napoje: Coca Colę zrobioną według starej receptury, Coca Colę według nowej receptury oraz Pepsi Colę. Żadna z osób uczestniczących w degustacji nie posiadała informacji o tym, który z napojów degustuje. Dwanaście osób za najlepszą wybrało Coca Colę zrobioną według starej receptury, siedmioro według nowej receptury a pozostałe sześć osób wybrało Pepsi Colę. Tylko troje spośród uczestników degustacji bezbłędnie rozpoznało wszystkie trzy napoje. Czy rezultaty tego testu są wystarczającym dowodem na to, że stara receptura jest najlepsza? Czy jest to jedynie wynik przypadkowego wyboru preferowanego napoju przez uczestników testu?

Problem, który został przedstawiony w przykładzie jest szczególnym przypadkiem zadania badania zgodności rozkładu cechy z pewnym założonym rozkładem teoretycznym. Niech 0x01 graphic
będzie prostą próbą losową z rozkładu prawdopodobieństwa o dystrybuancie 0x01 graphic
. Testy statystyczne służące do weryfikowania hipotezy zerowej

0x01 graphic

gdzie 0x01 graphic
jest pewną znaną dystrybuantą, nazywamy testami zgodności. Testy zgodności są testami nieparametrycznymi. W chwili obecnej jest bardzo wiele różnych testów pozwalających badać zgodność rozkładów o ciągłej dystrybuancie. W przypadku rozkładów typu dyskretnego zwykle używa się najpopularniejszego testu zgodności, testu 0x01 graphic
-Pearsona, który może być stosowany dla dowolnych rozkładów. Wadą tego testu jest to, iż wymaga on prób o dużej liczności. W przypadku, gdy badana cecha



Wyszukiwarka

Podobne podstrony:
STATYSTYKA OPISOWA '
1 Statystyka opisowa Wprowadze Nieznany (2)
Gorgol I Elementy statystyki opisowej
egzamin ze statystyki, Statystyka opisowa
ROZDZIAŁ 4, Statystyka opisowa
Parametry stosowane w statystyce opisowej, Płyta farmacja Bydgoszcz, statystyka, pozostałe
STATYSTYKA OPISOWA 6 11 2010
Statystyka opisowa wykład interpretacje
1 2 statystyka opisowaid 10222 Nieznany
Przykłady do rozwiązania - tablica korelacyjna, Informatyka i Ekonometria SGGW, Semestr 2, Statystyk
WZORY(1), UEP lata 2014-2019, Statystyka opisowa
Statystyka [25 stron], Statystyka opisowa

więcej podobnych podstron