Statystyki dostateczne.
Podstawowym problemem statystyki matematycznej jest stwierdzenie na podstawie zaobserwowanej próby, który rozkład z rodziny rozkładów {p0,O<E ©} jest rozkładem właściwym, tzn. jaka jest prawdziwa wartość parametru 9. Ponieważ nośnikiem informacji o 0 jest próba powstaje pytanie czy wszystkie informacje zawarte w próbie są istotne i czy nie jest możliwe ich zredukowanie. Okazuje się, że odpowiedź na to pytanie jest twierdząca. Wprowadzimy za chwilę jedno z fundamentalnych pojęć w statystyce - pojęcie dostateczności. Najpierw przykład ilustrujący ten problem.
Przykład. Rozważmy ponownie eksperyment polegający na n-krotnym rzucie monetą. Jeżeli 0 jest prawdopodobieństwem orła, to jak to pokazaliśmy wcześniej rozkład prawdopodobieństwa na przestrzeni próby ma postać
Pe{xx = xi,x2 = x2,...,Xn = xn)=e?=*i{1-0J-& ■
Niech T oznacza statystykę równą liczbie orłów w próbie, tzn.
T=t,Xr 1 = 1
Rozkład tej statystyki jest dobrze znanym rozkładem dwumianowym: pg{T = t}=^jo'(1-0)""', gdzie t = 0,1 ,...,n.
Nietrudno sprawdzić, że rozkład warukowy próby pod warunkiem T = tnie
zależy od 0P*{X, = *PX2 = *2,...,X„ = *J7 = r}=j( J’ gdy %Xi = t
[O, wp.p.
Fakt ten można zinterpretować w następujący sposób: gdy wiemy, że T = t, to informacja o tym, który z ” punktów przestrzeni próby faktycznie
się zrealizował, nie wnosi żadnej informacji o parametrze 0. Innymi słowy liczba sukcesów w schemacie Bernoulliego niesie pełną informację o wartości prawdopodobieństwa sukcesu 0 niezależnie od tego w jakiej kolejności te sukcesy się pojawiały. Można zatem powiedzieć, że T jest statystyką dostateczną dla parametru 0.
Definicja. Statystyka T nazywa się statystyką dostateczną dla rodziny rozkładów P (statystyką dostateczną dla 0), jeżeli dla każdej wartości ttej statystyki rozkład warunkowy P{-ir = /} nie zależy od 0.
Przykład. Jeżeli XrX2,...,Xn jest próbą losową, to dla każdego zdarzenia losowego A oraz dla każdego punktu (xl,x2,K ,xn) z przestrzeni próby mamy
doc3ity.com