Rozkład tej statystyki jest dobrze znanym rozkładem dwumianowym: P0{T =f} = f V(l —6?)"', gdzie t = 0,1.....n.
Nietrudno sprawdzić, że rozkład warukowy próby pod warunkiem T = t nie zależy od 9
gdy
wp.p.
n
Fakt ten można zinterpretować w następujący sposób: gdy wiemy, że T = t, to informacja
o tym, który z punktów przestrzeni próby faktycznie się zrealizował, nie wnosi żadnej
informacji o parametrze 0. Innymi słowy liczba sukcesów w schemacie Bemoulliego niesie pełną informację o wartości prawdopodobieństwa sukcesu 0 niezależnie od tego w jakiej kolejności te sukcesy się pojawiały. Można zatem powiedzieć, że T jest statystyką dostateczną dla parametru 0.
Definicja. Statystyka T nazywa się statystyką dostateczną dla rodziny rozkładów P (statystyką dostateczną dla 0), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy P{ -| T =f} nie zależy od 0.
Przykład. Jeżeli XltX2,... ,Xn jest próbą losową, to dla każdego zdarzenia losowego A oraz dla każdego punktu (x,,x2,K ,a^) z przestrzeni próby mamy
Ponieważ to prawdopodobieństwo nie zależy od 0, to próba jest zawsze statystyką dostateczną.
Prosty sposób rozpoznawania, czy dana staystyka jest statystyką dostateczną daje następujące kryterium faktoryzacyjne.
Twierdzenie. Statystyka T jest dostateczna wtedy i tylko wtedy, gdy gęstość rozkładu prawdopodobieństwa próby X,,X2,K , X„ można przedstawić w postaci f0(.xl,x2,...,xn) = ge(T(xl,x2,...,xn))h(xl>x2,...,xn), gdzie funkcja h nie zależy od 0, a funkcja gzależna od 0, zależy od (xlfx2,.••»*„) tylko przez wartość statystyki T.
Dowód. (Przypadek rozkładów dyskretnych).
{=>) Przypuśćmy, że statystyka T jest dostateczna. Zatem P0{X = x\ T = f} = /i(x,f) nie zależy od 0. Ponieważ dla xe T-,(r) mamy {X =x}cz{T =r}, to
Tym samym otrzymujemy
P,{X=x) = M*,t)P,|T=t}.
czyli dowodzoną faktoryzację.
(<=) Załóżmy, że faktoryzacja jest prawdziwa. Ustalmy x oraz t. Dla x€ET_l(f) mamy Ptf(X = x | T = f) = 0, co nie zależy od 0. Niech \g T-,(f). Wtedy