76
4. Podstawowe pojęcia statystyki
Podobnie jak dla momentów, istnieje empiryczny odpowiednik dystrybuan-ty, zwanej dalej dystrybuantą teoretyczną. Niech (X1 ,X2,... ,X„) będzie próbą prostą. Dystrybuanta empiryczna jest funkcją określoną wzorem:
Fn(x) = -\{i (4.2.1)
n
gdzie \A\ oznacza liczbę elementów skończonego zbioru A. Ponieważ wszystkie Xi = Xi(co) są funkcjami określonymi na przestrzeni zdarzeń elementarnych Q, to dystrybuanta empiryczna Fn(x) jest zmienną losową dla każdego ustalonego a. Jeżeli natomiast ustalimy zdarzenie elementarne co, to F„(a) jest funkcją zmiennej rzeczywistej, która spełnia wszystkie warunki na to, aby być dystrybuantą, to znaczy warunki wymienione w twierdzeniu 2.1.2. Przy takim ujęciu, F„(a) jest przedziałami stała i ma skoki o wartości 1 jn w punktach
Xi ~ X;(0)).
Dystrybuanta empiryczna jest statystycznym przybliżeniem dystrybuanty teoretycznej i ma zbliżony do niej kształt, choć na rysunkach jest to na ogół trudno zauważalne. Natomiast przy obliczeniach komputerowych dystrybuanta empiryczna jest łatwa do wykorzystania, gdyż jej obliczenie sprowadza się do posortowania (rosnąco) danych empirycznych. Niech (X[,X2,... ,Xfn) będzie właśnie taką próbą losową, powstałą z (XI,X2,... ,Xrt) przez rosnące jej posortowanie.
Kwantyle Mając dane już posortowane, łatwo można wyznaczyć kwantyle empiryczne,
a w szczególności medianę empiryczną. Kwantylem empirycznym rzędu p nazywamy statystykę
gdy np jest liczbą całkowitą, gdy np nie jest liczbą całkowitą.
(4.2.2)
Kwantyl empiryczny rzędu p — 1/2 nazywa się medianą empiryczną. Ze względu na symetrię, medianę empiryczną definiuje się niekiedy wzorem
X('rt+1y2 gdy n jest nieparzyste,
{Xn/2 +x\+nli) /2 gdy n Jest parzyste.
(4.2.3)
We wszystkich przypadkach [np] jest częścią całkowitą liczby np. Kwantyle empiryczne rzędu 0.25, 0.5 i 0.75 nazywa się kwartylami empirycznymi i oznacza symbolami odpowiednio Qx, Q0 i Qy Oczywiście Q2 — Me.