26
3.1 Podstawowe pojęcia
zamiast „w pełni poprawnego”
*!,X2, |
~ ■ |
(3.5) | |
Definicja 3.2. Niech Xi,X?,... |
F. Funkcję | ||
F(x) = i " fal |
l(X,<x) |
(3.6) |
nazywamy dystrybuantą empiryczną.
Czasami stosujemy zapis Fn(x) celem podkreślenia, że dystrybuanta empiryczna została skonstruowana w oparciu o n obserwacji. Dystrybuantę empiryczną traktujemy jako empiryczny, „obserwowałny” odpowiednik nieznanej dla nas dystrybuanty F(x), która „odpowiada” za zgromadzone przez nas dane. Dystrybuanta empiryczna ma pewne swoiste własności, które wynikają bezpośrednio ze wzoru (3.6) - jest ona funkcją schodkową, niemalejącą od wartości 0 do 1, a jej punkty nieciągłości pojawiają się tam, gdzie obserwacje X\, X?,..., Xn. Przykład 3.3. Załóżmy, że zgromadzono następujące dane o wynikach studentów z egzaminu ze statystyki (w skali od 0 do 10): 0, 2, 7, 8, 7, 10, S, 2. Stwórz dla nich dystrybuantę empiryczną.
Twierdzenie 3.4 (Gliwienki - Cantellego). Jeżeli X\, X?,..., Xn ~ F, to
sup \Ł(x)
*€R T
gdzie zbieżność następuje pra\ti<
nlimP(|£(x)-f(x)|
(3.7)
dla każdego e > 0 zachodzi
(3.8)
Twierdzenie to oznacza, że wrak ze zwiększaniem się wielkości próbki (liczby obserwacji), możemy poznać (przybliżyć) nieznany nam rozkład prawdopodobieństwa w „mechanizmie losowym” z dowolną zadaną przez nas dokładnością.
Dowiedziemy powyższe twierdzenie w trochę słabszej wersji, tzn. bez tezy, że odpowiednia zbieżność zachodzi jednostajnie.
Twierdzenie 3.5. Jeżeli X’i,X2,.. .,Xn ~ F, to
(3.9)
Dowód. Dla ustalonego x zmienne losowe 1 (Xi < x) , 1 (X2 < x),... są nieza^ leżne i mają jednakowy, dwupunktowy rozkład. Przyjmują bowiem albo wartość 1 z prawdopodobieństwem F(x), albo wartość 0 z prawdopodobieństwem 1 — F{x). Ponadto, dla dowolnego m
E 1 (Xm < x) = 1 • Pr (1 (Xm < x) = 1) = F(x) . (3.10)
Wtedy bezpośrednio z Mocnego prawa wielkich liczb (patrz twierdzenie 5.2) otrzymujemy tezę, gdyż dla ustalonego x
F„ (x) = i 1 (X, < x) E 1 (Xm < x) = F(x) . (3.11)
□