Ilustracja związku
Ilustracja związku
dystrybuanty
dystrybuanty
teoretycznej z
teoretycznej z
empiryczną
empiryczną
Opis zadania
Opis zadania
Dla dystrybuanty
Dla dystrybuanty
F(x)
F(x)
,
,
która ma dobrze określoną
która ma dobrze określoną
funkcję odwrotną
funkcję odwrotną
:
:
losujemy niezależnie liczby
losujemy niezależnie liczby
u
u
1
1
, u
, u
2
2
, . . . , u
, . . . , u
n
n
z
z
rozkładu jednostajnego
rozkładu jednostajnego
U
U
[0, 1];
[0, 1];
przekształcamy
przekształcamy
x
x
k
k
= F
= F
−1
−1
(u
(u
k
k
)
)
dla
dla
k = 1, 2, . . . , n
k = 1, 2, . . . , n
;
;
przez
przez
S
S
n
n
(x)
(x)
oznaczamy ilość tych elementów ciągu
oznaczamy ilość tych elementów ciągu
x
x
1
1
,
,
x
x
2
2
,
,
...
...
, x
, x
n
n
,
,
których wartość
których wartość
jest mniejsza niż
jest mniejsza niż
x.
x.
nazywamy dystrybuantą empiryczną.
nazywamy dystrybuantą empiryczną.
Dla kilku konkretnych przykładów dystrybuant
Dla kilku konkretnych przykładów dystrybuant
F
F
oraz dla kilku rzędów parametru
oraz dla kilku rzędów parametru
n
n
porównać (m.in.
porównać (m.in.
graficznie) otrzymaną dystrybuantę empiryczną
graficznie) otrzymaną dystrybuantę empiryczną
F
F
n
n
(x)
(x)
z dystrybuantą teoretyczną
z dystrybuantą teoretyczną
F(x)
F(x)
.
.
n
x
S
x
F
n
n
Dystrybuanta empiryczna
Dystrybuanta empiryczna
a PWL
a PWL
•
Zauważamy, że
Zauważamy, że
S
S
n
n
oznacza ilość sukcesów w
oznacza ilość sukcesów w
n
n
próbach
próbach
Bernoulliego, gdzie sukces w
Bernoulliego, gdzie sukces w
i
i
-tej próbie to zdarzenie
-tej próbie to zdarzenie
{X
{X
i
i
< x}
< x}
, a
, a
p=F(x)
p=F(x)
•
Zatem
Zatem
S
S
n
n
ma rozkład Bernoulliego z parametrami
ma rozkład Bernoulliego z parametrami
n
n
i
i
p=F(x)
p=F(x)
•
Możemy zastosować tw. Borela, z którego wynika:
Możemy zastosować tw. Borela, z którego wynika:
•
Co oznacza, że dla odpowiednio dużego
Co oznacza, że dla odpowiednio dużego
n
n
F
F
n
n
(x)≈F(x),
(x)≈F(x),
czyli dystrybuanta empiryczna jest przybliżeniem
czyli dystrybuanta empiryczna jest przybliżeniem
dystrybuanty teoretycznej
dystrybuanty teoretycznej
)
(
)
,...
,
;
(
)
,...
,
;
(
.
,
x
F
p
n
X
X
X
x
S
X
X
X
x
F
pr
z
n
n
n
n
n
1
2
1
2
1
Rozkład wykładniczy
Rozkład wykładniczy
x
e
x
F
2
3
1
)
(
n=5
Błąd średniokwadratowy: 0,0210044
Największe odchylenie: 0,324
Rozkład wykładniczy
Rozkład wykładniczy
x
e
x
F
2
3
1
)
(
n=20
Błąd średniokwadratowy: 0,00193983
Największe odchylenie: 0,1799
Rozkład wykładniczy
Rozkład wykładniczy
x
e
x
F
2
3
1
)
(
n=100
Błąd średniokwadratowy: 0,000781755
Największe odchylenie: 0,0281
Rozkład wykładniczy
Rozkład wykładniczy
x
e
x
F
2
3
1
)
(
n=1000
Błąd średniokwadratowy: 1,6035 · 10
-7
Największe odchylenie: 0,0006999997
Rozkład Cauchy’ego
Rozkład Cauchy’ego
n=5
Błąd średniokwadratowy: 0,00684262
Największe odchylenie: 0,0965
x
x
F
arctg
1
2
1
)
(
Rozkład Cauchy’ego
Rozkład Cauchy’ego
x
x
F
arctg
1
2
1
)
(
n=20
Błąd średniokwadratowy: 7,5326 · 10
-5
Największe odchylenie: 0,0381
Rozkład Cauchy’ego
Rozkład Cauchy’ego
n=50
Błąd średniokwadratowy: 0,000646874
Największe odchylenie: 0,0256
x
x
F
arctg
1
2
1
)
(
Rozkład Cauchy’ego
Rozkład Cauchy’ego
n=100
Błąd średniokwadratowy: 1,43857 · 10
-5
Największe odchylenie: 0,0038
x
x
F
arctg
1
2
1
)
(
Rozkład Cauchy’ego
Rozkład Cauchy’ego
n=1000
Błąd średniokwadratowy: 1,59877 · 10
-7
Największe odchylenie: 0,0003999
x
x
F
arctg
1
2
1
)
(
Rozkład arcsin
Rozkład arcsin
x
x
F
arcsin
1
2
1
)
(
n=5
Błąd średniokwadratowy: 0,00706723
Największe odchylenie: 0,1878
1
;
1
x
Rozkład arcsin
Rozkład arcsin
x
x
F
arcsin
1
2
1
)
(
n=20
Błąd średniokwadratowy: 0,000405924
Największe odchylenie: 0,0442997
1
;
1
x
Rozkład arcsin
Rozkład arcsin
x
x
F
arcsin
1
2
1
)
(
n=100
Błąd średniokwadratowy: 0,000122224
Największe odchylenie: 0,0110998
1
;
1
x
Rozkład arcsin
Rozkład arcsin
x
x
F
arcsin
1
2
1
)
(
n=500
Błąd średniokwadratowy: 2,54179 · 10
-7
Największe odchylenie: 0,0014028
1
;
1
x
Rozkład arcsin
Rozkład arcsin
x
x
F
arcsin
1
2
1
)
(
n=2000
Błąd średniokwadratowy: 8,76349 · 10
-8
Największe odchylenie: 0,000296098
1
;
1
x
Rozkład Pareto z param. 2
Rozkład Pareto z param. 2
2
1
1
1
)
(
x
x
F
n=5
Błąd średniokwadratowy: 0,0285624
Największe odchylenie: 0,1733
;
0
x
Rozkład Pareto z param. 2
Rozkład Pareto z param. 2
2
1
1
1
)
(
x
x
F
n=20
Błąd średniokwadratowy: 0,00223757
Największe odchylenie: 0,0477
;
0
x
Rozkład Pareto z param. 2
Rozkład Pareto z param. 2
2
1
1
1
)
(
x
x
F
n=100
Błąd średniokwadratowy: 0,000619006
Największe odchylenie: 0,0249999
;
0
x
Rozkład Pareto z param. 2
Rozkład Pareto z param. 2
2
1
1
1
)
(
x
x
F
n=500
Błąd średniokwadratowy: 4,75187 · 10
-5
Największe odchylenie: 0,00690007
;
0
x
Rozkład Pareto z param. 2
Rozkład Pareto z param. 2
2
1
1
1
)
(
x
x
F
n=2000
Błąd średniokwadratowy: 4,00494 · 10
-8
Największe odchylenie: 0,000400007
;
0
x
Rozkład kwadratowy
Rozkład kwadratowy
2
)
(
x
x
F
n=5
Błąd średniokwadratowy: 0,0262666
Największe odchylenie: 0,183
1
;
0
x
Rozkład kwadratowy
Rozkład kwadratowy
2
)
(
x
x
F
n=20
Błąd średniokwadratowy: 0,00031811
Największe odchylenie: 0,0185
1
;
0
x
Rozkład kwadratowy
Rozkład kwadratowy
2
)
(
x
x
F
n=100
Błąd średniokwadratowy: 2,99292 · 10
-6
Największe odchylenie: 0,0173001
1
;
0
x
Rozkład kwadratowy
Rozkład kwadratowy
2
)
(
x
x
F
n=1000
Błąd średniokwadratowy: 4,57001 · 10
-9
Największe odchylenie: 0,0021
1
;
0
x
Wnioski:
Wnioski:
Gdy liczba prób o rozkładzie,
którego dystrybuanta wynosi F(x),
dąży do nieskończoności to
dystrybuanta empiryczna tych prób
dąży do dystrybuanty teoretycznej
Niektóre dystrybuanty empiryczne
dążą szybciej do odpowiadającym
im dystrybuant teoretycznych.
Przy odpowiedniej liczbie prób
możemy rozpoznać jakiego typu jest
przybliżana dystrybuanta
Dziękujemy za
Dziękujemy za
uwagę!
uwagę!