226 Wybrane procedury statystyczno
226 Wybrane procedury statystyczno
poniżej dwa przykłady: ó
> # przedział ufności można różnorodnie wyznaczać,
> mean(daneO$VEGF)
[1] 2626.608
> boot.cKwynikBoot, conf = 0.95)
B00TSTRAP CONFIDENCE INTERVAL CALCULATIONS Based on 999 bootstrap replicates
CALL :
boot.ci(boot.out >= wynikBoot, conf « 0.95)
Intervals :
Level Normał Basic
957. (1941, 3346 ) (1886, 3276 )
Level Percentile BCa
957. (1977, 3367 ) (2067, 3545 )
Calculations and Intervals on Original Scalę Some BCa intervals may be unstable
W powyższym przykładzie przedziały ufności dla wartości oceny średniej wyznaczane są funkcją boot.ci(boot). Funkcja ta wyznacza przedziały ufności na bazie ocen średnich na replikacjach, korzystając z różnych algorytmów, m.in. licząc kwantylc empiryczne, przybliżając statystykę testową rozkładem normalnym itp. Jak widzimy na tym przykładzie różne algorytmy prowadzą do różnych ocen przedziału ufności.
Jeżeli chcemy generować obserwacje korzystając z metody bootstrapu parametrycznego, to w funkcji boot(boot) należy za argument ran.gen wskazać funkcję generującą nowe replikacje. Poniżej przedstawiamy przykład parametrycznego wywołania funkcji bootO.
Histogram of t
Rysunek 3.39: Wynik wywołania funkcji plot.boot(boot)
Bootstrap
227
> tt funkcja wyznaczająca statystykę (tu ocenę średniej)
> VEGF.stat <- function(data) {
+ mean(data)
* >
i
> # funkcja do generowania replikacji z rozkładu o zadanych parametrach ? VEGF.sim <- functionCdata, mle) -{
+ rnorm(length(data), mean = mleCl], sd - mle[2])
> # oceniamy parametry rozkładu na podstawie próby oryginalnej
> VEGF.mle <- c(mean(daneO$VEGF), sd(daneO$VEGF))
> # generujemy replikacje bootstrapem parametrycznym
> bootParametryczny <- boot(daneO$VEGF, atatistic « VEGF.stat, R • 999,
+ sim = "parametric", ran.gen = VEGF.sim, mle = VEGF.mle)
> # graficznie wyznaczamy rozkład estymatora oceny średniej
> plot(bootParametryczny)
> # i oceniamy przedział ufności dla tego estymatora
> boot.cl(bootParametryczny, type = "perć", conf = 0.95)
B00TSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates CALL :
boot.ci(boot.out = bootParametryczny, conf - 0.95, type * "perć")
Intervals :
Level Percentile 957, (1902, 3410 )
Calculations and Intervals on Original Scalę
W poprzednim podrozdziale szacowaliśmy rozkład estymatora, aby oceniać jego właściwości (w przedstawionych przykładach był to estymator średniej). Metodę bootstrap możemy też wykorzystać, by oceniać rozkład statystyki testowej a następnie użyć oszacowanego rozkładu w zagadnieniu testowania.
Niech interesująca nas hipoteza dotyczy wartości średniej dla cechy VEGF ze zbioru danych daneO. Chcemy ocenić czy ta średnia różui się istotnie od wartości 3000. A więc hipoteza zerowa, którą stawiamy jest postaci:
Ho : px — 3000.
Rozkład zmiennej VEGF jest daleki od rozkładu normalnego, pomimo to do testowania chcemy wykorzystać statystykę testową
T{X) =
X - 3000 ox
Gdyby zmienna VEGF miała rozkład normalny to statystyka testowa T(X) miałaby rozkład t-Studenta i do testowania moglibyśmy wykorzystać kwantyle tego rozkładu. W naszym przypadku rozkład statystyki T(X) jest nieznany, ale możemy go oszacować metodą bootstrap. badając rozkład wartości statystyki dla replikacji
T(X')
- X °x-