Wnioskowanie statystyczne - słowniczek podstawowych pojęć
Wnioskowanie statystyczne to zbiór metod i procesów logicznych pozwalających na formułowanie sądów odnośnie do pewnych właściwości zbiorowości bez konieczności jej pełnego badania. Owe właściwości zbiorowości nazywamy parametrami. Zamiast badać całą zbiorowość generalną (populację), przeprowadzane jest badanie częściowe losowo dobranej próby. Próba to dowolny podzespół pobrany z populacji, zaś losowość związana jest z zapewnieniem przypadkowości jej doboru. Próba jest losowa, gdy każdy element populacji może się w niej znaleźć z jednakowym prawdopodobieństwem.
Ponieważ formułowane osądy bazują na badaniu niepełnym, stąd też w każdym przypadku przyjęty przez nas osąd obarczony być może błędem. Prawdopodobieństwo popełnienia tego błędu ustalane jest zawsze na niskim poziomie.
Estymacja przedziałowa to szacowanie interesującego nas parametru za pomocą przedziału ufności. Przedział ufności to taki przedział, który z zadanym prawdopodobieństwem (
), zwanym poziomem ufności, pokrywa nieznaną wartość szacowanego parametru (np. średnią arytmetyczną, wariancję, wskaźnik struktury). Oznacza to zgodę na to, iż z prawdopodobieństwem równym
rzeczywisty parametr znajdzie się poza oszacowanym przedziałem ufności. Przedział ufności jest szacowany w oparciu o estymator, tzn. wartość, która, wedle naszej wiedzy, jest najbliższa szacowanemu parametrowi. Jest to wielkość pochodząca z próby, odpowiadająca danemu parametrowi. Stanowi ona bowiem punktowe oszacowanie (punktową estymację) wartości parametru. Estymatorem np. dla średniej arytmetycznej dla zbiorowości generalnej jest średnia arytmetyczna z próby, zaś dla wskaźnika struktury dla populacji - wskaźnik struktury z próby. Wyróżniamy dwa rodzaje estymatorów - obciążone i nieobciążone. W przypadku estymatora nieobciążonego średnia arytmetyczna, obliczona na podstawie wartości estymatorów pochodzących z prób, zbliża się systematycznie do rzeczywistej wartości parametru dla całej zbiorowości wraz ze wzrostem liczby prób. Inaczej mówiąc, mamy do czynienia z estymatorem nieobciążonym, gdy średnia z estymatorów zbliża się do wartości szacowanego parametru w miarę zwiększania się liczby prób. Powyższe twierdzenie nie jest prawdziwe w przypadku estymatora obciążonego.
Rozpiętość przedziału ufności to różnica pomiędzy maksymalną a minimalną wartością wchodzącą w skład przedziału ufności, zaś połowa owej długości to maksymalny błąd szacunku, określający o ile się maksymalnie, przy danym poziomie ufności, pomylimy, przyjmując jako wartość szacowanego parametru dla całej zbiorowości wartość estymatora, czyli wartość pochodzącą z próby. Wspomniany maksymalny błąd oszacowania zależny jest również od wielkości próby - im próba jest większa, tym przy innych stałych warunkach, ów błąd jest mniejszy. Innym czynnikiem, od którego zależy rozpiętość przedziału ufności, jest poziom ufności - im jest on wyższy, tym, chcąc mieć większe prawdopodobieństwo pokrycia przedziałem szacowanego parametru, rozpiętość większa.
Weryfikacja hipotezy statystycznej to sprawdzenie, czy w świetle posiadanej wiedzy, pochodzącej z badania niepełnego, przyjąć można pewien osąd dotyczący wartości danego parametru (danych parametrów) w całej zbiorowości. Hipoteza statystyczna bowiem to każdy osąd o zbiorowości generalnej, wydany bez przeprowadzania badania pełnego. Hipoteza zerowa (
) to hipoteza o wartości parametru zbiorowości. Hipotezę tę, zawsze mającą w sobie stwierdzenie o tym, iż parametr jest równy jakiejś wartości, traktujemy jako prawdopodobnie prawdziwą, dopóki nie uzyskamy informacji dostatecznych do zmiany naszej opinii. Hipoteza alternatywna (
) z kolei to hipoteza będąca zaprzeczeniem hipotezy zerowej. Jesteśmy ją skłonni przyjąć, gdy odrzucamy
.
Poziom istotności
to prawdopodobieństwo odrzucenia
, mimo iż jest ona prawdziwa (przyjmuje wartości bliskie zeru - 0,01; 0,02; 0,05).
przyjmuje tak niskie wartości, gdyż sprawdzamy prawdziwość hipotezy zerowej, co pociąga za sobą konieczność jak najmniejszego prawdopodobieństwa omyłkowego odrzucenia tej hipotezy.
Test statystyczny to reguła postępowania pozwalająca na zweryfikowanie prawdziwości
. Jego rdzeniem jest sprawdzian (statystyka) testu (czyli statystyka z próby), którego wartość jest wykorzystywana do przyjęcia lub odrzucenia hipotezy zerowej. Sprawdzian ów bazuje zawsze na estymatorze szacowanego parametru. Wybór konkretnego sprawdzianu zależy od wielkości próby i osądu sformułowanego w
. Wartość testu porównujemy ze zbiorami wartości dopuszczalnych i niedopuszczalnych, wyznaczonych z wykorzystaniem odpowiednich tablic statystycznych przy danym poziomie istotności
. Tablice te określają wartości krytyczne, rozdzielające oba wspomniane zbiory.
Szczególna rola we wnioskowaniu statystycznym przypada rozkładowi normalnemu, tj. rozkładowi Gaussa. Jest to rozkład charakteryzujący się symetrią, który można jednoznacznie zidentyfikować na podstawie znajomości jego średniej arytmetycznej (μ) oraz odchylenia standardowego (σ). Estymatorami tych parametrów są odpowiednio średnia arytmetyczna z próby (
) oraz odchylenie standardowe z próby (
). Ważność tego rozkładu wynika przede wszystkim z centralnego twierdzenia granicznego, głoszącego, iż rozkład średnich z n-elementowych, losowo dobranych prób dąży do rozkładu normalnego, niezależnie od tego, jaki był rozkład zmiennej w populacji. Tym samym procedura statystyczna dla weryfikowania hipotez o wartości średniej i szacowania przedziału ufności dla średniej opracowana dla rozkładu normalnego może być stosowana w zasadzie w każdym przypadku.