Lub „ Stawiamy hipotezę zerową głoszącą, że różnica pomiędzy parametrami θ a jego oceną T jest statycznie nieistotna ( jest na poziomie zerowym ) - stąd jej nazwa „hipoteza zerowa”
H1 - hipoteza alternatywna (dla każdej hipotezy zerowej określa się hipotezę alternatywną) w postaci
lub
lub
Dwie ostatnie postaci hipotezy alternatywnej określa się jako hipotezy jednostronne.
Postawioną hipotezę zerową weryfikuje się za pomocą odpowiedniego sprawdzianu zwanego testem, który określa się jako zmienną losową w postaci :
wyznaczającą różnicę, dla której następnie buduje się obszar krytyczny odrzuceń hipotezy zerowej na podstawie wartośći krytycznej
dla danego poziomu istotności α.
TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI
Model I
Badana cecha w populacji ma rozkład normalny N(μ,σ), przy czym σ jest znane. Na podstawie n-elementowej próby zeryfikować hipotezę zerową:
jest konkretną hipotetyczną wartością średniej, wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący :
Na podstawie wyników z próby oblicza się
- wartość średnią
- wartość zmiennej standaryzowanej u wg wzoru:
2. Z tabeli rozkładu normalnego standaryzowanego N(0,1) , dla założonego poziomu istotności αwyznacza się wartość krytyczną
taką by zachodziło:
Obszar krytyczny testu określany jest zależnością
tzn. że gdyż próby otrzymamy taką wartość u , że zachodzi
to hipotezę zerową H0 odrzucamy. W przypadku przeciwnym , gdy zachodzi
nie ma podstaw do odrzucenia H0
Uwaga: Powyższy test jest testem z dwustronnym obszarem krytycznym i stosuje się do tylko dla dwustronnej hipotezy alternatywnej
Przypadek 1
Hipoteza alternatywna H1ma postać :
W tym przypadku stosuje się test z lewostronnym obszarem krytycznym określonym nierównością
przy czym uα wyznacza się z tab. rozkładu normalnego standaryzowanego w taki sposób by była spełniona zależność:
Hipotezę zerową odrzuca się, jeśli wyznaczona z próby wartość zmiennej u spełnia nierówność:
Przypadek 2
Hipoteza alternatywna ma postać
W tym przypadku stosuje się test z prawostronnym obszarem krytycznym, określonym nierównością :
przy czym wartość uα wyznacza się z tab. rozkładu normalnego standaryzowanego w taki sposób by była spełniona zależność:
Hipotezę zerową odrzuca się, jeśli wyznaczona z próby wartość zmiennej u spełnia nierówność:
Model II
Badana cecha w populacji generalnej ma rozkład normalny N(μ,σ), przy czym odchylenie standardowe w populacji σ jest nieznane. W oparciu o wyniki małej n-elementowej próby zweryfikować hipotezę zerową :
μ0 - konkretna hipotetyczna wartość średniej, wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący;
1. Na podstawie wyników z próby oblicza się
- wartość średnią
- odchylenie standardowe s
- wartość statystyki - zmiennej t wg wzoru:
, ktorą przy prawidłowości hipotezy zerowej ma rozkład t-studenta o n-1 stopniach swobody
2. Z tablic t-studenta, dla ustalonego poziomu
istotności α i dla n-1 stopni swobody odczytuje się taką wartość tα, by zachodziło:
Obszar krytyczny testu określony jest zależnością:
tzn. że gdy z próby otrzymamy taką wartość t , e zachodzi:
to hipotezę zerową H0 odrzucamy. W przypadku przeciwnym, gdy zachodzi:
nie ma podstaw do odrzucenia H0
Model III
Badana cecha w populacji generalnej ma rozkład normalny N(μ,σ) lub dowolny inny, o średniej μ i skończonej i niezależnej wariancji σ. Na podstawie wyników n-elementowej próby zweryfikować hipotezę zerową:
gdzie μ0 - konkretna hipotetyczna wartość średniej, wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący:
1. Na podstawie wyników z próby oblicza się
- wartość średnią
- odchylenie standardowe s
- wartość zmiennej standaryzowanej u wg wzoru:
2. Z tabeli rozkładu normalnego standaryzowanego N(0,1) , dla założonego poziomu istotności αwyznacza się wartość krytyczną
taką by zachodziło:
Obszar krytyczny testu określany jest zależnością
tzn. że gdy z próby otrzymamy taką wartość u , że zachodzi:
to hipotezę zerową H0 odrzucamy. Przy
nie ma podstaw do odrzucenia hipotezy.
TEST DLA RÓWNOŚCI ŚREDNICH DWÓCH POPULACJI
W zastosowaniach praktycznych często zachodzi potrzeba sprawdzenia hipotez dotyczących równości wartości średnich w dwóch populacjach. W zależności od tego jak duży materiał doświadczalny
Jest w dyspozycji stosuje się jeden z trzech modeli.
Model I
Badamy dwie populacje generalne wktorych analizowane parametry mają rozkłady normalne N(μ1 , σ1) , N(μ2 , σ2), przy czym znane sa odchylenia standardowe w tych populacjach σ1,σ2. W oparciu o wyniki dwu niezależnych prób o liczebnościach odpowiednio n1 , n2 należy sprwadzić słuszność hipotezy zerowej
wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący:
. Na podstawie wyników z próby oblicza się
- wartość średnią
- wartość zmiennej standaryzowanej u wg. wzoru
która przy prawdziwości hipotezy zerowej ma rozkład normalny standaryzowany N(0,1)
Model II
Badamy dwie populacje generalne w który analizowane parametry mają rozkłady normalne N(μ1 , σ1) , N(μ2 , σ2), przy czym odchylenie standardowe w obu populacjach σ1,σ2 są nieznane ale jednakowe σ1=σ2. W oparciu o wyniku dwu niezależnych małych prób o liczebnościach odpowiednio n1 , n2 należy sprawdzić słuszność hipotezy zerowej
wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący:
. Na podstawie wyników z próby oblicza się
- wartość średnią
- wariacje s1 , s2
- wartość statystyki - zmiennej t wg. wzoru:
która przy prawdziwości hipotezy zerowej ma rozkład t-studenta o (n1+n2-2)stopniach swobody.
Model III
Badamy dwie populacje generalne w który analizowane parametry mają rozkłady normalne N(μ1 , σ1) , N(μ2 , σ2), lub inne o skończonych wariancjach
które są nieznane.
W oparciu o wyniki dwu niezależnych prób o liczebnościach odpowiednio n1 , n2 należy sprawdzić słuszność hipotezy zerowej
wobec hipotezy alternatywnej (dwustronnej)
Test dla hipotezy zerowej jest następujący:
. Na podstawie wyników z próby oblicza się
- wartość średnią
- wariancje
- wartość zmiennej standaryzowanej u wg wzoru
która przy prawdziwości hipotezy zerowej ma rozkład normalny standaryzowany N(0,1)
TEST DLA WARIANCJI POPULACJI
W praktyce duża wariancja jest niekorzystna, gdyż oznacza dużą niejednorodność analizowanej cechy, dlatego też przy weryfikacji hipotez dotyczących wariancji przyjmuje się jako hipotezę alternatywną z obszarem krytycznym prawostronnym.
Model
Badana cecha w populacji generalnej ma rozkład normalny N(μ,σ)przy czym paramtery μ i σ są nieznane. Na podstawie n-elementowej próby zweryfikować hipotezę zerową:
gdzie
jest konkretną, hipotetyczną wartością wariacji, wobec hipotezy alternatywnej (prawostronnej)
Test dla hipotezy zerowej
1.Na podstawie wyników z próby
- wariację z próby s2
- wartość zmiennej (statystyki )
wg. wzoru:
która przy prawdziwości hipotezy zerowej ma rozkład X2 o (n-1) stopniach swobody
2. Z tablic rozkładu X2 dla założonego poziomu istotność α i (n-10 stopniach swobody wyznacza się wartość krytyczną
taką by zachodziło:
Nierówność
określa prawostronny obszar krytyczny odrzuceń tzn. gdy jest spełniona należny odrzucić hipotezę zerową H0 na rzecz hipotezy alternatywnej H1
TEST DLA RÓWNOŚCI WARIANCJI W DWÓCH POPULACJACH
Model
Rozpatrujemy dwie populacje w których badana cecha ma odpowiednio rozkład normalny N(μ1 , σ1) , N(μ2 , σ2),przy czym parametry tych rozkładów są nieznane. W oparciu o wyniki dwu niezależnych prób o liczebnościach odpowiednio n1,n2 należy sprawdzić słuszność hipotezy zerowej.
wobec hipotezy alternatywnej(dwustronnej)
Test dl hipotezy zerowej jest następujący:
1.Na podstawie wyników z próby
- wariancje z prób
, przy czym
- wartość zmiennej (statystyki) F wg. wzoru
który ma rozkład F-snedecora z(n1-1,n2-2)stopniami swobody
2. Z tablic rozkładu F-snedecora dla założonego
poziomu istotności α odczytuje się wartośc krytyczną Fα, taką by zachodziło:
Nierówność
określa prawostronny obszar krytyczny teście tzn
Dla
-odrzucamy hipotezę zerową H0 na rzecz hipotezy alternatywnej.
Dla
przyjmujemy hipotezę zerową H0
NIEPARAMETRYCZNE TESTY ISTOTNOŚĆI
Dotyczą postaci rozkładów tzn. weryfikuje się hipotezę o postaci funkcyjnej rozkładu populacji generalnej.
Warunki przeprowadzenia testów nieparametrycznych:
liczebność próby duża
próba jest losowa
poziom istotności jest niemniejszy niż 0.1
W celu zweryfikowania hipotezy o postaci rozkładu empirycznego uzyskanego z próby z rozkładem teoretycznym( hipotetycznym)
Model
Populacja generalna ma dowolny rozkład o dystrybuancie należącej do pewnego zbioru Ω rozkładów o określonym typie postaci funkcyjnej dystrybuanty. Z populacji tej wylosowano dużą próbę (n>30), której wyniki podzielono na r rozłącznych klas o liczebnościach ni, w każdej klasie
Otrzymano w ten sposób tzw. szereg rozdzielczy.
Na podstawie wyników z tej próby, należy sprawdzić hipotezę zerową H0, że populacja generalna ma rozkład typu Ω, tzn.:
Gdzie F(x) jest dystrybuantą rozkładu populacji.
Test zgodności
Wprowadzamy charakterystykę, będącą miarą odległości między dystrybuantą rozkładu empirycznego a dystrybuantą rozkładu hipotetycznego.
ni- liczebność empiryczna i-tego przedziału klasowego (nie powinna być <10)
r- liczba przedziałów klasowych
pi- prawdopodobieństwo( częstość empiryczna) odpowiadające wartości badanej cechy w tej klasie
Statystyka
ma przy założeniu prawdziwości H0 i przy
rozkładu
o r stopniach swobody lub o ( r-k-1) stopniach swobody, gdy na podstawie próby oszacowano k parametrów.
Utworzony szereg rozdzielczy jest rozkładem empirycznym.
Jako rozkład teoretyczny najczęściej przyjmuje się :
- rozkład dwumianowy(Bernoulliego)
- rozkład POISSONA
- rozkład normalny
Obliczoną statystykę
należy porownać z wartością krytyczną
odczytaną z tablic rozkładu chi-kwadrat, przy ustalonym poziomie istotności α i określonej liczbie stopni swobody.
Obszar krytyczny w tym teście buduje się prawostronnie, tzn. tak aby spełniona była relacja:
Jeśli zachodzi
to H0należy odrzucić (gdyż różnica między rozkładem empirycznym a hipotetycznym, jest statystycznie istotna)
Metody analizy współzależności
Typy zależności :
- funkcjonalna - zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę drugiej zmiennej (jednej zmiennej X odpowiada tylko jedna wartość drugiej zmiennej Y), np. pole kwadratu
- stochastyczna - ze zmianą jednej zmiennej zmienia się rozkład prawdopodobieństwa drugiej zmiennej.
Zależność korelacyjna : szczególny przypadek zależności stochastycznej. Polega na tym, że określonym wartościom jednej zmiennej odpowiadają ściśle określone średnie wartości drugiej zmiennej.
X,Y - wartości badanych zmiennych:
- korelacja liniowa dodatnia
- korelacja liniowa ujemna
- korelacja krzywoliniowa
- brak korelacji
KOWARIANCJA
Współczynnik korelacji liniowej Pearsona, jest wyznaczany poprzez standaryzację kowariancji
s(x), s(y) - odchylenie standardowe zmiennych x,y
Kowariancja :
Cov(x,y)=0 brak zależnośći korelacyjnej
Cov(x,y)<= ujemna zależność korelacyjna
Cov(x,y)> dodatnia zależność korelacyjna
Analiza regresji
Oszacowanie funkcji regresji
ui składnik resztowy określany jako
Szacowanie parametrów funkcji regresji MNK (metodą najmniejszych kwadratów)
To wyrażenie jest funkcją dwóch zmiennych a0 i a1, a zatem należy znaleźć minimum funkcji kwadratowej dwóch zmiennych.
WK ekstremum
Zarowanie się pochodnych cząstkowych
Jeśli przyrównamy pochodne do zera to po przekształceniach i uproszczeniu