POPULACJA zbiorowość statystyczna, tzw zbiór dowolnych elementów nieidentycznych z punktu widzenia badanej cechy/cech. Może posiadać nieskończenie wiele bądź skończenie elementów.
PRÓBA część populacji (podzbiór), podlegający bezpośrednio badaniu ze względu na ustaloną cechę, w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w populacji. Ma zawsze skończoną liczbę elementów.
--- n>30 duża próba---
--- n<30 mała próba---
PRÓBA REPREZENTATYWNA to próba, której struktura pod względem badanej cechy nie różni się istotnie od struktury populacji. Jest ona `miniaturą' populacji, daje więc podstawę do wysuwania prawidłowych wniosków o danej populacji.
Aby próba była reprezentatywna powinna być:
---losowa --- dostatecznie liczna
ROZKŁAD TEORETYCZNY I EMPIRYCZNY
--- R. teoretyczny - rozkład cechy w populacji
--- R. empiryczny - rozkład cechy w próbie
HIPOTEZA ZEROWA I ALTERNATYWNA
H0 - wyróżniona hipoteza, którą weryfikujemy. Zawsze zakłada iż hipoteza zerowa jest prawdziwa. Np.: H0 - średnia wydajność krowy wynosi 6000kg. H0:u= 6000kg
HA - tak zwana hipoteza dopuszczalna - odrzucenie hipotezy zerowej równa się przyjęciem hipotezy alternatywnej Np.:
H1:u# 6000kg, (hipoteza dwustronna)
H2:u> 6000kg, H3:u<6000kg. (hipoteza jednostronna)
BŁĄD I i II RODZAJU. POZIOM ISTOTNOŚCI
Sytuacja |
Przyjąć H0 |
Odrzucić H0 |
H0 prawdziwa |
Właściwa |
Błąd I rodzaju |
H0 fałszywa |
Błąd II rodzaju |
Właściwa |
α - poziom istotności testu - dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (odrzucenie H0)
MODELE LINIOWE
Test t-Studenta na grup niezależnych:
Xij=u+t+Eij
Gdzie:
---Xij - obserwacja
---µ- średnia populacji
---t - efekt czynnika doświadczalnego
---Eij - błąd losowy
Test t-Studenta dla par skorelowanych:
Xij =µ+t+βj+Eij
Gdzie:
---Xij - obserwacja
---µ- średnia populacji
---t - efekt czynnika doświadczalnego
---βj - efekt wspólny dla obu obserwacji w obrębie pary
---Eij - błąd losowy
Jednoczynnikowa analiza wariancji:
Xij=µ+ti+Eij
Gdzie:
--- Xij - l. obserwacji w tej grupie
--- µ - średnia populacji
--- Ti - efekt czynnika doświadczalnego
---Eij - błąd losowy
I = 1,t (t - liczba grup)
J = 1, ri (ri - liczba obserwacji w tej gr.)
Dwunczynnikowa analiza wariancji:
Xij=µ+αi+βj+(αβ)ij+Eijk
Gdzie:
---Xijk - obserwacja
--- µ - średnia populacji
--- αi - efekt czynnika A
--- βi - efekt czynnika B
--- (αβ)ij - efekt interakcji między A i B
--- Eijk - błąd losowy
EFEKTY PROSTE I EFEKT GŁOWNY CZYNNIKA. ZWIĄZEK EFEKTÓW PROSTYCH Z INTERAKCJĄ
Efekty proste
Czynnik |
A |
||
B |
Poziom |
A1 |
A2 |
|
B1 |
a1b1 |
a2b1 |
|
B2 |
a1b2 |
a2b2 |
---efekty proste dla czynnika A
(a2-a1):a2b1-a1b1 i a2b2 - a1b2
---efekty proste dla czynnika B
(b2-b1): a1b2-a1-b1 i a2b2-a2-b1
--- efekty główne
A=0,5[(a2b2+a2+b1)-(a1b2+a1b1)]
B=0,5[(a2b2+a1b2)-(a2b1+a1b1)]
Jeśli efekty proste czynników różnią się znacznie (o więcej niż można uznać za różnice przypadkowe) to mówimy, że między czynnikami występuje interakcja (określa w jakim stopniu wpływ czynnika pierwszego zależy od poziomów drugiego czynnika.)
CO TO JEST INTERAKCJA? Z JAKIM UKŁADEM DOŚWIADCZENIA JEST ZWIĄZANA?
Interakcja związana jest z dwuczynnikową analizą wariancji. Określa w jakim stopniu czynniki są od siebie zależne. Jeśli wpływ ten nie zmienia się to nie występuje interakcja. Gdy wpływ pierwszego czynnika zależy od poziomu czynnika drugiego, zachodzi interakcja między tymi czynnikami.
RÓWNANIE PROSTEJ REGRESJI. INTERPRETACJA WSPÓŁCZYNNIKA REGRESJI JEŚLI: byx=1,5 i cecha x= dł.ciałą węża, y= masa ciała:
Jeśli długość ciała węża (X) wzrośnie o jedną jednostkę to masa ciała (Y) wzrośnie o 1,5.
WSPÓŁCZYNNIK KORELACJI I JEGO WŁASNOŚCI. CO TO JEST KORELACJA ZUPEŁNA?
Współczynnik korelacji jest to miara związku liniowego między cechami X i Y (r)
Korelacja zupełna występuje wtedy gdy: |r| = 1
Własności:
--- r jest liczbą bez miana
--- -1≤r≤1
--- jeśli r=0 to między cechami nie występuje zależność liniowa
--- jeśli r>0 to wraz ze wzrostem wartości jednej cechy wzrastają wartości 2 (funkcja rosnąca)
--- jeśli r<0..--.. maleją wartości 2 (funkcja malejąca)
TESTY NIEPARAMETRYCZNE. KIEDY JE STOSUJEMY? JAKIE MAJĄ ZALETY?
----Mają zastosowanie tam, gdzie nie są spełnione założenia wymagane dla testów parametrycznych
---- oparte na porównaniu rozkładów cech, a nie określonych parametrów charakteryzujących te układy
---- można stosować do wszystkich cech, których wartości można uporządkować
---- nie wymagają żadnych założeń dotyczących rozkładu cechy
---- proste i łatwe w użyciu
----są słabsze - za ich pomocą znacznie trudniej jest odrzucić H0, czyli łatwiej popełnić błąd II rodzaju, dlatego wymagają prób o większej liczebności
BADANA CECHA NIE MA ROZKŁADU NORMALNEGO. JAKIE TESTY NIEPARAMETRYCZNE MOŻNA ZASTOSOWAC JAKO ALTERNATYWĘ DLA TESTU t-STUDENTA? OPISAĆ JEDEN.
--- test Wilcoxona-Manna-Whitneya
--- test U Manna-Whitneya
--- test serii Walda-Wolfwitza
--- test Kołmogorowa-Smirnowa
test Wilcoxona-Manna-Whitneya:
H0:µa=µb, HA:µa≠µb
1 uszeregować wszystkie obserwacje rosnąco (łącznie wyniki w grupie A i B)
2 przypisać rangi uporządkowanym obserwacjom
3 podsumować rangi obserwacji dla grupy A (jako TA) i dla grupy B (jako TB)
4 przyjąć wartość testu: T=min (TA, TB)
5 zweryfikować H0 (jeśli wartość obliczona statystyki testowej T znajduje się w obszarze krytycznym testu (T<Tα) to obrzucić H0
TESTY NIEPARAMETRYCZNE DLA PAR SKORELOWANYCH
--- test znaków --- test Wilcoxona --- test McNemary (gdy zmienne są skategoryzowane)
Test Wilcoxona opiera się na różnicach w parach i ich rangach
H0: brak istniejących różnic w parach
HA: różnice w parach istotne
1 obliczenie różnic wartości w parach
2 uporządkowanie różnic i przypisanie im rang (ignorując znak różnicy)
3 podsumowywanie rang różnic dodatnich (T+) i ujemnych (T-)
4 wartość testu Wicoxona: T= {nie} (T+, T-)
5 weryfikacja H0 (porównanie T z odpowiednią wartością krytyczną (Tα) i jeśli T<Tα to odrzucamy H0