Miniskrypt: który test wybrać?
1. Dane: odsetek osobników z badaną cechą (dane z policzenia)
Badane osobniki są podzielone na grupy (skala nominalna) według badanej cechy, np. z pasożytami/bez pasożytów, samce/samice, futro jasne/ciemne/łaciate. Nasze dane to liczba osobników w każdej grupie.
Uwaga - możemy jednocześnie klasyfikować osobniki według dwóch różnych cech, np. chore/zdrowe i samce/samice.
grupy |
pytanie |
test |
H0 |
przykład |
2 i więcej |
Czy istnieją różnice między grupami |
test chi kwadrat |
różnic brak |
Wśród 25 kosów odłowionych w Parku Łazienkowskim w było 10 (40%) samców, natomiast w Parku Skaryszewskim samce stanowiły 62,5% (25) spośród 40 złowionych ptaków. Czy proporcja płci jest różna w tych dwóch parkach? |
2 i więcej |
Czy otrzymane proporcje są zgodne z rozkładem teoretycznym |
test chi kwadrat |
brak różnic z rozkładem teoret. |
Skrzyżowano 100 heteozygotycznych myszy i otrzymano 21 osobników białych, 26 czarnych i 53 łaciate. Sprawdź, czy dziedziczenie barwy sierści jest zgodne z prawami Mendla. |
|
|
|
|
|
|
|
|
|
|
2. Dane: mała próba, pomiar w skali interwałowej
Jeśli dysponujemy małą próbą (kilka-kilkanaście pomiarów) i policzyliśmy dla niej średnią, możemy na tej podstawie wnioskować o badanej cesze w całej populacji. Liczymy wtedy przedział ufności dla średniej.
Przykład: Policzono liczbę jaj złożonych przez 5 winniczków na łąkach koło Kampusu i otrzymano następujące dane: 5, 10, 6, 8, 3. Co na tej podstawie możesz powiedzieć o średniej liczbie jaj składanych przez wszystkie winniczki na tym obszarze?
3. Dane: dwa pomiary w skali interwałowej
Dysponujemy dwoma seriami pomiarów w skali interwałowej np. długość ucha, wzrost, waga, temperatura, wilgotność, tempo metabolizmu itd. Dane takie są w biologii szeroko rozpowszechnione i opracowano dla nich wiele testów, dlatego przy wyborze testu należy dokładnie zastanowić się, co chcemy zbadać i czego właściwie nasze dane dotyczą.
dane |
pytanie |
testy |
H0 |
przykłady |
2 serie pomiarów tej samej zmiennej w różnych miejscach, warunkach, czasie etc. (2 grupy danych)
|
Czy między grupami istnieją różnice |
t dla prób niezależnych
t dla par wiązanych |
brak różnic między grupami |
Patrz niżej (Który wybrać - testy t Studenta) |
1 seria pomiarów 2 różnych zmiennych |
Czy istnieje związek między tymi zmiennymi? |
korelacja (siła związku i jego kierunek - dodatni lub ujemny)
|
brak związku między cechami |
Związek między masą ciała a masą poroża u samców jelenia; związek między zawartością metali ciężkich w owocnikach borowików a odległością od huty |
Który wybrać - testy t Studenta
Jeśli dysponujemy danymi pochodzącymi z pomiarów dla dwóch grup i chcemy sprawdzić, czy między tymi grupami istnieją różnice, musimy sobie odpowiedzieć na następujące pytania:
1. Czy badamy pary wiązane?
Test dla par wiązanych stosujemy wtedy, kiedy istnieje coś, czym można "związać" pary pomiarów należące do dwóch badanych grup. Na przykład:
pomiar na tym samym osobniku w dwóch okolicznościach (np. przed i po podaniu leku, na młodym osobniku i kiedy dorośnie, rano i wieczorem, przed rozrodem i po itp.)
pomiar na parach osobników spokrewnionych (rodzeństwo, bliźnięta, klony).
pomiar na tej samej powierzchni badawczej w dwóch różnych okolicznościach (np. rano i wieczorem, przed i po wybudowaniu/zamknięciu huty/drogi/fabryki itp.)
itd.
Trzeba więc zastanowić się, czy nasze pomiary można jednoznacznie połączyć w pary i czy ma to biologiczny sens. Jeśli nie, stosujemy test dla różnic między średnimi dla prób niezależnych. Przykłady? różnorodność pająków/chrząszczy/skoczogonków/etc. w dwóch różnych typach lasu, średni wzrost zawodników reprezentacji Polski w piłce nożnej i w siatkówce... etc.
2. Czy wariancje są równe?
- jeśli tak -> test t Studenta dla różnic między średnimi przy równych wariancjach, porównanie statystki z tabelą
- jeśli nie -> test t Studenta dla różnic między średnimi przy różnych wariancjach, obliczenie t krytycznego wg. wzoru