Zadanie.
a |
b |
48 |
37 |
57 |
30 |
21 |
45 |
53 |
52 |
51 |
32 |
67 |
35 |
44 |
37 |
61 |
40 |
12 |
47 |
47 |
32 |
15 |
50 |
17 |
42 |
27 |
40 |
Badania dotyczyły oceny skuteczności polowań samic (kolumna a) i samców (kolumna b) lisa pospolitego (Vulpes vulpes). Liczono liczbę gryzoni złapanych przez poszczególne osobniki. Obserwowano 13 samic i 13 samców. Badania miały odpowiedzieć na pytanie czy płeć zwierzęcia ma wpływ na liczbę upolowanych przez niego gryzoni.
Statystyki podstawowe badanych zmiennych zamieszczono w Tabeli 1.
Tab. 1. Statystyki podstawowe dla badanych zmiennych: a - liczba gryzoni złapanych przez samice lisa, b- liczba gryzoni złapanych przez samce lisa.
Statystyka |
a |
b |
Średnia |
40 |
39,92308 |
Błąd standardowy |
5,27816 |
1,949561 |
Mediana |
47 |
40 |
Modalna |
Brak |
37 |
Odchylenie standardowe |
19,03068 |
7,029243 |
Wariancja próbki |
362,1667 |
49,41026 |
Kurtoza |
-1,50596 |
-0,92919 |
Skośność |
-0,29287 |
0,322643 |
Zakres |
55 |
22 |
Minimum |
12 |
30 |
Maksimum |
67 |
52 |
Liczba pomiarów N |
13 |
13 |
Każdy osobnik lisa jest niezależnym indywiduum. Ponieważ w zadaniu brak informacji o tym czy badane były zawsze dwa osobniki z pary nie wolno nam traktować tych wyników jako par wiązanych - musimy traktować je jako pomiary niezależne mimo ze jest ich taka sama liczba. Z tego powodu należy zastosować test t - studenta dla zmiennych niezależnych..
Aby zastosować odpowiedni test musimy najpierw sprawdzić czy badane zmienne istotnie statystycznie różnią się wariancją. W tym celu przeprowadzamy test F z dwiema próbami dla wariancji.
Test F
Hipoteza zerowa: Nie ma istotnych statystycznie różnic pomiędzy wariancjami badanych zmiennych
Hipoteza alternatywna: Wariancje badanych zmiennych różnią się ze statystyczną istotnością
Obliczam statystykę F, która jest
stosunkiem wariancji większej s12 do wariancji mniejszej s22
F= 362,1667 / 49,41026=7,329787
Otrzymana statystykę F porównujemy z wartościami krytycznymi rozkładu F
Posługując się tablicą z wartościami krytycznymi rozkładu F odczytuję wartość krytyczną odpowiadająca liczbie stopni swobody (N-1 =13-1=12) dla wariancji większej (główka tablicy) i wariancji mniejszej (N-1=13-1=12)(pierwsza kolumna tablicy). Ponieważ testowanie hipotezy chcę przeprowadzić na poziomie istotności 0,05 to korzystam z tablicy dla poziomu istotności 0,025. Odczytana z tablicy wartości krytycznych rozkładu F wartość krytyczna wynosi 3,28. Wartość krytyczna jest mniejsza od obliczonej przez nas statystyki F = 7,329787
Ponieważ obliczona przez nas statystyka F jest większa od wartości krytycznej odczytanej z tablic wartości krytycznych rozkładu F dla poziomu istotności 0,025 odrzucamy hipotezę zero zakładającą, iż wariancje badanych zmiennych nie różnią się statystycznie istotnie. Przyjmujemy zatem hipotezę alternatywną - badane zmienne mają wariancje różniące się ze statystyczną istotnością dla poziomu istotności 0,05. W związku z tym do oceny istotności różnic pomiędzy średnią liczbą gryzoni łowionych przez samice a średnia liczba gryzoni łowionych przez samce lisa muszę zastosować test t- studenta dla zmiennych niezależnych zakładający różne wariancje.
Porównuję wynik obliczony klasyczną metoda z wynikiem uzyskanym przy użyciu Excela (Tab.2)
Tab 2 |
Zmienna 1 |
Zmienna 2 |
Średnia |
40 |
39,92308 |
Wariancja |
362,1667 |
49,41026 |
Obserwacje |
13 |
13 |
df |
12 |
12 |
F |
7,329787 |
|
P(F<=f) jednostronny |
0,000806 |
|
Test F jednostronny |
2,686633 |
|
Obliczona przez Excel wartość statystyki F jest identyczna z wartością obliczoną klasyczną metodą. Natomiast podana przez Excela wartość odczytana z tablic (Test F jednostronny )wynosi 2,686633. Różni się ona o wartości odczytanej przeze mnie ponieważ korzystam z tablicy dla poziomu istotności 0,025. Excel podał wartość krytyczną odczytana z tabeli dla poziomu istotności 0,005
Test t- studenta
Hipoteza zerowa:
Nie ma statystycznej różnicy pomiędzy średnią liczbą gryzoni łowionych przez samice lisa a średnią liczbą gryzoni łowionych przez samce lisa.
Hipoteza alternatywna:
Średnia liczba gryzoni złowionych przez samice różni się statystycznie istotnie w porównaniu do liczby gryzoni złowionych przez samce
Obliczam statystykę t
Ponieważ wolno mi zastosować test t- studenta zakładający różne wariancje błąd standardowy obliczam z następującego wzoru:
N1- liczebność obserwowanych samic,
N2 - liczebność obserwowanych samców
s12 - wariancja liczby gryzoni złowionych przez samice
s22 - wariancja liczby gryzoni złowionych przez samce
sx=((362,1667/13)+( 49,41026/13))1/2 = 5,6267009
Wzór na obliczenie statystyki t
Gdzie: sx - błąd standardowy
X1 - średnia liczba gryzoni złowiona przez samice
X2 - średnia liczba gryzoni złowiona przez samce
T= (40-39,92308)/ 5,6267009=0,013671
Odczytuję wartość krytyczną z tablic wartości krytycznych rozkładu t dla poziomu istotności 0,05 dla testu dwustronnego przy df= N1+N2 - 2= 13+13-2=24
Odczytana wartość wynosi 2,797
Wartość obliczonej statystyki t (0,013671) jest mniejsza od odczytanej z tablic dla t testu dwustronnego (2,797) a zatem nie mamy podstaw do odrzucenia hipotezy zerowej (przyjmujemy hipotezę zerową) Średnia liczba gryzoni łowionych przez samice nie różni się istotnie statystycznie od średniej liczby gryzoni łowionych przez samce.
Wniosek
Płeć lisa nie ma wpływu na liczbę złowionych przez niego gryzoni
Porównuję wynik uzyskany metodą klasyczną z wynikiem uzyskanym przy użyciu excela (Tab. 3).
Tab. 3 |
||
Test t: z dwiema próbami zakładający nierówne wariancje |
||
|
Zmienna 1 |
Zmienna 2 |
Średnia |
40 |
39,92308 |
Wariancja |
362,16667 |
49,41026 |
Obserwacje |
13 |
13 |
Różnica średnich wg hipotezy |
0 |
|
df |
15 |
|
t Stat |
0,0136711 |
|
P(T<=t) jednostronny |
0,4946363 |
|
Test T jednostronny |
1,753051 |
|
P(T<=t) dwustronny |
0,9892726 |
|
Test t dwustronny |
2,1314509 |
|
Obliczona przez Excel statystyka t jest identyczna z obliczona metodą konwencjonalną ale Excel podaje inną liczbę stopni swobody niż wynika ze sposobu obliczania podanego przez Łomnickiego (Łomnicki 1995 Wprowadzenie do statystyki dla przyrodników; str 199). Z tego powodu wartość krytyczna podana przez Excela różni się od odczytanej przeze mnie z tablic.
Wartość obliczonej statystyki t (0,0136711) jest mniejsza od odczytanej z tablic dla t testu dwustronnego (2,1314509) a zatem nie mamy podstaw do odrzucenia hipotezy zerowej (przyjmujemy hipotezę zerową) Średnia liczba gryzoni łowionych przez samice nie różni się istotnie statystycznie od średniej liczby gryzoni łowionych przez samce. Ostateczna interpretacja testu jest identyczna jak przy obliczeniach wykonanych metoda konwencjonalną
4