Przykładowy zestaw zadań z kluczem rozwiązań
Opis statystyczny może wykazać (wskaż twierdzenie fałszywe)
rozkład typowy
rozkład normalny
rozkład symetryczny
rozkład platokurtyczny
Wnioskowanie statystyczne nie może lub nie powinno być stosowane gdy (wskaż twierdzenie fałszywe):
próba jest tendencyjna
zastosowano strategię badań wyczerpujących
nie zostały spełnione założenia modelowe
rozkład danych w próbie jest symetryczny
Cecha statystyczna (wskaż twierdzenie fałszywe):
może być określana jako zmienna
jeżeli jest nominalna, to jest niemierzalna ilościowo
gdy jest ciągła, to może przyjmować każdą wartość rzeczywistą z pewnego przedziału
gdy przyjmuje nieskończenie wiele wartości to jest dyskretna
Liczna wybranych przymiotników w teście ACL (wskaż twierdzenie fałszywe):
to cecha ilorazowa
to cecha skokowa - traktowana jak w przybliżeniu ciągła
jak każdy wynik testu psychologicznego - to cecha interwałowa
to cecha stosunkowa, którą można zamienić na porządkową
Cecha jakościowa (wskaż twierdzenie fałszywe):
powstaje w efekcie nominalizacji dowolnych danych
daje się znominalizować na dowolną skalę
podlega klasyfikacji zupełnej lub niezupełnej
podlega klasyfikacji rozłącznej lub nierozłącznej
Test nieparametryczny (wskaż twierdzenie fałszywe):
stawia hipotezy dotyczące rozkładu cechy w populacji
to zawsze test dla cech nominalnych
to zawsze test dla cech porządkowych
wymaga założenia o normalności rozkładu
Sklasyfikowano grupę 30 kibiców telewizyjnych na kategorie: oglądają każdy mecz - 7; oglądają większość - 16; oglądają wybrane mecze - 7
kategoria modalna nie występuje
kategoria modalna = 7
częstość kategorii modalnej wynosi 23,3%
częstość kategorii modalnej wynosi 0,533
Sklasyfikowano grupę 30 osób ze względu na sposób reagowania na sytuacje trudne: 9 osób stosuje mechanizmy obronne, 10 osób - atakuje, 11 osób - wycofuje się
ta grupa jest bardzo słabo zróżnicowana
ta grupa jest umiarkowanie zróżnicowana
ta grupa jest silne zróżnicowana
wartość dyspersji klasyfikacji = 0,96
Grupę 60 osób sklasyfikowano w tabeli 6-polowej w celu zbadania zależności między płcią a sposobem reakcji na zagrożenie (3 kategorie). Uzyskano 2 = 9 (wskaż twierdzenie fałszywe)
rp = 0,51
V = 0,387
T 0,32
= T
Grupę 36 osób sklasyfikowano w tabeli 4-polowej dla której 20,05; 1 = 3,841. Oblicz 2 wiedząc, że: 8 pań preferowało barwy zimne a 10 - ciepłe; 12 panów wybrało barwy zimne a 6 - ciepłe
występuje bardzo silna zależność
występuje silna zależność w próbie, ale nieistotna dla populacji
występuje dość słaba zależność w próbie, ale istotna dla populacji
zależność cech jest słaba i nieistotna
Ustalono równanie regresji między liczbą dzieci (x) a miesięcznymi wydatkami na kulturę (y) w zł:
; R2 = 84,64%
całkowity spadek wydatków wynosi 2 000 zł
wydatki w 84,64% zależą od każdego następnego dziecka
wydatki na kulturę w 15,36% zależą od innych czynników niż liczba dzieci
prognozowany wydatek przy trojgu dzieciach wynosi 60 zł
Stwierdzono, że tygodniowy czas oglądania TV rośnie przeciętnie o 0,10 godziny gdy wiek emeryta rośnie o 1 rok. Czas oglądania niezależny od wieku wynosi 2 godziny. Wiadomo również, że R2 = 81%
parametr a w równaniu regresji = 2
parametr b w równaniu regresji = 1
współczynnik indeterminacji = 19%
niska wartość współczynnika a wskazuje, że równanie regresji bardzo słabo opisuje tę zależność
Badano zależność między dawką nawozu a wielkością zbioru truskawek. Kowariancja obu cech = 3,6, a wariancje 0,09 i 400
r = +0,1
współczynnik determinacji = 1%
r = +0,6
współczynnik determinacji = 60%
Mediana
jest najmniej precyzyjna przy siodłowym rozkładzie danych
może nie wystąpić w ogóle
powinna być wyznaczana przy rozkładach ekstremalnie skośnych
jest miarą klasyczną wyrażaną w jednostkach absolutnych
Grupę 6 osób zapytano o liczbę lat stażu pracy: 1, 8, 8, 6, 8, 20
pozycja mediany wynosi 10,5
dominanta = 20
połowa tej grupy przepracowała co najwyżej 7 lat
połowa tej grupy przepracowała co najmniej 8 lat
W grupie 10 pacjentów badano zależność między poziomem tolerancji bólu a poziomem egocentryzmu. Policzono współczynnik korelacji rangowej Rs = -0,8. Wynik ten oznacza:
słabą zależność obu cech
im mniej ktoś jest egocentryczny tym ma mniejszą tolerancję bólu
wraz ze wzrostem egocentryzmu słabo spada tolerancja bólu
im mniejsza tolerancja bólu tym wyraźnie większy poziom egocentryzmu
Dla danych z tabeli wyznacz średnią i dominantę
xi |
2 |
3 |
4 |
5 |
ni |
1 |
3 |
5 |
1 |
D = 1
D = 4
D <x
D nie występuje
Wynik Wsk = -0,99 oznacza:
bardzo słabą asymetrię ujemną
bardzo silną przewagę wyników niższych od średniej
bardzo silną asymetrię lewostronną
bardzo słabą skośność prawostronną
xi |
ni |
0 - 2 |
1 |
2 - 4 |
7 |
4 - 6 |
1 |
6 - 8 |
1 |
Dla danych z tabeli wyznacz średnią i dominantę oraz przyjmij, że wariancja 2,0449
Wsk 0,28
Wsk 1,67
Wsk 1,17
Wsk 0,73
Jeśli dla pewnych danych x = 100, s2 = 81 to:
v = 81%
współczynnik zmienności informuje ile % z odchylenia standardowego stanowi wartość średniej
współczynnik zmienności pozwala oszacować wielkość dyspersji w stosunku do średniej
wartość v jest absolutną miarą klasyczną
Współczynnik asymetrii A
dla niektórych danych nie daje się policzyć
daje się policzyć dla każdych danych
jest miarą pozycyjną
przyjmuje wartości od -1 do +1
Test Studenta (wskaż twierdzenie fałszywe):
może wystąpić w formie parametrycznej lub nieparametrycznej
może wystąpić w wersji jedno- lub dwustronnej
może dotyczyć jednej lub dwu średnich
może wystąpić w wersji dla homo- lub heterogenicznych wariancji
Postanowiono sprawdzić czy jest istotna różnica między % zadowolonych studentów dziennych, wieczorowych i zaocznych. Do weryfikacji należy użyć testu:
Studenta dla prób niezależnych
jednoczynnikowej analizy wariancji
testu U
testu Fp porównywania częstości
Badano liczbę przeczytanych stron z zadanej literatury w losowo wybranych grupach studentów dziennych i zaocznych. W testach Levene'a i Studenta wykazano, że: F > F0,05 i t < t0,05. Uzyskane wyniki oznaczają, że:
nie ma różnic między wariancjami, natomiast jest istotna różnica między średnimi
musi być zastosowana wersja testu Studenta dla przypadków o homogenicznych wariancjach
średni poziom oczytania jest podobny, natomiast grupy wykazują różny rozrzut wyników
po stwierdzeniu, że badane grupy różnicuje dyspersja - stosuje się test Studenta dla jednej średniej
Jednoczynnikowa analiza wariancji (wskaż twierdzenie fałszywe)
jest testem parametrycznym
w hipotezie alternatywnej postuluje, że wszystkie badane średnie różnią się istotnie
zmienna zależna musi być wyrażona na skali stosunkowej lub przedziałowej
zmienna kryterialna - niezależna - przyjmuje co najmniej 2 wartości
Równość wariancyjna (wskaż twierdzenie fałszywe)
jest podstawą zarówno jednio- jak i dwuczynnikowej analizy wariancji
wariancja całkowita pomiaru jest sumą wariancji między- i wewnątrzgrupowej
wariancja międzygrupowa pozostaje niewyjaśniona
wariancja wewnątrzgrupowa pozostaje niewyjaśniona
Klucz
1b
2b
3d
4c
5b
6d
7d
8c h = 0,93
9d
10d 2 = 1,8
11c
12c
13c
14c
15d poz. Me = 3,5 Me = 8
16d
17b D = 4 x = 3,6
18c
19a D = 3 x = 3,4 s = 1,43
20c v = 9%
21b
22a
23d (% to miara częstości z kategorii „zadowolonych” w obu grupach; chodziło o test istotności różnic)
24c
25b
26d
3
4
Zestaw 2