Nazwisko, imię ………………………………………………………...; Data ………………………
(1) W jakim celu podejmujemy badania statystyczne?
1. Aby móc wnioskować o populacji na podstawie próby
2. aby wykryć w zbiorze danych określone prawidłowości, tj. wzorce zachowań, wzorce występowania organizmów w przestrzeni (w ściśle określonych warunkach) itp.
Zdefiniuj następujące pojęcia:
(2) populacja wielowymiarowa - populacja statystyczna, w której badanych jest wiele cech
(3) próba reprezentatywna - próba reprezentująca populację- tzw. miniatura populacji.
(4) prosta próba losowa (populacja skończona)- - próba uzyskana na drodze najprostszego schematu losowania, uzyskujemy ją, gdy:
1. losowanie jednostek statystycznych do próby dokonywane jest z całej populacji (losowanie nieograniczone),
2. każda jednostka ma takie samo prawdopodobieństwo dostania się do próby (losowanie indywidualne),
3. prawdopodobieństwo to nie zmienia się w trakcie losowania.
(5) dlaczego zobligowani jesteśmy do pobierania prostej próby losowej?
Ponieważ testy statystyczne i metody estymacji opierają się na założeniu, że z populacji pobrano prostą próbę losową.
(6) Jakie rodzaje cech wyróżniamy w statystyce?
Niemierzalna (jakościowa):
To cecha, której kategorii nie da się wyrazić za pomocą liczb, natomiast można to uczynić słownie, np. kolor włosów, płeć, zawód, wykształcenie, pochodzenie itp.
Mierzalna (ilościowa):
Zmienna skokowa (dyskretna)- dane pochodzą z policzenia, więc zmienna ta przybiera wartości całkowite- np. liczba dzieci w rodzinie, liczba uczniów w klasie, liczba chromosomów w komórce.
Zmienna ciągła- dane pochodzą z pomiaru, więc zmienna ta przyjmuje wartości należące do określonego przedziału skali ciągłej. W skali ciągłej mierzymy czas, długość, masę, temperaturę, lata itp.
(7) Czym różni się skala przedziałowa od skali ilorazowej?
Skala przedziałowa posiada arbitralny początek skali, w tej skali przedstawiane SA wyniki, które uzyskujemy poprzez pomiar. Skala przedziałowa wymaga ustalenia stałej jednostki miary
(8) Określ asymetrię rozkładu na podstawie relacji między wartościami średniej arytmetycznej (
), medialnej (me) i modalnej (mo):
≈ me ≈ mo Rozkład symetryczny
> me > mo Rozkład asymetryczny prawostronny
< me < mo Rozkład asymetryczny lewostronny
(9) Która z miar rozproszenia (zmienności) jest interpretowalna: wariancja (s2), odchylenie standardowe (s), współczynnik zmienności (V%)?
Interpretowalną miarą jest odchylenie standardowe (s).
(10) Kiedy mamy do czynienia z rozkładem zero-jedynkowym?
1. przeprowadzamy tylko jedno doświadczenie losowe (n=1);
2. przestrzeń wyników tego doświadczenia jest dwuelementowa (0,1)
3. ????????????
(11) Które parametry trzeba znać, by opisać rozkład zero-jedynkowy?
By obliczyć rozkład zero-jedynkowy wystarczy znać p.
(12) Podaj przykład cechy o rozkładzie zero-jedynkowym.
Z jaja może wykluć się kogut lub kura.
Rzut monetą- wyrzucenie orła lub reszki.
(13) Kiedy mamy do czynienia z rozkładem Poissona?
1. przestrzeń wyników pojedynczego doświadczenia jest dwuelementowa (0,1);
2. przeprowadza się n niezależnych, równoczesnych doświadczeń;
3. długość serii n jest nieznana (n zmierza do nieskończoności)
4. prawdopodobieństwo zaistnienia sukcesu w pojedynczym doświadczeniu jest stałe i bardzo małe (p zmierza do zera)
(14) Które parametry trzeba znać, by opisać rozkład Poissona?
Trzeba znać jeden parametr, średnią liczbę sukcesów przypadającą na jedno doświadczenie, λ (parametr ten jest związany z parametrami rozkładu dwumianowego n i p następującą zależnością λ= np, gdy liczba doświadczeń n wzrasta, prawdopodobieństwo sukcesu p maleje w taki sposób, że λ jest wielkością stałą.)
(15) Podaj przykład cechy o rozkładzie Poissona.
Rejestrujemy nieobecności studentów na ćwiczeniach.
(16) Podaj symboliczny zapis rozkładu normalnego standaryzowanego.
N(0,1).
(17) Podaj symboliczny zapis rozkładu estymatora.
N(n,σ
(18) Czy w przypadku zmiennej ciągłej można mówić o prawdopodobieństwie realizacji?
TAK … NIE … (zakreśl właściwą odpowiedź); DLACZEGO? …………………………..
?????????????????
(19) Czy każdy rozkład symetryczny jest rozkładem normalnym?
Nie
(20) Jakiej prawidłowości dotyczy reguła trzech sigm (odchyleń standardowych)?
Procent realizacji zmiennej w rozkładzie normalnym w przedziale μ ± 3σ wynosi 99,73%.
(21) Co to jest rozkład w próbie?
Rozkład w próbie to rozkład cechy skonstruowany na podstawie próby
danych; jest to rozkład empiryczny.
(22) Podaj (własny!) przykład doświadczenia założonego według metody zmiennych (prób) połączonych.
??????????????
(23) Jakie zasady obowiązują przy wyznaczaniu bloków (metoda zmiennych połączonych)?
Przy wyróżnianiu bloków obowiązuje zasada, że różnice między blokami powinny być duże, natomiast między bliźniaczymi jednostkami w bloku małe.
(24) Na czym polega weryfikacja hipotezy poprzez konfirmację?
Konfirmacja- postępowanie polegające na wykazaniu, że weryfikowana hipoteza jest prawdziwa: szukamy faktów POTWIERDZAJĄCYCH weryfikowaną hipotezę; konfirmacja nigdy nie jest konkluzywna, ponieważ nie można wykazać w sposób ostateczny, że weryfikowana hipoteza jest prawdziwa- teoretycznie, zawsze można znaleźć fakt, który zakwestionuje prawdziwość weryfikowanej hipotezy.
(25) Kiedy można stosować testy parametryczne?
- hipoteza jest parametryczna (hipoteza, która dotyczy parametru populacji. Hipotezę parametryczną można sformułować wtedy, gdy znany jest rozkład badanej cechy.)
- rozkład badanej cechy jest normalny
Najczęściej stosowane testy parametryczne: test z, test t, test F.
(26) Kiedy stosuje się testy nieparametryczne?
- hipoteza jest nieparametryczna (hipoteza, która dotyczy rozkładu badanej cechy. Najczęściej hipoteza ta głosi, że rozkład cechy jest rozkładem normalnym, dwumianowym, Poissona, równomiernym lub że rozkłady są jednorodne.)
Niektóre testy nieparametryczne są alternatywami testów parametrycznych, np. testu Studenta dla dwóch prób lub analizy wariancji. Jednym z najczęściej stosowanych testów nieparametrycznych jest test chi-kwadrat.
(27) Na które pytania trzeba odpowiedzieć, by wybrać właściwy test statystyczny?
1. Który schemat doświadczalny wybrano -zmienne połączone, czy zmienne niepołączone?
2. Ile prób będzie badanych- jedna, dwie czy więcej?
3. Którą skalę pomiaru zastosowano- nominalną, porządkową, czy przedziałowo-ilorazową?
4. Która hipoteza statystyczna będzie testowana: np. hipoteza dotycząca miar położenia, miar rozproszenia, proporcji, rozkładów, czy niezależności cech?
5. Czy można przyjąć, że rozkład cechy w populacji jest normalny?
6. ??????????
(28) Czy wówczas, gdy pobierzemy dużą próbę możemy stosować test parametryczny nawet wtedy, gdy rozkład cechy w populacji nie jest normalny? TAK … NIE … (zakreśl właściwą odpowiedź); DLACZEGO? ………… Możemy przyjąć, że rozkład zmierza do normalności bo rozkład estymatora zmierza do normalnośći
(29) Wymień nieparametryczne alternatywy testu t Studenta dla dwóch prób zależnych.????????????
1. ……
2. ……
(30) Sformułuj hipotezę zerową i alternatywną dla parametrycznej ANOVA.
H0: Porównywane populacje nie różnią się ze względu na wartość średnią.
H1: Przynajmniej dwie populacje różnią się ze względu na wartość średnią.
(31) Kiedy należy stosować testy wielokrotnych porównań?
Testy wielokrotnych porównań należy stosować gdy chcemy sprawdzić, które średnie grupowe różnią się istotnie, a które nie.
(32) Czy można wykorzystywać do wielokrotnych porównań testy dla dwóch prób, np. test t Studenta dla dwóch prób niezależnych lub jego nieparametryczną alternatywę, test U Manna-Whitneya?
NIE
DLACZEGO? Między innymi dlatego, że testy te nie utrzymują stałego, łącznego poziomu α, niezależnie od liczby dokonywanych porównań.
(33) Wymień nieparametryczną wersję ANOVA dla jednoczynnikowej analizy wariancji z powtarzanymi pomiarami - klasyfikacja podwójna (próby połączone):
1. dla skali porządkowej: test Friedmana
2. dla skali nominalnej (zmienna dychotomiczna): …………………………………….. ???????????
(34) Jakie warunki muszą być spełnione, by można było zastosować test chi-kwadrat?
1. cecha …nie stawia żadnych wymagań co do rozkładu cechy w populacji
2. pomiar wykonano w skali nominalnej
3. rozkład cechy …?????????
4. liczebność próby, n, była na tyle duża aby w każdej podklasie tabeli wielodzielczej oczekiwana liczebność wynosiła przynajmniej 5- jeżeli liczebności te są mniejsze, należy zsumować sąsiednie klasy tak, by warunek ten był spełniony.
( Jeżeli liczebność próby n<20, wówczas zawsze powinno się stosować test dokładny Fishera)
(35) Podaj przykład hipotezy zgodności, zerowej i alternatywnej, dla testu chi-kwadrat:
H0:
H1:
???????????????
(36) Podaj przykład hipotezy jednorodności, zerowej i alternatywnej, dla testu chi-kwadrat:
H0:
H1:
????????????
(37) Kiedy można liczyć współczynnik korelacji liniowej r Pearsona?
1. cechy - dwie cechy mierzalne
2. pomiar …????????????
3. rozkłady cech ….. ??????????
3. kształt związku- korelacja liniowa
(38) Wymień najczęściej stosowane współczynniki korelacji rang.
1. Spearmana
2. Kendalla
3. konkordancji Kendalla
(39) Wymień najczęściej stosowane współczynniki siły związku.
1. Pearsona
2. Cramera
3. Czuprowa
(40) Na czym polega estymacja punktowa?
W praktyce estymacja punktowa polega na podaniu jednej liczby, odpowiadającej przypuszczalnej wartości parametru. Liczba ta, to zaobserwowana w n- elementowej próbie wartość estymatora. Traktuje się ją jako najlepsze przybliżenie nieznanej wartości parametru.
(41) Co to jest błąd I rodzaju?
Błąd ten polega na odrzuceniu PRAWDZIWEJ hipotezy zerowej i przyjęciu FAŁSZYWEJ hipotezy alternatywnej. Zapis α=0,05 oznacza, że - przykładowo- na 100 zbadanych prób, w przypadku pięciu z nich możemy popełnić ten błąd.
(42) Co to jest test konserwatywny?
TEST KONSERWATYWNY rzadziej odrzuca hipotezę zerową, więc, w rzeczywistości, prawdopodobieństwo popełnienia błędu pierwszego rodzaju jest mniejsze, niż założone α. Dla poziomu istotności α=0,05, będzie ono mniejsze niż 5%.
W kontekście błędu drugiego rodzaju, prawdopodobieństwo popełnienia tego błędu jest mniejsze, gdy stosujemy test konserwatywny, a większe gdy stosujemy test liberalny. W efekcie: test konserwatywny ma większą moc.
ewelina.samek@gmail.com
7
Studia I Stopnia: Test sprawdzający - zestaw 2
.