Przykładowe pytania ze statystyki (1), ochrona środowiska UJ, I semestr SUM, statystyka


Przykładowe pytania ze statystyki

  1. Podaj intuicyjne wytłumaczenie, dlaczego odrzucamy hipotezę zerową, gdy wyliczone t jest większe od tablicowego

Odp: wartość powyżej t to odchylenie od średniej, które jest w obszarze krytycznym, a obszar krytyczny są to wszystkie możliwe wartości przy których odrzucamy ho

  1. Narysuj schematyczny wykres obrazujący zmienność w populacji i zaznacz na tym wykresie odpowiednie parametry.

  2. Czego dowiadujemy się o populacji generalnej wyznaczając 95% przedział ufności?

Dowiadujemy się jakie 5 % wyników jest najmniej prawdopodobnych - znajdujących się w obszarze krytycznym, a jakie 95% wyników jest najbliższe średniej z populacji generalnej.

  1. Dlaczego łatwiej jest zazwyczaj wykazać statystycznie istotne różnice, gdy nasze próby są większe?

Gdy próby są większe wówczas rozkład jest bliski rozkładowi normalnemu populacji generalnej - mamy więcej danych o populacji generalnej.

  1. Co to jest błąd standardowy?

SE - Odchylenie standardowe dla wartości średniej - świadczy o stopniu rozproszenia średnich. Nie mylić z odchyleniem standardowym.

  1. Jakie są założenia testu chi kwadrat?

Losowość, niezależność, wartość oczekiwana w każdej grupie nie mniejsza niż 5.

  1. O czym świadczy wartość F mniejsza od 1 w analizie wariancji?

Fmin = 1 (dla rozkładu normalnego obu zmiennych) F<1świadczy o błędnych obliczeniach.

  1. Jakich informacji dostarcza nam policzenie regresji, a jakich korelacji? Gdzie leżą różnice?

Policzenie regresji umożliwia nam poprowadzenie lini tak, aby suma kwadratów odchyleń była jak najmniejsza - mówi o kształcie związku między zmiennymi x,y i opisuje go za pomocą funkcji zależności między zmiennymi. Natomiast obliczenie korelacji umożliwia nam odpowiedź na pytanie o stopniu dopasowania linii regresji do punktów pomiarowych - mówi jak duża jest siła związku między zmiennymi.

  1. Co to jest błąd I-ego rodzaju?

Jest to błąd związany z odrzuceniem prawdziwej H0

  1. Czym różni się błąd standardowy od błędu I-ego rodzaju?

Szkoda się powtarzać….

  1. Czym różni się test t dla danych niezależnych od testu t dla danych zależnych? Podaj przykład.

Test t dla danych niezależnych spełnia założenie o losowości i niezależności 2 odmiennych badanych grup, np. wpływ położenia geograficznego na wysokość drzew, a par wiązanych - spełnia założenie o losowości ale bada się np. tą samą grupę (to samo miejsce) tylko przed zmianą i po zmianie (wpływie jakiegoś czynnika np. temperatury, promieniowania itd.) są do dane zależne - tak jak np. losowanie kulek ze zwracaniem

  1. Który z testów dla par wiązanych czy dla prób niezależnych jest mocniejszy i dlaczego?

  2. Co to jest obszar krytyczny przy testowaniu hipotez?

obszar krytyczny są to wszystkie możliwe wartości (wyniki pomiarów) przy których odrzucamy ho

  1. Co to jest transformacja danych i kiedy ją stosujemy? Podaj przykłady transformacji.

Stosuje się po to żeby dane spełniały założenia - np. aby rozkład był normalny, regresja prostoliniowa, wariancja homogeniczna. To np. logarytmowanie, pierwiastkowanie zmiennej zależnej.

  1. W testowaniu hipotez jednym z założeń jest obszar krytyczny. Co to jest i jak go wyznaczamy?

Wyznaczamy go z poziomu istotności np.gdy p = 0,05 to obszar krytyczny - 5%- jeżeli test dwustronny to 2,5% z jednej strony rozkładu i tyle samo z drugiej.

  1. Jakie znasz testy statystyczne, które służą do testowania hipotez o braku różnic między próbami? Wymień wszystkie znane Ci testy i warunki przy których możesz je zastosować.

Test t-studenta - zmienna zależna - rozkład normalny - pary wiązane lub próby niezależne

ANOVA jednoczynnikowa - zmienna zależna - rozkład normalny

Test U - brak rozkładu normalnego, próby niezależne

Wilcoxona - brak rozkładu normalnego, pary wiązane

  1. O czym mówią wartości t w teście t-studenta? Jeśli mamy rozkład t to jakich wartości t spodziewamy się najczęściej?

Wartość t są to wartości po standaryzacji, mówią gdzie leży granica odrzucenia H0, jak wygląda rozkład z próby

Im większe df tym bardziej rozkład t bliski rozkładowi normalnemu (granica odrzucenia H0, wartość t bliższa б =1,96) gdy df>120 - bliski rozkładowi normalnemu. Najwięcej spodziewamy się wartości t=0 (średnia)

  1. Wyjaśnij dlaczego trudniej wykazać jest różnice (w dowolnej cesze) między próbami jeśli próby różnią się wielkością.

W jednym zestawie -większa próba - jest więcej informacji o 1 populacji generalnej, a drugim - mniejsza - mniej

  1. Czego możemy dowiedzieć się o populacji generalnej obliczając średnią i odchylenie z próby n-elementowej pobranej z tej populacji?

  2. Po przeprowadzeniu badań i odpowiednich analiz statystycznych okazało się, że zmienność międzygrupowa wyniosła 2, a wewnątrzgupowa 1, przy wielkości próby 10 pomiarów. Jaki to test statystyczny i jakie ma założenia? Jak zinterpretujesz wyniki tych analiz? Czy nie znając wartości krytycznej możesz powiedzieć, czy raczej przyjmiesz czy raczej odrzucisz hipotezę zerową? Uzasadnij odpowiedź.

  3. Do czego służy test chi.kwadrat? Podaj przykłady zastosowań.

SII - test zgodności - chi kwadrat, test nieparametryczny (nie można obliczyć parametrów populacji generalnej np. średniej, odchylenia standardowego, wariancji) stosowany dla określenia ile jest czegoś w danej kategorii np. ile jest genotypu o danej wartości, ile jest kobiet palących, a ile niepalących, referencja stanowiska lęgowego, częstość występowania obu odmian np. kotów itd. , zaleta: określa rozkład w 2 grupach (gdy duże próby - lepszy niż rozkład dwumianowy)

Założenia: LOSOWOŚĆ, NIEZALEŻNOŚĆ

Odrzucamy H0 gdy chi 2> chi2 0,05

  1. W testowaniu hipotez jednym z założeń jest poziom istotności. Co to jest i jakie zwykle zakładamy jego wartości?

Poziom istotności - prawdopodobieństwo popełnienia błędu I rodzaju ( błąd związany z odrzuceniem prawdziwej H0), zwykle p = 0,05

  1. Zastanawiasz się, czy istnieje zależność między wielkością samicy trójszczyka mącznego a ciężarem jaj. Zaprojektuj odpowiednie badania, opisz jakie założenia poczynisz, jak je przeprowadzisz i jak opracujesz statystycznie wyniki takiego doświadczenia.

  2. Co to znaczy, że test jest jednostronny bądź dwustronny? Podaj przykłady.

  3. W dwóch litrowych słoikach masz rozwielitki pochodzące z dwóch różnych stawów. W jednym masz 10 a w drugim 100 osobników. Jakich testów statystycznych należy użyć do sprawdzenia hipotezy zerowej o braku różnic w długości rozwielitek między stawami? Zwróć uwagę na różnice w wielkościach prób. Uzasadnij odpowiedź.

  4. Jakich informacji dostarcza nam znajomość parametrów prostej regresji?

  5. Wyznaczasz dwa przedziały ufności jeden 95 a drugi 99%, który z nich ma większy zakres? Podaj uzasadnienie.

Pierwszy 5% obszar krytyczny - szerszy obszar krytyczny, węższy przedział ufności drugi 1 % - węższy obszar krytyczny, szerszy przedział ufności

  1. Zaprojektuj badania dotyczące zależności między wzrostem siewek buka a stężeniem ołowiu w podłożu, na którym te siewki rosły. Opisz, jakie założenia poczynisz, jak je przeprowadzisz i jak opracujesz statystycznie wyniki takiego doświadczenia

  2. W dwóch litrowych słoikach masz rozwielitki. W jednym 10 a w drugim 100 osobników. Przeprowadziliśmy odpowiednie pomiary długości tych rozwielitek i wyznaczyliśmy 95% przedziały ufności. Czy można z góry przewidzieć różnice między tymi przedziałami? Uzasadnij odpowiedź.

  3. Przeprowadziłeś/łaś badania i obliczyłeś/łaś test analizy wariancji. Obliczone F wyniosło 3.240. Z tablic wynika, że F krytyczne, przy założeniu wielkości Twojej próby, wynosi dokładnie 3.070. Jaka jest Twoja decyzja o istotności różnic między próbami. Szczegółowo uzasadnij swoją decyzję.

  4. Masz do wyboru dwa testy statystyczne stosowne dla opracowania Twoich danych: test t-studenta i test Manna-Whitneya (test U). Napisz, a) który jest mocniejszy i dlaczego tak uważasz, b) w jakich warunkach zdecydowałbyś/łabyś się stosować jeden bądź drugi.

  5. Podaj intuicyjne wyjaśnienie, na czym polega metoda najmniejszych kwadratów.

  6. Zaprojektuj badania dotyczące wpływu ołowiu na wzrost siewek buka. Opisz jakie założenia poczynisz, jak je przeprowadzisz i jak opracujesz statystycznie wyniki takiego doświadczenia

  7. Po co wyznaczamy przedział ufności?

Aby wyznaczyć granicę odrzucenia H0

  1. W dwóch litrowych słoikach masz rozwielitki. W jednym 10 a w drugim 100 osobników. W którym słoiku będzie większa średnia, a w którym większy błąd standardowy. Uzasadnij odpowiedź.

  2. Jakie znane Ci testy badają zależności między zmiennymi? Podaj ich nazwy, warunki ich stosowania i przykłady biologiczne.

Korelacja Pearsona - parametryczny, rozkład normalny Korelacja Spearmana - nieparametryczny,

  1. Podaj ogólne zasady zaokrąglania liczb

  2. W jaki sposób przekształcisz skalę interwałową w nominalną i skalę interwałową w porządkową? Podaj wyjaśnienie i przykłady

  3. Podaj przykłady, dla których stosuje się model I w analizie wariancji

W I modelu czynnik klasyfikujący kontrolowany, mamy co do niego przewidywania, np. GATUNEK, PŁEĆ, PORA ROKU, REJON GEOGR., USTALONA TEMP., RODZAJ POŻYWKI, PLACEBO, SZCZEPIONKI

  1. Co oznacza w statystyce termin ranga wiązana?

  2. Jakiego testu użyjesz dla sprawdzenia czy obserwowany rozkład genotypów w potomstwie krzyżówki 2 heterozygot jest zgodny z rozkładem oczekiwanym?

Chi kwadrat of corse

  1. Co możesz powiedzieć o 2 próbach ,w których znamy 95% przedziały ufności i dla których te przedziały nie zachodzą na siebie?

Są z różnych populacji generalnych bądź różnią się wariancją albo liczebnoscią

  1. Wymień wszystkie znane Ci testy, które pozwalają analizować dane zapisane w skali nominalnej

Chi kwadrat

  1. Naszkicuj na jednym wykresie krzywe dwóch hipotetycznych rozkładów normalnych

  1. Badano sukces lęgowy kosów w Lesie Wolskim. Okazało się, że spośród 200 gniazd, lęgi skończyły się sukcesem w 120 gniazdach. Oblicz 95% przedział ufności dla proporcji gniazd z sukcesem lęgowym.

  2. 18. Pewien student leśnictwa mierzył długości szyszek świerku w Puszczy Knyszyńskiej. W próbie 25 szyszek średnia długość wynosiła 9 cm, a odchylenie standardowe 1,5 cm.

  1. Pewien pszczelarz obserwował liczbę robotnic powracających do ula z pyłkiem przy 9 ulach swojej pasieki i notował ich liczbę (I) w ciągu 5 minut. Następnie dodał syropu cukrowego do podkarmiaczki każdego ula i powtórnie zanotował liczbę (II) robotnic wracających z pyłkiem w ciągu 5 minut. Otrzymał następujące wyniki:

I: 12 5 24 11 37 10 24 18 6

II: 15 4 26 13 40 8 30 22 7

Czy dodanie syropu do podkarmiaczek wpłynęło na liczbę robotnic latających po pożytek?

48. Pewien student obserwował intensywność karmienia piskląt przez kosy rano (R) od 7:00 do 8:00 i po południu (P) od 16:00 do 17:00 w tych samych 9 gniazdach. Otrzymał on następujące liczby przylotów rodziców z pokarmem:

R: 15 14 28 20 40 11 30 22 13

P: 12 13 24 21 37 10 24 18 12

Sprawdź, czy intensywność karmienia piskląt zależy od pory dnia? Przeprowadź wszystkie etapy testowania hipotez.

49. Badano długość liści buka. Kiedy należy zastosować pary wiązane, a kiedy próby niezależne, aby odpowiedzieć na następujące pytania:

  1. Czy długość liści jest różna w Puszczy Niepołomickiej i w Puszczy Boreckiej? niezależne

  2. Czy liście zebranie z drzew różnią się od liści zebranych spod drzew? Pary wiązane

  3. Czy liście rosnące od strony wschodniej różnią się od liści rosnących po stronie zachodniej? niezależne

  4. Czy długość liści w sezonie 2002 i 2003 różni się od siebie jeżeli leśnictwo wyraziło zgodę na znakowanie drzew? wiązane

  5. Czy długość liści w sezonie 2002 i 2003 różni się od siebie jeżeli drzewa nie były znakowane?niezależne

Podaj po kilka własnych przykładów badań z zastosowaniem prób niezależnych i par wiązanych.

OMG

50. Badano liczbę furażerek mrówki rudnicy wracających do gniazda z pokarmem na 10 mrowiskach rano i wieczorem. Otrzymano następujące wyniki:

Rano: 8 10 10 11 13 7 6 8 9 14

Wieczorem: 6 9 8 9 8 13 10 12 7 7

Czy liczba furażerek wracających do gniazda z pokarmem różni się między porami dnia?

Podaj: nazwę testu, statystyki, decyzję i błąd I rodzaju.

51. Przeprowadzono doświadczenie mające na celu zbadanie wpływu chlorpiryfosu (pestycyd) na wzrost siewek sosny Pinus silvestris. Do eksperymentu wybrano 50 roślin w tym samym wieku, które po połowie rozdzielono do zabiegu eksperymentalnego (E) i kontrolnego (K).

Otrzymano następujące wyniki:

dla E: średnia=14,2, Σx2=250,93

dla K: średnia=17,4, Σx2 =276,23

Jaki test wybierzesz, jaka będzie statystyka testu, decyzja o hipotezie zerowej i błąd I rodzaju, jeżeli:

  1. Wariancje w obu zabiegach są homogeniczne.

  2. Wariancje w obu zabiegach nie są homogeniczne.

  3. W obu zabiegach użyto po 100 roślin a wariancje są homogeniczne.

52. Na terenie Puszczy Niepołomickiej odłowiono po 9 samców i 9 samic nornicy rudej (Clethrionomys glareolus). Po przeniesieniu do laboratorium (i po kilkudniowym okresie aklimatyzacji) u każdego osobnika zmierzono masę ciała dwa razy: rano i wieczorem.

- samce rano: 34, 33, 28, 30, 23, 33, 25, 19, 31

- samce wieczorem: 35, 30, 26, 28, 21, 31, 24, 19, 31

- samice rano: 22, 29, 20, 26, 21, 24, 32, 17, 27

- samice wieczorem: 21, 27, 18, 24, 21, 23, 34, 16, 28

Użyj odpowiedniego testu (dla par wiązanych lub dla pomiarów niezależnych), aby odpowiedzieć na poniższe pytania:

  1. Czy samce różniły się od samic średnią masą ciała zmierzoną rano?

  2. Czy różnica między średnią masą ciała samców mierzoną rano i wieczorem była istotna?

53. Podaj znane Ci różnice między odchyleniem standardowym a błędem standardowym. Jak zmieniają się te statystyki wraz ze wzrostem wielkości próby?

54. Pewien rolnik mający w planach założenie hodowli krów mlecznych postanowił sam sprawdzić na niewielkich stadach mleczność dwóch ras krów. W grupie 16 krów czerwono-białych (RW) i 25 czarno-białych (BW) hodowanych w identycznych warunkach, z jednego udoju otrzymał następujące średnie objętości mleka w przeliczeniu na jedną krowę:

RW - 14,7 L mleka (SD = 1,4 L)

BW - 15,3 L mleka (SD = 1,5 L)

Przedstaw graficznie w jakich granicach z 95% prawdopodobieństwem znajdują się średnie z populacji RW i BW. Wysnuj wnioski statystyczne i powiedz jakiej rady udzieliłbyś temu rolnikowi przy zakupie stada krów mlecznych.

55. Zważono 61 chomików, a ponieważ ich ciężary (w gramach) były nieco dodatnio skośne dokonano transformacji przez spierwiastkowanie pierwiastkiem kwadratowym, uzyskując dla tak transformowanych danych średnią 20,0 i błąd standardowy 0,5. Oblicz 95% przedział ufności oraz średnią i granice przedziału ufności dla danych nietransformowanych.

56. Długość stopy nornicy rudej Clethrionomys glareolus w Puszczy Niepołomickiej ma rozkład normalny ze średnią i odchyleniem standardowym 15,8 ± 1,9 mm.

  1. Narysuj rozkład tej cechy w populacji. Zaznacz wartość średnią i SD; pod osią X zaznacz wartości rzeczywiste, a nad osią standaryzowane.

  2. Pewna nornica miała stopę o długości 16,5 mm. Oblicz standaryzowaną wartość tej długości i oznacz ją na wykresie. Co oznacza ten wynik?

57. Wykres przedstawia zależność tempa wzrostu człowieka od jego wieku. Jak należy postąpić z takimi danymi, aby ustalić istotność związku między tymi dwoma cechami?

0x01 graphic

58. Badano zawartość cynku w organizmie biegacza Pterostichus versicolor, z pomocą spektofotometru. Za pomocą roztworów o znanych stężeniach (cZn) wykalibrowano spektofotometr otrzymując następujące wartości absorbancji (A):

cZn [mg/L]

0

0,2

0,5

1,0

2,0

A

0,002

0,035

0,094

0,161

0,311

  1. Narysuj wykres punktowy zależności absorbancji od stężenia roztworu Zn.

  2. Jedno z niżej podanych równań opisuje tą zależność. Które?

A = 0,153 - 0,007 cZn A = 0,002 - 0,153 cZn

A = 0,007 + 0,153 cZn A = 0,153 + 0,007 cZn

  1. Jak nazywa się ta prosta? Nanieś ją na wykres.

  2. Jakie jest stężenie cynku w próbce z osobnika nr. 90, jeżeli absorbancja wynosi 0,110?

  3. Czy jest to model I czy II szeregu dwucechowego?

59. Badając na przestrzeni 20 lat związek między średnią temperaturą powietrza w marcu, a średnią datą przystąpienia do lęgów sikory modrej uzyskano r = 0,60. Oblicz, czy siła tego związku jest istotna. Podaj błąd I rodzaju, nawet, jeżeli go nie popełniasz. Z którym modelem szeregu dwucechowego mamy tu do czynienia?



Wyszukiwarka

Podobne podstrony:
1-14, ochrona środowiska UJ, I semestr SUM, statystyka
Biogeografia - egzamin - pytania UJ, ochrona środowiska UJ, I semestr SUM, biogeografia
statystyka 2014 I termin, ochrona środowiska UJ, I semestr SUM, statystyka
Biogeografia - ściaga egzamin, ochrona środowiska UJ, I semestr SUM, biogeografia
BIOGEOGRAFIA ściaga, ochrona środowiska UJ, I semestr SUM, biogeografia
ważne do prezentacji o nauce, ochrona środowiska UJ, I semestr SUM, podstawy dydaktyki
biogcw.ściąga, ochrona środowiska UJ, I semestr SUM, biogeografia
Biogeo.ściąga, ochrona środowiska UJ, I semestr SUM, biogeografia
formy organizacyjne, ochrona środowiska UJ, I semestr SUM, dydaktyka, dydaktyka
podsumowanie, ochrona środowiska UJ, I semestr SUM, dydaktyka
njjjjj, ochrona środowiska UJ, I semestr SUM, dydaktyka
Krzyzowki sprzez z plcia, ochrona środowiska UJ, I semestr SUM, genetyka
Przykładowe pytania, ochrona środowiska UJ, I semestr, statystyka
Miniskrypt, ochrona środowiska UJ, I semestr, statystyka
Zadania specjalne, ochrona środowiska UJ, I semestr, statystyka
Zadania, ochrona środowiska UJ, I semestr, statystyka
Uzupełnianka, ochrona środowiska UJ, V semestr, biologia roślin
zagadanienia, ochrona środowiska UJ, I semestr, matematyka - wszystko

więcej podobnych podstron