Na egzaminie będzie 8 pytań (zagadnień) z poniższych:
1. Opisz pojęcia populacja generalna, próba reprezentatywna i relacje między nimi.
Populacja generalna – zbiorowość statystyczna, czyli zbiór elementów mających co najmniej jedną właściwość wspólną lecz nieidentyczną ze względu na pewną cechę.
Próba (czyli część populacji podlegająca badaniu) powinna być reprezentatywna – odzwierciedla strukturę populacji pod względem badanej cechy.
2. Opisz rodzaje zmiennych losowych.
a. Ilościowe:
- ciągłe (np. waga, wynik matematycznych obliczeń jakiegoś współcz.).
- skokowe (liczby całkowite, np. liczba sęków w desce).
b. Dychotomiczne czyli binarne (zero-jedynkowe).
c. Nominalne (wartości opisane słownie, obserwacja opisowa, nie liczbowa, np. kolor oczu).
d. Porządkowe (obserwacja opisowa z wartościowaniem cechy, np. porażenie drewna przez drewno jady jest b. silne/ silne/ słabe).
3. Opisz sposoby obserwacji zmiennych losowych.
a. Pomiar – stosujemy w stosunku do zmiennej skokowej i ciągłej (wartości kg., cm…) b. Ocena wzrokowa - zamiast liczyć coś, to szacuje się, ocenia, często realizuje się to w % do zmiennych ilościowych i zmiennych binarnych
c. Ranking – sposób obserwowania zmiennej porządkowej ( w jednostkach elementarnych) d. Obserwacja według skali – dla zmiennej nominalnej – sztucznie narzuca się rangi/ liczby 4. Przedstaw statystyki opisowe będące miarami położenia
a. średnia arytmetyczna- x
b. średnia geometryczna- g
c. średnia harmoniczna- h
d. mediana (wartość środkowa)- me
e. wartość modalna (dominanta)- m0
5. Przedstaw statystyki opisowe będące miarami rozproszenia.
a. wariancja- s2
b. odchylenie standardowe- s
c. odchylenie przeciętne od wartości średniej- dx
d. odchylenie przeciętne od mediany- dme
6. Wymień rozkłady zmiennych losowych ciągłych
rozkład normalny
rozkład F Fishera
rozkład t Studenta
rozkład chi-kwadrat
rozkład jednostajny
7. Scharakteryzuj rozkład normalny
Rozkład normalny jest definiowany przez średnią i odchylenie standardowe.
Rozkład normalny, zwany też rozkładem Gaussa – jeden z najważniejszych rozkładów 1
prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp. Wykres funkcji prawdopodobieństwa tego rozkładu jest krzywą dzwonową.
8. Podaj nazwy współczynników jakie wyznacza się do sprawdzania zgodności między rozkładem empirycznym a rozkładem normalnym, przedstaw ich interpretację.
współczynnik skośności g1
g1 < 0 - rozkład empiryczny lewostronnie skośny w stosunku do odpowiedniego rozkładu normalnego, g1 > 0 - rozkład empiryczny prawostronnie skośny w stosunku do odpowiedniego rozkładu normalnego, g1 = 0 - rozkład empiryczny symetryczny,
współczynnik spłaszczenia g2
g2 < 0 - rozkład empiryczny spłaszczony w stosunku do odpowiedniego rozkładu normalnego, g2 > 0 - rozkład empiryczny strzelisty w stosunku do odpowiedniego rozkładu normalnego, g2 = 0 - rozkład empiryczny o maksimum takim jak odpowiedniego rozkładu normalnego.
9. Opisz procedurę testowania hipotez
a)postawienie hipotezy zerowej i alternatywnej
b)przyjęcie poziomu istotności alfa (prawdopodobieństwo popełnienia błędu I rzędu do odrzucenia hipotezy zerowej)
c)przeprowadzenie eksperymentu w celu zweryfikowania hipotezy
d)dobieranie odpowiedniego testu statystycznego
e)odczytuję wartości krytyczne z tabel dla danego rozkładu i podejmuję decyzję czy odrzucam hipotezę zerową czy nie
10.materiał, jednostka, układ – doświadczalny
a)Materiał doświadczalny – substancja lub materiał organiczny/nieorganiczny, w którym zachodzi proces lub zjawisko będące przedmiotem badań
b)Jednostka doświadczalna - naturalnie lub umownie wyróżniona część materiału doświadczalnego, która w całości jest jednakowo traktowana w doświadczeniu i względem której prowadzone są indywidualne obserwacje w czasie trwania i przy zakończeniu eksperymentu.
c) Układ doświadczalny - Schemat wskazujący jak jednostki doświadczalne są przypisane do obiektów, po ewentualnym pogrupowaniu tych jednostek.
11. Jakie typy układów doświadczalnych rozróżniamy?
a) układy niezależne:
a. układ całkowicie losowy
b. układ bloków (losowanych kompletnych lub niekompletnych)
c. układ wierszowo kolumnowy (np. kwadrat łaciński)
2
a. układ bloków losowanych kompletnych z jednostkami rozszczepionymi (Split-plot) b. układ bloków losowanych kompletnych z jednostkami rozszczepionymi w pasach
prostopadłych (Split- blok)
12. Podaj założenia analizy wariancji.
1. Zmienna obserwowana podlega rozkładowi normalnemu
2. Wariancje dla porównywanych grup są jednakowe - homogeniczność wariancji
13. Zapisz hipotezy ogólne weryfikowane metodą analizy wariancji dla doświadczenia dwuczynnikowego.
Czynnik A:
H
: µ = µ
= ... = µ H
:~ H
0 A
A
A
A
1A
0A
1
2
a
Czynnik B:
H
: µ = µ
= ... = µ H
:~ H
0 B
B
B
B
1B
0B
1
2
b
Interakcja AxB:
H
: brak i
nterakcji A
x
B H
:~ H
0 AxB
1AxB
0AxB
14. Co rozumiemy pod pojęciem, że występuje interakcja AxB? Wyjaśnij to na wykresie.
Zróżnicowana reakcja zmiennej obserwowanej dla poszczególnych gatunków (wariantów czynnika A) przy zmianie stężenia stosowanego środka (poziomów czynnika B).
25
gatunek 1
gatunek 2
20
gatunek 3
ćśo 15
gatunek 4
nzc
gatunek 5
te 10
u
gatunek 6
ks
5
0
stężenie stężenie stężenie stężenie stężenie
1
2
3
4
5
15. Co rozumiemy pod pojęciem, że nie występuje interakcja AxB? Wyjaśnij to na wykresie.
Jednakowa reakcja zmiennej obserwowanej dla poszczególnych gatunków (wariantów czynnika A) przy zmianie stężenia stosowanego środka (poziomów czynnika B).
25
gatunek 1
gatunek 2
20
gatunek 3
ćś
gatunek 4
o 15
nz
gatunek 5
c
te
gatunek 6
u 10
ks
5
0
stężenie stężenie stężenie stężenie stężenie
1
2
3
4
5
3
16. Podaj schemat postępowania dotyczący stawiania hipotez szczegółowych w sytuacji, gdy występuje interakcja.
Weryfikujemy hipotezy szczegółowe dla kombinacji doświadczalnych.
Nie analizujemy oddzielnie czynnika A i czynnika B
17. Podaj schemat postępowania dotyczący stawiania hipotez szczegółowych w sytuacji, gdy nie ma interakcja.
Weryfikujemy hipotezy szczegółowe dla czynnika A i czynnika B oddzielnie.
Możemy też porównywać kombinacje doświadczalne czynników A i B
18. Co rozumiemy pod pojęciem, że zmienne są skorelowane dodatnio lub ujemnie?
Na n elementach próbki losowej pobranej z populacji normalnej lub w przybliżeniu normalnej obserwowana jest zmienna dwuwymiarowa (x, y). Na podstawie obserwacji (x1, y1), (x2, y2), …, (xn, yn) wyznaczona jest wartość współczynnika korelacji. Współczynnik korelacji przyjmuje wartości od -1 do 1
0-brak korelacji, -1 – skorelowanie ujemne, a więc ze wzrostem wartości jednej cechy, maleje wartość cechy drugiej, 1 – skorelowanie dodatnie
19. Kiedy mówimy, że zmienne nie są skorelowane?
Zmienne nie są skorelowane gdy współczynnik korelacji wynosi 0 gdyż wtedy mówimy o braku korelacji 20. Jak interpretujemy współczynnik determinacji (R kwadrat)?
Współczynnik determinacji określa w jakim procencie wartości zmiennej X wpływają na wartości zmiennej Y. Im współczynnik
2
R jest bliższy 100%, tym w wyższym stopniu model wyjaśnia
zmienność całkowitą zmiennej Y.
21. Podaj 3 własności funkcji regresji liniowej.
a. Prosta regresji przechodzi przez współrzędne (x średnie,y średnie)
b. Miarą dopasowania prostej regresji do punktów empirycznych jest współczynnik determinacji Określa on w jakim procencie wartości zmiennej X wpłyną na wartości zmiennej Y.
c. W oparciu o równanie regresji możemy przewidzieć z pewną dokładnością wartości zmiennej Y dla wartości zmiennej X z przedziału <Xmin;Xmax>
22. Wymień 4 typy modeli krzywoliniowych, które można linearyzować.
- wykładniczy,
- potęgowy,
- hiperboliczny,
- typu logarytmicznego
23. Wyjaśnij pojęcie zmienna główna, zmienna towarzysząca i podaj nazwę analizy, którą stosuje się, gdy te dwie zmienne są obserwowane na jednostkach z układu doświadczalnego.
Zmienna główna- Jeżeli badana zmienna y uwarunkowana jest od wartości inne mierzalnej zmiennej x, to zmienną y nazywamy zmienną główną
Zmienna towarzysząca- zmienne, niekontrolowane przez badacza, ale obserwowalne w czasie badania Nazwa analizy : Analiza Kowariancji ( ANCOVA).
4
24. Podaj założenia analizy regresji.
Zakładamy że:
- dla każdej wartości X zmienna Y ma rozkład normalny z jednakową nieznaną wariancją
- wartość średnia µ zmiennej Y zależy od X
25. Kiedy stosuje się analizę regresji krzywoliniowej wielomianowej, podaj równanie regresji krzywoliniowej wielomianowej?
Stosujemy wówczas, gdy wraz ze wzrostem wartości zmiennej X wartości zmiennej Y rosną lub maleją ze zmienną prędkością np. najpierw wolno, a potem szybciej.
Równanie regresji krzywoliniowej wielomianowej:
dla <Xmin; Xmax> (z karty wzorów z ćwiczeń)
26. Co jest celem stosowania metody krokowej wstecznej dla modelu regresji krzywoliniowej wielomianowej?
y= β0 + β1x + β2x2 +… + βkxk + ε
Celem stosowania metody krokowej wstecznej dla modelu regresji krzywoliniowej wielomianowej jest redukcja (zmniejszenie) stopnia wielomianu.
27. Kiedy stosuje się analizę regresji wielorakiej (wielokrotnej)?
Ogólnym celem regresji wielorakiej jest ilościowe ujęcie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (kryterialną, objaśnianą).
28. Podaj model regresji wielorakiej (wielokrotnej) prostoliniowej?
29. Co jest celem stosowania metody krokowej wstecznej dla modelu regresji wielorakiej prostoliniowej?
Celem stosowania metody krokowej wstecznej dla modelu regresji wielorakiej prostoliniowej jest redukcja (zmniejszenie) liczby zmiennych niezależnych. Eliminuje się zmienne o najmniejszym wpływie na Y.
30. Kiedy stosujemy metody nieparametryczne?
Testy parametrycznych nie stosujemy, gdy zmienne maja charakter jakościowy czy też uporządkowany.
Testy NIEPARAMETRYCZNE wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne jak : zgodność z rozkładem normalnym, jednorodność wariancji itp.
5