1.Charakterystyki liczbowe opisujące zbiorowość to:
parametry (wyznaczone dla populacji) oraz statystyki (wyznaczone dla próby)
statystyki (wyznaczone dla populacji) oraz parametry (wyznaczone dla próby)
statystyki pełne (wyznaczone dla populacji) oraz statystyki częściowe (wyznaczone dla próby)
parametry pełne (wyznaczone dla populacji) oraz parametry częściowe (wyznaczone dla próby)
2. Różnicę pomiędzy dwiema wartościami estymatora można uznać za statystycznie nieistotną, jeżeli jest:
a) większa od przyjętej wartości granicznej
b) mało prawdopodobne, że pojawiła się przypadkowo
c) mniejsza od przyjętej wartości granicznej
d) bardzo prawdopodobne, że pojawiła się przypadkowo
3. Szereg rozdzielczy punktowy prosty nadaje się do analizy danych:
a) wyłącznie jakościowych
b) jakościowych i ilościowych, ale wyłącznie o wartościach dyskretnych
c) ilościowych, o wartościach zarówno dyskretnych, jak i ciągłych
d) wyłącznie ilościowych o wartościach dyskretnych
4. Pomiędzy modą (M), medianą (Q) i średnią arytmetyczną (x) rozkładu lewoskośnego zachodzą następujące zależności
M>Q>x
5.Do miar rozproszenia rozkładu należą:
Rozstęp kwartylowy, wariancja oraz błąd standardowy średniej
Kurioza, wariancja oraz odchylenie standardowe
Współczynnik zmienności, wariancja oraz odchylenie standardowe
Rozstęp kwartylowy, współczynnik zmienności oraz odchylenie standardowe
6. W porównaniu do rozstępu kwartylowego, odchylenie standardowe:
a) jest mniej narażone na wartości odstające oraz lepiej się nadaje do analizy rozkładu
b) jest bardziej narażone na wartości odstające oraz lepiej się nadaje do analizy rozkładu
c) jest bardziej narażone na wartości odstające oraz gorzej się nadaje do analizy rozkładu
d) jest mniej narażone na wartości odstające oraz gorzej się nadaje do analizy rozkładu
7. Pewna próba losowa x ma średnią x=10 i odchylenie standardowe s=2. Normalizacji ze wzoru… dokonuje się w celu:
a) uzyskania rozkładu o tendencji centralnej jeżeli zmienna x ma rozkład lewostronny
b) uzyskanie rozkładu o tendencji centralnej jeżeli zmienna x ma rozkład prawostronny
c) zmniejszenie wpływu wartości odstających na parametry rozkładu
d) otrzymanie rozkładu o średniej x=0 i odchylenia standardowego s=….
8. Dystrybuanta:
a) może być wyznaczona na podstawie szeregu prostego dla próby….
b) określa prawdopodobieństwo wystąpienia wartości mniejszej od x
c) jest pochodną funkcji gęstości prawdopodobieństwa
d) jest funkcją malejącą o wartościach …..
9. Pewna zmienna X ma rozkład normalny o średniej x=5…..
11. Pewna zmienna X ma rozkład t-Studenta o średniej równej 15 i odchyleniu standardowym równym ….
P1=P2
12. Efektywność estymatora jest miarą:
a) łatwości, z jaką można go policzyć
b) zgodności jego średniej ze średnią estymowanego parametru
c) tego, czy zawyża lub zaniża estymowany parametr
d) jego wariancji
13. Błąd drugiego rodzaju:
„Błąd II rodzaju popełnia się wówczas, gdy przyjmuje się hipotezę zerową wtedy, gdy jest ona fałszywa”
Określenie poziomu istotności umożliwia ustalenie prawdopodobieństwa popełnienia błędu I rodzaju.
Wnioskuję, że chodzi tu o odpowiedź c), która miałaby brzmieć : polega na przyjęciu fałszywej hipotezy zerowej; jego prawdopodobieństwo (nie jest możliwe do)…. określenia na podstawie testów istotności
a) polega na przyjęciu fałszywej hipotezy zerowej; jego prawdopodobieństwo można…. za pomocą testów istotności
b) polega na odrzuceniu prawdziwej hipotezy zerowej; jego prawdopodobieństwo ….. pomocą testów istotności
c) polega na przyjęciu fałszywej hipotezy zerowej; jego prawdopodobieństwo nie jest możliwe do określenia na podstawie testów istotności
d) polega na odrzuceniu prawdziwej hipotezy zerowej; jego prawdopodobieństwo ….. do określenia na podstawie testów istotności
14. Test t-Studenta jest testem:
a) parametrycznym dla średnich w dwóch próbach zależnych lub niezależnych
b) nieparametrycznym
c) parametrycznym dla wariancji w dwóch próbach zależnych lub niezależnych
d) parametrycznym dla średnich w dwóch próbach o równych wariancjach
15. Do badania rozkładów cech jakościowych służą testy:
a) serii
b) znaków
c) Kołmogorowa - Smirnowa
d) proporcji
16. Miarą siły związku pomiędzy zmiennymi jest:
korelacja
20. Klasteryzacja metodą Gaussa polega na:
a) określeniu prawdopodobieństwa przynależności poszczególnych pomiarów do
b) wyznaczeniu dendrogramu dla analizowanych danych
c) podziale danych na rozłączne grupy wokół centroidów
d) podziale danych na grupy zagnieżdżone na różnych poziomach
Idea klasteryzacji. Dażymy do takiego podziału zbioru danych aby wariancja wewnatrz-grupowa (w każdym z klastrów była możliwie mała) a jednoczesnie wariancja miedzy-grupowa możliwie duża.
21. Estymacja punktowa polega na:
Punktowym oszacowaniu wartości szukanego parametru rozkładu. Punktowe oszacowanie oznacza tutaj, że uzyskujemy konkretną wartość liczbową, nie zaś przedział liczbowy, jak dzieje się to w przypadku estymacji przedziałowej.
22. Nieobciążonym estymatorem odchylenia standardowego z populacji jest wartość równa wartości oczekiwanej szacowanego parametru.
23. Przy testowaniu hipotez parametrycznych za pomocą testów prawostronnych hipotezę zerową należy odrzucić gdy wynik testu jest większy od przyjętego poziomu istotności.
24. Test F-Snedecora służy do analizy wariancji dwóch prób o rozkładzie normalnym.
25. Współczynnik determinacji pomiędzy zmiennymi X i Y określa jaka część zmienności zmiennej objaśnianej została wyjaśniona przez model.
26. Który współczynnik korelacji - Pearsona czy Spearmana - jest bardziej czuły na wartości odstające. Dlaczego?
Współczynnik korelacji Pearsona jest bardziej czuły na wartości odstające, ze względu na dane niezrangowane. Rangowanie niweluje negatywny wpływ odstających na wynik.
27. Metoda średnich ruchomych w analizie szeregów czasowych służy do wyeliminowania z szeregu wahań przypadkowych, a przy odpowiednim postępowaniu także wahań okresowych.
28. Cross - kowariancja pomiędzy dwoma szeregami czasowymi daje informację o istnieniu bądź braku korelacji między danymi szeregami czasowymi (?) (jakieś pomysły - proszę edytowac ;])
29. Klasteryzacja metodą Gaussa różni się od klasteryzacji metodą k - średnich tym, że:
Klasteryzacja metodą Gaussa polega na wyznaczeniu dendrogramu dla danych. Klasteryzacja metodą k-średnich polega na podziale danych na rozłączne grupy wokół centroidów.
30. Cele analizy PCA to maksymalizacja wariancji kolejnych współrzędnych układu w celu stworzenia nowej przestrzeni obserwacji, w której najwięcej zmienności wyjaśniają początkowe czynniki.