PYTANKA OD PROF. ARANOWSKIEJ
13). Z jaką pewnością przyjmuje się hipotezę zerową. Podaj definicję hipotez rozważanych w trakcie wnioskowania.
Hipotezę zerową przyjmuje się z pewnością 1 – alfa, np. jeżeli zakładamy, że alfa = 0,05, to hipotezę zerową przyjmujemy z pewnością 0,95.
W trakcie wnioskowania rozważamy hipotezy: zerową, alternatywną (różnościową bądź kierunkową)
Hipoteza zerowa jest zawsze hipotezą równościową i prostą. Jest hipotezą na temat parametru populacyjnego, którą testuje badacz.
Hipoteza alternatywna jest zaprzeczeniem hipotezy zerowej. Może przyjmować postać różnosciową bądź kierunkową ( w zależności od problemu badawczego )
14). Jakie znasz skale pomiarowe.
Skala nominalna:
Liczby służą tylko do oznaczenia oraz identyfikacji i klasyfikowania obiektów.
Jedna liczba odpowiada tylko i wyłącznie jednemu obiektowi.
Liczby nie odzwierciedlają sumy cech posiadanych przez obiekty.
Jedyną dopuszczalna operacją na liczbach skali nominalnej jest ich zliczanie.
Dopuszczalne jest stosowanie ograniczonej liczby statystyk np. procenty i moda.
wartości na tej skali nie mają oczywistego uporządkowania (np. nazwy miejscowości).
Jedyną dozwoloną relacją porównującą dwie wartości na skali nominalnej jest równość.
Wśród skal nominalnych wyróżnia się czasem skale dychotomiczne przyjmujące tylko dwie wartości, np odpowiedź na pytania tak/nie.
Skala porządkowa:
Skala porządkowa umożliwia uporządkowanie obiektów (przydzielenie liczb) ze względu na stopień nasilenia pewnej cechy .
Możemy określić, że dany obiekt ma więcej lub mniej danej cechy, ale nie możemy określić o ile > lub <, ponieważ skala ta nie stałej jednostki pomiaru.
Każde serie liczb, które zachowują uporządkowane relacje między obiektami uznajemy za skale porządkowe.
Oprócz operacji liczenia dozwolonej na skali nominalnej, skale porządkowe pozwalają na użycie statystyk opartych na centylach, np. percentyla, kwartyli i mediany.
Skala interwałowa:
Równe liczbowo dystanse pomiędzy liczbami na skali reprezentują reprezentują równe wartości cechy poddanej pomiarowi – stała jednostka pomiaru.
Skala interwałowa pozwala na porównywanie różnic między cechami.
Brak ustalenia punktu „0”. Zarówno punkt „0”, jak i jednostki pomiaru są ustalane arbitralnie.
Każda pozytywna liniowa transformacja w postaci
y = a + bx będzie zachowywała własności tej skali.
Zaleca się wykorzystywanie w analizach relacji interwałów skali.
Możemy stosować wszystkie techniki statystyczne właściwe dla skal nominalnej i porządkowej, oraz średnią arytmetyczną, odchylenie standardowe.
Skala ilorazowa:
Posiada wszystkie własności skali nominalnej, porządkowej i interwałowej (stała jednostka miary).
Posiada nie arbitralny punkt „0” skali ( tzw.0 bezwzględne)
Nie tylko różnice, ale także ilorazy wielkości mają interpretację. ( nie tylko „o ile jednostek” coś jest większe/mniejsze, ale i „ile razy” coś jest większe/mniejsze)
Umożliwia precyzyjne obliczanie relacji między wartościami skali.
Dozwolone są tylko proporcjonalne transformacje w formie y = bx, gdzie b jest liczbą dodatnią.
Możemy stosować wszystkie statystyki i techniki statystyczne.
15). Co znaczy termin rozkład z próby statystyki.
Rozkład z próby statystyki jest to rozkład prawdopodobieństwa estymatora tej statystyki, opisujący zmienność statystyki w zbiorze powtarzanych prób.
(tego nie jestem pewna)
16). Ile stopni swobody ma wariancja i dlaczego?
Spośród n odchyleń podniesionych do kwadratu, tylko n-1 może się swobodnie zmieniać. Wariancja ma n-1 stopni swobody.
[ Liczba stopni swobody dla statystyki będącej estymatorem nieznanej wartości parametru populacji jest równa liczbie wyników, które w sposób niezależny od siebie przyczyniają się do wyznaczenia wartości tej statystyki.]
Wariancja ma n – 1 stopni swobody, ponieważ ostatni wynik w próbie nie jest niezależny – wpływa na niego średnia arytmetyczna, która jest na stale przywiązana do próby. (średnia jest na stałe przywiązana do próby i ponieważ musimy ja wyznaczyć to tracimy na to „1 punkt”)
17). Podaj definicję kwantyli. Jaki jest związek mediany z kwantylami.
Kwantyle to mierniki pozycyjne – zajmują takie miejsce, że dzielą rozkład w interesujący nas sposób. Mediana jest kwantylem 0,5 rzędu.
Kwantylem k rzędu m, k= 1,2,…,m zmiennej losowej X nazywa się wartość x należy do X spełniają równanie:
P(X < bądź równe x) = $\frac{k}{m}$, 0 < $\frac{k}{m}$ < lub równe 1
m = 4 $\frac{k}{4}$ k = 1, 2, 3, 4 - Kwartyle
m = 10 $\frac{k}{10}$ k = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 - Decyle
m = 100 $\frac{k}{100}$ k = 1, 2, 3,…, 50, … , 100 - Centyle, Percentyle
Kwantyl m rzędu n to xmax
18). Wystandaryzowany rozkład normalny i jego własności.
Ten czerwony to normalny wystandaryzowany
Właściwości ( rysunek kalka 23)
- Pole na odcinku jednego odchylenia standardowego od średniej (na lewo i prawo) stanowi 68% całego pola w przypadku zmiennej o normalnym rozkładzie prawdopodobieństwa.
- Na odcinku dwu odchyleń – 95,5% całego pola, zaś na odcinku 3 odchyleń – 99,7% pola.
19). Co znaczy termin wartość krytyczna testu statystycznego.
Wartość krytyczna testu statystycznego stanowi granicę pomiędzy przedziałem ufności i przedziałem istotności. Im mniejsza wartość krytyczna, tym łatwiej odrzucić hipotezę zerową, ponieważ potrzeba nam do tego mniej wartości skrajnych.
20). Jaka jest definicja statystyki t – studenta i przy jakich założeniach można ją stosować.
Założenia:
- zmienna X – skala przynajmniej przedziałowa (mierzalna)
- zmienna zależna ma rozkład normalny X (mi, sigma2)
- próba losowa, n – elementowa
- alfa – określone subiektywnie
H0: mi = mi0
H1: mi ≠ mi0
t = $\frac{\mathbf{\, x - \ \mu}}{\mathbf{\sigma}_{\mathbf{x}}}\mathbf{= \ }\frac{\mathbf{x - \ \mu}}{\mathbf{S}}\mathbf{\ \times \ }\sqrt{\mathbf{n}}$
21). Jaką interpretację mają wartości znanych statystyk t – studenta.
Gdy |t|>tdf H0- hipotezę zerową odrzucamy, przyjmując alternatywną.
Gdy |t|<tdf H0+ nie ma podstaw do odrzucenia hipotezy zerowej.
22). Narysuj rozkładał testu F – Fischera i podaj jego definicję.
Jest to test do sprawdzania homogeniczności wariancji dwóch (i tylko dwóch) populacji niezależnych.
Założenia:
- X – skala (przynajmniej przedziałowa)
- X N (μ1; σ12)
- X N (μ2; σ22)
- dwie próby losowe, niezależne
- α − okreslone subiektywnie
Statystyka testu:
F = $\frac{\mathbf{\sigma}_{\mathbf{1}}^{\mathbf{2}}}{\mathbf{\sigma}_{\mathbf{2}}^{\mathbf{2}}}\mathbf{\approx \ }\frac{\mathbf{S}_{\mathbf{1}}^{\mathbf{2}}}{\mathbf{S}_{\mathbf{2}}^{\mathbf{2}}}\mathbf{\ \geq 1}$
f1 = n1 – 1
f2 = n2 – 1
S12 – wariancja większa ( z próby o liczebności n1, ze stopniami swobody f1 = n1 – 1 )
S22 – wariancja mniejsza ( z próby o liczebności n2, ze stopniami swobody f2 = n2 – 1 )
F > Fα, f1, f2 Ho-
F ≤ Fα, f1, f2 H0+
RYSUNEK KALKA 47!
23). Postaw hipotezy stawiane przy weryfikowaniu homogeniczności wariancji dwu populacji. Czy mogą mieć postać alternatywną?
H0: sigma12 = sigma22 = sigma2
H1: sigma12 > sigma22 (zawsze taka postać)
24). Kiedy o próbach mówi się „próby niezależne”, a kiedy „próby zależne”. Czy rozróżnienie to wpływa na sposób testowania hipotezy zerowej?
(chyba) Próby niezależne, to próby, które pobrane zostały z dwóch populacji, które są niezależne od siebie (całkiem inne). Próby zależne pobrane są z jednej populacji aczkolwiek w pewnych odstępach czasowych (np. pierwsza próba pobrana na godzinę przed występem a druga na 5 minut przed występem).