2) Miary tendencji centralnej: średnia arytmetyczna, modalna i mediana. W populacji: mi-wartość oczekiwana; modalna,moda,dominanta-M- wartość X najbardziej prawdopodobna (gęsta); mediana-Me- wartość X poniżej (i powyżej) której wartość zmiennej realizuje się z pewnością 0,5; w próbie: m-modalna-wartość najcxęściej występująca w próbie; me- wartość X od której dokładnie połowa pomiarów uzyskana w n-elementowej grupie jest mniejsza i dokładnie połowa jest większa.
3) Średnia arytmetyczna własności - 1) wrażliwa na wyniki skrajne 2) suma odchyleń wszystkich pomiarów od średniej arytmetycznej wynosi 0 3)jest punktem równowagi odległości wszystkich pomiarów mniejszych i większych od średniej 4) suma kwadratów wszystkich odchyleń wielkości pomiarowych od ich wielkości średniej jest mniejsza od sumy kwadratów odchyleń tych pomiarów od każdej dowolnej wielkości pomiarowej xo, xo nie jest równe xzkreseczką, xo zawiera się w X
5) poziom dochodów - skala ilorazowa(stosunkowa), wyznanie - skala nominalna, wykształcenie - skala porządkowa.
6) Wrażliwa na skrajne wyniki jest średnia arytmetyczna. Jeden skrajny wynik może spowodować jej duży wzrost lub spadek.
9)Liczba stopni swobody dla statystyki będącej estymatorem nieznanej wartości parametru populacji jest równa liczbie wyników, które w sposób niezależny os siebie przyczyniają się do wyznaczania wartości tej statystyki.
10) Wariancja to średnia kwadratowa odległość pomiaru od średniej arytmetycznej (lub suma kwadratów podzielona przez stopnie swobody). Ma n-1 stopni swobody.
11) Wariancja ma n-1 stopni swobody, ponieważ tylko jeden pomiar jest potrzeby (jest zależny), by ją wyznaczyć.
12) Standaryzacja jest to zmiana rozkładu zmiennej zaleznej na rozkład normalny(????).Własności standaryzacji: 1) zachowuje pole pod krzywą, 2) przenosi średnią do punktu 0 3) Odchylenie standardowe=1 4) zmienia kształt rozkładu dla zmiennej ciągłej (gdy sigma większe od 1 - bardziej smukły; sigma <1 - spłaszczony).
13. Co to jest wynik wystandaryzowany?
Liczba odchyleń standardowych w odległości od średniej.
Transformacja standaryzacji:
Zi= $\frac{\mathbf{x}_{\mathbf{i}}\mathbf{-}\mathbf{\ }\mathbf{\mu}}{\mathbf{\sigma}}$ ; x = μ ± zi x σ
xi - wynik surowy zmiennej X
zi - wynik wystanadryzowany zmiennej X
- z własności miar rozproszenia wynika, że skoro odchylenie standardowe zmiennej X równe jest S, to odchylenie standardowe zmiennej X – x (X minus stała) równe jest także S.
- Dalej, (X-x)x $\frac{1}{S}$ ( X – x pomnożona przez stałą) ma odchylenie S pomnożone przez stalą, czyli S/S= 1. Zmienna „Z” ma odchylenie równe 1.
- Z postaci wzoru bezpośrednio wynika, że średnia arytmetyczna zmiennej Z równa jest 0.
- Wyniki standardowe stosuje się w celu porównywania pomiarów otrzymywanych przy użyciu różnych procedur u tego samego badanego, bądź badanych między sobą.
14. Narysuj rozkład prawo skośny oraz lewo skośny. W jakiej kolejności ustawią się miary tendencji centralnej w tych rozkładach?
Rozkład prawo skośny
m < me < x
Rozkład lewo skośny – odwrotnie.
Odwrotnie: x < me < m
15. Co oznacza termin „kurtoza”?
Kurtoza to miara skośności.
Zielony wykres – rozkład normalny
Niebieski – rozpłaszczony (platykurtyczny)
Czerwony – spiczasty (leptokurtyczny)
Różowy nas nie interesuje ;)
K3 = $\frac{m_{4}}{m_{2}^{2}}$ - 3
K3(oszacowanie) = $\frac{n\ x\ \sum_{i = 1}^{n}{(x_{i} - \ x)}^{4}}{{\lbrack\ \sum_{i = 1}^{n}\left( \ x_{i} - \ x \right)^{2}\rbrack}^{2}}$ – 3
- Dla rozkładu normalnego k=0, stąd $\frac{m_{4}}{m_{2}^{2}}$ – 3
- Dla rozkładu platykurtycznego k<0, zaś w przypadku rozkładu leptokurtycznego k>0;
- Wyższych (momentów) niż „cztery” w praktyce nie używa się do opisu zmiennej losowej.
16. Co to są kwantyle? Jaki jest związek mediany z kwantylami?
Kwantyle to mierniki pozycyjne – zajmują takie miejsce, że dzielą rozkład w interesujący nas sposób. Mediana jest kwantylem 0,5 rzędu.
Kwantylem k rzędu m, k= 1,2,…,m zmiennej losowej X nazywa się wartość x należy do X spełniają równanie:
P(X < bądź równe x) = $\frac{k}{m}$, 0 < $\frac{k}{m}$ < lub równe 1
m = 4 $\frac{k}{4}$ k = 1, 2, 3, 4 - Kwartyle
m = 10 $\frac{k}{10}$ k = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 - Decyle
m = 100 $\frac{k}{100}$ k = 1, 2, 3,…, 50, … , 100 - Centyle, Percentyle
Kwantyl m rzędu n to xmax
17. Co to jest dystrybuanta? Jakie ma własności? Narysuj dystrybuantę rozkładu normalnego oraz normalnego standaryzowanego.
Dystrybuanta zmiennej losowej X to funkcja przyporządkowująca każdej wartości zmiennej
prawdopodobieństwo przyjęcia przez zmienną tej właśnie wartości lub wszystkich od niej
mniejszych.
F(x) = P (X ≤ x)
Jako że mowa o dystrybuancie zmiennej X, która ma rozklad normalny [X→N(μ,σ2)], zmienna ta
jest zmienna ciagłą, przyjmującą wszystkie wartości ze zbioru liczb rzeczywistych, czyli od -∞
(minus nieskończoności) do +∞ (plus nieskończoności).
Jak wiadomo, skoro zmienna jest ciągła (a taką zmienna jest zmienna o rozkładzie normalnym),
jej dystrybuanta także jest funkcją ciągłą. Co nie oznacza, że jest tak zawsze. Dla zmiennej
dyskretnej (skokowej) dystrybuanta nie będzie funkcją ciagłą, ale takimi zmiennymi i ich
dystrybuantami aktualnie się nie zajmujemy.
Nasze rozważania dotyczą tylko zmiennej o rozkładzie normalnym i jej dystrybuanty.
Skoro dystrybuanta to – krótko mówiąc – prawdopodobieństwo, z jakim zmienna przyjmuje daną
wartość lub wszystkie wartości mniejsze od niej, to jakie wartości może przyjmować
dystrybuanta? Jakie wartości może przyjmować prawdopodobieńtwo? Od zera do jedności, czyli
F(x) może przyjmować wartości z przedziału <0,1>.
Jak pamiętamy, gdy mamy do czynienia ze zmienną ciągłą, prawdopodobieńtwo jest miarą pola
pod krzywą funkcji gęstości prawdopodobieńtwa. Skoro prawdopodobieńtwo jest miarą pola
(całe pole pod krzywą jest róne jedności), to dystybuanta stanowi pole pod krzywą nad
przedziałem od -∞ do danej wartości.
Na osi OX (poziomej) znajdują się wartości zmiennej.
Mogą to być wyniki surowe, czyli wyrażone w jednostkach przyjętych do pomiaru wartości
zmiennej (np. wartości na skali motywacji, agresji, iloraz inteligencji itp.) – oznaczamy je wtedy
jako x.
Lub mogą być w postaci wystandaryzowanej (czyli w jedostkach odchyleń standardowych od
średniej) – oznaczamy je wtedy jako z.
Pole nad osią OX jest miarą prawdopodobieństwa.
Obszar nad danym przedziałem na osi OX, a pod krzywą, wyznacza prawdopodobieństwo, że
zmienna przyjmie wartości z tego przedziału.
18. Omów własności rozkładu normalnego.
Postać krzywej normalnej zależy od wartości dwóch parametrów, które pozwalają
na jednoznaczne określenie kształtu rozkładu normalnego, a mianowicie średniej (μ) i odchylenia
standardowego (σ).
X → N (μ, σ)
Średnia i odchylenie standardowe całkowicie determinują kształt rozkładu normalnego.
W rozkładzie normalnym jedno odchylenie standardowe jest odległością pomiędzy średnią a
punktem przegięcia krzywej rozkładu.
Wszystkie rozkłady normalne są rozkładami o kształcie dzwonowatym i są symetryczne.
Każdy rozkład normalny jest symetryczny, jednakże z symetrii rozkładu nie wynika jego
normalność.
Funkcja gęstości prawdopodobieństwa osiąga maksimum w punkcie równym μ. Punkt ten
pokrywa się z Me i M.
Zmienna o rozkładzie normalnym z największym prawdopodobieństwem realizuje się w
postaci wartości równych μ (μ = M), połowa jej wartości nie przekracza μ, a połowa jest od
niej większa (μ = Me). Wartości funkcji gęstości prawdopodobieństwa maleją i dążą
asymptotycznie do osi OX, gdy wyniki oddalają się od μ.
Rozkłady normalne o tej samej średniej, a o różnych odchyleniach standardowych różnią się
kształtem (wszystkie są „dzwonowate”, ale bardziej lub mniej wysmukłe – kształt rozkładu
zależy od odchylenia standardowego wyników), natomiast rozkłady o tym samym odchyleniu
standardowym, ale o różnych średnich są przesunięte względem siebie na osi OX.
Powierzchnia pod wykresem funkcji gęstości prawdopodobieństwa a nad osią OX, czyli całe
pole pod krzywą, jest równe 1.
19. Omów własności rozkładu normalnego standaryzowanego.
20. Narysuj rozkład normalny o małej i dużej wariancji. + 21. Narysuj rozkład normalny o małym (mniejszym od 1) odchyleniu standardowym oraz rozkład o dużym (większym od 1) odchyleniu standardowym. Przedstaw na rysunku oba rozkłady w postaci wystandaryzowanej.
22. Przyjmując, że zmienna losowa X ma rozkład normalny, podaj wartość prawdopodobieństwa zrealizowania się jej wartości w przedziałach: (μ - 1σ; μ + 1σ), (μ - 2σ; μ + 2σ), (μ - 3σ; μ + 3σ).
W rozkładzie normalnym wystandaryzowanym:
P(μ - 1σ ≤ X ≤ μ + 1σ) = 0,683
W przedziale jednego odchylenia standardowego wokół średniej (μ ± 1σ) znajduje się 68,3%
całego pola pod krzywą.
P(μ - 2σ ≤ X ≤ μ + 2σ) = 0,955;
W przedziale dwóch odchyleń standardo – 2,33wych wokół średniej (μ ± 2σ) znajduje się 95,5% całego
pola pod krzywą.
P(μ - 3σ ≤ X ≤ μ + 3σ) = 0,997.
W przedziale trzech odchyleń standardowych wokół średniej (μ ± 3σ) znajduje się 99,7% całego
pola pod krzywą.
23. Jaki odsetek studentów uzyska wyniki leżące w granicach dwóch odchyleń standardowych powyżej średniej (czyli w przedziale <μ;μ+2σ>) przyjmując, że w populacji studentów psychologii rozkład poziomu odczuwanego na co dzień optymizmu można uznać za normalny?
0,4475 – 44,75% (chyba)
A jaki odsetek studentów charakteryzują bardzo wysokie poziomy optymizmu, wyższe od wartości oddalonej o dwa odchylenia standardowe powyżej średniej?
1 – 0,955/2 = 0,0225 (chyba)
24. Z jakiego przedziału zmienna losowa X o rozkładzie normalnym przyjmuje wartości z prawdopodobieństwem równym 0,99?
P(μ−2,58 x σ≤X ≤ μ+2,58 x σ) - nie mam pojęcia czy to tak ^
25. Z jakiego przedziału zmienna losowa X o rozkładzie normalnym przyjmuje wartości z
prawdopodobieństwem równym 0,95?
Z przedziału <-∞; 1,64>
26. Ile wynosi modalna rozkładu normalnego standaryzowanego?
Modalna w rozkładzie normalnym jest równa medianie i średniej i po wystandaryzowaniu wynosi 0.
27. Jakie parametry pozwalają jednoznacznie określić kształt krzywej normalnej?
Średnia i wariancja
28. Co oznacza termin „statystyka z prób/próby”? Czym różni się statystyka z próby od
statystyki w próbie?
Statystyka z prób jest to zmienna, która przyporządkowuje swoje wartości próbom losowanym z populacji, natomiast statystyka w próbie jest to konkretna wartość zmiennej statystyka z prób.
29. Co oznacza termin „rozkład z prób/próby”?
rozkład uzyskany dla nieskończenie wielu prób losowanych z populacji przy założeniu, że prawdziwa jest hipoteza zerowa- nie jestem pewna czy to dobra odp. (!)
30. Co to jest błąd standardowy?
Bł. standardowy jest to odchylenie standardowe w rozkładzie statystki z prób np. bł. stand. średniej, średniej z różnic, różnicy średnich.
31. Ile wynosi błąd standardowy średniej? Jakie może on przyjmować wartości?
Wynosi sigma/ pierwiastek z n, przyjmuje wartości z przedziału: <0; sigma>, maleje wraz ze wzrostem liczebności próby.
32. Co to jest estymator? Podaj przykład znanego Ci estymatora.
Estymatorem nieznanej wartości parametru populacji nazywamy taką statystykę z prób, której rozkład wykorzystujemy w celu oszacowania nieznanej wartości parametru. Każdy estymator jest jakąś statystyką z prób, czyli jest zmienną. Estymatorem danego parametru może być tylko taka statystyka z prób, której rozkład jest wrażliwy na zmianę wartości tego parametru
4. własności estymatorów:
-nieobciążony
-maksymalnie efektywny
-zgodny
-dostateczny
1.) nieobciążony- średnia jego rozkładu jest równa wartości parametru w populacji.
Obciążenie- różnica pomiędzy śr. w rozkładzie estymatora, a wartością parametru w populacji.- im większe próby tym mniejsze obciążenie.
2.) efektywny- estymator o najmniejszej wariancji- błędzie standardowym
33. Czy termin „statystyka” oznacza to samo co termin „estymator parametru”?
Wydaje mi się, że tak, ręki sobie natomiast uciąć nie dam ;D.
34. Przytocz i omów Centralne Twierdzenie Graniczne.
Jeżeli z populacji, w której zmienna losowa X ma dowolny rozkład prawdopodobieństwa ze średnią równą μ i wariancją równą sigma kwadrat losujemy kolejno próby losowe X o coraz większej liczbie elementów n to wraz ze wzrostem liczy losowań rozkład estymatora μ, czyli rozkład średniej z prób (x z kreseczką), dąży do rozkładu normalnego ze średnią równą μ i wariancją sigma kwadrat/ n.
35. Omów, w jaki sposób należy oszacować nieznaną wartość parametru μ w populacji.
Szacujemy tę wartość za pomocą estymatora.
Możemy wybrać estymację punktową lub przedziałową, ta druga jest zdecydowanie lepsze i stosowana najczęściej.
Punktowa- polega na uznaniu, że nieznana wartość parametru jest w przybliżeniu równa wartości estymatora tego parametru dla dużej próby.
Przedziałowa- polega na zbudowaniu przedziału ufności dla nieznanej wartości parametru
Wzór wg. Wikipedii ;D, myślę, że ten Aranowskiej każdy jakoś ogranie w notatkach, bo gdybym ja go napisała słownie nie byłoby zbyt czytelnie ;P
36. Co wpływa na długość przedziału ufności dla nieznanej wartości parametru μ w
populacji?
-liczebność próby- im większa tym krótszy przedział ufności
-poziom istotności alfa- im większy tym krótszy przedział
- zastosowanie testu jednostronnego- wartość krytyczna jest mniejsza, przedział ufności jest krótszy.
37. Od
1) wielkości próby n- im większa próba tym mniejszy błąd standardowy tym mniejszy przedział ufności 2) od alfa – określanego subiektywnie. Im większe alfa tym mniejszy przedział ufności
38. Dokładność szacunku można uzyskać poprzez krótki przedział ufności, szacujemy wtedy z dużym błędem. Gdy zwiększymy próbę będzie dokładniej i będzie mniejszy błąd. Przy tym punkcie proponuje wspomnieć o punkcie 37.
39. Założenia :
Określić- ? -> Ho, H1- może być kierunkowa(Fisher !) lub różnościowa : Zm. Zal- mieralna, zm. Niezal- niemierzalna; ma rozkład normalny (ni i sigma) sprawdzamy testem (patrz 2 cz. Pyt 22), określmy stopnie swobody, alfa- określona subiektywnie, piszemy główny wzór obliczamy i sprawdzamy w tabelach nasz wynik i na końcu odrzucamy lub nie nasza hipotezę (kryterium decyzyjne)
40. Hipoteza zerowa jest sprawdzane przy założeniu decyzji odnośnie postępowania o jej ewentualnym odrzuceniu. Musi być prosta i równościowa. Weryfikuje ją się testem statystycznym jednostronnym lub dwustronnym
41.Poziom istotności- prawdopodobieństwo popełnienia błędu I rodzaju, polegający na odrzucenia prawdziwej H0. Prawdopodobieństwo popełnienia tego błędu oznaczamy alfa. Na osi ox odpowiada obszarowi krytycznemu
42.prawdopodobieństwo, że zmienna przyjmie najbardziej prawdopodobne wyniki. Prawdopodobieństwo to oznaczamy 1-alfa i na osi ox odp. Przedziałowi ufności
43. Próbę nazywa się duża od 130 elementów ponieważ rozkład prawdopodobieństwa będzie dążył do rozkładu normalnego (patrz wniosek z centralnego twierdzenia granicznego- wariancja przez n) -> ?
44. Patrz punkt 41. Błąd typu probalistycznego.
45. Błąd II rodzaju- polega na nieodrzuceniu fałszywej H0. P-two jego oznacza się beta. Zależy on od liczebności próby n- im większe tym mniejsze p-two popełnienia go, od alfa- tak samo jak n. geneza- bład typu logicznego
46. Błąd I określany jest subiektywnie, więc nie zależy od drugiego błędy, notomiat błąd II jest zależny od alfy
47. Moc testu- zdolność odrzucenia fałszywej H0 ; 1-beta; zależy od alfa, n, efektu głównego
48. Narysuj rozkład t- Studenta i podaj jego definicję. Narysuj rozkład t- Studenta dla małej i dużej liczby stopni swobody.
Kształt rozkładu t- Studenta zależy od liczby stopni swobody. Im większa liczba stopni swobody, tym bardziej smukły rozkład.
49. Co to jest wartość krytyczna?
Wartość krytyczna- wartość, która oddziela obszar odrzucenia od obszaru nieodrzucenia.
50. Jaką postać może przyjmować hipoteza alternatywna i jak jej postać wpływa na sposób weryfikacji hipotezy zerowej?
Hipoteza alternatywna może przyjmować postać:
różnościową ( H₁: µ₁≠ µ₂ ). Wówczas hipotezę zerową weryfikujemy testem dwustronnym ( hipoteza alternatywna stwierdza, że parametr populacyjny może być albo mniejszy, albo większy od wartości określonej w Ho. Obszar krytyczny jest podzielony i zlokalizowany na obu krańcach rozkładu z próby).
kierunkową (H₁: µ₁> µ₂; µ₁< µ₂ ). Wówczas hipotezę zerową weryfikujemy testem jednostronnym ( hipoteza alternatywna stwierdza, że parametr populacyjny różni się od wartości określonej w hipotezie zerowej w jednym konkretnym kierunku. Obszar krytyczny zlokalizowany jest tylko na jednym krańcu rozkładu z próby).
51. Kiedy należy stosować test jednostronny i jakie ma on zalety w porównaniu z testem dwustronnym?
Test jednostronny należy stosować, gdy hipoteza alternatywna jest w postaci kierunkowej. Jest to test mocniejszy w porównaniu z testem dwustronnym, ponieważ wymaga mniej skrajnych danych by odrzucić Ho.
52. Który z błędów wnioskowania jest zależny od decyzji badacza?
Błąd I rodzaju jest zależny tylko i wyłącznie od decyzji badacza. Jest to błąd polegający na odrzuceniu prawdziwej hipotezy zerowej. Prawdopodobieństwo jego popełnienia oznaczamy jako α.
53. Czy stwierdzenie braku podstaw do odrzucenia hipotezy zerowej oznacza że Ho jest prawdziwa? Uzasadnij odpowiedź.
Stwierdzenie braku podstaw do odrzucenia hipotezy zerowej nie jest równoznaczne z jej prawdziwością. Oznacza to jedynie, że hipoteza zerowa może, ale nie musi być prawdziwa.
54. Podaj postać hipotez weryfikowanych za pomocą testu F-Fishera.
Ho: σ₁ ² = σ₂² =σ²
H₁: σ₁² > σ₂²
55. Podaj definicję statystyki F-Fishera i narysuj jej rozkład.
Test F- Fishera służy do weryfikacji hipotezy zerowej o homogeniczności dwóch wariancji. Statystyka tego testu ma postać:
F= s₁²/ s₂², (gdzie s₁²≥ s₂²)
Postać rozkładu F-Fishera- Snedecora
Rozkład ten ma parę stopni swobody równą: df₁= n₁- 1 i df₂= n₂ -1
56. Jakie założenia muszą być spełnione, żeby zastosować test t-Studenta dla jednej próby?
Założenia:
Zmienna X jest zmienną mierzalną ( mierzoną na skali przynajmniej przedziałowej)
Jedna próba losowa, n- elementowa
Zmienna X ma rozkład normalny w badanej populacji. Założenie to należy sprawdzić za pomocą testu Shapiro- Wilka, gdy próba jest mała lub za pomocą testu Kołmogorowa- Smirnowa, gdy próba jest duża. Jeżeli założenie o normalności nie jest spełnione, ale rozkład prawdopodobieństwa wartości naszej zmiennej w badanej populacji można uznać za wypukły, w miarę symetryczny i jednomodalny, możemy zastosować test t- Studenta (teoria odporności)
Subiektywnie założony poziom istotności α
57. Podaj postać hipotez weryfikowanych za pomocą testu t-Studenta dla jednej próby.
Ho: µ= µ₀
H₁: µ ≠ µ₀
58. Podaj postać hipotez weryfikowanych za pomocą testu t-Studenta dla dwóch prób niezależnych.
Ho: µ₁ = µ₂ = µ
H₁: µ₁ ≠ µ₂, lub H₁: µ₁ > µ₂; albo µ₁ < µ₂
59. Test t- studenta dla dwóch populacji niezależnych służy do weryfikacji hipotezy zerowej o braku efektów oddziaływania zmiennej zależnej (o 2 poziomach wartości) na zmienną zależną. Brak efektów oddziaływań wyraża się równością średnich rozkładów zmiennej zależnej w populacjach.
Założenia:
*zmienna zależna- mierzalna
*zmienna niezależna- niemierzalna o 2 i tylko 2 poziomach wartości (tzn ze mamy 2 równoliczebne, niezależne, losowe próby pobrane z populacji)
*rozkłady prawdopodobieństwa wartości zmiennej zależnej w obu populacjach są normalne, co sprawdzamy za pomocą testu Shapiro- Wilka, gdy próby są małe (n<130) lub Kołmogorowa- Smirnowa, gdy próby są duże
*wariancje rozkładów prawdopodobieństwa wartości zmiennej zależnej w obu populacjach mają być homogeniczne (sprawdzamy hipotezę zerową o homogeniczności 2 wariancji za pomocą testu F- Fishera)
60. T- studenta dla 2 prób zależnych służy do weryfikacji hipotezy zerowej o równości średnich w dwóch populacjach zależnych:
H0: µ1= µ2 lub µd=0 µd = µ1 - µ2
H1 : µd ≠0 lub µd >0 lub µd <0
61. Założenia dla testu t- studenta dla 2 populacji zależnych:
* zmienna zależna- mierzalna
* zmienna niezależna- niemierzalna o 2 poziomach wartości (tzn że mamy 2 losowe, zależne próby)
* rozkłady prawdopodobieństwa wartości zmiennej zależnej w obu populacjach zależnych są normalne, co sprawdzamy za pomocą testu Shapiro- Wilka, gdy próby są małe (n<130) lub Kołmogorowa- Smirnowa, gdy próby są duże
62. Interpretacja statystyki t:
Wystudentyzowana wartość- ilość odchyleń standardowych, o które wynik jest odległy od średniej swojego rozkładu; odległość między wartością estymatora, a średnią jego rozkładu
Np. t=4,24 tzn, że jest to 4,24 odchylenia standardowego w rozkładzie różnicy średnich z podpopulacji
63. Estymator łączny wariancji (nie jestem tego pewna, więc dobrze by było jakby ktoś potwierdził/ poprawił )
df= n1+n2-2 cyba
64. T- studenta dla 2 niezależnych
Np. Mierzymy stres jaki odczuwają fortepianiści i skrzypkowie przed koncertem. Którzy mają więszy stres?
65. df=n-2 bo mamy 2 niezależne próby, więc 2 średnie, więc 2 trzeba odjąć
66. df=n-1
67. df=n-1 bo jest to test t-stud dla jednej populacji. Mamy jedną populację, czyli jedną średnią i tylko 1 musimy odjąć.
68. T-studenta dla 2 zależnych
Problem badawczy: np. badacz chciał ocenić skuteczność treningu negocjacyjnego, oczekując, że u osób poddanych treningowi nastąpi wzrost umiejętności negocjacyjnych. W tym celu u losowo wybranych 50 osób dokonał pomiaru umiejętności negocjacyjnych przed i po treningu.
69. Założenia dla ANOVY:
* zmienna zależna- mierzalna
* zmienna niezależna- niemierzalna k > 2 poziomach wartości
* rozkłady prawdopodobieństwa wartości zmiennej zależnej we wszystkich populacjach są normalne, co sprawdzamy za pomocą testu Shapiro- Wilka, gdy próby są małe (n<130) lub Kołmogorowa- Smirnowa, gdy próby są duże
*wariancje w populacjach mają być homogeniczne (co sprawdzamy za pomocą testu Levene’a- najpopularniejszy, Bartlett’a- najmocniejszy, Hartley’a lub Cochrana)
Df= n-k
Df= k-1
70. postać hipotez ANOVA:
Ho: u1=u2=u3=u
H1: zaprzeczenie Ho
71. efekt główny- efekt oddziaływania danego poziomu zmiennej niezależnej na zmienną zależną, wyrażający się jako różnica średnich w podpopulacjach a w całej populacji :
Li = Ui- U
72. kontrast- różnica efektów zadziałania czynnika na dwóch jego poziomach wartości:
Li-Li’=Ui-Ui’
73 ?
74. nie jestem w stanie tego przepisać, mam nadzieje, że każdy zna ten wzór.
n-k= df dla wariancji wewnątrzgrupowej, k-1= dla międzypopulacyjnej,
SS= SSa+SSbłąd
n-1 k-1 n-k
licznik: ( xi-xg)2 =odchylenie średniej z grupy od średniej ogólnej
75. n-k
76. Xij=U+Li+Eij
Xij= U+Li+Eij Xij- pomiar j-tej osoby w i-tej próbie.
Li=Ui-U Li-stały efekt (główny) działania i –tego poziomu czynnika A na X
Eij- błąd pomiaru
77. Badanie: np. badacz chciał ocenić , czy wiedza na temat zachowań prozdrowotnych
( mała, przeciętna, duża) wpływa na czas poświęcany tygodniowo aktywności fizycznej. Mamy k>2
78. Interakcja- interakcja czynników lub inaczej współdziałanie czynników ( w badaniu) wpływające na zmienność Y ( zmienna objaśniana) może występować , gdy badacz kontroluje przynajmniej dwa czynniki. Jeśli średnie są addytywne, zostanie spełniona zasady prostokąta to nie ma interakcji. Zasada prostokąta: Uij-Ui=UJ-U Uij-Uj=Ui-U
79. ta tabelka jest na kalce 55 ( interakcja czynników i kontrasty między parametrami)
80. II rzędu A(k-poziomów) B(l-poziomów) (k/2)*(l/2)= k*l(k-1)(l-1)/4
U= mi :P