PYT 1. Jak można podzielić zmienne losowe?
Zmienna losowa to funkcja określona w przestrzeni zdarzeń elementarnych, która przyporządkowuje zdarzeniu elementarnemu liczbę rzeczywistą z określonym prawdopodobieństwem. Jest to taka zmienna, która w wyniku doświadczenia przybiera TYLKO jedna wartość ze zbioru wszystkich wartości, jakie ta zmienna może przyjąć.
Zmienna losowa DYSKRETNA (skokowa) - jeżeli zbiór wartości zmiennej losowej jest zbiorem przeliczalnym lub skończonym.
Zmienna losowa CIĄGŁA - jeżeli zmienna losowa przyjmuje wartości z pewnego przedziału liczbowego <w szczególności nieskończonego >.
PYT 2. Co to są zdarzenia niezależne?
Zdarzenia A i B nazywamy niezależnymi, tzn. P(A^B) = P(A) * P(B)
Jeśli P(A) >0 i P(B) >0 to warunkiem koniecznym, żeby zdarzenia były niezależne jest:
P(A/B)=P(A) oraz P(B/A) =P(B)
Dwa zdarzenia są niezależne, jeżeli wystąpienie lub nie wystąpienie jednego z nich nic nam nie mówi o prawdopodobieństwie wystąpienia drugiego. Zdarzenia takie nie mają na siebie wpływu.
PYT 3. Jakie są miary tendencji centralnej rozkładu?
Miary tendencji centralnej to wartość średnia (średnia arytmetyczna, geometryczna, harmoniczna), wartość oczekiwana, mediana i dominanta.
PYT 4. Jakie są miary rozrzutu rozkładu?
Wariancja i odchylenie standardowe oraz rozstęp.
PYT 5. Jakie są miary koncentracji rozkładu?
Miary koncentracji opisują skupienie wartości cechy wokół średniej. Miara skupienia pomiarów wokół średniej jest kurtoza (K). Jeśli K <0 to rozkład jest bardziej spłaszczony od normalnego, jeśli K >0 to rozkład jest bardziej smukły niż normalny.
PYT 6. Kiedy stosujemy medianę i dominantę do oceny rozkładu?
Medianę i dominantę stosujemy dla szeregów o dużej asymetrii. Ponieważ na medianę nie mają wpływu wartości skrajne, używa się jej przy rozkładach skrajnie asymetrycznych. Nie stosujemy mediany gdy szereg ma przedziały o różnej rozpiętości. Dominanta może być wyznaczona, gdy rozkład ma jedną wartość wyraźnie dominującą, łatwo ją wyznaczyć dla uporządkowanego szeregu prostego. Medianę stosujemy do oceny cech jakościowych, dominantę do cech ilościowych.
PYT 7. Na czym polega estymacja przedziałowa?
Estymacja - szacowanie wartości parametrów, ew. postaci rozkładu w populacji generalnej, na podstawie obserwacji uzyskanych w próbie losowej n - elementowej. Jako jedną z estymacji parametrycznych (czyli metod znajdowania nieznanych wartości parametrów rozkładu) wyróżniamy estymację przedziałową, gdzie szukana wartość należy z pewnym prawdopodobieństwem do określonego przedziału - przedziału ufności. Estymacji przedziałowej używamy przy szacowaniu parametrów rozkładu zmiennej losowej w populacji generalnej. Ten przedział ufności ( θ - θ1 , θ + θ2 ) o współczynniku ufności 1 - α nazywamy taki przedział zmiennej losowej ( θ - θ1 , θ + θ2 ) który spełnia warunek:
P( θ1<θ<θ2 ) = 1 - α
PYT 8. Co to jest przedział ufności?
Przedziałem ufności ( θ - θ1 , θ + θ2 ) o współczynniku ufności 1 - α nazywamy taki przedział zmiennej losowej ( θ - θ1 , θ + θ2 ) który spełnia warunek:
P( θ1<θ<θ2 ) = 1 - α
Przedział ufności dla wybranej statystyki (np. średniej lub linii regresji) to zakres wartości, w którym, z zadanym prawdopodobieństwem, leży "prawdziwa" wartość statystyki. Wielkość przedziału ufności zależy od wielkości próbki oraz od zmienności badanej cechy. Im większa próbka tym bardziej wiarygodna jest ocena wartości średniej, natomiast im większa zmienność cechy, tym ocena średniej jest mniej wiarygodna.
PYT 9. Od czego zależy rozpiętość przedziału ufności?
Wielkość przedziału ufności zależy od wielkości próbki oraz od zmienności badanej cechy. Im większa próbka tym bardziej wiarygodna jest ocena wartości średniej, natomiast im większa zmienność cechy, tym ocena średniej jest mniej wiarygodna. Im prawdopodobieństwo bliższe jedności, tym rozpiętość przedziału jest większa.
PYT 10. Jakie rozkłady są zbieżne do rozkładu normalnego i w jakich warunkach?
Rozkład t- Studenta - przy liczbie stopni swobody v >120 jest prawie nierozróżnialny od rozkładu normalnego. Rozkład ten jest podobny do rozkładu normalnego, tylko bardziej spłaszczony. Używany przy małej liczbie próbek.
Rozkład Poissona - jeżeli liczba zliczeń k jest duża, to dyskretny charakter k staje się coraz mniej istotny i mamy do czynienia z Gaussowskim przybliżeniem Poissona, N( λ, √λ ), gdzie m=λ i σ =√λ
PYT 11. Scharakteryzować część populacji podlegającej badaniu?
Część populacji podlegającej badaniu nazywamy próbą. Próba powinna być reprezentatywna, tzn. aby z przyjętą dokładnością opisywała strukturę zbiorowości generalnej. Na reprezentatywność wpływa liczebność próby (wraz z liczebnością wzrasta stopień jej reprezentatywności przy próbie losowej) oraz sposób jej doboru (wybór celowy, albo losowy). Czasem możemy potrzebować do badania próby obciążonej, czyli np. przy badaniu wpływu warunków pracy na choroby układu krążenia.
PYT 12. Co to reprezentatywność próby?
Próba powinna być reprezentatywna, tzn. aby z przyjętą dokładnością opisywała strukturę zbiorowości generalnej. Na reprezentatywność wpływa liczebność próby (wraz z liczebnością wzrasta stopień jej reprezentatywności przy próbie losowej) oraz sposób jej doboru (wybór celowy, albo losowy).
PYT 13. Podać cechy dystrybuanty?
Dystrybuantą zmiennej losowej X nazywamy funkcję F(x), zmiennej rzeczywistej zdefiniowanej : F(x) = P (X < x ). Cechy :
*dystrybuanta przyjmuje zawsze wartości nieujemne, mniejsze lub równe 1, tzn. 0 ≤ F(x) ≤ 1
*jest funkcją niemalejącą
*jest funkcją lewostronnie ciąglą
PYT 14. Podać parametry rozkładu Gaussa i t- Studenta?
Gaussa : N (m, σ ) wartość średnia m oraz odchylenie standardowe σ
t-Studenta : ilość stopni swobody v ,związane z liczbą niezależnych obserwacji.
PYT 15. Co to jest statystyka opisowa?
Statystyka opisowa to pewna wielkość opisująca rozkład teoretyczny. Do opisu analizy struktury zjawisk służą miary tendencji centralnej, asymetrii, spłaszczania, koncentracji i dyspersji, natomiast do opisu analizy współzależności zjawisk : miary regresji i korelacji.
PYT 16. Jak opisać zmienną empiryczną z dużą liczbą danych?
Należy stworzyć rozkład empiryczny, czyli zestawić wyniki w postaci szeregu rozdzielczego z cechą mierzalną, co pozwoli nam zbadać strukturę badanej zbiorowości z punktu widzenia określonej cechy statystycznej. Przy dużej liczbie danych należy zbiorowość podzielić na klasy wg określonej cechy ilościowej lub jakościowej z podaniem liczebności lub częstości każdej z klas. Czyli np. wypisujemy w kolejności rosnącej liczby występujące w danym badaniu (nie mogą się powtarzać), a następnie przypisujemy każdej z tych liczb numer, odpowiadający ilości, w jakiej się powtórzyły.
PYT 17. Co to jest szereg rozdzielczy?
Szereg rozdzielczy, czyli zbiorowość statystyczna podzielona na klasy, wg określonej cechy ilościowej lub jakościowej z podaniem liczebności lub częstości każdej z klas. Czyli np. wypisujemy w kolejności rosnącej liczby występujące w danym badaniu (nie mogą się powtarzać), a następnie przypisujemy każdej z tych liczb numer, odpowiadający ilości, w jakiej się powtórzyły.
PYT 18. Jak oblicza się dystrybuantę empiryczną?
Dystrybuanta empiryczna to przyporządkowanie kolejnym wartościom cechy statystycznej, odpowiadających im częstości skumulowanych. A częstość skumulowaną liczy się dzieląc liczbę jednostek, których cechy odpowiadają wartościom nie większym niż górna granica poszczególnego przedziału klasowego, przez liczebność naszej próby.
PYT 19. Czym różni się populacja od próbki i jednostki statystycznej ?
Populacja to zbiorowość generalna, czyli wszystkie elementy będące przedmiotem badania, co do których formułowane są wnioski ogólne. Próbka to podzbiór populacji generalnej obejmujący część jej elementów wybranych w określony sposób. Próbka ta podlega badaniu statystycznemu, a wynik jest uogólniony na zbiorowość generalną. Jednostka statystyczna to poszczególne elementy zbiorowości poddawanej badaniu (bezpośredniej obserwacji lub pomiarowi ).
PYT 20. Czy można zastosować opis rozkładu funkcją rozkładu normalnego gdy nie znamy jego parametrów ?
PYT 21. Co to jest hipoteza statystyczna ?
Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej na podstawie badań częściowych, dające się zweryfikować metodami statystycznymi na podstawie wyników badań próby losowej. Aby postawić hipotezę należy mieć próbkę z populacji ogólnej.
PYT 22. Co to jest test statystyczny ?
Test statystyczny to reguła postępowania, która każdej możliwej próbie losowej pobranej z populacji generalnej przyporządkowuje decyzję przyjęcia lub odrzucenia stawianej hipotezy z określonym prawdopodobieństwem. Testu statystycznego używamy do weryfikacji, która z hipotez ( zerowa czy alternatywna ) jest prawdziwa, a która fałszywa.
PYT 23. Na czym polega weryfikacja hipotez statystycznych ?
Przy posługiwaniu się próbką z populacji stawiamy dwie hipotezy - zerową, czyli tą, która podlega weryfikacji, oraz hipotezę alternatywną, czyli hipotezę będącą zaprzeczeniem hipotezy zerowej. Przy weryfikacji, czyli sprawdzeniu która z nich jest prawdziwa, a która fałszywa, posługujemy się testami statystycznymi. Należy określić obszar krytyczny testu, czyli obszar odrzucenia hipotezy zerowej, tzn. określić poziom istotności testu. Następnie dobieramy odpowiedni test, i obliczamy wartość statystyki na podstawie próbki. Następnie odczytujemy z tablic wartość dla obszaru krytycznego. Potem weryfikujemy czy wynik próby znajduje się w obszarze krytycznym ( i wtedy odrzucamy hipotezę zerową ), czy poza tym obszarem i wtedy przyjmujemy hipotezę alternatywną ( nie ma podstaw do odrzucenia hipotezy zerowej ).
PYT 24. Co to jest hipoteza parametryczna ?
Hipoteza parametryczna to hipoteza statystyczna (dowolne przypuszczenie co do rozkładu populacji generalnej na podstawie badań częściowych, dające się zweryfikować metodami statystycznymi na podstawie wyników badań próby losowej ), która dotyczy parametrów rozkładu badanej cechy. Do weryfikacji takiej hipotezy używamy testów parametrycznych.
PYT 25. Co to jest hipoteza nieparametryczna ?
Hipoteza nieparametryczna to hipoteza statystyczna (dowolne przypuszczenie co do rozkładu populacji generalnej na podstawie badań częściowych, dające się zweryfikować metodami statystycznymi na podstawie wyników badań próby losowej ), która dotyczy postaci rozkładu cech lub losowości próby.
PYT 26. Która hipoteza dotyczy rozkładu badanej cechy ?
Hipoteza parametryczna ( patrz.pyt.24 )
PYT 27. Jaka hipoteza dotyczy postaci rozkładu ?
Hipoteza nieparametryczna ( patrz pyt 25 )
PYT 28. Jak hipoteza dotyczy losowości próby ?
Hipoteza nieparametryczna ( patrz pyt 25 )
PYT 29. Co można wywnioskować z wyniku testu statystycznego ?
Z wyniku testu statystycznego możemy wywnioskować czy przyjętą hipotezę zerową odrzucamy czy nie ma podstaw do jej odrzucenia. Za pomocą testu można albo odrzucić hipotezę zerową albo przyjąć, że wyniki doświadczenia nie przeczą tej hipotezie.
PYT 30. Co trzeba wiedzieć aby postawić hipotezę ?
Aby postawić hipotezę trzeba mieć i znać próbkę z populacji, ponieważ rozkład populacji generalnej badamy na podstawie wyników badań próby losowej.
PYT 31. Czy hipoteza zerowa wyklucza hipotezę alternatywną ?
Hipoteza alternatywna jest zaprzeczeniem hipotezy zerowej, zatem obie hipotezy się wykluczają, jednak hipoteza alternatywna nie musi być prostym zaprzeczeniem hipotezy zerowej.
PYT 32. Kiedy przyjmujemy hipotezę alternatywną w teście ?
Hipotezę alternatywną przyjmujemy wtedy, kiedy odrzucamy hipotezę zerową, czyli kiedy wynik naszego testu statystycznego mieści się w obszarze krytycznym.
PYT 33. Co to jest obszar krytyczny testu ?
Obszar krytyczny testu to zbiór wartości rozkładu funkcji testowej w teście statystycznym, których wystąpienie, przy założeniu prawdziwości hipotezy zerowej (H0), jest wystarczająco mało prawdopodobne, żeby (empiryczna) realizacja zmiennej losowej, mieszcząca się w obszarze krytycznym, pozwalała na odrzucenie tej hipotezy. Wielkość obszaru określamy parametrem α i nazywamy poziomem istotności. Lokalizacja obszaru krytycznego zależy od sformułowania hipotezy alternatywnej (dwustronny, lewostronny lub prawostronny ).
PYT 34. Czy odrzucenie hipotezy zerowej jest równoznaczne z jej logicznym udowodnieniem fałszywości ?
Przyjęcie lub odrzucenie hipotezy w teście statystycznym nie jest równoznaczne z logicznym udowodnieniem jej prawdziwości lub fałszywości. Należy pamiętać, że odrzucając sprawdzaną hipotezę w teście statystycznym kierujemy się jedynie tym, że dane liczbowe wynikające z pomiarów dają nam małą szansę prawdziwości tej hipotezy.
PYT 35. Co wpływa na odrzucenie hipotezy zerowej ?
Na odrzucenie hipotezy zerowej wpływa fakt, że wynik naszego testu znajduje się w obszarze krytycznym testu. Wtedy hipotezę zerową odrzuca się na korzyść hipotezy alternatywnej.
PYT 36. Co to jest błąd I rodzaju a co błąd II rodzaju ?
Błąd I rodzaju - błąd polegający na odrzuceniu hipotezy zerowej pomimo że jest ona prawdziwa. Jako prawdopodobieństwo popełnienia tego błędu uznajemy poziom istotności α
Błąd II rodzaju - błąd polegający na przyjęciu hipotezy zerowej pomimo że jest ona fałszywa. Jako prawdopodobieństwo popełnienia tego błędu przyjmujemy poziom istotności β.
PYT 37. Czy pomiar (test), który nie przeczy hipotezie zerowej można uznać za dowód jej prawdziwości ?
Nie, ponieważ przyjęcie hipotezy w teście statystycznym nie jest równoznaczne z logicznym udowodnieniem jej prawdziwości.
PYT 38. Co to poziom istotności i jak ma się do poziomu ufności ?
Poziom istotności jest to prawdopodobieństwo popełnienia błędu I rodzaju (oznaczane symbolem α). Określa również maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05, 0,03 lub 0,01.
Poziom ufności to prawdopodobieństwo1-α związane z przedziałem ufności. Jeżeli poziom istotności testu szacujemy na α = 0,05, to poziom ufności tego testu wynosić będzie 95 %.
PYT 39. Jaki poziom istotności jest wysoki ?
Im wyższy poziom istotności, tym niższy poziom ufności, czyli tym prawdopodobieństwo znalezienia prawdziwego wyniku testu jest mniejsze. Za graniczny poziom istotności uznaje się α = 0,05, czyli powyżej tej wartości, poziom istotności będzie wysoki.
PYT 40. Co to jest moc testu ?
Moc testu M, to prawdopodobieństwo odrzucenia fałszywej hipotezy zerowej i przyjęcia w to miejsce prawdziwej hipotezy alternatywnej. M = 1 - β . Jest to dopełnienie do jedności prawdopodobieństwa niepopełnienia błędu drugiego rodzaju. Im mniejsze jest to prawdopodobieństwo, tym lepszy jest dany test jako narzędzie do różnicowania między hipotezą prawdziwą i fałszywą.
PYT 41. Od czego zależy dobór rodzaju testu ?
Dobór rodzaju testu zależy od rodzaju hipotezy oraz parametrów rozkładu.
PYT 42. Czemu służy test istotności ?
Służy do weryfikacji H0 poprzez wyłącznie jej odrzucenie lub stwierdzenie braku jej odrzucenia - nie podejmuje się decyzji o przyjęciu hipotezy.
PYT 43. Co mówi hipoteza istotności ?
Mówi o tym czy charakterystyki prób losowych różnią się od siebie w sposób istotny czy też różnice są przypadkowe. Różnica jest istotna wtedy gdy statystyki z dwóch prób odbiegają od siebie tak dalece, że można przypuszczać że nie pochodzą z tej samej populacji na określonym poziomie istotności α. Różnica jest przypadkowa, gdy różnica między statystykami pozwala przypuszczać że próby pochodzą z tej samej populacji.
PYT 44. Podstawowe sformułowanie hipotezy istotności ?
Stawiamy hipotezę zerową o tym, że dwie próby różnią się między sobą w sposób przypadkowy H0 : μ1 = μ2 a hipotezy alternatywne :
H1 : μ1 ≠ μ2
H2 : μ1 < μ2
H3 : μ1 > μ2
PYT 45. Jakie testy mogą być sprawdzianem hipotezy ?
Testy parametryczne, test t-Studenta ( dla prób zależnych, niezależnych lub dla jednej próby )
Testy nieparametryczne : chi kwadrat ( dla czech niemierzalnych ).
PYT 46. Jaki jest warunek dla obszaru krytycznego testu ?
Jeśli poziom istotności jest większy niż 0,05 to wynik naszego testu jest nieistotny statystycznie. Im będzie mniejszy obszar krytyczny, tym większe prawdopodobieństwo, że wynik naszego testu znajdzie się poza tym obszarem krytycznym ( nie będzie podstaw do odrzucenia H0 ).
PYT 47. Co to jest obszar krytyczny jedno a co dwustronny ?
Lokalizacja obszaru krytycznego zależy od sformułowania hipotezy alternatywnej.
Jeśli H0 = A, H1 ≠ A to mamy dwustronny obszar krytyczny, czyli zajmuje wszystkie wartości testu dużo większe od A i dużo mniejsze od A
Jeśli H0 = A, H1 > A to prawostronny obszar krytyczny, czyli obejmuje wartości większe od A
Jeśli H0 =A, H1 < A to lewostronny obszar, obejmujący wartości mniejsze od A.
PYT 48. Co to jest hipoteza niezależności ?
Hipotezę niezależności formułuje się wtedy gdy badamy współzależność co najmniej dwóch cech w populacji i należy rozstrzygnąć czy rzeczywiście ta współzależność istnieje. Wartość liczbowa współzależności wyrażona współczynnikiem korelacji badanych cech wynosi 0, a hipoteza alternatywna , że jest różna od zera.
PYT 49. Co to jest hipoteza zgodności ?
Formułuje się ją wtedy, gdy badanie dotyczy typu rozkład zmiennej losowej w populacji. H0 - rozkład empiryczny jest zgodny z rozkładem teoretycznym, H1, że nie jest zgodny.
PYT 50. Jaka jest zdefiniowana hipoteza zgodności ?
H0 - rozkład empiryczny jest zgodny z rozkładem teoretycznym, H1, że nie jest zgodny. H0 zakłada zgodność rozkładów empirycznych dwóch zmiennych niezależnych prób, czyli hipoteza zakłada, że obie próby można traktować jako pochodzące z populacji o tym samych rozkładzie badanej cechy.
PYT 51. Czym się różni budowa przedziału ufności od weryfikacji hipotezy zerowej ?
Niczym, budowa przedziału ufności i weryfikacja hipotezy zerowej to to samo.
PYT 52. Co należy zrobić gdy poziom istotności dla testu jest większy niż założony ?
Wtedy to oznacza że wynik testu znajduje się w obszarze krytycznym i trzeba odrzucić hipotezę zerową.
PYT 53. Co należy zrobić przy badaniu hipotezy jeśli prawdopodobieństwo obliczone dla testu jest większe niż poziom istotności ?
Oznacza to że wynik testu znajdzie się poza obszarem krytycznym, oraz, że nie ma podstaw do odrzucenia hipotezy zerowej.
PYT 54. Do czego służy test t ?
Test t służy do testowania małych próbek, powszechnie do oceny różnic między średnimi w dwóch grupach Musi być spełniony warunek dla użycia tego testu : normalność rozkładu zmiennych oraz brak istotnych różnic między wariancjami.
PYT 55. Dla jakiej liczby próbek ma zastosowanie test t a dla jakiej test z ?
Test t dla małych próbek, gdy liczebność próby jest mniejsza od 30. Test z używamy dla dużych próbek.
PYT 56. Kiedy odrzucimy hipotezę zerową ?
Hipotezę zerową odrzucamy, gdy wynik próby znajdzie się w obszarze krytycznym testu.
PYT 57. Jaki jest rozkład statystyki dla estymatora wartości średniej (oczekiwanej) ?
Normalny lub dążący do normalnego.
PYT 58. Czy istnieje różnica w wynikach testu gdy dane dotyczyły zmiennych powiązanych i niepowiązanych ?
Tak; dla niepowiązanych jest to wynik zawierający wartość testu t oraz istotność statystyczną różnicy między średnimi w analizowanych podgrupach; dla powiązanych: wynik testu t oraz istotność statystyczna średniej różnicy między wynikami
PYT 59. Czy analiza grupy pacjentów leczonych lekami A i B oraz grupy pacjentów leczonych i nieleczonych (placebo) przebiega tak samo?
Tak, można zastosować test t studenta dla prób niezależnych, albo testy nieparametryczne (np. Mc Nemary).
PYT 60. Postawić hipotezę dla średnich prób powiązanych ?
Test dla zmiennych powiązanych. H0: średnia z różnic jest równa 0 a H1: średnia z różnic jest różna od 0.
PYT 61. Do czego stosujemy testy nieparametryczne ?
Testy nieparametryczne są uniezależnione od rozkładu badanej cechy, mogą być, więc stosowane w przypadku dowolnych rozkładów niekoniecznie zbliżonych do normalnego. Dotyczą rozkładów populacji lub cech niemierzalnych. Stosowanie testów nieparametrycznych nie polega na estymacji parametrów, takich jak średnia czy odchylenie standardowe opisujących rozkład danej zmiennej w populacji.
PYT 62. Jaki rodzaj testu stosujemy do weryfikacji hipotezy dotyczącej cech niemierzalnych ?
Do weryfikacji hipotezy dotyczącej cech niemierzalnych wykorzystamy test nieparametryczny.
PYT 63. Do czego stosujemy test chi kwadrat ?
Służy badaniu czy rozkład cechy X podlega określonemu typowi rozkładu przy czym może to być zarówno rozkład ciągły lub skokowy. Warunkiem jest to że próba musi być duża.
PYT 64. Który test bada hipotezę o rozkładzie dystrybuanty ? CHI KWADRAT
PYT 65. Jaki test stosujemy przy badaniu niezależności ? CHI KWADRAT
PYT 66. Jak badać hipotezy dotyczące porównania metod leczenia ?
Gdy badamy dwie grupy pacjentów leczonych różnymi metodami szukamy odpowiedzi na pytanie czy leczenie np. nowym preparatem jest skuteczniejsze od leczenia tradycyjnego. Korzystamy wtedy z testu dla zmiennych niepowiązanych, aby wykazać czy istnieją statystycznie istotne różnice między średnimi. Formułujemy hipotezę H0: μ1=μ2 (jednakowa skuteczność obu sposobów leczenia) i H1: μ1≠μ2 (występują różnice w skuteczności leczenia). Odrzucenie H0 oznacza, że istnieją statystycznie istotne różnice. Aby potwierdzić skuteczność nowego leku należy obliczyć różnice w wynikach dla każdego pacjenta (przed i po leczeniu) i zastosować test dla zmiennych powiązanych. H0: średnia z różnic jest równa 0 a H1: średnia z różnic jest różna od 0.
PYT 67. Czym badamy współzależność cech mierzalnych ?
Do badania współzależności cech mierzalnych wykorzystujemy współczynnik korelacji Pearsona, czyli wartość określająca kierunek i siłę współzależności pomiędzy zmiennymi.
PYT 68. Co stosujemy do badania powiązania badanej cechy zmiennej losowej z innymi zmiennymi ?
Współczynnik korelacji oraz regresji ( wartość stojąca przy każdej zmiennej X, mająca wpływ na zmienna Y ).
PYT 69. Co to jest korelacja ?
Jest to fakt powiązania, współzależności między dwoma zmiennymi.
PYT 70. Jakiego rzędu kwantylem jest mediana?
Jest to kwartyl 2 -Q2 - Me. To taka wartość badanej cechy, która dzieli populację na połowy. Jest to wartość środkowa. W medianie połowa populacji jeszcze nie osiągnęła wartości badanej cechy, a połowa już przekroczyła tą wartość.
PYT 71. Podać definicję wariancji dla ciągłej zmiennej losowej ?
1 n
σ kwadrat = ---- Σ ( xi - μ)kwadrat
n i=1
Jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.
PYT 72. Czy wartość średnia i wartość oczekiwana są tym samym?
n
E(x) = Σ (xi * pi) wartość oczekiwana jest szacowana teoretycznie, odnosi się do całej
i = 1
populacji.
Wartość średnia jest wyznaczana empirycznie. Jest to to samo.
PYT 73. Co wiąże estymatory odchylenia standardowego sx z sx?
PYT 74. Jaką wartość ma całka (pola pod krzywą ) w zakresie -1 do +1 dla rozkładu normalnego standaryzowanego?
Poziom ufności wynosi 68,27%
PYT 75. Co oznacza użycie przedział 3 sigmowy w odniesieniu do 100 doświadczeń ?
To oznacza, że spośród wyników tych 100 doświadczeń, 99,7% wyników nie różni się od wartości średniej arytmetycznej.
PYT 76. Jaki jest związek pomiędzy odchyleniami standardowymi pojedynczego pomiaru i średniej arytmetycznej?
Średnia arytmetyczna to suma wartości zmiennych dzielona przez liczbę przypadków. Odchylenie standardowe określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.
PYT 77. Jakie własności ma estymator wartości oczekiwanej zwany wartością średnią?
Estymatorem wartości oczekiwanej rozkładu jest średnia arytmetyczna Xsr=1/n suma n i=1 Xi. Zgodny ( oznacza, to że jeśli rośnie liczebność próby, rośnie też prawdopodobieństwo, że oszacowanie przy pomocy estymatora będzie przyjmować wartości coraz bliższe wartości szacowanego parametru. ), nieobciążony, najbardziej efektywny ( ma najmniejsza wariancję spośród wszystkich estymatorów).
PYT 78. Jaka jest różnica pomiędzy parametrycznymi testami istotności a testami zgodności?
Test zgodności- można go zastosować do badania wartości mierzalnych i niemierzalnych i określa tylko kształt rozkładu zmiennych. Test parametryczny - porównuje konkretne wartości badanej cechy-zmienne ilościowe są brane pod uwagę.
PYT 79. Jakie wartości może przyjąć współczynnik korelacji?
współczynnik korelacji wartości (r ) niesie dwie informacje poprzez znak i moduł -1<=r<=1 0<=[r]<=1
PYT 80. Jaka jest istota analizy wariancji ANOVA?
Metoda statystyczna która pozwala na testowanie hipotez o równości średnich w kilku porównywanych grupach. Jest wykorzystywana gdy chcemy sprawdzić czy zmiana poziomu czynnika idzie w parze ze zmianą wysokości wyników uzyskiwanych przez osoby badane, a zatem i średniej z tych wyników.
PYT 81. Jakie są założenia wariancji ?
We wszystkich porównywanych grupach zmienna zależna ma rozkład normalny ( sprawdzenie test chi kwadrat, histogram )
Równość wariancji w porównywanych grupach
Niezależność pomiarów w obrębie grupy.
PYT 82. Jakie znaczenie ma współczynnik determinacji w analizie regresji ?
Współczynnik determinacji jest to miara dopasowania, liczba z przedziału <0,1>. Mierzy on, jaką część ogólnej zmienności zmiennej zależnej jest wyjaśniona przez regresję liniową . To miara dopasowania używana tylko dla regresji liniowej. W modelu liniowym jest on kwadratem współczynnika korelacji.
PYT 83. Na czym polega test istotności F dla dwóch wariancji ?
Wariancja międzygrupowa
F = -------------------------------------
Wariancja wewnątrzgrupowa
Międzygrupowa - miara rozproszenia średnich w grupach w stosunku do średniej ogólnej
Wewnątrzgrupowa - miara rozproszenia wyników w obrębie grupy do której należy dany wynik
PYT 84. Do czego służy test Kolmogorowa Smirnowa ?
Jest to test nieparametryczny do badania 2 prób losowych niezależnych dla rozkładów kumulacyjnych ( np. w badaniach marketingowych przy porównywaniu struktur preferencji ).
PYT 85. Co wynika z krzywych Neumana ?
PYT.86. Interpretacja geometryczna parametrów a i b regresji liniowej
Regresja - funkcja odzwierciedlająca powiązanie zmiennych (czynników) określonym wartością jednej zmiennej (niezależnej), odpowiadają ściśle określone średnie wartości drugiej zmiennej (zależnej) - w mowie potocznej to cofanie się, spadek, zanik
Współczynnik regresji - liczba stojąca przy każdej zmiennej x określająca jej wpływ na zmienną y.
PYT.87. Rozkład do estymacji wariancji
Wariancja V(x)= σ2 , gdy znane m
Rozkład dowolny, dla rozkładu N(σ,m) - najefektywniejszy
PYT.88. przedział ufności a poziom istotności
Prawdopodobieństwo popełnienia błędu I rodzaju - poziom istotności α, poziom ufności 1-α
Prawdopodobieństwo popełnienia błędu II rodzaju - poziom istotności β