Pytania do egzaminu z WNIOSKOWANIA STATYSTYCZNEGO
Wyjaśnij pojęcie „obserwacja statystyczna”. - gromadzenie informacji o właściwościach (cechach) poszczególnych jednostek zbiorowości. Badania statystyczne sprowadzają się do prowadzenia obserwacji a nastepnie interpretacji ich wyników
Wyjaśnij pojęcie „liczebność próby”.- liczba elementów populacji generalnej wybranych do próby (oznaczana zwykle jako „n”) Gdy n<30 - mała próba, n>30 - duża próba
Co znaczy, że próba powinna być reprezentatywna? Wymień typy reprezentatywności.
- tzn. powinna opisywać strukturę populacji generalnej z przyjętą dokładnością. Reprezentatywność próby ma zatem decydujące znaczenie dla jakości wyciągniętych wniosków. Wyróżniamy:
Reprezentatywność typologiczną - próba jest reprezentatywna jeśli zawiera wszystkie typy (wartości) interesujących nas cech (zmiennych).
Reprezentatywność rozkładów - próba jest reprezentatywna jeżeli rozkłady interesujących nas cech (zmiennych) w tej próbie odpowiadają (z określonym przybliżeniem) rozkładom tych cech (zmiennych) w populacji generalnej
Reprezentatywność związków między cechami - próba jest reprezentatywna jeżeli zależności występujące między cechami w próbie odpowiadają analogicznym zależnościom w populacji generalnej
Wyjaśnij pojęcie „badanie reprezentacyjne” - to takie badanie częściowe w którym losowo pobrane do próby jednostki reprezentują całą populację mimo, że stanowią tylko jej część. Badania te stosowane są przy statystycznej kontroli jakości produkcji, przy szacowaniu plonów, przy badaniach budżetów rodzinnych itp.
Wyjaśnij pojęcie „szereg szczegółowy”. - nazywamy zbiór danych uporządkowanych według wartości badanej cechy. Obejmuje wartości cechy występujące u wszystkich jednostek badanej zbiorowości, uporządkowane rosnąco lub malejąco.
Wyjaśnij pojęcie „szereg rozdzielczy”- uporządkowany i pogrupowany (według przyjętych kryteriów) zbiór informacji dotyczących badanej cechy. Otrzymuje się go dzieląc zbiorowość statystyczną na klasy zbiorcze według pewnej cechy i podając liczebność każdej z nich. Jeżeli liczba wariantów klas jest niewielka to zwykle buduje się szeregi rozdzielcze punktowe. Jeśli natomiast wariantów jest dużo, to wówczas buduje się szeregi rozdzielcze przedziałowe.
Wyjaśnij pojęcie „średnia arytmetyczna”.- informuje o przeciętnym poziomie cechy, abstrahując od różnic pomiędzy poszczególnymi wartościami cechy.
Wyjaśnij pojęcie „wariancja”.- jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartości cechy od ich wartości średniej. Dla oznaczenia wariancji w próbie stosuje się symbol s2 , a dla oznaczenia wariancji w populacji generalnej δ (sigma)
Wyjaśnij pojęcie zmiennej losowej X i wymień jej rodzaje. - nazywamy każdą funkcję o wartościach liczbowych (rzeczywistych) określoną na zbiorze zdarzeń elementarnych o wartościach ze zbioru liczb rzeczywistych. Wyróżniamy:
Zmienne losowe skokowe
Zmienne losowe ciągle
Wyjaśnij pojęcie „zmienna losowa X typu skokowego”.- to taka zmienna losowa która ma skończony lub przeliczalny zbiór wartości, zmienna losowa przyjmuje wartości x1, x2.. z prawdopodobieństwem p1, p2…
Wyjaśnij pojęcie „zmienna losowa X typu ciągłego”.- to taka zmienna losowa która może przybierać dowolne wartości liczbowe z pewnego przedziału liczbowego
Wyjaśnij pojęcie „estymacja”.- (szacowanie, ocenianie) jest procesem wnioskowania o numerycznych wartościach nieznanych wielkości charakteryzujących populację generalną na podstawie danych próbkowych.
Wymień rodzaje estymacji.
Estymacja punktowa
Estymacja przedziałowa
Wyjaśnij pojęcie „estymacja punktowa” - czyli metoda szacunku za pomocą której jako wartość parametru zbiorowości generalnej przyjmuje się konkretną wartość estymatora wyznaczonego na podstawie n-elementowej próby.
Wyjaśnij pojęcie „estymacja przedziałowa” - za pomocą której wyznacza się przedział liczbowy, który z ustalonym prawdopodobieństwem zawiera nieznaną wartość szacowanego parametru zbiorowości generalnej
Wyjaśnij pojęcie „hipoteza statystyczna”- nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie pobranej próbki.
Wyjaśnij pojęcie hipotezy zerowej i hipotezy alternatywnej.
Hipotezą zerową Ho - nazywamy hipotezę sprawdzaną (testowaną, weryfikowaną)
Hipotezą alternatywną - nazywamy hipotezę którą jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę Ho.
Wyjaśnij pojęcie „obszar krytyczny”- nazywamy zbiór tych wartości sprawdzianu hipotezy, które przemawiają za odrzuceniem hipotezy Ho. Obszar krytyczny może być w zależności od hipotezy alternatywnej zbiorem jednostronnym (prawo- lub lewo-stronnym) bądź zbiorem dwustronnym.
Wymień 2 rodzaje testów statystycznych.
Testy parametryczne - najczęściej weryfikują sądy o takich parametrach populacji jak średnia arytmetyczna, wariancja, wskaźnik struktury. W testach tych hipoteza Ho jest hipotezą „o równości”, natomiast H1 jest zaprzeczeniem, hipotezą o „większości” lub „o mniejszości”.
Testy nieparametryczne - służą do weryfikacji hipotez dotyczących zgodności rozkładu cechy w populacji z pokreślonym rozkładem teoretycznym, losowości doboru próby czy też zgodności rozkładów w dwóch populacjach.
Wymień 3 przykładowe zastosowania testów statystycznych.
Narysuj i nazwij 3 zbiory krytyczne dla różnych postaci hipotezy alternatywnej (rozkład normalny).
prawostronny obszar krytyczny
lewostronny obszar krytyczny
obustronny obszar krytyczny
Napisz do czego służą testy nieparametryczne - służą do weryfikacji hipotez dotyczących zgodności rozkładu cechy w populacji z pokreślonym rozkładem teoretycznym, losowości doboru próby czy też zgodności rozkładów w dwóch populacjach.
Podaj co najmniej 2 inne nazwy „wskaźnika struktury”.
Podaj przedział wartości prawdopodobieństwa - p <0;1>
Wyjaśnij skrót GUS - Główny Urząd Statystyczny
Przykładowe pytania na egzamin (od niej)
1. Wyjaśnij pojęcie „wnioskowanie statystyczne” - to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację generalną z wykorzystaniem metod probabilistycznych , oraz szacowania błędów wynikających z takiego uogólnienia
2. Wyjaśnij pojęcie „populacja generalna”- to zbiór dowolnych elementów, nieidentycznych z punktu widzenia badanej osoby, podlegających badaniu statystycznemu.
Przykład: Wszyscy ludzie w Polsce posiadają cechę wzrostu - Populacją w badaniu statystycznym wzrostu ludzi w Polsce będą wszyscy ludzie w Polsce.
Ze względu na liczebność zbioru, populacje można podzielić na:
populacje skończone - np. populacja ludzi w Polsce
populacje nieskończone - np. czas
3. Wyjaśnij pojęcie „próba”- to podzbiór populacji generalnej podlegający badaniu ze względu na ustaloną cechę w celu wyciągnięcia wniosków o kształtowaniu się tej cechy w populacji. Zwykle stosuje się tzw. próbę losową, definiowaną formalnie w teorii statystyki jako ciąg zmiennych losowych o rozkładzie takim jak rozkład populacji.
4. Wyjaśnij pojęcie „standaryzowany rozkład normalny” (proszę podać nazwy parametrów i odpowiadające im wartości) - Standaryzowany rozkład normalny to rozkład o zerowej wartości oczekiwanej (wektorze zerowym) i jednostkowej wariancji (macierzy kowariancji równej I) (a więc i jednostkowym odchyleniu standardowym) x~N(0, I).
5. Naszkicuj rozkład χ2 (chi-kwadrat). Wskaż (zapisz w postaci zdania) jedną charakterystyczną cechę związaną z rozkładem.
6. Naszkicuj rozkład t-Studenta. Wskaż (zapisz w postaci zdania) jedną charakterystyczną cechę związaną z rozkładem.
7. Naszkicuj rozkład normalny o średniej m. Wskaż (zapisz w postaci zdania) jedną charakterystyczną cechę związaną z rozkładem.
8. Przedstaw procedurę weryfikacji hipotez
3Obliczenie statystyki na podstawie próby
6 Podjęcie decyzji - odrzucić Ho lub nie odrzucać Ho
9. Podaj definicję poziomu istotności α. - nazywamy prawdopodobieństwo popełnienia błędu I rodzaju. Przyjmujemy je arbitalnie (najczęściej ɑ=0,01 , ɑ=0,05 , ɑ=0,1)
10. Wymień trzy rodzaje stablicowanych rozkładów ( tablice statystyczne, z których korzystaliśmy na wykładzie) - Rozkład T-studenta; Standaryzowany rozkład normalny; rozkład χ2 (chi-kwadrat).
11. Następujący zestaw hipotez:
H0: przeciętne miesięczne wydatki studentów zarządzania na ksero nie zależą od roku studiów
H1: przeciętne miesięczne wydatki studentów zarządzania na ksero zależą od roku studiów
Czy jest to przykład hipotez parametrycznych czy nieparametrycznych?
12. Sformułowano następujący zestaw hipotez:
H0: przeciętne miesięczne wydatki studentów zarządzania na ksero są równe 20 zł
H1: przeciętne miesięczne wydatki studentów zarządzania na ksero są wyższe niż 20 zł
Czy jest to przykład hipotez parametrycznych czy nieparametrycznych?