Co to jest statystyka
Statystka zajmuje się metodami opisu i analizy liczbowych prawidłowości występujących w tzw. Populacjach statystycznych tj. w zbiorowościach elementów zróżnicowanych ze względu na badane cechy.
Rodzaje cech statystycznych
Każda jednostka statystyczna charakteryzuje się odpowiednimi właściwościami, które nazywamy cechami statystycznymi.
Dzielimy je na stałe i zmienne:
Cechy stałe - określają jednostki pod względem rzeczowym (co?) czasowym (kiedy?), przestrzennym (gdzie?) nie podlegają one badaniom ale decydują o zaliczeniu danej jednostki do określonej zbiorowości.
Cechy zmienne – podlegają badaniom statystycznym dzielimy je na jakościowe (niemierzalne) i ilościowe ( mierzalne)
Rodzaje skal
- Jakościowa –niemierzalna ( nominalna)- operacje arytmetyczne niedozwolone np. pochodzenie społeczne, płeć
- porządkowa – qesi – ilościową (niemierzalna) – operacje arytmetyczne niedozwolone
- przedziałowa (mierzalna) zwana również interwałową – operacje arytmetyczne dozwolone określane za pomocą liczb o różnych miarach np. wzrost w cm
- ilorazowa (mierzalna) należy do skal porządkowych znaczenie ma nie tylko odległość ale również iloraz odległości
4. Kiedy badania są statystyczne
Aby badanie było statystyczne musi spełnić warunki:
- musi dotyczyć zbiorowości (masy) statystycznej
- musi określać prawidłowości charakteryzujące całą zbiorowość ( nie zaś opisywać własności poszczególnych jednostek)
- prawidłowości muszą dotyczyć zmiennych cech w tej zbiorowości
5. Metoda badań reprezentacyjnych
Oparta jest na próbie pobranej ze zbiorowości generalnej w sposób losowy zgodnie z odpowiednim schematem losowania umożliwia ta otrzymanie prób reprezentacyjnych stanowiących jakby miniaturkę populacji
6. interpolacja i ekstrapolacja
- interpolacja to szacowanie nieznanych wartości cechy na podstawie znanych wartości sąsiednich (późniejszych i wcześniejszych)
- ekstrapolacja to szacowanie wartości wykraczających poza przedział wartości znanych
7. Na ile sposobów można wyrzucić 8 kostek
8. Jakie jest prawdopodobieństwo otrzymania danej karty w brydżu
$$C_{1\ }^{1}\text{x\ }C_{12}^{51} = \left( \frac{1}{1} \right)x\left( \frac{51}{12} \right) = \frac{1!}{0!x1!}x\frac{51!}{39!x12!}$$
Inna wersja tego samego zadania
Na ile sposobów brydżysta otrzyma swoje karty
$$C_{52}^{13} = \left( \frac{52}{13} \right) = \frac{52!}{\left( 52 - 13 \right)!x13!}$$
Na ile sposobów brydżysta nie otrzyma konkretnej karty
$$C_{0}^{1}xC_{13}^{51} = \left( \frac{1}{0} \right)x\left( \frac{51}{13} \right) = \frac{1!}{1!x1!}x\frac{51!}{38!x13!}$$
9. Oblicz średnią arytmetyczną i wariancję z danego szeregu
Średnia – dodajemy liczby do siebie otrzymaną sumę dzielimy przez ilość liczb
Wariancja – wzór na wariancję x2 - x2
Np. ()2
5 25
6 36
5 25
4 16
5 25
6 36
Średnia= 31/6 = 5$\ \frac{1}{\ 6}$
${\overset{\overline{}}{x}}^{2} = \left( 5\frac{1}{6} \right)$ 2 Średnia do kwadratu
${\overset{\overline{}}{x}}^{2}$=$\ \frac{163}{6}$ Średnia z kwadratów tych liczb
10. Co to jest dystrybuanta
Dystrybuanta to funkcja mierzalna o wartości w (0,1) przynajmniej prawostronnie ( lewostronnie w przypadku definicji z nierównością ostrą) ciągła niemalejąca, której granica przy argumentach dążących do plus nieskończoności wynosi 1, zaś przy argumentach dążących do minus nieskończoności 0.
11. Etapy badań statystycznych
- przygotowanie (programowanie) badania
- obserwacja statystyczna
- opracowanie i prezentacja materiału statystycznego
- opis lub wnioskowanie statystyczne
12. Rodzaje błędów statystycznych
- systematyczne (tendencyjne) – wynikają z jednokierunkowej tendencji do zniekształcania badanej rzeczywistości
- niesystematyczne (przypadkowe) są popełniane z nieuwagi, nieumiejętności bądź ze zwykłego niedbalstwa
13. Co to jest szereg rozdzielczy
Szereg rozdzielczy jest statystycznym sposobem prezentacji rozkładu empirycznego. Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność zbiorów danych przypadających na każdą z tych kategorii
14. Klasyfikacja szeregów statystycznych
Dzielimy na: szeregi szczegółowe (zawierają wszystkie wyniki uzyskane z obserwacji), szeregi rozdzielcze (szeregi cech mierzalnych i niemierzalnych), szeregi przestrzenne , szeregi czasowe ( szeregi momentów i okresów). Szeregi można przedstawić niemalejąco (rosnący lub stały) lub nierosnąco
15. Parametry statystyczne – wymienić
Lub charakterystyki statystyki s a to liczby służące do syntetycznego opisu struktury zbiorowości statystycznej
Dzielimy na :
- miary położenia – średnie, przeciętne
- miary zmienności – rozproszenia, dyspersji
- miary asymetrii
- miary koncentracji
Ważne w analizach są parametry miary położenia i zmienności znajomość rozkładu cechy (jej obraz graficzny) pozwala przy tym na dobór odpowiednich parametrów z tych grup
16. Co to jest rozkład normalny
Rozkład normalny, zwany też rozkładem Gaussa, lub krzywą dzwonową, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.
17. Miary zmienności rodzaju
- klasyczne ( wariancja, odch. Standardowe, odch. Przeciętne, współczynnik zmienności)
- pozycyjne ( rozstęp , odch. Ćwiartkowe, współczynnik zmienności)
18. Dokonać rangowania danego szeregu
- wynik należy ułożyć od najmniejszego do największego
- każdemu wynikowi nadajemy wartość olejnej liczby naturalnej zaczynając od jednostki
- określamy tzw. Rangi wiązane z tymi samymi wynikami
- rangom wiązanym nadajemy średnią arytmetyczną
19. Wyznaczyć dominantę z szeregu
- wyznaczamy poprzez wskazanie wartości najczęściej występującej w szeregu
D= xD +$\ \frac{\left( n_{D} - n_{D - 1} \right)\ x\ x_{D}\ }{\left( n_{D} - n_{D - 1} \right) + \left( n_{D} - n_{D + 1} \right)}$
20. Wyznaczyć medianę z szeregu
Mediana (zwana też wartością środkową lub drugim kwartylem ) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwartylem rzędu ½ . mediana to taka wartość która dzieli nam zbiór na pół.
Liczebność nieparzysta
$$M_{c} = \frac{x_{N + 1}}{2}$$
Liczebność nieparzysta
$$M_{c} = \ \frac{x_{\frac{\text{\ N\ }}{2}} + x_{\frac{N}{2} + 1}}{2}$$
21. Minimum to -0 kwartyl, 0 decybel, 0 centyl
Kwantyle rzędu ¼, ½, ¾ są inaczej nazywane kwartynami
Kwantyle rzędu 1/10, 2/10 , …,9/10 to inaczej decyle
Kwantyle rzędu 1/100, 2/100,…, 99/100 to inaczej precentyle
22. Mediana to II kwanty, decybel, 50 centyl
23. Obliczyć rozstęp z szeregu
Empiryczny obszar zmienności różnica między wynikiem minimalnym a maksymalnym
Funkcja max – funkcja min
24. Jak na piechotę obliczyć wariancję
- obliczyć średnia arytmetyczną
- dal każdego wyniku obliczyć różnice pomiędzy nim a średnią
- różnice te podnieść do kwadratu
Wariancja – wzór na wariancję x2 - x2
Np. ()2
7 25
8 36
6 25
7 16
8 25
9 36
1
Średnia= 31/6 = 5 ---
6
${\overset{\overline{}}{x}}^{2} = \left( 5\frac{1}{6} \right)$ 2 Średnia do kwadratu
${\overset{\overline{}}{x}}^{2}$=$\ \frac{163}{6}$ Średnia z kwadratów tych liczb
25. Jaka jest różnica między wariancją a wariacją
Wariancja to miara zmienności. Ukazuje stopień zróżnicowania jednostek zbiorowości pod kątem badanej cechy. Jest średnią arytmetyczną kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości
Wariacją bez powtórzeń k – wyrazową zbioru n- elementowego A(k≤n) nazywa się każdy k- wyrazowy ciąg k różnych elementów tego zbioru, przy czym kolejność tych elementów ma znaczenie. Gdy k=n, wariację bez powtórzeń nazywa się permutacją.
Wariacją z powtórzeniami k – wyrazową zbioru n – elementowego A nazywa się każdy k – wyrazowy ciąg elementów tego zbioru ( dowolny element może wystąpić wielokrotnie w ciągu).
26. Wariancja dla małej i dużej grupy
To średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości ( populacji)
Dla n > 30 ( duża próba )
$\sigma^{2} = \frac{1}{n}\ \sum_{i = 1}^{n}{(x_{i}} - \overset{\overline{}}{x)}$2
Dla n < 30 ( mała próba)
$S^{2} = \frac{1}{n - 1}\ \sum_{i = 1}^{n}{(x_{i}} - \overset{\overline{}}{x)}$2
27. Czy odchylenie standardowe to pierwiastek z wariancji
Tak
Odch. Standardowe – klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne. Odch. Standardowe wartości cechy w populacji oznaczamy tradycyjnie przez σ ( małe greckie sigma) i definiujemy jako pierwiastek kwadratowy wariancji.
$$\sigma = \sqrt{\frac{\sum_{i - 1}^{N}{(x_{\text{i\ \ }} - \ \mu)^{2}}}{N}}$$
xi - to kolejne wartości cechy populacji
μ - to wartość oczekiwana
N – to liczba elementów w populacji
27. Co to jest odchylenie przeciętne
Odchylenie przeciętne D to średnia arytmetyczna bezwzględnych wartości cechy od jej średniej arytmetycznej
$d = \frac{1}{\text{n\ \ }}\sum_{i = 1}^{n}\left| x_{1} - \overset{\overline{}}{x}\ \right|$
Odchylenie bezwzględne jest wykorzystywane jako miara zróżnicowania rozkładu. Ponieważ wykorzystuje wartość wszystkich elementów w zbiorze, jest miarą klasyczną.
28. Klasyczne współczynniki zmienności
Współczynnik zmienności to iloraz odchylenia standardowego lub średniego i wartości średniej
V = $\frac{s}{\overset{\overline{}}{x}}$
S - to odchylenie standardowe z próby
$\overset{\overline{}}{x}$ - to średnia arytmetyczna z próby
29. Miary asymetrii – rodzaje
- wskaźnik asymetrii
- współczynnik skośności
- współczynnik asymetrii
30. Jaka funkcja Excela odpowiada dominancie
- występuje najczęściej
31. Jaka funkcja w Excelu odpowiada odch standardowemu populacji
Odchylenie średnie
32. Wskaźnik asymetrii
$$Ws = \overset{\overline{}}{x} - \ Mo$$
Wskaźnik asymetrii (znany również miernikiem skośności) dla szeregu symetrycznego jest równy zero. W szeregach asymetrycznych miernik skośności może być większy lub mniejszy od zera, mówimy wówczas o asymetrii prawostronnej (dodatniej) lub asymetrii lewostronnej (ujemnej). W szeregu o skośności prawostronnej wartości skrajne położone są z prawej strony średniej. Powoduje to przesunięcie średniej arytmetycznej w kierunku prawym w stosunku do dominanty i mediany. W szeregu o skośności lewostronnej występuje sytuacja odwrotna.
33. współczynnik asymetrii
Współczynnik asymetrii to iloraz trzeciego momentu centralnego przez trzecią potęgę odchylenia standardowego:
A= $\frac{M_{3}}{S^{3}}$
34. Co to jest kurtoza
Kurtoza jest miarą koncentracji oznaczamy ją literą A funkcja (kurtoza)
K= $\frac{m_{4}}{s^{4}}$ – 3
35. Pozycyjny współczynnik zmienności
Współczynnik zmienności to klasyczna miara zróżnicowania rozkładu cechy. W odróżnieniu od odchylenia standardowego, które określa bezwzględne zróżnicowanie cechy, współczynnik jest miarą względną, czyli zależną od wielkości średniej arytmetycznej. Definiowany jest wzorem:
V = $\frac{s}{\overset{\overline{}}{x}}$
S - to odchylenie standardowe z próby
$\overset{\overline{}}{x}$ - to średnia arytmetyczna z próby
Wartości z próby mogą zostać zastąpione przez odpowiednie wartości z populacji: odchylenie standardowe(σ) i wartość oczekiwana (μ). Współczynnik wielkości zazwyczaj podaje się w procesach.
Współczynnik zmienności jest stosowany najczęściej przy porównywaniu zróżnicowania cechy w dwóch różnych rozkładach.
36. Oblicz prawdopodobieństwo wyrzucenia trójki kostką
A=3
n=1
N=6
P(A) =1/6=0,1666666
37. Oblicz prawdopodobieństwo otrzymania dwóch asów
Kombinacje dwuelementowe ze zbioru 52 – u elementowego
$C_{2}^{52} = \left( \frac{52}{2} \right) = \frac{52!}{2!x50!} = \frac{2652}{2}$ = 1326
Kombinacje dwuelementowe ze zbioru 4-o elementowego
$$C_{2}^{4} = \left( \frac{4}{2} \right) = \frac{4!}{2!x2!} = \frac{12}{2} = 6$$
P(A)=$\ \frac{6}{1326}$
Test
Podać definicję statystyki matematycznej
Statystyka matematyczna zajmuje się metodami wnioskowania statystycznego, które polegają na tym, że na podstawie wyników uzyskanych z próby formułujemy wnioski o całej zbiorowości. Wnioskowanie statystyczne obejmuje estymacje i weryfikację hipotez statystycznych. To dział statystyki, używający teorii prawdopodobieństwa i innych działów matematyki do rozwijania statystyki z czysto matematycznego punktu widzenia.
Czy coroczne spisy rolne to badania statystyczne
Tak
Podać metody badań statystycznych
- badania pełne , badania częściowe, monograficzne, reprezentacyjne, ankietowe , interpolacja, ekstrapolacja,
Jeśli rozpatrujemy prawdopodobieństwo zdarzenia które zachodzi po zajściu poprzedzającego go zdarzenia (np. wylosowanie kuli białej za drugim razem – jeśli z pierwszym razem wylosowaliśmy kulą czarną) to mamy do czynienia z prawd.
– zdarzenia warunkowego
Cechy stałe określają jednostki ( a tym samym i zbiorowość) pod względem :
Rzeczowym, czasowym, przestrzennym i nie podlegają ocenie.
Na jakich typach badań opiera się głównie statystyka :
Oraz które cechy statystyczne podlegają ocenie: zmienne – jakościowe (niemierzalne), ilościowe (mierzalne)
Wymienić rodzaje skal podkreślając te , na których można przeprowadzić operacje arytmetyczne:
Skala oceny, przedziałowa, ilościowa, jakościowa, nominalna, porządkowa, przedziałowa
Wybór odpowiedniej jednostki statystycznej zależy przede wszystkim od:
Celu badania
Aby określone badanie można było uznać za statystyczne musi ono spełniać następujące warunki:
Musi dotyczyć zbiorowości statystycznej
Musi określać prawidłowości charakteryzujące całą zbiorowość
Wykryte prawidłowości muszą dotyczyć zmiennych cech w tej zbiorowości.
Wyjaśnić czym różni się szacunek interpolacyjny od ekstrapolacyjnego:
- interpolacja to szacowanie nieznanych wartości cechy na podstawie znanych wartości sąsiednich (późniejszych i wcześniejszych)
- ekstrapolacja to szacowanie wartości wykraczających poza przedział wartości znanych
Losowość doboru próby polegająca na wyborze poszczególnych elementów zbiorowości statystycznej beztendencyjnie zgodnie z odpowiednimi schematami losowania.
Wymienić etapy badania statystycznego ( w logicznej kolejności)
- przygotowanie (programowanie) badania
- obserwacja statystyczna
- opracowanie i prezentacja materiału statystycznego
- opis lub wnioskowanie statystyczne
Jakie błędy można popełnić w trakcie obserwacji statystycznej
Systematyczne wynikające z jednokierunkowej tendencji do zniekształcenia badanej rzeczywistości.
Niesystematyczne są popełnione z nieuwagi , nieumiejętności bądź ze zwykłego niedbalstwa
Wymienić rodzaje wykresów statystycznych
Graficzny, dynamiczny, korelacyjny
Częściowe badania reprezentacyjne, których dokładność zależy głównie od zdobycia informacji o danej zbiorowości wymagają spełnienia przez nią określonych postulatów, z których najważniejszy jest szacunek statystyczny.
Wybór metody badań statystycznych jest uzależniony od:
Celu badania, rodzaju zbiorowości statystycznej, tematu badania, jego szczegółowości, środków jakimi dysponujemy.
Wśród metod badania pełnego wyróżniamy
Ciągłe, okresowe, doraźne.