1 Czym zajmuje się statystyka matematyczna?
zajmuje się teorią, opisem i analizą zjawisk masowych (zjawisk o dużej liczebności) głównie przy użyciu metod matematycznych, a szczególnie rachunku prawdopodobieństwa.
2 Podział statystyki matematycznej.
Statystyka - podział
• statystyka opisowa (zbieranie danych, ich
prezentacja i sumaryczny opis)
• rachunek prawdopodobieństwa
(zdarzenia losowe)
• wnioskowanie statystyczne
(wykorzystanie teorii statystycznych do
uzyskiwania informacji o całości na
podstawie badania części)
3 Populacja generalna, jednostka statystyczna – przykłady.
ZBIOROWOŚĆ (POPULACJA) GENERALNA: wszystkie obiekty (elementy) będące przedmiotem badania.
JEDNOSTKA STATYSTYCZNA: pojedynczy obiekt (element) poddany badaniu statystycznemu (pomiarowi lub obserwacji).
4 Cecha statystyczna – rodzaje cech.
CECHY NIEMIERZALNE (jakościowe, kwalitatywne): można je jedynie opisać słownie lub za pomocą odpowiednich skal
CECHY MIERZALNE (ilościowe, kwantytatywne): możliwe do
opisania za pomocą liczb np. fizycznych (kg, cm , liczbie sztuk) :
– ciągłe: przyjmujące dowolne wartości w
danym przedziale
– skokowe: przyjmująca określone wartości w
danym przedziale,
5 Etapy badań statystycznych.
Etapy badań statystycznych
– Obserwacja statystyczna
• zbieranie materiału empirycznego tak, aby możliwe było uchwycenie stanu populacji w określonym momencie lub zmian zachodzących w czasie
– Opis
• kontrola zebranego materiału, jego porządkowanie, klasyfikację, określenie wartości różnych mierników.
Rezultatem są tablice, wykresy i charakterystyki liczbowe
– Analiza
• wykrywanie prawidłowości w badanych zjawiskach, ich interpretacja i formułowanie wniosków
6 Co to jest szereg rozdzielczy.
Szereg rozdzielczy to dane ułożone według malejącej lub wzrastającej wartości cechy.
7 Zasady tworzenia szeregu rozdzielczego.
Uzyskuje się go dzieląc dane statystyczne
na pewne kategorie i podając liczebność
(częstość) zbiorów danych
przypadających na każdą z tych kategorii
• Szereg może być:
– strukturalny (cecha jakościowa)
– punktowy (cecha ilościowa, skokowa)
– przedziałowy (cecha ilościowa, ciągła)
8 Sposoby graficznej prezentacji szeregów rozdzielczych.
- strukturalny
- punktowy
- przedziałowy
- punktowy + przedziałowy
9. Miary położenia – definicje, sposoby wyznaczania.
Miary położenia:
Średnią arytmetyczną nazywamy sumę jednostek danego zbioru podzieloną przez liczbę tych jednostek. Dla zbiorowości statystycznej składającej się z jednostek o wartościach
x1, x2, ..., xn, średnia arytmetyczna () jest równa:
Dla szeregu rozdzielczego, w którym ni jest liczebnością klasy, a jej środkiem jest xi, średnią arytmetyczną () określa się wzorem:
Mediana – wartość cechy, która dzieli uporządkowany
zbiór danych na dwie równe części
$$\mu_{e} = x_{d} + \frac{x_{g} - x_{d}}{n_{e}}\ (\frac{N + 1}{2} - n_{j})$$
Modalna (dominanta)
– wartość cechy o największej liczebności μo = μ − 3(μ − μe)
Średnia kwadratowa:
10 Własności średniej arytmetycznej.
Średnia arytmetyczna
xi – jednostki zbiorowości statystycznej
n – liczba jednostek
Średnia dla szeregu rozdzielczego.
n = Σni
ni – liczebność i-tej klasy
xi – środek klasy
Średnia na podstawie wartości wyjściowej, tzw. średniej z wartością wyjściową.
gdzie c jako stała jest wartością wyjściową. Dla szeregu rozdzielczego przyjmuje postać
Różnica obydwu średnich wynika z różnic występujących między wartościami środkowymi klas i wartościami średnich jednostek zaliczonych do klas
11 Relacje między średnią arytmetyczną, a średnią kwadratową.
?????????
12 Relacje między średnią arytmetyczną, medianą i modalną.
??????????
13 Miary zmienności (dyspersji) - definicje, sposoby wyznaczania.
Miary zmienności:
Rozstęp – różnica między największą i najmniejszą wartością cechy w zbiorowości .
Wariancją nazywamy średnią arytmetyczną kwadratów odchyleń poszczególnych wartości cechy od jej średniej arytmetycznej.
Wariancję można określić wzorem: lub
Odchylenie standardowe jest pierwiastkiem kwadratowym wariancji s=
Odchylenie przeciętne określa się wzorem δ=
Współczynnik zmienności – jest to odchylenie standardowe wyrażone w procentach średniej arytmetycznej: V =
14 Współczynnik zmienności i jego zastosowanie.
Współczynnik zmienności – jest to odchylenie standardowe wyrażone w procentach średniej arytmetycznej: V =
Zastosowanie : ???????
15 Relacje między odchyleniem standardowym i rozstępem.
??????????
16 Jak można zmierzyć asymetrię (skośność).
Wskaźnik skośności ma znak i wartość. Znak „plus” wskazuje na asymetrię dodatnią, a znak „minus” na asymetrię ujemną. Im większa jest bezwzględna wartość wskaźnika skośności, tym większa jest asymetria rozkładu.
I.Od Eweliny
1 Co to jest jednostka standardowa. Właściwości populacji wyrażonej w jednostkach standardowych.
??????????
2 Co to jest zdarzenie losowe. Przykłady.
Zdarzenie losowe – gdy zajście pewnego zdarzenia nie można z góry przewidzieć, zachodzi ono lub nie.
(1)Jeżeli zdarzenie A zachodzi wtedy i tylko wtedy, kiedy zachodzi zdarzenie B, to mówimy, że zdarzenie A jest równoważne (identyczne) zdarzeniu B.
A = B
(2) Jeżeli zdarzenie B zachodzi wtedy i tylko wtedy, gdy zachodzi zdarzenie A. To mówimy, że zajście zdarzenia A pociąga za sobą zajście zdarzenia B.
A ⊂ B
3 Klasyczna definicja prawdopodobieństwa.
Definicja klasyczna (na podstawie Laplace`a 1812)
Prawdopodobieństwem P zdarzenia losowego A nazywamy iloraz liczby zdarzeń elementarnych sprzyjających zdarzeniu A oraz liczby wszystkich zdarzeń elementarnych, jednakowo możliwych i wzajemnie się wykluczających. $P\left( A \right) = \frac{a}{a + b}$
0 £ P(A)£1 P(B) =1- P(A)
4 Współczesna definicja prawdopodobieństwa.
Definicja współczesna (na podstawie Kołmogorowa)
(Prawdopodobieństwo jest tu rozumiane jako miara na
podzbiorach zbioru zdarzeń elementarnych. Definicja
zapisywana jest w formie aksjomatów wynikających z teorii
klasycznej Laplace`a)
5 Co to jest zmienna losowa.
Zmienna losowa – funkcja która z określonym prawdopodobieństwem przyporządkowuje zdarzeniom elementarnym liczby rzeczywiste
6 Typy zmiennych losowych.
Zmienna losowa X funkcja X przyporządkowująca każdemu zdarzeniu elementarnemu 1 i tylko 1 liczbę.
Skokowa – gdy może przyjmować skończoną lub nie skończoną ale przeliczalną liczbę wartości
Ciągła – gdy jej możliwe wartości tworzą przedział ze zbioru liczb rzeczywistych.
7 Co to jest gęstość prawdopodobieństwa zmiennej losowej.
???????????
8 Co to jest dystrybuanta zmiennej losowej.
Dystrybuanta zmiennej losowej X to prawdopodobieństwo przyjęcia przez zmienną losową X wartości >= X
9 Charakterystyka rozkładu dwumianowego.
Przykład funkcji rozkładu prawdopodobieństwa
• Opisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p
10 Wyznaczanie częstości teoretycznych zgodnych z rozkładem dwumianowym.
???????????
11 Charakterystyka rozkładu normalnego.
Najczęściej stosowany rozkład w statystyce
• Podstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji
• Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych
• Przykład rozkładu zmiennej ciągłej
• Jego funkcję gęstości prawdopodobieństwa można opisać następująco:
$$f\left( x \right) = \frac{1}{\sigma\sqrt{2}}*exp\lbrack - \frac{\left( x - \mu \right)^{2}}{2\sigma^{2}}\rbrack$$
• gdzie:
– x - zmienna
– μ - średnia arytmetyczna
– σ - odchylenie standardowe
12 Wyznaczanie częstości teoretycznych zgodnych z rozkładem normalnym.
???????????
1 Powody dla których prowadzi się badania na podstawie próby.
????????
2 Na czym polega losowanie niezależne i losowanie zależne.
Schematy losowania:
niezależne – ze zwracaniem, - jeden element populacji może zostać wylosowany do próby więcej niż 1 raz
zależne – bez zwracania,
3 Co to jest prosta próba losowa.
Prosta próba losowa – to taka próba w której każdy element populacji ma jednakową szansę (prawdopodobieństwo) wejścia do próby, a losowanie elementów jest niezależne.
4 Wyjaśnij pojęcie „statystyka”, podaj przykłady statystyki.
Statystyka – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.
5 Jaka jest różnica między parametrem populacji, a parametrem próby.
Różnica między próbą a populacją. Populacją jest cała zbiorowość, a próba jest wybraną częścią populacji. Posłużmy się konkretnymi przykładami:
- populacją jest ludność zamieszkująca Polskę, a próbą z tej populacji jest ludność wybranego województwa,
- populację stanowią drzewa na danym obszarze, a próbą z tej populacji jest np. 30 wybranych drzew, itd.
6 Co to jest błąd standardowy średniej arytmetycznej z próby i jaki jest jego związek z odchyleniem standardowym populacji.
??????????
7 Wymień poznane rozkłady z próby.
Próba reprezentatywna – to taka próba z której po odpowiednich przeliczeniach uzyskamy
idealny obraz populacji. Otrzymujemy ją przez losowy wybór.
Próba tendencyjna – reprezentatywna daje fałszywy obraz populacji.
8 Co to jest estymacja statystyczna.
Estymacją statystyczną 2 nazywamy postępowanie, mające na celu wyznaczenie parametrów populacji na podstawie wyników badania reprezentacyjnego.
9 Co to jest estymator.
Estymator jest statystyką służącą do szacowania wartości parametru rozkładu.
Celem zastosowania estymatora jest znalezienie parametru rozkładu cechy w populacji.
10 Cechy dobrego estymatora.
??????
11 Jakie warunki muszą być spełnione, aby do budowy przedziału ufności dla średniej można było wykorzystać rozkład normalny.
?????????
12 Od czego zależy szerokość przedziału ufności.
?????
13 Od czego zależy liczebność próby losowej.
????????
1 Rodzaje hipotez statystycznych.
Hipotezy statystyczne – sformułowane przypuszczenia dotyczące rozkładu populacji:
parametryczne – precyzują wartości parametrów w rozkładzie populacji (są najczęściej stosowane)
nieparametryczne – dotyczą rozkładów badanej cechy w populacji generalnej i nie prezentują wartości parametrów tego rozkładu
h0 – podlega weryfikacji
h1 – alternatywna
Do weryfikacji testów używamy testów.
2 Co to jest hipoteza zerowa albo hipoteza alternatywna.
Hipoteza zerowa – hipoteza podlegająca testowaniu
• Hipoteza alternatywna – hipoteza „rezerwowa” na wypadek, gdyby hipoteza zerowa okazała się fałszywa
– Powyższe hipotezy mogą być zarówno parametryczne, jak i nieparametryczne
3 Rodzaje błędów popełnianych podczas testowania hipotez.
???????
4 Co to są testy istotności.
Test istotności - rodzaj testu, w którym na podstawie wyników próby losowej podejmuje się wyłącznie decyzję odrzucenia hipotezy, którą się sprawdza, bądź stwierdza się brak podstaw do odrzucenia tej hipotezy.
5 Jakiego błędu unikamy stosując istotności.
?????
6 Jakie jest prawdopodobieństwo popełnienia błędu pierwszego rodzaju przy stosowaniu testów istotności.
???????
7 Jakie testy mogą być stosowane przy porównywaniu dwóch średnich.
???????
8 Przedstaw test do porównywania wariancji.
????????
9 Jak powinna być sformułowana hipoteza, którą weryfikujemy podczas badania istotności korelacji (w analizie korelacyjnej).
?????????
10 Do czego służy test zgodności x2 . (chi kwadrat, nie iks)
Test zgodności χ2 pozwala na weryfikację hipotezy, że populacja ma określoną postać funkcyjną dystrybuanty. Może to być rozkład dla zmiennej losowej zarówno skokowej jak i ciągłej, a jedynym ograniczeniem jest konieczność operowania dużą próbą.
11 Czego dotyczy hipoteza zerowa w analizie wariancji.
???????
12 Przedstaw rozmieszczenie wariantów doświadczenia na polu doświadczalnym jeżeli doświadczenie założono w układzie całkowicie zrandomizowanym bloków losowych kwadratu łacińskiego przy danej liczbie wariantów (f) i danej liczbie powtórzeń (n).
????????