Zdarzenie losowe-wyniku nie jesteśmy wstanie przewidzieć
Zdarzenie elementarne- pojedynczy, niepodzielny wynik doświadczenia
Przestrzeń zdarzeń- zbiór wszystkich zdarzen elementarnych
Zdarzenie- podzbiór przestrzeni zdarzeń (Ω) obejmujący zdarzenia elementarne które sprzyjają temu zdarzeniu.
Zbiór pusty- zdarzenie, które w rzadnym doświadczeniu nie może się zrealizować.
PRAWDOPODOBIEŃSTWO: klasyczna (jeżeli wszystkie zdarzenia elementarne są jednakowo prawdopodobne, to prawdopodobieństwo każdego zdarzenia jest ilorazem liczby zadrzen elementarnych sprzyjających temu zdarzeniu przez liczbę wszystkich zdarzen elementarnych); Częściowa (statystycznie jest to stosunek zdarzen sprzyjających do ogólnej liczby zdarzen w długiej serii doświadczeń)
Miary średnie:
- Średnie klasyczne (są obliczane na podstawie wszystkich wartości szeregu) arytmetyczna; harmoniczna; geometryczna
- Średnie pozycyjne (są wartościami konkretnych wyrazów szeregu (pozycji) wyróżniających się pod pewnym względem) dominanta - wartość najczęstsza; kwantyle: kwantyle (dzielące zbiorowośc na 4 części), kwintale (dzielące zbiorowośc na 5 części), decyle (10 części), centyle (percentyle, 100 części)
Średnia Arytmetyczna- suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzieloną przez liczbę tych jednostek.
Średnia harmoniczna- średnią harmoniczną zbioru jest odwrotność średniej arytmetycznej z odwrotności tych liczb.
Mediana- jest to wartość środkowa szeregu uporządkowanego, dzieli taki szereg na dwie równe części pod względem liczebności. Dokładnie 50% obserwacji tego szeregu znajduje się poniżej tej wartości i 50% powyżej tej wartości. Dla szeregu uporządkowanego dla nieparzystej liczbie obserwacji mediana jest środkowym wyrazem szeregu, gdy szereg ma parzystą liczbę obserwacji medianą jest średnia arytmetyczna dwóch wartości środkowych szeregu. Mediana szeregu rozdzielczego znajduje się w przedziale, w którym liczebność skumulowana jest mniejsza lub równa n/2 (n-liczebność próby).
Kwantyle - są to miary pozycyjne, które dzielą uporządkowany szereg statystyczny na równe części pod względem obserwacji. Do kwanty li należą kwantyle, które dzielą próbę na 4 równe części, zawierające po 25% obserwacji, decyle- na 10 równych części zawierających po 10% obserwacji, oraz procentyle- punkty procentowe, czyli 100 równych części zawierających po 1% obserwacji.
Odchylenie standardowe- Jest pierwiastkiem kwadratowym z wariancji . Wyrażana jest w tych samych jednostkach co rozpatrywana cecha (w jednostkach pomiaru). Określa o ile przeciętne pojedyncze obserwacje różnią się od średniej arytmetycznej tych obserwacji. Im większe jest odchylenie standardowe, tym bardziej rozproszone są dane.
Błąd standardowy średniej- służy do oceny niepewności związanej z estymacją średniej w populacji. Maleje do zera wraz ze wzrostem n. Używane do przewidywań dotyczących średniej.
Współczynnik zmienności- Jest miarą wyrażającą jaki procent średniej stanowi odchylenie standardowe. Wielkość zazwyczaj w %. Przydatny szczególnie do porównywania zmienności cech wyrażanych w różnych jednostkach np. wagi (kg), wzrostu (cm).
Klasyfikacja zmienności- Mała (0-20%0; Przeciętna (20-40); duża (40-100); bardzo duża (100-150); skrajnie duża (pow. 150).
Kowariancja- średnia iloczynów odchyleń każdej pary punktu danych, służy do określenia zależności pomiędzy dwoma zbiorami danych.
Korelacja- mówi w jakim stopniu zjawiska są ze sobą powiązane. Współczynnik rxy : Słaba (<0,2; prawie nie zachodzi); Niska (0,2-0,4; wyraźna lecz mała); Umiarkowana (0,4-0,7; Istotna); Wysoka (0,7-0,9; znacząca); Bardzo wysoka (0,9-1; bardzo pewne).
Regresja- odpowiada na pytanie o ile przy wzroście jednej cechy o jednostkę zmieni się wartość drugiej cechy.
Hipoteza statystyczna- nazywamy każdy sąd o zbiorowości generalnej, wydany bez przeprowadzenia badania całkowitego. 1) hipoteza parametryczna (dotyczą wartości odpowiednich parametrów statystycznych populacji generalnej takich jak wariancja czy wartość przeciętna); 2) Hipoteza nieparametryczna (dotycząca np. postaci rozkładu cechy statystycznej, współzależności cechy lub losowości próby).
Hipoteza zerowa (H0)- nazywamy hipotezę sprawdzaną (testowaną, weryfikowaną)
Hipoteza alternatywna (H1)- nazywamy hipotezę, którą jesteśmy w stanie przyjąć, gdy odrzucamy hipotezę H0
Prawdziwośc hipotezy zerowej weryfikujemy na podstawie wyników próby za pomocą testu statystycznego, który w zależności od rodzaju hipotezy może być:
- testem parametrycznym (dla h. parametrycznych)
- testem nieparametrycznym (dla h. nieparametrycznych)
Test statystyczny- to reguła postępowania, która przyporządkowuje wynikom próby losowej decyzję przyjęcia lub odrzucenia H0.
Przyjęcie hipotezy H0 oznacza, że hipotezę tę uznajemy za prawdziwą natomiast odrzucenie tej hipotezy, że H0 uznajemy za fałszywą, co jest równoznaczne z przyjęciem hipotezy alternatywnej jako hipotezy prawdziwej. Poniwarz decyzję o przyjęciu lub odrzuceniu H0 podejmuje się na padstawie wyników otrzymanych w próbie, możliwe jest popełnienie dwóch rodzajów błędów.
BŁĄD: błąd I rodzaju (polega na odrzuceniu H0 mimo że jest ona prawdziwa. Poziomem istotności α nazywamy prawdopodobieństwo popełnienia błędu I rodzaju. Wartości α są bliskie zera i na ogół równe 0,01; 0,02; 0,05; 0,1); Błąd II rodzaju (Polega na przyjęciu H0 mimo że jest ona fałszywa, czyli prawdziwa jest H1. Prawdopodobieństwo popełnienia błędu II rodzaju oznacza się przez β. Dobry test statystyczny powinien mieć tę własność, że β również powinno być bliskie zeru.
Test zgodności : może być stosowany jeśli:* dane pochodzą z dużej n-elementowej próby wylosowanej w sposób niezależny.* dane są przedstawione w postaci szeregu rozdzielczego o r przedziałach klasowych, o liczebnościach przedziałów np…..n spełniających warunek n1+n2+…+nr=n. Na ogół przyjmuje się że n1≥5i i=1,2…r.;* rozkład hipotetyczny (sprecyzowany w H0) może być rozkładem zarówno typu ciągłego jak i skokowego.
Test zgodności : a) funkcja testowa służy do weryfikowania hipotezy statystycznej o zgodności rozkładu w próbie z hipotetycznym rozkładem populacji. B) hipotezę odrzucamy gdy x02>xa2 gdzie xa jest α-procentową wartością x2 odczytaną z tablicy przy v=c-1 stopniach swobody. C) liczbę klas oznaczono jako „c”. Wartość oczekiwana w każdej klasie nie powinna być mniejsza niż 5. Jeśli jest mniejsza, a mamy wiele klas, to należy je połączyć, dodając osobno wartości oczekiwane f dla dwóch lub więcej klas i osobowo wartości otrzymane F.
Zm.losowa to taka zmienna, która przyjmuje określone wartości liczbowe z danym prawdopodobieństwem.
Zm.losowe skokowe(zwane tez dyskretnymi) to zmienne przyjmujące skończoną lub nieskończoną , ale przeliczalną liczbę wartości(np.liczba wyrzuconych oczek na sześciennej kostce,liczba samochodów w gopsp.domowym, liczba nabytych akcji PKO BP)
Zmienna losowa ciągła to zmienna przyjmująca nieskończoną lub nieprzeliczalna liczbę wartości np. wiek poszczególnych osób,czas przejazdu autostradą z Gliwic do Wrocławia itp.
Rozkład zmiennej losowej - opis wartości przyjmowanych przez zmienną losową przy pomocy prawdopodobieństw z jakimi są one przyjmowane.
Współczynnik korelacji - liczba określająca w jakim stopniu zmienne są współzależne. Jest miarą korelacji dwu (lub więcej) zmiennych. Istnieje wiele różnych wzorów określanych jako współczynniki korelacji. Większość z nich jest normalizowana tak, żeby przybierała wartości od -1 (zupełna korelacja ujemna), przez 0 (brak korelacji) do +1 (zupełna korelacja dodatnia).