Statystyka - wykład 1: wprowadzenie podstawowych pojęć.
.Statystyka matematyczna dzieli się na 2 działy: opis i wnioskowanie statystyczne.
Opis statystyczny charakteryzuje właściwości badanej próby i jest realizowany za pomocą wskaźników. Wnioskowanie statystyczne realizowane jest za pomocą testów. Testy służą do oszacowania prawdopodobieństwa, że dane stwierdzone w próbie wystąpią także w całej populacji. Warunkiem sięgnięcia do wnioskowania jest posiadanie próby reprezentatywnej. Reprezentatywność próby oznacza bycie dobrym modelem populacji. Najprostsze sposoby uzyskiwania próby reprezentatywnej:
losowanie proste - uzyskujemy wtedy próbę prostą (losową). Losowanie może być rzeczywiste lub możemy się posłużyć tablicami liczb losowych.
losowanie systematyczne. Wybieramy co któryś obiekt z uporządkowanej (np. alfabetycznie) listy.
losowanie grupowe - gdy losujemy całe zespoły np. szkoły czy klasy
losowanie warstwowe - stosowane gdy populacja jest niejednorodna. Ustalamy warstwy (podgrupy), jakie występują w populacji i dokonujemy losowania prostego w obrębie każdej warstwy. Jeżeli wydzielone warstwy wyraźnie różnią się wielkością, to pobieramy próbę warstwowo - kwotową, czyli losujemy kolejne próby o wielkości proporcjonalnej do liczebności każdej warstwy.
Istnieją dwie strategie prowadzenia badań:
strategia badań prostych (wyczerpujących);
strategia badań reprezentatywnych.
Badanie proste ma miejsce wtedy, gdy próba jest jednocześnie populacją (badane wszystkie obiekty). Uzyskujemy wtedy wnioski 100%-pewne, a opracowanie statystyczne kończymy na opisie (nie ma potrzeby stosowania wnioskowania statystycznego).
W badaniu reprezentatywnym: pobieramy próbę losową, przeprowadzamy badania na próbie, dokonujemy opisu próby, a następnie za pomocą testów ustalamy prawdopodobieństwo wystąpienia takich samych danych w całej populacji.
Istnieją 4 podstawowe skale pomiarowe:
Skala nominalna, która służy do pomiaru cech jakościowych takich jak: płeć, rodzaj motywacji, typ uzdolnień, marka samochodu, rodzaj błędu, Pomiar polega na klasyfikacji np. zupełnej (wszystkie obiekty z próby sklasyfikowane i żaden nie zostaje poza przydziałem do kategorii) i rozłącznej (każdy obiekt może być przydzielony tylko jeden raz i tylko do jednej kategorii).
Skala porządkowa, która służy do pomiaru cech porządkowych takich jak: nasilenie lęku przed egzaminem, stopień uzdolnień, poziom zaangażowania czy miejsce w wyścigu. Pomiar polega na ustaleniu kolejności wszystkich obiektów (przypisaniu rangi) w szeregu uporządkowanym ze względu na nasilenie cechy.
Skala interwałowa (przedziałowa) służy do pomiaru cech ilościowych (których pomiar zaczyna się od arbitralnie wybranego zera umownego i występuje stała jednostka pomiaru) takich jak, liczba punktów z testów, kwestionariuszy, ankiet, iloraz inteligencji, czy temperatura w skali Celsjusza lub Fahrenheita. Wprowadzenie zera umownego powoduje, że można ustalać tylko o ile jednostek jeden pomiar jest większy od drugiego (nie można powiedzieć ile razy jest większy).
Skala stosunkowa (ilorazowa) - odnosi się do cech ilościowych, np. liczba przeczytanych książek, suma złotych, długość, czas, temperatura w skali Kelvina czy ciepło w kaloriach. Pełny pomiar ilościowy (od zera rzeczywistego) pozwala na stosowanie wszystkich operacji matematycznych.
Każdą skalę wyższego rzędu można przekształcić na skalę niższego rzędu, ale nie jest możliwa operacja odwrotna.
Każdy pomiar ilościowy może być :ciągły, w przybliżeniu ciągły lub skokowy.