Statystyka – nauka zajmująca się metodami badań przedmiotów i zjawisk masowych zachodzących w przestrzeni, czasie oraz ich ilościową lub jakościową analizą. Badania obejmują poszczególne jednostki statystyczne tworzące populację generalną.
Zjawisko masowe – dotyczy masy, badane są jednostki ale wyciągane wnioski są ogólne, np. systematyka dzieci urodzonych w ciągu roku.
Badając np. masę noworodków na oddziale położniczym, prawidłowość statystyczna polega na tym, że najwięcej noworodków będzie miało masę ciała równą ok. 3kg, a odstępstwa od tej średniej będą występowały bardzo rzadko.
Hipoteza statystyczna – każde przypuszczenie dotyczące właściwości, które charakteryzują populację generalną.
Zależy od wielu czynników (czas trwania, płeć, wiek itd.) np. „Wpływ palenia tytoniu na terenie Śląska przez mężczyzn w wieku 40-50lat.”
Zbiór elementów poddanych badaniu, czyli jednostek statystycznych. Jednostką może być pacjent lub np. oczy pacjenta.
populacja generalna – wszystkie osobniki z danego gatunku (badanie epidemiologiczne)
populacja kliniczna – osobniki ograniczone jakimś czynnikiem (np. wiek 60+)
Gdy populacja jest zbyt duża, trzeba ją rozwarstwić, wybrać pewne elementy. Aby próba byłą reprezentatywna, stosunki procentowe muszą zgadzać się z populacją wyjściową (l-ba kobiet/l-ba mężczyzn, itp.), a elementy takiej próby muszą być dobrane losowo.
Nominalne
Dzielimy populację na klasy i jeden element należy tylko do jednej klasy, nie ma gradacji skali, np. instrumenty smyczkowe, dęte itp.
Skala dychotoniczna – dzieli na duże klasy
Porządkowe
Elementy podlegają gradacji ale nie mogą być mierzone w odpowiedni sposób. Przez brak odpowiednich narzędzi ustala się sztuczne, narzucone definicje i przydziela się cyfry, które rosną raz ze wzrostem natężenia elementów, np. skala Apgar.
Interwałowe
Elementy bardzo łatwo da się zmierzyć. Interwałem jest odległość pomiędzy wynikami.
Badane cechy dzielimy na:
Ilościowe – mierzalne
ciągłe, np. masa
dyskretne, np. liczba urodzeń
Jakościowe – niemierzalne ale policzalne, np. zawód, wykształcenie, stan cywilny
Próba – podzbiór populacji, który podlega bezpośredniemu badaniu ze względu na określoną cechę w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w całej populacji generalnej.
Liczebność próby musi być dokładnie określona (N < 30 – mała próba).
Próba reprezentacyjna to taka, której struktura nie różni się od struktury populacji. Może być wyodrębniona przez stratyfikację.
Dla badań statystycznych wykonuje się następujące próby wykonane na poszczególnych grupach homogennych:
Placebo
Badawcza
Kontrolna
Norma
Próba ślepa – pacjenci biorą udział w eksperymencie, z którego zawsze mogą zrezygnować. Jedna grupa dostaje lek, a druga placebo. Różnice pomiędzy wynikami powinny wynikać jedynie z działania leku.
Próba podwójnie ślepa – osoba podająca leki nie wie co podaje, leki są zakodowane, pacjenci również nie wiedzą jaki lek przyjmują. Ujawnienie następuje po zakończeniu badania.
Próba potrójnie ślepa – badanie międzynarodowe, tylko krajowi koordynatorzy mają pełną wiedzę na temat badania. Metoda ta pochłania mnóstwo czasu i pieniędzy.
Kształt rozkładu
Próba narysowania krzywej
Dopasowanie wzoru
Lista:
1 | - | dolny kwadryl | |
---|---|---|---|
2 | |||
3 | |||
4 | |||
5 | |||
6 | - | mediana | |
7 | - | górny kwadryl | |
8 | |||
9 | |||
10 | |||
11 |
Wykres:
Błędy próbkowania – błędy, które pojawiają się w czasie badań statystycznych. Są one duże, jeżeli liczebność próby jest mała, np. jeżeli rzucamy monetą 5 razy, istnieje duże prawdopodobieństwo, że wylosujemy tylko reszkę.
Precyzyjność mierzymy przez sumę wartości bezwzględnych uchybów.
Diagram:
punkty wyznaczające wyniki pomiarów nie są połączone, gdy elementy statystyczne są różne,
łączymy punkty, gdy wyniki dotyczą jednego osobnika.
Histogram
wykres słupkowy,
histogram kumulowany dodatni/ujemny.
Statystyka opisowa – zajmuje się metodami oraz ich sumarycznym opisem. Dane statystyczne mogą być przedstawione za pomocą:
szeregów statystycznych:
„Surowy” szereg statystyczny – dane zapisane są w kolejności ich otrzymywania.
Uporządkowany szereg prosty – dane zapisane w kolejności (rosnąco, malejąco itp.).
Szereg rozdzielczy – dane klasyfikujemy ze względu na klasy (przedziały), a następnie podajemy liczebność klas. Liczebność określa rozkład wyników pomiarowych danej cechy. Jeżeli dana cecha jest zmienną losową, to liczebności klas nie mogą być jednakowe. Klasa środkowa powinna być najliczniejsza.
miar położenia – średnia, mediana, dominanta;
miar rozproszenia – rozstęp, wariancja, odchylenie standardowe, odchylenie przeciętne;
tabele, wykresy.
Statystyka matematyczna – zajmuje się metodami poznawania charakteru i właściwości rozkładu badanych cech w populacji (najważniejszy jest rozkład normalny!).
Statystyka indukcyjna (wnioskowanie statystyczne) – zajmuje się opracowaniem metod wnioskowania statystycznego, którego celem jest uogólnienie obserwacji przeprowadzanych na próbie na całą populację generalną