Badanie statystyczne i zbiorowość statystyczna, podział cech statystycznych, skale pomiaru cech mierzalnych i niemierzalnych:
Badanie statystyczne jest to takie badanie, które spełnia następujące warunki: dotyczy zbiorowości (masy) statystycznej, określa prawidłowości charakteryzujące całą zbiorowość (nie opisuje własności poszczególnych jednostek, dane prawidłowości dotyczą zmiennych (cech) występujących w tej zbiorowości. Podział:
badania pełne (całkowite, wyczerpujące) – obejmują wszystkie jednostki statystyczne z danej zbiorowości statystycznej. Np. spis statystyczny – badanie okresowe lub doraźne obejmujące wszystkie jednostki zbiorowości statystycznej.
badania
niepełne
(częściowe) –
obejmują niektóre jednostki statystyczne z danej zbiorowości
statystycznej. Często stosowane są dla populacji generalnej, z
której pobrano próbę. Przynosi mniej dokładne wyniki. Wyróżniamy
tu reprezentatywne, monograficzne, ankietowe
Badania pełne i częściowe możemy jeszcze podzielić na:
ciągłe: Zmieniające się w czasie zjawiska są obserwowane i analizowane sukcesywnie oraz nieprzerwanie np. ewidencja urodzeń i zgonów,
okresowe: Podejmowane w pewnych, zazwyczaj ściśle określonych odstępach czasu. Np. powszechne spisy ludności co 10 lat
doraźne: Przeprowadzane w pewnych szczególnych okolicznościach, spowodowanych z reguły nieprzewidzianymi przyczynami Np. badanie strat materialnych spowodowanych powodzią lub pożarem
Obserwacja statystyczna to wstępny etap badania statystycznego, którego celem jest zgromadzenie danych o określonym zjawisku, lub ich grupie, za pomocą spisu, rejestracji bieżącej lub statystycznej sprawozdawczości. Może mieć charakter badania pełnego, dotyczącego wszystkich jednostek zbiorowości statystycznej, lub badania niepełnego, dotyczącego niektórych jednostek wybranych ze zbiorowości statystycznej.
Zbiorowość statystyczna (populacja/masa statystyczna) to zbiór dowolnych elementów objętych badaniem statystycznym. Owe poszczególne elementy wchodzące w skład badanej zbiorowości to jednostki statystyczne. Rodzaje:
populacja
generalna - jest to
zbiór dowolnych elementów (osób, obserwacji, zdarzeń) nie
identycznych z punktu widzenia badanej cechy, obejmujący wszystkie
elementy, co do których chcemy sformułować wnioski ogólne.
Liczebność zbiorowości generalnej może być skończona lub
nieograniczona. Jeżeli badamy zbiorowość ze względu na jedną
cechę, mówimy o zbiorowości
jednowymiarowej,
natomiast gdy rozpatrujemy wiele cech - o zbiorowości
wielowymiarowej.
Można poddać
populacja próbna - jest to podzbiór zbiorowości generalnej, obejmujący część jej elementów, wybranych w określony sposób. Podzbiór ten badamy, a uzyskane wyniki uogólniamy na zbiorowość generalną Wyróżniamy: mała – N < 30; duża – N » 30;
Próba reprezentatywna: Wnioskowanie o populacji generalnej jest zasadne tylko wówczas, gdy próba jest reprezentatywna, tzn. gdy jej struktura ze względu na interesujące nas cechy statystyczne jest zbliżona do struktury populacji generalnej. Próba jest reprezentatywna wtedy, gdy: 1. elementy populacji są pobierane do próby w sposób losowy 2. próba jest dostatecznie liczna.
Cechy statystyczne to właściwości, którymi charakteryzują się jednostki statystyczne wchodzące w skład danej zbiorowości statystycznej, a które poddajemy analizie statystycznej. Podział cech statystycznych:
Cechy
stałe –
określają
jednostki statystyczne (i zbiorowość statystyczną) pod względem
rzeczowym, czasowym i przestrzennym, można więc powiedzieć, że
odpowiadają na pytania: co?, kiedy? i gdzie?. Są wspólne
wszystkim jednostkom badanej zbiorowości, zatem nie podlegają
badaniu a jedynie decydują o zaliczeniu jednostek do danej
zbiorowości.
→ Przykład: badamy zbiorowość, której
jednostkami statystycznymi są przedsiębiorstwa budowlane z
województwa śląskiego, które prowadziły działalność w 2000
roku.
Cechy zmienne – Podlegają badaniu statystycznemu. Są to właściwości, którymi różnią się dane jednostki statystyczne.
jakościowe (niemierzalne) – nie można ich zmierzyć; możemy je jedynie określić słownie np. płeć, kolor włosów
ilościowe (mierzalne) – można je wyrazić za pomocą liczb o różnych mianach, np. wzrost (w cm), wiek (w latach), zarobek (w złotych).
skokowe (dyskretne) – cechy, których wartości mogą się wyrażać jedynie określonymi liczbami ze zbioru skończonego przeliczalnego, zmieniającymi się skokami, bez wartości pośrednich: liczba zębów.
ciągłe – cechy, które mogą przyjmować każdą wartość z określonego skończonego przedziału liczbowego. Przykłady: wiek
quasi-ilościowe (porządkowe) – określają natężenie badanej cechy, porządkują w określony sposób badaną zbiorowość statystyczną. Przykłady: oceny, rangi.
Skale niemetryczne (jakościowe):
Skala nominalna (klasyfikacyjna): cech jakościowych, Skala słaba, najmniej precyzyjny sposób pomiaru, Liczby pełnią rolę umownych symboli, służących do identyfikacji jednostek statystycznych i ich klasyfikacji do wyróżnionych kategorii (grup) Dopuszczalne operacje matematyczne: zliczanie jednostek należących do określonej kategorii danej cechy i obliczanie np.: proporcji, odsetek Przykłady: gatunki sera, trasy autobusów, numery pokoi
Skala porządkowa (rangowa): jakościowych i ilościowych , Skala słaba, bardziej precyzyjna od skali nominalnej (oprócz grupowania jednostek, można je porządkować), Ma wszystkie cechy skali nominalnej, a poza tym można w niej porządkować jednostki statystyczne w ramach wyróżnionych kategorii pod względem natężenia danej cechy, Liczby (rangi) wyznaczają kolejność występowania jednostek, ale nie określają odległości pomiędzy nimi: Rangi to kolejne wartości naturalne (np. 1, 2, 3 …), Porządkowanie jednostek według badanej cechy z wykorzystaniem rang może być uporządkowaniem: Dopuszczalne operacje matematyczne: takie przekształcanie liczb, które nie zmieniają porządku jednostek, np. potęgowanie, pierwiastkowanie, logarytmowanie, Przykłady: gatunki owoców i warzyw (I, II, III), , 9-stopniowa skala Richtera, stopnie wojskowe, , wykształcenie,
Skale metryczne (ilościowe):
Skala przedziałowa (interwałowa): Skala mocna, bardziej precyzyjna od skali porządkowej, Ma wszystkie cechy skali rangowej, a poza tym można w niej określać odległość (dystans) między jednostkami: istnieje jednostka skali oraz zero skali nie posiadające interpretacji fizycznej (zero na skali interwałowej nie odpowiada zerowej wartości cechy, Dopuszczalne operacje matematyczne: dodawanie i odejmowanie, nie można wykonywać dzielenia i mnożenia, Przykłady: lata kalendarzowe, skale temperatur Celsjusza i Farenheita, indeksy cen
Skala stosunkowa (ilorazowa): Skala mocna, najprecyzyjniejsza skala, Ma własności trzech poprzednich skal, a poza tym posiada naturalny punkt zerowy, istnieje jednostka skali, zero skali posiadające interpretację fizyczną: Dopuszczalne operacje matematyczne: wszystkie, łącznie za dzieleniem, Przykłady: wiek, dochody, wielkość sprzedaży, ceny towarów, temperatura w skali Kelvina, długość, ciężar, koszty