TEORIA STATYSTYKI
Statystyka – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.
Zjawisko Masowe
Zjawisko składające się z wielu elementów, które z pewnego punktu widzenia mogą być jednakowe a z innego nie, czyli różnią się między sobą; np.: ludność pewnego miasta, osoby chore na cukrzyce itp.
Zjawiska (procesy) masowe
to takie, które powtarzają się dostatecznie często.
każde zjawisko: przyrodnicze, techniczne czy ekonomiczno-społeczne, kształtuje się pod wpływem dwojakiego rodzaju przyczyn:
głównych (podstawowych, typowych)
ubocznych (przypadkowych, nietypowych)
Przyczyny główne wpływają na każde zjawisko w jednakowy sposób- działają w ściśle określonym kierunku, co kształtuje pewną prawidłowość wyników.
Przyczyny uboczne maja charakter przypadkowy, zróżnicowany, co powoduje zakłócenie wyników obserwacji. Wyniki obserwacji są więc efektem konieczności i przypadkowości.
Statystyka- znaczenie terminu
Po pierwsze określa się nim zbiór informacji liczbowych, dotyczących celowo wybranej grupy lub kategorii zjawisk.
Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania, o prawidłowościach występujących w procesach masowych.
Po trzecie , nowoczesna statystyka , to nauka dostarczająca metod (narzędzi )do podejmowania decyzji) w warunkach niepewności.
Statystyka opisowa
dostarcza metod i procedur gromadzenia, opracowywania i prezentacji danych statystycznych. Celem statystyki opisowej jest podanie zwięzłego opisu określonego materiału statystycznego. Jeżeli zgromadzone dane dotyczą części badanej zbiorowości sam opis może być niewystarczający. Uogólnienie wyników zaobserwowanych na podstawie badań częściowych jest możliwe tylko w tym przypadku, gdy badania te są odpowiednio przeprowadzone.
Statystyka matematyczna
dostarcza metod wyboru prób losowych i reguł wnioskowania , czyli pozwala na uogólnienie wniosków wynikających z obserwacji części zbiorowości, tak aby ryzyko popełnienia błędu było małe. Wnioskowanie statystyczne opiera się na rachunku prawdopodobieństwa.
Zbiorowość statystyczna
Zbiór dowolnych elementów (osób, przedmiotów, faktów), podobnych pod względem określonych cech ale nie identycznych, i poddanych badaniom statystycznym
Zbiorowości statystyczne mogą być:
skończenie lub nieskończenie liczne
statyczne (gdy elementy są obserwowane w danym momencie czasu)
dynamiczne (elementy obserwowane w przedziale czasowym)
jednowymiarowe (gdy elementy poddaje się badaniu ze względu na jedną cechę)
wielowymiarowe (w przypadku rozpatrywania wielu cech)
jednorodne lub niejednorodne.
Jednostka statystyczne -element składowy zbiorowości poddawany bezpośredniej obserwacji lub pomiarowi (obiekt badania).
Zbiorowość (populacja) generalna - wszystkie elementy, będące przedmiotem badania, co do których formułowane są wnioski ogólne.
Zbiorowość próbna (próba) - podzbiór populacji generalnej, obejmujący część jej elementów - wybranych w określony sposób. Próba podlega badaniu statystycznemu, a wynik jest uogólniany na zbiorowość generalną.
Badanie statystyczne -ogół prac mających na celu poznanie struktury określonej zbiorowości statystycznej.
Proces zbierania informacji statystycznej to obserwacja statystyczna.
Obserwację statystyczną można uzyskać na podstawie badania statystycznego
Podział badań statystycznych
Całkowite- obejmują wszystkie jednostki zbiorowości statystycznej
Częściowe - obejmują część zbiorowości generalnej, próbę
Badania całkowite – przykłady
spis statystyczny - jednorazowe lub powtarzalne (co pewien okres) badanie obejmujące wszystkie jednostki zbiorowości statystycznej. W Polsce przeprowadza się co 10 lat narodowy spis powszechny ludności. Spis statystyczny jest badaniem kosztownym, wymagającym odpowiedniego przygotowania technicznego i organizacyjnego
inwentaryzacja - spis ujmujący faktyczny ilościowy i wartościowy stan majątku określonej jednostki administracyjnej lub podmiotu gospodarczego,
rejestracja bieżąca - systematyczne notowanie ściśle określonych faktów, będących przedmiotem badań, np. ewidencja urodzeń, zgonów, itp.,
sprawozdawczość statystyczna - obejmuje informacje przekazywane, obligatoryjnie na odpowiednich formularzach, przez osoby fizyczne, podmioty gospodarcze i inne (zeznania podatkowe)
Badania częściowe – przykłady
badanie ankietowe - najszybszy sposób badania zjawisk masowych, stosowane w celu zgromadzenia informacji o ściśle określonych problemach (np. nastroje społeczne, preferencje konsumentów), informacje uzyskuje się na podstawie odpowiedzi na przygotowane uprzednio pytania, zadawane wybranym osobom.
badanie monograficzne - polega na szczegółowym opisie i analizie indywidualnego przypadku, wybranej jednostki statystycznej lub niewielkiego zespołu jednostek, przy czym oprócz charakterystyk liczbowych podaje się też informacje w formie opisowej.
badanie reprezentacyjne - opiera się na próbie pobranej ze zbiorowości generalnej w sposób losowy, popełnione błędy przy przenoszeniu wyników z losowej próby na zbiorowość szacuje się z rachunku prawdopodobieństwa.
Zarówno badania całkowite jak i częściowe mogą być obarczone błędami popełnianymi w trakcie badania.
W badaniu częściowym błędy mogą wystąpić dodatkowo na skutek tego, że struktura próby różni się od struktury populacji. Wynika stąd, że gdy korzystamy z badania częściowego, wydanie prawdziwego sądu jest zdarzeniem losowym, któremu odpowiada jakieś prawdopodobieństwo. To prawdopodobieństwo jest tym większe im próba lepiej reprezentuje zbiorowość.
Aby uzyskane wyniki badania próby można było odnieść do zbiorowości generalnej z dokładnością próba musi być reprezentatywna, a zatem muszą być spełnione dwa warunki:
musi być wybrana losowo- tzn. każda jednostka danej zbiorowości ma znane, różne od zera prawdopodobieństwo znalezienia się w próbie,
powinna być dostatecznie liczna.
Cechy statystyczne - właściwości charakteryzujące jednostki statystyczne (obiekty).
CECHY STAŁE -są wspólne dla wszystkich jednostek danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości:
rzeczowe - właściwości, które charakteryzują określony zbiór osób, rzeczy lub zjawisk,
przestrzenne - gdzie badamy,
czasowe - jaki okres obejmuje badanie lub w jakim momencie się ono odbywa.
CECHY ZMIENNE -są to właściwości, które różnią poszczególne jednostki statystyczne (głównie one podlegają obserwacji),
mierzalne - (ilościowe, kwantytatywne) - właściwości które można zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych (np. w kilometrach, centymetrach), zalicza się również do nich cechy quasi-ilościowe (porządkowe), kwantyfikują (mierzą) natężenie badanej właściwości przedstawionej w sposób opisowy, porządkując w ten sposób zbiorowość (np. oceny studentów: bdb, db, itp.),
niemierzalne - (jakościowe, kwalitatywne) - zwykle określane słownie (np. płeć). Wśród ogółu cech niemierzalnych na szczególną uwagę zasługują cechy obrazujące przestrzenny rozkład badanych zjawisk (rozmieszczenie terytorialne) tzw. cechy geograficzne
Cechy mierzalne
skokowe (dyskretne) - przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, najczęściej jest to zbiór liczb całkowitych dodatnich (np. liczba osób w rodzinie, liczba usterek, itp.).
ciągłe - mogą przyjąć każdą wartość z określonego przedziału liczbowego przy czym liczba miejsc po przecinku jest uzależniona od dokładności dokonywanych pomiarów (np. waga detalu).
W przypadku badań zbiorowości wielowymiarowych zmienne (cechy mierzalne) dzielimy na:
stymulanty - te cechy, których wyższe wartości pozwalają zakwalifikować daną jednostkę statystyczną jako lepszą z punku widzenia realizowanego badania,
destymulanty - cechy, których wysokie wartości świadczą o niskiej pozycji jednostki w zbiorze.
Pomiar - czynność przyporządkowania liczb przedmiotom (obiektom) lub wydarzeniom zgodnie z pewnym zbiorem reguł. Wynikiem pomiaru są dwa rodzaje wielkości, te które mówią o liczebności zbioru obiektów, i te, które charakteryzują stopień nasilenia zjawiska.
Rozróżnia się cztery podstawowe skale pomiarowe i związane z nimi relacje:
- nominalną (relacja: równe lub różne)
- porządkową (relacja: większe lub mniejsze)
- przedziałową (relacja: większe o tyle)
- stosunkową (relacja: tyle razy większe)
Skala nominalna - relacja: równe różne
Pomiar polega na zastosowaniu liczby jako nazwy, czyli grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy czy liczby, np. studenci wg rodzaju studiów, szczególny przypadek - skala dychotomiczna (dwupunktowa),
Skala porządkowa - relacja: większe lub mniejsze
Pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy lub liczby i porządkuje się te klasy ze względu na stopień natężenia, w jakim posiadają one badaną cechę,
SKALE PORZĄDKOWA PRZYKŁADY
Skala porządkowa opisana werbalnie
W jakim stopniu, wiedza na temat działania silnika wysokoprężnego wpłynie na Twoje użytkowanie samochodu?
Bardzo pomoże
Troszkę pomoże
Być może pomoże
Raczej nie pomoże
Na pewno nie pomoże
Skala porządkowa opisana liczbowo
Proszę określić, w jakim stopniu umie Pan/Pani obsługiwać wózek widłowy.
Znakomicie 5 4 3 2 1 Kompletnie nie umiem
Proszę zaznaczyć swoje oceny najlepiej odzwierciedlające Pana/Pani opinię o wymienionych cechach importowanego samochodu Lexus IS 300 (każda skala reprezentuje jedną cechę o siedmiostopniowej intensywności).
Skala porządkowa - Likerta
Czy w Twojej szkole panuje przemoc?
a) zdecydowanie tak
b) raczej tak
c) raczej nie
d) zdecydowanie nie
e) trudno powiedzieć
Skala przedziałowa - relacja: większe o tyle
Pomiar występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się z liczb rzeczywistych, zero w tej skali ustalone jest dowolnie, np. skala Celsjusza i Fahrenheita, skala pozwala stwierdzić tylko o ile jest coś wyższe, (np.: w jednym pomieszczeniu temperatura jest o tyle wyższa od temperatury w drugim pomieszczeniu)
Przykład – zastosowanie skali przedziałowej
Czas trwania snu określamy następująco: w chwili rozpoczęcia i zakończenia snu zanotowano czas (godziny i minuty z dokładnością do sekundy).
Tym samym przyporządkowaliśmy każdej i-tej osobie dwie liczby: t1i – czas rozpoczęcia i t2i – czas zakończenia snu.
Różnica Δti = t1i - t2i określa czas trwania snu w sekundach.
Dokonaliśmy obserwacji cechy ilościowej (czasu trwania snu) a wyniki wyraziliśmy tym razem na skali przedziałowej czasu (jednostką miary była 1 sekunda, a skala nie miała zera bezwzględnego).
Wynik i-tej osoby utożsamiliśmy z liczbą Δti określającą przedział czasu , który upłynął od rozpoczęcia snu do jego zakończenia.
Skala stosunkowa (ilorazowe) - relacja: tyle razy większe
Charakteryzuje się wszystkimi wymienionymi wyżej własnościami skali przedziałowej. Skalę tę określamy przez wybór stałej jednostki miary, wskazanie zera bezwzględnego
Przykład zastosowanie skali ilorazowej
Załóżmy, że dokonaliśmy pomiaru czasu trwania snu (po zażyciu leku nasennego) w grupie osób o liczebności N.
Czas snu każdej osoby był mierzony za pomocą sekundomierza.
Można wówczas przyporządkować każdej i-tej badanej osobie liczbę ti określającą czas trwania snu w sekundach. Dokonaliśmy obserwacji ilościowej (czas trwania snu), a wyniki obserwacji wyraziliśmy na skali ilorazowej czasu, dla której jednostką miary jest jedna sekunda. Zerem bezwzględnym jest tu moment zaśnięcia badanej osoby.
Gdybyśmy zmienili jednostkę czasu na minuty to zachowana jest stałość ilorazów, niezależnie od tego czy wyniki mierzone były w sekundach czy w minutach.
|
|
---|---|
|
|
|
|
|
|
|
|
|
|