Materiał pomocniczy do nauki Statystyki lub Wykorzystania statystycznego komputerów
na Wydziale Nauk o Żywieniu Człowieka i Konsumpcji
Statystyka to nauka o metodach badania prawidłowości występujących w procesach masowych, czyli w procesach (zjawiskach) powtarzalnych. Jest narzędziem do wydobywania wiedzy z dużego lub nawet b. dużego zbioru danych (informacji)
Statystyka to także zbiór metod liczbowego opisu zbioru (populacji, procesu, oróby).
Statystyka to też liczba reprezentująca zbiorowość, czyli ujmująca w sposób syntetyczny pewną wiedzę o zbiorowości, a w tym o zjawisku w niej zachodzącym.
Zbiorowość statystyczna, populacja to zbiory jednostek (zdarzeń), przypadków logicznie powiązanych ze sobą i jednocześnie nieidentycznych. Do zbiorowości statystycznej odnosi się teoria rachunku prawdopodobieństwa, a w tym prawo wielkich liczb, twierdzenia graniczne, rozkłady prawdopodobieństwa, gęstości itp.
Cecha (zmienna) to właściwość jednostek, przypadków lub zdarzeń składających się na daną zbiorowość, właściwość przyjmująca różne odmiany, wartości.
Wyróżniamy cechy (zmienne) ilościowe i jakościowe.
Ilościowe, to mierzalne, czyli reprezentowane przez dowolne liczby (z przedziału ciągłego) lub liczby dyskretne (skokowe). Przykłady cech ilościowych: wzrost, masa ciała, zawartość cholesterolu we krwi, liczba osób w gospodarstwie domowym.
Cechy jakościowe to zmienne niemierzalne, które opisać można słowami. Przykłady cech jakościowych: barwa oczu, stopień zachmurzenia, poziom ukończonego wykształcenia.
Na użytek analiz statystycznych przekształca się odmiany cech jakościowych na kody. Często zmienne jakościowe „pokazuje” się z użyciem skal numerycznych (np. skala ocen szkolnych).
Przypadki czyli elementy populacji różnią się między sobą wartościami (odmianami) rozpatrywanej cechy. Poznanie kształtowania się tych wartości jest celem analiz lub badań statystycznych.
Badania pełne (wyczerpujące wszystkie przypadki czyli elementy zbioru, populacji, np. Narodowy Spis Powszechny).
Badania częściowe (reprezentacyjne lub celowe, obejmują część jednostek, czyli pewną ich reprezentację, próbę).
Koncentracja (kurtoza, spłaszczenie rozkładu) - miary
Skośność (asymetria) - miary
Budowa szeregu rozdzielczego (tablicy statystycznej), tabelaryczna i graficzna wizualizacja danych. W szeregu wielodzielczym wyróżniamy rozkłady brzegowe i warunkowe.
Wykaz zagadnień:
1. Opis statystyczny (miary poziomu, zmienności, rozkładu)
2. Estymacja (orzekanie o populacji na podstawie wyników z próby)
3. Teoretyczne rozkłady zmienności
4. Analiza wariancji
5. Weryfikacja hipotez statystycznych
6. Opis i analiza związków pomiędzy zmiennymi (cechami
a. Regresja
b. Korelacja
7. Analizy penetracyjne i wielowymiarowe
Pomocnicze wzory:
Średnia w próbie:
=
Wariancja w próbie:
Odchylenie standardowe w próbie. Współczynnik zmienności:
Współczynnik korelacji liniowej Pearsona (związku pomiędzy zmiennymi x i y)
Równości wariancyjne (x i y - zmienne):
SSTy=SSRy+SSEy a także SSTx=SSRx+SSEx
Gdzie: SST - sumy kwadratów odchyleń (odchyleń całkowitych)
SSR - sumy kwadratów odchyleń kontrolowanych (zabiegowych - wyjaśnianych przez zmienną niezależną)
SSE - sumy kwadratów odchyleń losowych (niewyjaśnionych)
Wskaźniki (stosunki) korelacyjne):
Współczynnik Cramera (zbieżności korelacyjnej), określony wzorem:
gdzie:
- statystyka chi-kwadrat, czyli:
; przy czym
- liczebność teoretyczna
n - liczba jednostek obserwacji, czyli liczba gospodarstw domowych,
= min(k, l), przy czym k oraz l to liczby odmian odpowiednio pierwszej i drugiej cechy
Wybrana (przykładowa) literatura:
Luszniewicz A., Słaby T. 2001: Statystyka z pakietem komputerowym STATISTICA. Wyd C.H. Beck, Warszawa.
Aczel A. D., 2000: Statystyka w zarządzaniu. PWN, Warszawa
Luszniewicz A., 1979: Metody wnioskowania statystycznego. PWE, Warszawa.
Luszniewicz A., 1977: Statystyka ogólna. PWE, Warszawa.