Statystyka - wykład I
Jest nauką o metodach ilościowego badania prawidłowości występujących w zjawiskach masowych.
To sztuka wyciągania maksymalnie wiarygodnych wniosków w sytuacji, gdy mamy wiele danych, a każda z nich jest nieco inna od pozostałych. Różnice między nimi wynikające z przypadkowości mogą nasuwać błędne konkluzje.
Umożliwia prawidłowe zebranie informacji i zastosowanie odpowiednich miar umożliwiających analizę zjawiska. Pozwala sformułować wnioski o istnieniu bądź nieistnieniu
Populacja
Przedmiotem badania jest zbiorowość określana jako populacja, jednoznacznie wyodrębnionych zbiór złożony z elementów mających przynajmniej jedną właściwość (cechę), którą mogą (ale nie muszą) różnić się między sobą.
W celu uzyskania informacji o badanej zbiorowości (populacji) generalnej badamy próbę.
Liczebność próby:
N - liczba jednostek populacji generalnej wybranych do próby (badania);
jeżeli N <30 - próba mała
Próba losowa - próba jest otrzymana w wyniku losowania elementów z populacji generalnej.
Zbiorowość
Liczebność zbiorowości generalnej może być skończona lub nieograniczona
Jeżeli badamy zbiorowość ze względu na jedną cechę, mówimy o zbiorowości jednowymiarowej, natomiast gdy rozpatrujemy wiele cech - o zbiorowości wielowymiarowej.
Cecha statystyczna
Elementarną cząstką zbiorowości statystycznej jest jednostka statystyczna. Charakteryzuje się ona pewnymi właściwościami i zachowaniami, które nazywamy cechami statystycznymi.
Zmienne
a) ilościowe
-ciągłe
-dyskretne
b) jakościowe
-porządkowe
-nominalne
Cechy:
a) mierzalne (ilościowe) które można opisać za pomocą liczb wyrażonych, na ogół, w jednostkach miary;
b) skokowe (dyskretne) - przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej.
Błędy pomiarów
Przypadkowe (losowe) - są spowodowane drobnymi losowymi przyczynami, których nie można uniknąć. W miarę wzrostu liczby pomiarów wpływ tego rodzaju błędów zmniejsza się.
Błędy systematyczne - powodują jednokierunkowe, stałe odchylenia wartości od wartości rzeczywistych . Ich wpływ nie zmniejsza się ze wzrostem liczby pomiarów UWAGA ! NALEŻY ICH UNIKAĆ !
______________________
Badając próbę możemy obliczać nie tylko średnią pomiarów z tej próby, ale także zmienność w jej obrębie lub jakieś inne miary, które by ją charakteryzowały. Jeśli dotyczą one próby, mówimy że obliczamy statystyki.
Średnia z próby jest statystyką, natomiast średnia z całej populacji jest parametrem.
Próba musi być reprezentatywna dla populacji generalnej, czyli jej struktura pod względem badanej cechy nie różni się istotnie od struktury populacji generalnej.
Charakterystyki opisowe rozkładów
a) miary średnie
b) miary rozproszenia
c) miary asymetrii
d) miary koncentracji
Modalna
w szeregu statystycznym ...
Mediana
wartość środkowa w szeregu statystycznym uporządkowanym.
Percentyl
Wartość cechy tej jednostki w szeregu statystycznym uporządkowanym, poniżej której znajduje się p% jednostek, np. piąty percentyl = wartość cechy poniżej, której jest 5 % jednostek
Wyróżnia się:
a) kwartyl dolny - 25 percentyl
b) kwartyl górny: 75 percentyl
Mediana: kwartyl pięćdziesiąty (p50)
Rozstęp międzykwartylowy: Rq = Q3 - Q1
Odchylenie przeciętne
Średnia arytmetyczna bezwzględnych wartości odchyleń wartości cechy od tej średniej arytmetycznej (wyrażona w jednostkach cechy).
Wariancja i SD
Średnia arytmetyczna kwadratów odchyleń wartości poszczególnych jednostek od ich średniej arytmetycznej.
Im większe odchylenie = większy rozrzut wyników
Współczynnik zmienności
Odchylenie (przeciętne lub standardowe) wyrażone w % średniej arytmetycznej.
Im większe tym zbiorowość jest bardziej zróżnicowana.
Miary asymetrii i koncentracji
Współczynnik asymetrii (skośność)
Współczynnik koncentracji (kurtoza)