Metody analizy (...) Opracował: dr Adam Kucharski
1.3 Standaryzacja danych
Cechy mierzalne podlegające obserwacji statystycznej zazwyczaj mają miano, które niekiedy utrudnia porównywanie cech ze sobą. Wyjściem w takiej sytuacji może się stać standaryzacja zmiennych.
Jednym ze sposobów standaryzacji danych jest podzielenie wszystkich elementów szeregu przez jego wartość maksymalną. Ma to tę zaletę, że dane po przekształceniu zyskują stały punkt odniesienia (wartość jeden).
Przykład 1
Rozpatrzmy dostępny na stronie NBP średniomiesięczny kurs euro za pierwsze osiem miesięcy 2008 roku. Tabela 1 zawiera dane przed i po standaryzacji.
Tabela 1: Przykład standaryzacji wykorzystującej wartość maks.
Miesiąc |
Kurs EUR |
Kurs wystand. |
Styczeń |
3,6080 |
1 |
Luty |
3,5825 |
0,9929 |
Marzec |
3,5374 |
0,9804 |
Kwiecień |
3,4444 |
0,9547 |
Maj |
3,4069 |
0,9443 |
Czerwiec |
3,3760 |
0,9357 |
Lipiec |
3,2600 |
0,9035 |
Sierpień |
3,2884 |
0,9114 |
Średnia |
3,4380 |
0,9529 |
Odch. stand. |
0,1217 |
0,0337 |
źródło: obliczenia własne na podst. danych z www.nbp.pl
Postępowanie przedstawione w tabeli 1 przydaje się m.in. podczas przetwarzania danych powstających przy zliczaniu wyników pochodzących z ankiet.
1.4 Szeregi statystyczne
Dane liczbowe jakie gromadzimy podczas badania statystycznego najczęściej mają postać szeregów statystycznych.
Szereg statystyczny ciąg wielkości statystycznych, uporządkowanych według określonych kryteriów.
Podstawowe rodzaje szeregów statystycznych ze względu na sposób prezentacji danych:
• szczegółowy;
• rozdzielczy:
— punktowy;
— z przedziałami klasowymi.
Szeregi rozdzielcze dzielą zbiorowość statystyczną na części (klasy) wg określonej cechy i podają liczebność lub częstość każdej z klas. Zazwyczaj szeregi punktowe buduje się dla cech