Rozdział 2
2. POJĘCIA PODSTAWOWE WPROWADZAJĄCE DO STATYSTYKI
Statystyka jest nauką o metodach badania zjawisk masowych, czyli o metodach analizy danych. Statystyka to w istocie nierozdzielna triada:
DANE <=> METODY STATYSTYCZNE <=> PYTANIA I MOŻLIWE ODPOWIEDZI
Posiadane dane mogą być zastosowane do pewnego tylko podzbioru metod. Określone metody statystyczne odpowiadają na pewne typy pytań. Zadawane pytania wymagają doboru odpowiednich metod statystycznych, a te - odpowiednich danych. Odpowiedzi na zadawane pytania są uwarunkowane stosowaną metodą analizy danych.
Układ triady:
DANE <= METODY STATYSTYCZNE <= PYTANIA I MOŻLIWE ODPOWIEDZI
to układ charakterystyczny dla wszystkich badań empirycznych dotyczących na przykład problemów społecznych czy demograficznych. Z pytań dotyczących rozmiarów ubóstwa w Polsce czy procesu starzenia się naszego społeczeństwa wynika dobór metod umożliwiających odpowiedź, a następnie dobór danych umożliwiających zastosowanie wybranych metod. Taki układ triady jest typowy dla zastosowań statystyki jako nauki o metodach badania zjawisk masowych.
Układ triady charakterystyczny dla nauczania statystyki to układ:
DANE -> METODY STATYSTYCZNE -> MOŻLIWE ODPOWIEDZI, UWARUNKOWANE METODĄ
Ten właśnie układ jest osią prezentowanych materiałów.
Celem zajęć ze statystyki jest prezentacja podstawowych, najczęściej używanych metod statystycznego opisu danych oraz metod wnioskowania statystycznego, czyli metod formułowania pewnego rodzaju wniosków o populacji generalnej na podstawie wyników próby losowo pobranej z tej populacji.
Opisuję to, co obserwuję, czyli próbę lub populację generalną, stąd nazwa: statystyka opisowa. Wnioskuję o tym, czego nie znam dokładnie, mam jednak przesłanki, czyli wyniki próby, oraz metody matematyczne pozwalające formułować sądy o populacji, z której próba została pobrana w sposób losowy, stąd nazwa: statystyka matematyczna. Metoda reprezentacyjna zaś to nauka o metodach wyboru losowej próby z populacji generalnej.
Omawiane na zajęciach ze statystyki metody opisu są różnorodne, a zatem analizują różne rodzaje danych oraz odpowiadają na różne pytania.
Wspaniałym przykładem zbioru danych, z punktu widzenia prezentowanych, podstawowych metod, są dane dotyczące warszawskiej giełdy, funkcjonującej od kwietnia 1991 roku. Najciekawsze są różnie agregowane informacje liczbowe o tych samych cechach, które można traktować jako dane przekrojowe lub jako szereg czasowy obserwacji, a taki właśnie podział danych jest uznawany za podstawowy z punktu widzenia podziału metod opisu. Dodatkową zaletą danych z giełdy jest ich akutalność i dostępność.
Do analizy wybieramy obecnie tylko dwie cechy związane z giełdą papierów wartościowych: obie dotyczą spółek występujących na wszystkich rynkach giełdy. Cechy te to wartości księgowe i wartości rynkowe spółek (wartość rynkowa spółki to iloczyn liczby wyemitowanych akcji i giełdowego kursu akcji, nazywana jest ona też kapitalizacją). Wybór jak najmniejszej liczby cech podyktowany został chęcią ich zaprezentowania w różnych przekrojach i agregacjach. Wartość księgowa i rynkowa dobrze spełnia ten warunek, może bowiem dotyczyć spółek na kolejnych sesjach giełdowych, spółek obserwowanych w czasie (np. w kwartale, roku), agregatu spółek czyli rynku (podstawowego, równoległego, wolnego, notowań ciągłych lub rynku Narodowych Funduszy Inwestycyjnych) obserwowanego w czasie (np. w miesiącu, kwartale, roku). Do analizy wybieramy rynek równoległy jako mniejszy.
Cecha X i cecha łączna (X,Y). Dane przekrojowe i szereg
czasowy obserwacji dotyczący cechy X lub cechy łącznej (X,Y)
Kluczem do zrozumienia podstaw statystyki jest zdobycie na początku studiowania tego przedmiotu trzech umiejętności:
1) prawidłowych odpowiedzi na pytania: jaka to własność - cecha, której symbolem jest X lub Y - oraz czyja to własność - przestrzennej czy też czasowej jednostki obserwacji?
2) prawidłowej klasyfikacji własności (cech) na jednowymiarowe - cecha X i cecha Y analizowane są pojedynczo, wyniki ich analizy są porównywane oraz łączne - cecha (X, Y) jest parą cech jednowymiarowych X i Y analizowanych razem, we wzajemnej współzależności,
3) prawidłowej klasyfikacji danych liczbowych o cechach (własnościach), które oznaczane są symbolami:
a) dla cech jednowymiarowych xi, yi dla i = 1,..., n (dane przekrojowe) lub też xt, yt dla t = 1,..., n (szeregi czasowe obserwacji);
b) dla cech łącznych (xi, yi) dla i = 1,..., n (dane przekrojowe) lub też (xt, yt) dla t = 1,..., n, (szeregi czasowe obserwacji).
Pytanie 2.1. Które z tablic 2.1-2.10 podają jednakowe informacje, chociaż w inny sposób, o wartości księgowej - cecha X i o średniej wartości rynkowej - cecha Y? Czyimi własnościami są w tych tablicach wartości księgowe i rynkowe - przestrzennych jednostek obserwacji czy czasowych jednostek obserwacji?
Pytanie 2.2. Gdzie w podanych dalej tablicach 2.1-2.10 znajdują się takie informacje liczbowe, które można oznaczyć symbolami:
1) xi, yi dla i = 1,..., n
2) xt, yt dla t = 1,..., n
3) (xi, yi) dla i = 1,..., n
4) (xt, yt) dla t = 1,..., n
Pytanie 2.3. Gdybyśmy na szkicach wykresów układów współrzędnych prostokątnych przedstawili informacje o wartościach księgowych (X) i średnich wartościach rynkowych (Y) spółek rynku równoległego w 1995 roku (por. środkowe kolumny tablicy 2.1 lub wiersze tablicy 2.7) według niżej podanego schematu 1-4, wówczas powstaje pytanie, jakie wartości byłyby odkładane na osi odciętych i rzędnych?
1) xi, dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według alfabetu,
2) (xi, i) dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według alfabetu,
3) (xi, i) dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według rosnących wartości cechy,
4) (xi, yi) dla i = 1,..., n, gdzie i jest numerem kolejnych spółek ułożonych według alfabetu.
W tablicach 2.1 - 2.10 zastosowano następujące skróty: w. ks. - wartość księgowa, ś.w.r. - średnia wartość rynkowa (nazywana też kapitalizacją), r.r. - rynek równoległy, ł.w.ks. - łączna wartość księgowa, ł.ś.w.r. - łączna średnia wartość rynkowa.
Tablica 2.1
Lp. |
Spółki rynku równoległego |
1993 |
1994 |
1995 |
1996 |
||||
|
|
(w mld starych złotych) |
(w mln PLN) |
(w mln PLN) |
(w mln PLN) |
||||
|
|
w.ks. |
ś.w.r. |
w.ks. |
ś.w.r. |
w.ks. |
ś.w.r. |
w.ks. |
ś.w.r. |
1 |
AmerBank |
. |
. |
43,296 |
79,321 |
38,540 |
48,500 |
44,9 |
59,9 |
2 |
Ariel |
. |
. |
. |
. |
. |
. |
17,2 |
31,3 |
3 |
Beton Stal |
. |
. |
. |
. |
5,140 |
5,300 |
5,3 |
7,0 |
4 |
Chemiskór |
. |
. |
. |
. |
. |
. |
6,9 |
21,6 |
5 |
Dom-Plast |
. |
. |
21,044 |
72,391 |
30,490 |
53,400 |
36,6 |
103,6 |
6 |
Drosed |
. |
. |
22,989 |
32,596 |
29,780 |
39,300 |
35,1 |
61,7 |
7 |
Echo Press |
. |
. |
. |
. |
. |
. |
5,9 |
66,5 |
8 |
Efekt |
29,88 |
210,7 |
13,865 |
32,947 |
19,140 |
20,200 |
19,3 |
20,7 |
9 |
Elektromontaż |
. |
. |
. |
. |
22,630 |
18,700 |
22,9 |
20,9 |
10 |
Farm Food |
. |
. |
. |
. |
58,670 |
64,500 |
60,9 |
82,5 |
11 |
Indykpol |
. |
. |
23,340 |
44,586 |
33,750 |
32,000 |
36,7 |
45,3 |
12 |
Jutrzenka |
. |
. |
. |
. |
27,180 |
55,600 |
33,6 |
126,2 |
13 |
Kompap |
. |
. |
. |
. |
. |
. |
17,9 |
64,5 |
14 |
KPBP Bick |
. |
. |
. |
. |
21,300 |
19,100 |
21,6 |
21,9 |
15 |
Krak-Chemia |
. |
. |
16,033 |
23,288 |
18,470 |
15,000 |
18,7 |
14,2 |
16 |
Mostostal-Zab |
. |
. |
17,131 |
57,401 |
. |
. |
. |
. |
17 |
Lubawa |
. |
. |
. |
. |
. |
. |
17,6 |
25,0 |
18 |
Łda |
. |
. |
. |
. |
. |
. |
9,0 |
14,2 |
19 |
Ocean |
. |
. |
. |
. |
. |
. |
13,4 |
36,2 |
20 |
PU |
. |
. |
. |
. |
. |
. |
23,8 |
79,5 |
21 |
PPWK |
. |
. |
. |
. |
. |
. |
14,5 |
31,1 |
22 |
Prochem |
. |
. |
24,829 |
45,091 |
28,040 |
37,200 |
26,9 |
33,8 |
Źródło: zestawienie własne na podstawie Roczników Statystyki Giełdowej 1992-1996.
Tablica 2.2 (w mln PLN)
Miesiące |
1993 |
1994 |
1995 |
1996 |
||||
|
w.ks.*) |
ś.w.r.*) |
w.ks. |
ś.w.r. |
w.ks. |
ś.w.r. |
w.ks. |
ś.w.r. |
Styczeń Luty Marzec Kwiecień Maj Czerwiec Lipiec Sierpień Wrzesień Październik Listopad Grudzień |
- - - - - - - - - - - - |
- - - - - - - - - - - - |
3,667 3,667 3,667 3,958 3,958 19,713 89,046 110,089 110,089 182,526 182,526 182,526 |
63,4 59,1 53,2 32,6 30,6 23,2 185,9 342,3 250,7 365,4 294,1 302,7 |
200,6 223,2 223,2 223,2 234,8 234,8 254,3 217,2 217,2 333,1 333,1 333,1 |
305,4 284,7 284,4 330,6 399,8 398,8 360,2 343,3 344,3 357,7 380,6 370,0 |
- - - - - - - - - - - - |
415 524 630 751 754 684 645 681 792 885 885 941 |
*) Brak danych w Rocznikach Statystyki Giełdowej z 1993 i 1996 roku.
Źródło: zestawienie własne na podstawie Roczników Statystyki Giełdowej 1992-1996.
Tablica 2.3
Wyszczególnienie |
1993 |
1994 |
1995 |
1996 |
Ł.w.ks. spółek r.r. Ł.ś.w.r. spółek r.r. |
29,88 mld s. zł. 210,70 mld s. zł. |
182,526 mln PLN 302,700 mln PLN |
333,13 mln PLN 346,30 mln PLN |
356,4 mln PLN 712,1 mln PLN |
Źródło: zestawienie własne na podstawie Roczników Statystyki Giełdowej 1992-1996.
Tablica 2.4 (w mln PLN)
Wyszczególnienie |
Miesiące 1994 roku |
|||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Ł.w.ks. spółek r.r. Ł.ś.w.r. spółek r.r. |
3,667 63,4 |
3,667 59,1 |
3,667 53,2 |
3,958 32,6 |
3,958 30,6 |
19,713 23,2 |
89,046 185,9 |
110,089 342,3 |
110,089 250,7 |
182,526 365,4 |
182,526 294,1 |
182,526 302,7 |
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1994.
Tablica 2.5 (w mln PLN)
Wyszczególnienie |
Miesiące 1995 roku |
|||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Ł.w.ks. spółek r.r. Ł.ś.w.r. spółek r.r. |
200,6 305,4 |
223,2 284,7 |
223,2 284,4 |
223,2 330,6 |
234,8 399,8 |
234,8 398,8 |
254,3 360,2 |
217,2 343,3 |
217,2 344,3 |
333,1 357,7 |
333,1 380,6 |
333,1 377,0 |
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1995.
Tablica 2.6 (w mln PLN)
Wyszczególnienie |
Miesiące 1996 roku |
|||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Ł.w.ks. spółek r.r. |
brak danych w Roczniku Statystyki Giełdowej 1996 |
|||||||||||
Ł.ś.w.r. spółek r.r. |
415 |
524 |
630 |
751 |
754 |
684 |
645 |
681 |
792 |
885 |
885 |
941 |
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1996.
Tablica 2.7 (w mln PLN)
Wyszczególnienie |
Numer spółki rynku równoległego w 1995 r. |
|||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
wartości księgowe |
38,54 |
5,14 |
30,49 |
29,78 |
19,14 |
22,63 |
58,67 |
33,75 |
27,18 |
21,3 |
18,47 |
28,04 |
średnie wartości rynkowe |
48,5 |
5,3 |
53,4 |
39,3 |
20,2 |
18,7 |
64,5 |
32 |
55,6 |
19,1 |
15 |
37,2 |
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1995.
Tablica 2.8 (w mln PLN)
Lp. |
Spółki rynku równoległego |
1995 rok |
|
|
|
wartość księgowa spółki |
średnia wartość rynkowa spółki |
1 2 3 4 5 6 7 8 9 10 11 12 |
AmerBank Beton Stal Dom-Plast Drosed Efekt Elektromontaż Farm Food Indykpol Jutrzenka KPBP Bick Krak-Chemia Prochem |
38,54*) 5,14 30,49 29,78 19,14 22,63 58,67 33,75 27,18 21,3 18,47 28,04 |
48,5**) 5,3 53,4 39,3 20,2 8,7 64,5 32 55,6 19,1 15 37,2 |
*) Wartość księgowa spółki;
**) Średnia wartość rynkowa spółki.
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1995.
Tablica 2.9 (w mln PLN)
Miesiące |
1994 |
|
|
łączna wartość księgowa spółek rynku równoległego |
łączna średnia wartość rynkowa spółek rynku równoległego |
Styczeń Luty Marzec Kwiecień Maj Czerwiec Lipiec Sierpień Wrzesień Październik Listopad Grudzień |
3,667*) 3,667 3,667 3,958 3,958 19,713 89,046 110,089 110,089 182,526 182,526 182,526 |
63,4**) 59,1 53,2 32,6 30,6 23,2 185,9 342,3 250,7 365,4 294,1 302,7 |
*) Łączna wartość księgowa spółek rynku równoległego;
**) Łączna średnia wartość rynkowa spółek rynku równoległego.
Źródło: zestawienie własne na podstawie Rocznika Statystyki Giełdowej 1994.
Tablica 2.10 (w mln PLN)
Wyszczególnienie |
1993 |
1994 |
1995 |
1996 |
Wartość księgowa spółki Efekt |
2,988*) |
13,865 |
19,14 |
19,3 |
Średnia wartość rynkowa spółki Efekt |
21,07**) |
32,947 |
20,20 |
20,7 |
*) Wartość księgową spółki Efekt wynoszącą w 1993 roku 29,88 mld zł przedstawiamy po denominacji złotego jako 2,988 mln PLN;
**) Średnia wartość rynkową spółki Efekt wynoszącą w 1993 roku 210,7 mld zł przedstawiamy po denominacji zł jako 21,07 mln zł.
Źródło: zestawienie własne na podstawie Roczników Statystyki Giełdowej 1992-1996.
Warto podkreślić, że informacje liczbowe z tablic 2.1-2.10 mogą być wykorzystywane do tematów omawianych na kolejnych ćwiczeniach ze statystyki.
Na podstawie tablic 2.1-2.10 w programie Statgraphics sieci komputerowej SGH utworzono ogólnie dostępne zbiory danych (ich nazwa, jak wiadomo, nie może być dłuższa niż 8 znaków): RRSPLATA i RRMELATA. Mają one umożliwić studiującym samodzielną pracę nad zadaniami omawianymi na ćwiczeniach.
Odpowiedź na pytanie 2.1
Jak łatwo zauważyć, tablice 2.1 oraz 2.2 tworzą bazę danych, na podstawie której zbudowano następne tablice 2.3.-2.10. Tablice 2.4, 2.5, 2.6 i 2.9 utworzono z danych liczbowych dla lat 1994 i 1995 tablicy 2.2. Tablice 2.7 i 2.8 w różny sposób przedstawiają dane z dwóch środkowych kolumn tablicy 2.1. W tablicy 2.10 przedstawiono dane dotyczące spółki "Efekt" z tablicy 2.1, które znajdują się w ósmym wierszu tej tablicy.
Na pytanie: czyimi własnościami są wartości księgowe i średnie wartości rynkowe tworzące kolumny tablicy 2.1, odpowiedź brzmi: spółek rynku równoległego z 1994, 1995 lub 1996 roku (odpowiednio w liczbie 8, 12 i 21), czyli przestrzennych jednostek obserwacji.
Na pytanie: czyimi własnościami są wartości księgowe i średnie wartości rynkowe spółki "Efekt" umieszczone w ósmym wierszu tablicy 2.1 odpowiedź brzmi: to własności 1993, 1994, 1995 i 1996 roku, czyli mamy tu szereg czasowy obserwacji.
Na pytanie: czyimi własnościami są łączne wartości księgowe i łączne średnie wartości rynkowe spółek rynku równoległego tworzące kolumny tablicy 2.2, odpowiedź brzmi: miesięcy 1994 lub 1995, lub też 1996 roku, czyli mamy tu również szereg czasowy obserwacji.
Odpowiedź na pytanie 2.2
Symbolami xi, yi, dla i = 1,..., n, można oznaczyć:
a) odpowiadające kolejnym okresom czasu (1993, 1994, 1995 i 1996 rok) po dwie kolumny tablicy 2.1, oraz dwie kolumny tablicy 2.8,
b) dwa wiersze tablicy 2.7.
Symbolami xt, yt, dla t = 1,..., n, można oznaczyć:
a) odpowiadające kolejnym okresom czasu (1994 i 1995 rok) po dwie kolumny tablicy 2.2, oraz 2 kolumny tablicy 2.9,
b) dwa wiersze tablicy 2.3, 2.4, 2.5 i 2.10.
Odpowiedź na pytanie 2.3
Gdyby na szkicu wykresu układu współrzędnych prostokątnych przedstawić informacje o wartościach księgowych (X) spółek rynku równoległego w 1995 roku (por. środkowa kolumna tablicy 2.1 lub pierwszy wiersz tablicy 2.7) według podanego schematu: 1) xi, dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według alfabetu, wtedy na osi odciętych byłyby odkładane wartości księgowe spółek ułożonych według alfabetu, a oś rzędnych byłaby zbędna.
Gdyby na szkicu wykresu układu współrzędnych prostokątnych przedstawić informacje o wartościach księgowych (X) spółek rynku równoległego w 1995 roku (por. środkowa kolumna tablicy 2.1 lub pierwszy wiersz tablicy 2.7) według schematu: 2) (xi, i), dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według alfabetu, wtedy na osi odciętych byłyby odkładane wartości księgowe spółek, a na osi rzędnych byłyby odkładane numery spółek ułożonych według alfabetu.
Gdyby na szkicu wykresu układu współrzędnych prostokątnych przedstawić informacje o wartościach księgowych (X) spółek rynku równoległego w 1995 roku według schematu: 3) (xi, i) dla i = 1,..., n, gdzie i jest numerem kolejnym spółek ułożonych według rosnących wartości cechy X, wtedy rosnące wartości księgowe spółek byłyby odkładane na osi odciętych, a na osi rzędnych byłyby odkładane numery spółek ułożonych według rosnących wartości księgowych.
Gdyby na szkicu wykresu układu współrzędnych prostokątnych przedstawić informacje o wartościach księgowych (X) i średnich wartościach rynkowych (Y) spółek rynku równoległego w 1995 roku (por. tablica 2.8) według schematu: 4) (xi, yi) dla i = 1,..., n, gdzie i jest numerem kolejnych spółek ułożonych według alfabetu, wtedy wartości księgowe spółek byłyby odkładane na osi odciętych, a średnie wartości rynkowe spółek na osi rzędnych.