Rozdział 13
13. ZADANIA DOTYCZĄCE METOD OPISU STATYSTYCZNEGO
13.1. Wszechstronna analiza porównawcza dwóch cech oraz porównywania względnych klasycznych i względnych pozycyjnych miar dyspersji oraz asymetrii
Na podstawie danych z Rocznika Statystyki Giełdowej 1995, umieszczonych w zbiorach danych RRSPLATA i RPSPLATA obliczono podstawowe miary opisu dotyczące wartości księgowych i średnich wartości rynkowych 12 spółek rynku równoległego i 53 spółek rynku podstawowego Giełdy Papierów Wartościowych w Warszawie w 1995 roku.
Tablica 13.1.1
Miary |
Rynek równoległy (1995 rok) |
Rynek podstawowy (1995 rok) |
||
|
wartości księgowe (w mln PLN) |
średnie wartości rynkowe (w mln PLN) |
wartości księgowe (w mln PLN) |
średnie wartości rynkowe (w mln PLN) |
n |
12 |
12 |
53 |
53 |
Miary klasyczne |
||||
x S V A |
27,761 13,003 0,468 +0,874 |
34,067 18,725 0,549 +0,136 |
166,889 171,292 1,026 +1,970 |
212,142 229,970 1,084 +2,016 |
Miary pozycyjne |
||||
xmin xmax R me Q1 Q3 2Q Vp A2 |
5,140 58,670 53,530 27,610 20,220 32,120 11,900 0,215 -0,242 |
5,300 64,500 59,200 34,600 18,900 50,950 32,050 0,463 +0,020 |
16,210 809,430 793,220 113,180 52,710 231,990 179,280 0,792 +0,325 |
15,400 1150,800 1135,400 125,400 59,900 285,500 225,600 0,899 +0,419 |
Źródło: obliczenia własne.
Zadanie 13.1.1
Proszę zinterpretować i porównać wartości podstawowych miar opisu statystycznego obu zmiennych na obu rynkach.
Zadanie 13.1.2
Proszę porównać względne klasyczne miary dyspersji oraz względne pozycyjne miary dyspersji.
Zadanie 13.1.3
Proszę porównać klasyczne miary asymetrii oraz pozycyjne miary asymetrii.
13.2. Rodzaje cech i danych, miary opisu, graficzna
prezentacja rozkładów empirycznych
Zadanie 13.2.1
W podanych niżej przykładach 13.2.1 - 13.2.10 proszę:
1. Nazwać badaną cechę.
2. Podać jej typ (rodzaj).
3. Odpowiedzieć na pytanie, co lub kto stanowi jednostki obserwacji statystycznej.
Zadanie 13.2.2
W podanych niżej przykładach 13.2.1 - 13.2.10 proszę:
1. Określić rodzaj danych liczbowych (indywidualne, pogrupowane w przedziały klasowe, pogrupowane w rozkład punktowy, wynikowe).
2. Zapisać wzory, według których byłaby obliczana:
a) średnia arytmetyczna,
b) wariancja obciążona,
c) wariancja nieobciążona.
Zadanie 13.2.3
1. Proszę zapisać wzory, według których w każdym z niżej podanych przykładów 13.2.1 - 13.2.10 można byłoby obliczyć:
a) medianę,
b) kwartyl pierwszy,
c) kwartyl trzeci.
2. Proszę wskazać te przykłady, w których jest możliwe graficzne wyznaczenie kwartyli.
Zadanie 13.2.4
1. W niżej zapisanych przykładach 13.2.1 - 13.2.10 proszę wskazać te, w których spełnione są warunki wyznaczania lub obliczania dominanty.
2. Do wskazanych przykładów proszę zapisać odpowiednie wzory służące obliczaniu dominanty.
Zadanie 13.2.5
1. W prostokątnym układzie współrzędnych proszę graficznie przedstawić rozkłady empiryczne cech podane w niżej zapisanych przykładach 13.2.1 - 13.2.10.
2. Proszę nazwać oś odciętych i oś rzędnych każdego wykresu.
Zadanie 13.2.6
1. Na podstawie odpowiednich danych z niżej zapisanych przykładów 13.2.1 - 13.2.10 proszę obliczyć częstości względne (nazywane inaczej wskaźnikami struktury), a następnie skumulowane częstości względne.
2. W prostokątnym układzie współrzędnych proszę przedstawić graficznie obliczone:
a) skumulowane częstości względne,
b) dystrybuanty empiryczne rozkładów.
3. Proszę nazwać oś odciętych i oś rzędnych każdego wykresu.
Zadanie 13.2.7
Proszę porównać zróżnicowanie cech w tych podanych niżej przykładach 13.2.1 - 13.2.10 w których jest to możliwe.
Zadanie 13.2.8
Proszę porównać asymetrię rozkładów w podanych niżej przykładach 13.2.1 - 13.2.10 wybierając do porównań ten spośród trzech współczynników asymetrii, który jest możliwy do obliczenia w największej liczbie przykładów.
Przykłady 13.2.1 - 13.2.10 do zadań 13.2.1 - 13.2.8
13.2.1. W pewnym zakładzie pracownicy posiadają następującą liczbę dzieci: 3, 1, 2, 2, 1, 2, 0, 1, 0, 1, 1, 3, 1, 1, 0, 0, 2, 2, 0, 1, 0, 1, 2, 2, 1, 0, 3, 0, 2, 0, 1, 2, 1, 0, 1, 0, 2, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1.
13.2.2. W oddziale banku zapytano zatrudnione tam osoby, ile czasu zabiera im przeciętnie rano dojazd do pracy. Pytani udzielili takich oto odpowiedzi (w minutach): 85, 48, 45, 50, 65, 58, 68, 70, 75, 80, 55.
13.2.3. Rozkład braków w 50 partiach telewizorów dostarczonych w ciągu trzech miesięcy do sklepu z artykułami radiowo-telewizyjnymi przedstawia zestawienie:
xi |
2 |
3 |
4 |
5 |
6 |
ni |
7 |
12 |
16 |
10 |
5 |
13.2.4. Związki zawodowe zebrały informacje o wysokości premii (w złotych) w pierwszym kwartale tego roku dwóch grup pracowników bezpośrednio produkcyjnych: grupy pracowników zatrudnionych na stałym etacie (grupa 1) oraz grupy pracującej na akord (grupa 2):
Wynagrodzenia |
Liczba pracowników grupy 1 |
Odsetek pracowników grupy 2 |
0 - 300 |
10 |
5 |
300 - 600 |
25 |
10 |
600 - 900 |
20 |
15 |
900 - 1200 |
15 |
20 |
1200 - 1500 |
5 |
35 |
1500 - 1800 |
5 |
15 |
Razem |
80 |
100 |
13.2.5. W Roczniku Statystycznym 1993, s. 106 oraz 1994, s. 129 mamy następujące informacje o wieku bezrobotnych (zarejestrowanych) osób w latach 1992 i 1993:
Wiek w latach ukończonych |
Liczba bezrobotnych osób (w tys.) |
|
|
w 1992 roku |
w 1993 roku |
Poniżej 25 |
675 |
995,0 |
25 - 34 |
713 |
824,7 |
35 - 44 |
631 |
729,1 |
45 - 54 |
261 |
284,2 |
55 i więcej |
112 |
56,6 |
Razem |
2394 |
2889,6 |
13.2.6. Rozkład powierzchni (w m2) 98 wolnych działek budowlanych oferowanych przez agencję sprzedaży nieruchomości jest następujący:
Powierzchnia (w m2) |
Liczba działek |
100 - 300 |
2 |
300 - 500 |
28 |
500 - 700 |
36 |
700 - 900 |
20 |
900 - 1100 |
10 |
1100 - 1300 |
2 |
13.2.7. Badanie 200 losowo wybranych emerytów ze względu na poziom miesięcznych wydatków na prasę (w zł) dostarczyło następujących danych:
Miesięczne wydatki |
15-21 |
21-27 |
27-33 |
33-39 |
39-45 |
Liczba emerytów |
20 |
45 |
70 |
50 |
15 |
13.2.8. Rozkład liczby spóźnień do szkoły 100 losowo wybranych uczniów w ostatnim półroczu był następujący:
Liczba spóźnień |
0 |
1 |
2 |
3 |
4 |
5 i więcej |
Liczba uczniów |
10 |
15 |
40 |
15 |
10 |
10 |
13.2.9. W pewnym dużym przedsiębiorstwie związanym z handlem zagranicznym zbadano częstotliwość wyjazdów pracowników w ciągu roku do krajów Unii Europejskiej i otrzymano wyniki:
Liczba wyjazdów |
0 |
1 |
2 |
3 |
4 |
Razem |
Odsetek pracowników |
30 |
35 |
20 |
10 |
5 |
100 |
13.2.10. Rozkład wartości księgowych spółek rynku podstawowego otrzymany na podstawie wyników sesji warszawskiej giełdy z 30 września 1996 roku był następujący:
Wartości księgowe (w mln PLN) |
Liczba spółek |
0 - 150 |
41 |
150 - 300 |
12 |
300 - 450 |
5 |
450 - 600 |
4 |
600 - 750 |
0 |
750 - 900 |
1 |
900 - 1050 |
1 |
Razem |
64 |
13.3. Analiza zależności i skorelowania (tablica korelacyjna, miary siły zależności, siły wpływu i siły skorelowania)
Zadanie 13.3.1
W niżej podanych przykładach 13.3.1 - 13.3.5 w parze cech X i Y tworzących cechę łączną (X, Y) proszę:
a) wskazać cechę mierzalną i cechę niemierzalną,
b) wskazać cechę zależną i cechę niezależną,
c) wymienić warianty wartości cechy X oraz warianty wartości cechy Y, powiązać liczbę wariantów cechy X i cechy Y z wymiarem tablicy korelacyjnej.
Zadanie 13.3.2
W zbudowanych tablicach korelacyjnych 13.3.1 - 13.3.5 proszę:
a) wyznaczyć rozkłady warunkowe częstości cechy zależnej,
b) zinterpretować otrzymane wyniki,
c) odpowiedzieć na pytanie, czy występuje zależność (stochastyczna) między cechą zależną i cechą niezależną.
Zadanie 13.3.3
W zbudowanych tablicach korelacyjnych 13.3.1 - 13.3.5 proszę:
a) wyznaczyć średnie arytmetyczne w rozkładach warunkowych cechy mierzalnej zależnej,
b) zinterpretować wyniki badania,
c) odpowiedzieć na pytanie, czy można zaobserwować wpływ cechy niezależnej na wartości zmienne cechy zależnej (mierzalnej).
Zadanie 13.3.4
Jakie miary siły zależności, siły wpływu lub skorelowania można obliczyć w podanych niżej przykładach 13.3.1 - 13.3.5 ?
Zadanie 13.3.5
1. Które z tych miar siły zależności (stochastycznej), siły wpływu i siły skorelowania, jakie mogłyby być obliczone w przykładach 13.3.1 - 13.3.5, oblicza się tylko i wyłącznie według:
a) formuły nieważonej wzoru, czyli z danych indywidualnych,
b) formuły ważonej wzoru, czyli z danych pogrupowanych?
2. Które z tych miar siły wpływu i siły skorelowania, jakie mogłyby być obliczone w przykładach 13.3.1 - 13.3.5, oblicza się według formuły nieważonej wzoru, czyli z danych indywidualnych, lub też według formuły ważonej wzoru, czyli z danych pogrupowanych?
Zadanie 13.3.6
Dla podanych niżej przykładów 13.3.1 - 13.3.5 proszę obliczyć i zinterpretować odpowiednie miary siły zależności, siły wpływu lub siły skorelowania.
Przykłady 13.3.1 - 13.3.5 do zadań 13.3.1 - 13.3.6
13.3.1. Podczas badania opinii publicznej w dużym sklepie pytano odchodzących od kasy ludzi, czy reklama telewizyjna wpływa na ich decyzje o zakupie reklamowanego towaru. Notowano płeć osoby pytanej (kobieta - K, mężczyzna - M) oraz rodzaj odpowiedzi (tak - T, nie - N, brak zdania - BZ). Odpowiedzi 50 pytanych osób zapisano niżej w następujący sposób:
(M;N), (M;N), (K;N), (K;BZ), (K;N), (K;N), (M;T), (K;T), (K;N),
(M;N), (K;BZ), (K;N), (K;N), (K;N), (K;T), (K;N), (K;N), (K;N),
(K;N), (M;BZ), (M;N), (K;N), (K;BZ), (K;N), (M:N), (K;N), (K;T),
(K;N), (K;T), (M;T), (K;T), (M;T), (K;N), (M;T), (K;T), (M;N),
(K;BZ), (M;N), (K;N), (M;T), (K;N), (M;N), (K;N), (K;N), (K;BZ),
(K;N), (K;N), (K;N), (M;T), (M;BZ).
13.3.2. Plony 4 zbóż w q/ha (X) oraz zużycie nawozów sztucznych w kg/ha (Y) w 17 gminach było na poziomie:
(21.9; 96.0), (19.6; 104.2), (20.6; 118.1), (16.5; 55.6),
(17.4; 84.4), (17.8; 69.6), (18.2; 68.3), (19.7; 83.8),
(17.1; 76.5), (22.7; 121.8), (21.4; 114.6), (18.6; 60.2),
(21.3; 92.3), (17.4; 72.3), (22.6; 122.2), (18.6; 100.7).
(15.4; 53.2).
13.3.3. Demografowie przypuszczają, że na liczbę dzieci (Y) ma wpływ liczba posiadanego przez matkę tych dzieci rodzeństwa (X). Rozkłady liczby dzieci ze względu na liczbę rodzeństwa matki są w badanej próbie następujące:
Liczba rodzeństwa |
Liczba dzieci |
0 (brak rodzeństwa) |
2 0 1 0 1 0 1 0 1 0 |
1 (jedno) |
1 0 1 2 1 3 1 2 1 2 1 3 |
2 (dwoje) |
2 3 2 3 2 3 1 3 2 3 |
13.3.4. W 600 osobowej losowej próbie przeprowadzono badanie opinii publicznej na temat przystąpienia Polski do Unii Europejskiej. Cechą X było miejsce zamieszkania badanych osób (duże miasta, małe miasta, wieś), cechą Y była opinia (pozytywna lub nie). Pytano grupy liczące po 200 osób i odpowiedzi pozytywnych było: a) w dużych miastach 90%, b) w małych miastach 55%, c) na wsiach 35%.
13.3.5. Oceny (2, 3, 4) z egzaminu pisanego przez studentów w dwóch terminach (I, II) były następujące:
(I, 2), (II, 2), (II, 2), (II, 2), (I, 2), (II, 2), (II, 2),
(II, 2), (I, 3), (I, 3), (I, 3), (I, 3), (I, 4), (I, 3),
(I, 4), (I, 4), (II, 4), (II, 3), (II, 4), (II, 3), (II, 3),
(II, 4), (II, 3), (II, 4), (II, 3), (II, 4), (II, 4), (II, 3),
(II, 4), (II, 3), (II, 3), (II, 4), (II, 3), (II, 4), (II, 3),
(II, 3), (II, 4), (II, 3), (II, 4), (II, 3).
Tablice korelacyjne 13.3.1 - 13.3.5 do przykładów 13.3.1 - 13.3.5
Tablica 13.3.1
Płeć \ Odpowiedź |
Tak |
Nie |
Brak zdania |
Razem |
Kobieta |
6 |
23 |
5 |
34 |
Męóczyzna |
6 |
8 |
2 |
16 |
Razem |
12 |
31 |
7 |
50 |
Tablica 13.3.2
xi0 - xi1 \ yj0 - yj1 |
50-70 |
70-90 |
90-110 |
110-130 |
|
|
15-17 |
2 |
0 |
0 |
0 |
2 |
60 |
17-19 |
3 |
3 |
1 |
0 |
7 |
74,28 |
19-21 |
0 |
1 |
1 |
1 |
3 |
100 |
21-23 |
0 |
0 |
2 |
3 |
5 |
112 |
|
5 |
4 |
4 |
4 |
17 |
X |
|
17,2 |
18,5 |
20,5 |
21,5 |
X |
X |
Tablica 13.3.3
xi \ yj |
0 |
1 |
2 |
3 |
|
0 |
5 |
4 |
1 |
0 |
10 |
1 |
1 |
6 |
3 |
2 |
12 |
2 |
0 |
1 |
4 |
5 |
10 |
|
6 |
11 |
8 |
7 |
32 |
Tablica 13.3.4
Miejsce zamieszkania \ Opinia |
Pozytywna |
Negatywna |
Razem |
Duże miasta |
180 |
20 |
200 |
Małe miasta |
110 |
90 |
200 |
Wieś |
70 |
130 |
200 |
Razem |
360 |
240 |
600 |
Tablica 13.3.5
Termin egzaminu \ Oceny |
2 |
3 |
4 |
Razem |
I termin |
2 |
5 |
3 |
10 |
II termin |
6 |
15 |
9 |
30 |
Razem |
8 |
20 |
12 |
40 |