Szeregi strukturalne powstają w wyniku grupowania materiału wg cechy rzeczowej.
Na podstawie xero nr 1:
Wyróżniamy tu 6 cech statystycznych:
powierzchnia użytkowa mieszkań
liczba izb
liczba osób
urządzenia sanitarne
instalacje gazowe
instalacje c. o.
Zbiór wartości, w którym poszczególne warianty cechy zapisane są dla każdej jednostki statystycznej odrębnie, nazywamy szeregiem szczegółowym.
Schemat szeregu prostego, szczegółowego:
Cecha statystyczna |
np. powierzchnia mieszkania w m2 |
Xi |
Xi |
x1 |
38 = x1 |
x2 |
56 = x2 |
x3 |
73 = x3 |
... |
23 = x4 |
xn |
45 = x5 |
x1+x2+x3+x4+...+xn=∑xi 235 m2
W zbiorowościach większych niektóre warianty cechy powtarzają się. Dokonujemy wówczas łączenia tych jednostek, które charakteryzują się takim samym poziomem cechy. Poszczególne warianty zapisujemy, porządkując je rosnąco lub malejąco, a następnie zliczamy jednostki charakteryzujące się danym wariantem cechy. W ten sposób tworzymy szeregi rozdzielcze o klasach pojedynczych (jednowariantowych).
Schemat szeregu rozdzielczego:
Cecha statystyczna |
Liczba jednostek (obserwacji) |
Xi |
ni |
x1 |
n1 |
x2 |
n2 |
x3 |
.. |
... |
.. |
xn |
nk |
Ogółem: ∑i ni
W szeregu rozdzielczym następuje rozdzielenie cechy statystycznej od liczby jednostek.
Ćwiczenie a) - obliczyć liczbę mieszkań w dzielnicy A i B z odpowiednią liczbą izb.
Liczba izb w mieszkaniu |
Liczba mieszkań w dzielnicy |
|
xi |
A |
B |
1 |
6 |
10 |
2 |
17 |
19 |
3 |
12 |
7 |
4 |
4 |
3 |
5 |
1 |
1 |
Ogółem: |
40 |
40 |
Ćwiczenie b) - obliczyć liczbę osób przypadającą na daną liczbę mieszkań w dzielnicy A i B.
Liczba osób w mieszkaniu |
Liczba osób w dzielnicy |
|
xi |
A |
B |
1 |
6 |
4 |
2 |
7 |
6 |
3 |
8 |
14 |
4 |
11 |
8 |
5 |
5 |
6 |
6 |
3 |
2 |
Ogółem: |
40 |
40 |
Ćwiczenie c) - obliczyć liczbę mieszkań, w których zainstalowano (bądź nie zainstalowano) urządzenia sanitarne w dzielnicy A i B.
Urządzenia sanitarne |
Liczba mieszkań w dzielnicy |
|
|
A |
B |
są (tak) |
29 |
28 |
brak (nie) |
11 |
12 |
Ogółem: |
40 |
40 |
Ćwiczenie d) - obliczyć liczbę mieszkań, w których zainstalowano (bądź nie zainstalowano) urządzenia gazowe w dzielnicy A i B.
Urządzenia gazowe |
Liczba mieszkań w dzielnicy |
|
|
A |
B |
są (tak) |
25 |
29 |
brak (nie) |
15 |
11 |
Ogółem: |
40 |
40 |
Ćwiczenie e) - obliczyć liczbę mieszkań, w których zainstalowano (bądź nie zainstalowano) c.o. w dzielnicy A i B.
Urządzenia c.o. |
Liczba mieszkań w dzielnicy |
|
|
A |
B |
są (tak) |
14 |
16 |
brak (nie) |
26 |
24 |
Ogółem: |
40 |
40 |
W zbiorowościach o dużej liczbie zróżnicowanych wariantów cechy, łączymy te jednostki które charakteryzują się zbliżonym wariantem cechy. Tworzymy w ten sposób szeregi rozdzielcze o przedziałach klasowych (wielowariantowych).
Ćwiczenie f) - tworzymy przedziały klasowe
Grupując wg cechy mierzalnej ciągłej możemy tak tworzyć przedziały aby górna granica przedziału poprzedniego była równa dolnej granicy przedziału następnego. Przed przystąpieniem do grupowania tworzymy przedziały robocze wg jednego ze sposobów.
wg pierwszego schematu:
Wiek |
|
5 - 10 |
10 - dolna granica przedziału |
10 - 15 |
15 - górna granica przedziału |
15 - 30 |
15 - 10 = 5 - rozpiętość przedziału |
30 - 50 |
|
wg drugiego schematu
Wiek |
5 - 9,9 |
10 - 14,9 |
15 - 29,9 |
30 - 49,9 |
wg trzeciego schematu
Wiek |
5 - 10 |
10,1 - 15 |
15,1 - 30 |
30,1 - 50 |
Grupując wg cechy mierzalnej skokowej musimy przyjąć różne granice przedziałów.
Wiek |
|
do 10 |
Przedziały otwarte to przedziały nie posiadające jednej z granic. Mogą one |
10 - 15 |
wystąpić tylko na początku i końcu szeregu. |
15 - 30 |
|
30 i więcej |
|
Ćwiczenie g) - tworzymy przedziały klasowe dla powierzchni mieszkań w dzielnicy A i B.
Powierzchnia mieszkania |
Liczba mieszkań w dzielnicy |
|
|
A |
B |
do 30 |
5 |
5 |
30 - 40 |
10 |
10 |
40 - 50 |
11 |
13 |
50 - 60 |
6 |
7 |
60 - 80 |
4 |
2 |
80 i więcej |
4 |
3 |
Ogółem: |
40 |
40 |
Ćwiczenie g) - obliczanie miar
Średnia liczba izb:
__ ∑i xi |
|
n
Zadanie1
Oprocentowanie kredytów preferencyjnych w wybranych bankach, w dwóch kolejnych latach kształtowało się następująco.
Oprocentowanie kredytów (w %) |
|
1995 |
1996 |
xi |
xi |
7 |
101 |
8 |
10 |
11 |
8 |
9 |
7 |
9 |
12 |
8 |
12 |
10 |
12 |
12 |
13 |
7 |
12 |
13 |
14 |
-- |
9 |
94 |
119 |
Porównać przeciętne oprocentowanie kredytów, posługując się poznanymi miarami średnimi.
Rozwiązanie:
Są to szeregi szczegółowe (proste), ponieważ nie występują tu liczby jednostek.
__ ∑i xi |
|
n
_ _
x1995 = 94/10 = 9,4 % gdzie 7% < x < 14% (patrz na wartości max i min w tabeli)
_ _
x1996 = 119/11 = 10,8 % gdzie 7% < x < 14%
Wyznaczanie mediany:
Najpierw szeregujemy wartości cechy rosnąco lub malejąco.
Oprocentowanie kredytów (w %) |
|
1995 |
1996 |
xi |
xi |
7 |
7 |
7 |
8 |
8 |
9 |
8 |
10 |
9 |
10 |
9 |
12 |
10 |
12 |
11 |
12 |
12 |
12 |
13 |
13 |
-- |
14 |
n |
|
2
n
NM II 1995 = + 1 = 10/2 + 1 = 6 to szósta liczba z tabeli, czyli 9
2
M1995 = (9+9)/2 = 9% to jest średnie oprocentowanie
n + 1 |
|
2
N1996 = 12% to średnie oprocentowanie
W szeregu 1995 nie występuje dominanta (wartość, która pojawia się najczęściej).
W szeregu 1996 dominanta wynosi:
D1996 = 12% (12% występuje najczęściej)
Zadanie 2
Wśród słuchaczy studium podyplomowego przeprowadzono badanie liczby papierosów wypalanych dziennie przez kobiety i mężczyzn.
Kobiety wypalały średnio 10 sztuk dziennie, połowa spośród nich wypalała nie więcej niż 11 sztuk, a dominująca grupa 12 sztuk dziennie.
Struktura mężczyzn wg liczby wypalanych papierosów przedstawia poniższy szereg.
Liczba wypalanych papierosów |
Liczba słuchaczy |
xi |
ni |
0 |
10 |
5 |
20 |
10 |
40 |
15 |
60 |
20 |
40 |
25 |
20 |
30 |
10 |
Porównać możliwie przestronnie struktury obu zbiorowości z punktu widzenia liczby wypalanych papierosów, wiedząc dodatkowo, że zróżnicowanie zbiorowości kobiet obliczone na podstawie odchylenia standardowego, stanowiło 25% średniej.
Rozwiązanie:
Jest to szereg rozdzielczy.
Wypisujemy miary, które zostały podane w zadaniu.
Parametry |
Zbiorowość |
|
_ |
Kobiet |
Mężczyzn |
x |
10 szt. |
15 szt. |
D |
12 szt. |
15 szt. |
M |
11 szt. |
15 szt. |
Vδ |
25 % |
48 % |
δx |
2,5 szt. |
7,2 szt. |
WAS |
- 0,8 |
0 |
δx |
|
x stosunek odchylenie standardowego do średniej arytmetycznej
2,5 7,2 |
|
10 15
∑i ( xi - x )2 ni |
|
∑i n i pojedynczych
|
|
|
-15 |
225 |
2250 |
-10 |
100 |
2000 |
-5 |
25 |
1000 |
0 |
0 |
0 |
5 |
25 |
1000 |
10 |
100 |
2000 |
15 |
225 |
2250 |
-------- |
--------- |
10500 |
|
|
200
(15 ± 7,2) - typowy obszar zmienności cechy (średnia i odchylenie)
|
|
δx
10 - 12 15 - 15 |
|
2,5 7,2
Wnioski:
Mężczyźni wypalali zdecydowanie więcej papierosów dziennie o czym świadczą wszystkie średnie. Jednocześnie zbiorowość mężczyzn jest bardziej silnie zróżnicowana pod względem liczby wypalanych papierosów. Rozkład liczby wypalanych papierosów w zbiorowości kobiet jest asymetryczny. Stopień asymetrii jest wysoki = 0,8, a szereg jest lewostronnie skośny (asymetria ujemna). Natomiast w zbiorowości mężczyzn rozkład liczby wypalanych papierosów jest symetryczny.
Zadanie 3
W hurtowni znajdują się konserwy mięsne produkowane przez dwóch producentów A i B. Średnia waga puszki od producenta A = 1 kg przy odchyleniu standardowym 0,12 kg. Rozkład wagi puszek jest symetryczny. Struktura puszek ze względu na wagę od producenta B podano w szeregu.
Waga puszki |
Odsetek puszek |
xi |
ni |
0,7 |
10 |
0,8 |
10 |
0,9 |
20 |
1 |
30 |
1,1 |
15 |
1,2 |
10 |
1,3 |
5 |
Ogółem: |
100 |
Właściciel sklepu chce zakupić partię towarów, którego producenta należy polecić, aby liczba reklamacji związanych ze zbyt dużym odchyleniem ciężaru puszek była mniejsza. Obliczyć udział puszek od producenta B, których waga przekroczyła 1 kg.
Rozwiązanie:
xi ni |
nisk |
xi2 |
7 |
10 |
4,9 |
8 |
20 |
6,4 |
18 |
40 |
16,2 |
30 |
70 |
30,0 |
16,5 |
85 |
18,15 |
12 |
95 |
14,40 |
6,5 |
100 |
8,45 |
98,0 |
--------- |
98,50 |
Parametry |
Hurtownie |
|
_ |
A |
B |
x |
1kg |
0,98 kg |
D |
1kg |
1kg |
M |
1kg |
1kg |
Vx |
12 % |
14,28 % |
δx |
0,12 kg |
0,14 kg |
30 puszek posiada wagę 1 kg, więc to jest dominanta.
∑i xi2 ni |
|
∑i ni pojedynczych
98,0 |
|
100
0,12 0,14 |
|
0,98
Udział puszek, których waga przekracza 1 kg.
ni 15 + 10 + 5 |
|
Wnioski:
Polecamy hurtownię A, ponieważ średnia waga puszek wynosi 1kg, a Vx = 12 %.
Z analizy danych wynika, że należy polecić producenta A, ponieważ średnia waga puszki jest tutaj wyższa a odchylenie od wagi (zróżnicowanie wagi) mniejsze. Można więc oczekiwać mniejszej liczby reklamacji.
Zadanie 4
Przeprowadzono badania z użycia energii elektrycznej przez rodziny w Łodzi i Warszawie. Okazało się, że średnie zużycie wśród rodzin łódzkich wynosiło 55 kwh, przy odchyleniu standardowym 11kwh. Połowa rodzin zużywał niemniej niż 53 kwh, a dominująca grupa 50 kwh. Zużycie energii elektrycznej wśród rodzin w Warszawie było następujące:
Zużycie energii w kwh |
Liczba rodzin |
xi |
ni |
35 - 45 |
60 |
45 - 55 |
100 |
55 - 65 |
150 |
65 - 75 |
110 |
75 - 85 |
80 |
-------- |
500 |
Przeprowadzić możliwie wszechstronną analizę struktury rodzin wg poziomu zużycia energii elektrycznej w obu zbiorowościach.
Rozwiązanie:
Jest to szereg rozdzielczy o przedziałach klasowych.
Obliczamy środki przedziałów.
|
|
xi |
xi ni |
40 |
2400 |
50 |
5000 |
60 |
9000 |
70 |
7700 |
80 |
6400 |
-------- |
30500 |
(35 + 45)/2 = 40
(45 + 55)/2 = 50 itd.
Obliczamy średnią arytmetyczną.
__ ∑i xi ni |
|
∑i ni
Parametry |
Łódź |
Warszawa |
|
55 kwh |
61 kwh |
D |
50 kwh |
60,6 kwh |
M |
53 kwh |
61 kwh |
Vx |
20 % |
20 % |
δx |
11 kwh |
12,6 kwh |
Was |
0,45 |
0,03 |
Wyznaczamy medianę:
500/2 = 250
55 ≤ M ≤ 65
Wyznaczamy skumulowany szereg zbiorowości.
|
xi - x |
(xi - x)2 |
(xi - x)2ni |
60 |
40 - 61 = -21 |
441 |
28460 |
160 |
50 - 61 = -11 |
121 |
12100 |
320 |
-1 |
1 |
150 |
420 |
9 |
81 |
9810 |
500 |
19 |
361 |
28880 |
65 - 55 = 10 to rozpiętość przedziału mediany
ho |
|
no
55 ≤ D ≤ 65
D = 55 + [(150 - 100) - 10]/(150 - 100) + (150 - 110) = 66,6 kwh
|
|
∑i n i
VŁ = 11/55 * 100 = 20 %
VW = 12,6/61 * 100 = 20%
Was = (55 - 50)/11 = 0,45%
Was = (61 - 60,6) = 0,03 %
Wnioski:
Zużycie energii elektrycznej jest zdecydowanie wyższe w rodzinach warszawskich na co wskazują wszystkie obliczone średnie. Poziom zróżnicowania w oby zbiorowościach jest jednakowy. Rozkład cechy wykazuje znaczny stopień asymetrii dla rodzin łódzkich. Dla zbiorowości rodzin warszawskich szereg jest niemal symetryczny. kierunek asymetrii dla obu zbiorowości jest dodatni (prawostronny).
1