Zadanie kontrolne ze statystyki 2013/2014
Wyższa Szkoła Bankowa w Toruniu
kierunek: Finanse i Rachunkowość
Imię i nazwisko: Dorota Tchorzewska
nr indeksu: 23807
nr grupy ćw:
nr grupy wyk: W1
Imię i nazwisko prowadzącego ćw: Prof. Dr. Hab. Tadeusz Kufel
I Szereg indywidualny:
Klasyczne miary:
Średnia arytmetyczna:
$\overset{\overline{}}{\mathbf{x}}\mathbf{=}\frac{\mathbf{1}}{\mathbf{\text{n\ \ }}}\sum_{\mathbf{i = 1}}^{\mathbf{n}}\mathbf{x}_{\mathbf{i}}$=$\frac{\mathbf{3840}}{\mathbf{80}}\mathbf{=}48\ $tys. zł
Wśród badanych 80 sklepów średni miesięczny utarg wyniósł 48 tys.zł
Odchylenie standardowe:
$\mathbf{\mu}_{\mathbf{2\ }}\mathbf{=}\frac{\sum_{\mathbf{i = 1}}^{\mathbf{n}}\left( \mathbf{x}_{\mathbf{i}}\mathbf{-}\overset{\overline{}}{\mathbf{x}} \right)^{\mathbf{2}}}{\mathbf{n}}$= $\frac{\mathbf{21448}}{\mathbf{80}}\mathbf{=}268,100$ tys. zł
μ2 =S2 (x)
$\mathbf{S}\left( \mathbf{x} \right)\mathbf{=}\sqrt{\mathbf{268,100}}$ = 16,374 tys. zł
Poszczególne rezultaty różniły się od tej kwoty przeciętnie o ± 16,374 tys. zł od średniego utargu miesięcznego.
Współczynnik zmienności:
$\mathbf{V}\left( \mathbf{x} \right)\mathbf{=}\frac{\mathbf{S}\left( \mathbf{x} \right)}{\overset{\overline{}}{\mathbf{x}}}\mathbf{*}100\ $=$\ \frac{16,374}{48}*100 \approx 34,112\%$
Miesięczny utarg w sklepach spożywczych stanowił aż 34,112% średniego poziomu utargu.
Współczynnik asymetrii :
$\mu_{3\ } = \frac{\sum_{i = 1}^{n}\left( x_{i} - \overset{\overline{}}{x} \right)^{3}}{n}$ = $\frac{41700}{80} = 521,25$0
$$A_{s} = \frac{M_{3}}{S^{3}(x)} = \ \frac{521,2}{4389,81} = \ 0,119$$
Rozkład utargu posiada cechy rozkładu o lewostronne (ujemnej) słabej sile asymetrii wynoszącej 0,119
Współczynnik skupienia:
$\mu_{4} = \frac{\sum_{i = 1}^{n}\left( x_{i} - \overset{\overline{}}{x} \right)^{4}}{n} = \ $ $\frac{17455384}{80} = 218192,3$00
$W_{s} = \frac{\mu_{4}}{S^{4}\left( x \right)} = \ $ $\frac{218192,3}{71877,61} = 3,036$
Rozkład utargów badanej zbiorowości posiada cechy rozkładu wysmukłego o nieznacznie większym skupieniu wartości wokół średniej niż w rozkładzie normalnym, ponieważ 3,036.
Miary pozycyjne :
Mediana
$Me = \frac{n}{2}$ $Me = \frac{80}{2} = 40$
$Me = \frac{x_{40} + x_{41}}{2} = \frac{49 + 49}{2} = 49$ tys.zł
50% badanych sklepów spożywczych ma utarg mniejszy bądź równy 49 tys. zł,
a 50 % sklepów ma utarg większy bądź równy 49 tys. zł.
Kwartyl pierwszy :
$$Q_{1} = \frac{n}{4}\mathbf{\text{\ \ \ }}Q_{1} = \frac{80}{4} = 20$$
$Q_{1}\mathbf{=}\frac{\mathbf{x}_{\mathbf{20}}\mathbf{+}\mathbf{x}_{\mathbf{21}}}{\mathbf{2}}\mathbf{=}$ $\frac{35 + 36}{2}\mathbf{=}35,500$ [tys.zł
25 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 35,500 tys. zł , a 75 % sklepów większy bądź równy 35,500tys. zł .
Kwartyl trzeci :
$$Q_{3} = \frac{3n}{4}\text{\ \ }Q_{3} = \frac{240}{4} = 60\backslash n$$
75 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 57,500 tys.zł,
a 25 % badanych sklepów ma utarg większy bądź równy 57,500 tys. zł.
Decyl pierwszy :
$D_{1} = \frac{n}{10}\text{\ \ \ }D_{1} = \frac{80}{10} = 8$
$D_{1} = \frac{x_{8} + x_{9}}{2} = \ \frac{26 + 27}{2} = 26,500$ tys. zł
10 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 26,500 tys. zł,
a 90 % badanych sklepów ma utarg większy bądź równy 26,500 tys. zł.
Decyl dziewiąty :
$$D_{9} = \frac{9n}{10}\text{\ \ \ }D_{9} = \frac{720}{10} = 72$$
$D_{9} = \ \frac{x_{72} + x_{73}}{2} = \ \frac{65 + 67}{2} = 66,000$ tys. zł
90 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 66,00 tys. zł,
a 10 % badanych sklepów ma utarg większy bądź równy 66 ,00tys. zł.
Odchylenie ćwiartkowe :
$Q = \frac{Q_{3} - Q_{1}}{2} = \frac{57,5 - 35,5}{2} = 11,000$ tys. zł
Zróżnicowanie miesięcznego utargu w sklepach spożywczych wynosi 11 tys. zł w zwężonym obszarze zmienności.
Współczynnik zmienności :
$V_{(x)} = \frac{Q}{\text{Me}}$ * 100 $V_{(x)} = \frac{11}{49}*100 = 22,449\ \%$
Zróżnicowanie miesięcznego utargu w sklepach spożywczych wynosi 22,449 % mediany w zawężonym obszarze zmienności.
Współczynnik asymetrii :
$$A_{s} = \frac{\left( Q_{3} - Me \right) - \left( Me - Q_{1} \right)}{\left( Q_{3} - Me \right) + \left( Me - Q_{1} \right)} = \frac{\left( 57,5 - 49 \right) - (49 - 35,5)}{\left( 57,5 - 49 \right) + (49 - 35,5)} = \frac{8,5 - 13,5}{8,5 + 13,5} = - 0,227$$
Współczynnik asymetrii As = -0,227 wskazuje na słabą asymetrię lewostronną, tzn. w zawężonym obszarze zmienności jest nieco więcej sklepów, które mają utargi poniżej mediany. Ponieważ rozkład utargów (w zawężonym obszarze zmienności) jest słabo asymetryczny, to uzasadnione jest ocenienie stopnia skupienia sklepów wokół mediany utargu.
Współczynnik skupienia :
$W_{s} = \frac{D_{9} - D_{1}}{Q_{3} - Q_{1}} = \frac{66 - 26,500}{57,5 - 35,5} = 1,795$
Rozkład utargu w sklepach spożywczych charakteryzuje się skupieniem wartości wokół średniej 1,795 rozkładem spłaszczonym w stosunku do normalnego.
II Szereg pogrupowany przedziałowo :
Miary klasyczne:
Średnia arytmetyczna:
$\overset{\overline{}}{\mathbf{x}}\mathbf{=}\frac{\frac{\mathbf{1}}{\mathbf{\text{n\ \ }}}\sum_{\mathbf{i = 1}}^{\mathbf{k}}{\mathbf{*x}_{\mathbf{i}}\mathbf{\text{ni}}}}{\mathbf{n}}$=$\mathbf{\ }\frac{\mathbf{3920}}{\mathbf{80}}$ = 49
Wśród badanych 80 sklepów średni miesięczny utarg wyniósł 49 tys. zł
Odchylenie standardowe:
$\mu_{2\ }\mathbf{=}\frac{\sum_{\mathbf{i = 1}}^{\mathbf{n}}{\left( \mathbf{x}_{\mathbf{i}}\mathbf{-}\overset{\overline{}}{\mathbf{x}} \right)^{\mathbf{2}}\mathbf{*ni}}}{\mathbf{n}}$= $\frac{23920}{80} = 299,000\mathbf{\ }$tys. Zł
μ2 = S2 (x)
$S\left( x \right)\mathbf{=}\sqrt{299,00}$ = 17,292 tys. zł
Poszczególne rezultaty różniły się od tej kwoty przeciętnie o ± 17,292 tys. zł od średniego utargu miesięcznego.
Współczynnik zmienności:
$V\left( x \right)\mathbf{=}\frac{\mathbf{S}\left( \mathbf{x} \right)}{\overset{\overline{}}{\mathbf{x}}}\ $=$\frac{17,292}{48}*100\% = 35,289$
Miesięczny utarg w sklepach spożywczych stanowił aż 35,289% średniego poziomu utargu.
. Współczynnik asymetrii:
$\mathbf{\mu}_{\mathbf{3\ }}\mathbf{=}\frac{\sum_{\mathbf{i = 1}}^{\mathbf{n}}{\left( \mathbf{x}_{\mathbf{i}}\mathbf{-}\overset{\overline{}}{\mathbf{x}} \right)^{\mathbf{3}}\mathbf{*ni}}}{\mathbf{n}}$ = $\frac{\mathbf{63840,00}}{\mathbf{80}}\mathbf{= 798,00}$
$\mathbf{A}_{\mathbf{s}}\mathbf{=}\frac{\mathbf{\mu}_{\mathbf{3\ }}}{\mathbf{S}^{\mathbf{3}}\mathbf{(x)}}\mathbf{= \ }\frac{\mathbf{798,00}}{\mathbf{5170,193}}\mathbf{= \ 0,154}$
Rozkład utargu posiada cechy rozkładu prawostronnego o słabej asymetrii wynoszącej 0,154.
Współczynnik skupienia:
$\mu_{4} = \frac{\sum_{i = 1}^{n}{\left( x_{i} - \overset{\overline{}}{x} \right)^{4}*ni}}{n} = \ $ $\frac{20751760}{80} =$259397
$W_{s} = \frac{\mu_{4}}{S^{4}\left( x \right)} = \ $ $\frac{259397}{89401} = \ $2,901
Rozkład utargów badanej zbiorowości posiada cechy rozkładu spłaszczonego o nieznacznie mniejszym skupieniu wartości wokół średniej niż w rozkładzie normalnym, ponieważ wynosi 2,901.
Miary pozycyjne:
Dominanta:
$$\mathbf{D = \ }\mathbf{x}_{\mathbf{0}}\mathbf{+ \ }\frac{\left( \mathbf{n}_{\mathbf{0}}\mathbf{- \ }\mathbf{n}_{\mathbf{- 1}} \right)}{\left( \mathbf{n}_{\mathbf{0}}\mathbf{-}\mathbf{n}_{\mathbf{- 1}} \right)\mathbf{+}\left( \mathbf{n}_{\mathbf{0}}\mathbf{+}\mathbf{n}_{\mathbf{+ 1}} \right)}\mathbf{*}\mathbf{h}_{\mathbf{0}}$$
D= 50 +$\frac{32 - 30}{\left( 32 - 30 \right) + \left( 32 - 6 \right)}*20 = \ $51,429
Najczęściej miesięczny utarg wynosił 51,429 tys. zł
Mediana:
$Me = x_{\text{oMe\ }} + \frac{\frac{N}{2} - n - 1cum\ }{n}*h_{0}$ = 30 +$\ \frac{40,5 - 11}{30}*20 =$ 49,667
50% badanych sklepów spożywczych ma utarg mniejszy bądź równy 49,667 tys. zł,
a 50 % sklepów ma utarg większy bądź równy 49,667 tys. zł.
Kwartyl pierwszy:
$$Q_{1} = \frac{n}{4}\mathbf{\text{\ \ \ }}Q_{1} = \frac{80}{4} = 20$$
Q1 = $x_{0} + \ \frac{\frac{N}{4} - n_{- 1cum}}{n_{0}}*h_{0}$
Q1=30 + $\frac{\frac{80}{4} - 11}{30}*20 = 36,000$tys.zł
25 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 36,000 tys. zł ,
a 75 % sklepów większy bądź równy 36,000 tys. zł .
Kwartyl trzeci:
$$Q_{3} = \frac{3n}{4}\text{\ \ }Q_{3} = \frac{240}{4} = 60$$
Q3 = $x_{0} + \ \frac{\frac{3n}{4} - n_{- 1cum}}{n_{0}}*h_{0}$
$Q_{3} = 50 + \ \frac{\frac{240}{4} - 41}{32}*20 = 61,875$ tys.zł
75 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 61,875 tys. zł,
a 25 % badanych sklepów ma utarg większy bądź równy 61,875 tys. zł.
Decyl pierwszy:
$D_{1} = \frac{n}{10}\text{\ \ \ }D_{1} = \frac{80}{10} = 8$
$D_{1} = 10 + \ \frac{\frac{80}{10} - 0}{11}\ $* 20 = 24,545tys.zł10 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 24,545 tys. zł,
a 90 % badanych sklepów ma utarg większy bądź równy 24,545 tys. zł.
Decyl dziewiąty:
$$D_{9} = \frac{9n}{10}\text{\ \ \ }D_{9} = \frac{720}{10} = 72$$
$D_{9} = 50 + \frac{\frac{720}{10} - 41}{32}*20 = 69,375$ tys.zł
90 % badanych sklepów spożywczych ma utarg mniejszy bądź równy 69,375 tys. zł,
a 10 % badanych sklepów ma utarg większy bądź równy 69,375 tys. zł.
Odchylenie ćwiartkowe:
$Q = \frac{Q_{3} - Q_{1}}{2} = \frac{36 - 61,875}{2} = 12,938$tys. zł
Zróżnicowanie miesięcznego utargu w sklepach spożywczych wynosi 12,938 tys. zł w zwężonym obszarze zmienności.
Współczynnik zmienności:
$V_{(x)} = \frac{Q}{\text{Me}}$ * 100 $V_{(x)} = \frac{12,938}{49,667}*100 = 26,049\ \%$
Zróżnicowanie miesięcznego utargu w sklepach spożywczych wynosi 26,049 % mediany w zawężonym obszarze zmienności
Współczynnik asymetrii:
$A_{s} = \frac{\left( Q_{3} - Me \right) - \left( Me - Q_{1} \right)}{\left( Q_{3} - Me \right) + \left( Me - Q_{1} \right)} = \frac{\left( 61,875 - 49,667 \right) - (49,667 - 36)}{\left( 61,875 - 49,667 \right) + (49,667 - 36)} = \frac{12,208 - 13,667}{12,208 + 13,667} = \frac{- 1,459}{25,875}\ $ = -0,056
Współczynnik asymetrii As = -0,056 wskazuje na słabą asymetrię lewostronną, tzn. w zawężonym obszarze zmienności jest nieco więcej sklepów, które mają utargi poniżej mediany. Ponieważ rozkład utargów jest słabo asymetryczny, to uzasadnione jest ocenienie stopnia skupienia sklepów wokół mediany utargu.
Współczynnik skupienia:
$W_{s} = \frac{D_{9} - D_{1}}{Q_{3} - Q_{1}}$= $\frac{69,375 - 24,545}{61,875 - 36}$ = $\frac{44,83}{25,875}$ = 1,733
Rozkład utargu w sklepach spożywczych charakteryzuje się skupieniem wartości wokół średniej 1,733 rozkładem spłaszczonym w stosunku do normalnego.
Zadanie 3.1
średnia arytmetyczna: $\overset{\overline{}}{y}$ = $\frac{\sum_{i = 1}^{n}y_{i}}{n}$ = $\frac{28435}{50\ }$ = 568,7
wariancja: μ2= $\frac{\sum_{i = 1}^{n}\left( y_{i} - \ \overset{\overline{}}{y} \right)^{2}}{n}$ = $\frac{604090,50}{50}$ = 12081,81
odchylenie standardowe: S(y) = $\sqrt{\frac{\sum_{i = 1}^{n}\left( y_{i} - \ \overset{\overline{}}{y} \right)^{2}}{n}}$ = $\sqrt{967,33}$= 31,10
poziom istotności: α = 10%
wartość krytyczna: μα= 1,64
liczebność próby: $\sqrt{n}$ = $\sqrt{50}$ = 7,07
$P(\overset{\overline{}}{\mathbf{y}} - u_{\text{α\ }}\frac{S(y)}{\sqrt{n}}$ < µ < $\overset{\overline{}}{\mathbf{y}}$+ $u_{\text{α\ \ }}\frac{S(y)}{\sqrt{n}}$ ) = 1 – α
$P(\ 154,10 - 1,64\ \frac{31,1}{7,07}$ < µ < 154,10+ 1,64 $\frac{31,1}{7,07}$ )= 1-0,1
P(154,1−7,21< u<154,1+7,21) = 0, 99
P{ 146,89 < μ < 161,31} = 0,99 (99%)
Z prawdopodobieństwem 99% możemy twierdzić, że nieznana wartość średnich wydatków dla ogółu gospodarstw domowych zawiera się w przedziale od 147zł do 161zł.
Zadanie 3.2
Hipoteza:
Ho : µ = 370 (nie, nie jest większe)
H1: µ > 370 (tak, jest większe)
2) Statystyka testowa
średnia arytmetyczna: $\overset{\overline{}}{x}$ = $\frac{\sum_{i = 1}^{n}x_{i}}{n}$ = $\frac{28435}{50}$ = 568,7
wariancja: μ2= $\frac{\sum_{i = 1}^{n}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}{n}$ = $\frac{604090,5}{50}$ =12081,81
odchylenie standardowe: S(x) = $\sqrt{\frac{\sum_{i = 1}^{n}\left( x_{i} - \ \overset{\overline{}}{x} \right)^{2}}{n}}$ = $\sqrt{12081,81}$ = 109,92
liczebność próby: $\sqrt{n}$ = $\sqrt{50\ }$= 7,07
μo = 370
uobl. = $\frac{\overset{\overline{}}{\mathbf{x}}\mathbf{- \ }\mathbf{\mu}_{\mathbf{o}}}{\mathbf{S(x)}}$ × $\sqrt{\mathbf{n}}$ = $\frac{\mathbf{568,7\ - 370\ }}{\mathbf{109,92}}$ × 7,07 = 12,78
Obszar krytyczny : α = 10% = 1,64
Uobl należy do obszaru krytycznego odrzucam Ho na rzecz H1.
Z maksymalnym prawdopodobieństwem popełnienia błędu α=10% średni dochód dla ogółu gospodarstw domowych jest istotnie większy niż 370.
Zadanie 3.3
1) Stawiamy hipotezę
Ho: σ2 = 812
H1: σ2 > 812
2) Statystyka testowa
S2(x) = (109,92)2 = 12082,4
$\mathbf{\chi}^{\mathbf{2}}\mathbf{= \ }\frac{\mathbf{S}^{\mathbf{2}}\mathbf{(x)}}{\mathbf{\sigma}_{\mathbf{o}}^{\mathbf{2}}}$ × (n-1) = $\frac{\mathbf{12082,4}}{\mathbf{81}^{\mathbf{2}}}$ × 49 = $\frac{\mathbf{12082,4}}{\mathbf{6561}}$ × 49 = 90,23
uobl. = $\sqrt{\mathbf{2\ }\mathbf{\chi}^{\mathbf{2}}}$ - $\sqrt{\mathbf{2}\mathbf{n - 3}}$ = $\sqrt{\mathbf{2*90,23}}$ - $\sqrt{\mathbf{2*50 - 3}}$ = $\sqrt{\mathbf{180,46}}$ - $\sqrt{\mathbf{97}}$ = 13,43-9,8=3,63
Obszar krytyczny: α = 10% = 1,64
Uobl. Należy do obszaru krytycznego odrzucam Ho na rzecz H1. Z maksymalnym prawdopodobieństwem popełnienia błędu α=10% zróżnicowanie dochodu dola ogółu gospodarstw domowych jest istotnie większy niż 81zł
Zadanie 3.4
rxy = 0 (brak korelacji)
rxy > 0 (korelacja dodatnia)
rxy < 0 (korelacja ujemna)
1) Obliczam kowariancję
cov (X,Y) = $\frac{\sum_{\mathbf{i =}\mathbf{1}}^{\mathbf{n}}{\left( \mathbf{x}_{\mathbf{\text{i\ }}}\mathbf{- \ }\overset{\overline{}}{\mathbf{x}} \right)\left( \mathbf{y}_{\mathbf{i}}\mathbf{- \ }\overset{\overline{}}{\mathbf{y}} \right)}}{\mathbf{n}}$ = $\frac{\mathbf{142034}\mathbf{,}\mathbf{50}}{\mathbf{50}}$ = 2840,69
Współczynnik korelacji liniowej Pearsona:
rxy = $\frac{\mathbf{\text{cov}}\mathbf{\ }\left( \mathbf{X}\mathbf{,}\mathbf{Y} \right)}{\mathbf{S}\left( \mathbf{x} \right)\mathbf{\ \times}\mathbf{S}\mathbf{(}\mathbf{y}\mathbf{)}}$ = $\frac{\mathbf{2840}\mathbf{,}\mathbf{69}}{\mathbf{109}\mathbf{,}\mathbf{92}\mathbf{*\ 31,1}}$ = $\frac{\mathbf{2840}\mathbf{,}\mathbf{69}}{\mathbf{3418}\mathbf{,}\mathbf{51}}$ = 0,83
Odp. Zależność pomiędzy dochodami na 1 osobę, a wydatkami na turystykę, sport i wypoczynek jest dodatnia oraz występuje korelacja silna.
Zadanie 3.5
Klasyczny model regresji liniowej: Y = a + bx + E
b = $\frac{\mathbf{cov\ (X,Y)}}{\mathbf{S}^{\mathbf{2}}\mathbf{(x)}}$ = $\frac{\mathbf{2840,69}}{\mathbf{12082,40}}$ = 0,24
a = $\overset{\overline{}}{\mathbf{y}}$ - b * $\overset{\overline{}}{\mathbf{x}}$ = 154,1 – 0,24 * 568,7 = 154,1 – 136,49 = 17,61
Odp. Wzrost dochodów o 1 zł powoduje wzrost wydatków o 24 grosze.
Równanie modelu: $\hat{\mathbf{y}_{\mathbf{i}}}$ = 17,61 + 0,24 * xi (wydatki teoretyczne)
Reszty: Ei = yi – $\hat{\mathbf{y}_{\mathbf{i}}}$