Autorzy raportu: Data: 24 kwiecie艅 2007 r.
Rados艂aw Baran
Piotr B臋tkowski
TEMAT RAPORTU
Badanie wsp贸艂zale偶no艣ci cech charakteryzuj膮cych dzia艂alno艣膰 firmy handlowej
W pliku tekstowym FIRMA.TXT zestawiono dane o warto艣ciach nast臋puj膮cych cech w r贸偶nych oddzia艂ach firmy: obroty w tys. z艂otych, koszty transportu w tys. z艂otych, 艣redni sta偶 pracy w latach.
Raport ma na celu zbadanie istotno艣ci zale偶no艣ci liniowej oraz jej charakter mi臋dzy wielko艣ci膮 obrot贸w firmy a kosztami transportu towar贸w oraz mi臋dzy wielko艣ci膮 obrot贸w i 艣rednim sta偶em pracy os贸b zatrudnionych w firmie.
W raporcie przedstawiono wyniki uzyskane z rozwi膮za艅 podanych ni偶ej zagadnie艅.
1. Analiza korelacji liniowej
Analiza wsp贸艂zale偶no艣ci liniowej mi臋dzy badanymi cechami
H0: wsp贸艂czynnik korelacji jest r贸wny 0 - nie ma korelacji mi臋dzy tymi zmiennymi H1: wsp贸艂czynnik korelacji jest r贸偶ny od 0 - jest korelacja mi臋dzy tymi zmiennymi |
||
Zmienne |
Obr x KT |
Obr x SP |
Wsp贸艂czynnik korelacji z pr贸by |
0,96783 |
0,22053 |
Statystyka testowa t |
- |
- |
Licz. stopni .swobody |
27 |
27 |
Poziom istotno艣ci 伪 |
0,05 |
0,05 |
Prawdopodobie艅stwo testowe p - value |
<0,0001 |
0,2503 |
Wniosek |
p -value < 伪; odrzucamy hipotez臋 zerow膮 na korzy艣膰 H1 na poziomie istotno艣ci r贸wnym 0.05 |
p -value > 伪; nie ma podstaw do odrzucenia hipotezy zerowej na korzy艣膰 H1 na poziomie istotno艣ci r贸wnym 0.05 |
Liczebno艣膰 pr贸by: 29
Poziom istotno艣ci=5%
1.2. Wykres punktowy dla zale偶no艣ci mi臋dzy obrotami a kosztami transportu:
K_TRANS = f(OBROTY)
1.3. Wykres punktowy dla zale偶no艣ci mi臋dzy obrotami a sta偶em pracy:
Sta偶_pr = f(obroty)
1.4. Wnioski:
Na podstawie zestawionych wynik贸w w postaci tabelarycznej oraz punktowej (wykres) stwierdzamy, 偶e:
- w przypadku koszt贸w transportu w funkcji obrot贸w wsp贸艂czynnik korelacji liniowej dla poziomu istotno艣ci r贸wnej 0,05 (warto艣膰 prawdopodobie艅stwa testowego jest mniejsza od poziomu istotno艣ci 伪=0,05) wynosi 0,968 i nie zawiera si臋 w obszarze krytycznym, dlatego nale偶y odrzuci膰 hipotez臋 H0, kt贸ra m贸wi, 偶e nie ma zwi膮zku pomi臋dzy tymi dwiema cechami. Ze wzgl臋du na warto艣膰 wsp贸艂czynnika korelacji (0,968) stwierdzamy, 偶e wyst臋puje prawie pe艂na korelacja
- po dokonaniu analizy wykresu punktowego K_TRANS = f(OBROTY) obrazuj膮cego zwi膮zek pomi臋dzy zmiennymi (obroty a koszty) stwierdzamy, 偶e wzrostowi warto艣ci jednej zmiennej odpowiada wzrost warto艣ci drugiej zmiennej, co 艣wiadczy o korelacji dodatniej
- Analizuj膮c powy偶sze zestawienia wynik贸w obrot贸w w stosunku do 艣redniego sta偶u pracy otrzymujemy warto艣膰 prawdopodobie艅stwa testowego (p-value) wy偶sz膮 od przyj臋tego poziomu istotno艣ci, co oznacza, 偶e wsp贸艂zale偶no艣膰 pomi臋dzy badanymi cechami nie istnieje (przyjmujemy hipotez臋 zerow膮). Warto艣膰 wsp贸艂czynnika korelacji z pr贸by jest r贸wny 0,221 co 艣wiadczy o znikomej korelacji.
- po dokonaniu analizy wykresu punktowego K_TRANS = f(STA呕_PR) zauwa偶yli艣my, 偶e jest znaczne rozproszenie punkt贸w i niezauwa偶alna jest 偶adna tendencja centralna, co potwierdza nam brak wsp贸艂zale偶no艣ci liniowej mi臋dzy badanymi cechami..
2. Analiza regresji liniowej
Budujemy model regresji liniowej dla pary cech, dla kt贸rych wsp贸艂czynnik korelacji jest istotny statystycznie, czyli dla zale偶no艣ci mi臋dzy obrotami i kosztami transportu.
Na podstawie wynik贸w otrzymanych w systemie SAS dokonujemy oceny oszacowanego modelu w postaci niniejszego zestawienia.
Wyestymowana posta膰 zale偶no艣ci regresyjnej: koszty transportu = m * obroty + b
2.1. Istotno艣膰 statystyczna wsp贸艂czynnik贸w modelu
2.1.1. Wsp贸艂czynnik m: 0,07105
Elementy testu istotno艣ci:
poziom istotno艣ci: 伪 = 0,05
statystyka testowa dla m: t-value = 19,99
warto艣膰 p - value <0,0001
Wniosek:
Poniewa偶 p-value jest mniejsze od poziomu istotno艣ci 0,05 wi臋c odrzucamy hipotez臋 zerow膮 (H0) na korzy艣膰 alternatywnej (H1); wsp贸艂czynnik m jest wi臋c istotny statystycznie.
2.1.2. Wsp贸艂czynnik b: 22,26130
Elementy testu istotno艣ci:
poziom istotno艣ci: 伪 = 0,05
statystyka testowa dla b: t = 10,17
warto艣膰 p - value <0,0001
Wniosek:
Poniewa偶 p-value jest mniejsze od poziomu istotno艣ci 0,05 wi臋c odrzucamy hipotez臋 zerow膮 (H0) na korzy艣膰 alternatywnej (H1); wsp贸艂czynnik b jest wi臋c istotny statystycznie.
2.2. Dopasowanie modelu do danych empirycznych
2.2.1. Wsp贸艂czynnik determinacji(R-square) : 0,9367
Wniosek:
Warto艣膰 wsp贸艂czynnika determinacji 艣wiadczy o tym, 偶e zmienno艣膰 koszt贸w transportu K_TRANS prawie w 94% wyja艣niona jest liniow膮 zale偶no艣ci膮 od warto艣ci obrot贸w OBROTY.
2.2.2. B艂膮d oceny (Root MSE) Y: 4,58974
Wniosek:
艢redni b艂膮d oszacowania koszt贸w transportu K_TRANS, spowodowany wp艂ywem czynnik贸w losowych wynosi 4,58974 tys.z艂. Oznacza to, i偶 warto艣ci rzeczywiste zmiennej obja艣nianej r贸偶ni膮 si臋 od warto艣ci przewidywanej przez model o powy偶sz膮 warto艣膰.
2.3. Istotno艣膰 statystyczna modelu liniowego
Elementy testu istotno艣ci:
poziom istotno艣ci: 伪 = 0,05
statystyka testowa: t = 399,53
warto艣膰 p - value <0,0001
Wniosek:
Poniewa偶 poziom istotno艣ci jest wi臋kszy od prawdopodobie艅stwa testowego odrzucamy hipotez臋 H0 na korzy艣膰 H1; stwierdzamy te偶, 偶e istnieje liniowy zwi膮zek pomi臋dzy badanymi cechami.
2.4. Regresyjna i resztowa suma kwadrat贸w
Regresyjna suma kwadrat贸w (MODEL): 8416.39796
Resztowa suma kwadrat贸w (ERROR): 568.77446
Wniosek:
Dopasowanie modelu jest odpowiednie, poniewa偶 resztowa suma kwadrat贸w jest mniejsza od regresyjnej sumy kwadrat贸w.
Istnieje liniowy zwi膮zek (y=0,071*obroty+22,261) mi臋dzy badanymi cechami (wraz ze wzrostem obrot贸w wzrastaj膮 koszty transportu.
Wykres punktowy z wstawion膮 lini膮 trendu dla zale偶no艣ci K_TRANS = f(OBROTY)
Wykres obrazuje zwi膮zek pomi臋dzy zmiennymi (obroty, a koszty). 艁atwo zauwa偶y膰, 偶e wzrostowi warto艣ci jednej zmiennej odpowiada wzrost warto艣ci drugiej zmiennej, co 艣wiadczy o korelacji dodatniej. Punkty na wykresie tworz膮 tzw „smug臋”, kt贸ra uk艂ada si臋 wzd艂u偶 linii prostej, tak wi臋c mo偶emy dopasowa膰 do niej funkcj臋 liniow膮, kt贸r膮 mo偶na opisa膰 zale偶no艣ci膮: Y = mX+b.
Po艂o偶enie prostej na p艂aszczy藕nie okre艣laj膮 obie sta艂e m i b funkcji Y = mX+b, zwanej liniow膮 funkcj膮 regresji, co 艣wiadczy o tym, 偶e istnieje liniowy zwi膮zek (y=0,071*obroty+22,261) mi臋dzy badanymi cechami (wraz ze wzrostem obrot贸w wzrastaj膮 koszty transportu).
3. Prognozowanie:
Celem badania by艂o okre艣lenie prognozy cechy Y dla wartosci X r贸wnej 500 oraz oszacowanie b艂臋du prognozy.
3.1 Prognoza:
Y=m*X+b
gdzie:
X= 500 tys.z艂.
m = 0,07105
b = 22,2613
Y=57,7863ty艣.z艂.
B艂膮d prognozy:
B艂膮d prognozy w punkcie x wyznaczono wed艂ug poni偶szego wzoru:
gdzie:
n =29
x=500 tys.z艂.
tys.z艂.
tys.z艂.
tys.z艂.
tys.z艂.
BP(500)= 4,674286 tys.z艂.
B艂膮d prognozy wynosi 4,674286 tys.z艂.