ANALIZA KORELACJI - ewentualne zadania na egzamin
Zadanie 1. Na podstawie 27-elementowej próby (N=27) gospodarstw domowych zbadano zależność między wydatkami na pewien artykuł (Y) a liczbą domowników (X). Otrzymano następującą funkcję regresji y^ = 10,5 − 0,7 x. Równocześnie wiadomo, że odchylenie standardowe składnika resztowego Sy = 0,7 a odchylenie standardowe zmiennej X wynosi 1,3 (σx). Określ kierunek i siłę badanego związku.
Ze wzoru na parametr by (który wynosi -0,7) oraz na Sy otrzymujemy układ równań z którego znajdziemy rxy
Zadanie 2. Badanie zależności między liczbą braków (Y - w szt.) przy produkcji pewnego detalu a stażem pracy (X) 15 pracowników dało następujące rezultaty:
średni staż wynosił 10 lat (Xśr)
liczba braków w 30% zależy od innych czynników poza stażem pracy (φ2=30%)
gdy staż pracy wzrośnie o 1 rok to liczba braków maleje średnio o 3 sztuki (by = -3)
teoretycznie biorąc, przy liczbie braków równej 0 sztuk, staż pracy wynosi 13 lat (ax=13)
Określ kierunek i siłę tego związku i ustal przy jakim stażu liczba braków wyniesie 20 sztuk.
Najpierw liczymy współczynnik determinacji d a z niego rxy
Potem mając rxy i by obliczymy bx
Następnie ze wzory na ax szukamy Yśr i na koniec liczymy bx
Na koniec mając daną funkcję regresji y^=ay+byx szukamy przy jakim x y^=20
Zadanie 3. W pewnym porcie dla 10 lat zebrano informacje o wysokości przeładunku (X - w mln ton) i jego kosztach (Y - w tys. zł). Okazało się, że:
przeciętna wielkość przeładunku wynosiła 1,1 mln ton, a odchylenie standardowe 0,4 mln ton (Xśr=1,1 σx=0,4)
łączne koszty przeładunku wynosiły 400 tys. zł (Σy=400)
koszty przeładunku w 70% zależą od wysokości przeładunku, przy czym wiadomo, że im większy przeładunek tym większe koszty (d=70%)
odchylenie standardowe składnika resztowego dla funkcji opisującej wpływ wysokości przeładunku na jego koszty jest równe 1,2 tys. zł (Sy=1,2)
Określ kierunek i siłę tego związku i ustal przy jakim przeładunku koszty wyniosą 60 tys. zł.
Ze współczynnika determinacji d wyznaczamy rxy
Dzieląc sumę Y przez N=10 otrzymujemy Yśr
Ze wzoru na Sy obliczamy σy
Potem wyznaczamy funkcję regresji i sprawdzamy dla jakiego x y^=60
Zadanie 4. Badanie zależności między dochodami 100 gospodarstw rolnych (Y) a ich powierzchnią (X) dało następujące wyniki:
związek między tymi zmiennymi opisuje funkcja regresji y^ = -24 + 43 x
rozkład powierzchni jest symetryczny a najwięcej gospodarstw miało powierzchnię 11,1 ha (czyli Mo=11,1 i jednocześnie Xśr=11,1 i Me=11,1)
99,7% gospodarstw miało powierzchnię od 5,55 do 16,65 ha (jest to reguła 3-sigm czyli Xśr−3σx=5,55 a Xśr+3σx=16,65 - z tego obliczamy σx)
zróżnicowanie dochodów wynosiło 102 tys. zł (czyli σy)
Określ kierunek i siłę zależności oraz oszacuj dochody gospodarstwa 20-hektarowego.
Korzystamy ze wzoru na by w którym występuje rxy a potem stawiamy prognozę