Wyklad3(korelacja2014teoria3 zadania3)


Wykład 3.
Analiza korelacji
(część 3)
Korelacja wieloraka  wielu zmiennych
3 zmienne (cechy): x1 , x2 oraz yi
ćð
co to za parametr?
x2
[1]
[1] [4]
x1
[2]
[3]
Åšð Žð
co to za parametr? co to za parametr?
[1]
[4]
[1] [3] [1]
y
[1] [2] [3] [4] [1] [2] [3] [4]
Współczynnik korelacji wielorakiej
2 2
Ry.x x2 1 (1 ryx )(1 ryx .x1 )
1 1 2
2 2
ryx ryx 2 ryx ryx rx x2
1 2 1 2 1
Ry.x x2
1
1 rx2x
1 2
Przyjmuje wartości od 0 do 1  informuje tylko o sile zależności
Korelacja całkowita
r yx1
ryx ryx rx x2
1 2 1
r yx2
ryx .x2
1
2
(1 ryx )(1 rx2x )
2 1 2
Korelacja czÄ…stkowa
ryx ryx rx x2
r yx1 . x2
2 1 1
ryx .x1
2
2
r yx2 . x1
(1 ryx )(1 rx2x )
1 1 2
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż między
sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
18000 18000
16000 16000
14000 14000
12000 12000
10000
10000
8000 8000
6000 6000
4000 4000
2000
2000
0 0
0 2000 4000 6000 8000 0 1000 2000 3000 4000 5000
Sprzedaż czarnych T-shirtów (w szt.)
Sprzedaż białych T-shirtów (w szt.)
4500
4000
3500
3000
2500
2000
1500
1000
500
0
0 2000 4000 6000 8000
Sprzedaż białych T-shirtów (w szt.)
Zysk firmy
Zysk firmy
Sprzedaż czarnych T-shirtów
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż między
sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
0
0
0
8
1
0
0
0
6
1
0
0
0
4
1
Z
0
0
y
0
2
s
1
k
f
i
r
m
0
0
0
0
y
1
(
z
Å‚
)
0
0
0
8
0
0
0
6
0
0
5
4
0
0
8
0
0
4
0
0
0
7
0
0
5
T
0
3
0
-
s
6
h
0
0
i
0
r
0
0
t
0
3
c
5
z
0
a
0
)
0
r
0
.
n
t
0
5
z
y
2
4
s
0
(
s
w
0
0
p
0
ż
0
r
a
0
3
z
d
2
0
e
e
0
d
z
r
0
a
0
p
0
ż
2
s
5
(
0
1
w
0
y
Å‚
0
a
s
i
0
1
z
b
0
0
t
t
0
r
.
i
0
)
1
h
0
s
-
0
0
T
0
5
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż między
sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
Współczynnik korelacji wielorakiej
2 2
Ry.x x2 1 (1 ryx )(1 ryx .x1 )
1 1 2
2 2
ryx ryx 2 ryx ryx rx x2
1 2 1 2 1
Ry.x x2
1
1 rx2x
1 2
Przyjmuje wartości od 0 do 1  informuje tylko o sile zależności
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż
między sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
Korelacja całkowita
r yx1
ryx ryx rx x2
1 2 1
r yx2
ryx .x2
1
2
(1 ryx )(1 rx2x )
2 1 2
Korelacja czÄ…stkowa
ryx ryx rx x2
r yx1 . x2
2 1 1
ryx .x1
2
2
r yx2 . x1
(1 ryx )(1 rx2x )
1 1 2
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż między
sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
ANALIZA REGRESJI wielu zmiennych
Funkcja regresji opisująca wpływ zmiennych x1 i x2 na zmienną y
ma postać:
w a0 a1x1 a2 x2
ryx ryx rx x2 sy ryx ryx rx x2 sy
1 2 1
2 1 1
a0 y a1 x a2 x
1 2 a1 a2
1 rx2x sx 1 rx2x sx
1 2 1 1 2 2
Parametr a1 informuje o ile średnio zmieni się zmienna Y,
gdy zmienna X1 wzrośnie o jednostkę,
przy założeniu braku zmian zmiennej X2
Y = 6 121,21 + 1,22*X1 + 0,85*X2
> 18000
< 17000
< 15000
< 13000
< 11000
< 9000
< 7000
0
0
0
2
2
0
0
0
0
2
0
0
0
8
1
0
0
0
6
1
Z
y
0
0
s
0
4
1
k
f
i
r
0
0
m
0
2
1
y
(
0
z
0
0
Å‚
0
)
1
0
0
0
8
0
0
0
6
0
0
5
4
0
0
8
0
0
4
0
0
0
7
0
0
T
5
0
3
-
0
s
6
h
0
0
i
r
0
0
t
0
0
c
3
5
z
0
a
0
)
0
.
r
0
t
n
0
5
z
y
2
4
s
0
(
w
s
0
0
p
0
ż
0
r
a
0
3
z
d
2
0
e
e
0
z
d
r
0
0
a
p
0
2
ż
s
5
0
(
1
0
w
y
Å‚
0
a
i
s
0
1
b
0
z
0
0
t
t
0
r
1
.
i
)
0
h
0
s
-
0
T
0
5
Zadanie 1. Zbadano jak kształtowała się sprzedaż T-shirtów (białych i czarnych)
produkowanych przez pewną firmę odzieżową oraz jaki był zysk tej firmy
w ostatnich 8 miesiÄ…cach:
Sprzedaż białych Sprzedaż czarnych
y x1 x2
Zysk (w zł) T-shirtów (x1)  T-shirtów (x1) 
10 0000 28 000 20 000
Suma
w sztukach w sztukach
12 500 3 500 2 500
Åšrednia
11 000 2 000 4 000
Odchylenie
3 082 1 871 1 118
standardowe
14 000 5 000 2 000
11 000 3 000 1 000
15 000 5 000 3 000
Macierz korelacji:
13 000 2 000 3 000
y x1 x2
6 000 1 000 1 000
1 0,87 0,62
y
13 000 3 000 2 000 1 0,42
x1
1
x2
17 000 7 000 4 000
a) określ siłę współzależności między wszystkimi cechami jednocześnie,
b) czy można przyjąć, że korelacja między sprzedażą białych T-shirtów a zyskiem jest silniejsza niż między
sprzedażą czarnych T-shirtów a zyskiem?
c) sprzedaż którego koloru T-shirtów, przeciętnie rzecz biorąc, przynosi większy zysk?
d) oszacuj zysk przy sprzedaży 3 000 sztuk białych oraz 6 000 czarnych T-shirtów,
e) w jakim stopniu zmienność sprzedaży obu typów koszulek determinuje zysk?
f) czy model regresji jest dopuszczalny?
OCENA STOPNIA DOPASOWANIA FUNKCJI REGRESJI
1. Odchylenie standardowe reszt (składnika resztowego) 
o ile średnio na +/- odchylają się wartości empiryczne od teoretycznych
(yi wi )2
SSy) R2
(y ssy 11 R2
y S(y)
n k
d R2 100
2. Współczynnik determinacji 
w jakim stopniu model (f. regr.) wyjaśnia wpływ zmiennych X na Y
2
100% d
3. Współczynnik indeterminacji 
jaka część wpływu zmiennych X na Y nie została objaśniona za pomocą modelu
4. Współczynnik zmienności resztowej 
S( y)
jaką część średniego Y stanowi odchylenie Sy  W 100
y
model jest dopuszczalny gdy Wy 20%
Zadanie 2)
W wyniku badania przeprowadzonego wśród pracowników pewnej firmy ustalono,
iż współczynniki korelacji całkowitej Pearsona wynoszą:
 między wiekiem a czasem efektywnej pracy: +0,9
 między wiekiem a płacą: +0,8
 między płacą a czasem pracy: +0,85
Przeciętny wiek jest równy 40 lat, przeciętny efektywny czas pracy 6 godzin
zaś przeciętna płaca wynosi 3500 zł
Odchylenie standardowe płacy wynosi 500 zł, odchylenie standardowe czasu pracy
1 godz., a odchylenie stand. wieku 5 lat
a) Określ siłę i kierunek związku między wiekiem a pensją z wyłączeniem wpływu
czasu efektywnej pracy
b) Oszacuj pensję pracownika, który ma 67 lat a jego efektywny czas pracy wynosi
8 godzin


Wyszukiwarka

Podobne podstrony:
Wyklad3(korelacja2014teoria2 zadania2)
Wykład 1 Rola i zadania inżynieri materiałowej
10 Funkcje wykładnicze i logarytmiczne, zadania powtórzeniowe przed maturą
Wyklad nr 2 zadania
Wyklad 8 KORELACJA ZM LOSOWYCH In Ekol
Wykład nr 4 zadania
wyklad 3 korelacja
Wyklad3(korelacja1)
Wykład nr 8 zadania
Wykład Logistyka Zadania, rozwĂlj
Wykład 2 Środowisko pracy pojęcia i zadania
zadania korelacje
Wykład 1 Metoda geometryczna i zadania dualne
wyklad 2 Spektrometria nas slajdy i zadania
Przykładowe zadania Kolokwium wykładowe i zaliczenie ćwiczeń sem II

więcej podobnych podstron