ANALIZA KORELACJI - zadania przed egzaminem (4)
Zadanie 1. Współczynnik korelacji liniowej Pearsona między liczbą sprzedanych biletów na koncert, a popularnością występującego piosenkarza wynosi 0,6. Jaką część całkowitej zmienności liczby sprzedanych biletów wyjaśniają nie uwzględnione w badaniu czynniki? Jak nazywa się potrzebny do obliczenia parametr?
Należy wyznaczyć współczynnik indeterminacji ϕ2
Zadanie 2. Współczynnik korelacji liniowej Pearsona między wartością sprzedaży hot-dogów a średnią temperaturą dnia wynosi -0,7. Jaką część całkowitej zmienności wartości sprzedaży wyjaśnia temperatura? Jak nazywa się ten parametr?
Należy wyznaczyć współczynnik determinacji d
Zadanie 3. Wpływ wynagrodzeń (X - w tys. zł) na wydajność pracowników (Y - w sztukach na godzinę) przedstawia funkcja regresji o postaci:
y^ = 25 + 3,8 x
Na podstawie ankiet przeprowadzonych wśród 100 pracowników ustalono, że:
• średnie wynagrodzenie wynosi 4,2 tys. zł
• średnia wydajność wynosi 39 szt./godz.
• odchylenie standardowe wynagrodzeń jest równe 2,1 tys. zł
• współczynnik zmienności dla wydajności jest równy 31%
Znając powyższe informacje:
a) oblicz siłę i kierunek zależności pomiędzy badanymi zmiennymi
Ze wzoru na współczynnik zmienności Vy (31%) ustalamy odchylenie standardowe sy
Następnie ze wzoru na by (0,8) z metody pośredniej obliczamy współczynnik korelacji rxy
b) wyznacz równanie regresji x^
Z metody pośredniej
c) jakiej wydajności należy oczekiwać przy wynagrodzeniu 5,1 tys. zł
Podstawiamy x=5,1 do podanej funkcji y^ i pamiętamy o uwzględnieniu średniego błędu prognozy Sy (który wcześniej trzeba policzyć)
Zadanie 4. Przeprowadzono badanie zależności między miesięczną produkcją mebli (X - w szt.) a zużyciem energii (Y - w kWh). Przeciętna produkcja mebli wyniosła 600 sztuk, a przeciętne zużycie energii 160 kWh. Współczynnik zmienności dla produkcji mebli jest równy 30% a względna dyspersja dla zużycia energii 25%. Współczynnik korelacji liniowej Pearsona między tymi zmiennymi wynosi 0,80.
Na podstawie powyższych informacji:
a) wyznacz obie teoretyczne linie regresji
Z metody pośredniej - wcześniej trzeba znać odchylenia standardowe obu zmiennych, które wyliczymy ze współczynników zmienności (czyli względnej dyspersji) Vx=30% oraz Vy=25%
b) oszacuj zużycie energii potrzebnej do wyprodukowania 1000 mebli
Do funkcji y^=ay+by⋅x w miejsce x wstawiamy 1000 i pamiętamy o średnim błędzie prognozy Sy (który wcześniej trzeba policzyć)
c) czy zmiany wielkości produkcji w znaczącym stopniu determinują zmienność zużycia energii?
Należy obliczyć współczynnik determinacji d i ocenić czy ten wynik jest duży = znaczący (zazwyczaj powyżej 50%)