• współczynnik determinacji:
R2 =1-M = o,9941.
102
Wartość ta jest bliska 1, więc dopasowanie funkcji regresji do danych empirycznych jest bardzo dobre. Zmienność wydajności pracy została wyjaśniona przez badaną regresję aż w 99,41%.
Miary dopasowania funkcji regresji do danych empirycznych znajdują się wśród składników wydruku analizy regresji wykonanej przy pomocy polecenia Execl Analiza Danych, zaprezentowanego w poprzednim przykładzie. Można je jednak obliczyć również w standardowej wersji Exccla, gdyż znajdują się wśród funkcji statystycznych. Średni błąd szacunku oblicza się przy pomocy funkcji REGBLSTD, a współczynnik determinacji przy pomocy R.KWADRAT. Wystarczy w tym celu jedynie wprowadzić zakres komórek z obserwacjami zmiennych A i Y.
Właściwie wyspecyfikowana, tzn. poprawna merytorycznie i dobrze dopasowana do danych empirycznych, funkcja regresji może posłużyć do przewidywania wartości jednej zmiennej przy znanym poziomie drugiej. Warunkiem jest jednak, aby relacje między zmiennymi nic uległy znacznym zmianom, np. pod wpływem nieprzewidzianych, losowych okoliczności. Ponieważ jednak funkcja regresji z jedną zmienną niezależną stanowi bardzo mocne uproszczenie rzeczywistości, również prognozy dokonywane są nieco „na wyrost".
Przykład 6.4.
Na podstawie oszacowanej w przykładzie 6.2. funkcji regresji wydajności pracy odpowiedz na pytanie, jakiej wydajności można się spodziewać u pracownika o stażu dwunastoletnim?
Rozwiązanie
Oszacowana funkcja regresji wydajności pracy pracowników firmy OLA ma następującą postać: yt = 8,5 + 1,3*,. Interesuje nas, jaką wydajność może osiągnąć pracownik z dwunastoletnim stażem (X? = 12). Prognozę tę wyznaczymy podstawiając do równania regresji xp= 12. Mamy zatem:
y, =8,5 + 1,3- 12 = 8,5 + 15,6 = 24,1 szt/h.
Oznacza to, że po pracowniku z dwunastoletnim stażem można się spodziewać, że w ciągu godziny wyprodukuje średnio 24,1 sztuk wyrobu. Nasze szacunki są obarczone pewnym błędem, który przyjmujemy na poziomie średniego błędu szacunku. Zatem uwzględniając jego wartość do otrzymanego wyniku dodamy i odejmiemy 0,27 szt./h, otrzymując w ten sposób (23,83; 24.37). Oznacza to, że omawiany pracownik może wyprodukować od 23 do 25 szt./h.
Współczynnik korelacji rang Spearmana służy do badania zależności dwóch cech przedstawionych w szeregu korelacyjnym. Cechy te mogą być mierzalne lub niemierzalne, jeśli niemierzalne to tylko takie, które można uporządkować. Liczba badanych jednostek powinna być nieduża.
Załóżmy, że badamy N jednostek ze względu na dwie cechy. Jednostki te można więc uporządkować ze względu na obie cechy, tzn. można je uszeregować według rosnącego lub malejącego znaczenia danego wariantu cechy (np. wykształcenie można uporządkować w następujący sposób: podstawowe, zawodowe, średnie, wyższe). Kolejnym uporządkowanym wariantom cechy można nadać kolejne numery, które określa się mianem rang. Procedurę nadawania rang nazywa się rangowaniem.
Współczynnik korelacji rang Spearmana wyznacza się z następującego wzoru:
(6.13)
gdzie: di oznaczają różnice między rangami odpowiadających sobie wartością iyjy tzn. rangami cech X i Y dla poszczególnych jednostek badania.
W sytuacji, gdy kilka jednostek badania ma takie same warianty cechy (np. jest kilka osób z wykształceniem zawodowym czy wyższym), rangi ustalane są wówczas jako średnia z kolejnych pozycji, na jakich znalazły się jednostki badania posiadające dany wariant cechy (np. jeśli mamy trzy osoby z wykształceniem podstaw-owym, które w uporządkowanym szeregu zajmują pozycję pierwszą, drugą i trzecią, ranga
dla wszystkich tych osób będzie taka sama i wynosić będzie: * - = 2).
Współczynnik korelacji rang przyjmuje wartości z przedziału [-1:1]. Im wartości tego miernika jest bliższa -1, tym silniejsza ujemna korelacja między badanymi cechami, z kolei im bliższy +1 tym silniejsza korelacja dodatnia. Wartości bliskie zero wskazują na słabą zależność. Współczynnik ten jest miarą symetryczną, tzn. zależność Y od Xjest taka sama jak X od Y.
Sposób wyznaczania współczynnika korelacji rang Spearmana zaprezentujemy dla dwóch sytuacji, wf których zalecane jest jego stosowanie. Przykład 6.5. dotyczy badania zależności dwóch cech mierzalnych, zaś przykład 6.6. - przypadku dwóch cech, z których jedna jest mierzalna, a druga niemierzalna.
Przykład 6.5.
Na podstawie danych zawartych w tablicy 6.4. ustal przy pomocy współczynnika korelacji rang Spearmana, czy istnieje zależność między emisją zanieczyszczeń powietrza dwutlenkiem węgla a liczbą ludności w krajach UE i Polsce w 1999 roku.
175