no jest wykryć w przypadku małych wartości N. W praktyce w odnieś;, . wielu zmiennych Stosowanych w psychologii i pedagogice założenie |u;i regresji jest dostatecznie uzasadnione.
Wielkość współczynnika korelacji zależy do pewnego stopnia od jednor..; bądź niejednorodności próby, z której oblicza .się korelację. Rozwa/nw zmienne. X i Y. z wariancjami s; i s; i korelacja niezerową r w próbie pobranej z pewnej populacji. Rozważmy też druga próbę, dobrana w taki ze wariancja jest w niej mniejsza niż y*. Zmienność tej próby jest więc ogra:-.;...-, w zakresie A*. Ograniczenie zmienności w zakresie X zmniejsza wariancję ) korelację między A’ i Y. Wpływ doboru jednozmiennowego. czasami okro-również jako ograniczenie rozstępu, na współczynnik korelacji po raz p. zbadał Karl Pcarson i opisał w 1902 r. w artykule zatytułowanym On ilu■ h>\„ of Natural Selenian on tlie Variabiliiy and Correlatian af Organs |..0 u pi,, doboru naturalnego na zmienność i korelację narządów") Omówienie tego niema można znaleźć w pracy McNemara (1969). Bardziej szczegółowe i ca! wc potraktowanie tematu zawiera książka Thomsona (1950).
Istnieją wzory umożliwiające oszacowanie korelacji między dwiema /nr. mi w próbie nic dobranej, na podstawie znajomości korelacji w próbie do: bądź ograniczonej. Możliwe jest równie/ dokonanie oszacowania odwiuii.. Wzorów tych tu nie podajemy. W praktyce stosuje się je rzadko Pokazuj., jednak wyraźnie, jak dobór w zakresie jednej zmiennej wpływa na współc/;.: korelacji.
Rozpatrzmy pewne dane przykładowe, które pomogą nam zrozumieć nic nic. Weźmy dwa testy, test inteligencji i test osiągnięć w nauce arytmeio Przyjmijmy, żc w nie dobranej próbie wyniki testu inteligencji mają odcini. standardowe równe 16. a korelacja między tymi dwoma teslami wynosi O.SU R wa/my teraz kilka grup. dobranych na podstawie testu inteligencji. Niech ode: lenia standardowe wyników testu inteligencji w tych grupach wynoszą 16. 1-i j 10. 8. 6. 4 i 2. Jak zmniejszająca się zmienność będzie wpływać na korcie; między omawianymi testami w tych grupach? Korelacje te można oszacou... Oszacowania są następujące:
•S» | |
16 |
0.800 |
14 |
0.759 |
12 |
0.707 |
to |
0.640 |
8 |
0.555 |
6 |
0.478 |
4 |
0,318 |
■» |
0.167 |
Wyraźnie widać. Ze wysoki poziom dobom. c/y w ,-rjnK/ l^tłtoWme sanniej*/1 *idkott współczynnik* korelacji
W*zy*cy. którzy posługują mc współczynnikom, korelacu powmm sobie sprawę z Mnmm omÓwicmej (u zaJc/m*, C/c*to numy A. czyniona , <u. nynu wskazujmy mi na istnienie korelacji między wynikam. *u/m /dołrwHo dcmickich bąd/ icMow inteligencji a osiągnięciami studentów * n-KT rt,/nich przedmiotów. Nierzadko korelacje tc vą nnkie Jedna / przyczyn tak**., rzeczy jot fakt. * Mudcnc. którzy zostali przyj*, ru studia.'stanowią grupę b«-dzo suranmc dobraną, czysto na podstawie wyników testu zdołoofci akademickich , testu inteligencji.
Autor zetknął się ostatnio z danymi, będącym, wymk.cm zastosowania boleni testów psychologicznych w kilku różnych grupach wiekowych. Najstarsza grap, składała się z osób starszych Współczynnik, korelacji wyka/ah vyncmaiyczny wzrost wraz z wiekiem. Odchylenie standardowe tych testów w/rasulo tak sany. Jeżeli wzrost korelacji jest tu efektem rzeczywistym i nasze zdolności są coraz bardziej skorelowane ze sobą w miarę upływu lak jcm to odkrycie szczególnie interesujące z punktu widzenia teoretycznego. Jeżeli natomiast ten" w zrost korelacji można przypisać wzrostowi zmienności, to rezultat taki może być artefaktem statystycznym. który należy interpretować zupełnie inaczej
Interpretując bądź wykorzystując współczynnik korelacji, nic musimy koniecznie przyjmować. Ze obie zmienne mają rozkład normalny, aczkolwiek w wielu pracach statystycznych na temat korelacji przyjmuje się założenie rozkładu normalnego. Korelacje można obliczać dla rozkładów prostokątnych, a także dla innych typów rozkładu. Często oblicza się korelacje między zmiennymi mającymi ró/nc Lsztahy rozkładu. Okoliczność ta nakłada na współczynnik korelacji pewne ograniczenia. Jeżeli rozkład skośny dodatnio jest skorelowany /. rozkładem 'kośnym ujemnie, to różnice kształtów tych rozkładów będą wpływać na współczynnik korelacji W pewnej mierze odchylenie współczynnika korelacji od jedności będzie spowodowane różnymi kształtami rozkładów. W takiej sytuacji różnice w kształtach rozkładów będą w rezultacie z całą pewnością wskazywały, ze jedna lub obie linie regresji sa nieliniowe. Raczej skrajny przypadek lego rodzaju efektu ma miejsce, gdy jedna zmienna jest dychotomiczna. czyli przyjmuje tylko dwie wartości, a druga przyjmuje wiele wartości i teoretycznie może być ciagla.
Przykładem zmiennej dwuwartościowej może być /.danie-niczdanie egzaminu na studiach, a przykładem zmiennej wielowartościowej wyniki testu zdolności akademickich. W przypadku lego rodzaju danych korelacje często oblicza się. przypisując dowolnie liczby obu kategoriom zmiennej dwuwartościowej, na przykład I „zdoT. 2 — ..me zdał". Jeżeli tak jest i zostanie obliczony współczynnik według momentu iloczynowego, znaczna różnica między kształtami rozkładów nałoży ogra-
151