94 Janusz Buga, Helena Kassyk-Rokicka
dowania odpowiedniej tablicy kombinowanej, zwanej też tablicą korelacyjną. Jeśli taka tablica zawiera dwie cechy XY, dla jej określenia używa się też terminu empiryczny rozkład dwuwymiarowy28. Wartości jednej z dwu cech wpisywane są w tzw. boczku tablicy, zaś drugiej w główce tablicy. Wewnątrz tablicy znajdują się liczebności (częstości), które wskazują na liczbę jednostek posiadających i-ty wariant cechy X oraz j-ty wariant cechy Y29. Częstości te pokazują, u ilu jednostek z ogółu badanych obserwujemy współwystępowanie i-tych oraz j-tych wariantów obu cech jednocześnie. Z punktu widzenia badania powiązań między cechą X i Y częstości te są bardzo ważne.
Załóżmy, że przedmiotem badania statystycznego jest zbiorowość n=100 studentów kierunku statystycznego, badanych ze względu na pozytywne oceny uzyskane na egzaminie końcowym ze statystyki (Y) oraz czas poświęcony na naukę tego przedmiotu w ostatnim dniu przed egzaminem (X w minutach). Fragment zaobserwowanych par punktów (x,-; yj) dla każdego badanego studenta przedstawia tablica 1. Są to dane jednostkowe, gdzie cecha X została uporządkowana od najniższych do najwyższych wartości.
Tabl. 1
i |
1 |
2 |
3 |
«♦« |
99 |
100 | ||
Xi |
3 |
3 |
3 |
5 |
5 | |||
20 |
25 |
140 |
140 |
50 |
Informacje te grupujemy, budując tablicę statystyczną kombinowaną30, w której zamieszczamy liczebności odpowiedniej kombinacji odmian obu cech (patrz tabl. 2). Tablica ta nosi nazwę tablicy korelacyjnej i przedstawia empiryczny rozkład dwuwymiarowy. Każda z liczb
28 Wspomniano już wcześniej, że ograniczamy pole rozważań do badania związków dwóch cech.
29 Oznaczenia cech symbolami X i Y, jak również wskaźników zmienności symbolami „i” oraz, j” są umowne.
10 Zasady tworzenia przedziałów i grupowania omówiono w rozdziale 1.
zamieszczonych wewnątrz tablicy jest cząstką ogólnej liczby zbadanych jednostek n=100 i wskazuje na cząstkową liczebność studentów o określonym poziomie stopnia z egzaminu (y) i jednocześnie o określonym poziomie czasu przeznaczonego na naukę w ujęciu przedziałowym (x0j -X|i).
Tabl. 2. Badani studenci według stopni i czasu nauki
Czas nauki w minutach Xoi - X,f |
Stopnie z egzaminu końcowego y. |
Razem | ||||
3 |
3,5 |
4 |
4,5 |
5 | ||
0-60 |
10 |
2 |
- |
~ |
- |
12 |
60-120 |
8 |
17 |
- |
- |
- |
25 |
120-180 |
- |
10 |
14 |
8 |
2 |
34 |
180-240 |
- |
5 |
7 |
8 |
9 |
29 |
Razem n..j |
18 |
34 |
21 |
16 |
11 |
100 |
Źródło: Opracowanie własne
Przyjmijmy następujące oznaczenia, którymi będziemy się posługiwać w dalszej analizie tablicy korelacyjnej:
- wartości cechy Y (stopnie),
xoi - Xii - przedział klasowy wartości cechy X (czas nauki w minutach),
x. - środek przedziału klasowego cechy X,
n ~ ogółem liczba badanych studentów (100), iły - liczebności cząstkowe z tablicy (podwójna ramka), które odpowiadają konkretnym wartościom x,- cechy X oraz jednocześnie konkretnym wartościom yj cechy Y,
n,. - dla i = 1, 2,..., k liczebności szeregu brzegowego cechy X, n j — dla j = 1,2,1 liczebności szeregu brzegowego cechy Y, y i - średnie warunkowe cechy Y (stopnie),
Xj - średnie warunkowe cechy X (czas nauki),
S- (y) - wariancje warunkowe cechy Y,
Sj (x) — wariancje warunkowe cechy X,