KORELACJE
Zadanie 1
Tab. 1. Pomiary długości i szerokości muszli małża [cm] |
||
Numer muszli |
długość muszli |
szerokość muszli |
1 |
13,2 |
8,4 |
2 |
11,8 |
7,4 |
3 |
11,2 |
7,0 |
4 |
13,2 |
8,4 |
5 |
11,2 |
7,2 |
6 |
13,7 |
8,2 |
7 |
13,4 |
8,2 |
8 |
11,3 |
7,5 |
9 |
12,5 |
7,7 |
10 |
12,8 |
7,9 |
11 |
11,8 |
7,4 |
12 |
11,2 |
7,0 |
13 |
12,3 |
7,5 |
Zmierzono długość i szerokość 13 muszli małża. Sprawdź czy istnieje związek pomiędzy tymi dwoma zmierzonymi cechami. Czy korelacja jest dodatnia czy ujemna (co to oznacza)? Jaka jest siła korelacji? Czy korelacja jest istotna? Do obliczeń wykorzystaj wzory n obliczanie kowariancji, korelacji, statystyki F.
W sprawozdaniu
Krótko opisz zadanie - problem
Podaj wartości statystyk podstawowych
Podaj wzory i wartości obliczonych statystyk: kowariancji i korelacji.
Podaj wartość obliczonej statystyki F
Podaj wartość odczytaną z tablic wartości krytycznych rozkładu F wraz z poziomem istotności
Podaj interpretację testu (porównanie wartości odczytanej z tablic z wartością obliczoną)
Podaj wyniki uzyskane przy użyciu odpowiednich narzędzi Excela. Spróbuj ustalić z czego mogą wynikać różnice w wynikach obliczonych metoda konwencjonalną i przy użyciu Excela? Według jakich wzorów były obliczane statystyki w Excelu?
PRZY OBLICZANIU POSZCZEGÓLNYCH PARAMETRÓW UZYWAJ ARKUSZA KALKULACYJNEGO EXCELA (mnożenie kolumn, kopiowanie formuł, wartości statystyki obliczone przy użyciu „Narzędzia/ analiza danych / statystyka opisowa” itd)
Uzyskane wyniki porównaj z wynikami uzyskanymi przy wykorzystaniu narzędzia Excela jakim jest
Narzędzia / analiza danych / kowariancja
Narzędzia / analiza danych / korelacja
Narzędzia / analiza danych / regresja
Wzory pomocnicze
n - liczba pomiarów
- wartości średnie
Xi, Yi - wartości pomiarów
sx , sy- odchylenia standardowe
Kowariancja Sxy - wzór dla małych liczebności
gdzie X1, Y1 - wartości pomiarów w danej parze
- średnia
Współczynnik korelacji liniowej Persona r
Przybliżone określenie stopnia zależności cech w zależności od wartości współczynnika korelacji liniowej Pearsona r
rxy== 0 brak korelacji
0 ≤ rxy < 0,1 korelacja nikła
0,1 ≤ rxy < 0,3 korelacja słaba
0,3 ≤ rxy < 0,5 korelacja przeciętna
0,5 ≤ rxy < 0,7 korelacja wysoka
0,7 ≤ rxy < 0,9 korelacja bardzo wysoka
0,9 ≤ rxy < 1 korelacja prawie pełna
Statystyka F
gdzie r- współczynnik korelacji Pearsona
N - liczba par pomiarów
Obliczmy wartości statystyki F. Odczytujemy krytyczną wartość F dla poziomu istotności 0,05 z tablic „Wartości krytycznych rozkładu F”. Przy korzystaniu z tablic zakładamy, iż liczba stopni swobody dla wariancji większej wynosi df=1 a liczba stopni swobody dla wariancji mniejszej wynosi df= N-2.
Jeżeli wartość F odczytana z tablic wartości krytycznych rozkładu F jest mniejsza od obliczonej przez nas to korelacja jest istotna statystycznie
Jeżeli wartość F odczytana z tablic wartości krytycznych rozkładu F jest większa od obliczonej przez nas to korelacja jest nieistotna statystycznie
Analiza istotności korelacji w Excelu
Narzędzia / Analiza danych/ Regresja
W uzyskanych wynikach odszukujemy wartość „Istotności F' Jeżeli Istotność F jest mniejsza od założonego przez nas poziomu istotności 0,05 (lub 0,01) to korelacja jest istotna statystycznie
Jeżeli wartość „Istotności F” jest większa od przyjętego przez nas poziomu istotności np. 0,05 to korelacja jest nieistotna statystycznie