Charakterystyki liczbowe, tabelaryczne i graficzne metody prezentacji pary cech (X,Y):
Opracowany materiał statystyczny musi być odpowiednio zaprezentowany. Rozróżniamy trzy sposoby prezentacji: Metoda tabelaryczna,, graficzna, opisowa.
CHARAKTERYTYKI LICZBOWE PARY CECH:
DLA CECH JAKOŚCIOWYCH:
Współczynnik Ф Yule'a: miara korelacji między dwoma zmiennymi jakościowymi w tabeli 2x2, Przyjmuje wartości z przedziału [0,1]., Nie informuje o kierunku zależności, tylko o sile zależności.
Współczynnik V-Cramer'a: miara korelacji między dwoma zmiennymi jakościowymi w tabeli 2x2, Przyjmuje wartości z przedziału [0,1], Nie informuje o kierunku zależności, tylko o sile zależności.
DLA CECH ILOŚCIOWYCH:
Współczynnik r Pearsona: Współczynnik korelacji prostoliniowej,Jest to miara korelacji między cechami ilościowymi, które mają rozkład normalny w populacji generalnej, Przyjmuje wartości z przedziału [-1,1], Informuje o kierunku i sile zależności
Współczynnik determinacji r2 (określoności): Jest to kwadrat współczynnika korelacji, Informuje o tym, jaka część zmian zmiennej objaśnianej (skutek) jest wyjaśniona przez zmiany zmiennej objaśniającej (przyczyna), Po pomnożeniu przez 100, informuje nas jaki % ogólnej zmienności cechy zależnej (y) wyjaśnione jest zmiennością cechy niezależnej (x)
DLA CECH JAKOŚCIOWYCH I ILOŚCIOWYCH:
Współczynnik rang Spearmana: - ρ Jest to miara korelacji między dwoma zmiennymi jakościowymi w skali porządkowej (lub ilościowymi o niewielkiej liczebności), Oblicza się go na podstawie rang, a nie samych wartości, Przyjmuje wartości w przedziału [-1,1], Informuje o kierunku i sile zależności
Skala zależności pomiędzy cechami:
rxy=0 - zmienne nie są skorelowane
0,0 < rxy < - zależność nikła
0,1 ≤ rxy < 0,3 - zależność słaba
0,3 ≤ rxy < 0,5 - zależność przeciętna
0,5 ≤ rxy < 0,7 - zależność wysoka
0,7 ≤ rxy < 0,9 - zależność bardzo wysoka
0,9 ≤ rxy < 1 - zależność prawie pełna
Kierunek zależności:
Kierunek zależności między cechami można określić w przypadku współczynników korelacji, które zmieniają znak.
ξ > 0 - wzrost wartości jednej cechy powoduje również wzrost wartości drugiej cechy dla cech ilościowych
ξ < 0 - wzrost wartości jednej cechy powoduje spadek wartości drugiej cechy dla cech ilościowych.
TABELARYCZNE I GRAFICZNE METODY PREZENTACJI PARY CECH (X, Y):
HISTOGRAMY: Jest to graficzny sposób przedstawienia rozkładu liczebności dla wybranej zmiennej. Należy do wykresów opisujących rozkład cechy mierzalnej w prostokątnym układzie współrzędnych. Jest to zbiór przylegających prostokątów, których: podstawy - równe są rozpiętości przedziałów klasowych, spoczywają na osi odciętych wysokości - są liczebnościami (częstościami) przedziałów Rodzaje: zwykły, histogram podwójny Y , histogram wielokrotny , wiszące słupki , histogram kumulacyjny
Algorytm tworzenia histogramu dla danych przedstawionych w postaci szeregu rozdzielczego przedziałowego:
Zakres wartości danych jest dzielony na rozłączne przedziały takiej samej szerokości.
Dla każdego przedziału rysowane są słupki o wysokości równej liczbie obserwacji (przypadków) w przedziale (kolumny rysowane są nad przedziałami klasowymi.) Środki słupków powinny być równe środkom klas.
Luka w histogramie - jedna z klas jest pusta, szereg rozdzielczy źle zbudowany
WYKRES ROZRZUTU ZMIENNYCH (X, Y): Każdemu punktowi odpowiadają dwie współrzędne (X i Y), które jednoznacznie określają jego położenie. Wykresy tego typu umożliwiają zbadanie zależności pomiędzy zmiennymi. Zmienne powiązane - regularna krzywa, zmienne nie powiązane - nieregularna chmura Rodzaje: zwykły, wielokrotny, podwójny-Y , liczebności , kwantylowy, Voronoi
WYKRES TABLICY KORELACYJNEJ DLA ZMIENNYCH (X, Y): sposób stwierdzania, czy istnienie korelacja między dwiema zmiennymi oraz do graficznego przedstawienia relacji między dwoma zmiennymi (cechami), Zbiór punktów na płaszczyźnie, odpowiadającym zbiorowi par liczb. Na osi odciętych - zmienna niezależna (objaśniająca), na osi rzędnych - zmienna zależna (objaśniana), Punkty umieszczone w takim układzie współrzędnych tworzą mniej lub bardziej wyraźną „smugę”, co daje możliwość wstępnej oceny siły i kierunku zależności. Przykłady
Korelacja liniowa dodatnia - wzrost zmiennej X powoduje wzrost zmiennej Y
Korelacja liniowa ujemna - wzrost zmiennej X powoduje spadek zmiennej Y
Brak korelacji - wzrost zmiennej X nie powoduje zmian zmiennej Y
Korelacja krzywoliniowa
Tablica korelacyjna: liczne obserwacje statystyczne, operowanie wartościami szczegółowymi jest uciążliwe. W celu stwierdzenia istnienia lub braku związku korelacyjnego konstruujemy wówczas tablicę korelacyjną. Na skrzyżowaniu kolumn z wierszami wpisywane są liczebności jednostek zbiorowości statystycznej, u których zaobserwowano jednoczesne występowanie określonej wartości xi i yj.