4Graficzne i tabelaryczne metody prezentacji danych statystycznych:
DIAGRAMY: wykres opisujący rozkład cechy mierzalnej w prostokątnym układzie współrzędnych. Zwany jest inaczej wielobokiem liczebności, łamana powstała przez połączenie punktów o współrzędnych: środki przedziałów oraz odpowiadające im liczebności (lub wskaźniki natężenia liczebności).
Kolumnowe: kolumny pionowe, występują w kilku wariantach, mogą przedstawiać zarówno wartości mianowane jak i procentowe, wykresy słupkowe/kolumnowe prezentują sekwencje wartości, każdemu przypadkowi odpowiada jeden słupek lub kolumna (dla poszczególnych zmiennych), na takim wykresie, dla każdego punktu danych (tzn. pary współrzędnych XY) rysowana jest kolumna łącząca ten punkt z osią X.
Liniowe: linia łamana (lub ciągła), na układzie współrzędnych, zwykle przedstawiają dynamikę zmian w czasie, pojedyncze punkty danych są łączone linią, prosty sposób graficznej prezentacji sekwencji wartości. Typy wykresów liniowych: zwykły, wielokrotny, zagregowany, podwójny Y
Kołowe: mogą przedstawiać tylko wartości procentowe, najczęściej stosowany rodzaj wykresów służących do prezentacji części (udziałów, procentu) pewnej całości., koło - reprezentujące całą zbiorowość dzieli się tak, aby poszczególne wycinki koła były proporcjonalne do liczebności rozróżnionych grup Typy wykresów kołowych: wykres kołowy wartości, wykres kołowy liczności:
TABELARYCZNE I GRAFICZNE METODY PREZENTACJI PARY CECH (X, Y):
HISTOGRAMY: Jest to graficzny sposób przedstawienia rozkładu liczebności dla wybranej zmiennej. Należy do wykresów opisujących rozkład cechy mierzalnej w prostokątnym układzie współrzędnych. Jest to zbiór przylegających prostokątów, których: podstawy - równe są rozpiętości przedziałów klasowych, spoczywają na osi odciętych wysokości - są liczebnościami (częstościami) przedziałów Rodzaje: zwykły, histogram podwójny Y , histogram wielokrotny , wiszące słupki , histogram kumulacyjny
Algorytm tworzenia histogramu dla danych przedstawionych w postaci szeregu rozdzielczego przedziałowego:
Zakres wartości danych jest dzielony na rozłączne przedziały takiej samej szerokości.
Dla każdego przedziału rysowane są słupki o wysokości równej liczbie obserwacji (przypadków) w przedziale (kolumny rysowane są nad przedziałami klasowymi.) Środki słupków powinny być równe środkom klas.
Luka w histogramie - jedna z klas jest pusta, szereg rozdzielczy źle zbudowany
WYKRES RAMKA-WĄSY: wykres pokazujący zakresy wybranej zmiennej (zmiennych) oraz statystyki opisowe (średnia, mediana, odchylenie standardowe lub błąd standardowy). Na wykresie mogą również być wykreślone odstające punkty danych. Interpretacja:
Ramka - miara zmienności (błąd standardowy, odchylenie standardowe, min-maks lub stała)
Wąsy - miara zmienności
Punkt środkowy - miara centralnej tendencji (średnia lub mediana)
WYKRES ROZRZUTU ZMIENNYCH (X, Y): Każdemu punktowi odpowiadają dwie współrzędne (X i Y), które jednoznacznie określają jego położenie. Wykresy tego typu umożliwiają zbadanie zależności pomiędzy zmiennymi. Zmienne powiązane - regularna krzywa, zmienne nie powiązane - nieregularna chmura Rodzaje: zwykły, wielokrotny, podwójny-Y , liczebności , kwantylowy, Voronoi
WYKRES TABLICY KORELACYJNEJ DLA ZMIENNYCH (X, Y): sposób stwierdzania, czy istnienie korelacja między dwiema zmiennymi oraz do graficznego przedstawienia relacji między dwoma zmiennymi (cechami), Zbiór punktów na płaszczyźnie, odpowiadającym zbiorowi par liczb. Na osi odciętych - zmienna niezależna (objaśniająca), na osi rzędnych - zmienna zależna (objaśniana), Punkty umieszczone w takim układzie współrzędnych tworzą mniej lub bardziej wyraźną „smugę”, co daje możliwość wstępnej oceny siły i kierunku zależności. Przykłady
Korelacja liniowa dodatnia - wzrost zmiennej X powoduje wzrost zmiennej Y
Korelacja liniowa ujemna - wzrost zmiennej X powoduje spadek zmiennej Y
Brak korelacji - wzrost zmiennej X nie powoduje zmian zmiennej Y
Korelacja krzywoliniowa
Tablica korelacyjna: liczne obserwacje statystyczne, operowanie wartościami szczegółowymi jest uciążliwe. W celu stwierdzenia istnienia lub braku związku korelacyjnego konstruujemy wówczas tablicę korelacyjną. Na skrzyżowaniu kolumn z wierszami wpisywane są liczebności jednostek zbiorowości statystycznej, u których zaobserwowano jednoczesne występowanie określonej wartości xi i yj.