■W
")
Rysunek 3.11: Wykres mozaikowy mosa-icplot() dla trzech zmiennych: praca, wykształcenie i płeć.
Wybrane procedury statystyczne
poszczególnych zmiennych. Można to zmienić modyfikując argument boxplots, podając boxplots="x" powodujemy, że wykres pudełkowy rysowany jest tylko osi x. W bibliotece car znajduje się alias funkcji s.catterplotO o krótszej sp(car) ale identycznym działaniu.
Do wykresu rozrzutu można dorysować prostą regresji liniowej (prosta jest wana w zależności od wartości argumentu reg.linę, wartość FALSE wyłącza rysóJ wanie prostej regresji, domyślnie reg.line=TRUE) oraz krzywą regresji nieparametrycznej (krzywa jest rysowana w zależności od wartości argumentu smooth, wi FALSE wyłącza rysowanie tej krzywej, domyślna wartość to smooth=TRUE). W pr, zentowanyrn przykładzie (rysunek 3.10) wykres rozrzutu dla dwóch zmiennych (ei| śnienia skurczowego i rozkurczowego) został przedstawiony w dwóch podpoj określonych przez zmienną pleć. Na wykresie rozrzutu możemy zobaczyć, czy jj jakaś zależność pomiędzy badanymi zmiennymi i czy ta zależność jest taka san czy różna w podpopulacjach.
Wykresy rozrzutu są bardzo przydatne do wykrywania i opisywania zależności li-: niowych lub monofonicznych pomiędzy parą zmiennych. Dla dużej liczby obserwacji' H można z wykresów rozrzutu odczytać też bardziej skomplikowane zależności pomię- : dzy zmiennymi. Do wyznaczenia wykresów rozrzutu pomiędzy większą liczbą zmiennych można wykorzystać funkcje pairs(graphics), scatterplot .matrix(car) i gpairs(YaleToolkit) przedstawione w rozdziale 4.1.11. Poniżej prezentujemy 7 przykład wywołania funkcji scatterplotO (a dokładniej jej aliasu spO), efekt graficzny jest przedstawiony na rysunku 3.10.
library(ęar)
tt wykres rozrzutu osobno dla każdej pici sp(cisnienie.skurczowe, ciśnienie.rozkurczowe, groups=plec, smooth*F lwd-3, pch-c(20,21), cex”1.5)
tt wykres rozrzutu bez podziału na płcie i bez krzywej regresji sp(ciśnienie.skurczowe, ciśnienie.rozkurczowe, smooth=F, reg.line=F)
Parametry pch i cex to parametry graficzne regulujące kształt i wielkość rysowanych punktów. Będą one omówione później przy okazji szczegółowszego omawiania grafiki.-M
3.1.2.6 Wykres mozaikowy, funkcja: mosaicplot(graphics)
Odpowiednikiem wykresu rozrzutu dla zmiennych typu wyliczeniowego, do graficz^|S nego przedstawiania tablic wielodzielczych, posłużyć się można wykresem mozai-kowym. Na wykresie mozaikowym liczebności odpowiednich kombinacji poziomów'-;?; poszczególnych zmiennych reprezentowane są przez pola poszczególnych obszarów-Wynik poniższego wywołania można zobaczyć na rysunku 3.11.
> tt wykres mozaikowy dla trzech, zmiennych
> mosaicplot("praca+wyksztalcenie+plec, data“dane,main=l1
> tt inny zapis równoważny powyższemu wywołaniu
> mosaicplot(table(praca, wykształcenie, piec), main-"")
Statystyki opisowe
Balloon Plot for x by y. Area Is proportional to Freq.
Rysunek 3.12: Wykres balonowy baloon-plot() dla zmiennych wykształcenie i pleć.
: Z wykresu mozaikowego można odczytać informację o interakcjach pomiędzy
zmiennymi. Przy zupełnym braku zależności, poszczególne prostokąty powinny tworzyć regularną macierz wierszy i kolumn. Na przykładowym rysunku prostokąt odpowiadający liczbie pracujących kobiet z wykształceniem zawodowym jest znacznie ; -większy niż wynikałoby to z częstości występowania kobiet, osób pracujących i osób :j4r wykształceniem zawodowym. Sugeruje to pewną zależność we współwystępowa-niu wymienionych czynników. Na jednej mozaice można umieścić wyniki dla więcej niż dwóch zmiennych typu wyliczeniowego, należy jednak uważać, bowiem umieszczenie bardzo wielu zmiennych lub zmiennych o bardzo wielu poziomach znacząco żrriniejsza czytelność i przydatność tego wykresu.
Pierwszym parametrem funkcji mosaicplot O może być formuła (tak jak w pierwszym z powyższych przykładów) lub macierz kontyngencji będąca wynikiem funkcji tableO (tak jak w drugim przykładzie).
3.1.2.7 Wykres balonowy, funkcja: balloonplot(gplots)
Wykres balonowy baloonplot(gplots) jest jedną z alternatyw dla wykresu mozaikowego mosaicplot (). Liczebność poszczególnych kombinacji czynników jest reprezentowana przez powierzchnie kół a nie prostokątów. Dodatkowo na wykresie balonowym rysowane są też odpowiednie liczebności brzegowe.
Wynik poniższego wywołania zobaczyć można na rysunku 3.12.
> balloonplot(table(piec, wykształcenie), colsrt=90, dotcolor«"orange")
Pierwszym argumentem funkcji balloonplotO może być macierz kontyngencji ’ (jak w powyższym przykładzie) lub też lista zmiennych do wizualizacji. Na wykresie balonowym zamiast liczebności można też przedstawiać średnie lub inne statystyki ' Wyznaczone w podgrupach.
137