Wybrane procedury statystyczne
Statystyki opisowe
Tabela 3.1: Statystyki opisowe dla n-elementowego wektora x (pierwszy argument wyvi mienionych funkcji)
Na przykładzie zmiennej wiek przedstawimy wybrane statystyki opisowe.Zmienna fetfiek jest kolumną ramki danych daneSoc, ale ponieważ użyliśmy funkcji attachO Sie musimy podawać nazwy tej ramki danych odwołując; się do jej kolumn.
max(base) |
Wartość maksymalna w próbie. |
min(base) |
Wartość minimalna w próbie. |
mean(stats) |
Średnia arytmetyczna, wyznaczona ze wzoru x | Xi/n. Nieobowiązkowym argmnentem tej funkcji jest % trim. Jeżeli wartość tego argumentu jest różna od zera, t<> . wyznaczana jest średnia ucięta (Windsordzka). Średnią a uciętą wyznacza się tak jak arytmetyczną, po usunięciu % 200% * trim skrajnych obserwacji. |
weighted.mean(stats) |
Średnia ważona, wyznaczona ze wzoru ~ Yli «*»£*• Drugra|l argumentem tej funkcji jest wektor wag Wi. |
geometrie.mean(psych) |
Średnia geometryczna, wyznaczona ze wzoru (n<*j)ł/n7~K |
harmonie.mean (psych) median (stats) |
Średnia harmoniczna, wyznaczona ze wzoru . M Mediana (wartość środkowa). |
ąuantile(stats) |
Kwantyl wybranego rzędu. Drugim argumentem funkcji i ? ąuantileO jest wektor kwantyli do wyznaczenia. W tej funkcji zaimplementowano 9 różnych algorytmów do wy- śj znaczania kwiuityli w różny sposób obslugując.ych sytu-, ? ację, gdy wartość kwantyla wypada pomiędzy obserwa- ,, cjami. Metodę wyznaczania kwantyli określa się argumen-tom type. |
rangę(base) |
Przedział zmienności próby, [mim xi, max, |
IQR(stats) |
Rozstęp międzykwartylowy, czyli różnica pomiędzy górcl: nym a dolnym kwartylem, IQR = 90.75 — 90.25- |
var(stats) |
Wariancja w próbie. Wyznaczany jest nieobciążony os- j.( tymator wariancji S2 = - *)2- Jeżeli podanc/I; zostaną dwa wektory 0 równej długości, to funkcja var() b wyznaczy kowariancję pomiędzy tymi wektorami. |
sd(stats) |
Odchylenie standardowe wyznaczone jako VS2, gdzie S2 |
to ocena wariancji. | |
cor(stats), cov(stats) |
Macierz korelacji i kowariancji. Argumentami może być l5 para wektorów lub macierz. Dla macierzy korelacje i ko-wariancje oznaczane będą dla wszystkich par kolumn. ' \l |
| mad(stats) 1 |
Medianowe odchylenie bezwzględne wyznaczone ze wzoru1; 1.4826 * median(\xi — median(xi)\). |
1 sd(stats)/msan(stats) |
Współczynnik zmienności CV (ang. eoefficient 0} varian-ce), czyli odchylenie standardowe podzielone przez śred- j nią z próby. |
length(base) |
Liczba elementów w próbie. |
kurtosis(el071) |
Kurioza, miara koncentracji (spłaszczenia), wyznaczona j |
ze wzoru —3. Rozkład normalny ma kurtozę | |
równą 0. | |
skewness(el071) |
Śkośność, miara asmctryczności, wyznaczona ze wzoru ■ Rozkład symetryczny nm śkośność 0. |
moda(dprep) |
Moda lub dominanta, czyli wnrtość występująca najczęściej w próbie. |
■
z jakiego przedziału przyjmuje wartości zmienna wiek?
Tanga(wiek)
■ [1] 22 75
P p ile wynosi rozstęp kwartylowy dla zmiennej wiek -> It)R(wiek)
■fil 23
średnia dla zmienne] wiek
mcmii wiek) .......
:.[1) 43.16176
> # średnia obcięta z 60% środkowych obserwacji ńeąnCwiek, trim»0.2)
[1] 42.58065 / i •
vi * średnia geometryczna .)> geometrie.oean(wiek)
U; 40.89757
> * średnia harmoniczna
> harmonie.mean(wiek)
;£13 38.66
> # mediana, tutaj bliska średniej, czyżby brak skośności?
> median(wiek)
, W 45
> moda(wiek)
lii 26
'> U wybrane kwantyle zmiennej wiek
> quantile(wiekjc(0.1, 0.25, 0.5, 0.75, 0.9)) to1/. 257, 507. 757. 907.
26.0 30.0 45.0 53.0 62.4
> t> odchylenie medianowe
> mad(wiek)
Cl] 17.0499
> # odchylenie standardowe
> sd(wiek)
[1] 13.8471
> # kurtoża, miara koncentracji, rozkład normalny ma 0
> kurtosis(wlek)
Cl] -0.955848
> t> akośność
> skewness(wiek) tl] 0.233151
> ż macierz korelacji dla trzech wybranych kolumn
> cor(dane[,c(l,6,7)])
wiek ciśnienie.skurcz ciśnienie.rozkurcz wiek 1.00000 -0.02765 -0.08313
ciśnienie.skurcz -0.02765 1.00000 0.67852
ciśnienie.rozkurcz -0.08313 0.67852 1.00000