Zadanie 1
Podzielić dane z pliku zakupy.csv na trzy mniej więcej jednakowo liczne grupy ze względu na wiek klienta
(powiedzmy Y, M, O). Następnie zbadać, czy różnica średnich wydatków w tych grupach jest istotna
statystycznie.
Rozwiązanie:
dane = read.csv2("Zakupy.csv")dane
#zmienimy nazwy zmiennych, żeby łatwiej się odwołać
attach(dane)
wyd = WYDATEK
plec = PLEC
wiek = WIEK
n =length(wyd)
detach(dane)
library(Hmisc)
#dzieli dane na tabelę, w której są trzy grupy wieku i 10 grup wydatków
tabela=table(cut2(wyd, g=10),cut2(wiek, g = 3))
tabela
#przeprowadza test chi kwadrat - niepotrzebnie
chisq.test(tabela)
# p z którym porównujemy z alpha = 0.05. gdy jest p < alpha odrzucamy hipotezę
# df stopnie swobody, X - wartość statystyki chi kwadrat
# anova(lm(wyd~plec)) - analizuje wariancję (wyd - to co podzielić),
# plec - to co chcemy podzielić
anova(lm(wyd~cut2(wiek, g = 3)))
# to co nam wyjdzie, to wartość krytyczna testu "value" musi być <0.05,
# żeby odrzucić hipotezę Ho, bo w teście "anova" hipotezą zerową jest równość średnich.
# wyszło nam "value = 0.8604 < 0.05 czyli odrzucamy Ho więc nie ma równości średnich.
# Czyli jest istotna.
Wyszukiwarka
Podobne podstrony:
lista 6 zad1zad1granice zad1zad1 cz2Zad1 v1 1PS6 cipher zad1Zad1 csproj FileListAbsolutezad1zad1 przyblizone cw wyjsciePKS W zad1 Opis TechnicznyTeoria PG gr2 zad1,2zad1więcej podobnych podstron