28086

28086



Drzewa klasyfikacyjne

Dla danych dane.csv (z modeli liniowych i mieszanych) skonstruować drzewo klasyfikacyjne, gdzie liśćmi będzie miejsce hospitalizacji, natomiast korzeniami płeć, wiek oraz poziom hemoglobiny.

>    drzewo=rpart(szpital~Wiek+Płeć+Anemia,data=dane,cp=0.005, minsplit=10)

>    plot(drzewo,branch=0.7)

>    text(drzewo,use.n=T)

Następnie wykonać następujące polecenia.

1)    Wybrać optymalną wartość współczynnika złożoności, przy pomocy funkcji

>    plotcp(drzewo)

i wyznaczyć ponownie drzewo z uzyskaną wartością współczynnika złożoności.

2)    Wybrać drzewo optymalne przy pomocy metody kros-walidacji

>    for (i in l:n) {

>    drzewo.i=rpart(szpital'vPłeć+Wiek+Hemoglobina,data=dane[-c(i),),cp=0.005,minsplit=10)

>    pred=predict(drzewo.i,newdata=dane[c(i),],type="classM)

>    if (pred==dane$szpital[ij) popr.klas[i)=l

>    }

>    popr.klas

3)    Następnie oszacować ułamek poprawnych klasyfikacji oraz błąd klasyfikacji na podstawie kros-walidacji

>    upk=sum(popr.klas)/n

>    bl.cv=l-upk

4)    Porównać wartości z zadania nr 3 dla drzewa ze współczynnikiem złożoności=0.005. Które drzewo jest lepsze?

5)    Do której z klas należałby mężczyzna w wieku 74 lat z poziomem hemoglobiny 13.29?

>    new.dane=as.data.frame(matrix(c(l,74,13.29),1,3))

>    names(new.dane)=c("Płeć","Wiek","Hemoglobina")

>    predict(drzewo,new.dane,type=’'class")

6)    Maksymalnie w trzy-osobowych grupach roboczych opisać i zinterpretować uzyskane wyniki.



Wyszukiwarka

Podobne podstrony:
Zadania 7 Dla danych zapisanych w pliku raty.csv: 1. Utworzyć liniowe modele regresji opisujące zale
img154 Tabela 8.5 Tablica analizy wariancji dla regresji liniowej z testem na liniowość (dla danych
IMG$67 6. Do klasyfikacji wiersza danych: A1 A2 A3 A4 Iow fast smali użyto poniższego drzewa: jakiej
Iwona Kasprzyk: MODELE LOG-LINIOWE A DRZEWA KLASYFIKACYJNE
Sprawozdanie z Konferencji Naukowej... 137 datkowych modeli, innych klas niż drzewa klasyfikacyjne,
Zadania 3 1.    Dla danych zawartych w pliku wzrost.csv (próbka statystyczna opisując
Zadania 6 1.    Przetestować normalność dla danych z pliku wzrost.csv za pomocą testu
DANE ŹRÓDŁOWE Excel CSV Hurtownia danych Dane Sprawozdanie NADZORCA KRAJOWY □
Drzewa klasyfikacyjne Konspekt do zajęć: Statystyczne metody analizy danychAgnieszka Nowak-Brzezińsk
Źródła danych dla SIP. Dane Pomimo różnorodności celów przetwarzania, we wszystkich systemach
Drzewa klasyfikacyjne Konspekt do zajęć: Statystyczne metody analizy danychAgnieszka Nowak-Brzezińsk
Ramy tre zadania?ne Zadanie 9.21. Sporządzić wykresy sił wewnętrznych dla danych ram (dane w tabel
Źródła danych (2) Plik CSV - dane adresowe i geograficzne z serwisu geonames.org JS 34050 US

więcej podobnych podstron