Na podstawie skryptu trAn Introduction to R" zamieszczonego na stronie www.r-proiect.org w zakładce „Manuals" zapoznać się z podstawowymi komendami pakietu R.
Co trzeba wiedzieć:
a) Jak korzystać z pomocy w pakiecie R?
b) Jak wczytywać i zapisywać dane w pakiecie R.
c) Czy można używać pakiet R jako profesjonalny kalkulator?
d) Jak wykonywać działania na macierzach i wektorach.
1.
2.
3.
4.
5.
6. 7.
Do programu R wczytać dane o nazwie „DanePakietyStatystyczne.csv" umieszczone na stronie http://theta.edu.pl/teaching/pakietv-statvstvczne/. Dane przedstawiają grupę 860 pacjentów, pochodzących z trzech miast w Polsce (Gdańsk, Warszawa i Wrocław), dla których zostały zmierzone wartości hemoglobiny (g/dL), witaminy B12 (pg/dL) oraz kreatyniny (mg/dL). Dodatkowo dla każdego pacjenta jest znana jego płeć, waga, wzrost oraz rok urodzenia. Dokładna struktura kolumn to: rok urodzenia, wzrost, waga, płeć, hemoglobina, witamina B12, kreatynina oraz miasto pochodzenia. Jak są oznaczone brakujące obserwacje dla zmiennej miasto pochodzenia? Wartości brakujących obserwacji zamienić na wartość -9999.
Przekodować kolumnę płeć, tak aby mężczyzna był oznaczany jako 1, a kobieta 0. Wyznaczyć wartości statystyk opisowych (średnia, wariancja, odchylenie standardowe, mediana oraz skośność) dla hemoglobiny, witaminy B12 oraz kreatyniny.
Ile średnio lat w dniu dzisiejszym mieli by pacjenci znajdujący się w analizowanym zbiorze danych?
W którym z miast średnia wartość kreatyniny jest najniższa, a w którym najwyższa?
Na podstawie wagi i wzrostu utworzyć nową kolumnę o nazwie BMI (Body Mass lndex).
BMI =
waga tkg] wzrost2 Im2]
Porównać wskaźniki BMI pomiędzy kobietami, a mężczyznami. Ile procent mężczyzn jest otyłych w analizowanym zbiorze danych (otyłość zaczyna się gdy wskaźnik BMI jest większy od 30)?
8. Zlogarytmować dane o dużej skośności.
9. Zbiór danych z nowo utworzonymi zmiennymi zachować na następne zajęcia.