28213

28213



Pakiety Statystyczne

Lista nr 6 (R)

Na podstawie skryptu trAn Introduction to R" zamieszczonego na stronie www.r-proiect.org w zakładce „Manuals" zapoznać się z podstawowymi komendami pakietu R.

Co trzeba wiedzieć:

a)    Jak korzystać z pomocy w pakiecie R?

b)    Jak wczytywać i zapisywać dane w pakiecie R.

c)    Czy można używać pakiet R jako profesjonalny kalkulator?

d)    Jak wykonywać działania na macierzach i wektorach.

Wykonać następujące zadania

1.


2.

3.

4.

5.

6. 7.


Do programu R wczytać dane o nazwie „DanePakietyStatystyczne.csv" umieszczone na stronie http://theta.edu.pl/teaching/pakietv-statvstvczne/. Dane przedstawiają grupę 860 pacjentów, pochodzących z trzech miast w Polsce (Gdańsk, Warszawa i Wrocław), dla których zostały zmierzone wartości hemoglobiny (g/dL), witaminy B12 (pg/dL) oraz kreatyniny (mg/dL). Dodatkowo dla każdego pacjenta jest znana jego płeć, waga, wzrost oraz rok urodzenia. Dokładna struktura kolumn to: rok urodzenia, wzrost, waga, płeć, hemoglobina, witamina B12, kreatynina oraz miasto pochodzenia. Jak są oznaczone brakujące obserwacje dla zmiennej miasto pochodzenia? Wartości brakujących obserwacji zamienić na wartość -9999.

Przekodować kolumnę płeć, tak aby mężczyzna był oznaczany jako 1, a kobieta 0. Wyznaczyć wartości statystyk opisowych (średnia, wariancja, odchylenie standardowe, mediana oraz skośność) dla hemoglobiny, witaminy B12 oraz kreatyniny.

Ile średnio lat w dniu dzisiejszym mieli by pacjenci znajdujący się w analizowanym zbiorze danych?

W którym z miast średnia wartość kreatyniny jest najniższa, a w którym najwyższa?

Na podstawie wagi i wzrostu utworzyć nową kolumnę o nazwie BMI (Body Mass lndex).

BMI =


waga tkg] wzrost2 Im2]

Porównać wskaźniki BMI pomiędzy kobietami, a mężczyznami. Ile procent mężczyzn jest otyłych w analizowanym zbiorze danych (otyłość zaczyna się gdy wskaźnik BMI jest większy od 30)?

8.    Zlogarytmować dane o dużej skośności.

9.    Zbiór danych z nowo utworzonymi zmiennymi zachować na następne zajęcia.



Wyszukiwarka

Podobne podstrony:
Pakiety StatystyczneLista nr 3 (Statistica) 1.    Dla danych przygotowanych na ćwicze
Pakiety StatystyczneLista nr 4 (Statistica) 1. Dla danych przygotowanych na ćwiczeniach nr 2 zapropo
1.Pakiety StatystyczneLista nr 2 (Statistica) Do programu STATISTICA wczytać dane o nazwie
a)    podstawowa: I.AItera Corp.: Introduction to the Ouartus II Software, San Jose,
Pakiety Statystyczne Lista nr 7 (R) 1.    Na podstawie danych zamieszczonych na stron
IMG 03 IPio - statystycznie obliczona na podstawia wyników badatf ilość substancji chemicznej, która
fin ost2 2 ■S Gromadzenie i opracowywanie informacji statystycznych !! Patrząc na podstawowe i inne
11121894?114915692139404963278 n Imię , Na:w*>kO Grupa: IŚ1* Pi.u o kont i dno Nr l Pt  &nb
Podstawyprawa Skrypt Marcin Redziński SjknU Gidami Htndkmm w Ittnm Oporowano na pochtawta ayłła*/ dr
W} Arb _ ivluvi nr o 10 PODSTAWY ZARZĄDZANIA Skrypt wykładów
Wykład nr 9,10 PODSTAWY ZARZĄDZANIA Skrypt wykładów 2003/2004 f).1 17 05.12.2003 2.
Lf 21.X— „GLOS PORANNY* — 1937 Nr. ■«»Obwieszczenie. Na podstawie art. art. 14 i 56 p. 1
Opracował Piotr MILART na podstawie skryptu: A. Czarny, B. Kawałek, A. Kolasa, P. Milart, B. Rys, J.
Zespól Szkól nr 1 - Szkoła Podstawowa nr 16 im. B. Prusa w Siemianowicach Śląskich Na jakość i skute

więcej podobnych podstron