GRUPA 1 1. Pogrupować dane z pliku dane_usmiech2.csv według pól x i y na 5 klas metodą grupowania wokół centroidów (być może warto użyć wersji dla dużej ilości danych). Następnie przeanalizować częstości występowania elementów z różnych klas (pole klasa) w wybranych skupiskach. Policzyć jaka cześć elementów "odstaje" od najczęstszych wyborów w swoich skupiskach. Uwaga: przed wykonaniem zadania proponuję ustawić generator liczb pseudolosowych poleceniem set.seed(2011). 2. Dopasować możliwie dobry model regresji (parametrycznej) do zależności y od x w 4-tej klasie danych dane_usmiech2.csv 3. Narysować histogram oraz estymator gęstości dla zmiennej x w 1-szej klasie danych dane_usmiech2.csv. Przetestować hipotezę, że dane te pochodzą z rozkładu normalnego.
Wyszukiwarka