1. Opis danych analizowanych w projekcie
Praca ma na celu sprawdzenie czy istnieje statystycznie istotna różnica między wagą noworodków urodzonych przez palące i niepalące kobiety. Analizy dokonamy za pomocą metod statystycznych z wykorzystaniem programu R. Dane zawarte w pliku tekstowym ,noworodki 1 txt” zawierają próbę o liczebności równej 1236 z wartościami dwóch cech: wagan - waga noworodka w uncjach palenie - czy matka dziecka obecnie pali (0 - nie, 1 - tak, 9 - nie ustalono)
Analizując wstępnie dane stwierdzamy, że jest dziesięć przypadków, kiedy cecha palenie przyjmuje wartość 9, czyli nie jest wiadomo czy matka pali Dane z nieznanymi przypadkami usuwamy z badania. Tym samym nasza próba liczy 1226 elementów: 484 (matka pali) i 742 (matka nie pali).
Na początku przeliczamy wartość zmiennej będącej wagą noworodka w uncjach na jednostkę obowiązującą w Polsce, czyli na gramy. Dokonujemy tego dzieląc wartości cechy waga n przez 0.0351.
2 Czy można sądzić, że waga urod/.eniowa dzieci matek palących i niepalących jest istotnie różna?
Zagadnienie sprowadza się do porównania dwóch grup: matki palące i matki niepalące. Obie z nich badamy pod kątem wagi urodzeniowej dzieci. Można porównywać cale rozkłady badanych populacji, ale najczęściej ogranicza się do porównania średnich w obu rozkładach.
W tym celu należy przetestować hipotezę statystyczną postaci:
t
Pizeciwko hipotezie alternatywnej *2
Pizy czym *, oznacza średnią wagę urodzeni ową dziecka matki palącej, zaś *2 średnią wagę urodzeni ową dziecka matki niepalącej. Ponieważ mamy do czynienia z próbami niezależnymi możemy posłużyć się testem Studenta dla prób niezależnych, przy czym najpierw należy zweryfikować liipotezę o równości wariancji w obu próbach. Zatem testujemy liipotezę, że
2