Egzamin z 12 lutego 2011
Tłumaczenie zdań
X - płeć (1-K, 2-M) Y - ocena ze statystyki (w procentach) Z - wiek (w latach)
Eta 2 x/y = 1
Zależność między płcią a wiekiem jest maksymalna
b(Y) = E[b(Y/X)]
Najczęściej występujące oceny są takie same dla całej zbiorowości
Dwudziestoletnie kobiety częściej otrzymywały oceny ze statystyki powyżej średniej niż dwudziestoletni mężczyźni
P(Y>E(Y)/X=1 ^ Z=20) > P(Y>E(Y)/X=2 ^ Z=20)
W całej zbiorowości studentów średni wiek był taki sam jak w grupie mężczyzn
E(Z)=E(Z/X=2)
Zadanie 1
W pewnej populacji zmienna wzrost (W) ma rozkład normalny o parametrach E(W)=170 i D(W)=20.
Wyznacz pierwszy i trzeci kwartyl wzrostu tej populacji.
Q1,4 to P(X≤a)≥0,25 oraz P(X≥a)≥0,75
Nie wiem jak policzyć jakieś pomysły, sugestie, uwagi?
Q3,4 to P(X≤a)≥0,75 oraz P(X≥a)≥0,25
Zgodnie z rozwiązaniami zrobionymi przez Sałamatin do innych zadań skoro mamy rozkład normalny należy w tablicach odszukać wartość najbliższą ale nie przekraczającą 0,7500 czyli będzie to 0,7486 i odczytać jej parametry czyli 0,67. Wartość 0,67 podstawiamy do wzoru na standaryzację :
czyli x=170+0,67*20-=183,4
Oblicz prawdopodobieństwo wylosowania z tej populacji takiej 4-elementowej próby, w której średni wzrost będzie nie mniejszy niż 165 cm.
Wzór podstawowy to
ale skoro w zadaniu jest mowa o średniej nasze „u” musi wyglądać tak
czyli
Prawdopodobieństwo wylosowania 4-elementowej próby, w której wzrost będzie równy lub większy 165 cm wynosi 0,3085.
Zadanie 2
Zmienna X - waga ma w pewnej populacji rozkład normalny w średniej 70 kg i odchyleniu standardowym 10 kg. Oblicz prawdopodobieństwo, że wylosowana z tej populacji osoba będzie ważyła mniej niż 75 kg ale nie więcej niż 65 kg.
E(X) = 70 D(X) = 10 szukamy P(65<x<75)
Wzór
F(-u) = 1-F(u)
Zadanie 3 - (ma niby rozwiązanie ale ten sposób dojścia do równania regresji liniowej wydaje mi się być bardziej klarowny)
W pewnej zbiorowości zbadano liczbę wizyt w teatrze w ciągu miesiąca (zmienna X) i wysokość zarobków w tys. pln (zmienna Y). Wyniki przedstawia poniższa tabela:
X\Y |
3 |
4 |
5 |
∑ |
0 |
0 |
10 |
0 |
10 |
1 |
10 |
0 |
0 |
10 |
2 |
10 |
0 |
20 |
30 |
∑ |
20 |
10 |
20 |
50 |
Wyznacz równanie regresji liniowej zmiennej X w zależności od zmiennej Y
Wyliczamy średnie E(X) i E(Y)
Wyliczamy wariancje
Wyliczamy
Wyliczamy kowariancję
Wyraz wolny ax/y
Współczynnik regresji
W efekcie mamy wszystkie dane do wstawienia do wzoru regresji liniowej
Xy=
+
*Y czyli Xy=0,4+0,25*Y
Zadanie 4
Wyznaczono regresję liniową zmiennej X (wysokość zarobków w tysiącach zł) ze względu na zmienną Y (liczbę odbytych szkoleń zawodowych). Otrzymano równanie Xy=3+0,2Y i współczynnik korelacji liniowej wynoszący 0,25.
Czy należałoby się spodziewać jakiejś zmiany współczynnika korelacji, gdyby listę zmiennych niezależnych uzupełnić o zmienną Z zdającą sprawę z tego, czy osoba badana ukończyła wyższe studia (0-nie, 1-tak)? Jeśli spodziewasz się, że wartość współczynnika zmieni się, to w którą stronę, a jeśli nie - dlaczego.
Wg mnie zmienna Z wprowadza nowy zasób danych do modelu ale musiałaby być skorelowana ze zmienną X lub zmienną Y aby mogła wpłynąć z zwiększenie się współczynnika korelacji.
W przypadku braku korelacji współczynnik nie zmieni się.
Oblicz wariancję zmiennej X, jeśli wariancja zmiennej Y wynosi 5
=5