12. w metodach przedziałowych niema odchylenia standardowego, ale jest wariancja która jest odchyleniem standardowym do kwadratu, a wiec:
estymacja przedziałowa dla wariancji:
P((n*s2/x21)<&2<( n*s2/x22))=1-L
P((11*16,8/(21,2)2)<&2<(11*16,8/(3,06)2))=96%
P(184,8/449,44<&2<184,8/9,36)=96%
P(0,41<&2<19,7)=96%
musimy mieć przedziały dla odchylenia standardowego, więc pierwiastkujemy przedziały:
P(0,64<&2<4.44)=96%
Odp: otrzymany przedział ufności informuje nasz że z 96 % prawdopodobieństwem odchylenia standardowe wagowe dziewczynek mieszą się w przedziale: (0,64-4,44).
13,
H1= średnie płace kobiet i mężczyzn różnią się od siebie istotnie
H0=średnie płace kobiet i mężczyzn nie różnią się znacznie od siebie
100/68=1,47
stat obl= 1,47
stat L= 2,77
stat obl < stat L -dlatego nie możemy odrzucić hipotezy zerowej.
Odp. nie chce mi się pisać ale będzie coś takiego. Statystyka obliczona jest mniejsza od wartości krytycznej (statystyki alfa), dlatego nie ma podstaw do odrzucenia hipotezy zerowej, średnie płace kobiet i mężczyzn nie różnią się znacznie od siebie, na poziomie istotności L=0,01.
14, Mamy zweryfikować hipotezę czy jedna czecha jest zależna od innych cech.. moim zdaniem najlepiej będzie zastosować test chi kwadrat <korelacja jakościowa>//// lecz mam przy tym nutkę niepewności:
H0:cechy są niezależne;
H1:cechy nie są niezależne;
Liczebność obserwowana:
Płeć |
Do 30 lat |
30-45 lat |
Pow. 45 lat |
Suma |
Kobieta |
10 |
8 |
20 |
38 |
Mężczyźni |
15 |
35 |
60 |
110 |
Suma |
25 |
43 |
80 |
148 |
Liczebność teoretyczna:
Płeć |
Do 30 lat |
30-45 lat |
Pow. 45 lat |
Suma |
Kobieta |
25*38/148=6,41 |
43*38/148=11,04 |
80*38/148=20,54 |
38 |
Mężczyźni |
25*110/148=18,58 |
43*110/148=31,96 |
80*110/148=59,46 |
110 |
Suma |
25 |
43 |
80 |
148 |
2=(10-6,41)2/6,41 + (8-11,04)2/11,04 + (20-20,54)2/20,54 +
+(15-18,58)2/18,58 + (35-31,96)2/31,96 + (60-59,46)2/59,46=
=2,01+0,84+0,29+0,69+0,29+0,005 = 4,12
2=4,12
obliczamy wskaźnik Kontyngencji C Pearsona
C=
2/
2+n....pod pierwiastkiem
C=4,12/4,12+148=0,0271 pierwiastkujemy =0,16
Cmax= [((k-1)/k)pod pierw. + ((w-1)/w)pod pierw.]/2
=[3-1/3 pod pierw. + 2-1/2 pod pierw.]/2=0,765
C kov= C/Cmax= 0,16/0,765=0,21
Ckov > 0 , co oznacza że istnieje zależność między czechami ,,,przyjmujemy H1 mówiącą o cechach które nie są niezależne.
//chciałbym to zrobić analizą wariancji, ale nie mamy wartości krytycznej, potrzebnej do weryfikacji hipotezy.
16. W klinice położniczej w roku 2005 urodziło się 476 dziewczynek i 512 chłopców. Stosując jest chi2 na zgodność hipotezy zweryfikuj czy liczba urodzonych w tej klinice dziewczynek i chłopców nie przeczy zasadzie o rozkładzie płci u potomstwa jak 1:1.
f-1empiryczne=476
f-2empiryczne=512
F-1teoretyczne=F-2teoretyczne=(476+512):2=494
2=
18.
Liczba targowisk |
0 |
1 |
2 |
3 |
4 |
5 |
Liczba gmin |
9 |
8 |
1 |
4 |
2 |
1 |
-oblicz ile targowisk przypada przeciętnie na jedną gminę,
Liczba targowisk 9*0 + 8*1 + 1*2 + 4*3 + 2*4 + 1*5=35
liczba gmin =25
śr. =35/25=1,4
-Oblicz i zinterpretuj Kwartyl drugi,
kwartyl drugi, czyli mediana, w tym przypadku dla rozkładu normalnego
{0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,2,3,3,3,3,4,4,5}N nieparzyste
mediana=n+1/2 =25+1/2 =13
X13=1
Odp. wartością środkową zbiory jest 1, czyli połowa gmin ma mniej targowisk od wartości mediany, a druga połowa ma więcej targowisk od 1.....czy cóś takiego.
-Oceń zróżnicowanie i asymetrię rozkładu liczby targowisk w badanej zbiorowości.
Wydawałoby się trudne, a jest to tylko wariancja i odchylenie standardowe.
Wariancja-
S2=[Σ (xi - x .średnie)2]/N
x. średnie = 1.4
S2=[(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+(0-1,4)2+
+(1-1,4)2+(1-1,4)2+(1-1,4)2+(1-1,4)2+(1-1,4)2+(1-1,4)2+(1-1,4)2+(1-1,4)2+
+(2-1,4)2+
+(3-1,4)2+(3-1,4)2+(3-1,4)2+(3-1,4)2+
+(4-1,4)2+(4-1,4)2+
(5-1,4)2 ] / 25 =
=[17,64+1,28+0,36+10,24+13,52+12,96]/25 = 2,24
S2=2,24
-odchylenie standardowe
S= pierwiastek z S2
S=1,49 w zaokrągleniu 1,50
19.
Liczba osób w gospodarstwie domowym |
1 |
2 |
3 |
4 |
5 |
6 i więcej |
Odsetek gospodarstw domowych [5] |
5,2 |
16,4 |
27 |
32,5 |
12,8 |
6,1 |
Dominanta - potrzebne są wartości skumulowane
Lp. |
Xi |
sk. Xi |
1 |
5,2 |
5,2 |
2 |
16,4 |
21,6 |
3 |
27 |
48,6 |
4 |
32,5 |
81,1 |
5 |
12,8 |
93,9 |
6 |
6,1 |
100 |
Liczymy przedział dla dominanty 100/2=50 czyli będzie czwarty przedział
Gospodarstwa w których żyją 4 osoby, stanowią największy odsetek gospodarstw domowych <32% całej badanej próby>.
<spać>