Metody probabilistyczne i statystyka – kolo nr2
Oto On. długo czekał na to, aby się pojawić
Manual jest oparty o kolo, które jakimś sposobem trafiło do mojego komputera. Będziemy
korzystać również z pomocy programu Microsoft Excel [na moim sprzęcie wersja 2003 i w mojej
ukochanej sali 138 też jest taki EXCEL].
BARDZO DZIĘKUJE MARCINOWI LOSZOWI, ZA UDOSTĘPNIENIE SWOICH
JAKŻE CENNYCH I ZACNYCH NOTATEK. POLECAM JE OSOBIŚCIE.
http://www.youtube.com/watch?v=gxvNGy5jUeA
– polecam przed rozpoczęciem nauki
No to teraz zadanie nr 1.
Pierwszy krok to wrzućmy wszystkie obserwacje do Excela.
By Perez
Strona 1 z 9
Aby rozpocząć pracę musimy
nacisnąć przycisk wstawiania
funkcji
Uruchomi się okno z
funkcjami.
Podpunkt a) każe nam
obliczyć wartość średnią.
Musimy wybrać kategorie
Statystyczne
I znaleźć tam funkcję średnia
Wstawianie funkcji
Metody probabilistyczne i statystyka – kolo nr2
Po wybraniu tej funkcji pokaże nam się okno.
Ukaże się naszym oczom wynik 9,205. To jest nasza średnia czyli x=9,205
Wiemy również, że przedział ufności, czyli 1− wynosi 0,95. Musimy z jakże trudnego
równania wyliczyć , a więc 1−=0,95 −=0,95−1 =0,05 . Kolejny krok to musimy
policzyć t
- pomoże nam w tym Excel, ale zanim wykonamy obliczenie te musimy policzyć ile
jest obserwacji, czyli n. Tutaj również pomoże nam Excel. Wybieramy przycisk wybieranie
funkcji, a następnie znajdujemy w funkcjach statystycznych funkcje ILE.LICZB. Jako Wartość1
zaznaczamy taki sam obszar jak przy średniej[patrz obrazek wyżej]. Jeśli dostaliście wynik 8 to
jesteście świetni.
Teraz obliczamy nieszczęsne
t
. Ponownie zwracamy się do Excela wybieranie funkcji,
następnie funkcje Statystyczne i znajdujemy funkcję ROZKŁAD.T.ODW
By Perez
Strona 2 z 9
W miejsce liczba1. Naciskamy ten button, aby
móc zaznaczyć sobie na spokojnie obszar
interesujących nas liczb. Zaznaczamy oczywiście tak
samo jak w strategiach.
Prawdopodobieństwo
tutaj to nic innego jak
nasza obliczona α(alfa)
Stopień swobody - tutaj czeka nas bardzo
trudna kalkulacja, bo od liczebności musimy
odjąć jeden
Metody probabilistyczne i statystyka – kolo nr2
Naszym oczom jeśli oczywiście dobrze obliczymy stopień swobody to powinien ukazać nam się
wynik 2,364624, ale niestety jak dla nas to troszkę za dużo i musimy zaokrąglić tą liczbę. W Excelu
jest bardzo przydatny button do tej operacji z reguły zaokrąglamy do 3 miejsc po przecinku,
więc naciskamy ten klawisz tyle razy, aż znajdzie się interesujący nas wynik.
Ostateczna rzecz w tym podpunkcie, musimy obliczyć takiego potworka:
x−t
s
n−1
mx t
s
n−1
skorzystamy ponownie z Excela , bo po co mamy się męczyć i
sami to liczyć skoro może to policzyć program.
Opisze te obliczanie w kilku krokach. Myślę, że ten sposób jest o wiele miej problematyczny i da
nam to wynik jak najbardziej prawidłowy.
1. Obliczamy ułamek (= pole gdzie jest s / PIERWIASTEK(pole gdzie jest n – 1))
2. Obliczmy iloczyn ułamka z t
(=pole gdzie jest rozkład t odw * pole gdzie mamy
obliczony ułamek)
3. Obliczmy lewy przedział (=pole gdzie jest wartość średnia – pole iloczynu ułamka z
t
).
4. obliczamy prawy przedział (=pole gdzie jest wartość średnia + pole iloczynu ułamka z
t
).
Zapiszmy teraz wyniki do wzorku 4,28m14,13 . Hmm dobrze myślisz. To koniec zadania
możesz iść po piwko.
UWAGA 1: Wzór x−t
s
n−1
mx t
s
n−1
stosujemy zawsze do przedziału ufności do
wartości średniej.
b) przyjmując współczynnik ufności 0,9 zbudować przedział ufności dla wariancji.
To jest analogicznie podobne do zadania poprzedniego, ale niestety główna różnicą są wzorki do
ustalenia przedziałów, ale o tym może później.
Najpierw rzeczy bajecznie proste. Wybierzmy z funkcji statystycznych funkcje o nazwie wariancja
i zaznaczmy nasze liczby (obserwacje, czy jak tam wolicie). Jeśli zaznaczyliście dobrze to Waszym
oczom ukaże się jakże piękna i znośna liczba 30,41414. używając magicznej sztuczki z
zaokrąglaniem doprowadźmy do stanu 30,41.
Coraz bliżej zwycięstwa... teraz jak zapewne domyślacie się musimy obliczyć . Wiedząc, że
przedział ufności wynosi 0,9 [przypominam, ze przedział ufności to 1− ] , więc wynosi
0,1. teraz niestety musimy się brać za wzorki. Do przedziału.
ns
2
2
2
2
ns
2
1−
2
2
No to wbijamy w nasze EXCELISKO i
w funkcjach statystycznych znajdujemy
ROZKŁAD.CHI.ODW.
W miejsce prawdopodobieństwa należy
wpisać wynik działania tego co na dole
przy CHI jest. Hmm ciekawe ile to jest
0,1 dzielone na 2. Dostałem informacje
z frontu, że jest to 0,05. Oby mieli rację.
By Perez
Strona 3 z 9
Zanim zdążycie zapytać czy to jest X już
wam odpowiadam, że to nie jest X tylko
CHI [taka grecka literka powstała w ....
UPS to nie ten manual :)], a to cale na
dole to są informacje potrzebne do
EXCELA potrzebne do policzenia
rozkładu. Zapytanie zapewne jakiego
rozkładu. Rozkładu CHI wam
odpowiadam (nie wiem dlaczego ale
zawsze jak pisze CHI to najpierw
wychodziło mi CHU ciekawe czemu)
Metody probabilistyczne i statystyka – kolo nr2
Pierwszy wynik to 14,07 [po skróceniu]
Kolejny wynik rozkładu CHI inna liczbę wpisujemy przy prawdopodobieństwie. Tutaj wpisujemy
wynik z działania 1−
2
wynika nam, że liczbą przeznaczoną do prawdopodobieństwa jest 0,95.
Teraz zastanówmy się przez chwile co mamy wpisać w Stopnie swobody.... hmm w sumie musimy
wpisać również 7.
Drugi wynik to 2,17 [po skróceniu]
no to teraz obliczmy te wzorki i zakończmy męki z tym zadaniem. Znów użyjemy naszego
masterminda EXCELA [ufajmy mu jak Zawiszy Czarnemu] i wypisze co jak liczymy, aby było
prościej i EXCEL nie złapał TapCzkawk.
1. Obliczamy górę ułamka ns
2
(=pole gdzie mamy liczebność * pole gdzie mamy
wariancję)
2. Obliczamy lewy połap (=pole gdzie mamy obliczenie góry * pole gdzie mamy pierwsze
CHI )
3. 3. Obliczamy prawy pułap (=pole gdzie mamy obliczenie góry * pole gdzie mamy
pierwsze CHI)
4. Cieszymy się z obliczonego zadania. W nagrodę strzelcie sobie browar, tak jesteście zdolni.
Na koniec oczywiście podamy wynik
17
2
112,3
punkt b zakończony powodzeniem.
Wnioski z tej lekcji. Kiedy jest mowa o odchyleniu standardowym lub wariancji to używamy
rozkładu CHI
c) na poziomie istotności 0,01 zbadać czy średnia badanej cechy różni się istotnie od 9,5
tutaj musimy zrobić 2 hipotezy.
H
0
: m=9,5
H
1
: m≠9,5
Oczywiście działamy tutaj na rozkładzie t-studenta.
Wiemy, że poziom istotności (czyli )
Aby obalić hipotezę numer 0 należy:
Obliczyć wzorek t=
x−m
0
s
n−1
By Perez
Strona 4 z 9
Tutaj wpisujemy alfa
dzieloną na 2
Tutaj wpisujemy
liczebność -1
n- liczebność
m- liczba przy hipotezie 0
Odchylenie std
Średnia wartość
Metody probabilistyczne i statystyka – kolo nr2
Jak widać mamy tutaj wszystko policzone do tego wzorku (podpunkt a pomógł nam bardzo mocno)
a więc wyjdzie tak
t=
9,21−9,5
5,51
8−1=−0,14
Teraz musimy policzyć rozkład t- studenta [ROZKŁAD.T.ODW]
w miejsce prawdopodobieństwa wpisujemy a w miejsce stopni swobody wiadomo n-1.
Wynik jest następujący (po zaokrągleniu) 3,499. Teraz podstawmy pod wzorek −t
tt
wychodzi coś takiego:
−
3,499−0,143,499
. Zabawie się w matematyka. Ja widać możemy
ten wzorek przestawić za pomocą wykresu
Jeśli warunek jest spełniony (czyli, że liczba jest w przedziale podanym przez nasz rozkład to wtedy
musimy napisać następujące zdanie)
Nie ma podstaw do odrzucenia hipotezy H
0
. Wartość średnia badanej cechy nie różni się
znacznie od 9,5.
Koniec zadania numer 1. Kolejne piwo wypijmy za zdrowie swe.
Zanim obliczymy punkt a) policzymy kilka innych rzeczy, które prawdopodobnie mogą być na
kole. Są to średnia,wariancja, odchylenie standardowe, mediana i modalna. Te zadanie jest o
tyle paskudniejsze, że nie damy rady policzyć tego w sposób taki jaki był w zadaniu numer 1, a
szkoda. Będziemy musieli nauczyć się kilku wzorków.
UWAGA: Tutaj będziemy posługiwać się rozkładem normalnym więc wielki powrót literki fi lub
By Perez
Strona 5 z 9
-3,499
3,499
-0,14
Metody probabilistyczne i statystyka – kolo nr2
jak kto woli TIE Fightera [pozdrowionka dla fanów Star Warsów].
Najpierw zabierzmy się za modalną.
m
o
=
X
k
n
k
n
k 1
n
k
−
n
k1
n
k
−
n
k1
h
Przedziałem gdzie jest modalna jest przedział na którym liczebność jest największa
Tym przedziałem jest przedział nr 3 (liczebność 37)
No to teraz podstawy sobie wszystko pod wzorek.
m
o
=
30
3721
37−2737−21
⋅
7. Pamiętając , że EXCEL prawdę Ci powie ,
warością modalną jest 45,615.
Zaokrąglijmy wynik
do 3 miejsc po przecinku (oczywiście w EXCELU za pomocą przycisku) .
Teraz mediana.
m
e
=
X
k
1
2
n
k
1−
∑
i=1
k−1
n
i
n
k
h
Przedziałem w którym jest mediana, jest pierwszym przedziałem gdzie suma liczebności
poprzedzających przedziałów z tym przedziałem przekraczają polowe obserwacji.
By Perez
Strona 6 z 9
H Wielkość przedziału, czyli
prawy koniec odjąć koniec lewy.
Lewy koniec
przedziału gdzie jest
modalna
Liczebność
przedziału
gdzie jest
modalna
Liczebność przedziału następnego
po przedziale gdzie jest wartość
modalna
Lewy koniec przedziału
gdzie jest mediana.
Liczebność przedziału gdzie jest
mediana zwiększona o jeden i
podzielona na 2
Sumy liczebności
przedziałów
poprzedzających
medianę
Wielkość przedziału
Liczebność przedziału
gdzie jest mediana.
Metody probabilistyczne i statystyka – kolo nr2
Naszym n jest 148 (suma wszystkich liczebności). Polową jest jak nie licząc 74. kolejnym zadaniem
jest sumowanie liczebności. Na następnej stronie będzie to pokazane dokładnie na tym przykładzie
Teraz musimy wybrać ten jeden jedyny przedział Jest
nim numer 3, bo tutaj przekroczona po raz pierwszy
została bariera polowy populacji (naszego n)
Teraz na spokojnie możemy policzyć nasz wzorek
m
e
=
30
1
2
38−45
37
⋅
7=28,58108
Done. Kolej na Średnia teraz. Które również jest bajecznie prosta. Na początek wzór.
x=
1
n
⋅
∑
k
i=1
x
o
i
⋅
n
i
Czyli w skrócie mówiąc, mnożymy liczebność przez środek i dzielimy przez
ilość wszystkich obserwacji jakie są. Po wrzuceniu w EXCELA dostaniemy wynik następujący.
x=
1
n
⋅
∑
k
i=1
x
o
i
⋅
n
i
=
1
148
⋅
5420=36,62162 Oczywiście nie zapominamy o zaokrągleniu wyników, bo
po co nam taki brzydal.
Po obliczeniu średniej przyszedł czas na wariancje i odchylenie standardowe. Jak dobrze pamiętacie
wariancja do kwadrat odchylenia, więc jeśli mamy jedną z tych rzeczy to od razu w kilka sekund
mamy drugą. Policzymy wariancję ze wzorku
s
2
=
1
n
∑
i=1
n
x
o
i
−
x
2
⋅
n
i
Tutaj musimy środek przedziału każdego odjąć od wartości średniej (brzmi
znajomo prawda) i podnieść to do kwadratu. Kwadraty mnożymy przez liczebności i dzielimy przez
cala populację (ilość wszystkich obserwacji). Nasz ukochany arkusz kalkulacyjny oczywiście
przeliczy to wszystko szybko i sprawnie.
s
2
=
1
148
17667,81081=119,3771
od razu policzmy odchylenie standardowe. s=
119,3771=10,92598 .
Teraz bierzmy się za zadania.
a) przyjmując współczynnik ufności 0,90 zbudować przedział ufności dla wartości średniej.
Wzorek na przedział:
x−u
s
n
mxu
s
n
Następnie zauważając, że mamy wszystko oprócz jednej rzeczy którą jest
u
, a liczymy je w
By Perez
Strona 7 z 9
Teraz w kwestii wytłumaczenia. Sumy
przedziałów to jest interesująca nas
kolumna. Sumą tą nazywamy liczebności
przedziałów wszystkich które są powyżej i
tego przedziału w którym jesteśmy. Tak
więc dla przedziału pierwszego liczebność
wynosi 18, bo przedziałów poprzednich nie
ma, ale za to w tym przedziale jest 18
absztyfikantów. Wiersz niżej schodząc.
Suma liczebności wszystkich poprzednich
przedziałów wynosi 18, i dodając jeszcze
27 wynikiem jest 45. itd.
Metody probabilistyczne i statystyka – kolo nr2
sposób następujący u
=
1−
2
, a więc obliczmy te jakże trudne równanko i wynik wrzucamy
do funkcji ROZKŁAD.NORMALNY.S.ODW. Wynik podany jest naszym upragnionym
u
.
wynosi 0,1 ( 1−=0,9 =1−0,9 =0,1 ), następnie liczymy nasze fi od u
, żeby
poznać jaka liczba kryje się za tą alfą u
=
1−
0,1
2
=
1−0,05=0,95 0,95 wrzucamy do funkcji
otrzymujemy wynik. 1,645 (po zaokrągleniu).
Teraz kiedy mamy wszystko możemy policzyć sobie na spokojnie te wszystkie cudeńka.
1. Obliczyć ułamek (=POLE GDZIE JEST ODCHYLENIE / PIERWIASTEK(POLE
GDZIE JEST N)
2. Obliczyć ułamek mnożony przez
u
(=POLE GDZIE JEST ULAMEK * POLE
GDZIE JEST u
)
3. Obliczyć lewą stronę nierówności (=POLE GDZIE JEST ŚRENIA – POLE GDZIE
JEST WYNIK OBLICZENIE POWYŻEJ)
4. Obliczyć prawą stronę(=POLE GDZIE JEST ŚREDNIA + POLE GDZIE JEST WYNIK
OBLICZENIA Z PUNKTU NR 2)
Na koniec oczywiście jak to ma wyglądać po obliczeniu
35,144m38,099
b)przyjmując współczynnik ufności 0,95 zbudować przedział ufności dla wariancji.
Teraz zapewne widać dlaczego, tak ważne były te moje dodatkowe obliczenia przed wykonaniem
tego zadania. Teraz praktycznie mamy wszystko jak na tacy gotowe i czeka tylko na wrzucenie do
wzorku.
s
1−
u
2n
2
2
s
1
u
2n
2
Następnie już, rutynowo obliczamy sobie u
. Najpierw sama
1−=0,95 =1−0,95 =0,05 u
=
1−0,1=1−0,1=0,9 . Ostatecznie naszym u
jest liczba 1,64 (dla wariancji liczymy, nie dzieląc %alfa na 2, co za typ wymyślił tą plapkę to nie
wiem, ale najpewniej już nie żyje)
Teraz bierzmy się za przedziały.
1. Obliczenie DOLU ULAMKA DLA PRZEDZIALU LEWEGO (=1- (POLE GDZIE JEST
NASZE NOWE
u
/PIERWIASTEK(2*POLE GDZIE MAMY NASZĄ
POPULACJĘ))
2. Obliczenie DOLU ULAMKA DLA PRZEDZIALU PRAWEGO (=1+ (POLE GDZIE
JEST NASZE NOWE u
/PIERWIASTEK(2*POLE GDZIE MAMY NASZĄ
POPULACJĘ))
3. Dzielenie s przez dół ułamka przedziału lewego (=POLE GDIZE MAMY ODCHYLENIE
STANDARDOWE / POLE GDIZE MAMY OBLICZENIE Z PUNKTU 1)
4. Dzielenie s przez dół ułamka przedziału PRAWEGO (=POLE GDIZE MAMY
ODCHYLENIE STANDARDOWE / POLE GDIZE MAMY OBLICZENIE Z
PUNKTU 2)
5. Podniesienie obliczenia z punktu nr 3 do kwadratu (=POLE GDIZE MAMY
OBLICZENIE ^2)
By Perez
Strona 8 z 9
Metody probabilistyczne i statystyka – kolo nr2
6. Podniesienie obliczenia z punktu nr 4 do kwadratu (=POLE GDIZE MAMY
OBLICZENIE ^2)
Teraz wynik i z głowy.
96,208
2
152,046
c) na poziomie istotności 0,05 zbadać czy wartość średnia badanej cechy różni się istotnie od
37,5.
Tworzymy 2 hipotezy H
0
m=37,5
H
1
m≠37,5 Kolejną rzeczą jest obliczenie u
samą
alfę mamy już jest nią 0,05 [poziom istotności] u
=
1−
0,05
2
=
1−0,025=0,975 Rzut do
Excela i mamy wynik 1,96. Teraz podrzucamy to do wzoru u=
x−m
0
s
n
1. Liczymy pierwiastek z n (=PIERWIASTEK(POLE GDZIE JEST POPULACJA))
2. od wartości średniej odejmujemy liczbę m która jest przy H
0
(=POLE GDZIE MAMY
ŚREDNIA – 37,5)
3. punkt drugi dzielimy przez odchylenie standardowe (=POLE GDZIE MAMY
OBLICZENIE PUNKTU NR 2 / POLE GDZIE JEST ODCHYLENIE)
4. Ułamek mnożymy przez pierwiastek (=POLE GDZIE MAMY OBLICZENIE Z
PUNKTU NR 1 * POLE GDZIE JEST OBLICZENIE Z PUNKTU NR 3)
wynikiem jest -0,978
Na koniec musimy sprawdzić czy
−
u
uu
, a więc czy
−
1,960,9781,96
. Zgadza się
ta nierówność wg mnie, czyli musimy napisać, że:
Nie ma podstaw do odrzucenia hipotezy zerowej. Wartość średnia badanej cechy nie różni
się znacząco od 37,5.
Dziękuje to by było na tyle, manual został ukończony o godzinie 16:07. Teraz idę spać bo jakoś
dziwnie senny się zrobiłem, a taśma na powiekach nie pomaga już. Powodzenia i milej nauki
Chciałbym podziękować osobom, które znalazły błędy w wersji 1.0 tegoż manuala. Mam nadzieję,
że teraz ta wersja jest lepsza i bez błędów. Pozdrawiam.
By Perez
Strona 9 z 9