SPSS – jak go zaliczyć?
PODSTAWY:
Wprowadzenie danych:
Excel
SPSS
Podział danych na podzbiory.
Wyznaczenie zmiennych zależnych i niezależnych.
ROZWINIĘCIE:
Test t dla jednej próby.
Etapy obowiązkowe:
Losowość – test serii Stevensa.
Normalność – test zgodności D-K-S.
Jednakowość rozkładów – Test znaków.
Porównywanie średnich niezależnych.
Porównywanie średnich zależnych.
Sprawdzenie, czy średnie są większe / mniejsze od X.
INNE DZIAŁY:
Szeregi czasowe.
Testy parametryczne.
Estymacja.
Estymacja – kiedy mamy mało danych a zadanie wydaje się niemożliwe do wykonania.
Rozkład normalny.
DODATKI:
Znaki w próbie i w populacji.
Któro-stronność rozkładu, czyli kiedy dzielimy α przez 2.
PODSTAWY:
Wprowadzenie danych:
Excel
Zaczniemy od EXCELA, bo tutaj mamy pierwszy myk na który niestety trudno wpaść jak liczyło się tak mało zadań… Ale nie szkodzi!
Mianowicie musimy już na samym początku stworzyć zmienną tekstową (tzw. grupująca), czyli nic innego jak stworzyć własnoręcznie podział na… płeć! : )
Mamy o takie coś:
Te dane stworzyłem sam.
Z racji braku danych na czas tworzenia tego rozdziału. ; )
Potem będziemy używać innych więc nie przepisuj ich.Zaznaczmy sobie OSTATNIĄ KOBIETĘ np. kolorem, który tak bardzo zaznaczyłem na obrazku obok
Teraz wycinamy mężczyzn i wklejamy ich pod kobiety
W końcu dodajemy zmienną „płeć”, najlepiej poprzez zastąpienie starych, pozostałych i nieużywanych już komórkach
Przyjmijmy, że:
Kobieta = „0”
Mężczyzna = „1”
Na koniec upewnijmy się, że kobiet („0”) i mężczyzn („1”) jest tyle samo! Można to sprawdzić chociażby licząc ile jest „0” i ile jest „1”
Mamy 11 kobiet i 11 mężczyzn, a właściwie:
Wprowadzenie danych:
SPSS
Teraz, jak jesteśmy już tak elegancko przygotowani – możemy wklepać to wszystko w SPSS.
Na początku z czym możemy (i chcemy) się spotkać:
Zmienna ilościowa (liczbowa) | Może nią być każda liczba. Albo z przedziału (−∞;∞) , albo ewentualnie (0; ∞) |
---|---|
Zmienna tekstowa (grupująca) | Zamiana pierwszego tekstu na „0” i drugiego na „1” ; ) Dzięki czemu uzyskujemy prosty podział. |
Teraz jak to wklepać w program?
Niestety program groźny jest… Czasem wywala błędy, dlatego starajmy się wykonać następujące kroki w takiej kolejności, w jakiej je podałem:Zmienna ilościowa (liczbowa) :
Wprowadzamy nazwę zmiennej. (1)
Ustalamy jej typ. (2)
Wyznaczamy jego poziom pomiaru. (3)
W przypadku zmiennej ILOŚCIOWEJ – nie robimy nic więcej!
Zmienna tekstowa (grupująca) :
Wprowadzamy nazwę zmiennej. (1)
Ustalamy jej typ. (2)
Zaznaczamy jakie zmienna ma przyjmować wartości wobec podanego „tekstu” . (3)
Wartość: 0
Etykieta: Kobiety
„Dodaj” , itd.
W przypadku zmiennej TEKSTOWEJ – nie robimy nic więcej!
Dodatki:
Nazwa | Funkcja | Czy jest pomocne |
---|---|---|
Dziesiętne | Ile ma być miejsc po przecinku | Estetycznie – ustawię sobie na 0, bo nasze zmienne są liczbami całkowitymi |
Etykieta | Rozwinięci nazwy | Nie na tym kole |
Kolumny | Szerokość kolumn | nie |
Wyrównanie | wyrównanie | nie |
(dostałem dane z koła – w dalszym ciągu samouczka będę operował już tylko na nich)
W końcu możemy wkleić nasze dane z excela…
Podział danych na podzbiory.
Teraz kiedy mamy już stworzoną bazę danych, podzielmy sobie dane, abyśmy wszelkie wyniki dostali w podziale osobno dla mężczyzn i osobno dla kobiet.
Robimy to w następujący sposób:
Wyznaczenie zmiennych zależnych i niezależnych.
Z podstaw została nam już tylko jedna rzecz.
Ustalenie zależności między zmiennymi.
Jak zostało to ujęte na ćwiczeniach, po prostu badamy czy zmienne zostały:
Wylosowane
Uzupełnione o nowe dane
Pierwsza zmienna | Druga zmienna | |
---|---|---|
Zależne | * wylosowana | * Zaktualizowana o nowe wartości |
Niezależne | * wylosowana | * wylosowana |
Przykładowe zmienne niezależne:
Cena samochodu i cena łodzi,
Czas pracy kobiet i czas pracy mężczyzn,
Ceny mieszkań w Gdańsku i ceny jabłek
Przykłady zmiennych zależnych:
Dochód Mariusza na rok 2001 i 2006
Ceny mieszkań przed i po remoncie
Liczba zakładów w totolotku przed i po kryzysie
Jak łatwo zauważyć – zmienne niezależne to te, które mogą mieć podobny cel, ale nie muszą.
Zaś zmienne zależne – są (chyba) zawsze tym samym podmiotem, uzależnionym od czasu.
ROZWINIĘCIE:
Test t dla jednej próby.
Wyskoczy nam takie coś.
Analizujemy zmienną „przed”, tak jak w poleceniu.
Każdy test ma takie opcje!
Ruszamy je więc tylko przy zmianie ALPHA!!
I nie zmieniajmy nic poza tym.
RESZTY ZOSTAWIAMY!!!
Pora i na sam test:
Pamiętamy, że analizujemy kobiety.
Dane które nam wyskoczyły:
$${\mu = \ s\text{rednia}\backslash n}{S_{\overset{\overline{}}{x}} = blad\ \text{standardowy}\ s\text{redniej}\backslash n}{d = \ \frac{go\text{rna}\ \text{granica}\ - \text{dolna}\ \text{granica}}{2}\backslash n}$$
Teraz zastosujmy je pod zadania:
$${\mu = \overset{\overline{}}{x} \pm \ S_{\overset{\overline{}}{x}}\ \backslash n}{\mu = 18,7 \pm \ 2,66468\ \backslash n}$$
$$S_{\overset{\overline{}}{x}} = \ 2,66468\ \backslash n$$
$$d = \ \frac{go\text{rna}\ \text{granica}\ - \text{dolna}\ \text{granica}}{2} = \frac{24,2772 - 13,1228}{2} = 5,5772\backslash n$$
P{ dolna granica ≤μ≤gorna granica} = 1 − α ∖ nP{ 13,1228 ≤μ≤24,2772} = 0, 95 ∖ n
Tak samo można zrobić z kobietami PO szkoleniu, a także z mężczyznami PRZED i PO ; )
Etapy obowiązkowe:
Test serii Stevensa
W rozwinięciu spotkamy się z zadaniami z treścią.
Są to może nie tyle co trudne, co czasochłonne zadanka.
Dlaczego?
Musimy przeprowadzić ZAWSZE dwa etapy obowiązkowe.
i niestety – dla każdej zmiennej obowiązującej nas w zadaniu…
I ETAP - LOSOWOŚĆ
Test serii Stevensa
H0 : dobor jest losowy ∖ nHA : dobor nie jest losowy ∖ n ∖ nZ = −0, 689
p = 0, 491 ≶ α = 0, 05
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że dobór kobiet przed szkoleniem jest losowy. (tak powinno być!)
… odrzucamy H0 na rzecz HA , co oznacza, że dobór kobiet przed szkoleniem nie jest losowy.
Etapy obowiązkowe:
Test zgodności D-K-S
Po poprawnym rozwiązaniu I etapu możemy przejść do II:
II ETAP - NORMALNOŚĆ
Test zgodności D-Kołmogorowa-Smirnowa
H0 : F(x) = F0(x) ∖ nHA : F(x) ≠ F0(x) ∖ n ∖ nZ = 0, 953
$$\frac{p}{2} = 0,162 > \alpha = 0,05$$
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że rozkład kobiet przez szkoleniem jest zgodny z rozkładem normalnym.
… odrzucamy H0 na rzecz HA , co oznacza, że rozkład kobiet przez szkoleniem nie jest zgodny z rozkładem normalnym.
Ten test może już nie wyjść, tzn. w jednej zmiennej wyjdzie nam HA – rozkład nie jest normalny.
Jeśli na kolokwium tak się stanie (co jest na szczęście wątpliwe – z racji braku miejsca na dodatkowy test) to będziemy musieli zastosować:
Etapy obowiązkowe:
Test znaków
II ETAP ALTERNATYWNY – JEDNAKOWOŚĆ ROZKŁADÓW
1. Cel: niestandardowy
2. Zmienne: obie
3. Ustawienia: test znaków
Test znaków
H0 : F(x) = F0(x) ∖ nHA : F(x) ≠ F0(x) ∖ n
p = 0, 167 > α = 0, 05
Na poziomie istotności α=0,05
… nie ma podstaw do odrzucenia H0, co oznacza, że rozkłady YYY są jednakowe.
… odrzucamy H0 na rzecz HA , co oznacza, że rozkłady YYY nie są jednakowe.
Test znaków MUSI JUŻ OSTATECZNIE wyjść na H0 .
Jeśli wyjdzie inaczej – to nie mamy już czego liczyć..
Porównywanie średnich niezależnych.
A więc przechodzimy do sedna.
Czas na bardziej skomplikowane zadania…
Np. sprawdzenie czy płeć była czynnikiem różnicującym.
Czyli czy kobiety_po i mężczyźni_po mają taki sam średni
czas obsługi ; )
Zaczynamy!
Zmienne niezależne
|
---|
III ETAP – RÓWNOŚĆ WARIANCJI
Teraz widzisz czemu aż tak mi zależało na zmiennej grupującej ; )
Oczywiście definiujemy pierwszą i drugą grupę tak samo jak wcześniej.
0 → kobiety
1 → mężczyźni
Test Levene’a jedności wariancji:
H0 : σ12 = σ22 ∖ nHA : σ12 ≠ σ22 ∖ n ∖ nF = 1, 151 ∖ n
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że wariancje czasu obsługi klienta przez kobiety po szkoleniu i mężczyzn po szkoleniu są równe.
… odrzucamy H0 na rzecz HA , co oznacza, że wariancje czasu obsługi klienta przez kobiety po szkoleniu i mężczyzn po szkoleniu nie są równe.
IV ETAP – TEST T RÓWNOŚCI ŚREDNICH
Test t równości średnich:
H0 : μ1 = μ2 ∖ nHA : μ1 ≠ μ2 ∖ n ∖ nt = −0, 758 ∖ ndf = 38 ∖ np = 0, 453 > α = 0, 05
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że średnie czasy obsługi kobiet po szkoleniu i mężczyzn po szkoleniu są równe.
… odrzucamy H0 na rzecz HA , co oznacza, że średnie czasy obsługi kobiet po szkoleniu i mężczyzn po szkoleniu nie są równe.
Jeśli czasy obsługi są równe, to płeć nie była czynnikiem różnicującym. ; )
Porównywanie średnich zależnych.
Inny typ zadania.
Taki, gdzie mamy już zmienne zależne – trochę łatwiejsze i szybsze w wykonaniu.
Np. sprawdzenie czy kobiety po szkoleniu obsługiwały klientów szybciej niż przed nim.
Czyli czy kobiety_przed i kobiety_po mają taki sam średni
czas obsługi!!
Czy krócej, czy dłużej – to piszemy dopiero w hipotezie alternatywnej!!
Zaczynamy!
Zmienne zależne
|
---|
Po przyporządkowaniu zmiennych w odpowiedniej kolejności, przechodzimy do ostatecznego wyniku:
Test t dla prób zależnych:
H0 : μ1 = μ2 ∖ nHA : μ1 ≠ μ2 ∖ n ∖ nt = 2, 572 ∖ ndf = 39 ∖ np = 0, 014 < α = 0, 05 ∖ n
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że średnie czasu obsługi przed szkoleniem i po szkoleniu przez kobiety są równe.
… odrzucamy H0 na rzecz HA , co oznacza, że średnie czasu obsługi przed szkoleniem i po szkoleniu przez kobiety nie są równe.
Sprawdzenie, czy średnie są większe/mniejsze od X.
Ostatni typ zadania! ; )
Sprawdź czy średni czas obsługi kobiet po szkoleniu był dłuższy / krótszy niż XXX.
A więc robimy to co przy podstawowym teście (estymacje itd.).
Kobiety po szkoleniu |
---|
Etap I |
Etap II |
Różnice:
1. Zmieniamy wartość testowaną
2. Patrzymy na „TEST” a nie na „STATYSTYKĘ” – jak poprzednio ; )
3.
$${H_{0}:\ \mu = \ \mu_{0}\backslash n}{H_{A}:\ \mu > \ \mu_{0}\backslash n}\backslash n{\mu_{0} = 25\backslash n}{t = - 8,805\backslash n}{df = 39\backslash n}{\frac{p}{2} = 0,0000 < \alpha = 0,05}$$
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0, co oznacza, że średnie czasy obsługi klientów przez kobiety po szkoleniu są istotnie równe 25 min.
… odrzucamy H0 na rzecz HA , co oznacza, że średnie czasy obsługi klientów przez kobiety po szkoleniu są wyższe od/ niższe niż 25 min.
C. Inne działy:
Szeregi czasowe
Szeregi czasowe dzielimy na:
Momentu - charakter zasobu, np. liczba pracowników lub studentów
Okresu - zmienna o charakterze strumienia
Rodzaje miar dynamiki:
przyrost | Indeksy indywidualne (o ile %) | Rok | |
---|---|---|---|
Łańcuchowe | (Δ = yt − yt − 1) |
$$\frac{y_{t}}{y_{t - 1}}\ \ *100\%$$ |
Poprzedni = 100% |
Jednopodstawowe | (Δ = yt − y0) |
$$\frac{y_{t}}{y_{0}}\ \ *100\%$$ |
bazowy = 100% |
Tempo zmian:
$\frac{y_{t} - y_{0}}{y_{0}}*100\%$
Średnie tempo zmian:
$\overline{T} = \ \sqrt[{(n - 1)}]{\frac{y_{n}}{y_{1}}}\ *100\% - 1$
Na statystyce mamy tylko podstawy szeregów, a spotkać się możemy z 3 typami zadań:
1 typ zadania:
Sprzedaż w 2004 roku wynosiła 20 tys. sztuk a w 2009 roku 100 tys. sztuk. Sprzedaż wzrosła w badanym okresie ……….. razy tj. o ……%., średnie tempo zmian wynosiło …….
100 / 20 = 5
100/20 * 100%-100% = 500% - 100% = 400%
W.w wzór =$\ \overset{\overline{}}{T}$ =38%
2 typ zadania:
1. Określić typ szeregu czasowego……. |
---|
Momentu |
2. Obliczyć przyrosty absolutne łańcuchowe. Podać interpretację dla 2007 roku. |
W roku 2007 dokonano o 166 mln więcej transakcji niż w roku 2006. |
3. Obliczyć przyrosty jednopodstawowe przyjmując poziom z roku 2000 za podstawę porównań. Podać interpretację dla 2007 roku. |
W roku 2007 dokonano o 795 mln więcej transakcji niż w roku 2000. |
4. Obliczyć indeksy łańcuchowe. Podać interpretację dla 2007 roku. |
W roku 2007 dokonano o 18% więcej transakcji niż w roku 2006. |
5. Obliczyć indeksy jednopodstawowe przyjmując poziom z roku 2000 za podstawę porównań. Podać interpretację dla 2007 roku. |
W roku 2007 dokonano o 283% więcej transakcji niż w roku 2000. |
6. Obliczyć i podać interpretację średniego tempa zmian |
21,1% |
W latach 2000-2007 z roku na rok liczba transakcji rosła średnio o 21,1% |
3 typ zadania:
1. Określić rodzaj indeksów………… |
---|
Łańcuchowe |
2. Liczba sprzedanych samochodów |
□ rosła □ malała □ podlegała wahaniom |
Rosła |
3. Najwyższe tempo zmian wystąpiło w ……. i wynosiło …….. |
2002r. 37,1% |
4. Najniższe tempo zmian wystąpiło w ……. i wynosiło…….. |
2005r. 4,3% |
5. Najwyższa sprzedaż była w ………., a najniższa w ……….. |
2006r. 2001r. |
6. Zamienić przedstawiony ciąg indeksów na indeksy jednopodstawowe przyjmując poziom z roku 2001 za podstawę porównań. Podać interpretację indeksów dla 2006 roku: |
jedno…. z roku bieżącego = łańcuchowy * jedno…. z roku poprzedniego |
łańcuchowy = $\frac{jedno\ldots\ z\ roku\ biez.}{jedno\ldots\ z\ roku\ poprz.}$ |
a. łańcuchowego…. |
W roku 2006 wydano o 7,3% więcej środków na reklamę niż w roku 2005. |
b. jednopodstawowego… |
W roku 2006 wydano o 114,2% więcej środków na reklamę niż w roku 2001. |
Testy parametryczne
Tak serio to każde zadanie podaje multum danych, które musimy:
Wykorzystać we…
.. wzorach, które mamy podane…
… zapisując dodatkowo:
Hipotezy
Obliczenia
Wniosek
Rozwiąże jedno przykładowe:
Zad. 1
Wysunięto przypuszczenie, że średni tygodniowy czas pracy pracowników zatrudnionych w transporcie nie przekracza 40 godzin. W losowo wybranej grupie pracowników otrzymano średnią arytmetyczną 38,4 godz. i odchylenie standardowe 6,5 godz. Przyjąć założenie, że wyniki pochodzą z populacji o rozkładzie normalnym.
Słuszność wysuniętego przypuszczenia zweryfikować na poziomie istotności 0,05 przy założeniu, że wyniki otrzymano na podstawie próby liczącej 26 pracowników
Dane:
μ |
40 |
---|---|
$$\overset{\overline{}}{x}$$ |
38,4 |
s | 6,5 |
α | 0,05 |
n | 26 |
H0 : μ = μ0
$${H_{A}:\mu > \ \mu_{0}\backslash n}{t = \ \frac{\overset{\overline{}}{x} - \mu}{s}\ *\ \sqrt{n - 1} = \frac{38,4 - 40}{6,5}*5 = ( - 1,23)\backslash n}{\left| t \right| = 1,23\backslash n}{t_{\alpha} = 2,060\backslash n}\backslash n{\left| t \right| < \ t_{\alpha}\backslash n}$$
Na poziomie istotności α=0,05…
… nie ma podstaw do odrzucenia H0 , co oznacza, że średni czas pracy zatrudnionych w transporcie jest istotnie równy 40 godzin.
… odrzucamy H0 na rzecz HA , co oznacza, że średni czas pracy zatrudnionych w transporcie jest istotnie wyższy niż 40 godzin.
Estymacja
Estymatory:
Średniej arytmetycznej:
Zgodny
Nieobciążony
Efektywny
Wskaźnik struktury:
Zgodny
Nieobciążony
Efektywny
A teraz zadania..
Estymacja to takie podcinanie sobie żył, bo wszystko liczy SPSS! ; D
I od razu uprzedzam, że wzory podane tutaj są TYLKO I WYŁĄCZNIE PRZYKŁADOWE!!
Bo każdy może wystąpić w 3 wariantach, w zależności od tego, czy:
Znamy odchylenie w populacji
Próba jest duża n > 30
Próba jest mała n < 30
Zadanka!
Średni błąd szacunku:
$$S_{\overset{\overline{}}{x}}$$
Średnie YYY (oszacowane na podstawie n-elementowej próby) różnią się przeciętnie od rzeczywistej średniej o $\pm \ S_{\overset{\overline{}}{x}}$j.
Oszacowanie estymacji metodą punktową:
$$\mu = \overset{\overline{}}{x} \pm S_{\overset{\overline{}}{x}}$$
Należy oczekiwać, że średnie YYY w populacji wyniosą $\overset{\overline{}}{x}$ ze średnim błędem szacunku $\pm \ S_{\overset{\overline{}}{x}}$j.
Maksymalny błąd szacunku dla α = 0,05:
d = zα * sr. bl. szacunku ∖ n
ν = n − 1 ∖ n
Z ufnością 0,95 średnie YYY badanej populacji różnią się o nie więcej niż d j. od średniej.
Oszacowanie estymacji metodą przedziałową:
$P\left\{ \overset{\overline{}}{x} - d \leq \mu \leq \overset{\overline{}}{x} + d\ \right\} = 1 -$α
Z ufnością 0,95 przedział o krańcach od A do B pokrywa się ze średnią wartością YYY.
Minimalna liczebność próby:
n = $\left( \frac{\mathbf{t}_{\mathbf{\alpha}}\mathbf{\ }\mathbf{s}}{\mathbf{d}} \right)\mathbf{\ *\ }\left( \frac{\mathbf{n}^{\mathbf{'}}}{\mathbf{n}^{\mathbf{'}}\mathbf{- 1}} \right)$
gdzie
$\left( \frac{n^{'}}{n^{'} - 1} \right)\ \rightarrow \ $n z zadania
ESTYMACJA WSKAŹNIKA STRUKTURY W POPULACJI:
k = np. spośród 100 prób wylosowano 50 mężczyzn, to k=50
$$\hat{p}\ \rightarrow w\ \text{procentac}h\backslash n$$
Odczytywanie z tablicy rozkładu normalnego.
α = 0, 05 ∖ n
Szukamy liczby 0,975 i z jego przecięć odczytujemy:
zα = 1,96
Mam niestety za mało czasu, aby wyjaśnić to krok po kroku
Wierzę, że sami to ogarniecie, albo po prostu olejecie, bo SPSS jest o wieeeele łatwiejszy. ; )
Przygotowałem jeszcze jedno zadanko, takie jakie było na kole.
Dla wszystkich jest ono istnym kosmosem.
A nawet nie trzeba zadania rozumieć, wystarczy podpasować to co mamy pod prawdopodobny wzór ; )
Taka zgadywanka niby, oszukiwanie, ale tak naprawdę, mając mało danych – mało ich potrzebujemy! ; )
A oto i zadanie:
Estymacja - kiedy mamy mało danych a zadanie wydaje się niemożliwe do wykonania.
Celem przeprowadzonej kontroli w Urzędzie Wojewódzkim X była ocena postępowania wobec zaległości z mandatów karnych kredytowanych.
1. Ile należy wylosować spraw do próby, aby z ufnością 95% i maksymalnym błędem szacunku 5 p.p oszacować udział nieprawidłowych działań w tym zakresie.
d = 0, 05 ∖ n
$$n = \left( \frac{z_{\alpha}}{2d} \right)^{2} = \left( \frac{1,96}{2*0,05} \right)^{2} = 384,16\ \approx 385$$
2. W pobranej losowo próbie o ustalonej w pkt. 1 liczebności stwierdzono 20 nieprawidłowości . Metodą przedziałową z ufnością 95% oszacować udział nieprawidłowości w populacji spraw.
Stwierdzić, czy urzędowi zostanie wydana pozytywna ocena pokontrolna, jeżeli przyjęto, że udział nieprawidłowych działań nie może przekroczyć 5%.
$${\hat{p} = \ \frac{20}{385} = 0,052 = 5,2\%\backslash n}{P\left\{ 5,2\% - 1,96*\sqrt{\frac{5,2\%*94,8\%}{385}} \leq p \leq 5,2\% + 1,96*\sqrt{\frac{5,2\%*94,8\%}{385}} \right\} = 1 - 0,05\backslash n}{P\left\{ 2,98\% \leq p \leq 7,42\% \right\} = 0,95\backslash n}\backslash n$$
3. W czasie poprzedniej kontroli stwierdzono 15 nieprawidłowości w 500 losowo wybranych działaniach windykacyjnych. Czy z ufnością 95% można stwierdzić, że pogorszyła/poprawiła się skuteczność działania urzędu w tym zakresie.
$$\hat{p} = \ \frac{15}{500} = 0,03 = 3\%$$
$${P\left\{ 3\% - 1,96*\sqrt{\frac{3\%*97\%}{500}} \leq p \leq 3\% + 1,96*\sqrt{\frac{3\%*97\%}{500}} \right\} = 1 - 0,05\backslash n}{P\left\{ 1,51\% \leq p \leq 4,50\% \right\} = 0,95\backslash n}\backslash n$$
Rozkład Normalny
I w końcu najłatwiejsze zadania – obliczanie jednym wzorem WSZYSTKIEGO! ; D
Zad.1.
Rozkład wysokości udzielanych kredytów (w tys. zł) na zakup samochodu w pewnym banku jest zgodny z rozkładem normalnym o następującej funkcji gęstości:
$f\left( x \right) = \frac{1}{\sigma\ \sqrt{2\pi}}\ e^{\left\{ - \ \frac{{(x - \mu)}^{2}}{2\sigma^{2}} \right\}}$ N (μ, σ2)
Wartość i interpretacja:
odchylenia standardowego:
Wysokość udzielonych kredytów odchyla się przeciętnie od wartości oczekiwanej o σ j.
wartości oczekiwanej:
Średnia wysokość udzielonego kredytu wynosi μ j.
mediany:
Środkowa wartość pomiarowa, tzn. taka, że połowa pozostałych wartości jest mniejsza, a połowa większa od niej; dzieli zbiór pomiarów na dwie równe części, to: μ j.
dominanty:
Liczba będąca najczęściej przyjmowaną wartością pomiarową to μ j.
Wykres:
Połowa kredytobiorców zaciągnęła kredyt na kwotę co najmniej 50 tys. zł (mediana)
Najwięcej kredytobiorców zaciągnęła kredyt na kwotę 50 tys. zł (dominanta)
Jakie jest prawdopodobieństwo, że losowo wybrana osoba zaciągnęła kredyt na więcej niż 22 tys. zł.
$${P\left( > 22\ 000 \right) = \ P\left( z > \frac{22\ 000 - 50\ 000}{8\ 000} \right) = \ P\left( z > - 3,50 \right) = 1\ - F\left( - 3,50 \right) = 1 - 0,0002 = 0,9998\backslash n}\backslash n$$
Ilu spośród 300 kredytobiorców zaciągnęło kredyt od 55 do 72 tys. zł.
$P\left( 72\ 000 > > 55\ 000 \right) > \ P\left( \frac{72\ 000 - 50\ 000}{8\ 000} > z > \frac{55\ 000 - 50\ 000}{8\ 000} \right) = \ P\left( 2,75 > z > 0,625 \right) = F\left( 2,75 \right) - F\left( 0,63 \right) = 0,9970 - 0,7357 = 0,2613$ =F(2,75)−F(0,63)=0,9970−0,7357=0,2613
0, 2613 * 300=78,39Spośród 300 kredytobiorców 79 zaciągnęło kredyt na od 55 do 72 tys.
Jaki procent kredytobiorców zaciągnął kredyt na mniej niż 61 tys. Zł.
$$P\left( < 61\ 000 \right) = \ P\left( z < \frac{61\ 000 - 50\ 000}{8\ 000} \right) = \ P\left( z < 1,375 \right) = F\left( 1,38 \right) = 0,9162$$
91,62% kredytobiorców zaciągnęła kredyt na mniej niż 61 tys. zł.
Jaka jest wysokość kredytu 20% klientów, którzy zaciągnęli najniższy kredyt.
$$P\left( < a \right) = P\left( z < \ \frac{a\ - 50\ 000}{8\ 000} \right) = F\ \left( \frac{a\ - 50\ 000}{8\ 000} \right) = 0,2\backslash n$$
Oblicz prawdopodobieństwo, że średnia wysokość kredytu wynosi więcej niż 60 tys. zł, kiedy wylosowano 100 prób.
$P\left( \overset{\overline{}}{x} > 60\ 000 \right) = P\left( z > \ \frac{\overset{\overline{}}{x} - \mu}{\sigma}\ *\ \sqrt{n} \right) = P\left( z > \ \frac{60\ 000 - 50\ 000}{8\ 000}\ *10 \right) = P\left( z > 12,5 \right) = 1\ - F\left( 12,5 \right) = 1 - 0,9999 = 0,0001\%$
Prawdopodobieństwo, że średnia wysokość kredytu wynosi więcej niż 60 tys. zł, kiedy wylosowano 100 prób wynosi 0,0001%.
Dodatki:
Znaki w próbie i w populacji:
próba | populacja | |
---|---|---|
$$\overset{\overline{}}{x}$$ |
μ |
średnia |
s | σ |
Odchylenie standardowe |
$$\hat{p}$$ |
p | Wskaźnik struktury |
Któro-stronność rozkładu, czyli kiedy dzielimy α przez 2:
TESTY PARAMETRYCZNE
Kiedy HA ≠
p jednostronne x2
HA < >
p dwustronne / 2
TESTY NIEPARAMETRYCZNE
Test serii Stevensa - dwustronny
Test zgodność DKS - prawostronny
Test jednorodności: - lewostronny
Test znaków
Test W-W
Dzięki za skorzystanie z mojego poradnika / samouczka.
Zapraszam do moich pozostałych materiałów.
Mam nadzieję, że wszystko zaliczysz na 5 a wiedza pozostanie na dłużej ; )
Pozdrawiam,
Filip Macikowski