Rozdział 14
14. ZADANIA Z WYKORZYSTANIEM KOMPUTEROWEGO WSPOMAGANIA STATYSTYKI
Zadania dotyczą przede wszystkim zagadnień związanych z wnioskowaniem statystycznym. Do tekstu każdego zadania dołączone są wydruki komputerowe. Wydruki mają z jednej strony zmniejszyć pracochłonność rozwiązywania zadań, z drugiej zaś służyć wyrobieniu umiejętności korzystania z komputerowego wspomagania obliczeń.
Wydruki komputerowe są podane w większości zadań w dwóch wersjach. Pierwsza wersja jest zawsze kopią ekranu odpowiedniej procedury programu Statgraphics, nr 5. Druga wersja jest fragmentem lub całością ekranu z tłumaczeniami polskimi lub odpowiednimi symbolami tam, gdzie jest to możliwe i sensowne. Kopiowanie fragmentów, a nie całego ekranu, jest dlatego uzasadnione, iż w niektórych procedurach podawane są na jednym ekranie tematycznie różne wyniki obliczeń. Mogą być one zatem wykorzystywane do różnego typu zadań. Wydruk drugi tworzono zawsze z wydruku pierwszego, oryginalnego, tłumacząc podstawowe sformułowania z języka angielskiego lub zastępując je odpowiednimi, powszechnie stosowanymi symbolami po to, aby nie uzależniać umiejętności posługiwania się komputerowym wspomaganiem obliczeń od znajomości języka angielskiego.
Dobrze jest korzystać z wydruku (pierwszego oryginalnego lub z jego drugiej wersji), gdyż w ten sposób znacznie skracamy czas rozwiązywania zadań. Bez odwoływania się do wydruków rozwiązanie zadań jest również możliwe, ale bardziej pracochłonne. Jaka jest praktycznie rola i przydatność komputerowego wspomagania statystyki może uświadomić nam dwukrotne rozwiązanie któregoś z zadań (bez oraz z wykorzystaniem wydruku). Wybór sposobu rozwiązywania zadań należy jednak w ostateczności do osoby rozwiązującej zadania.
Przed przystąpieniem do pracy proszę zapoznać się z podanymi niżej uwagami:
Uwaga 1) w tych zadaniach, w których nie jest to podane, a jest potrzebne, proszę przyjąć 1 - α = 0,95 lub α = 0,05.
Uwaga 2) wartości z odpowiednich tablic proszę podawać z przybliżeniem wtedy, gdy tablice nie są wystarczająco dokładne.
Zadanie 14.1
Na podstawie wieloletnich badań pewnej populacji ustalono, że prawdopodobieństwo urodzenia się dziewczynki wynosi 0,48 (bez względu na liczbę dzieci w małóeństwie i kolejność ich urodzeń).
a) Proszę wyznaczyć i wykreślić funkcję prawdopodobieństwa zmiennej losowej, którą jest liczba dziewczynek w małóeństwie z trójką dzieci.
b) Które ze zdarzeń ma większe prawdopodobieństwo zaistnienia w małóeństwie z trójką dzieci: wszystkie dzieci są dziewczynkami czy też wszystkie dzieci są chłopcami?
ZAŁĄCZNIKI DO ZADANIA 14.1
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Tail Area Probabilities
Distributions available:
(1) Bernoulli (7) Beta (13) Lognormal
(2) Binomial (8) Chi-square (14) Normal
(3) Discrete uniform (9) Erlang (15) Student's t
(4) Geometric (10) Exponential (16) Triangular
(5) Negative binomial (11) F (17) Uniform
(6) Poisson (12) Gamma (18) Weibull
Distribution number: 2
Number of trials: 3
Event probability: 0,48
Area at or below 0 = 0,140608
Area at or below 1 = 0,529984
Area at or below 2 = 0,889408
Area at or below 3 = 1
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wartości dystrybuanty rozkładu) Tail Area Probabilities
Distribution number: 2 (Numer dystrybuanty: 2 - rozkład dwumianowy)
Number of trials: 3 (n = 3)
Event probability: 0,48 (p = 0,48)
P(X ≤ k):
Area at or below 0 = 0,140608
Area at or below 1 = 0,529984
Area at or below 2 = 0,889408
Area at or below 3 = 1
Zadanie 14.2
Czas pracy (X) baterii pewnego typu jest zmienną losową o rozkładzie normalnym, określonym parametrami 370 godzin i 30 godzin, zapisujemy zatem X : N [370 godz., 30 godz.].
a) Gdyby na opakowaniu baterii podano gwarantowany czas pracy jako 340 godzin, wówczas jaki procent sprzedanych baterii mógłby być reklamowany?
b) Jaki czas pracy baterii byłby czasem minimalnym, gwarantowanym, gdyby producent dopuścił możliwość reklamacji: 1) 10% baterii, 2) 5% baterii, 3) 1% baterii? Po analizie kosztów producent zdecydował, że może uwzględnić reklamacje w nie więcej niż 1% sprzedanych baterii. Jaki czas pracy należy na opakowaniu baterii zapisać jako minimalny gwarantowany?
c) Jak często przedsiębiorca kupujący stale do obsługi urządzeń po 9 takich baterii trafi na baterie, których średni czas pracy będzie nie wyższy niż 390 godzin?
d) Jak często przedsiębiorca kupujący stale do obsługi urządzeń po 9 takich baterii trafi na baterie, których wariancja czasu pracy będzie nie wyższa niż 1100 godzin?
ZAŁĄCZNIKI DO ZADANIA 14.2, punkt a)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Tail Area Probabilities
Distributions available:
(1) Bernoulli (7) Beta (13) Lognormal
(2) Binomial (8) Chi-square (14) Normal
(3) Discrete uniform (9) Erlang (15) Student's t
(4) Geometric (10) Exponential (16) Triangular
(5) Negative binomial (11) F (17) Uniform
(6) Poisson (12) Gamma (18) Weibull
Distribution number: 14
Mean: 370
Standard deviation: 30
Area at or below 340 = 0,158655
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wartości dystrybuanty rozkładu) Tail Area Probabilities
Distribution number: 14 (Numer dystrybuanty: 14 - rozkład normalny)
Mean: 370 (m = 370)
Standard deviation: 30 (σ = 30)
P(X ≤ x):
Area at or below 340 = 0,158655
ZAŁĄCZNIKI DO ZADANIA 14.2, punkt b)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Critical Values
Distributions available:
(1) Bernoulli (7) Beta (13) Lognormal
(2) Binomial (8) Chi-square (14) Normal
(3) Discrete uniform (9) Erlang (15) Student's t
(4) Geometric (10) Exponential (16) Triangular
(5) Negative binomial (11) F (17) Uniform
(6) Poisson (12) Gamma (18) Weibull
Distribution number: 14
Mean: 370
Standard deviation: 30
Area at or below 331,553 = 0,1
Area at or below 320,654 = 0,05
Area at or below 300,209 = 0,01
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wartości krytyczne) Critical Values
Distribution number: 14 (Numer dystrybuanty: 14 - rozkład normalny)
Mean: 370 (m = 370)
Standard deviation: 30 (σ = 30)
P(X ≤ x):
Area at or below 331,553 = 0,1
Area at or below 320,654 = 0,05
Area at or below 300,209 = 0,01
ZAŁĄCZNIKI DO ZADANIA 14.2, punkt c)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Tail Area Probabilities
Distributions available:
(1) Bernoulli (7) Beta (13) Lognormal
(2) Binomial (8) Chi-square (14) Normal
(3) Discrete uniform (9) Erlang (15) Student's t
(4) Geometric (10) Exponential (16) Triangular
(5) Negative binomial (11) F (17) Uniform
(6) Poisson (12) Gamma (18) Weibull
Distribution number: 14
Mean: 370
Standard deviation: 10
Area at or below 390 = 0,97725
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wartości dystrybuanty rozkładu) Tail Area Probabilities
Distribution number: 14 (Numer dystrybuanty: 14 - rozkład normalny)
Mean: 370 (m = 370)
Standard deviation: 10 (σ = 10)
P(X ≤ x):
Area at or below 390 = 0,97725
ZAŁĄCZNIKI DO ZADANIA 14.2, punkt d)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Tail Area Probabilities
Distributions available:
(1) Bernoulli (7) Beta (13) Lognormal
(2) Binomial (8) Chi-square (14) Normal
(3) Discrete uniform (9) Erlang (15) Student's t
(4) Geometric (10) Exponential (16) Triangular
(5) Negative binomial (11) F (17) Uniform
(6) Poisson (12) Gamma (18) Weibull
Distribution number: 8
Degrees of freedom: 8
Area at or below 11 = 0,798301
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wartości dystrybuanty rozkładu) Tail Area Probabilities
Distribution number: 8 (Numer dystrybuanty: 8 - rozkład chi-kwadrat)
Degrees of freedom: 8 (stopnie swobody v : 8)
P(
)
Area at or below 11 = 0,798301
ZADANIE 14.3
Powstałe w bieżącym roku Stowarzyszenie Abstynentów Telewizyjnych zleciło statystykowi badanie, którego celem było oszacowanie średniego czasu spędzanego przed telewizorami w dni powszednie przez osoby dorosłe. Czas oglądania telewizji (w godzinach) zaobserwowany wśród sąsiadów prowadzącego badanie był następujący: 2, 5, 4, 1, 3, 4, 1, 3, 4. Na ich podstawie obliczono między innymi granice przedziału ufności dla średniego czasu oglądania (w godzinach): (1,418; 4,582) oraz dla wariancji czasu oglądania (w godz2.): (0,7288; 11,9029).
a) Jakie współczynniki ufności przyjęto przy przedziałowej estymacji średniego czasu oglądania i wariancji czasu oglądania telewizji w dni powszednie przez osoby dorosłe?
b) Gdyby ponownie przedziałowo oszacować średni czas oglądania i wariancję czasu oglądania przy współczynniku ufności 0,96, wówczas jakiej relacji (równości, mniejszości, większości) można oczekiwać między długościami obu przedziałów ufności?
c) Jaki jest wynik weryfikacji hipotezy mówiącej, że średni czas oglądania telewizji w dni powszednie w populacji osób dorosłych wynosi 4 godziny?
d) Jakie zastrzeżenia można sformułować wobec tak przeprowadzonego badania?
ZAŁĄCZNIKI DO ZADANIA 14.3, punkt a)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
One-Sample Analysis Results
2 5 4 1 3 4 1 3 4
Sample Statistics: Number of Obs. 9
Average 3
Variance 2
Std. Deviation 1,41421
Median 3
Confidence Interval for Mean: 99 Percent
Sample 1 1,41788 4,58212 8 D.F.
Confidence Interval for Variance: 99 Percent
Sample 1 0,728765 11,9029 8 D.F.
Hypothesis Test for H0: Mean = 4 Computed t statistic = -2,12132
vs Alt: NE Sig. Level = 0,066688
at Alpha = 0,05 so do not reject H0.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wyniki analizy jednej próby) One-Sample Analysis Resultates
2 5 4 1 3 4 1 3 4
Sample Statistics: (n) Number of Obs. 9
(średnia arytmetyczna) Average 3
(wariancja) Variance 2
(odchylenie standardowe) Std. Deviation 1,41421
Median 3
Confidence Interval for Mean: 99 Percent (procent)
(przedział ufnoSci dla sredniej) 1,41788 4,58212 8 D.F.
Confidence Interval for Variance: 99 Percent (procent)
(przedział ufnoSci dla wariancji) 0,728765 11,9029 8 D.F.
ZAŁĄCZNIKI DO ZADANIA 14.3, punkt b) i punkt c)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
One-Sample Analysis Results
2 5 4 1 3 4 1 3 4
Sample Statistics: Number of Obs. 9
Average 3
Variance 2
Std. Deviation 1,41421
Median 3
Confidence Interval for Mean: 96 Percent
Sample 1 1,84522 4,15478 8 D.F.
Confidence Interval for Variance: 96 Percent
Sample 1 0,880658 7,87306 8 D.F.
Hypothesis Test for H0: Mean = 4 Computed t statistic = -2,12132
vs Alt: NE Sig. Level = 0,066688
at Alpha = 0,05 so do not reject H0.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wyniki analizy jednej próby) One-Sample Analysis Resultates
2 5 4 1 3 4 1 3 4
Sample Statistics: (n) Number of Obs. 9
(średnia arytmetyczna) Average 3
(wariancja) Variance 2
(odchylenie standardowe) Std. Deviation 1,41421
Median 3
Confidence Interval for Mean: 96 Percent (procent)
(przedział ufności dla średniej) 1,84522 4,15478 8 D.F.
Confidence Interval for Variance: 96 Percent (procent)
(przedział ufności dla wariancji) 0,880658 7,87306 8 D.F.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
Hypothesis Test for H0 : Mean = 4 Computed t statistic = -2,12132
(Test dotyczący hipotezy H0 : m = 4 ) (obliczona statystyka t)
(wobec alternatywy:) vs Alt: NE (Not-nie, Equal-równy) Sig. Level = 0,066688
(znaczący poziom istotności)
(przy poziomie istotności α) at Alpha = 0,05 so do not reject H0.
(nie ma podstaw do odrzucenia
hipotezy sprawdzanej H0)
Zadanie 14.4
Czy członkowie Partii Upartych mogą się cieszyć ze wzrostu w społeczeństwie frakcji swoich zwolenników, jeżeli w losowej próbie liczącej 1200 osób było ich w roku bieżącym 108, a w roku ubiegłym w tak samo licznej, niezależnej próbie znalazły się 84 osoby popierające tę partię?
Przy jakiej różnicy między liczbą zwolenników z obu 1200 elementowych prób podjęta wyżej, przy wybranym poziomie istotności, decyzja weryfikacyjna uległaby zmianie (bez zmiany poziomu istotności)?
Zadanie 14.5
Trzy konkurujące ze sobą firmy farmaceutyczne wyprodukowały leki przeciwbólowe o podobnym przeznaczeniu. Zakładamy, że czas działania leku jest zmienną losową o rozkładzie normalnym. Czasy działania leków o porównywalnych dawkach były dla losowo wybranych pacjentów następujące (w godz.):
Firma A (1): 8, 11, 12, 9,
Firma B (2): 8, 6, 4, 7, 5,
Firma C (3): 10, 8, 9.
a) Jakie znaczenie dla oceny jakości leków ma stwierdzenie, iż zróżnicowanie czasów działania poszczególnych leków jest:
1) niewielkie dla różnych leków, 2) jednakowe dla różnych leków?
b) Jakie wartości parametrów m i σ są wyrazem sukcesu firmy?
c) Czy zróżnicowanie czasu działania poszczególnych leków jest istotnie różne?
d) Której firmy lek ma istotnie dłuższą wartość średnią czasu działania?
(Na pytania punktu c) i d) proszę odpowiedzieć na podstawie parami porównywanych firm).
ZAŁĄCZNIKI DO ZADANIA 14.5, punkt d)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Firma 1 i firma 2
Two-Sample Analysis Results
8 11 12 9 8 6 4 7 5 Pooled
Sample Statistics: Number of Obs. 4 5 9
Average 10 6 7,77778
Variance 3,33333 2,5 2,85714
Std. Deviation 1,82574 1,58114 1,69031
Median 10 6 8
Difference between Means = 4
Conf. Interval For Diff. in Means: 95 Percent
(Equal Vars.) Sample 1 - Sample 2 1,31799 6,68201 7 D.F.
(Unequal Vars.) Sample 1 - Sample 2 1,17904 6,82096 6,0 D.F.
Ratio of Variances = 1,33333
Conf. Interval for Ratio of Variances: 95 Percent
Sample 1 - Sample 2 0,133609 20,1361 3 4 D.F. Hypothesis Test for H0: Diff = 0 Computed t statistic = 3,52767
vs Alt: GT Sig. Level = 4,81396E-3
at Alpha = 0,05 so reject H0.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
Hypothesis Test for H0: Diff = 0 Computed t statistic = 3,52767
(Test dotyczący hipotezy:) H0: m1 - m2 = 0 (obliczona statystyka t)
(wobec alternatywy:) vs Alt: GT (G n Greater, T - Then) Sig. Level = 4,1396E-3
(znaczący poziom istotności)
(przy poziomie istotności α) at Alpha = 0,05 so reject H0.
(odrzucamy hipotezę sprawdzaną H0)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Firma 1 i firma 3
Two-Sample Analysis Results
8 11 12 9 10 8 9 Pooled
Sample Statistics: Number of Obs. 4 3 7
Average 10 9 9,57143
Variance 3,33333 1 2,4
Std. Deviation 1,82574 1 1,54919
Median 10 9 9
Difference between Means = 1
Conf. Interval For Diff. in Means: 95 Percent
(Equal Vars.) Sample 1 - Sample 2 -2,04254 4,04254 5 D.F.
(Unequal Vars.) Sample 1 - Sample 2 -1,82355 3,82355 4.7 D.F.
Ratio of Variances = 3,33333
Conf. Interval for Ratio of Variances: 95 Percent
Sample 1 - Sample 2 0,0851089 53,481 3 2 D.F.
Hypothesis Test for H0: Diff = 0 Computed t statistic = 0,845154
vs Alt: GT Sig. Level = 0,218294
at Alpha = 0,05 so do not reject H0.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
Hypothesis Test for H0: Diff = 0 Computed t statistic = 0,845154
(Test dotyczący hipotezy:) H0: m1 - m2 = 0 (obliczona statystyka t)
(wobec alternatywy:) vs Alt: GT (G - Greater, T - Then) Sig. Level = 0,218294
(znaczący poziom istotności)
(przy poziomie istotności α) at Alpha = 0,05 so do not reject H0.
(nie ma podstaw do odrzucenia hipotezy sprawdzanej H0)
Wersja 1: wydruk oryginalny, program statgraphics 5:
Firma nr 3 i firma nr 2
Two-Sample Analysis Results
10 8 9 8 6 4 7 5 Pooled
Sample Statistics: Number of Obs. 3 5 8
Average 9 6 7,125
Variance 1 2,5 2
Std. Deviation 1 1,58114 1,41421
Median 9 6 7,5
Difference between Means = 3
Conf. Interval For Diff. in Means: 95 Percent
(Equal Vars.) Sample 1 - Sample 2 0,472074 5,52793 6 D.F.
(Unequal Vars.) Sample 1 - Sample 2 0,754727 5,24527 5,9 D.F.
Ratio of Variances = 0.4
Conf. Interval for Ratio of Variances: 95 Percent
Sample 1 - Sample 2 0,0375596 15,6994 2 4 D.F.
Hypothesis Test for H0: Diff = 0 Computed t statistic = 2,90474
vs Alt: GT Sig. Level = 0,0135831
at Alpha = 0,05 so reject H0.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
Hypothesis Test for H0: Diff = 0 Computed t statistic = 2,90474
(Test dotyczący hipotezy:) H0: m1 - m2 = 0 (obliczona statystyka t)
(wobec alternatywy:) vs Alt: GT (G - Greater, T - Then) Sig. Level = 0,0135831
(znaczący poziom istotności)
(przy poziomie istotności α) at Alpha = 0,05 so reject H0.
(odrzucamy hipotezę sprawdzaną H0)
Zadanie 14.6
Z badań wynika, że iloraz inteligencji jest zmienną losową o rozkładzie normalnym, a populacje ludzkie różnią się jedynie parametrami tego rozkładu. W celu sprawdzenia tej hipotezy wylosowano i zbadano 150 uczniów szkół podstawowych, których średnia arytmetyczna ilorazu inteligencji wyniosła 111,23 punkta a odchylenie standardowe 19,3814 punkta. Pozostałe dane zamieszczono niżej:
Liczebności empiryczne |
8 |
35 |
54 |
44 |
9 |
Liczebności teoretyczne |
8 |
34 |
59 |
39 |
10 |
Proszę zweryfikować hipotezę o zgodności rozkładu z normalnym.
Proszę podać poziom istotności, przy którym podjęta wyżej decyzja weryfikacyjna mogłaby ulec zmianie.
ZAŁĄCZNIKI DO ZADANIA 14.6
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Chisquare Test
Lower Limit |
Upper Limit |
Observed Frequency |
Expected Frequency |
Chisquare |
at or below 80000 100000 120000 above 140000 |
80000 100000 120000 140000 |
8 35 54 44 9 |
8,0 34,1 59,0 38,5 10,3 |
.000135 .021677 .425224 .788557 .170619 |
Chisquare = 1,40621 with 2 d.f. Sig. level = 0,495045
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
Chisquare Test (Test chi-kwadrat)
(Dolna granica) Lower Limit |
(Górna granica) Upper Limit |
Observed Frequency (liczebności obserwowane) |
Expected Frequency (liczebności oczekiwane) |
(Chi-kwadrat) Chisquare |
at or below (≤) 80000 100000 120000 above (>) 140000 |
80000 100000 120000 140000 |
8 35 54 44 9 |
8,0 34,1 59,0 38,5 10,3 |
.000135 .021677 .425224 .788557 .170619 |
(Chi - kwadrat) Chisquare = 1,40621 (z 2 stopniami swobody) with 2 d.f. Sig.level = 0,495045 (znaczący poziom istotności)
Zadanie 14.7
Trzy konkurujące ze sobą firmy farmaceutyczne wyprodukowały leki przeciwbólowe o podobnym przeznaczeniu. Zakładamy, że czas działania leku jest zmienną losową o rozkładzie normalnym. Natomiast czasy działania leków o porównywalnych dawkach były dla losowo wybranych pacjentów następujące (w godz):
Firma A (1): 8, 11, 12, 9,
Firma B (2): 8, 6, 4, 7, 5,
Firma C (3): 10, 8, 9.
Czy czynnik, pochodzenie leku, różnicuje średnią długość czasu działania leku przeciwbólowego w statystycznie znaczący sposób?
ZAŁĄCZNIKI DO ZADANIA 14.7
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Firma 1, firma 2 i firma 3
One-Way Analysis of Variance
Data: 8 11 12 9 8 6 4 7 5 10 8 9
Level codes: 1 1 1 1 2 2 2 2 2 3 3 3
Labels:
Means plot: Conf. Int. Confidence level: 95 Range test: LSD
Analysis of variance
Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level
Between groups 38,916667 2 19,458333 7,960 .0102
Within groups 22,000000 9 2,444444
Total (corrected) 60,916667 11
0 missing value(s) have been excluded.
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Analiza wariancji z klasyfikacją pojedynczą) One-Way Analysis of Variance
Data (dane dotyczące zmiennej zależnej): 8 11 12 9 8 6 4 7 5 10 8 9
Level codes (dane dotyczące poziomów czynnika): 1 1 1 1 2 2 2 2 2 3 3 3
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
(Źródło (Suma kwadratów) (stopnie Fobl.
zróżnicowania) swobody)
Between groups 38,916667 2 19,458333 7,960 .0102
(międzygrupowe)
Within groups 22,000000 9 2,444444
(wewnątrzgrupowe)
Total (corrected) 60,916667 11
(ogólne)
Zadanie 14.8
Na podstawie informacji o wartościach księgowych i rynkowych 117 spółek rynku podstawowego w IV kwartale 1998 roku ("Rynek Giełdowy" nr 4/1998) oszacowano, metodą najmniejszych kwadratów, parametry liniowego modelu regresji wartości rynkowych spółek względem ich wartości księgowych otrzymując:
yi = 2,128 xi - 228,411 + ei, r2 = 0,8499, i = 1,..., 117.
[0,083] [86,483] [875,785]
a) Proszę zweryfikować hipotezę o braku wpływu wartości księgowych spółek na ich wartości rynkowe.
b) Proszę podać poziom istotności, przy którym podjęta wyżej decyzja weryfikacyjna może ulec zmianie.
c) Proszę zinterpretować odchylenie standardowe składnika resztowego oraz współczynnik determinacji.
ZAŁĄCZNIK DO ZADANIA 14.8
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Regression Analysis - Linear model: Y = a x + b
Dependent variable: RPSPKWLA.swrrp4kw98 Independent variable: RPSPKWLA.wksrp4kw9
Standard T Prob.
Parameter Estimate Error Value Level
Intercept -228,411 86,4834 -2,6411 .00941
Slope 2,12758 0,083368 25,5203 .00000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio Prob. Level
Model 4,9954E0008 1 4,9954E0008 6,513E0002 .00000
Residual 88204957 115 767000
Total (Corr.) 5,8774E0008 116
Correlation Coefficient = 0,921914 R-squared = 84,99 percent
Stnd. Error of Est. = 875785
Zadanie 14.9
W koszyku "Polityki" (z 9 stycznia 1999 roku) podano informacje o cenie fiata 126p w latach 1989-1998, w złotych (PLN): 1200, 2600, 3290, 4510, 6170, 8000, 9750, 11410, 12900, 10800.
Przyjmując t = 1,..., n; oszacowano, metodą najmniejszych kwadratów, współczynnik trendu, który wyniósł 1313,03 zł/rok i obliczono współczynnik determinacji, którego wartość wyniosła 0,943.
a) Proszę zapisać i wykreślić (naszkicować) funkcję trendu liniowego.
b) Proszę podać prognozę ceny fiata 126p na rok 2000, proszę podać średni błąd prognozy i przedział ufności prognozy wiedząc, że dla t = 1,..., n; mamy:
= 8 640 002,4 (zł)2.
ZAŁĄCZNIK DO ZADANIA 14.9
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Regression Analysis - Linear model: Y = a t + b
Dependent variable: KPOLITYK.CenaFiata Independent variable: 1 2 3 4 5 6 7 8 9
Standard T Prob.
Parameter Estimate Error Value Level
Intercept -158,667 709,93 -0,223496 .82875
Slope 1313,03 114,416 11,476 .00000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio Prob. Level
Model 1,4223E0008 1 1,4223E0008 1,317E0002 .00000
Residual 8640002,4 8 1080000,3
Total (Corr.) 1,5087E0008 9
Correlation Coefficient = 0,970945 R-squared = 94,27 percent
Stnd. Error of Est. = 1039,23
Zadanie 14.10
Półroczne zmiany indeksu giełdowego WIG w latach 1991-1998 opisane są następującym modelem trendu liniowego (t = 1,..., n):
yt = 1080,92 t - 598,05 + et, r2 = 0,8119.
[139,06] [1344,66] [2564,16]
Statystyka Durbina-Watsona: d = 1,637.
a) Proszę zweryfikować hipotezę o braku korelacji (pierwszego rzędu) między składnikami losowymi modelu trendu liniowego indeksu WIG w półroczach lat 1991-1998.
b) Proszę zbudować przedział ufności dla współczynnika trendu.
ZAŁĄCZNIKI DO ZADANIA 14.10, punkt a)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
Model fitting results for: WIGPKW98.WIGp91_8
Independent variable coefficient std. error t-value sig.level
CONSTANT -598,05 1344,658085 -0,4448 0,6633
ZC91DO98.t1_16 1080,925 139,061229 7,7730 0,0000
R-SQ. (ADJ.) = 0,7984 SE = 2564,162358 MAE = 1760,615625 DurbWat = 1,637
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
(Wyniki estymacji modelu dla zmiennej:) Model fitting results for: WIGPKW98.WIGp91_8
Independent variable coefficient std. error t-value sig.level
(zmienna niezależna) (współczynnik) (błąd standardowy) (wartość t) (znaczący po-
ziom istotności)
CONSTANT -598,05 1344,658085 -0,4448 0,6633
(wyraz wolny)
ZC91DO98.t1_16 1080,925 139,061229 7,7730 0,0000
(współczynnik trendu)
R-SQ. (ADJ.) = 0,7984 SE = 2564,162358 MAE = 1760,615625 DurbWat = 1,637
(R - skorygowane) (błąd standardowy) (statystyka Durbina-Watsona)
ZAŁĄCZNIKI DO ZADANIA 14.10, punkt b)
Wersja 1: wydruk oryginalny, program Statgraphics 5:
95 percent confidence intervals for coefficient estimates
Estimate Standard error Lower Limit Upper Limit
CONSTANT -598,05 1344,66 -3482,780 2286,68
ZC91DO98.t1_16 1080,92 139,061 782,593 1379,26
Wersja 2: wydruk skrócony i fragmentami przetłumaczony na język polski, program Statgraphics 5:
95 percent confidence intervals for coefficient estimates (95% przedziały ufności estymowanych współczynników)
Estimate Standard error Lower Limit Upper Limit
(ocena) (błąd stan- (dolna granica) (górna granica)
dardowy)
CONSTANT -598,050 1344,66 -3482,78 2286,68
(wyraz wolny)
ZC91DO98.t1_16 1080,92 139,061 782,593 1379,26
(współczynnik trendu)