ANALIZA STRUKTURY ROZKŁADU JEDNOWYMIAROWEGO
Zadanie 1:
Liczba zdobytych bramek przez pewną drużynę meczach rundy wiosennej i jesiennej przedstawia się następująco: 332122342102011231102340120422
wyznaczyć i zinterpretować średnią arytmetyczną, medianę i dominantę
porównując obliczone miary ocenić i zinterpretować kierunek asymetrii (bez obliczania siły asymetrii)
Zadanie 2:
Rozkład połowów 40 załóg kształtował się następująco:
Wysokość połowów w tonach |
Poniżej 20 |
Poniżej 40 |
Poniżej 60 |
Poniżej 80 |
Poniżej 100 |
Odsetek załóg |
10 |
40 |
75 |
95 |
100 |
w oparciu o podane informacje wyznaczyć liczbowo medianę
wyznaczyć wartość dominanty w tym rozkładzie
wartość dystrybuanty empirycznej dla x=60 zaznaczyć na wykresie
Zadanie 3
W wyniku badania losowej próby inwestorów giełdowych otrzymano następujący rozkład wielkości stopy zwrotu z inwestycji (w %)
Stopa zwrotu |
2,5-7,5 |
7,5-12,5 |
12,5-17,5 |
17,5-22,5 |
22,5-27,5 |
27,5-32,5 |
Liczba inwestorów |
10 |
20 |
40 |
70 |
40 |
20 |
obliczyć i zinterpretować średnią arytmetyczną i dominantę stopy zwrotu z inwestycji
porównując obliczone miary ocenić i zinterpretować kierunek asymetrii (bez obliczania siły)
ocenić zróżnicowanie badanego rozkładu
Zadanie 4
W celu zbadania struktury wypłaconych trzynastek w zł (X) w dwóch grupach pracowniczych pobrano dwie próby i otrzymano wyniki:
Parametry |
n |
X średnia |
do |
me |
s |
V |
A |
Grupa 1 |
100 |
1400 |
|
|
|
12% |
0 |
Grupa 2 |
100 |
2000 |
1900 |
1978 |
200 |
|
|
Uzupełnić brakujące informacje w tabelce. Dokonać wszechstronnej analizy porównawczej rozkładów wypłaconych trzynastek w obu grupach w zakresie tendencji centralnej, zróżnicowania i asymetrii.
Zadanie 5
N podstawie próby 50 tramwajów użytkowych w Warszawie ustalono, że ich rozkład ze względu na okres użytkowania (w latach) był następujący:
Okres użytkowania |
0-4 |
4-8 |
8-12 |
12-16 |
16-20 |
Częstość tramwajów |
0,02 |
0,04 |
0,20 |
0,40 |
0,34 |
Ponadto wiadomo że wariancja w tej próbie jest równa 18,3 lat (do kwadratu). Czy jest prawdą że:
większość zbadanych tramwajów była użytkowana powyżej 15 lat?
Względne zróżnicowanie tramwajów ze względu na okres użytkowania przekracza 30%?
Zadanie 6
Poniższe zestawienie prezentuje informacje o strukturze gospodarstw domowych w województwie kujawsko - pomorskim wg liczby osób:
Liczba osób w gospodarstwie |
1 |
2 |
3 |
4 |
5 |
Skumulowany odsetek gospodarstw |
20 |
45 |
66 |
86 |
100 |
korzystając z miar klasycznych oceń średnią i zróżnicowanie wielkości gospodarstw
wiedząc dodatkowo, że trzeci moment centralny w rozkładzie wynosi 0,38 oceń asymetrię rozkładu
Zadanie 7
Poniższe zestawienie przedstawia informacje o rozkładzie wieku czytelników „Polityki”
Wiek w latach |
10-20 |
20-30 |
30-40 |
40-50 |
50-60 |
60-70 |
Odsetek czytelników |
5 |
20 |
40 |
20 |
10 |
5 |
oceń zróżnicowanie wieku dla 50 % czytelników znajdujących się w obszarze
rozstępu kwartylowego
Zadanie 8
Informacje o strukturze gospodarstw domowych wg liczby osób (na wsi) prezentuje zestawienie:
Liczba osób w gospodarstwie |
1 |
2 |
3 |
4 |
5 |
Odsetek gospodarstw |
21 |
23 |
20 |
22 |
14 |
korzystając z miar pozycyjnych oceń absolutne i względne zróżnicowanie wielkości gospodarstw na wsi
ZMIENNE LOSOWE, ROZKŁADY STATYSTYK Z PRÓBY
Zadanie 1
Zakładając, że prawdopodobieństwo urodzenia chłopca wynosi 0,51 a dziewczynki 0,49 oraz że zdarzenia są niezależne, obliczyć prawdopodobieństwo, że w rodzinie w której będzie troje dzieci
a) urodzą się trzy dziewczynki
urodzi się jeden chłopiec
urodzi się co najmniej dwóch chłopców
Zadanie 2
Prawdopodobieństwo wygrania nagrody na loterii wynosi 0,001. Jakie jest prawdopodobieństwo, że wśród 2000 losujących osób:
żadna nie wygra
wygra co najmniej jedna osoba
wygrają co najwyżej dwie osoby
Zadanie 3
Przypuścimy, że wzrost (w cm) poborowych w Polsce ma rozkład normalny N(175,7). Obliczmy prawdopodobieństwo tego, że wylosowany poborowy będzie miał wzrost:
nie większy od 170 cm
z przedziału (180, 190]
Zadanie 4
Zmienna losowa X ma rozkład N(100, 20). Korzystając z operacji standaryzacji i tablicy dystrybuanty standardowego rozkładu normalnego oblicz prawdopodobieństwo następujących zdarzeń:
P(X≤90)
P(X>126)
Odp. A)0,3085: B)1-0,9032
Zadanie 5
Wiadomo, że co piąty student nie podchodzi do egzaminu ze statystyki w pierwszym terminie. Wyznaczyć prawdopodobieństwo tego, że:
wśród losowo wybranych studentów do egzaminu nie podejdzie więcej niż trzech
w losowej próbie 300 studentów nie więcej niż 40 nie podejdzie do egzaminu
Zadanie 6
Zużycie paliwa (w litrach na 100 km) w samochodzie SEAT ma rozkład normalny z parametrami 8; 1,2
obliczyć prawdopodobieństwo tego, że zużycie paliwa w losowo wybranym samochodzie przekroczy 7,6 litra
dla jakiej wielkości zużycia paliwa dystrybuanta w badanym rozkładzie przyjmuje wartość 0,75?
Odp: a) 0,6293 b) 8,804
Zadanie 7
Czas oczekiwania na tramwaj linii 33 jest zmienną losową o rozkładzie normalnym z odchyleniem standardowym równym 1 min:
ile wynosi przeciętny czas oczekiwania na tramwaj jeśli 75,8% osób oczekujących na ten tramwaj czeka nie krócej niż 4 min
Odp: m=4,07
Zadanie 8
Poziom cholesterolu we krwi jest zmienną losową o rozkładzie N (200, 30)
jaki odsetek ludzi ma poziom cholesterolu nie przekraczający 185
Odp: 30, 85%
Zadanie 9
Zmienne X1 i X2 są niezależnymi zmiennymi losowymi o rozkładach odpowiednio: N(20, 3) i N (4,2). Należy obliczyć:
wartość oczekiwaną, wariancję i współczynnik asymetrii zmiennej Y=X1-2X2
prawdopodobieństwo P(Y>9,6)
Odp: a) EY=12, DY=5 więc wariancja 25, A=0
0,6844
Zadanie 10
Rzucamy 10000 razy monetą. Oblicz jakie jest prawdopodobieństwo, że orzeł wypadnie nie więcej niż 5100 razy oraz że liczba wyrzuconych reszek będzie zawierała się pomiędzy 4900 a 5500
Odp. A) 0.97725: b)0, 81855
Zadanie 11
Zmienna losowa W ma rozkład normalny o wartości oczekiwanej 105 i wariancji 9
oblicz ile wynosi kwartyl trzeci w tym rozkładzie
oblicz wartośc oczekiwaną i wariancję zmiennej Z=250 - 2W
Odp:a) Q3=107,01, b)EZ=40, wariancja wynosi 36
TWIERDZENIA GRANICZNE, ROZKŁADY STATYSTYK Z PRÓBY
ESTYMACJA
Zadanie 1
100 losowo wybranym osobom zadano pytanie na temat czasu oczekiwania na autobus (min). Na podstawie uzyskanych odpowiedzi obliczono średnią= 10 i odchylenie standardowe=2.
a) ile wynosi punktowe oszacowanie nieznanej wartości średniego czasu oczekiwania
b) oszacować przedziałowo ten parametr przy współczynniku ufności 0,9
c) co się stanie gdy współczynnik ten zwiększymy do 0, 95 - odpowiedzieć nie szacując nowego przedziału
Odp: a)10+0,2: b) 9,671<m<10,329 c) precyzja zmaleje
Zadanie 2
W oparciu o informacje z 25 losowo wybranych prywatnych szkół średnich ustalono, że przeciętne czesne w tych szkołach wyniosło 500 zł, zaś odchylenie standardowe 146 zł
a) jaki współczynnik ufności zastosowano przy przedziałowej estymacji średniej wielkości czesnego w szkołach średnich, jeśli maksymalny błąd szacunku stanowił 10 % wartości estymatora?
Odp: 0,9
Zadanie 3
Z szeregu badań wiadomo, że poziom leukocytów we krwi (tys/mm3) ma rozkład normalny z odchyleniem standardowym 0,3. W pewnym instytucie doświadczalnym postanowiono sprawdzić możliwość zastosowania w analizie krwi pewnego nowego aparatu do badania przeciętnego poziomu leukocytów.
a) Jak liczna powinna być próba badanych osób, aby przy współczynniku ufności 0,95 maksymalny błąd szacunku wynosił 0,1 tys/mm3?
b) Zbudować przedział ufności dla przeciętnego poziomu leukocytów we krwi (1-ɑ=0,95), jeśli w próbie o liczebności wyznaczonej punkcie a) średni poziom leukocytów wynosił 8
Odp. A)n=35, b) 7,901<m<8,099
Zadanie 4
Roczne wydatki (x- w tys. zł) na promocję nowych wyrobów w zakładach produkcyjnych branży spożywczej mają rozkład normalny. Na podstawie wyników 10 elementowej próby zakładów zbudowano przedział ufności o długości 18,096 tys. zł. Dla średniej wysokości wydatków na promocje nowych wyrobów ogółu zakładów tej branży
jaki współczynnik ufności przyjęto przy estymacji wartości średnich wysokości wydatków na promocję nowych wyrobów w populacji, jeśli dodatkowo wiadomo, że w wylosowanej próbie Ʃ(xj - ẍ)2 =1440
o ile należałoby zwiększyć liczebność próby, aby - przy ustalonym w punkcie a) współczynniku ufności dwukrotnie zwiększyć precyzję oszacowania?
Odp: a) 1-ɑ = 0,95 b) czterokrotnie
Zadanie 5
W środowisku studenckim pewnej uczelni pojawiły się głosy na temat konieczności zwiększenia liczby godzin z języków obcych. Oszacować punktowo i przedziałowo (1-ɑ = 0,95) odsetek studentów popierających ten pogląd, jeśli w próbie 600 studentów 400 wypowiedziało się „za”. Jakie konsekwencje będzie miało zmniejszenie współczynnika ufności do 0,9. Ile wynosi maksymalny błąd szacunku? Jak liczebność próby wpływa na wielkość maksymalnego błędu szacunku?
Odp. A) p = 0,67+0,019, b) 0,633<p<0,707 c) precyzja rośnie
Zadanie 6
Aby oszacować odsetek pracujących mieszkańców pewnego osiedla korzystających z metra pobrano losowo 200 osób i stwierdzono, że 72 spośród nich dojeżdża regularnie metrem do pracy. Z jakim prawdopodobieństwem można oczekiwać, że przedział o końcach 29,3% - 42,7% pokrywać będzie nieznany procent osób dojeżdżający metrem do pracy wśród wszystkich pracujących mieszkańców tego osiedla?
Odp. ɑ = 0,05