stata zad

Liczba osób xi 2 3 4 5 6 7 8
Odsetek osób ni 15 30 20 15 10 5 5

Mieszkania komunalne wg liczby osób zamieszkałych w jednym mieszkaniu w miejscowości A charakteryzuje poniższy rozkład:

Scharakteryzuj ten rozkład za pomocą miar średnich.

Szereg rozdzielczy punktowy: średnia arytmetyczna = suma xi*ni/N = 2*15+*3*30+4*20+5*15+6*10+7*5+8*5/100 = 410/100 = 4,1

Mediana: (sprowadza się do wskazania jednostki środkowej i odczytania wariantu cechy odpowiadającej tej jednostce)- pozMe = n + 1 /2 = 101/2 = 50,5, czyli mediana jest na pozycji 50,5;

Liczebność skumulowana 15 45 65 80 90 95 100

dodajemy wartości skumulowane ni,

i patrzymy, gdzie znajduje się po raz pierwszy 50,5. Jest to przy liczbie 4, czyli Me = Q2 = 4osoby

interpretacja: 50% osób mieszka w mieszkaniu 4 osobowym lub mniej, pozostałe 50% mieszka w jednym mieszkaniu 4osobowym lub więcej.

xi * ni 30 90 80 75 60 35 40

Dominanta (jest wartością cechy, której odpowiada największa liczebność)= 3 osoby, bo mnożę

tam, gdzie jest największa wartość to dominanta,

czyli D = 3 osoby.

interpretacja: W jednym mieszkaniu najczęściej mieszkają 3 osoby.

Kwartyl 3 (sprowadza się do podzielenia jednostki na 4 części, gdzie ¾ odpowiada wartościom cech niższych, a ¼ wyższych od trzeciego kwartyla) pozMe = ¾ * (n + 1) /4 = 75,75, czyli kwartyl trzeci jest na pozycji 75,75;

Liczebność skumulowana 15 45 65 80 90 95 100

dodajemy wartości skumulowane ni,

i patrzymy, gdzie znajduje się po raz pierwszy 75,75. Jest to przy liczbie 5, czyli Q3 = 5 osób

interpretacja: 75% osób mieszka w mieszkaniu mniej niż w 5 osób, pozostałe 25% mieszka w jednym mieszkaniu 5osobowym lub więcej.

Losowo wybranych stu studentów (70 mężczyzn i 30 kobiet) pewnej uczelni warszawskiej poddano badaniu ze względu na czas dojazdu na zajęcia i otrzymano następujące wyniki:

  1. Mężczyźni: średnia = 40 minut, dominanta = 35 minut, As = +0,5

  2. Kobiety: średnia = 30 minut, dominanta = 33 minut, As = -0,3

Oblicz współczynnik zmienności całej zbiorowości.

X całej populacji = 70*40+30*30/100=2800+900/100=3700/100=37

As = średnia (x)– dominanta(D) / odchylenie standardowe (s)

sm = 10

sk = 10

s2populacji = 102*70+102*30+70(40-37)2+30(30-37)2 / 100 = 10000+630+1470 /100 = 12100/100 = 121

s = 11

Vpop = 11 / 37 * 100 % = 29,72%

Losowo wybrano grupę nowożeńców w pewnej gminie poddana badaniu na wiek zamążpójścia i otrzymano następujące wyniki:

  1. Mężczyźni: średnia = 27, Me = 26, D = 24, s 2 = 36

  2. Kobiety: średnia = 24, Me = 22, D = 20, s 2 = 16

Obliczyć właściwe parametry i przeprowadzić analizę porównawczą wieku zamążpójścia wg płci.

Mężczyźni: Wskaźnik asymetrii = x – D Ws = 1

Vs = s/ średnia * 100 = 6 / 27 * 100 = 22,2 %

As = 27 -24 / 6 = 0,5

Kobiety: Ws = 2

Vs = s/ średnia * 100 = 4/24 *100% = 16,6%

As = 24 -20 / 4 = 1

Oba rozkłady charakteryzują się asymetrią prawostronną, silniejszą asymetrią charakteryzują się kobiety. Większe zróżnicowanie wg wieku zamążpójścia miało miejsce u mężczyzn, mniejsze u kobiet.

Wielkość gospodarstw rolniczych w pewnej gminie charakteryzuje poniższy rozkład:

Liczba gospodarstw 1 13 12 10 8 4 1
Powierzchnia ha 1,5-3,1 3,1-4,7 4,7-6,3 6,3-7,9 7,9-9,5 9,5-11,1 11,1-12,7

Wyznaczyć średnią arytmetyczną, odchylenie standardowe, odchylenie przeciętne, współczynnik asymetrii badanej zbiorowości.

  1. Wyznaczam środki przedziałów:

Środki przedziałów 2,3 3,9 5,5 7,1 8,7 10,3 11,9
  1. Średnia arytmetyczna = 2,3*1+3,9*13+5,5*12+7,1*10+8,7*8+10,3*4+11,9*1 / 49 = 312,7/49 = 6,38 ha

  2. s2 = 1/ N suma (środek przedziału – średnia)2* ni = 1/ 49* (2,3-6,38)2*1+(3,9-6,38)2*13+(5,5-6,38)2*12+(7,1-6,38)2*10+(8,7-6,38)2*8+(10,3-6,38)2*4+(11,9-6,38)2*1= (16,65+79,96+9,3+5,19+43+61,47+30,47)/49 = 246,07/49 = 5,02

s = 2,24

  1. d = 1 / N * suma | środek przedziału – średnia | * ni = 1/ 49* |2,3-6,38|*1+|3,9-6,38|*13+|5,5-6,38|*12+|7,1-6,38|*10+|8,7-6,38|*8+|10,3-6,38|*4+|11,9-6,38|*1= 4,08+32,24+10,56+7,2+18,56+15,68+5,52 /49 = 93,84 /49 = 1,92

  2. D = xd +[ nd-nd-1/( nd-nd-1)+( nd-nd+1)]*id = 3,1+[13-1/(13-1)+(13+12)]*1,6 = 3,1+ (12/37)*1,6=3,62

As = x – D /s = 6,38 – 3,62 /2,24 =1,23

Rozkład powierzchni sklepów (w m2) w mieście A przedstawia się następująco:

Liczba sklepów 9 19 23 14 9 7
Powierzchnia 30-50 50-70 70-90 90-110 110-130 130-150

Jak silna jest koncentracja powierzchni w badanej zbiorowości sklepów?

Kurtoza: K = 1/N suma (środki przedziałów – średnia)4 *ni / s4

Współczynnik koncentracji K’ = K-3

Środki przedziałów 40 60 80 100 120 140

Średnia = 6800 / 81 = 83,95

[suma (środki przedziałów – średnia)4 *ni]/ N = 125052467/81 = 1543857,622

s4= 662632,2279

K = 1543857,622 / 662632,2279 = 2,33

K’ = 2,33-3 = 0,27

Mediana wieku zatrudnionych nauczycieli w pewnej szkole zawarta jest w przedziale 40-50 i wynosi 44 lata. W przedziale mediany mieści się 25 nauczycieli. W tej szkole zatrudnionych jest 40 nauczycieli liczących mniej niż 40 lat. Ilu nauczycieli jest w tej szkole zatrudnionych.

44 = 40 + [N/2 – 40] / 25 * 10 ||/10

4,4 = 4 + [N/2 – 40] /25

0,4 = [N/2 – 40] /25

10 = N/2 – 40

N/2 = 50

N = 100

Obwód trójkąta równy jest 21 cm. Pierwszy bok równy jest średniej arytmetycznej pozostałych boków. Drugi bok stanowi 75% boku trzeciego. Jaka jest długość boków tego trójkąta?

1,75a /2 + a + 0,75a = 21

0,875a+a+0,75a =21

2,625a= 21

a=8

0,75a = 6

0,875a = 7

Rzucono dwie kostki do gry. Obliczyć prawdopodobieństwo tego, że suma oczek na obu kostkach jest równa 7.

Przestrzeń zdarzeń elementarnych - 6*6= 36

(1,6) (2,5) (3,4) (4,3) (5,2) (6,1) – 6 możliwości przy rzutach

P(A) = 6/ 36 = 1/6

Student potrafi odpowiedzieć na 20 spośród 25 pytań egzaminacyjnych. Znaleźć prawdopodobieństwo tego, że student zna odpowiedź na zadane trzy pytania.

P(A) = 20/25 + 19/24 + 18/23 = 57/115

W pewnej hodowli drobiu 80% kur jest zdatnych do hodowli, a na każde 100 kur zdatnych do hodowli 40 sztuk odznacza się wysoką nieśnością. Oblicz prawdopodobieństwo, że wybierając losowo kurę trafimy na taką, która odznacza się wysoką nieśnością.

A – wylosowano kurę zdatną do hodowli

B- wylosowano kurę odznaczającą się wysoką nieśnością

P(AiB)= 0,8*0,4 = 0.32

W skrzynce znajduje się 50 puszek konserw, w tym 3 uszkodzone. Ze skrzynki tej wyjęto 7 puszek. Obliczyć prawdopodobieństwo, że:

a) wszystkie będą dobre,

b) wśród wyjętych puszek będzie dokładnie jedna uszkodzona

  1. N = 50! / 7!* 43! = 99884400

n= 47! / 7! * 40! = 62891499

P(a) = 0,63

  1. n= 3!/1!*2! * 47!/ 6! *41! = 3* 10737573 = 32212719

P(b) = 0,3225

Obliczyć prawdopodobieństwo, że w miocie liczącym 9 prosiąt będzie:

a) 5 knurków,

b) 6 knurków, zakładając, że frakcja knurków wśród prosiąt wynosi 0,5

Prawdopodobieństwo, że ziarno łubinu wykiełkuje jest równe 0,9. Dla celów doświadczalnych wybieramy 10 ziaren. Obliczyć prawdopodobieństwo, że wykiełkuje co najmniej 8 ziaren.

Co najmniej 8, czyli wykiełkuje 8 lub 9 lub 10.

Schemat Bernoullego P(8)+P(9)+P(10) = 0,93

Dwóch jednakowo silnych przeciwników gra w szachy. Co jest bardziej prawdopodobne dla każdego z nich: wygrać dwie partie spośród czterech czy trzy partie z sześciu?

N =4 k=2 p= 0,5

P(A) = (4 po2) 0,25*0,25 = 0 375 -> łatwiej wygrać

N= 6 k =3 p= 0,5

P(B) = 4*5*0,125*0,125 = 0,3125

Z urny zawierającej 6 czarnych i 4 białe kule losujemy bez zwracania 5 kul. Obliczyć prawdopodobieństwo, że wśród nich są co najmniej 2 kule białe.

N= 10 po 5 = 6*7*8*9*10/2*3*4*5 = 30240/120 = 252

n = 4 po 2 + 4 po 3 + 4 po 4 =

N = 10 po 4

Wymienić rozkłady z próby:

Rozkład średniej arytmetycznej, rozkład chi kwadrat, rozkład t-Studenta, rozkład F Fischera-Snedecora

Rozkład średniej arytmetycznej

Z populacji o rozkładzie normalnym N(m; σ) losujemy n elementową próbę i przez xi oznaczamy kolejne wyniki w próbie. Przy tych założeniach statystyka: (Średnia) x= 1/n Σ xi, tzn. średnia arytmetyczna z próby, ma rozkład normalny N(m; x σ ): X~ N(m; x σ ) przy czym zachodzi związek: błąd standardowy średniej = odch standardowe/ pierw z n. Z powyższego wynika wniosek, że rozkład średniej arytmetycznej w próbach pochodzących z populacji o rozkładzie normalnym jest zależny od odchylenia standardowego σ w populacji. Wraz ze wzrostem liczebności próby odchylenie standardowe statystyki X maleje. Oznacza to, że średnia arytmetyczna podlega mniejszej zmienności niż pojedyncze wyniki.

Rozkład χ2

Niech X1, ...., Xv będzie ciągiem niezależnych zmiennych losowych o rozkładzie normalnym standaryzowanym N(0; 1). Utwórzmy następującą funkcję tych zmiennych: χ2 = X1 + X2 +..... + Xv

Statystyka ta ma rozkład χ2 (chi-kwadrat) z liczbą stopni swobody równą v. Liczba stopni swobody jest parametrem rozkładu zmiennej losowej o rozkładzie χ2. Wartość tego parametru jest liczbą składników tej zmiennej. Parametry zmiennej losowej o rozkładzie χ2 są następujące: E(χ2) = v D2(χ2) = 2v. Kształt funkcji gęstości prawdopodobieństwa rozkładu χ2 zmienia się wraz ze zmianą liczby stopni swobody v. Przy małej liczbie stopni swobody rozkład jest skrajnie asymetryczny, natomiast wraz ze wzrostem liczby stopni swobody rozkład χ2 zbliża się do rozkładu normalnego. Zmienne losowe mające rozkład χ2 przyjmują tylko wartości nieujemne. W zastosowaniach omawianego rozkładu korzysta się z zależności, że prawdopodobieństwo: P(ch2>=ch2alfa,v)=alfa. Wartość ch2alfa,v nazywa się wartością krytyczną. Rozkład χ2 jest stablicowany. Okazuje się, że wiele statystyk ma rozkład χ2 . W wielu rozważaniach będziemy korzystać ze zmiennej o postaci: ch kwadrat = (n-1) s2 . odch stan2. Zmienna ta ma rozkład χ2 z liczbą stopni swobody v = n−1. s2 to 1/n-1 suma(xi-średnia)2

Rozkład t-Studenta

Niech X0, X1, ... , Xv będą niezależnymi zmiennymi losowymi o rozkładzie normalnym standaryzowanym N(0; 1). Utwórzmy następującą funkcję tych zmiennych:

Zmienna t określona powyższym wzorem ma rozkład t-Studenta z liczbą stopni swobody v. Warto zauważyć, że zmienna losowa t-Studenta jest ilorazem zmiennej losowej o rozkładzie normalnym standaryzowanym i pierwiastka kwadratowego ze zmiennej o rozkładzie c2 . Kształt funkcji gęstości prawdopodobieństwa tego rozkładu jest zbliżony do rozkładu normalnego standaryzowanego N(0; 1) i zależy od liczby stopni swobody. Im liczba swobody jest większa, tym bardziej rozkład t-Studenta przypomina rozkład N(0; 1). Oczywiste jest, że rozkład t-Studenta jest symetryczny względem osi y-ów, czyli ma wartość oczekiwaną równą zero. Parametry zmiennej losowej o rozkładzie t-Studenta wynoszą odpowiednio:

E(t) = 0

Uwaga: Dla ułatwienia oznaczeń zmienne losowe o rozkładzie t-Studenta, zamiast X, najczęściej oznaczamy po prostu t.

Funkcja gęstości rozkładu t-Studenta wyraża się dość skomplikowanym wzorem, który pomijamy. W zastosowaniach tego rozkładu potrzebne są tylko wartości krytyczne ta,v takie, że:

P ( | t | ł ta,v ) = a

Jeżeli x1, x2, .... , xn jest n elementową próbą z populacji o rozkładzie normalnym N(m; s), to statystyka:

ma rozkład t-Studenta z liczbą stopni swobody v = n-1.

- ocena błędu standardowego średniej

Statystykę określoną wzorem (3.3.5) będziemy wykorzystywać przy wyznaczaniu przedziałowej oceny średniej populacji generalnej i testowaniu hipotez statystycznych dotyczących średniej populacji generalnej.


Wyszukiwarka

Podobne podstrony:
stata zad 3
wm 2011 zad 2
Instrukcja do zad proj 13 Uklad sterowania schodow ruchom
CAD CAM KWPPWPS Zad graf PDF
2009 klucz zad 01 092 u
ALGEBRA zad 2 id 57346 Nieznany (2)
K2 2009 10 zad 2 id 229691
koło 15 zad 1
GIiZK 0809 przydzial tematow zad domowego
cw zad dysocjacja hydroliza buf Nieznany
E1 2010 11 zad 2 id 149115
K1 2007 08 zad 5 id 229626
ICh S schemat rozw zad konwekcja
Zad 4, UEK, FiR II SEMESTR, Standardy Sprawozdawczości Finansowej
Zad 25 10 11, AGH Imir materiały mix, Studia
Biotechn3rnew, Technologia chemiczna pw, 2 rok, stata
stata kolos, statystyka matematyczna(1)

więcej podobnych podstron