Dwuwymiarowa zmienna losowa oraz dwuwymiarowy rozkład empiryczny
!"
#
$%& %
& &'
Zad. 1. Wyniki badania losowej próby 200 osób, pytanych o zamiar wzi cia udziału w najbli szych
wyborach przedstawiały si nast puj co: ze 100 badanych kobiet 60 twierdziło, e decyduje si głosowa
natomiast w próbie m czyzn, znajdowało si 60 takich, którzy nie zamierzali i na wybory. Czy
zale no mi dzy powy szymi zmiennymi jest istotna statystycznie?
Zad. 2. 100 losowo wybranych dystrybutorów zbadano ze wzgl du na rodzaj wydatków inwestycyjnych
oraz zakres prowadzonej działalno ci w ostatnim kwartale. Wynik badania przedstawia poni sza tabela:
Zakres prowadzonej działalno ci
Inwestycje w kapitał ludzki Inwestycje w rodki produkcji
Lokalna
20
0
Regionalna
20
20
Ogólnokrajowa
10
30
Z jakim ryzykiem bł du pierwszego rodzaju mo na uzna zale no stochastyczn mi dzy rodzajem
wydatków inwestycyjnych oraz zakres prowadzonej działalno ci za statystycznie istotn ?
Zad. 3. Zbadano losow grup kierowców ze wzgl du na płe kierowcy (X) i liczb stłuczek (Y).
Otrzymano nast puj cy rozkład:
x \ y
0
1
2
n
i.
m
14
8
13
k
6
0
9
n
.j
50
2
=4,67
a) Podaj rozkład warunkowy Y|X=k oraz jego interpretacj ; b) Czy hipotetyczna liczba m czyzn, którzy
mieli 1 stłuczk jest wy sza od hipotetycznej liczby kobiet które miały 2 stłuczki? (prosz uzasadni ).
c) Czy na podstawie wyników z próby, mo na twierdzi , e kobiety prowadz ostro niej samochód?
Zad. 4. Prosz dwukrotnie wypełni poni sz tablic tak, aby: a) współczynnik Cramera równał si 0;
b)
0
)
(
)
(
)
(
2
3
2
2
2
1
=
=
=
y
S
y
S
y
S
oraz prosz poda i zinterpretowa warto wska nika korelacji cechy Y
wzgl dem cechy X, jaki musi nast pi w tym przypadku.
a)
y
j
b)
y
j
x
i
0
1
2
n
i.
x
i
0
1
2
n
i.
2
20
2
20
3
50
3
50
4
30
4
30
n
.j
20
50
30
100
n
.j
20
50
30
100
___________
Zad. 5. (egz. 2003) Badaj c zale no mi dzy wydatkami na promocje (w tys. zł) -X , a warto ci
sprzeda y (w tys. zł) -Y w losowo wybranych punktach sprzeda y pewnej sieci dystrybucji uzyskano
nast puj ce dane:
x
i
3
2
4
5
6
y
i
4
6
8
12
10
a) prosz oceni sił i kierunek korelacji liniowej pomi dzy zmiennymi je li obliczone na podstawie
próby nieobci one odchylenia standardowe wynosz :
=
)
(
ˆ x
S
1,58,
=
)
(
ˆ y
S
3,16.
b) czy badana zale no jest istotna statystycznie? (Nale y przyj poziom istotno ci 0,01 i zało y
normalno rozkładu obu zmiennych.)
Zad.6. (egz. 2003) Czy w populacji siedleckich przedsi biorstw obroty (Y w mln zł) s dodatnio
skorelowane z nakładami na informatyk (X w tys. zł), je li wiadomo, e obliczona na podstawie
wyników 18 elementowej losowej próby suma iloczynów obu zmiennych wyniosła 30700 (mln zł
*
tys.
zł), rednie obroty 19 mln zł, rednie nakłady 88 tys. zł a współczynniki zmienno ci odpowiednio 10% i
25%?.
Dodatkowe informacje: rozkład obu zmiennych jest normalny, wariancje obliczono jako realizacje
obci onych estymatorów wariancji.
___________
Dwuwymiarowa zmienna losowa oraz dwuwymiarowy rozkład empiryczny
!"
#
$%& %
& &'
Zad. 7. Dla 100 punktów gastronomicznych zbadanych ze wzgl du na dzienny utarg (X, w tys. zł) i liczb
zatrudnionych osób (Y) otrzymano wyniki:
y
j
4
6
8
10
j
x
5
7
9
10
S
j
2
(x)
2,6 2,4 2,6 3
n
.j
10 40 30 20
Oce sił zale no ci utargu wzgl dem liczby zatrudnionych.
Wykre l odpowiedni empiryczn krzyw regresji.
Jakie informacje s niezb dne by wykre li drug empiryczn krzyw
regresji?
Zad. 8. Badanie zale no ci mi dzy zdolno ciami matematycznymi (X) a ocen uzyskan na dyplomie
uko czenia studiów (Y) 100 losowo wybranych studentów SGH dostarczyło nast puj cych danych:
Poziom zdolno ci
Liczba studentów
rednia ocena uzyskana na dyplomie
słabe
20
3
rednie
50
4
du e
30
5
Wiedz c, e wariancja w próbie S
2
(y) = 0,8 prosz oceni zale no mi dzy badanymi zmiennymi.
Czy zale no ta jest istotna statystycznie?
PRACA DOMOWA
Zad. 9. Dany jest nast puj cy rozkład zmiennej dwuwymiarowej:
a) Prosz wyznaczy warto oczekiwan , wariancj
oraz kowariancj zmiennej dwuwymiarowej (X,Y);
b) Prosz wyznaczy regresj pierwszego rodzaju
zmiennej losowej Y wzgl dem zmiennej X.
Zad. 10. Je li liczebno ci brzegowe wynosz odpowiednio: dla cechy X: 30, 50, 20, dla cechy Y: 50, 30,
20, wyznaczy liczebno ci rozkładu ł cznego je li wiadomo, e V = 0.
Zad. 11. Przypuszcza si , e ryzyko rozwodu jest zwi zane z wiekiem zawarcia zwi zku mał e skiego.
Dla grupy 400 m czyzn zbadanej w roku t, którzy zawarli mał e stwo 5 lat wcze niej, uzyskano
nast puj ce dane:
wiek w momencie zawarcia mał e stwa
Stan cywilny
do 18 lat
19-25
ponad 25 lat
Rozwiedziony
100
80
20
nie rozwiedziony
80
70
50
Prosz oceni , czy ryzyko rozwodu jest zale ne od wieku w momencie zawarcia mał e stwa. Jak silna
jest badana zale no ?
Zad. 12. Badaj c zale no stawki godzinowej w zł (Y) od sta u pracy w latach (X) administratorów
danych, dla losowej próby 125 administratorów danych otrzymano nast puj ce wyniki:
y
j
0-2 3-5
6-8
9-11
j
x
46,7 76
107,4 128,6
n
.
j
15
40
35
35
=
x
95,8
S
2
(x) = 1621,3
=
y 6,2
S
2
(y) = 9,1
ij
j
i
j
i
n
y
x
= 84040
a) Jak silna jest zale no stawki godzinowej w zł (Y) od sta u pracy w latach (X)? (Prosz wyznaczy
i zinterpretowa odpowiedni miernik). Czy zale no ta jest statystycznie istotna?
b) Czy na podstawie powy szych wyników mo na powiedzie , e w populacji generalnej
administratorów danych rednia stawka za godzin ro nie wraz ze wzrostem sta u?
Zad. 13. Ranking 5 najwi kszych uczelni w Polsce w opinii pracowników i studentów tych uczelni
przedstawia si nast puj co:
uczelnia
A
B
C
D
E
pracowników
4
1
3
5
2
Ranking według
studentów
5
1
4
3
2
Na podstawie podanych informacji prosz :
a) zmierzy sił współzale no ci pomi dzy ocenami
pracowników i studentów,
b) oceni czy otrzymany wynik jest statystycznie istotny.
warto ci zmiennych
y
j
x
i
2
3
4
0,5
0
6
0,3
0
8
0,1
0,1