Zadania do wykonania
1.Utworzyć szeregi rozdzielcze klasowe dla zmiennych x 5, x 6
2.Przeprowadzić kodowanie zmiennych x 3, x 4 i utworzyć dla nich szeregi rozdzielcze
3Utworzyć tablicę kontyngencyjną dla zmiennych x 3, x 4
4.Utworzyć odpowiednie wykresy punktowe, histogramy dla zmiennych punktu 1
5.Wyznaczyć wartości średnie, wariancję, modę, medianę oraz kwartale Q1,Q3 dla zmiennych punktu 1
Zadanie 1
szereg dla x5
od 1007 do 3906
1007,1037, 1249, 1303, 1378, 1482, 1531,1585, 1658, 1699, 1917, 1956, 1972, 2000, 2033, 2038, 2061, 2070, 2119, 2210, 2213, 2219, 2249,2351, 2359, 2456, 2577, 2679, 2715,2739, 2748, 2765, 2790, 2816, 2826, 2863, 2874, 2903,2936, 2991, 3023, 3127, 3169,3170,3329,3341, 3343, 3356, 3400,3451, 3639, 3666,3739, 3763, 3758, 3795,3821,3825, 3906,.
szereg dla x6
od 0 do5
000000000000, 111111111111111111, 2222222222222222, 333333333, 444, 5.
0=12 1=18 2=16 3=9 4=3 5=1
Zadanie 2 Przeprowadzić kodowanie zmiennych x3 i x4 oraz utworzyć dla nich szeregi rozdzielcze
KODOWANIE I SZEREG ROZDZIELCZY DLA X3
00000000000 1111111111111 22222222222 333333333 4444444 555555555
X3 - wykształcenie
n3i - liczba osób
ω₃i- wskaźnik struktury
n₃isk - liczebność skumulowana
ω₇isk - częstość skumulowana
KODOWANIE I SZEREG ROZDZIELCZY DLA X4
6666 77777777777777 88 999999999 10101010101010101010 11 11 11 11 11 11 11 11 11 11 12121212121212121212
Zadanie 3 Utworzyć tablicę kontyngencyjną dla zmiennych x 3, x 4
Zadanie 4 Utworzyć odpowiednie wykresy punktowe, histogramy oraz dystrybuanty dla zmiennych punktu 1
DLA X2
K=8
R=1987-1941=46
46:8=5,75≈6
1941,1942,1942,1946,1946,1946,1950,1954,1954,1954,1958,1961,1964,1964,1965,1965,1965,1966,1967,1969,1969,1969,1970,1972,1972,1973,1973,1975,1976,1978,1978,1979,1979,1980,1980,1980,1980,1980,1981,1982,1982,1982,1983,1983,1983,1983,1984,1984,1985,1985,1985,1985,1985,1985,1985,1985,1986,1987,1987,1987.
Numer klasy |
Rok urodzenia |
L.p. |
Wskaźnik struktury |
Liczebność skumulowana |
Częstość skumulowana |
i |
xi |
ni |
wi |
nisk |
wisk |
1 2 3 4 5 6 7 8 |
1941-1946 1947-1952 1953-1958 1959-1964 1965-1970 1971-1976 1977-1982 1983-1988 |
6 1 4 3 9 6 13 18 |
0.1 0.01(6) 0.0(6) 0.05 0.15 0.1 0.21(6) 0.3 |
6 7 11 14 23 29 42 60 |
0.1 0.11(6) 0.18(3) 0.2(3) 0.38(3) 0.48(3) 0.7 1.00 |
Razem |
x |
60 |
1 |
x |
x |
Wykres i do ni
Histogram częstotliwości
wi - wskaźnik struktury
i - numer klasy
Dystrybuanta empiryczna
ωisk - częstość skumulowana
i - numer klasy
Wykres punktowy
DLA X5
k-liczba klas
k=√n
k=60 ≈ 8
dla x5
R=3906-1007=2899
2899:8=362,375≈ 363
Numer klasy |
Liczba wynagrodzeń w styczniu |
L.p. |
Wskaźnik struktury |
Liczebność skumulowana |
Częstość skumulowana |
i |
xi |
ni |
wi |
nisk |
wisk |
1 2 3 4 5 6 7 8 |
1007-1369 1370-1732 1733-2095 2096-2458 2459-2821 2822-3184 3185-3547 3548-3911 |
4 6 8 8 8 10 5 11 |
0.0 (6) 0.1 0.1(3) 0.1(3) 0.1(3) 0.1(6) 0.08(3) 0.18(3) |
4 10 18 26 34 44 49 60 |
0.0(6) 0.1(6) 0.3 0.4(3) 0.5(6) 0.7(3) 0.81(6) 1.00 |
Razem |
x |
60 |
1 |
x |
x |
Wykres i do ni
Histogram częstotliwości
Dystrybuanta emiryczna
Wykres punktowy
Zadanie 5 Wyznaczyć wartości średnie, wariancję, modę, medianę oraz kwartale Q1,Q3 dla zmiennych punktu 1
ŚREDNIA ARYTMETYCZNA
Gdy obserwacje statystyczne dotyczące badanych zmiennych są liczne, operowanie wartościami szczegółowymi jest uciążliwe. W celu stwierdzenia istnienia lub braku związku korelacyjnego konstruujemy wówczas tablicę korelacyjną. Na skrzyżowaniu kolumn z wierszami wpisywane są liczebności jednostek zbiorowości statystycznej, u których zaobserwowano jednoczesne występowanie określonej wartości xi i yj
Średnią arytmetyczną - definiuje się jako sumę wartości cechy mierzalnej podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej.
szereg szczegółowy |
|
szereg rozdzielczy punktowy |
|
zereg rozdzielczy z przedziałami klasowymi |
|
gdzie:
oznacza środek przedziału klasowego
Modalna Mo (dominanta D, moda, wartość najczęstsza- jest to wartość cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej
|
gdzie:
m - numer przedziału (klasy), w którym występuje modalna,
- dolna granica przedziału, w którym występuje modalna,
nm - liczebność przedziału modalnej, tzn. klasy o numerze m,
nm-1; nm+1 - liczebność klas poprzedzającej i następnej, o numerach m - 1 i m +1,
hm - rozpiętość przedziału klasowego, w którym występuje modalna.
Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach.
Dla szeregu rozdzielczego wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
Kwartyl pierwszy Q1
Kwartyl trzeci Q3
gdzie:
m - numer przedziału (klasy), w którym występuje odpowiadający mu kwartyl,
- dolna granica tego przedziału,
nm - liczebność przedziału, w którym występuje odpowiedni kwartyl,
- liczebność skumulowana do przedziału poprzedzającego kwartyl,
hm - rozpiętość przedziału klasowego, w którym jest odpowiedni kwartyl.
Wariancja - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.
Kwartyl drugi (mediana Me) |
dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa |