Wykład 1 2011.10.15
Zaliczenie-ściągi ze wzorami można mieć – suche wzory-bez opisu.
LITERATURA:
1.M. Sobczyk „Statystyka” PWN W-wa, 2001
2.S.Ostasiewicz, Z. Rusnak, U. Siedlecka „Statystyka, elementy teorii, zadania” Wyd. AE, Wrocław, 2001
3.S. Juszczyk „Statystyka dla pedagogów” Toruń 2006
4.A Malarska, H. Mikulska „Statystyka w zadaniach nie tylko dla psychologów i pedagogów” UE, Łódź 1999
5.E Sojka „Statystyka w przykładach i zadaniach” Podręczniki akademickie, WSZiNS, Tychy
STATYSTYKA – nauka traktująca o metodach ilościowych badania zjawisk masowych.
ZJAWISKA MASOWE – zjawiska, które składają się z dużej liczby (masy) pojedynczych faktów, zdarzeń lub wielkości.
METEDY ILOŚCIOWE – procedury badawcze, które posługują się opisem liczbowym.
PODSTAWOWE POJĘCIA STATYSTYCZNE:
-zbiorowość statystyczna;
-jednostka statystyczna;
-cecha statystyczna – czyli cecha jednostki statystycznej.
PODZIAŁ CECH STATYSTYCZNYCH:
1.CECHY STAŁE:
-rzeczowa (co lub kogo poddajemy obserwacji statystycznej);
-czasowa (jaki okres obejmuje badanie);
-przestrzenna (gdzie badamy).
2.CECHY ZMIENNE:
-mierzalne (ilościowe)
-niemierzalne (jakościowe) .
CECHY MIERZALNE, ZWANE ZMIENNYMI DZIELIMY NA:
1.SKOKOWE (dyskretne) – przyjmują skończony lub przeliczalny zbiór wartości. Najczęściej jest to zbiór liczb całkowitych dodatnich np.: liczba osób w rodzinie, liczba usterek, np.: 1,2,5,11,13;
2.CIĄGŁE-mogą przyjąć każdą wartość z określonego przedziału liczbowego (a,b), przy czym ilość miejsc po przecinku uzależniona jest od dokładności dokonywanych pomiarów (np. wiek, waga), np. może być 16 lat lub 16, 5 lat, lub 16 lat 6 miesięcy i 12 dni.
RODZAJE BADAN STATYSTYCZNYCH:
1.BADANIA CAŁKOWITE, np.: spis ludności;
2.BADANIA CZĘŚCIOWE:
-badania reprezentacyjne – czyli część jednostek tzw. Próba statystyczna;
-badania monograficzne;
-badania ankietowe.
ETAPY BADANIA STATYSTYCZNEGO:
1.PLANOWANIE BADANIA STATYSTYCZNEGO:
-cel badania
- zbiorowość statystyczna wraz z jednostkami;
-zakres badania (jakie cechy będziemy badać);
- rodzaj badania (czy cała zbiorowość statystyczna, czy Badania całkowite czy częściowe)
-kosztorys badania;
-osoby odpowiedzialne za badania.
2.OBSERWACJA STATYSTYCZNA – zebranie danych statystycznych.
3.OPRACOWANIE I PREZENTACJA MATERIAŁU STATYSTYCZNEGO:
-grupowanie materiału statystycznego;
-budowa szeregów statystycznych;
-budowa tablic statystycznych;
-prezentacja graficzna materiału statystycznego.
4.ANALIZA STATYSTYCZNA WYNIKÓW OBSERWACJI.
GRUPY METOD STATYSTYCZNYCH:
1.OPISOWE METODY ANALIZY STRUKTURY ZBIOROWOŚCI STATYSTYCZNEJ:
A. SZEREG STATYSTYCZNY- ciąg wielkości statystycznych wzrastających lub malejących uporządkowanych według kryteriów.
SZEREGI STATYSTYCZNE
SZEREGI SZCZEGÓŁOWE SZEREGI ROZDZIELCZE SZEREGI GEOGRAFICZNE SZEREGI DYNAMICZNE
(proste, wyliczające) (strukturalne) (terytorialne) (czasowe)
Z CECHĄ MIERZALNĄ Z CECHĄ NIEMIERZALNĄ
PUNKTOWE PRZEDZIAŁOWE
ZADANIE 1:
Badano 10 rodzin ze względu na liczbę dzieci w rodzinie.
N – 10 rodzin x – liczba dzieci w rodzinie 1,0,2,2,3,0,2,1,2,4
N- liczba jednostek w zbiorowości (czyli ogólna liczba obserwacji)
SZEREG PROSTY: 0,0,1,1,2,2,2,2,3,4
SZEREG ROZDZIELCZY PUNKTOWY( jest badany dla średniej skokowej):
LICZBA DZIECI Xi |
LICZBA RODZIN ni |
---|---|
0 | 2 |
1 | 2 |
2 | 4 (to jest DOMINANTA) |
3 | 1 |
4 | 1 |
RAZEM | 10 |
WZÓR: $\sum_{i = 1}^{k}{\ n_{i}} = N$ , czyli to jak jakbyśmy dodali : n1 +n2+n3+n4+n5….itd.
ZADANIE 2:
SZEREG ROZDZIELCZY PRZEDZIAŁOWY:
WIEK W LATACH xi |
LICZBA STUDENTÓW ni |
ODSETEK STUDENTÓW wi=ni/N*100=(%) (wychodzi nam wynik w procentach) |
---|---|---|
20-24 | 10 | 10% |
24-28 | 20 | 20% |
28-32 | 40-przedział DOMINANTY | 40% |
32-36 | 20 | 20% |
36-40 | 10 | 10% |
OGÓŁEM | 100 – oznaczamy jako N | 100% |
Zestawienie wyników w postaci SZEREGU ROZDZIELCZEGO nazywamy ROZKŁADEM EMPIRYCZNYM ZMIENNEJ JEDNOWYMIAROWEJ!!!
SZEREG ROZDZIELCZY Z CECHĄ NIEMIERZALNĄ:
PŁEĆ | LICZBA STUDENTÓW |
---|---|
M | 12 |
K | 18 |
OGÓŁEM | 30 |
SZEREG CZASOWY:
LATA | PRODUKCJA (w sztukach) |
---|---|
2005 | 125 |
2006 | 120 |
2007 | 180 |
2008 | 110 |
SZEREG GEOGRAFICZNY:
PODREGIONY WOJ. ŚLĄSKIEGO |
PRZYROST NATURALNY NA 1000 W 2006 ROKU |
---|---|
CZĘSTOCHOWSKI | -2,5 |
BIELSKO-BIALSKI | 1,0 |
CENTRALNY ŚLĄSKI | -1,5 |
RYBNICKO - JASTRZĘBSKI | 1,7 |
TABLICA STATYSTYCZNA – zawiera jeden lub więcej szeregów statystycznych:
- tablica prosta-zawiera jeden szereg;
-tablica kombinowana – charakteryzuje zbiorowość statystyczną pod względem dwóch lub więcej cech statystycznych.
BUDOWA TABLICY:
1.ZWIĘZŁY TYTUŁ TABLICY – OKREŚLAJĄCY zbiorowość pod względem rzeczowym, czasowym i przestrzennym;
2.TABLICA WŁAŚCIWA – nazwa wierszy i kolumn;
3.ŹRÓDŁO DANYCH ZAWARTYCH W TABLICY.
PREZENTACJA GRAFICZNA MATERIAŁU STATYSTYCZNEGO:
1.WYKRESY LINIOWE-szczególna odmianą jest diagram zwany wielobokiem liczebności;
2.WYKRESY SŁUPKOWE (histogram);
3.WYKRESY KOŁOWE – należą do grupy wykresów powierzchniowych;
4.KARTOGRAMY – stosowane do analiz w ujęciu przestrzennym
5.PIRAMIDY WIEKU-używane w analizach demograficznych;
6. WYKRESY OBRAZKOWE – przedstawiają wielkości zjawiska przed odpowiednią wielkość znaku obrazkowego.
PARAMETRY OPISOWE – takie charakterystyki liczbowe, które w sposób syntetyczny pozwalają ocenić i porównać różne własności rozkładów empirycznych zmiennych jednowymiarowych.
MIARY PRZECIĘTNE:
1.ŚREDNIA ARYTMETYCZNA: ($\overset{\overline{}}{x}$)
$$\overset{\overline{}}{x} = \frac{\sum_{i = 1}^{N}x_{i}}{N}$$
$$\ \overset{\overline{}}{x} = \frac{17}{10} = 1,7$$
Szereg szczegółowy:
LICZBA DZIECI Xi |
LICZBA RODZIN ni |
xi * ni |
---|---|---|
0 | 2 | 0 |
1 | 2 | 2 |
2 | 4 (to jest DOMINANTA) | 8 |
3 | 1 | 3 |
4 | 1 | 4 |
RAZEM | 10 | 17 |
Odp. Średnia liczba dzieci w rodzinie to 1,7 dziecka.
SZEREG ROZDZIELCZY PUNKTOWY (ŚREDNIA WAŻONA):
$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ czyli zapisujemy:
$$\overset{\overline{}}{x} = \frac{17}{10} = 1,7$$
SZEREG ROZDZIELCZY PRZEDZIAŁOWY:
$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ gdzie: $\ x_{i\ } = \frac{x_{\text{di}}\ + \ x_{\text{gi}}}{2}$ gdzie : xdi – dolny przedział; xgi – górny przedział
WIEK W LATACH xi |
LICZBA STUDENTÓW ni |
xi | xi *ni |
---|---|---|---|
20-24 | 10 | 22 | 220 |
24-28 | 20 | 26 | 520 |
28-32 | 40 | 30 | 1200 |
32-36 | 20 | 34 | 680 |
36-40 | 10 | 38 | 380 |
OGÓŁEM | N = 100 | - | - |
$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ = $\frac{3000}{100} = 30$
2.DOMINANTA – (moda, wartość najczęstsza, wartość typowa) – wartość cechy, która w rozkładzie występuje najczęściej. W szeregach szczegółowych i rozdzielczych punktowych jest to wartość zmiennej, której odpowiada największa liczebność (lub częstość względna).
D = xi[maxni] lub: D = xi[maxwi] ;
Gdzie ni- to liczebność, wi – odsetek (procenty)
Przykładowa odpowiedź to : NAJCZĘSTSZA LICZBA DZIECI W RODZINIE WYNOSI 2.
W szeregach przedziałowych o równej długości przedziałów klasowych – dominanta jest jedną z wartości należących do tego przedziału, któremu odpowiada największa liczebność lub częstość względna.
$$D \approx \ x_{D} + \ \frac{n_{D} - n_{D - 1}}{\left( n_{D} - n_{D - 1} \right) + \left( n_{D} - n_{D + 1} \right)}*\ x_{D}$$
xD - dolna granica przedziału dominanty
nD - liczebność przedziału dominanty
nD − 1 - liczebność przedziału poprzedzającego przedział dominanty
nD + 1 - liczebność przedziału następnego po przedziale dominanty
xD - długość przedziału dominanty
WIEK W LATACH xi |
LICZBA STUDENTÓW ni |
---|---|
20-24 | 10 |
24-28 | 20 |
28-32 | 40 |
32-36 | 20 |
36-40 | 10 |
OGÓŁEM | 100 |
$$D = 28 + \ \frac{40 - 20}{\left( 40 - 20 \right) + \left( 40 - 20 \right)}*4 = 30$$
Odp. Najczęstszy wiek wynosi 30 lat. ZAPAMIĘTAJ!!!!!!!!!!!!ZAWSZE DAJEMY ODPOWIEDŹ!!!!!!!!!!!!!!!!
HISTOGRAM:
ni
40
30
20
10
20 24 28 32 36 40 xi
DIAGRAM: dorysować ręcznie
ni
40
30
20
10
20 24 28 32 36 40 xi
METODA GRAFICZNA – WYKORZYSTUJĄC HISTOGRAM LICZEBNOŚCI: dorysować ręcznie
ni
40
30
20
10
24 28 32 36 xi
KWANTYLE – miary, które pozwalają podzielić daną zbiorowość statystyczną ze względu na wartości badanej zmiennej na pewną ilość części.
Qβ – kwantyl rzędu β , który np. należy do…: βЄ (0, 1)
NAJCZĘŚCIEJ STOSOWANE KWANTYLE:
1.KWARTYLE (miary ćwiartkowe, 4 części), β = 0,25; 0,5; 0,75
2.DECYLE (10 części) β =0,1; 0,2; ………0,9
3.CENTYLE (100 części) β =0,01; 0,02;………………..0,99
Q0,25=Q1 Q0,5=Q2= Me Q0,75=Q3
x min Q1 Me Q3 x max
MEDIANA – zwana wartością środkową dzieli zbiorowość statystyczną na 2 równe części; połowa jednostek zbiorowości przyjmuje wartości – cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od mediany.
SZEREG SZCZEGÓŁOWY I ROZDZIELCZY PUNKTOWY:
$Me = x_{\frac{N + 1}{2}}$ gdy N jest nieparzyste
$Me = \ \frac{1}{2}\left( x_{\frac{N}{2}} + x_{\frac{N}{2} + 1} \right)$ gdy N jest parzyste
ZADANIE:
N – 10 studentów
x-liczba nieobecności na ćwiczeniach ze statystyki 1,0,2,2,3,0,2,1,2,4
Oblicz medianę.
0,0,1,1,2,2,2,2,3,4
Me
$$Me = \ \frac{1}{2}\left( x_{\frac{N}{2}} + x_{\frac{N}{2} + 1} \right)$$
$$Me = \frac{1}{2}\left( x_{5} + x_{6} \right) = \frac{2 + 2}{2} = 2$$
Me=2
≤ ≥
LICZBA NIEOBECNOŚCI xi |
LICZBA STUDENTÓW ni |
SKUMULOWANA LICZBA STUDENTÓW cum ni |
---|---|---|
0 | 2 | 2 |
1 | 2 | 4 |
2 | 4 | 8 |
3 | 1 | 9 |
4 | 1 | 10 |
RAZEM | 10 | - |
SZEREG ROZDZIELCZY PRZEDZIAŁOWY:
1.Wyznaczamy pozycję mediany: Me=0,5*N
2.$Me \approx x_{\text{Me}} + \frac{0,5*N - \text{cum}_{ni - 1}}{n_{\text{Me}}}*\ x_{\text{Me}}$
xMe - dolna granica przedziału mediany
0,5*N – pozycja mediany
cumni − 1 – skumulowana liczebność przedziału poprzedzającego przedział mediany
nMe - liczebność przedziału mediany
xMe – długość przedziału mediany
LICZBA NIEOBECNOŚCI xi |
LICZBA STUDENTÓW ni |
SKUMULOWANA LICZBA STUDENTÓW cum ni |
---|---|---|
20-24 | 10 | 10 |
24-28 | 20 | 30 |
28-32 | 40 | 70 |
32-36 | 20 | 90 - Me |
36-40 | 10 | 100 |
OGÓŁEM | 100 | - |
Obliczyć medianę:
Poz Q0,5= M=Q2 0,5N=0,5*100=50
$$Q_{\beta} \approx x_{Q_{\beta}} + \frac{\beta*N - \text{cum}_{ni - 1}}{n_{Q}}*\ x_{Q_{\beta}}$$
$$Me \approx 28 + \frac{50 - 30}{40}*4 = 30$$
Odp. Najczęstszy wiek studenta to 30 lat.