ELEMENTY STATYSTYKI wykład 1

Wykład 1 2011.10.15

Zaliczenie-ściągi ze wzorami można mieć – suche wzory-bez opisu.

LITERATURA:

1.M. Sobczyk „Statystyka” PWN W-wa, 2001

2.S.Ostasiewicz, Z. Rusnak, U. Siedlecka „Statystyka, elementy teorii, zadania” Wyd. AE, Wrocław, 2001

3.S. Juszczyk „Statystyka dla pedagogów” Toruń 2006

4.A Malarska, H. Mikulska „Statystyka w zadaniach nie tylko dla psychologów i pedagogów” UE, Łódź 1999

5.E Sojka „Statystyka w przykładach i zadaniach” Podręczniki akademickie, WSZiNS, Tychy

STATYSTYKA – nauka traktująca o metodach ilościowych badania zjawisk masowych.

ZJAWISKA MASOWE – zjawiska, które składają się z dużej liczby (masy) pojedynczych faktów, zdarzeń lub wielkości.

METEDY ILOŚCIOWE – procedury badawcze, które posługują się opisem liczbowym.

PODSTAWOWE POJĘCIA STATYSTYCZNE:

-zbiorowość statystyczna;

-jednostka statystyczna;

-cecha statystyczna – czyli cecha jednostki statystycznej.

PODZIAŁ CECH STATYSTYCZNYCH:

1.CECHY STAŁE:

-rzeczowa (co lub kogo poddajemy obserwacji statystycznej);

-czasowa (jaki okres obejmuje badanie);

-przestrzenna (gdzie badamy).

2.CECHY ZMIENNE:

-mierzalne (ilościowe)

-niemierzalne (jakościowe) .

CECHY MIERZALNE, ZWANE ZMIENNYMI DZIELIMY NA:

1.SKOKOWE (dyskretne) – przyjmują skończony lub przeliczalny zbiór wartości. Najczęściej jest to zbiór liczb całkowitych dodatnich np.: liczba osób w rodzinie, liczba usterek, np.: 1,2,5,11,13;

2.CIĄGŁE-mogą przyjąć każdą wartość z określonego przedziału liczbowego (a,b), przy czym ilość miejsc po przecinku uzależniona jest od dokładności dokonywanych pomiarów (np. wiek, waga), np. może być 16 lat lub 16, 5 lat, lub 16 lat 6 miesięcy i 12 dni.

RODZAJE BADAN STATYSTYCZNYCH:

1.BADANIA CAŁKOWITE, np.: spis ludności;

2.BADANIA CZĘŚCIOWE:

-badania reprezentacyjne – czyli część jednostek tzw. Próba statystyczna;

-badania monograficzne;

-badania ankietowe.

ETAPY BADANIA STATYSTYCZNEGO:

1.PLANOWANIE BADANIA STATYSTYCZNEGO:

-cel badania

- zbiorowość statystyczna wraz z jednostkami;

-zakres badania (jakie cechy będziemy badać);

- rodzaj badania (czy cała zbiorowość statystyczna, czy Badania całkowite czy częściowe)

-kosztorys badania;

-osoby odpowiedzialne za badania.

2.OBSERWACJA STATYSTYCZNA – zebranie danych statystycznych.

3.OPRACOWANIE I PREZENTACJA MATERIAŁU STATYSTYCZNEGO:

-grupowanie materiału statystycznego;

-budowa szeregów statystycznych;

-budowa tablic statystycznych;

-prezentacja graficzna materiału statystycznego.

4.ANALIZA STATYSTYCZNA WYNIKÓW OBSERWACJI.

GRUPY METOD STATYSTYCZNYCH:

1.OPISOWE METODY ANALIZY STRUKTURY ZBIOROWOŚCI STATYSTYCZNEJ:

A. SZEREG STATYSTYCZNY- ciąg wielkości statystycznych wzrastających lub malejących uporządkowanych według kryteriów.

SZEREGI STATYSTYCZNE

SZEREGI SZCZEGÓŁOWE SZEREGI ROZDZIELCZE SZEREGI GEOGRAFICZNE SZEREGI DYNAMICZNE

(proste, wyliczające) (strukturalne) (terytorialne) (czasowe)

Z CECHĄ MIERZALNĄ Z CECHĄ NIEMIERZALNĄ

PUNKTOWE PRZEDZIAŁOWE

ZADANIE 1:

Badano 10 rodzin ze względu na liczbę dzieci w rodzinie.

N – 10 rodzin x – liczba dzieci w rodzinie 1,0,2,2,3,0,2,1,2,4

N- liczba jednostek w zbiorowości (czyli ogólna liczba obserwacji)

SZEREG PROSTY: 0,0,1,1,2,2,2,2,3,4

SZEREG ROZDZIELCZY PUNKTOWY( jest badany dla średniej skokowej):

LICZBA DZIECI

Xi

LICZBA RODZIN

ni

0 2
1 2
2 4 (to jest DOMINANTA)
3 1
4 1
RAZEM 10

WZÓR: $\sum_{i = 1}^{k}{\ n_{i}} = N$ , czyli to jak jakbyśmy dodali : n1 +n2+n3+n4+n5….itd.

ZADANIE 2:

SZEREG ROZDZIELCZY PRZEDZIAŁOWY:

WIEK W LATACH

xi

LICZBA STUDENTÓW

ni

ODSETEK STUDENTÓW

wi=ni/N*100=(%)

(wychodzi nam wynik w procentach)

20-24 10 10%
24-28 20 20%
28-32 40-przedział DOMINANTY 40%
32-36 20 20%
36-40 10 10%
OGÓŁEM 100 – oznaczamy jako N 100%

Zestawienie wyników w postaci SZEREGU ROZDZIELCZEGO nazywamy ROZKŁADEM EMPIRYCZNYM ZMIENNEJ JEDNOWYMIAROWEJ!!!

SZEREG ROZDZIELCZY Z CECHĄ NIEMIERZALNĄ:

PŁEĆ LICZBA STUDENTÓW
M 12
K 18
OGÓŁEM 30

SZEREG CZASOWY:

LATA

PRODUKCJA

(w sztukach)

2005 125
2006 120
2007 180
2008 110

SZEREG GEOGRAFICZNY:

PODREGIONY

WOJ. ŚLĄSKIEGO

PRZYROST NATURALNY

NA 1000 W 2006 ROKU

CZĘSTOCHOWSKI -2,5
BIELSKO-BIALSKI 1,0
CENTRALNY ŚLĄSKI -1,5
RYBNICKO - JASTRZĘBSKI 1,7

TABLICA STATYSTYCZNA – zawiera jeden lub więcej szeregów statystycznych:

- tablica prosta-zawiera jeden szereg;

-tablica kombinowana – charakteryzuje zbiorowość statystyczną pod względem dwóch lub więcej cech statystycznych.

BUDOWA TABLICY:

1.ZWIĘZŁY TYTUŁ TABLICY – OKREŚLAJĄCY zbiorowość pod względem rzeczowym, czasowym i przestrzennym;

2.TABLICA WŁAŚCIWA – nazwa wierszy i kolumn;

3.ŹRÓDŁO DANYCH ZAWARTYCH W TABLICY.

PREZENTACJA GRAFICZNA MATERIAŁU STATYSTYCZNEGO:

1.WYKRESY LINIOWE-szczególna odmianą jest diagram zwany wielobokiem liczebności;

2.WYKRESY SŁUPKOWE (histogram);

3.WYKRESY KOŁOWE – należą do grupy wykresów powierzchniowych;

4.KARTOGRAMY – stosowane do analiz w ujęciu przestrzennym

5.PIRAMIDY WIEKU-używane w analizach demograficznych;

6. WYKRESY OBRAZKOWE – przedstawiają wielkości zjawiska przed odpowiednią wielkość znaku obrazkowego.

PARAMETRY OPISOWE – takie charakterystyki liczbowe, które w sposób syntetyczny pozwalają ocenić i porównać różne własności rozkładów empirycznych zmiennych jednowymiarowych.

MIARY PRZECIĘTNE:

1.ŚREDNIA ARYTMETYCZNA: ($\overset{\overline{}}{x}$)


$$\overset{\overline{}}{x} = \frac{\sum_{i = 1}^{N}x_{i}}{N}$$


$$\ \overset{\overline{}}{x} = \frac{17}{10} = 1,7$$

Szereg szczegółowy:

LICZBA DZIECI

Xi

LICZBA RODZIN

ni

xi * ni
0 2 0
1 2 2
2 4 (to jest DOMINANTA) 8
3 1 3
4 1 4
RAZEM 10 17

Odp. Średnia liczba dzieci w rodzinie to 1,7 dziecka.

SZEREG ROZDZIELCZY PUNKTOWY (ŚREDNIA WAŻONA):

$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ czyli zapisujemy:


$$\overset{\overline{}}{x} = \frac{17}{10} = 1,7$$

SZEREG ROZDZIELCZY PRZEDZIAŁOWY:

$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ gdzie: $\ x_{i\ } = \frac{x_{\text{di}}\ + \ x_{\text{gi}}}{2}$ gdzie : xdi – dolny przedział; xgi – górny przedział

WIEK W LATACH

xi

LICZBA STUDENTÓW

ni

xi xi *ni
20-24 10 22 220
24-28 20 26 520
28-32 40 30 1200
32-36 20 34 680
36-40 10 38 380
OGÓŁEM N = 100 - -

$\overset{\overline{}}{x} = \ \frac{\sum_{i = 1}^{k}{x_{i}n_{i}}}{N}$ = $\frac{3000}{100} = 30$

2.DOMINANTA – (moda, wartość najczęstsza, wartość typowa) – wartość cechy, która w rozkładzie występuje najczęściej. W szeregach szczegółowych i rozdzielczych punktowych jest to wartość zmiennej, której odpowiada największa liczebność (lub częstość względna).

D =  xi[maxni] lub: D =  xi[maxwi] ;

Gdzie ni- to liczebność, wi – odsetek (procenty)

Przykładowa odpowiedź to : NAJCZĘSTSZA LICZBA DZIECI W RODZINIE WYNOSI 2.

W szeregach przedziałowych o równej długości przedziałów klasowych – dominanta jest jedną z wartości należących do tego przedziału, któremu odpowiada największa liczebność lub częstość względna.


$$D \approx \ x_{D} + \ \frac{n_{D} - n_{D - 1}}{\left( n_{D} - n_{D - 1} \right) + \left( n_{D} - n_{D + 1} \right)}*\ x_{D}$$

xD - dolna granica przedziału dominanty

nD - liczebność przedziału dominanty

nD − 1 - liczebność przedziału poprzedzającego przedział dominanty

nD + 1 - liczebność przedziału następnego po przedziale dominanty

xD - długość przedziału dominanty

WIEK W LATACH

xi

LICZBA STUDENTÓW

ni

20-24 10
24-28 20
28-32 40
32-36 20
36-40 10
OGÓŁEM 100


$$D = 28 + \ \frac{40 - 20}{\left( 40 - 20 \right) + \left( 40 - 20 \right)}*4 = 30$$

Odp. Najczęstszy wiek wynosi 30 lat. ZAPAMIĘTAJ!!!!!!!!!!!!ZAWSZE DAJEMY ODPOWIEDŹ!!!!!!!!!!!!!!!!

HISTOGRAM:

ni

40

30

20

10

20 24 28 32 36 40 xi

DIAGRAM: dorysować ręcznie

ni

40

30

20

10

20 24 28 32 36 40 xi

METODA GRAFICZNA – WYKORZYSTUJĄC HISTOGRAM LICZEBNOŚCI: dorysować ręcznie

ni

40

30

20

10

24 28 32 36 xi

KWANTYLE – miary, które pozwalają podzielić daną zbiorowość statystyczną ze względu na wartości badanej zmiennej na pewną ilość części.

Qβ – kwantyl rzędu β , który np. należy do…: βЄ (0, 1)

NAJCZĘŚCIEJ STOSOWANE KWANTYLE:

1.KWARTYLE (miary ćwiartkowe, 4 części), β = 0,25; 0,5; 0,75

2.DECYLE (10 części) β =0,1; 0,2; ………0,9

3.CENTYLE (100 części) β =0,01; 0,02;………………..0,99

Q0,25=Q1 Q0,5=Q2= Me Q0,75=Q3

x min Q1 Me Q3 x max

MEDIANA – zwana wartością środkową dzieli zbiorowość statystyczną na 2 równe części; połowa jednostek zbiorowości przyjmuje wartości – cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od mediany.

SZEREG SZCZEGÓŁOWY I ROZDZIELCZY PUNKTOWY:

$Me = x_{\frac{N + 1}{2}}$ gdy N jest nieparzyste

$Me = \ \frac{1}{2}\left( x_{\frac{N}{2}} + x_{\frac{N}{2} + 1} \right)$ gdy N jest parzyste

ZADANIE:

N – 10 studentów

x-liczba nieobecności na ćwiczeniach ze statystyki 1,0,2,2,3,0,2,1,2,4

Oblicz medianę.

0,0,1,1,2,2,2,2,3,4

Me


$$Me = \ \frac{1}{2}\left( x_{\frac{N}{2}} + x_{\frac{N}{2} + 1} \right)$$


$$Me = \frac{1}{2}\left( x_{5} + x_{6} \right) = \frac{2 + 2}{2} = 2$$

Me=2

≤ ≥

LICZBA NIEOBECNOŚCI

xi

LICZBA STUDENTÓW

ni

SKUMULOWANA LICZBA STUDENTÓW

cum ni

0 2 2
1 2 4
2 4 8
3 1 9
4 1 10
RAZEM 10 -

SZEREG ROZDZIELCZY PRZEDZIAŁOWY:

1.Wyznaczamy pozycję mediany: Me=0,5*N

2.$Me \approx x_{\text{Me}} + \frac{0,5*N - \text{cum}_{ni - 1}}{n_{\text{Me}}}*\ x_{\text{Me}}$

xMe - dolna granica przedziału mediany

0,5*N – pozycja mediany

cumni − 1 – skumulowana liczebność przedziału poprzedzającego przedział mediany

nMe - liczebność przedziału mediany

xMe – długość przedziału mediany

LICZBA NIEOBECNOŚCI

xi

LICZBA STUDENTÓW

ni

SKUMULOWANA LICZBA STUDENTÓW

cum ni

20-24 10 10
24-28 20 30
28-32 40 70
32-36 20 90 - Me
36-40 10 100
OGÓŁEM 100 -

Obliczyć medianę:

Poz Q0,5= M=Q2 0,5N=0,5*100=50


$$Q_{\beta} \approx x_{Q_{\beta}} + \frac{\beta*N - \text{cum}_{ni - 1}}{n_{Q}}*\ x_{Q_{\beta}}$$


$$Me \approx 28 + \frac{50 - 30}{40}*4 = 30$$

Odp. Najczęstszy wiek studenta to 30 lat.


Wyszukiwarka

Podobne podstrony:
ELEMENTY STATYSTYKI WYKŁAD 2
statystyka wykład
Gorgol I Elementy statystyki opisowej
elementy bioinformatyki wyklad2
statystyka wyklady, Szkoła WSTiH
Statystyka wykład 1
ELEMENTY SEKSUOLOGII wykłady
statystyka wyklad III
Elementy Filozofii Wykład 1  10 2013
Statystyka - egzamin - ściąga - Kuszewski, Statystyka - wykłady - T.Kuszewski
statystyka- wyklady, Ekonomia, 1ROK, statystyka
Kolokwium z neta, Pedagogika EPiW, Metody badań pedagogicznych z elementami statystyki
statystyka -wykłady II sem, statystyka
Elementy statystyki matematycznej wykorzystywane do opracowywania wielkości wyznaczanych, Geodezja i
bhp z elementami ergonomii wyklad 9 10 2010
AnaLIZA STATYSTYCZNA 8 wykład6, 1
Elementy Ekonomi Wykład 1  10 2013

więcej podobnych podstron