Wprowadzenie w tematyki zajęć
Krótki rys historyczny
Podstawowe pojęcia
Opracowanie i prezentacja danych
Statystyki opisowe (miary położenia, zminność, asymetrii i koncentracji)
Prawdopodobieństwo i rozkłady teoretyczne (zmienne ciągłe i dyskretne)
Próba i rozkłady z próby
Teoria estymacji – estymacja parametrów statystycznych
Badanie zależności posiedzi ilościowymi cechami statystycznymi (korelacja liniowa Pearsona korelacja rang spearmana)
Podstawowe podręczniki
Interpretacja, rozwiązywanie zadań
Stasiewicz S., rusnak z., siedlacka u – statystyka elementy teorii i zadania - (Best off !!)
Sobczyk M. statystyka wydawnictwo PWN warszawa 1998
Szwed R. metody statystyczne w badaniach społecznych , wydawnictwo kul lublin 2009
W razie nie zrozumienia programu
Stanisz A. przystępny kurs statystyki z wykorzystaniem pakietu statistica pl na przykładzie danych z medycyny tom 1 i 2 statsoft polska, Kraków 2000
Statystyka – status lac. Państwo
Jako sztuka – 2000 lat b przed naszą peą spisu ludności w Egipcie i Chinach
600 lat c spisy ludności w cesarstwie rzymskim
300 lat bc
Spisy w Indiach, gecji, Babilonii…
Średniowiecze – spisy gospodarcze majatków feudalnych i koscielnych
Jako nauka
Nauki o panstwie – zajmowały się gromadzeniem danych liczbowych i opisem stanu państwa ba podstawie danych
Statystyka współczesna podstawą stat. Współ. Jest teoria rachunki prawdopodobieństwa, która wyjaśnia w jakich warunkach ujawniają się prawidłowości w zjawiskach masowych. Prace arytmetyków politycznych oraz matematyków rozw. Rach, prawdppodobienstwa
Statystyka opisowa – zajmuje się gromadzeniem opracowaniem i prezentacja danych o obserwowanej zbiorowości, opisuje zbiorowość przy wykorzystaniu narzędzi statystycznych (sem1)
Wnoski statystyczne – pozwala określicz i scharakteryzować populację generalną za pomocą zredukowanej ilości danych przy zastosowaniu rachunku prawdopodobieństwa
Statystyka -to zbiór metod służących pozyskiwaniu, prezentacji i analizie danych !!!! – wazne !!!
Statystyka- jest bardziej sposobem myślenia lub wnioskowania niż pęczkiem rece[pt na młócenie danych w celu odsłonięcia odpowiedzi. Trzeba traktować ją jako „naukę, technikę i sztukę”
----------------------
Realizując badania statystyczne należy zapoznać się z podst., pojęciami jakie wykorzystywane są na etapie projektowania badań i doboru metod ich analizy
Zbiorowość statystyczną – jest przedmiotem badań statystycznych, jest to zbiór wszystkich elementów nieidentycznych które podlegają badaniu. Generalnie nie możemy przebadać wszystkich jednostek
Próba (populacja próbna) – stanowić ją może grupa lub podzbiór jednostek lub elementów całej populacji (zbiorowości generalnej) który podlega bezpośredniemu badaniu ze względu na rozpatrywaną cechę co pozwala na wyciągnięcie wnioskowo kształtowaniu się badanej cechy populacji generalnej
Cechami statystycznymi – nazywamy własnośći charakteryzujące każdą jednostę statystyczną, podstawowy podział cech stat. Wskazuje na możliwoś ich opisu dzielim je na ilościowe (mierzalne i jakościowe niemierzalne
----------------------------------------
Cechy statystyczne
1 mierzalne (ilościowe ) ciągłe i skokowe – interwałowa lub ilorazowa – warianty cech mogą przyjmować postać ciągłą lub skokową. Realizacje cech ciągłych wyrażane są przed dowolne liczny ( całkowite lub ułamkowe np. metry, gramy sztuki) podczas gdy realizacje cech skokowych są wyrażane na ogół przez liczy całkowite
2 niemierzalne (jakościowe) – nominalna lub porządkowa - warianty tych cech mogą przyjmować tylko postać opisu słownego sprowadzonego jedynie do postaci mierzalnej poprzez zastos. Umownych skal numerycznych (także postać zero jedynkowa
) można jedynie stwierdzić ktry z wariant cechy występuje u danej jednostki
-------------------------------------
Skale pomiarowe !!
1.nominalna - miejsce zamieszkania , płeć – stosuje tylko opis słowny potrzebny do identyfikacji jednostki
2. ilorazowa – cena w zł, napięcie elektryczne, inflacja, bezrobocie, masa, czas wykonywanywanej danej czynnosci, czas przejazdu z miasta do miasta – działania na danych
3. porządkowa – służy do porządkowania danych ale zajmuje się też cechami jakościowymi – wykształcenie, stan zdrowia, stan finansów, kolejność zawodników na podium
4. interwałowa – ma wartości skali porządkowej, możliwość segregowania jednostek – ale nie można wykonywać operacji – daty, stopnie Celsjusza
---------------------------------------
Prezentacja danych
1 szereg szczegółowy {0,0,0,0,1,1,1,2,2,2,3,3,4,4,4,5,5,6,6,8,9,11,15}
2 szereg rozdzielczy punktowy
numer klas ( liczba popełnionych bledow we tescie) | Liczba kierowców |
---|---|
0 | 55 |
1 | 15 |
2 | 10 |
3 | 2 |
3 szereg rozdzielczy klasowy (przedziałowy)
Czas opczekiwania samochodow ciezarowych na odprawe celna (min) | Liczba samochodow |
---|---|
0-10 | 14 |
10-20 | 20 |
20-30 | 25 |
30-40 | 27 |
40-50 | 20 |
50-60 | 9 |
----------------------
Konstrukcja szeregu rozdzielczego z przedziałami klasowymi – cwieczenia (na 100%)
Ustalenie liczby klas – K
liczba klas zalezy od:
-liczby obserwacji
-Obszaru zmienności danej cechy (różnica mieczy max i min)
-cel badania
Im liczniejsza zbiorowość i wiekszy obszar zmienności, tym wiecej przedziałów być powinno
a)
Liczba obserwacji | Liczba zalecnych klas |
---|---|
40-60 | 6-8 |
60-100 | 7-10 |
100-200 | 9-12 |
200-500 | 11-17 |
b) – kartka
c) kartka
Ustalenie rozpiętości przedziału klasowego dla badanych cech (h lub i)
Rozstęp R= Xmax – Xmin
H(i) = Xmax-Xmin/k = R/k gdzie K= pierwiastek z N
Jeżeli wybiera się przybliżoną wartość h, to powinno to być zawsze zaokrąglane w górę
Ustalenie granic poszczególnych klas
Wybór dolnej granicy pierwszego przedziało X01 powinien zapewnić najlepszą prezentacją zebranego materiału i powinien obejmować najmniejszą wartość cechy w danej zbiorowośći (x01=xmin)
Problem oznaczania przedziałów
W przypadku cech ciągłych górne granice przedziałow poprzednich powinny być dolnymi granicami przedziałów astępnych ( tak aby nie było luk międzi klasami). Należy więc wstawić do której klasy zaliczane będą wartości granicznenp przedziały lewostronne domknięte (x oi <xi<xii)
Zadanie .
W pewnej fimie kurierskiej przeciętny koszt przesyłki w zależnośći od wagi w ciągu 16dni był następujący: 21, 38, 43, 56, 41, 54, 48, 80, 50, 26, 58, 28, 54, 48, 68, 76.
Przedstawić dane w postaci szeregu rozdzielczego
Szereg uporządkowany
21, 26, 28, 38, 41, 43, 48, 48, 50, 50, 54, 56, 58, 68, 76, 80
Ustalenie rozpiętości przedziału i liczby klas:
H= xmax-xmin/k = 80-21/pierwiastek z 16 = 59/4 = 14,7515 = w przybliżeniu 15
Koszty przesyłki | Liczba paczek | Wskaźnik struktury |
---|---|---|
21-36 | 3 | 0,1875 |
36-51 | 7 | 0,4375 |
51-66 | 3 | 0,1875 |
66-81 | 3 | 0,1875 |
(przedziały – pierwszy - 21+15, pierwszy przedział itd…)
Zadanie do domu, w pewnej firmie transportowej sprawdzono dzienne zużycie paliwa, przed samochody rozwożące towar do pobliskich miejscowości: 7, 11,8 ,14,14,10,5,18,12,21,14,13,15,11,9,6,17,16,19,15,14,19,17,13,19,18,13,15,11,13,18,14,19,16,17,15,14,15,12,12,13,17,13,18,14,8,9,21,22,24,17,28,22,14,15,19,17,19,23,12,13,8,9,11
Przestawić dane w postaci szeregu rozdzielczego, oraz na histogramie ( histogram wykres słupkowy)
5, 6, 7, 8, 8, 8, 9, 9, 9, 10, 11, 11, 11, 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 21, 21, 22, 22, 23, 24, 28,
H= 28-5/8= 23/8= 2,875 w przybliżeniu 3
Zużycie paliwa | Ile pojazdów | Wskaźnik struktury |
---|---|---|
5-8 | 3 | |
8-11 | ||
11-14 | ||
14-17 | ||
17-20 | ||
20-23 | ||
23-26 | ||
26-29 |