POJĘCIA STATYSTYKI:
-nauka-gałąź matematyki stosowanej
-zbiór danych ilościowych (liczbowych)
-pewna wielkość opisująca rozkład teoretyczny ( t-Studenta)
CELE STATYSTYKI:
-analiza struktury procesów masowych
-poszukiwanie powiązań między procesami
-analiza dynamiki struktur i procesów zjawisk masowych
-wnioskowanie statystyczne
STATYSTYKA- nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.
Metoda ilościowa- m. analizy która wykorzystuje opis liczbowy
ZBIOROWOŚĆ STATYSTYCZNA zbiór elementów (osób, rzeczy, faktów) poddanych badaniu statystycznemu, podobnych ale nie jednakowych. Dzielimy ją na zbiorowość generalną i populację generalną (wszystkie elementy)
Próba musi być reprezentatywna!
JEDNOSTKA STATYSTYCZNA- element zbiorowości statystycznej
CECHY STATYSTYCZNE - właściwości jednostki stat.
PODZIAŁ CECH: na stałe i zmienne
CECHY STAŁE-nie podlegają badaniu stat. ale są bardzo przydatne (definiują jednostki stat. definiują zbiorowości)
CECHY ZMIENNE- różnicują jedn. stat., podlagają badaniu,
Cechy zmienne dzielimy na ilościowe (mierzalne) jakościowe (niemierzalne)
CECHY ILOŚCIOWE-np. wzrost, ciężar
CECHY JAKOŚCIOWE-poziom wykształcenia, kolor oczu,
Cechy ilościowe dzielimy na skokowe i ciągłe
CECHY SKOKOWE- takie które przyjmują niektóre wartości ze zbioru liczb rzeczywistych (np. liczba dzieci w rodzinie)
CECHY CIĄGŁE- wzrost, ciężar ciała
SKALE POMIAROWE:
1.Skala nominalna (najsłabsza ze skal) rozróżniamy za jej pomocą elementy (kobieta, mężczyzna)
2.Skala porządkowa (silniejsza) może dokonać rankingu (co lepsze co gorsze) i skala nominalna się w niej zawiera
3.Skala przedziałowa (s.1i2 się w niej zawierają) odp. na pyt. o ile dane zjawisko, jednostka jest mniejsza czy większa. Np. C'
4.Skala ilorazowa (s.1,2i3 się w niej z,) odp. na pyt. o ile razy to co w 3. (wzrost, waga, St. Kalwina -mnie ma w nich mniej niż zero)
BADANIA STATYSTYCZNE- zespół czynności mających na celu określenie w zbiorowości stat. prawidłowości
3 CELE BADAŃ S.
-poznanie rozkładów badanych cech
-poznanie współzależności między cechami
-analiza dynamiki badanych zjawisk i procesów
RODZAJE BADAŃ ST.
1.badanie pełne np. spis powszechny (celem jest zbadanie wszystkich jednostek statystycznych w badanej zbiorowości)
2.badanie częściowe- badamy tylko cześć zb., tutaj wykorzystuje się metodę reprezentatywną (na podstawie próby wyciągnąć wnioski)
3.szacunki-stosujemy wtedy kiedy nie możemy użyć m.pełnej ani częściowej, kiedy nie możemy dotrzeć do jednostek (pyt.o rzeczy wstydliwe)
ETAPY BADAŃ STATYSTYCZNYCH
1.przygotowanie b.s. (określenie celu b., określenie przedmiotu b., ustalenie zakresu b., wybór metody badania,
2.zbieramy materiał statystyczny (m.s.pierwotny- zebrany dla naszego konkretnego badania, m.s.wtórny- został zebrany na potrzeby innego badania który teraz wykorzystujemy w naszym badaniu)
3.opracowanie materiału stat. (grupowanie-w sposób typologiczny lub wariancyjny, zliczanie- zlicz komputer) g.typologiczne- co, gdzie, kiedy, g.wariancyjne- cecha ilościowa
4.prezentacja materiału stat. (tablice, tabele jedno lub wielo wymiarowe, wykresy, szeregi statystyczne,
5.analiza statystyczna (wzory, przeliczenia, interpretacje)
SZEREG STATYSTYCZNY- ciąg wielkości statystycznych uporządkowany według jakiegos kryterium. Wyróżniamy szeregi: strukturalne (np.szereg ważony) szczegółowe (szczegółowy prosty) kumulacyjne, geograficzne, dynamiczne albo chronologiczne.
SZEREG SZCZEGÓŁOWY PROSTY- (wyliczający) to ciąg wartości cechy statystycznej uporządkowanych w sposób niemalejący i nierosnący.
4 RODZAJE CHARAKTERYSTYK dla rozkładu jednej zmiennej:
-miary przeciętne
-miary zmienności
-m.asymetrii
-m.koncentracji
Rozkład czyli rozdział wartości danej cechy czyli struktura podzialu
MIARY PRZECIĘTNE- średnie klasyczne (śr.arytmetyczna- najbardziej podstawowa, śr.harmoniczna, śr.geometryczna, śr.kwadratowa) modalna (wartość typowa, dominanta) mediana ( szczegółowy przypadek kwartyli- które dzielą się na kwartale, decyle, wentyle)
Najlepsza reprezentanta- średnia z przedziału klasowego
MEDIANA- wartość środkowa- taka wartość cechy albo zmiennej która dzieli zbiór obserwacji na dwie równe części ze względu na liczebność tych części.
MIARY ZMIENNOŚCI-bezwzględne i względne
WARIANCJA- średnia arytmetyczna z kwadratów odległości, podstawowa miara zmienności
KURIOZA- podstawowa miara koncentracji rozkładu
METODY ANALIZY WSPÓŁZALEŻNOŚCI.
Współzależność dzielimy na FUNKCYJNĄ- jednej zmiennej odpowiadają konkretne wartości drugiej zmiennej i STOCHASTYCZNĄ- gdy wraz ze zmianą wartości jednej zmiennej następuje zmiana rozkładu prawdopodobieństwa drugiej zmiennej, np.waga do wzrostu.
WSPÓŁZALEŻNOŚĆ KORELACYJNA- szczególny przypadek w.stochastycznej, ma miejsce wtedy gdy zmianom jednej zmiennej towarzyszą zmiany średnich wartości drugiej zmienne. Jeżeli nie ma związku stochastycznego lub współzależności stochastycznej to również nie ma związku korelacyjnego. Współzależność korelacyjna może być dwu lub jedno stronna.
DWUSTRONNA jeżeli badane zjawiska nawzajem na siebie oddziaływają np.aktywność zawodowa i dochód
JEDNOSTRONNA- istnieje współzależność ale tylko w jedną stronę np.temperatura i liczba spożywanych napojów chłodzących
NARZĘDZIA B. ZWIĄZKÓW KORELACYJNYCH
1.kowariancja
2.współczynnki korelacji
3.regresja
4.tablica korelacyjna
5.tablicz asocjacji
Wady kowariancji- jest nieinterpretowana, nie pokazuje siły związku)
Współczynnik korelacji liniowej Persona nie ma jednostki a więc można go interpretować i pokazuję siłę związku
REGRESJA- pozwala na badanie mechanizmu powiązań miedzy zmiennymi.
Funkcja regresji jest to analityczny obraz przyporządkowania średnich wartości zmiennej objaśnianej konkretnym wartością zmiennych objaśniających
MODEL REGRESYJNY- pozwala przewidywać
Regresje wyróżniamy pierwszego i drugiego rodzaju, dokładny obraz współzależności daje nam regresja pierwszego rodzaju.
MNK metoda najmniejszych kwadratów
Współczynnik korelacji wielorakiej- mówi o współzależności między jedną zmienną a zespołem pozostałych zmiennych.
Zmienne objaśniane nie powinny być ze sobą skorelowane, albo być w bardzo małym stopniu
ZDARZENIE ELEMENTARNE-podstawowe, pierwotne pojecie w prawdopodobieństwie, jest to wynik doświadczenia losowego
DOŚWIADCZENIE-jest to eksperyment lub obserwacja
LOSOWE- nie jesteśmy w stanie określić wyniku tego doświadczenia pomimo sprecyzowania warunków w których doświadczenie przebiega np.rzut monetą
WŁAŚCIWOŚCI Z.E.
-z.e. może zajść lub nie
-jedno ze z.e. na pewno zajdzie
-zaistnienie jednego z.e. wyklucza zaistnienie innych z.e. (wykluczają się)
3 RODZAJAPRZESTRZENI:
-przestrzeń skończona np.rzut monetą
-przestrzeń nieskończona przeliczalna np.rzut monetą do momentu wyrzucenia orła
-przestrzeń nieskończona nieprzeliczalna, dotyczy zbioru liczb rzeczywistych np.wzrostu, czasu
ZDARZENIE LOSOWE- w przypadku przestrzeni skończonej i nieskończonej przeliczalnej każdy podzbiór w przestrzeni z.elementarnych jest zdarzeniem losowym.
DEF.PRAWDOPODOBIEŃSTWA
DEF.LA PLATA- jeżeli zdarzenie E rozkłada się na n wykluczających się jednakowo możliwych zdarzeń elementarnych spośród których m zdarzeń sprzyja zaistnieniu zdarzenia A to prawdopodobieństwo zaistnienia zdarzenia A możemy zapisać jako iloraz m/n
GEOMETRYCZNA DEF.PRAWDOPODOBIEŃSTWA- jeżeli Q i q są to 2 zbiory w przestrzeni r wymiarowej, oraz jeśli q zawiera się w Q to prawdopodobieństwo, że dowolny punkt należący do Q będzie również należał do q wynosi tyle co stosunek miary q do miary Q.
Wyróżniamy również definicje Kołmogorowa oraz twierdzenie Bayesa
ZMIENNA LOSOWA- zmienną losową X nazywa się funkcję X=X(e) określoną na zbiorze zdarzeń elementarnych i przyjmującą wartości ze zbioru liczb rzeczywistych taką że dla każdej liczby rzeczywistej X dla której X(e)<X spełniony jest warunek że zdarzenie A € Z
Wyróżniamy zmienne losowe skokowe i ciągłe
PRAWDOPODOBIEŃSTWO WARUNKOWE- prawdopodobieństwem zdarzenia A obliczonego przy założeniu że zaszło zdarzenie B nazywamy prawdop.warunkowym zaistnienia zdarzenia A pod warunkiem zaistnienia zdarzenia B.
Niezależność zdarzeń- jeżeli zdarzenia są zespołowo niezależne to są parami niezależne.
DYSTRYBUANTA- d.nazywamy funkcję F(x) mówiącą o prawdop. że zmienna losowa x przyjmie wartości < od x. F(X)=P(X<x)
Znając dystrybuantę znamy rozkład i odwrotnie.
Własności d.
0≤F(X)≤1
limx→-∞F(X)=0
limx→+∞F(X)=1
jest funkcją co najmniej lewostronnie ciągłą
jest funkcją niemalejącą
P(a≤X<b)=F(b)-F(a)
SZCZEGÓLNE ROZKŁADY- zero-jedynkowy, Bernouliego, Poissona,
ZMIENNA LOSOWA CIĄGŁA- zmienna losowa x jest zmienną ciągłą w danym przedziale jeśli w tym przedziale gęstość f(x) istnieje i jest f.ciągłą względem x w całym przedziale z wyjątkiem skończonej liczby punktów.