statystyka łaczek, !!! EDUKACJA, TECHNIKA , ZDOBYWANIE WIEDZY !!!, PRAWO - WIEDZA USTAWY WZORY PISM, PRAWO SKRYPTY -PODSTAWY, pozostałe



Statystyka to nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe.

Duża część dziedzin wiedzy zajmuje się obserwacją otaczającego nas świata lub też posługuje się eksperymentem dla potwierdzenia swoich teorii. Takie badanie przebiega zazwyczaj według schematu: zebranie dużej ilości danych, ich analiza i interpretacja. Badaczowi potrzebny jest wtedy zestaw narzędzi - sprawdzonych metod, które umożliwią mu operowanie na dużych zbiorach danych. Tworzeniem i rozwijaniem takich użytecznych narzędzi zajmuje się właśnie statystyka.

Swoje początki statystyka wywodzi z tradycji dokonywania spisów powszechnych, czyli zbierania informacji na temat ludności. Ślady pierwszego spisu można znaleźć w Księdze Liczb, kiedy to Mojżesz wyprowadzał lud Izraela z Egiptu. Spisy powszechne były stosunkowo systematycznie przeprowadzane na terenie starożytnego Rzymu. Z pewnością posiadanie informacji na temat stanu ludności ułatwiało rozpoznawanie trendów i odpowiednie planowanie. Do ok. połowy XIX wieku termin statystyka oznaczał podany w tabelarycznej formie zbiór danych na temat stanu państwa. Można przypuszczać, że w pewnym momencie posiadanie podstawowych danych stało się niewystarczające, szczególnie przy coraz szybciej rozwijającej się gospodarce światowej. Konieczne stało się nie tylko ulepszanie metod pozyskiwania danych, ale również ich opisu i analizy. Zbiegło się to w czasie z szybkim rozwojem metod matematycznych, szczególnie teorii prawdopodobieństwa.

Już pierwszy rzut oka na podstawowe metody statystyczne pozwala nam zorientować się, że nieodłącznym ich atrybutem jest losowość. Przede wszystkim wynika to z losowej natury badanych wielkości. Na przykład wzrost człowieka jest uwarunkowany ogromną ilością czynników, takich jak genetyka, dieta, środowisko, przy czym niektóre z nich również mają losową naturę. Zgodnie z zasadami mechaniki kwantowej na pewnym poziomie obserwacji wszystkie zjawiska mają charakter losowy.

Ważniejszy jest jednak fakt, że czasami nie mamy możliwości lub środków do tego, aby przebadać całą populację. Badanie wzrostu wszystkich ludzi tylko po to, aby wyznaczyć średni wzrost ludzi w Polsce z ekonomicznego punktu widzenia nie ma sensu (patrz Badanie statystyczne), lepiej byłoby przebadać losowo wybraną grupę osób, zakładając, że reszta populacji nie wyróżnia się szczególnie wysokim lub niskim wzrostem. W tym wypadku, oszczędzając na samym badaniu, świadomie skazujemy się na niepewność.

Jak widać, losowość zjawisk jest niejako wpisana w definicję metod statystycznych. Dlatego właśnie statystykę łączy bardzo ścisły związek z teorią prawdopodobieństwa, działem matematyki dzięki któremu jesteśmy w stanie poradzić sobie z niepewnością.

0x01 graphic

Celem analizy statystycznej jest pozyskanie jak największej wiedzy z tego, co jesteśmy w stanie zaobserwować. Dlatego powinniśmy:

  1. Zaplanować badanie

  2. Podsumować zbiór danych z obserwacji, podkreślając tendencje, ale rezygnując ze szczegółów

  3. Uzgodnić, jaką wiedzę o badanym zjawisku dostarczają nam dane

Poszczególne punkty odpowiadają działom statystyki:

  1. Metoda reprezentacyjna

  2. Statystyka opisowa

  3. Wnioskowanie statystyczne

1.


Metoda reprezentacyjna jest częściowym badaniem statystycznym opartym na próbie pobranej ze zbiorowości generalnej w sposób losowy. Z teoretycznego i praktycznego punktu widzenia metoda ta jest najbardziej prawidłową formą badania częściowego.

Zastosowanie rachunku prawdopodobieństwa przy przenoszeniu wyników z losowej próby na całą zbiorowość umożliwia określenie wielkości popełnianego błędu. Możliwości tej nie daje ani metoda ankietowa, ani monograficzna.

Zamiast gromadzić szczegółowe informacje o wszystkich jednostkach populacji generalnej, losujemy z niej pewną liczbę jednostek zwaną próbą i na podstawie otrzymanych wyników wnioskujemy o całości. Aby jednak próba była dobrą reprezentacją całości, należy zapewnić jednakowe szanse dostania się (trafienia) do próby wszystkim jednostkom zbiorowości generalnej. Jeśli prawdopodobieństwo wylosowania każdej jednostki jest jednakowe, wówczas wylosowana próba jest dobrą reprezentacją całej zbiorowości, tzn. charakteryzuje się tymi samymi właściwościami i prawidłowościami ogólnymi co zbiorowość generalna.


2.




Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych uzyskanych podczas badania statystycznego. Celem stosowania metod statystyki opisowej jest podsumowanie zbioru danych i wyciągnięcie pewnych podstawowych wniosków i uogólnień na temat zbioru.

Statystykę opisową stosuje się zazwyczaj jako pierwszy i podstawowy krok w analizie zebranych danych.

Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny.

Dane przedstawiane są w postaci tabel. Dla małych zbiorów danych tabele mogą prezentować wszystkie dane, w przeciwnym przypadku tworzy się różnego rodzaju podsumowania, jak np. szereg rozdzielczy.

2. Graficzna prezentacja wyników.

Dane prezentowane są w formie graficznej. Podstawowymi narzędziami są tutaj: histogram, wielobok liczebności i krzywa liczebności, które wykreślane są bezpośrednio na podstawie danych z szeregu rozdzielczego; wykres pudełkowy, przedstawiający zależności pomiędzy niektórymi statystykami pozycyjnymi; krzywa Lorentza charakteryzująca koncentrację wartości cechy.

3. Wyznaczanie miar rozkładu.

Do opisu służą miary rozkładu - różnego rodzaju wielkości obliczane na podstawie uzyskanych danych. Interpretacja wartości tych miar dostarcza informacji na temat charakteru rozkładu cechy.

Miary można podzielić na trzy podstawowe kategorie:

np. średnia arytmetyczna, średnia geometryczna, średnia harmoniczna, średnia kwadratowa, mediana, moda

np. odchylenie standardowe, wariancja, rozstęp, rozstęp ćwiartkowy, średnie odchylenie bezwzględne, odchylenie ćwiartkowe, współczynnik zmienności

np. współczynnik skośności, współczynnik asymetrii, trzeci moment centralny

np. współczynnik Giniego, kurtoza

3.




Wnioskowanie statystyczne to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia (patrz badanie statystyczne).

Wyróżnia się dwie grupy metod uogólniania wyników, definiujące jednocześnie dwa działy wnioskowania statystycznego:

0x01 graphic

Poza tym podziałem wyróżnia się miary klasyczne i miary pozycyjne.

Techniki z wymienionych kategorii dostarczają wzajemnie uzupełniających się danych, dlatego najczęściej wykorzystuje się jednocześnie techniki z każdej z tych grup.


Istnieje również wiele metod służących analizie danych statystycznych:



Analiza wariancji (ANOVA - od ang. analysis of variance) to metoda statystyczna, służąca do badania obserwacji, które zależą od jednego lub wielu działających równocześnie czynników. Metoda ta wyjaśnia z jakim prawdopodobieństwem wyodrębnione czynniki mogą być powodem różnic między obserwowanymi średnimi grupowymi. Analiza wariancji została stworzona w latach dwudziestych przez Ronalda Fishera.

Modele analizy wariancji można podzielić na:

Według kryterium podział modeli przebiega następująco:


Regresja to w statystyce metoda, pozwalająca na zbadanie związku pomiędzy różnymi wielkościami występującymi w danych i wykorzystanie tej wiedzy do przewidywania nieznanych wartości jednych wielkości na podstawie znanych wartości innych.

Z matematycznego punktu widzenia, regresją nazywamy dowolną metodę statystyczną pozwalającą estymować warunkową wartość oczekiwaną zmiennej losowej, zwanej zmienną objaśnianą[1], dla zadanych wartości innej zmiennej lub wektora zmiennych losowych (tzw. zmiennych objaśniających[1]).

Użycie regresji w praktyce sprowadza się do dwóch faz:

Dział statystyki zajmujący się modelami i metodami regresji zwany jest analizą regresji. Regresja w której występuje więcej niż jedna zmienna objaśniająca zwana jest regresją wieloraką (ang. multiple regression



Analiza czynnikowa to metoda statystyczna, służąca odnajdywaniu struktur w zbiorze zmiennych losowych. Znalazła ona szerokie zastosowanie w marketingu, zarządzaniu produktem i teorii decyzji.

Celem analizy czynnikowej jest zredukowanie dużej liczby zmiennych losowych do mniejszego zbioru, co uzyskujemy przez założenie, że pewne grupy zmiennych losowych reprezentują zmienność tych samych czynników, czyli zmienne losowe w danej grupie są od siebie w pewnym stopniu zależne.

W analizie czynnikowej istnieją dwa podejścia:

Istnieje wiele metod analizy czynnikowej, jednak najbardziej popularne są dwie:



Niezależnie od metody, analizę czynnikową rozpoczynamy od budowy macierzy korelacji i sprawdzenia, czy możliwe jest zastosowanie analizy czynnikowej





Analiza dyskryminacyjna (ang. discriminant analysis) - zespół metod wielowymiarowej analizy danych. Zalicza się do grupy prognoz ilościowych. Zawiera metody, które czynią z tej techniki niezwykle efektywne narzędzie do zagadnień klasyfikacyjnych i technik zagłębiania danych (data mining). Jej zadaniem jest rozstrzyganie, które zmienne w najlepszy sposób dzielą dany zbiór przypadków na występujące w naturalny sposób grupy. Pozwala rozstrzygnąć, czy grupy różnią się ze względu na średnią pewnej zmiennej, oraz wykorzystanie tej zmiennej do przewidywania przynależności do danej grupy.

W metodzie tej możemy wyróżnić dwa główne etapy:

Sposób przeprowadzania analizy w pakietach statystycznych najczęściej przebiega krokowo (postępująca lub wsteczna analiza krokowa). Pakiety oprócz licznych statystyk wykreślają też tak zwane funkcje klasyfikacyjne, które stanowią doskonałą ilustrację otrzymanych wyników. Postać tych funkcji może być dowolna, choć najczęściej wykorzystywane są funkcje liniowe (LDA). W tym podejściu opisowym obiekt przydzielany jest do tej klasy, dla której funkcja dyskryminacyjna osiąga największą wartość.

Zaletą klasycznej analizy dyskryminacyjnej jest prostota jak i wysoka skuteczność na homogenicznych danych, wadą natomiast nieprzenośność i brak skuteczności na niehomogenicznych danych.

Używane są również w podobnych celach m.in. drzewa klasyfikacyjne, klasyfikatory bayesowskie, metoda najbliższych sąsiadów, maszyny wektorów podpierających (SVM).





Korelacja kanoniczna - metoda statystyczna, pozwalająca badać związek między dwoma zbiorami zmiennych. Stanowi swego rodzaju uogólnienie współczynnika korelacji Pearsona. Jest szczególnym przypadkiem Ogólnych Modeli Liniowych (GLM





Metoda tworzy dla każdego z wejściowych zbiorów zmiennych tzw. zmienne kanoniczne będące sumami ważonymi zmiennych wejściowych z danego zbioru. Para zmiennych kanonicznych z obydwu zbiorów to tzw. pierwiastek kanoniczny.

Metoda tak dobiera wagi w tych sumach (tzw. wagi kanoniczne), aby przede wszystkim zmaksymalizować korelację pomiędzy pierwszą zmienną kanoniczną z jednego i drugiego zbioru, w następnej kolejności zmaksymalizować korelację między drugą parą zmiennych kanonicznych, itd..

Maksymalna liczba pierwiastków jest równa minimum z liczby wejściowych zmiennych w jednym i w drugim zbiorze. Zmienne kanoniczne dotyczące tego samego zbioru zmiennych wejściowych są nieskorelowane



Z metodami statystycznymi nieodłącznie związane są błędy. Ich występowanie uzależnione jest między innymi od:




Wahania przypadkowe to nieregularne (sporadyczne, jednorazowe) wahania w czasie mające charakter losowy. Związane są nieodłącznie z błędami statystycznymi oraz prognostycznymi. Występują jako składowa szeregu czasowego (trend + sezonowość + wahania przypadkowe).

Przyczyny wahań przypadkowych: nieurodzaj, katastrofy naturalne, klęski żywiołowe, wojny i inne.


Statystyka jest stosowana w wielu dziedzinach wiedzy, w niektórych z nich tak intensywnie, że doczekała się własnej terminologii i wyspecjalizowanych metod. Z czasem wytworzyły się dziedziny z pogranicza statystyki i innych nauk. Należą do nich:



Wyszukiwarka

Podobne podstrony:
W teorii kształcenia wszechstronnego nacisk kładło się na bierne zdobywanie wiedzy, media w edukacji
Uczenie się to zdobywanie wiedzy, techniki pracy umysłowej
W teorii kształcenia wszechstronnego nacisk kładło się na bierne zdobywanie wiedzy, media w edukacji
PEDAGOGIKA[1], Studia, Edukacja Techniczno-Informatyczna, Pedagogika
Edytor Word - ćwiczenia 2, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty
Urządz. zew. - monitor, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty
c3 stal po ob ciep-chem, Politechnika Poznańska, Edukacja Techniczno Informatyczna, Semestr II, Mate
Łączenie tekstu z grafiką IIe, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty, Kons Informatyka
Znaczenie prawidłowej komunikacji w pracy technika administracji, Dokumenty- prawo i administracja
hospitacje, ETI Edukacja technicyno inf,, KONSPEKTY, kons
Spawalność, Politechnika Poznańska, Edukacja Techniczno Informatyczna, Semestr II, Materiałoznawstwo
edukacja techniczna w XXI w
Style kierowania, Politechnika Poznańska, Edukacja Techniczno Informatyczna, Semestr II, Materiałozn
Edytor Word - ClipArt-y, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty
Edytor Word - czcionka, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty
Works-wprowadzenie, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty
kształtowanie motywacji do zdobywania wiedzy
MATERIAŁO ZNAWSTWO EGZAMIN (WIERSZUŁŁOWSKI, Politechnika Poznańska, Edukacja Techniczno Informatyczn
Turbo Pascal - writeln, ETI Edukacja technicyno inf,, KONSPEKTY, Konspekty

więcej podobnych podstron