Statystyka jest to zbiór metod służących do : a)pozyskiwania b)prezentacji C)analizie danych. Celem stosowania tych metod jest otrzymywanie, na podstawie danych użytecznych, uogólnionych informacji na temat zjawiska, którego dane dotyczy.
Proces pozyskiwania danych ogólnie jest nazywany badaniem statystycznym
Podstawowe zadania statystyki: a)analiza, która sprowadza się do sumarycznego opisu zbiory danych, a wykorzystane do tego celu środki nazywa się metodami opisu statystycznego. b)interpretacją danych
Pojecie statystyki matematycznej. W wielu rzeczywistych sytuacjach zebranie wszystkich potencjalnych danych nie jest możliwe, a interpretacji dokonuje się na podstawie odpowiednio zebranych danych częściowych, a badanym zjawiska. Taka analiza wykorzystująca metody rachunku prawdopodobieństwa nosi miano STATYSTYKI MATEMATYCZNEJ.
Populacja generalna. Badania statystyczne dotyczą zawsze pewnej zbiorowości, której elementami są obiekty materialne, lub zjawiska. W statystyce matematycznej badaną zbiorowość statystyczna nazywa się populacją generalną lub zbiorowością generalną.
Populacja generalna skończona - jeśli zbiór jej elementów jest skończony.
Populacja generalna nieskończona - dotyczy zazwyczaj zjawiska, a nie obiektów materialnych.
Cechy statystyczne. Elementem populacji generalnej mogą mieć różne właściwości i najczęściej miewają, które podlegają obserwacji. Te właściwości nazywa się cechami statystycznymi lub krótko cechami.
Cechy ilościowe - da się określić lub wyrazić: (wzrost, waga) są to cechy mierzalne lecz własności jakościowe jak (płeć , kolor włosów) to są cechy niemierzalne Przeważająca część metod statystycznej matematyki dotyczy analizy cech mierzalnych.
Rozkład cech - jeżeli elementy różnią się między sobą wartościami analitycznej cechy to mówi się o rozkładzie cechy w populacji.
Badania pełne i częściowe. Celem badania statystycznego na ogół jest poznanie rozkładu interesującej nas cechy w populacji generalnej oraz uzyskanie informacji o wartościach statystycznych charakterystyk parametrów tego rozkładu. Rozróżnia się dwa zasadnicze typy badań 1. pełne - obejmujące wszelkie elementy zbiorowości generalnej, 2. częściowe - obejmujące części elementy zbiorowości generalnej
Próba - podzbiór elementów populacji generalnej podlegająca badaniu nazywa się próbką. Statystyka matematyczna zajmuje się tylko badaniami częściowymi, takim, w których dobór próby podlega pewnym obiektywnym regułom. Dobór próby - próba losowa. Próbę otrzymaną w wyniku doboru losowego nazywa się próbą losową.
Warunki dla zapewnienia losowego doboru próby. a)Każdy element populacji generalnej ma dodatnie znane prawdopodobieństwo znalezienia się w próbie losowej. b)Istnieje możliwość ustalenia prawdopodobieństwa znalezienia się w próbce dla każdego zespołu elementów populacji.
Ocena wielkości błędów wynikających z przeprowadzenia częściowego badania statystycznego jest możliwa tylko przy losowym doborze próby, w którym o fakcie znalezienia się poszczególnych elementów populacji w próbie decyduje przypadek.
Podstawowym zagadnieniem pojawiającym się w badaniach częściowych jest możliwość uogólnienia uzyskanych na podstawie próby wyników na całą populację oraz oszacowanie popełnionych przy tym błędów. Takie działanie nazywa się wnioskowaniem statystycznym.
Wyróżnia się 2 podstawowe typy problemów. a)estymację (szacowanie) b)sprawdzanie(weryfikacja) hipotez.
Cechy statystyczne (mierzalne), które przyjmują wartości całkowite nazywa się skokami lub dyskretnymi. Cechy przyjmujące wartości rzeczywiste nazywa się cechami ciągłymi.
Empiryczny rozkład cechy - stanowi podstawę dla wszystkich analiz badanej cechy.
Zmiana losowa - to wielkość, która w wyniku doświadczenia przyjmuje określaną wartość zmianą po zrealizowaniu doświadczenia, a nie dająca się przewidzieć przez jego realizacją.
Zmienna losowa - jest to taka zmienna która w wyniku doświadczenia przybiera jedną i tylko jedną wartość ze zbioru tych wszystkich wartości, jakie ta zmienna może przyjąć. Oznaczenie zmiennych losowych 1. Na ogół końcowymi literami alfabetu np. X, Y.............., 2. Wartości zmiennej losowej (realizująca) oznaczenie małymi literami np. x, y............, Z wartościami zmiennej losowej związane są określone prawdopodobieństwa tak, więc zmienna losowa przybiera różne wartości z różnych prawdopodobieństwa.
Rodzaje zmiennych losowych: a)zmienne skokowe (dyskretne) b)zmienne ciągłe
Zmiennymi losowymi skokowymi (dyskretne) nazywa się takie zmienne losowe, które mają skończoną lub przeliczalny zbiór wartości.
Zmiennymi losowymi ciągłymi nazywa się takie zmienne losowe, które mogą przybierać dowolne wartości liczbowe pewnego przedziału liczbowego.
Dystrybuanta zmiennej losowej (skumulowane prawdopodobieństwo). Wartości w przedziale <a,b>: a)jest funkcją nie malejącą b)jest funkcją co najmniej lewostronnie ciągłą.
Rozkłady teoretyczne zmiennej losowej dyskretnej. Podstawowe rozkłady: a)jednopunktowe b)dwupunktowe c)równomierne
weryfikacja hipotez statystycznych. Jest to drugi obok estymacji, podstawowy rodzaj wnioskowania statystycznego Dwie grupy hipotez statystycznych a)parametryczne, związane z wartościami parametrów b)nieparametryczne, związane z postacią rozkładów
Hipoteza statystyczna - to każde przypuszczenie dotyczące wielkości parametru rozkładu zmiennej losowej w populacji generalnej lub próbnej, albo też postaci tego rozkładu, uzyskane na podstawie próby losowej
Testy nieparametryczne. dotyczą postaci rozkładów - tzn. weryfikuje się hipotezy o postaci funkcyjnej rozkładu populacji generalnej
Warunki przeprowadzania: a)liczebność próby jest duża b)próba jest losowa c)poziom istotności nie mniejszy niż 0,01
Eksperyment - seria doświadczeń, np. w metalurgii seria wytopów stali o różnych składach chemicznych
Cel planowania eksperymentu - wyznaczenie opisu matematycznego obiektu badań lub zjawiska, tzw. modelu matematycznego umożliwiającego analizę jego zachowania i ustalenia czynników wpływających na zachowanie obiektu.
Różnica między zwykłym i statystycznym planowaniem eksperymentu. Wg metody planowania zwykłego zmienne zmienia się stopniowo, przy czym wszystkie pozostałe zmienne utrzymuje się stałe. Następnie zmienia się kolejną zmienną a pozostałe utrzymuje się stałe itd. Otrzymuje się w ten sposób wyniki badań jako zależności zmiennej stanu od każdej zmiennej przy ustalonym poziomie wszystkich pozostałych zmiennych (np. w postaci krzywej). Potrzebna liczba badań jest duża. W statystycznym planowaniu eksperymentu dokonuje się zmiany (wariuje się) jednocześnie wszystkich zmiennych w planie eksperymentu.