1. Estymacja (podstawowe pojęcia, własności estymatorów, estymatory momentów, metoda największej wiarygodności, metoda momentów, metoda histogramu)
1. Metoda największej wiarygodności
Idea: należy przyjąć taką wartość oszacowania nieznanego parametru, dla której zaobserwowane dla próby losowej wartości badanej cechy są najbardziej
prawdopodobne. Podstawą budowy estymatora jest tzw. funkcja wiarygodności (łączny rozkład z próby)
Estymacja to dział wnioskowania statystycznego będący zbiorem metod pozwalających na uogólnianie wyników badania próby losowej na nieznaną postać i parametry rozkładu zmiennej losowej całej populacji oraz szacowanie błędów wynikających z tego uogólnienia. W zależności od szukanej cechy rozkładu można podzielić metody estymacji na dwie grupy:
Estymacja parametryczna - metody znajdowania nieznanych wartości parametrów rozkładu
Estymacja nieparametryczna - metody znajdowania postaci rozkładu populacji
W praktyce estymacja nieparametryczna jest zastępowana prostszymi metodami bazującymi na weryfikacji hipotez statystycznych.
2. Weryfikacja hipotez (podstawowe pojęcia, test istotności dla wartości średniej)
Hipoteza – pewien sąd (teza) nt. cechy statystycznej (jej własności, rozkładu, parametrów rozkładu, itp.)
Weryfikacja hipotez statystycznych – sprawdzanie sądów o populacji przez badanie jej wycinka (próby statystycznej).
Hipoteza parametryczna i nieparametryczna
Weryfikacja hipotezy – ocena prawdziwości hipotezy – jej przyjęcie lub odrzucenie (na podstawie badań częściowych – wyrażona w języku probabilistycznym – uznanie hipotezy za prawdziwą lub fałszywą z pewnym prawdopodobieństwem)
Przykłady:
• średnia długość życia na wsi jest większa niż w mieście,
• wzrost ma rozkład normalny,
• dzieci są coraz wyższe.
Błędy przy weryfikacji hipotez:
• hipoteza jest prawdziwa, a my ją odrzucamy – błąd I rodzaju,
• hipoteza jest fałszywa, a my ją przyjmujemy – błąd II rodzaju.
Test statystyczny – szczegółowa procedura zmierzająca do przyjęcia lub odrzucenia hipotezy.
Test istotności
Test istotności kończy się w dwojaki sposób:
• hipoteza zostaje odrzucona jako fałszywa (wynik konstruktywny),
• nie ma podstaw do odrzucenia hipotezy (nie ma postaw sądzić, że jest fałszywa) – wynik nie jest równoważny przyjęciu hipotezy i uznaniu jej za prawdziwą (wynik niekonstruktywny).
Weryfikacja hipotezy z testem istotności:
1. przyjęcie hipotez H0 i H1,
2. określenie poziomu istotności testu α,
3. określenie obszaru krytycznego testu,
4. wyznaczamy wynik testu z próby – gdy należy on do obszaru krytycznego, to
hipotezę zerową H0 odrzucamy i przyjmujemy hipotezę alternatywną H1.
W przeciwnym razie nie ma podstaw do odrzucenia H0 i przyjęcia H1.
3. Rozpoznawanie (podstawowe pojęcia, model probabilistyczny, ryzyko, algorytm optymalny, rozpoznawanie z uczeniem nadzorowanym, algorytmy minimalno-odległościowe)
Rozpoznawanie – przypisanie obiektowi na podstawie pomiaru jego cech numeru (etykiety) klasy, do której należy
Przykłady rozpoznawania
1. Diagnostyka medyczna
2. Rozpoznawanie liter
Schemat systemu rozpoznawania
Model probabilistyczny x oraz j – realizacja pary zmiennych losowych (X, J)
Rozkład prawdopodobieństwa (X, J):
1. P(J = j) = pj,j∈M - prawdopodobieństwa a priori klas
2. f(x/ j) = f j(x),x∈X - warunkowe gęstości cech w klasach
4. Model obiektu wejściowo-wyjściowego w warunkach niepewności, model parametryczny liniowy minimalizujący błąd średnio-kwadratowy (przypadek znanych rozkładów prawdopodobieństwa, przypadek z danymi eksperymentalnymi)