POPULACJA I PRÓBA POPULACJA I PRÓBA POPULACJ w statystyce matematycznej nazywamy zbiór wszystkich elementów (zdarzeÅ„ elementarnych) charakteryzujÄ…cych siÄ™ badanÄ… cechÄ… opisywanÄ… zmiennÄ… losowÄ…. Zbadanie caÅ‚ej populacji (przeprowadzenie tzw. badaÅ„ wyczerpujÄ…cych) w celu okreÅ›lenia rozkÅ‚adu zmiennej losowej zwiÄ…zanej z badanÄ… cechÄ… lub jego parametrów czÄ™stokroć nie jest możliwe. W takim przypadku przeprowadza siÄ™ badania PRÓBY - tzn. wybranej części populacji. Podstawowym warunkiem, który gwarantuje poprawność wniosków o caÅ‚ej populacji jest tzw. reprezentatywność próby. PRÓB REPREZENTATYWN nazywamy próbÄ™ o strukturze bardzo zbliżonej do struktury caÅ‚ej populacji. NajlepszÄ… metodÄ… zapewnienia reprezentatywnoÅ›ci próby jest jej stworzenie poprzez caÅ‚kowicie losowy wybór elementów populacji. Próba reprezentatywna Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 1 POPULACJA I PRÓBA W ODNIESIENIU DO POMIARU POPULACJA I PRÓBA W ODNIESIENIU DO POMIARU Populacja zbiór wszystkich możliwych wyników pomiarów 0.5 Próba wyniki przeprowadzonych pomiarów (x1 , x2 , x3 , x4 , x5 , x6 ) 0.4 0.3 0.2 0.1 x6 x5 x2 x1 x3 x4 0 wyniki pomiarów Rzeczywista wartość mierzonej wielkoÅ›ci x0 , bÄ™dÄ…ca wartoÅ›ciÄ… oczekiwanÄ… rozkÅ‚adu prawdopodobieÅ„stwa opisujÄ…cego całą populacjÄ™ poszukiwany parametr rozkÅ‚adu zmiennej losowej dla caÅ‚ej populacji Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 2 PrawdopodobieÅ„stwo ESTYMACJA ESTYMACJA - oznacza oszacowanie wielkoÅ›ci (parametrów) opisujÄ…cych pewne cechy populacji na podstawie próby. CECHY DOBRYCH ESTYMATORÓW: 1. ZGODNOŚĆ ESTYMATORA P{Qn - Q < µ} = 1 lim n" gdzie: µ dowolnie maÅ‚a liczba dodatnia, Q parametr estymowany, Qn estymator z n-elementowej próby. Jest to tzw. zbieżność stochastyczna. 2. NIEOBCIÅ»ONOŚĆ E(Qn) = Q Dla estymatorów obciążonych definiujemy obciążęnie jako Bn = E(Qn) - Q 3. EFEKTYWNOŚĆ Estymator najbardziej efektywny Qn* to taki, który ma najmniejszÄ… dyspersjÄ™ (wariancjÄ™) spoÅ›ród wszystkich możliwych estymatorów obliczonych z próby n-elementowej. V(Q* ) n W(Qn ) = V(Qn ) Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 3 METODA NAJWIKSZEJ WIARYGODNOÅšCI METODA NAJWIKSZEJ WIARYGODNOÅšCI Wzory, które pozwolÄ… nam wyznaczyć estymatory poszukiwanych parametrów możemy wyprowadzić stosujÄ…c metodÄ™ najwiÄ™kszej wiarygodnoÅ›ci. Załóżmy, że przeprowadziliÅ›my n pomiarów pewnej wielkoÅ›ci (wylosowaliÅ›my próbÄ™ n-elementowÄ…) i w otrzymaliÅ›my w ich wyniku nastÄ™pujÄ…ce wartoÅ›ci: x1, x2, x3, ... , xn . PrawdopodobieÅ„stwo otrzymania w wyniku pomiaru wartoÅ›ci xi (a dokÅ‚adniej z przedziaÅ‚u [xi, xi+dx] ) jest równe: dp(xi) = f(xi ,µ ,Ã)·dx gdzie f(xi ,µ ,Ã) jest rozkÅ‚adem gÄ™stoÅ›ci prawdopodobieÅ„stwa zmiennej losowej xi, w którym wystÄ™pujÄ… nieznane nam parametry µ i Ã. Ponieważ poszczególne przeprowadzone pomiary możemy uznać za niezależne, prawdopodobieÅ„stwo otrzymania (wylosowania z populacji) serii x1, x2, x3, ... , xn wyznaczymy jako iloczyn prawdopodobieÅ„stw n n dp(x1,x2, ... ,xn,µ,Ã) = dp(xi) = f(xi,µ,Ã) Å" dxi " " i=1 i=1 n Funkcja f (x1,x2, ... ,xn,µ,Ã) = f (xi,µ,Ã) " i=1 ma zatem sens rozkÅ‚adu gÄ™stoÅ›ci prawdopodobieÅ„stwa otrzymania w wyniku serii pomiarów wartoÅ›ci x1, x2, x3, ... , xn . FunkcjÄ™ tÄ…, możemy jednak potraktować jako okreÅ›lajÄ…cÄ… prawdopodobieÅ„stwo, że dla znanej serii wartoÅ›ci x1, x2, ... , xn nieznane parametry rozkÅ‚adu przyjmujÄ… wartoÅ›ci µ i Ã. Tak okreÅ›lonÄ… wielkość nazywamy wiarygodnoÅ›ciÄ…. Metoda najwiÄ™kszej wiarygodnoÅ›ci nakazuje nam szukać takiej wartoÅ›ci estymowanego parametru, dla której funkcja wiarygodnoÅ›ci osiÄ…ga maksimum. Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 4 ESTYMATOR WARTOÅšCI OCZEKIWANEJ ESTYMATOR WARTOÅšCI OCZEKIWANEJ Metoda najwiÄ™kszej wiarygodnoÅ›ci pozwala nam m.in. znalezć estymator wartoÅ›ci oczekiwanej dla przypadku przeprowadzenia n niezależnych pomiarów (tzn. dla próby n-elementowej) jeżeli rozkÅ‚ad możliwych wyników każdego z pomiarów f(xi,µ,Ã) ma postać rozkÅ‚adu Gaussa. Ponieważ z wczeÅ›niejszych rozważaÅ„ wiemy, że wartość prawdziwa jest równa wartoÅ›ci oczekiwanej bÄ™dzie to też wzór pozwalajÄ…cy oszacować rzeczywistÄ… wartość mierzonej wielkoÅ›ci. Przeprowadzmy zatem odpowiednie wyliczenia: Przyjmijmy, że przeprowadziliÅ›my n pomiarów i otrzymaliÅ›my wyniki x1, x2 , ... , xn . RozkÅ‚ad gÄ™stoÅ›ci prawdopodobieÅ„stwa dla każdego z pomiarów xi jest rozkÅ‚adem Gaussa o tych samych parametrach µ i à : ëÅ‚ öÅ‚ 1 (xi - µ)2 ÷Å‚ ìÅ‚ f(xi ,µ ,Ã) = expìÅ‚- à Å" 2Ä„ 2Ã2 ÷Å‚ íÅ‚ łł ZaÅ‚ożenie, że parametry µ i à sÄ… takie same dla każdego z pomiarów jest równoznaczne temu, że wszystkie pomiary zostaÅ‚y przeprowadzone w tych samych warunkach. Funkcja wiarygodnoÅ›ci ma zatem postać: n n n ńł üÅ‚ ëÅ‚ öÅ‚ îÅ‚ łł 1 (xi - µ)2 ÷łżł ëÅ‚ öÅ‚ 1 (xi - µ)2 ÷łśł öÅ‚ = ëÅ‚ expòÅ‚- ìÅ‚ f(x1,x2, ... , xn,µ,Ã) = expìÅ‚- ìÅ‚ ÷Å‚ "ìÅ‚ " ïÅ‚ ìÅ‚ à Å" 2Ä„ 2Ã2 ÷Å‚þÅ‚ íÅ‚ łł i=1 2Ã2 ÷Å‚ûÅ‚ i=1 íÅ‚ łł ół íÅ‚ łł ðłà Å" 2Ä„ Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 5 n n n îÅ‚ łł ńł üÅ‚ ëÅ‚ öÅ‚ ëÅ‚ öÅ‚ 1 (xi - µ)2 ÷łśł 1 (xi - µ)2 ÷łżł öÅ‚ ìÅ‚ f(x1,x2, ... , xn,µ,Ã) = expìÅ‚ - = ëÅ‚ expòÅ‚- " ìÅ‚ ÷Å‚ "ìÅ‚ ïÅ‚ ìÅ‚ à Å" 2Ä„ 2Ã2 ÷Å‚ûÅ‚ 2Ã2 ÷Å‚þÅ‚ i=1 íÅ‚ łł i=1 íÅ‚ łł íÅ‚ łł ðłà Å" 2Ä„ ół Pochodna funkcji wiarygodnoÅ›ci po µ bÄ™dzie zatem wynosiÅ‚a: n n n ńł üÅ‚ ëÅ‚ öÅ‚ "f(x1,x2, ... ,xn,µ,Ã) 1 (xi - µ)2 ÷łżł 1 öÅ‚ öÅ‚ îÅ‚ = ëÅ‚ expòÅ‚- Å"ëÅ‚- Å" - µ)łł Å" (-1) ìÅ‚ ÷Å‚ "ìÅ‚ ìÅ‚ ÷Å‚ " = ìÅ‚ "µ à Å" 2Ä„ 2Ã2 ÷Å‚þÅ‚ 2Ã2 ïÅ‚i=12(xi śł íÅ‚ łł i=1 íÅ‚ łł ðÅ‚ ûÅ‚ íÅ‚ łł ół n n n ńł üÅ‚ ëÅ‚ öÅ‚ 1 (xi - µ)2 ÷łżł 1 ëÅ‚ öÅ‚ îÅ‚ = expòÅ‚- Å" Å" - µ)łł ìÅ‚ ÷Å‚ "ìÅ‚ " ìÅ‚ à Å" 2Ä„ 2Ã2 ÷Å‚þÅ‚ Ã2 ïÅ‚i=1(xi śł íÅ‚ łł i=1 ðÅ‚ ûÅ‚ íÅ‚ łł ół W celu znalezienia estymatora wartoÅ›ci oczekiwanej szukamy takiej wartoÅ›ci µm , dla której powyższa pochodna jest równa zeru. Zauważmy, że może być ona równa zeru tylko wtedy, gdy rónwe zeru bÄ™dzie wyrażenie w n nawiasie kwadratowym: (xi - µm) = 0 " i=1 PrzeksztaÅ‚cajÄ…c powyższe wyrażenie otrzymamy: n n n xi - µm = xi - n Å" µm = 0 " " " i=1 i=1 i=1 n n Å" µm = xi " i=1 n 1 µm = xi " n i=1 Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 6 OtrzymaliÅ›my w ten sposób wzór okreÅ›lajÄ…cy estymator wartoÅ›ci oczekiwanej wyznaczonej na podstawie wyników n niezależnych pomiarów przeprowadzonych w niezmienionych warunkach jeżeli rozkÅ‚ad możliwych wyników każdego z pomiarów jest rozkÅ‚adem Gaussa. Jeżeli estymator ten oznaczymy symbolem xsr to możemy zapisać: n 1 xsr = i "x n i=1 Jest to dobrze znany wzór na Å›redniÄ… arytmetycznÄ…, dlatego też w dalszej części estymator wartoÅ›ci oczekiwanej bÄ™dzie nazywany wÅ‚aÅ›nie wartoÅ›ciÄ… Å›redniÄ…. Aatwo zauważyć, że estymator ten jest estymatorem zgodnym. Okazuje siÄ™, że jest on także nieobciążony i najbardziej efektywny. Każdy estymator a w szczególnoÅ›ci wartość Å›rednia jako funkcja zmiennych losowych sam jest zmiennÄ… losowÄ…. Możemy zatem dla dowolnego estymatora (np. wartoÅ›ci Å›redniej) okreÅ›lić takie pojÄ™cia jak rozkÅ‚ad prawdopodobieÅ„stwa, wartość oczekiwana, wariancja czy dyspersja. W praktyce fakt, że wartość Å›rednia jest zmiennÄ… losowÄ… oznacza, iż jeÅ›li na podstawie kilku serii pomiarów wyznaczymy wynikajÄ…ce z nich wartoÅ›ci Å›rednie, to bÄ™dÄ… one cechowaÅ‚y siÄ™ rozrzutem podobnie jak wartoÅ›ci pojedynczych pomiarów. Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 7 WARIANCJA WARTOÅšCI ÅšREDNIEJ WARIANCJA WARTOÅšCI ÅšREDNIEJ Zastanówmy siÄ™ zatem nad rozrzutem wartoÅ›ci Å›redniej. W tym celu spróbujmy powiÄ…zać wariancjÄ™ wartoÅ›ci Å›redniej z wariancjÄ… pojedynczego pomiaru: n 1 V(xsr ) = VëÅ‚ xi öÅ‚ ìÅ‚ " ÷Å‚ n íÅ‚ i=1 łł KorzystajÄ…c z zależnoÅ›ci V(ax) = a2·V(x) oraz V(x1 + x2) = V(x1) + V(x2) otrzymamy: n n 1 1 V(xsr ) = Å" VëÅ‚ xi öÅ‚ = Å" V(xi) ìÅ‚" ÷Å‚ " n2 n2 íÅ‚i=1 łł i=1 Ponieważ przyjÄ™to, że rozkÅ‚ad gÄ™stoÅ›ci prawdopodobieÅ„stwa dla każdego z pomiarów xi jest rozkÅ‚adem Gaussa o tych samych parametrach , zatem wariancja V(xi) ma takÄ… samÄ… wartość dla każdego xi . JeÅ›li oznaczymy tÄ™ wartość jako V(x) możemy napisać: 1 V(xsr ) = Å" n Å" V(x) n2 1 V(xsr ) = Å" V(x) n Rozrzut wartoÅ›ci Å›redniej jest mniejszy od rozrzutu pojedynczych pomiarów i maleje ze wzrostem iloÅ›ci pomiarów uwzglÄ™dnionych przy obliczaniu Å›redniej. Dr Adam MichczyÅ„ski - METODY ANALIZY DANYCH POMIAROWYCH 5 8