BestCurFit
v.1.0+
FREEWARE
http://rodomontano.altervista.org/engbestcurfit.php
Program BestCurFit oblicza parametry 12 różnych krzywych korzystając z metody najmniejszych
kwadratów dop dopasowywania każdej krzywej do danych użytkownika. Równania nieliniowe są
linearyzowane. Uzyskane parametry wykorzystywane sÄ… w procedurze optymalizacji przy stosowaniu
metody Simplex oraz algorytmu Gaussa-Newtona Gdy proces nie jest zbieżny do rozwiązania, krzywa
jest optymalizowana metodą Monte Carlo. Estymowana jest dobroć dopasowania.
Przekład:
Robert Wiśniewski
http://chomikuj.pl/bobwis
- 2 -
Opis programu
BestCurFit
na podstawie oryginalnych informacji
Celem tego programu jest analiza regresji Regression Analysis (lub dopasowanie krzywych) Curve
Fitting, tzn. wyznaczanie wartości parametrów funkcji najlepiej dopasowanej do zestawu danych
obserwowanych. Tym niemniej, dla danego zestawu danych krzywe regresji danego typu równania
NIE są unikalne. Tak więc wymagana jest krzywa o minimalnych odchyleniach od punktów danych.
Najlepiej dopasowana krzywą można uzyskać metodą najmniejszych kwadratów Method of Least
Squares. Najlepsze dopasowanie w tym sensie minimalizuje sumę kwadratów odchyleń Residuals
(ResSS). Reszta d (lub odchylenie albo błąd) jest różnicą między obserwowana wartością y,
a wartością dopasowaną w obliczona z modelu. Tak więc:
2 2 2
d +ð d +ð ... +ð d =ð d2 =ð (ðy - w)ð2 =ð minimum
åð åð
1 2 n
Metoda najmniejszych kwadratów dzieli się na dwie kategorie: Liniowa metoda najmniejszych
kwadratów i nieliniowa metoda najmniejszych kwadratów.
Model regresji jest liniowy gdy model ten spełnia liniową kombinacje jego parametrów. Równania
linowe, takie jak linia prosta Straight Line, parabola, równanie trzeciego stopnia Cubic lub równanie
okresowe Periodic są rozwiązywane metodą najmniejszych kwadratów w jednym etapie. Równania
nieliniowe wymagajÄ… w analizie regresji stosowania metody iteracyjnej. Takie metody iteracyjne
wymagają przyjęcia wartości początkowych parametrów i w odróżnieniu od algorytmu metody
najmniejszych kwadratów nie zapewniają że znaleziona zostanie suma najmniejszych kwadratów
odchyleń (proces iteracji może być rozbieżny). Niektóre równania nieliniowe można zredukować do
postaci liniowej przez odpowiednia transformacjÄ™ zmiennych i rozwiÄ…zanie metodÄ… najmniejszych
kwadratów.
Przykładowo, krzywa wykładnicza:
y =ð a ×ð exp (bx)
może być zlinearyzowana za pomocą logarytmów do postaci:
log (ðy)ð =ð log (a) +ð b ×ð x
Ograniczeniami techniki linearyzacji są czasem wartości ujemne (lub zerowe), które nie mogą być
akceptowane (nie można obliczyć logarytmu z liczby ujemnej lub zerowej). Inną wada jest to, że gdy
przeprowadzamy regresje liniową na transformowanej funkcji, uzyskujemy wartości parametrów, które
minimalizują sumę kwadratów reszt funkcji transformowanej do postaci liniowej, a nie sumę
kwadratów reszt funkcji oryginalnej. Jest to coś innego niż minimalizacja sumę kwadratów reszt funkcji
aktualnej, a wartości estymowanych parametrów mogą nie tworzyć najlepszego dopasowania funkcji
oryginalnej do danych. Jednak tak estymowane parametry można wykorzystać jako wartości
początkowe w następnej procedurze optymalizacji.
- 3 -
Program BestCurFit linearyzuje równania nieliniowe i korzysta z metody najmniejszych kwadratów do
funkcji transformowanej w celu uzyskania wartości początkowych parametrów wykorzystywanych
w algorytmie analizy regresji modeli nieliniowych metodÄ… iteracyjnÄ… Gaussa-Newtona. Gdy algorytm
ten zawiedzie, program BestCurFit korzysta z tych wartości początkowych parametrów oraz z metody
Monte Carlo do minimalizacji sumy kwadratów reszt. Obliczenia takie mogą być długotrwale,
zwłaszcza gdy mamy duże zestawy danych. Dla każdej krzywej, program BestCurFit oblicza również
poniższe statystyki:
·ð Coefficient of Determination R2 Współczynnik determinacji R2 (kwadrat współczynnika
korelacji). Jest to udział zmienności dopasowanej przez model. Oblicza on dobroć dopasowania
(w granicach od 0 do 100 %) krzywej regresji do danych. Im większa ta wartość, tym bardziej
prawdopodobne, że równanie regresji jest dobrze dopasowane do danych. Jest to stosunek
sumy kwadratów regresji RegSS (objaśnianej wariancją) do łącznej sumy kwadratów TotSS.
Z uwagi na to, że TotSS jest sumą kwadratów regresji i sumą kwadratów reszt, wartość R2
może być zapisana i obliczana jako: R2 = (TotSS-ResSS)/TotSS.
·ð Fisher Test Test Fishera. Statystyka Fishera testuje ogólnÄ… istotność modelu regresji.
Wartość Prob(F) jest prawdopodobieństwem (w %), że wszystkie współczynniki regresji są
zerowe i estymacja zmiennej zależnej y prowadzi do średniej wartości y. Im mniejsza wartość
Prob(F), tym bardziej prawdopodobne, że przynajmniej niektóre parametry regresji są zerowe
i że równanie regresji nie jest dobrze dopasowane do danych.
·ð Durbin-Watson Autocorrelation Autokorelacja Durbina-Watsona. Modele regresji zakÅ‚adajÄ…,
że odchylenia błędów (reszty) są niezależne i nieskorelowane. Test ten oznaczany literą d
wskazuje na prawdopodobieństwo, że reszty zawierają składnik autokorelacji. Wartość d
zawsze mieści się w granicach od 0 do 4. Wartość d = 2 świadczy, że brak autokorelacji.
Wysokie i niskie wartości d wskazują na ujemną i dodatnią autokorelację. Można korzystać
z tabel istotności Durbina-Watsona do sprawdzania dokładnej interpretacji tych wartości.
Jednak wartość mniejsza od 0,80 zwykle wskazuje na prawdopodobieństwo autokorelacji
dodatniej.
·ð 95 % Confidence Intervals IC % PrzedziaÅ‚y ufnoÅ›ci na poziomie istotnoÅ›ci 95 %. Gdy
obliczamy parametry innego zestawu danych, wówczas 95 ze 100 estymowanych wartości
mieści się w przedziale ufności (wyrażonym jako % wartości parametru). Przykładowo, gdy
estymowany parametr wynosi 40, a przedziaÅ‚ ufnoÅ›ci wynosi Ä…ð 30 % (tzn. 0,3 x 40 = 12),
wówczas mamy 95 % szans, że aktualny parametr ma wartość między 40-12=28, a 40+12=52.
·ð Student s t Statistic Statystyka-t Studenta. Wartość ta oznaczana jako Prob(t), wyrażana
w %, jest prawdopodobieństwem uzyskania estymowanej wartości parametru równej 0. Im
mniejsza wartość Prob(t), tym bardziej istotny jest ten parametr i jest mniej prawdopodobne, że
wartość aktualnego parametru jest zerowa. Gdy Prob(t) = 0,1 %, wówczas istnieje tylko 0,1 %
szansa na 1000, że parametr ten wynosi 0.
UWAGA: Program BestCurFit przechowuje dane współrzędnych w edytowalnym pliku tekstowym
o nazwie xydata.txt znajdującym się w katalogu programu. Można wklejać swoje dane bezpośrednio
do tego pliku.
Wyszukiwarka
Podobne podstrony:
Polski opis Lucas ChessPolski opis Power ISO v 4 7Polski opis Avast 6 FreePolski opis WinplotPolski opis DOC2CHMPolski opis FXChemPolski opis Physion PortablePolski opis programu AutorunsPolski opis programu ESTPolski opis programu Chemistry ProblemsPolski opis MagicPlotPolski opis programu fx CalcPolski opis Fotoview GraphingPolski opis Retouch PilotPolski opis Tibis MathematicPolski opis Falco MoleculePolski opis Advanced UninstallerPolski opis LEC Power Translatorwięcej podobnych podstron