Występow. obl. numerycznych. 1) Błędy ich klasyfikacja i najprostsze spos. ich obliczania. Związki ilościowe wyst. w zjawiskach przyrodn. są opisywane na granice matematyczne za pom. równań wiążących pewne funkc., których część jest znana a część natomiast wymaga obliczenia. Równanie tego rodzaju można bez istotnego ograniczenia ogólności zapis. w postaci: U=Af (1) f-elem. pewnej przestrzeni funkcyjnej; A-operator czyli operacją określ. spos. przekszt. elem. A w elem. U, w szczególności A nazywa się funkcjonalem, J. U jest liczbą rzeczywistą. Zad., które trzeba rozwiązać, sprow. się do obl. z równ. (1) elem. U gdy dany jest elem. f. 1.Udowodnienie istn. i jednozn. rozw. równ. 2.Wyrażanie stabiln. zad. lub co na jedno wychodzi stabiln. rozw tego zad. Oznacza to że trzeba udowodnić iż dostatecznie małym zmianom danych wyjść f odpowiada dowolnie małej zmianie rozw. w rozpatrywanym obszarze. 3.Znalezienie rozw. w post. wzoru. Każde zagadnienie dla którego potrafimy pozytywnie rozw. problem 1 i 2 nazywa się zagadn. popr. postawionym. Poszukiw. rozw. U równ. (1) w postaci wzoru w wielu konkretnych przykładach związane jest z zasadniczymi trudnościami. Stąd prowadzi konieczność uciekania się do pomocy tzw. metod przybliżonych rozw. zad. Prowadzi to do otrzymania zamiast szukanej f. i liczb wartości przybliżonych. Wartości f. będziemy nazywać przybliżeniami f., a wartości przybliżone liczb liczbami przybliżonymi. Z przybliżeniami f. mamy do czynienia, np. wówczas gdy w celu uproszczenia obliczeń zastępujemy daną f. sumą skończoną ilości wyrazów jej szereg Fouriera lub szereg Taylora. Liczby przybliżone spotykamy wówczas, np. przy mierzeniu różnych wielkości fiz.: długości, powierzchni, objętości, masy, prędkości, itd. Liczby przybliżone zjawiają się również jako wynik działań artmet. na liczbach przybliżonych oraz na skutek odrzucania dost. małych wielkości podcz. obl. W związku z tym powst. wiele zagadnień: Jak wybrać przybliżoną metodę rozwiązywania równ typu (1)? Jaki będzie przy tym błąd otrzymanego rozw. przybliż. tzn. w jakim stopniu będzie się ono różnić od rozw. dokł.? Jak scharskt. błąd liczb przybl. miarę ich odchylenia od odpow. liczb dokł.? Jak oszacować błąd wyniku obl.? Jaki jest dop. bł. l. przybl., przy którym bł. wyniku działań artmet. na tych liczbach nie jest zbyt duży? W jaki sposób można wykonywać działania na l. przyb. żeby błąd wyniku był najmniejszy? Badanie wszystkich tych zagadnień jest przedmiotem metod num. Bł. bezwzględny i dokładna wartość bł. bezwzględnego. J. a jest wart. przybliżoną liczby a0 to w skrócie zapiszemy a0 ≈ a (a0 jest przybliżalnie równa a). Dokładną wartością błędu liczby a lub przybliżonej równości (2) nazywamy wielkość ∆=a0-a (3). Błędem bezwzględnym przybliżonej liczby a nazywamy każdą możliwie małą liczbę dodatnią α, taką że |∆|=|a0-a|≤α (4) Np. niech będzie dana liczba a0=0,5531. Gdy weźmiemy jako jej przybliżenie a=0,55 to dokładna wart. bł. wyn. ∆=0,0031. W pewnym przyp. dla wsk. bł. bezwzgl. równości przybliżonej (2) przyjmujemy zapis (a0=a±α) (2'). J. spełn. jest nierówn. (4) to mówimy że przybliżona l a przedstawia l. a0 z dokładn. do wielkości α. Bł. względny i dokł. wart. bł. bezwzględnego. Łatwo zauważyć że bł. bezwzgl. nie charakt. w pełni pomiarów. J. bł. bezwzgl. przy pomiarze dł. pudełka z zapałkami i przy pom. dł. biurka w obu przyp. jest bezporówn. bardziej dokł. niż pierwszy mimo że bł. bezwzgl. obu pomiarów jest taki sam. Naturalne jest wprowadzenie jeszcze jednej wielkości charakt. liczby przybliżone. Tą wielk. jest tzw. błędem przybliżonym liczby przybliżonej. Dokładną wielk. bł. wzgl. jest wielk. η=∆/a=(a0-a)/a (5). Bł. wzgl. l. przybl. a lub przybl. równ. (2) nazywa się dowolną możliwie małą dodatnią liczbę δ taką że: |η|=∆/a=|(a0 - a)/a|≤δ (6) Z określenia tego wynika że J. znany jest bł. bezwzgl. liczby przybliż. a to jako bł. wzgl. można przyjąć wielk.: δ=α/|a| (7). Bł. wzgl. zawsze wyraża się liczbą niemianowaną. W praktyce często bł. wzgl. wyrażamy w % wielkości zmiennej. Bł. wzgl. charakt. wyst. dokładnie l. przybl., a w szczególn. jakość pomiaru różnych wielkości. Przyjmiemy np. że przy średn. drutu i wys. drzwi możemy dopuścić bł. nie przekr. 1mm. otrzymując w rezult. pom. średn. drutu ≈5mm a wys. drzwi ≈2m łatwo stwierdzić że bł. wzgl. w 1 przyp. wyn. 20% a w 2 zaś 0,05%. Dochodzimy zatem do wn. że im mniejszy jest bł. wzgl., tym lepsza jest jakość pomiaru. Dokładanie cyfry i zapis przybliżony. Każda l. rzeczyw. a ma rozw. przy podst. q=2,3,8,10,16 tzn. można przedst. ją w spos.: a=±(a1qn+a2qn-1+...+amqn-m+1+...) (8) gdzie: a1-liczby całkowite (0≤ai≤q). Daną liczbę a zapiszemy przy tym w postaci ciągu cyfr, im bardziej na prawo tym cyfra niższa i niższa jest jej pozycja tzn. mniejszy jest wykładnik potęgi, przy której cyfra wyst. we wzorze (8). Cyfry wyst. przy potęgach o nieujemnych wykładnikach są oddziel. „,” od cyfr niższych pozycji, np. l. 11,1 zapisana w postaci dwójkowego syst. liczb. jest równa 21+20+2-1=3½. Wszystkie cyfry liczby rozwinięcia przy pewnej podst., poczynając od pierwszej cyfry niezerowej nazywamy cyframi znaczącymi, np. l. 0,016 ma dwie cyfry znaczące 1 i 6. Ilość cyfr znacz. liczb można zwiększać lub zmn. przez dopisyw. zer na ostatnich pozycjach. Dana liczba nie zmienia się przy tym. dy/dx=lim[∆x;0]∆y/∆x ; y(x0+∆x)-y(x0)=∆y ; dy/dx≈∆y/∆x=[y(x0+∆x)-y(x0)]/∆x ; ∫[a;b]f(x)dx ; Str=½h[f(a)+f(b)]=½(b-a)[f(b)+f(a)]x=x0 ; xi-xi-1=hi ; ∆Si=h/2[f(xi)+f(xi-1)] ; Sa0=∑∆Si=h/2∑[i=1,n][f(xi)+f(xi-1)] RYS. 1 W celu, żeby z ostatniej cyfry znaczącej można było sądzić o wartości błędu bezwzględnego obieramy parametr liczbowy Ω( ½≤Ω≤1) i umawiamy się, że cyfrę am liczby (8) nazywać będziemy dokładną, j. dla błędu bezwzględnego α tej liczby zachodzi nierówność α≤Ωqn-m+1 (9) J. ten warunek nie jest spełniony to cyfrę am nazywamy wątpliwą. J. cyfra am jest dokładna, to również i wszystkie poprzednie cyfry są dokładne. W taki spos. pom. dokładnymi cyframi można zawsze znalęźć ostatnią (J. α>0) Ostatnia cyfra znacząca powinna być dokładna. Osiągamy to przez odrzucenie cyfr wątpliwych i dopisanie w razie konieczności po prawej stronie mnożnika qk (kЄC). Np. w dziesiętnym syst. liczenia zapis a=3,14 przy α≤Ω*10-2 jest poprawny zapis a=3,140 nie jest poprawny; zapis a=1200 przy α≤Ω≤1 - poprawny a przy α≤Ω*10 niepoprawny. Liczbę a=124237 z trzema cyframi dokładnymi trzeba zapisać w postaci a=124*103, a liczbę a=0,00412 z dwiema dokładnymi cyframi 4 i 1 można zapisać poprawnie jak a=4,1*10-3. Zaokrąglanie liczby przybliżonej (8) do ostatniej cyfry am polega na tym, że J. Θ=am+1qn-m+am+2qn-m+1+...<½ qn-m+1 (10) to wartość Θ odrzuca się. J. jednak Θ ≥ ½ qn-m+1, to odrzuca się Θ, aleprzy tym zwiększa się o jedność cyfrę am ostatniej z pozostawionych pozycji. W niektórych przyp. dziesiętnego syst. licz. przy Θ=½ qn+m-1 zostawia się am zmiany gdy am jest parzysta i zwiększa się o jedność, gdy am jest nieparzysta. Błąd nieunikniony. Wielkości dane wyst. w każdym konkretnym zagadnieniu typu (1) z regóły nie są znane dokładnie, jedynie w przybliżeniu, z pewnym błędem. Ze wzgl. na ten błąd danych wyjściowych w końcowym wyniku rozwiązania zad. otrzym. nieuchronnie pewien błąd nazwany błędem nieuniknionym. Rozpatrzymy zagadnienia dot. wielk. bł. nieunikn. prostszych f. i działań artmet. Niech y0-f(x10,x20,x30,...,xn0) (11) będzie różniczkowalna w spos. ciągły f. zmiennych niezal. x10,...xn0. Wówczas przy podaniu niedokładnej ale przybliżonej wartości argumentów x1=x10±α1; x2=x20±α2 ;...; xn=xn0±αn zamiast y0 otrzymujemy z f. (11) pewną wielkość y=y0±αy, gdzie αy - błąd bezwzgl. wielkości y. Powstaje pytanie, w jaki spos. znaleźć wielkość αy(αy), a także odpowiedni błąd względny δy, jako wielkości charakt. błąd nieunikniony f. y. Stosując wzór Lagrange'a dostaniemy y-y0=∑[i=1;n][∂f(x)/∂xi](xi-xi0) (12), gdzie: y(x)=f(x)=f(x1,...,xn), x - punkt o współrz. x1,x2,...,xn. Nawiasy kwadratowe oznaczają, że ujęte w nich pochodne są brane w pewnym wewn. punkcjie x+Θ(x-x0), Θ-liczba zawarta między zerem a jednością. Rozważania będziemy prowadzić przy następujących uproszczonych założeniach: a)pochodne cząstkowe f. f zmieniają się dost. wolno; b)błędy wzgl. δ1,δ2,...,δn danych wyjściowych x1,x2,...,xn są dost. małe. Ze wzoru (12) mamy: a)αy≈∑[i=1;n]|∂f(x) / ∂xi|αi (13) Jest to ogólny wzór przybliżony dla błędu bezwzględnego f.. Dzieląc obie str. rown. (13) przez y=f(x) oraz uwzględniając założenia a) i b) otrzymamy wzór na błąd względny δy≈∑[i=1;n] |∂lnf(x)/∂xi|αi (14) lub δy≈∑ |∂lnf(x)/∂lnxi|δi=∑{|xi||∂lnf(x)/∂xi|}δi (14') Z wzorów (13), (14) i (14') otrymujemy wielkości błędów działań artmet. Zasady obl. liczby dokładnych cyfr. Widzieliśmy już (pkt 4), że pozycja ostatniej dokładnej cyfry znaczącej liczby dokładnej i jej błąd bezwzględny α wyrażają się jedno przez drugie. Niech w liczbie przybliżonej a=±(a1qn+a2qn-1+...+amqn-m+1) (8) wszystkie cyfry przy danym wyborze parametru Ω (½≤Ω≤1) będą dokładne. Znaczy to, że α≤Ωqn-m+1 (9) Dzielac bie str. (9) przez |a| mamy δ≤Ωqn-m+1/|a1qn+...+amqn-m+1|≤Ωqn-m+1/a1qn czyli δ≤Ω/a1qn (15) to dana liczba a z pierwszą cyfrą znacząca a1 ma co najmniej m dokładnych cyfr znaczących. Istotnie mamy α=|a|δ≤δ(a1+1)qn≤Ωqn-m+1 a to znaczy, że cyfra am jest dokładna. Z nierówności (15) i (15') wynikają stosunk. proste zasady obliczania liczb dokładnych. Błąd metody Dokładne rozw. wielu zad. typu (1) jest związ. z podst. trudnościami. Stosując jakąkolwiek przybliżoną metodę rozw. zad. U=Af (1) rozwiązujemy faktycznie inne „aproksymujące” zadanie U--=A—f--(1') gdzie: f---element zbliżony w pewnym sensie do elementu f, A--- operator zbl. w p. sens. do op. A. Wielkość U-Ū (16) będziemy nazywać błędem metody. W ogólnym przyp. nie ma nie ma możliwości wskazania wartości lub oszacowania błędu metody. Zagadnienie to powinno być badane w zastosowaniu do każdej konkretnej metody rozwiązyw. dotyczącej szerokiej czasem zadań, a czasem i w zastosowaniu do szczególnego zadania. Obliczany np. metodą prostokątów całkę RYS. 2 I=∫[0;1]f(x)dx Biorąc punkty xi=ih, h=1/n(n-l) całkowita, i=0,1,2,...,n otrzymamy w przybliżeniu Ii=f(xi)(xi+1)=fih Dokładną wartość I≈∑[i=0;n-1]Ii=∑[i=0;n-1]f(xi) bł. bezwzgl. metody określa równość ∆=∫[0;1]f(x)dx-∑[i=0;n-1]f(xi)h=∑[i=0;n-1]∫[x[i];x[i+1]]f(x)dx-∑[i=0;n-1]f(xi)h=∑[i=0;n-1]∫[x[i];x[i+1]][f(x)-f(xi)]dx≤∑[i=0;n-1]∫[x[i];x[i+1]]|f(x)-f(xi)|dx. U podstaw podanych tu części znanych metod przybliżeniowych leży jedna ogólna idea, która polega na tym że zamiast szukania rozw. zad. (1) w danej przestrzeni funkcyjnej poszukujemy rozwiązania tego zad. w węższej skończenie wymiarowej przestrzeni f. Bł. numeryczny. Pojęcie stabilności obliczeń. Przypuśćmy że jakąkolwiek metodą przybliżoną doprowadziliśmy rozwiązanie zagadnienia (1) do rozwiązania pomocniczego zagadnienia aproksymującego (1'). Żeby rozw. to zad. należy przede wszystkim podać algorytm rachunkowy. Oznacza to że trzeba przedstawić zbiór praw i reguł obliczeniowych określających przebieg obliczeń, prowadzący do szukanego wyniku. Np. pożądane jest tak dobierać metodę, żeby ilość potrzebnych działań rachunkowych była wedle możności najmniejsza. Czasem trzeba poświęcić prosty schemat obliczeniowy na korzyść takiej metody, której liczba działań rachunkowych jest najmniejsza. Np. rozwiązanie ukł. algebraicznych równań liniowych ∑[j=1;n]aijxj=bi (17)(i=1,2,...,n) z wyznacznikiem ∆≠0 można zapisać za pomocą wzorów Cramera xi=∆i/∆ (18)(i=1,2,...,n) gdzie ∆i - wyznacznik otrzymany z ∆ przez zastąp. i-tej kolumny elem. kolymną prawej str. ukł. (17). Należałoby wtedy obliczyć n+1 wyznaczników n-tego stopnia. Przy obliczaniu każdego z nich trzeba wykonać (n-1)n! mnożeń. Ogólna liczba koniecznych działań mnożenia i dzielenia wyniesie (n2-1)n!+n. Skorzystajmy teraz z metody eliminacji Gaussa. Pierwsze z równań (17) daje xi=bi/aii-a12/a11x2-...-a1n/a11xn (19). Wykomuje się przy tym n dzieleń. Podstawienie xi w każde z n-1 następnych równań wymaga n mnożeń. Ogólnie rzecz biorąc, do otrzymania n-1 równań o niewiadomych x2,x3,...,xn potrzeba n2 mnożeń i dzieleń razem, należy zatem wykonać n/6(2n2+3n+1) mnożeń i dzieleń razem, żeby sprowadzić ukł. (17) do ukł. macierzy trójkątnej. Do rozwiązania ukł. trzeba wżiąć [n(n-1)/2 mnożeń. W taki spos. do rozw. ukł. (17) potrzeba n/3(n2+3n-1) mnożeń i dzieleń razem. Na pierwszy rzut oka mogłoby się wydawać że pierwsza metoda (Cramera) jest lepsza; przeprowadzone jednak obliczenia liczby potrzebnych mnożeń i dzieleń dowodzą jednak czegoś przeciwnego. Np. dla 10 równań metoda Cramera wymaga (102-1)*10!+10 ≈ 36*107, metoda Gaussa natomiast tylko 10/3(102+3*10-1)=430. W taki spos. dzięki dobrze dobranej metodzie obliczeń można często znacznie skrócić pracę. Istnieją jednak jeszcze inne powody o charakt. bardziej zasadniczym, które zmuszają do tego, żeby dążyć do max zmn. liczby koniecznych działań rachunk. Podczas obl. z reguły zmuszeni jesteśmy zaokrąglać liczby lub po prostu odrzucać wielkości dost. małe. W wyn. tego zjawia się tzw. bł. numeryczny lub bł. obliczeń. Przy obliczeniach wyk. na maszynach cyfrowych wyst. 3 podst. rodzaje bł.: wejściowe, obcięcia i zaokrągleń. Bł. wejściowe (względnie bł. danych wejściowych) wyst. wówczas gdy dane liczbowe wprowadzone do pamięci lub rejestrów maszyny cyfrowej odbiegają od dokł. wartości tych danych. Błędy takie pojawiają się wtedy gdy dane wejściowe są wynikiem pomiarów wielk. fiz., mierzonych z pwen. bł. pomiaru. Bardziej jednak charakt. przyczyną wyst. bł. wejściowych jest skończona dł. słów binarnych, reprezentujących liczby w maszynie i nieuniknione w związku z tym wstępne zaokrąglanie. Zauważmy na koniec że wstępna zaokrąglanie wyst. w przypadku wszystkich liczb niewym. √2 π e itp. Bł. obcięcia powst. na skutek zmniejszania liczby działań. Postępujemy tak na ogół przy obl. sum nieskończ. (szeregów). Np. wartości wyrażenia ex równego szeregowi 1+x+x2/2+...+xN/N! o odpowiednio dobranej wartości N. Podobnie zastąpienie wartości pochodnej f. jej ilorazem różnicowym powoduje powstanie bł. obcięcia. Praktyka obliczeń stawia teorii metod num. jeszcze jedno ogólne żądanie o pierwszorzędnym znaczeniu. Jest to żądanie stabilności obliczeń względem błędu. Okazuje się często że dla otrzymania wyniku konieczne jest przeprowadzenie długotrwałego ciągu obl. związanych z daną metodą; ciąg ten zazwyczaj jest tym dłuższy, im większą dokł. chcemy uzyskać. J. popełnimy bł. w pewnym działaniu tych obliczeń to powinniśmy się spodziewać że bł. ten będzie maił wpływ na wynik nast. działań rachunku. J. bł. popełniony w pierwszych krokach rachunku nie zwiększa się w nast. krokach lub pozostaje tego samego rzędu to przebieg obl. nazywa się stabilnym względem bł. początkow. J. bł. ten wzrasta to przebieg obl. jest niestabilny. Metody numeryczne algebry liniowej. 1.Wiadomości podst. z algebry. 1.Macierze i wyznaczniki. Tablicę prostokątną zawierającą m wierszy i n kolumn nazywamy (m,n)-macierzą. Przez aij oznaczamy elem. m. stojący na przecięciu i-tego wiersza i j-tej kolumny. J. w m. A zmienimy role kolumn i wierszy to otrzymamy m. przestawioną A' m. A. J. A'=A to m. A naz. się symetryczną. M. której wszystkie elem. są rzeczyw. naz. się m. rzeczywistą. M. której wszystkie elem. są 0 naz. się m. zerową. Dwie m. A=[aij] i B=[bij] naz. równymi gdy aij=bij przy wszystkich i, j. M. A i E naz. sprzężonymi gdy aij=ēij przy wszystkich i, j (kreska u góry oznacza wielkość zespoloną sprzężoną do eij). Suma dwóch macierzy A+B=C o elem. cij=aij+bij. Iloczynem m. A przez liczbę α naz. m. o elem. cij=αaij. Iloczynem dwóch m. A i B naz. m. C o elem. cij=∑[k=1;n]aikbkj gdzie n - liczba kol. A=z zał. l. wierszy m. B. Dowilny wektor o składowych x1,x2,...,xn można przedstawić jako wiersz (x1,x2,...,xn) lub jako kol. o elem. (x1,x2,...,xn). Dowolną (n,n)-macierz naz. kwadratową stopnia n. Elementy aii tej m. przedst. gł. przekątną. J. wyznacznik W=|A|=detA≠0 to m. kw. A naz. nieosobliwą. J. wszystkie elem. m. kw. leżące pod(nad) gł. przekątną są=0 to naz. ją m. górną(dolną) trójkątną. M. diagonalna - wszystkie elem. oprócz stojących na gł. przek.=0. M. jednostkowa - gł. przek. zawiera 1 a reszta elem.=0 i oznaczamy ją E - AE=EA=A. M. A-1 naz. odwrotną j. AA-1=E. Łatwo spr. że (AB)-1=A-1B-1. M. dołączoną m. A naz. m. C=[Aij*] gdzie Aij* są dopełnieniami algebraicznymi elem. aij wyznacznika |A|. M. A naz. skośnosymetryczną, j. A=-A'. Gdy A-1=A' to m. A naz. ortogonalną, gdy A=Ā' - hermitowską. Dwie m. A i B naz. podobnymi j. istn. m. nieosobliwa C taka że B=C-1AC. Mówimy wtedy że m. B jest otrzymana z m. A przekształceniem przez podobieństwo. Przez wielomian względem m. A rozumiemy P(A)=a0E+a1A+a2A2+...+anAn gdzie a1,a2,...,an-liczby dane, A2=AA,...,An=AAn-1. Niektóre znane z algebry: 1)detAB=detAdetB 2)Na to żeby A miała A-1 potrzeba i wystarcza żeby |A|=detA≠0. M. odwrotną zapis. w post. A-1=C/|A| gdzie C -m. dołączona natomiast |A-1|=1/|A| 3)J. detA≠0 to ukł. AX^=b^ (1) gdzie A=[aij]nxn X^=[xn]nx1 b^=[bn]nx1 ma jedno rozw. które zapis w post. X^=A-1b^. 4)Na to żeby ukł. równ. jednorodnych Ax^=0 miał rozw. ≠0 potrzeba i wystarcza żeby detA=C. Ukł. n równań jednorodnych Ax^=λx^ (2) (λ-wart. własna m.) może być zapis w post. Ax^-λx^=0 ⇒ (A-λE)x^=0 i dlatego ma niezerowe rozw. w tym i tylko w tym przypadku gdy wyznacznik D(λ)=det(A-λE)=|m.kw.n-tego st. i od każdego a na gł. przek. -λ| (3) jest=0 (D(λ)=0). Równanie D(λ)=0 naz. równ. charakterystycznym lub wiekowym. D(λ) - wielomianem charakterystycznym m. A. Pierwiastki równ. D(λ)=0 naz. wartościami własnymi lub liczbami własnymi m. A, a odpowiadające im rozwiąz. niezerowe ukł. równ. (2) wektorami własnymi m. A. M. podobne mają jednakowe wielomiany charakt.: |C-1AC-λE|=|C-1AC-λC-1EC|=|C-1||A-λE||C|=|A-λE|. Łatwo zauważyć że m. przestawiona A' ma taki sam wielomian charakt. jak m. A ponieważ wartość wyznacznika przy zamianie wierszy przez kolumny i przeciwnie nie zmienia się. TW1. Niech λ1,λ2,...,λn będą wartościami własnymi m. A, a φ^1,φ^2,..., φ^n odpowiadającymi im wektorami własnymi i Ψ^1, Ψ^2,...,Ψ^n odpow. im wekt. wł. m. podst. A. Wówczas przy λi≠λj wektory φ^i i φ^j są ortogonalne tzn. φiΨj=∑[k=1;n]ξikΨjk=0 gdzie ξi1, ξi2,..., ξin -składowe wektorów φ^i, Ψj1, Ψj2,...,Ψjn -składowe wektorów Ψj TW2. Wekt. własne odpow. różnym wartościom wlasnym są liniowo niezależne. Wekt. X^1, X^2,..., X^n, naz. wekt. liniowymi niezależnymi, j. tożsamość ∑[i=1;n]ciX^i=0 gdzie c1, c2,..., cn -liczby, zachodzi tylko przy c1=c2=...=cn=0. Rzeczywista (n,n) m. symetryczna ma n rzeczywistych liniowo niezależnych ortogonalnych wektorów własnych; wszystkie jej wartości własne są rzeczywiste. RYS3 TW3. Każdy n-wymiarowy wektor X^ może być przedst. w post. kombinacji liniowej n wektorów własnych rzeczywistej m. symetrycznej X^=∑[i=1;n]ciφ^i gdzie ci (i=1,...,n) -stałe. Często jest wygodnie normować wektory ortogonalne tj. dzielić każdy wekt. przez pierwiastek z sumy kwadratów jego składowych. TW4. J. n wektorów X^i=(xi1,xi2,...,xin) przedst. ukł. ortonormalny to ukł. n wektorów Y^i=(x1i,x2i,...,xni) (i=1,2,...,n) jest też ukł. ortonormalnym. TW5. Dowolną (n,n) m. A można przedst. w post. iloczynu 2 m. trójkątnych - górnej i dolnej j. a11≠0, |a11 a12; a21 a22|≠0, |A|≠0 TW6. J. A ma n-liniowo niezależnych wektorów własnych to przekształceniem przez podobieństwo można ją doprowadzić do postaci diagonalnej. Przy tym elementami gł. przek. w tej m. będą jej wart. własne. TW7. (Cayley'a - Hamiltona) J. wartości własne m. A spełn. równ. algebraiczne λn+gn-1λn-1+...+g1λ+g0=0 to An+gn-1An-1+...+g1A+g0E=0 2.Przestrzenie liniowe unormowane. Niech X^1,X^2,...,X^n będzie ukł. n wektorów liniowo niezależnych o składowych (x1i,x2i,...,xni) (i=1,...,n). Wówczas zbiór wszystkich możliwych kombinacji liniowych wektorów X^=C1X^1+C2X^2,+...+CnX^n (4) gdzie C1,C2,...,Cn-dowolne stałe; przedstawia przestrzeń liniową n-wymiarową R. TW8. J. każdy z k wektorów Y^1,Y^2,...,Y^k jest kombinacją innych m<k wektorów X^1,X^2,...,X^m to wektory Y^1,Y^2,...,Y^k są liniowo zależne. Każdy zbiór n liniowo niezależnych wektorów przestrzeni R nazywa się jej bazą. Np. jako bazę można wziąć wektory X^1,X^2,...,X^n lub wektory e^1=[100...0]T,e^2=[010...0]T,...,e^n=[00...1]T Wypisanie powyżej n wektorów nazywamy bazą wyjściową przestrzeni R. Na mocy tw. 8 każdy wekt. jest kombinacją liniową wektorów bazy. Współczynniki tej kombinacji liniowej są określone jednoznacznie i naz. się składowymi (współrzędnymi) wektora w danej bazie. Np. X^=[x1x2...xn]T=x1e^1+...+xne^n (4') gdzie x1,x2,...,xn składowe wekt. X^ w bazie wyjściowej e^1,e^2,...,e^n. Zobaczmy jak przekształcają się składowe wekt. X^ przy przejściu od bazy wyjściowej e^1,e^2,...,e^n do dowolnej bazy X^1,X^2,...,X^n. Niech C będzie m. której kolumny przedst. składowe wekt. X^1,X^2,...,X^n w bazie wyjściowej C=[cij]nxn. M. ta jest oczywiście nieosobliwa pon wekt. X^1,X^2,...,X^n są liniowo niezależne; naz. się ona m. przekształcenia. Podstawiając Xi=∑[j=1;n]cjie^j w równ. (4) otrzym. [x1x2...xn]T=[c11c1+c12c2+...+c1ncn;... ;cn1c1+cn2c2+...+cnncn]=[cij]nxn*[c1...cn]T. W taki spos. składowe wyjściowe wekt. X^ otrzymujemy z jego skład. przekszt. przekształceniem linowym z m. C; X^=CX^', gdzie przez X^' oznaczono kolumnę utworzoną ze składowych wekt. X^ w bazie przekszt. Niech będzie dane przekszt. liniowe przestrzeni R w siebie Y^=AX^ gdzie A-(n,n) m. nieosobliwa nazwana m. przekszt. liniowego X^, Y^-wekt. wyznaczone przez swoje składowe w bazie wyjściowej. Zobaczmy jak zmienia się m. A przekszt. linowego przy przejściu od bazy wyjściowej e^1,e^2,...,e^n do bazy przekształconej X^1,X^2,...,X^n. Niech X^`,Y^` oznacz. wektory X^,Y^ w bazie. Wówczas X^=CX^';Y^=CY^' skąd wynika Y^`=C-1Y^`=C-1AX^=C-1ACX^` W ten spos. jednemu i temu samemu przekszt. w różnych bazach odpowiadają m. podobne ze współcz. podobieństwa C. Wartości własne i wektory własne m. A naz. także wart. własnymi i odpowiednio wektorami własnymi przekształcenia Y^=AX^. J. przekszt. liniowe ma w jakiejś bazie macierz diagonalną to baza skł. się z wekt. wł., elem. zaś stojące na przek. tej m. przedst. wartości wł. I przeciwnie j. w przestrzeni istn. baza złożona z wekt. wł. przekszt. to w tej bazie m. przekszt. A jest diagonalną. Wszystko to wynika bezpośrednio z równości AX^=λX^ określającej wartości własne i wektory własne przekształcenia Y^=AX^. Normą (analogia do długości) wektora X lub -ogólnie-dowolnego elem. przestrzeni liniowej nazywamy przyporządk. temu wekt. nieujemną liczbę rzeczyw. ||X|| spełn. nast. aksjomaty normy: 1)||X||>0 przy X≠0, ||0||=0 2)||αX||=|α| ||X|| α -liczba 3)||X+Y||≤||X||+||Y|| Każda przestrzeń liniowa w której wprowadzono pojęcie normy naz. przest. lin. unormowaną. Iloczynem skalarnym wektorów naz. przyporządkow. każdej parze wekt. X^ i Y^ liczby rzeczyw. (zespolonej) nazywanej iloczynem skalarowym XY=(X,Y) Aksjomaty skalarowego mnożenia: 1)XX>0 przy X≠0 i 00=0 2)XY=YX (XY=YX -w przestrzeni zespolonej) 3)(αX)Y=α(X,Y) α -liczba 4)(X+X1)Y=XY+X1Y Przestrzeń e której wprowadzono pojęcie iloczynu skalarowego i norma ||X||=√(XX) naz. przest. euklidesową. J. przestrzeń jest zespoloną a norma ||X||=√(XX) to naz. przest. unitarną. Np. w przestrz. R przyjmujemy XY=∑[i=1;n]xiŷi (też w zespolonej). Przez x1,...,xn y1,...,yn oznaczono składowe wekt. X i Y. W tejże samej przestrzeni można wziąć na równi z normą wektora określoną równością ||X||=√(XX) w charakterze ||X|| jedną z wielkośi max[i]|xi| (i-1,...,n) lub ∑[1;n]|xi|. Dla odróżnienia jednej od drugiej tych różnych postaci norm oznaczymy je wskaźnikami u dołu ||X||1=max[i]|xi| (5), ||X||2=∑[i=1;n]|xi| (6), ||X||3=√(XX)=√(∑[1;n]|xi|) (7). Dwa wektory X i Y naz ortogonalnymi, j. XY=0. Układ wektorów Y1,...,YK naz. ukł. ortogonalnym j. wszystkie te wekt. są parami ortogonalne; j. przy tym norma każdego z nich=1, to ukł. naz. ortogonalnym. Dla m. A tak samo jak dla wekt. może być wprowadzone pojęcie normy ||A|| spełniającej aksjomaty 1,2,3 normy a warunek ||AX||≤M||X|| gdzie X -dowilny wektor n-wymiarowej przestrzeni euklidesowej R. Określenie to jest równoważne równości ||A||=max|| A X/||X|| || (8) Konkretna postać normy macierzy zależy oczywiście od postaci normy przyjętej dla wektorów. Np. można wykazać że w przyp. normy (5)(6)(7) dla wekt. odpowiednie normy macierzy A są ||A||1=max[i]∑[j=1;n]|aij| (9), ||A||2=max[j]∑[j=1;n]|aij| (10), ||A||3=√λ1 (11) gdzie λ1 -najw. wart. własna m. Istotnie w przyp (5) ||X||=1, wówczas mamy ||AX||=max|∑[k=1;n]|aikxk|≤max∑[k=1;n]|aik||xk|≤max[i]∑[k=1;n]|aik| zatem max||AX||=max[i]∑[k=1;n]|aik|. W przyp. (7) zauważymy że słuszne jest prawo przestawienia m. w iloczynie skalarowym (AX,Y)=(X,A*Y) gdzie A*-m. której elem. są zespolone sprzężone z A' przestawiona macierzy A. Niech λ1≥λ2≥...≥λn będą wartościami własnymi X1,X2,...,Xn ortonormalnym ukł. wektorów własnych. Obierzmy dowolny wekt. X z normą=1 i zapiszmy go za pomocą wekt. własnych X=c1X1+...+cnXn wtedy (X,X)=c12+c22+...+cn2=1. Następnie ||AX||2=(X,A'AX)=(c1X1+...+cnXn, c1λ1X1+...+cnλnXn)=λ1c12+λ2c22+...+λncn2=λ1(c12+...+cn2)=λ1 a poza tym, dla X=X1 mamy ||AX1||2=(X1,A'AX1)=(X1,λ1X1)=λ1 W taki spos. max||AX||=√λ1 (11). Mówimy że ciąg wektorów Xk (ciąg m. Ak) przy k→∞ dąży do wektora X (do m. A) lim[k→∞]Xk=X (lim[k→∞]Ak=A), jeśli każda składowa wekt. Xk (każdy elem. m. Ak) przy k→∞ dąży do odpowiedniej składowej wekt. X (do odp. elem. m. A). Żeby lim[k→∞]Xk=X potrzeba i wystarcza by lim[k→∞]||Xk-X||=0 (lim[k→∞]Ak=A ; lim[k→∞]||Ak-A||=0) TW12. Na to by Am→0 przy m→∞ potrz. i wyst. by wszystkie wartości własne m. A były co do wart. bezwzgl.<1. |λ1|<1 (i=1,...,n) TW13. Wartość bezwzgl. każdej wart. wł. m. A jest większa od jej normy (dowolniej) |λi|≤||A|| (i=1,...,n) TW14. Na to by szereg E+A+A2+...+Am+... był zbieżny potrz. i wyst. by Am→0, gdy m→∞. Przy spełnieniu tego warunku zachodzi równość E+A+A2+...+Am+...=(E-A)-1 (12). Istotnie konieczność powyższego warunku jest oczywista. Pokażemy, że jest on war. dost. Na mocy twierdzenia (12) mamy |λi|<1 (i=1,...,n) co oznacza że równanie AX=1X (λ=1) nie ma rozwiąz. niezerowego i wyznacznik |E-A|≠0. Dlatego istnieje m. (E-A)-1 odwrotna do (E-A). Mnożąc prawostronnie przez (E-A)-1 tożsamość (E+A+A2+...+Am)(E-A)=E-Am+1 otrzymujemy E+A+A2+...+Am=(E-A)-1-Am+1(E-A)-1 Stąd wynika że Sm=E+A+...+Am⇒(E-A)-1 ponieważ Am+1→0 gdy m→∞. Zauważmy jeszcze że (E-A)-1-Sm=Am+1+Am+2+... ||(E-A)-1-Sm||≤||A||m+1+||A||m+2+...=||A||m+1/(1-||A||) Metody numeryczne rozw. ukł. równ. algebraicznych liniowych. 1.Wstęp. Rozwiązanie układu a11x1+a12x2+...+a1nxn=a1 n+1 ;...; an1x1+an2x2+...+annxn=an n+1 (14) lub w postaci macierzowej AX=f (14') gdzie A=[a11 ... a1n ;...; an1 ... ann] X=[x1 ... xn]T f=[a1 n+1 ... an n+1]T nie przedstawia trudności z teoretycznego punktu widzenia i w przypadku gdy wyznacznik |A|=W≠0 wyraża się wzorami Cramera xi=|Ai|/|A| (15) gdzie |Ai|-wyznacznik otrzymany z |A| drogą zamiany jegi i-tej kol. przez kol. wyr. wolnych. Ale rozwiązanie ukł. (14) przez obliczenie wart. liczbowych wg wzorów (15) przedst. znaczne trudności i do chwili obecnej jest przedm. zainteresowania matematyków. Metody rozw. można podzielić na 2 duże grupy: metody bezpośrednie i iteracyjne. M. bezpośrednie charakt. to że prowadzą zawsze do rozwiąz. ukł. j. ono istn. Ale duż liczba działań arytmet. które należy przy tym przeprow. pociąga za sobą niebezpieczeństwo popełnienia bł. co przy znacznej liczbie równań może dać bezwartościowy wynik. M. iteracyjne nie posiadają ostatniej wady, ale zastosow. do odkeśl. klasy ukł. konkretnej z tych metod nie zawsze daje proces zbieżny. Z metod bezpośr. przede wszystkim należy wymienić metodę eliminacji Gaussa i metodę rzutu ortogonalnego. Najbardziej rozpowsz. z met. iteracyjnych jest met. iteracji prostej, met. Seidla i met. relaksacji (met. poprawek). Podst. idea met. elimin. Gaussa polega na tym że sprowadzamy ukł. (14) do ukł. równoważnego z macierzą trójk. górną (postępowanie proste eliminacji). Z otrzymanego w taki spos. ukł. znajdujemy niewiadome przez kolejne podstawienia (postępow. odwrotne eliminacji). Przyjmując że nazywany elem. kierującym współczynnik a11≠0 dzielimy pierwsze z równań ukł. przez a11. Następnie mnożąc otrzymane w taki spos. równ. przez a21, a31,...,an1 odejmujemy od odpowiednich równań ukł. (14). W rezultacie dochodzimy do układu x1+b12x2+...+b1n=b1 n+1 ; c22x2+a23*1x3+...a2n*1xn=a2 n+1 ;...; cn2x2+an3*1, x3+...ann*1xn=an n+1*1 (141) Postępując z tym ukł. (bez uwzględnienia pierwszego równ.) tak samo jak z ukł. (14) otrzymamy ukł. x2+b23x3+b24x4+...+b2nxn=b2 n+1 ; c33x3+a34*2x4+...+a3n*2xn=a3 n+1*2 ;...; cn3x3+an4*2x4+...ann*2xn=an n+1*2 (142) Powtarzając to postępowanie otrzymamy w końcu ukł. xn-1+bn-1 nxn=bn-1 n+1 ; cnnxn=an n+1*n-1 ; xn=bn n+1 Biorąc w każdym ukł. (141)(142)...(14n) pierwsze równania otrzymujemy szukany układ równań z m. trójkątną x1+b12x2+b13x3+...+b1nxn=b1 n+1 ; x2+b23x3+...b2nxn=b2 n+1 ;...; xn-1+bn-1xn=bn-1 n+1 ; xn=bn n+1 (16). Podany schemat eliminacji znany jest pod nazwą schematu jedynego dzielenia. Ten schemat zawsze istn. w tych przypadkach gdy elem. kierujące każdego z ukł. (141)(142)...(14n) są ≠0. J. jednak którykolwiek z nich zeruje się to w odpowiednim ukł. wystarczy zmienić numeracje równań tak by można było powtórzyć proces eliminowania. W pewnych przypadkach dla otrzymania większej dokładności obieramy w charakt. współczynnika kierującego ukł. największy co do wart. bezwzgl. elem. A. Drogą eliminow. odpowiadającej niewiadomej otrzymujemy ukł. równ. analogiczny do ukł. (141). Z tego ukł. w taki sam spos. wybieramy w charakt. kierującego najw. co do wart. bezwzgl. współczynnik tego ukł. i otrzym. ukł. analogiczny do (142). Powtarzając to postępow. otrzymujemy szuk. ukł. równ. z m. trójkątną. Taki schemat eliminacji jest znany pod nazwą schematu z wyborem elementów największych. 2.Metoda eliminacji Gaussa. Rozkład LU. Etap pierwszy (zwany etapem elimin. zmiennych). Dany jest ukł. równań. A(1)x^=b^(1), postaci a11(1)x1+...+a1n(1)xn=b1(1) ; a21(1)x1+...+a2n(1)xn=b2(1) ;...; an1(1)x1+...+ann(1)xn=bn(1) (1). Odejmując od i-tego wiersza tegi ukł. (i=2,3,...,n) wiersz pierwszy pomnożony przez ai1(1)/a11(1) otrzymujemy ukł. A(2)x^=b^(2) postaci a11(2)x1+...+a1n(2)xn=b1(2) ; a22(2)x2+...+a2n(2)xn=b2(2) ;...; an2(2)x2+...ann(2)xn=bn(2) Wyeliminowaliśmy w ten spos. pierwszą niewiadomą x1 z równań leżących w wierszach o nr i=2,3,...,n. Podobnie eliminujemy x2 z równań leżących w wierszach 3,4,...,n odejmując od i-tego wiersza (i-3,4,...,n) wierszdrugi pomnożony przez ai2(2)/a22(2). Postępując w ten spos. otrzymamy kolejne przekszt. ukł. równ. A(3)x^=b^(3), A(4)x^=b^(4), ..., i po (n-1) eliminacjach uzyskamy trójkątny ukł. równań A(n)ℋ ^=b^(n), postaci a11(n)x1+...+a1n(n)xn=b1(n) ; a22(n)x2+...+a2n(n)xn=b2(n) ;...; ann(n)xn=bn(n) (3). Etap drugi (zwany postępow. odwrotnym). Otrzymany po przekształceniu ukł. rozwiązujemy zgodnie ze wzorami (4) xn=bn(n)/ann(n), xi=(bi(n)-ain(n)xn-...-ai i+1(n)xi+1)/aii(n) (i=n-1,n-2,...,1). Można obliczyć że w celu wyznaczenia tą metodą rozwiązania x^ należy wykonać łącznie M=n3/3+n2-n/3 mnożeń i dzieleń oraz D=n3/3+n2/2-5n/6 dodawań. Jeśli nie musimy zachować danych A(1) i b(1) do dalszych obliczeń lub sprawdzenia to min. liczba zajętych komórek pamięci P=n2+n, w przeciwnym razie P'=2P. Liczba wykonyw. w met. Gaussa jest bez porównania mniejsza niż w metodzie Cramera. Tam bowiem należało obliczyć (n+1) wyznaczników, które w przyp. stosow. rozwijania wyznacznika wg kolumny lub wiersza wymagają co najmniej (n+1)! mnożeń. Zatem w przypadku 15 równań należałoby wyk. 4922789888000 ≈ 5*1012 mnożeń i maszyna cyfrowa wykonująca 106 mnożeń na sek. musiałaby pracować nieprzerwanie przez ponad rok, natomiast w met. Gaussa M=1345 mnożeń, a więc komputer wykona pracę w niecałe 0,01 sek. W wielu zagadnieniach num. dotyczących m. kwadratowych A, poszukujemy takich m. trójkątnych L i U by A=LU. Met. eimin. Gaussa umożliwia wyznaczenie takiego rozkładu. Zauważmy, że przekształcenie układu A(1)x^=b^(1) do postaci A(2)x^=b^(2) jest równoważne pomnożeniu obu str. ukł. (1) A(1)x^=b^(1) przez m. [1 0 0 ... 0 ;-l21 1 0 0 ... 0 ;-l31 0 1 0 0 ... 0 ;-l31 0 0 1 0 0 ... 0 ;...;-ln1 0 0 ... 1]=L(1), li1=ai1(1)/a11(1), i=2,3,...,n. Mamy zatem 2 równości: L(1)A(1)=A(2), L(1)b^(1)=b^(2). Analogicznie otrzym. 2 kolejne równości: L(2)A(2)=A(3), L(2)b^(2)=b^(3) gdzieli2=ai2(2)/a22(2), L(2)=[1 0 ... 0 ; 0 1 0 ... 0 ; 0 -l32 1 0 ... 0 ;...; 0 -ln2 ... 1] i=3,4,...,n. Postępując w ten spos. otrzymamy L(n-1)L(n-2)...L(1)A(1)=A(n) L(n-1)L(n-2)...L(1)b^(1)=b^(n). Macierze L(i), i=1,2,...,n-1 są nieosobliwe, możemy zatem napisać A(1)=(L(1))-1(L(2))-1...(L(n-1))-1A(n) (4) Zauważmy że (L(1))-1=[1 0 ... 0 ; l21 1 0 ... 0 ; l31 0 1 0 ... 0 ;...; ln1 ... 1], (L(2))-1=[1 0 ... 0 ; 0 1 0 ... 0 ; 0 l32 1 ... 0 ;...; 0 ln2 0 ... 1] a ponad to L=(L(1))-1(L(2))-1(L(n-1))-1=[1 0 ... 0 ; l21 1 0 ... 0 ; l31 l32 1 ... ;...; ln1 ln2 ln3 ... 1]. J. oznaczymy m. A(n) symbolem U to rozkład (4) m. A(1) na iloczyn możemy zapisać następująco A(1)=LU, gdzie L -m. trójkątna dolna z jedynkami na diagonalnej, U -m. trójkątna górna. J. etap elimin. zmiennych met. Gaussa można wykonać do końca to ukł. równań Ax^=b^ można zapisać jako Lux^=b^. Etap ten jest zatem równoważny przekształceniu wyjściowego ukł. do postaci Ux^=L-1b^=b^(n), a wyznaczenie rozwiąz. postaci x^ polega na rozwiąz. 2 ukł. z macierzami trójkątnymi Ly^=b^, Ux^=y^. Warianty stabilne. Met. Gaussa nie jest dozwolona. Np. [0 2 2 ; 3 3 0 ; 1 0 1]x^=[b1 b2 b3]T M. tego ukł. jest nieosobliwa, istn. zatem dokł. jedno rozw. Jednak ukł. tego nie można sprow. do postaci trójkątnej pon. a11=0=u4. Łatwo stwierdzić że wersja algorytmu Gaussa z częściowym wyborem elelm. podst., zwana czasem met. Gaussa-Crouta. (GCW) jest met. niezawodną przy założeniu dokładnych działań arytmet. nie nastąpi zatrzymanie procesu obliczeń z powodu dzielenia przez zero. Podamy ważne przykł. m., w stos. do których nie trzeba stos. strategii częściowego wyboru elem. podst. M. kwadratowa A naz. diagonalną dominującą gdy moduły elem. diagonali są niemniejsze od sumy modułów pozostałych elem. stojących w tym samym wierszu |aii|≥∑[k=1;n]|aik|, i=1,..,n Np. A=[3 1 0 ; 0 2 2 ; 4 1 5] jest diagonalnie dominująca. M. A jest diag. dom. kolumnowo, j. A'=AT jest diagonalnie dominująca |aii|≥ (>) ∑[k=1;n]|aik|, i=1,...,n 3.Metoda eliminacji Jordana. Ukł. równ. postaci (1) A(1)x^=b^(1) przekształc. następująco. Pierwsze równanie dzielimy obustronnie przez a11(1), a następnie do i-tego wiersza, i=2,3,...,n odejmujemy wiersz pierwszy pomnożony przez ai1(1), otrzymując układ A(2)x^=b^(2): x1+a12(2)x2+...+a1n(2)xn=b1(2); a22(2)x2+...+a2n(2)xn=b2(2); ...; an2(2)x2+...+ann(2)xn=bn(2). Następnie drugie równanie dzielimy obustronnie przez a22(2) i od i-tego wiersza, i=1,3,4,...,n odejmujemy wiersz drugi pomnożony przez ai2(2), otrzymując ukł. A(3)x^=b^(3): x1+a13(3)x3+...+a1n(3)xn=b1(2); x2+a23(3)x3+...+a2n(3)xn=b2(2); ...; an3(3)x3+...+ann(3)xn=bn(2). Po (n-1) eliminacjach otrzymujemy ukł. x1=b1(n); x2=b2(n); ...; xn=bn(n) -a wiec gotowe rozwiązanie. Liczba działań jest tu około półtora raza większa niż dla met. Gaussa. Nie można bowiem dla met. Jordana znaleźć odpowiednika rozkładu A=LU jak dla met. Gaussa. 4.Układy z m.trójdiagonalną. Tx^=d^, T=[b1 c1 0 ... 0 ; a2 b2 c2 0 ... 0 ; 0 a3 b3 c3 0 … 0 ; 0 0 a4 b4 c4 0 … 0 ;…; 0 … 0 an bn]; b1x1+c1x2=d1; aixi-1+bixi+cixi+1=di, i=2,3,…,n-1; anxn-1+bnxn=dn. Ukł. równ. Tx^=d^ można rozwiązać nadzwyczaj szybko, wykon. małą liczbę działań arytm. Zauważmy na wstępie że jeśli można dokonać rozkładu T na iloczyn LU, to macierze L i U mają specyficzną postać: L=[1 0 ... 0 ; l2 1 0 ... 0 ; 0 l3 1 0 ... 0 ;...; 0 ... 0 ln 1]; U=[u1 c1 0 ... 0 ; 0 u2 c2 0 ... 0 ; 0 0 u3 c3 0 ... 0 ; 0 ... 0 un cn] Elementy l2,…,ln oraz u1,...,un można obl. rekurencyjnie z wzorów u1=b1, li=ai/ui-1, ui=bi-lici-1, dla i=2,3,...,n. Liczba działań wynosi M=2n-2, D=n-1, a liczba zajętych komórek pamięci P=3n-2. Aby znaleźć rozw. ukł. Tx^=d^, czyli LUx^=d^, należy rozw. kolejno 2 ukł. Lx^=d^ oraz Ux^=d^ według wzorów y1=d1, yi=di-liyi-1 (i=2,3,...,n) oraz xn=yn/un, xi=(yi-cixi+1)/ui dla i=n-1, n-2, ...,1. Łącznie należy wykonać dodatkowo M=3n-2, D=2n-2 działań. J. m. T jest diagonalnie dominująca kolumnowo |b1|≥|a2|, |bi|≥|ci-1|+|ai+1| dla i=2,3,...,n-1 |bn|≥|cn-1|, to rozkład T=LU jest równoważny wersji rozkładu z częściowym wyborem elementu podst., która jest niezawodna. Ponadto elementy m. L spełniają warunek |li|≤1 i=2,...,n co poprawia oszacowanie błędów zaokrągleń. J. T jest diagonalnie dominująca |bi|≥|ci|, |bi|≥|ai|+|ci|, i=2,...,n |bn|≥|an|, to met elimin. Gaussa też jest niezawodna, ale stosujemy inną wersję rozkładu T=LU. L=[l1 0 ... 0 ; a2 l2 0 … 0 ; 0 … 0 an ln], U=[1 u1 0 ... 0 ; 0 1 u2 0 … 0 ; 0 … 0 1]; l1=b1; y1=d1/l; ui=ci/li; li=bi+1-uiai+1; yi+1=(di+1-ai+1yi)/li; i=1,...,n-1 oraz xn=yn, xi=yi-uixi+1 dla i=n-i,n-2,...,1. 5.Układy z m.symetryczną. Rozkład Banachiewicza (Cholesky'ego) Dla symetrycznych m. dodatnio określonych istn. jeszcze jeden typ rozkł. na iloczyn m. trójkątnych zwany rozkładem Banachiewicza (w wielu publikacjach anglosaskich -Cholesky'ego) A=L LT (LT=L'). M. L jest m. trójkątną dolną przy czym na digonali mogą być elem. nieskończenie=1. Pon. m. L*(sprzężone)=-L też spełnia warunek A=(L LT)* dla A=L LT, więc rozkład taki nie jest jednoznaczny. J. jednak założyć że liczby na diagonali m. L są dodatnie to otrzymujemy jednoznaczne wzory obliczeniowe w sposób następujący. Obliczamy kolejno: lii=√(aii-∑[k-1;l-1]lik2), i=1,...,n (5.1) lji=(aji-∑[k=1;i-1](ljk / lik))/lii, j=i+1,...,n Np. Dla m. A=[4 2 2 ; 2 5 3 ; 2 3 6] znajdujemy i=1: l11=√4=2, l21=2/2=1, l31=2/2=1; i=2: l22=√(5-1*1)=2, l32=(3-1)/2=1; i=3: l33=√(6-1*1-1*1)=2, zatem A=[4 2 2 ; 2 5 3 ; 2 3 6]=[2 0 0 ; 1 2 0 ; 1 1 2]*[2 1 1 ; 0 2 1 ; 0 0 2]. Dodatnia określoność A gwarantuje że elem. lii na diagonali są niezerowe a bład wyznaczenia rozkładu A=LLT jest niewielki, zwłaszcza jeśli działanie wykonujemy w zwiększonej precyzji. 6.Obliczanie wyznacznika i odwracanie m. J. zachodzi konieczność obliczenia wyznacznika najlepiej dokonać rozkładu m. A=LU (stosując częściowy wybór elem. podstawowego), a wówczas detA=detLU=detL*detU. Ponieważ elementy na diagonali m. L są=1 (lii=1) więc detL=1 wtedy detA=detLU=detU (6.1). Wyznacznik m. trójk. U=iloczynowi elem. na diagonali i można wyznaczyć go z dużą dokł. wyk. (n-1) mnożeń. detA=detU=u11u22...unn (6.2) Wyznaczanie m. odwrotnej A-1 met. GCW. Rozpatrzymy ukł. równ. {a11x1+a12x2+...+a1nxn=1; a21x1+a22x2+...+a2nxn=0 ;...; an1x1+an2x2+...+annxn=0} (6.3) Oznaczmy rozw. rego ukł. przez x1(1),...,xn(1). Wówczas na podst. wzorów Cramera mamy |A|x1(1)=A11, ..., |A|xn(1)=A1n (6.4) gdzie A1j (j=1,...,n) są dopełnieniami agbraicznymi odpowiednich elem. a1j. J. oznaczymy przez x1(2),...,xn(2) rozw. ukł. (6.3), którego prawe strony są równe 0,1,0...0 to w podobny spos. otrzymamy |A|x1(2)=A21, ..., |A|xn(2)=A2n (6.5) itd. Oznaczając wreszcie przez x1(n),...,xn(n) rozw. ukł., którego prawe strony są równe 0,0,...,0,1 otrzym. |A|x1(n)=An1, ..., |A|xn(n)=Ann (6.6) Utwórzmy obecnie tablicę której kol. są rozw. wskazanych rówm.: [x1(1),...,x1(n) ;x2(1),...,x2(n) ;...;xn(1),...,xn(n)] Ta tablicz przedstawia m. odwrotną A-1 pon A-1=[x1(1),...,x1(n) ;x2(1),...,x2(n) ;...;xn(1),...,xn(n)]=[A11/|A| A21/|A| ... An1/|A| ;...; A1n/|A| A2n/|A| ... Ann/|A|]. Każdy ukł. równ. typu (6.3) rozw. za pom. met. GCW. 7.Met.iteracyjne. Met.iteracji prostej. Niech ukł. równ. lin. będzie dany w post. x1=b11x1+...+b1nxn+g1 ;...; xn=bn1x1+...+bnnxn+gn lub w post. macierzowej (7.1) X=BX+G albo (E-B)X=G. W charakt. pierwszego przybliżenia obieramy dowolny wekt X0 (np. X0=G) i podst. go w prawą str. równości (7.1). Z lewej str. równości otrzymamy pewien wektor X1=BX0+G. Postępując z X1 tak samo jak z X0 otrzym. wekt. X2. Powtarzając to postępow. otrzym. ciąg wektorów Xm+1=BXm+G (7.2). Oczywiście że jeśli przy (m=0,1,...) m→∞ mamy że Xm→X to wekt. X będzie rozw. równ. (7.1). Dla zbieżności tego procesu konieczne jest żeby m. B była mała w tym lub innym sensie, tj. żeby w m. (E-B) elem. wyst. na gł. diagonali przewyższały pozostałe elem. i były zbliżone do jedności. TW: (o zbieżności met. iteracji prostej). Dla zbieżności met. iteracji prostej przy dowolnym wekt. X0 i przy dowolnej wart. wekt. G wyrazów wolnych potrzeba i wystarcza by wszystkie wart. wł. m. B były co do wart. bezwzgl.<1. Dowód Wychodząc ze wzoru (7.2) możemy wyrazić wekt. Xm przez początkowy wekt. X0. Otrzym.: Xm=BXm-1+G=B(BXm-2+G)+G=B2Xm-2+(B+E)G=B2(BXm-3+G)+(B+E)G=B3Xm-3+(B2+B+E)G=... BmX0+(Bm-1+Bm-2+…+B+E)G. W taki spos. mamy Xm=BmX0+(E+B+B2+...+Bm-1)G (7.3). Stąd od razu wynika że dla istn. lim[m→∞]Xm przy dowolnym wekt. G i dowolnym X0 wystarczy żeby szereg E+B+B2+...+Bm-1+... (7.4) był zbieżny. Warunkiem koniecznym i dostat. zbieżności szeregu (7.4) jest to by wszystkie wart. własne λi m. B były co do wart. |λi|<1. Tym samym tw. zostało udowodnione. Sprawdzenie spełnienia warunków tw. z reguły jest kłopotliwe dla tego w praktyce bywają bardzo przydatnespecjalne kryteria dostateczne zbieżności, wynikające z następującegi twierdzenia: TW: Dla zbieżności procesu iteracji prostej wystarcza by którakolwiek z norm m. B była<1, ||B||<1. Np. Należy rozw. ukł. {10x1+2x2+x3=10; x1+10x2+2x3=12; x1+x2+10x3=8} Pon. elem. na gł. diagonali |aii|>∑[j=1,i≠j;3]|aij|, i=1,2,3 więc met. iteracji prostej jest zbieżna. Rozwiązując ukł. względem niewiadomych stojących na gł. przek. otrzym.: {x1=-0,2x2-0,1x3+1; x2=-0,1x1-0,2x3+1,2; x3=-0,1x1-0,1x2+0,8} ⇒ B=[0 -0,2 -0,1 ;-0,1 0 -0,2 ;-0,1 -0,1 0] ⇒ ||B||<1 Obliczenia kolejnych przybliżeń Xm wykonujemy na podst. wz. (7.2) Xm=BXm-1+G. Obierając jako pierwsze przybliżenie X0=0 otrzym. nast. wyniki RYS4 Widzimy że met. iteracji prostej w danym przyp. jest dość szybko zbieżna. 8.Met.Seidala różni się od met. iteracji prostej tylko tym że przy obliczaniu k-tej składowej wekt. Xm+1 (m+1)-ego przybliżenia wykorzystujemy obliczone już za pom. ukł. (7.1) k-1 pierwszych składowych tego wekt. tzn. obliczenie kolejnych przybliżeń prowadzimy wg wzorów xi(m+1)=∑[j=1;i-1]bijxj(m+1)+∑[j=1;m]bijxj(m)+Gi (8.1) TW: J. pierwsza norma m. B ||B||1=max[i]∑[j=1;n]|bij|=ν<1 to met. Seidla jest zbieżna. 9.Met.Jacobiego. Niech m. A ukł. równ. Ax=b będzie taką m. że można ją rozłożyć na składniki A=L+D+U gdzie L jest m. poddiagomalną, D -m. diagonalną, U -m. naddiagonalną: A=[1 2 3 ; 4 5 6 ; 7 8 9]=(L)[0 0 0 ; 4 0 0 ; 7 8 0]+(D)[1 0 0 ; 0 5 0 ; 0 0 9]+(U)[0 2 3 ; 0 0 6 ; 0 0 0] wówczas Ax=b ⇒ Lx+Dx+Ux=b ⇒ Dx=-(L+U)x+b. Otrzym. wz. iteracyjny Jacobiego Dx(k+1)=-(L+U)x(k)+b (9.1) k=0,1,... Aby móc zast. wz. (9.1) należy tak zmienić kolejność równ. ukł. Ax=b by na diagonali były elem. niezerowe. W przyp. gdy wymiar m. jest duży wprowadzenie takiej zmiany kolejn. równ. jest trudne. Istn. jednak metody automatycznego przestawienia wierszy m. A. Jedna z tych met.: a) spośród kol., w któeych na diagonali znajduje się elem. zerowy, wybieramy tę, w której jest największa liczba 0; b) w kol. tej wybieramy elem. o maks. module i tak przestawiamy wiersze by wybrany elem. znalazł się na diagonali: wiersz ten ustalamy i omijamy go w dalszym badaniu wartości elem. c) spośród pozostałych kol., w których na diagonali znajduje się elem. zerowy wybieramy tem, której jest największa l. 0; d) dokonując kolejnych przestawień wierszy doprowadzamy ostatecznie wyjściową m. do takiej postaci m., w której na diagonali są elem. ≠0. Met. Jacobiego jest niezawodna. Przybliżone rozw. równań nieliniowych i ich układów. 1.Jedno równanie z jedną niewidomą. Jak wiadomo nie każde równanie można rozwiązać dokładnie. Nie można podać metody na rozwiązanie dowolnego równania algebraicznego stopnia wyższego niż czwarty. Dokładne rozw. równ. nie zawsze jest też konieczne pon. w równaniach często mamy jedynie przybliżone wart. współczyn. i zadanie dokładnego wyznaczenia pierwiastków traci sens. Rozpatrzymy zadanie przybliżonego obliczania pierwiastków rzeczywistych równania f(x)=0. Gdy f(x) jest ciągła na pewnym przedziale (skończonym lub nieskończonym). Większość met. przybliżonego rozw. równań polega na poprawianiu kolejnych przybliżonego pierwiastków. Ponadto większość met. można stos. jedynie wtedy, gdy znamy przedział, w którym znajduje się pojedynczy pierwiastek. O takim przedziale mówi się, że jest przedziałem izolacji pierwiastka. Dla wyznaczenia przedziałów izolacji można wykorzystać wykres f. y=f(x), albo j. jest to trudne, równanie wyjściowe f(x)=0 należy przekształcić do równoważnej mu postaci φ(x)=ψ(x) gdzie wykresy y1=φ(x) i y2=ψ(x) są prostsze do wykonania. Odcięte punktów przecięcia tych wykresów będą pierwiastkami równoważnego równania. J. f. f(x) jest wielomianem algebraicznym to istn. metody analitycznego izolowania pierwiastków. Będziemy zakładali że f(x) jest klasy C2 (f(x)ЄC2) a także będziemy przyjmować dodatkowe warunki na jej pierwszą f'(x) i jej drugą f''(x) pochodną. Mamy do czynienia z 3 źródłami błędów uzyskiwanych przybliżeń: 1)błąd przybliżenia wynikający ze stosowanej met. 2)wpływ błędów współczyn. równania 3)dokładność obliczeń przybliżonych 1.1 Metoda połowienia. Mamy dane równania f(x)=0 (1) przy czym f(x) jest ciągła na przedziale domkniętym [a;b] wewnątrz którego znajduje się dokł. jeden pierwiastek i na którego końcach wartości f(a) i f(b) mają przeciwne znaki ⇒ f(a)f(b)<0. Aby znaleźć pierwiastek dzielimy przedział [a;b] na połowy punktem x1=(a+b)/2. J. f(x1)=0, to x1 jest szukanym pierwiastkiem a jak f(x1)≠0 to z otrzymanych dwóch przedziałów [a;x1] i [x1;b] wybieramy ten na końcach którego f(x) ma przeciwne znaki. Z kolei ten przedział dzielimy na 2 połowy, ponownie badamy wartość f(x2) i znaki f(x) na końcach otrzymanych przedziałów itd. W wyniku takiego postępow. po pewnej ilości kroków albo otrzymamy pierwiastek dokładny f(xn)=0 albo ciąg przedziałów takich że f(xi)f(xi+1)<0 (2)przy czym xi oraz xi+1 są odpowiednio początkiem i końcem i-tego przedziału a jego długość |xi=xi+1|=(b-a)/2i (3). Pon. lewe końce ciągu przedziałów tworzą ciąg niemalejący i ograniczony z góry, a prawe końce ciąg nierosnący i ograniczony z dołu więc z (3) wynika że istnieje ich wspólna granica lim[x→∞]|xi-xi+1|=lim[x→∞](b-a)/2i=0 ⇒ lim[x→∞]xi=lim[x→∞]xi+1=ξ pierwiastek α. Ten spos. znajdowania pierw. naz. met. połowienia także met. równego podziału albo met. bisekcji. Np. Znaleźć pierwiastek x3+x2-3x-3=0 położony w przedziale [1,2]. Mamy f(x)=x3+x2-3x-3 zatem f(1)=-4 i f(2)=3 i f(1)f(2)<0. Pon. pochodna f'(x)=3x2+2x-3>0 na [1,2] więc jest to przedział izolacji pierwiastka. Postępując zgodnie z met. połow. obliczamy kolejne przybliżenia są zestawione w tablicy RYS.5 Schemat blokowy: RYS.6 Zmienne A i B określają końce przedziału w każdej z kolejnych iteracji: YA i YB są to wart. f. y=f(x) odpowiednio w tych punktach a zmienna EPS to przyjęta dokładność z jaką chcemy obliczyć pierwiastek. Gdy długość przedziału w danej iteracji (B-A) jest mniejsza od EPS następuje przerwanie procedury. Oczywiście to założone EPS powinno być większe od maksymalnej granicznej dokładności obliczeń, w przeciwnym razie gdy EPS będzie mniejsze możemy otrzymać wynik jedynie z maksymalną graniczną dokładnością. 2.Reguła falsi. Nazwa metody pochodzi od łacińskich słów: regula - linia i falsus - fałszywy; jest to zatem met. fałszywego założenia liniowości f.. Przyjmijmy że w przedziale [a;b] ma dokładnie jeden pierwiastek i że f(a)f(b)<0. Ponadto niech f(x)ЄC2 i f'(x), f''(x) mają stały znak na [a;b]. Wobec tych założeń wykres f. y=f(x) może być tylko jednym z czterech rodzajów: RYS.7 Rozpatrzymy przypadek gdy na [a;b] pochodne f'(x)>0 i f''(x)>0. Dla pozostałych przypadków rozumowanie jest analogiczne. Przez punkty A(a,f(a)) i B(b,f(b)) prowadzimy cięciwę o równaniu y-a=[(f(a)-f(b))/(b-a)](x-a) (4). Odciętą X, punktu w którym cięciwa AB przecina oś OX przyjmujemy za pierwsze przybliżenie szukanego pierw. Stąd pon. y(x1)=0 mamy x1=a-[f(a)/(f(b)-f(a))](b-a) (5). J. f(x1)=0 to oczywiście x1 jest pierw. α i zadanie zostało zakończone. Załóżmy że f(x1)≠0. Przez punkt C(x1,f(x1)) oraz ten z punktów A, B którego rzędna ma przeciwny znak niż f(x1) prowadzimy następną cięciwę (rys.7(5)). Odcięta x2 punktu w którym ta cięciwa przetnie oś OX da nam drugie przybliżenie pierw. α. Dla f'(x)>0, f''(x)>0 w kolejnych przybliżeniach punktu B pozostaje nieruchomy. (Gdy f'(x)>0 i f''(x)<0 (rys.7(4)) wówczas nieruchomy byłby punkt A). J. przybliżenie x2 jest nadal niewystarczające to przez punkty B i D(x2,f(x2)) prowadzimy trzecią cięciwę co daje nam trzecie przybliżenie x3 itd. Otrzymujemy kolejne wyrazy ciągu x1,x2,...,xn,... (6) określonego wzorem rekurencyjnym: x0=a, xk+1=xk-[f(xk)/(f(b)-f(xk))](b-xk) (7) k=1,2,...,n. Można wykazać że przy przyjętych założeniach ciąg (6) {xi} jest rosnący i ograniczony a więc zbieżny i jego granica jest szukanym pierw. α. Przy nieruchomym punkcie B, kolejne wyrazy ciągu {xi} są mniejsze od α oraz f(xi)<0 dla każdego i. Przechodząc do granicy dla n→∞ z równości (7) otrzymujemy g=g-[f(g)/(f(b)-f(g))](b-g) przy czym g=lim[g→∞]xn (a<g<b). Stąd f(g)=0 i g≡α. 3.Metoda Newtona. Załóżmy że αЄ[a;b], f(a)f(b)<0 oraz f'(x), f''(x) mają stały znak na [a;b]. W met. Newtona zwanej też met. stycznych z tego końca przedziału [a;b] w którym f(x) ma ten sam znak co f''(x) prowadzimy styczną do wykresy f. y=f(x) i punkt x1, w którym ta styczna przecina oś OX przyjmujemy za pierwsze przybliżenie pierwiastka α. RYS.8 Oczywiście f(x1) ma ten sam znak co rzędna punktu z którego końca wyprowadzona była styczna. J. otrzymane przybliżenie jest za mało dokładne to z punktu o współrzędnych (x1,f(x1)) prowadzimy następną styczną. Punkty x2 przecięcia tej stycznej z osią OX jest drugim przybliżeniem. W ten sposób otrzymujemy kolejne wyrazy ciągu przybliżeń x1, x2, ..., xn... Zbieżnego monotonicznie do α. Na rys.8(6) pokazano interpretację met. Newtona dla przyp. gdy zarówno f'(x)>0 i f''(x)>0. Styczną prowadzimy z punktu B0. Jej równanie ma postać: y-f(b)=f'(b)(x-b). Przyjmując y=0 otrzymamy x1=b-f(b)/f'(b) (8). Z tw. Lagrange'a mamy f(x1)-f(α)=f'(c1)(x1-α), przy czym c1Є(α,x1). Pon. f(α)=0 i f'(c1)>0, więc f(x1)>0, a stąd wynika że styczna poprowadzona w punkcie B1(x1,f(x1)) będzie miała identyczne własności co styczna w punkcie B0. Z równości drugiej stycznej y-f(x1)=f'(x1)(x-x1) otrzymamy przy x=x2, y(x2)=0 x2=x1-f(x1)/f'(x1) (9). Ogólnie równanie stycznej w punkcie Bn(xn,f(xn)), n=0,1,2,... ma postać y-f(xn)=f'(xn)(x-xn) co pozwala na podanie wzoru rekurencyjnego kolejne wyrazy ciągu przybliżeń: xn+1=xn=f(xn)/f'(xn) (10). Ciąg {xn} jest ciągiem malejącym (xn+1<xn) ograniczonym z dołu (α<xn) a więc zbieżnym. Przechodząc do granicy w (10) dla n→∞ mamy g=g-f(g)/f'(g) czyli f(g)=0, a więc g=α. Przy rozwiązyw. równ. met. stycznych (Newtona) wygodnie jest skorzystać z TW: J. mamy przedział [a;b] taki że: 1)f(a) i f(b) mają przeciwne znaki; 2)f''(x) jest ciągła i nie zmienia znaku na [a;b]; 3)styczne do krzywej y=f(x) poprowadzono w punktach o odciętych a i b przecinają oś OX wewn. przedziału [a;b], wówczas równanie f(x)=0 ma dokładnie jeden pierw. α w przedziale [a;b] i met. Newtona jest zbieżna do α dla dowolnego punktu startowego x0Є[a;b]. Znanym przykł. zast. met. Newtona jest algorytm obliczania pierw. kwadratowego x2-c=0. Mamy tutaj f(x)=x2-c i f'(x)=2x, zatem na podst. wzoru (10) xn+1=xn-(xn2-c)/2xn (xn≠0) i po uproszczeniu otrzymamy xn+1=½(xn+c/xn) (11). Wszystkie założenia powyższego tw. są spełnione na przedziale 0<a<c½ i b>½(a+c/a). Dotychczasowe rozważania prowadziliśmy przy założeniu że szukany pierwiastek α jest pojedynczy. Omówimy teraz pokrótce metodę w przypadku gdy α jest pierw. wielokrotnym. DEF. Liczbę α naz. r-krotnym (r≥2) pierw. równania f(x)=0 jest (r-1)-krotnym pierw. równania f'(x)=0. J. α jest pierw. o parzystej krotności to met. połowienia traci sens, natomiast dla krotności nieparzystej (r≥3) gdy f(a)b(b)<0 pozostaje słuszna. Podobnie przedstawia się sprawa dla met. regula falsi oraz met. siecznych, przy czym dla tej ostatniej obniża się rząd metody. Met. Newtona pozwala na znalezienie pierwiastka zarówno o nieparzystej jak i o parzystej krotności, jeżeli tylko istnieje pewne lewo lub prawo stronne sąsiedztwo szukanego pierw. o stałym znaku f'(x) i f''(x). W przyp. wielokrotności jednym ze spos. modyfikacji metody Newtona jest przekształcenie zależności (10) do postaci xn+1=xn-rf(xn)/f'(xn) (12) gdzie r jest krotnością pierw. (znana a priori). Ponieważ na ogół krotność nie jest znana, często we wzorach (7), (10) stosuje się podstawienie: zamiast f. f(x) wprowadza się f. U(x)=f(x)/f'(x). Równanie U(x)=0 ma identyczne pierwiastki jak równanie f(x)=0, ale wszystkie te pierwiastki są pojedyncze. Wzór (10) przyjmuje wtedy postać xn+1=xn-U(xn)/U'(xn), gdzie U'(xn)=1-f''(xn)U(xn)/f(xn) (13). 4.Metoda siecznych. Metodę regiła falsi można znacznie ulepszyć, j. zrezygnujemy z żądania, aby f(x) miała w punktach wytyczających następna cięciwę różne znaki, natomiast do wyznaczenia (n+1)-ego przybliżenia będziemy korzystali zawsze z punktów xn i xn-1. Mamy wówczas xn+1=xn-f(xn)(xn-xn-1)/f(xn)-f(xn-1) (14) Ta metoda (14) naz. się met. siecznych. Jej zbieżność jest znacznie szybsza; niestety zdarzają się przypadki, gdy może ona nie być zbieżna, gdy początkowe przybliżenia nie leżą dostatecznie blisko pierwiastka. Przy stosowaniu met. siecznych jest niezbędne aby pierwsza iteracja zaczynała się od punktów, w których f. ma różne znaki, w przeciwnym razie możemy wykryć nieistniejący pierwiastek RYS.16, co jest szczególnie niebezpieczne przy obliczeniach na maszynach cyfrowych. W met. siecznych istotne znaczenie ma maksymalna graniczna dokładność wynikająca z przyjętej arytmetyki. Gdy bowiem różnica xn+1-xn jest tego samego rzędu co oszacowanie błędu następne przybliżenie może już być całkowicie błędne. Dlatego też za dodatkowe kryterium przerwania iteracji należy przyjmować wartości |f(xn)|, tak aby tworzyły one ciąg malejący (w końcowej fazie obliczeń). Program obliczeniowy powinien także zapewniać możliwość przerwania iteracji, j. różnica między kolejnymi przybliżeniami zamiast maleć zaczyna wzrastać. Wtedy powtórna lokalizacja pierwiastka
Układy równań nieliniowych Metoda Newtona - Raphsona Rozważmy układ równań (X^(P+1)=X^(P)-[f^']-1f^) {f1(x1, x2, ...,xn)=0; f2(x1, x2, ...,xn)=0; ...; fn(x1, x2, ...,xn)=0} (1) albo f^(x^)=0 (2) gdzie x^=[x1 x2 ... xn]T, f^=[f1 f2 ... fn]T Niech mamy P-ξ przybliżenie x^(P)=(x1(P), x2(P), ..., xn(P))T w pewnym otoczeniu K(α^,r^) punktu α w którym f(α^)=0 wtedy dokładnie pierwiastek można przedstawić w postaci x^=x^(P)+ξ^(P) (2) gdzie ξ^(P)=(ξ1(P), ξ2(P), ...,ξn(P))T -błąd pierwiastka f(x^(P)+ξ^(P))=0 (3) Niech f. f^(x^) będzie różniczkowalna w otoczeniu K(α^,r^). Załóżmy, że pochodna f^'(x^) jest ciągła w punkcie α^, a pochodna f^'(α) jest nieosobliwa. Więc punkt α jest punktem przyciągania metody iteracyjnej. Interoplacja 1.1 Sformułowanie zagadnienia interpolacji. Na przedziale [a;b] danych jest n+1 różnych punktów x0, x1, ...,xn -które naz. węzłami interpolacji, oraz wartości pewnej f. y=f(x) w tych punktach f(x0)=y0, f(x1)=y1, ..., f(xn)=yn RYS.9 Zadaniem interpolacji (1.1) jest wyznaczenie przybliżonych wartości f. w punktach nie będących węzłami oraz oszacowanie błędu tych przybliżonych wartości. W tym celu należy znaleźć f. F(x) zwaną f. interpolującą, która w węzłach interpolacji przyjmuje takie same wart. co f. y=f(x). Można powiedzieć, że interpolacja jest w pewnym sensie zadaniem odwrotnym do tablicowania f.. Przy tablicowaniu f. budujemy tablicę wart., przy interpolacji natomiast na podstawę tablicy wartości f. określamy jej postać analityczną. F. interpolującej poszukuje się najczęściej jako f. pewnej określonej postaci. Mogą to być wielomiany algebraiczne, wielom. trygonometryczne, funkcje sklejane (splajny) itp. Zależnie od postaci f. interpolującej sformułowane powyżej zagadnienie interpolacyjne może mieć rozwiązania lub mieć nieskończenie wiele rozwiązań. Jest bardzo ważne aby istn. jedna f. interpolująca. Wzory interpolacyjne są punktem wyjścia do wyprowadzenia wielu metod stosowanych w innych działach metod numerycznych np. do różniczkowania numerycznego, kwadratur czy numerycznego rozwiązywania równań różniczkowych. 1.2 Interpolacja za pomocą wielomianów. Poszukamy wielomianu Wn(x) stopnia co najwyżej n, spełniającego warunki (1.1) f(xi)=yi (i=0,1,...,n) TW: Istn. dokł. jeden wielom. stopnia co najwyżej n≥0 który w punktach x0, x1, ..., xn przyjmuje wartości y0, y1, ..., yn. Dowód: Przyjmijmy że węzły interpolacji są rozmieszczone w zupełnie dowolny sposób w przedziale [a;b]. Mamy dane n+1 węzłów, w których są znane wartości pewnej f. y=f(x). Szukany wielomian zapisujemy w postaci Wn(x)=a0+a1x+...+anxn korzystając z warunków (1.1) f(xi)=yi otrzymujemy układ (n+1) równań z (n+1) niewiadomymi współczynnikami a0, a1, ..., an. ∑[k=0;n]akxik=yi, i=0,1,...,n (1.3) M. współcz. tego ukł. ma postać A=[1 x0 x02 ... x0n; 1 x1 x12 ... x1n; ...; 1 xn xn2 ... xnn] (1.4) Wyznacznik D=|A|=detA jest wyznacznikiem Vandermonde'a więc przy xi≠xj (i≠j) zawsze D=II(xi-xj)≠0 (1.5) 0≤j<i≤n. Zatem ukł. (1.3) ma dokł. jedno rozw., a wartości ak wg tw. Cramera są określone wzorem ak=1/D∑[j=0;n]ykDkj (1.6) gdzie Dkj (j=0,1,...,n) są kolejnymi dopełnieniami algebraicznymi elementów k-tej kol. m. A. 1.2.1 Wzór interpolacyjny Lagrange'a Podstawiając (1.6) do (1.2) i grupując razem te składniki, w których wyst. jednakowe yk otrzymujemy Wn(x)=y0Φ0(x)+y1Φ1(x)+...+ynΦn(x) (1.8) gdzie funkcje Φi(x) są wielomianami stopnia co najwyżej n. Jak poprzednio zakładamy że węzły są rozmieszczone w dowolnych sposób. Poszukujemy wielomianu Wn(x) stopnia co najwyżej n określonego równaniem (1.8). Dla każdego i=0,1,2,...,n zachodzi zależność Wn(xi)=y0Φ0(xi)+y1Φ1(xi)+...+ynΦn(xi) stąd wynika że Φn(xi)={0, gdy i≠j ; 1, gdy j=i} (1.9). Aby określić f. Φj(x) należy znaleźć wielomian stopnia n, który w punktach x0, ..., xj-1, xj+1, ..., xn jest tożsamościowo=0, a w punkcie xj=1. Stąd Φj(x)=λ(x-x0) ...(x-xj-1)(x-xj+1) ...(x-xn) (1.11) a pon. Φj(xj)=1 to 1=λ(xj-x0) ...(xj-xj-1)(xj-xj+1) ...(xj-xn) (1.12). Po wygórowaniu stałej λ ze wzorów (1.11) - (1.12) otrzymujemy Φj(x)=(x-x0) ...(x-xj-1)(x-xj+1) ...(x-xn) / (xj-x0) ...(xj-xj-1)(xj-xj+1) ...(xj-xn) (1.13) Zatem Wn(x)=y0 (x-x1)...(x-xn) / (x0-x1)...(x0-xn)+y1 (x-x0)(x-x2)...(x-xn) / (x1-x0)(x1-x2)...(x1-xn)+...+yn (x-x0)...(x-xn-1) / (xn-x0)...(x0-xn-1)=∑[j=0;n]yj (x-x0) ...(x-xj-1)(x-xj+1) ...(x-xn) / (xj-x0) ...(xj-xj-1)(xj-xj+1) ...(xj-xn) (1.14) Przyjmując oznaczenie Wn(x)=(x-x0)...(x-xn) możemy (1.14) zapisać w postaci Wn(x)=∑[j=0;n]yjWn(x)/(x-xj)Wn'(xj) (1.1.6) gdzie yj=y(xj), a Wn'(xj) jest wartością pochodnej wielomianu Wn(x) w punkcie xj (będącym zerem tego wielomianu) co można łatwo pokazać rozpatrując wzór Taylora w otoczeniu punktu xj. Otrzymamy wielomian spełniający wszystkie warunki wymagane przy interpolacji. Wzór (1.14) nazywamy wzorem nterpolacyjnym Lagrange'a. Np.: Znaleźć wielomian interpolacyjny który w punktach -2, 1, 2, 4 przyjmuje wartości 3, 1,-3, 8. Stosujemy wzór interpolacyjny Lagrange'a (1.14) dla n=3 Mamy W3(x)=3(x-1)(x-2)(x-4) / (-2-1)(-2-2)(-2-4)+1(x+2)(x-2)(x-4) / (1+2)(1-2)(1-4) - 3(x+2)(x-1)(x-4) / (2+2)(2-1)(2-4)+8(x+2)(x-2)(x-2) / (4+2)(4-1)(4-2)=2x3/3 - 3x2/2 - 25x/6+6. 1.2.2. Oszacowanie błędu wzoru interpolacyjnego. Powstaje pytanie z jaką dokładnością wielomian Lagrange'a przybliża f. f(x) w pozostałych punktach x≠xi, xЄ[a;b] czyli określenie wielkości błędu ξ(x)=f(x)-Wn(x)=? (1.17). Niech f(x) ma pochodne rzędu n+1 włącznie. Wprowadzamy f. pomocniczą Ψ(u)=f(u)-Wn(u)+K(u-x0)(u-x1) ...(u-xn) (1.18) w której K jest pewną stałą .Oczywiście Ψ(x0)=Ψ(x1)=...=Ψ(xn)=0. Współczynnik K dobieramy w taki spos. aby pierwiastkiem f. Ψ(u) był również punkt x--, różny od węzłów interpolacji. Stąd K=f(x--)-Wn(x--) / (x---x0)...(x---xn)=f(x--)-Wn(x--)/Wn(x--) (1.19) Mianownik (1.19) jest ≠0 dla każdego x--≠xi (x0<x1<...<xi<xn). F. Ψ(u) ma więc n+2 miejsc zerowych w przedziale [a;b], w punktach xo, x1, ..., xn, x--. Na podstawie tw. Rolle'a możemy stwierdzić, że pochodna Ψ'(u) ma co najmniej jedno miejsce zerowe w każdym z przedziałów których końcami są miejsca zerowe f. Ψ(u), a zatem wewnątrz przedziału o końcach min(x;x0), max(x;xn) ma co najmniej n+1miejsc zerowych: ζ0(1), ζ1(1), ..., ζn(1). Stosując ponownie tw. Rolle'a do pochodnej Ψ'(u), stwierdzamy że istn. con. n punktów ζ0(2), ζ1(2), ..., ζn-1(2) takich że Ψ''(ζ0(2))=...=Ψ''(ζn-1(2))=0 (1.20). Kontynuując to rozumowanie dochodzimy do wniosku że istn. con. jeden taki punkt w przedziale (min(x;x0); max(x;xn)) że Ψ(n+1)(ζ)=0 (1.21) Ponieważ Wnn+1(x)=0, (1.22) Wnn+1(x)=(n+1)!. Więc Ψ(n+1)(u)=f(n+1)(u)-K(n+1)! (1.23). Z (1.2.1) dla u=ζ otrzymujemy K=f(n+1)(ζ)/(n+1)! Stąd f(x)-Wn(x)=f(n+1)(ζ)Wn(x) / (n+1)! (1.24) J. kres górny Mn+1=max[xЄ[a;b]]|f(n+1)(x)|, to (1.25) |f(x)-Wn(x)|≤Mn+1|Wn(x)| / (n+1)! (1.26). Wyrażenie (1.26) może służyć do oszacowania błędu bezwzględnego wzoru interpolacyjnego. W4(x)=1+1(x-0)-2/3(x-0)+2/3(x-0)(x-2)(x-3)-2/9(x-0)(x-2)(x-3)(x-4)=-2x4/9+8x3/3-88x2/9+35x/3+1. J. tylko możma oszacować wartość fn+1(ζ). Np.: Z jaką dokładnością można obliczyć wartość sin(π/36) stosując wzór interpolacyjny Lagrange'a, j. dane są wartości sin0, sin(π/6), sin(π/4) i sin(π/3). Mamy f(x)=sinx, n=3, a=0, b=π/3, f(4)(x)=sinx, M4=√3/2|sin(π/36)-W4(π/36)|≤√3/(2*4!)|(π/36-0)(π/36-π/4)(π/36-π3)|≈9*10-4 1.2.3.Wzór interpolacyjny Newtona dla nierównych odstępów argumentu. Przyjmijmy, że f. f(x) jest określona za pom. wielom. algebraicznych. Do tego celu niezbędne jest wprowadzenie pojęcia ilorazów różnicowych. Wyrażenia f(x0,x1)=[f(x1)-f(x0)]/(x1-x0); f(x1,x2)=[f(x2)-f(x1)]/(x2-x1); f(xn-1,xn)=[f(xn)-f(xn-1)]/(xn-xn-1) nazywamy ilorazami różnicowymi pierwszego rzędu. Analogicznie definiujemy ilorazy różnicowe rzędu drugiego f(x0,x1,x2)=[f(x1,x2)-f(x0,x1)]/(x2-x0); f(xn-2,xn-1,xn)=[f(xn-1,xn)-f(xn-2,xn-1)]/(xn-xn-2). Ogólnie iloraz różnicowy rzędu n tworzymy z ilorazu różnicowego rzędu n-1 za pomocą wzoru rekurencyjnego f(xi, xi+1, ..., xi+n)=[f(xi+1, ..., xi+n)-f(xi, ..., x1+n-1)]/(xi+n-xi) dla n=1,2,... oraz i=0,1,... Z ilorazów różnicowych tworzy się zazwyczaj tablicę
Ilorazy różnicowe |
||||||
xi |
f(xi) |
rzędu 1 |
rzędu 2 |
rzędu 3 |
rzędu 4 |
rzędu 5 |
x0 x1 x2 x3 x4 x5 |
f(x0) f(x1) f(x2) f(x3) f(x4) f(x5) |
f(x0,x1) f(x1,x2) f(x2,x3) f(x3,x4) f(x4,x5) |
f(x0,x1,x2) f(x1,x2,x3) f(x2,x3,x4) f(x3,x4,x5) |
f(x0,x1,x2,x3) f(x1,x2,x3,x4) f(x2,x3,x4,x5) |
f(x0,x1,x2,x3,x4) f(x1,x2,x3,x4,x5) |
f(x0,x1,x2,x3,x4,x5) |
Załóżmy, że f. f(x) jest okr. tablicą wartości (x0,f(x0)), (x1,f(x1)), ..., (xn,f(xn)), gdzie x0,...,xn są węzłami interpolacji. Niech Wn(x) będzie wielom. interpolac. Wn(xi)=f(xi), I=0,1,…,n Wn(x)=W0(x)+[W1(x)-W0(x)]+[W2(x)-W1(x)]+...+[Wn(x)-Wn-1(x)] (1.27). Oczywiście różnica Wk(x)-Wk-1(x) jest wielom., który można przedstawić w postaci Wk(x)-Wk-1(x)=A(xk-x0)(xk-x1)...(xk-xk-1) a ponieważ Wk(xk)=f(xk), więc A=[f(xk)/(xk-x0)...(xk-xk-1)]-[(∑[i=0;k-1]f(xi)Wk-1(xk)/(xk-xi)Wk-1'(xi))/(xk-x0)...(xk-xk-1)] (1.28) ⇒ A=f(xk)/Wk-1(xk)+∑[i=0;k-1]f(xi)/(xk-xi)Wk-1'(xi)=∑[i=0;k-1]f(xi)/Wk(xi) (1.29). Z (1.27) i (1.29) mamy Wk(x)-Wk-1(x)=(∑[i=0;k-1]f(xi)/Wk(xi))Wk-1(x) (1.30). Można udowodnić zależność dotyczącą ilorazu rzędu n (met. indukcji) f(xi, xi+1, ..., xi+n)=f(xi)/(xi-xi+1)...(xi-xn+i)+f(xi+1)/(xi+1-xi)...(xi+1-xi+n)+...+f(xi+n)/(xi+n-xi)...(xi+n-xi+n) (1.31). Przy i=0 z (1.31) mamy f(x0,x1,...,xn)=∑[j=0;j=n]f(xj)/(xj-x0)...(xj-xj-1)(xj-xj+1)...(xj-xn) dla n=1,2,... i stąd Wn(x)=f(x0)+f(x0,x1)W0(x)+f(x0,x1,x2)W1(x)+...+f(x0,x1,...,xn)Wn-1(x) (1.32). Wzór interpolacyjny (1.32) nosi nazwę wzoru interpolacyjnego Newtona dla nierównych odstępów argumentów albo wzoru interpolacyjnego Newtona z ilorazami różnicowymi. Np.: Napisać wzór interpolacyjny dla f(x) okereślony tablicą wartości f(0)=1, f(2)=3, f(3)=2, f(4)=5, f(6)=7
xi |
f(xi) |
1 |
2 |
3 |
4 |
0 2 3 4 6 |
1 3 2 5 7 |
1 -1 3 1 |
-2/3 2 -2/3 |
2/3 -2/3 |
-2/9 |
1.2.5 Różnice progresywne i wsteczne. Obecnie przyjmujemy że wartości argumentów x0, x1, ..., xn (węzły interpolacji) tworzą ciąg arytmetyczny i że przyrost argumentu jest wielkością stałą x1=x0+h, ..., xn=x0+nh. Takie założenie bardzo upraszcza wzory. Różnice progresywne. Niech będą dane wartości f. f(x) w punktach x0, x1, ..., xn. Wyrażenie Δf=f(x+h)=f(x) (1.33) nazywamy różnicą progresywną rzędu pierwszego f. f(x). Podobnie definiujemy różnice progresywne wyższych rzędów Δnf=Δ(Δn-1f), n=2,3,... (1.34). Np.: Δ2f=Δ(Δf)=Δ[f(x+h)-f(x)]=[f(x+2h)-f(x+h)]-[f(x+h)-f(x)]=f(x+2h)-2f(x+h)+f(x). Wzór (1.34) można także zapisać w postaci Δ0f(x)=f(x), Δnf(x)=Δn-1f(x+h)-Δn-1f(x) (1.3.5). Różnicę progresywną dowolnego rzędu f. f można więc przedstawić jako kombinację liniową wartości tej f.. W przypadku wielomianu rzędu n różnica rzędu pierwszego jest wielomianem stopnia n-1. Np.: Obliczyć różnice progresywne wielomianu W4(x)=x4-x-1 przyjmując h=1. Mamy Δw=[(x+1)4-(x+1)-1]-[x4-x-1]=4x3+6x2+4x; Δ2w=[4(x+1)3+6(x+1)2+4(x+1)]=[4x3+6x2+4x]=12x2+24x+14; Δ3w=[12(x+1)2+24(x+1)+14]-[12x2+24x+14]=24x+36; Δ4w=[24(x+1)+36]-[24x+36]=24; Δ5w=0. Jak łatwo wykazać, w przypadku wielomianu n-tego stopnia n-ta różnica progresywna jest stałą i ma postać ΔnWn(x)=n!a0hn=const. Stosując interpolację f. f(x) mamy określoną za pomocą stablicowanych wartości yif(xi) a punkty xi (i=0,1,...,n) są rozmieszczone w równych odstępach. Wówczas Δyi=yi+1-yi; Δ2yi=Δ(Δyi)=Δyi+1-Δyi; Δnyi=Δ(Δn-1yi)=Δn-1yi+1-Δn-1yi (1.36). Można udowodnić (met. Indukcji) że Δnyi=(n0)yi+n-(n1)yi+n-1+(n2)yi+n-2-...-(-1)n(nn-1)yi+1+(-1)n(nn)yi albo Δnyi=∑[j=0;n](-1)j(nj)yi+n-j (1.37). Analogicznie dowodzi się że każdą wart. yk (k=1,2,...,n) można obliczyć za pom. różnic Δy0, Δ2y0, ..., Δky0 oraz wartości y0: yk=y0+(k1)Δy0+(k2)Δ2y0+...+(kk)Δky0 (1.38). Operator Δ ma wiele własności podobnych do właściwości operatora różniczkowego: Δ(gk±fk)=Δgk±Δfk; Δ(afk)=aΔfkΔm(Δnfk)=Δm+nfk; Δ(fkgk)=fk+1Δgk+gk+1ΔfkΔ fk/gk=(Δfkgk-fkΔgk)/gk+1gk dla gk+1gk≠0 Δc=0 (c-const). Obliczone różnice kolejnych rzędów najwygodniej jest układać w post. trójkątnej tablicy różnic. Np.: y=x3-1, x0=0 z krokiem 1 dla n=5 RYS.10 Różnice wsteczne. Korzystając z przyjętych oznaczeń, pierwszą różnicę wsteczną f. f(x) w punkcie xi określamy jako pierwszą różnicę progresywną tej f. w punkcie xi-1 i oznaczamy ją symbolicznie ∇yi, ∇1yi, ∇f(xi) albo ∇1f(xi). Zatem ∇yi=∇yi-1=f(xi)-f(xi-1) (1.38) i=1,2,...,n. Ogólnie, k-tą różnicę wsteczną f. f(x) w punkcie xi określamy jako różnicę różnic (k-1)-szych w punktach xi oraz xi-1, a więc ∇kyi=∇k-1yi-∇k-1yi-1 (1.39) k=1,2,...,n, i=k,k+1,...,n przy czym ∇0yi=yi. Można bez trudności wykazać, że ∇kyi=∇kyi-k (k=0,1,...,n). Tablica różnic wstecznych jest identyczna z tablicą różnic progresywnych - zmianie ulegają jedynie symbole różnic. Problem, czy korzystać z różnic progresywnych czy z różnic wstecznych jest uzależniony najczęściej od tego, w jakiej części przedziału (x0;xn) chcemy badać f. f(x). J. interesuje nas początek przedziału (otoczenie punktu x0) korzystamy z różnic progresywnych. J. natomiast interesuje nas zachowanie się f. f(x) na otoczeniu końca przedziału to korzystamy z różnic wstecznych i tablicę rozbudowujemy w kierunku malejących wskaźników xi (xn,xn-1,...). W tym drugim przypadku punkty w których jest określona f. f(x) wygodnie jest oznaczać symbolami: x-n, x-n+1, ..., x-1, x0. sposób sporządzanie tablicy różnic wstecznych: RYS.11 1.2.6 Wzory interpolacyjne Newtona dla równoległych wartości argumentu. Niech będą dane wartości f. yi=f(xi), i=0,1,...,n; przy czym punkty xisą rozmieszczone w jednakowych odstępach xi=x0+ih, i=0,1,...,n; h=const. W punkcie (1.2.4) podaliśmy wzór interpolacyjny Newtona przy założeniu dowolnego rozmieszczenia węzłów Wn(x)=f(x0)+f(x0;x)ω0(x)+...+f(x0;...;xn)ωn-1(x) (1.40) gdzie ωk(x)=(x-xo)(x-x1)...(x-xk). W przypadku węzłów równoległych ilorazy różnicowe kolejnych rzędów wynoszą odpowiednio: f(x0)=a0=y0; f(x0;x1)=(y1-y0)/h; f(x0;x1;x2)=[(y2-y1)/h - (y1-y0)/h]/2h=(y2-2y1+y0)/2h2; ...; f(x0;x1;...;xn)=(yn-nyn-1+(n2)yn-2-...+(-1)ny0)/(n!hn) (1.41). korzystając ze wzoru (1.36) na różnice progresywne rzędu n, otrzymujemy a0=y0; a1=Δy0/h; a2=Δ2y0/2h2; ...; ak=Δky0/k!hk (1.42) przy czym 0!=1, Δ0y0=y0. Podstawiając (1.42) do (1.40) otrzymujemy Wn(x)=y0+Δy0(x-x0)/h+Δ2y0(x-x0)(x-x1)/2!h2+...+Δny0(x-x0)(x-x1)...(x-xn-1)/n!hn (1.43). Wzór nosi nazwę pierwszego wzoru interpolacyjnego Newtona. Jest to wielomian stopnia nie większego niż n, a ponad to Wn(xk)=yk. W praktycznych zastosowaniach znacznie łatwiej jest stos. wielomian Newtona, wprowadzając nową zmienna g=(x-x0)/h. Ponieważ (x-x1)/h=[x-(x0+h)]/h=g-1; x-x2/h=[x-(x0+2h)]/h=g-2; (x-xn-1)/h=g-(n-1) więc wzór (1.34) można sprowadzić do postaci Wn(x)=Wn(x0+gh)=y0+gΔy0/1!+g(g-1)Δ2y0/2!+...+g(g-1)...(g-n+1)Δny0/n! (1.44). Wielkość g=(x-x0/h określa liczbę kroków potrzebnych do przejścia od punktu x0 do punktu x. Wzór (1.44) wygodnie jest stos. do interpolacji f. na otoczeniu wartości początkowej x0 (dla g<1). Przechodząc do przedziału x1<x<x2 w którym g>1 wygodniej jest przyjąć za x0 następny węzeł x1. J. posługujemy się trójkątną tablicą różnic, to do wzoru (1.44) wchodzą różnice „schodzące” w dół po odpowiedniej przekątnej. Dlatego też stosownie tego wzoru jest wygodne dla górnej, początkowej części tablicy, gdzie mamy dostateczną liczbę różnic. Wzór (1.44) nazywany jest tu także wzorem Newtona na interpolację w przód. Pierwszy wzór Newtona jest niewygodny do interpolacji w pobliżu końca tablicy. Stosuje się tu inny wzór. Szukamy wielomianu zapis. w postaci Wn(x)=a0+a1(x-xn)+a2(x-xn)(x-xn-1)+...+an(x-xn)(x-xn-1)...(x-x1) (1.45). Współczynniki ai, jak poprzednio, wyznaczamy ze wzorów na ilorazy różnicowe ak=Δkyn-k/k!hk (1.46) i korzystając ze wprowadzonego pojęci różnic wstecznych mamy ak=∇kyn/k!hk (1.47). Podstawiając (1.47) do (1.45) otrzymujemy Wn(x)=yn+Δyn-1(x-xn)/1!h+Δ2yn-2(x-xn)(x-xn-1)/2!h2+...+Δny0(x-xn)...(x-x1)/n!hn (1.48). Wzór (1.48) naz. drugim wzorem Newtona. Wprowadzamy podstawienie x=xn+gh. Wówczas Wn(x)=yn+gΔyn-1+g(g+1)Δ2yn-2/2!+...+g(g+1)(g+2)...(g+n-1)Δny0/n! (1.49). Skorzystajmy teraz ze wzorów (1.47) określających współczynniki ak za pom. różnic wstecznych a ponadto pon. z różnic wstecznych korzystamy wtedy, gdy interesuje nas zachowanie się f. na końcowej części przedziału, zmienimy numerację punktów xi pisząc xi-n zamiast xi (i=0,1,...,n) xi=x0+ih (i=0,-1,...,-n). Wówczas Wn(x)=y0+∇y0(x-x0)/h+∇2y0(x-x0)(x-x-1)/2!h2+...+∇ny0(x-x0)(x-x-1)...(x-x-n+1)/n!hn (1.50). Punktom x-n, x-n+1, ..., x-1, x0 odpowiadają punkty x0, x1, ..., xn. Po podstawieniu do (1.50) g=(x0-x)/h mamy Wn(x)=y0-g∇y0+g(g-1)∇2y0/2-...+(-1)ng(g-1)(g-2)...(g-n+1)∇ny0/h! (1.51). Wzór naz. się często wzorem interpolacyjnym Newtona na interpolację wstecz. 1.2.7 Zbieżność procesów interpolacyjnych. powstaje pytanie, czy przybliżenie polepszy się gdy zwiększymy liczbę węzłów? Intuicyjnie wydaje się oczywiste że j. będziemy mieli większą liczbę zmierzonych wartości f., to można będzie dokładniej opisać matematycznie tę zależność funkcyjną. Nie zawsze jednak tak jest, zwłaszcza wtedy, gdy do opisu matematycznego stos. interpolację. Pogorszenie wyników interpolacji przy zwiększaniu liczby węzłów pokażemy na przykładzie f. y=|x| na przydziale [-1;1]. Znajdziemy wielomiany interpolacyjne i narysujemy ich wykresy dla n=2,4,10. Mamy dla n=2, x0=-1, h=1, W2(x)=x2; dla n=4, x0=-1, h=0,5, W4(x)=-4x4/3+7x2/3; dla n=10, x0=-1, h=0,2, W10(x)=390625x10/5184-1015625x8/6048+221875x6/1728+6835x4/162+11527x2/1792 RYS.12 Na rys. są podane wykresy wielomianów interpolacyjnych. Widać wyraźnie, że początkowo ze wzrostem liczby węzłów przybliżenie polepsza się, lecz przy dalszym wzroście n przybliżenie zaczyna się pogarszać, zwłaszcza przy krańcach przedziału. Wadą f. y=|x| jest fakt że w punkcie x=0 nie ma ona pochodnej. Można jednakże łatwo znaleźć f. nie mającą tej wady, np.: y=1/(1+25x2) w przypadku której mamy do czynienia z tym samym zjawiskiem. Takie zachowanie się wielomianu interpolacyjnego (zwłaszcza przy końcach przedziału) jest zjawiskiem typowym dla interpolacji za pomocą wielomianu wysokich stopni przy stałych odległościach węzłów. Jest to tak zwane zjawisko Kungego - jest ono przykładem źle uwarunkowanego zadania. Interpolacja tego typu na środkowych częściach przedziału [x0;xn] jest natomiast dobra i użyteczna. Również w przypadku interpolowania f., której wykres znacznie różni się od wykresu wielomianu (np. f. x=1/x) interpolacja przy dużej liczbie węzłów daje nie najlepsze wyniki (pojawiają się ekstrema w f. interpolującej). W takich przypadkach lepsze wyniki daje interpolacja przedziałowa (np. wielomianami stopnia drugiego). Problem wyboru odpowiedniego wzoru interpolacyjnego ma szczególne znaczenie przy obliczeniach „ręcznych”, gdy nie możemy zbytnio zagęszczać węzłów. Stos. się wówczas również inne wzory interpolacyjne zawierające różnice położone nad i pod poziomym wierszem, w którym powinna znajdować się podana wartość zmiennej x. Są to tzw. wzory z różnicami centralnymi; zaliczamy do nich wzory: Gaussa, Stirlinga i Bessela, których nie będziemy omawiać. 1.3. Interpolacja za pom. f. sklejanych. 1.3.1 Określenie f. sklejanych. Niech w przedziale [a;b] danych będzie (n+1) punktów x0, x1, ..., xn przy czym a=x0<x1<...<xn=b (1). Punkty xi określają pewien podział przedziału [a;b] na n podprzedziałów. Podział ten oznaczymy Δn. F. S(x)=S(x,Δn) określoną na przedziale [a;b] naz. f. sklejaną stopnia co najwyżej m (m≥1); j.: 1)S(x) jest wiel. stopnia co najwyżej m na każdym podprzedziale (xi;xi+1), i=0,1,...,n-1; 2)S(x)ЄC(m-1)([a;b]). Punkty xi naz. węzłami f. sklejanej. Zbiór wszystkich f. sklejanych stopnia m o węzłach xi oznaczymy Sm(Δn). Niech S(x)ЄSm(Δn). Na każdym przedziale (xi;xi+1), i=0,1,...,n-1 f. S(x) jest wielom. stop. co najw. m S(x)-Cimxm+Cim-1xm-1+...+Ci1x+Ci0 (2) xЄ(xi;xi+1). Mamy więc n(m+1) dowolnych stałych Cij. Żądanie ciągłości pochodnych rzędu 0,1,...,n-1 w każdym wewnętrznym xi, i=1,...,n-1 daje m(n-1) warunków. Tak więc f. S(x) zależy od n(m+1)-m(n-1) parametrów. W obliczeniach na maszynach cyfrowych funkcje bardzo często przybliża się f.mi sklejanymi. Związane jest to z tym, że wartości tych f. są łatwe do wyznaczenia oraz że są one zbieżne dla licznych klas f. (jest to jedna z zalet f. sklejanych w porównaniu z wielomianami). W praktyce często stos. się funkcje sklejane stopnia trzeciego. Dla wielu zagadnień są one wystarczająco gładkie, szybkość ich zbieżności jest wystarczająca a ponadto wyznacza się je stosunkowo łatwo. Postać interpolującej f. sklejanej w dużym stopniu zależy od zagadnienia. Często wygodnie jest przedstawić poszukiwaną f. S(x)ЄSm(Δn) w postaci kombinacji liniowej elementów bazy przestrzeni. Sm(Δn). Wyznaczymy teraz bazę przestrzeni f. S(x) stopnia trzeciego z węzłami równoodległymi xi=x0+ih, h=(b-a)/n, i=0,1,...,n. Oznaczmy dodatkowo przez x-3, x-2, x-1, xn+1, xn+2, xn+3 punkty xi=x0+ih dla i=-3,-2,-1, n+1, n+2, n+3. i określmy f. ϕi3(x), i=-1, 0, 1, ..., n, n+1: ϕi3(x)=1/h3 {(x-xi-2)3 dla xЄ[xi-2;xi-1]; h3+3h2(x-xi-1)+3h(x-xi-1)2-3(x-xi-1)3 dla xЄ[xi-1;xi]; h3+3h2(xi+1-x)+3h(xi+1-x)2-3(xi+1-x)3 dla xЄ[xi;xi+1]; (xi+2-x)3 dla xЄ[xi+1;xi+2]; 0 dla pozostałych xЄR} (3). Funkcje (3) są klasy C2((-∞;+∞)). W tablicy
|
xj-2 |
xj-1 |
xj |
xj+1 |
xj+2 |
ϕj3(x) |
0 |
1 |
4 |
1 |
0 |
(ϕj3(x))' |
0 |
3/h |
0 |
-3/h |
0 |
(ϕj3(x))'' |
0 |
6/h2 |
-12/h2 |
6/h2 |
0 |
podano wartości f. ϕj3(x) oraz jej pierwszej i drugiej pochodnej w punktach xk dla k=j-2, j-1, j, j+1, j+2 (poza przedziałem [xj-2;xj+2] f. ta jest tożsamościowo=0), a na RYS.13 pokazano jej wykres. TW: Funkcje ϕi—(x), i=-1,0,1,...,n+1, określone na przedziale [a;b] w nast. spos. ϕi—(x)=ϕi3(x) (4), a≤x≤b stanowią bazę przestrzeni f. sklejanych trzeciego stopnia S3(Δn). Każdą f. S(x)ЄS3(Δn) można więc przedstawić w postaci kombinacji liniowej S(x)=∑[i=-1;n+1]Ciϕi3(x), a≤x≤b (5) gdzie Ci są liczbami rzeczywistymi. 1.3.2 Interpolacyjne f. sklejane stopnia 3. Niech f(x)ЄC([a;b]). F. S(x)ЄS3(Δn) naz. interpolacyjną f. sklejaną stopnia 3-go dla f. f(x), j. S(xi)=f(xi)=yi (6), i=0,1,...,n; n≥2. Jak wiemy, f. S(x) stopnia 3-go zależy od (n+3) parametrów. Tak więc f. sklejana stopnia 3-go mają dwa stopnie swobody, wobec czego nakładamy na nie dwa dodatkowe warunki. Wybór tych warunków zależy zarówno od własności f(x), jak i od posiadanej info. o tej f.. Najczęściej rozpatrujemy następujące dodatkowe warunki: S'(a+0)=α, S'(b-0)=β (7) lub S''(a+0)=α2, S''(b-0)=β2 (8) gdzie α1, β1, α2, β2 są ustalonymi liczbami. J. f(x) ma pochodne w punktach a, b i są one znane, to możemy je przyjąć jako α1, β1, α2, β2. Na f. S(x) możemy nakładać inne warunki. Np.: j. f(x) jest okresowa, o okresie (b-a), to najczęściej żądamy, aby f. S(x) można było przedłużyć na przedziale (-∞;+∞) w taki spos., że będzie ona f. okresową o okresie (b-a), różniczkowalną w spos. ciągły. W takiej sytuacji na f. sklejaną nakładamy warunki S(i)(a+0)=S(i)(b-0), i=1,2 (9). Omówimy spos. wyznaczania oraz problem istnienia i jednoznaczności interpolacyjnej f. sklejanej dla węzłów dowolnie rozłożonych. Oznaczymy Mj=S''(xj), j=0,1,...,n (10). Zgodnie z określeniem f. sklejanej 3-go stopnia, pochodna S''(x) jest f. ciągłą na przedziale [a;b] i liniowa na każdym podprzedziale [xj-1;xj], można więc przedstawić ją w postaci S''(x)=Mj-1(xj-x)/hj+Mj(x-xj-1)/hj, xЄ[xj-1;xj] (11) hj=xj-xj-1. Całkując stronami (11), otrzymujemy (dla xЄ[xj-1;xj]) S'(x)=-Mj-1(xj-x)2/2hj+Mj(x-xj-1)2/2hj+Aj (12) S(x)=Mj-1(xj-x)3/6hj+Mj(x-xj-1)3/6hj+aj(x-xj-1)+Bj (13) gdzie Aj, Bj są stałymi. Nakładając na (12) i (13) warunki interpolacji S(xj-1)=Mj-1hj2/6+Bj=yj-1; S(xj)=Mjhj2/6+Ajhj+Bj=yj wyznaczamy stałe Aj, Bj. Mamy Bj=yj-1-Mj-1hj2/6, Aj=(yj-yj-1)/hj-hj(Mj-Mj-1)/6 (14). Nałożymy teraz warunek na S(x), aby pochodna S'(x) była f. ciągłą na [a;b]. W tym celu obliczymy granice jednostronne S'(xj-0)=hjMj-1/6+hjMj/3+(yj-yj-1)/hj (15) S'(xj+0)=-hj+1Mj/3-hj+1Mj+1/6+(yj+1-yj)/hj+1 i zażądamy, aby S'(xj-0)=S'(xj+0), j=1,...,n-1. Po podst. (15) do (16) otrzymujemy ukł. (n-1) równań: hjMj-1/6+(hj+hj+1)Mj/3+hj+1Mj+1/6=(yj+1-yj)/hj+1-(yj-yj-1)/hj (17), j=1,...,n-1. Równania te wygodnie jest zapisać w postaci μjMj-1+2Mj+λjMj+1=dj, j=1,...,n-1 (18) gdzie: λj=hj+1/(hj+hj+1), μj=1-λj; dj=[6/(hj+hj+1)][(yj+1-yj)/hj+1-(yj-yj-1)/hj]=6f(xj-1;xj;xj+1). J. Mj, j=0,1,...,n spełniają powyższy ukł. to f. S(x) określona wzorami (13), (14) na każdym podprzedziale [xj-1;xj], j=1,...,n jest interpolacyjną f. sklejaną stopnia 3-go. Do ukł. (18) należy dołączyć jeszcze dwa równania wynikające ze spełnienia przez f. S(x) jednego z dodatkowych warunków (7-9). Równania te mają postać: dla warunków (7) 2M0+M1=d0, Mn-1+2Mn=dn gdzie d0=6/h1[(y1-y0)/h1-α1), dn=6/hn[β1-(yn-yn-1)/hn) (19) dla warunków (8) M0=α2, Mn=β2 (20) dla warunków (9) M0=Mn, λnM1+μnMn-1+2Mn=d~~n gdzie λn=h1/(h1+hn), μn=1-λn, d~~n=[(y1-y0)/h1-(yn-yn-1)/hn]6/(h1+hn) (21). Zapiszemy teraz ukł. równ. (18) i (19) w postaci macierzowej [2 1 0 ... 0; μ1 2 λ1 ... 0; 0 μ2 2 ... 0; ...; 0 ... 2 λn-1; 0 ... 1 2][M0 M1 ... Mn-1 Mn]T=[d1 d2 ... dn-1 dn] (22). We wszystkich trzech przypadkach (19) - (21) m. współczynników układów, które należy rozwiązać są m. silnie dominującymi. stąd wynika, że układy te mają jednoznaczne rozwiązanie, istn. zatem dokł. jedna interpolacyjna f. sklejana stopnia trzeciego, spełniająca jeden z dodatkowych warunków (19), (20), (21). Dla układów z macierzami trójdiagonalnymi silnie, diagonalnie dominującymi są opracowane niezawodne algorytmy ich rozwiązywania, a więc wyznaczanie interpolacyjnych f. sklejanych w przedstawiony powyżej spos. nie nastręcza numerycznych trudności. Zauważmy że j. węzły są równoodległe to λj=μj=½. Aproksymacja 1.Wstęp. W poprzednim rozdziale omówiliśmy zagadnienie interpolacji, czyli poszukiwania pewnej f. interpolującej F(x), która na danym, dyskretnym zbiorze argumentów pokrywa się z wartościami f. interpolowanej f(x). Takie postępow. jest często niedogodne. Zajmiemy się teraz zagadnieniem bardziej ogólnym, w którym warunek aby f. dana i f. szukana przyjmowały dokładnie te same wartości na zb. danych z góry punktów węzłowych, nie musi być spełniony. F. f(x), znaną lub określoną tablicą wartości, będziemy aproksymować (zastępować) inna f. F(x), zwaną f. aproksymującą lub przybliżeniem f. f(x). Oczywiście przybliżenie takie powoduje pojawienie się bł. zwanych bł. aproksymacji (przybliżenia) i problem oszacowania tych błędów oraz ich wielkości mają istotny wpływ na wybór metody aproksymacyjnej. Gdy zbiór, na którym mierzymy błąd aproksymacji, jest zbiorem dyskretnym, wówczas jest to apr. punktowa, gdy zaś jest to przedział - apr. integralna. Niech f(x) będzie f. którą chcemy aproksymować, X - prwną przestrzenią liniową unormowaną (skończenie lub nieskończenie unormowaną; f(x)ЄX) a Xm - m-wymiarową podprzestrzenią liniową p. X. Apr. f. f(x) polega na wyznaczeniu takich współczynników a0, a1, ..., am f. F(x)=a0ϕ0(x)+a1ϕ1(x)+...+amϕm(x) (1) gdzie ϕ0,ϕ1,...,ϕm są funkcjami bazowymi m+1 wymiarowej podprz. liniowej Xm+1 aby f. F(x) spełniała pewne warunki, np. minimalizowała normę różnicy ||f(x)-F(x)||. Apr. określona wzorem (1) nosi nazwę apr. liniowej (wzór (1) naz. się też wilom. uogólnionym). W obliczeniach na maszynach cyfrowych duże znaczenie ma też apr. wymierna, określona wzorem: F(x)=[a0ϕ0(x)+a1ϕ1(x)+...+amϕm(x)]/[b0ψ0(x)+b1ψ1(x)+...+bmψm(x)] (2) gdzie ϕi(x), ψj(x) (i=0,1,...,n) (j=0,1,...,m) są elementami tej samej bazy k-wymiarowej podprz. linowej (k=max(n,m)), natomiast ai i bi są stałymi współczynnikami, które należy wyznaczyć. Zajmiemy się teraz zagadnieniem wyboru odpow. podprz. Xm i związanej z nią bazy (f. bazowych ϕk(x)). J. f. aproksymowana f(x) jest f. cigłą na przedziale [a;b] f(x)ЄC[a;b], to f. ϕk(x) będą elementami pewnej m+1 wymiarowej podprz. C[a;b]. Jedną z często obieranych podprz. Xm jest podprz. f. trygonometrycznych z bazą 1, sinx, cosx, sin2x, cos2x, ..., sinkx, coskx szczególnie przydatna, gdy apr. f. f(x) jest f. okresową. Inną, też często obieraną jest podprz. wilomianów (4) 1, x, x2, ..., xm - z bazą jednomianów. Interpolacja jest oczywiście także jedną z met. apr. f. Przy interp. wzorami Newtona używaliśmy jako bazy wielomianów ϕ0(x)=1, ϕ1(x)=(x-x0), ..., ϕm(x)=(x-x0)(x-x1)...(x-xm-1). Przyjmijmy, że w p. X jest określona norma ||•||. Mówimy, że f. F)x) dobrze przybliża f. f(x), j. norma ||F9x)-f(x)|| jest mała. Normą taką może być np.: norma Czebyszewa ||f||=max[a;b]|f(x)|; norma L2 ||f||2=(∫[a;b]|f(x)|2dx)½; norma L2 z wagą ||f||2,w=(∫[a;b]w(x)|f(x)|2dx)½ gdzie x(x) jest ciągłą, nieujemną f. wagową, dodatnią poza zb. miary zero. Gdy f. f(x) jest określona na dyskretnym zb. punktów wówczas można dane wartości f(xi) przyjąć za współrzędne wekt. f i wówczas rozpatrujemy normę ||f||=(∑[i=0;n][f(xi)]2)½ Zagadnienie najlepszej apr. przy wybranych f. bazowych ϕk(x) sprowadza się do znalezienia wartości współczynników ak takich, aby otrzymać wyrażenia ||f(x)-(a0ϕ0(x)+...+amϕm(x))|| (5) i aby istn. jedyne możliwe rozw. tego zagadnienia ze wzgl. na ak. Apr. średniokwadratowa. Dla f. f(x) okr. na przedziale [a;b] poszukujemy minimum całki ||F(x)-f(x)||=∫[a;b]W(x)[F(x)-f(x)]2dx (6) a dla f. f(x) danej na dyskretnym zb. argumentów poszukujemy min. sumy (met. najmn. kwadratów) ||F(x)-f(x)||=∑[i=0;n]W(xi)[F(xi)-f(xi)]2 (7) W(xi)≥0 dla i=0,1,...,n. Apr. jednostajna. Dla f. f(x) poszukujemy f. F(x) dającej najmn. maksimum różnicy między F(x) a f(x) na całym przedziale ||F(x)-f(x)||=max[xЄ[a;b]]|F(x)-f(x)| (8) TW1: J. f. f(x) jest ciągła na [a;b] (skończonym) to dla każdego ξ>0 można dobrać takie n, że jest możliwe utworzenie wielom. Pn(x) stopnia n (n=n(ξ)), który spełnia nierówność |f(x)-Pn(x)|<ξ (9) na całym [a;b]. TW2: J. f. f(x) jest ciągła na R i okresową o okresie 2π, to dla każdego ξ dodatniego istn. wielom. trygonometryczny Sn(x)=a0+∑[k=1;n](akcoskx+bksinkx) (10), n=n(ξ) spełniający dla wszystkich x nierówność |f(x)-Sn(x)|<ξ. 2.Apr. średniokwadratowa. Niech będzie dana f. y=f(x), która na pewnym zb. X punktów x0, x1, ..., xn przyjmuje wart. y0, y1, ..., yn. Wartości te możemy znać tylko w przybliżeniu z pewnymi błędami (np.: jako wyniki pomiarów obarczone błędami obserwacji) przy czym błędy te mogą być niejednokrotnie dosyć duże, co w istotny spos. wpływa na jakość apr. Będziemy poszukiwać takiej f. F(x) przybliżającej daną f. f(x), która umożliwi wygładzenie f. f(x) i pozwoli z zakłóconych błędami danych wart. f. przybliżanej otrzymać gładką f. przybliżającą z dużym prawdopodobieństwem mało odchylającą się od f. przybliżanej zarówno między węzłami, jak i w węzłach x0, x1, ..., xn, j. tylko przyjmiemy, że f. przybliżana ma dość gładki przebieg. Niech ϕi(x), j=0,1,...,m. będzie układem f. bazowych podprz. X. Poszukujemy wielom. uogólnionego F(x), RYS.14 będącego najlepszym przybliżeniem średniokwadratowym f. f(x) na zb. X=(xj), tj. f. postaci F(x)=∑[i=0;n]aiϕi(x) (11) przy czym współczynniki ai są tak określone aby wyrażenie (7) było min. Oznaczmy H(a0, a1, ..., am)=∑[j=0;n]W(xj)[f(xj)-∑aiϕi(xj)]2=∑[j=0;n]WjRj2 (12) gdzie f. wagowa W(x) jest ustalona z góry i taka że W(xi)>0 dla i=0,1,...,n, a Rj jest odchyleniem w punkcie xj. Aby znaleźć ai obliczamy pochodne cząstkowe f. H względem zmiennych ai. Z warunku ekstremów f. wielu zmiennych ∂H/∂ak=0 (13), k=0,1,...,m otrzymamy wówczas układ (m+1) równań liniowych z m+1 niewiadomymi ai ∂H/∂ak=-2∑[j=0;n]W(xj)[f(xj)-∑[i=0;m]aiϕi(x)]ϕk(xj)=0 (14) zwany ukł. normalnym. Ponieważ f. ϕj(x) tworzą bazę p. Xm, więc układ (14) ma wyznacznik różny od zera i rozwiązanie tego ukł. daje min. f. H. W zapisie macierzowym ukł. (14) przyjmuje postać DTDA=DTf (15), gdzie D=[ϕ0(x0) ... ϕm(x0); ϕ0(x1) ... ϕm(x1); ...; ϕ0(xn) ... ϕm(xn)], A^=[a0 a1 … am]T, f^=[f(x0) f(x1) … f(xn)]T. M. współczynników ukł. (15) jest m. symetryczną i dodatnio określona co zapewnia jednoznaczność rozwiązania. Ukł. normalny (14) lub (15) można otrzymać z równania (11) po podst. wart. węzłowych xi (i=0,1,...,n). Otrzymamy wówczas nieokreślony ukł. (n+1) równań z (m+1) niewiadomymi DA=f (16) z którego po pomnożeniu przez DT otrzymujemy (15). 2.1 Apr. wielomianowa. J. jako f. bazowe przyjmiemy ciąg jednomianów (xi), i=0,1,...,m to wzór (15) przyjmie postać ∑[j=0;n][f(xj)-∑aixji]xjk=0 (17) k=0,1,...,m. Zmieniając kolejność sumowania mamy ∑[j=0;n]f(xj)xjk=∑[i=0;m]ai(∑[j=0;n]xji+k), (18) k=0,1,...,m i oznaczając gik=∑[j=0;n]xji+k, ρk=∑[j=0;n]f(xj)xjk (13) otrzymamy ukł. normalny postaci ∑[i=0;m]aigik=ρk (20) k=0,1,...,m. Można wykazać, że j. punkty x0, x1, ..., xn są różne i m≤n to wyznacznik ukł. (20) jest różny od zera, a więc ukł. tem ma jednoznaczne rozwiązanie. J. m=n, to wielom. aproksymac. f(x) pokrywa się z wielom. interpolac. dla punktów x0, x1, ..., xn i wówczas H=0. W praktyce stopień wieom. jest i powinien być znacznie mniejszy od liczby punktów xk (k=0,1,...,n), wtedy bowiem korzystamy z dużej ilości inf., uzyskując równocześnie prostrze (niskiego stopnia) f. aproksymujące. Np.: Niech dane będą wyniki pomiarów zestawione w tablicy
x |
1 |
3 |
4 |
6 |
8 |
9 |
11 |
14 |
y |
1 |
2 |
4 |
4 |
5 |
7 |
8 |
9 |
Poszukujemy zależności między x i y postaci ax+by=1 przy czym zadanie polega na znalezieniu najlepszych a i b. RYS.15 Przy tak sformowanym zad. pojawia się problem: czy rozpatrywać odchylenia x czy y. Przedyskutujmy obydwa przypadki pokazując jednocześnie że prowadzą one do różnych wniosków. Gdy przyjmiemy, że wartości y są obarczone pewnymi bł. wówczas minimalizujemy wyrażenie ∑[i=1;n](yi-yi--)2 (21) gdzie yi--=-axi/b+1/b=a1xi+a0. J. natomiast przyjmiemy że wartości x są obarczone bł. to powinniśmy minimalizować wyrażenie ∑[i=1;n](xi-xi--)2 (22) a1xi--+byi=1. W przypadku minimaliz. wyrażenia (21) otrzymamy układ normalny postaci {na0+(∑[i=1;n]xi)a1=∑[i=1;n]yi (n=8); (∑[i=1;n]xi)a0+(∑[i=1;n]xi2)a1=∑[i=1;n]xiyi} w którym a1=-a/b, a0=1/b i stąd {a0=[(∑[1;n]yi)(∑[1;n]xi2)-(∑[1;n]xi)(∑[1;n]xiyi)]/[n(∑[1;n]xi2)-(∑[1;n]xi)2; a1=[n(∑[1;n]xiyi)-(∑[1;n]xi)(∑[1;n]yi)]/n∑[1;n]xi2-(∑[1;n]xi)2} (24). Układ normalny (24) dla danych z tablicy ma rozwiązanie a0=6/11 i a1=7/11 i stąd równanie ma postać 11y-7x=6 (25). Minimalizując w taki spos. wyrażenie (22) otrzymamy równanie 2x-3y=-1 (26). Jak widać, równania (25) i (26) są różne, chociaż ich wykresy prawie się pokrywają. 3.Apr. za pomocą wielomianów ortogonalnych. Przy apr. wielom. z f. bazowymi 1, x, x2, ..., xk ze wzrostem stopnia wielom. k obliczenia stają się coraz bardziej pracochłonne, a ponadto ich wyniki są niepewne. Dodatkową trudnością jest fakt że zmiana stopnia wielom. wymaga ponownego rozwiązania ukł. normalnego, co też przemawia przeciwko stosowaniu ciągu funkcji ϕi(x)=xi do apr. Obydwie trudności można usunąć używając do apr. wielomianów ortogonalnych. Zdefiniujmy zatem ortogonalność f. na dyskretnym zb. punktów. DEF. F. f(x) i g(x) naz. ortogonalnymi na dyskr. zb. punktów x0, x1, ..., xn j. ∑[i=0;n]f(xi)g(xj)=0 (1) przy czym ∑[i=0;n][f(xi)]2>0, ∑[i=0;n][g(xi)]2>0 (2). Analogicznie ciąg funkcyjny {ϕm(x)}≡ϕ0(x), ϕ1(x), ..., ϕm(x), ... (3) naz. ortogonalnym na zb. punktów x0, x1, ..., xn (4), j. ∑[i=0;n]ϕj(xi)ϕk(xi)=0 (5) dla j≠k. Zakładamy, że nie wszystkie punkty xi są miejscami zerowymi f. ϕj(x). Zastosowanie wielom. ortogonalnych usuwa jedną z podst. trudności obliczeniowych. Przy apr. wielom. ortogonalnymi m. ukł. normalnego jest m. diagonalna, a jej elementy położone na głównej przekątnej wynoszą ajj=∑[i=0;n]ϕj2(xi). Załóżmy że mamy n+1 równoodległych punktów xi (xi=x0+ih), i=0,1,...,n). Niech q=(x-x0)/h przeprowadzimy te punkty odpowiednio w kolejne liczby całkowite od 0 do n. x0→0; x1→q=(x1-x0)/h=1; xn→(xn-x0)/h=n=q Poszukujemy ciągu wielomianów {Fi(n)(q)}: F0(n)(q), F1(n)(q), ..., Fm(n)(q) (6) (dolny indeks oznacza stopień, m≤n) spełniających na zb. punktów q=0,1,...,n warunek ortogonalności ∑[i=0;n]Fj(n)(i)Fk(n)(i)=0 (7) dla j≠k przy czym Fkn(q)=a0+a1q+a2q(q-1)+...+akq(q-1)...(q-k+1) (8). Wówczas Fk(n)(q)=a0+a1q(1)+a2q(2)+...+akq(k). Często używa się unormowanego ciągu wielom. spełniających warunek F—k(n)(q)=∑[s=0;k](-1)s(ks)(k+ss) q[s]/n[n] (10) k=0,1,...,m gdzie (ks) są symbolami Newtona. Wzór (10) określa wielom. Grama stopni k=0,1,...,m dla (n+1) równoodległych węzłów. Wzór apr. Grama ma postać: ym(x)=∑[k=0;m]CkF—k(n)(q)/Sk=∑[k=0;m]CkF—k(n)((x-x0)/h)/Sk (11) Sk=∑[q=0;n][F—k(n)(q)]2, Ck=∑[i=0;n]yiF—k(n)(xi) dla m≤n. Np.:Dana jest tabl. wartości f(x). Znaleźć najlepszy, w sensie aproksymacji średniokwadratowej, wielom. przybliżający f. f(x). Tabl.1
x |
1 |
1,5 |
2 |
2,5 |
3 |
y |
3 |
4,75 |
7 |
9,75 |
13 |
Ponieważ węzły są równoodległe, posłużymy się wielomianami Grama. Konstruujemy wielom. apr. dla n=4. Wartości Fk(q), q=0,1,2,3,4 obliczamy ze wzoru (11) F0(q)=1, F1(q)=1-2q/n, n≥1, F2(q)=1-6q/n+6q(q-1)/n(n-1), n≥2, F3(q)=1-12q/n+30q(q-1)/n(n-1)-20q(q-1)(q-2)/n(n-1)(n-2), n≥3, F4(q)=1-20q/n+90q(q-1)/n(n-1)-140q(q-1)(q-2)/n(n-1)(n-2)+70q(q-1)(q-2)(q-3)/n(n-1)(n-2)(n-3), n≥4 i zestawiamy w postaci tabl. 2
q |
xi |
yi |
F0(q) |
F1(q) |
F2(q) |
F3(q) |
F4(q) |
0 |
1 |
3 |
1 |
1 |
1 |
1 |
1 |
1 |
1,5 |
4,75 |
1 |
0,5 |
-0,5 |
-2 |
-4 |
2 |
2 |
7 |
1 |
0 |
-1 |
0 |
6 |
3 |
2,5 |
9,75 |
1 |
-0,5 |
-0,5 |
2 |
-4 |
4 |
3 |
13 |
1 |
-1 |
1 |
-1 |
1 |
Obliczamy wartości Ci, Si oraz bi=Ci/Si (tabl. 3)
Ci |
Si |
bi |
37,5 |
5 |
7,5 |
-12,5 |
2,5 |
-5 |
1,75 |
3,5 |
0,5 |
0 |
10 |
0 |
0 |
70 |
0 |
Dla q=(x-1)/0,5 i ze wzoru (11) otrzymujemy y(x)=∑[i=0;4]biFi(q)=x2+x+1. Apr. średniokwadratowa f. ciągłych. Niech f(x) ciągła na przedziale [a;b]. Wielom. apr. P(x)=a0ϕ0(x)+a1ϕ1(x)+…+anϕn(x) gdzie {ϕI(x)} są elementami bazy pewnej podprzestrzeni funkcji całkowych z kwadratem na [a;b]. Podobnie jak w przyp., gdy f(x) była określona na dyskretnym zb. punktów, apr. średniokw. f. ciągłych polega na znalezieniu takiego ciągu współczynników ai (i=0,1,...,n) aby otrzymać minimum normy ||F(x)-f(x)||=∫[a;b]W(x)[F(x)-f(x)]2dx. Przyjmijmy zatem, tak jak w przyp. apr. dyskretnej, że W(x)≡1 i Hn=∫[a;b]{P(x)-f(x)]2dx=∫[a;b][∑[i=0;n]aiϕi(x)-f(x)]2dx (12). Aby rozwiązać zadanie obl. pochodne cząstkowe ∂Hn/∂ai, i=0,1,...,n, przyrównujemy je do zera i z otrzymanego ukł. równ. wyznaczamy współczynniki ai. Rachunki będą znacznie prostrze, j. zamiast ϕi(x)-xi użyjemy ciągu f. ortogonalnych z wagą. Może to być np. ciąg wielomianów Legendre'a Pn(x)=(1/2nn!)(dn/dxn)(x2-1)n (13), n=0,1,... Przykładem ortogonalnego układu f. z wagą na przedziale [-1;1], W(x)=1/√(1-x2) są wielom. Czebyszewa. 4.Apr. trygonometryczna. W zagadnieniach apr. często spotykamy się z przyp. gdy f. f(x) jest okresowa. Taką f. wygodniej i lepiej jest apr. nie wielom. algebraicznymi, a wielom. tryg. Jako przykład ukł. ortogonalnego f. można podać układ (baza) 1, cosx, sinx, cos2x, sin2x, ..., cosmx, sinmx ortogonalny na odcinku [0;2π] ponieważ przez całkowanie można łatwo sprawdzić słuszność następujących równości dla dowolnych całkowitych k i n. ∫[0;2π]sinnx sinkx dx={0, k≠n, k=n=0; π, k=n} (13) ∫[0;2π]coskx sinnx dx=0, ∫[0;2π]cosnx coskx dx={0, k≠n; π, k=n≠0; 2π, k=n=0} Niech dana f. ciągła f(x) ma dla ustalenia wagi okres równy 2π. J. okres=L to wyst. wykonać podstawienie x1=Lx/2π, żeby sprowadzić zagadnienie do przypadku okresu=2π. Obieramy wielom. apr. Tm(x) w postaci Tm(x)=∑[k=0;m](akcoskx+bksinkx) (14). Współczynniki ak i bk zapiszemy to zgodnie ze wzorami: Hm=∫[a;b][f(x)-∑aiϕi(x)]dx, ∂Hm/∂ak=0, k=1,2,...,n; ∑ai(ϕi,ϕk)=(f,ϕk) (15), k=1,2,...,m; (ϕi ϕk)=∫[a;b]ϕi(x)ϕk(x)dx=0, i≠k; (f,ϕk)=∫[a;b]f(x)ϕk(x)dx, ak=(f,ϕk)/(ϕk,ϕk)=(∫[a;b]fϕkdx)/(∫[a;b]ϕk2dx) i (13) a0=(1/2π)∫[0;2π]f(x)dx, ak=(1/π)∫[0;2π]f(x)coskx dx, bk=(1/π)∫[0;2π]f(x)sinkx dx (16). Są to znane z analizy współczynniki Fouriera f. f(x). W szczególności a0=(1/π)∫[0;π]f(x)dx, ak=(2/π)∫[0;π]f(x)coskx dx (17), (bk=0, k=1,2,...,m) j. f(x) jest parzysta oraz a0=0, ak=0, bk=(2/π)∫[0;π]f(x)sinkx dx (18) j. f(x) jest nie parzysta. Np.: Za pom. wielom. tryg. dziewiątego stopnia należy otrzymać przybliżenie następującej f. okresowej f(x)={x(π-x), 0≤x≤π ⇒ -x2+πx; x(π+x),-π≤x≤0 ⇒ x2+πx} RYS.16 Na mocy nieparzystości danej f., ze wzorów (18) bk=(2/π)∫[0;π]x(π-x)sinkx dx=(2/π)[-x(π-x)coskx/k|0π+(1/k)∫[0;π](π-2x)coskx dx]=(2/πk)[(π-2x)sinkx/k|0π+(2/k)∫[0;π]sinkxdx]=4/πk2∫[0;π]sinkx dx=(-4/πk3)coskx|0π=(4/πk3)[1-(-1)k] zatem b2n=0, b2n-1=8/π(2n-1)3. Szukany wielom. tryg. przyjmuje postać: T9(x)=8/π[sinx+sin3x/27+sin5x/125+sin7x/343+sin9x/729]. Za pom. wielom. tryg. można apr. też f. nieokresowe. W tym przypadku przybliżone przedstawienie f. f(x) nie na całej prostej (-∞;∞), lecz tylko na odcinku dł. 2π albo okresu. Przejdziemy obecnie do rozpatrzenia przypadku punktów dyskretnych. W przyp. f. okresowej o okresie 2π znamy wartości w równoodległych punktach (węzach) odcinka [0;2π] xj=2πj/n (j=0,1,...,n-1). Dobierzemy tak współczynniki ak, bk wielom. Tm(x) przy n>2m, żeby wyrażenie S=∑[j=0;n-1][f(xj)-Tm(xj)]2 miało wartość najmniejszą. Przyrównując do zera pochodne cząstkowe S względem aq i bq otrzymujemy następujący układ równań: {∑[k=0;m][ak∑[j=0;n-1]coskxjcosqxj+bk∑[j=0;n-1]sinkxjcosqxj]=∑[j=0;n-1]f(xj)cosqxj; ∑[k=0;m][ak∑[j=0;n-1]coskxjsinqxj+bk∑[j=0;n-1]sinkxjsinqxj]=∑[j=0;n-1]f(xj)sinqxj} (20) (q=0,1,...,m). Łatwo sprawdzić następujące równości dla k,q=0,1,...,m: ∑[j=0;n-1]coskxj={0, k≠0; n, k=0}; ∑[j=0;n-1]sinkxj=0 (21); ∑[j=0;n-1]coskxjsinqxj=0 (22); ∑[j=0;n-1]coskxjcosqxj={0, k≠q; n/2, k=q≠0; n, k=q=0} (23); ∑[j=0;n-1]sinkxjsinqxj={0, k≠q; n/2, k=q=0; 0, k=q=0} (24). Istotnie, słuszność równości (21) jest oczywista. Dla udowodnienia ich przy k≠0 rozpatrzymy sumę ∑[j=0;n-1]coskxj+I∑[j=0;n-1]sinkxj=∑[j=0;n]eIkx (z indeksem j)=∑eIk2πj/n=(1-ei2kπ)/(1-ei2kπ/n)=0. Przyrównując tu do zera część równości (21). W celu udowodnienia równości (22) zapiszemy lewą jej stronę w postaci ∑[j=0;n-1]coskxjsinqxj=½∑[j=0;n-1][sin(k+q)xj+sin(q-k)xj]=½∑[j=0;n-1]sin(k+q)xj+½∑[j=0;n-1]sin(k-q)xj. Stąd na mocy równości (21) wynika, że strona prawa tej równości=0. Analogicznie dowodzimy słuszności równości (23,24). Z równania (20) wykorzystując równości (21-24) znajdujemy a0=1/n∑[j=0;n-1]f(xj), ak=2/n∑[j=0;n-1]f(xj)coskxj, bk=2/n∑[j=0;n-1]f(xj)sinkxj (25) (k=1,2,...,m). J. w (25) przejdziemy do granicy przy n→∞, to przekształcają się one we wzory (16) określające współczynniki Fouriera f. f(x). J. rozpatrywana f. f(x) jest parzysta, to wszystkie bk=0 (k=1,...,m). W przyp. zaś jej nieparzystości ak=0 (k=0,1,...,m) f(0)=f(π). W tych przyp. szczególnych przy obliczaniu ≠0 współczynników na podstawie wzorów (25) można wykonywać sumowanie tylko w połowie przedziału [a;b]=[0;2π] i następnie mnożyć wynik przez dwa. Np.: Za pom. wielom. tryg. stopnia 3 znaleźć przybliżenie nieparzystej funkcji f(x) danej na odcinku [0;π] następującym ciągiem wartości:
x |
0 |
π/4 |
π/2 |
3π/4 |
π |
y |
0 |
5 |
7 |
6 |
0 |
Tu n=8 na [-π;π] Na mocy nieparzystości ak=0, a dla określenia bk na podstawie wzorów (25) mamy bk=¼∑[j=0;7]f(xj)sinkxj=½∑[j=0;3]f(πj/4)sin(kπj/4). Obliczone współczynniki bk podano w tablicy
x |
f(x) |
sinx |
f(x)sinx |
sin2x |
fsin2x |
sin3x |
fsin3x |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
π/4 |
5 |
√2/2 |
5√2/2 |
1 |
5 |
√2/2 |
5√2/2 |
π/2 |
7 |
1 |
7 |
0 |
0 |
-1 |
-7 |
3π/4 |
6 |
√2/2 |
3√2 |
-1 |
-6 |
√2/2 |
3√2 |
2b1=11√2/2+7, 2b2=-1, 2b3=11√2/2-7, b1=11√2/4+7/2, b2=-˝, b3=11√2/4-7/2. Szukany wielom. tryg. przyjmuje postać T3(x)=(11√2/4+7/2)sinx-½sin2x+(11√2/4-7/2)sin3x 4.Uwagi końcowe Często zdarza się że dla f. określonej tablicą wartości albo wykresem (np. wyniki pomiarów) chcemy dobrać wyrażenie analityczne, które będzie w przybliżeniu opisywać daną f. Proces dobierania takiego wzoru empirycznego składa się z 2 części: wyboru postaci wzoru i określenia wartości liczbowych dla występujących w nim parametrów, tak aby przybliżenie to było jak najlepsze. Czasami mamy pewne inf. dotyczące postaci poszukiwanego wzoru, ale najczęściej postać wzoru dobieramy „na oko” na zasadzie podobieństwa wykresu analizowanej f. do znanych f. Staramy się przy tym, aby f. te miały stosunkowo prostą postać. Takimi często używanymi wzorcami są m. in.: y=axb+c; y=exp(ax2+bx+c); y=aebx+c; y2=ax2+bx+c; y=ax2+bx+c; y=(ax+b)/(cx+d); y=1/(ax2+bx+c); y=x/(ax2+bx+c); y=a+b/x+c/x2; y=axbecx; y=aebx+cedx. Ponieważ przyjęta „metoda” określania podobieństwa wykresów jest bardzo niedokładna po wybraniu postaci wzoru, ale przed doborem parametrów, sprawdza się jego przydatność za pom. met. wyrównywania. Wielkość parametrów można określić albo w spos. dokładny omówioną met. najmniejszych kwadratów albo w spos. przybliżony met. przeciętnych. Całkowanie numeryczne. 1.Wstęp. Uwagi ogólne o całkowaniu numerycznym. Ponieważ wyznaczenie f. pierwotnej w wielu przypadkach jest bardzo trudne lub wręcz niemożliwe stosowanie metod przybliżonych jest więc często konieczne. Ponadto, j. f. podcałkowa jest określona za pom. tablicy to pojęcie f. pierwotnej traci sens i wówczas możemy obliczyć tylko przybliżoną wartość całki. Gdy przedział całkowania jest skończony, wówczas wiele sposobów przybliżonego obliczania całek polega na tym, że f. podcałkową F(x) zastępujemy interpolującą f. ϕ(x), którą łatwo można całkować. Niech ϕ(x) będzie wielom. interpolacyjnym Lagrange'a dla f. F(x) z węzłami interpolacji x0,x1,...,xN ϕ(x)=LN(x)=∑[k=0;N]ψk(x)F(xk); ψk(x)=(x-x0)...(x-xk-1)(x-xk+1)...(x-xN)/(xk-x0)...(xk-xk-1)(xk-xk+1)...(xk-xN). Podstawiając w miejsce f. podcałkowej F(x) wielom. ϕ(x), otrzymamy ∫[a;b]F(x)dx ≈ ∫[a;b]ϕ(x)dx=∑[K=0;N]AkF(xk), AK=∫[a;b]ψk(x)dx. J. F(x)-ϕ(x)|<ξ i xЄ[a,b], to |∫[a;b](F(x)-ϕ(x))dx|≤ξ(b-a). Przedstawiony sposób pozwala zatem obl. całkę z dowolną dokł. j. tylko f. F(x) można przybliżyć wielom. z dowolną dokładnością; oprócz wielom. można stosować też inne f. interpolacyjne ϕ(x), np.: f. wymierne, trygonom. Podobny wzór przybliżonego całkowania otrzymamy gdy przedział całkowania podzielimy na podprzedziały i w każdym podprzedziale zastosujemy powyższy sposób obliczania całki. J. f. F(x) ma osobliwości utrudniające dobre przybliżenie (np. gdy F(x) jest nieograniczona lub jej pochodne niskiego rzędu nie istn. w przedziale całkowania) to postępowanie można zmodyfikować. F. podcałkową przedstawiamy w postaci iloczynu F(x)=p(x)f(x), gdzie f(x) jest już f., którą można dobrze przybliżyć, a p(x) ma wszelkie osobliwości F(x) utrudniające to przybliżenie. Niech teraz ϕ(x) będzie wielom. interpolacyjnym Lagrange'a dla f. f(x) z węzłami interpolacji x0,x1,...,xN. Podstawiając w miejsce f(x) wielom. ϕ(x) otrzymamy ∫[a;b]F(x)dx=∫[a;b]p(x)f(x)dx ≈ ∫p(x)(x)dx=∑[K=0;N]Ak'f(xk); Ak'=∫[a;b]p(x)ψk(x). Ten zmodyfikowany sposób można zastosować i do obliczania całek na nieskończonym przedziale całkowania. F. p(x) określa wówczas szybkość malenia F(x), gdy x→±∞. Rozbicie f. podcałkowej F(x) na iloczyn f(x) i p(x) niekoniecznie musi być związane z wydzieleniem osobliwości F(x). W met. Gaussa f. p(x) dobiera się często ze wzgl. na wybór odpowiedniego typu wielom. ortogonalnych. Do przybliżonego obliczania całek I(f)=∫[a;b]p(x)f(x)dx (1) będziemy stosować wzory S(f)=∑Akf(xk), xkЄ[a;b] (2) przy czym współczynniki Ak nie zależą od f(x). Wzór (2) naz. kwadraturą, a xk węzłami kwadratury. F. p(x) naz. f. wagową lub wagą. Błąd przybliżenia całki (1) sumą (2) czyli błąd metody, oznaczymy jako E(f)=I(f)-S(f) (3). Za krytrium dokładności kwadratury przyjmujemy zgodność S(w) i I(w), gdy w jest wielom. Mówimy, że wzór (2) jest rzędu r, j.: 1) I(w)=S(x) dla wszystkich wielom. W(x) stopnia mniejszego niż r. 2) istnieje wielom. W(x) stopnia r taki, że I(w)≠S(w). Zakładać będziemy, że r≥1. 2.Kwadratury Newtona-Cotesa. Rozpatrzymy następujący sposób obliczania całki (1) S(f)=I(Ln)=∑Akf(xk), Ak=∫[a;b]p(x)ψk(x)dx (5) gdzie Ln jest wielom. interpolacyjnym Lagrange'a dla f. f(x) z węzłami interpolacji x0,x1,...,xN Ln(x)=∑ψk(x)f(xk) (6), wzór na błąd przybliżenia f(x) wielom. Ln(x) jest Rn+1(x)=f(x)-Lw(x)=1/(N+1)!wn+1(x)f(n+1)(ζ), ζЄ[a;b] (7) gdzie wN+1(x)=(x-x0)(x-x1)...(x-xN) TW Rząd kwadratury (2) wynosi co najmniej (N+1) ⇔ kwadratura ta jest postaci (5). Kwadratury (5) z węzłami równoodległymi naz. kwadraturami Newtona-Cotesa. Niech końce przedziału są węzłami i waga p(x)≡1. S(f)=∑[k=0;N]Akfk, Ak=∫[a;b]ψk(x)dx=[h(-1)N-k/k!(N-k)!]∫[0;N]t(t-1)...(t-N)/(t-k) dt (8) h=(b-a)/N, fk=f(a+kh) Podst. własności kwadratury: 1. J. N jest liczbą nieparzystą, to kwadratura (8) nie jest dokładna dla wszystkich wielom. stopnia (N+1) i (N+1) jest jej rzędem dokładności. Gdy jest dokładna dla wielom. stopnia (N+1) i jej rząd wynosi (N+2). Dla dowolnego N rząd kwadratury wynosi zatem 2[N/2]+2 (9) gdzie [N/2] oznacza całkowitą część liczby N/2. 2. J. fЄCP([a;b]), gdzie r=2[N/2]+2, to błąd kwadratury można przedstawić w postaci F(f)=CPfx(P)(ζ), ζЄ[a;c], współczynnik CP nie zależy od f. 3. Błąd kwadratury zależy od f(P)=dPf/dxP, a jak wiadomo pochodne wysokiego rzędu trudno jest oszacować. Inną trudnością jest to że pochodne te często rosną, nieograniczenie; ten szybki wzrost może już wystąpić dla pochodnych niskiego rzędu. Ponadto dla dużych N kwadratura jest mało odporna na niedokładność obliczeń na maszynach cyfrowych 4. Zaznaczamy, że Ak zależą od N (Ak=AkN). Dla pewnych k mamy lim[N→∞]|AkN|=∞, a więc metoda nie jest zbieżna w klasie f. ciągłych. Podamy teraz wzory (8) gdy N=1 i N=2. Dla N=1, mamy A0=-h∫[0;1](t-1)dt=h/2, A1=h∫[0;1]tdt=h/2 a więc S(f)=h/2(f0+f1) (9). Błąd tego wzoru na podstawie (7) E(f)=1/2!∫[a;b](x-a)(x-b)fx''(ζ)dx (8) gdy fЄC2([a;b]), ζЄ[a,b]. F. W2(x)=(x-a)(x-b) nie zmienia znaku na [a;b], możemy zatem do (8) zast. uogólniona tw. o wartości średniej całek. E(f)=f''(ζ1)/2∫[a;b](x-a)(x-b)dx=-h3f''(ζ1)/12 (9) ζ1Є[a;b], h=b-a RYS.17 Dla N=2 otrzymujemy A0=h/3, A1=4h/3, A2=h/3 S(f)=h/3(f0+f1+f2) (10). Jest to znany wzór parabol, zwany też wzorem Simpsona. RYS.18 Wzór (10) jest też dokładny dla wielom. st. 3-go. Niech f(x)ЄC4([a;b]) i niech L3(x) będzie wilom. interpolacyjnym dla f(x) z węzłami a, (a+b)/2, b i x4, gdzie x4 jest dowolnym ale różnym od pozostałych węzłów punktem z przedziału [a;b]. Mamy wówczas f(x)-L3(x)=(x-a)(a-(a+b)/2)(x-b)(x-x4)fx''''(ζ)/4! (11) ζЄ[a;b]. Przechodząc w (11) do granicy z x4→(a+b)/2 otrzymamy f(x)-L3~~(x)=(x-a)(x-(a+b)/2)(x-b)fx(4)( ζ~~)/4!, (12) ζ~~Є[a;b]. Błąd kwadratury E(f)=1/4!∫[a;b](x-a)(x-(a+b)/2)2(x-b)f(4)(ζ~~)dx (13). Po zastosowaniu do (13) uogólnionego tw. o wartości średniej dla całek otrzymamy E(f)=f(4)(ζ1)/4!∫[a;b](x-a)(x-(a+b)/2)2(x-b)dx=-h5f(4)(ζ1) (14) gdzie ζ1Є[a;b], h=(b-a)/2. 3.Kwadratury złożone Newtona-Cotesa. Z powodów, które przedstawiliśmy w poprzednim punkcie, kwadratur Newtona-Cotesa wysokich rzędów używa się rzadko. Dla N równych 1 i 2 współczynniki CP we wzorze E(f)=CPf(P)(ζ), określającym błąd wynoszą odpowiednio (b-a)3/12, (b-a)5/2880. Błąd tych kwadratur jest zatem proporcjonalny do pewnej potęgi długości przedziału całkowania i przy dużych przedziałach stosow. kwadratur nawet niskiego rzędu może nie zapewnić żądanej dokładności. W praktyce kwadratury te stosuje się w nast. spos.: 1. przedział całkowania [a;b] dzielimy na pewną liczbę podprzedziałów 2. w każdym podprzedziale stos. kwadraturę niskiego rzędu i wyniki sumujemy. Kwadraturę która jest sumą kwadratur na podprzedziałach naz. kwadraturą złożoną. Omówimy wzór złożony trapezów RYS.19. Przedział całkowania [a;b] dzielimy na m części o dł. h=(b-a)/m. W każdym podprzedziale stosujemy wzór trapezów i wyniki sumujemy. Otrzymamy S(f)=∑[k=0;m-1]h(fk+fk+1)/2=h(f0/2+f1+...+fm-1+fm/2) (15) gdzie fi=f(a+ih). Niech fЄC2([a;b]). Błąd złożonego wzoru trapezów wynosi E(f)=-h3/12∑[k=0;m-1]f''(ζk)=(-(b-a)3/12m2)(1/m)∑[k=0;m-1]f''(ζk) (16) przy czym ζkЄ[a+kh;a+(k+1)h]. Czynnik 1/m∑[k=0;m-1]f''(ζk) jest średnią arytmetyczną wartości drugiej pochodnej w punktach ζk. Jest oczywiste że wartość ta znajduje się między najmniejszą i największą wartością f''(x) na [a;b]. Ponieważ pochodna f''(x) jest ciągła na [a;b] więc istn. punkt ζЄ[a;b] taki że 1/m∑[k=0;m-1]f''(ζk)=f''(ζ) Zatem E(f)=(-(b-a)/12m2)f''(ζ) (17). Wzór złożony parabol. W tym przypadku dzielimy [a;b] na m równych części o dł. h=(b-1)/m, przy czym m jest parzyste. W przedziałach [a;a+2h]=[x0;x2], ..., [a+(m-2)h;b]=[xm-2;xm] o dł. 2h stosujemy wzór parabol, wyniki sumujemy S(f)=h/3∑[k=1;m/2](f2k=2+4f2k-1+f2k)=h/3[f0+fm+2(f2+f4+fm-2)+4(f1+f3+...+fm-1)]. Niech fЄC4([a;b]). Błąd E(f)=-h5/90∑[k=1;m/2]f(4)(ζk), ζЄ[a+2(k-1)k;a+2kh]. Istn. punkt ζЄ[a;b] taki, że 2/m∑[k=1;m/2]f(4)(ζk)=f(4)(ζ). Stąd mamy E(f)=(-(b-a)/180m4)f(4)(ζ) (18). Rozwiązywanie przybliżone równań różniczkowych zwyczajnych. W przypadku nawet całkiem prostych równań różniczkowych zwyczajnych nie zawsze można wyrazić szukane rozw. w postaci wzoru. Dlatego duże znaczenie mają met. przybliżone rozwiązywania. Met. przybliżone można podzielić na: analityczne i numeryczne. Do met. analitycznych zaliczamy met. kolejnych przybliżeń Picarda i met. szeregów potęgowych, a do met numerycznych met. Eulera i jej odmiany oraz met. Rungego-Kutty, Adamsa i Störmera. W przypadku zagadnień brzegowych rozpatrzymy numeryczne met. różnicowe. 1. Met. kolejnych przybliżeń. Jedną z prostych co do pomysłu (jednak nie w praktycznym realizowaniu) przybliżonego rozwiązania zagadnienia Cauchy'ego dla równania dy/dx=f(x,y) (1) z warunkiem początkowym y(x0)=y0 (2) jest met. kolejnych przybliżeń. Rozwiązanie zagadnienia (1-2) jest równoważne rozwiązaniu równania całkowego y(x)=y0+∫[x0;x]f(t,y)dt (3) niewiadomej f. y dowolną f. - przybliżenie zerowe, np. y=y0 - po wykonaniu całkowania otrzymujemy pierwsze przybliżenie y1(x)=y0+∫[x0;x]f(t,y0)dt. Postępując z y1(x) tak samo jak z y0 dostajemy drugie przybliżenie y2(x)=y0+∫[x0;x]f(t,y1(t))dt Powtarzając ten proces otrzymamy przybliżenie yn+1(x)=y0+∫[x0;x]f(t,yn(t))dt (4) Przy dość ogólnych założeniach co do f. f(x,y) ciąg {yn} jest zbieżne jednostajnie do rozwiązania zagadnienia (1), (2) -gdy n→∞. Np.: Rozwiązać zagadnienie y'=x-y, y(x0)=1. Jako przybliżenie zerowe obieramy y0=1, wówczas: y1(x)=1+∫[0;x](t-1)dt=1-x+x2/2; y2(x)=1+∫[x0=0;x](t-1+t-t2/2)dt=1-x+x2-x3/6; ...; yn=1-x+2x2/2!+2x3/3!+...+(-1)n2x4/n!-(-1)nxn+1/(n+1)! Przy n→∞ yn→2e-x-(1-x), co pokrywa się z dokł. rozw. zad. 2.Zwyczajna Metoda Eulera. Podczas numerycznego rozw. równania (1) przy warunku początkowym y(x0)=y0 należy znaleźć w punktach x0, x1, x2, ..., xn,... przybliżenia yn wartości rozwiązania dokładnego y(xn). Różnicę Δxn=xn+1-xn=h naz. krokiem siatki. Gdy f jest stałą wówczas xn=x0+nh (n=0,1,...). Można w przybliżeniu przyjąć, prawa str. równ. y'=f(x,y) na każdym z odcinków zawartych między punktami podziału jest stała. Na tej podst. szukane rozw. na pierwszym odcinku w przybliżeniu przyjmuje postać f. liniowej y=y0+(x-x0)f(x0,y0) (5), w szczególności w punkcie x1 otrzymujemy y1=y0+hf(x0,y0). Równość (5) oznacza że na odcinku [x0,x0+h] szukaną krzywą całkową y(x) zastępujemy w przybliżeniu odcinkiem prostoliniowym wychodzącym z punktu (x0,y0) i o współczynniku kątowym równym f(x0,y0). RYS.20 Analogicznie wychodząc z punktu (x1,y1) znajdujemy wart. przybliżoną y2 wg wzoru y2=y1+hf(x1,y1) itd. Dla punktu xn=x0+nh mamy yn=yn-1+hf(xn-1,yn-1) (6). W ten sposób jako przybliżenie szukanej krzywej całkowej otrzymamy linię łamaną o wierzchołkach w węzłach (x0,y0), (x1,y1), ..., (xn,yn). Metoda (wzór (6)) zwyczajna Eulera daje dosyć grube przybliżenia rozwiązania zagadnienia Cauchy'ego (1), (2) i wykorzystywana jest zazwyczaj w tych przypadkach kiedy trzeba otrzymać poglądowe przedstawienie rozwiązania na niedużym odcinku. 3.Ulepszuna met. Eulera. Istota tej met. jest następująca: Obliczamy najpierw wartości pomocnicze szukanej f. yn+½ w punktach xn+½=xn+h/2 za pomocą wzoru yn+½= yn+f(xn,yn)h/2. Następnie znajdujemy wartości prawej strony f w punkcie xn+½, f(xn+½,yn+½) i potem przyjmujemy yn+1=yn+hfn+½ (7) RYS.21 Metoda ulepszona Eulera (7) jest nieco dokładniejsza w porównaniu ze zwyczajną met. Eulera. 4.Ulepszona met. Eulera-Cauchy'ego. Znajdujemy przybliżenie szukanego rozw. na postawie wzoru yn+1=yn+h/2[f(xn,yn|+f(xn+1,yn+1)] (8) tgαn+1=f(xn+1,yn+1); tgαn=f(xn,yn). RYS.22 Jak łatwo widać prawa strona (8) zależy od niewiadomej yn+1. Dlatego wykorzystujemy wzór iteracyjny yn+1(k+1)=yn+h/2[f(xn,yn)+f(xn+1,yn+1(k)] (9) (k=0,1,...). Na pierwszym kroku zerowe przybliżenie można znaleźć na podstawie met. zwyczajnej Eulera yn+1(0)=yn+hfn. Następnie można znaleźć yn+1(1)=yn+h/2[f(x,yn)+f(xn+1,yn+1(0))]; yn+1(2)=yn+h/2[f(xn,yn)+f(xn+1,yn+1(1))] itd. Zakończymy proces iteracyjny gdy |yn+1(k+1)-yn+1(k)|≤ξ, gdzie ξ-błąd. 5.Metoda Rungego-Kutty (RK). Metoda RK jest jedną z najczęściej stosowanych met. o większej dokładności. Idea tej met. ma dużo wspólnego z ideą met. Eulera. Przedstawmy y(x) w otoczeniu każdego punktu x=xn wzorem Taylora i obliczmy współczynniki rozwinięcia bezpośrednio na podst. f(x,y) wykorzystując warunki y(x0)-y0 (2) y(x)=yn+hdy/dx|Xn+(h2/2!)(d2y/dx2)|Xn+(h3/3!)(d3y/dx3)|Xn+... (10) xЄ[xn,xn+1]. W zależności od tego do jakich wyrazów ograniczamy się we wzorze (10), otrzymujemy taką lub inną dokładność szukanego rozwiązania przybliżonego. Np.: zachowując wyrazy do rzędu h włącznie dojdziemy do met. Eulera. W met. RK ograniczamy się do 4 lub 5 wyrazów rozwinięcia (zachowując wyrazy z potęgami do h3 lub h4 włącznie). Rozpatrzymy met. RK trzeciego rzędu, zachowujemy w (10) wyrazy do h3 y(x)≈yn+h(dy/dx)|Xn+(h2/2!)(d2y/dx2)|Xn+(h3/3!)(d3y/dx3) (11) przyjmujemy yn+1=yn+λn (12), gdzie λn=h(dy/dx)+(h2/2)(d2y/dx2)+(h3/6)(d3y/dx3). Wielkość λn przedstawiamy za pom. kombinacji liniowych postaci λn=αk1+βk2+γk3+δk4 (14), gdzie α,β,γ,δ -współczynniki nieokreślone, k1,k2,k3,k4 -liczby okr. równościami: {k1=hf(xn,yn); k2=hf(xn+h/2,yn+k1/2); k3=hf(xn+h/2,yn+k2/2); k4=hf(xn+h,yn+k3)} (15). Wyrazimy pochodne λn przez prawą str. f(x,y). dy/dx=f(x,y); d2y/dx2=∂f/∂x+(∂f/∂y)(dy/dx) itd. Dla prostoty wprowadzimy operator D=∂/∂x+f(∂/∂y) wówczas d2y/dx2=Df, d3y/dx3=D(Df)=∂2f/∂x2+2f(∂2f/∂x∂y)+f2(∂2f/∂y2)+∂f/∂y(∂f/∂x+f(∂f/∂y))=D2f+(∂f/∂y)Df. Podstawiając znalezione wartości pochodnych w równości (13) dla λn mamy λn=hf+(h2/2)Df+h3/3(D2f+(∂f/∂y)Df) (16). Przedstawimy obecnie k2,k3,k4 jako f. dwóch zmiennych za pom. szeregu Taylora k2=f(xn+h/2,yn+k1/2)h=[f+((h/2)∂/∂x+(k1/2)∂/∂y)f+½((h/2)∂/∂x+(k1/2)∂/∂y)f+...]h. Ograniczając się do trzeciej potęgi h i uwzględniając że k1=hf, mamy k2=hf+(h2/2)Df+(h3/8)D2f, k3=hf+(h2/2)Df+(h3/4)(∂f/∂y)Df +(h3/8)D2f, k4=hf+h2Df+(h3/2)(∂f/∂y)Df +(h3/2)D2f. Utworzymy obecnie sumę λn=αk1+βk2+γk3+δk4. Porównując w ostatniej równości i w wyrażeniach (16) dla λn współczynniki przy jednakowych potęgach h otrzymamy ukł. równań: {α+β+γ+δ=1 (przy hf); β/2+γ/2+δ=½ (przy h2Df); β/8+γ/8+δ/2=1/6 (przy h3D2f); γ/4+δ/2=1/6 (przy h3(∂f/∂y)Df)} Ukł. ten ma rozw. α=δ=1/6, β=γ=1/3. W ten spos. λn=1/6(k1+2k2+2k3+k4) (17) a do obliczania yn+1 mamy wzór yn+1=yn+1/6(k1+2k2+2k3+k4) (18), gdzie k1,k2,k3,k4 -liczby określone przez (15). Dla równania y'=f(x,y) Bieberbach otrzymał za pom. rozwinięcia Taylora następujące oszacowanie błędu met. RK |yn+1-y(xn+1)|<6MN|xn+1-xn|5|N5-1|/|N-1|, gdzie M i N -stałe takie że w obszarze |x-xn|<a, |y-yn|<b spełnione są nierówności |f(x,y)|<M, |∂i+kf/∂xi∂yk|<N/Mk-1 (i+k≤3), |x-xn|N<1, aM<b, h=xn+1-xn≤a. W ogólnym przypadku trudno jest wskazać dokładne oszacowanie bł. met. RK. Dlatego w praktyce korzysta się często z przybliżonego oszacowania bł. tej met. wychodząc z różnych rozwiązań pośrednich. Starając się zwiększyć dokł. rozw. kosztem zmniejszenia kroku kierujemy się w praktyce następującą zasadą: tworzymy różnicę |k2-k3| i |k1-k2| oraz żądamy żeby pierwsza z nich nie przekraczała kilku procent wartości drugiej. J. ten warunek nie jest spełniony to krok podziału należy zmniejszyć. Odpowiednia liczba Θ=|(k2-k3)/(k1-k2)| jest swego rodzaju „miarą niepewności” lub „wskaźnikiem kroku”. W celu grubego oszacowania bł. metody wykorzystujemy często zas. Rungego: przypuśćmy dla ustalenia uwagi, że mamy do czynienia z met. RK o dokł. hk i niech x będzie punktem w którym interesuje nas rozwiązanie przybliżone. Znajdujemy to rozw. wykorzystując krok h a następnie krok 2h. Przy kroku h dla punktu x1=x0+h mamy y(x1)=y1+Ahk+1, A=fk+1(ζ)/(k+1)! (x0≤ζ≤x1). Bł. wynosi Ahk+1. W celu orientacyjnego obliczenia bł. w p. x=x0+2nh można przyjąć że na każdym kroku o dł. h czynimy bł. proporcjonalny do hk+1 i dla p. x bł. sumaryczny jest równy Ahk+12n czyli y(x)=y2n+A2nhk+1 (19). W obliczeniach z krokiem 2h również zakładamy że na każdym kroku dopuszczamy bł. proporcjonalny do (2h)k+1 z tym samym współczynnikiem proporcjonalności A i w p. x bł. sumaryczny jest równy An(2h)k+1 to jest y(x)=yn+An(2h)k+1 (20). Z równości (19) i (20) |y2n-y(x2n)|≈|y2n-yn|/(2k-1). W ten spos. dochodzimy do zas. Rungego. Szukany bł. met. RK jest w przybliżeniu równy modułowi różnicy rozwiązań o kroku h i kroku 2h dzielonej przez 2k-1 przy k=4 mamy 24-1=15. (błąd kroku ~ h5). 6.Rozwiązywanie ukł. równań różniczkowych. Zagadnienia początkowe: Znaleźć f. yi=yi(x) i=1,2,...,m spełniające na przedziale [x0=a;b] ukł. równ. różniczkowych {dy1/dx=f1(x,y1,...,ym); dy2/dx=f2(x,y1,...,ym); ...; dym/dx=fm(x,y1,...,ym)} (21) i warunek początkowy y(x0)=yi,0 (22) (i=1,...,m) albo w postaci wektorowej dy^/dx=f^(x,y^), y^(x0)=y0^ (23) y^=[y1...ym]T, f^=[f1...fm]T. Jak i dla jednego równania skalarnego y'=f(x,y) mamy metodą Eulera wg której yn+1^=yn^+hf^(xn,yn^), n≥1. y^(x0)=y0^ (24). Ulepszona met. Eulera-Cauchy'ego yn+1^(k+1)=yn^+h/2[f^(xn,yn^)+f(xn+1,yn+1^(k))] (25) yn+1^(0)=yn^+f^(xn,yn^), (k=1,2,...). Metody typu Rungego-Kutty yn+1^=yn^+∑[i=1;s]wiki^, k1^=hf^(xn,yn^) (26), ki^=hf^(xn+aih,yn^+∑[j=1;i-1]bijkj^), wi,ai,bij -stałe. 7.Met. różnicowe rozwiązywania zagadnień brzegowych. Przez liniowe zagadnienie brzegowe rzędu n rozumiemy równanie różniczkowe rzędu n≥2 względem f. niewiadomej y(x) L(y)=r(x) (27), gdzie L(y)=∑[j=0;n]fj(x)y(i) przy n warunkach brzegowych sj=γj, (j=1,2,...,n), sj(y)=∑[k=0;n-1][αjky(k)(a)+βjky(k)(b)] (28), gdzie: fj(x), r(x) -dane f. ciągłe na obcinku [a;b], αjk,βjk,γj -dane stałe. J. r(x)=0 to równanie (27) naz. jednorodnym, j. γj=0 to odpowiednie warunki brzegowe naz. jednorodnymi. Zagadnienie brzegowe naz. jednorodnym, gdy r(x)=0 i γj=0. Rozwiązanie zagadnienia brzegowego polega na znalezieniu takiej f. y(x) która spełnia równanie (27) i warunki (28). Niech będzie dane równanie różniczkowe rzędu drugiego L(y)=f0(x)y+f1(x)y'+f2(x)y''(x)=r(x) z warunkami brzegowymi: γ1=s1=α10y(a)+β10y(b)+α11y'(a)+β11y'(b); γ2=s2=α20y(a)+β20y(b)+α21y'(a)+β21y'(b) (29). Z najczęściej stosowanych zagadnień brzegowych jest zagadnieniem trzech typów na końcach przedziału [a;b]. Pierwsze zagadnienie na wartości y(x) na końcach [a;b] y(a)=ya; y(b)=yb (30) α10=1, β20=1, αjk=βjk=0 dla k=1, β10=0, α20=0. Drugie zagadnienie y'(a)= γa; y'(b)= γb (31). Trzecim zagadnieniem nazywamy zadanie kombinację liniową: {α10y(a)+α11y'(a)=γ1; β20y(b)+β21y'(b)=γ2} (32) U podstaw met. różnicowej leży zastąpienie zależności różniczkowych związkami różnic skończonych. Oznaczmy punkty przedziału [a;b] przez xi=x0+ih, h=(b-a)/n, (i=0,1,...,n). Niech y(xi) jest wartością szukanej f., a jej wartości przybliżone to yi. Zastępujemy pochodne ilorazami różnicowymi y'(xi)≈[y(xi+1)-y(xi-1)]/2h=(yi+1-yi-1)/2h (33); y''(xi)≈[y(xi+1)-2y(xi)+y(xi-1)]/h2=(yi+1-2yi+yi-1)/h2 (34). W przypadku ogólnym dla k parzystego mamy y(k)(xi)≈(1/hk)Δkyi-k/2 i nieparzystym y(k)(xi)=1/2hk(Δkyi-[(k+1)/2]+Δkyi-[(k+1)/2]). Podstawiając do równania (27) zamiast pochodnych iloraz różnicowy otrzymamy tzw. równanie różnicowe. Postępując dokładnie tak samo z warunkami brzegowymi sprowadzamy rozwiązanie zagadnienia brzegowego do rozwiązania ukł. równań algebraicznych względem yi. Np.: y''+x2y+2=0; y(-1)=y(1)=0; a=-1, b=1. Dzielimy przedział [a;b]=[-1;1] na części o dł. h=½. RYS.23 Na podstawie warunków brzegowych i symetrii zadania mamy y-2=y2=0; y-1=y1. Dlatego zagadnienie sprowadza się do znalezienia 2 niewiadomych y0 i y1. Równanie różnicowe zapisujemy w postaci: {2+(y1-2y0+y1)/h2=0, dla x=0; ¼y1+2+(0-2y1+y0)/h4=0, dla x=½} ⇒ {y0=1,05; y1=0,8} 8.Met. „przeganiania”. Przy rozwiązywaniu wielu specjalnych zagadnień, np. przy obliczaniu reaktorów jądrowych, mamy często do czynienia z równaniami różnicowymi postaci Aiyi-1-Ciyi+Biyi+1=-Fi (35), przy warunkach brzegowych -C0y0+B0y1=-F0 (36); ANyN-1-CNyN=-Fn (37), gdzie i=1,2,...,N-1; Ai,Bi,Ci,Fi -dane liczby dodatnie, yi -f. szukana. Do rozwiązywania ukł. równań liniowych algebraicznych z macierzą trój-diagonalną, bardzo wygodne jest szukanie rozw. ukł. (35) w postaci yi=αi+1yi+1+βi+1 (38). Dla i-1 mamy yi-1=αiyi+βi=αi(αi+1yi+1+βi+1)+βi (39). podstawiając (38)(39) w (35) mamy (Aiαiαi+1-Ciαi+1+βi)yi+1+(Aiαiβi+1+Aiβi-Ciβi+1+Fi)=0. Żeby były spełnione równości =0 Aiαiαi+1-Ciαi+1+βi=0 ⇒ αi+1=Bi/(Ci-αiAi) (40); Aiαiβi+1+Aiβi-Ciβi+1+Fi=0 ⇒ βi+1=(Aiβi+Fi)/(Ci-αiAi) (41). Współczynniki „przeginania” αi+1, βi+1 można obliczać rekurencyjnie ze wzorów (40)(41) j. dane są α1 i βi. Dla znalezienia ich wykorzystujemy warunek brzegowy (36) i wzór (38) dla i=0 y0=y1B0/C0+F1/C0 (36') y0=α1y1+β1 (38'). Z porównania (36') i (38') mamy α1=B0/C0, β1=F1/C0. Następnie wykorzystujemy warunek brzegowy (36) i wzór (38) dla i=N-1, mamy ANyN-1-CNyN==FN (36'') ma rozw. względem yN=(ANβN+FN)/(CN-αNAN) (42). Teraz można obliczyć rekurencyjnie niewiadomą yi na podstawie wzoru (38) dla i=N-1, N-2, ..., y0.