Przybliżone metody chemii kwantowej
Dwie rodziny metod:
metody rachunku zaburzeń (metody perturbacyjne);
metody wariacyjne.
Metody wariacyjne
Schemat każdej metody wariacyjnej opiera się na następującym rozumowaniu:
Mamy dane równanie Schrödingera, które jest zbyt trudne (ze względu na skomplikowaną strukturę elektronową układu), aby można je było rozwiązać w sposób ścisły:
Chcemy zatem otrzymać rozwiązania (czyli energie En i funkcje ψn) w postaci przybliżonej. Najczęściej interesuje nas stan o najniższej energii, czyli stan podstawowy układu, a więc E0 i ψ0.
Oczywiście energie En wszystkich innych stanów (dla n>0) będą większe od E0 (energii stanu podstawowego): E0<En (dla n>0).
Bierzemy pewną (dowolną) funkcję φ (określoną w tej samej przestrzeni co funkcje ψn) i za jej pomocą definiujemy pewną wielkość ε w sposób następujący:
Powyższe równanie przypomina postulat o wartości średniej. Gdyby funkcja φ opisywała jakiś stan, to wartość ε byłaby równa energii układu w tym stanie (jako wartość średnia hamiltonianu).
Pomimo, iż nie znamy poprawnych funkcji własnych naszego układu, czyli ψ0, ψ1, ψ2, ..., wiemy, że tworzą one układ zupełny funkcji ortonormalnych. Możemy więc przedstawić funkcję φ w postaci rozwinięcia
(*)
Zakładając, że funkcja φ jest unormowana, dostajemy:
, czyli
a zatem
Podstawiając rozwinięcie * do wyrażenia na ε i wykorzystując, że funkcja φ jest unormowana a funkcje ψn są ortonormalne mamy:
Ponieważ
, to możemy zapisać, że E0 = E0 ∙
Odejmijmy E0 od lewej strony wyrażenia na ε oraz E0= E0∙
od prawej strony:
Ponieważ: (i) iloczyn cn*∙cn jest zawsze dodatni, (ii) E0 jest zawsze mniejsze od En (gdyż E0 reprezentuje stan o najniższej energii), to:
prawa strona powyższego równania jest zawsze nieujemna
Wobec tego lewa strona musi spełniać warunek: ε - E0 ≥ 0
z czego natychmiast wynika, że ε ≥ E0
Wniosek: wartość średnia ε hamiltonianu obliczona za pomocą dowolnej funkcji φ (określonej w tej samej przestrzeni) nie jest nigdy mniejsza od jego ścisłej wartości własnej E0 , odpowiadającej stanowi podstawowemu ψ0
(gdyby funkcja φ była ścisłą funkcją własną dla stanu podstawowego (czyli φ=ψ0), wówczas otrzymalibyśmy ε=E0 )
Powyższy wniosek stanowi podstawę metody wariacyjnej
Postępowanie w ramach metody wariacyjnej:
(i) wiemy, że wartość ε (obliczona dla dowolnej funkcji φ) jest zawsze większa od dokładnej wartości energii stanu podstawowego
(ii) wiemy, że jeżeli obliczymy ε dla kilku dowolnych funkcji φ1, φ2, φ3, ... uzyskując odpowiednio ε1, ε2, ε3, ... to najmniejsza z wartości εi będzie najbliższa energii stanu podstawowego;
(iii) należy zatem zminimalizować funkcjonał ε[φ], przy czym ε oznacza wartość średnią hamiltonianu obliczoną przy pomocy funkcji φ ;
(iv) bierzemy pewną funkcję próbną φ, zależącą od współrzędnych r1, r2, r3, ... charakteryzujących układ, oraz od kilku parametrów liczbowych c1, c2, c3, ... , czyli
φ = φ (c1, c2, c3, ..., ck ; r1, r2, r3, ..., rn)
Równanie to określa całą klasę funkcji (różniących się między sobą wartościami parametrów c1, c2, c3, ..., ck );
(v) obliczamy wartość ε (zgodnie z postulatem o wartości średniej), a wynikowa wielkość ε będzie tak naprawdę funkcją parametrów c1, c2, c3, ..., ck (czyli ε = ε (c1, c2, c3, ..., ck ) );
(vi) obliczamy minimum ε ze względu na parametry c1, c2, c3, ..., ck
(vii) uzyskana najmniejsza wartość εmin , którą oznaczamy przez E, jest najlepszym przybliżeniem energii stanu podstawowego badanego układu, osiągalnym za pomocą funkcji φ=φ(ci;ri)
(viii) minimalizacja energii ε prowadzi do wyznaczenia wartości współczynników c1, c2, c3, ..., ck a więc w konsekwencji do ustalenia postaci funkcji φ = φ (c1, c2, c3, ..., ck ; r1, r2, r3, ..., rn) , która jest najlepszym przybliżeniem dokładnej funkcji falowej ψ0
(w obrębie rozpatrywanej klasy funkcji).
Zwiększenie liczby parametrów ci prowadzi do poszerzenia rozpatrywanej klasy funkcji a więc zwiększa dokładność wyniku.
Wniosek: uzyskanie bardzo dokładnego wyniku jest wyłącznie kwestią uwzględnienia dostatecznie dużej liczby parametrów wariacyjnych
Liniowe i nieliniowe parametry wariacyjne. Metoda Ritza.
Przykładem funkcji próbnej z parametrem nieliniowym jest np.
Ψ = N(c)∙exp(-c∙r) (r jest zmienną, N(c) to współczynnik normalizacyjny zależny od c, natomiast c jest parametrem wariacyjnym). Parametry wariacyjne nieliniowe są bardzo efektywne w sensie możliwości uzyskania stosunkowo dobrego wyniku przy zastosowaniu niewielkiej liczby takich parametrów.
Wada: nieliniowe parametry prowadzą do bardziej skomplikowanych równań (których rozwiązanie wymaga więcej czasu).
Jeżeli stosujemy liniowe parametry wariacyjne, to mówimy o tzw. metodzie Ritza (a zatem stosowanie metody Ritza polega na użyciu metody wariacyjnej z funkcją próbną zawierającą wyłącznie liniowe parametry wariacyjne). W metodzie Ritza zakładamy więc funkcję próbną postaci φ = c1 χ1 + c2 χ2 +...+ cN χN
Podstawiając powyższe rozwinięcie do równania na ε (postulat o wartości średniej) otrzymujemy:
, czyli
Zdefiniujmy dwie całki:
(całkę Srq nazywamy zazwyczaj całką nakrywania, natomiast całkę Hrq nazywamy elementem macierzowym hamiltonianu).
Wykorzystując te symbole mamy zatem:
Szukamy teraz minimum ε ze względu na współczynniki cr* i cq (współczynniki te są liczbami zespolonymi).
Różniczkujemy ostatnie równanie względem wybranego cp* :
Ponieważ szukamy ekstremum ε jako funkcji cr*, więc założymy
(tzn. że funkcja ε jest minimum ze względu na cp*),
a tę minimalną wartość ε oznaczymy przez E. Otrzymujemy:
czyli
Ostatecznie:
przy czym p = 1, 2, 3, ... , N
Powyższy zapis jest de facto układem równań:
Jest to tzw. układ równań wiekowych
Układ równań wiekowych jest układem równań liniowych jednorodnych. Trywialne rozwiązanie takiego układu odpowiada sytuacji, gdy wszystkie współczynniki ck są równe zero.
Nietrywialne rozwiązania tego układu istnieją wtedy i tylko wtedy, gdy wyznacznik zbudowany ze współczynników przy niewiadomych znika (jest równy zeru).
A zatem: warunkiem rozwiązywalności układu równań wiekowych jest znikanie wyznacznika (tzw. wyznacznika wiekowego):
Wyznacznik wiekowy zapisujemy często w postaci skróconej:
Oczywiste jest, że po rozwinięciu wyznacznika otrzymamy wielomian stopnia N (ze względu na niewiadomą E). Wobec tego, po przyrównaniu wyznacznika do zera, otrzymamy równanie stopnia N. Równanie to będzie miało zatem N pierwiastków (czyli rozwiązań), którymi będzie zbiór wartości E, czyli E1, E2, ..., EN
Energie i współczynniki (uzyskiwane z układu równań wiekowych)
Po rozwiązaniu równania i uzyskaniu jednej z wartości E, np. Ei ,
możemy wstawić pierwiastek Ei do układu równań wiekowych, czyli do
, a następnie znaleźć współczynniki cq odpowiadające danej wartości energii Ei. Ponieważ dla każdej energii otrzymamy inny zestaw współczynników cq, wprowadzimy dodatkowy indeks (aby je rozróżniać), oznaczając przez ciq (i=1,2, ..., N). Czyli np. po uzyskaniu energii E1 możemy z kolei uzyskać współczynniki c11, c12, c13, ..., c1N, odpowiadające tej energii natomiast po uzyskaniu energii E2 możemy z kolei uzyskać współczynniki c21, c22, c23, ..., c2N, odpowiadające energii E2.
Energia i funkcja falowa stanu podstawowego (uzyskiwane z układu równań wiekowych)
Jeżeli Ei jest najmniejszym pierwiastkiem równania uzyskanego przez przyrównanie wyznacznika wiekowego do zera, to wartość ta odpowiada (przybliżonej) energii stanu podstawowego badanego układu, a odpowiednie współczynniki ci1, ci2, ci3, ..., ciN określają (przybliżoną) funkcję falową dla stanu podstawowego, czyli:
φi = ci1 χ1 + ci2 χ2 + ci3 χ3 + ...+ ciN χN
czyli w skróconym zapisie:
96