Procedura parametryczna z warunkami na niewiadome
Sformułowanie zadania wyrównawczego z warunkami
Cov(L) = CLL = C
Część funkcjonalna
V = Ax + L
przy czym rozwiązanie ma spełniać dodatkowe warunki
Sx + W = 0
Występowanie warunków wiążących parametry oznacz, że są one zależne. Analizując kolejne równania warunkowe wybieramy w każdym z równań jeden parametr zależny od pozostałych. W ten sposób uzyskamy dwie grupy parametrów, które nazwiemy parametrami właściwymi i parametrami dodatkowymi a układ równań warunkowych przybiera formę
Sdxd+Swxw+W = 0
Stąd mamy parametry dodatkowe w jawnej postaci
xd=−Sd−1Swxw−Sd−1W
Umożliwia ona ograniczenie liczby parametrów i uwolnienie zadania wyrównawczego od uwarunkowania oraz ujawnia niezależność liniową warunków.
Rozwiązanie metodą wielkich wag
Metoda wielkich wag jest metodą numeryczną sprowadzającą trudne zadanie uwarunkowane do prostszego - parametrycznego. Warunki zamieniamy na obserwacje o bardzo małych odchyleniach standardowych – ze względów numerycznych powinniśmy przyjmować dokładność takich quasi-obserwacji o 2-3 rzędy wyższą od oryginalnych obserwacji.
Funkcja Lagrange’a minimum uwarunkowanego
Zadanie uwarunkowane charakteryzuje funkcja Lagrange’a w której wykorzystano współczynniki nieoznaczone Lagrange’a k nazywane tradycyjnie w geodezji korelatami.
$$\text{Lag}\left( \mathbf{x,k} \right) = \mathbf{v}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{v + 2}\mathbf{k}^{\mathbf{T}}\left( \mathbf{Sx + W} \right)\mathbf{=}\left( \mathbf{Ax + L} \right)^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\left( \mathbf{Ax + L} \right)\mathbf{+ 2}\mathbf{k}^{\mathbf{T}}\left( \mathbf{Sx + W} \right)\mathbf{=}\mathbf{x}^{\mathbf{T}}\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{Ax + 2}\mathbf{k}^{\mathbf{T}}\mathbf{Sx + 2}\mathbf{x}^{\mathbf{T}}{\overset{\check{}}{\mathbf{A}}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L + 2}\mathbf{k}^{\mathbf{T}}\mathbf{W +}\mathbf{L}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L}$$
Funkcja Lagrange’a nie ma ograniczeń −∞<Lag < ∞
Rozwiązanie zadania określają warunki Kuhna-Tuckera dla punktu siodłowego
$$\frac{\mathbf{\partial}\text{Lag}}{\mathbf{\partial}\overset{\check{}}{\mathbf{x}}}\mathbf{= 2}\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{Ax + 2}\mathbf{S}^{\mathbf{T}}\mathbf{k + 2}\mathbf{A}^{\mathbf{T}}\mathbf{L}\mathbf{C}^{\mathbf{- 1}}\mathbf{= 0}$$
$$\frac{\mathbf{\partial}\text{Lag}}{\mathbf{\partial k}}\mathbf{= 2\ Sx + 2}\mathbf{W = 0}$$
Stąd układ równań normalnych Lagrange’a
$$\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{A} & \mathbf{S}^{\mathbf{T}} \\
\mathbf{S} & \mathbf{0} \\
\end{bmatrix}\begin{bmatrix}
\mathbf{x} \\
\mathbf{k} \\
\end{bmatrix}\mathbf{+}\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L} \\
\mathbf{W} \\
\end{bmatrix}\mathbf{= 0}$$
Wprowadzając łączny wektor niewiadomych oraz macierze blokowe
$$\mathbf{y =}\begin{bmatrix}
\mathbf{x} \\
\mathbf{k} \\
\end{bmatrix}\mathbf{;\ \ \ \ \ \ \ \ \ \ \Lambda}\mathbf{=}\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{A} & \mathbf{S}^{\mathbf{T}} \\
\mathbf{S} & \mathbf{0} \\
\end{bmatrix}\mathbf{,\ \ \ \ \ \ }\mathbf{\Omega}\mathbf{=}\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L} \\
\mathbf{W} \\
\end{bmatrix}$$
Funkcję Lagrange’a zapiszemy w postaci
Lag = yTΛy + 2yTΩ+LTL
a układ równań normalnych Lagrange’a w postaci
$$\frac{\mathbf{1}}{\mathbf{2}}\frac{\mathbf{d}\text{Lag}}{\mathbf{\text{dy}}}\mathbf{=}\mathbf{\Lambda}\mathbf{y +}\mathbf{\Omega = 0}$$
stąd rozwiązanie nieoznaczone
y = −Λ−1Ω
Macierz Λ posiada wartości własne dodatnie - odpowiadające podprzestrzeni x oraz ujemne – odpowiadające podprzestrzeni k.
Analiza dokładności rozwiązania
Oznaczymy bloki macierzy odwrotnej obliczonej dowolną metoda numeryczną
$${\mathbf{\Lambda}^{\mathbf{- 1}}\mathbf{=}\begin{bmatrix}
\mathbf{\Lambda}_{\mathbf{\text{xx}}}^{\mathbf{- 1}} & \mathbf{\Lambda}_{\mathbf{\text{xk}}}^{\mathbf{- 1}} \\
\mathbf{\Lambda}_{\mathbf{\text{kx}}}^{\mathbf{- 1}} & \mathbf{\Lambda}_{\mathbf{\text{kk}}}^{\mathbf{- 1}} \\
\end{bmatrix}\mathbf{=}\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{A} & \mathbf{S}^{\mathbf{T}} \\
\mathbf{S} & \mathbf{0} \\
\end{bmatrix}}^{\mathbf{- 1}}\mathbf{=}\begin{bmatrix}
\mathbf{D} & \mathbf{E}^{\mathbf{T}} \\
\mathbf{E} & \mathbf{F} \\
\end{bmatrix}$$
Z definicji macierzy odwrotnej MM−1=I wynikają związki
ATC−1A D+STE = I
ATC−1A ET+STF = 0
S D = 0
S ET=I
Zapiszemy rozwiązanie w postaci rozwiniętej
$$\hat{\mathbf{y}}\mathbf{= -}\mathbf{\Lambda}^{\mathbf{- 1}}\mathbf{\Omega} = \begin{bmatrix}
\hat{\mathbf{x}} \\
\hat{k} \\
\end{bmatrix} = - \begin{bmatrix}
\mathbf{D} & \mathbf{E}^{\mathbf{T}} \\
\mathbf{E} & \mathbf{F} \\
\end{bmatrix}\begin{bmatrix}
\mathbf{A}^{\mathbf{T}}\mathbf{L} \\
W \\
\end{bmatrix} = - \begin{bmatrix}
\mathbf{\text{D\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L +}\mathbf{E}^{\mathbf{T}}\mathbf{W} \\
\mathbf{E}\ \mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{L + FW} \\
\end{bmatrix}$$
Analiza dokładności wyznaczonych parametrów
$$\mathbf{C}_{\hat{\mathbf{x}}\hat{\mathbf{x}}}\mathbf{=}\frac{\mathbf{\text{dx}}}{\mathbf{\text{dL}}}C_{\text{LL}}\left( \frac{\mathbf{\text{dx}}}{\mathbf{\text{dL}}} \right)^{\mathbf{T}}\mathbf{=}\mathbf{\text{D\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{\ \ C\ \ \ }}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{AD}}$$
Z równania i) mamy ATC−1A D = I−STE
Wstawiając otrzymamy $\mathbf{C}_{\hat{\mathbf{x}}\hat{\mathbf{x}}}\mathbf{=}\mathbf{\text{D\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{AD}}\mathbf{= D}\mathbf{-}{\mathbf{D}\mathbf{\text{\ S}}}^{\mathbf{T}}\mathbf{E}$
Z równania iii) mamy (SD)T=DT ST=D ST=0
co prowadzi do wyzerowania ostatniego składnika i w efekcie
$\mathbf{C}_{\hat{\mathbf{x}}\hat{\mathbf{x}}}\mathbf{=}\mathbf{\text{D\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{AD}}\mathbf{= D}$
Należy podkreślić, że macierz D o takiej własności nazywany odwrotnością uogólnioną i oznaczamy
D=(ATC−1A)−
Ostatecznie $\mathbf{C}_{\hat{\mathbf{x}}\hat{\mathbf{x}}}\mathbf{=}\mathbf{\Lambda}_{\mathbf{\text{xx}}}^{\mathbf{- 1}}\mathbf{=}\left( \mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{A} \right)^{\mathbf{-}}$
Analiza dokładności wyznaczonych korelat
$$\mathbf{C}_{\mathbf{\text{kk}}}\mathbf{=}\frac{\mathbf{\text{dk}}}{\mathbf{\text{dL}}}C_{\text{LL}}\left( \frac{\mathbf{\text{dk}}}{\mathbf{\text{dL}}} \right)^{\mathbf{T}}\mathbf{= E}\mathbf{\text{\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{\ \ C\ \ }}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{A\ }}\mathbf{E}^{\mathbf{T}}$$
Z równania ii) mamy ATC−1A ET=−STF
Wstawiając otrzymamy Ckk= − ESTF
Z równania iv) otrzymamy E ST=I
Stąd ostatecznie Ckk= − F = −Λkk−1
Analizujemy poprawkę
$$\hat{\mathbf{V}}\mathbf{= A}\hat{\mathbf{x}}\mathbf{+ L}\mathbf{=}\left( \mathbf{I - A\ D\ A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}} \right)\mathbf{L + A}\mathbf{E}^{\mathbf{T}}\mathbf{W}$$
Traktując V jako funkcję L otrzymamy
$$\mathbf{C}_{\hat{\mathbf{V}}\hat{\mathbf{V}}}\mathbf{=}\frac{\mathbf{d}\hat{\mathbf{V}}}{\mathbf{\text{dL}}}C_{\text{LL}}\left( \frac{\mathbf{d}\hat{\mathbf{V}}}{\mathbf{\text{dL}}} \right)^{\mathbf{T}}\mathbf{=}$$
=(I − A D ATC−1)C(I−C−1A D AT)=C−A D AT−A D AT+A D ATC−1A D AT
Z własności v) mamy A (D ATC−1A D )AT=A D AT
stąd $\mathbf{C}_{\hat{\mathbf{V}}\hat{\mathbf{V}}}\mathbf{=}{\mathbf{C}\mathbf{- A\ D\ A}}^{\mathbf{T}}$
Łatwo zauważyć, że macierz I − A D AT jest idempotentna.
Ostatecznie $\mathbf{C}_{\hat{\mathbf{V}}\hat{\mathbf{V}}}\mathbf{=}\mathbf{C}\mathbf{- A\ }\mathbf{\Lambda}_{\mathbf{\text{xx}}}^{\mathbf{- 1}}\mathbf{\text{\ A}}^{\mathbf{T}}\mathbf{= I - A}\left( \mathbf{A}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{A} \right)^{\mathbf{-}}\mathbf{A}^{\mathbf{T}}$
Analizujemy wyrównane obserwacje
$$\hat{\mathbf{L}}\mathbf{=}\mathbf{L}^{\mathbf{\text{przybl}}}\mathbf{+ A}\hat{\mathbf{x}}$$
$$\mathbf{C}_{\hat{L}\hat{L}}\mathbf{=}\frac{\mathbf{d}\hat{L}}{\mathbf{d}\hat{\mathbf{x}}}\mathbf{\ }\mathbf{C}_{\hat{\mathbf{x}}\hat{\mathbf{x}}}\mathbf{\ }\left( \frac{\mathbf{d}\hat{L}}{\mathbf{d}\hat{\mathbf{x}}} \right)^{\mathbf{T}}\mathbf{= AD}\mathbf{A}^{\mathbf{T}}$$
Stąd analiza wariancji
$$\mathbf{C =}\mathbf{C}_{\hat{L}\hat{L}}\mathbf{+}\mathbf{C}_{\hat{\mathbf{V}}\hat{\mathbf{V}}}$$
$$\mathbf{C}_{\hat{L}\hat{V}}\mathbf{=}\frac{\mathbf{d}\hat{L}}{\mathbf{d}\mathbf{L}}C_{\text{LL}}\left( \frac{\mathbf{d}\hat{\mathbf{V}}}{\mathbf{\text{dL}}} \right)^{\mathbf{T}}\mathbf{= A}\mathbf{\text{D\ A}}^{\mathbf{T}}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{\ \ }}\mathbf{C}\mathbf{\text{\ \ }}\left( {\mathbf{I -}\mathbf{C}^{\mathbf{- 1}}\mathbf{\text{A\ D\ A}}}^{\mathbf{T}} \right)\mathbf{\ }$$
=AD AT−AD ATC−1A D AT=0
po uwzględnieniu własności v)
W ten sposób wykazaliśmy niezależność wyrównanych obserwacji $\hat{L}$ i poprawek $\hat{\mathbf{V}}$
Skutki uwarunkowania
Rozpatrzymy dwa przypadki odwracania macierzy blokowych o strukturze macierzy Λ.
$$\mathbf{\Lambda =}\begin{bmatrix}
d & s^{T} \\
s & 0 \\
\end{bmatrix}$$
Przypadek 1
Zakładamy, że istnieje d−1.
Budujemy macierzowy układ równań o wyrazie wolnym równym macierzy jednostkowej
d | sT |
I | 0 |
---|---|---|---|
s | 0 | 0 | I |
Przeprowadzimy operacje liniowe na wierszach, tak aby lewa część tabeli stała się blokową macierzą jednostkową – wówczas w prawej części otrzymamy macierz odwrotną Λ−1. Rozpoczynamy od pierwszej kolumny. Pierwsze równanie mnożymy przez odwrotność elementu diagonalnego. Następnie zerujemy początkowy blok w drugim wierszu w wyniku dodawania do równania drugiego równania pierwszego pomnożonego przez ujemny blok zerowany.
I | d−1 sT |
d−1 | 0 |
---|---|---|---|
0 | −sd−1 sT |
-sd−1 | I |
Następnie przekształcamy drugą kolumnę. Drugie równanie mnożymy przez odwrotność elementu diagonalnego, a następnie zerujemy element wiersza pierwszego przy pomocy równania drugiego.
I | 0 | d−1 − d−1 sT(sd−1 sT)−1 sd−1 | d−1 sT (sd−1 sT)−1 |
---|---|---|---|
0 | I | (sd−1 sT)−1 sd−1 | −(sd−1 sT)−1 |
Analizowany przypadek odpowiada sytuacji w której liczba warunków jest większa od defektu macierzy ATA czyli
rank ATA + rank S > rank Λ = u + w
Oznacza to zniekształcanie obserwacji przez warunki, jego miarą jest ujemna wariancja korelat reprezentowana elementem drugiego wiersza i drugiej kolumny macierzy odwrotnej
Λkk−1=−(sd−1 sT)−1
Przypadek 2
Oryginalny układ równań poprawek o rzędzie r = rank ATA
uzupełniamy niezależnymi warunkami w = d = u − r
czyli zachodzi rank ATA + rank S = rank Λ = u + w
Macierze S, ATA dzielimy na bloki o wymiarach r, w tak, aby uzyskać macierz pełnego rzędu
$\mathbf{A}^{\mathbf{T}}\mathbf{A} = \begin{bmatrix} d_{11} & d_{12} \\ d_{12}^{T} & d_{22} \\ \end{bmatrix}$ ; $\mathbf{S} = \begin{bmatrix} s_{1} & s_{2} \\ \end{bmatrix}$
Macierze d22 i s2 są kwadratowe i mają takie same wymiary.
Interesuje nas fragment macierzy odwrotnej odpowiadający wariancji korelat.
Budujemy macierzowy układ równań z jedną kolumna wyrazów wolnych odpowiadającej trzeciej kolumnie blokowej macierzy jednostkowej
d11 |
d12 |
s1T |
0 |
---|---|---|---|
d12T |
d22 |
s2T |
0 |
s1 |
s2 |
0 | I |
Z założeń podziału na bloki wynika, że istnieje d11−1. Mnożąc przez tą odwrotność pierwsze równanie a następnie rugując z drugiego otrzymamy układ
I | d11−1d12 |
d11−1s1T |
0 |
---|---|---|---|
0 | d22 − d12Td11−1d12 |
s2T-d12Td11−1s1T | 0 |
0 | s2 − s1d11−1d12 |
−s1d11−1s1T |
I |
d22 − d12Td11−1d12 = 0
q = s2 − s1d11−1d12
Układ przybiera postać
I | d11−1d12 |
d11−1s1T |
0 |
---|---|---|---|
0 | 0 |
qT |
0 |
0 | q |
−s1d11−1s1T |
I |
Mnożymy drugie równanie przez (q−1)T i rugujemy z pozostałych
I | d11−1d12 |
0 |
0 |
---|---|---|---|
0 | 0 |
I |
0 |
0 | q |
0 |
I |
Mnożymy trzecie równanie przez q−1 i rugujemy z pierwszego
I | 0 |
0 |
−d11−1d12q−1 |
---|---|---|---|
0 | 0 |
I |
0 |
0 | I |
0 |
q−1 |
Zamieniamy równania 2 z 3
I | 0 |
0 |
−d11−1d12q−1 |
---|---|---|---|
0 | I |
0 |
q−1 |
0 | 0 |
I |
0 |
Uzyskaliśmy ZEROWĄ wariancję korelat
Λkk−1=0
Jest to wyróżnik uwarunkowania niezniekształcającego