Wykład 8
Rzutem ortogonalnym wektora u na wektor v nazywamy wektor u
v
∈
Lin(v) taki, że u − u
v
⊥v.
Twierdzenie 1 W każdej przestrzeni euklidesowej dla dowolnych wektorów
u, v istnieje dokładnie jeden rzut wektora u na wektor v.
Dowód Jeśli u = 0 lub v = 0 to twierdzenie jest oczywiste. Niech u i v będą
wektorami niezerowymi. Wektor u
v
ma postać kv. Ponieważ (u − u
v
|v) = 0
to 0 = (u − kv|v) = (u|v) − k(v|v) i mamy k =
(u|v)
(v|v)
. To dowodzi istnienia i
jednoznaczności.
Twierdzenie 2 Niech v
1
, v
2
, . . . , v
n
będzie bazą ortonormalną przestrzeni eu-
klidesowej V . Wtedy każdy wektor v ∈ V może być przedstawiony w postaci
v = (v|v
1
)v
1
+ (v|v
2
)v
2
+ . . . + (v|v
n
)v
n
.
Dowód Ponieważ v
1
, v
2
, . . . , v
n
jest bazą przestrzeni V to dla dowolnego
wektora v istnieją skalary k
1
, k
2
, . . . , k
n
, takie że:
v = k
1
v
1
+ k
2
v
2
+ . . . + k
n
v
n
Obliczmy (v|v
1
) = (k
1
v
1
+ k
2
v
2
+ . . . + k
n
v
n
|v
1
) = k
1
(v
1
|v
1
) + k
2
(v
2
|v
1
) + . . . +
k
n
(v
n
|v
1
), ponieważ baza jest ortonormalna to ostatnie wyrażenie jest równe
k
1
, a więc:
(v|v
1
) = k
1
Podobnie udowadnia się, że k
i
= (v|v
i
).
Rzutem ortogonalnym wektora v na podprzestrzeń U < V nazywamy
wektor v
U
, taki że v
U
∈ U i v − v
U
∈ U
⊥
.
Twierdzenie 3 Niech U będzie podprzestrzenią skończenie wymiarowej, unor-
mowanej przestrzeni euklidesowej V . Wtedy dla dowolnego wektora v ∈ V
istnieje wyznaczony jednoznacznie rzut wektora v na podprzestrzeń U .
Dowód Niech v
1
, . . . , v
n
będzie bazą ortonormalną przestrzeni U . Wtedy
poszukiwany wektor v
U
da się zapisać w postaci v
U
= k
1
v
1
+ k
2
v
2
+ . . . + k
n
v
n
.
Na podstawie poprzedniego twierdzenia mamy: k
i
= (v
U
|v
i
). Ponieważ v −
v
U
∈ U
⊥
to mamy (v − v
U
|v
i
) = 0 dla i ∈ {1, . . . , n}, zatem (v
U
|v
i
) = (v|v
i
).
Zatem poszukiwanym rzutem wektora v na podprzestrzeń U jest wektor:
k
1
v
1
+ k
2
v
2
+ . . . + k
n
v
n
taki, że k
i
= (v|v
i
).
Dowody powyższych Twierdzeń dają również algorytmy szukania rzutów.
1
Nierówność Bessela
Twierdzenie 4 Niech v
1
, v
2
, . . . , v
n
będzie bazą ortonormalną podprzestrzeni
U przestrzeni euklidesowej V . Wtedy dla każdego wektora v ∈ V zachodzi
nierówność Bessela:
(v|v
1
)
2
+ (v|v
2
)
2
+ . . . + (v|v
n
)
n
¬ kvk
2
przy czym równość zachodzi wtedy i tylko wtedy gdy v ∈ U .
Dowód Wiemy, że (v − v
U
|v − v
U
) 0. Z poprzedniego twierdzenia mamy:
(v − v
U
|v − v
U
) = (v −
n
X
i=1
(v|v
i
)v
i
|v −
n
X
i=1
(v|v
i
)v
i
) = (v|v) −
n
X
i=1
(v|v
i
) 0
a stąd mamy rządaną nierówność.
Nierówność Bessela mówi, że norma rzutu ortogonalnego jest mniejsza
bądź równa od normy wektora.
Metoda najmniejszych kwadratów
Rozważmy układ m równań liniowych z n niewiadomymi o współczynni-
kach rzeczywistych:
a
11
x
1
+ a
12
x
2
+ . . . + a
1n
x
n
= b
1
a
21
x
1
+ a
22
x
2
+ . . . + a
2n
x
n
= b
2
. . . . . . . . .
a
m1
x
1
+ a
m2
x
2
+ . . . + a
mn
x
n
= b
m
Założymy, że m > n, a rząd macierzy współczynników jest równy n. Mo-
że się zdarzyć, że w wyniku pewnych pomiarów fizycznych pojawi się taki
układ równań. Z powodu niedokładności pomiarów taki układ może nie mieć
rozwiązań. Trzeba więc znaleźć rozwiązanie przybliżone. Jedną z metod roz-
wiąznia przybliżonego jest tak zwana metoda najmniejszych kwadratów to
znaczy znalezienie takich elementów y
1
, y
2
, . . . , y
n
, żeby suma kwadratów:
m
X
i=1
n
X
j=1
a
ij
y
j
− b
i
2
była najmniejsza. Niech f = (b
1
, b
2
, . . . , b
m
), h
i
= (a
1i
, a
2i
, . . . , a
mi
), i =
1, 2, . . . , n będą wektorami z przestrzeni R
m
. Wtedy powyższa suma przyj-
muje najmniejszą wartość jeśli (y
1
, y
2
, . . . , y
n
) jest rzutem wektora f na pod-
przestrzeń rozpiętą na wektorach h
1
, h
2
, . . . , h
n
. Zatem elementy y
1
, y
2
, . . . , y
n
2
spełniają układ:
(h
1
|h
1
)y
1
+ (h
1
|h
2
)y
2
+ . . . + (h
1
|h
n
)y
n
= (h
1
|f )
(h
2
|h
1
)y
1
+ (h
2
|h
2
)y
2
+ . . . + (h
2
|h
n
)y
n
= (h
2
|f )
. . . . . . . . .
(h
n
|h
1
)y
1
+ (h
n
|h
2
)y
2
+ . . . + (h
n
|h
n
)y
n
= (h
n
|f )
gdzie (|) oznacza standardowy iloczyn skalarny w przestrzeni R
n
(jest to
również sposób wyznaczania rzutu wektora na podprzestrzeń). Wyznacznik
macierzy współczynników tego układu nazywamy wyznacznikiem Grama.
Zadanie Rozwiązać metodą najmniejszych kwadratów układ:
x + y = 3
2x + y = 5
x − y = 2
Rozwiązanie Układ ten jest sprzeczny. Poszukamy więc takiego rozwiązania
przybliżonego x
1
, y
1
aby wyrażenie:
(x
1
+ y
1
− 3)
2
+ (2x
1
+ y
1
− 5)
2
+ (x
1
− y
1
− 2)
2
przyjmowało najmniejszą wartość. Do tego wykorzystamy metodę najmniej-
szych kwadratów. Przyjmijmy f = (3, 5, 2), h
1
= (1, 2, 1), h
2
= (1, 1, −1).
Obliczmy:
(h
1
|h
1
) = 6, (h
1
|h
2
) = 2, (h
1
|f ) = 15,
(h
2
|h
1
) = 2, (h
2
|h
2
) = 3,
(h
2
|f ) = 6
Zatem przybliżone rozwiązanie (w sensie najmniejszych kwadratów) spełnia
układ:
(
6x
1
+ 2y
1
= 15
2x
1
+ 3y
1
= 6
Formy dwuliniowe
Niech V będzie przestrzenią liniową nad ciałem K (=R lub C). Funkcję:
f : V × V → K
nazywamy formą dwuliniową jeśli ∀u, v, w ∈ V, ∀k ∈ K mamy:
(i) f (u + v, w) = f (u, w) + f (v, w),
(ii) f (ku, v) = kf (u, v),
(iii) f (u, v + w) = f (u, v) + f (u, w),
(iv) f (u, kv) = ¯
kf (u, v).
3
Przykładem formy dwuliniowej może być iloczyn skalarny w przestrzeni eu-
klidesowej.
Przyjmijmy teraz V = R
n
, u = (x
1
, x
2
, . . . , x
n
), v = (y
1
, y
2
, . . . , y
n
) wtedy
jeśli f jest formą dwuliniową to istnieją współczynniki g
ij
, i, j ∈ {1, . . . , n},
że:
f (u, v) =
n
X
i=1
n
X
j=1
g
ij
x
i
y
j
dla każdych u, v. Wtedy dla macierzy G = [g
ij
] mamy:
f (u, v) = (x
1
, x
2
, . . . , x
n
)G
y
1
y
2
..
.
y
n
Można zauważyć, że jeśli e
1
, e
2
, . . . , e
n
oznacza bazę kanoniczną to g
ij
=
f (e
i
, e
j
).
Formę f nazywamy formą symetryczną jeśli ∀u, v ∈ V mamy f (u, v) =
f (v, u).
Stwierdzenie 1 Forma f jest symetryczna wtedy i tylko wtedy gdy macierz
G tej formy jest symetryczna (to znaczy G = G
T
).
Niech A = [a
ij
] będzie macierzą nad ciałem liczb zespolonych. Wtedy
A
∗
= A
T
= [a
ij
]
T
. Macierz A nazywamy macierzą hermitowską jeśli A
∗
=
A.
Formę f nazywamy formą hermitowską jeśli jej macierz współczynników G
jest hermitowska. Zatem forma hermitowska spełnia tożsamość: ∀u, v ∈ V :
f (u, v) = f (v, u).
Macierz A nazywamy macierzą ortogonalną (unitarną) jeśli A
T
A = I (AA
∗
=
I).
Macierz A nazywamy macierzą normalną jeśli AA
T
= A
T
A (AA
∗
= A
∗
A).
Forma kwadratowa
Funkcję:
g : V → R
nazywamy formą kwadratową jeśli istnieje forma dwuliniowa f : V × V →
R, taka że ∀v ∈ V,
g(v) = f (v, v).
Twierdzenie 5 Jeśli g jest formą kwadratową w przestrzeni V = R
n
to
istnieje dokładnie jedna symetryczna forma dwuliniowa f , że dla każdego
v ∈ V mamy g(v) = f (v, v).
4
Symetryczną formę dwuliniową f nazywamy formą biegunową formy kwa-
dratowej g.
Dowód Wystarczy przyjąć:
f (u, v) =
1
2
(g(u + v) − g(u) − g(v))
Zadanie Niech
g(x
1
, x
2
, x
3
) = (x
1
, x
2
, x
3
)
1
2
3
1 −1 2
2
1
0
x
1
x
2
..
.
x
n
Znaleźć biegunową formę dwuliniową tej formy kwadratowej.
Można zauważyć, że jeśli g jest formą kwadratową w przestrzeni R
n
to:
g(x
1
, x
2
, . . . , x
n
) =
n
X
i=1
g
ii
x
2
i
+ 2
n
X
i=1,j=1,i<j
g
ij
x
i
x
j
= (x
1
, x
2
, . . . , x
n
)G
x
1
x
2
..
.
x
n
gdzie G jest macierzą symetryczną, o współczynnikach g
ij
. Wtedy biegunowa
forma dwuliniowa ma postać:
f (u, v) = (x
1
, x
2
, . . . , x
n
)G
y
1
y
2
..
.
y
n
Każdą formę kwadratową możemy skojarzyć z pewną macierzą symetryczną
G.
Oznaczmy przez G
i
macierz wymiaru i×i, która powstaje z macierzy G przez
wykreślenie wierszy i kolumn o numerach i + 1, i + 2, . . . , n. Wtedy det G
i
nazywamy minorem głównym macierzy G.
Formę kwadratową g : R
n
→ R nazywamy dodatnio określoną jeśli ∀v ∈
R
n
\ {(0, 0, . . . , 0)} mamy g(v) > 0.
Twierdzenie 6 Forma g wyznaczona przez macierz symetryczną G jest do-
datnio określona wtedy i tylko wtedy gdy wszystkie minory główne det G
i
są
dodatnie.
5