WYKŁAD
Z ALGEBRY LINIOWEJ Z GEOMETRIĄ
JACEK DĘBECKI
Przypomnienie definicji ciała
Przypomnijmy, że ciałem nazywa się zbiór K z określonymi na nim dwoma
działaniami K × K 3 (α, β) −→ α + β ∈ K i K × K 3 (α, β) −→ αβ ∈ K,
które spełniają następujące warunki:
1) β + α = α + β dla wszystkich α, β ∈ K (przemienność dodawania),
2) (α+β)+γ = α+(β+γ) dla wszystkich α, β, γ ∈ K (łączność dodawania),
3) istnieje oznaczany przez 0 element zbioru K taki, że dla każdego α ∈ K
α + 0 = α (istnienie zera),
4) dla każdego α ∈ K istnieje oznaczany przez −α element zbioru K taki,
że α + (−α) = 0 (istnienie elementów przeciwnych),
5) βα = αβ dla wszystkich α, β ∈ K (przemienność mnożenia),
6) (αβ)γ = α(βγ) dla wszystkich α, β, γ ∈ K (łączność mnożenia),
7) istnieje oznaczany przez 1 element zbioru K taki, że dla każdego α ∈ K
α1 = α (istnienie jedynki),
8) dla każdego α ∈ K \ {0} istnieje oznaczany przez α
−1
element zbioru K
taki, że αα
−1
= 1 (istnienie elementów odwrotnych do niezerowych),
9) (α + β)γ = αγ + βγ dla wszystkich α, β, γ ∈ K (rozdzielność mnożenia
względem dodawania),
10) 1 6= 0.
Oprócz dodawania i mnożenia w ciele K mamy również odejmowanie
określone wzorem α − β = α + (−β) dla α, β ∈ K i dzielenie określone
wzorem α/β = αβ
−1
dla α ∈ K i β ∈ K \ {0} (nie można dzielić przez 0).
Dobrze znanymi przykładami ciał są: ciało liczb wymiernych Q ze zwy-
kłymi działaniami, ciało liczb rzeczywistych R ze zwykłymi działaniami, ciało
liczb zespolonych C ze zwykłymi działaniami, a ponadto dla każdej liczby
pierwszej p ciało Z
p
, czyli zbiór {0, . . . , p − 1} z dodawaniem i mnożeniem
modulo p (przypomnijmy, że działania te wykonuje się biorąc resztę z dzie-
lenia przez p zwykłej sumy i zwykłego iloczynu).
1
Ciało liczb zespolonych
Zbierzemy teraz razem i uporządkujemy podstawowe fakty dotyczące
liczb zespolonych, a przede wszystkim przeprowadzimy formalną konstrukcję
ciała liczb zespolonych wychodząc od ciała liczb rzeczywistych.
Oznaczmy przez C zbiór R
2
(czyli zbiór par liczb rzeczywistych) i zdefi-
niujmy na tym zbiorze dwa działania
(a, b) + (c, d) = (a + c, b + d),
(a, b)(c, d) = (ac − bd, ad + bc).
Ćwiczenie. Sprawdzić, że C z powyższymi działaniami jest ciałem (w C
0 = (0, 0), −(a, b) = (−a, −b), 1 = (1, 0), (a, b)
−1
= (a/(a
2
+b
2
), −b/(a
2
+b
2
)),
gdy (a, b) 6= 0).
Tak skonstruowane ciało C nazywa się ciałem liczb zespolonych, a jego
elementy liczbami zespolonym.
Oznaczając
i = (0, 1),
dostajemy i
2
= (0, 1)(0, 1) = (−1, 0) = −(1, 0), czyli
i
2
= −1.
Z tego powodu liczbę zespoloną i nazywa się jednostką urojoną.
Dowolną liczbę rzeczywistą a utożsamia się z liczbą zespoloną (a, 0). Nie
doprowadzi to do żadnych nieporozumień, bo jeśli weźmiemy dwie liczby rze-
czywiste a i b, potraktujemy je jako liczby zespolone (a, 0) i (b, 0), a następnie
obliczymy według powyższych wzorów sumę albo iloczyn tych liczb zespolo-
nych, to otrzymamy (a + b, 0) albo (ab, 0), czyli to samo, co gdybyśmy a i b
dodali albo pomnożyli jako liczby rzeczywiste, a dopiero później otrzymany
wynik potraktowali jako liczbę zespoloną dopisując 0 jako drugi wyraz pary.
Ponadto, jeśli a 6= b, to oczywiście (a, 0) 6= (b, 0). Formalnie można to ująć
mówiąc, że odwzorowanie
R 3 a −→ (a, 0) ∈ C
jest monomorfizmem ciał. W praktyce po prostu zawsze myślimy, że dowolna
liczba rzeczywista jest też liczbą zespoloną, więc R ⊂ C.
2
Dzięki wprowadzonemu utożsamieniu dla dowolnej liczby zespolonej (a, b)
mamy (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi, zatem dowolną liczbę zespoloną
można zapisać w postaci
a + bi,
gdzie a, b ∈ R. Oczywiście zapis taki jest jednoznaczny (to znaczy jeśli
a + bi = c + di, gdzie a, b, c, d ∈ R, to a = c i b = d)). W praktyce za-
wsze używa się właśnie takiego zapisu. Ułatwia to wykonywanie obliczeń na
liczbach zespolonych, można bowiem przekształcać wyrażenia według reguł
do których jesteśmy przyzwyczajeni, tylko trzeba pamiętać, że i
2
= −1. Na
przykład mnożenie przebiega tak: (a + bi)(c + di) = ac + adi + bci + bdi
2
=
ac + adi + bci − bd = ac − bd + (ad + bc)i.
Dla dowolnej liczby zespolonej a + bi, gdzie a, b ∈ R, definiuje się jej
część rzeczywistą Re (a + bi) = a i część urojoną Im (a + bi) = b oraz liczbę
zespoloną z nią sprzężoną
a + bi = a − bi,
a ponadto wartość bezwzględną (nazywaną też modułem)
|a + bi| =
√
a
2
+ b
2
.
Zauważmy, że wartość bezwzględna dowolnej liczby zespolonej jest nieujemną
liczbą rzeczywistą i że wartości bezwzględne dowolnej liczby rzeczywistej jako
liczby rzeczywistej i jako liczby zespolonej pokrywają się.
Ćwiczenie. Wykazać, że dla wszystkich p, q ∈ C
1) Re p = (p + p)/2, Im p = (p − p)/(2i),
2) p = p wtedy i tylko wtedy, gdy p ∈ R,
3) p = p,
4) p + q = p + q,
5) p − q = p − q,
6) pq = p q,
7) p/q = p/q, pod warunkiem, że q 6= 0,
8) |p + q| ≤ |p| + |q|,
9) |p − q| ≥ ||p| − |q||,
10) |pq| = |p||q|,
11) |p/q| = |p|/|q|, pod warunkiem, że q 6= 0,
12) |p| = 0 wtedy i tylko wtedy, gdy p = 0,
13) pp = |p|
2
.
3
Ostatnia równość pomaga przy dzieleniu liczb zespolonych. Otóż można
pomnożyć dzielną i dzielnik przez sprzężenie dzielnika: (a + bi)/(c + di) =
(a + bi)(c − di)/((c + di)(c − di)) = (ac + bd + (−ad + bc)i)/(c
2
+ d
2
) =
(ac + bd)/(c
2
+ d
2
) + ((−ad + bc)/(c
2
+ d
2
))i.
Liczby zespolone możemy oczywiście utożsamiać z punktami płaszczyzny,
na której jest wybrany prostokątny układ współrzędnych kartezjańskich (w
tym kontekście nazywa się ją płaszczyzną zespoloną). Liczbie zespolonej a+bi,
gdzie a, b ∈ R, odpowiada punkt o współrzędnych (a, b). Widać, że liczbom
rzeczywistym odpowiadają przy tym punkty osi odciętych. Parze liczb zespo-
lonych wzajemnie ze sobą sprzężonych odpowiadają punkty położone syme-
trycznie względem osi odciętych. Wartość bezwzględna liczby zespolonej to
odległość odpowiadającego jej punktu od początku układu współrzędnych.
Jeśli popatrzeć na liczby zespolone jako na wektory zaczepione w początku
układu współrzędnych o końcach w odpowiadających im punktach, to widać,
że dodawanie i odejmowanie liczb zespolonych jest tym samym co dodawanie
i odejmowanie wektorów.
Ćwiczenie. Dlaczego nierówność 8) z poprzedniego ćwiczenia można
nazwać nierównością trójkąta?
Ciekawsza jest interpretacja geometryczną mnożenia i dzielenia liczb ze-
spolonych. By ją podać, musimy zdefiniować argument liczby zespolonej.
Podzbiór 2πZ = {t ∈ R : ∃
k∈Z
t = 2πk} jest podgrupą grupy abelowej
R ze zwykłym dodawaniem. Jest naturalną rzeczą uważać warstwy z grupy
ilorazowej R/(2πZ) za kąty, dlatego będziemy je nazywać kątami. Ponieważ
funkcje cos : R −→ R i sin : R −→ R są okresowe o okresie 2π, to funkcje
R/(2πZ) 3 t + 2πZ −→ cos t ∈ R i R/(2πZ) 3 t + 2πZ −→ sin t ∈ R są
poprawnie określone. Będziemy je również oznaczać przez cos i sin.
Argumentem niezerowej liczby zespolonej a + bi, gdzie a, b ∈ R, nazywa
się jedyny kąt ϕ spełniający warunki
cos ϕ =
a
√
a
2
+ b
2
,
sin ϕ =
b
√
a
2
+ b
2
.
Będziemy go oznaczać przez arg(a + bi). Z geometrycznego punktu widzenia
jest to mierzony w radianach kąt skierowany między dodatnią półosią osi
odciętych a odcinkiem łączącym początek układu współrzędnych z punktem
(a, b).
4
Natychmiastową konsekwencją przyjętych definicji jest równość
p = |p|(cos(arg p) + i sin(arg p))
zachodząca dla p ∈ C \ {0}. Prawą stronę tej równości nazywa się postacią
trygonometryczną niezerowej liczby zespolonej p.
Następne ćwiczenie, w połączeniu z równościami 10) i 11) z ćwiczenia
wcześniejszego oraz postacią trygonometryczną, daje już interpretację geo-
metryczną mnożenia i dzielenia liczb zespolonych.
Ćwiczenie. Wykazać, że dla wszystkich p, q ∈ C \ {0}
arg(pq) = arg p + arg q,
arg(p/q) = arg p − arg q.
Jako wniosek z tego ćwiczenia łatwo uzyskać przez indukcję ze względu
na n ∈ N następujący wzór de Moivre’a
p
n
= |p|
n
(cos(n arg p) + i sin(n arg p))
obowiązujący dla p ∈ C \ {0}.
Na koniec przytoczymy zasadnicze twierdzenie algebry.
Twierdzenie. Ciało liczb zespolonych jest algebraicznie domknięte, czyli
każdy wielomian jednej zmiennej o współczynnikach zespolonych stopnia co
najmniej pierwszego ma pierwiastek zespolony.
Przyjmujemy to twierdzenie bez dowodu. Dość przystępny (choć też nie-
łatwy) dowód, wymagający jedynie podstawowych wiadomości z topologii,
można znaleźć na przykład w podręczniku Gleichgewichta „Algebra”.
Ćwiczenie. Korzystając z zasadniczego twierdzenia algebry udowodnić,
że każdy niezerowy wielomian jednej zmiennej o współczynnikach zespolo-
nych jest iloczynem wielomianów jednej zmiennej o współczynnikach zespo-
lonych stopnia co najwyżej pierwszego.
Ćwiczenie. Korzystając z zasadniczego twierdzenia algebry udowodnić,
że każdy niezerowy wielomian jednej zmiennej o współczynnikach rzeczywi-
stych jest iloczynem wielomianów jednej zmiennej o współczynnikach rzeczy-
wistych stopnia co najwyżej drugiego.
5
Rozwiązywanie układów równań liniowych metodą Gaussa
Omówimy teraz metodę Gaussa rozwiązywania układów równań liniowych
o współczynnikach z dowolnego ciała K. Pozwala ona rozstrzygnąć, czy dany
układ ma rozwiązania w ciele K i gdy ma, wyznaczyć wszystkie. Metoda ta
polega na przekształcaniu układu za pomocą dwóch operacji elementarnych:
dodawania do któregoś równania innego równania pomnożonego przez do-
wolny element ciała K oraz zamiany dwóch równań miejscami. Oczywiście
te operacje przekształcają układ na układ mu równoważny, czyli mający te
same rozwiązania.
Opiszemy najpierw ogólnie odpowiedni algorytm, a później objaśnimy go
na przykładzie.
Przed rozpoczęciem obliczeń równania należy zapisać jedno pod drugim
w ten sposób, by wyrazy zawierające te same niewiadome stały jeden pod
drugim tworząc kolumny po lewej stronie równań, natomiast wyrazy wolne
stały po prawej stronie.
Algorytm można podzielić na dwie części.
W pierwszej sprowadza się układ do postaci „schodkowej”. Ta część składa
się z tylu kroków, ile jest niewiadomych. W trakcie obliczeń będziemy pod-
kreślać niektóre wyrazy, aby móc się potem do nich odwoływać. Przypuśćmy,
że wykonaliśmy k − 1 kroków i mamy wykonać k-ty. Gdy w k-tej kolumnie
brak niezerowych wyrazów leżących niżej niż wszystkie wyrazy dotychczas
podkreślone, to w k-tym kroku nie robimy nic. W przeciwnym wypadku
oznaczmy przez l numer najwyższego z równań leżących niżej niż wszystkie
wyrazy dotychczas podkreślone. Jeśli l-te równanie ma w k-tej kolumnie
wyraz zerowy, to zamieniamy miejscami równanie l-te i któreś (powiedzmy
pierwsze od góry) spośród równań leżących niżej i mających w k-tej kolumnie
wyraz niezerowy. Dzięki temu l-te równanie będzie już miało w k-tej kolum-
nie wyraz niezerowy, czyli wyraz postaci αx
k
, gdzie α 6= 0. Podkreślamy
go. Możemy teraz mnożyć l-te równanie przez odpowiednie elementy ciała
K i dodawać do równań leżących poniżej tak, by po takim przekształceniu
miały one w k-tej kolumnie wyrazy zerowe. Oczywiście, jeśli przekształcane
równanie ma w k-tej kolumnie wyraz βx
k
, to elementem przez który trzeba
pomnożyć l-te równanie jest −β/α.
Po zakończeniu pierwszej części algorytmu pewna ilość ostatnich równań
może mieć zerowe lewe strony. Jeśli choć jedno z nich ma niezerową prawą
stronę, to oczywiste jest, że układ jest sprzeczny, to znaczy nie ma rozwiązań,
6
i algorytm się kończy. Jeśli natomiast wszystkie takie równania mają również
prawe strony zerowe, to można je zignorować, bo zupełnie nic nie wnoszą do
układu.
W drugiej części wylicza się już łatwo po kolei idąc od dołu do góry nie-
wiadome występujące w podkreślonych wyrazach podstawiając za każdym
razem wartości niewiadomych wcześniej obliczonych. W ten sposób niewia-
dome występujące w podkreślonych wyrazach zostaną wyrażone przez po-
zostałe niewiadome, które traktuje się jako parametry mogące przyjmować
dowolne wartości z ciała K. Jasne jest, że otrzymane wzory dają wszystkie
rozwiązania rozpatrywanego układu.
Przykład. Weźmy następujący układ o współczynnikach rzeczywistych
x
1
−2x
2
+x
3
+x
4
−x
5
= 1,
2x
1
−4x
2
+2x
3
+5x
4
−x
5
= 1,
3x
1
−6x
2
+x
3
+x
4
−2x
5
= 3,
−x
1
+2x
2
+x
3
−2x
4
−x
5
= 0.
Krok pierwszy. Podkreślamy wyraz pierwszego równania w pierwszej ko-
lumnie. Mnożymy pierwsze równanie przez −2 i dodajemy do drugiego, przez
−3 i dodajemy do trzeciego, przez 1 i dodajemy do czwartego. Mamy
x
1
−2x
2
+x
3
+x
4
−x
5
=
1,
3x
4
+x
5
= −1,
−2x
3
−2x
4
+x
5
=
0,
2x
3
−x
4
−2x
5
=
1.
Krok drugi. Nie robimy nic.
Krok trzeci. Zamieniamy miejscami równania drugie i trzecie
x
1
−2x
2
+x
3
+x
4
−x
5
=
1,
−2x
3
−2x
4
+x
5
=
0,
3x
4
+x
5
= −1,
2x
3
−x
4
−2x
5
=
1,
po czym podkreślamy wyraz drugiego równania w trzeciej kolumnie. Mno-
żymy drugie równanie przez 0 i dodajemy do trzeciego, przez 1 i dodajemy
do czwartego. Mamy
x
1
−2x
2
+x
3
+x
4
−x
5
=
1,
−2x
3
−2x
4
+x
5
=
0,
3x
4
+x
5
= −1,
−3x
4
−x
5
=
1.
7
Krok czwarty. Podkreślamy wyraz trzeciego równania w czwartej kolum-
nie. Mnożymy trzecie równanie przez 1 i dodajemy do czwartego. Mamy
x
1
−2x
2
+x
3
+x
4
−x
5
=
1,
−2x
3
−2x
4
+x
5
=
0,
3x
4
+x
5
= −1,
0 =
0.
Krok piąty. Nie robimy nic.
Otrzymany układ ma postać „schodkową”. Widać, że nie jest sprzeczny.
Ignorujemy czwarte równanie i przechodzimy do drugiej części algorytmu.
Wyliczamy x
4
z trzeciego równania
x
4
=
1
3
(−x
5
− 1) = −
1
3
x
5
−
1
3
.
Wyliczamy x
3
z drugiego równania wstawiając za x
4
wcześniej obliczoną
wartość
x
3
= −
1
2
¡
2(−
1
3
x
5
−
1
3
) − x
5
¢
=
5
6
x
5
+
1
3
.
Wyliczamy x
1
z pierwszego równania wstawiając za x
3
i x
4
wcześniej
obliczone wartości
x
1
= 2x
2
− (
5
6
x
5
+
1
3
) − (−
1
3
x
5
−
1
3
) + x
5
+ 1 = 2x
2
+
1
2
x
5
+ 1.
Ostatecznie mamy zatem rozwiązanie w postaci
x
1
= 2x
2
+
1
2
x
5
+1,
x
3
=
5
6
x
5
+
1
3
,
x
4
=
−
1
3
x
5
−
1
3
.
Jeśli weźmiemy dowolne liczby rzeczywiste x
2
i x
5
, wstawimy do tych wzorów
i obliczymy z nich x
1
, x
3
, x
4
, to x
1
, x
2
, x
3
, x
4
, x
5
będzie rozwiązaniem
naszego układu. Co więcej, każde rzeczywiste rozwiązanie da się otrzymać w
ten sposób.
8
Definicja przestrzeni wektorowej
Wprowadzimy teraz kluczowe dla całej algebry liniowej pojęcie przestrzeni
wektorowej.
Definicja. Załóżmy, że K jest dowolnym ciałem. Przestrzenią wektorową
(lub inaczej przestrzenią liniową) nad ciałem K nazywa się zbiór V z dwoma
działaniami – wewnętrznym V × V 3 (u, v) −→ u + v ∈ V i zewnętrznym
K × V 3 (α, u) −→ αu ∈ V , które spełniają następujące warunki:
1) v + u = u + v dla wszystkich u, v ∈ V (przemienność dodawania wekto-
rów),
2) (u + v) + w = u + (v + w) dla wszystkich u, v, w ∈ V (łączność dodawania
wektorów),
3) istnieje oznaczany przez 0 element zbioru V taki, że dla każdego u ∈ V
u + 0 = u (istnienie wektora zerowego),
4) dla każdego u ∈ V istnieje oznaczany przez −u element zbioru V taki,
że u + (−u) = 0 (istnienie wektorów przeciwnych),
5) (α + β)u = αu + βu dla wszystkich α, β ∈ K, u ∈ V (rozdzielność
mnożenia wektorów przez skalary względem dodawania skalarów),
6) α(u + v) = αu + αv dla wszystkich α ∈ K, u, v ∈ V (rozdzielność
mnożenia wektorów przez skalary względem dodawania wektorów),
7) (αβ)u = α(βu) dla wszystkich α, β ∈ K, u ∈ V (łączność mieszana
mnożenia skalarów i wektorów przez skalary),
8) 1u = u dla każdego u ∈ V .
Warto się dokładniej przyjrzeć tej definicji.
Jak widać, elementy ciała K nazywa się w tym kontekście skalarami, a
elementy przestrzeni wektorowej V wektorami.
Wiemy (ze względu na 1)), że element 0 z warunku 3) jest jedyny (dla-
tego nie ma wątpliwości co oznaczyliśmy przez 0). Nazywa się go wektorem
zerowym. Podobnie (ze względu na 1) i 2)) dla każdego u ∈ V element −u
z warunku 4) jest jedyny (dlatego nie ma wątpliwości co oznaczyliśmy przez
−u). Nazywa się go wektorem przeciwnym do u.
Dzięki warunkowi 4) możemy określić również odejmowanie wektorów
wzorem u − v = u + (−v) dla u, v ∈ V .
Warunki 1)–4) mówią dokładnie tyle, że V z dodawaniem wektorów jest
grupą abelową. Nową rzeczą do zapamiętania są więc tylko warunki 5)–8).
9
Oczywiście, o ile nawiasy nie wskazują inaczej, najpierw wykonuje się
mnożenie wektorów przez skalary, a dopiero później dodawanie lub odejmo-
wanie wektorów.
Ćwiczenie. Udowodnić, że warunek 1) z definicji przestrzeni wektorowej
wynika z pozostałych warunków.
Twierdzenie. Jeśli V jest przestrzenią wektorową nad ciałem K, α ∈ K
oraz u ∈ V , to
1) αu = 0 wtedy i tylko wtedy, gdy α = 0 lub u = 0,
2) (−α)u = −(αu) i α(−u) = −(αu).
Dowód: 0 = 0 + 0 w K, więc 0u = (0 + 0)u = 0u + 0u i po dodaniu −(0u)
do obu stron 0 = (0u + 0u) + (−(0u)) = 0u + (0u + (−(0u))) = 0u + 0 = 0u.
Podobnie 0 = 0 + 0 w V , więc α0 = α(0 + 0) = α0 + α0 i po dodaniu −(α0)
do obu stron 0 = (α0 + α0) + (−(α0)) = α0 + (α0 + (−(α0))) = α0 + 0 = α0.
Natomiast gdy α 6= 0, a 0 = αu, to po pomnożeniu obu stron przez α
−1
mamy 0 = α
−1
0 = α
−1
(αu) = (α
−1
α)u = 1u = u, co kończy dowód 1).
αu + (−α)u = (α + (−α))u = 0u = 0, więc z jednoznaczności wektora
przeciwnego (−α)u = −(αu). Podobnie αu+α(−u) = α(u+(−u)) = α0 = 0,
więc z jednoznaczności wektora przeciwnego −α(−u) = −(αu), co kończy
dowód 2).
Zwróćmy uwagę, że dzięki warunkowi 2) można pisać wyrażenie −αu bez
żadnych nawiasów, a oprócz tego mamy użyteczną równość −u = (−1)u.
Podstawowe przykłady przestrzeni wektorowych
O wektorach była mowa na geometrii w szkole. I w istocie zbiór wszyst-
kich zaczepionych w jednym wyróżnionym punkcie wektorów na płaszczyźnie
albo w przestrzeni ze znanymi z geometrii działaniami dodawania wektorów i
mnożenia wektorów przez liczby rzeczywiste jest przestrzenią wektorową nad
ciałem liczb rzeczywistych. Można się o tym przekonać rysując odpowiednie
obrazki. Ale ścisły dowód wymagałby ścisłego ujęcia geometrii poczynając
od pojęć pierwotnych i aksjomatów. My postąpimy inaczej. Dojdziemy do
geometrii od algebry. Warto jednak od samego początku mieć w pamięci ob-
raz wektorów na płaszczyźnie i w przestrzeni, bo są one najlepszym źródłem
intuicji w algebrze liniowej.
10
Przejdźmy do przykładów już całkiem formalnych. Pierwszy z nich jest
najważniejszy.
Przykład. Niech K będzie ciałem, a n ∈ N. Zbiór K
n
z działaniami
(a
1
, . . . , a
n
) + (b
1
, . . . , b
n
) = (a
1
+ b
1
, . . . , a
n
+ b
n
),
α(a
1
, . . . , a
n
) = (αa
1
, . . . , αa
n
)
jest przestrzenią wektorową nad K (w K
n
0 = (0, . . . , 0) oraz −(a
1
, . . . , a
n
) =
(−a
1
, . . . , −a
n
)).
Zauważmy, że gdy K = R, a n = 2 albo 3, to przestrzeń wektorową
z tego przykładu można utożsamiać ze wspomnianą wcześniej przestrzenią
wektorową zaczepionych w jednym wyróżnionym punkcie wektorów na płasz-
czyźnie albo w przestrzeni pod warunkiem, że wybierze się układ współrzęd-
nych kartezjańskich o początku w tym punkcie (dowolny wektor (a
1
, . . . , a
n
)
z R
2
albo R
3
odpowiada wtedy wektorowi na płaszczyźnie albo w przestrzeni
o początku w wyróżnionym punkcie i końcu w punkcie o współrzędnych
(a
1
, . . . , a
n
); ważne, że działania wykonywane „arytmetycznie” (czyli według
powyższych wzorów) i „geometrycznie” dają ten sam wynik).
Przykład. Niech K będzie ciałem, a X dowolnym zbiorem. Zbiór K
X
(czyli zbiór wszystkich funkcji X −→ K) z działaniami określonymi wzorami
(ϕ + ψ)(x) = ϕ(x) + ψ(x),
(αϕ)(x) = α ϕ(x)
dla ϕ, ψ ∈ K
X
, α ∈ K, x ∈ X, jest przestrzenią wektorową nad K (w K
X
0 : X 3 x −→ 0 ∈ K, −ϕ : X 3 x −→ −ϕ(x) ∈ K).
Przykład. Niech K będzie podciałem ciała L. Wówczas L ze swoim do-
dawaniem i obciętym do K×L swoim mnożeniem jest przestrzenią wektorową
nad K.
Ćwiczenie. Sprawdzić że zbiory z działaniami opisane w powyższych
trzech przykładach rzeczywiście są przestrzeniami wektorowymi.
11
Podprzestrzenie przestrzeni wektorowej
Definicja. Podzbiór P przestrzeni wektorowej V nad ciałem K nazywa
się jej podprzestrzenią, gdy działania dodawania wektorów i mnożenia wekto-
rów przez skalary można zawęzić z V do P i P z tymi zawężonymi działaniami
jest przestrzenią wektorową nad K.
W praktyce, aby sprawdzić, czy podzbiór przestrzeni wektorowej jest jej
podprzestrzenią, stosuje się następujące twierdzenie.
Twierdzenie. Podzbiór P przestrzeni wektorowej V nad ciałem K jest
jej podprzestrzenią wtedy i tylko wtedy, gdy spełnia następujące warunki
1) 0 ∈ P ,
2) dla wszystkich u, v ∈ P u + v ∈ P ,
3) dla wszystkich α ∈ K, u ∈ P αu ∈ P .
Dowód: Warunki 2) i 3) mówią dokładnie tyle, że działania można za-
węzić z V do P . Gdy P z tymi zawężonymi działaniami jest przestrzenią
wektorową, to P 6= ∅, czyli istnieje u ∈ P , i z 3) 0 = 0u ∈ P . Odwrotnie,
gdy zachodzą 1), 2), 3), to P z zawężonymi działaniami jest przestrzenią
wektorową, ponieważ dla każdego u ∈ P z 3) −u = (−1)u ∈ P . Tym samym
dowód jest zakończony.
Oczywiście podzbiory {0} i V dowolnej przestrzeni wektorowej V są jej
podprzestrzeniami. Podprzestrzenie te nazywa się niewłaściwymi, wszystkie
inne zaś właściwymi.
Zastanówmy się teraz nad geometrycznym sensem pojęcia podprzestrzeni.
Otóż w przestrzeni wektorowej złożonej ze wszystkich zaczepionych w jed-
nym wyróżnionym punkcie wektorów na płaszczyźnie każda podprzestrzeń
właściwa składa się z tych wektorów, które leżą na jednej prostej przechodzą-
cej przez wyróżniony punkt. Natomiast w przestrzeni wektorowej złożonej ze
wszystkich zaczepionych w jednym wyróżnionym punkcie wektorów w prze-
strzeni są dwa rodzaje podprzestrzeni właściwych: każda taka podprzestrzeń
składa się z tych wektorów, które leżą albo na jednej prostej przechodzą-
cej przez wyróżniony punkt, albo na jednej płaszczyźnie przechodzącej przez
wyróżniony punkt.
12
Ze względu na wspomnianą wcześniej możliwość przejścia do R
2
albo R
3
poprzez wybór odpowiedniego układu współrzędnych na płaszczyźnie albo
w przestrzeni podprzestrzenie występujące w dwóch kolejnych ćwiczeniach
mają intepretację geometryczną (zauważmy, że pojawiają się tam znane
ze szkoły równania parametryczne i ogólne przechodzących przez początek
układu współrzędnych prostych na płaszczyźnie oraz prostych i płaszczyzn
w przestrzeni).
Ćwiczenie. Sprawdzić, że następujące podzbiory przestrzeni wektorowej
R
2
są jej podprzestrzeniami
1) {(x, y) ∈ R
2
: ∃
λ∈R
x = 2λ, y = 7λ},
2) {(x, y) ∈ R
2
: 7x − 2y = 0}.
Ćwiczenie. Sprawdzić, że następujące podzbiory przestrzeni wektorowej
R
3
są jej podprzestrzeniami
1) {(x, y, z) ∈ R
3
: ∃
λ∈R
x = 3λ, y = −λ, z = 5λ},
2) {(x, y, z) ∈ R
3
: x + 8y + z = 0, 3x + 4y − z = 0},
3) {(x, y, z) ∈ R
3
: ∃
λ,µ∈R
x = 3λ + 2µ, y = 2λ + 3µ, z = λ + 2µ},
4) {(x, y, z) ∈ R
3
: x − 4y + 5z = 0}.
Poniższe proste przykłady pokazują, że przestrzenie wektorowe można
spotkać w topologii i analizie.
Przykład. Podzbiór przestrzeni wektorowej R
[0,1]
złożony z funkcji cią-
głych jest jej podprzestrzenią.
Przykład. Podzbiór przestrzeni wektorowej R
R
złożony z funkcji róż-
niczkowalnych jest jej podprzestrzenią.
Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Sprawdzić,
że podzbiór przestrzeni wektorowej K
X
złożony z funkcji, które przyjmują
wartości różne od 0 tylko dla skończonej ilości argumentów, jest jej podprze-
strzenią. Dla jakiego zbioru X ta podprzestrzeń jest właściwa?
Podprzestrzenie generowane przez zbiory
Ćwiczenie. Wykazać, że jeśli P
i
dla i ∈ I są podprzestrzeniami prze-
strzeni wektorowej V , to
T
i∈I
P
i
również jest podprzestrzenią V .
13
Definicja. Niech A będzie podzbiorem przestrzeni wektorowej V . Pod-
przestrzenią generowaną przez A nazywa się najmniejszą podprzestrzeń prze-
strzeni V zawierającą A (czyli taką podprzestrzeń P zawierającą A, że każda
podprzestrzeń zawierająca A zawiera P ). Z ostatniego ćwiczenia widać, że
podprzestrzeń generowana przez A istnieje, jest nią bowiem część wspólna
wszystkich podprzestrzeni zawierających A. Podprzestrzeń generowaną przez
A będziemy oznaczać przez lin A.
Ćwiczenie. Wykazać, że dla dowolnych podzbiorów A i B przestrzeni
wektorowej
1) lin A = A wtedy i tylko wtedy, gdy A jest podprzestrzenią,
2) lin (lin A) = lin A,
3) jeśli A ⊂ B, to lin A ⊂ lin B,
4) lin (A ∩ B) ⊂ (lin A) ∩ (lin B),
5) lin (A ∪ B) = lin ((lin A) ∪ (lin B)).
Jeżeli V jest przestrzenią wektorową nad ciałem K, λ
1
, . . . , λ
n
∈ K i
v
1
, . . . , v
n
∈ V , to wyrażenie λ
1
v
1
+ . . . + λ
n
v
n
(i jego wartość) nazywa się
kombinacją liniową wektorów v
1
, . . . , v
n
o współczynnikach λ
1
, . . . , λ
n
.
Twierdzenie. Niech A będzie podzbiorem przestrzeni wektorowej V nad
ciałem K. Podprzestrzeń generowana przez A to zbiór wszystkich kombinacji
liniowych λ
1
v
1
+ . . . + λ
n
v
n
, gdzie n ∈ N, λ
1
, . . . , λ
n
∈ K, v
1
, . . . , v
n
∈ A.
Dowód: Oznaczmy przez L zbiór kombinacji liniowych, o których mowa
w twierdzeniu. Wtedy A ⊂ L (bo u = 1u dla każdego u ∈ A) i z poprzed-
niego twierdzenia wynika, że L jest podprzestrzenią, zatem lin A ⊂ L. Ale z
tamtego twierdzenia widać też, że musi być L ⊂ lin A.
Przykład. Podprzestrzeń generowana przez zbiór {(5, 6, 1), (2, 3, 4)} w
R
3
składa się z kombinacji liniowych λ(5, 6, 1) + µ(2, 3, 4), gdzie λ, µ ∈ R,
czyli jest równa {(x, y, z) ∈ R
3
: ∃
λ,µ∈R
x = 5λ+2µ, y = 6λ+3µ, z = λ+4µ}.
Definicja. Gdy przestrzeń wektorowa V jest generowana przez swój
podzbiór A, czyli gdy lin A = V , to mówi się, że A generuje V , a A nazywa
się zbiorem generatorów przestrzeni V . Gdy ponadto A = {a
1
, . . . , a
n
}, to
mówi się też, że a
1
, . . . , a
n
generują V .
14
Liniowa niezależność
Pojęcie liniowej niezależności (a później także bazy) zdefiniujemy w dwóch
różnych sytuacjach. Najpierw dla ciągów wektorów (ograniczymy się tylko
do ciągów skończonych), a następnie dla dowolnych zbiorów wektorów.
Definicja. Niech V będzie przestrzenią wektorową nad ciałem K, a
v
1
, . . . , v
n
∈ V . Mówi się, że ciąg v
1
, . . . , v
n
jest liniowo niezależny, gdy dla
dowolnych λ
1
, . . . , λ
n
∈ K zachodzi implikacja
λ
1
v
1
+ . . . + λ
n
v
n
= 0 =⇒ λ
1
= 0, . . . , λ
n
= 0.
W przeciwnym przypadku nazywa się go liniowo zależnym (mówi się też, że
liniowo niezależne lub zależne są wektory, mając na myśli ciąg, który tworzą).
Przykład. Wektory (1, 3, 2), (2, 5, 1), (3, 8, 4) z R
3
są liniowo niezależne.
Istotnie, gdy α, β, γ ∈ R są takie, że α(1, 3, 2) + β(2, 5, 1) + γ(3, 8, 4) = 0, to
spełniają układ równań α + 2β + 3γ = 0, 3α + 5β + 8γ = 0, 2α + β + 4γ = 0.
Wystarczy go rozwiązać, by się przekonać, że musi być α = 0, β = 0, γ = 0.
Przykład. Wektory (1, 2, 2), (2, 5, 3), (2, 1, 7) z R
3
są liniowo zależne, bo
8(1, 2, 2) − 3(2, 5, 3) − (2, 1, 7) = 0.
Oczywiście jeden wektor w dowolnej przestrzeni wektorowej jest liniowo
zależny wtedy i tylko wtedy, gdy jest zerowy.
W przestrzeni wektorowej złożonej z zaczepionych w jednym wyróżnio-
nym punkcie wektorów na płaszczyźnie lub w przestrzeni dwa wektory są
liniowo zależne wtedy i tylko wtedy, gdy leżą na jednej prostej przechodzą-
cej przez wyróżniony punkt. Natomiast trzy wektory w są liniowo zależne
wtedy i tylko wtedy, gdy leżą na jednej płaszczyźnie przechodzącej przez
wyróżniony punkt.
Twierdzenie. Wektory v
1
, . . . , v
n
są liniowo zależne wtedy i tylko wtedy,
gdy któryś z nich jest kombinacją liniową pozostałych.
Dowód: Gdy λ
1
v
1
+ . . . + λ
n
v
n
= 0 i na przykład λ
k
6= 0, to mamy
v
k
= (−λ
1
/λ
k
)v
1
+. . .+(−λ
k−1
/λ
k
)v
k−1
+(−λ
k+1
/λ
k
)v
k+1
+. . .+(−λ
n
/λ
k
)v
n
.
Natomiast gdy na przykład v
k
= µ
1
v
1
+. . .+µ
k−1
v
k−1
+µ
k+1
v
k+1
+. . .+µ
n
v
n
,
to µ
1
v
1
+ . . . + µ
k−1
v
k−1
+ (−1)v
k
+ µ
k+1
v
k+1
+ . . . + µ
n
v
n
= 0 i −1 6= 0.
15
Definicja. Mówi się, że podzbiór A przestrzeni wektorowej jest liniowo
niezależny, gdy dla każdego n ∈ N i każdych v
1
, . . . , v
n
∈ A, takich że v
i
6= v
j
o ile i 6= j, ciąg v
1
, . . . , v
n
jest liniowo niezależny. W przeciwnym przypadku
podzbiór ten nazywa się liniowo zależnym.
Wprost z definicji widać, że każdy podzbiór zbioru liniowo niezależnego
również jest liniowo niezależny.
Ćwiczenie. Wykazać, że ciąg v
1
, . . . , v
n
jest liniowo niezależny wtedy
i tylko wtedy, gdy jest różnowartościowy i zbiór {v
1
, . . . , v
n
} jest liniowo
niezależny.
Ćwiczenie. Wykazać, że podzbiór A przestrzeni wektorowej jest liniowo
zależny wtedy i tylko wtedy, gdy istnieje taki u ∈ A, że u ∈ lin (A \ {u}).
Ćwiczenie. Wykazać, że jeśli A jest liniowo niezależnym podzbiorem
przestrzeni wektorowej V , a u ∈ V \ (lin A), to zbiór A ∪ {u} również jest
liniowo niezależny.
Bazy przestrzeni wektorowej
Jak już nadmieniliśmy, przez bazę przestrzeni wektorowej można rozumieć
zarówno ciąg wektorów (ograniczymy się tylko do ciągów skończonych), jak
i zbiór wektorów. Zdefiniujemy kolejno oba te pojęcia.
Definicja. Niech V będzie przestrzenią wektorową, a v
1
, . . . , v
n
∈ V .
Ciąg v
1
, . . . , v
n
nazywa się bazą przestrzeni V , gdy jest liniowo niezależny i
zbiór {v
1
, . . . , v
n
} generuje V .
Przykład. Niech K będzie ciałem, a n ∈ N. Wektory
(1, 0, . . . , 0), . . . , (0, . . . , 0, 1)
tworzą bazę przestrzeni wektorowej K
n
(baza ta składa się z n wektorów
i dla każdego i ∈ {1, . . . , n} jej i-ty wektor ma na i-tym miejscu 1, a na
pozostałych 0). Nazywamy ją bazą kanoniczną.
Ćwiczenie. Sprawdzić, że baza kanoniczna rzeczywiście jest bazą.
16
Poniższe twierdzenie ukazuje istotę pojęcia bazy.
Twierdzenie. Niech V będzie przestrzenią wektorową nad ciałem K, a
v
1
, . . . , v
n
∈ V . Ciąg v
1
, . . . , v
n
jest bazą przestrzeni V wtedy i tylko wtedy,
gdy każdy wektor z V ma jednoznaczne przedstawienie w postaci kombinacji
liniowej wektorów v
1
, . . . , v
n
, czyli gdy zachodzą warunki
1) dla każdego u ∈ V istnieją λ
1
, . . . , λ
n
∈ K takie, że u = λ
1
v
1
+. . .+λ
n
v
n
,
2) dla dowolnych λ
1
, . . . λ
n
, µ
1
, . . . , µ
n
∈ K zachodzi implikacja
λ
1
v
1
+ . . . + λ
n
v
n
= µ
1
v
1
+ . . . + µ
n
v
n
=⇒ λ
1
= µ
1
, . . . , λ
n
= µ
n
.
Dowód: Oczywiście 1) oznacza dokładnie tyle, że v
1
, . . . , v
n
generują V .
Wykażemy, że warunek 2) jest równoważny liniowej niezależności v
1
, . . . , v
n
.
Faktycznie, przyjmując w 2) µ
1
= 0, . . . , µ
n
= 0 dostajemy liniową niezależ-
ność v
1
, . . . , v
n
. Natomiast gdy są one liniowo niezależne, to z poprzednika
implikacji z 2), który można zapisać jako (λ
1
− µ
1
)v
1
+ . . . + (λ
n
− µ
n
)v
n
= 0,
wynika że λ
1
− µ
1
= 0, . . . , λ
n
− µ
n
= 0, czyli następnik tej implikacji.
Definicja. Niech ciąg v
1
, . . . , v
n
będzie bazą przestrzeni wektorowej V , a
u ∈ V . Współrzędnymi wektora u w bazie v
1
, . . . , v
n
nazywa się jedyny ciąg
skalarów λ
1
, . . . , λ
n
taki, że u = λ
1
v
1
+ . . . + λ
n
v
n
.
Przykład. W przestrzeni wektorowej R
3
współrzędne wektora (2, 1, 7) w
bazie (1, 2, 3), (2, 3, 4), (1, 1, 2) są równe 3, −4, 7, ponieważ zachodzi równość
(2, 1, 7) = 3(1, 2, 3) − 4(2, 3, 4) + 7(1, 1, 2).
Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Wykazać, że współrzędne
dowolnego wektora (a
1
, . . . , a
n
) z K
n
w bazie kanonicznej to a
1
, . . . , a
n
.
Przejdźmy teraz do baz rozumianych jako zbiory wektorów.
Definicja. Podzbiór przestrzeni wektorowej nazywa się jej bazą, gdy jest
liniowo niezależny i generuje tę przestrzeń.
Widać od razu, że ciąg v
1
, . . . , v
n
jest bazą przestrzeni wektorowej wtedy
i tylko wtedy, gdy jest różnowartościowy i zbiór {v
1
, . . . , v
n
} jest bazą tej
przestrzeni.
17
Kolejne ćwiczenie daje nam dla dowolnego zbioru przykład przestrzeni
wektorowej o bazie równolicznej z tym zbiorem.
Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Wykazać,
że zbiór funkcji ϕ
a
: X −→ K zdefiniowanych dla a ∈ X wzorem
ϕ
a
(x) =
½
1, gdy x = a,
0, gdy x 6= a
jest bazą przestrzeni wektorowej złożonej z funkcji X −→ K, które przyjmują
wartości różne od 0 tylko dla skończonej ilości argumentów.
Przeniesiemy teraz ostatnie twierdzenie i związaną z nim definicję współ-
rzędnych wektora na bazy będące podzbiorami (niekoniecznie skończonymi)
przestrzeni wektorowej.
Niech V będzie przestrzenią wektorową nad ciałem K, a A ⊂ V . Jeśli
λ : A −→ K przyjmuje wartości różne od 0 tylko dla skończonej ilości argu-
mentów, to ma sens suma
P
v∈A
λ
v
v, gdzie λ
v
oznacza λ(v). Rzeczywiście,
nawet gdy A jest nieskończony, to suma ta ma właściwie skończoną ilość
składników, bo składniki równe 0 można pominąć.
Ćwiczenie. Wykazać, że podzbiór A przestrzeni wektorowej V nad cia-
łem K jest jej bazą wtedy i tylko wtedy, gdy dla każdego u ∈ V istnieje
dokładnie jedna funkcja λ : A −→ K, która przyjmuje wartości różne od 0
tylko dla skończonej ilości argumentów i dla której u =
P
v∈A
λ
v
v.
Widać więc, że funkcja λ : A −→ K, która przyjmuje wartości różne od 0
tylko dla skończonej ilości argumentów i dla której u =
P
v∈A
λ
v
v, pełni rolę
współrzędnych wektora u w bazie A.
Przykład. Niech K będzie ciałem. Zbiór A jednomianów X
i
dla i ∈ N
jest bazą przestrzeni wektorowej K[X] nad K z oczywistymi działaniami.
Ponieważ mamy naturalną bijekcję pomiędzy A a N (jednomianowi X
i
od-
powiada i), to naturalniej jest zamiast
P
X
i
∈A
λ
X
i
X
i
pisać
P
i∈N
λ
i
X
i
, gdzie
λ
i
oznacza λ
X
i
, i w konsekwencji zamiast funkcji λ : A −→ K za współrzędne
wielomianu w tej bazie uważać funkcję λ : N −→ K, czyli ciąg λ
0
, λ
1
, λ
2
, . . . ,
gdzie λ
i
oznacza λ(i). Zatem jest tak, jak powinno być: współrzędne dowol-
nego wielomianu z K[X] w bazie A to po prostu jego współczynniki.
18
W świetle ostatniego przykładu jest jasne, że współrzędne dowolnego
wektora w bazie będącej zbiorem skończonym (powiedzmy n-elementowym)
można uważać za wcześniej omówione współrzędne w bazie będącej ciągiem,
ale oczywiście pod warunkiem, że ustawi się wyrazy tego zbioru w ciąg róż-
nowartościowy, czyli ustali się bijekcję pomiędzy tym zbiorem a {1, . . . , n}.
Twierdzenie o istnieniu bazy przestrzeni wektorowej
Korzystając z lematu Kuratowskiego-Zorna, czyli pośrednio z pewnika
wyboru, udowodnimy teraz, że każda przestrzeń wektorowa posiada bazę.
Przypomnijmy, że dowolna relacja ≤ w dowolnym zbiorze X nazywa się
częściowym porządkiem, gdy spełnia następujące warunki:
1) x ≤ x dla każdego x ∈ X (zwrotność),
2) dla każdych x, y ∈ X jeśli x ≤ y i y ≤ x, to x = y (antysymetryczność),
3) dla każdych x, y, z ∈ X jeśli x ≤ y i y ≤ z, to x ≤ z (przechodniość).
Częściowy porządek w X nazywa się porządkiem, gdy dodatkowo
4) dla każdych x, y ∈ X x ≤ y lub y ≤ x (spójność).
Znanymi przykładami częściowego porządku są relacja inkluzji w dowolnej
rodzinie podzbiorów jednego zbioru oraz relacja podzielności w N \ {0}, a
przykładem porządku relacja zwykłej nierówności w R.
Załóżmy, że relacja ≤ jest częściowym porządkiem w X. Jeśli P ⊂ X,
to P nazywa się łańcuchem, gdy dla każdych x, y ∈ P x ≤ y lub y ≤ x
(czyli relacja ≤ zawężona do P jest porządkiem). Jeśli P ⊂ X i p ∈ X, to p
nazywa się majorantą zbioru P , gdy x ≤ p dla każdego x ∈ P . Jeśli p ∈ X,
to p nazywa się elementem maksymalnym, gdy dla każdego x ∈ X z tego, że
p ≤ x wynika, że p = x.
Przyjmując pewnik wyboru można udowodnić prawdziwość następującego
lematu Kuratowskiego-Zorna.
Lemat. Jeśli w zbiorze z częściowym porządkiem każdy łańcuch posiada
majorantę, to istnieje w tym zbiorze element maksymalny.
Twierdzenie. Jeśli V jest przestrzenią wektorową, A jej liniowo nieza-
leżnym podzbiorem, C zbiorem jej generatorów i A ⊂ C, to istnieje taka baza
B przestrzeni V , że A ⊂ B ⊂ C.
19
Dowód: Oznaczmy przez R rodzinę wszystkich liniowo niezależnych pod-
zbiorów D przestrzeni V spełniających warunek A ⊂ D ⊂ C. Oczywiście
relacja inkluzji jest częściowym porządkiem w R. Niech P będzie łańcuchem
w R. Gdy P = ∅, to A jest majorantą P . W przeciwnym wypadku defi-
niujemy E =
S
D∈P
D. Pokażemy, że E ∈ R, a wtedy będzie jasne, że E
jest majorantą P . Od razu widać, że A ⊂ E ⊂ C, więc wystarczy pokazać
liniową niezależność E. Weźmy różnowartościowy ciąg v
1
, . . . , v
n
wektorów
z E. Musimy pokazać, że jest on liniowo niezależny. Z definicji E istnieją
D
1
, . . . , D
n
∈ P takie, że v
1
∈ D
1
, . . . , v
n
∈ D
n
. Ale P jest łańcuchem,
czyli dla dowolnych i, j ∈ {1, . . . , n} D
i
⊂ D
j
lub D
j
⊂ D
i
. Stąd wynika
istnienie takiego k ∈ {1, . . . , n}, że D
1
⊂ D
k
, . . . , D
n
⊂ D
k
. To pokazuje,
że v
1
, . . . , v
n
∈ D
k
i z liniowej niezależności D
k
mamy liniową niezależność
v
1
, . . . , v
n
. A zatem sprawdziliśmy, że R z relacją inkluzji spełnia założenia
lematu Kuratowskiego-Zorna.
Na podstawie tezy tego lematu istnieje element B maksymalny w R i z
definicji R widać, że dowód twierdzenia będzie zakończony, gdy wykażemy,
że B jest zbiorem generatorów przestrzeni V . Przypuśćmy dla dowodu nie
wprost, że lin B 6= V . Wtedy nie może być C ⊂ lin B, bo inaczej mielibyśmy
V = lin C ⊂ lin (lin B) = lin B, czyli lin B = V . Zatem istnieje u ∈ C \ lin B.
Wiemy, że w takiej sytuacji zbiór B ∪ {u} jest liniowo niezależny. Ponadto
oczywiście A ⊂ B ∪ {u} ⊂ C, więc (B ∪ {u}) ∈ P . Ale to jest sprzeczne z
maksymalnością B, bo B ⊂ B ∪ {u}, a B 6= B ∪ {u}.
Biorąc w ostatnim twierdzeniu kolejno C = V , A = ∅ oraz A = ∅ i C = V
dostajemy trzy następujące wnioski.
Wniosek. Jeżeli A jest liniowo niezależnym podzbiorem przestrzeni wek-
torowej, to istnieje taka baza B tej przestrzeni, że A ⊂ B.
Wniosek. Jeżeli B jest zbiorem generatorów przestrzeni wektorowej, to
istnieje taka baza B tej przestrzeni, że B ⊂ C.
Wniosek. Każda przestrzeń wektorowa posiada bazę.
Przykład. Niestety, nikt nie widział bazy przestrzeni wektorowej R nad
ciałem Q, choć udowodniliśmy, że przynajmniej jedna istnieje. Takie rzeczy
się zdarzają, kiedy używa się w dowodach pewnika wyboru.
20
Wymiar przestrzeni wektorowej
Udowodnimy najpierw lemat Steinitza o wymianie.
Lemat. Niech V będzie przestrzenią wektorową nad ciałem K, a
1
, . . . , a
n
liniowo niezależnym ciągiem wektorów z V , a C zbiorem generatorów prze-
strzeni V . Wtedy istnieją takie c
1
, . . . , c
n
∈ C, że c
i
6= c
j
o ile i 6= j, oraz że
(C \ {c
1
, . . . , c
n
}) ∪ {a
1
, . . . , a
n
} jest zbiorem generatorów przestrzeni V .
Dowód: Stosujemy indukcję względem n. Gdy n = 0, to teza lematu
jest trywialna. Załóżmy, że lemat jest prawdziwy dla n − 1, gdzie n 6= 0,
czyli istnieje taki różnowartościowy ciąg c
1
, . . . , c
n−1
wektorów z C, że zbiór
(C \ {c
1
, . . . , c
n−1
}) ∪ {a
1
, . . . , a
n−1
} generuje V . W szczególności mamy
a
n
= λ
1
d
1
+ . . . + λ
m
d
m
+ µ
1
a
1
+ . . . + µ
n−1
a
n−1
dla pewnego różnowar-
tościowego ciągu d
1
, . . . , d
m
wektorów z C \ {c
1
, . . . , c
n−1
} oraz pewnych
λ
1
. . . , λ
m
, µ
1
, . . . , µ
n−1
∈ K. Z liniowej niezależności a
1
, . . . , a
n
wynika, że
λ
k
6= 0 dla pewnego k ∈ {1, . . . , m}. Przyjmijmy c
n
= d
k
. Jest oczywiste,
że wówczas c
n
∈ C, ciąg c
1
, . . . , c
n
jest różnowartościowy, a ponadto c
n
=
(−λ
1
/λ
k
)d
1
+ . . . + (−λ
k−1
/λ
k
)d
k−1
+ (−λ
k+1
/λ
k
)d
k+1
+ . . . + (−λ
m
/λ
k
)d
m
+
(−µ
1
/λ
k
)a
1
+ . . . + (−µ
n−1
/λ
k
)a
n−1
+ (1/λ
k
)a
n
. Pozostało tylko wykazać, że
(C \ {c
1
, . . . , c
n
}) ∪ {a
1
, . . . , a
n
} generuje V . Jest tak rzeczywiście, ponieważ
dowolny wektor z V można zapisać w postaci kombinacji liniowej wektorów
z (C \ {c
1
, . . . , c
n−1
}) ∪ {a
1
, . . . , a
n−1
}, a następnie wstawić do tej kombinacji
za c
n
(o ile c
n
w niej występuje) prawą stronę wyprowadzonej równości. To
kończy dowód.
Twierdzenie. Gdy przestrzeń wektorowa ma bazę skończoną, to wszyst-
kie jej bazy są skończone i mają po tyle samo elementów.
Dowód: Niech A będzie dowolną bazą rozważanej przestrzeni, zaś C jej
bazą skończoną, powiedzmy m-elementową. Gdyby zbiór A miał więcej niż
m elementów, to zawierałby różnowartościowy ciąg a
1
, . . . , a
m+1
. Ciąg ten
byłby liniowo niezależny na podstawie liniowej niezależności A. Z lematu
Steinitza wynikałoby wówczas, że C zawiera różnowartościowy ciąg (m + 1)-
elementowy, co przeczyłoby m-elementowości C. Zatem A nie może mieć
więcej niż m elementów, to znaczy jest skończony i ma co najwyżej tyle ele-
mentów co C. Powtarzając to samo rozumowanie, ale z A i C zamienionymi
miejscami, dostajemy równoliczność A i C, co kończy dowód.
21
Definicja. Przestrzeń wektorową posiadająca skończoną bazę nazywamy
skończenie wymiarową, a ilość elementów dowolnej jej bazy jej wymiarem
(ostatnie twierdzenie gwarantuje nam poprawność takiej definicji). Wymiar
przestrzeni skończenie wymiarowej V będziemy oznaczać przez dim V .
Zgodnie z intuicją przestrzeń wektorowa zaczepionych w jednym punkcie
wektorów na płaszczyźnie ma wymiar 2, a w przestrzeni 3.
Przykład. Niech K będzie ciałem, a n ∈ N. Przestrzeń wektorowa K
n
jest n-wymiarowa.
Przykład. Niech K będzie ciałem. Przestrzeń wektorowa K[X] nie jest
skończenie wymiarowa.
Twierdzenie. Jeżeli P jest podprzestrzenią skończenie wymiarowej prze-
strzeni wektorowej V , to P też jest skończenie wymiarowa i dim P ≤ dim V ,
przy czym dim P = dim V wtedy i tylko wtedy, gdy P = V .
Dowód: Dla bazy A przestrzeni P istnieje taka baza B przestrzeni V , że
A ⊂ B. Skoro B jest skończona, to A też, i widać, że dim P ≤ dim V . Jeżeli
dim P = dim V , to A = B i P = lin A = lin B = V .
Ćwiczenie. Udowodnić bez korzystania z lematu Kuratowskiego-Zorna,
że jeśli V jest skończenie wymiarową przestrzenią wektorową, A jej liniowo
niezależnym podzbiorem, C zbiorem jej generatorów i A ⊂ C, to istnieje taka
baza B przestrzeni V , że A ⊂ B ⊂ C.
Ćwiczenie. Wykazać, że jeśli V jest przestrzenią wektorową skończonego
wymiaru n, a v
1
, . . . , v
n
∈ V , to następujące warunki są równoważne:
1) v
1
, . . . , v
n
są liniowo niezależne,
2) v
1
, . . . , v
n
generują V ,
3) v
1
, . . . , v
n
tworzą bazę V .
Ćwiczenie. Udowodnić, że gdy przestrzeń wektorowa ma bazę przeli-
czalną, to wszystkie jej bazy są przeliczalne (wskazówka: jeśli v
1
, v
2
, v
3
, . . .
tworzą przeliczalną bazę rozważanej przestrzeni, a B jest dowolną jej bazą, to
B =
S
n∈N
(B ∩ lin {v
1
, . . . , v
n
}) i dla każdego n ∈ N zbiór B ∩ lin {v
1
, . . . , v
n
}
jest skończony).
22
Odwzorowania liniowe
Definicja. Niech U i V będą przestrzeniami wektorowymi nad ciałem K.
Odwzorowanie f : U −→ V nazywa się liniowym, gdy spełnia następujące
warunki:
1) f (u + v) = f (u) + f (v) dla wszystkich u, v ∈ U,
2) f (αu) = αf (u) dla wszystkich α ∈ K, u ∈ U.
Własność odwzorowania f opisaną przez warunek 1) z powyższej definicji
nazywa się addytywnością, a przez warunek 2) jednorodnością.
Widać, że odwzorowanie liniowe można by też nazwać homomorfizmem
przestrzeni wektorowych. Mają tu zastosowanie również inne nazwy znane
z teorii grup i pierścieni: liniowa injekcja to monomorfizm, liniowa surjekcja
to epimorfizm, liniowa bijekcja to izomorfizm, odwzorowanie liniowe, którego
dziedzina i przeciwdziedzina są takie same, nazywa się endomorfizmem, a
gdy ponadto jest bijekcją, to nazywa się automorfizmem.
Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, to f (0) = 0 i
f (−u) = −f (u) dla każdego u ∈ U.
Rozpatrzmy kilka przykładów.
Ćwiczenie. Sprawdzić liniowość odwzorowania
R
3
3 (x, y, z) −→ (2x − 5y + z, x + 3y + 4z) ∈ R
2
.
Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Sprawdzić,
że dla każdego a ∈ X odwzorowanie K
X
3 ϕ −→ ϕ(a) ∈ K jest liniowe.
Przykład. Niech C oznacza przestrzeń wektorową wszystkich funkcji
ciągłych [0, 1] −→ R. Odwzorowanie C 3 ϕ −→
R
1
0
ϕ(x)dx ∈ R jest liniowe.
Przykład. Niech R oznacza przestrzeń wektorową wszystkich funkcji
różniczkowalnych R −→ R. Odwzorowanie R 3 ϕ −→ ϕ
0
∈ R
R
jest liniowe.
Zbiór wszystkich odwzorowań liniowych U −→ V , gdzie U i V są prze-
strzeniami wektorowymi nad ciałem K, będziemy oznaczać przez Hom(U, V ).
Następne ćwiczenie pokazuje, że jest to przestrzeń wektorowa nad K.
23
Ćwiczenie. Sprawdzić, że zbiór V
X
, gdzie V jest przestrzenią wektorową
nad ciałem K, a X dowolnym zbiorem, z działaniami określonymi wzorami
(ϕ + ψ)(x) = ϕ(x) + ψ(x),
(αϕ)(x) = α ϕ(x)
dla ϕ, ψ ∈ V
X
, α ∈ K, x ∈ X, jest przestrzenią wektorową nad K. Spraw-
dzić, że w szczególnym przypadku, kiedy X to przestrzeń wektorowa U nad
K, podzbiór Hom(U, V ) przestrzeni wektorowej V
U
jest jej podprzestrzenią.
Ćwiczenie. Sprawdzić, że jeśli f : U −→ V i g : V −→ W są liniowe, to
g ◦ f również.
Ćwiczenie. Sprawdzić, że jeśli f jest izomorfizmem przestrzeni wekto-
rowych, to f
−1
również.
Oczywiście identyczność dowolnej przestrzeni wektorowej jest jej auto-
morfizmem. Dlatego z dwóch ostatnich ćwiczeń wynika, że zbiór wszystkich
automorfizmów ustalonej przestrzeni wektorowej V z działaniem składania
odwzorowań jest grupą. Oznacza się ją Aut(V ).
Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a P jest pod-
przestrzenią przestrzeni U, to f (P ) (czyli {v ∈ V : ∃
u∈P
v = f (u)}) jest
podprzestrzenią przestrzeni V .
Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a Q jest podprze-
strzenią przestrzeni V , to f
−1
(Q) (czyli {u ∈ U : f (u) ∈ Q}) jest podprze-
strzenią przestrzeni U.
Jeśli f : U −→ V jest liniowe, to f
−1
({0}) nazywa się jądrem odwzoro-
wania f i oznacza przez ker f , a f (U) obrazem odwzorowania f i oznacza
przez im f . Z dwóch ostatnich ćwiczeń widać, że ker f jest podprzestrze-
nią przestrzeni U, a im f podprzestrzenią przestrzeni V . Oczywiście f jest
epimorfizmem wtedy i tylko wtedy, gdy im f = V .
Ćwiczenie. Wykazać, że odwzorowanie liniowe f jest monomorfizmem
wtedy i tylko wtedy, gdy ker f = {0}.
24
Zobaczymy teraz, że baza to taki podzbiór przestrzeni wektorowej, że do-
wolnie zadane na nim odwzorowanie w drugą przestrzeń wektorową rozszerza
się jednoznacznie do odwzorowania liniowego.
Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią
wektorową nad ciałem K, a u
1
, . . . , u
n
∈ U. Ciąg u
1
, . . . , u
n
jest bazą U
wtedy i tylko wtedy, gdy dla każdej przestrzeni wektorowej V nad K i każdego
ciągu v
1
, . . . , v
n
wektorów z V istnieje dokładnie jedno odwzorowanie liniowe
f : U −→ V takie, że f (u
1
) = v
1
, . . . , f (u
n
) = v
n
.
Dowód: Jeśli u
1
, . . . , u
n
jest bazą, to dla każdego p ∈ U istnieją jedyne
λ
1
, . . . , λ
n
∈ K takie, że p = λ
1
u
1
+ . . . + λ
n
u
n
. Gdyby istniało takie f jak
trzeba, to musiałoby być f (p) = λ
1
f (u
1
) + . . . + λ
n
f (u
n
) = λ
1
v
1
+ . . . + λ
n
v
n
.
Stąd już wynika jednoznaczność f . Aby pokazać jego istnienie, definiujemy
f (p) = λ
1
v
1
+ . . . + λ
n
v
n
. Ponieważ p jest dowolne, określiliśmy w ten sposób
odwzorowanie f : U −→ V . Sprawdzimy, że jest ono liniowe. Jeśli p, q ∈ U,
p = λ
1
u
1
+. . .+λ
n
u
n
, q = µ
1
u
1
+. . .+µ
n
u
n
, gdzie λ
1
, . . . , λ
n
, µ
1
, . . . , µ
n
∈ K,
to zgodnie z definicją f (p) = λ
1
v
1
+ . . . + λ
n
v
n
, f (q) = µ
1
v
1
+ . . . + µ
n
v
n
. Ale
p + q = (λ
1
+ µ
1
)u
1
+ . . . + (λ
n
+ µ
n
)u
n
, więc zgodnie z definicją f (p + q) =
(λ
1
+µ
1
)v
1
+. . .+(λ
n
+µ
n
)v
n
, co oznacza, że f (p+q) = f (p)+f (q). Podobnie
jeśli α ∈ K, p ∈ U, p = λ
1
u
1
+ . . . + λ
n
u
n
, gdzie λ
1
, . . . , λ
n
∈ K, to zgodnie
z definicją f (p) = λ
1
v
1
+ . . . + λ
n
v
n
. Ale αp = (αλ
1
)u
1
+ . . . + (αλ
n
)u
n
, więc
zgodnie z definicją f (αp) = (αλ
1
)v
1
+ . . . + (αλ
n
)v
n
, co oznacza, że f (αp) =
αf (p). Ponadto u
1
= 1u
1
+ 0u
2
+ . . . + 0u
n
, . . . , u
n
= 0u
1
+ . . . + 0u
n−1
+ 1u
n
i dlatego wykorzystując jeszcze raz definicję odwzorowania f otrzymujemy
f (u
1
) = v
1
, . . . , f (u
n
) = v
n
.
Implikację odwrotną wykażemy nie wprost. Gdyby u
1
, . . . , u
n
były liniowo
zależne, to u
k
= λ
1
u
1
+ . . . + λ
k−1
u
k−1
+ λ
k+1
u
k+1
+ . . . + λ
n
u
n
dla pewnego
k ∈ {1, . . . , n} i pewnych λ
1
, . . . , λ
k−1
, λ
k+1
, . . . , λ
n
∈ K, więc wystarczyłoby
wziąć V = K oraz v
1
= 0, . . . , v
k−1
= 0, v
k
= 1, v
k+1
= 0, . . . , v
n
= 0, aby
otrzymać sprzeczność z istnieniem f . Zatem u
1
, . . . , u
n
są liniowo niezależne.
Gdyby nie generowały U, to istniałyby takie w
1
, . . . , w
m
, gdzie m 6= 0, że ciąg
u
1
, . . . , u
n
, w
1
, . . . , w
m
byłby bazą U. Na podstawie wcześniej udowodnionej
implikacji moglibyśmy więc otrzymać odwzorowania liniowe g, h : U −→ K
spełniające warunki g(u
1
) = 0, . . . , g(u
n
) = 0, g(w
1
) = 0, . . . , g(w
n
) = 0 i
h(u
1
) = 0, . . . , h(u
n
) = 0, h(w
1
) = 1, . . . , h(w
n
) = 1, lecz to by przeczyło
jednoznaczności odpowiedniego f . Zatem twierdzenie jest udowodnione.
25
Ćwiczenie. Załóżmy, że U jest przestrzenią wektorowa nad ciałem K, a
B ⊂ U. Udowodnić, że B jest bazą U wtedy i tylko wtedy, gdy dla każdej
przestrzeni wektorowej V nad K i każdego odwzorowania e : B −→ V istnieje
dokładnie jedno odwzorowanie liniowe f : U −→ V , takie że f |
B
= e.
Ćwiczenie. Wykazać, że jeśli f, g : U −→ V są liniowe, A jest zbiorem
generatorów U i f |
A
= g|
A
, to f = g.
Ćwiczenie. Udowodnić, że jeśli f : U −→ V jest monomorfizmem, a A
liniowo niezależnym podzbiorem U, to f (A) jest liniowo niezależny.
Ćwiczenie. Niech f : U −→ V będzie liniowe. Wykazać, że jeśli A ⊂ U,
to f (lin A) = lin (f (A)) (więc jeśli A generuje U, to f (A) generuje im f ).
Ćwiczenie. Załóżmy, że odwzorowanie f : U −→ V jest liniowe, a ciąg
u
1
, . . . , u
n
jest bazą przestrzeni wektorowej U. Udowodnić, że
1) f jest monomorfizmem wtedy i tylko wtedy, gdy ciąg f (u
1
), . . . , f (u
n
)
jest liniowo niezależny,
2) f jest epimorfizmem wtedy i tylko wtedy, gdy zbiór {f (u
1
), . . . , f (u
n
)}
generuje przestrzeń V ,
3) f jest izomorfizmem wtedy i tylko wtedy, gdy ciąg f (u
1
), . . . , f (u
n
) jest
bazą przestrzeni V .
Ćwiczenie. Wykazać, że dwie skończenie wymiarowe przestrzenie wek-
torowe nad tym samym ciałem są izomorficzne (to znaczy istnieje izomorfizm
z jednej na drugą) wtedy i tylko wtedy, gdy mają równe wymiary.
Ostatnie ćwiczenie zawiera klasyfikację skończenie wymiarowych prze-
strzeni wektorowych. Jak widać, jest ona szalenie prosta, o wiele prostsza
niż choćby klasyfikacja skończenie generowanych grup abelowych.
Rząd odwzorowania liniowego
Twierdzenie. Niech f : U −→ V będzie odwzorowaniem liniowym. Prze-
strzeń U jest skończenie wymiarowa wtedy i tylko wtedy, gdy przestrzenie
ker f i im f są skończenie wymiarowe, i jeśli tak jest, to
dim U = dim ker f + dim im f.
26
Dowód: Załóżmy, że ker f i im f są skończenie wymiarowe. Weźmy bazę
u
1
, . . . , u
k
przestrzeni ker f i bazę v
1
, . . . , v
l
przestrzeni im f oraz wybierzmy
w
1
∈ f
−1
({v
1
}), . . . , w
l
∈ f
−1
({v
l
}). Wykażemy, że ciąg w
1
, . . . , w
l
, u
1
, . . . , u
k
jest bazą przestrzeni U. Jeżeli dla pewnych skalarów λ
1
, . . . , λ
l
, µ
1
, . . . , µ
k
zachodzi równość λ
1
w
1
+ . . . + λ
l
w
l
+ µ
1
u
1
+ . . . + µ
k
u
k
= 0, to mamy 0 =
f (λ
1
w
1
+ . . . + λ
l
w
l
+ µ
1
u
1
+ . . . + µ
k
u
k
) = λ
1
v
1
+ . . . + λ
l
v
l
i z liniowej
niezależności v
1
, . . . , v
l
otrzymujemy λ
1
= 0, . . . , λ
l
= 0. Ale w takim razie
mamy µ
1
u
1
+ . . . + µ
k
u
k
= 0 i z liniowej niezależności u
1
, . . . , u
k
otrzymujemy
µ
1
= 0, . . . , µ
k
= 0. A więc w
1
, . . . , w
l
, u
1
, . . . , u
k
są liniowo niezależne. Dla
dowolnego u ∈ U istnieją takie skalary ν
1
, . . . , ν
l
, że f (u) = ν
1
v
1
+ . . . + ν
l
v
l
.
Ponadto f (u − ν
1
w
1
− . . . − ν
l
w
l
) = 0, więc istnieją takie skalary ξ
1
, . . . , ξ
k
,
że u − ν
1
w
1
− . . . − ν
l
w
l
= ξ
1
u
1
+ . . . + ξ
k
u
k
. A więc w
1
, . . . , w
l
, u
1
, . . . , u
k
generują U. Udowodniliśmy w ten sposób tezę twierdzenia w przypadku, gdy
ker f i im f są skończenie wymiarowe. Natomiast gdy skończenie wymiarowa
jest U, to jest taka też ker f i jeśli B jest bazą U, to f (B) jest skończonym
zbiorem generatorów im f , można więc z niego wybrać bazę przestrzeni im f ,
co oznacza, że również ona jest skończenie wymiarowa. Zatem ten przypadek
został sprowadzony do poprzedniego.
Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a U i V są skoń-
czenie wymiarowe i dim U = dim V , to następujące warunki są równoważne:
1) f jest monomorfizmem,
2) f jest epimorfizmem,
3) f jest izomorfizmem.
Definicja. Mówimy, że odwzorowanie liniowe f jest skończonego rzędu,
gdy jego obraz ma skończony wymiar, i definiujemy rząd takiego f wzorem
rz f = dim im f
(zauważmy, że jeśli f : U −→ V jest liniowe i U lub V ma skończony wymiar,
to f ma skończony rząd i odpowiednio rz f ≤ dim U lub rz f ≤ dim V ).
Ćwiczenie. Załóżmy, że f : U −→ V i f
0
: U
0
−→ V
0
są liniowe, zaś
U, V , U
0
, V
0
skończenie wymiarowe oraz dim U
0
= dim U i dim V
0
= dim V .
Udowodnić, że następujące warunki są równoważne:
1) istnieją takie izomorfizmy g : U −→ U
0
i h : V −→ V
0
, że f
0
◦ g = h ◦ f ,
2) rz f = rz f
0
.
27
Suma podprzestrzeni
Definicja. Sumą podprzestrzeni P
1
, . . . , P
r
przestrzeni wektorowej V
nazywa się zbiór
P
1
+ . . . + P
r
= {u ∈ V : ∃
p
1
∈P
1
,...,p
r
∈P
r
u = p
1
+ . . . + p
r
}
Okazuje się, że suma podprzestrzeni jest najmniejszą podprzestrzenią,
która je zawiera.
Twierdzenie. Jeśli P
1
, . . . , P
r
są podprzestrzeniami jednej przestrzeni
wektorowej, to P
1
+ . . . + P
r
= lin (P
1
∪ . . . ∪ P
r
).
Dowód: Łatwo sprawdzić warunki wystarczające do tego, by P
1
+ . . . + P
r
było podprzestrzenią. Ponadto P
1
⊂ P
1
+ . . . + P
r
, . . . , P
r
⊂ P
1
+ . . . + P
r
,
bo p
1
= p
1
+ 0 + . . . + 0, . . . , p
r
= 0 + . . . + 0 + p
r
dla p
1
∈ P
1
, . . . , p
r
∈ P
r
.
Oznacza to, że lin (P
1
∪ . . . ∪ P
r
) ⊂ P
1
+ . . . + P
r
. Inkluzja odwrotna wynika
stąd, że suma wektorów należących do podprzestrzeni również do niej należy.
Twierdzenie. Jeśli P i Q są skończenie wymiarowymi podprzestrzeniami
jednej przestrzeni wektorowej, to P + Q jest skończenie wymiarowa i
dim(P + Q) = dim P + dim Q − dim(P ∩ Q).
Dowód: Weźmy bazę u
1
, . . . , u
k
podprzestrzeni P ∩ Q i uzupełnijmy ją do
bazy u
1
, . . . , u
k
, v
1
, . . . , v
l
podprzestrzeni P i do bazy u
1
, . . . , u
k
, w
1
, . . . , w
m
podprzestrzeni Q. Wykażemy, że u
1
, . . . , u
k
, v
1
, . . . , v
l
, w
1
, . . . , w
m
jest bazą
podprzestrzeni P + Q. Wtedy teza twierdzenia przyjmie postać k + l + m =
(k + l) + (k + m) − k i tym samym będzie udowodniona. Widać od razu,
że wypisane wektory generują P + Q, zatem pozostało sprawdzić ich liniową
niezależność. Przypuśćmy, że dla skalarów λ
1
, . . . , λ
k
, µ
1
, . . . , µ
l
, ν
1
, . . . , ν
m
zachodzi równość λ
1
u
1
+. . .+λ
k
u
k
+µ
1
v
1
+. . .+µ
l
v
l
+ν
1
w
1
+. . .+ν
m
w
m
= 0.
Wówczas λ
1
u
1
+ . . . + λ
k
u
k
+ µ
1
v
1
+ . . . + µ
l
v
l
= −ν
1
w
1
− . . . − ν
m
w
m
. Lewa
strona tej równości należy do P , a prawa do Q, więc obie należą do P ∩ Q.
Istnieją więc takie skalary ξ
1
, . . . , ξ
k
, że λ
1
u
1
+ . . . + λ
k
u
k
+ µ
1
v
1
+ . . . + µ
l
v
l
=
ξ
1
u
1
+. . .+ξ
k
u
k
. Stąd i z liniowej niezależności u
1
, . . . , u
k
, v
1
, . . . , v
l
wynika, że
µ
1
= 0, . . . , µ
k
= 0. Mamy więc λ
1
u
1
+. . .+λ
k
u
k
+ν
1
w
1
+. . .+ν
m
w
m
= 0. Stąd
i z liniowej niezależności u
1
, . . . , u
k
, w
1
, . . . , w
m
wynika z kolei, że również
λ
1
= 0, . . . , λ
k
= 0, ν
1
= 0, . . . , ν
m
= 0, co kończy dowód.
28
Suma prosta
Ćwiczenie. Sprawdzić, że iloczyn kartezjański V
1
× . . . × V
r
przestrzeni
wektorowych V
1
, . . . , V
r
nad tym samym ciałem K z działaniami
(u
1
, . . . , u
r
) + (v
1
, . . . , v
r
) = (u
1
+ v
1
, . . . , u
r
+ v
r
),
α(u
1
, . . . , u
r
) = (αu
1
, . . . , αu
r
)
jest przestrzenią wektorową nad K.
Ćwiczenie. Udowodnić, że jeśli V
1
, . . . , V
r
są skończenie wymiarowymi
przestrzeniami wektorowymi nad tym samym ciałem, to również przestrzeń
V
1
× . . . × V
r
jest skończenie wymiarowa i
dim(V
1
× . . . × V
r
) = dim V
1
+ . . . + dim V
r
.
Definicja. Mówimy, że przestrzeń wektorowa V jest sumą prostą swoich
podprzestrzeni P
1
, . . . , P
r
i piszemy V = P
1
⊕ . . . ⊕ P
r
, gdy odwzorowanie
F : P
1
× . . . × P
r
3 (p
1
, . . . , p
r
) −→ p
1
+ . . . + p
r
∈ V
jest izomorfizmem (łatwo sprawdzić, że F zawsze jest liniowe, istotą definicji
sumy prostej jest więc to, że jest ono bijekcją).
Twierdzenie. Przestrzeń wektorowa V jest sumą prostą swoich pod-
przestrzeni P
1
, . . . , P
r
wtedy i tylko wtedy, gdy dowolny wektor u z V można
jednoznacznie zapisać w postaci
u = p
1
+ . . . + p
r
,
gdzie p
1
∈ P
1
, . . . , p
r
∈ P
r
.
Dowód: Istnienie powyższego przedstawienia dowolnego wektora jest rów-
noważne z surjektywnością F , a jego jednoznaczność z injektywnością F .
Ćwiczenie. Wywnioskować z poprzedniego ćwiczenia, że jeśli P
1
, . . . , P
r
są takimi podprzestrzeniami skończenie wymiarowej przestrzeni wektorowej
V , że V = P
1
⊕ . . . ⊕ P
r
, to dim V = dim P
1
+ . . . + dim P
r
(dla r = 2
można tę równość otrzymać natychmiast ze wzoru na wymiar sumy dwóch
podprzestrzeni i następnego twierdzenia).
29
Twierdzenie. Jeśli P i Q są podprzestrzeniami przestrzeni wektorowej
V , to V = P ⊕ Q wtedy i tylko wtedy, gdy zachodzą następujące warunki:
1) P ∩ Q = {0},
2) P + Q = V .
Dowód: Jasne, że warunek 2) to to samo, co surjektywność odwzorowania
F : P × Q 3 (p, q) −→ p + q ∈ V , bo im F = P + Q. Injektywność F jest
równoważna temu, że ker F = {0}. Jeśli (p, q) ∈ ker F , to q = −p ∈ P ∩ Q,
więc jeśli P ∩ Q = {0}, to (p, q) = (0, 0). Odwrotnie, jeśli u ∈ P ∩ Q, to
(−u, u) ∈ ker F , więc jeśli ker F = {0}, to u = 0. Zatem 1) zachodzi wtedy i
tylko wtedy, gdy ker F = {0}, i twierdzenie jest udowodnione.
Zawarte w ostatnim twierdzeniu kryterium pozwalające sprawdzać, czy
przestrzeń wektorowa jest sumą prostą dwóch swoich podprzestrzeni, jest w
następnym ćwiczeniu uogólnione na dowolną ich ilość.
Ćwiczenie. Dowieść, że jeśli P
1
, . . . , P
r
są podprzestrzeniami przestrzeni
wektorowej V , to V = P
1
⊕ . . . ⊕ P
r
wtedy i tylko wtedy, gdy zachodzą
następujące warunki:
1) (P
1
+ . . . + P
k−1
) ∩ P
k
= {0} dla każdego k ∈ {2, . . . , r},
2) P
1
+ . . . + P
r
= V .
Ćwiczenie. Wykazać, że jeśli P i Q są takimi podprzestrzeniami skoń-
czenie wymiarowej przestrzeni wektorowej V , że dim P + dim Q = dim V , to
następujące warunki są równoważne:
1) P ∩ Q = {0},
2) P + Q = V ,
3) V = P ⊕ Q.
Ćwiczenie. Niech V będzie przestrzenią wektorową, a f : V −→ V jej
endomorfizmem. Udowodnić, że następujące warunki są równoważne:
1) istnieją takie podprzestrzenie P i Q przestrzeni V , że V = P ⊕ Q i
f (p + q) = p dla wszystkich p ∈ P , q ∈ Q,
2) f
2
= f (przez f
2
rozumiemy f ◦ f ).
Endomorfizm f spełniający warunek 1) z ostatniego ćwiczenia nazywa się
rzutowaniem na przestrzeń P równolegle do podprzestrzeni Q. Warunek 2)
daje więc bardzo ładną charakteryzację rzutowań.
30
Łatwo sobie wyobrazić, jak może wyglądać takie rzutowanie w przestrzeni
wektorowej V złożonej ze wszystkich zaczepionych w jednym wyróżnionym
punkcie wektorów leżących na płaszczyźnie. Przypuśćmy, że P i Q to dwie
różne proste przechodzące przez wyróżniony punkt (podprzestrzeniami są
właściwie zbiory wektorów o początku w wyróżnionym punkcie i końcach na
odpowiedniej prostej P lub Q, ale ponieważ wszystkie wektory mają ten sam
początek, to można je utożsamić z ich końcami, a wtedy podprzestrzenie są
tym samym, co proste P i Q). Mamy V = P ⊕ Q, bo P ∩ Q = {0}, jako że
proste P i Q są różne, a ponadto dim P + dim Q = 1 + 1 = 2 = dim V . Niech
f będzie rzutowaniem na P równolegle do Q. Dowolny wektor u z V można
jednoznacznie zapisać w postaci u = p + q, gdzie p ∈ P , q ∈ Q, i f (u) to p.
Widać więc, że aby znaleźć f (u) należy poprowadzić przez koniec wektora u
prostą równoległą do Q. Przetnie ona prostą P , a punkt przecięcia będzie
właśnie końcem wektora f (u).
W przestrzeni wektorowej złożonej ze wszystkich zaczepionych w jednym
wyróżnionym punkcie wektorów leżących w przestrzeni jako podprzestrzenie
tworzące sumę prostą równą całej przestrzeni można wziąć przecinające się
w wyróżnionym punkcie płaszczyznę i prostą. Naturalnie rzutować można na
płaszczyznę równolegle do prostej albo na prostą równolegle do płaszczyzny,
a interpretacja geometryczna powinna już być oczywista.
Przestrzeń ilorazowa
Przypomnijmy, że dowolna relacja ∼ w dowolnym zbiorze X nazywa się
relacją równoważności, gdy spełnia następujące warunki:
1) x ∼ x dla każdego x ∈ X (zwrotność),
2) dla każdych x, y ∈ X jeśli x ∼ y, to y ∼ x (symetryczność),
3) dla każdych x, y, z ∈ X jeśli x ∼ y i y ∼ z, to x ∼ z (przechodniość).
Jeśli ∼ jest relacją równoważności w zbiorze X, to dla każdego x ∈ X
definiuje sie jego klasę równoważności [x] = {y ∈ X : y ∼ x}. Oczywiście
X =
P
x∈X
[x], a ponadto wiadomo, że dla dowolnych x, y ∈ X albo [x] = [y],
albo [x] ∩ [y] = ∅ (czyli X rozpada się na rozłączne klasy równoważności).
Twierdzenie. Niech V będzie przestrzenią wektorową nad ciałem K, a
P jej podprzestrzenią. Wtedy relacja ∼ w zbiorze V zdefiniowana wzorem
u ∼ v ⇐⇒ v − u ∈ P
jest relacja równoważności.
31
Relacja ta jest zgodna z działaniami w przestrzeni wektorowej V , to znaczy
∀
u,v,u
0
v
0
∈V
u
0
∼ u, v
0
∼ v =⇒ u
0
+ v
0
∼ u + v,
∀
α∈K
∀
u,u
0
∈V
u
0
∼ u =⇒ αu
0
∼ αu.
Dowód: Relacja ∼ jest zwrotna, bo dla każdego u ∈ V u − u = 0 ∈ P ,
symetryczna, bo dla każdych u, v ∈ V z tego, że v − u ∈ P , wynika, że
u − v = −(v − u) ∈ P , i przechodnia, bo dla każdych u, v, w ∈ V z tego, że
v − u ∈ P i w − v ∈ P , wynika, że w − u = (w − v) + (v − u) ∈ P .
Jeżeli u, v, u
0
, v
0
∈ V , u
0
− u ∈ P i v
0
− v ∈ P , to (u
0
+ v
0
) − (u + v) =
(u
0
− u) + (v
0
− v) ∈ P , natomiast jeżeli α ∈ K, u, u
0
∈ V , u
0
− u ∈ P , to
αu
0
− αu = α(u
0
− u) ∈ P .
Definicja. Niech V będzie przestrzenią wektorową nad ciałem K, a P
jej podprzestrzenią. Oznaczmy przez V /P zbiór klas równoważności relacji
określonej w ostatnim twierdzeniu. Na zbiorze tym definiujemy działania
[u] + [v] = [u + v],
α[u] = [αu].
Zgodność relacji równoważności z działaniami w V gwarantuje nam popraw-
ność takiej definicji, czyli to, że wynik działań na klasach równoważności nie
zależy od wyboru reprezentantów tych klas. Zbiór V /P z tymi działaniami
jest przestrzenią wektorową nad K, którą nazywamy przestrzenią ilorazową
przestrzeni V przez podprzestrzeń P .
Ćwiczenie. Sprawdzić, że przestrzeń ilorazowa rzeczywiście jest prze-
strzenią wektorową (w V /P 0 = [0], −[u] = [−u]).
Przykład. Rozważmy przestrzeń wektorową V wszystkich zaczepionych
w jednym wyróżnionym punkcie wektorów leżących na płaszczyźnie oraz jej
podprzestrzeń P będącą prostą przechodzącą przez wyróżniony punkt. Łatwo
zauważyć, że elementy przestrzeni V /P to proste równoległe do P . Żeby
dodać dwie takie proste S i T należy wziąć dowolne wektory s i t o końcach
odpowiednio na S i T . Prosta równoległa do P i przechodząca przez koniec
wektora s + t to suma S + T . Gdyby ktoś wziął inne wektory s
0
i t
0
o końcach
odpowiednio na S i T , to dostałby sumę s
0
+ t
0
, być może inną niż s + t,
ale końce wektorów s
0
+ t
0
i s + t leżałyby na tej samej prostej równoległej
32
do P , więc dostałby tę samą sumę S + T . To właśnie oznacza, że suma ta
nie zależy od wyboru reprezentantów. Podobnie, żeby pomnożyć prostą S
równoległą do P przez liczbę rzeczywistą α należy wziąć dowolny wektor s o
końcu na S. Prosta równoległa do P i przechodząca przez koniec wektora αs
to iloczyn αS. Gdyby ktoś wziął inny wektor s
0
o końcu na S, to dostałby
iloczyn αs
0
, być może inny niż αs, ale końce wektorów αs
0
i αs leżałyby na
tej samej prostej równoległej do P , więc dostałby ten sam iloczyn αS. To
właśnie oznacza, że iloczyn ten nie zależy od wyboru reprezentanta.
Ćwiczenie. Wykazać, że jeżeli ∼ jest relacją równoważności w przestrzeni
wektorowej V zgodną z działaniami tej przestrzeni, to istnieje (i to jedyna)
podprzestrzeń P przestrzeni V taka, że dla dowolnych u, v ∈ V u ∼ v wtedy
i tylko wtedy, gdy v − u ∈ P (wskazówka: P = [0]).
Definicja. Jeśli P jest podprzestrzenią przestrzeni wektorowej V , to
V 3 v −→ [v] ∈ V /P
nazywa się epimorfizmem kanonicznym.
Ćwiczenie. Sprawdzić, że epimorfizm kanoniczny V −→ V /P rzeczywi-
ście jest epimorfizmem, a jego jądro to podprzestrzeń P .
Twierdzenie. Niech V będzie przestrzenią wektorową, a P jej podprze-
strzenią. Przestrzeń V jest skończenie wymiarowa wtedy i tylko wtedy, gdy
przestrzenie P i V /P są skończenie wymiarowe, i jeśli tak jest, to
dim(V /P ) = dim V − dim P.
Dowód: Wystarczy zastosować wzór dim V = dim ker f + dim im f do
epimorfizmu kanonicznego f : V −→ V /P .
Podstawowe twierdzenie o epimorfizmie
Twierdzenie. Jeśli f : U −→ V jest epimorfizmem, a g : U −→ W jest
liniowe, to następujące warunki są równoważne:
1) ker f ⊂ ker g,
2) istnieje liniowe h : V −→ W takie, że h ◦ f = g,
3) istnieje dokładnie jedno liniowe h : V −→ W takie, że h ◦ f = g.
33
Dowód: Oczywiście z 3) wynika 2). Jeśli zaś zachodzi 2) i u ∈ ker f , to
g(u) = h(f (u)) = h(0) = 0, dlatego zachodzi 1). Pozostało wykazać, że z 1)
wynika 3). Załóżmy więc, że zachodzi 1) i weźmy v ∈ V . Chcemy zdefiniować
h(v). Ponieważ f jest epimorfizmem, to istnieje takie u ∈ U, że f (u) = v.
Gdyby istniało takie h jak trzeba, to musiałoby być h(v) = h(f (u)) = g(u).
Stąd już wynika jednoznaczność h. Aby pokazać jego istnienie definiujemy
h(v) = g(u). Sprawdzimy, że ta definicja jest poprawna, to znaczy nie zależy
od wyboru u. Jeśli weźmiemy inne u
0
∈ U takie, że f (u
0
) = v, to mamy
f (u
0
− u) = 0, więc na podstawie 1) g(u
0
− u) = 0, czyli g(u
0
) = g(u), a to
oznacza właśnie, że g(u) nie zależy od wyboru u. Ponieważ v jest dowolne,
to określiliśmy w ten sposób odwzorowanie h : V −→ W . Wprost z definicji
widać, że h ◦ f = g. Trzeba jeszcze sprawdzić liniowość h. Jeśli v, v
0
∈ V ,
a u, u
0
∈ U są takie, że f (u) = v, f (u
0
) = v
0
, to f (u + u
0
) = v + v
0
i mamy
h(v + v
0
) = g(u + u
0
) = g(u) + g(u
0
) = h(v) + h(v
0
). Podobnie jeśli α jest
skalarem, v ∈ V , a u ∈ U jest takie, że f (u) = v, to f (αu) = αv i mamy
h(αv) = g(αu) = αg(u) = αh(v). Zatem twierdzenie jest udowodnione.
Twierdzenie. Niech f : U −→ V będzie epimorfizmem, a g : U −→ W
liniowe. Jeżeli zachodzą trzy równoważne warunki z ostatniego twierdzenia
(nazywanego podstawowym twierdzeniem o epimorfizmie), to
1) h jest monomorfizmem wtedy i tylko wtedy, gdy ker f = ker g,
2) h jest epimorfizmem wtedy i tylko wtedy, gdy g jest epimorfizmem.
Dowód: Jeśli u ∈ ker g, to 0 = g(u) = h(f (u)), więc jeśli h jest mono-
morfizmem, to f (u) = 0, zatem ker g ⊂ ker f . Odwrotnie, jeśli v ∈ ker h,
a u ∈ U jest takie, że f (u) = v, to 0 = h(v) = h(f (u)) = g(u), więc jeśli
ker g ⊂ ker f , to v = f (u) = 0, zatem h jest monomorfizmem. W ten sposób
wykazaliśmy pierwszą część tezy. Druga to już tylko teoria mnogości: jeśli f
i h są surjekcjami, to h ◦ f też, a jeśli h ◦ f jest surjekcją, to h też.
Przykład. Niech P = {ϕ ∈ R
R
: ϕ(0) = ϕ(1), ϕ(2) = 0}. Zobaczymy
zaraz, jak przy pomocy podstawowego twierdzenia o epimorfizmie wykazać
izomorficzność R
R
/P i R
2
. Niech f : R
R
−→ R
R
/P będzie epimorfizmem
kanonicznym, a g : R
R
3 ϕ −→ (ϕ(0) − ϕ(1), ϕ(2)) ∈ R
2
. Łatwo sprawdzić,
że g jest liniowe i ker g = P , czyli ker f = ker g. Dlatego z podstawowego
twierdzenia o epimorfizmie mamy liniowe h : R
R
/P −→ R
2
, a z pierwszej
części ostatniego twierdzenia wynika, że jest ono monomorfizmem. Z drugiej
wynika, że jest ono epimorfizmem, bo, jak łatwo sprawdzić, g jest surjekcją.
34
Przestrzeń dualna
Definicja. Przestrzeń wektorową Hom(V, K), gdzie V jest przestrzenią
wektorową nad ciałem K, oznacza się przez V
∗
oraz nazywa przestrzenią
dualną do przestrzeni V , a jej elementy, czyli odwzorowania liniowe V −→ K,
formami liniowymi na V .
Dla dowolnego ciała K i dowolnych i, j ∈ N wprowadzamy symbol
δ
ij
=
½
1, gdy i = j,
0, gdy i 6= j.
nazywany deltą Kroneckera.
Jeżeli ciąg e
1
, . . . , e
n
jest bazą przestrzeni wektorowej V nad ciałem K, to
istnieją jednoznacznie wyznaczone formy liniowe e
∗
1
, . . . , e
∗
n
: V −→ K takie,
że dla wszystkich i, j ∈ {1, . . . , n}
e
∗
i
(e
j
) = δ
ij
.
Twierdzenie. Jeżeli e
1
, . . . , e
n
jest bazą V , to e
∗
1
, . . . , e
∗
n
jest bazą V
∗
.
Dowód: Gdy λ
1
, . . . , λ
n
są takimi skalarami, że λ
1
e
∗
1
+ . . . + λ
n
e
∗
n
= 0, to
dla każdego i ∈ {1, . . . , n} 0 = (λ
1
e
∗
1
+ . . . + λ
n
e
∗
n
)(e
i
) = λ
i
, więc λ
1
, . . . , λ
n
są liniowo niezależne. Generują one V
∗
, bo dla dowolnego α ∈ V
∗
mamy
α = α(e
1
) e
∗
1
+ . . . + α(e
n
) e
∗
n
. Rzeczywiście, obie strony tej równości są
liniowe i dla każdego i ∈ {1, . . . , n} przyjmują na e
i
taką samą wartość α(e
i
).
Definicja. Jeżeli e
1
, . . . , e
n
jest bazą V , to e
∗
1
, . . . , e
∗
n
nazywa się bazą
dualną do bazy e
1
, . . . , e
n
.
Przykład. Baza dualna do bazy (1, 2), (1, 3) przestrzeni R
2
składa się z
form α : R
2
3 (x, y) −→ 3x − y ∈ R, β : R
2
3 (x, y) −→ −2x + y ∈ R, bo
α(1, 2) = 1, α(1, 3) = 0, β(1, 2) = 0, α(1, 3) = 1.
Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Sprawdzić, że baza dualna
do bazy kanonicznej przestrzeni wektorowej K
n
jest złożona z form liniowych
K
n
3 (x
1
, . . . , x
n
) −→ x
i
∈ K dla i ∈ {1, . . . , n}.
35
Definicja. Dla liniowego f : U −→ V definiujemy
f
∗
: V
∗
3 β −→ β ◦ f ∈ U
∗
nazywane odwzorowaniem dualnym do f .
Ćwiczenie. Sprawdzić, że tak zdefiniowane f
∗
jest liniowe i zauważyć,
że jeśli f : U −→ V i g : V −→ W są liniowe, to (g ◦ f )
∗
= f
∗
◦ g
∗
.
W dowodzie kolejnego twierdzenia przyda się następujący lemat.
Lemat. Niech V będzie przestrzenią wektorową nad ciałem K, a v ∈ V .
Jeśli α(v) = 0 dla każdej α ∈ V
∗
, to v = 0.
Dowód: Gdyby było v 6= 0, to {v} byłby liniowo niezależny i istniałaby
baza B przestrzeni V zawierająca {v}. Istniałoby zatem liniowe α : V −→ K
o z góry zadanych wartościach na wektorach z B. W szczególności można by
zadać α(v) = 1, co byłoby sprzeczne z założeniem lematu.
Dla przestrzeni wektorowej V mamy przestrzeń V
∗
dualną do V , a dla
V
∗
przestrzeń V
∗∗
dualną do V
∗
. Przestrzeń V
∗∗
nazywa się bidualną do V .
Twierdzenie. Jeżeli V jest przestrzenią wektorową, to odwzorowanie
j : V −→ V
∗∗
, zdefiniowane wzorem
(j(v))(α) = α(v)
dla v ∈ V , α ∈ V
∗
, jest monomorfizmem. Jeżeli ponadto V jest skończenie
wymiarowa, to jest ono izomorfizmem.
Dowód: Niech K oznacza ciało skalarów przestrzeni V . Łatwo sprawdzić,
że dla każdego v ∈ V odwzorowanie j(v) : V
∗
−→ K jest liniowe (więc
faktycznie j(v) ∈ V
∗∗
) i że samo j jest liniowe. Z lematu mamy ker j = {0},
co kończy dowód pierwszej części. Jeśli V ma skończony wymiar, to dowolna
jej baza e
1
, . . . , e
n
ma tyle samo elementów, co baza e
∗∗
1
, . . . , e
∗∗
n
przestrzeni
V
∗∗
dualna do e
∗
1
, . . . , e
∗
n
. W takim razie V
∗∗
też ma skończony wymiar i
dim V
∗∗
= dim V , dlatego monomorfizm j jest izomorfizmem.
Powyższe j : V −→ V
∗∗
nazywa się monomorfizmem kanonicznym, a
jeżeli V jest skończenie wymiarowa, to izomorfizmem kanonicznym.
36
Twierdzenie. Przestrzeń wektorowa V jest skończenie wymiarowa wtedy
i tylko wtedy, gdy V
∗
jest skończenie wymiarowa, i jeśli tak jest, to
dim V
∗
= dim V.
Dowód: Oczywiście jeśli V ma skończony wymiar, to dowolna jej baza
e
1
, . . . , e
n
ma tyle samo elementów, co baza e
∗
1
, . . . , e
∗
n
przestrzeni V
∗
. W
takim razie V
∗
też ma skończony wymiar i dim V
∗
= dim V . Z drugiej strony
jeśli V
∗
ma skończony wymiar, to V
∗∗
również. Zatem obie przestrzenie
ker j = {0} i im j, gdzie j : V −→ V
∗∗
to monomorfizm kanoniczny, mają
skończone wymiary, więc V również.
Twierdzenie. Jeśli P jest p-wymiarową podprzestrzenią n-wymiarowej
przestrzeni wektorowej V , to istnieją liniowo niezależne α
1
, . . . , α
q
∈ V
∗
, dla
których P = ker α
1
∩ . . . ∩ ker α
q
, przy czym q = n − p.
Dowód: Weźmy bazę u
1
, . . . , u
p
podprzestrzeni P i dopełnijmy ją do bazy
u
1
, . . . , u
n
przestrzeni V . Wystarczy przyjąć α
1
= u
∗
p+1
, . . . , α
q
= u
∗
n
. Fak-
tycznie, dowolny wektor v ∈ V jest postaci v = λ
1
u
1
+ . . . + λ
n
u
n
, więc
mamy v ∈ ker α
1
∩ . . . ∩ ker α
q
wtedy i tylko wtedy, gdy zachodzą równości
0 = u
∗
p+1
(v) = λ
p+1
, . . . , 0 = u
∗
n
(v) = λ
n
, to znaczy wtedy i tylko wtedy, gdy
v = λ
1
u
1
+ . . . + λ
p
u
p
, czyli v ∈ P .
Z powyższego twierdzenia wynika, że każda p-wymiarowa podprzestrzeń
P przestrzeni wektorowej K
n
, gdzie K jest dowolnym ciałem, a n ∈ N, da się
opisać układem q liniowo niezależnych równań liniowych jednorodnych, gdzie
q = n − p (naturalnie liniowa niezależność równań oznacza, że żadne z nich
nie jest kombinacją liniową pozostałych). Faktycznie, niech α
1
, . . . , α
q
∈ K
n∗
będą takie, jak w twierdzeniu, zaś a
11
, . . . , a
1n
, . . . , a
q1
, . . . , a
qn
∈ K takie, że
α
1
= a
11
e
∗
1
+ . . . + a
1n
e
∗
n
, . . . , α
q
= a
q1
e
∗
1
+ . . . + a
qn
e
∗
n
, gdzie e
1
, . . . , e
n
to
baza kanoniczna w K
n
. Przypominając sobie, jak wyglądają formy z bazy
dualnej do bazy kanonicznej, otrzymujemy dla dowolnego (x
1
, . . . , x
n
) ∈ K
n
równoważność: (x
1
, . . . , x
n
) ∈ P wtedy i tylko wtedy, gdy
a
11
x
1
+ . . . + a
1n
x
n
= 0,
...
...
...
a
q1
x
1
+ . . . + a
qn
x
n
= 0.
Jasne, że równania tego układu są liniowo niezależne, bo liniowo niezależne
są formy α
1
, . . . , α
q
.
37
Twierdzenie. Jeżeli V jest przestrzenią wektorową i α
1
, . . . , α
q
, β ∈ V
∗
,
to β ∈ lin {α
1
, . . . , α
q
} wtedy i tylko wtedy, gdy ker α
1
∩ . . . ∩ ker α
q
⊂ ker β.
Dowód: Niech K będzie ciałem skalarów przestrzeni V . Od razu widać,
że jeżeli β = λ
1
α
1
+ . . . + λ
q
α
q
, gdzie λ
1
, . . . , λ
q
∈ K, to dla v ∈ V takiego,
że α
1
(v) = 0, . . . , α
q
(v) = 0, również β(v) = 0. Implikacja odwrotna jest
trudniejsza. Ponieważ (α
1
, . . . , α
q
) : V 3 v −→ (α
1
(v), . . . , α
q
(v)) ∈ K
q
jest
epimorfizmem na swój obraz i ker(α
1
, . . . , α
q
) = ker α
1
∩ . . . ∩ ker α
q
⊂ ker β,
to z podstawowego twierdzenia o epimorfizmie mamy odwzorowanie liniowe
h : im (α
1
, . . . , α
q
) −→ K takie, że h ◦ (α
1
, . . . , α
q
) = β. Można je rozszerzyć
do liniowego k : K
q
−→ K (bo można wybrać bazę im (α
1
, . . . , α
q
), dopełnić
ją do bazy przestrzeni K
q
i zadać k na tej bazie tak, by na wektorach z bazy
im (α
1
, . . . , α
q
) pokrywało się z h) i będzie również k ◦ (α
1
, . . . , α
q
) = β. Ale
k = λ
1
e
∗
1
+. . .+λ
q
e
∗
q
, gdzie λ
1
, . . . , λ
q
∈ K, natomiast e
1
, . . . , e
q
oznacza bazę
kanoniczną przestrzeni K
q
. Stąd dla każdego v ∈ V otrzymujemy równość
β(v) = k(α
1
(v), . . . , α
q
(v)) = λ
1
α
1
(v) + . . . + λ
q
α
q
(v), co kończy dowód.
Ćwiczenie. Niech α
1
, . . . , α
s
, β
1
, . . . , β
t
∈ V
∗
. Z powyższego twierdzenia
wysnuć wniosek, że ker α
1
∩ . . . ∩ ker α
s
⊂ ker β
1
∩ . . . ∩ ker β
t
wtedy i tylko
wtedy, gdy lin {β
1
, . . . , β
t
} ⊂ lin {α
1
, . . . , α
s
}.
Zatem zbiór rozwiązań jednego układu równań liniowych jednorodnych
zawiera się w zbiorze rozwiązań drugiego takiego układu wtedy i tylko wtedy,
gdy każde równanie drugiego z tych układów jest kombinacją liniową równań
pierwszego. Stąd oczywiście wynika, że dwa układy równań liniowych jedno-
rodnych mają takie same zbiory rozwiązań wtedy i tylko wtedy, gdy każde
równanie pierwszego układu jest kombinacją liniową równań drugiego i każde
równanie drugiego układu jest kombinacją liniową równań pierwszego.
Ćwiczenie. Niech α
1
, . . . , α
q
∈ V
∗
, gdzie V jest przestrzenią wektorową
skończonego wymiaru n. Wykorzystując dwa ostatnie twierdzenia wykazać,
że formy liniowe α
1
, . . . , α
q
są liniowo niezależne wtedy i tylko wtedy, gdy
dim(ker α
1
∩ . . . ∩ ker α
q
) = n − q.
Z ostatniego ćwiczenia wynika, że podprzestrzeń przestrzeni wektorowej
K
n
złożona ze wszystkich rozwiązań w ciele K układu q równań liniowych
jednorodnych z n niewiadomymi o współczynnikach z K ma wymiar n − q
wtedy i tylko wtedy, gdy te równania są liniowo niezależne.
38
Macierze
Definicja. Niech K będzie ciałem, a p, q ∈ N. Macierzą o q wierszach i
p kolumnach oraz wyrazach z ciała K nazywa się prostokątną tablicę
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
,
gdzie a
11
, . . . , a
1p
, . . . , a
q1
, . . . , a
qp
∈ K (formalnie taka macierz jest funkcją
a : {1, . . . , q} × {1, . . . , p} −→ K, przy czym a
ji
to a(j, i)).
Oczywiście j-ty wiersz takiej macierzy to
[ a
j1
. . . a
jp
] ,
a jej i-ta kolumna to
a
1i
...
a
qi
.
Wyrazy macierzy są indeksowane dwoma wskaźnikami – pierwszy to numer
wiersza, a drugi to numer kolumny, na przecięciu których leży dany wyraz.
Zbiór wszystkich macierzy o q wierszach i p kolumnach oraz wyrazach z
ciała K będziemy oznaczać przez M
q×p
(K). Ten zbiór z działaniami
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
+
b
11
. . . b
1p
...
...
b
q1
. . . b
qp
=
a
11
+ b
11
. . . a
1p
+ b
1p
...
...
a
q1
+ b
q1
. . . a
qp
+ b
qp
,
α
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
=
αa
11
. . . αa
1p
...
...
αa
q1
. . . αa
qp
jest przestrzenią wektorową nad K (jest to właściwie znanana nam przestrzeń
K
{1,...,q}×{1,...,p}
). Można ją utożsamiać z przestrzenią wektorową K
qp
, bo
wyrazy każdej macierzy z M
q×p
(K) można ułożyć w ciąg (qp)-elementowy,
układając jeden z a drugim jej wiersze, i widać, że działania na macierzach
odpowiadają przy tym działaniom na ciągach. Dlatego
dim M
q×p
(K) = qp.
39
Niech K będzie ciałem, a p, q, r ∈ N. Dwie macierze, z których pierwsza
należy do M
r×q
(K), a druga do M
q×p
(K), można pomnożyć według wzoru
a
11
. . . a
1q
...
...
a
r1
. . . a
rq
b
11
. . . b
1p
...
...
b
q1
. . . b
qp
=
a
11
b
11
+ . . . + a
1q
b
q1
. . . a
11
b
1p
+ . . . + a
1q
b
qp
...
...
a
r1
b
11
+ . . . + a
rq
b
q1
. . . a
r1
b
1p
+ . . . + a
rq
b
qp
.
Jak widać, ten iloczyn jest macierzą z M
r×p
(K).
Przykład. Dla macierzy o wyrazach z R
·
1 3 1
2 1 0
¸
2 3
1 0
4 1
=
·
1 · 2 + 3 · 1 + 1 · 4 1 · 3 + 3 · 0 + 1 · 1
2 · 2 + 1 · 1 + 0 · 4 2 · 3 + 1 · 0 + 0 · 1
¸
=
·
9 4
5 6
¸
.
Macierze odwzorowań liniowych
Jak zobaczymy, dość dotąd abstrakcyjne odwzorowania liniowe między
przestrzeniami skończonego wymiaru mogą być utożsamiane z macierzami,
jeśli tylko wybierze się w tych przestrzeniach uporządkowane bazy.
Definicja. Niech U i V będą skończenie wymiarowymi przestrzeniami
wektorowymi nad ciałem K, ciągi u
1
, . . . , u
p
i v
1
, . . . , v
q
niech będą bazami
odpowiednio U i V , natomiast f : U −→ V odwzorowaniem liniowym. Dla
każdego i ∈ {1, . . . , p} f (u
i
) ∈ V , więc skoro v
1
, . . . , v
q
jest bazą V , to istnieją
jednoznacznie wyznaczone a
1i
, . . . , a
qi
∈ K takie, że
f (e
i
) = a
1i
v
1
+ . . . + a
qi
v
q
.
W ten sposób orzymujemy macierz
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
,
którą nazywa się macierzą odwzorowania f w bazach u
1
, . . . , u
p
i v
1
, . . . , v
q
.
40
Zwróćmy uwagę, że kolejność kolumn i wierszy w macierzy odwzorowania
liniowego odzwierciedla kolejność wektorów odpowiednio w bazach dziedziny
i przeciwdziedziny. Z tego powodu istotne jest, że bazy są tu ciągami, a
nie zbiorami. Czasami chcąc podkreślić, że chodzi o bazy będące ciągami,
nazywa się je bazami uporządkowanymi
Przykład. Niech f : R
2
3 (x, y) −→ (x + 6y, 2x + 7y) ∈ R
2
. Chcemy
wyznaczyć macierz f w bazach (0, 1), (1, 1) oraz (1, 1), (2, 3). Obliczamy
f (0, 1) = (6, 7) = 4(1, 1) + 1(2, 3), f (1, 1) = (7, 9) = 3(1, 1) + 2(2, 3), więc
szukana macierz to
·
4 3
1 2
¸
.
Twierdzenie, które teraz wykażemy, mówi jak znając współrzędne wektora
w pewnej bazie dziedziny obliczyć szybko współrzędne w pewnej bazie prze-
ciwdziedziny wartości odwzorowania liniowego na tym wektorze, jeśli znamy
macierz tego odwzorowania w tych bazach.
Twierdzenie. Niech U i V będą skończenie wymiarowymi przestrzeniami
wektorowymi nad ciałem K, ciągi u
1
, . . . , u
p
i v
1
, . . . , v
q
niech będą bazami
odpowiednio U i V , f : U −→ V odwzorowaniem liniowym, a x ∈ U. Jeśli
x
1
. . . , x
p
są współrzędnymi x w bazie u
1
, . . . , u
p
, a y
1
, . . . , y
q
współrzędnymi
f (x) w bazie v
1
, . . . , v
q
, to
y
1
...
y
q
=
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
x
1
...
x
p
,
przy czym druga z macierzy występujących w tym wzorze jest macierzą f w
bazach u
1
, . . . , u
p
i v
1
, . . . , v
q
.
Dowód: Z f (x) = f (
P
p
i=1
x
i
u
i
) =
P
p
i=1
x
i
f (u
i
) =
P
p
i=1
x
i
(
P
q
j=1
a
ji
v
j
) =
P
q
j=1
(
P
p
i=1
a
ji
x
i
)v
j
i f (x) =
P
q
j=1
y
j
v
j
oraz jednoznaczności współrzędnych
wektora w bazie v
1
, . . . , v
q
dostajemy tezę twierdzenia, bo
P
p
i=1
a
ji
x
i
to leżący
w j-tym wierszu wyraz iloczynu z prawej strony dowodzonego wzoru.
To twierdzenie sugeruje, że wektory ze skończenie wymiarowej przestrzeni
wektorowej z ustaloną bazą wygodnie będzie reprezentować przez macierze
jednokolumnowe. Ściśle ujmuje to następne twierdzenie.
41
Twierdzenie. Gdy U jest skończenie wymiarową przestrzenią wektorową
nad ciałem K, a ciąg u
1
, . . . , u
p
jest jej bazą, to odwzorowanie
U −→ M
p×1
(K),
przyporządkowujące wektorom ich współrzędne w tej bazie (wpisane kolejno
do macierzy jednokolumnowej), jest izomorfizmem.
Dowód: Odwzorowaniem odwrotnym do tego z twierdzenia jest
M
p×1
(K) 3
x
1
...
x
p
−→
p
X
i=1
x
i
u
i
∈ U
i łatwo sprawdzić, że to ostatnie jest liniowe.
Kolejne twierdzenie mówi, że odwzorowania liniowe między skończenie
wymiarowymi przestrzeniami wektorowymi z ustalonymi bazami mogą być
reprezentowane przez macierze.
Twierdzenie. Niech U i V będą skończenie wymiarowymi przestrzeniami
wektorowymi nad ciałem K, a ciągi u
1
, . . . , u
p
i v
1
, . . . , v
q
niech będą bazami
odpowiednio U i V . Odwzorowanie
Hom(U, V ) −→ M
q×p
(K),
przyporządkowujące odwzorowaniom liniowym ich macierze w tych bazach,
jest izomorfizmem.
Dowód: Odwzorowaniem odwrotnym do tego z twierdzenia jest przypisa-
nie macierzy o wyrazach a
ji
jedynego odwzorowania liniowego f : U −→ V
spełniajacego warunki f (u
1
) =
P
q
j=1
a
j1
v
j
, . . . , f (u
p
) =
P
q
j=1
a
jp
v
j
i łatwo
sprawdzić, że to odwzorowanie odwrotne jest liniowe.
Ćwiczenie. Sprawdzić, że jeśli w K
p
i K
q
weźmie się bazy kanoniczne, to
macierz o wyrazach a
ji
jest wartością izomorfizmu z ostatniego twierdzenia
na K
p
3 (x
1
, . . . , x
p
) −→ (a
11
x
1
+ . . . + a
1p
x
p
, . . . , a
q1
x
1
+ . . . + a
qp
x
p
) ∈ K
q
.
Przykład. Dla f : R
2
3 (x, y) −→ (x + 3y, 2x + 4y) ∈ R
2
dostajemy
f (2, 1) = (5, 8), bo
·
1 3
2 4
¸ ·
2
1
¸
=
·
5
8
¸
.
42
Twierdzenie. Jeśli f : U −→ V i g : V −→ W są liniowe, u
1
, . . . , u
p
,
v
1
, . . . , v
q
, w
1
, . . . , w
r
są bazami odpowiednio U, V , W , zaś A jest macierzą
f w bazach u
1
, . . . , u
p
, v
1
, . . . , v
q
i B jest macierzą g w bazach v
1
, . . . , v
q
,
w
1
, . . . , w
r
, to macierzą g ◦ f w bazach u
1
, . . . , u
p
, w
1
, . . . , w
r
jest BA.
Dowód: Gdy oznaczmy wyrazy A i B odpowiednio przez a
ji
i b
kj
, to mamy
g(f (u
i
)) =
P
q
j=1
a
ji
g(v
j
) =
P
q
j=1
a
ji
(
P
r
k=1
b
kj
w
k
) =
P
r
k=1
(
P
q
j=1
b
kj
a
ji
)w
k
,
co kończy dowód, bo
P
q
j=1
b
kj
a
ji
to wyraz macierzy BA leżący na przecięciu
k-tego wiersza i i-tej kolumny.
Twierdzenie. Mnożenie macierzy jest łączne, to znaczy dla dowolnych
A ∈ M
q×p
(K), B ∈ M
r×q
(K), C ∈ M
s×r
(K) zachodzi równość
(CB)A = C(BA).
Dowód: Wystarczy wziąć odwzorowania liniowe K
p
−→ K
q
, K
q
−→ K
r
,
K
r
−→ K
s
mające w bazach kanonicznych macierze A, B, C i skorzystać z
poprzedniego twierdzenia oraz łączność składania odwzorowań.
Algebry endomorfizmów i macierzy
Definicja. Niech K będzie ciałem. Algebrą nad K nazywa się przestrzeń
wektorową A nad K z dodatkowym działaniem A × A 3 (a, b) −→ ab ∈ A
nazywanym mnożeniem i spełniającym warunki:
1) (ab)c = a(bc) dla wszystkich a, b, c ∈ A (łączność),
2) (a+b)c = ac+bc i a(b+c) = ab+ac dla wszystkich a, b, c ∈ A (rozdzielność
względem dodawania),
3) (αa)b = α(ab) i a(αb) = α(ab) dla wszystkich α ∈ K, a, b ∈ A (łączność
mieszana z mnożeniem przez skalary).
Gdy ponadto ba = ab dla wszystkich a, b ∈ A, to algebrę A nazywa się
przemienną, natomiast gdy istnieje element 1 zbioru A taki, że dla każdego
a ∈ A 1a = a i a1 = a, to mówi się, że algebra A jest z jedynką (oczywiście
jedynką nazywa się wtedy element 1, który jest jedyny).
Zauważmy, że algebra nad K jest równocześnie przestrzenią wektorową
nad K i pierścieniem, a obie te struktury są powiązane przez warunek 3).
Przy tym algebra jest przemienna lub z jedynką, gdy jest taka jako pierścień.
43
Przykład. Zbiór K[X] wielomianów jednej zmiennej o współczynnikach
z ciała K ze znanymi działaniami jest algebra przemienną z jedynką nad K.
Dla dowolnej przestrzeni wektorowej V nad ciałem K oznaczmy przez
End(V ) przestrzeń wektorową wszystkich endomorfizmów V −→ V (widać
więc, że End(V ) = Hom(V, V )).
Ćwiczenie. Sprawdzić, że dla dowolnej przestrzeni wektorowej V nad
ciałem K przestrzeń wektorowa End(V ) z mnożeniem
End(V ) × End(V ) 3 (g, f ) −→ g ◦ f ∈ End(V )
jest algebrą nad K z jedynką, którą jest id
V
. Udowodnić, że ta algebra jest
przemienna wtedy i tylko wtedy, gdy dim V ≤ 1.
Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Sprawdzić, że przestrzeń
wektorowa M
n×n
(K) z mnożeniem macierzy jest algebrą nad K z jedynką.
Jedynką tej algebry jest oznaczana przez I macierz jednostkowa o wyrazach
równych delcie Kroneckera δ
ji
dla i, j ∈ {1, . . . , n}. Ma ona na tak zwanej
głównej przekątnej łączącej rogi lewy górny i prawy dolny wyrazy równe 1, a
wszystkie pozostałe równe 0, czyli
I =
1
. ..
1
.
Udowodnić, że algebra M
n×n
(K) jest przemienna wtedy i tylko wtedy, gdy
n ≤ 1 (z tego, że
·
1 0
0 0
¸ ·
0 1
0 0
¸
=
·
0 1
0 0
¸
6=
·
0 0
0 0
¸
=
·
0 1
0 0
¸ ·
1 0
0 0
¸
,
widać nieprzemienność algebry M
2×2
(K)).
Jeżeli A i B są algebrami nad tym samym ciałem, to f : A −→ B nazywa
się homomorfizmem algebr, gdy jest liniowe i f (ab) = f (a)f (b) dla wszystkich
a, b ∈ A (czyli gdy jest równocześnie homomorfizmem przestrzeni wektoro-
wych i pierścieni). Jak zwykle, izomorfizmem algebr nazywa się homomorfizm
algebr, który jest bijekcją. Odwzorowanie odwrotne do izomorfizmu algebr
też jest izomorfizmem algebr.
44
Twierdzenie. Gdy V jest skończenie wymiarową przestrzenią wektorową
nad ciałem K, a ciąg v
1
, . . . , v
n
jest jej bazą, to odwzorowanie
End(V ) −→ M
n×n
(K),
przyporządkowujące endomorfizmom ich macierze w bazie v
1
, . . . , v
n
(tej sa-
mej w dziedzinie i przeciwdziedzinie), jest izomorfizmem algebr.
Dowód: Takie odwzorowanie jest szczególnym przypadkiem omówionego
wcześniej izomorfizmu przestrzeni wektorowych, bo End(V ) = Hom(V, V ).
To, że jest on też homomorfizmem algebr, wynika z twierdzenia mówiącego,
że składaniu odwzorowań liniowych odpowiada mnożenie ich macierzy we
właściwych bazach (zwróćmy uwagę, jak ważne tu jest, że do zdefiniowania
izomorfizmu End(V ) −→ M
n×n
(K) bierzemy w dziedzinie i przeciwdziedzinie
endomorfizmów V −→ V tę samą bazę v
1
, . . . , v
n
).
Odnotujmy jeszcze, że odwzorowanie End(V ) −→ M
n×n
(K) z ostatniego
twierdzenia przeprowadza id
V
na I.
Niech A będzie algebrą z jedynką, a a ∈ A. Jeśli istnieje takie b ∈ A, że
ab = 1 i ba = 1, to element a nazywa się odwracalnym, a b odwrotnym do
a i oznacza przez a
−1
(wiemy, że element odwrotny jest tylko jeden). Zbiór
elementów odwracalnych algebry A z mnożeniem z algebry A tworzy grupę
(wszystko to jest już znane z teorii pierścieni).
Zauważmy, że jeśli V jest przestrzenią wektorową, to grupą elementów
odwracalnych algebry End(V ) jest grupa Aut(V ), o której wspominaliśmy
przy okazji odwzorowań liniowych.
Definicja. Grupę elementów odwracalnych algebry M
n×n
(K), gdzie K
jest ciałem, a n ∈ N, nazywa się ogólną grupą liniową i oznacza GL(n, K).
Zatem
GL(n, K) = {A ∈ M
n×n
(K) : ∃
B∈M
n×n
(K)
AB = I, BA = I},
a działaniem w GL(n, K) jest mnożenie macierzy. Podgrupy grupy GL(n, K)
nazywa się grupami liniowymi
Następne twierdzenie jest natychmiastowym wnioskiem z poprzedniego.
45
Twierdzenie. Gdy V jest skończenie wymiarową przestrzenią wektorową
nad ciałem K, a ciąg v
1
, . . . , v
n
jest jej bazą, to odwzorowanie
Aut(V ) −→ GL(n, K),
przyporządkowujące automorfizmom ich macierze w bazie v
1
, . . . , v
n
(tej sa-
mej w dziedzinie i przeciwdziedzinie), jest izomorfizmem grup.
Macierz transponowana
Definicja. Niech K będzie ciałem, a p, q ∈ N. Macierzą transponowaną
do macierzy A z M
q×p
(K) o wyrazach a
ji
nazywa się macierz A
∗
z M
p×q
(K)
o wyrazach a
ij
, to znaczy
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
∗
=
a
11
. . . a
q1
...
...
a
1p
. . . a
qp
.
Zatem wiersze macierzy A
∗
są kolumnami macierzy A, a kolumny macierzy
A
∗
są wierszami macierzy A.
Twierdzenie. Jeżeli f : U −→ V jest liniowe, u
1
, . . . , u
p
i v
1
, . . . , v
q
są
bazami odpowiednio U i V , zaś A jest macierzą f w tych bazach, to A
∗
jest
macierzą f
∗
: V
∗
−→ U
∗
w bazach v
∗
1
, . . . , v
∗
q
i u
∗
1
, . . . , u
∗
p
.
Dowód: (f
∗
(v
∗
j
))(u
i
) = v
∗
j
(f (u
i
)) = v
∗
j
(
P
q
l=1
a
li
v
l
) =
P
q
l=1
a
li
v
∗
j
(v
l
) =
P
q
l=1
a
li
δ
jl
= a
ji
oraz (
P
p
k=1
a
jk
u
∗
k
)(u
i
) =
P
p
k=1
a
jk
δ
ki
= a
ji
, więc faktycznie
f
∗
(v
∗
j
) =
P
p
k=1
a
jk
u
∗
k
dla każdego j ∈ {1, . . . , q}.
Ćwiczenie. Sprawdzić, że
1) (A + B)
∗
= A
∗
+ B
∗
dla wszystkich A, B ∈ M
q×p
(K),
2) (αA)
∗
= αA
∗
dla wszystkich α ∈ K, A ∈ M
q×p
(K),
3) (BA)
∗
= A
∗
B
∗
dla wszystkich A ∈ M
q×p
(K), B ∈ M
r×q
(K),
4) A
∗∗
= A dla każdej A ∈ M
q×p
(K).
Rząd macierzy
Definicja. Niech K będzie ciałem, p, q ∈ N, a A ∈ M
q×p
(K). Macierz
A ma rząd równy r (co będziemy zapisywać jako rz A = r), gdy wśród jej
kolumn jest r liniowo niezależnych, ale nie ma r + 1 liniowo niezależnych.
46
Przykład. Rozważmy macierz
A =
1 2 4 3
1 3 5 5
2 5 9 8
z M
3×4
(R). Łatwo sprawdzić, że każde trzy spośród macierzy
1
1
2
,
2
3
5
,
4
5
9
,
3
5
8
są liniowo zależne, ale istnieją wśród nich dwie liniowo niezależne (choćby
dwie pierwsze). Dlatego rz A = 2.
Twierdzenie. Jeżeli f : U −→ V jest liniowe, u
1
, . . . , u
p
i v
1
, . . . , v
q
są
bazami odpowiednio U i V , a A jest macierzą f w tych bazach, to rz A = rz f .
Dowód: Skoro u
1
, . . . , u
p
generują U, to f (u
1
), . . . , f (u
p
) generują im f i
można spośród nich wybrać bazę im f . Widać więc, że dim im f , czyli rz f , to
największa ilość liniowo niezależnych wektorów, które można wybrać spośród
f (u
1
), . . . , f (u
p
). Ale przez izomorfizm V −→ M
q×1
(K) przyporządkowujący
wektorom ich współrzędne w bazie v
1
, . . . , v
q
wektory f (u
1
), . . . , f (u
p
) prze-
chodzą na kolumny A, bo f (u
i
) =
P
q
j=1
a
ji
v
j
, gdzie a
ji
oznaczają wyrazy A.
Zatem rz f to największa ilość liniowo niezależnych kolumn A, bo izomorfizm
przekształca ciągi liniowo niezależne na ciągi liniowo niezależne.
Twierdzenie. Dla każdego odwzorowania liniowego f : U −→ V , gdzie
U i V są skończenie wymiarowe, dim U = p i dim V = q, istnieją takie bazy
przestrzeni U i V , że wyrazy a
ji
macierzy odwzorowania f w tych bazach
wyrażają się wzorami
a
ji
=
½
1, gdy i = j oraz i, j ≤ rz f ,
0
w pozostałych przypadkach.
Dowód: Weźmy bazę u
1
, . . . , u
k
przestrzeni ker f i bazę v
1
, . . . , v
l
prze-
strzeni im f oraz wybierzmy w
1
∈ f
−1
({v
1
}), . . . , w
l
∈ f
−1
({v
l
}). Jak wiemy,
w
1
, . . . , w
l
, u
1
, . . . , u
k
jest wówczas bazą U. Dobierzmy takie z
1
, . . . , z
m
, żeby
ciąg v
1
, . . . , v
l
, z
1
, . . . , z
m
był bazą V . Tak skonstruowane bazy są dobre, bo
f (w
1
) = v
1
, . . . , f (w
l
) = v
l
, f (u
1
) = 0, . . . , f (u
k
) = 0 i oczywiście rz f = l.
47
Macierz z ostatniego twierdzenia można przejrzyście zapisać w tak zwanej
postaci blokowej, mianowicie
·
I
0
0 0
¸
,
gdzie I jest macierzą jednostkową z M
r×r
(K), a zera macierzami zerowymi
kolejno z M
r×(p−r)
(K), M
(q−r)×r
(K), M
(q−r)×(p−r)
, przy czym r = rz f .
Ćwiczenie. Niech K będzie ciałem, a p, q, r, s, t, u ∈ N. Zauważyć, że
1) jeżeli α ∈ K, A, E ∈ M
r×p
(K), B, F ∈ M
r×q
(K), C, G ∈ M
s×p
(K),
D, H ∈ M
s×q
(K), to
·
A B
C D
¸
+
·
E
F
G H
¸
=
·
A + E
B + F
C + G D + H
¸
,
α
·
A B
C
D
¸
=
·
αA αB
αC
αD
¸
,
2) jeżeli A ∈ M
r×p
(K), B ∈ M
r×q
(K), C ∈ M
s×p
(K), D ∈ M
s×q
(K),
E ∈ M
t×r
(K), F ∈ M
t×s
(K), G ∈ M
u×r
(K), H ∈ M
u×s
(K), to
·
E
F
G H
¸ ·
A B
C
D
¸
=
·
EA + F C
EB + F D
GA + HC
GB + HD
¸
,
3) jeżeli A ∈ M
r×p
(K), B ∈ M
r×q
(K), C ∈ M
s×p
(K), D ∈ M
s×q
(K), to
·
A B
C
D
¸
∗
=
·
A
∗
C
∗
B
∗
D
∗
¸
.
Twierdzenie. Jeżeli f : U −→ V jest liniowe, a U i V są skończenie
wymiarowe, to
rz f
∗
= rz f.
Dowód: Weźmy w U i V bazy, w których f ma macierz z poprzedniego
twierdzenia. W bazach dualnych f
∗
ma macierz do niej transponowaną, czyli
·
I
0
0 0
¸
,
gdzie I jest macierzą jednostkową z M
r×r
(K), a zera macierzami zerowymi
kolejno z M
r×(q−r)
(K), M
(p−r)×r
(K), M
(p−r)×(q−r)
, przy czym r = rz f . Ma
ona r pierwszych kolumn liniowo niezależnych, a pozostałe zerowe, więc jej
rząd, i tym samym rząd f
∗
, jest równy rz f .
48
Twierdzenie. Jeżeli K jest ciałem, p, q ∈ N, a A ∈ M
q×p
(K), to
rz A
∗
= rz A.
Dowód: Wystarczy zastosować ostatnie twierdzenie do f : K
p
−→ K
q
mającego w bazach kanonicznych macierz A.
Wniosek. Macierz ma rząd równy r, gdy wśród jej wierszy jest r liniowo
niezależnych, ale nie ma r + 1 liniowo niezależnych.
Przykład. Na podstawie ostatniego wniosku widać, że jeżeli do któregoś
wiersza macierzy doda się inny jej wiersz pomnożony przez dowolny skalar
lub jeżeli zamieni się miejscami dwa wiersze macierzy, to rząd tej macierzy
się nie zmieni. Dlatego można obliczać rząd macierzy metodą Gaussa. Na
przykład przy użyciu operacji elementarnych na wierszach macierz
1 2 4 3
1 3 5 5
2 5 9 8
można przekształcić w macierz „schodkową”
1 2 4 3
0 1 1 2
0 0 0 0
i dla niej znaleźć największą możliwą ilość liniowo niezależnych wierszy. Ale
ta ilość to oczywiście ilość wyrazów podkreślonych w trakcie wykonywania
algorytmu Gaussa. Zatem rząd rozpatrywanej macierzy jest równy 2.
Zmiana bazy
Definicja. Niech ciągi u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
będą bazami przestrzeni
wektorowej U nad ciałem K. Macierzą przejścia od bazy u
1
, . . . , u
p
do bazy
u
0
1
, . . . , u
0
p
nazywa się macierz z M
p×p
(K) o wyrazach p
ji
określonych przez
równości
u
0
i
= p
1i
u
1
+ . . . + p
pi
u
p
dla i ∈ {1, . . . , p} (a więc wyrazy p
1i
, . . . p
pi
z i-tej kolumny macierzy przejścia
to po prostu współrzędne wektora u
0
i
w bazie u
1
, . . . , u
p
).
49
Przykład. Ponieważ (7, 9) = 2(1, 2) + 5(1, 1), (4, 5) = 1(1, 2) + 3(1, 1),
to macierzą przejścia od bazy (1, 2), (1, 1) do bazy (7, 9), (4, 5) w R
2
jest
·
2 1
5 3
¸
.
Twierdzenie. Jeżeli P jest macierzą przejścia od bazy u
1
, . . . , u
p
do bazy
u
0
1
, . . . , u
0
p
, a Q od bazy u
0
1
, . . . , u
0
p
do bazy u
00
1
, . . . , u
00
p
, to macierzą przejścia
od bazy u
1
, . . . , u
p
do bazy u
00
1
, . . . , u
00
p
jest P Q.
Dowód: Oznaczając wyrazy macierzy P i Q odpowiednio przez p
ji
i q
ji
mamy u
00
i
=
P
p
j=1
q
ji
u
0
j
=
P
p
j=1
q
ji
(
P
p
k=1
p
kj
u
k
) =
P
p
k=1
(
P
p
j=1
p
kj
q
ji
)u
k
,
skąd wynika teza twierdzenia, bo
P
p
j=1
p
kj
q
ji
to wyraz macierzy P Q leżący
na przecięciu k-tego wiersza i i-tej kolumny.
Twierdzenie. Jeżeli P jest macierzą przejścia od bazy u
1
, . . . , u
p
do bazy
u
0
1
, . . . , u
0
p
, to P jest odwracalna i macierzą przejścia od bazy u
0
1
, . . . , u
0
p
do
bazy u
1
, . . . , u
p
jest P
−1
.
Dowód: Oznaczmy macierz przejścia od u
0
1
, . . . , u
0
p
do u
1
, . . . , u
p
przez Q.
Biorąc w ostatnim twierdzeniu u
1
, . . . , u
p
za u
00
1
, . . . , u
00
p
dostajemy P Q = I,
bo macierzą przejścia od dowolnej bazy do niej samej jest I. Zamieniając
rolami u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
dostajemy QP = I, więc Q = P
−1
.
Udowodnimy teraz dwa twierdzenia zawierające wzory transformacyjne.
Pierwsze z nich mówi, jak zmieniają się współrzędne wektora przy zmianie
bazy, a drugie mówi, jak zmienia się macierz odwzorowania liniowego przy
zmianie baz dziedziny i przeciwdziedziny.
Twierdzenie. Załóżmy, że u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
są bazami przestrzeni
wektorowej U, zaś x ∈ U. Jeżeli x
1
, . . . , x
p
i x
0
1
, . . . , x
0
p
są współrzędnymi
wektora x w bazie odpowiednio u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
, to
x
0
1
...
x
0
p
= P
−1
x
1
...
x
p
,
gdzie P oznacza macierz przejścia od bazy u
1
, . . . , u
p
do bazy u
0
1
, . . . , u
0
p
.
50
Dowód: Oznaczając wyrazy macierzy P przez p
ji
mamy x =
P
p
i=1
x
0
i
u
0
i
=
P
p
i=1
x
0
i
(
P
p
j=1
p
ji
u
j
) =
P
p
j=1
(
P
p
i=1
p
ji
x
0
i
)u
j
. Z drugiej strony x =
P
p
j=1
x
j
u
j
.
Stąd
P
p
i=1
p
ji
x
0
i
= x
j
dla j ∈ {1, . . . , p}, co można zapisać jako P X
0
= X,
gdzie X i X
0
są macierzami z M
p×1
(K) o wyrazach odpowiednio x
1
, . . . , x
p
i
x
0
1
, . . . , x
0
p
. Mnożąc ostatnią równość lewostronnie przez P
−1
dostajemy tezę.
Twierdzenie. Załóżmy, że u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
są bazami przestrzeni
wektorowej U, v
1
, . . . , v
q
i v
0
1
, . . . , v
0
q
są bazami przestrzeni wektorowej V , zaś
f : U −→ V jest liniowe. Jeżeli A jest macierzą f w bazach u
1
, . . . , u
p
i
v
1
, . . . , v
q
, a A
0
macierzą f w bazach u
0
1
, . . . , u
0
p
i v
0
1
, . . . , v
0
q
, to
A
0
= Q
−1
AP,
gdzie P oznacza macierz przejścia od bazy u
1
, . . . , u
p
do bazy u
0
1
, . . . , u
0
p
, a Q
macierz przejścia od bazy v
1
, . . . , v
q
do bazy v
0
1
, . . . , v
0
q
.
Dowód: Niech x ∈ U oraz niech X i X
0
oznaczają macierze z M
p×1
(K),
których wyrazy to współrzędne x w bazie odpowiednio u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
,
a Y i Y
0
macierze z M
q×1
(K), których wyrazy to współrzędne f (x) w bazie
odpowiednio v
1
, . . . , v
q
i v
0
1
, . . . , v
0
q
. Wstawiając Y = QY
0
i X = P X
0
do
równości Y = AX dostajemy QY
0
= AP X
0
, czyli Y
0
= Q
−1
AP X
0
. Z drugiej
strony Y
0
= A
0
X
0
. Ponieważ x był dowolny, to równość A
0
X
0
= Q
−1
AP X
0
oznacza, że A
0
i Q
−1
AP są macierzami w bazach u
0
1
, . . . , u
0
p
i v
0
1
, . . . , v
0
q
tego
samego odwzorowania liniowego, więc A
0
= Q
−1
AP .
Ślad macierzy i endomorfizmu
Definicja. Niech K będzie ciałem, n ∈ N, a A ∈ M
n×n
(K). Śladem tr A
macierzy A nazywa się sumę wyrazów z jej głównej przekątnej, czyli
tr A =
n
X
i=1
a
ii
,
gdzie a
ji
oznaczają wyrazy macierzy A.
Ćwiczenie. Sprawdzić, że odwzorowanie M
n×n
(K) 3 X −→ tr X ∈ K
jest liniowe.
Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A, B ∈ M
n×n
(K), to
tr (AB) = tr (BA).
51
Dowód: Gdy a
ji
i b
ji
oznaczają wyrazy macierzy odpowiednio A i B, to
tr (AB) =
P
n
i=1
(
P
n
j=1
a
ij
b
ji
) =
P
n
j=1
(
P
n
i=1
b
ji
a
ij
) = tr (BA).
Definicja. Śladem endomorfizmu f : U −→ U skończenie wymiarowej
przestrzeni wektorowej U nazywa się ślad jego macierzy w dowolnej bazie (tej
samej w dziedzinie i przeciwdziedzinie). Z ostatniego twierdzenia wynika, że
taka definicja jest poprawna, to znaczy nie zależy od wyboru bazy, bo gdy
u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
są bazami U, A i A
0
macierzami f w bazie odpowiednio
u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
, a P macierzą przejścia od u
1
, . . . , u
n
do u
0
1
, . . . , u
0
n
, to
tr A
0
= tr (P
−1
AP ) = tr (AP P
−1
) = tr A.
Ostatnie twierdzenie można sformułować jako następujący wniosek.
Wniosek. Dla dowolnych endomorfizmów f i g skończenie wymiarowej
przestrzeni wektorowej U
tr (f ◦ g) = tr (g ◦ f ).
Następne twierdzenie zawiera ciekawą charakteryzację śladu.
Twierdzenie. Niech K będzie ciałem, a n ∈ N. Gdy f : M
n×n
(K) −→ K
jest odwzorowaniem liniowym spełniającym dla wszystkich A, B ∈ M
n×n
(K)
warunek f (AB) = f (BA), to istnieje taka λ ∈ K, że f (X) = λ tr X dla
każdej X ∈ M
n×n
(K).
Dowód: Oznaczmy przez E
ji
, gdzie i, j ∈ {1, . . . , n}, macierz z M
n×n
(K),
która ma na przecięciu j-tego wiersza i i-tej kolumny 1, a wszystkie pozostałe
wyrazy równe 0. Oczywiście E
ji
dla i, j ∈ {1, . . . , n} tworzą bazę przestrzeni
M
n×n
(K) (odpowiada ona bazie kanonicznej przy utożsamieniu M
n×n
(K) z
K
n
2
). Łatwo zauważyć, że dla dowolnych i, j, k, l ∈ {1, . . . , n}
E
lk
E
ji
= δ
kj
E
li
,
gdzie δ
kj
oznacza jak zwykle deltę Kroneckera. Dzięki temu mamy dla i 6= j
f (E
ji
) = f (E
jj
E
ji
) = f (E
ji
E
jj
) = f (0) = 0, a ponadto f (E
ii
) = f (E
i1
E
1i
) =
f (E
1i
E
i1
) = f (E
11
). Oznaczając λ = f (E
11
) możemy te równości zapisać
krótko: f (E
ji
) = δ
ji
λ dla wszystkich i, j ∈ {1, . . . , n}. Ponieważ dla każdej
X ∈ M
n×n
(K) jest X =
P
n
i=1
P
n
j=1
x
ji
E
ji
, gdzie x
ji
są wyrazami X, to
f (X) =
P
n
i=1
P
n
j=1
x
ji
f (E
ji
) =
P
n
i=1
P
n
j=1
x
ji
δ
ji
λ =
P
n
i=1
x
ii
λ = λ tr X.
52
Odwzorowania wieloliniowe
Definicja. Niech U
1
, . . . , U
r
oraz V będą przestrzeniami wektorowymi
nad tym samym ciałem. Odwzorowanie
f : U
1
× . . . × U
r
−→ V
nazywa się r-liniowym, gdy jest liniowe ze względu na każdą zmienną z osobna
przy dowolnie ustalonych pozostałych, czyli gdy dla każdego i ∈ {1, . . . , r} i
każdych u
1
∈ U
1
, . . . , u
i−1
∈ U
i−1
, u
i+1
∈ U
i+1
, . . . , u
r
∈ U
r
odwzorowanie
U
i
3 u −→ f (u
1
, . . . , u
i−1
, u, u
i+1
, . . . , u
r
) ∈ V
jest liniowe.
Przykład. Łatwo sprawdzić trójliniowość odwzorowania
R
2
× R
2
× R 3 ((a, b), (c, d), e) −→ (2ace − ade − bce − bde, ace + 3bde) ∈ R
2
.
Zbiór wszystkich odwzorowań r-liniowych U
1
× . . . × U
r
−→ V będziemy
oznaczać przez L(U
1
, . . . , U
r
; V ). Z następnego ćwiczenia wynika, że jest to
przestrzeń wektorowa nad tym samym ciałem, co U
1
, . . . , U
r
oraz V .
Ćwiczenie. Niech U
1
, . . . , U
r
oraz V będą przestrzeniami wektorowymi
nad tym samym ciałem. Sprawdzić, że podzbiór L(U
1
, . . . , U
r
; V ) przestrzeni
wektorowej V
U
1
×...×U
r
jest jej podprzestrzenią.
Sformułujemy teraz i wykażemy twierdzenie o tym, że dowolnie zadane na
ciągach wektorów z baz poszczególnych przestrzeni wektorowych U
1
, . . . , U
r
odwzorowanie w przestrzeń wektorową V rozszerza się jednoznacznie do od-
wzorowania r-liniowego U
1
× . . . × U
r
−→ V . Będzie to zatem uogólnienie
twierdzenia, które już znamy, a które dotyczy przypadku r = 1.
Twierdzenie. Niech U
1
, . . . , U
r
oraz V będą przestrzeniami wektorowymi
nad tym samym ciałem, i niech dla każdego k ∈ {1, . . . , r} ciąg u
k1
, . . . , u
kp
k
będzie bazą przestrzeni wektorowej U
k
. Wtedy dla dowolnych v
l
1
...l
r
∈ V , gdzie
l
1
∈ {1, . . . , p
1
}, . . . , l
r
∈ {1, . . . , p
r
}, istnieje dokładnie jedno odwzorowanie
r-liniowe f : U
1
× . . . × U
r
−→ V takie, że f (u
1l
1
, . . . , u
rl
r
) = v
l
1
...l
r
dla
wszystkich l
1
∈ {1, . . . , p
1
}, . . . , l
r
∈ {1, . . . , p
r
}.
53
Dowód: Zastosujemy indukcję względem r. Dla każdego l ∈ {1, . . . , p
r
}
istnieje na podstawie założenia indukcyjnego dokładnie jedno (r − 1)-liniowe
g
l
: U
1
× . . . × U
r−1
−→ V takie, że g
l
(u
1l
1
, . . . , u
r−1 l
r−1
) = v
l
1
...l
r−1
l
dla
każdych l
1
∈ {1, . . . , p
1
}, . . . , l
r−1
∈ {1, . . . , p
r−1
}. Następnie istnieje jedyne
liniowe h : U
r
−→ L(U
1
, . . . , U
r−1
; V ) takie, że h(u
r1
) = g
1
, . . . , h(u
rp
r
) = g
p
r
.
Wystarczy teraz przyjąć f (x
1
, . . . , x
r
) = (h(x
r
))(x
1
, . . . , x
r−1
) dla dowolnych
x
1
∈ U
1
, . . . , x
r
∈ U
r
. Widać, że tak określone f spełnia wymagane warunki.
Stąd, że dla x
1
=
P
p
1
l
1
=1
x
1l
1
u
1l
1
, . . . , x
r
=
P
p
r
l
r
=1
x
rl
r
u
rl
r
powinna zachodzić
równość f (x
1
, . . . , x
r
) =
P
p
1
l
1
=1
. . .
P
p
r
l
r
=1
x
1l
1
. . . x
rl
r
v
l
1
...l
r
, otrzymujemy od
razu jednoznaczność f .
Twierdzenie. Jeżeli przestrzenie wektorowe U
1
, . . . , U
r
oraz V nad tym
samym ciałem są skończenie wymiarowe, to również przestrzeń wektorowa
L(U
1
, . . . , U
r
; V ) jest skończenie wymiarowa i
dim L(U
1
, . . . , U
r
; V ) = dim U
1
· . . . · dim U
r
· dim V.
Dowód: Niech dla każdego k ∈ {1, . . . , r} ciąg u
k1
, . . . , u
kp
k
będzie bazą
U
k
, a v
1
, . . . , v
q
niech będzie bazą V . Na podstawie poprzedniego twierdzenia
dla każdych j
1
∈ {1, . . . , p
1
}, . . . , j
r
∈ {1, . . . , p
r
}, i ∈ {1, . . . , q} istnieje
dokładnie jedno r-liniowe f
j
1
...j
r
,i
: U
1
× . . . × U
r
−→ V takie, że
f
j
1
...j
r
,i
(u
1l
1
, . . . , u
rl
r
) =
½
v
i
, gdy (l
1
, . . . , l
r
) = (j
1
, . . . , j
r
),
0,
gdy (l
1
, . . . , l
r
) 6= (j
1
, . . . , j
r
)
dla wszystkich l
1
∈ {1, . . . , p
1
}, . . . , l
r
∈ {1, . . . , p
r
}. W celu zakończenia do-
wodu wystarczy tylko sprawdzić, że te f
j
1
...j
r
,i
tworzą bazę L(U
1
, . . . , U
r
; V ).
Są one liniowo niezależne, bo gdy
P
p
1
l
1
=1
. . .
P
p
r
l
r
=1
P
q
i=1
α
l
1
...l
r
,i
f
l
1
...l
r
,i
= 0,
to obliczając wartości obu strony tej równości na (u
1j
1
, . . . , u
rj
r
) dostajemy
P
q
i=1
α
j
1
...j
r
,i
v
i
= 0, a stąd α
j
1
...j
r
,1
= 0, . . . , α
j
1
...j
r
,q
= 0. Natomiast generują
one L(U
1
, . . . , U
r
; V ), bo dla dowolnego g ∈ L(U
1
, . . . , U
r
; V ) mamy równość
g =
P
p
1
l
1
=1
. . .
P
p
r
l
r
=1
P
q
i=1
β
l
1
...l
r
,i
f
l
1
...l
r
,i
, gdzie β
l
1
...l
r
,1
, . . . , β
l
1
...l
r
,q
oznaczają
współrzędne g(u
1l
1
, . . . , u
rl
r
) w bazie v
1
, . . . , v
q
. A prawdziwość tej równości
łatwo sprawdzić obliczając wartości obu jej stron na ciągach (u
1j
1
, . . . , u
rj
r
)
i korzystając jeszcze raz z poprzedniego twierdzenia.
Zwróćmy uwagę, że powyższy dowód pokazuje, jak wychodząc od baz
przestrzeni wektorowych U
1
, . . . , U
r
oraz V skonstruować bazę przestrzeni
wektorowej L(U
1
, . . . , U
r
; V ).
54
Znak permutacji
Oznaczmy przez S
r
grupę permutacji zbioru {1, . . . , r} (jak pamiętamy
jest to grupa wszystkich bijekcji {1, . . . , r} −→ {1, . . . , r} ze składaniem
odwzorowań jako działaniem). Przypomnijmy, że jeśli a
1
, . . . , a
k
są różnymi
elementami zbioru {1, . . . , r}, to k-elementowy cykl (a
1
, . . . , a
k
) jest taką
permutacją σ z S
r
, że σ(a
1
) = a
2
, . . . , σ(a
k−1
) = a
k
oraz σ(a
k
) = a
1
. Cykle
dwuelementowe nazywa się transpozycjami.
Twierdzenie. Dowolna permutacja jest iloczynem transpozycji.
Dowód: Jak wiemy, dowolna permutacja jest iloczynem cykli. Natomiast
dowolny cykl k-elementowy jest następującym iloczynem k − 1 transpozycji
(a
1
, . . . , a
k
) = (a
1
, a
k
) . . . (a
1
, a
2
),
a więc twierdzenie jest wykazane.
Transpozycję (a, b) będziemy nazywać sąsiednią, gdy |b−a| = 1. Dowolna
permutacja jest iloczynem transpozycji sąsiednich, bo dowolna transpozycja
(a, b) jest następującym iloczynem 2|b − a| − 1 transpozycji sąsiednich
(a, b) = (a, a + 1) . . . (b − 2, b − 1)(b − 1, b)(b − 2, b − 1) . . . (a, a + 1)
(bez straty ogólności założyliśmy tu, że a < b).
Przykład. Permutacja
µ
1 2 3 4 5 6 7
5 1 7 6 2 3 4
¶
jest równa iloczynowi cykli (1, 5, 2)(3, 7, 4, 6), a więc zgodnie z powyższymi
wzorami jest równa iloczynowi transpozycji (1, 2)(1, 5)(3, 6)(3, 4)(3, 7) oraz
iloczynowi transpozycji sąsiednich (1, 2)(1, 2)(2, 3)(3, 4)(4, 5)(3, 4)(2, 3)(1, 2)
(3, 4)(4, 5)(5, 6)(4, 5)(3, 4)(3, 4)(3, 4)(4, 5)(5, 6)(6, 7)(5, 6)(4, 5)(3, 4).
Oczywiście permutację można zapisać jako iloczyn transpozycji na wiele
różnych sposobów. W ostatnim przykładzie zapisaliśmy tę samą permutację
jako iloczyn 5 transpozycji oraz jako iloczyn 21 transpozycji. Obie te liczby
są nieparzyste. Jak zaraz zobaczymy, nie jest to przypadek.
55
Niech σ ∈ S
r
, a i, j ∈ {1, . . . , r}. Mówimy, że para (i, j) jest inwersją w
permutacji σ, gdy i < j, ale σ(i) > σ(j).
Przykład. Permutacja z ostatniego przykładu ma dokładnie 11 inwersji:
(1, 2), (1, 5), (1, 6), (1, 7), (3, 4), (3, 5), (3, 6), (3, 7), (4, 5), (4, 6), (4, 7).
Twierdzenie. Jeżeli permutacja ma parzystą ilość inwersji, to w każdym
iloczynie transpozycji, który jest jej równy, jest parzysta ilość czynników, a
jeżeli ma nieparzystą ilość inwersji, to w każdym iloczynie transpozycji, który
jest jej równy, jest nieparzysta ilość czynników.
Dowód: Skoro udało nam się zapisać dowolną transpozycję jako iloczyn
nieparzystej ilości transpozycji sąsiednich, to wystarczy tylko udowodnić, że
dla każdych σ ∈ S
r
, i ∈ {1, . . . , r − 1} różnica ilości inwersji w permutacjach
σ i σ(i, i + 1) jest nieparzysta, bowiem wówczas indukcja ze względu na ilość
transpozycji w iloczynie natychmiast da nam tezę twierdzenia. Ale wartość
bezwzględna tej różnicy jest równa 1, ponieważ
σ(i, i + 1) =
µ
1
. . .
i − 1
i
i + 1
i + 2
. . .
r
σ(1) . . . σ(i − 1) σ(i + 1)
σ(i)
σ(i + 2) . . . σ(r)
¶
,
skąd widać, że (i, i + 1) jest inwersją w σ(i, i + 1) wtedy i tylko wtedy, gdy
nie jest inwersją w σ, i że jeżeli j 6= i oraz j 6= i + 1, to (i, j) albo (j, i) jest
inwersją w σ(i, i + 1) wtedy i tylko wtedy, gdy (i + 1, j) albo (j, i + 1) jest
inwersją w σ, a (i + 1, j) albo (j, i + 1) jest inwersją w σ(i, i + 1) wtedy i tylko
wtedy, gdy (i, j) albo (j, i) jest inwersją w σ, natomiast pozostałe inwersje w
σ(i, i + 1) i σ pokrywają się.
Definicja. Niech K będzie dowolnym ciałem. Dla każdej permutacji σ z
S
r
definiujemy jej znak jako element sgn σ ciała K określony wzorem
sgn σ =
½
1, gdy σ jest iloczynem parzystej ilości transpozycji,
−1, gdy σ jest iloczynem nieparzystej ilości transpozycji.
Pierwsze z twierdzeń, które udowodniliśmy, gwarantuje, że znak został
zdefiniowany dla każdej permutacji, a dzięki drugiemu definicja znaku jest
poprawna, bo wynika z niego, że żadna permutacja nie może być iloczynem
i parzystej, i nieparzystej ilości transpozycji.
56
Permutację nazywa się parzystą albo nieparzystą, gdy jej znak jest równy
odpowiednio 1 albo −1.
Przykład. Permutacja z poprzednich przykładów jest nieparzysta.
Odwzorowania wieloliniowe symetryczne i antysymetryczne
Przypomnijmy, że charakterystyką ciała K nazywa się najmniejszą nie-
zerową liczbę naturalną p taką, że w K p = 0 (przez p rozumie się tu sumę
1 + . . . + 1 o p składnikach), a gdy taka liczba nie istnieje, to 0.
Twierdzenie. Dla r-liniowego f : U × . . . × U −→ V rozważmy warunki:
1) f (u
σ(1)
, . . . , u
σ(r)
) = sgn σ f (u
1
, . . . , u
r
), dla każdej σ ∈ S
r
i wszystkich
u
1
, . . . , u
r
∈ U,
2) dla każdych i, j ∈ {1, . . . , r}, takich że i < j, i wszystkich u
1
, . . . , u
r
∈ U
f (u
1
, . . . , u
i−1
, u
j
, u
i+1
, . . . , u
j−1
, u
i
, u
j+1
, . . . , u
r
) = −f (u
1
, . . . , u
r
),
3) dla każdych i, j ∈ {1, . . . , r} takich, że i < j, i wszystkich u
1
, . . . , u
r
∈ U
takich, że u
i
= u
j
, f (u
1
, . . . , u
r
) = 0,
4) dla wszystkich liniowo zależnych u
1
, . . . , u
r
∈ U f (u
1
, . . . , u
r
) = 0.
Spośród powyższych warunków 1) i 2) są równoważne, 3) i 4) są równo-
ważne, z 3) i 4) wynikają 1) i 2), a jeśli U i V są nad ciałem charakterystyki
różnej od 2, to również z 1) i 2) wynikają 3) i 4).
Dowód: Równoważność 1) i 2) wynika stąd, że dowolna permutacja jest
złożeniem transpozycji. Jeżeli u
i
= u
j
i zachodzi 2), to mamy f (u
1
, . . . , u
r
) =
f (u
1
, . . . , u
i−1
, u
j
, u
i+1
, . . . , u
j−1
, u
i
, u
j+1
, . . . , u
r
) = −f (u
1
, . . . , u
r
), a zatem
2f (u
1
, . . . , u
r
) = 0. Gdy 2 6= 0, to możemy pomnożyć obie strony tej równość
przez 1/2 i stwierdzić, że wówczas z 2) wynika 3). Natomiast gdy zachodzi
3), to f (u
1
, . . . , u
i−1
, u
i
+ u
j
, u
i+1
, . . . , u
j−1
, u
i
+ u
j
, u
j+1
, . . . , u
r
) = 0, a stąd,
wykorzystując r-liniowości f i jeszcze dwa razy 3), otrzymujemy bez trudu
równość f (u
1
, . . . , u
r
)+f (u
1
, . . . , u
i−1
, u
j
, u
i+1
, . . . , u
j−1
, u
i
, u
j+1
, . . . , u
r
) = 0,
więc z 3) wynika 2). Jeżeli wektory u
1
, . . . , u
r
są liniowo zależne, to mamy
u
j
= λ
1
u
1
+ . . . + λ
j−1
u
j−1
+ λ
j+1
u
j+1
+ . . . + λ
r
u
r
dla pewnego j ∈ {1, . . . , r}.
Wystarczy teraz prawą stronę tej równości wstawić za u
j
do f (u
1
, . . . , u
r
) i
wykorzystać r-liniowość f i 3), aby udowodnić, że z 3) wynika 4). Implikacja
odwrotna jest trywialna, bo ciąg wektorów, który nie jest różnowartościowy,
jest liniowo zależny, a więc dowód jest zakończony.
57
Ćwiczenie. Wykazać, że dla r-liniowego f : U × . . . × U −→ V następu-
jące warunki są równoważne:
1) f (u
σ(1)
, . . . , u
σ(r)
) = f (u
1
, . . . , u
r
) dla każdej σ ∈ S
r
i wszystkich
u
1
, . . . , u
r
∈ U,
2) dla każdych i, j ∈ {1, . . . , r}, takich że i < j, i wszystkich u
1
, . . . , u
r
∈ U
f (u
1
, . . . , u
i−1
, u
j
, u
i+1
, . . . , u
j−1
, u
i
, u
j+1
, . . . , u
r
) = f (u
1
, . . . , u
r
).
Definicja. Odwzorowanie r-liniowe f : U × . . . × U −→ V nazywa się
symetrycznym, gdy spełnia któryś z warunków 1) i 2) z ostatniego ćwiczenia
(a więc automatycznie spełnia też drugi z nich), a antysymetrycznym (lub
skośnie symetrycznym), gdy spełnia któryś z warunków 3) i 4) z ostatniego
twierdzenia (a więc automatycznie spełnia wszystkie cztery; w dodatku, gdy
U i V są nad ciałem charakterystyki różnej od 2, to f jest antysymetryczne,
gdy spełnia któryś z warunków 1) i 2) z tego twierdzenia).
Przykład. R
2
× R
2
3 ((a, b), (c, d)) −→ 2ac + 3ad + 3bc + 4bd ∈ R jest
symetryczne, a R
2
× R
2
3 ((a, b), (c, d)) −→ ad − bc ∈ R antysymetryczne.
Oznaczmy przez L
r
(U, V ) przestrzeń wektorową wszystkich r-liniowych
odwzorowań U × . . . × U −→ V (w takim razie L
r
(U, V ) jest szczególnym
przypadkiem przestrzeni L(U
1
, . . . , U
r
; V ) z U
1
= U, . . . , U
r
= U), natomiast
przez L
r
S
(U, V ) i L
r
A
(U, V ) jej podzbiory złożone z odwzorowań odpowiednio
symetrycznych i antysymetrycznych.
Ćwiczenie. Sprawdzić, że L
r
S
(U, V ) i L
r
A
(U, V ) są podprzestrzeniami
przestrzeni wektorowej L
r
(U, V ).
Sformułujemy teraz i wykażemy twierdzenie o tym, że dowolnie zadane na
silnie rosnących ciągach wektorów z uporządkowanej bazy przestrzeni wekto-
rowej U odwzorowanie w przestrzeń wektorową V rozszerza się jednoznacznie
do antysymetrycznego odwzorowania r-liniowego U × . . . × U −→ V .
Twierdzenie. Niech U i V będą przestrzeniami wektorowymi nad tym
samym ciałem, a ciąg u
1
, . . . , u
p
niech będzie bazą U. Wtedy dla dowolnych
v
l
1
...l
r
∈ V , gdzie l
1
, . . . , l
r
∈ {1, . . . , p} spełniają warunek l
1
< . . . < l
r
,
istnieje dokładnie jedno antysymetryczne r-liniowe f : U × . . . × U −→ V
takie, że f (u
l
1
, . . . , u
l
r
) = v
l
1
...l
r
dla wszystkich l
1
, . . . , l
r
∈ {1, . . . , p}, które
spełniają warunek l
1
< . . . < l
r
.
58
Dowód: Niech l
1
, . . . , l
r
∈ {1, . . . , p}. Gdy ciąg l
1
, . . . , l
r
nie jest różno-
wartościowy, to musi zachodzić równość f (u
l
1
, . . . , u
l
r
) = 0, natomiast gdy
jest, to istnieje dokładnie jedna permutacja σ ∈ S
r
taka, że l
σ(1)
< . . . < l
σ(r)
i musi zachodzić równość f (u
l
1
, . . . , u
l
r
) = (1/sgn σ) v
l
σ(1)
...l
σ(r)
. Jak wiemy,
istnieje dokładnie jedno r-liniowe f : U × . . . × U −→ V , które spełnia te
równości dla wszystkich l
1
, . . . , l
r
∈ {1, . . . , p}. Pozostało sprawdzić, że f jest
antysymetryczne. Widać, że dla x
1
=
P
p
l
1
=1
x
1l
1
u
l
1
, . . . , x
r
=
P
p
l
r
=1
x
rl
r
u
l
r
mamy f (x
1
, . . . , x
r
) =
P
l
1
<...<l
r
P
σ∈S
r
x
1l
σ(1)
. . . x
rl
σ(r)
sgn σ v
l
1
...l
r
. Załóżmy,
że x
i
= x
j
dla i < j. Ponieważ ϕ : T 3 σ −→ σ ◦ (i, j) ∈ S
r
\ T , gdzie
T = {σ ∈ S
r
: σ(i) < σ(j)}, jest bijekcją i przy ustalonych l
1
, . . . , l
r
i σ ∈ T
sgn ϕ(σ) = −sgn σ, x
il
ϕ(σ)(i)
= x
jl
σ(j)
i x
jl
ϕ(σ)(j)
= x
il
σ(i)
, a x
kl
ϕ(σ)(k)
= x
kl
σ(k)
,
gdy k 6= i i k 6= j, to w sumie po prawej stronie wzoru na f (x
1
, . . . , x
r
)
składniki odpowiadające σ i ϕ(σ) wzajemnie się znoszą i f (x
1
, . . . , x
r
) = 0.
Twierdzenie. Jeżeli przestrzenie wektorowe U oraz V nad tym samym
ciałem są skończenie wymiarowe, to również przestrzeń wektorowa L
r
A
(U, V )
jest skończenie wymiarowa i
dim L
r
A
(U, V ) =
µ
dim U
r
¶
dim V.
Dowód: Niech u
1
, . . . , u
p
i v
1
, . . . , v
q
będą bazami odpowiednio U i V .
Na podstawie poprzedniego twierdzenia dla każdych j
1
, . . . , j
r
∈ {1, . . . , p}
spełniających warunek j
1
< . . . < j
r
i i ∈ {1, . . . , q} istnieje dokładnie jedno
antysymetryczne r-liniowe g
j
1
...j
r
,i
: U × . . . × U −→ V takie, że
g
j
1
...j
r
,i
(u
l
1
, . . . , u
l
r
) =
½
v
i
, gdy (l
1
, . . . , l
r
) = (j
1
, . . . , j
r
),
0,
gdy (l
1
, . . . , l
r
) 6= (j
1
, . . . , j
r
)
dla wszystkich l
1
, . . . , l
r
∈ {1, . . . , p} spełniających warunek l
1
< . . . < l
r
. W
celu zakończenia dowodu wystarczy tylko sprawdzić, że te g
j
1
...j
r
,i
tworzą bazę
L
r
A
(U, V ). Są one liniowo niezależne, bo gdy
P
l
1
<...<l
r
P
q
i=1
α
l
1
...l
r
,i
g
l
1
...l
r
,i
=
0, to obliczając wartości obu stron tej równości na (u
j
1
, . . . , u
j
r
) takim, że
j
1
< . . . < j
r
, dostajemy
P
q
i=1
α
j
1
...j
r
,i
v
i
= 0, i α
j
1
...j
r
,1
= 0, . . . , α
j
1
...j
r
,q
= 0.
Natomiast generują L
r
A
(U, V ), bo dla dowolnego h ∈ L
r
A
(U, V ) mamy rów-
ność h =
P
l
1
<...<l
r
P
q
i=1
β
l
1
...l
r
,i
g
l
1
...l
r
,i
, gdzie β
l
1
...l
r
,1
, . . . , β
l
1
...l
r
,q
oznaczają
współrzędne h(u
l
1
, . . . , u
l
r
) w bazie v
1
, . . . , v
q
. A prawdziwość tej równości
łatwo sprawdzić obliczając wartości obu jej stron na ciągach (u
j
1
, . . . , u
j
r
)
takich, że j
1
< . . . < j
r
, i korzystając jeszcze raz z poprzedniego twierdzenia.
59
Zwróćmy uwagę, że powyższy dowód pokazuje, jak wychodząc od baz
przestrzeni U oraz V skonstruować bazę przestrzeni wektorowej L
r
A
(U, V ).
W dowodzie tym wykorzystaliśmy oczywisty fakt, że ilość r-elementowych
silnie rosnących ciągów o elementach ze zbioru {1, . . . , p} jest równa ilości
kombinacji bez powtórzeń p elementów po r elementów. Przypomnijmy, że
ta ilość wyraża się znanym z kombinatoryki wzorem
µ
p
r
¶
=
p!
r! (p − r)!
.
Przykład. dim L
2
A
(R
3
, R) =
¡
3
2
¢
·1 = 3. Wychodząc od baz kanonicznych
w R
3
i R i postępując tak, jak w powyższym dowodzie, dostalibyśmy bazę
przestrzeni L
2
A
(R
3
, R) złożoną z odwzorowań
g
12,1
: R
3
× R
3
3 ((a, b, c), (d, e, f )) −→ ae − bd ∈ R,
g
13,1
: R
3
× R
3
3 ((a, b, c), (d, e, f )) −→ af − cd ∈ R,
g
23,1
: R
3
× R
3
3 ((a, b, c), (d, e, f )) −→ bf − ce ∈ R.
Można się o tym przekonać obliczając wartości tych odwzorowań na ciągach
((1, 0, 0), (0, 1, 0)), ((1, 0, 0), (0, 0, 1)), ((0, 1, 0), (0, 0, 1)).
Dwa następne ćwiczenia są odpowiednikami dwóch ostatnich twierdzeń,
ale dotyczą odwzorowań symetrycznych zamiast antysymetrycznych (dlatego
pojawiają się tam ciągi słabo rosnące zamiast silnie rosnących i w konsekwen-
cji kombinacje z powtórzeniami zamiast bez powtórzeń).
Ćwiczenie. Udowodnić, że jeżeli U i V są przestrzeniami wektorowymi
nad tym samym ciałem, a ciąg u
1
, . . . , u
p
jest bazą U, to dla dowolnych
v
l
1
...l
r
∈ V , gdzie l
1
, . . . , l
r
∈ {1, . . . , p} spełniają warunek l
1
≤ . . . ≤ l
r
,
istnieje dokładnie jedno symetryczne r-liniowe f : U × . . . × U −→ V takie,
że f (u
l
1
, . . . , u
l
r
) = v
l
1
...l
r
dla wszystkich l
1
, . . . , l
r
∈ {1, . . . , p}, które speł-
niają warunek l
1
≤ . . . ≤ l
r
.
Ćwiczenie. Udowodnić, że jeżeli przestrzenie wektorowe U oraz V nad
tym samym ciałem są skończenie wymiarowe, to również przestrzeń wekto-
rowa L
r
S
(U, V ) jest skończenie wymiarowa i
dim L
r
S
(U, V ) =
µ
dim U + r − 1
r
¶
dim V.
60
Wyznacznik macierzy kwadratowej
Wprowadzimy teraz bardzo ważne pojęcie wyznacznika macierzy.
Definicja. Niech K będzie ciałem, a n ∈ N. Dla macierzy A z M
n×n
(K)
o wyrazach a
ji
definiujemy jej wyznacznik wzorem
det A =
X
σ∈S
n
sgn σ a
1σ(1)
. . . a
nσ(n)
.
Często zamiast det A pisze się
¯
¯
¯
¯
¯
¯
a
11
. . . a
1n
...
...
a
n1
. . . a
nn
¯
¯
¯
¯
¯
¯
.
Przykład. S
1
= {id
{1}
}, więc |a
11
| = a
11
.
Przykład. S
2
= {id
{1,2}
, (1, 2)}, więc
¯
¯
¯
¯
a
11
a
12
a
21
a
22
¯
¯
¯
¯ = a
11
a
22
− a
12
a
21
.
Przykład. S
3
= {id
{1,2,3}
, (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)}, więc
¯
¯
¯
¯
¯
¯
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
¯
¯
¯
¯
¯
¯
=
a
11
a
22
a
33
+ a
12
a
23
a
31
+ a
13
a
21
a
32
− a
13
a
22
a
31
− a
11
a
23
a
32
− a
12
a
21
a
33
.
Ten wzór jest już trudniejszy do zapamiętania. Do obliczania wyznaczników
macierzy z M
3×3
(K) można jednak stosować nastepującą metodę Sarrusa.
Dopisuje się do takiej macierzy jako czwartą i piątą kolumnę jej kolumny od-
powiednio pierwszą i drugą, oblicza iloczyny wyrazów tak powstałej macierzy
z M
3×5
(K) połączonych liniami na schematach
s
s
s
s
s
s
s
s
s
s
s
s
s
s
s
@
@
@
@
@
@
@
@
@
@
@
@
s
s
s
s
s
s
s
s
s
s
s
s
s
s
s
¡
¡
¡
¡
¡
¡
¡
¡
¡
¡
¡
¡
61
i wreszcie sumuje te iloczyny, mnożąc przy tym przez −1 te, które powstały
z drugiego schematu. Na przykład dla
A =
1 2 3
4 5 6
7 8 9
mamy po dopisaniu kolumn
1 2 3 1 2
4 5 6 4 5
7 8 9 7 8
,
więc det A = 1 · 5 · 9 + 2 · 6 · 7 + 3 · 4 · 8 − 3 · 5 · 7 − 1 · 6 · 8 − 2 · 4 · 9 = 0.
Czasem dopisywanie kolumn bywa kłopotliwe. W takiej sytuacji zamiast
poprzednich schematów można użyć następujących
s
s
s
s
s
s
s
s
s
@
@
@
@
@
@
©
©
©
©
¢
¢
¢
¢ ©
©
©
©
@
@¢
¢
¢
¢
s
s
s
s
s
s
s
s
s
¡
¡
¡
¡
HH
HH
¡
¡
A
A
A
A ¡
¡
HH
HHA
A
A
A
odnoszących się bezpośrednio do macierzy z M
3×3
(K). Wówczas oblicza się
iloczyny wyrazów leżących na zaznaczonych przekątnych macierzy oraz w
wierzchołkach zaznaczonych trójkątów. Dalej postępuje się jak poprzednio.
Twierdzenie. Dla dowolnej macierzy A z M
n×n
(K) o wyrazach a
ji
det A =
X
σ∈S
n
sgn σ a
σ(1)1
. . . a
σ(n)n
.
Dowód: Twierdzenie zachodzi, bo det A =
P
σ∈S
n
sgn σ a
1σ(1)
. . . a
nσ(n)
=
P
σ∈S
n
sgn σ
−1
a
σ
−1
(1)1
. . . a
σ
−1
(n)n
, a S
n
3 σ −→ σ
−1
∈ S
n
jest bijekcją.
Wniosek. Dla dowolnej macierzy A z M
n×n
(K)
det A
∗
= det A.
Może się wydawać dziwne, czemu definicja wyznacznika jest akurat taka,
a nie inna. Z następnego twierdzenia widać, że jest ona uzasadniona, bo
wyznacznik jest jedynym obiektem o pewnych dobrych własnościach.
62
Twierdzenie. Niech K będzie ciałem, a n ∈ N. Wtedy
1) wyznacznik macierzy z M
n×n
(K) jest antysymetryczną n-liniową funkcją
jej kolumn, to znaczy antysymetrycznym n-liniowym jest odwzorowanie
M
n×1
(K) × . . . × M
n×1
(K) 3 (A
1
, . . . , A
n
) −→ det[A
1
. . . A
n
] ∈ K,
2) dla macierzy jednostkowej I z M
n×n
(K)
det I = 1.
Co więcej, przyporządkowanie macierzom z M
n×n
(K) ich wyznaczników jest
jedynym odwzorowaniem M
n×n
(K) −→ K spełniającym warunki 1) i 2)
(należy to rozumieć tak, że jeżeli dla f : M
n×n
(K) −→ K odwzorowanie
M
n×1
(K) × . . . × M
n×1
(K) 3 (A
1
, . . . , A
n
) −→ f ([A
1
. . . A
n
]) ∈ K jest an-
tysymetryczne n-liniowe i f (I) = 1, to dla każdej A ∈ M
n×n
(K) zachodzi
równość f (A) = det A).
Dowód: Z poprzedniego twierdzenia widać, że odwzorowanie z punktu
1) jest n-liniowe. Żeby wykazać jego antysymetryczność oznaczmy przez a
ji
wyrazy macierzy A i załóżmy, że A
i
= A
j
dla i < j. Ponieważ mamy bijekcję
ϕ : T 3 σ −→ σ ◦ (i, j) ∈ S
n
\ T , gdzie T = {σ ∈ S
n
: σ(i) < σ(j)}, i dla
każdej σ ∈ T mamy sgn ϕ(σ) = −sgn σ, a
ϕ(σ)(i) i
= a
σ(j)j
i a
ϕ(σ)(j) j
= a
σ(i)i
, a
a
ϕ(σ)(k) k
= a
σ(k)k
, gdy k 6= i i k 6= j, to w sumie
P
σ∈S
n
sgn σ a
σ(1)1
. . . a
σ(n)n
składniki odpowiadające σ i ϕ(σ) wzajemnie się znoszą i det A = 0. Punkt
2) jest konsekwencją tego, że gdy σ 6= id
{1,...,n}
, to δ
1σ(1)
. . . δ
nσ(n)
= 0, zaś
sgn id
{1,...,n}
δ
11
. . . δ
nn
= 1. W celu udowodnienia drugiej części twierdzenia
zauważmy, że dim M
n×1
(K) = n, więc dim L
n
A
(M
n×1
(K), K) =
¡
n
n
¢
· 1 = 1.
W takim razie odwzorowanie z punktu 1), będąc niezerowym, stanowi bazę
przestrzeni L
n
A
(M
n×1
(K), K) i mamy f = λ det dla pewnego λ ∈ K, a skoro
1 = f (I) = λ det I = λ · 1 = λ, to f = det, co kończy dowód.
Oczywiście powyższe twierdzenie pozostanie prawdziwe, gdy zastąpimy
w nim kolumny przez wiersze. W szczególności mamy następujący wniosek.
Wniosek. Niech K będzie ciałem, a n ∈ N. Wtedy wyznacznik macierzy
z M
n×n
(K) jest antysymetryczną n-liniową funkcją jej wierszy, to znaczy
antysymetrycznym n-liniowym jest odwzorowanie
M
1×n
(K) × . . . × M
1×n
(K) 3 (A
1
, . . . , A
n
) −→ det
A
1
...
A
n
∈ K.
63
Ponieważ antysymetryczne odwzorowanie wieloliniowe zeruje się na ciągu
wektorów liniowo zależnych, dostajemy natychmiast kolejne wnioski.
Wniosek. Dla macierzy kwadratowej jest prawdą, że
1) jeżeli do którejś kolumny dodamy dowolną kombinację liniową pozosta-
łych kolumn, to wyznacznik się nie zmieni,
2) jeżeli którąś kolumnę pomnożymy przez dowolny skalar, to wyznacznik
ulegnie pomnożeniu przez ten skalar,
3) jeżeli zamienimy miejscami dwie kolumny, to wyznacznik zmieni się na
przeciwny.
Wniosek. Dla macierzy kwadratowej jest prawdą, że
1) jeżeli do któregoś wiersza dodamy dowolną kombinację liniową pozosta-
łych wierszy, to wyznacznik się nie zmieni,
2) jeżeli któryś wiersz pomnożymy przez dowolny skalar, to wyznacznik ule-
gnie pomnożeniu przez ten skalar,
3) jeżeli zamienimy miejscami dwa wiersze, to wyznacznik zmieni się na
przeciwny.
Twierdzenie. Niech K będzie ciałem, a p, q ∈ N. Wtedy dla dowolnych
A ∈ M
p×p
(K), B ∈ M
p×q
(K), D ∈ M
q×q
(K)
det
·
A B
0
D
¸
= det A · det D
(oczywiście zero w powyższym wzorze oznacza macierz zerową z M
q×p
(K)).
Dowód: Niech e
ji
oznaczają wyrazy macierzy z lewej strony dowodzonego
wzoru. Wtedy e
σ(1)1
. . . e
σ(p+q) p+q
= 0 dla σ ∈ S
p+q
takiej, że σ(i) > p dla
pewnego i ≤ p. Ale dla σ ∈ S
p+q
takiej, że σ(i) ≤ p dla wszystkich i ≤ p,
istnieją jednoznacznie wyznaczone τ ∈ S
p
, υ ∈ S
q
takie, że
σ =
µ
1
. . .
p
p + 1
. . .
p + q
τ (1) . . . τ (p) p + υ(1) . . . p + υ(q)
¶
i przy tym jest sgn σ = sgn τ sgn υ. Dlatego oznaczając przez a
ji
i d
ji
wyrazy
macierzy A i D widzimy, że wyznacznik z lewej strony dowodzonego wzoru
równa się
P
τ ∈S
p
P
υ∈S
q
sgn τ sgn υ e
τ (1)1
. . . e
τ (p)p
e
p+υ(1) p+1
. . . e
p+υ(q) p+q
, czyli
(
P
τ ∈S
p
sgn τ a
τ (1)1
. . . a
τ (p)p
)(
P
υ∈S
q
sgn υ d
υ(1)1
. . . d
υ(q)q
), co kończy dowód.
64
Wniosek. Niech K będzie ciałem, n ∈ N, a a
ji
∈ K dla i, j ∈ {1, . . . , n}.
Jeżeli a
ji
= 0, gdy j > i, to wyznacznik macierzy z M
n×n
(K) o wyrazach a
ji
przedstawia się wzorem
det
a
11
. . .
a
1n
. ..
...
a
nn
= a
11
· . . . · a
nn
,
czyli wyznacznik macierzy „górnej trójkątnej” jest równy iloczynowi wyrazów
z jej głównej przekątnej.
Dowód: Stosujemy ostatnie twierdzenie i indukcję ze względu na n.
Oczywiście także wyznacznik macierzy „dolnej trójkątnej” (czyli mającej
wyrazy a
ji
takie, że a
ji
= 0, gdy j < i) jest równy iloczynowi wyrazów z jej
głównej przekątnej.
To, co udowodniliśmy do tej pory, pozwala nam obliczać wyznaczniki
macierzy kwadratowych metodą Gaussa. Otóż przy pomocy dwóch operacji
elementarnych: dodawania do któregoś wiersza innego wiersza pomnożonego
przez dowolny skalar i zamiany dwóch wierszy miejscami, z których pierwsza
nie zmienia wyznacznika, a druga zmienia na przeciwny, możemy sprowadzić
macierz do postaci „górnej trójkątnej”, a wyznacznik tej ostatniej już bardzo
łatwo obliczyć mnożąc po prostu wyrazy z jej głównej przekątnej.
Przykład. Przy użyciu operacji elementarnych na wierszach macierz
2 3 1 1
2 3 4 2
4 7 5 6
2 4 7 8
można przekształcić w macierz „górną trójkątną”
2 3 1 1
0 1 3 4
0 0 3 1
0 0 0 2
zamieniając po drodze dwa wiersze miejscami jeden raz. Zatem wyznacznik
rozpatrywanej macierzy jest równy −2 · 1 · 3 · 2, czyli −12.
65
Wzór Bineta-Cauchy’ego
Sformułujemy i udowodnimy teraz tak zwany wzór Bineta-Cauchy’ego na
wyznacznik iloczynu macierzy.
Twierdzenie. Niech K będzie ciałem, a p, q ∈ N. Wtedy dla dowolnych
A ∈ M
p×q
(K) i B ∈ M
q×p
(K)
det(BA) =
X
l
1
<...<l
q
det[B
l
1
. . . B
l
q
] · det
A
l
1
...
A
l
q
,
przy czym A
1
, . . . , A
p
i B
1
, . . . , B
p
oznaczają odpowiednio wiersze macierzy
A i kolumny macierzy B, a sumuje się po wszystkich l
1
, . . . , l
q
∈ {1, . . . , p}
takich, że l
1
< . . . < l
q
.
Dowód: Oznaczmy przez a
ji
i b
ji
wyrazy macierzy odpowiednio A i B.
Wyraz macierzy BA leżący na przecięciu k-tego wiersza i i-tej kolumny jest
równy
P
p
j=1
b
kj
a
ji
, czyli i-ta kolumna macierzy BA jest równa
P
p
j=1
a
ji
B
j
.
Zatem det(BA) = det[
P
p
j
1
=1
a
j
1
1
B
j
1
, . . . ,
P
p
j
q
=1
a
j
q
q
B
j
q
]. Lecz wyznacznik
macierzy z M
q×q
(K) jest q-liniową funkcją jej kolumn, dlatego det(BA) =
P
p
j
1
,...,j
q
=1
a
j
1
1
. . . a
j
q
q
det[B
j
1
, . . . , B
j
q
]. Następnie, ponieważ funkcja ta jest
antysymetryczna oraz każdy różnowartościowy ciąg j
1
, . . . , j
q
można jedno-
znacznie zapisać jako l
σ(1)
, . . . , l
σ(q)
, gdzie l
1
< . . . < l
q
i σ ∈ S
q
, dostajemy
równości det(BA) =
P
l
1
<...<l
q
P
σ∈S
q
a
l
σ(1)
1
. . . a
l
σ(q)
q
det[B
l
σ(1)
, . . . , B
l
σ(q)
] =
P
l
1
<...<l
q
det[B
l
1
, . . . , B
l
q
]
P
σ∈S
q
sgn σ a
l
σ(1)
1
. . . a
l
σ(q)
q
, a więc twierdzenie jest
udowodnione, bo
P
σ∈S
q
sgn σ a
l
σ(1)
1
. . . a
l
σ(q)
q
to nic innego, tylko wyznacznik
macierzy o wierszach A
l
1
, . . . , A
l
q
.
Przykład. Ze wzoru Bineta-Cauchy’ego mamy
det
·
8 1 7
9 0 6
¸
0 1
5 4
3 2
=
¯
¯
¯
¯
8 1
9 0
¯
¯
¯
¯
¯
¯
¯
¯
0 1
5 4
¯
¯
¯
¯ +
¯
¯
¯
¯
8 7
9 6
¯
¯
¯
¯
¯
¯
¯
¯
0 1
3 2
¯
¯
¯
¯ +
¯
¯
¯
¯
1 7
0 6
¯
¯
¯
¯
¯
¯
¯
¯
5 4
3 2
¯
¯
¯
¯ .
66
Zauważmy, że gdy p < q, to prawa strona wzoru Bineta-Cauchy’ego jest
równa 0, bo nie ma wtedy silnie rosnących q-elementowych ciągów liczb z
{1, . . . , p}. Natomiast dla p = q mamy bardzo ważny przypadek szczególny
nazywany wzorem Cauchy’ego i przedstawiony w poniższym wniosku.
Wniosek. Niech K będzie ciałem, a n ∈ N. Wtedy
det(BA) = det B · det A
dla dowolnych A, B ∈ M
n×n
(K).
Twierdzenie. Niech K będzie ciałem, a n ∈ N. Dla A ∈ M
n×n
(K)
następujące warunki są równoważne
1) A jest odwracalna,
2) istnieje taka B ∈ M
n×n
(K), że BA = I,
3) istnieje taka B ∈ M
n×n
(K), że AB = I,
4) det A 6= 0,
5) rz A = n.
Dowód: Oczywiście z 1) wynikają 2) i 3). Gdy zachodzi 2) lub 3), to
na podstawie wzoru Cauchy’ego zachodzi 4). Z 4) wynika, że kolumny A
są liniowo niezależne, czyli 5). Niech f : K
n
−→ K
n
oznacza endomorfizm,
który ma w bazie kanonicznej macierz A. Warunek 5) mówi, że rz f = n,
czyli f jest epimorfizmem, a więc i izomorfizmem. Zatem A jest odwracalna,
bo macierzą do niej odwrotną jest macierz f
−1
w bazie kanonicznej, i tym
samym z 5) wynika 1).
Macierze, które spełniają równoważne warunki z powyższego twierdzenia
nazywa się nieosobliwymi, a pozostałe macierze kwadratowe osobliwymi. A
więc grupa GL(n, K) składa się z tych macierzy algebry M
n×n
(K), które są
nieosobliwe.
Odnotujmy jeszcze jeden wniosek ze wzoru Cauchy’ego.
Wniosek. Niech K będzie ciałem, a n ∈ N. Dla A ∈ GL(n, K) mamy
det A
−1
=
1
det A
.
67
Wyznacznik endomorfizmu
Definicja. Wyznacznikiem endomorfizmu f : U −→ U skończenie wy-
miarowej przestrzeni wektorowej U nazywa się wyznacznik jego macierzy w
dowolnej bazie (tej samej w dziedzinie i przeciwdziedzinie). Wzór Cauchy’ego
gwarantuje, że taka definicja jest poprawna, to znaczy nie zależy od wyboru
bazy, bo gdy u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
są bazami U, A i A
0
macierzami f w bazie
odpowiednio u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
, a P macierzą przejścia od u
1
, . . . , u
n
do
u
0
1
, . . . , u
0
n
, to det A
0
= det(P
−1
AP ) = (1/ det P ) det A det P = det A.
Bezpośrednio z twierdzeń o wyznacznikach macierzy możemy wyciągnąć
następujące wnioski o wyznacznikach endomorfizmów.
Wniosek. Dla dowolnych endomorfizmów f i g skończenie wymiarowej
przestrzeni wektorowej U
det(g ◦ f ) = det g · det f.
Wniosek. Dla endomorfizmu f n-wymiarowej przestrzeni wektorowej
następujące warunki są równoważne
1) f jest automorfizmem,
2) det f 6= 0,
3) rz f = n.
Wniosek. Dla automorfizmu f skończenie wymiarowej przestrzeni wek-
torowej mamy
det(f
−1
) =
1
det f
.
Rozwinięcie Laplace’a
Definicja. Przypuśćmy, że K jest ciałem, p, q, r ∈ N, A jest macierzą
z M
q×p
(K) o wyrazach a
ji
, i
1
, . . . , i
r
∈ {1, . . . , p} są takie, że i
1
< . . . < i
r
,
i j
1
, . . . , j
r
∈ {1, . . . , q} są takie, że j
1
< . . . < j
r
. Wyznacznik macierzy
z M
r×r
(K) o wyrazach a
j
l
i
k
, gdzie k, l ∈ {1, . . . , r}, nazywa się minorem
stopnia r macierzy A. Inaczej mówiąc, taki minor to wyznacznik macierzy
powstałej z A przez skreślenie wszystkich wierszy oprócz tych o numerach
j
1
, . . . , j
r
i wszystkich kolumn oprócz tych o numerach i
1
, . . . , i
r
.
68
Przykład. Macierz
·
3 1 2
7 4 5
¸
ma 3 minory drugiego stopnia, mianowicie
¯
¯
¯
¯
3 1
7 4
¯
¯
¯
¯ ,
¯
¯
¯
¯
3 2
7 5
¯
¯
¯
¯ ,
¯
¯
¯
¯
1 2
4 5
¯
¯
¯
¯ ,
a 12 minorów pierwszego stopnia (są to po prostu wyrazy tej macierzy).
Ogólnie macierz z M
q×p
(K) ma
¡
q
r
¢
·
¡
p
r
¢
minorów stopnia r.
Udowodnimy teraz wzór na wyznacznik macierzy kwadratowej nazywany
rozwinięciem Laplace’a wyznacznika względem l-tego wiersza.
Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A macierzą z M
n×n
(K) o
wyrazach a
ji
, to dla każdego l ∈ {1, . . . , n}
det A =
n
X
k=1
(−1)
l+k
a
lk
A
lk
,
gdzie A
lk
oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie
jej l-tego wiersza i k-tej kolumny.
Dowód: Niech f : M
n×n
(K) −→ K będzie odwzorowaniem przyjmującym
na macierzach A wartości równe prawej stronie wzoru, który właśnie mamy
dowieść. Gdy wykażemy, że f (A) jest n-liniową i antysymetryczną funkcją
kolumn macierzy A i że f (I) = 1, to dostaniemy równość f (A) = det A dla
każdej A z M
n×n
(K), co zakończy dowód. Ponieważ A
lk
jest (n − 1)-liniową
funkcją wszystkich oprócz k-tej kolumn macierzy A, to a
lk
A
lk
jest n-liniową
funkcją wszystkich kolumn macierzy A i w konsekwencji jest taką funkcją
również f . Gdy kolumny i-ta i j-ta macierzy A są jednakowe dla i < j,
to A
lk
= 0, jeśli tylko k 6= i i k 6= j, zaś (−1)
l+i
a
li
A
li
i (−1)
l+j
a
lj
A
lj
są
wzajemnie przeciwne, bo a
lj
= a
li
, a oznaczając przez A
0
1
, . . . , A
0
n
kolumny
macierzy A z opuszczonymi wyrazami z l-tego wiersza widzimy, że A
lj
i A
li
to wyznaczniki macierzy odpowiednio [A
0
1
. . . A
0
i−1
A
0
i+1
. . . A
0
j−1
A
0
i
A
0
j−1
. . . A
0
n
]
i [A
0
1
. . . A
0
i−1
A
0
i
A
0
i+1
. . . A
0
j−1
A
0
j−1
. . . A
0
n
], przy czym jedna powstaje z drugiej
drogą j − i − 1 transpozycji kolumn. W takim razie f jest antysymetryczne.
Wreszcie sprawdzenie, że f (I) = 1, jest trywialne.
69
Transponowanie macierzy kwadratowej nie zmienia jej wyznacznika, więc
ostatnie twierdzenia możemy przeformułować tak, by otrzymać rozwinięcie
Laplace’a wyznacznika względem k-tej kolumny.
Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A macierzą z M
n×n
(K) o
wyrazach a
ji
, to dla każdego k ∈ {1, . . . , n}
det A =
n
X
l=1
(−1)
l+k
a
lk
A
lk
,
gdzie A
lk
oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie
jej l-tego wiersza i k-tej kolumny.
Przykład. Oto rozwinięcie Laplace’a względem drugiego wiersza:
¯
¯
¯
¯
¯
¯
¯
¯
3 2 6 4
1 0 7 5
4 1 2 8
2 3 4 6
¯
¯
¯
¯
¯
¯
¯
¯
= −1
¯
¯
¯
¯
¯
¯
2 6 4
1 2 8
3 4 6
¯
¯
¯
¯
¯
¯
+ 0
¯
¯
¯
¯
¯
¯
3 6 4
4 2 8
2 4 6
¯
¯
¯
¯
¯
¯
− 7
¯
¯
¯
¯
¯
¯
3 2 4
4 1 8
2 3 6
¯
¯
¯
¯
¯
¯
+ 5
¯
¯
¯
¯
¯
¯
3 2 6
4 1 2
2 3 4
¯
¯
¯
¯
¯
¯
.
Widać, że rozwinięcie Laplace’a sprowadza obliczenie wyznacznika n × n
do obliczenia n wyznaczników (n − 1) × (n − 1).
Ćwiczenie. Niech K będzie ciałem, n ∈ N, x
1
, . . . , x
n
∈ K. Wykazać, że
¯
¯
¯
¯
¯
¯
¯
¯
1
. . .
1
x
1
. . .
x
n
...
...
x
n−1
1
. . . x
n−1
n
¯
¯
¯
¯
¯
¯
¯
¯
=
Y
i<j
(x
j
− x
i
),
przy czym po prawej stronie występuje iloczyn
¡
n
2
¢
czynników indeksowanych
takimi parami (i, j) ∈ {1, . . . , n}
2
, że i < j. Wyznacznik po lewej stronie
nazywa się wyznacznikiem Vandermonde’a.
Wskazówka: dowód powyższego wzoru można przeprowadzić w pięciu
następujących krokach: odjąć pierwszą kolumnę od pozostałych; rozwinąć
wyznacznik względem pierwszego wiersza; wykorzystując wzór skróconego
mnożenia a
k
− b
k
= (a − b)(a
k−1
+ a
k−2
b + . . . + ab
k−2
+ b
k−1
) wyłączyć z
wyznacznika czynniki x
2
− x
1
, . . . , x
n
− x
1
; od wierszy kolejno od ostatniego
do drugiego odejmować wiersz poprzedni pomnożony przez x
1
; zastosować
indukcję względem n.
70
Odwracanie macierzy
Twierdzenie. Niech K będzie ciałem, n ∈ N i niech A będzie macierzą
z GL(n, K) o wyrazach a
ji
. Wtedy wyraz macierzy A
−1
leżący na przecięciu
j-tego wiersza i i-tej kolumny jest równy
(−1)
j+i
A
ij
det A,
gdzie A
ij
oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie
jej i-tego wiersza i j-tej kolumny.
Dowód: Leżący na przecięciu k-tego wiersza i i-tej kolumny wyraz ilo-
czynu macierzy A i macierzy o wyrazach opisanych w tezie twierdzenia jest
równy
P
n
j=1
a
kj
(−1)
j+i
A
ij
/ det A. Lecz
P
n
j=1
(−1)
i+j
a
kj
A
ij
to rozwinięcie
Laplace’a względem i-tego wiersza wyznacznika macierzy powstałej z A przez
zastąpienie jej i-tego wiersza jej k-tym wierszem. Taki wyznacznik jest równy
det A, gdy k = i, a 0, gdy k 6= i. Oznacza to, że iloczyn macierzy A i macierzy
o wyrazach opisanych w tezie twierdzenia jest równy macierzy jednostkowej,
więc czynniki w tym iloczynie są macierzami wzajemnie odwrotnymi.
Dopełnieniem algebraicznym wyrazu a
ji
kwadratowej macierzy A nazywa
się skalar stojący przy a
ji
w rozwinięciu Laplace’a wyznacznika A względem
j-tego wiersza lub i-tej kolumny, czyli skalar (−1)
j+i
A
ji
, gdzie A
ji
oznacza
minor macierzy A stopnia n − 1 powstały przez skreślenie jej j-tego wiersza
i i-tej kolumny. Ostatnie twierdzenie mówi więc, że wyrazy macierzy A
−1
to
dopełnienia algebraiczne odpowiednich wyrazów macierzy transponowanej
do A podzielone przez wyznacznik A. Natomiast macierz o takich wyrazach,
ale nie podzielonych przez det A nazywa się macierzą dołączoną do A (zatem
macierz dołączona do nieosobliwej macierzy A to (det A)A
−1
).
Przykład. Korzystając z ostatniego twierdzenia odwrócimy macierz
A =
1 3 2
2 4 1
2 5 1
o wyrazach rzeczywistych. Ponieważ det A = 3 6= 0, więc A jest odwracalna.
71
Obliczamy macierz jej minorów stopnia 2
¯
¯
¯
¯
4 1
5 1
¯
¯
¯
¯
¯
¯
¯
¯
2 1
2 1
¯
¯
¯
¯
¯
¯
¯
¯
2 4
2 5
¯
¯
¯
¯
¯
¯
¯
¯
3 2
5 1
¯
¯
¯
¯
¯
¯
¯
¯
1 2
2 1
¯
¯
¯
¯
¯
¯
¯
¯
1 3
2 5
¯
¯
¯
¯
¯
¯
¯
¯
3 2
4 1
¯
¯
¯
¯
¯
¯
¯
¯
1 2
2 1
¯
¯
¯
¯
¯
¯
¯
¯
1 3
2 4
¯
¯
¯
¯
=
−1
0
2
−7 −3 −1
−5 −3 −2
.
Zmieniamy znaki tak, by otrzymać macierz dopełnień algebraicznych A
−1
0
2
7
−3
1
−5
3
−2
.
Otrzymaną macierz transponujemy i dostajemy macierz dołączoną do A
−1
7
−5
0
−3
3
2
1
−2
.
Dzielimy ją przez wyznacznik A i mamy macierz odwrotną do A
−
1
3
7
3
−
5
3
0
−1
1
2
3
1
3
−
2
3
.
Widać, że odwrócenie taką metodą macierzy n × n wymaga obliczenia
jednego wyznacznika n × n i n
2
wyznaczników (n − 1) × (n − 1).
Rząd macierzy a jej minory
Udowodnimy teraz użyteczne kryterium pozwalające stwierdzić jaki jest
rząd macierzy na podstawie znajomości jej minorów.
Twierdzenie. Macierz ma rząd równy r wtedy i tylko wtedy, gdy istnieje
jej minor stopnia r różny od 0, ale każdy jej minor stopnia większego od r
jest równy 0.
72
Dowód: Niech K będzie ciałem, p, q ∈ N i niech A ∈ M
q×p
(K). Ustalmy
i
1
, . . . , i
k
∈ {1, . . . , p} takie, że i
1
< . . . < i
k
. Teza twierdzenia stanie się
oczywista, jeśli tylko wykażemy, że kolumny macierzy A o numerach i
1
, . . . , i
k
są liniowo zależne wtedy i tylko wtedy, gdy dla każdych j
1
, . . . , j
k
∈ {1, . . . , q}
takich, że j
1
< . . . < j
k
, minor macierzy A otrzymany w wyniku skreślenia
wszystkich wierszy oprócz tych o numerach j
1
, . . . , j
k
i wszystkich kolumn
oprócz tych o numerach i
1
, . . . , i
k
jest równy 0. Ale gdy kolumny A
i
1
, . . . , A
i
k
macierzy A są liniowo zależne, to dla każdych j
1
, . . . , j
k
∈ {1, . . . , q} takich,
że j
1
< . . . < j
k
, liniowo zależne są również kolumny A
0
i
1
, . . . , A
0
i
k
powstałe
z A
i
1
, . . . , A
i
k
przez opuszczenie wyrazów ze wszystkich wierszy o numerach
innych niż j
1
, . . . , j
k
, więc faktycznie det[A
0
i
1
. . . A
0
i
k
] = 0. Odwrotnie, gdy
wszystkie takie minory są równe 0, to znaczy, że wśród wierszy macierzy
[A
i
1
. . . A
i
k
] nie ma k liniowo niezależnych, czyli jej rząd jest mniejszy niż k,
czyli jej kolumny A
i
1
, . . . , A
i
k
są liniowo zależne.
Przykład. Na podstawie ostatniego twierdzenia
rz
1 2 4 3
1 3 5 5
2 5 9 8
= 2
(przyjmujemy, że ciałem skalarów jest tu R), bo
¯
¯
¯
¯
¯
¯
1 2 4
1 3 5
2 5 9
¯
¯
¯
¯
¯
¯
= 0,
¯
¯
¯
¯
¯
¯
1 2 3
1 3 5
2 5 8
¯
¯
¯
¯
¯
¯
= 0,
¯
¯
¯
¯
¯
¯
1 4 3
1 5 5
2 9 8
¯
¯
¯
¯
¯
¯
= 0,
¯
¯
¯
¯
¯
¯
2 4 3
3 5 5
5 9 8
¯
¯
¯
¯
¯
¯
= 0,
ale na przykład
¯
¯
¯
¯
1 2
1 3
¯
¯
¯
¯ = 1 6= 0.
Twierdzenie Kroneckera-Capelliego
Niech K będzie ciałem, a p, q ∈ N. Rozważmy układ równań liniowych
a
11
x
1
+ . . . + a
1p
x
p
= b
1
,
...
...
...
a
q1
x
1
+ . . . + a
qp
x
p
= b
q
,
gdzie a
11
, . . . a
1p
, . . . , a
q1
, . . . , a
qp
, b
1
, . . . , b
q
∈ K.
73
Zajmiemy się najpierw problemem istnienia rozwiązania, czyli istnienia
takiego ciągu (x
1
, . . . , x
p
) z K
p
, dla którego ten układ równań jest spełniony.
Wygodnie będzie zapisywać nasz układ równań liniowych w następującej
(oczywiście równoważnej) postaci macierzowej
Ax = b,
gdzie
A =
a
11
. . . a
1p
...
...
a
q1
. . . a
qp
, x =
x
1
...
x
p
, b =
b
1
...
b
q
.
A nazywa się w tej sytuacji macierzą główną układu równań liniowych, zaś
macierz [A b] należącą do M
q×(p+1)
(K) i otrzymaną z macierzy głównej przez
dopisanie jako ostatniej kolumny macierzy b wyrazów wolnych nazywa się
macierzą rozszerzoną.
Poniższe twierdzenie Kroneckera-Capelliego podaje warunek konieczny i
wystarczający do istnienia rozwiązania układu równań liniowych.
Twierdzenie. Układ równań liniowych
Ax = b,
gdzie A ∈ M
q×p
(K), b ∈ M
q×1
(K), natomiast K jest dowolnym ciałem, ma
rozwiązanie x należące do M
p×1
(K) wtedy i tylko wtedy, gdy
rz [A b] = rz A,
czyli wtedy i tylko wtedy, gdy rzędy macierzy głównej i macierzy rozszerzonej
tego układu są sobie równe.
Dowód: Niech A
1
, . . . , A
p
oznaczają kolumny macierzy A. Od razu widać,
że x jest rozwiązaniem układu równań Ax = b wtedy i tylko wtedy, gdy
x
1
A
1
+ . . . + x
p
A
p
= b. Zatem istnienie rozwiązania naszego układu jest
równoważne temu, że b można zapisać w postaci kombinacji liniowej kolumn
A
1
, . . . , A
p
, czyli temu, że b ∈ lin {A
1
, . . . , A
p
}, a to jest równoważne temu,
że lin {A
1
, . . . , A
p
, b} = lin {A
1
, . . . , A
p
}, czyli że dim lin {A
1
, . . . , A
p
, b} =
dim lin {A
1
, . . . , A
p
}, a więc że rz [A b] = rz A.
74
Wzory Cramera
Wyprowadzimy teraz wzory Cramera dające w jawnej postaci rozwiązanie
układu równań liniowych o jednakowej ilości równań i niewiadomych oraz
różnym od 0 wyznaczniku macierzy głównej.
Twierdzenie. Załóżmy, że K jest ciałem, n ∈ N, A ∈ M
n×n
(K), a
b ∈ M
n×1
(K). Jeżeli det A 6= 0, to układ równań liniowych
Ax = b
ma dokładnie jedno rozwiązanie x ∈ M
n×1
(K). Wyraża się ono wzorami
x
j
=
det[A
1
. . . A
j−1
b A
j+1
. . . A
n
]
det A
dla j ∈ {1, . . . , n}, przy czym A
1
, . . . , A
n
oznaczają kolumny macierzy A.
Dowód: Ponieważ det A 6= 0, to macierz A jest odwracalna. Mnożąc obie
strony równania Ax = b z lewej strony przez A
−1
widzimy, że ma ono do-
kładnie jedno rozwiązanie x = A
−1
b. Jak wiemy, wyraz macierzy A
−1
leżący
na przecięciu j-tego wiersza i i-tej kolumny jest równy (−1)
j+i
A
ij
/ det A,
gdzie A
ij
oznacza minor macierzy A powstały przez skreślenie jej i-tego
wiersza i j-tej kolumny. Zatem mamy x
j
=
P
n
i=1
((−1)
j+i
A
ij
/ det A)b
i
. Z
drugiej strony rozwinięcie Laplace’a względem j-tej kolumny daje równość
det[A
1
. . . A
j−1
b A
j+1
. . . A
n
] =
P
n
i=1
(−1)
i+j
b
i
A
ij
, na podstawie której jest
już widoczna teza twierdzenia.
Przykład. Rozważmy układ równań liniowych
x
1
+3x
2
+x
3
= 3,
x
1
+2x
2
+2x
3
= 4,
2x
1
+3x
2
+2x
3
= 5,
który ma rzeczywiste współczynniki. Wyznacznik macierzy głównej
¯
¯
¯
¯
¯
¯
1 3 1
1 2 2
2 3 2
¯
¯
¯
¯
¯
¯
jest równy 3, więc możemy stosować wzory Cramera. Obliczamy każdą nie-
wiadomą dzieląc przez wyznacznik macierzy głównej wyznacznik macierzy
75
powstałej w wyniku zastąpienia odpowiedniej kolumny w macierzy głównej
kolumną wyrazów wolnych:
x
1
=
¯
¯
¯
¯
¯
¯
3 3 1
4 2 2
5 3 2
¯
¯
¯
¯
¯
¯
3
=
2
3
,
x
2
=
¯
¯
¯
¯
¯
¯
1 3 1
1 4 2
2 5 2
¯
¯
¯
¯
¯
¯
3
=
1
3
,
x
3
=
¯
¯
¯
¯
¯
¯
1 3 3
1 2 4
2 3 5
¯
¯
¯
¯
¯
¯
3
=
4
3
.
Kolejny przykład pokazuje jak używając wzorów Cramera i twierdzenia
Kroneckera-Capelliego rozwiązać układ równań liniowych z parametrem.
Przykład. Rozważmy układ równań liniowych
x
1
+ax
2
+x
3
= 4,
x
1
+3x
2
+ax
3
= 6,
x
1
+4x
2
+3x
3
= 5,
który ma rzeczywiste współczynniki i w którym a jest parametrem. Ponieważ
¯
¯
¯
¯
¯
¯
1 a 1
1 3 a
1 4 3
¯
¯
¯
¯
¯
¯
= (2 − a)(5 − a),
to dla każdego a ∈ R\{2, 5} układ ma dokładnie jedno rozwiązanie. Ponadto
¯
¯
¯
¯
¯
¯
4 a 1
6 3 a
5 4 3
¯
¯
¯
¯
¯
¯
= (9 − 5a)(5 − a),
¯
¯
¯
¯
¯
¯
1 4 1
1 6 a
1 5 3
¯
¯
¯
¯
¯
¯
= 5 − a,
¯
¯
¯
¯
¯
¯
1 a 4
1 3 6
1 4 5
¯
¯
¯
¯
¯
¯
= −5 + a,
zatem według wzorów Cramera rozwiązaniem tym jest x
1
= (9 − 5a)/(2 − a),
x
2
= 1/(2 − a), x
3
= −1/(2 − a). Dla a = 2 pierwszy z czterech powyższych
wyznaczników jest równy 0, więc macierz główna ma rząd mniejszy niż 3, ale
wśród pozostałych istnieje różny od 0, więc macierz rozszerzona ma rząd 3.
Zgodnie z twierdzeniem Kroneckera-Capelliego układ jest w tym przypadku
sprzeczny. Natomiast dla a = 5 wszystkie cztery wyznaczniki są równe 0, ale
w macierzy głównej można znaleźć różny od 0 minor stopnia 2, na przykład
pomijając trzeci wiersz i trzecią kolumnę dostajemy
¯
¯
¯
¯
1 5
1 3
¯
¯
¯
¯ = −2.
76
Oznacza to, że macierze główna i rozszerzona mają jednakowy rząd równy 2
i zgodnie z twierdzeniem Kroneckera-Capelliego w tym przypadku układ ma
rozwiązanie. Co więcej, skoro znaleziony różny od 0 minor stopnia 2 mieści
się w obrębie pierwszego i drugiego wiersza, to pierwsze i drugie równanie
układu są liniowo niezależne, więc trzecie musi być od nich zależne i można
je pominąć. Dla a = 5 mamy więc układ
x
1
+5x
2
+x
3
= 4,
x
1
+3x
2
+5x
3
= 6,
który najłatwiej rozwiązać metodą Gaussa. Ale można go też przepisać jako
x
1
+5x
2
=
−x
3
+4,
x
1
+3x
2
= −5x
3
+6,
a następnie traktując x
3
jako parametr obliczyć ze wzorów Cramera x
1
i x
2
,
bo jak już wiemy odpowiedni wyznacznik jest równy −2, czyli różny od 0.
Dostajemy w ten sposób
x
1
=
¯
¯
¯
¯
−x
3
+ 4
5
−5x
3
+ 6 3
¯
¯
¯
¯
−2
= −11x
3
+ 9,
x
2
=
¯
¯
¯
¯
1
−x
3
+ 4
1 −5x
3
+ 6
¯
¯
¯
¯
−2
= 2x
3
− 1.
A zatem w przypadku a = 5 wyjściowy układ równań ma nieskończenie wiele
rozwiązań. Każde z nich jest trójką x
1
, x
2
, x
3
, gdzie x
1
i x
2
są określone
powyższymi wzorami z dowolnym rzeczywistym x
3
.
Algebra zewnętrzna
Przypomnijmy, że charakterystyką ciała K nazywa się najmniejszą liczbę
całkowitą dodatnią m taką, że w K suma 1+. . .+1 o m składnikach jest równa
0, a jeżeli taka m nie istnieje, to mówi się, że charakterystyka K jest równa
0. Na przykład dla każdej liczby pierwszej p ciało Z
p
ma charakterystykę p,
a Q, R, C mają charakterystykę 0. W dowolnym ciele K dla każdej liczby
całkowitej dodatniej m sumę 1 + . . . + 1 o m składnikach oznacza się przez
m, więc jeśli K ma charakterystykę 0, to istnieje element ciała K odwrotny
do m oznaczany przez 1/m (w Q, R, C jest to zwykła liczba wymierna 1/m).
Niech U będzie przestrzenią wektorową nad ciałem K, a r ∈ N. Każde
odwzorowanie U × . . . × U −→ K r-liniowe i antysymetryczne nazywa się r-
formą na U. Oznaczmy przestrzeń wektorową wszystkich r-form na U przez
Ω
r
(U) (czyli Ω
r
(U) = L
r
A
(U, K)).
77
Załóżmy teraz, że K ma charakterystykę 0. Dla r-formy α i s-formy β
na U definiujemy ich iloczyn zewnętrzny α ∧ β : U × . . . × U −→ K wzorem
(α ∧ β)(u
1
, . . . , u
r+s
) =
1
r! s!
X
σ∈S
r+s
sgn σ α(u
σ(1)
, . . . , u
σ(r)
) β(u
σ(r+1)
, . . . , u
σ(r+s)
)
dla dowolnych u
1
, . . . , u
r+s
∈ U.
Twierdzenie. Tak określone α ∧ β jest (r + s)-formą na U, a
Ω
r
(U) × Ω
s
(U) 3 (α, β) −→ α ∧ β ∈ Ω
r+s
(U)
jest dwuliniowe.
Dowód: Weźmy u
1
, . . . , u
r+s
∈ U takie, że u
i
= u
j
dla pewnych i, j
takich, że i < j. Wtedy ϕ : T 3 σ −→ (i, j) ◦ σ ∈ S
r+s
\ T , gdzie T =
{σ ∈ S
r+s
: σ
−1
(i) < σ
−1
(j)}, jest bijekcją oraz (u
(ϕ(σ))(1)
, . . . , u
(ϕ(σ))(r+s)
) =
(u
σ(1)
, . . . , u
σ(r+s)
) i sgn (ϕ(σ)) = −sgn σ dla każdej σ ∈ T . Dlatego dla
każdej σ ∈ T w sumie
P
σ∈S
r+s
sgn σ α(u
σ(1)
, . . . , u
σ(r)
) β(u
σ(r+1)
, . . . , u
σ(r+s)
)
znoszą się wzajemnie składniki o indeksach ϕ(σ) i σ. Dowodzi to pierwszej
części twierdzenia. Druga jest trywialna.
Twierdzenie. Mnożenie zewnętrzne jest łączne, to znaczy
(α ∧ β) ∧ γ = α ∧ (β ∧ γ)
dla dowolnych α ∈ Ω
r
(U), β ∈ Ω
s
(U), γ ∈ Ω
t
(U).
Dowód: Lewa strona dowodzonej równości na ciągu (u
1
, . . . , u
r+s+t
) jest
równa 1/(r! s! (r + s)! t!)
P
σ∈S
r+s+t
P
τ ∈S
r+s
sgn σ sgn τ α(u
σ(τ (1))
, . . . , u
σ(τ (r))
)
β(u
σ(τ (r+1))
, . . . , u
σ(τ (r+s))
) γ(u
σ(r+s+1)
, . . . , u
σ(r+s+t)
). Jednak każdą τ z S
r+s
możemy także uważać za permutację z S
r+s+t
przyjmując τ |
{r+s+1,...,r+s+t}
=
id
{r+s+1,...,r+s+t}
i wtedy S
r+s+t
3 σ −→ σ ◦ τ ∈ S
r+s+t
jest bijekcją. Dlatego
((α ∧ β) ∧ γ)(u
1
, . . . , u
r+s+t
) =
1
r! s! t!
X
σ∈S
r+s+t
sgn σ α(u
σ(1)
, . . . , u
σ(r)
) β(u
σ(r+1)
, . . . , u
σ(r+s)
) γ(u
σ(r+s+1)
, . . . , u
σ(r+s+t)
).
78
Podobnie pokazuje się, że (α ∧(β ∧γ))(u
1
, . . . , u
r+s+t
) wyraża się tym samym
wzorem, więc twierdzenie jest udowodnione.
Ćwiczenie. Naśladując ostatni dowód wykazać przez indukcję ze względu
na r, że dla dowolnych α
1
, . . . , α
r
∈ U
∗
i u
1
, . . . , u
r
∈ U
(α
1
∧ . . . ∧ α
r
)(u
1
, . . . , u
r
) =
¯
¯
¯
¯
¯
¯
α
1
(u
1
) . . . α
1
(u
r
)
...
...
α
r
(u
1
) . . . α
r
(u
r
)
¯
¯
¯
¯
¯
¯
.
Twierdzenie. Dla dowolnych α ∈ Ω
r
(U), β ∈ Ω
s
(U)
β ∧ α = (−1)
rs
α ∧ β.
Dowód: Lewa strona dowodzonej równości na (u
1
, . . . , u
r+s
) jest równa
P
σ∈S
r+s
sgn σ β(u
σ(τ (r+1))
, . . . , u
σ(τ (r+s))
) α(u
σ(τ (1))
, . . . , u
σ(τ (r))
), gdzie
τ =
µ
1
. . .
r
r + 1 . . . r + s
s + 1 . . . s + r
1
. . .
s
¶
,
a ponieważ S
r+s
3 σ −→ σ ◦ τ ∈ S
r+s
jest bijekcją i sgn τ = (−1)
rs
, to widać,
że taka jest też prawa strona dowodzonej równości na (u
1
, . . . , u
r+s
), więc
twierdzenie jest udowodnione.
Załóżmy teraz, że przestrzeń wektorowa U nad ciałem K charakterystyki
0 ma skończony wymiar n. Wówczas Ω
r
(U) = {0} dla każdego r ≥ n + 1.
Oznaczmy
Ω(U) = Ω
0
(U) × . . . × Ω
n
(U)
(przy czym Ω
0
(U) to po prostu K). Zatem Ω(U) jako iloczyn kartezjański
n + 1 przestrzeni wektorowych nad K też jest przestrzenią wektorową nad
K. Ponadto dim Ω(U) =
P
n
r=0
dim Ω
r
(U) =
P
n
r=0
¡
n
r
¢
= (1 + 1)
n
, czyli
dim Ω(U) = 2
n
.
W dalszym ciągu wygodnie nam będzie zapisywać wektory z Ω(U) w postaci
α
0
+ . . . + α
n
lub
P
n
r=0
α
r
zamiast w postaci (α
0
, . . . , α
n
) (sprowadza się to
do utożsamienia dla każdego r ∈ {0, . . . , n} przestrzeni Ω
r
(U) z jej obrazem
przez monomorfizm Ω
r
(U) 3 α
r
−→ (0, . . . , 0, α
r
, 0, . . . , 0) ∈ Ω(U); przy
takiej interpretacji Ω(U) = Ω
0
(U) ⊕ . . . ⊕ Ω
n
(U)).
79
Dla dowolnych α
0
, β
0
∈ Ω
0
(U), . . . , α
n
, β
n
∈ Ω
n
(U) definiujemy iloczyn
zewnętrzny
P
n
r=0
α
r
i
P
n
s=0
β
s
wzorem
(
n
X
r=0
α
r
) ∧ (
n
X
s=0
β
s
) =
n
X
t=0
(
t
X
i=0
α
i
∧ β
t−i
).
Twierdzenie. Jeżeli U jest przestrzenią wektorową skończonego wymiaru
nad ciałem K charakterystyki 0, to przestrzeń wektorowa Ω(U) z mnożeniem
zewnętrznym Ω(U) × Ω(U) 3 (α, β) −→ α ∧ β ∈ Ω(U) jest algebrą z jedynką
nad K.
Dowód: Łączność mnożenia zewnętrznego na Ω(U) wynika bezpośrednio
z udowodnionej łączności mnożenia zewnętrznego form, natomiast warunki
2) i 3) z definicji algebry to nic innego jak dwuliniowość mnożenia, a jak łatwo
zauważyć, mnożenie zewnętrzne jest dwuliniowe. Jedynką algebry Ω(U) jest
jedynka ciała K, które traktujemy jako podprzestrzeń Ω
0
(U) w Ω(U).
Powyższą algebrę Ω(U) nazywa się algebrą zewnętrzną.
Ćwiczenie. Zauważyć, że algebra Ω(U) jest przemienna wtedy i tylko
wtedy, gdy dim U ≤ 1 (wynika to ze wzoru, który już udowodniliśmy).
Twierdzenie. Jeżeli e
1
, . . . , e
n
jest bazą przestrzeni wektorowej U, to
e
∗
j
1
∧ . . . ∧ e
∗
j
r
,
gdzie r ∈ {0, . . . , n} i j
1
, . . . , j
r
∈ {1, . . . , n} spełniają warunek j
1
< . . . < j
r
,
tworzą bazę Ω(U).
Dowód: Wystarczy połączyć znajomość bazy iloczynu kartezjańskiego lub
sumy prostej ze znajomością bazy przestrzeni wektorowych L
r
A
(U, K) oraz
zauważyć, że dla wszystkich l
1
, . . . , l
r
∈ {1. . . . , n} spełniających warunek
l
1
< . . . < l
r
zachodzi
(e
∗
j
1
∧ . . . ∧ e
∗
j
r
)(e
l
1
, . . . , e
l
r
) =
½
1, gdy (l
1
, . . . , l
r
) = (j
1
, . . . , j
r
),
0, gdy (l
1
, . . . , l
r
) 6= (j
1
, . . . , j
r
),
co jest oczywiste na podstawie przedostatniego ćwiczenia.
80
Na koniec warto jeszcze zwrócić uwagę, że chociaż mnożenie zewnętrzne
wydaje się skomplikowane, to wykonuje się je bardzo łatwo i naturalnie,
gdy zapisuje się elementy algebry zewnętrznej w bazie, która jest opisana
w ostatnim twierdzeniu. Wystarczy wówczas przy mnożeniu pamiętać tylko
o tym, że mnożenie zewnętrzne jest dwuliniowe i łączne, a odwzorowanie
Ω
1
(U)×. . .×Ω
1
(U) 3 (α
1
, . . . , α
r
) −→ α
1
∧. . .∧α
r
∈ Ω
r
(U) antysymetryczne.
Przykład. Niech e
1
, e
2
, e
3
oznacza bazę kanoniczną R
3
. Chcemy obliczyć
iloczyn elementów 3 + 4e
∗
2
+ e
∗
2
∧ e
∗
3
i e
∗
1
+ 2e
∗
1
∧ e
∗
2
w algebrze zewnętrznej
Ω(R
3
). Możemy to zrobić następująco: (3 + 4e
∗
2
+ e
∗
2
∧ e
∗
3
) ∧ (e
∗
1
+ 2e
∗
1
∧ e
∗
2
) =
3e
∗
1
+ 6e
∗
1
∧ e
∗
2
+ 4e
∗
2
∧ e
∗
1
+ 8e
∗
2
∧ e
∗
1
∧ e
∗
2
+ e
∗
2
∧ e
∗
3
∧ e
∗
1
+ 2e
∗
2
∧ e
∗
3
∧ e
∗
1
∧ e
∗
2
=
3e
∗
1
+ 6e
∗
1
∧ e
∗
2
− 4e
∗
1
∧ e
∗
2
+ e
∗
1
∧ e
∗
2
∧ e
∗
3
= 3e
∗
1
+ 2e
∗
1
∧ e
∗
2
+ e
∗
1
∧ e
∗
2
∧ e
∗
3
.
Wielomian charakterystyczny macierzy i endomorfizmu
Przypomnijmy, że wielomianem jednej zmiennej o współczynnikach z
ciała K nazywa się każdy ciąg (a
i
)
i∈N
, gdzie a
0
, a
1
, a
2
, . . . ∈ K, dla którego
istnieje liczba całkowita dodatnia d taka, że a
i
= 0 dla każdego i > d. Jeśli
wielomian nie jest ciągiem stałym równym 0, to najmniejszą taką d nazywa
się jego stopniem. Zbiór wielomianów jednej zmiennej o współczynnikach z K
będziemy oznaczać przez K[X]. Zbiór K[X] jest pierścieniem przemiennym
z jedynką z działaniami, które formalnie definiuje się wzorami
(a
i
)
i∈N
+ (b
i
)
i∈N
= (a
i
+ b
i
)
i∈N
,
(a
i
)
i∈N
(b
i
)
i∈N
= (
P
i
j=0
a
j
b
i−j
)
i∈N
.
Jest on nawet algebrą przemienną z jedynką nad K, jeśli dodatkowo przyjąć
α(a
i
)
i∈N
= (αa
i
)
i∈N
, ale mnożenie wielomianów przez skalary to właściwie
szczególny przypadek mnożenia wielomianów, bo dowolny skalar α utożsa-
mia się z wielomianem (αδ
0i
)
i∈N
. Ponadto oznaczając X = (δ
1i
)
i∈N
możemy
dowolny wielomian (a
i
)
i∈N
zapisać w postaci a
0
+ a
1
X + a
2
X
2
+ . . . + a
d
X
d
.
Zwykle stosuje się właśnie taki zapis i wówczas wszystkie powyższe działania
wykonuje się całkiem zwyczajnie, tak jak w szkole na wielomianach z R[X].
W następnej definicji będzie potrzebny wyznacznik macierzy o wyrazach
z K[X]. Wyznaczniki takich macierzy (i macierzy o wyrazach z dowolnego
pierścienia przemiennego z jedynką), jak również same takie macierze oraz
działania na nich, definiuje się tak samo jak poprzednio, zastepując tylko K
przez K[X] (lub inny pierścień przemienny z jedynką).
81
Definicja. Niech K będzie ciałem, n ∈ N, natomiast A ∈ M
n×n
(K).
Wielomianem charakterystycznym macierzy A nazywa się wielomian z K[X]
określony wzorem
W
A
(X) = det(A − XI),
przy czym A i macierz jednostkową I z M
n×n
(K) traktuje się jako macierze
z M
n×n
(K[X]) utożsamiając w oczywisty (i wspomniany wcześniej) sposób
skalary z K z wielomianami stałymi z K[X].
Przykład. Obliczymy wielomian charakterystyczny macierzy
A =
3 2 4
3 2 1
5 4 3
z M
3×3
(R). Mamy
W
A
(X) = det
3 2 4
3 2 1
5 4 3
− X
1 0 0
0 1 0
0 0 1
=
¯
¯
¯
¯
¯
¯
3 − X
2
4
3
2 − X
1
5
4
3 − X
¯
¯
¯
¯
¯
¯
= (3 − X)(2 − X)(3 − X) + 2 · 1 · 5 + 4 · 3 · 4
−4(2 − X)5 − (3 − X)1 · 4 − 2 · 3(3 − X) = 6 + 9X + 8X
2
− X
3
.
Twierdzenie. Wielomian charakterystyczny macierzy A z M
n×n
(K) o
wyrazach a
ji
jest równy w
0
+ w
1
X + w
2
X
2
+ . . . + w
n
X
n
, gdzie
w
n−k
= (−1)
n−k
X
i
1
<...<i
k
¯
¯
¯
¯
¯
¯
a
i
1
i
1
. . . a
i
1
i
k
...
...
a
i
k
i
1
. . . a
i
k
i
k
¯
¯
¯
¯
¯
¯
dla każdego k ∈ {0, . . . , n} (w powyższym wzorze sumuje się po wszystkich
i
1
, . . . , i
k
∈ {1, . . . , n} spełniających warunek i
1
< . . . < i
k
).
Dowód: Wyznacznik macierzy o wyrazach z K[X] jest antysymetryczną
funkcją wieloliniową jej kolumn, przy czym jednorodność zachodzi nie tylko
względem skalarów z K, ale również względem dowolnych elementów z K[X].
82
Dlatego oznaczając kolumny macierzy A i I przez A
1
, . . . , A
n
i I
1
, . . . , I
n
oraz
wykorzystując liniowość ze względu na pierwszą kolumnę możemy napisać
W
A
(X) = det[A
1
− XI
1
, . . . , A
n
− XI
n
] = det[A
1
, A
2
− XI
2
, . . . , A
n
− XI
n
] −
X det[I
1
, A
2
− XI
2
, . . . , A
n
− XI
n
]. Podobnie można wykorzystać liniowość
ze względu na pozostałe kolumny i stwierdzić, że współczynnik w
l
przy X
l
jest pomnożoną przez (−1)
l
sumą po j
1
, . . . , j
l
∈ {1, . . . , n} spełniających
warunek j
1
< . . . < j
l
wyznaczników macierzy powstałych z A przez zastą-
pienie jej kolumn A
j
1
, . . . , A
j
l
kolumnami I
j
1
, . . . , I
j
l
. Rozwinięcie każdego
z tych wyznaczników po kolei względem kolumn o numerach j
1
, . . . , j
l
daje
natychmiast wzory, które mieliśmy udowodnić.
Wniosek. Wielomian charakterystyczny w
0
+ w
1
X + w
2
X
2
+ . . . + w
n
X
n
macierzy A z M
n×n
(K) ma stopień n oraz
w
0
= det A,
w
n−1
= (−1)
n−1
tr A,
w
n
= (−1)
n
.
Przykład. Na mocy ostatniego twierdzenia współczynniki wielomianu
charakterystycznego w
0
+ w
1
X + w
2
X
2
+ w
3
X
3
macierzy z poprzedniego
przykładu są równe
w
0
=
¯
¯
¯
¯
¯
¯
3 2 4
3 2 1
5 4 3
¯
¯
¯
¯
¯
¯
= 6,
w
1
= −
µ¯
¯
¯
¯
3 2
3 2
¯
¯
¯
¯ +
¯
¯
¯
¯
3 4
5 3
¯
¯
¯
¯ +
¯
¯
¯
¯
2 1
4 3
¯
¯
¯
¯
¶
= 9,
w
2
= 3 + 2 + 3 = 8,
w
3
= −1.
Dostaliśmy to samo, co wprost z definicji wielomianu charakterystycznego.
Twierdzenie. Jeżeli K jest ciałem, n ∈ N, A, P ∈ M
n×n
(K) i P jest
odwracalna, to
W
P
−1
AP
(X) = W
A
(X).
Dowód: Ponieważ wzór Cauchy’ego jest słuszny również dla macierzy o
wyrazach z K[X], to możemy napisać W
P
−1
AP
(X) = det(P
−1
AP − XI) =
det(P
−1
(A − XI)P ) = (1/ det P ) det(A − XI) det P = W
A
(X).
83
Definicja. Wielomian charakterystyczny endomorfizmu f : U −→ U
skończenie wymiarowej przestrzeni wektorowej U to z definicji wielomian
charakterystyczny jego macierzy w dowolnej bazie (tej samej w dziedzinie
i przeciwdziedzinie). Ostatnie twierdzenie gwarantuje, że taka definicja jest
poprawna, to znaczy nie zależy od wyboru bazy, bo gdy u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
są bazami U, A i A
0
macierzami f w bazie odpowiednio u
1
, . . . , u
n
i u
0
1
, . . . , u
0
n
,
a P macierzą przejścia od u
1
, . . . , u
n
do u
0
1
, . . . , u
0
n
, to A
0
= P
−1
AP .
Wniosek. Wielomian charakterystyczny w
0
+ w
1
X + w
2
X
2
+ . . . + w
n
X
n
endomorfizmu f n-wymiarowej przestrzeni wektorowej ma stopień n oraz
w
0
= det f,
w
n−1
= (−1)
n−1
tr f,
w
n
= (−1)
n
.
Twierdzenie Cayleya-Hamiltona
Twierdzenie. Jeżeli w
0
+ w
1
X + w
2
X
2
+ . . . + w
n
X
n
jest wielomianem
charakterystycznym macierzy A z M
n×n
(K), to
w
0
+ w
1
A + w
2
A
2
+ . . . + w
n
A
n
= 0.
Dowód: Wygodnie będzie utożsamiać dowolną macierz n × n o wyrazach
P
k
m
ji,k
X
k
z K[X] z wielomianem
P
k
M
k
X
k
, którego współczynniki M
k
są
macierzami z M
n×n
(K) o wyrazach m
ji,k
(działania na takich wielomianach
definiuje się tymi samymi wzorami, co na wielomianach z K[X], i nasze
utożsamienie jest zgodne z działaniami). Połóżmy B = A − XI i oznaczmy
przez C macierz, która dla każdych i, j ∈ {1, . . . , n} ma na przecięciu j-
tego wiersza i i-tej kolumny wyraz (−1)
j+i
B
ij
, gdzie B
ij
to minor macierzy
B powstały przez skreślenie jej i-tego wiersza i j-tej kolumny. Wówczas
BC = (det B)I (dowód tego faktu dla macierzy o wyrazach z K[X] jest taki
sam, jak dla macierzy o wyrazach z K). Stąd zaraz dostajemy równość BC =
W
A
(X)I = w
0
I + w
1
IX + w
2
IX
2
+ . . . + w
n
IX
n
. Ale minory stopnia n − 1
macierzy B są wielomianami z K[X] stopnia co najwyżej n − 1, więc istnieją
takie C
0
, . . . , C
n−1
∈ M
n×n
(K), że C = C
0
+ C
1
X + C
2
X
2
+ . . . + C
n−1
X
n−1
.
W takim razie mamy równość (A−IX)(C
0
+C
1
X +C
2
X
2
+. . .+C
n−1
X
n−1
) =
w
0
I + w
1
IX + w
2
IX
2
+ . . . + w
n
IX
n
, z której po wymnożeniu i porównaniu
współczynników obu stron przy poszczególnych potęgach X otrzymujemy, że
AC
0
= w
0
I, AC
1
− C
0
= w
1
I, . . . , AC
n−1
− C
n−2
= w
n−1
I, −C
n−1
= w
n
I.
Mnożąc te równości z lewej strony odpowiednio przez I, A, . . . , A
n−1
, A
n
, a
potem wszystkie dodając, dostajemy tezę twierdzenia.
84
Jak zwykle w podobnych sytuacjach, mamy również twierdzenie Cayleya-
Hamiltona w wersji dotyczącej endomorfizmów zamiast macierzy.
Wniosek. Jeżeli w
0
+ w
1
X + w
2
X
2
+ . . . + w
n
X
n
jest wielomianem
charakterystycznym endomorfizmu f : U −→ U n-wymiarowej przestrzeni
wektorowej U, to
w
0
+ w
1
f + w
2
f
2
+ . . . + w
n
f
n
= 0.
Oczywiście f
k
w powyższym wniosku to potęga w algebrze End(U), więc
oznacza złożenie f ◦ . . . ◦ f , w którym f występuje k razy.
Podsumowując, twierdzenie Cayleya-Hamiltona mówi, że każda macierz
kwadratowa i każdy endomorfizm skończenie wymiarowej przestrzeni wekto-
rowej spełnia swoje „równanie charakterystyczne”.
Wektory własne i wartości własne
Definicja. Załóżmy, że U jest przestrzenią wektorową nad ciałem K, a
f : U −→ U endomorfizmem. Niezerowy wektor u z U nazywa się wektorem
własnym endomorfizmu f , gdy istnieje taka λ ∈ K, że f (u) = λu. W tej
sytuacji λ nazywa się wartością własną endomorfizmu f . Zatem skalar λ z
K jest wartością własną f , gdy istnieje takie u ∈ U \ {0}, że f (u) = λu.
Przykład. Niech G oznacza podprzestrzeń przestrzeni wektorowej R
R
złożoną z funkcji klasy C
∞
. Dla endomorfizmu G 3 ϕ −→ ϕ
0
∈ G dowolna
liczba rzeczywista λ jest wartością własną, a odpowiadającym jej wektorem
własnym jest funkcja R 3 x −→ e
λx
∈ R.
Przypomnijmy, że skalar λ z ciała K nazywa się pierwiastkiem wielomianu
a
0
+ a
1
X + a
2
X
2
+ . . . + a
d
X
d
z K[X], gdy a
0
+ a
1
λ + a
2
λ
2
+ . . . + d
d
λ
d
= 0.
Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią
wektorową nad ciałem K, a f : U −→ U endomorfizmem. Skalar λ z K jest
wartością własną endomorfizmu f wtedy i tylko wtedy, gdy jest pierwiastkiem
jego wielomianu charakterystycznego W
f
(X), czyli
det(f − λid
U
) = 0.
85
Dowód: Skalar λ jest wartością własną f wtedy i tylko wtedy, gdy istnieje
takie u ∈ U \ {0}, że f (u) − λu = 0, to znaczy wtedy i tylko wtedy, gdy
ker(f − λid
U
) 6= {0}, co, jak wiemy, jest równoważne temu, że f − λid
U
nie
jest monomorfizmem, czyli temu, że det(f − λid
U
) = 0.
Krotnością wartości własnej λ endomorfizmu f skończenie wymiarowej
przestrzeni wektorowej nad ciałem K nazywa się jej krotność jako pierwiastka
wielomianu charakterystycznego f (a zatem jest ona równa q, gdy W
f
(X)
dzieli się w K[X] przez (λ − X)
q
, ale nie przez (λ − X)
q+1
).
Czasami mówi się również o wartościach własnych i wektorach własnych
macierzy A z M
n×n
(K). Ma się wówczas na myśli wartości własne i wektory
własne endomorfizmu przestrzeni wektorowej K
n
, który w bazie kanonicznej
ma macierz A.
Przykład. Znajdziemy wartości własne i wektory własne endomorfizmu
R
3
3 (x, y, z) −→ (3x + 2y − 4z, x + 2y − 2z, x + y − z) ∈ R
3
(i tym samym
macierzy
A =
3 2 −4
1 2 −2
1 1 −1
z M
3×3
(R)). Wielomian charakterystyczny jest równy 2 − 5X + 4X
2
− X
3
=
(1−X)
2
(2−X), a więc wartości własne to 1 i 2, przy czym 1 jest dwukrotna,
a 2 jednokrotna. Przy wyznaczaniu wektorów własnych posłużymy się ma-
cierzami A − 1I i A − 2I. Dowolny wektor własny (x, y, z) o wartości własnej
1 spełnia równanie
2 2 −4
1 1 −2
1 1 −2
x
y
z
= 0
i metoda Gaussa pokazuje, że jest on postaci y(−1, 1, 0) + z(2, 0, 1), gdzie
y, z ∈ R, y 6= 0 lub z 6= 0. Natomiast dowolny wektor własny (x, y, z) o
wartości własnej 2 spełnia równanie
1 2 −4
1 0 −2
1 1 −3
x
y
z
= 0
i metoda Gaussa pokazuje, że jest on postaci z(2, 1, 1), gdzie z ∈ R, z 6= 0.
86
Mówi się, że macierz A z M
n×n
(K) o wyrazach a
ji
jest diagonalna, gdy
a
ji
= 0 dla wszystkich i, j ∈ {1, . . . , n} takich, że i 6= j. Zatem macierz
diagonalna to macierz kwadratowa, która poza główną przekątną ma wy-
razy równe 0. Endomorfizm skończenie wymiarowej przestrzeni wektorowej
nazywa się diagonalizowalnym, gdy istnieje baza tej przestrzeni, w której
ma on macierz diagonalną (ma to być macierz w jednej bazie, tej samej w
dziedzinie i przeciwdziedzinie).
Ćwiczenie. Zauważyć, że endomorfizm f : U −→ U skończenie wymia-
rowej przestrzeni wektorowej U jest diagonalizowalny wtedy i tylko wtedy,
gdy istnieje baza U złożona z wektorów własnych f . Przemyśleć, jak można
opisać działanie takiego endomorfizmu w terminach geometrii.
Czasami mówi się również, że diagonalizowalna jest macierz A z M
n×n
(K),
co oznacza diagonalizowalność endomorfizmu przestrzeni wektorowej K
n
,
który w bazie kanonicznej ma macierz A. A więc A jest diagonalizowalna
wtedy i tylko wtedy, gdy istnieje taka P ∈ GL(n, K), że macierz P
−1
AP jest
diagonalna.
Przykład. Jak wiemy, endomorfizm z poprzedniego przykładu ma w
bazie (−1, 1, 0), (2, 0, 1), (2, 1, 1) macierz diagonalną
1 0 0
0 1 0
0 0 2
,
a więc jest diagonalizowalny.
Ponieważ macierz diagonalna jest szczególnie prosta, to i w rozważaniach
teoretycznych, i w zastosowaniach praktycznych często pomaga sprowadzenie
diagonalizowalnego endomorfizmu lub diagonalizowalnej macierzy do postaci
diagonalnej. Ilustruje to następny przykład.
Przykład. Słynny ciąg Fibonacciego związany z liczeniem królików jest
określony przez warunki a
0
= 0, a
1
= 1, a
k
= a
k−1
+a
k−2
dla k ≥ 2. Ostatnią
zależność rekurencyjną można zapisać w postaci macierzowej jako
·
a
k
a
k−1
¸
=
·
1 1
1 0
¸ ·
a
k−1
a
k−2
¸
,
87
co w połączeniu z warunkami początkowymi daje dla wszystkich k ≥ 0 wzór
·
a
k+1
a
k
¸
= A
k
·
1
0
¸
,
gdzie
A =
·
1 1
1 0
¸
.
Postępując jak poprzednio obliczamy, że A ma jednokrotne wartości własne
(1 −
√
5)/2 i (1 +
√
5)/2, a odpowiadające im wektory własne to na przykład
((1 −
√
5)/2, 1) i ((1 +
√
5)/2, 1). Macierz przejścia od bazy kanonicznej do
bazy złożonej z tych wektorów to
Q =
·
1−
√
5
2
1+
√
5
2
1
1
¸
,
dlatego A = QDQ
−1
, gdzie
D =
·
1−
√
5
2
0
0
1+
√
5
2
¸
.
Stąd mamy A
k
= AA . . . AA = (QDQ
−1
)(QDQ
−1
) . . . (QDQ
−1
)(QDQ
−1
) =
QDD . . . DDQ
−1
= QD
k
Q
−1
. Ponadto, jak łatwo zauważyć, potęgowanie
macierzy diagonalnej sprowadza się do potęgowania jej wyrazów z głównej
przekątnej, więc
·
a
k+1
a
k
¸
=
·
1−
√
5
2
1+
√
5
2
1
1
¸ "
(
1−
√
5
2
)
k
0
0
(
1+
√
5
2
)
k
# "
−
1
√
5
1+
√
5
2
√
5
1
√
5
−
1−
√
5
2
√
5
# ·
1
0
¸
.
Po obliczeniu drugiego wyrazu iloczynu macierzy z prawej strony tej równości
dostajemy wzór na wyrazy ciągu Fibonacciego
a
k
=
1
√
5
³
(
1+
√
5
2
)
k
− (
1−
√
5
2
)
k
´
.
Jednakże, jak pokazuje kolejny przykład, nie wszystkie endomorfizmy i
macierze są diagonalizowalne.
Przykład. Dobrze znanym sposobem łatwo obliczamy, że endomorfizm
f : R
2
3 (x, y) −→ (x − 4y, x + 5y) ∈ R
2
ma dwukrotną wartość własną 3
i że dowolny jego wektor własny jest postaci y(−2, 1), gdzie y ∈ R, y 6= 0.
Widać stąd jasno, że nie istnieje baza R
2
złożona z wektorów własnych f .
88
Podprzestrzenie pierwiastkowe
Choć nie dla każdego endomorfizmu można znaleźć bazę, w której ma
on macierz diagonalną, to przy założeniu algebraicznej domkniętości ciała
można znaleźć bazę, w której ma on tak zwaną macierz Jordana, będącą
uogólnieniem macierzy diagonalnej. Mówiącemu o tym twierdzeniu Jordana
i związanym z nim zagadnieniom poświęcimy parę najbliższych wykładów.
Niech f : U −→ U będzie endomorfizmem przestrzeni wektorowej U nad
ciałem K. Dla każdej wartości własnej λ endomorfizmu f i każdego k ∈ N
definiujemy
U
k
λ
= {u ∈ U : (f − λid
U
)
k
(u) = 0}.
Zauważmy, że jest to podprzestrzeń przestrzeni U, bo U
k
λ
= ker((f − λid
U
)
k
).
Ponadto U
0
λ
= {0}, natomiast U
1
λ
składa się z wszystkich wektorów własnych
endomorfizmu f o wartości własnej λ i wektora 0 (dlatego U
1
λ
nazywa się
podprzestrzenią własną endomorfizmu f o wartości własnej λ). Oczywiście
U
k
λ
⊂ U
k+1
λ
dla każdego k ∈ N.
Przykład. Dla dowolnego k ∈ N funkcja R 3 x −→ x
k
e
λx
∈ R należy
do podprzestrzeni U
k+1
λ
endomorfizmu G 3 ϕ −→ ϕ
0
∈ G, gdzie G oznacza
podprzestrzeń przestrzeni wektorowej R
R
złożoną z funkcji klasy C
∞
.
Podprzestrzeń P przestrzeni wektorowej U nazywa się podprzestrzenią
niezmienniczą endomorfizmu f : U −→ U, gdy f (P ) ⊂ P (czyli f (u) ∈ P
dla każdego u ∈ P ).
Twierdzenie. Każda U
k
λ
jest podprzestrzenią niezmienniczą f .
Dowód: Jeśli u ∈ U
k
λ
, to (f − λid
U
)
k
(f (u)) = f ((f − λid
U
)
k
(u)) = f (0) =
0, więc f (u) ∈ U
k
λ
.
Podprzestrzeń pierwiastkowa endomorfizmu f o wartości własnej λ to
U
λ
=
∞
[
k=0
U
k
λ
.
Bez trudu można sprawdzić, że U
λ
rzeczywiście jest podprzestrzenią U, bo
U
0
λ
⊂ U
1
λ
⊂ U
2
λ
⊂ . . . . Oczywiście jest ona podprzestrzenią niezmienniczą f .
89
Twierdzenie. Niech λ
1
, . . . , λ
m
będą wartościami własnymi endomorfi-
zmu f , przy czym λ
i
6= λ
j
o ile i 6= j, i niech u
1
∈ U
λ
1
, . . . , u
m
∈ U
λ
m
. Jeżeli
u
1
+ . . . + u
m
= 0, to u
1
= 0, . . . , u
m
= 0.
Dowód: Łatwo sprawdza się, że U
λ
i
jest podprzestrzenią niezmienniczą
endomorfizmu f − λ
j
id
U
. Pokażemy najpierw, że jeśli i 6= j, to endomorfizm
(f −λ
j
id
U
)|
U
λi
: U
λ
i
−→ U
λ
i
jest monomorfizmem. Weźmy w tym celu wektor
u ∈ ker((f −λ
j
id
U
)|
U
λi
), a następnie taką liczbę k ∈ N, że (f −λ
i
id
U
)
k
(u) = 0.
Ponieważ f (u) = λ
j
u, to 0 = (f − λ
i
id
U
)
k
(u) = (λ
j
− λ
i
)
k
u i skoro λ
i
6= λ
j
,
to faktycznie mamy u = 0. Aby zakończyć dowód twierdzenia obliczamy dla
każdego i wartości na obu stronach równości u
1
+ . . . + u
m
= 0 endomorfizmu
(f − λ
1
id
U
)
k
1
. . . (f − λ
i−1
id
U
)
k
i−1
(f − λ
i+1
id
U
)
k
i+1
. . . (f − λ
m
id
U
)
k
m
, gdzie
k
l
są dobrane tak, że (f − λ
l
)
k
l
(u
l
) = 0 dla każdego l różnego od i. Dzięki
temu stwierdzamy, że wartość tego endomorfizmu na u
i
jest równa 0. Stąd
dostajemy u
i
= 0, jako że złożenie monomorfizmów jest monomorfizmem.
Twierdzenie. Dla dowolnej wartości własnej λ endomorfizmu f i każdej
k ≥ 2 odwzorowanie
U
k
λ
/U
k−1
λ
3 [u] −→ [(f − λid
U
)(u)] ∈ U
k−1
λ
/U
k−2
λ
jest poprawnie określone i jest monomorfizmem.
Dowód: Wprost z definicji otrzymujemy (f − λid
U
)(U
k
λ
) ⊂ U
k−1
λ
oraz
(f −λid
U
)(U
k−1
λ
) ⊂ U
k−2
λ
, a to oznacza, że nasze odwzorowanie jest poprawnie
określone. Jego monomorficzność jest również bardzo łatwa do zauważenia:
jeśli [(f − λid
U
)(u)] = 0 dla pewnego u ∈ U
k
λ
, to (f − λid
U
)(u) ∈ U
k−2
λ
, więc
(f − λid
U
)
k−1
(u) = 0 i u ∈ U
k−1
λ
, czyli [u] = 0.
Gdy U ma skończony wymiar, co będziemy od tej pory zakładać, to w
ciągu U
0
λ
⊂ U
1
λ
⊂ U
2
λ
⊂ . . . może występować tylko skończenie wiele inkluzji
nie będących równościami. Oznaczmy przez k
λ
najmniejszą liczbę naturalną,
dla której
U
λ
= U
k
λ
λ
.
Okazuje się, że wymiar U
λ
jest równy krotności wartości własnej λ. Teraz
udowodnimy, że wymiar U
λ
jest nie mniejszy niż krotność wartości własnej
λ, a nierówność przeciwna będzie udowodniona po wprowadzeniu macierzy i
baz Jordana.
90
Weźmy dowolną bazę e
1
, . . . , e
p
podprzestrzeni U
λ
i dopełnijmy ją do
bazy e
1
, . . . , e
n
całej przestrzeni U. W tej ostatniej bazie endomorfizm f ma
macierz postaci
·
A B
0
D
¸
,
gdzie A ∈ M
p×p
(K), B ∈ M
p×(n−p)
(K), D ∈ M
(n−p)×(n−p)
(K). Widać stąd,
że wielomian charakterystyczny f jest równy det(A − XI) det(D − XI). Je-
śli krotność wartości własnej λ endomorfizmu f oznaczymy przez q, to ten
wielomian charakterystyczny dzieli się przez (λ − X)
q
. Aby zakończyć do-
wód nierówności p ≥ q, o którą nam chodzi, wystarczy tylko pokazać, że
jednomian λ − X nie dzieli wielomianu det(D − XI), bo wówczas wielomian
det(A − XI) stopnia p będzie podzielny przez wielomian (λ − X)
q
stopnia
q. Przypuśćmy więc dla dowodu nie wprost, że λ − X dzieli det(D − XI).
Ale ostatni wielomian jest wielomianem charakterystycznym endomorfizmu
U/U
λ
3 [u] −→ [f (u)] ∈ U/U
λ
. Endomorfizm ten ma więc wektor własny [w]
o wartości własnej λ. Mamy zatem w ∈ U \ U
λ
i f (w) − λw ∈ U
λ
. Te dwa
warunki są ze sobą sprzeczne, bo pierwszy mówi, że (f − λid
U
)
k
(w) 6= 0 dla
każdego k, a drugi, że (f − λid
U
)
k
λ
+1
(w) = 0.
Macierz Jordana i baza Jordana
Niech λ będzie skalarem z ciała K, a r ≥ 1. Klatką Jordana rozmiaru r
o wartości własnej λ nazywa się macierz z M
r×r
(K) postaci
λ
1
λ
. .. ...
1
λ
,
czyli mającą na głównej przekątnej wyrazy λ, bezpośrednio pod nią wyrazy
1, a wszystkie pozostałe wyrazy równe 0 (formalnie wyrazy a
ji
tej macierzy
spełniają warunki: a
ji
= λ, gdy j = i, a
ji
= 1, gdy j = i + 1, oraz a
ji
= 0 we
wszystkich pozostałych przypadkach).
Macierzą Jordana nazywa się każdą macierz kwadratową mającą wzdłuż
głównej przekątnej rozmieszczone klatki Jordana, natomiast wszędzie poza
tymi klatkami wyrazy równe 0.
91
Przykład. Macierz
4 0 0 0 0 0
1 4 0 0 0 0
0 1 4 0 0 0
0 0 0 4 0 0
0 0 0 0 5 0
0 0 0 0 1 5
z M
6×6
(R) jest macierzą Jordana o trzech klatkach: rozmiaru 3 o wartości
własnej 4, rozmiaru 1 o wartości własnej 4, rozmiaru 2 o wartości własnej 5.
Bazą Jordana endomorfizmu f : U −→ U skończenie wymiarowej prze-
strzeni wektorowej U nazywa się dowolną uporządkowaną bazę U, w której
macierz f jest macierzą Jordana.
Twierdzenie. Załóżmy, że f : U −→ U jest endomorfizmem skończenie
wymiarowej przestrzeni wektorowej U, a λ jego wartością własną. Wówczas
dla endomorfizmu f |
U
λ
: U
λ
−→ U
λ
istnieje baza Jordana.
Dowód: Konstrukcja bazy Jordana przebiega rekurencyjnie ze względu
na k ∈ {1, . . . , k
λ
}. Rozpoczyna się od k
λ
. Załóżmy że już wykonaliśmy
krok odpowiadający k + 1 i mamy skonstruowane niektóre wektory naszej
bazy. Opiszemy jak wykonać krok odpowiadający k i skonstruować kolejne.
Bierzemy mianowicie te spośród już skonstruowanych wektorów, które należą
do U
k
λ
\ U
k−1
λ
. Zakładamy, że ich klasy abstrakcji w U
k
λ
/U
k−1
λ
są liniowo
niezależne i dopełniamy je do bazy tej przestrzeni. Wybieramy po jednym
reprezentancie z każdej z dołożonych klas. Powiedzmy, że są nimi u
1
, . . . , u
s
.
Otóż wektory, które dokładamy do naszej bazy w kroku odpowiadającym k
to wektory (f −λid
U
)
j
(u
i
) dla (i, j) ∈ {1, . . . , s}×{0, . . . , k −1} ułożonych w
porządku leksykograficznym (baza Jordana musi być bazą uporządkowaną).
Ponieważ wiemy, że U
k
λ
/U
k−1
λ
3 [u] −→ [(f − λid
U
)(u)] ∈ U
k−1
λ
/U
k−2
λ
jest
monomorfizmem i przeprowadza klasy liniowo niezależne na klasy liniowo
niezależne, to warunek, który założyliśmy w kroku odpowiadającym k będzie
również spełniony w kroku odpowiadającym k − 1, skąd wynika poprawność
konstrukcji. Łatwo też zauważyć, że daje ona bazę U
λ
będącą bazą Jordana
f |
U
λ
. Rzeczywiście, oznaczając v
j
= (f − λid
U
)
j−1
(u
i
) dla j ∈ {1, . . . , k}
widzimy, że f (v
j
) = λv
j
+ v
j+1
dla j ∈ {1, . . . , k − 1}, a f (v
k
) = λv
k
, więc
macierzą endomorfizmu f |
lin {v
1
,...,v
k
}
w bazie v
1
, . . . , v
k
jest klatka Jordana.
92
Ćwiczenie. Niech V będzie przestrzenią wektorową, V
0
, . . . , V
l
takimi jej
podprzestrzeniami, że {0} = V
0
⊂ V
1
⊂ . . . ⊂ V
l−1
⊂ V
l
= V , A zaś jej
skończonym podzbiorem. Uzasadnić następujący prosty fakt wykorzystany
w trakcie ostatniego dowodu: jeśli dla każdego k ∈ {1, . . . , l} klasy abstrakcji
[a
1
], . . . , [a
t
] z V
k
/V
k−1
dla a
1
, . . . , a
t
takich, że A ∩ (V
k
\ V
k−1
) = {a
1
, . . . , a
t
},
tworzą bazę V
k
/V
k−1
, to A jest bazą V .
Twierdzenie. Wymiar podprzestrzeni pierwiastkowej U
λ
endomorfizmu
skończenie wymiarowej przestrzeni wektorowej jest równy krotności wartości
własnej λ.
Dowód: Już wcześniej udowodniliśmy, że p ≥ q, gdzie p oznacza wymiar
U
λ
, a q krotność wartości własnej λ endomorfizmu f . Nierówność przeciwna
wynika stąd, że U
λ
jest podprzestrzenią niezmienniczą f i dlatego wielomian
charakterystyczny f jest podzielny przez wielomian charakterystyczny f |
U
λ
,
a ten ostatni jest równy (λ − X)
p
jako wielomian charakterystyczny macierzy
Jordana o p wierszach i p kolumnach, w której wszystkie klatki Jordana mają
wartość własną λ, jak to widać z poprzedniego dowodu.
Twierdzenie. Jeżeli endomorfizm skończenie wymiarowej przestrzeni
wektorowej ma wielomian charakterystyczny będący iloczynem wielomianów
pierwszego stopnia, to jego dziedzina jest sumą prostą jego podprzestrzeni
pierwiastkowych.
Dowód: Już wcześniej udowodnione twierdzenie mówi, że odwzorowanie
U
λ
1
× . . . × U
λ
m
3 (u
1
, . . . , u
m
) −→ u
1
+ . . . + u
m
∈ U jest monomorfizmem.
Pozostało zauważyć, że dim(U
λ
1
× . . . × U
λ
m
) = dim U, bo suma krotności
pierwiastków wielomianu charakterystycznego naszego endomorfizmu jest na
podstawie założenia równa jego stopniowi.
Twierdzenie. Jeżeli endomorfizm skończenie wymiarowej przestrzeni
wektorowej ma wielomian charakterystyczny będący iloczynem wielomianów
pierwszego stopnia, to istnieje dla niego baza Jordana.
Dowód: Wiemy, że dziedzina naszego endomorfizmu jest sumą prostą jego
podprzestrzeni pierwiastkowych i że jego zawężenie do każdej z nich ma bazę
Jordana. Ustawiając te bazy jedną za drugą w jeden ciąg otrzymujemy bazę,
której istnienie mieliśmy wykazać.
93
Zauważmy, że założenie ostatniego twierdzenia (nazywanego twierdzeniem
Jordana) jest spełnione dla każdego endomorfizmu, jeżeli ciało skalarów jest
algebraicznie domknięte, a więc w szczególności dla ciała C.
Twierdzenie. Niech f będzie endomorfizmem, λ jego wartością własną, a
k ∈ N\{0}. Wtedy w każdej macierzy Jordana endomorfizmu f |
U
λ
ilość klatek
Jordana o rozmiarze nie mniejszym niż k jest równa dim U
k
λ
− dim U
k−1
λ
.
Dowód: Niech f |
lin {v
1
,...,v
r
}
ma w bazie v
1
, . . . , v
r
macierz będącą klatką
Jordana, to znaczy niech będzie f (v
j
) − λv
j
= v
j+1
dla j ∈ {1, . . . , r − 1}, a
f (v
r
)−λv
r
= 0. Wtedy dla dowolnych skalarów α
1
, . . . , α
r
i k ∈ {0, . . . , r−1}
mamy równość (f −λid
U
)
k
(α
1
v
1
+. . .+α
r
v
r
) = α
1
v
1+k
+. . .+α
r−k
v
r
, z której
wynika, że U
k
λ
∩lin {v
1
, . . . , v
r
} = lin {v
r−k+1
, . . . , v
r
} dla k ∈ {1, . . . , r}. Stąd
różnica dim(U
k
λ
∩ lin {v
1
, . . . , v
r
}) − dim(U
k−1
λ
∩ lin {v
1
, . . . , v
r
}) jest równa 1,
gdy k ∈ {1, . . . , r}, a 0, gdy k ≥ r + 1. Sumując takie różnice odpowiadające
wszystkim klatkom Jordana otrzymujemy tezę twierdzenia, bo U
k
λ
i U
k−1
λ
są
sumami prostymi podprzestrzeni U
k
λ
∩ lin {v
1
, . . . , v
r
} i U
k−1
λ
∩ lin {v
1
, . . . , v
r
}
po wszystkich klatkach Jordana o wartości własnej λ, co łatwo sprawdzić.
Istota ostatniego twierdzenia polega na tym, że wymiary podprzestrzeni
U
k
λ
endomorfizmu posiadającego bazę Jordana wyznaczają rozmiary klatek
Jordana dowolnej jego macierzy Jordana i na odwrót. Otoż gdy w
k
oznacza
wymiar U
k
λ
, a i
k
ilość klatek Jordana rozmiaru k o wartości własnej λ, to na
podstawie tego twierdzenia mamy dla każdego k ≥ 1
i
k
= −w
k−1
+ 2w
k
− w
k+1
,
w
k
=
∞
X
r=1
i
r
min{r, k}
(suma jest tu skończona, bo i
r
6= 0 tylko dla skończenie wielu r).
Powyższe wzory są niełatwe do zapamiętania i niepraktyczne. Związki,
które one opisują, można o wiele przejrzyściej przedstawić na odpowiednim
diagramie. Mianowicie, jeśli narysujemy diagram złożony z kolumn o górnych
końcach leżących na jednym poziomie i długościach równych kolejno różnicom
dim U
k
λ
− dim U
k−1
λ
dla k ∈ {1, . . . , k
λ
}, to długości wierszy tego diagramu
będą równe rozmiarom klatek Jordana. Objaśnimy to na przykładzie.
94
Przykład. Przypuśćmy, że dla pewnego endomorfizmu i pewnej jego
wartości własnej λ mamy dim U
0
λ
= 0, dim U
1
λ
= 4, dim U
2
λ
= 6, dim U
3
λ
= 8,
dim U
4
λ
= 9, dim U
k
λ
= 10 dla k ≥ 5. Aby znaleźć ilości klatek Jordana
poszczególnych rozmiarów o wartości własnej λ w macierzy Jordana tego
endomorfizmu obliczamy, że dim U
1
λ
− dim U
0
λ
= 4, dim U
2
λ
− dim U
1
λ
= 2,
dim U
3
λ
− dim U
2
λ
= 2, dim U
4
λ
− dim U
3
λ
= 1, dim U
5
λ
− dim U
4
λ
= 1 (dalsze
różnice będą równe 0), więc rysujemy diagram o kolumnach kolejno długości
4, 2, 2, 1, 1, umieszczając górne końce kolumn na jednym poziomie.
Długości wierszy tego diagramu są równe 5, 3, 1, 1, i takie też będą rozmiary
klatek Jordana o wartości własnej λ, czyli będzie jedna klatka rozmiaru 5,
jedna rozmiaru 3 i dwie rozmiaru 1. Oczywiście gdybyśmy znali te rozmiary,
to moglibyśmy z nich odtworzyć wymiary podprzestrzeni U
k
λ
rysując diagram
o wierszach długości 5, 3, 1, 1 (koniecznie w kolejności od największego do
najmniejszego) z lewymi końcami wyrównanymi wzdłuż pionowej linii. Dla
każdego k ∈ N wymiar podprzestrzeni U
k
λ
jest ilością kratek w k pierwszych
kolumnach tak otrzymanego diagramu.
Zwróćmy uwagę, że w takich diagramach żaden wiersz nie będzie dłuższy
niż poprzedni i żadna kolumna nie będzie dłuższa niż poprzednia.
Obliczanie macierzy Jordana i bazy Jordana
Opiszemy teraz algorytm pozwalający obliczyć macierz Jordana i bazę
Jordana endomorfizmu f : U −→ U, którego wielomian charakterystyczny
rozkłada się na czynniki pierwszego stopnia. Jest on podsumowaniem kilku
dotychczas udowodnionych twierdzeń. W szczególności sama konstrukcja
bazy Jordana będzie powtórzeniem konstrukcji, która pojawiła się w jednym
z dowodów, jednak w celu zwiększenia przejrzystości podzielimy ją tu na
więcej drobniejszych kroków.
95
Rozpoczyna się od obliczenia wielomianu charakterystycznego oraz jego
pierwiastków, czyli wartości własnych f . Dalszy ciąg algorytmu przebiega
dla każdej wartości własnej λ osobno i daje macierz Jordana i bazę Jordana
zawężenia endomorfizmu f do podprzestrzeni pierwiastkowej U
λ
. Otrzymane
w ten sposób dla poszczególnych wartości własnych macierze należy na końcu
ułożyć wzdłuż głównej przekątnej macierzy Jordana całego f , wypełniając
pozostałe miejsca zerami, a bazy ustawić jedną za drugą w ciąg, który będzie
bazą Jordana całego f .
Dla każdej wartości własnej λ konstruuje się ciąg podprzestrzeni
U
0
λ
( U
1
λ
( U
2
λ
( . . . ( U
k
λ
−1
λ
( U
k
λ
λ
= U
k
λ
+1
λ
= . . . ,
gdzie U
k
λ
= {u ∈ U : (f − λid
U
)
k
(u) = 0} (przy czym zawsze U
0
λ
= {0}).
Ciąg ten stabilizuje się od miejsca o numerze oznaczonym przez k
λ
, które
można rozpoznać po tym, że po raz pierwszy inkluzja staje się tam równością
(dalsze inkluzje automatycznie są równościami) lub po tym, że wymiar U
k
λ
λ
jest równy krotności λ (zatem U
k
λ
λ
= U
λ
). Następnie najlepiej narysować
diagram złożony z kolumn o górnych końcach leżących na jednym poziomie i
długościach równych kolejno różnicom dim U
k
λ
−dim U
k−1
λ
dla k ∈ {1, . . . , k
λ
},
który już daje pełną informację o macierzy Jordana endomorfizmu f |
U
λ
. Ma
ona mianowicie tyle klatek Jordana, ile ten diagram ma wierszy, a rozmiary
klatek są takie, jak długości wierszy (wartości własne tych klatek są równe
λ). Natomiast konstrukcja bazy Jordana f |
U
λ
rozpada się naturalnie na tyle
kroków, ile jest wierszy w diagramie. Opiszemy jak wykonać jeden z nich,
przy założeniu, że wykonane są poprzednie, czyli odpowiadające wierszom
położonym wyżej. Niech wiersz odpowiadający temu krokowi ma długość k.
Na początek trzeba wziąć wektor v
1
z U
k
λ
wybrany dość dowolnie, byle tylko
klasa abstrakcji [v
1
] w U
k
λ
/U
k−1
λ
była liniowo niezależna od klas abstrakcji w
U
k
λ
/U
k−1
λ
tych spośród wektorów skonstruowanych w poprzednich krokach,
które należą do U
k
λ
\ U
k−1
λ
. Następnie rekurencyjnie oblicza się wektory v
j
=
(f − λid
U
)(v
j−1
) dla j ∈ {2, . . . , k}. Dobrze jest po otrzymaniu każdego z
wektorów v
1
, . . . , v
k
zaznaczać krzyżykiem kratkę w wierszu odpowiadającym
wykonywanemu krokowi idąc od prawej do lewej (wówczas dla dowolnego
l ∈ {1, . . . , k
λ
} krzyżyki wektorów z U
l
λ
\U
l−1
λ
będą leżeć w l-tej kolumnie), co
pomaga w orientacji, na jakim się jest etapie. Ponieważ macierzą f |
lin {v
1
,...,v
k
}
w bazie v
1
, . . . , v
k
jest klatka Jordana, więc wystarczy wektory otrzymywane
w poszczególnych krokach ustawiać w ciąg w kolejności ich konstruowania, a
dostanie się bazę Jordana endomorfizmu f |
U
λ
. Oczywiście będzie ona miała
tyle elementów, ile kratek ma diagram dla wartości własnej λ.
96
Warto tutaj dodać, że wartości własne i rozmiary klatek Jordana są przez
endomorfizm wyznaczone jednoznacznie, ale ich kolejność wzdłuż przekątnej
macierzy Jordana już nie. Opisany algorytm grupuje klatki według wartości
własnych, a dla każdej wartości własnej z osobna ustawia je od największej do
najmniejszej. Możemy się więc umówić, że zawsze będziemy ustawiać klatki
w macierzach Jordana zgodnie z tymi regułami. Nadal jednak pozostanie
niejednoznaczność w kolejności wartości własnych, bo poza przypadkiem, gdy
wszystkie wartości własne są rzeczywiste, raczej nie ma jakiegoś naturalnego
sposobu ich uporządkowania. Jeśli chodzi o bazy Jordana, to endomorfizm
może ich mieć wiele, nawet bardzo różnych, i to takich, w których ma taką
samą macierz Jordana. Jest to jasne, skoro nasz algorytm daje dużą swobodę
wyboru po jednym wektorze na każdą klatkę Jordana.
Przykład. Obliczymy według powyższego algorytmu macierz Jordana i
bazę Jordana endomorfizmu f : R
4
−→ R
4
, który w bazie kanonicznej ma
macierz
1
−2 −1 −5
1
4
1
5
3
3
5
9
−1 −1 −1 −1
.
Wielomianem charakterystycznym f jest 24 − 44X + 30X
2
− 9X
3
+ X
4
, czyli
(2 − X)
3
(3 − X), więc f ma dwie wartości własne: 2, która jest trzykrotna,
i 3, która jest jednokrotna.
Bierzemy wartość własną 2. Macierz f − 2id
R
4
w bazie kanonicznej to
−1 −2 −1 −5
1
2
1
5
3
3
3
9
−1 −1 −1 −3
,
zatem (x
1
, x
2
, x
3
, x
4
) należy do U
1
2
wtedy i tylko wtedy, gdy
−x
1
−2x
2
−x
3
−5x
4
= 0,
x
1
+2x
2
+x
3
+5x
4
= 0,
3x
1
+3x
2
+3x
3
+9x
4
= 0,
−x
1
−x
2
−x
3
−3x
4
= 0.
Stąd U
1
2
= {(x
1
, x
2
, x
3
, x
4
) ∈ R
4
: x
1
= −x
3
− x
4
, x
2
= −2x
4
} i dim U
1
2
= 2.
97
Macierz (f − 2id
R
4
)
2
w bazie kanonicznej to
1
0
1
1
−1 0 −1 −1
0
0
0
0
0
0
0
0
,
zatem (x
1
, x
2
, x
3
, x
4
) należy do U
2
2
wtedy i tylko wtedy, gdy
x
1
+x
3
+x
4
= 0,
−x
1
−x
3
−x
4
= 0.
Stąd U
2
2
= {(x
1
, x
2
, x
3
, x
4
) ∈ R
4
: x
1
= −x
3
− x
4
} i dim U
2
2
= 3. Widać, że
już U
2
2
= U
2
, więc rysujemy diagram, który ma dwie kolumny o długościach
kolejno dim U
1
2
− dim U
0
2
= 2 i dim U
2
2
− dim U
1
2
= 1.
Pojawiły się dwa wiersze o długościach kolejno 2 i 1, dlatego będą dwie
klatki Jordana z wartością własną 2 o rozmiarach kolejno 2 i 1. Konstrukcja
bazy Jordana dla f |
U
2
składa się z dwóch kroków. Pierwszy krok odpowiada
pierwszemu wierszowi, który ma długość 2, dlatego wybieramy wektor z U
2
2
,
którego klasa abstrakcji w U
2
2
/U
1
2
jest liniowo niezależna od klas wcześniej
skonstruowanych wektorów zaznaczonych krzyżykami w drugiej kolumnie.
Skoro żadnych wektorów jeszcze nie skonstruowaliśmy, to ostatni warunek
oznacza tylko tyle, że ta klasa ma być niezerowa, więc sam wektor ma nie
należeć do U
1
2
. Wektorem, który spełnia równanie opisujące U
2
2
, ale nie rów-
nania opisujące U
1
2
, jest na przykład (0, 1, 0, 0). Zaznaczamy go na diagramie.
@
@
¡
¡
W pierwszym pierwszym kroku obliczamy (a nie wybieramy) jeszcze jeden
wektor mnożąc przez macierz f −2id
R
4
w bazie kanonicznej poprzedni wektor
zapisany w postaci macierzy jednokolumnowej. Otrzymujemy (−2, 2, 3, −1).
Zaznaczamy go na diagramie.
98
@
@
¡
¡
@
@
¡
¡
Drugi krok odpowiada drugiemu wierszowi, który ma długość 1, dlatego wy-
bieramy wektor z U
1
2
, którego klasa abstrakcji w U
1
2
/U
0
2
jest liniowo nieza-
leżna od klas wcześniej skonstruowanych wektorów zaznaczonych krzyżykami
w pierwszej kolumnie. Ale U
0
2
= {0}, więc niezależność klas jest tym sa-
mym co niezależność ich reprezentantów. Wektorem, który spełnia równania
opisujące U
1
2
, ale nie jest liniowo zależny od (−2, 2, 3, −1) jest na przykład
(−1, 0, 1, 0). Zaznaczamy go na diagramie.
@
@
¡
¡
@
@
¡
¡
@
@
¡
¡
Cały diagram jest wypełniony, zatem mamy gotową bazę Jordana f |
U
2
.
Bierzemy wartość własną 3. Macierz f − 3id
R
4
w bazie kanonicznej to
−2 −2 −1 −5
1
1
1
5
3
3
2
9
−1 −1 −1 −4
,
zatem (x
1
, x
2
, x
3
, x
4
) należy do U
1
3
wtedy i tylko wtedy, gdy
−2x
1
−2x
2
−x
3
−5x
4
= 0,
x
1
+x
2
+x
3
+5x
4
= 0,
3x
1
+3x
2
+2x
3
+9x
4
= 0,
−x
1
−x
2
−x
3
−4x
4
= 0.
Stąd U
1
3
= {(x
1
, x
2
, x
3
, x
4
) ∈ R
4
: x
1
= −x
2
, x
3
= 0, x
4
= 0} i dim U
1
3
= 1.
Widać, że już U
1
3
= U
3
, więc rysujemy diagram, który ma jedną kolumnę o
długości dim U
1
3
− dim U
0
3
= 1.
Pojawił się jeden wiersz o długości 1, dlatego będzie jedna klatka Jordana z
wartością własną 3 o rozmiarze 1. Konstrukcja bazy Jordana dla f |
U
3
składa
99
się z jednego kroku. Jedyny krok odpowiada jedynemu wierszowi, który
ma długość 1, dlatego wybieramy wektor z U
1
3
, którego klasa abstrakcji w
U
1
3
/U
0
3
jest liniowo niezależna od klas wcześniej skonstruowanych wektorów
zaznaczonych krzyżykami w pierwszej kolumnie. Skoro żadnych wektorów
jeszcze nie skonstruowaliśmy, to ostatni warunek oznacza tylko tyle, że ta
klasa ma być niezerowa, więc sam wektor ma nie należeć do U
0
3
. Wektorem,
który spełnia równania opisujące U
1
3
, ale nie jest zerowy, jest na przykład
(−1, 1, 0, 0). Zaznaczamy go na diagramie.
@
@
¡
¡
Cały diagram jest wypełniony, zatem mamy gotową bazę Jordana f |
U
3
.
Ostatecznie macierzą Jordana endomorfizmu f jest
2 0 0 0
1 2 0 0
0 0 2 0
0 0 0 3
,
a bazą Jordana (0, 1, 0, 0), (−2, 2, 3, −1), (−1, 0, 1, 0), (−1, 1, 0, 0) (ta baza
Jordana, którą udało się nam znaleźć, jest oczywiście tylko jedną z wielu
możliwych). Łatwo się przekonać, że uzyskany wynik jest prawidłowy: po
obliczeniu w zwykły sposób macierzy endomorfizmu f w znalezionej bazie
Jordana wychodzi znaleziona macierz Jordana.
Klasyfikacja endomorfizmów
Dwa endomorfizmy f : U −→ U i f
0
: U
0
−→ U
0
przestrzeni wektorowych
U i U
0
nad tym samym ciałem K będziemy nazywać równoważnymi, gdy
istnieje taki izomorfizm g : U −→ U
0
, że f
0
◦ g = g ◦ f . Łatwo sprawdzić,
że faktycznie jest to relacja równoważności na dowolnym zbiorze endomorfi-
zmów przestrzeni wektorowych nad K. Z punktu wiedzenia algebry liniowej
endomorfizmy równoważne można uważać za jednakowe.
Twierdzenie. Dwa endomorfizmy skończenie wymiarowych przestrzeni
wektorowych nad tym samym ciałem są równoważne wtedy i tylko wtedy, gdy
istnieją bazy (po jednej dla każdego z nich, tej samej w dziedzinie i przeciw-
dziedzinie), w których mają one jednakowe macierze.
100
Dowód: Jeżeli f : U −→ U i f
0
: U
0
−→ U
0
mają w bazach e
1
, . . . , e
n
i e
0
1
, . . . , e
0
n
jednakowe macierze, to izomorfizm g określony przez warunki
g(e
1
) = e
0
1
, . . . , g(e
n
) = e
0
n
daje równoważność f i f
0
. Odwrotnie, gdy f i f
0
są równoważne za pośrednictwem izomorfizmu g, a e
1
, . . . , e
n
jest bazą U, to
f i f
0
mają w bazach e
1
, . . . , e
n
i g(e
1
), . . . , g(e
n
) jednakowe macierze.
Wzięcie za e
1
, . . . , e
n
w przedostatniej linijce bazy Jordana f pokazuje
poprawność określenia następującej bijekcji klasyfikującej endomorfizmy.
Twierdzenie. Istnieje kanoniczna bijekcja między klasami abstrakcji
relacji równoważności endomorfizmów skończenie wymiarowych przestrzeni
wektorowych nad ciałem algebraicznie domkniętym a macierzami Jordana o
wyrazach z tego ciała, o ile utożsamia się macierze różniące się tylko kolej-
nością klatek Jordana. Bijekcja ta przypisuje każdej klasie abstrakcji macierz
Jordana dowolnego jej reprezentanta.
Rozpatrywanej tu relacji równoważności nie wolno mylić z inną, którą też
można by określić na zbiorach endomorfizmów przestrzeni wektorowych nad
tym samym ciałem. Otóż można by f : U −→ U i f
0
: U
0
−→ U
0
uznać za
równoważne, gdy istnieją takie izomorfizmy g : U −→ U
0
i h : U −→ U
0
, że
f
0
◦ g = h ◦ f . Wówczas twierdzenie klasyfikacyjne byłoby znacznie prostsze:
przy założeniu skończoności wymiarów U i U
0
takie f i f
0
są równoważne w
tym drugim sensie wtedy i tylko wtedy, gdy dim U = dim U
0
i rz f = rz f
0
.
Rozkład Jordana
Mówi się, że endomorfizm h przestrzeni wektorowej jest nilpotentny, gdy
istnieje taka k ∈ N, że h
k
= 0. Podobnie mówi się też, że macierz kwadratowa
N jest nilpotentna, gdy istnieje taka k ∈ N, że N
k
= 0.
Twierdzenie. Niech f : U −→ U będzie endomorfizmem skończenie
wymiarowej przestrzeni wektorowej, którego wielomian charakterystyczny jest
iloczynem wielomianów pierwszego stopnia. Przy tym założeniu istnieją takie
endomorfizmy g, h : U −→ U, że g jest diagonalizowalny, h jest nilpotentny,
g i h są przemienne (czyli h ◦ g = g ◦ h) oraz
f = g + h.
Co więcej, takie g i h są wyznaczone jednoznacznie.
101
Dowód: Istnienie g i h jest prostym wnioskiem z twierdzenia Jordana, bo
możemy zapisać macierz f w bazie Jordana jako sumę macierzy diagonalnej
D i nilpotentnej N rozkładając każdą klatkę Jordana według wzoru
λ
1
λ
. .. ...
1
λ
=
λ
λ
. ..
λ
+
1
. ..
1
.
Potęga N o wykładniku równym maksymalnemu rozmiarowi klatek będzie
równa 0, bo jest tak potęga drugiej klatki z prawej strony powyższego wzoru
o wykładniku równym jej rozmiarowi. D i N będą przemienne, bo są takie
klatki z prawej powyższego wzoru. Widać więc, że wystarczy za g i h przyjąć
endomorfizmy, które w rozpatrywanej bazie mają macierze D i N. Ale dowód
jednoznaczności g i h jest trudniejszy. Niech wielomian charakterystyczny f
będzie równy (λ
1
− X)
q
1
. . . (λ
m
− X)
q
m
, gdzie λ
1
, . . . , λ
m
są parami różne.
Ponieważ pierścień K[X] jest euklidesowy, a (λ
1
− X)
k
λ1
, . . . , (λ
m
− X)
k
λm
są
parami względnie pierwsze, to na podstawie chińskiego twierdzenia o resztach
istnieją takie wielomiany P (X), P
1
(X), . . . , P
m
(X) ∈ K[X], że dla każdego
i ∈ {1, . . . , m} P (X) = λ
i
+ P
i
(X)(λ
i
− X)
k
λi
. Stąd dla u ∈ U
λ
i
dostajemy
(P (f ))(u) = λ
i
u, czyli P (f )|
U
λi
= g|
U
λi
, a skoro U = U
λ
1
⊕ . . . ⊕ U
λ
m
, to
g = P (f ). Oprócz tego h = Q(f ), gdzie Q(X) = X − P (X). Jeżeli g
0
i h
0
też
spełniają wszystkie warunki wymagane od g i h, to f ◦ g
0
= (g
0
+ h
0
) ◦ g
0
=
g
0
◦ (g
0
+ h
0
) = g
0
◦ f . W konsekwencji g
0
jest przemienne również z P (f ), to
znaczy z g. Dzięki temu dowolna podprzestrzeń własna V endomorfizmu g
0
jest niezmiennicza dla g, bo gdy g
0
(u) = λu, to g
0
(g(u)) = g(g
0
(u)) = g(λu) =
λg(u). Ponadto wielomian charakterystyczny g|
V
jako dzielnik wielomianu
charakterystycznego g rozkłada się na czynniki pierwszego stopnia, więc g|
V
ma bazę Jordana, a ponieważ U jest sumą prostą podprzestrzeni własnych
g
0
, więc g ma bazę Jordana złożoną z wektorów własnych g
0
. Jednoznaczność
macierzy Jordana g wymusza, że baza ta składa się z wektorów własnych g.
Mamy więc bazę, w której macierze obu endomorfizmów g i g
0
są diagonalne.
Dlatego diagonalna jest w niej też macierz g − g
0
. Z drugiej strony h
0
− h jest
nilpotentny, bo gdy h
k
= 0 i h
0k
0
= 0, to (h
0
− h)
k+k
0
−1
= 0, skoro h i h
0
są
przemienne (wykazuje się to tak samo jak przemienność g i g
0
), co pozwala
zastosować tu wzór Newtona. Wykazaliśmy zatem, że obie strony równości
g − g
0
= h
0
− h są równocześnie diagonalizowalne i nilpotentne. Ale każdy
taki endomorfizm musi być równy 0, bo dostatecznie duża potęga każdej jego
wartości własnej musi być równa 0. Stąd już dostajemy g
0
= g i h
0
= h.
102
Warto tu odnotować, że w trakcie dowodu udało nam się wykazać istnienie
P, Q ∈ K[X] (gdzie K to ciało skalarów), dla których g = P (f ) i h = Q(f ).
Drugi ważny fakt, który stwierdziliśmy, to że dla dwóch przemiennych
oraz diagonalizowalnych endomorfizmów skończenie wymiarowej przestrzeni
wektorowej istnieje wspólna baza, w której oba mają macierze diagonalne.
Występujący w ostatnim twierdzeniu rozkład endomorfizmu na składowe
endomorfizmy diagonalizowalny i nilpotentny nazywa się rozkładem Jordana.
Oczywiście o macierzach Jordana i bazach Jordana oraz o rozkładach
Jordana można mówić nie tylko w odniesieniu do endomorfizmu, ale i do ma-
cierzy kwadratowej, mając na myśli endomorfizm odpowiedniej przestrzeni
K
n
, który w bazie kanonicznej ma rozważaną macierz.
Przykład. Przy okazji ciągu Fibonacciego obliczaliśmy potęgi macierzy
korzystając z tego, że była ona diagonalizowalna. O macierzy
A =
·
1 −4
1
5
¸
wiemy, że nie jest diagonalizowalna. Zobaczymy teraz jak obliczać jej potęgi
posługując się rozkładem Jordana. Znajdując w dobrze już znany sposób
macierz Jordana i bazę Jordana dostajemy A = Q(D + N)Q
−1
, gdzie
Q =
·
1 −2
0
1
¸
,
D =
·
3 0
0 3
¸
,
N =
·
0 0
1 0
¸
.
Stąd A
k
= Q(D + N)
k
Q
−1
. Dzięki przemienności D i N możemy zastosować
wzór Newtona i mamy (D + N)
k
=
P
k
j=0
¡
k
j
¢
D
k−j
N
j
. Ale N
j
= 0 dla j ≥ 2,
więc (D + N)
k
= D
k
+ kD
k−1
N. Ponieważ obliczanie potęg D jest banalne,
to na podstawie powyższych wzorów bez trudu dostajemy
A
k
= 3
k−1
·
3 − 2k
−4k
k
3 + 2k
¸
.
W podobny sposób można też potęgować macierz kwadratową większego
rozmiaru, o ile tylko da się ją sprowadzić do postaci Jordana. Ma to duże
znaczenie w zastosowaniach, choćby przy obliczaniu eksponenty macierzy.
103
Kompleksyfikacja
Ciało liczb rzeczywistych nie jest algebraicznie domknięte. Z tego powodu
w przypadku rzeczywistym nie do każdego endomorfizmu można zastosować
dotychczas omówioną teorię Jordana. Jednak ze względu na znaczenie tego
przypadku, specjalnie dla niego została opracowana pewna modyfikacja teorii
Jordana, którą się teraz zajmiemy. Jej istotą jest sprowadzenie przypadku
rzeczywistego do zespolonego przy pomocy tak zwanej kompleksyfikacji.
Dla dowolnej przestrzeni wektorowej U nad ciałem R definiujemy prze-
strzeń wektorową U
C
nad ciałem C nazywaną kompleksyfikacją U jako zbiór
U
2
z działaniami
(u, v) + (w, x) = (u + w, v + x),
(α + iβ)(u, v) = (αu − βv, αv + βu),
przy czym α, β ∈ R.
Ćwiczenie. Sprawdzić, że U
C
rzeczywiście jest przestrzenią wektorową
nad C (zwróćmy uwagę, że rachunki, które tu trzeba wykonać, do złudzenia
przypominają te, które wykonaliśmy konstruując ciało C z ciała R).
Będziemy utożsamiać dowolny wektor u z U z wektorem (u, 0) z U
C
. Nie
doprowadzi to do nieporozumień, ponieważ U 3 u −→ (u, 0) ∈ U
C
jest
monomorfizmem przestrzeni wektorowych nad R (U
C
można traktować jako
przestrzeń nad R zawężając mnożenie C × U
C
−→ U
C
do R × U
C
). Przy
takim utożsamieniu dowolny wektor (u, v) z U
C
można zapisywać w postaci
u + iv, co też będziemy robić. Dzięki temu staje się oczywiste, że definicja
mnożenia wektorów przez skalary w U
C
powinna być właśnie taka, jaka jest.
Ćwiczenie. Niech u
1
, . . . , u
r
, v
1
, . . . , v
s
, w
1
, . . . , w
s
∈ U. Udowodnić, że
ciąg u
1
, . . . , u
r
, v
1
, w
1
, . . . , v
s
, w
s
jest bazą U wtedy i tylko wtedy, gdy ciąg
u
1
, . . . , u
r
, v
1
+ iw
1
, v
1
− iw
1
, . . . , v
s
+ iw
s
, v
s
− iw
s
jest bazą U
C
(nad C).
Dla dowolnego wektora u+iv z U
C
(przy czym u, v ∈ U) definiujemy jego
sprzężenie u + iv = u − iv
Ćwiczenie. Zauważyć, że p + q = p + q i λp = λ p dla p, q ∈ U
C
, λ ∈ C.
104
Gdy U i V są przestrzeniami wektorowymi nad R, a f : U −→ V jest
liniowe, to kompleksyfikacją f nazywa się odwzorowanie f
C
: U
C
−→ V
C
określone dla u, v ∈ U wzorem
f
C
(u + iv) = f (u) + if (v).
Ćwiczenie. Zauważyć, że f
C
jest jedynym odwzorowaniem liniowym
U
C
−→ V
C
(nad C), którego zawężenie do U jest równe f (ostatni warunek
ma sens, bo na podstawie opisanego utożsamienia U ⊂ U
C
i V ⊂ V
C
).
Ćwiczenie. Zauważyć, że f
C
(p) = f
C
(p) dla p ∈ U
C
.
W praktyce kompleksyfikacja przestrzeni wektorowej lub odwzorowania
liniowego okazuje się łatwiejsza, niż by się to mogło wydawać na pierwszy
rzut oka. Otóż można uważać, że (R
p
)
C
to po prostu C
p
, utożsamiając dla
dowolnych a
1
, . . . , a
p
, b
1
, . . . , b
p
∈ R wektor (a
1
, . . . , a
p
) + i(b
1
, . . . , b
p
) z (R
p
)
C
z wektorem (a
1
+ ib
1
, . . . , a
p
+ ib
p
) z C
p
. Wówczas (z
1
, . . . , z
p
) = (z
1
, . . . , z
p
)
dla (z
1
, . . . , z
p
) ∈ C
p
. Ponadto, jak nietrudno zauważyć, jeśli f : R
p
−→ R
q
jest liniowe, to f
C
: C
p
−→ C
q
ma w bazach kanonicznych C
p
i C
q
tę samą
macierz, co f w bazach kanonicznych R
p
i R
q
(ma to sens, bo R ⊂ C, więc
M
q×p
(R) ⊂ M
q×p
(C)).
Uogólniona macierz Jordana i baza Jordana
Niech λ = α + iβ, gdzie α, β ∈ R, β 6= 0, i niech s ≥ 1. Uogólnioną klatką
Jordana rozmiaru 2s o wartości własnej λ nazywa się macierz z M
2s×2s
(R)
postaci
L
I
L
. .. ...
I
L
,
gdzie
L =
·
α
β
−β α
¸
,
I =
·
1 0
0 1
¸
.
Taka klatka ma zatem wzdłuż głównej przekątnej s bloków L, bezpośrednio
pod nią s − 1 bloków I, a wszędzie poza tymi blokami wyrazy równe 0.
105
Uogólnioną macierzą Jordana nazywa się każdą macierz kwadratową o
wyrazach rzeczywistych mającą wzdłuż głównej przekątnej rozmieszczone
klatki Jordana i uogólnione klatki Jordana, natomiast wszędzie poza tymi
klatkami wyrazy równe 0. Jak łatwo się domyślić, uogólnioną bazą Jordana
endomorfizmu f : U −→ U rzeczywistej skończenie wymiarowej przestrzeni
wektorowej U nazywa się dowolną uporządkowaną bazę U, w której macierz
f jest uogólnioną macierzą Jordana.
Udowodnimy teraz uogólnione twierdzenie Jordana.
Twierdzenie. Dla każdego endomorfizmu skończenie wymiarowej rzeczy-
wistej przestrzeni wektorowej istnieje uogólniona baza Jordana.
Dowód: Rozpatrzmy kompleksyfikację f
C
: U
C
−→ U
C
endomorfizmu
f : U −→ U, dla którego ma istnieć uogólniona baza Jordana. Wielomian
charakterystyczny f
C
jest równy wielomianowi charakterystycznemu f , więc
jego współczynniki są rzeczywiste. Dlatego jeśli λ jest wartością własną f
C
,
to jest nią również λ. Będziemy konstruować uogólnioną bazę Jordana f
po kawałku, przy czym każdy z kawałków będzie odpowiadał albo rzeczywi-
stej wartości własnej f
C
, albo parze wzajemnie sprzężonych nierzeczywistych
wartości własnych f
C
. W pierwszym przypadku, czyli gdy λ ∈ R, λ jest też
wartością własną f i jako kawałek konstruowanej bazy odpowiadający λ bie-
rzemy bazę Jordana zawężenia f do jego podprzestrzeni pierwiastkowej o
wartości własnej λ. Zauważmy, że wtedy podprzestrzeń pierwiastkowa f
C
o
wartości własnej λ jest równa kompleksyfikacji podprzestrzeni pierwiastkowej
f o wartości własnej λ, bo ((f − λid
U
)
k
)
C
= (f
C
− λid
U
C
)
k
, i skonstruowany
kawałek jest też bazą Jordana zawężenia f
C
do jego podprzestrzeni pier-
wiastkowej o wartości własnej λ. Natomiast w drugim przypadku, czyli gdy
λ = α + iβ, gdzie α, β ∈ R, β 6= 0, wychodzimy od bazy Jordana zawężenia
f
C
do jego podprzestrzeni pierwiastkowej o wartości własnej λ. Jako kawałek
konstruowanej bazy odpowiadający (λ, λ) bierzemy ciąg powstały z tej bazy
Jordana przez zastąpienie każdego z wektorów v + iw, gdzie v, w ∈ U, wek-
torami v, w. Zauważmy, że jeśli f
C
(p
j
) = λp
j
+ p
j+1
dla j ∈ {1, . . . , s − 1}, a
f
C
(p
s
) = λp
s
, to f
C
(p
j
) = λp
j
+ p
j+1
dla j ∈ {1, . . . , s − 1}, a f
C
(p
s
) = λp
s
.
Wynika z tego, że jeśli w bazie Jordana zawężenia f
C
do jego podprzestrzeni
pierwiastkowej o wartości własnej λ zastąpimy każdy wektor jego sprzęże-
niem, to dostaniemy bazę Jordana zawężenia f
C
do jego podprzestrzeni pier-
wiastkowej o wartości własnej λ. Stąd na podstawie wcześniejszego ćwiczenia
106
widać, że po ustawieniu w ciąg jeden po drugim wszystkich skonstruowanych
kawałków otrzymamy bazę U. Będzie ona uogólnioną bazą Jordana f , bo
jeśli f
C
(v
j
+ iw
j
) = (α + iβ)(v
j
+ iw
j
) + v
j+1
+ iw
j+1
dla j ∈ {1, . . . , s − 1}, a
f
C
(v
s
+ iw
s
) = (α + iβ)(v
s
+ iw
s
), gdzie α, β ∈ R, v
1
, . . . , v
s
, w
1
, . . . , w
s
∈ U,
to f (v
j
) = αv
j
− βw
j
+ v
j+1
, f (w
j
) = βv
j
+ αw
j
+ w
j+1
dla j ∈ {1, . . . , s − 1},
a f (v
s
) = αv
s
− βw
s
, f (w
s
) = βv
s
+ αw
s
. Oznacza to koniec dowodu.
Przeprowadzony dowód zawiera algorytm obliczania uogólnionej macierzy
Jordana i uogólnionej bazy Jordana. Oblicza się je kawałkami, po jednym
kawałku dla każdej rzeczywistej wartości własnej i każdej pary wzajemnie
sprzężonych nierzeczywistych wartości własnych. Dla rzeczywistej wartości
własnej nie dzieje się nic nowego, oblicza się po prostu macierz Jordana i bazę
Jordana zawężenia endomorfizmu do podprzestrzeni pierwiastkowej o tej war-
tości własnej. Natomiast dla pary wzajemnie sprzężonych nierzeczywistych
wartości własnych (λ, λ) oblicza się najpierw macierz Jordana i bazę Jordana
zawężenia kompleksyfikacji endomorfizmu do podprzestrzeni pierwiastkowej
tylko jednej z tych wartości własnych, powiedzmy λ. Z otrzymanej macierzy
Jordana uzyskuje się kawałek uogólnionej bazy Jordana zastępując wyrazy λ
na głównej przekątnej i wyrazy 1 bezpośrednio pod nią odpowiednio blokami
·
α
β
−β α
¸
,
·
1 0
0 1
¸
,
gdzie λ = α+iβ, α, β ∈ R, a z otrzymanej bazy Jordana uzyskuje się kawałek
uogólnionej bazy Jordana zastępując każdy wektor jego częścią rzeczywistą
i urojoną (to znaczy wektor u + iv z U
C
, gdzie u, v ∈ U, wektorami u, v).
Oczywiście na końcu należy wszystkie tak skonstruowane kawałki macierzy
ułożyć wzdłuż głównej przekątnej szukanej uogólnionej macierzy Jordana,
wypełniając pozostałe miejsca zerami, zaś wszystkie kawałki bazy ustawić
jeden za drugim w ciąg, który będzie szukaną uogólnioną bazą Jordana.
W tym miejscu warto jeszcze zauważyć, że uogólnione macierze Jordana
tego samego endomorfizmu mogą się różnić nie tylko kolejnością klatek, ale
również tym, że wartości własne niektórych uogólnionych klatek Jordana
tych samych rozmiarów zamiast być jednakowe, mogą być tylko wzajemnie
sprzężone. Naturalnie tych niejednoznaczności można by się łatwo pozbyć,
żądając na przykład, by w blokach na głównej przekątnej o wyżej wypisanej
postaci było zawsze β < 0, a wartości własne były uporządkowane rosnąco
względem porządku leksykograficznego na zbiorze R
2
, którym jest C.
107
Przykład. Znajdziemy uogólnioną macierz Jordana i uogólnioną bazę
Jordana endomorfizmu f : R
2
3 (x, y) −→ (5x−4y, 2x+y) ∈ R
2
. Jak wiemy,
przy odpowiednim utożsamieniu f
C
: C
2
3 (x, y) −→ (5x − 4y, 2x + y) ∈ C
2
.
Wielomian charakterystyczny f
C
to X
2
−6X +13, więc wartościami własnymi
f
C
są 3−2i i 3+2i. Od dawna znanym sposobem obliczamy, że zawężenie f
C
do jego podprzestrzeni pierwiastkowej o wartości własnej 3 − 2i ma macierz
Jordana [3 − 2i] i bazę Jordana (1 − i, 1). Zatem f ma uogólnioną macierz
Jordana
·
3 −2
2
3
¸
i uogólnioną bazę Jordana (1, 1), (−1, 0) składającą się z części rzeczywistej
i urojonej wektora (1 − i, 1). Łatwo się przekonać, że uzyskany wynik jest
prawidłowy: po obliczeniu w zwykły sposób macierzy endomorfizmu f w zna-
lezionej uogólnionej bazie Jordana wychodzi znaleziona uogólniona macierz
Jordana. Rzecz jasna, f ma także uogólnioną macierz Jordana
·
3
2
−2 3
¸
w uogólnionej bazie Jordana (1, 1), (1, 0), co ilustruje wspomnianą niejedno-
znaczność uogólnionej macierzy Jordana (oczywiście dla każdej z tych dwóch
uogólnionych macierzy Jordana można dobrać wiele różnych uogólnionych
baz Jordana).
Na zakończenie odnotujmy rzeczywistą wersję klasyfikacji endomorfizmów
będącą podsumowaniem uogólnionej teorii Jordana.
Twierdzenie. Istnieje kanoniczna bijekcja między klasami abstrakcji re-
lacji równoważności endomorfizmów skończenie wymiarowych rzeczywistych
przestrzeni wektorowych a uogólnionymi macierzami Jordana, o ile utożsa-
mia się takie macierze, że jedna powstaje z drugiej przez zmianę kolejności
klatek Jordana i uogólnionych klatek Jordana lub przez zastąpienie wartości
własnych niektórych uogólnionych klatek Jordana wartościami własnymi z
nimi sprzężonymi. Bijekcja ta przypisuje każdej klasie abstrakcji uogólnioną
macierz Jordana dowolnego jej reprezentanta.
Sugerowane sposoby zapewnienia jednoznaczności uogólnionych macierzy
Jordana uprościłyby wypowiedź powyższego twierdzenia, jednak nie są one
powszechnie przyjęte.
108
Zespolone przestrzenie wektorowe jako rzeczywiste
Powiedzieliśmy już nieco o kompleksyfikacji, która pozwala wychodząc
od rzeczywistej przestrzeni wektorowej skonstruować przestrzeń wektorową
zespoloną. Przy okazji zauważyliśmy, że zespolona przestrzeń wektorowa U
może być traktowana jako rzeczywista przez zawężenie ciała skalarów, czyli
mówiąc dokładnie zawężenia mnożenia wektorów przez skalary C × U −→ U
do podzbioru R × U. Teraz przedstawimy kilka najbardziej podstawowych
faktów dotyczących tej drugiej operacji, zostawiając ich nietrudne dowody
jako ćwiczenia. Zauważmy też, że operacje kompleksyfikacji i zawężenia ciała
skalarów nie są wzajemnie odwrotne, bo ich złożenie w dowolnej kolejności
podwaja wymiar przestrzeni wektorowych skończonego wymiaru.
Ćwiczenie. Niech u
1
, . . . , u
p
będzie bazą przestrzeni wektorowej U nad
ciałem C. Zauważyć, że u
1
, . . . , u
p
, iu
1
, . . . , iu
p
jest bazą U nad R.
Ćwiczenie. Załóżmy, że u
1
, . . . , u
p
i v
1
, . . . , v
q
są bazami przestrzeni
wektorowych U i V nad ciałem C, a f : U −→ V . Sprawdzić, że f jest
C-liniowe (czyli liniowe jako odwzorowanie przestrzeni wektorowych nad C)
wtedy i tylko wtedy, gdy jest R-liniowe (czyli liniowe jako odwzorowanie
przestrzeni wektorowych nad R) oraz ma w bazach u
1
, . . . , u
p
, iu
1
, . . . , iu
p
i
v
1
, . . . , v
q
, iv
1
, . . . , iv
q
macierz postaci
·
A −B
B
A
¸
,
gdzie A, B ∈ M
q×p
(R) (wtedy f jako odwzorowanie C-liniowe ma w bazach
u
1
, . . . , u
p
i v
1
, . . . , v
q
macierz A + iB).
Ćwiczenie. Załóżmy, że f jest endomorfizmem skończenie wymiarowej
przestrzeni wektorowej nad C i oznaczmy przez f
R
to samo odwzorowanie
f , ale traktowane jako endomorfizm przestrzeni wektorowej nad R, a przez
W
f
(X) i W
f
R
(X) wielomiany charakterystyczne f i f
R
. Udowodnić, że
W
f
R
(X) = W
f
(X)W
f
(X),
gdzie W
f
(X) oznacza wielomian powstały z W
f
(X) przez zastąpienie każdego
współczynnika jego sprzężeniem. Zauważyć, że w szczególności
det f
R
= | det f |
2
,
tr f
R
= 2Re (tr f ).
109
Wskazówka: dla dowolnych A, B ∈ M
p×p
(R[X]) zachodzi równość
·
A −B
B
A
¸
=
1
2
·
I
iI
iI
I
¸ ·
A − iB
0
0
A + iB
¸ ·
I
−iI
−iI
I
¸
,
gdzie 0 i I oznaczają macierze zerową i jednostkową z M
p×p
(R) (ale oczywiście
wszystkie bloki są tu traktowane jako macierze z M
p×p
(C[X])); zastosować
do tej równości wzór Cauchy’ego.
Przykład. Dowolny endomorfizm przestrzeni wektorowej C nad ciałem
C jest postaci f : C 3 z −→ λz ∈ C dla pewnego λ ∈ C. Niech λ = α + iβ,
gdzie α, β ∈ R. Macierzą C-endomorfizmu f w bazie 1 jest [λ], czyli [α + iβ].
Dla z = x + iy, gdzie x, y ∈ R, λz = αx − βy + i(βx + αy), więc faktycznie
macierzą R-endomorfizmu f w bazie 1, i jest
·
α −β
β
α
¸
.
Widać to wyraźnie, gdy się pamięta, że C = R
2
, 1 = (1, 0), i = (0, 1). Jasne
też jest, że każdy C-endomorfizm jest R-endomorfizmem, ale nie odwrotnie,
bo C-endomorfizmami są tylko te R-endomorfizmy, które w bazie 1, i mają
macierz szczególnej, wyżej wypisanej postaci. Na tym prostym przykładzie
można również bezpośrednio zobaczyć zależności między wyznacznikami i
śladami f traktowanego jako C-endomorfizm i R-endomorfizm.
Macierz formy dwuliniowej
Definicja. Niech U i V będą skończenie wymiarowymi przestrzeniami
wektorowymi nad ciałem K, ciągi u
1
, . . . , u
p
, v
1
, . . . , v
q
niech będą bazami
odpowiednio U i V , natomiast f : U × V −→ K odwzorowaniem dwuliniową
(takie odwzorowania będziemy nazywać formami dwuliniowym). Macierz
f (u
1
, v
1
) . . . f (u
1
, v
q
)
...
...
f (u
p
, v
1
) . . . f (u
p
, v
q
)
nazywa się macierzą formy dwuliniowej f w bazach u
1
, . . . , u
p
i v
1
, . . . , v
p
.
Od razu widać, że dla dowolnie ustalonych baz U i V odwzorowanie
L(U, V ; K) −→ M
p×q
(K), które przyporządkowuje formom dwuliniowym ich
macierze w tych bazach, jest izomorfizmem przestrzeni wektorowych.
110
Przykład. Obliczanie macierzy formy kwadratowej jest łatwiejsze niż
obliczanie macierzy odwzorowania liniowego. Jeżeli chcemy znaleźć macierz
f : R
2
× R
3
3 ((a, b), (c, d, e)) −→ 2ac + ad − 5bc − 3bd − 4be ∈ R w bazach
(1, 1), (0, 1) i (0, 1, 0), (0, 1, 1), (1, 1, 0), to obliczamy f ((1, 1), (0, 1, 0)) = −2,
f ((1, 1), (0, 1, 1)) = −6, f ((1, 1), (1, 1, 0)) = −5, f ((0, 1), (0, 1, 0)) = −3,
f ((0, 1), (0, 1, 1)) = −7, f ((0, 1), (1, 1, 0)) = −8 i dostajemy
·
−2 −6 −5
−3 −7 −8
¸
.
Natomiast macierzą f w bazach kanonicznych jest
·
2
1
0
−5 −3 −4
¸
,
co widać bez żadnych obliczeń.
Twierdzenie. Niech U i V będą przestrzeniami wektorowymi nad ciałem
K, u
1
, . . . , u
p
i v
1
, . . . , v
q
bazami odpowiednio U i V , f : U × V −→ K
odwzorowaniem dwuliniowym oraz niech x ∈ U i v ∈ V . Jeżeli x
1
, . . . , x
p
i
y
1
, . . . , y
q
są współrzędnymi x i y w tych bazach, to
[f (x, y)] =
x
1
...
x
p
∗
a
11
. . . a
1q
...
...
a
p1
. . . a
pq
y
1
...
y
q
,
przy czym trzecia z macierzy występujących w tym wzorze jest macierzą f w
bazach u
1
, . . . , u
p
i v
1
, . . . , v
q
.
Dowód: f (x, y) = f (
P
p
i=1
x
i
u
i
,
P
q
j=1
y
j
v
j
) =
P
p
i=1
P
q
j=1
x
i
y
j
f (u
i
, v
j
) =
P
p
i=1
P
q
j=1
x
i
a
ij
y
j
.
Przykład. Dla f : R
2
× R
2
3 ((a, b), (c, d)) −→ 4ac + 2ad + bc + 3bd ∈ R
dostajemy f ((1, −2), (3, 1)) = 2, bo
[ 1 −2 ]
·
4 2
1 3
¸ ·
3
1
¸
= [2].
Wykażemy teraz wzór transformacyjny, który pokazuje jak zmienia się
macierz formy dwuliniowej przy zmianie baz.
111
Twierdzenie. Załóżmy, że u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
są bazami przestrzeni
wektorowej U, v
1
, . . . , v
q
i v
0
1
, . . . , v
0
q
są bazami przestrzeni wektorowej V , zaś
f : U ×V −→ K jest dwuliniowe. Jeżeli A jest macierzą f w bazach u
1
, . . . , u
p
i v
1
, . . . , v
q
, a A
0
macierzą f w bazach u
0
1
, . . . , u
0
p
i v
0
1
, . . . , v
0
q
, to
A
0
= P
∗
AQ,
gdzie P oznacza macierz przejścia od bazy u
1
, . . . , u
p
do bazy u
0
1
, . . . , u
0
p
, a Q
macierz przejścia od bazy v
1
, . . . , v
q
do bazy v
0
1
, . . . , v
0
q
.
Dowód: Niech x ∈ U, a y ∈ V oraz niech X i X
0
oznaczają macierze z
M
p×1
(K), których wyrazy to współrzędne x w bazie odpowiednio u
1
, . . . , u
p
i u
0
1
, . . . , u
0
p
, a Y i Y
0
macierze z M
q×1
(K), których wyrazy to współrzędne
y w bazie odpowiednio v
1
, . . . , v
q
i v
0
1
, . . . , v
0
q
. Wstawiając X = P X
0
i Y =
QY
0
do równości [f (x, y)] = X
∗
AY dostajemy [f (x, y)] = X
0∗
P
∗
AQY
0
. Z
drugiej strony [f (x, y)] = X
0∗
A
0
Y
0
. Ponieważ x i y są dowolne, to równość
X
0∗
A
0
Y
0
= X
0∗
(P
∗
AQ)Y
0
oznacza, że A
0
i P
∗
AQ są macierzami w bazach
u
0
1
, . . . , u
0
p
i v
0
1
, . . . , v
0
q
tej samej formy kwadratowej, więc A
0
= P
∗
AQ.
Dla formy dwuliniowej f : U ×V −→ K określamy L
f
: V −→ U
∗
wzorem
(L
f
(v))(u) = f (u, v).
Twierdzenie. Odwzorowanie
L(U, V ; K) 3 f −→ L
f
∈ Hom(V, U
∗
)
jest izomorfizmem.
Dowód: Liniowość jest oczywista, zaś odwzorowaniem odwrotnym jest
przypisanie dowolnemu L z Hom(V, U
∗
) formy f z L(U, V ; K) określonej
wzorem f (u, v) = (L(v))(u).
Twierdzenie to pozwala utożsamiać formy z L(U, V ; K) z odwzorowaniami
z Hom(V, U
∗
). Następne twierdzenie czyni takie utożsamienie jeszcze bardziej
naturalnym.
Twierdzenie. Niech u
1
, . . . , u
p
będzie bazą U, a v
1
, . . . , v
q
bazą V . Wtedy
dla dowolnej f ∈ L(U, V ; K) macierz f w bazach u
1
, . . . , u
p
i v
1
, . . . , v
q
jest
taka sama, jak macierz L
f
w bazach v
1
, . . . , v
q
i u
∗
1
, . . . , u
∗
p
.
112
Dowód: Teza twierdzenia wynika stąd, że L
f
(v
j
) =
P
p
i=1
f (u
i
, v
j
)u
∗
i
, a
ta równość zachodzi, bo wartości obu jej strony na wektorach u
1
, . . . , u
p
są
jednakowe, jako że (L
f
(v
j
))(u
i
) = f (u
i
, v
j
).
Rzędem formy dwuliniowej f : U × V −→ K będziemy nazywać rząd
odwzorowania liniowego L
f
, o ile jest on skończony (a więc w szczególności,
gdy U i V mają skończone wymiary).
Wniosek. Gdy wymiary U i V są skończone, to rząd formy dwuliniowej
U × V −→ K jest równy rzędowi jej macierzy w dowolnych bazach.
Mówi się, ze forma dwuliniowa f : U × V −→ K jest niezdegenerowana,
gdy L
f
: V −→ U
∗
jest izomorfizmem. Taka forma pozwala utożsamiać V i
U
∗
poprzez ten izomorfizm. Oczywiście gdy wymiary U i V są skończone, to
f jest niezdegenerowana wtedy i tylko wtedy, gdy jej macierz w dowolnych
bazach jest kwadratowa i ma wyznacznik różny od 0.
Dla form dwuliniowych określonych na iloczynie kartezjańskim dwóch jed-
nakowych przestrzeni szczególne znaczenie mają macierze w jednej bazie, tej
samej w obu tych przestrzeniach (podobnie jak dla endomorfizmów macierze
w tej samej bazie w dziedzinie i przeciwdziedzinie).
Macierz kwadratową A nazywa się symetryczną, kiedy A
∗
= A, zaś anty-
symetryczną, kiedy A
∗
= −A. Obrazowo można powiedzieć, że w macierzy
symetrycznej wyrazy położone symetrycznie po obu stronach głównej prze-
kątnej są równe, a w antysymetrycznej przeciwne. Gdy charakterystyka ciała
skalarów jest rożna od 2, to wyrazy macierzy antysymetrycznej leżące na
głównej przekątnej muszą być równe 0 jako przeciwne same do siebie. Dla
zachowania jednolitości umówmy się zatem w przypadku charakterystyki 2
nazywać antysymetrycznymi tylko te macierze, które spełniają dodatkowo
również i ten warunek.
Przykład. Jeden rzut oka na macierze
6
−1
4
−1
2
5
4
5
−3
,
0
4
−7
−4
0
2
7
−2
0
pozwala stwierdzić, że pierwsza jest symetryczna, a druga antysymetryczna.
113
Ponieważ każdy wektor jest kombinacją liniową wektorów bazy, to mamy
prosty sposób rozpoznawania czy forma dwuliniowa jest symetryczna lub
antysymetryczna po wyglądzie jej macierzy zapisanej w jednej bazie.
Twierdzenie. Jeżeli u
1
, . . . , u
p
jest bazą przestrzeni wektorowej U nad
ciałem K, f : U × U −→ K formą dwuliniową, a A jej macierzą w bazie
u
1
, . . . , u
p
, to
1) f jest symetryczna wtedy i tylko wtedy, gdy A jest symetryczna,
2) f jest antysymetryczna wtedy i tylko wtedy, gdy A jest antysymetryczna.
Twierdzenie Lagrange’a
Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią
wektorową nad ciałem K charakterystyki różnej od 2, a f : U × U −→ K
symetryczną formą dwuliniową. Wówczas istnieje taka baza przestrzeni U,
w której f ma macierz diagonalną.
Dowód: Niech dim U = n. Opiszemy efektywny algorytm dający bazę,
której istnienie powinniśmy udowodnić. Jest on rekurencyjny ze względu na
k ∈ {1, . . . , n − 1}, przy czym celem k-tego kroku jest skonstruowanie takiej
bazy w
1
, . . . , w
n
, że f (w
i
, w
j
) = 0 dla i ∈ {1, . . . , k} oraz j ∈ {i + 1, . . . , n}.
Rozpocząć można od dowolnej bazy. Przypuśćmy, że krok k − 1 został już
wykonany i mamy taką bazę u
1
, . . . , u
n
, że f (u
i
, u
j
) = 0 dla i ∈ {1, . . . , k −1}
oraz j ∈ {i + 1, . . . , n}. Możemy też założyć, że f (u
k
, u
j
) 6= 0 dla pewnego
j ∈ {k + 1, . . . , n}, bo inaczej można by natychmiast zakończyć k-ty krok
przyjmując w
1
= u
1
, . . . , w
n
= u
n
. Najpierw szukamy takiej bazy v
1
, . . . , v
n
,
że nadal f (v
i
, v
j
) = 0 dla i ∈ {1, . . . , k − 1} oraz j ∈ {i + 1, . . . , n}, ale
dodatkowo f (v
k
, v
k
) 6= 0. Jeśli f (u
k
, u
k
) 6= 0, to wystarczy wziąć po prostu
v
1
= u
1
, . . . , v
n
= u
n
. W przeciwnym przypadku patrzymy, czy istnieje takie
j ∈ {k + 1, . . . , n}, że f (u
j
, u
j
) 6= 0. Jeśli tak, to bierzemy v
k
= u
j
i v
j
= u
k
,
zaś v
i
= u
i
dla pozostałych i. Jeśli nie, to mamy takie j ∈ {k + 1, . . . , n},
że f (u
k
, u
j
) 6= 0, i przyjmujemy v
k
= u
k
+ u
j
i v
j
= u
k
− u
j
, zaś v
i
= u
i
dla pozostałych i (wtedy f (v
k
, v
k
) = 2f (u
k
, u
j
) 6= 0, a v
1
, . . . , v
n
jest bazą,
ponieważ u
k
=
1
2
(v
k
+ v
j
) i u
j
=
1
2
(v
k
− v
j
), zatem lin {v
1
, . . . , v
n
} = U).
Mając już v
1
, . . . , v
n
, wykonujemy zasadniczą część k-tego kroku przyjmując
w
1
= v
1
, . . . , w
k
= v
k
, w
k+1
= v
k+1
+ α
k+1
v
k
, . . . , w
n
= v
n
+ α
n
v
k
z
α
k+1
, . . . , α
n
dobranymi tak, aby baza w
1
, . . . , w
n
miała żądane własności.
Jak widać, α
j
= −f (v
k
, v
j
)/f (v
k
, v
k
) dla j ∈ {k + 1, . . . , n} są dobre.
114
Przykład. Stosując algorytm opisany w dowodzie znajdziemy dla formy
R
3
× R
3
3 ((a, b, c), (d, e, f )) −→ ae − af + bd + 3bf − cd + 3ce ∈ R bazę, w
której ma ona macierz diagonalną. Jej macierz bazie kanonicznej to
0
1 −1
1
0
3
−1 3
0
.
Wyjdziemy od bazy kanonicznej. W pierwszym kroku chcemy uzyskać bazę,
w której macierz formy będzie miała wyrazy równe 0 w pierwszym wierszu
i pierwszej kolumnie, być może poza wyrazem leżącym na ich przecięciu.
Niestety, w bazie u
1
= (1, 0, 0), u
2
= (0, 1, 0), u
3
= (0, 0, 1) macierz formy ma
na przecięciu pierwszego wiersza i pierwszej kolumny wyraz równy 0, musimy
więc najpierw zmienić bazę, by stał się on różny od 0. Co gorsze, wszystkie
dalsze wyrazy z głównej przekątnej też są równe 0, więc nie wystarczy zmienić
kolejności wektorów bazy. Dlatego postępując zgodnie z procedurą tworzymy
bazę v
1
= (1, 0, 0) + (0, 1, 0) = (1, 1, 0), v
2
= (1, 0, 0) − (0, 1, 0) = (1, −1, 0),
v
3
= (0, 0, 1), w której forma ma macierz
1
1
0
1 −1 0
0
0
1
0
1 −1
1
0
3
−1 3
0
1
1
0
1 −1 0
0
0
1
=
2
0
2
0 −2 −4
2 −4
0
.
Teraz już możemy przystąpić do zasadniczej części pierwszego kroku. Zatem
konstruujemy bazę w
1
= (1, 1, 0), w
2
= (1, −1, 0) −
0
2
(1, 1, 0) = (1, −1, 0),
w
3
= (0, 0, 1) −
2
2
(1, 1, 0) = (−1, −1, 1), w której forma ma macierz
1
1
0
1
−1 0
−1 −1 1
0
1 −1
1
0
3
−1 3
0
1
1
−1
1 −1 −1
0
0
1
=
2
0
0
0 −2 −4
0 −4 −2
.
Widać, że pierwszy krok został pomyślnie zakończony. Żeby nie komplikować
oznaczeń umówmy się, że te stosowane dotychczas, w następnym kroku już
nie obowiązują. Oczywiście teraz wychodzimy od bazy, do której ostatnio
doszliśmy. W drugim kroku chcemy uzyskać bazę, w której macierz formy
będzie miała wyrazy równe 0 także w drugim wierszu i drugiej kolumnie,
być może poza wyrazem leżącym na ich przecięciu. Na szczęście w aktualnej
bazie u
1
= (1, 1, 0), u
2
= (1, −1, 0), u
3
= (−1, −1, 1) macierz formy ma na
przecięciu drugiego wiersza i drugiej kolumny wyraz różny od 0, więc po
115
prostu przyjmujemy v
1
= (1, 1, 0), v
2
= (1, −1, 0), v
3
= (−1, −1, 1) i od razu
przystępujemy do zasadniczej części drugiego kroku, czyli konstruujemy bazę
w
1
= (1, 1, 0), w
2
= (1, −1, 0), w
3
= (−1, −1, 1) −
(−4)
(−2)
(1, −1, 0) = (−3, 1, 1),
w której forma ma macierz
1
1
0
1
−1 0
−3
1
1
0
1 −1
1
0
3
−1 3
0
1
1
−3
1 −1
1
0
0
1
=
2
0
0
0 −2 0
0
0
6
.
Widać, że drugi i ostatni krok został pomyślnie zakończony.
Twierdzenie Sylvestera
W przypadku rzeczywistym twierdzenie Lagrange’a można wzmocnić.
Twierdzenie. Załóżmy, że U jest skończenie wymiarową rzeczywistą
przestrzenią wektorową, a f : U × U −→ R symetryczną formą dwuliniową.
Wówczas istnieje taka baza przestrzeni U, w której f ma macierz diagonalną,
przy czym na głównej przekątnej tej macierzy występują kolejno: pewna ilość
wyrazów równych 1, pewna ilość wyrazów równych −1, pewna ilość wyrazów
równych 0, i nie występują tam żadne inne wyrazy.
Dowód: Z twierdzenia Lagrange’a mamy bazę u
1
, . . . , u
n
, w której f ma
macierz diagonalną z wyrazami a
1
, . . . , a
n
na głównej przekątnej. Żądaną
bazę otrzymujemy wymieniając w bazie u
1
, . . . , u
n
wektory u
i
na (1/
p
|a
i
|)u
i
dla takich i ∈ {1, . . . , n}, że a
i
6= 0, a następnie zmieniając odpowiednio
kolejność wektorów.
Przykład. Symetryczna forma dwuliniowa z poprzedniego przykładu ma
w bazie
1
√
2
(1, 1, 0),
1
√
6
(−3, 1, 1),
1
√
2
(1, −1, 0) macierz
1 0
0
0 1
0
0 0 −1
.
Opisana w ostatnim twierdzeniu specjalna postać macierzy diagonalnej
jest wyznaczona jednoznacznie przez samą formę. Mówi o tym następujące
twierdzenie Sylvestera, nazywane też twierdzeniem o bezwładności.
116
Twierdzenie. Załóżmy, że f : U × U −→ R jest symetryczną formą
dwuliniową, a u
1
, . . . , u
n
i v
1
, . . . , v
n
bazami przestrzeni wektorowej U nad
ciałem R. Jeżeli macierz f w bazie u
1
, . . . , u
n
jest diagonalna i ma na głównej
przekątnej p wyrazów równych 1, q wyrazów równych −1 i n − p − q wyrazów
równych 0, a macierz f w bazie v
1
, . . . , v
n
jest diagonalna i ma na głównej
przekątnej r wyrazów równych 1, s wyrazów równych −1 i n − r − s wyrazów
równych 0, to r = p i s = q.
Dowód: Bez straty ogólności możemy założyć, że wyrazy na głównych
przekątnych w obu macierzach są uporządkowane tak, jak w poprzednim
twierdzeniu. Ponieważ każda z sum p + q i r + s jest równa rzędowi f , to
wystarczy dowieść, że r = p. Przypuśćmy dla dowodu nie wprost, że r < p.
Wtedy dim(lin {u
1
, . . . , u
p
} ∩ lin {v
r+1
, . . . , v
n
}) ≥ p + (n − r) − n > 0, więc
istnieje w ∈ (lin {u
1
, . . . , u
p
} ∩ lin {v
r+1
, . . . , v
n
}) \ {0}. Stąd już uzyskujemy
sprzeczność, bo skoro w = λ
1
u
1
+ . . . + λ
p
u
p
, to f (w, w) = λ
2
1
+ . . . + λ
2
p
> 0,
a skoro w = µ
r+1
v
r+1
+ . . . + µ
n
v
n
, to f (w, w) = −µ
2
r+1
− . . . − µ
2
r+s
≤ 0.
Twierdzenie Sylvestera pozwala postawić następującą definicję.
Definicja. Sygnaturą symetrycznej formy dwuliniowej f : U × U −→ R,
gdzie U jest skończenie wymiarową przestrzenią wektorową nad R, nazywamy
parę (p, q), w której p oznacza ilość wyrazów równych 1, a q ilość wyrazów
równych −1 na głównej przekątnej macierzy f w dowolnej bazie U takiej, że
ta macierz jest diagonalna i ma na głównej przekątnej tylko wyrazy 1, −1, 0.
Przykład. Forma z dwóch ostatnich przykładów ma sygnaturę (2, 1).
Dwie formy dwuliniowe f : U × U −→ K i f
0
: U
0
× U
0
−→ K, gdzie
U są przestrzeniami wektorowymi nad ciałem K, nazywa się równoważnymi,
gdy istnieje taki izomorfizm g : U −→ U
0
, że f
0
◦ (g × g) = f . Łatwo
sprawdzić, że faktycznie jest to relacja równoważności na dowolnym zbiorze
takich form. Z punktu widzenia algebry liniowej formy równoważne można
uważać za jednakowe.
Ćwiczenie. Zauważyć, że dwie symetryczne formy dwuliniowe na skoń-
czenie wymiarowych przestrzeniach wektorowych nad tym samym ciałem są
równoważne wtedy i tylko wtedy, gdy istnieją bazy (po jednej dla każdej z
nich), w których mają one jednakowe macierze.
117
Następująca klasyfikacja symetrycznych form dwuliniowych na skończenie
wymiarowych rzeczywistych przestrzeniach wektorowych jest wnioskiem z
poprzednich twierdzeń.
Twierdzenie. Jeśli U i U
0
są skończenie wymiarowymi przestrzeniami
wektorowymi nad R, to symetryczne formy dwuliniowe f : U × U −→ R i
f
0
: U
0
× U
0
−→ R są równoważne wtedy i tylko wtedy, gdy dim U
0
= dim U
oraz sygnatury f i f
0
są jednakowe.
W przypadku zespolonym klasyfikacja symetrycznych form dwuliniowych
na przestrzeniach skończonych wymiarów jest prostsza niż w rzeczywistym.
Ćwiczenie. Zauważyć, że dla dowolnej symetrycznej formy dwuliniowej
na skończenie wymiarowej przestrzeni wektorowej nad ciałem algebraicznie
domkniętym charakterystyki różnej od 2 istnieje baza, w której jej macierz
jest diagonalna i ma na głównej przekątnej tylko wyrazy 1 i 0. Wywnioskować
stąd, że takie formy są równoważne wtedy i tylko wtedy, gdy są określone na
przestrzeniach tego samego wymiaru i mają jednakowe rzędy.
Formy kwadratowe
Będziemy tu zakładać, że ciało skalarów ma charakterystykę różną od 2.
Definicja. Formą kwadratową na przestrzeni wektorowej U nad ciałem
K nazywa się każde odwzorowanie h : U −→ K, dla którego istnieje takie
dwuliniowe f : U × U −→ K, że h(u) = f (u, u) dla każdego u ∈ U.
Wykażemy teraz twierdzenie ukazujące ścisły związek między formami
kwadratowymi a symetrycznych formami dwuliniowymi.
Twierdzenie. Jeżeli U jest przestrzenią wektorową nad ciałem K cha-
rakterystyki różnej od 2, to dla dowolnej formy kwadratowej h : U −→ K
istnieje dokładnie jedna symetryczna forma dwuliniowa g : U × U −→ K
taka, że h(u) = g(u, u) dla każdego u ∈ U. Jest ona określona wzorem
g(u, v) =
1
2
(h(u + v) − h(u) − h(v))
dla wszystkich u, v ∈ U.
118
Dowód: Jeżeli f : U × U −→ K jest dwuliniowe i h(u) = f (u, u) dla
każdego u ∈ U, to g : U × U 3 (u, v) −→
1
2
(f (u, v) + f (v, u)) ∈ K jest
symetryczną formą dwuliniową i h(u) = g(u, u) dla każdego u ∈ U, więc
mamy istnienie g. Ponadto jeżeli g : U × U −→ K jest dowolną symetryczną
formą dwuliniową i h(u) = g(u, u) dla każdego u ∈ U, to dla wszystkich
u, v ∈ U jest h(u + v) − h(u) − h(v) = g(u + v, u + v) − g(u, u) − g(v, v) =
g(u, u) + g(u, v) + g(v, u) + g(v, v) − g(u, u) − g(v, v) = 2g(u, v), więc mamy
jednoznaczność g i wzór z drugiej części twierdzenia.
Definicja. Gdy h : U −→ K jest formą kwadratową i charakterystyka K
jest różna od 2, natomiast g : U × U −→ K jest jedyną symetryczną formą
dwuliniową taką, że h(u) = g(u, u) dla każdego u ∈ U, to będziemy mówić,
że h i g są wzajemnie stowarzyszone.
Wzór, który pojawił się w drugiej części ostatniego twierdzenia nazywa
się wzorem polaryzacyjnym. Pozwala on odtworzyć z formy kwadratowej
symetryczną formę dwuliniową z nią stowarzyszoną, albo inaczej, odtworzyć
symetryczną formę dwuliniową U × U −→ K, kiedy zna się jej wartości tylko
na diagonali iloczynu kartezjańskiego U × U.
Jeśli charakterystyka ciała jest różna od 2, to jest jasne, że wszystko, co
powiedzieliśmy o symetrycznych formach dwuliniowych, można przenieść też
na formy kwadratowe, odnosząc to do stowarzyszonych z nimi symetrycznych
form dwuliniowych. Na przykład macierzą formy kwadratowej o dziedzinie
skończonego wymiaru w dowolnej bazie tej dziedziny nazywa się macierz w
tej bazie stowarzyszonej z nią symetrycznej formy dwuliniowej.
Przykład. h : R
3
3 (x, y, z) −→ x
2
+ 8xy − 2xz + 5y
2
+ 6yz − 7z
2
∈ R
jest formą kwadratową. Faktycznie, łatwo możemy wskazać stowarzyszoną z
h symetryczną formę dwuliniową. Jest nią g : R
3
× R
3
−→ R dana wzorem
g((a, b, c), (d, e, f )) = ad + 4ae + 4bd − af − cd + 5be + 3bf + 3ce − 7cf . Stąd
macierz h w bazie kanonicznej to
1
4 −1
4
5
3
−1 3 −7
.
(zwróćmy uwagę, że wyrazy poza główną przekątną to połowy odpowiednich
współczynników h, a nie te współczynniki).
119
Ćwiczenie. Zauważyć, że jeśli K jest ciałem, a n ∈ N, to h : K
n
−→ K
jest formą kwadratową wtedy i tylko wtedy, gdy jest jednorodną funkcją
wielomianową drugiego stopnia, czyli wyraża się wzorem
h(x
1
, . . . , x
n
) =
n
X
i=1
n
X
j=1
a
ij
x
i
x
j
dla (x
1
, . . . , x
n
) ∈ K
n
, przy czym a
ij
∈ K (a
ij
mogą tu być dobrane tak, że
a
ji
= a
ij
, i wtedy są wyrazami macierzy h w bazie kanonicznej).
Podobnie przenosi się na formy kwadratowe definicje niezdegenerowania
i rzędu, twierdzenie Lagrange’a, twierdzenie Sylvestera i definicję sygnatury.
Niech U będzie rzeczywistą przestrzenią wektorową. Mówi się, że forma
kwadratowa h : U −→ R jest dodatnio określona, gdy h(u) > 0 dla każdego
u ∈ U \ {0}, a ujemnie określona, gdy h(u) < 0 dla każdego u ∈ U \ {0}
(oczywiście zawsze h(0) = 0). Oba te pojęcia naturalnie przenosi się z form
kwadratowych na stowarzyszone z nimi symetryczne formy dwuliniowe.
Ćwiczenie. Zauważyć, że jeśli U ma skończony wymiar n, a sygnaturą
h jest (p, q), to h jest dodatnio albo ujemnie określona odpowiednio wtedy i
tylko wtedy, gdy p = n i q = 0 albo p = 0 i q = n.
Iloczyn skalarny
Wprowadzimy teraz pojęcie iloczynu skalarnego, który umożliwi między
innymi mierzenie długości wektorów oraz kątów między nimi. Będzie to więc
bardzo ważny krok na drodze od algebry do geometrii.
Definicja. Niech U będzie przestrzenią wektorową nad R. Iloczynem
skalarnym na U nazywa się symetryczną formę dwuliniową g : U × U −→ R,
która jest dodatnio określona, to znaczy dla każdego u ∈ U spełnia warunki:
g(u, u) ≥ 0 i g(u, u) = 0 tylko wtedy, gdy u = 0.
Przykład. Najważniejszym przykładem jest niewątpliwie standardowy
iloczyn skalarny na przestrzeni wektorowej R
n
zdefiniowany wzorem
g((x
1
, . . . , x
n
), (y
1
, . . . , y
n
)) = x
1
y
1
+ . . . + x
n
y
n
∈ R
dla wszystkich (x
1
, . . . , x
n
), (y
1
, . . . , y
n
) ∈ R
n
.
120
Poniższe ćwiczenia zawierają następne przykłady iloczynów skalarnych.
Ćwiczenie. Oznaczmy Q = {(a
i
)
i∈N
∈ R
N
: ∃
M ∈R
∀
n∈N
P
n
i=0
a
2
i
< M }.
Sprawdzić, że Q jest podprzestrzenią przestrzeni wektorowej R
N
, natomiast
Q×Q 3 ((a
i
)
i∈N
, (b
i
)
i∈N
) −→ lim
n→∞
P
n
i=0
a
i
b
i
∈ R jest poprawnie określone
i jest iloczynem skalarnym (wskazówka: średnia geometryczna dwóch liczb
nieujemnych nie przekracza ich średniej arytmetycznej).
Ćwiczenie. Sprawdzić, że C × C 3 (ϕ, ψ) −→
R
1
0
ϕ(x)ψ(x)dx ∈ R jest
iloczynem skalarnym na przestrzeni wektorowej C wszystkich funkcji ciągłych
[0, 1] −→ R.
Ćwiczenie. Sprawdzić, że P × P 3 (ϕ, ψ) −→
R
2π
0
ϕ(x)ψ(x)dx ∈ R jest
iloczynem skalarnym na przestrzeni wektorowej P ciągłych funkcji R −→ R
okresowych o okresie 2π (przypomnijmy, że ϕ jest okresowa o okresie 2π, gdy
ϕ(x + 2π) = ϕ(x) dla każdego x ∈ R).
Ćwiczenie. Sprawdzić, że R[X]×R[X] 3 (ϕ, ψ) −→
R
1
−1
ϕ(x)ψ(x)dx ∈ R
jest iloczynem skalarnym na przestrzeni wektorowej R[X] (tutaj oczywiście
traktujemy wielomiany z R[X] jako funkcje R −→ R).
Do zapisywania iloczynu skalarnego często używa się kropki, to znaczy
zamiast g(u, v), gdzie g : U × U −→ R jest iloczynem skalarnym, a u, v ∈ U,
pisze się po prostu u · v.
Rzeczywistą przestrzeń wektorową wraz z określonym na niej iloczynem
skalarnym nazywa się wektorową przestrzenią euklidesową (lub krócej, ale
mniej ściśle, przestrzenią euklidesową).
Definicja. Dla wektora u z przestrzeni euklidesowej definiuje się jego
długość jako
kuk =
√
u · u.
Zauważmy, że kuk = 0 wtedy i tylko wtedy, gdy u = 0.
Przykład. Wektor (1, 8, 4) z przestrzeni R
3
ze standardowym iloczynem
skalarnym ma długość
√
1
2
+ 8
2
+ 4
2
= 9.
121
Widać, że w R
2
i R
3
ze standardowym iloczynem skalarnym zdefiniowana
tu długość wektora pokrywa się ze zwykłą znaną ze szkoły długością wektora
obliczaną na podstawie twierdzenia Pitagorasa.
Udowodnimy teraz tak zwaną nierówność Schwarza.
Twierdzenie. Dla dowolnych wektorów u i v z przestrzeni euklidesowej
|u · v| ≤ kukkvk,
przy czym równość zachodzi wtedy i tylko wtedy, gdy u i v są liniowo zależne.
Dowód: Przypadek u = 0 jest trywialny, więc załóżmy, że u 6= 0. Niech
ϕ : R 3 t −→ ktu + vk
2
∈ R. Ponieważ iloczyn skalarny jest dwuliniowy i
symetryczny, to ϕ(t) = (tu + v) · (tu + v) = kuk
2
t
2
+ 2(u · v)t + kvk
2
, a więc ϕ
jest funkcją kwadratową. Ponieważ przyjmuje ona tylko wartości nieujemne,
to ma niedodatni wyróżnik, czyli 4(u·v)
2
−4kuk
2
kvk
2
≤ 0. Stąd natychmiast
dostajemy nierówność Schwarza i widzimy, że staje się ona równością wtedy
i tylko wtedy, gdy wyróżnik ϕ jest równy 0. Ten ostatni warunek zachodzi
wtedy i tylko wtedy, gdy istnieje takie t ∈ R, że ϕ(t) = 0, czyli że tu + v = 0,
co oznacza liniową zależność u i v.
Przypomnijmy, że arccos : [−1, 1] −→ [0, π] jest funkcją odwrotną do
funkcji cos |
[0,π]
: [0, π] −→ [−1, 1].
Definicja. Dla różnych od 0 wektorów u i v z przestrzeni euklidesowej
definiuje się kąt między nimi jako
∠(u, v) = arccos
u · v
kukkvk
.
Zauważmy, że prawa strona tego wzoru ma sens dzięki nierówności Schwarza
oraz że kąt między wektorami jest liczbą rzeczywistą z przedziału [0, π] (lub
mówiąc inaczej, może przyjmować wartości od 0
◦
do 180
◦
).
Przykład. Skoro dla u = (1, 0, 1) i v = (1, 1, −4) w R
3
ze standardowym
iloczynem skalarnym mamy u · v = 1 · 1 + 0 · 1 + 1 · (−4) = −3, kuk =
√
2
i kvk =
√
18, to (u · v)/(kukkvk) = −
1
2
, a więc kąt między tymi wektorami
jest równy
2
3
π (czyli 120
◦
).
122
W R
2
i R
3
ze standardowym iloczynem skalarnym zdefiniowany tutaj kąt
między wektorami pokrywa się ze zwykłym kątem znanym ze szkoły. Widać
to na podstawie szkolnego twierdzenia cosinusów, które można zapisać w
postaci ku − vk
2
= kuk
2
+ kvk
2
− 2kukkvk cos ∠(u, v), i tego, że ku − vk
2
=
(u − v) · (u − v) = kuk
2
+ kvk
2
− 2(u · v).
Mówi się, że wektory u i v z przestrzeni euklidesowej są prostopadłe (lub
inaczej ortogonalne), gdy u · v = 0. Wprost z tej definicji wynika, że wektor
0 jest prostopadły do każdego wektora z rozpatrywanej przestrzeni, a dwa
wektory różne od 0 są prostopadłe wtedy i tylko wtedy, gdy kąt między nimi
wynosi
1
2
π (czyli 90
◦
).
Oczywiście dwa różne od 0 wektory z przestrzeni euklidesowej są liniowo
zależne wtedy i tylko wtedy, gdy kąt między nimi jest równy 0 lub π (czyli
0
◦
lub 180
◦
). Można powiedzieć, że takie wektory mają jednakowe kierunki
oraz odpowiednio jednakowe lub przeciwne zwroty.
Twierdzenie. Dla dowolnych wektorów u i v z przestrzeni euklidesowej
ku + vk ≤ kuk + kvk,
przy czym równość zachodzi wtedy i tylko wtedy, gdy któryś z tych wektorów
jest równy 0 lub oba są różne od 0 oraz mają jednakowe kierunki i zwroty.
Dowód: Z nierówności Schwarza dostajemy ku + vk
2
= (u + v) · (u + v) =
kuk
2
+ 2(u · v) + kvk
2
≤ kuk
2
+ 2|u · v| + kvk
2
≤ kuk
2
+ 2kuk · kvk + kvk
2
=
(kuk + kvk)
2
. Stąd widać i dowodzoną nierówność, i to, że równość zachodzi
wtedy i tylko wtedy, gdy u · v = kukkvk, czyli całą tezę twierdzenia.
Norma na przestrzeni wektorowej
Definicja. Niech U będzie przestrzenią wektorową nad ciałem R lub C,
które oznaczamy przez K. Funkcję U 3 u −→ kuk ∈ [0, +∞) nazywa się
normą na przestrzeni wektorowej U, gdy spełnia warunki
1) kuk = 0 wtedy i tylko wtedy, gdy u = 0,
2) kλuk = |λ|kuk dla wszystkich λ ∈ K, u ∈ U,
3) ku + vk ≤ kuk + kvk dla wszystkich u, v ∈ U.
Ćwiczenie. Wydedukować z 3) i 2), że dla u, v ∈ U ku−vk ≥ |kuk − kvk|.
123
Rzeczywistą lub zespoloną przestrzeń wektorową wraz z określoną na niej
normą nazywa się przestrzenią unormowaną.
Określoną wcześniej długość wektora w przestrzeni euklidesowej i normę
wektora w przestrzeni unormowanej oznaczyliśmy tym samym symbolem.
Nie jest to przypadek, mamy bowiem następujące twierdzenie mówiące, że
każda przestrzeń euklidesowa jest rzeczywistą przestrzenią unormowaną.
Twierdzenie. Jeśli U jest przestrzenią euklidesową, to odwzorowanie
U 3 u −→ kuk ∈ [0, +∞) określone wzorem kuk =
√
u · u jest normą na U.
Dowód: Warunki 1) i 2) z definicji normy są trywialne, a warunek 3) był
przedmiotem poprzedniego twierdzenia.
To twierdzenie sugeruje, by normę wektora z przestrzeni unormowanej
interpretować jako jego długość. W związku z tym warunek 3) z definicji
normy bywa nazywany nierównością trójkąta, bo oznacza, że suma długości
dwóch boków trójkąta jest nie mniejsza od długości jego trzeciego boku.
Dla dowolnej przestrzeni unormowanej U definiujemy funkcję
d : U × U 3 (u, v) −→ kv − uk ∈ [0, +∞).
Ćwiczenie. Sprawdzić, że powyższa funkcja jest metryką na U, czyli że
1) d(u, v) = 0 wtedy i tylko wtedy, gdy v = u,
2) d(v, u) = d(u, v) dla wszystkich u, v ∈ U,
3) d(u, w) ≤ d(u, v) + d(v, w) dla wszystkich u, v, w ∈ U.
Zatem każda przestrzeń unormowana jest przestrzenią metryczną i jako
taka jest również przestrzenią topologiczną. Nie będziemy teraz rozwijać tego
tematu, zauważmy tylko, że w przestrzeni euklidesowej R
n
ze standardowym
iloczynem skalarnym zdefiniowana tu metryka jest najzwyklejszą metryką
euklidesową i w konsekwencji indukowana przez nią topologia też jest zwykła.
Następne ćwiczenie zawiera tak zwany warunek równoległoboku, który
zachodzi w przestrzeniach euklidesowych i mówi, że w tych przestrzeniach
suma kwadratów długości przekątnych dowolnego równoległoboku jest równa
sumie kwadratów długości wszystkich jego boków.
124
Ćwiczenie. Sprawdzić, że dla dowolnych wektorów u i v z przestrzeni
euklidesowej zachodzi równość
ku + vk
2
+ ku − vk
2
= 2(kuk
2
+ kvk
2
).
Dzięki warunkowi równoległoboku możemy się przekonać, że nie każda
rzeczywista przestrzeń unormowana jest przestrzenią euklidesową.
Ćwiczenie. Sprawdzić, że C 3 ϕ −→ sup
x∈[0,1]
|ϕ(x)| ∈ [0, +∞) jest
normą na przestrzeni wektorowej C wszystkich funkcji ciągłych [0, 1] −→ R.
Dla tej normy oraz ϕ : [0, 1] 3 x −→ x ∈ R i ψ : [0, 1] 3 x −→ 1 − x ∈ R
mamy kϕk = 1, kψk = 1, kϕ + ψk = 1, kϕ − ψk = 1, a więc norma ta nie
spełnia warunku równoległoboku. Dlatego nie może istnieć iloczyn skalarny
na C, od którego by ona pochodziła.
A zatem norma pochodząca od iloczynu skalarnego spełnia warunek rów-
noległoboku. Twierdzenie odwrotne jest również prawdziwe, to znaczy norma
na rzeczywistej przestrzeni wektorowej spełniająca warunek równoległoboku
pochodzi od pewnego iloczynu skalarnego, ale dowód tego faktu jest znacznie
trudniejszy. Stanowi on przedmiot poniższych ćwiczeń.
Ćwiczenie. Udowodnić, że każda norma na przestrzeni wektorowej U,
która spełnia warunek równoległoboku, spełnia także następujący warunek
równoległościanu: dla każdych u, v, w ∈ U
ku + v + wk
2
= ku + vk
2
+ kv + wk
2
+ kw + uk
2
− kuk
2
− kvk
2
− kwk
2
(czyli kwadrat normy przekątnej dowolnego równoległościanu jest różnicą
sum kwadratów norm wychodzących z jednego jej końca przekątnych ścian
oraz krawędzi).
Ćwiczenie. Udowodnić, że jeśli norma na przestrzeni wektorowej U nad
ciałem R spełnia warunek równoległoboku, to istnieje na U iloczyn skalarny,
od którego ta norma pochodzi (to znaczy ta norma i ten iloczyn skalarny są
ze sobą związane zależnością kuk =
√
u · u dla każdego u ∈ U). Wskazówka:
u · v =
1
2
(ku + vk
2
− kuk
2
− kvk
2
) dla u, v ∈ U; addytywność prawej strony
ze względu na jedną zmienną przy dowolnie ustalonej drugiej łatwo wykazać
z warunku równoległościanu; z addytywności wywieść Q-liniowość, a z niej
oraz z gęstości Q w R i ciągłości R-liniowość.
125
Zbiory ortogonalne i ortonormalne
Podzbiór A przestrzeni euklidesowej nazywa się ortogonalnym, gdy każde
dwa jego elementy są do siebie prostopadłe, czyli gdy u · v = 0 dla każdych
u, v ∈ A takich, że u 6= v. Taki ortogonalny podzbiór A nazywa się orto-
normalnym, gdy dodatkowo wszystkie wektory z A mają długość równą 1,
czyli kuk = 1 dla każdego u ∈ A (ta nazwa pochodzi stąd, że unormowaniem
różnego od 0 wektora z przestrzeni unormowanej nazywa się pomnożenie go
przez odwrotność jego normy, a więc wektory unormowane to takie, których
norma jest równa 1).
Ćwiczenie. Udowodnić, że każdy zbiór ortogonalny, którego wszystkie
elementy są różne od 0 (a więc w szczególności każdy zbiór ortonormalny)
jest liniowo niezależny.
Ćwiczenie. W przestrzeni euklidesowej P ciągłych funkcji okresowych
R −→ R o okresie 2π z iloczynem skalarnym ϕ · ψ =
R
2π
0
ϕ(x)ψ(x)dx roz-
ważmy zbiór T złożony z funkcji R 3 x −→ cos kx ∈ R dla k ∈ N oraz
R 3 x −→ sin kx ∈ R dla k ∈ N \ {0}. Sprawdzić, że T jest ortogonalny, ale
nie ortonormalny, i unormować wszystkie jego elementy.
Pojęcia ortogonalności i ortonormalności można oczywiście przenieść ze
zbiorów na ciągi wektorów, a w szczególności na bazy uporządkowane.
Definicja. Baza e
1
, . . . , e
n
przestrzeni euklidesowej jest nazywana bazą
ortonormalną, gdy dla każdych i, j ∈ {1, , . . . , n}
e
i
· e
j
= δ
ij
(jak pamiętamy, δ
ij
to delta Kroneckera równa 1, gdy i = j, a 0, gdy i 6= j).
Przykład. Oczywiście baza kanoniczna przestrzeni euklidesowej R
n
ze
standardowym iloczynem skalarnym jest ortonormalna.
Jak zobaczymy w dalszym ciągu wykładu, wszelkie obliczenia w prze-
strzeniach euklidesowych znacznie się upraszczają, kiedy się je przeprowadza
w bazach ortonormalnych. Stąd ogromne znaczenie tych baz. Z najbliższego
twierdzenia widać na przykład, jak łatwe i eleganckie jest obliczanie w bazie
ortonormalnej współrzędnych wektora.
126
Twierdzenie. Jeżeli baza e
1
, . . . , e
n
przestrzeni euklidesowej jest orto-
normalna, a u = λ
1
e
1
+ . . . + λ
n
e
n
, gdzie λ
1
, . . . , λ
n
∈ R, to dla każdego
i ∈ {1, . . . , n}
λ
i
= u · e
i
.
Dowód: u · e
i
= (λ
1
e
1
+ . . . + λ
n
e
n
) · e
i
= λ
i
.
Przykład. Łatwo sprawdzić, że baza (−
8
9
,
1
9
,
4
9
), (
1
9
, −
8
9
,
4
9
), (
4
9
,
4
9
,
7
9
) w R
3
ze standardowym iloczynem skalarnym jest ortonormalna. Zatem nie trzeba
rozwiązywać układu równań, tylko obliczyć, że (−1, −2, 3) · (−
8
9
,
1
9
,
4
9
) = 2,
(−1, −2, 3) · (
1
9
, −
8
9
,
4
9
) = 3, (−1, −2, 3) · (
4
9
,
4
9
,
7
9
) = 1, po to, by stwierdzić, że
współrzędne wektora (−1, −2, 3) w tej bazie to 2, 3, 1.
Przykład. Wróćmy do przestrzeni euklidesowej P i do jej podzbioru
ortogonalnego T z ostatniego ćwiczenia oraz oznaczmy przez U zbiór orto-
normalny składający się z unormowanych elementów zbioru T . Dla funkcji
ϕ ∈ P liczby rzeczywiste ϕ · ψ, gdzie ψ ∈ U, nazywa się współczynnikami
Fouriera. Funkcje, które należą do lin T nazywa się wielomianami trygonome-
trycznymi. Ponieważ lin T = lin U, to dowolny wielomian trygonometryczny
ϕ jest również kombinacją liniową funkcji z U. Ostatnie twierdzenie mówi,
że współczynniki tej kombinacji liniowej to współczynniki Fouriera ϕ.
Przykład. Obliczymy współczynniki Fouriera funkcji ϕ z P określonej
jednoznacznie przez warunki ϕ(x) = x dla x ∈ [−
π
2
,
π
2
] i ϕ(x) = π − x dla
x ∈ [
π
2
,
3π
2
]. Mamy
R
2π
0
ϕ(x)
1
√
2π
dx = 0,
R
2π
0
ϕ(x)
1
√
π
cos kx dx = 0 dla każdego
k ∈ N\{0},
R
2π
0
ϕ(x)
1
√
π
sin kx dx = 0, gdy k z N\{0} jest parzyste, natomiast
R
2π
0
ϕ(x)
1
√
π
sin kx dx =
4
√
πk
2
sin
kπ
2
, gdy k z N\{0} jest nieparzyste. Zatem ϕ
ma nieskończenie wiele współczynników Fouriera różnych od 0. Nic dziwnego,
przecież nie jest wielomianem trygonometrycznym. Oznaczając k = 2j + 1
możemy współczynnik Fouriera ϕ odpowiadający funkcji
1
√
π
sin(2j + 1)x dla
j ∈ N zapisać w postaci
4(−1)
j
√
π(2j+1)
2
. Ciekawe, że wielomian trygonometryczny
P
n
j=0
4(−1)
j
√
π(2j+1)
2
1
√
π
sin(2j + 1)x dobrze przybliża ϕ, gdy n jest dostatecznie
duże. Można się o tym przekonać rysując przy pomocy jakiegoś programu
komputerowego wykresy tych wielomianów trygonometrycznych dla coraz
większych n i porównując je z wykresem ϕ. Ale ścisły opis tego zjawiska to
już analiza, a nie algebra liniowa.
127
W związku z ostatnim twierdzeniem warto jeszcze dodać, że gdyby baza
e
1
, . . . , e
n
była tylko ortogonalna, to baza
1
ke
1
k
e
1
, . . . ,
1
ke
n
k
e
n
byłaby już orto-
normalna i dla u = λ
1
e
1
+ . . . + λ
n
e
n
oraz każdego i ∈ {1, . . . , n} mielibyśmy
λ
i
=
u · e
i
ke
i
k
2
.
128