algebra wstęp do algebry homomorfizmy, grupy, ciała, pierścienie

WYKŁAD

Z ALGEBRY LINIOWEJ Z GEOMETRIĄ

JACEK DĘBECKI

Przypomnienie definicji ciała

Przypomnijmy, że ciałem nazywa się zbiór K z określonymi na nim dwoma

działaniami K × K 3 (α, β) −→ α + β ∈ K i K × K 3 (α, β) −→ αβ ∈ K,
które spełniają następujące warunki:

1) β + α = α + β dla wszystkich α, β ∈ K (przemienność dodawania),
2) (α+β)+γ = α+(β+γ) dla wszystkich α, β, γ ∈ K (łączność dodawania),
3) istnieje oznaczany przez 0 element zbioru K taki, że dla każdego α ∈ K

α + 0 = α (istnienie zera),

4) dla każdego α ∈ K istnieje oznaczany przez −α element zbioru K taki,

że α + (−α) = 0 (istnienie elementów przeciwnych),

5) βα = αβ dla wszystkich α, β ∈ K (przemienność mnożenia),
6) (αβ)γ = α(βγ) dla wszystkich α, β, γ ∈ K (łączność mnożenia),
7) istnieje oznaczany przez 1 element zbioru K taki, że dla każdego α ∈ K

α1 = α (istnienie jedynki),

8) dla każdego α ∈ K \ {0} istnieje oznaczany przez α

−1

element zbioru K

taki, że αα

−1

= 1 (istnienie elementów odwrotnych do niezerowych),

9) (α + β)γ = αγ + βγ dla wszystkich α, β, γ ∈ K (rozdzielność mnożenia

względem dodawania),

10) 1 6= 0.

Oprócz dodawania i mnożenia w ciele K mamy również odejmowanie

określone wzorem α − β = α + (−β) dla α, β ∈ K i dzielenie określone
wzorem α/β = αβ

−1

dla α ∈ K i β ∈ K \ {0} (nie można dzielić przez 0).

Dobrze znanymi przykładami ciał są: ciało liczb wymiernych Q ze zwy-

kłymi działaniami, ciało liczb rzeczywistych R ze zwykłymi działaniami, ciało
liczb zespolonych C ze zwykłymi działaniami, a ponadto dla każdej liczby
pierwszej p ciało Z

, czyli zbiór {0, . . . , p − 1} z dodawaniem i mnożeniem

modulo p (przypomnijmy, że działania te wykonuje się biorąc resztę z dzie-
lenia przez p zwykłej sumy i zwykłego iloczynu).

Ciało liczb zespolonych

Zbierzemy teraz razem i uporządkujemy podstawowe fakty dotyczące

liczb zespolonych, a przede wszystkim przeprowadzimy formalną konstrukcję
ciała liczb zespolonych wychodząc od ciała liczb rzeczywistych.

Oznaczmy przez C zbiór R

(czyli zbiór par liczb rzeczywistych) i zdefi-

niujmy na tym zbiorze dwa działania

(a, b) + (c, d) = (a + c, b + d),

(a, b)(c, d) = (ac − bd, ad + bc).

Ćwiczenie. Sprawdzić, że C z powyższymi działaniami jest ciałem (w C

0 = (0, 0), −(a, b) = (−a, −b), 1 = (1, 0), (a, b)

−1

= (a/(a

), −b/(a

)),

gdy (a, b) 6= 0).

Tak skonstruowane ciało C nazywa się ciałem liczb zespolonych, a jego

elementy liczbami zespolonym.

Oznaczając

i = (0, 1),

dostajemy i

= (0, 1)(0, 1) = (−1, 0) = −(1, 0), czyli

= −1.

Z tego powodu liczbę zespoloną i nazywa się jednostką urojoną.

Dowolną liczbę rzeczywistą a utożsamia się z liczbą zespoloną (a, 0). Nie

doprowadzi to do żadnych nieporozumień, bo jeśli weźmiemy dwie liczby rze-
czywiste a i b, potraktujemy je jako liczby zespolone (a, 0) i (b, 0), a następnie
obliczymy według powyższych wzorów sumę albo iloczyn tych liczb zespolo-
nych, to otrzymamy (a + b, 0) albo (ab, 0), czyli to samo, co gdybyśmy a i b
dodali albo pomnożyli jako liczby rzeczywiste, a dopiero później otrzymany
wynik potraktowali jako liczbę zespoloną dopisując 0 jako drugi wyraz pary.
Ponadto, jeśli a 6= b, to oczywiście (a, 0) 6= (b, 0). Formalnie można to ująć
mówiąc, że odwzorowanie

R 3 a −→ (a, 0) ∈ C

jest monomorfizmem ciał. W praktyce po prostu zawsze myślimy, że dowolna
liczba rzeczywista jest też liczbą zespoloną, więc R ⊂ C.

Dzięki wprowadzonemu utożsamieniu dla dowolnej liczby zespolonej (a, b)

mamy (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi, zatem dowolną liczbę zespoloną
można zapisać w postaci

a + bi,

gdzie a, b ∈ R. Oczywiście zapis taki jest jednoznaczny (to znaczy jeśli
a + bi = c + di, gdzie a, b, c, d ∈ R, to a = c i b = d)). W praktyce za-
wsze używa się właśnie takiego zapisu. Ułatwia to wykonywanie obliczeń na
liczbach zespolonych, można bowiem przekształcać wyrażenia według reguł
do których jesteśmy przyzwyczajeni, tylko trzeba pamiętać, że i

= −1. Na

przykład mnożenie przebiega tak: (a + bi)(c + di) = ac + adi + bci + bdi

ac + adi + bci − bd = ac − bd + (ad + bc)i.

Dla dowolnej liczby zespolonej a + bi, gdzie a, b ∈ R, definiuje się jej

część rzeczywistą Re (a + bi) = a i część urojoną Im (a + bi) = b oraz liczbę
zespoloną z nią sprzężoną

a + bi = a − bi,

a ponadto wartość bezwzględną (nazywaną też modułem)

|a + bi| =

√

+ b

Zauważmy, że wartość bezwzględna dowolnej liczby zespolonej jest nieujemną
liczbą rzeczywistą i że wartości bezwzględne dowolnej liczby rzeczywistej jako
liczby rzeczywistej i jako liczby zespolonej pokrywają się.

Ćwiczenie. Wykazać, że dla wszystkich p, q ∈ C

1) Re p = (p + p)/2, Im p = (p − p)/(2i),
2) p = p wtedy i tylko wtedy, gdy p ∈ R,
3) p = p,
4) p + q = p + q,
5) p − q = p − q,
6) pq = p q,
7) p/q = p/q, pod warunkiem, że q 6= 0,
8) |p + q| ≤ |p| + |q|,
9) |p − q| ≥ ||p| − |q||,

10) |pq| = |p||q|,
11) |p/q| = |p|/|q|, pod warunkiem, że q 6= 0,
12) |p| = 0 wtedy i tylko wtedy, gdy p = 0,
13) pp = |p|

Ostatnia równość pomaga przy dzieleniu liczb zespolonych. Otóż można

pomnożyć dzielną i dzielnik przez sprzężenie dzielnika: (a + bi)/(c + di) =
(a + bi)(c − di)/((c + di)(c − di)) = (ac + bd + (−ad + bc)i)/(c

+ d

) =

(ac + bd)/(c

+ d

) + ((−ad + bc)/(c

+ d

))i.

Liczby zespolone możemy oczywiście utożsamiać z punktami płaszczyzny,

na której jest wybrany prostokątny układ współrzędnych kartezjańskich (w
tym kontekście nazywa się ją płaszczyzną zespoloną). Liczbie zespolonej a+bi,
gdzie a, b ∈ R, odpowiada punkt o współrzędnych (a, b). Widać, że liczbom
rzeczywistym odpowiadają przy tym punkty osi odciętych. Parze liczb zespo-
lonych wzajemnie ze sobą sprzężonych odpowiadają punkty położone syme-
trycznie względem osi odciętych. Wartość bezwzględna liczby zespolonej to
odległość odpowiadającego jej punktu od początku układu współrzędnych.
Jeśli popatrzeć na liczby zespolone jako na wektory zaczepione w początku
układu współrzędnych o końcach w odpowiadających im punktach, to widać,
że dodawanie i odejmowanie liczb zespolonych jest tym samym co dodawanie
i odejmowanie wektorów.

Ćwiczenie. Dlaczego nierówność 8) z poprzedniego ćwiczenia można

nazwać nierównością trójkąta?

Ciekawsza jest interpretacja geometryczną mnożenia i dzielenia liczb ze-

spolonych. By ją podać, musimy zdefiniować argument liczby zespolonej.

Podzbiór 2πZ = {t ∈ R : ∃

k∈Z

t = 2πk} jest podgrupą grupy abelowej

R ze zwykłym dodawaniem. Jest naturalną rzeczą uważać warstwy z grupy
ilorazowej R/(2πZ) za kąty, dlatego będziemy je nazywać kątami. Ponieważ
funkcje cos : R −→ R i sin : R −→ R są okresowe o okresie 2π, to funkcje
R/(2πZ) 3 t + 2πZ −→ cos t ∈ R i R/(2πZ) 3 t + 2πZ −→ sin t ∈ R są
poprawnie określone. Będziemy je również oznaczać przez cos i sin.

Argumentem niezerowej liczby zespolonej a + bi, gdzie a, b ∈ R, nazywa

się jedyny kąt ϕ spełniający warunki

cos ϕ =

√

+ b

sin ϕ =

√

+ b

Będziemy go oznaczać przez arg(a + bi). Z geometrycznego punktu widzenia
jest to mierzony w radianach kąt skierowany między dodatnią półosią osi
odciętych a odcinkiem łączącym początek układu współrzędnych z punktem
(a, b).

Natychmiastową konsekwencją przyjętych definicji jest równość

p = |p|(cos(arg p) + i sin(arg p))

zachodząca dla p ∈ C \ {0}. Prawą stronę tej równości nazywa się postacią
trygonometryczną niezerowej liczby zespolonej p.

Następne ćwiczenie, w połączeniu z równościami 10) i 11) z ćwiczenia

wcześniejszego oraz postacią trygonometryczną, daje już interpretację geo-
metryczną mnożenia i dzielenia liczb zespolonych.

Ćwiczenie. Wykazać, że dla wszystkich p, q ∈ C \ {0}

arg(pq) = arg p + arg q,

arg(p/q) = arg p − arg q.

Jako wniosek z tego ćwiczenia łatwo uzyskać przez indukcję ze względu

na n ∈ N następujący wzór de Moivre’a

= |p|

(cos(n arg p) + i sin(n arg p))

obowiązujący dla p ∈ C \ {0}.

Na koniec przytoczymy zasadnicze twierdzenie algebry.

Twierdzenie. Ciało liczb zespolonych jest algebraicznie domknięte, czyli

każdy wielomian jednej zmiennej o współczynnikach zespolonych stopnia co
najmniej pierwszego ma pierwiastek zespolony.

Przyjmujemy to twierdzenie bez dowodu. Dość przystępny (choć też nie-

łatwy) dowód, wymagający jedynie podstawowych wiadomości z topologii,
można znaleźć na przykład w podręczniku Gleichgewichta „Algebra”.

Ćwiczenie. Korzystając z zasadniczego twierdzenia algebry udowodnić,

że każdy niezerowy wielomian jednej zmiennej o współczynnikach zespolo-
nych jest iloczynem wielomianów jednej zmiennej o współczynnikach zespo-
lonych stopnia co najwyżej pierwszego.

Ćwiczenie. Korzystając z zasadniczego twierdzenia algebry udowodnić,

że każdy niezerowy wielomian jednej zmiennej o współczynnikach rzeczywi-
stych jest iloczynem wielomianów jednej zmiennej o współczynnikach rzeczy-
wistych stopnia co najwyżej drugiego.

Rozwiązywanie układów równań liniowych metodą Gaussa

Omówimy teraz metodę Gaussa rozwiązywania układów równań liniowych

o współczynnikach z dowolnego ciała K. Pozwala ona rozstrzygnąć, czy dany
układ ma rozwiązania w ciele K i gdy ma, wyznaczyć wszystkie. Metoda ta
polega na przekształcaniu układu za pomocą dwóch operacji elementarnych:
dodawania do któregoś równania innego równania pomnożonego przez do-
wolny element ciała K oraz zamiany dwóch równań miejscami. Oczywiście
te operacje przekształcają układ na układ mu równoważny, czyli mający te
same rozwiązania.

Opiszemy najpierw ogólnie odpowiedni algorytm, a później objaśnimy go

na przykładzie.

Przed rozpoczęciem obliczeń równania należy zapisać jedno pod drugim

w ten sposób, by wyrazy zawierające te same niewiadome stały jeden pod
drugim tworząc kolumny po lewej stronie równań, natomiast wyrazy wolne
stały po prawej stronie.

Algorytm można podzielić na dwie części.
W pierwszej sprowadza się układ do postaci „schodkowej”. Ta część składa

się z tylu kroków, ile jest niewiadomych. W trakcie obliczeń będziemy pod-
kreślać niektóre wyrazy, aby móc się potem do nich odwoływać. Przypuśćmy,
że wykonaliśmy k − 1 kroków i mamy wykonać k-ty. Gdy w k-tej kolumnie
brak niezerowych wyrazów leżących niżej niż wszystkie wyrazy dotychczas
podkreślone, to w k-tym kroku nie robimy nic. W przeciwnym wypadku
oznaczmy przez l numer najwyższego z równań leżących niżej niż wszystkie
wyrazy dotychczas podkreślone. Jeśli l-te równanie ma w k-tej kolumnie
wyraz zerowy, to zamieniamy miejscami równanie l-te i któreś (powiedzmy
pierwsze od góry) spośród równań leżących niżej i mających w k-tej kolumnie
wyraz niezerowy. Dzięki temu l-te równanie będzie już miało w k-tej kolum-
nie wyraz niezerowy, czyli wyraz postaci αx

, gdzie α 6= 0. Podkreślamy

go. Możemy teraz mnożyć l-te równanie przez odpowiednie elementy ciała
K i dodawać do równań leżących poniżej tak, by po takim przekształceniu
miały one w k-tej kolumnie wyrazy zerowe. Oczywiście, jeśli przekształcane
równanie ma w k-tej kolumnie wyraz βx

, to elementem przez który trzeba

pomnożyć l-te równanie jest −β/α.

Po zakończeniu pierwszej części algorytmu pewna ilość ostatnich równań

może mieć zerowe lewe strony. Jeśli choć jedno z nich ma niezerową prawą
stronę, to oczywiste jest, że układ jest sprzeczny, to znaczy nie ma rozwiązań,

i algorytm się kończy. Jeśli natomiast wszystkie takie równania mają również
prawe strony zerowe, to można je zignorować, bo zupełnie nic nie wnoszą do
układu.

W drugiej części wylicza się już łatwo po kolei idąc od dołu do góry nie-

wiadome występujące w podkreślonych wyrazach podstawiając za każdym
razem wartości niewiadomych wcześniej obliczonych. W ten sposób niewia-
dome występujące w podkreślonych wyrazach zostaną wyrażone przez po-
zostałe niewiadome, które traktuje się jako parametry mogące przyjmować
dowolne wartości z ciała K. Jasne jest, że otrzymane wzory dają wszystkie
rozwiązania rozpatrywanego układu.

Przykład. Weźmy następujący układ o współczynnikach rzeczywistych

−2x

−x

= 1,

−4x

+2x

+5x

−x

= 1,

−6x

−2x

= 3,

−x

+2x

−2x

−x

= 0.

Krok pierwszy. Podkreślamy wyraz pierwszego równania w pierwszej ko-

lumnie. Mnożymy pierwsze równanie przez −2 i dodajemy do drugiego, przez
−3 i dodajemy do trzeciego, przez 1 i dodajemy do czwartego. Mamy

−2x

−x

= −1,

−2x

−x

−2x

Krok drugi. Nie robimy nic.
Krok trzeci. Zamieniamy miejscami równania drugie i trzecie

−2x

−x

−2x

= −1,

−x

−2x

po czym podkreślamy wyraz drugiego równania w trzeciej kolumnie. Mno-
żymy drugie równanie przez 0 i dodajemy do trzeciego, przez 1 i dodajemy
do czwartego. Mamy

−2x

−x

−2x

= −1,

−3x

−x

Krok czwarty. Podkreślamy wyraz trzeciego równania w czwartej kolum-

nie. Mnożymy trzecie równanie przez 1 i dodajemy do czwartego. Mamy

−2x

−x

−2x

= −1,

0 =

Krok piąty. Nie robimy nic.
Otrzymany układ ma postać „schodkową”. Widać, że nie jest sprzeczny.

Ignorujemy czwarte równanie i przechodzimy do drugiej części algorytmu.

Wyliczamy x

z trzeciego równania

1
3

(−x

− 1) = −

1
3

−

1
3

Wyliczamy x

z drugiego równania wstawiając za x

wcześniej obliczoną

wartość

= −

1
2

2(−

1
3

−

1
3

) − x

5
6

1
3

Wyliczamy x

z pierwszego równania wstawiając za x

i x

wcześniej

obliczone wartości

= 2x

− (

5
6

1
3

) − (−

1
3

−

1
3

) + x

+ 1 = 2x

1
2

+ 1.

Ostatecznie mamy zatem rozwiązanie w postaci

= 2x

1
2

+1,

5
6

1
3

−

1
3

−

1
3

Jeśli weźmiemy dowolne liczby rzeczywiste x

i x

, wstawimy do tych wzorów

i obliczymy z nich x

, x

, to x

, x

będzie rozwiązaniem

naszego układu. Co więcej, każde rzeczywiste rozwiązanie da się otrzymać w
ten sposób.

Definicja przestrzeni wektorowej

Wprowadzimy teraz kluczowe dla całej algebry liniowej pojęcie przestrzeni

wektorowej.

Definicja. Załóżmy, że K jest dowolnym ciałem. Przestrzenią wektorową

(lub inaczej przestrzenią liniową) nad ciałem K nazywa się zbiór V z dwoma
działaniami – wewnętrznym V × V 3 (u, v) −→ u + v ∈ V i zewnętrznym
K × V 3 (α, u) −→ αu ∈ V , które spełniają następujące warunki:

1) v + u = u + v dla wszystkich u, v ∈ V (przemienność dodawania wekto-

rów),

2) (u + v) + w = u + (v + w) dla wszystkich u, v, w ∈ V (łączność dodawania

wektorów),

3) istnieje oznaczany przez 0 element zbioru V taki, że dla każdego u ∈ V

u + 0 = u (istnienie wektora zerowego),

4) dla każdego u ∈ V istnieje oznaczany przez −u element zbioru V taki,

że u + (−u) = 0 (istnienie wektorów przeciwnych),

5) (α + β)u = αu + βu dla wszystkich α, β ∈ K, u ∈ V (rozdzielność

mnożenia wektorów przez skalary względem dodawania skalarów),

6) α(u + v) = αu + αv dla wszystkich α ∈ K, u, v ∈ V (rozdzielność

mnożenia wektorów przez skalary względem dodawania wektorów),

7) (αβ)u = α(βu) dla wszystkich α, β ∈ K, u ∈ V (łączność mieszana

mnożenia skalarów i wektorów przez skalary),

8) 1u = u dla każdego u ∈ V .

Warto się dokładniej przyjrzeć tej definicji.
Jak widać, elementy ciała K nazywa się w tym kontekście skalarami, a

elementy przestrzeni wektorowej V wektorami.

Wiemy (ze względu na 1)), że element 0 z warunku 3) jest jedyny (dla-

tego nie ma wątpliwości co oznaczyliśmy przez 0). Nazywa się go wektorem
zerowym. Podobnie (ze względu na 1) i 2)) dla każdego u ∈ V element −u
z warunku 4) jest jedyny (dlatego nie ma wątpliwości co oznaczyliśmy przez
−u). Nazywa się go wektorem przeciwnym do u.

Dzięki warunkowi 4) możemy określić również odejmowanie wektorów

wzorem u − v = u + (−v) dla u, v ∈ V .

Warunki 1)–4) mówią dokładnie tyle, że V z dodawaniem wektorów jest

grupą abelową. Nową rzeczą do zapamiętania są więc tylko warunki 5)–8).

Oczywiście, o ile nawiasy nie wskazują inaczej, najpierw wykonuje się

mnożenie wektorów przez skalary, a dopiero później dodawanie lub odejmo-
wanie wektorów.

Ćwiczenie. Udowodnić, że warunek 1) z definicji przestrzeni wektorowej

wynika z pozostałych warunków.

Twierdzenie. Jeśli V jest przestrzenią wektorową nad ciałem K, α ∈ K

oraz u ∈ V , to

1) αu = 0 wtedy i tylko wtedy, gdy α = 0 lub u = 0,
2) (−α)u = −(αu) i α(−u) = −(αu).

Dowód: 0 = 0 + 0 w K, więc 0u = (0 + 0)u = 0u + 0u i po dodaniu −(0u)

do obu stron 0 = (0u + 0u) + (−(0u)) = 0u + (0u + (−(0u))) = 0u + 0 = 0u.
Podobnie 0 = 0 + 0 w V , więc α0 = α(0 + 0) = α0 + α0 i po dodaniu −(α0)
do obu stron 0 = (α0 + α0) + (−(α0)) = α0 + (α0 + (−(α0))) = α0 + 0 = α0.
Natomiast gdy α 6= 0, a 0 = αu, to po pomnożeniu obu stron przez α

−1

mamy 0 = α

−1

0 = α

−1

(αu) = (α

−1

α)u = 1u = u, co kończy dowód 1).

αu + (−α)u = (α + (−α))u = 0u = 0, więc z jednoznaczności wektora

przeciwnego (−α)u = −(αu). Podobnie αu+α(−u) = α(u+(−u)) = α0 = 0,
więc z jednoznaczności wektora przeciwnego −α(−u) = −(αu), co kończy
dowód 2).

Zwróćmy uwagę, że dzięki warunkowi 2) można pisać wyrażenie −αu bez

żadnych nawiasów, a oprócz tego mamy użyteczną równość −u = (−1)u.

Podstawowe przykłady przestrzeni wektorowych

O wektorach była mowa na geometrii w szkole. I w istocie zbiór wszyst-

kich zaczepionych w jednym wyróżnionym punkcie wektorów na płaszczyźnie
albo w przestrzeni ze znanymi z geometrii działaniami dodawania wektorów i
mnożenia wektorów przez liczby rzeczywiste jest przestrzenią wektorową nad
ciałem liczb rzeczywistych. Można się o tym przekonać rysując odpowiednie
obrazki. Ale ścisły dowód wymagałby ścisłego ujęcia geometrii poczynając
od pojęć pierwotnych i aksjomatów. My postąpimy inaczej. Dojdziemy do
geometrii od algebry. Warto jednak od samego początku mieć w pamięci ob-
raz wektorów na płaszczyźnie i w przestrzeni, bo są one najlepszym źródłem
intuicji w algebrze liniowej.

Przejdźmy do przykładów już całkiem formalnych. Pierwszy z nich jest

najważniejszy.

Przykład. Niech K będzie ciałem, a n ∈ N. Zbiór K

z działaniami

, . . . , a

) + (b

, . . . , b

) = (a

+ b

, . . . , a

+ b

α(a

, . . . , a

) = (αa

, . . . , αa

)

jest przestrzenią wektorową nad K (w K

0 = (0, . . . , 0) oraz −(a

, . . . , a

) =

(−a

, . . . , −a

)).

Zauważmy, że gdy K = R, a n = 2 albo 3, to przestrzeń wektorową

z tego przykładu można utożsamiać ze wspomnianą wcześniej przestrzenią
wektorową zaczepionych w jednym wyróżnionym punkcie wektorów na płasz-
czyźnie albo w przestrzeni pod warunkiem, że wybierze się układ współrzęd-
nych kartezjańskich o początku w tym punkcie (dowolny wektor (a

, . . . , a

)

z R

albo R

odpowiada wtedy wektorowi na płaszczyźnie albo w przestrzeni

o początku w wyróżnionym punkcie i końcu w punkcie o współrzędnych
(a

, . . . , a

); ważne, że działania wykonywane „arytmetycznie” (czyli według

powyższych wzorów) i „geometrycznie” dają ten sam wynik).

Przykład. Niech K będzie ciałem, a X dowolnym zbiorem. Zbiór K

(czyli zbiór wszystkich funkcji X −→ K) z działaniami określonymi wzorami

(ϕ + ψ)(x) = ϕ(x) + ψ(x),

(αϕ)(x) = α ϕ(x)

dla ϕ, ψ ∈ K

, α ∈ K, x ∈ X, jest przestrzenią wektorową nad K (w K

0 : X 3 x −→ 0 ∈ K, −ϕ : X 3 x −→ −ϕ(x) ∈ K).

Przykład. Niech K będzie podciałem ciała L. Wówczas L ze swoim do-

dawaniem i obciętym do K×L swoim mnożeniem jest przestrzenią wektorową
nad K.

Ćwiczenie. Sprawdzić że zbiory z działaniami opisane w powyższych

trzech przykładach rzeczywiście są przestrzeniami wektorowymi.

Podprzestrzenie przestrzeni wektorowej

Definicja. Podzbiór P przestrzeni wektorowej V nad ciałem K nazywa

się jej podprzestrzenią, gdy działania dodawania wektorów i mnożenia wekto-
rów przez skalary można zawęzić z V do P i P z tymi zawężonymi działaniami
jest przestrzenią wektorową nad K.

W praktyce, aby sprawdzić, czy podzbiór przestrzeni wektorowej jest jej

podprzestrzenią, stosuje się następujące twierdzenie.

Twierdzenie. Podzbiór P przestrzeni wektorowej V nad ciałem K jest

jej podprzestrzenią wtedy i tylko wtedy, gdy spełnia następujące warunki

1) 0 ∈ P ,
2) dla wszystkich u, v ∈ P u + v ∈ P ,
3) dla wszystkich α ∈ K, u ∈ P αu ∈ P .

Dowód: Warunki 2) i 3) mówią dokładnie tyle, że działania można za-

węzić z V do P . Gdy P z tymi zawężonymi działaniami jest przestrzenią
wektorową, to P 6= ∅, czyli istnieje u ∈ P , i z 3) 0 = 0u ∈ P . Odwrotnie,
gdy zachodzą 1), 2), 3), to P z zawężonymi działaniami jest przestrzenią
wektorową, ponieważ dla każdego u ∈ P z 3) −u = (−1)u ∈ P . Tym samym
dowód jest zakończony.

Oczywiście podzbiory {0} i V dowolnej przestrzeni wektorowej V są jej

podprzestrzeniami. Podprzestrzenie te nazywa się niewłaściwymi, wszystkie
inne zaś właściwymi.

Zastanówmy się teraz nad geometrycznym sensem pojęcia podprzestrzeni.

Otóż w przestrzeni wektorowej złożonej ze wszystkich zaczepionych w jed-
nym wyróżnionym punkcie wektorów na płaszczyźnie każda podprzestrzeń
właściwa składa się z tych wektorów, które leżą na jednej prostej przechodzą-
cej przez wyróżniony punkt. Natomiast w przestrzeni wektorowej złożonej ze
wszystkich zaczepionych w jednym wyróżnionym punkcie wektorów w prze-
strzeni są dwa rodzaje podprzestrzeni właściwych: każda taka podprzestrzeń
składa się z tych wektorów, które leżą albo na jednej prostej przechodzą-
cej przez wyróżniony punkt, albo na jednej płaszczyźnie przechodzącej przez
wyróżniony punkt.

Ze względu na wspomnianą wcześniej możliwość przejścia do R

albo R

poprzez wybór odpowiedniego układu współrzędnych na płaszczyźnie albo
w przestrzeni podprzestrzenie występujące w dwóch kolejnych ćwiczeniach
mają intepretację geometryczną (zauważmy, że pojawiają się tam znane
ze szkoły równania parametryczne i ogólne przechodzących przez początek
układu współrzędnych prostych na płaszczyźnie oraz prostych i płaszczyzn
w przestrzeni).

Ćwiczenie. Sprawdzić, że następujące podzbiory przestrzeni wektorowej

są jej podprzestrzeniami

1) {(x, y) ∈ R

: ∃

λ∈R

x = 2λ, y = 7λ},

2) {(x, y) ∈ R

: 7x − 2y = 0}.

Ćwiczenie. Sprawdzić, że następujące podzbiory przestrzeni wektorowej

są jej podprzestrzeniami

1) {(x, y, z) ∈ R

: ∃

λ∈R

x = 3λ, y = −λ, z = 5λ},

2) {(x, y, z) ∈ R

: x + 8y + z = 0, 3x + 4y − z = 0},

3) {(x, y, z) ∈ R

: ∃

λ,µ∈R

x = 3λ + 2µ, y = 2λ + 3µ, z = λ + 2µ},

4) {(x, y, z) ∈ R

: x − 4y + 5z = 0}.

Poniższe proste przykłady pokazują, że przestrzenie wektorowe można

spotkać w topologii i analizie.

Przykład. Podzbiór przestrzeni wektorowej R

[0,1]

złożony z funkcji cią-

głych jest jej podprzestrzenią.

Przykład. Podzbiór przestrzeni wektorowej R

złożony z funkcji róż-

niczkowalnych jest jej podprzestrzenią.

Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Sprawdzić,

że podzbiór przestrzeni wektorowej K

złożony z funkcji, które przyjmują

wartości różne od 0 tylko dla skończonej ilości argumentów, jest jej podprze-
strzenią. Dla jakiego zbioru X ta podprzestrzeń jest właściwa?

Podprzestrzenie generowane przez zbiory

Ćwiczenie. Wykazać, że jeśli P

dla i ∈ I są podprzestrzeniami prze-

strzeni wektorowej V , to

i∈I

również jest podprzestrzenią V .

Definicja. Niech A będzie podzbiorem przestrzeni wektorowej V . Pod-

przestrzenią generowaną przez A nazywa się najmniejszą podprzestrzeń prze-
strzeni V zawierającą A (czyli taką podprzestrzeń P zawierającą A, że każda
podprzestrzeń zawierająca A zawiera P ). Z ostatniego ćwiczenia widać, że
podprzestrzeń generowana przez A istnieje, jest nią bowiem część wspólna
wszystkich podprzestrzeni zawierających A. Podprzestrzeń generowaną przez
A będziemy oznaczać przez lin A.

Ćwiczenie. Wykazać, że dla dowolnych podzbiorów A i B przestrzeni

wektorowej

1) lin A = A wtedy i tylko wtedy, gdy A jest podprzestrzenią,
2) lin (lin A) = lin A,
3) jeśli A ⊂ B, to lin A ⊂ lin B,
4) lin (A ∩ B) ⊂ (lin A) ∩ (lin B),
5) lin (A ∪ B) = lin ((lin A) ∪ (lin B)).

Jeżeli V jest przestrzenią wektorową nad ciałem K, λ

, . . . , λ

∈ K i

, . . . , v

∈ V , to wyrażenie λ

+ . . . + λ

(i jego wartość) nazywa się

kombinacją liniową wektorów v

, . . . , v

o współczynnikach λ

, . . . , λ

Twierdzenie. Niech A będzie podzbiorem przestrzeni wektorowej V nad

ciałem K. Podprzestrzeń generowana przez A to zbiór wszystkich kombinacji
liniowych λ

+ . . . + λ

, gdzie n ∈ N, λ

, . . . , λ

∈ K, v

, . . . , v

∈ A.

Dowód: Oznaczmy przez L zbiór kombinacji liniowych, o których mowa

w twierdzeniu. Wtedy A ⊂ L (bo u = 1u dla każdego u ∈ A) i z poprzed-
niego twierdzenia wynika, że L jest podprzestrzenią, zatem lin A ⊂ L. Ale z
tamtego twierdzenia widać też, że musi być L ⊂ lin A.

Przykład. Podprzestrzeń generowana przez zbiór {(5, 6, 1), (2, 3, 4)} w

składa się z kombinacji liniowych λ(5, 6, 1) + µ(2, 3, 4), gdzie λ, µ ∈ R,

czyli jest równa {(x, y, z) ∈ R

: ∃

λ,µ∈R

x = 5λ+2µ, y = 6λ+3µ, z = λ+4µ}.

Definicja. Gdy przestrzeń wektorowa V jest generowana przez swój

podzbiór A, czyli gdy lin A = V , to mówi się, że A generuje V , a A nazywa
się zbiorem generatorów przestrzeni V . Gdy ponadto A = {a

, . . . , a

}, to

mówi się też, że a

, . . . , a

generują V .

Liniowa niezależność

Pojęcie liniowej niezależności (a później także bazy) zdefiniujemy w dwóch

różnych sytuacjach. Najpierw dla ciągów wektorów (ograniczymy się tylko
do ciągów skończonych), a następnie dla dowolnych zbiorów wektorów.

Definicja. Niech V będzie przestrzenią wektorową nad ciałem K, a

, . . . , v

∈ V . Mówi się, że ciąg v

, . . . , v

jest liniowo niezależny, gdy dla

dowolnych λ

, . . . , λ

∈ K zachodzi implikacja

+ . . . + λ

= 0 =⇒ λ

= 0, . . . , λ

= 0.

W przeciwnym przypadku nazywa się go liniowo zależnym (mówi się też, że
liniowo niezależne lub zależne są wektory, mając na myśli ciąg, który tworzą).

Przykład. Wektory (1, 3, 2), (2, 5, 1), (3, 8, 4) z R

są liniowo niezależne.

Istotnie, gdy α, β, γ ∈ R są takie, że α(1, 3, 2) + β(2, 5, 1) + γ(3, 8, 4) = 0, to
spełniają układ równań α + 2β + 3γ = 0, 3α + 5β + 8γ = 0, 2α + β + 4γ = 0.
Wystarczy go rozwiązać, by się przekonać, że musi być α = 0, β = 0, γ = 0.

Przykład. Wektory (1, 2, 2), (2, 5, 3), (2, 1, 7) z R

są liniowo zależne, bo

8(1, 2, 2) − 3(2, 5, 3) − (2, 1, 7) = 0.

Oczywiście jeden wektor w dowolnej przestrzeni wektorowej jest liniowo

zależny wtedy i tylko wtedy, gdy jest zerowy.

W przestrzeni wektorowej złożonej z zaczepionych w jednym wyróżnio-

nym punkcie wektorów na płaszczyźnie lub w przestrzeni dwa wektory są
liniowo zależne wtedy i tylko wtedy, gdy leżą na jednej prostej przechodzą-
cej przez wyróżniony punkt. Natomiast trzy wektory w są liniowo zależne
wtedy i tylko wtedy, gdy leżą na jednej płaszczyźnie przechodzącej przez
wyróżniony punkt.

Twierdzenie. Wektory v

, . . . , v

są liniowo zależne wtedy i tylko wtedy,

gdy któryś z nich jest kombinacją liniową pozostałych.

Dowód: Gdy λ

+ . . . + λ

= 0 i na przykład λ

6= 0, to mamy

= (−λ

/λ

+. . .+(−λ

k−1

/λ

k−1

+(−λ

k+1

/λ

k+1

+. . .+(−λ

/λ

Natomiast gdy na przykład v

= µ

+. . .+µ

k−1

+µ

k+1

+. . .+µ

to µ

+ . . . + µ

k−1

+ (−1)v

+ µ

k+1

+ . . . + µ

= 0 i −1 6= 0.

Definicja. Mówi się, że podzbiór A przestrzeni wektorowej jest liniowo

niezależny, gdy dla każdego n ∈ N i każdych v

, . . . , v

∈ A, takich że v

6= v

o ile i 6= j, ciąg v

, . . . , v

jest liniowo niezależny. W przeciwnym przypadku

podzbiór ten nazywa się liniowo zależnym.

Wprost z definicji widać, że każdy podzbiór zbioru liniowo niezależnego

również jest liniowo niezależny.

Ćwiczenie. Wykazać, że ciąg v

, . . . , v

jest liniowo niezależny wtedy

i tylko wtedy, gdy jest różnowartościowy i zbiór {v

, . . . , v

} jest liniowo

niezależny.

Ćwiczenie. Wykazać, że podzbiór A przestrzeni wektorowej jest liniowo

zależny wtedy i tylko wtedy, gdy istnieje taki u ∈ A, że u ∈ lin (A \ {u}).

Ćwiczenie. Wykazać, że jeśli A jest liniowo niezależnym podzbiorem

przestrzeni wektorowej V , a u ∈ V \ (lin A), to zbiór A ∪ {u} również jest
liniowo niezależny.

Bazy przestrzeni wektorowej

Jak już nadmieniliśmy, przez bazę przestrzeni wektorowej można rozumieć

zarówno ciąg wektorów (ograniczymy się tylko do ciągów skończonych), jak
i zbiór wektorów. Zdefiniujemy kolejno oba te pojęcia.

Definicja. Niech V będzie przestrzenią wektorową, a v

, . . . , v

∈ V .

Ciąg v

, . . . , v

nazywa się bazą przestrzeni V , gdy jest liniowo niezależny i

zbiór {v

, . . . , v

} generuje V .

Przykład. Niech K będzie ciałem, a n ∈ N. Wektory

(1, 0, . . . , 0), . . . , (0, . . . , 0, 1)

tworzą bazę przestrzeni wektorowej K

(baza ta składa się z n wektorów

i dla każdego i ∈ {1, . . . , n} jej i-ty wektor ma na i-tym miejscu 1, a na
pozostałych 0). Nazywamy ją bazą kanoniczną.

Ćwiczenie. Sprawdzić, że baza kanoniczna rzeczywiście jest bazą.

Poniższe twierdzenie ukazuje istotę pojęcia bazy.

Twierdzenie. Niech V będzie przestrzenią wektorową nad ciałem K, a

, . . . , v

∈ V . Ciąg v

, . . . , v

jest bazą przestrzeni V wtedy i tylko wtedy,

gdy każdy wektor z V ma jednoznaczne przedstawienie w postaci kombinacji
liniowej wektorów v

, . . . , v

, czyli gdy zachodzą warunki

1) dla każdego u ∈ V istnieją λ

, . . . , λ

∈ K takie, że u = λ

+. . .+λ

2) dla dowolnych λ

, . . . λ

, µ

, . . . , µ

∈ K zachodzi implikacja

+ . . . + λ

= µ

+ . . . + µ

=⇒ λ

= µ

, . . . , λ

= µ

Dowód: Oczywiście 1) oznacza dokładnie tyle, że v

, . . . , v

generują V .

Wykażemy, że warunek 2) jest równoważny liniowej niezależności v

, . . . , v

Faktycznie, przyjmując w 2) µ

= 0, . . . , µ

= 0 dostajemy liniową niezależ-

ność v

, . . . , v

. Natomiast gdy są one liniowo niezależne, to z poprzednika

implikacji z 2), który można zapisać jako (λ

− µ

+ . . . + (λ

− µ

= 0,

wynika że λ

− µ

= 0, . . . , λ

− µ

= 0, czyli następnik tej implikacji.

Definicja. Niech ciąg v

, . . . , v

będzie bazą przestrzeni wektorowej V , a

u ∈ V . Współrzędnymi wektora u w bazie v

, . . . , v

nazywa się jedyny ciąg

skalarów λ

, . . . , λ

taki, że u = λ

+ . . . + λ

Przykład. W przestrzeni wektorowej R

współrzędne wektora (2, 1, 7) w

bazie (1, 2, 3), (2, 3, 4), (1, 1, 2) są równe 3, −4, 7, ponieważ zachodzi równość
(2, 1, 7) = 3(1, 2, 3) − 4(2, 3, 4) + 7(1, 1, 2).

Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Wykazać, że współrzędne

dowolnego wektora (a

, . . . , a

) z K

w bazie kanonicznej to a

, . . . , a

Przejdźmy teraz do baz rozumianych jako zbiory wektorów.

Definicja. Podzbiór przestrzeni wektorowej nazywa się jej bazą, gdy jest

liniowo niezależny i generuje tę przestrzeń.

Widać od razu, że ciąg v

, . . . , v

jest bazą przestrzeni wektorowej wtedy

i tylko wtedy, gdy jest różnowartościowy i zbiór {v

, . . . , v

} jest bazą tej

przestrzeni.

Kolejne ćwiczenie daje nam dla dowolnego zbioru przykład przestrzeni

wektorowej o bazie równolicznej z tym zbiorem.

Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Wykazać,

że zbiór funkcji ϕ

: X −→ K zdefiniowanych dla a ∈ X wzorem

(x) =

1, gdy x = a,
0, gdy x 6= a

jest bazą przestrzeni wektorowej złożonej z funkcji X −→ K, które przyjmują
wartości różne od 0 tylko dla skończonej ilości argumentów.

Przeniesiemy teraz ostatnie twierdzenie i związaną z nim definicję współ-

rzędnych wektora na bazy będące podzbiorami (niekoniecznie skończonymi)
przestrzeni wektorowej.

Niech V będzie przestrzenią wektorową nad ciałem K, a A ⊂ V . Jeśli

λ : A −→ K przyjmuje wartości różne od 0 tylko dla skończonej ilości argu-
mentów, to ma sens suma

v∈A

v, gdzie λ

oznacza λ(v). Rzeczywiście,

nawet gdy A jest nieskończony, to suma ta ma właściwie skończoną ilość
składników, bo składniki równe 0 można pominąć.

Ćwiczenie. Wykazać, że podzbiór A przestrzeni wektorowej V nad cia-

łem K jest jej bazą wtedy i tylko wtedy, gdy dla każdego u ∈ V istnieje
dokładnie jedna funkcja λ : A −→ K, która przyjmuje wartości różne od 0
tylko dla skończonej ilości argumentów i dla której u =

v∈A

Widać więc, że funkcja λ : A −→ K, która przyjmuje wartości różne od 0

tylko dla skończonej ilości argumentów i dla której u =

v∈A

v, pełni rolę

współrzędnych wektora u w bazie A.

Przykład. Niech K będzie ciałem. Zbiór A jednomianów X

dla i ∈ N

jest bazą przestrzeni wektorowej K[X] nad K z oczywistymi działaniami.
Ponieważ mamy naturalną bijekcję pomiędzy A a N (jednomianowi X

od-

powiada i), to naturalniej jest zamiast

∈A

pisać

i∈N

, gdzie

oznacza λ

, i w konsekwencji zamiast funkcji λ : A −→ K za współrzędne

wielomianu w tej bazie uważać funkcję λ : N −→ K, czyli ciąg λ

, λ

, . . . ,

gdzie λ

oznacza λ(i). Zatem jest tak, jak powinno być: współrzędne dowol-

nego wielomianu z K[X] w bazie A to po prostu jego współczynniki.

W świetle ostatniego przykładu jest jasne, że współrzędne dowolnego

wektora w bazie będącej zbiorem skończonym (powiedzmy n-elementowym)
można uważać za wcześniej omówione współrzędne w bazie będącej ciągiem,
ale oczywiście pod warunkiem, że ustawi się wyrazy tego zbioru w ciąg róż-
nowartościowy, czyli ustali się bijekcję pomiędzy tym zbiorem a {1, . . . , n}.

Twierdzenie o istnieniu bazy przestrzeni wektorowej

Korzystając z lematu Kuratowskiego-Zorna, czyli pośrednio z pewnika

wyboru, udowodnimy teraz, że każda przestrzeń wektorowa posiada bazę.

Przypomnijmy, że dowolna relacja ≤ w dowolnym zbiorze X nazywa się

częściowym porządkiem, gdy spełnia następujące warunki:

1) x ≤ x dla każdego x ∈ X (zwrotność),
2) dla każdych x, y ∈ X jeśli x ≤ y i y ≤ x, to x = y (antysymetryczność),
3) dla każdych x, y, z ∈ X jeśli x ≤ y i y ≤ z, to x ≤ z (przechodniość).

Częściowy porządek w X nazywa się porządkiem, gdy dodatkowo

4) dla każdych x, y ∈ X x ≤ y lub y ≤ x (spójność).

Znanymi przykładami częściowego porządku są relacja inkluzji w dowolnej

rodzinie podzbiorów jednego zbioru oraz relacja podzielności w N \ {0}, a
przykładem porządku relacja zwykłej nierówności w R.

Załóżmy, że relacja ≤ jest częściowym porządkiem w X. Jeśli P ⊂ X,

to P nazywa się łańcuchem, gdy dla każdych x, y ∈ P x ≤ y lub y ≤ x
(czyli relacja ≤ zawężona do P jest porządkiem). Jeśli P ⊂ X i p ∈ X, to p
nazywa się majorantą zbioru P , gdy x ≤ p dla każdego x ∈ P . Jeśli p ∈ X,
to p nazywa się elementem maksymalnym, gdy dla każdego x ∈ X z tego, że
p ≤ x wynika, że p = x.

Przyjmując pewnik wyboru można udowodnić prawdziwość następującego

lematu Kuratowskiego-Zorna.

Lemat. Jeśli w zbiorze z częściowym porządkiem każdy łańcuch posiada

majorantę, to istnieje w tym zbiorze element maksymalny.

Twierdzenie. Jeśli V jest przestrzenią wektorową, A jej liniowo nieza-

leżnym podzbiorem, C zbiorem jej generatorów i A ⊂ C, to istnieje taka baza
B przestrzeni V , że A ⊂ B ⊂ C.

Dowód: Oznaczmy przez R rodzinę wszystkich liniowo niezależnych pod-

zbiorów D przestrzeni V spełniających warunek A ⊂ D ⊂ C. Oczywiście
relacja inkluzji jest częściowym porządkiem w R. Niech P będzie łańcuchem
w R. Gdy P = ∅, to A jest majorantą P . W przeciwnym wypadku defi-
niujemy E =

D∈P

D. Pokażemy, że E ∈ R, a wtedy będzie jasne, że E

jest majorantą P . Od razu widać, że A ⊂ E ⊂ C, więc wystarczy pokazać
liniową niezależność E. Weźmy różnowartościowy ciąg v

, . . . , v

wektorów

z E. Musimy pokazać, że jest on liniowo niezależny. Z definicji E istnieją
D

, . . . , D

∈ P takie, że v

∈ D

, . . . , v

∈ D

. Ale P jest łańcuchem,

czyli dla dowolnych i, j ∈ {1, . . . , n} D

⊂ D

lub D

⊂ D

. Stąd wynika

istnienie takiego k ∈ {1, . . . , n}, że D

⊂ D

, . . . , D

⊂ D

. To pokazuje,

że v

, . . . , v

∈ D

i z liniowej niezależności D

mamy liniową niezależność

, . . . , v

. A zatem sprawdziliśmy, że R z relacją inkluzji spełnia założenia

lematu Kuratowskiego-Zorna.

Na podstawie tezy tego lematu istnieje element B maksymalny w R i z

definicji R widać, że dowód twierdzenia będzie zakończony, gdy wykażemy,
że B jest zbiorem generatorów przestrzeni V . Przypuśćmy dla dowodu nie
wprost, że lin B 6= V . Wtedy nie może być C ⊂ lin B, bo inaczej mielibyśmy
V = lin C ⊂ lin (lin B) = lin B, czyli lin B = V . Zatem istnieje u ∈ C \ lin B.
Wiemy, że w takiej sytuacji zbiór B ∪ {u} jest liniowo niezależny. Ponadto
oczywiście A ⊂ B ∪ {u} ⊂ C, więc (B ∪ {u}) ∈ P . Ale to jest sprzeczne z
maksymalnością B, bo B ⊂ B ∪ {u}, a B 6= B ∪ {u}.

Biorąc w ostatnim twierdzeniu kolejno C = V , A = ∅ oraz A = ∅ i C = V

dostajemy trzy następujące wnioski.

Wniosek. Jeżeli A jest liniowo niezależnym podzbiorem przestrzeni wek-

torowej, to istnieje taka baza B tej przestrzeni, że A ⊂ B.

Wniosek. Jeżeli B jest zbiorem generatorów przestrzeni wektorowej, to

istnieje taka baza B tej przestrzeni, że B ⊂ C.

Wniosek. Każda przestrzeń wektorowa posiada bazę.

Przykład. Niestety, nikt nie widział bazy przestrzeni wektorowej R nad

ciałem Q, choć udowodniliśmy, że przynajmniej jedna istnieje. Takie rzeczy
się zdarzają, kiedy używa się w dowodach pewnika wyboru.

Wymiar przestrzeni wektorowej

Udowodnimy najpierw lemat Steinitza o wymianie.

Lemat. Niech V będzie przestrzenią wektorową nad ciałem K, a

, . . . , a

liniowo niezależnym ciągiem wektorów z V , a C zbiorem generatorów prze-
strzeni V . Wtedy istnieją takie c

, . . . , c

∈ C, że c

6= c

o ile i 6= j, oraz że

(C \ {c

, . . . , c

}) ∪ {a

, . . . , a

} jest zbiorem generatorów przestrzeni V .

Dowód: Stosujemy indukcję względem n. Gdy n = 0, to teza lematu

jest trywialna. Załóżmy, że lemat jest prawdziwy dla n − 1, gdzie n 6= 0,
czyli istnieje taki różnowartościowy ciąg c

, . . . , c

n−1

wektorów z C, że zbiór

(C \ {c

, . . . , c

n−1

}) ∪ {a

, . . . , a

n−1

} generuje V . W szczególności mamy

= λ

+ . . . + λ

+ µ

+ . . . + µ

n−1

dla pewnego różnowar-

tościowego ciągu d

, . . . , d

wektorów z C \ {c

, . . . , c

n−1

} oraz pewnych

. . . , λ

, µ

, . . . , µ

n−1

∈ K. Z liniowej niezależności a

, . . . , a

wynika, że

6= 0 dla pewnego k ∈ {1, . . . , m}. Przyjmijmy c

= d

. Jest oczywiste,

że wówczas c

∈ C, ciąg c

, . . . , c

jest różnowartościowy, a ponadto c

(−λ

/λ

+ . . . + (−λ

k−1

/λ

k−1

+ (−λ

k+1

/λ

k+1

+ . . . + (−λ

/λ

(−µ

/λ

+ . . . + (−µ

n−1

/λ

n−1

+ (1/λ

. Pozostało tylko wykazać, że

(C \ {c

, . . . , c

}) ∪ {a

, . . . , a

} generuje V . Jest tak rzeczywiście, ponieważ

dowolny wektor z V można zapisać w postaci kombinacji liniowej wektorów
z (C \ {c

, . . . , c

n−1

}) ∪ {a

, . . . , a

n−1

}, a następnie wstawić do tej kombinacji

za c

(o ile c

w niej występuje) prawą stronę wyprowadzonej równości. To

kończy dowód.

Twierdzenie. Gdy przestrzeń wektorowa ma bazę skończoną, to wszyst-

kie jej bazy są skończone i mają po tyle samo elementów.

Dowód: Niech A będzie dowolną bazą rozważanej przestrzeni, zaś C jej

bazą skończoną, powiedzmy m-elementową. Gdyby zbiór A miał więcej niż
m elementów, to zawierałby różnowartościowy ciąg a

, . . . , a

m+1

. Ciąg ten

byłby liniowo niezależny na podstawie liniowej niezależności A. Z lematu
Steinitza wynikałoby wówczas, że C zawiera różnowartościowy ciąg (m + 1)-
elementowy, co przeczyłoby m-elementowości C. Zatem A nie może mieć
więcej niż m elementów, to znaczy jest skończony i ma co najwyżej tyle ele-
mentów co C. Powtarzając to samo rozumowanie, ale z A i C zamienionymi
miejscami, dostajemy równoliczność A i C, co kończy dowód.

Definicja. Przestrzeń wektorową posiadająca skończoną bazę nazywamy

skończenie wymiarową, a ilość elementów dowolnej jej bazy jej wymiarem
(ostatnie twierdzenie gwarantuje nam poprawność takiej definicji). Wymiar
przestrzeni skończenie wymiarowej V będziemy oznaczać przez dim V .

Zgodnie z intuicją przestrzeń wektorowa zaczepionych w jednym punkcie

wektorów na płaszczyźnie ma wymiar 2, a w przestrzeni 3.

Przykład. Niech K będzie ciałem, a n ∈ N. Przestrzeń wektorowa K

jest n-wymiarowa.

Przykład. Niech K będzie ciałem. Przestrzeń wektorowa K[X] nie jest

skończenie wymiarowa.

Twierdzenie. Jeżeli P jest podprzestrzenią skończenie wymiarowej prze-

strzeni wektorowej V , to P też jest skończenie wymiarowa i dim P ≤ dim V ,
przy czym dim P = dim V wtedy i tylko wtedy, gdy P = V .

Dowód: Dla bazy A przestrzeni P istnieje taka baza B przestrzeni V , że

A ⊂ B. Skoro B jest skończona, to A też, i widać, że dim P ≤ dim V . Jeżeli
dim P = dim V , to A = B i P = lin A = lin B = V .

Ćwiczenie. Udowodnić bez korzystania z lematu Kuratowskiego-Zorna,

że jeśli V jest skończenie wymiarową przestrzenią wektorową, A jej liniowo
niezależnym podzbiorem, C zbiorem jej generatorów i A ⊂ C, to istnieje taka
baza B przestrzeni V , że A ⊂ B ⊂ C.

Ćwiczenie. Wykazać, że jeśli V jest przestrzenią wektorową skończonego

wymiaru n, a v

, . . . , v

∈ V , to następujące warunki są równoważne:

1) v

, . . . , v

są liniowo niezależne,

2) v

, . . . , v

generują V ,

3) v

, . . . , v

tworzą bazę V .

Ćwiczenie. Udowodnić, że gdy przestrzeń wektorowa ma bazę przeli-

czalną, to wszystkie jej bazy są przeliczalne (wskazówka: jeśli v

, v

, . . .

tworzą przeliczalną bazę rozważanej przestrzeni, a B jest dowolną jej bazą, to
B =

n∈N

(B ∩ lin {v

, . . . , v

}) i dla każdego n ∈ N zbiór B ∩ lin {v

, . . . , v

}

jest skończony).

Odwzorowania liniowe

Definicja. Niech U i V będą przestrzeniami wektorowymi nad ciałem K.

Odwzorowanie f : U −→ V nazywa się liniowym, gdy spełnia następujące
warunki:

1) f (u + v) = f (u) + f (v) dla wszystkich u, v ∈ U,
2) f (αu) = αf (u) dla wszystkich α ∈ K, u ∈ U.

Własność odwzorowania f opisaną przez warunek 1) z powyższej definicji

nazywa się addytywnością, a przez warunek 2) jednorodnością.

Widać, że odwzorowanie liniowe można by też nazwać homomorfizmem

przestrzeni wektorowych. Mają tu zastosowanie również inne nazwy znane
z teorii grup i pierścieni: liniowa injekcja to monomorfizm, liniowa surjekcja
to epimorfizm, liniowa bijekcja to izomorfizm, odwzorowanie liniowe, którego
dziedzina i przeciwdziedzina są takie same, nazywa się endomorfizmem, a
gdy ponadto jest bijekcją, to nazywa się automorfizmem.

Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, to f (0) = 0 i

f (−u) = −f (u) dla każdego u ∈ U.

Rozpatrzmy kilka przykładów.

Ćwiczenie. Sprawdzić liniowość odwzorowania

3 (x, y, z) −→ (2x − 5y + z, x + 3y + 4z) ∈ R

Ćwiczenie. Niech K będzie ciałem, a X dowolnym zbiorem. Sprawdzić,

że dla każdego a ∈ X odwzorowanie K

3 ϕ −→ ϕ(a) ∈ K jest liniowe.

Przykład. Niech C oznacza przestrzeń wektorową wszystkich funkcji

ciągłych [0, 1] −→ R. Odwzorowanie C 3 ϕ −→

ϕ(x)dx ∈ R jest liniowe.

Przykład. Niech R oznacza przestrzeń wektorową wszystkich funkcji

różniczkowalnych R −→ R. Odwzorowanie R 3 ϕ −→ ϕ

∈ R

jest liniowe.

Zbiór wszystkich odwzorowań liniowych U −→ V , gdzie U i V są prze-

strzeniami wektorowymi nad ciałem K, będziemy oznaczać przez Hom(U, V ).
Następne ćwiczenie pokazuje, że jest to przestrzeń wektorowa nad K.

Ćwiczenie. Sprawdzić, że zbiór V

, gdzie V jest przestrzenią wektorową

nad ciałem K, a X dowolnym zbiorem, z działaniami określonymi wzorami

(ϕ + ψ)(x) = ϕ(x) + ψ(x),

(αϕ)(x) = α ϕ(x)

dla ϕ, ψ ∈ V

, α ∈ K, x ∈ X, jest przestrzenią wektorową nad K. Spraw-

dzić, że w szczególnym przypadku, kiedy X to przestrzeń wektorowa U nad
K, podzbiór Hom(U, V ) przestrzeni wektorowej V

jest jej podprzestrzenią.

Ćwiczenie. Sprawdzić, że jeśli f : U −→ V i g : V −→ W są liniowe, to

g ◦ f również.

Ćwiczenie. Sprawdzić, że jeśli f jest izomorfizmem przestrzeni wekto-

rowych, to f

−1

również.

Oczywiście identyczność dowolnej przestrzeni wektorowej jest jej auto-

morfizmem. Dlatego z dwóch ostatnich ćwiczeń wynika, że zbiór wszystkich
automorfizmów ustalonej przestrzeni wektorowej V z działaniem składania
odwzorowań jest grupą. Oznacza się ją Aut(V ).

Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a P jest pod-

przestrzenią przestrzeni U, to f (P ) (czyli {v ∈ V : ∃

u∈P

v = f (u)}) jest

podprzestrzenią przestrzeni V .

Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a Q jest podprze-

strzenią przestrzeni V , to f

−1

(Q) (czyli {u ∈ U : f (u) ∈ Q}) jest podprze-

strzenią przestrzeni U.

Jeśli f : U −→ V jest liniowe, to f

−1

({0}) nazywa się jądrem odwzoro-

wania f i oznacza przez ker f , a f (U) obrazem odwzorowania f i oznacza
przez im f . Z dwóch ostatnich ćwiczeń widać, że ker f jest podprzestrze-
nią przestrzeni U, a im f podprzestrzenią przestrzeni V . Oczywiście f jest
epimorfizmem wtedy i tylko wtedy, gdy im f = V .

Ćwiczenie. Wykazać, że odwzorowanie liniowe f jest monomorfizmem

wtedy i tylko wtedy, gdy ker f = {0}.

Zobaczymy teraz, że baza to taki podzbiór przestrzeni wektorowej, że do-

wolnie zadane na nim odwzorowanie w drugą przestrzeń wektorową rozszerza
się jednoznacznie do odwzorowania liniowego.

Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią

wektorową nad ciałem K, a u

, . . . , u

∈ U. Ciąg u

, . . . , u

jest bazą U

wtedy i tylko wtedy, gdy dla każdej przestrzeni wektorowej V nad K i każdego
ciągu v

, . . . , v

wektorów z V istnieje dokładnie jedno odwzorowanie liniowe

f : U −→ V takie, że f (u

) = v

, . . . , f (u

) = v

Dowód: Jeśli u

, . . . , u

jest bazą, to dla każdego p ∈ U istnieją jedyne

, . . . , λ

∈ K takie, że p = λ

+ . . . + λ

. Gdyby istniało takie f jak

trzeba, to musiałoby być f (p) = λ

f (u

) + . . . + λ

f (u

) = λ

+ . . . + λ

Stąd już wynika jednoznaczność f . Aby pokazać jego istnienie, definiujemy
f (p) = λ

+ . . . + λ

. Ponieważ p jest dowolne, określiliśmy w ten sposób

odwzorowanie f : U −→ V . Sprawdzimy, że jest ono liniowe. Jeśli p, q ∈ U,
p = λ

+. . .+λ

, q = µ

+. . .+µ

, gdzie λ

, . . . , λ

, µ

, . . . , µ

∈ K,

to zgodnie z definicją f (p) = λ

+ . . . + λ

, f (q) = µ

+ . . . + µ

. Ale

p + q = (λ

+ µ

+ . . . + (λ

+ µ

, więc zgodnie z definicją f (p + q) =

(λ

+µ

+. . .+(λ

+µ

, co oznacza, że f (p+q) = f (p)+f (q). Podobnie

jeśli α ∈ K, p ∈ U, p = λ

+ . . . + λ

, gdzie λ

, . . . , λ

∈ K, to zgodnie

z definicją f (p) = λ

+ . . . + λ

. Ale αp = (αλ

+ . . . + (αλ

, więc

zgodnie z definicją f (αp) = (αλ

+ . . . + (αλ

, co oznacza, że f (αp) =

αf (p). Ponadto u

= 1u

+ 0u

+ . . . + 0u

, . . . , u

= 0u

+ . . . + 0u

n−1

+ 1u

i dlatego wykorzystując jeszcze raz definicję odwzorowania f otrzymujemy
f (u

) = v

, . . . , f (u

) = v

Implikację odwrotną wykażemy nie wprost. Gdyby u

, . . . , u

były liniowo

zależne, to u

= λ

+ . . . + λ

k−1

+ λ

k+1

+ . . . + λ

dla pewnego

k ∈ {1, . . . , n} i pewnych λ

, . . . , λ

k−1

, λ

k+1

, . . . , λ

∈ K, więc wystarczyłoby

wziąć V = K oraz v

= 0, . . . , v

k−1

= 0, v

= 1, v

k+1

= 0, . . . , v

= 0, aby

otrzymać sprzeczność z istnieniem f . Zatem u

, . . . , u

są liniowo niezależne.

Gdyby nie generowały U, to istniałyby takie w

, . . . , w

, gdzie m 6= 0, że ciąg

, . . . , u

, w

, . . . , w

byłby bazą U. Na podstawie wcześniej udowodnionej

implikacji moglibyśmy więc otrzymać odwzorowania liniowe g, h : U −→ K
spełniające warunki g(u

) = 0, . . . , g(u

) = 0, g(w

) = 0, . . . , g(w

) = 0 i

h(u

) = 0, . . . , h(u

) = 0, h(w

) = 1, . . . , h(w

) = 1, lecz to by przeczyło

jednoznaczności odpowiedniego f . Zatem twierdzenie jest udowodnione.

Ćwiczenie. Załóżmy, że U jest przestrzenią wektorowa nad ciałem K, a

B ⊂ U. Udowodnić, że B jest bazą U wtedy i tylko wtedy, gdy dla każdej
przestrzeni wektorowej V nad K i każdego odwzorowania e : B −→ V istnieje
dokładnie jedno odwzorowanie liniowe f : U −→ V , takie że f |

= e.

Ćwiczenie. Wykazać, że jeśli f, g : U −→ V są liniowe, A jest zbiorem

generatorów U i f |

= g|

, to f = g.

Ćwiczenie. Udowodnić, że jeśli f : U −→ V jest monomorfizmem, a A

liniowo niezależnym podzbiorem U, to f (A) jest liniowo niezależny.

Ćwiczenie. Niech f : U −→ V będzie liniowe. Wykazać, że jeśli A ⊂ U,

to f (lin A) = lin (f (A)) (więc jeśli A generuje U, to f (A) generuje im f ).

Ćwiczenie. Załóżmy, że odwzorowanie f : U −→ V jest liniowe, a ciąg

, . . . , u

jest bazą przestrzeni wektorowej U. Udowodnić, że

1) f jest monomorfizmem wtedy i tylko wtedy, gdy ciąg f (u

), . . . , f (u

)

jest liniowo niezależny,

2) f jest epimorfizmem wtedy i tylko wtedy, gdy zbiór {f (u

), . . . , f (u

)}

generuje przestrzeń V ,

3) f jest izomorfizmem wtedy i tylko wtedy, gdy ciąg f (u

), . . . , f (u

) jest

bazą przestrzeni V .

Ćwiczenie. Wykazać, że dwie skończenie wymiarowe przestrzenie wek-

torowe nad tym samym ciałem są izomorficzne (to znaczy istnieje izomorfizm
z jednej na drugą) wtedy i tylko wtedy, gdy mają równe wymiary.

Ostatnie ćwiczenie zawiera klasyfikację skończenie wymiarowych prze-

strzeni wektorowych. Jak widać, jest ona szalenie prosta, o wiele prostsza
niż choćby klasyfikacja skończenie generowanych grup abelowych.

Rząd odwzorowania liniowego

Twierdzenie. Niech f : U −→ V będzie odwzorowaniem liniowym. Prze-

strzeń U jest skończenie wymiarowa wtedy i tylko wtedy, gdy przestrzenie
ker f i im f są skończenie wymiarowe, i jeśli tak jest, to

dim U = dim ker f + dim im f.

Dowód: Załóżmy, że ker f i im f są skończenie wymiarowe. Weźmy bazę

, . . . , u

przestrzeni ker f i bazę v

, . . . , v

przestrzeni im f oraz wybierzmy

∈ f

−1

({v

}), . . . , w

∈ f

−1

({v

}). Wykażemy, że ciąg w

, . . . , w

, u

, . . . , u

jest bazą przestrzeni U. Jeżeli dla pewnych skalarów λ

, . . . , λ

, µ

, . . . , µ

zachodzi równość λ

+ . . . + λ

+ µ

+ . . . + µ

= 0, to mamy 0 =

f (λ

+ . . . + λ

+ µ

+ . . . + µ

) = λ

+ . . . + λ

i z liniowej

niezależności v

, . . . , v

otrzymujemy λ

= 0, . . . , λ

= 0. Ale w takim razie

mamy µ

+ . . . + µ

= 0 i z liniowej niezależności u

, . . . , u

otrzymujemy

= 0, . . . , µ

= 0. A więc w

, . . . , w

, u

, . . . , u

są liniowo niezależne. Dla

dowolnego u ∈ U istnieją takie skalary ν

, . . . , ν

, że f (u) = ν

+ . . . + ν

Ponadto f (u − ν

− . . . − ν

) = 0, więc istnieją takie skalary ξ

, . . . , ξ

że u − ν

− . . . − ν

= ξ

+ . . . + ξ

. A więc w

, . . . , w

, u

, . . . , u

generują U. Udowodniliśmy w ten sposób tezę twierdzenia w przypadku, gdy
ker f i im f są skończenie wymiarowe. Natomiast gdy skończenie wymiarowa
jest U, to jest taka też ker f i jeśli B jest bazą U, to f (B) jest skończonym
zbiorem generatorów im f , można więc z niego wybrać bazę przestrzeni im f ,
co oznacza, że również ona jest skończenie wymiarowa. Zatem ten przypadek
został sprowadzony do poprzedniego.

Ćwiczenie. Wykazać, że jeśli f : U −→ V jest liniowe, a U i V są skoń-

czenie wymiarowe i dim U = dim V , to następujące warunki są równoważne:

1) f jest monomorfizmem,
2) f jest epimorfizmem,
3) f jest izomorfizmem.

Definicja. Mówimy, że odwzorowanie liniowe f jest skończonego rzędu,

gdy jego obraz ma skończony wymiar, i definiujemy rząd takiego f wzorem

rz f = dim im f

(zauważmy, że jeśli f : U −→ V jest liniowe i U lub V ma skończony wymiar,
to f ma skończony rząd i odpowiednio rz f ≤ dim U lub rz f ≤ dim V ).

Ćwiczenie. Załóżmy, że f : U −→ V i f

: U

−→ V

są liniowe, zaś

U, V , U

, V

skończenie wymiarowe oraz dim U

= dim U i dim V

= dim V .

Udowodnić, że następujące warunki są równoważne:

1) istnieją takie izomorfizmy g : U −→ U

i h : V −→ V

, że f

◦ g = h ◦ f ,

2) rz f = rz f

Suma podprzestrzeni

Definicja. Sumą podprzestrzeni P

, . . . , P

przestrzeni wektorowej V

nazywa się zbiór

+ . . . + P

= {u ∈ V : ∃

∈P

,...,p

∈P

u = p

+ . . . + p

}

Okazuje się, że suma podprzestrzeni jest najmniejszą podprzestrzenią,

która je zawiera.

Twierdzenie. Jeśli P

, . . . , P

są podprzestrzeniami jednej przestrzeni

wektorowej, to P

+ . . . + P

= lin (P

∪ . . . ∪ P

Dowód: Łatwo sprawdzić warunki wystarczające do tego, by P

+ . . . + P

było podprzestrzenią. Ponadto P

⊂ P

+ . . . + P

, . . . , P

⊂ P

+ . . . + P

bo p

= p

+ 0 + . . . + 0, . . . , p

= 0 + . . . + 0 + p

dla p

∈ P

, . . . , p

∈ P

Oznacza to, że lin (P

∪ . . . ∪ P

) ⊂ P

+ . . . + P

. Inkluzja odwrotna wynika

stąd, że suma wektorów należących do podprzestrzeni również do niej należy.

Twierdzenie. Jeśli P i Q są skończenie wymiarowymi podprzestrzeniami

jednej przestrzeni wektorowej, to P + Q jest skończenie wymiarowa i

dim(P + Q) = dim P + dim Q − dim(P ∩ Q).

Dowód: Weźmy bazę u

, . . . , u

podprzestrzeni P ∩ Q i uzupełnijmy ją do

bazy u

, . . . , u

, v

, . . . , v

podprzestrzeni P i do bazy u

, . . . , u

, w

, . . . , w

podprzestrzeni Q. Wykażemy, że u

, . . . , u

, v

, . . . , v

, w

, . . . , w

jest bazą

podprzestrzeni P + Q. Wtedy teza twierdzenia przyjmie postać k + l + m =
(k + l) + (k + m) − k i tym samym będzie udowodniona. Widać od razu,
że wypisane wektory generują P + Q, zatem pozostało sprawdzić ich liniową
niezależność. Przypuśćmy, że dla skalarów λ

, . . . , λ

, µ

, . . . , µ

, ν

, . . . , ν

zachodzi równość λ

+. . .+λ

+µ

+. . .+µ

+ν

+. . .+ν

= 0.

Wówczas λ

+ . . . + λ

+ µ

+ . . . + µ

= −ν

− . . . − ν

. Lewa

strona tej równości należy do P , a prawa do Q, więc obie należą do P ∩ Q.
Istnieją więc takie skalary ξ

, . . . , ξ

, że λ

+ . . . + λ

+ µ

+ . . . + µ

+. . .+ξ

. Stąd i z liniowej niezależności u

, . . . , u

, v

, . . . , v

wynika, że

= 0, . . . , µ

= 0. Mamy więc λ

+. . .+λ

+ν

+. . .+ν

= 0. Stąd

i z liniowej niezależności u

, . . . , u

, w

, . . . , w

wynika z kolei, że również

= 0, . . . , λ

= 0, ν

= 0, . . . , ν

= 0, co kończy dowód.

Suma prosta

Ćwiczenie. Sprawdzić, że iloczyn kartezjański V

× . . . × V

przestrzeni

wektorowych V

, . . . , V

nad tym samym ciałem K z działaniami

, . . . , u

) + (v

, . . . , v

) = (u

+ v

, . . . , u

+ v

α(u

, . . . , u

) = (αu

, . . . , αu

)

jest przestrzenią wektorową nad K.

Ćwiczenie. Udowodnić, że jeśli V

, . . . , V

są skończenie wymiarowymi

przestrzeniami wektorowymi nad tym samym ciałem, to również przestrzeń
V

× . . . × V

jest skończenie wymiarowa i

dim(V

× . . . × V

) = dim V

+ . . . + dim V

Definicja. Mówimy, że przestrzeń wektorowa V jest sumą prostą swoich

podprzestrzeni P

, . . . , P

i piszemy V = P

⊕ . . . ⊕ P

, gdy odwzorowanie

F : P

× . . . × P

3 (p

, . . . , p

) −→ p

+ . . . + p

∈ V

jest izomorfizmem (łatwo sprawdzić, że F zawsze jest liniowe, istotą definicji
sumy prostej jest więc to, że jest ono bijekcją).

Twierdzenie. Przestrzeń wektorowa V jest sumą prostą swoich pod-

przestrzeni P

, . . . , P

wtedy i tylko wtedy, gdy dowolny wektor u z V można

jednoznacznie zapisać w postaci

u = p

+ . . . + p

gdzie p

∈ P

, . . . , p

∈ P

Dowód: Istnienie powyższego przedstawienia dowolnego wektora jest rów-

noważne z surjektywnością F , a jego jednoznaczność z injektywnością F .

Ćwiczenie. Wywnioskować z poprzedniego ćwiczenia, że jeśli P

, . . . , P

są takimi podprzestrzeniami skończenie wymiarowej przestrzeni wektorowej
V , że V = P

⊕ . . . ⊕ P

, to dim V = dim P

+ . . . + dim P

(dla r = 2

można tę równość otrzymać natychmiast ze wzoru na wymiar sumy dwóch
podprzestrzeni i następnego twierdzenia).

Twierdzenie. Jeśli P i Q są podprzestrzeniami przestrzeni wektorowej

V , to V = P ⊕ Q wtedy i tylko wtedy, gdy zachodzą następujące warunki:

1) P ∩ Q = {0},
2) P + Q = V .

Dowód: Jasne, że warunek 2) to to samo, co surjektywność odwzorowania

F : P × Q 3 (p, q) −→ p + q ∈ V , bo im F = P + Q. Injektywność F jest
równoważna temu, że ker F = {0}. Jeśli (p, q) ∈ ker F , to q = −p ∈ P ∩ Q,
więc jeśli P ∩ Q = {0}, to (p, q) = (0, 0). Odwrotnie, jeśli u ∈ P ∩ Q, to
(−u, u) ∈ ker F , więc jeśli ker F = {0}, to u = 0. Zatem 1) zachodzi wtedy i
tylko wtedy, gdy ker F = {0}, i twierdzenie jest udowodnione.

Zawarte w ostatnim twierdzeniu kryterium pozwalające sprawdzać, czy

przestrzeń wektorowa jest sumą prostą dwóch swoich podprzestrzeni, jest w
następnym ćwiczeniu uogólnione na dowolną ich ilość.

Ćwiczenie. Dowieść, że jeśli P

, . . . , P

są podprzestrzeniami przestrzeni

wektorowej V , to V = P

⊕ . . . ⊕ P

wtedy i tylko wtedy, gdy zachodzą

następujące warunki:

1) (P

+ . . . + P

k−1

) ∩ P

= {0} dla każdego k ∈ {2, . . . , r},

2) P

+ . . . + P

= V .

Ćwiczenie. Wykazać, że jeśli P i Q są takimi podprzestrzeniami skoń-

czenie wymiarowej przestrzeni wektorowej V , że dim P + dim Q = dim V , to
następujące warunki są równoważne:

1) P ∩ Q = {0},
2) P + Q = V ,
3) V = P ⊕ Q.

Ćwiczenie. Niech V będzie przestrzenią wektorową, a f : V −→ V jej

endomorfizmem. Udowodnić, że następujące warunki są równoważne:

1) istnieją takie podprzestrzenie P i Q przestrzeni V , że V = P ⊕ Q i

f (p + q) = p dla wszystkich p ∈ P , q ∈ Q,

2) f

= f (przez f

rozumiemy f ◦ f ).

Endomorfizm f spełniający warunek 1) z ostatniego ćwiczenia nazywa się

rzutowaniem na przestrzeń P równolegle do podprzestrzeni Q. Warunek 2)
daje więc bardzo ładną charakteryzację rzutowań.

Łatwo sobie wyobrazić, jak może wyglądać takie rzutowanie w przestrzeni

wektorowej V złożonej ze wszystkich zaczepionych w jednym wyróżnionym
punkcie wektorów leżących na płaszczyźnie. Przypuśćmy, że P i Q to dwie
różne proste przechodzące przez wyróżniony punkt (podprzestrzeniami są
właściwie zbiory wektorów o początku w wyróżnionym punkcie i końcach na
odpowiedniej prostej P lub Q, ale ponieważ wszystkie wektory mają ten sam
początek, to można je utożsamić z ich końcami, a wtedy podprzestrzenie są
tym samym, co proste P i Q). Mamy V = P ⊕ Q, bo P ∩ Q = {0}, jako że
proste P i Q są różne, a ponadto dim P + dim Q = 1 + 1 = 2 = dim V . Niech
f będzie rzutowaniem na P równolegle do Q. Dowolny wektor u z V można
jednoznacznie zapisać w postaci u = p + q, gdzie p ∈ P , q ∈ Q, i f (u) to p.
Widać więc, że aby znaleźć f (u) należy poprowadzić przez koniec wektora u
prostą równoległą do Q. Przetnie ona prostą P , a punkt przecięcia będzie
właśnie końcem wektora f (u).

W przestrzeni wektorowej złożonej ze wszystkich zaczepionych w jednym

wyróżnionym punkcie wektorów leżących w przestrzeni jako podprzestrzenie
tworzące sumę prostą równą całej przestrzeni można wziąć przecinające się
w wyróżnionym punkcie płaszczyznę i prostą. Naturalnie rzutować można na
płaszczyznę równolegle do prostej albo na prostą równolegle do płaszczyzny,
a interpretacja geometryczna powinna już być oczywista.

Przestrzeń ilorazowa

Przypomnijmy, że dowolna relacja ∼ w dowolnym zbiorze X nazywa się

relacją równoważności, gdy spełnia następujące warunki:

1) x ∼ x dla każdego x ∈ X (zwrotność),
2) dla każdych x, y ∈ X jeśli x ∼ y, to y ∼ x (symetryczność),
3) dla każdych x, y, z ∈ X jeśli x ∼ y i y ∼ z, to x ∼ z (przechodniość).

Jeśli ∼ jest relacją równoważności w zbiorze X, to dla każdego x ∈ X

definiuje sie jego klasę równoważności [x] = {y ∈ X : y ∼ x}. Oczywiście
X =

x∈X

[x], a ponadto wiadomo, że dla dowolnych x, y ∈ X albo [x] = [y],

albo [x] ∩ [y] = ∅ (czyli X rozpada się na rozłączne klasy równoważności).

Twierdzenie. Niech V będzie przestrzenią wektorową nad ciałem K, a

P jej podprzestrzenią. Wtedy relacja ∼ w zbiorze V zdefiniowana wzorem

u ∼ v ⇐⇒ v − u ∈ P

jest relacja równoważności.

Relacja ta jest zgodna z działaniami w przestrzeni wektorowej V , to znaczy

∀

u,v,u

∈V

∼ u, v

∼ v =⇒ u

+ v

∼ u + v,

∀

α∈K

∀

u,u

∈V

∼ u =⇒ αu

∼ αu.

Dowód: Relacja ∼ jest zwrotna, bo dla każdego u ∈ V u − u = 0 ∈ P ,

symetryczna, bo dla każdych u, v ∈ V z tego, że v − u ∈ P , wynika, że
u − v = −(v − u) ∈ P , i przechodnia, bo dla każdych u, v, w ∈ V z tego, że
v − u ∈ P i w − v ∈ P , wynika, że w − u = (w − v) + (v − u) ∈ P .

Jeżeli u, v, u

, v

∈ V , u

− u ∈ P i v

− v ∈ P , to (u

+ v

) − (u + v) =

− u) + (v

− v) ∈ P , natomiast jeżeli α ∈ K, u, u

∈ V , u

− u ∈ P , to

αu

− αu = α(u

− u) ∈ P .

Definicja. Niech V będzie przestrzenią wektorową nad ciałem K, a P

jej podprzestrzenią. Oznaczmy przez V /P zbiór klas równoważności relacji
określonej w ostatnim twierdzeniu. Na zbiorze tym definiujemy działania

[u] + [v] = [u + v],

α[u] = [αu].

Zgodność relacji równoważności z działaniami w V gwarantuje nam popraw-
ność takiej definicji, czyli to, że wynik działań na klasach równoważności nie
zależy od wyboru reprezentantów tych klas. Zbiór V /P z tymi działaniami
jest przestrzenią wektorową nad K, którą nazywamy przestrzenią ilorazową
przestrzeni V przez podprzestrzeń P .

Ćwiczenie. Sprawdzić, że przestrzeń ilorazowa rzeczywiście jest prze-

strzenią wektorową (w V /P 0 = [0], −[u] = [−u]).

Przykład. Rozważmy przestrzeń wektorową V wszystkich zaczepionych

w jednym wyróżnionym punkcie wektorów leżących na płaszczyźnie oraz jej
podprzestrzeń P będącą prostą przechodzącą przez wyróżniony punkt. Łatwo
zauważyć, że elementy przestrzeni V /P to proste równoległe do P . Żeby
dodać dwie takie proste S i T należy wziąć dowolne wektory s i t o końcach
odpowiednio na S i T . Prosta równoległa do P i przechodząca przez koniec
wektora s + t to suma S + T . Gdyby ktoś wziął inne wektory s

i t

o końcach

odpowiednio na S i T , to dostałby sumę s

+ t

, być może inną niż s + t,

ale końce wektorów s

+ t

i s + t leżałyby na tej samej prostej równoległej

do P , więc dostałby tę samą sumę S + T . To właśnie oznacza, że suma ta
nie zależy od wyboru reprezentantów. Podobnie, żeby pomnożyć prostą S
równoległą do P przez liczbę rzeczywistą α należy wziąć dowolny wektor s o
końcu na S. Prosta równoległa do P i przechodząca przez koniec wektora αs
to iloczyn αS. Gdyby ktoś wziął inny wektor s

o końcu na S, to dostałby

iloczyn αs

, być może inny niż αs, ale końce wektorów αs

i αs leżałyby na

tej samej prostej równoległej do P , więc dostałby ten sam iloczyn αS. To
właśnie oznacza, że iloczyn ten nie zależy od wyboru reprezentanta.

Ćwiczenie. Wykazać, że jeżeli ∼ jest relacją równoważności w przestrzeni

wektorowej V zgodną z działaniami tej przestrzeni, to istnieje (i to jedyna)
podprzestrzeń P przestrzeni V taka, że dla dowolnych u, v ∈ V u ∼ v wtedy
i tylko wtedy, gdy v − u ∈ P (wskazówka: P = [0]).

Definicja. Jeśli P jest podprzestrzenią przestrzeni wektorowej V , to

V 3 v −→ [v] ∈ V /P

nazywa się epimorfizmem kanonicznym.

Ćwiczenie. Sprawdzić, że epimorfizm kanoniczny V −→ V /P rzeczywi-

ście jest epimorfizmem, a jego jądro to podprzestrzeń P .

Twierdzenie. Niech V będzie przestrzenią wektorową, a P jej podprze-

strzenią. Przestrzeń V jest skończenie wymiarowa wtedy i tylko wtedy, gdy
przestrzenie P i V /P są skończenie wymiarowe, i jeśli tak jest, to

dim(V /P ) = dim V − dim P.

Dowód: Wystarczy zastosować wzór dim V = dim ker f + dim im f do

epimorfizmu kanonicznego f : V −→ V /P .

Podstawowe twierdzenie o epimorfizmie

Twierdzenie. Jeśli f : U −→ V jest epimorfizmem, a g : U −→ W jest

liniowe, to następujące warunki są równoważne:

1) ker f ⊂ ker g,
2) istnieje liniowe h : V −→ W takie, że h ◦ f = g,
3) istnieje dokładnie jedno liniowe h : V −→ W takie, że h ◦ f = g.

Dowód: Oczywiście z 3) wynika 2). Jeśli zaś zachodzi 2) i u ∈ ker f , to

g(u) = h(f (u)) = h(0) = 0, dlatego zachodzi 1). Pozostało wykazać, że z 1)
wynika 3). Załóżmy więc, że zachodzi 1) i weźmy v ∈ V . Chcemy zdefiniować
h(v). Ponieważ f jest epimorfizmem, to istnieje takie u ∈ U, że f (u) = v.
Gdyby istniało takie h jak trzeba, to musiałoby być h(v) = h(f (u)) = g(u).
Stąd już wynika jednoznaczność h. Aby pokazać jego istnienie definiujemy
h(v) = g(u). Sprawdzimy, że ta definicja jest poprawna, to znaczy nie zależy
od wyboru u. Jeśli weźmiemy inne u

∈ U takie, że f (u

) = v, to mamy

f (u

− u) = 0, więc na podstawie 1) g(u

− u) = 0, czyli g(u

) = g(u), a to

oznacza właśnie, że g(u) nie zależy od wyboru u. Ponieważ v jest dowolne,
to określiliśmy w ten sposób odwzorowanie h : V −→ W . Wprost z definicji
widać, że h ◦ f = g. Trzeba jeszcze sprawdzić liniowość h. Jeśli v, v

∈ V ,

a u, u

∈ U są takie, że f (u) = v, f (u

) = v

, to f (u + u

) = v + v

i mamy

h(v + v

) = g(u + u

) = g(u) + g(u

) = h(v) + h(v

). Podobnie jeśli α jest

skalarem, v ∈ V , a u ∈ U jest takie, że f (u) = v, to f (αu) = αv i mamy
h(αv) = g(αu) = αg(u) = αh(v). Zatem twierdzenie jest udowodnione.

Twierdzenie. Niech f : U −→ V będzie epimorfizmem, a g : U −→ W

liniowe. Jeżeli zachodzą trzy równoważne warunki z ostatniego twierdzenia
(nazywanego podstawowym twierdzeniem o epimorfizmie), to

1) h jest monomorfizmem wtedy i tylko wtedy, gdy ker f = ker g,
2) h jest epimorfizmem wtedy i tylko wtedy, gdy g jest epimorfizmem.

Dowód: Jeśli u ∈ ker g, to 0 = g(u) = h(f (u)), więc jeśli h jest mono-

morfizmem, to f (u) = 0, zatem ker g ⊂ ker f . Odwrotnie, jeśli v ∈ ker h,
a u ∈ U jest takie, że f (u) = v, to 0 = h(v) = h(f (u)) = g(u), więc jeśli
ker g ⊂ ker f , to v = f (u) = 0, zatem h jest monomorfizmem. W ten sposób
wykazaliśmy pierwszą część tezy. Druga to już tylko teoria mnogości: jeśli f
i h są surjekcjami, to h ◦ f też, a jeśli h ◦ f jest surjekcją, to h też.

Przykład. Niech P = {ϕ ∈ R

: ϕ(0) = ϕ(1), ϕ(2) = 0}. Zobaczymy

zaraz, jak przy pomocy podstawowego twierdzenia o epimorfizmie wykazać
izomorficzność R

/P i R

. Niech f : R

−→ R

/P będzie epimorfizmem

kanonicznym, a g : R

3 ϕ −→ (ϕ(0) − ϕ(1), ϕ(2)) ∈ R

. Łatwo sprawdzić,

że g jest liniowe i ker g = P , czyli ker f = ker g. Dlatego z podstawowego
twierdzenia o epimorfizmie mamy liniowe h : R

/P −→ R

, a z pierwszej

części ostatniego twierdzenia wynika, że jest ono monomorfizmem. Z drugiej
wynika, że jest ono epimorfizmem, bo, jak łatwo sprawdzić, g jest surjekcją.

Przestrzeń dualna

Definicja. Przestrzeń wektorową Hom(V, K), gdzie V jest przestrzenią

wektorową nad ciałem K, oznacza się przez V

∗

oraz nazywa przestrzenią

dualną do przestrzeni V , a jej elementy, czyli odwzorowania liniowe V −→ K,
formami liniowymi na V .

Dla dowolnego ciała K i dowolnych i, j ∈ N wprowadzamy symbol

1, gdy i = j,
0, gdy i 6= j.

nazywany deltą Kroneckera.

Jeżeli ciąg e

, . . . , e

jest bazą przestrzeni wektorowej V nad ciałem K, to

istnieją jednoznacznie wyznaczone formy liniowe e

∗

, . . . , e

∗

: V −→ K takie,

że dla wszystkich i, j ∈ {1, . . . , n}

∗

) = δ

Twierdzenie. Jeżeli e

, . . . , e

jest bazą V , to e

∗

, . . . , e

∗

jest bazą V

∗

Dowód: Gdy λ

, . . . , λ

są takimi skalarami, że λ

∗

+ . . . + λ

∗

= 0, to

dla każdego i ∈ {1, . . . , n} 0 = (λ

∗

+ . . . + λ

∗

)(e

) = λ

, więc λ

, . . . , λ

są liniowo niezależne. Generują one V

∗

, bo dla dowolnego α ∈ V

∗

mamy

α = α(e

) e

∗

+ . . . + α(e

) e

∗

. Rzeczywiście, obie strony tej równości są

liniowe i dla każdego i ∈ {1, . . . , n} przyjmują na e

taką samą wartość α(e

Definicja. Jeżeli e

, . . . , e

jest bazą V , to e

∗

, . . . , e

∗

nazywa się bazą

dualną do bazy e

, . . . , e

Przykład. Baza dualna do bazy (1, 2), (1, 3) przestrzeni R

składa się z

form α : R

3 (x, y) −→ 3x − y ∈ R, β : R

3 (x, y) −→ −2x + y ∈ R, bo

α(1, 2) = 1, α(1, 3) = 0, β(1, 2) = 0, α(1, 3) = 1.

Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Sprawdzić, że baza dualna

do bazy kanonicznej przestrzeni wektorowej K

jest złożona z form liniowych

3 (x

, . . . , x

) −→ x

∈ K dla i ∈ {1, . . . , n}.

Definicja. Dla liniowego f : U −→ V definiujemy

∗

: V

∗

3 β −→ β ◦ f ∈ U

∗

nazywane odwzorowaniem dualnym do f .

Ćwiczenie. Sprawdzić, że tak zdefiniowane f

∗

jest liniowe i zauważyć,

że jeśli f : U −→ V i g : V −→ W są liniowe, to (g ◦ f )

∗

= f

∗

◦ g

∗

W dowodzie kolejnego twierdzenia przyda się następujący lemat.

Lemat. Niech V będzie przestrzenią wektorową nad ciałem K, a v ∈ V .

Jeśli α(v) = 0 dla każdej α ∈ V

∗

, to v = 0.

Dowód: Gdyby było v 6= 0, to {v} byłby liniowo niezależny i istniałaby

baza B przestrzeni V zawierająca {v}. Istniałoby zatem liniowe α : V −→ K
o z góry zadanych wartościach na wektorach z B. W szczególności można by
zadać α(v) = 1, co byłoby sprzeczne z założeniem lematu.

Dla przestrzeni wektorowej V mamy przestrzeń V

∗

dualną do V , a dla

∗

przestrzeń V

∗∗

dualną do V

∗

. Przestrzeń V

∗∗

nazywa się bidualną do V .

Twierdzenie. Jeżeli V jest przestrzenią wektorową, to odwzorowanie

j : V −→ V

∗∗

, zdefiniowane wzorem

(j(v))(α) = α(v)

dla v ∈ V , α ∈ V

∗

, jest monomorfizmem. Jeżeli ponadto V jest skończenie

wymiarowa, to jest ono izomorfizmem.

Dowód: Niech K oznacza ciało skalarów przestrzeni V . Łatwo sprawdzić,

że dla każdego v ∈ V odwzorowanie j(v) : V

∗

−→ K jest liniowe (więc

faktycznie j(v) ∈ V

∗∗

) i że samo j jest liniowe. Z lematu mamy ker j = {0},

co kończy dowód pierwszej części. Jeśli V ma skończony wymiar, to dowolna
jej baza e

, . . . , e

ma tyle samo elementów, co baza e

∗∗

, . . . , e

∗∗

przestrzeni

∗∗

dualna do e

∗

, . . . , e

∗

. W takim razie V

∗∗

też ma skończony wymiar i

dim V

∗∗

= dim V , dlatego monomorfizm j jest izomorfizmem.

Powyższe j : V −→ V

∗∗

nazywa się monomorfizmem kanonicznym, a

jeżeli V jest skończenie wymiarowa, to izomorfizmem kanonicznym.

Twierdzenie. Przestrzeń wektorowa V jest skończenie wymiarowa wtedy

i tylko wtedy, gdy V

∗

jest skończenie wymiarowa, i jeśli tak jest, to

dim V

∗

= dim V.

Dowód: Oczywiście jeśli V ma skończony wymiar, to dowolna jej baza

, . . . , e

ma tyle samo elementów, co baza e

∗

, . . . , e

∗

przestrzeni V

∗

. W

takim razie V

∗

też ma skończony wymiar i dim V

∗

= dim V . Z drugiej strony

jeśli V

∗

ma skończony wymiar, to V

∗∗

również. Zatem obie przestrzenie

ker j = {0} i im j, gdzie j : V −→ V

∗∗

to monomorfizm kanoniczny, mają

skończone wymiary, więc V również.

Twierdzenie. Jeśli P jest p-wymiarową podprzestrzenią n-wymiarowej

przestrzeni wektorowej V , to istnieją liniowo niezależne α

, . . . , α

∈ V

∗

, dla

których P = ker α

∩ . . . ∩ ker α

, przy czym q = n − p.

Dowód: Weźmy bazę u

, . . . , u

podprzestrzeni P i dopełnijmy ją do bazy

, . . . , u

przestrzeni V . Wystarczy przyjąć α

= u

∗

p+1

, . . . , α

= u

∗

. Fak-

tycznie, dowolny wektor v ∈ V jest postaci v = λ

+ . . . + λ

, więc

mamy v ∈ ker α

∩ . . . ∩ ker α

wtedy i tylko wtedy, gdy zachodzą równości

0 = u

∗

p+1

(v) = λ

p+1

, . . . , 0 = u

∗

(v) = λ

, to znaczy wtedy i tylko wtedy, gdy

v = λ

+ . . . + λ

, czyli v ∈ P .

Z powyższego twierdzenia wynika, że każda p-wymiarowa podprzestrzeń

P przestrzeni wektorowej K

, gdzie K jest dowolnym ciałem, a n ∈ N, da się

opisać układem q liniowo niezależnych równań liniowych jednorodnych, gdzie
q = n − p (naturalnie liniowa niezależność równań oznacza, że żadne z nich
nie jest kombinacją liniową pozostałych). Faktycznie, niech α

, . . . , α

∈ K

n∗

będą takie, jak w twierdzeniu, zaś a

, . . . , a

∈ K takie, że

= a

∗

+ . . . + a

∗

, . . . , α

= a

∗

+ . . . + a

∗

, gdzie e

, . . . , e

baza kanoniczna w K

. Przypominając sobie, jak wyglądają formy z bazy

dualnej do bazy kanonicznej, otrzymujemy dla dowolnego (x

, . . . , x

) ∈ K

równoważność: (x

, . . . , x

) ∈ P wtedy i tylko wtedy, gdy

+ . . . + a

= 0,

...

+ . . . + a

= 0.

Jasne, że równania tego układu są liniowo niezależne, bo liniowo niezależne
są formy α

, . . . , α

Twierdzenie. Jeżeli V jest przestrzenią wektorową i α

, . . . , α

, β ∈ V

∗

to β ∈ lin {α

, . . . , α

} wtedy i tylko wtedy, gdy ker α

∩ . . . ∩ ker α

⊂ ker β.

Dowód: Niech K będzie ciałem skalarów przestrzeni V . Od razu widać,

że jeżeli β = λ

+ . . . + λ

, gdzie λ

, . . . , λ

∈ K, to dla v ∈ V takiego,

że α

(v) = 0, . . . , α

(v) = 0, również β(v) = 0. Implikacja odwrotna jest

trudniejsza. Ponieważ (α

, . . . , α

) : V 3 v −→ (α

(v), . . . , α

(v)) ∈ K

jest

epimorfizmem na swój obraz i ker(α

, . . . , α

) = ker α

∩ . . . ∩ ker α

⊂ ker β,

to z podstawowego twierdzenia o epimorfizmie mamy odwzorowanie liniowe
h : im (α

, . . . , α

) −→ K takie, że h ◦ (α

, . . . , α

) = β. Można je rozszerzyć

do liniowego k : K

−→ K (bo można wybrać bazę im (α

, . . . , α

), dopełnić

ją do bazy przestrzeni K

i zadać k na tej bazie tak, by na wektorach z bazy

im (α

, . . . , α

) pokrywało się z h) i będzie również k ◦ (α

, . . . , α

) = β. Ale

k = λ

∗

+. . .+λ

∗

, gdzie λ

, . . . , λ

∈ K, natomiast e

, . . . , e

oznacza bazę

kanoniczną przestrzeni K

. Stąd dla każdego v ∈ V otrzymujemy równość

β(v) = k(α

(v), . . . , α

(v)) = λ

(v) + . . . + λ

(v), co kończy dowód.

Ćwiczenie. Niech α

, . . . , α

, β

, . . . , β

∈ V

∗

. Z powyższego twierdzenia

wysnuć wniosek, że ker α

∩ . . . ∩ ker α

⊂ ker β

∩ . . . ∩ ker β

wtedy i tylko

wtedy, gdy lin {β

, . . . , β

} ⊂ lin {α

, . . . , α

Zatem zbiór rozwiązań jednego układu równań liniowych jednorodnych

zawiera się w zbiorze rozwiązań drugiego takiego układu wtedy i tylko wtedy,
gdy każde równanie drugiego z tych układów jest kombinacją liniową równań
pierwszego. Stąd oczywiście wynika, że dwa układy równań liniowych jedno-
rodnych mają takie same zbiory rozwiązań wtedy i tylko wtedy, gdy każde
równanie pierwszego układu jest kombinacją liniową równań drugiego i każde
równanie drugiego układu jest kombinacją liniową równań pierwszego.

Ćwiczenie. Niech α

, . . . , α

∈ V

∗

, gdzie V jest przestrzenią wektorową

skończonego wymiaru n. Wykorzystując dwa ostatnie twierdzenia wykazać,
że formy liniowe α

, . . . , α

są liniowo niezależne wtedy i tylko wtedy, gdy

dim(ker α

∩ . . . ∩ ker α

) = n − q.

Z ostatniego ćwiczenia wynika, że podprzestrzeń przestrzeni wektorowej

złożona ze wszystkich rozwiązań w ciele K układu q równań liniowych

jednorodnych z n niewiadomymi o współczynnikach z K ma wymiar n − q
wtedy i tylko wtedy, gdy te równania są liniowo niezależne.

Macierze

Definicja. Niech K będzie ciałem, a p, q ∈ N. Macierzą o q wierszach i

p kolumnach oraz wyrazach z ciała K nazywa się prostokątną tablicę





. . . a

...

. . . a



 ,

gdzie a

, . . . , a

∈ K (formalnie taka macierz jest funkcją

a : {1, . . . , q} × {1, . . . , p} −→ K, przy czym a

to a(j, i)).

Oczywiście j-ty wiersz takiej macierzy to

[ a

. . . a

] ,

a jej i-ta kolumna to





...



 .

Wyrazy macierzy są indeksowane dwoma wskaźnikami – pierwszy to numer
wiersza, a drugi to numer kolumny, na przecięciu których leży dany wyraz.

Zbiór wszystkich macierzy o q wierszach i p kolumnach oraz wyrazach z

ciała K będziemy oznaczać przez M

q×p

(K). Ten zbiór z działaniami





. . . a

...

. . . a



 +





. . . b

...

. . . b



 =





+ b

. . . a

+ b

...

+ b

. . . a

+ b



 ,





. . . a

...

. . . a



 =





αa

. . . αa

...

αa

. . . αa





jest przestrzenią wektorową nad K (jest to właściwie znanana nam przestrzeń
K

{1,...,q}×{1,...,p}

). Można ją utożsamiać z przestrzenią wektorową K

, bo

wyrazy każdej macierzy z M

q×p

(K) można ułożyć w ciąg (qp)-elementowy,

układając jeden z a drugim jej wiersze, i widać, że działania na macierzach
odpowiadają przy tym działaniom na ciągach. Dlatego

dim M

q×p

(K) = qp.

Niech K będzie ciałem, a p, q, r ∈ N. Dwie macierze, z których pierwsza

należy do M

r×q

(K), a druga do M

q×p

(K), można pomnożyć według wzoru





. . . a

...

. . . a









. . . b

...

. . . b



 =





+ . . . + a

. . . a

+ . . . + a

...

+ . . . + a

. . . a

+ . . . + a



 .

Jak widać, ten iloczyn jest macierzą z M

r×p

(K).

Przykład. Dla macierzy o wyrazach z R

1 3 1
2 1 0





2 3
1 0
4 1



 =

1 · 2 + 3 · 1 + 1 · 4 1 · 3 + 3 · 0 + 1 · 1
2 · 2 + 1 · 1 + 0 · 4 2 · 3 + 1 · 0 + 0 · 1

9 4
5 6

Macierze odwzorowań liniowych

Jak zobaczymy, dość dotąd abstrakcyjne odwzorowania liniowe między

przestrzeniami skończonego wymiaru mogą być utożsamiane z macierzami,
jeśli tylko wybierze się w tych przestrzeniach uporządkowane bazy.

Definicja. Niech U i V będą skończenie wymiarowymi przestrzeniami

wektorowymi nad ciałem K, ciągi u

, . . . , u

i v

, . . . , v

niech będą bazami

odpowiednio U i V , natomiast f : U −→ V odwzorowaniem liniowym. Dla
każdego i ∈ {1, . . . , p} f (u

) ∈ V , więc skoro v

, . . . , v

jest bazą V , to istnieją

jednoznacznie wyznaczone a

, . . . , a

∈ K takie, że

f (e

) = a

+ . . . + a

W ten sposób orzymujemy macierz





. . . a

...

. . . a



 ,

którą nazywa się macierzą odwzorowania f w bazach u

, . . . , u

i v

, . . . , v

Zwróćmy uwagę, że kolejność kolumn i wierszy w macierzy odwzorowania

liniowego odzwierciedla kolejność wektorów odpowiednio w bazach dziedziny
i przeciwdziedziny. Z tego powodu istotne jest, że bazy są tu ciągami, a
nie zbiorami. Czasami chcąc podkreślić, że chodzi o bazy będące ciągami,
nazywa się je bazami uporządkowanymi

Przykład. Niech f : R

3 (x, y) −→ (x + 6y, 2x + 7y) ∈ R

. Chcemy

wyznaczyć macierz f w bazach (0, 1), (1, 1) oraz (1, 1), (2, 3). Obliczamy
f (0, 1) = (6, 7) = 4(1, 1) + 1(2, 3), f (1, 1) = (7, 9) = 3(1, 1) + 2(2, 3), więc
szukana macierz to

4 3
1 2

Twierdzenie, które teraz wykażemy, mówi jak znając współrzędne wektora

w pewnej bazie dziedziny obliczyć szybko współrzędne w pewnej bazie prze-
ciwdziedziny wartości odwzorowania liniowego na tym wektorze, jeśli znamy
macierz tego odwzorowania w tych bazach.

Twierdzenie. Niech U i V będą skończenie wymiarowymi przestrzeniami

wektorowymi nad ciałem K, ciągi u

, . . . , u

i v

, . . . , v

niech będą bazami

odpowiednio U i V , f : U −→ V odwzorowaniem liniowym, a x ∈ U. Jeśli
x

. . . , x

są współrzędnymi x w bazie u

, . . . , u

, a y

, . . . , y

współrzędnymi

f (x) w bazie v

, . . . , v

, to





...



 =





. . . a

...

. . . a









...



 ,

przy czym druga z macierzy występujących w tym wzorze jest macierzą f w
bazach u

, . . . , u

i v

, . . . , v

Dowód: Z f (x) = f (

p
i=1

) =

p
i=1

f (u

) =

p
i=1

(

q
j=1

) =

q
j=1

(

p
i=1

i f (x) =

q
j=1

oraz jednoznaczności współrzędnych

wektora w bazie v

, . . . , v

dostajemy tezę twierdzenia, bo

p
i=1

to leżący

w j-tym wierszu wyraz iloczynu z prawej strony dowodzonego wzoru.

To twierdzenie sugeruje, że wektory ze skończenie wymiarowej przestrzeni

wektorowej z ustaloną bazą wygodnie będzie reprezentować przez macierze
jednokolumnowe. Ściśle ujmuje to następne twierdzenie.

Twierdzenie. Gdy U jest skończenie wymiarową przestrzenią wektorową

nad ciałem K, a ciąg u

, . . . , u

jest jej bazą, to odwzorowanie

U −→ M

p×1

(K),

przyporządkowujące wektorom ich współrzędne w tej bazie (wpisane kolejno
do macierzy jednokolumnowej), jest izomorfizmem.

Dowód: Odwzorowaniem odwrotnym do tego z twierdzenia jest

p×1

(K) 3





...



 −→

i=1

∈ U

i łatwo sprawdzić, że to ostatnie jest liniowe.

Kolejne twierdzenie mówi, że odwzorowania liniowe między skończenie

wymiarowymi przestrzeniami wektorowymi z ustalonymi bazami mogą być
reprezentowane przez macierze.

Twierdzenie. Niech U i V będą skończenie wymiarowymi przestrzeniami

wektorowymi nad ciałem K, a ciągi u

, . . . , u

i v

, . . . , v

niech będą bazami

odpowiednio U i V . Odwzorowanie

Hom(U, V ) −→ M

q×p

(K),

przyporządkowujące odwzorowaniom liniowym ich macierze w tych bazach,
jest izomorfizmem.

Dowód: Odwzorowaniem odwrotnym do tego z twierdzenia jest przypisa-

nie macierzy o wyrazach a

jedynego odwzorowania liniowego f : U −→ V

spełniajacego warunki f (u

) =

q
j=1

, . . . , f (u

) =

q
j=1

i łatwo

sprawdzić, że to odwzorowanie odwrotne jest liniowe.

Ćwiczenie. Sprawdzić, że jeśli w K

i K

weźmie się bazy kanoniczne, to

macierz o wyrazach a

jest wartością izomorfizmu z ostatniego twierdzenia

na K

3 (x

, . . . , x

) −→ (a

+ . . . + a

, . . . , a

+ . . . + a

) ∈ K

Przykład. Dla f : R

3 (x, y) −→ (x + 3y, 2x + 4y) ∈ R

dostajemy

f (2, 1) = (5, 8), bo

1 3
2 4

¸ ·

2
1

5
8

Twierdzenie. Jeśli f : U −→ V i g : V −→ W są liniowe, u

, . . . , u

, . . . , v

, w

, . . . , w

są bazami odpowiednio U, V , W , zaś A jest macierzą

f w bazach u

, . . . , u

, v

, . . . , v

i B jest macierzą g w bazach v

, . . . , v

, . . . , w

, to macierzą g ◦ f w bazach u

, . . . , u

, w

, . . . , w

jest BA.

Dowód: Gdy oznaczmy wyrazy A i B odpowiednio przez a

i b

, to mamy

g(f (u

)) =

q
j=1

g(v

) =

q
j=1

(

r
k=1

) =

r
k=1

(

q
j=1

co kończy dowód, bo

q
j=1

to wyraz macierzy BA leżący na przecięciu

k-tego wiersza i i-tej kolumny.

Twierdzenie. Mnożenie macierzy jest łączne, to znaczy dla dowolnych

A ∈ M

q×p

(K), B ∈ M

r×q

(K), C ∈ M

s×r

(K) zachodzi równość

(CB)A = C(BA).

Dowód: Wystarczy wziąć odwzorowania liniowe K

−→ K

, K

−→ K

mające w bazach kanonicznych macierze A, B, C i skorzystać z

poprzedniego twierdzenia oraz łączność składania odwzorowań.

Algebry endomorfizmów i macierzy

Definicja. Niech K będzie ciałem. Algebrą nad K nazywa się przestrzeń

wektorową A nad K z dodatkowym działaniem A × A 3 (a, b) −→ ab ∈ A
nazywanym mnożeniem i spełniającym warunki:

1) (ab)c = a(bc) dla wszystkich a, b, c ∈ A (łączność),
2) (a+b)c = ac+bc i a(b+c) = ab+ac dla wszystkich a, b, c ∈ A (rozdzielność

względem dodawania),

3) (αa)b = α(ab) i a(αb) = α(ab) dla wszystkich α ∈ K, a, b ∈ A (łączność

mieszana z mnożeniem przez skalary).

Gdy ponadto ba = ab dla wszystkich a, b ∈ A, to algebrę A nazywa się

przemienną, natomiast gdy istnieje element 1 zbioru A taki, że dla każdego
a ∈ A 1a = a i a1 = a, to mówi się, że algebra A jest z jedynką (oczywiście
jedynką nazywa się wtedy element 1, który jest jedyny).

Zauważmy, że algebra nad K jest równocześnie przestrzenią wektorową

nad K i pierścieniem, a obie te struktury są powiązane przez warunek 3).
Przy tym algebra jest przemienna lub z jedynką, gdy jest taka jako pierścień.

Przykład. Zbiór K[X] wielomianów jednej zmiennej o współczynnikach

z ciała K ze znanymi działaniami jest algebra przemienną z jedynką nad K.

Dla dowolnej przestrzeni wektorowej V nad ciałem K oznaczmy przez

End(V ) przestrzeń wektorową wszystkich endomorfizmów V −→ V (widać
więc, że End(V ) = Hom(V, V )).

Ćwiczenie. Sprawdzić, że dla dowolnej przestrzeni wektorowej V nad

ciałem K przestrzeń wektorowa End(V ) z mnożeniem

End(V ) × End(V ) 3 (g, f ) −→ g ◦ f ∈ End(V )

jest algebrą nad K z jedynką, którą jest id

. Udowodnić, że ta algebra jest

przemienna wtedy i tylko wtedy, gdy dim V ≤ 1.

Ćwiczenie. Niech K będzie ciałem, a n ∈ N. Sprawdzić, że przestrzeń

wektorowa M

n×n

(K) z mnożeniem macierzy jest algebrą nad K z jedynką.

Jedynką tej algebry jest oznaczana przez I macierz jednostkowa o wyrazach
równych delcie Kroneckera δ

dla i, j ∈ {1, . . . , n}. Ma ona na tak zwanej

głównej przekątnej łączącej rogi lewy górny i prawy dolny wyrazy równe 1, a
wszystkie pozostałe równe 0, czyli

I =





. ..



 .

Udowodnić, że algebra M

n×n

(K) jest przemienna wtedy i tylko wtedy, gdy

n ≤ 1 (z tego, że

1 0
0 0

¸ ·

0 1
0 0

0 0
0 0

0 1
0 0

¸ ·

1 0
0 0

widać nieprzemienność algebry M

2×2

(K)).

Jeżeli A i B są algebrami nad tym samym ciałem, to f : A −→ B nazywa

się homomorfizmem algebr, gdy jest liniowe i f (ab) = f (a)f (b) dla wszystkich
a, b ∈ A (czyli gdy jest równocześnie homomorfizmem przestrzeni wektoro-
wych i pierścieni). Jak zwykle, izomorfizmem algebr nazywa się homomorfizm
algebr, który jest bijekcją. Odwzorowanie odwrotne do izomorfizmu algebr
też jest izomorfizmem algebr.

Twierdzenie. Gdy V jest skończenie wymiarową przestrzenią wektorową

nad ciałem K, a ciąg v

, . . . , v

jest jej bazą, to odwzorowanie

End(V ) −→ M

n×n

(K),

przyporządkowujące endomorfizmom ich macierze w bazie v

, . . . , v

(tej sa-

mej w dziedzinie i przeciwdziedzinie), jest izomorfizmem algebr.

Dowód: Takie odwzorowanie jest szczególnym przypadkiem omówionego

wcześniej izomorfizmu przestrzeni wektorowych, bo End(V ) = Hom(V, V ).
To, że jest on też homomorfizmem algebr, wynika z twierdzenia mówiącego,
że składaniu odwzorowań liniowych odpowiada mnożenie ich macierzy we
właściwych bazach (zwróćmy uwagę, jak ważne tu jest, że do zdefiniowania
izomorfizmu End(V ) −→ M

n×n

(K) bierzemy w dziedzinie i przeciwdziedzinie

endomorfizmów V −→ V tę samą bazę v

, . . . , v

Odnotujmy jeszcze, że odwzorowanie End(V ) −→ M

n×n

(K) z ostatniego

twierdzenia przeprowadza id

na I.

Niech A będzie algebrą z jedynką, a a ∈ A. Jeśli istnieje takie b ∈ A, że

ab = 1 i ba = 1, to element a nazywa się odwracalnym, a b odwrotnym do
a i oznacza przez a

−1

(wiemy, że element odwrotny jest tylko jeden). Zbiór

elementów odwracalnych algebry A z mnożeniem z algebry A tworzy grupę
(wszystko to jest już znane z teorii pierścieni).

Zauważmy, że jeśli V jest przestrzenią wektorową, to grupą elementów

odwracalnych algebry End(V ) jest grupa Aut(V ), o której wspominaliśmy
przy okazji odwzorowań liniowych.

Definicja. Grupę elementów odwracalnych algebry M

n×n

(K), gdzie K

jest ciałem, a n ∈ N, nazywa się ogólną grupą liniową i oznacza GL(n, K).

Zatem

GL(n, K) = {A ∈ M

n×n

(K) : ∃

B∈M

n×n

(K)

AB = I, BA = I},

a działaniem w GL(n, K) jest mnożenie macierzy. Podgrupy grupy GL(n, K)
nazywa się grupami liniowymi

Następne twierdzenie jest natychmiastowym wnioskiem z poprzedniego.

Twierdzenie. Gdy V jest skończenie wymiarową przestrzenią wektorową

nad ciałem K, a ciąg v

, . . . , v

jest jej bazą, to odwzorowanie

Aut(V ) −→ GL(n, K),

przyporządkowujące automorfizmom ich macierze w bazie v

, . . . , v

(tej sa-

mej w dziedzinie i przeciwdziedzinie), jest izomorfizmem grup.

Macierz transponowana

Definicja. Niech K będzie ciałem, a p, q ∈ N. Macierzą transponowaną

do macierzy A z M

q×p

(K) o wyrazach a

nazywa się macierz A

∗

z M

p×q

(K)

o wyrazach a

, to znaczy





. . . a

...

. . . a





∗





. . . a

...

. . . a



 .

Zatem wiersze macierzy A

∗

są kolumnami macierzy A, a kolumny macierzy

∗

są wierszami macierzy A.

Twierdzenie. Jeżeli f : U −→ V jest liniowe, u

, . . . , u

i v

, . . . , v

są

bazami odpowiednio U i V , zaś A jest macierzą f w tych bazach, to A

∗

jest

macierzą f

∗

: V

∗

−→ U

∗

w bazach v

∗

, . . . , v

∗

i u

∗

, . . . , u

∗

Dowód: (f

∗

))(u

) = v

∗

(f (u

)) = v

∗

(

q
l=1

) =

q
l=1

∗

) =

q
l=1

= a

oraz (

p
k=1

∗

)(u

) =

p
k=1

= a

, więc faktycznie

∗

) =

p
k=1

∗

dla każdego j ∈ {1, . . . , q}.

Ćwiczenie. Sprawdzić, że

1) (A + B)

∗

= A

∗

+ B

∗

dla wszystkich A, B ∈ M

q×p

(K),

2) (αA)

∗

= αA

∗

dla wszystkich α ∈ K, A ∈ M

q×p

(K),

3) (BA)

∗

= A

∗

dla wszystkich A ∈ M

q×p

(K), B ∈ M

r×q

(K),

4) A

∗∗

= A dla każdej A ∈ M

q×p

(K).

Rząd macierzy

Definicja. Niech K będzie ciałem, p, q ∈ N, a A ∈ M

q×p

(K). Macierz

A ma rząd równy r (co będziemy zapisywać jako rz A = r), gdy wśród jej
kolumn jest r liniowo niezależnych, ale nie ma r + 1 liniowo niezależnych.

Przykład. Rozważmy macierz

A =





1 2 4 3
1 3 5 5
2 5 9 8





z M

3×4

(R). Łatwo sprawdzić, że każde trzy spośród macierzy





1
1
2



 ,





2
3
5



 ,





4
5
9



 ,





3
5
8





są liniowo zależne, ale istnieją wśród nich dwie liniowo niezależne (choćby
dwie pierwsze). Dlatego rz A = 2.

Twierdzenie. Jeżeli f : U −→ V jest liniowe, u

, . . . , u

i v

, . . . , v

są

bazami odpowiednio U i V , a A jest macierzą f w tych bazach, to rz A = rz f .

Dowód: Skoro u

, . . . , u

generują U, to f (u

), . . . , f (u

) generują im f i

można spośród nich wybrać bazę im f . Widać więc, że dim im f , czyli rz f , to
największa ilość liniowo niezależnych wektorów, które można wybrać spośród
f (u

), . . . , f (u

). Ale przez izomorfizm V −→ M

q×1

(K) przyporządkowujący

wektorom ich współrzędne w bazie v

, . . . , v

wektory f (u

), . . . , f (u

) prze-

chodzą na kolumny A, bo f (u

) =

q
j=1

, gdzie a

oznaczają wyrazy A.

Zatem rz f to największa ilość liniowo niezależnych kolumn A, bo izomorfizm
przekształca ciągi liniowo niezależne na ciągi liniowo niezależne.

Twierdzenie. Dla każdego odwzorowania liniowego f : U −→ V , gdzie

U i V są skończenie wymiarowe, dim U = p i dim V = q, istnieją takie bazy
przestrzeni U i V , że wyrazy a

macierzy odwzorowania f w tych bazach

wyrażają się wzorami

1, gdy i = j oraz i, j ≤ rz f ,
0

w pozostałych przypadkach.

Dowód: Weźmy bazę u

, . . . , u

przestrzeni ker f i bazę v

, . . . , v

prze-

strzeni im f oraz wybierzmy w

∈ f

−1

({v

}), . . . , w

∈ f

−1

({v

}). Jak wiemy,

, . . . , w

, u

, . . . , u

jest wówczas bazą U. Dobierzmy takie z

, . . . , z

, żeby

ciąg v

, . . . , v

, z

, . . . , z

był bazą V . Tak skonstruowane bazy są dobre, bo

f (w

) = v

, . . . , f (w

) = v

, f (u

) = 0, . . . , f (u

) = 0 i oczywiście rz f = l.

Macierz z ostatniego twierdzenia można przejrzyście zapisać w tak zwanej

postaci blokowej, mianowicie

0 0

gdzie I jest macierzą jednostkową z M

r×r

(K), a zera macierzami zerowymi

kolejno z M

r×(p−r)

(K), M

(q−r)×r

(K), M

(q−r)×(p−r)

, przy czym r = rz f .

Ćwiczenie. Niech K będzie ciałem, a p, q, r, s, t, u ∈ N. Zauważyć, że

1) jeżeli α ∈ K, A, E ∈ M

r×p

(K), B, F ∈ M

r×q

(K), C, G ∈ M

s×p

(K),

D, H ∈ M

s×q

(K), to

A B
C D

G H

A + E

B + F

C + G D + H

A B
C

αA αB
αC

αD

2) jeżeli A ∈ M

r×p

(K), B ∈ M

r×q

(K), C ∈ M

s×p

(K), D ∈ M

s×q

(K),

E ∈ M

t×r

(K), F ∈ M

t×s

(K), G ∈ M

u×r

(K), H ∈ M

u×s

(K), to

G H

¸ ·

A B
C

EA + F C

EB + F D

GA + HC

GB + HD

3) jeżeli A ∈ M

r×p

(K), B ∈ M

r×q

(K), C ∈ M

s×p

(K), D ∈ M

s×q

(K), to

A B
C

∗

Twierdzenie. Jeżeli f : U −→ V jest liniowe, a U i V są skończenie

wymiarowe, to

rz f

∗

= rz f.

Dowód: Weźmy w U i V bazy, w których f ma macierz z poprzedniego

twierdzenia. W bazach dualnych f

∗

ma macierz do niej transponowaną, czyli

0 0

gdzie I jest macierzą jednostkową z M

r×r

(K), a zera macierzami zerowymi

kolejno z M

r×(q−r)

(K), M

(p−r)×r

(K), M

(p−r)×(q−r)

, przy czym r = rz f . Ma

ona r pierwszych kolumn liniowo niezależnych, a pozostałe zerowe, więc jej
rząd, i tym samym rząd f

∗

, jest równy rz f .

Twierdzenie. Jeżeli K jest ciałem, p, q ∈ N, a A ∈ M

q×p

(K), to

rz A

∗

= rz A.

Dowód: Wystarczy zastosować ostatnie twierdzenie do f : K

−→ K

mającego w bazach kanonicznych macierz A.

Wniosek. Macierz ma rząd równy r, gdy wśród jej wierszy jest r liniowo

niezależnych, ale nie ma r + 1 liniowo niezależnych.

Przykład. Na podstawie ostatniego wniosku widać, że jeżeli do któregoś

wiersza macierzy doda się inny jej wiersz pomnożony przez dowolny skalar
lub jeżeli zamieni się miejscami dwa wiersze macierzy, to rząd tej macierzy
się nie zmieni. Dlatego można obliczać rząd macierzy metodą Gaussa. Na
przykład przy użyciu operacji elementarnych na wierszach macierz





1 2 4 3
1 3 5 5
2 5 9 8





można przekształcić w macierz „schodkową”





1 2 4 3
0 1 1 2
0 0 0 0





i dla niej znaleźć największą możliwą ilość liniowo niezależnych wierszy. Ale
ta ilość to oczywiście ilość wyrazów podkreślonych w trakcie wykonywania
algorytmu Gaussa. Zatem rząd rozpatrywanej macierzy jest równy 2.

Zmiana bazy

Definicja. Niech ciągi u

, . . . , u

i u

, . . . , u

będą bazami przestrzeni

wektorowej U nad ciałem K. Macierzą przejścia od bazy u

, . . . , u

do bazy

, . . . , u

nazywa się macierz z M

p×p

(K) o wyrazach p

określonych przez

równości

= p

+ . . . + p

dla i ∈ {1, . . . , p} (a więc wyrazy p

, . . . p

z i-tej kolumny macierzy przejścia

to po prostu współrzędne wektora u

w bazie u

, . . . , u

Przykład. Ponieważ (7, 9) = 2(1, 2) + 5(1, 1), (4, 5) = 1(1, 2) + 3(1, 1),

to macierzą przejścia od bazy (1, 2), (1, 1) do bazy (7, 9), (4, 5) w R

jest

2 1
5 3

Twierdzenie. Jeżeli P jest macierzą przejścia od bazy u

, . . . , u

do bazy

, . . . , u

, a Q od bazy u

, . . . , u

do bazy u

, . . . , u

, to macierzą przejścia

od bazy u

, . . . , u

do bazy u

, . . . , u

jest P Q.

Dowód: Oznaczając wyrazy macierzy P i Q odpowiednio przez p

i q

mamy u

p
j=1

(

p
k=1

) =

p
k=1

(

p
j=1

skąd wynika teza twierdzenia, bo

p
j=1

to wyraz macierzy P Q leżący

na przecięciu k-tego wiersza i i-tej kolumny.

Twierdzenie. Jeżeli P jest macierzą przejścia od bazy u

, . . . , u

do bazy

, . . . , u

, to P jest odwracalna i macierzą przejścia od bazy u

, . . . , u

bazy u

, . . . , u

jest P

−1

Dowód: Oznaczmy macierz przejścia od u

, . . . , u

do u

, . . . , u

przez Q.

Biorąc w ostatnim twierdzeniu u

, . . . , u

za u

, . . . , u

dostajemy P Q = I,

bo macierzą przejścia od dowolnej bazy do niej samej jest I. Zamieniając
rolami u

, . . . , u

i u

, . . . , u

dostajemy QP = I, więc Q = P

−1

Udowodnimy teraz dwa twierdzenia zawierające wzory transformacyjne.

Pierwsze z nich mówi, jak zmieniają się współrzędne wektora przy zmianie
bazy, a drugie mówi, jak zmienia się macierz odwzorowania liniowego przy
zmianie baz dziedziny i przeciwdziedziny.

Twierdzenie. Załóżmy, że u

, . . . , u

i u

, . . . , u

są bazami przestrzeni

wektorowej U, zaś x ∈ U. Jeżeli x

, . . . , x

i x

, . . . , x

są współrzędnymi

wektora x w bazie odpowiednio u

, . . . , u

i u

, . . . , u

, to





...



 = P

−1





...



 ,

gdzie P oznacza macierz przejścia od bazy u

, . . . , u

do bazy u

, . . . , u

Dowód: Oznaczając wyrazy macierzy P przez p

mamy x =

p
i=1

(

p
j=1

) =

p
j=1

(

p
i=1

. Z drugiej strony x =

p
j=1

Stąd

p
i=1

= x

dla j ∈ {1, . . . , p}, co można zapisać jako P X

= X,

gdzie X i X

są macierzami z M

p×1

(K) o wyrazach odpowiednio x

, . . . , x

. Mnożąc ostatnią równość lewostronnie przez P

−1

dostajemy tezę.

Twierdzenie. Załóżmy, że u

, . . . , u

i u

, . . . , u

są bazami przestrzeni

wektorowej U, v

, . . . , v

i v

, . . . , v

są bazami przestrzeni wektorowej V , zaś

f : U −→ V jest liniowe. Jeżeli A jest macierzą f w bazach u

, . . . , u

, . . . , v

, a A

macierzą f w bazach u

, . . . , u

i v

, . . . , v

, to

= Q

−1

AP,

gdzie P oznacza macierz przejścia od bazy u

, . . . , u

do bazy u

, . . . , u

, a Q

macierz przejścia od bazy v

, . . . , v

do bazy v

, . . . , v

Dowód: Niech x ∈ U oraz niech X i X

oznaczają macierze z M

p×1

(K),

których wyrazy to współrzędne x w bazie odpowiednio u

, . . . , u

i u

, . . . , u

a Y i Y

macierze z M

q×1

(K), których wyrazy to współrzędne f (x) w bazie

odpowiednio v

, . . . , v

i v

, . . . , v

. Wstawiając Y = QY

i X = P X

równości Y = AX dostajemy QY

= AP X

, czyli Y

= Q

−1

AP X

. Z drugiej

strony Y

= A

. Ponieważ x był dowolny, to równość A

= Q

−1

AP X

oznacza, że A

i Q

−1

AP są macierzami w bazach u

, . . . , u

i v

, . . . , v

tego

samego odwzorowania liniowego, więc A

= Q

−1

AP .

Ślad macierzy i endomorfizmu

Definicja. Niech K będzie ciałem, n ∈ N, a A ∈ M

n×n

(K). Śladem tr A

macierzy A nazywa się sumę wyrazów z jej głównej przekątnej, czyli

tr A =

i=1

gdzie a

oznaczają wyrazy macierzy A.

Ćwiczenie. Sprawdzić, że odwzorowanie M

n×n

(K) 3 X −→ tr X ∈ K

jest liniowe.

Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A, B ∈ M

n×n

(K), to

tr (AB) = tr (BA).

Dowód: Gdy a

i b

oznaczają wyrazy macierzy odpowiednio A i B, to

tr (AB) =

n
i=1

(

n
j=1

) =

n
j=1

(

n
i=1

) = tr (BA).

Definicja. Śladem endomorfizmu f : U −→ U skończenie wymiarowej

przestrzeni wektorowej U nazywa się ślad jego macierzy w dowolnej bazie (tej
samej w dziedzinie i przeciwdziedzinie). Z ostatniego twierdzenia wynika, że
taka definicja jest poprawna, to znaczy nie zależy od wyboru bazy, bo gdy
u

, . . . , u

i u

, . . . , u

są bazami U, A i A

macierzami f w bazie odpowiednio

, . . . , u

i u

, . . . , u

, a P macierzą przejścia od u

, . . . , u

do u

, . . . , u

, to

tr A

= tr (P

−1

AP ) = tr (AP P

−1

) = tr A.

Ostatnie twierdzenie można sformułować jako następujący wniosek.

Wniosek. Dla dowolnych endomorfizmów f i g skończenie wymiarowej

przestrzeni wektorowej U

tr (f ◦ g) = tr (g ◦ f ).

Następne twierdzenie zawiera ciekawą charakteryzację śladu.

Twierdzenie. Niech K będzie ciałem, a n ∈ N. Gdy f : M

n×n

(K) −→ K

jest odwzorowaniem liniowym spełniającym dla wszystkich A, B ∈ M

n×n

(K)

warunek f (AB) = f (BA), to istnieje taka λ ∈ K, że f (X) = λ tr X dla
każdej X ∈ M

n×n

(K).

Dowód: Oznaczmy przez E

, gdzie i, j ∈ {1, . . . , n}, macierz z M

n×n

(K),

która ma na przecięciu j-tego wiersza i i-tej kolumny 1, a wszystkie pozostałe
wyrazy równe 0. Oczywiście E

dla i, j ∈ {1, . . . , n} tworzą bazę przestrzeni

n×n

(K) (odpowiada ona bazie kanonicznej przy utożsamieniu M

n×n

(K) z

). Łatwo zauważyć, że dla dowolnych i, j, k, l ∈ {1, . . . , n}

= δ

gdzie δ

oznacza jak zwykle deltę Kroneckera. Dzięki temu mamy dla i 6= j

f (E

) = f (E

) = f (0) = 0, a ponadto f (E

) = f (E

) =

f (E

) = f (E

). Oznaczając λ = f (E

) możemy te równości zapisać

krótko: f (E

) = δ

λ dla wszystkich i, j ∈ {1, . . . , n}. Ponieważ dla każdej

X ∈ M

n×n

(K) jest X =

n
i=1

n
j=1

, gdzie x

są wyrazami X, to

f (X) =

n
i=1

n
j=1

f (E

) =

n
i=1

n
j=1

λ =

n
i=1

λ = λ tr X.

Odwzorowania wieloliniowe

Definicja. Niech U

, . . . , U

oraz V będą przestrzeniami wektorowymi

nad tym samym ciałem. Odwzorowanie

f : U

× . . . × U

−→ V

nazywa się r-liniowym, gdy jest liniowe ze względu na każdą zmienną z osobna
przy dowolnie ustalonych pozostałych, czyli gdy dla każdego i ∈ {1, . . . , r} i
każdych u

∈ U

, . . . , u

i−1

∈ U

i−1

, u

i+1

∈ U

i+1

, . . . , u

∈ U

odwzorowanie

3 u −→ f (u

, . . . , u

i−1

, u, u

i+1

, . . . , u

) ∈ V

jest liniowe.

Przykład. Łatwo sprawdzić trójliniowość odwzorowania

× R

× R 3 ((a, b), (c, d), e) −→ (2ace − ade − bce − bde, ace + 3bde) ∈ R

Zbiór wszystkich odwzorowań r-liniowych U

× . . . × U

−→ V będziemy

oznaczać przez L(U

, . . . , U

; V ). Z następnego ćwiczenia wynika, że jest to

przestrzeń wektorowa nad tym samym ciałem, co U

, . . . , U

oraz V .

Ćwiczenie. Niech U

, . . . , U

oraz V będą przestrzeniami wektorowymi

nad tym samym ciałem. Sprawdzić, że podzbiór L(U

, . . . , U

; V ) przestrzeni

wektorowej V

×...×U

jest jej podprzestrzenią.

Sformułujemy teraz i wykażemy twierdzenie o tym, że dowolnie zadane na

ciągach wektorów z baz poszczególnych przestrzeni wektorowych U

, . . . , U

odwzorowanie w przestrzeń wektorową V rozszerza się jednoznacznie do od-
wzorowania r-liniowego U

× . . . × U

−→ V . Będzie to zatem uogólnienie

twierdzenia, które już znamy, a które dotyczy przypadku r = 1.

Twierdzenie. Niech U

, . . . , U

oraz V będą przestrzeniami wektorowymi

nad tym samym ciałem, i niech dla każdego k ∈ {1, . . . , r} ciąg u

, . . . , u

będzie bazą przestrzeni wektorowej U

. Wtedy dla dowolnych v

...l

∈ V , gdzie

∈ {1, . . . , p

}, . . . , l

∈ {1, . . . , p

}, istnieje dokładnie jedno odwzorowanie

r-liniowe f : U

× . . . × U

−→ V takie, że f (u

, . . . , u

) = v

...l

dla

wszystkich l

∈ {1, . . . , p

}, . . . , l

∈ {1, . . . , p

Dowód: Zastosujemy indukcję względem r. Dla każdego l ∈ {1, . . . , p

}

istnieje na podstawie założenia indukcyjnego dokładnie jedno (r − 1)-liniowe
g

: U

× . . . × U

r−1

−→ V takie, że g

, . . . , u

r−1 l

r−1

) = v

...l

r−1

dla

każdych l

∈ {1, . . . , p

}, . . . , l

r−1

∈ {1, . . . , p

r−1

}. Następnie istnieje jedyne

liniowe h : U

−→ L(U

, . . . , U

r−1

; V ) takie, że h(u

) = g

, . . . , h(u

) = g

Wystarczy teraz przyjąć f (x

, . . . , x

) = (h(x

))(x

, . . . , x

r−1

) dla dowolnych

∈ U

, . . . , x

∈ U

. Widać, że tak określone f spełnia wymagane warunki.

Stąd, że dla x

, . . . , x

powinna zachodzić

równość f (x

, . . . , x

) =

. . .

. . . x

...l

, otrzymujemy od

razu jednoznaczność f .

Twierdzenie. Jeżeli przestrzenie wektorowe U

, . . . , U

oraz V nad tym

samym ciałem są skończenie wymiarowe, to również przestrzeń wektorowa
L(U

, . . . , U

; V ) jest skończenie wymiarowa i

dim L(U

, . . . , U

; V ) = dim U

· . . . · dim U

· dim V.

Dowód: Niech dla każdego k ∈ {1, . . . , r} ciąg u

, . . . , u

będzie bazą

, a v

, . . . , v

niech będzie bazą V . Na podstawie poprzedniego twierdzenia

dla każdych j

∈ {1, . . . , p

}, . . . , j

∈ {1, . . . , p

}, i ∈ {1, . . . , q} istnieje

dokładnie jedno r-liniowe f

...j

: U

× . . . × U

−→ V takie, że

...j

, . . . , u

) =

, gdy (l

, . . . , l

) = (j

, . . . , j

gdy (l

, . . . , l

) 6= (j

, . . . , j

)

dla wszystkich l

∈ {1, . . . , p

}, . . . , l

∈ {1, . . . , p

}. W celu zakończenia do-

wodu wystarczy tylko sprawdzić, że te f

...j

tworzą bazę L(U

, . . . , U

; V ).

Są one liniowo niezależne, bo gdy

. . .

q
i=1

...l

= 0,

to obliczając wartości obu strony tej równości na (u

, . . . , u

) dostajemy

q
i=1

...j

= 0, a stąd α

...j

= 0, . . . , α

...j

= 0. Natomiast generują

one L(U

, . . . , U

; V ), bo dla dowolnego g ∈ L(U

, . . . , U

; V ) mamy równość

g =

. . .

q
i=1

...l

, gdzie β

...l

, . . . , β

...l

oznaczają

współrzędne g(u

, . . . , u

) w bazie v

, . . . , v

. A prawdziwość tej równości

łatwo sprawdzić obliczając wartości obu jej stron na ciągach (u

, . . . , u

)

i korzystając jeszcze raz z poprzedniego twierdzenia.

Zwróćmy uwagę, że powyższy dowód pokazuje, jak wychodząc od baz

przestrzeni wektorowych U

, . . . , U

oraz V skonstruować bazę przestrzeni

wektorowej L(U

, . . . , U

; V ).

Znak permutacji

Oznaczmy przez S

grupę permutacji zbioru {1, . . . , r} (jak pamiętamy

jest to grupa wszystkich bijekcji {1, . . . , r} −→ {1, . . . , r} ze składaniem
odwzorowań jako działaniem). Przypomnijmy, że jeśli a

, . . . , a

są różnymi

elementami zbioru {1, . . . , r}, to k-elementowy cykl (a

, . . . , a

) jest taką

permutacją σ z S

, że σ(a

) = a

, . . . , σ(a

k−1

) = a

oraz σ(a

) = a

. Cykle

dwuelementowe nazywa się transpozycjami.

Twierdzenie. Dowolna permutacja jest iloczynem transpozycji.

Dowód: Jak wiemy, dowolna permutacja jest iloczynem cykli. Natomiast

dowolny cykl k-elementowy jest następującym iloczynem k − 1 transpozycji

, . . . , a

) = (a

, a

) . . . (a

, a

a więc twierdzenie jest wykazane.

Transpozycję (a, b) będziemy nazywać sąsiednią, gdy |b−a| = 1. Dowolna

permutacja jest iloczynem transpozycji sąsiednich, bo dowolna transpozycja
(a, b) jest następującym iloczynem 2|b − a| − 1 transpozycji sąsiednich

(a, b) = (a, a + 1) . . . (b − 2, b − 1)(b − 1, b)(b − 2, b − 1) . . . (a, a + 1)

(bez straty ogólności założyliśmy tu, że a < b).

Przykład. Permutacja

1 2 3 4 5 6 7
5 1 7 6 2 3 4

jest równa iloczynowi cykli (1, 5, 2)(3, 7, 4, 6), a więc zgodnie z powyższymi
wzorami jest równa iloczynowi transpozycji (1, 2)(1, 5)(3, 6)(3, 4)(3, 7) oraz
iloczynowi transpozycji sąsiednich (1, 2)(1, 2)(2, 3)(3, 4)(4, 5)(3, 4)(2, 3)(1, 2)
(3, 4)(4, 5)(5, 6)(4, 5)(3, 4)(3, 4)(3, 4)(4, 5)(5, 6)(6, 7)(5, 6)(4, 5)(3, 4).

Oczywiście permutację można zapisać jako iloczyn transpozycji na wiele

różnych sposobów. W ostatnim przykładzie zapisaliśmy tę samą permutację
jako iloczyn 5 transpozycji oraz jako iloczyn 21 transpozycji. Obie te liczby
są nieparzyste. Jak zaraz zobaczymy, nie jest to przypadek.

Niech σ ∈ S

, a i, j ∈ {1, . . . , r}. Mówimy, że para (i, j) jest inwersją w

permutacji σ, gdy i < j, ale σ(i) > σ(j).

Przykład. Permutacja z ostatniego przykładu ma dokładnie 11 inwersji:

(1, 2), (1, 5), (1, 6), (1, 7), (3, 4), (3, 5), (3, 6), (3, 7), (4, 5), (4, 6), (4, 7).

Twierdzenie. Jeżeli permutacja ma parzystą ilość inwersji, to w każdym

iloczynie transpozycji, który jest jej równy, jest parzysta ilość czynników, a
jeżeli ma nieparzystą ilość inwersji, to w każdym iloczynie transpozycji, który
jest jej równy, jest nieparzysta ilość czynników.

Dowód: Skoro udało nam się zapisać dowolną transpozycję jako iloczyn

nieparzystej ilości transpozycji sąsiednich, to wystarczy tylko udowodnić, że
dla każdych σ ∈ S

, i ∈ {1, . . . , r − 1} różnica ilości inwersji w permutacjach

σ i σ(i, i + 1) jest nieparzysta, bowiem wówczas indukcja ze względu na ilość
transpozycji w iloczynie natychmiast da nam tezę twierdzenia. Ale wartość
bezwzględna tej różnicy jest równa 1, ponieważ

σ(i, i + 1) =

. . .

i − 1

i + 1

i + 2

. . .

σ(1) . . . σ(i − 1) σ(i + 1)

σ(i)

σ(i + 2) . . . σ(r)

skąd widać, że (i, i + 1) jest inwersją w σ(i, i + 1) wtedy i tylko wtedy, gdy
nie jest inwersją w σ, i że jeżeli j 6= i oraz j 6= i + 1, to (i, j) albo (j, i) jest
inwersją w σ(i, i + 1) wtedy i tylko wtedy, gdy (i + 1, j) albo (j, i + 1) jest
inwersją w σ, a (i + 1, j) albo (j, i + 1) jest inwersją w σ(i, i + 1) wtedy i tylko
wtedy, gdy (i, j) albo (j, i) jest inwersją w σ, natomiast pozostałe inwersje w
σ(i, i + 1) i σ pokrywają się.

Definicja. Niech K będzie dowolnym ciałem. Dla każdej permutacji σ z

definiujemy jej znak jako element sgn σ ciała K określony wzorem

sgn σ =

1, gdy σ jest iloczynem parzystej ilości transpozycji,

−1, gdy σ jest iloczynem nieparzystej ilości transpozycji.

Pierwsze z twierdzeń, które udowodniliśmy, gwarantuje, że znak został

zdefiniowany dla każdej permutacji, a dzięki drugiemu definicja znaku jest
poprawna, bo wynika z niego, że żadna permutacja nie może być iloczynem
i parzystej, i nieparzystej ilości transpozycji.

Permutację nazywa się parzystą albo nieparzystą, gdy jej znak jest równy

odpowiednio 1 albo −1.

Przykład. Permutacja z poprzednich przykładów jest nieparzysta.

Odwzorowania wieloliniowe symetryczne i antysymetryczne

Przypomnijmy, że charakterystyką ciała K nazywa się najmniejszą nie-

zerową liczbę naturalną p taką, że w K p = 0 (przez p rozumie się tu sumę
1 + . . . + 1 o p składnikach), a gdy taka liczba nie istnieje, to 0.

Twierdzenie. Dla r-liniowego f : U × . . . × U −→ V rozważmy warunki:

1) f (u

σ(1)

, . . . , u

σ(r)

) = sgn σ f (u

, . . . , u

), dla każdej σ ∈ S

i wszystkich

, . . . , u

∈ U,

2) dla każdych i, j ∈ {1, . . . , r}, takich że i < j, i wszystkich u

, . . . , u

∈ U

f (u

, . . . , u

i−1

, u

i+1

, . . . , u

j−1

, u

j+1

, . . . , u

) = −f (u

, . . . , u

3) dla każdych i, j ∈ {1, . . . , r} takich, że i < j, i wszystkich u

, . . . , u

∈ U

takich, że u

= u

, f (u

, . . . , u

) = 0,

4) dla wszystkich liniowo zależnych u

, . . . , u

∈ U f (u

, . . . , u

) = 0.

Spośród powyższych warunków 1) i 2) są równoważne, 3) i 4) są równo-

ważne, z 3) i 4) wynikają 1) i 2), a jeśli U i V są nad ciałem charakterystyki
różnej od 2, to również z 1) i 2) wynikają 3) i 4).

Dowód: Równoważność 1) i 2) wynika stąd, że dowolna permutacja jest

złożeniem transpozycji. Jeżeli u

= u

i zachodzi 2), to mamy f (u

, . . . , u

) =

f (u

, . . . , u

i−1

, u

i+1

, . . . , u

j−1

, u

j+1

, . . . , u

) = −f (u

, . . . , u

), a zatem

2f (u

, . . . , u

) = 0. Gdy 2 6= 0, to możemy pomnożyć obie strony tej równość

przez 1/2 i stwierdzić, że wówczas z 2) wynika 3). Natomiast gdy zachodzi
3), to f (u

, . . . , u

i−1

, u

+ u

, u

i+1

, . . . , u

j−1

, u

+ u

, u

j+1

, . . . , u

) = 0, a stąd,

wykorzystując r-liniowości f i jeszcze dwa razy 3), otrzymujemy bez trudu
równość f (u

, . . . , u

)+f (u

, . . . , u

i−1

, u

i+1

, . . . , u

j−1

, u

j+1

, . . . , u

) = 0,

więc z 3) wynika 2). Jeżeli wektory u

, . . . , u

są liniowo zależne, to mamy

= λ

+ . . . + λ

j−1

+ λ

j+1

+ . . . + λ

dla pewnego j ∈ {1, . . . , r}.

Wystarczy teraz prawą stronę tej równości wstawić za u

do f (u

, . . . , u

) i

wykorzystać r-liniowość f i 3), aby udowodnić, że z 3) wynika 4). Implikacja
odwrotna jest trywialna, bo ciąg wektorów, który nie jest różnowartościowy,
jest liniowo zależny, a więc dowód jest zakończony.

Ćwiczenie. Wykazać, że dla r-liniowego f : U × . . . × U −→ V następu-

jące warunki są równoważne:

1) f (u

σ(1)

, . . . , u

σ(r)

) = f (u

, . . . , u

) dla każdej σ ∈ S

i wszystkich

, . . . , u

∈ U,

2) dla każdych i, j ∈ {1, . . . , r}, takich że i < j, i wszystkich u

, . . . , u

∈ U

f (u

, . . . , u

i−1

, u

i+1

, . . . , u

j−1

, u

j+1

, . . . , u

) = f (u

, . . . , u

Definicja. Odwzorowanie r-liniowe f : U × . . . × U −→ V nazywa się

symetrycznym, gdy spełnia któryś z warunków 1) i 2) z ostatniego ćwiczenia
(a więc automatycznie spełnia też drugi z nich), a antysymetrycznym (lub
skośnie symetrycznym), gdy spełnia któryś z warunków 3) i 4) z ostatniego
twierdzenia (a więc automatycznie spełnia wszystkie cztery; w dodatku, gdy
U i V są nad ciałem charakterystyki różnej od 2, to f jest antysymetryczne,
gdy spełnia któryś z warunków 1) i 2) z tego twierdzenia).

Przykład. R

× R

3 ((a, b), (c, d)) −→ 2ac + 3ad + 3bc + 4bd ∈ R jest

symetryczne, a R

× R

3 ((a, b), (c, d)) −→ ad − bc ∈ R antysymetryczne.

Oznaczmy przez L

(U, V ) przestrzeń wektorową wszystkich r-liniowych

odwzorowań U × . . . × U −→ V (w takim razie L

(U, V ) jest szczególnym

przypadkiem przestrzeni L(U

, . . . , U

; V ) z U

= U, . . . , U

= U), natomiast

przez L

(U, V ) i L

(U, V ) jej podzbiory złożone z odwzorowań odpowiednio

symetrycznych i antysymetrycznych.

Ćwiczenie. Sprawdzić, że L

(U, V ) i L

(U, V ) są podprzestrzeniami

przestrzeni wektorowej L

(U, V ).

Sformułujemy teraz i wykażemy twierdzenie o tym, że dowolnie zadane na

silnie rosnących ciągach wektorów z uporządkowanej bazy przestrzeni wekto-
rowej U odwzorowanie w przestrzeń wektorową V rozszerza się jednoznacznie
do antysymetrycznego odwzorowania r-liniowego U × . . . × U −→ V .

Twierdzenie. Niech U i V będą przestrzeniami wektorowymi nad tym

samym ciałem, a ciąg u

, . . . , u

niech będzie bazą U. Wtedy dla dowolnych

...l

∈ V , gdzie l

, . . . , l

∈ {1, . . . , p} spełniają warunek l

< . . . < l

istnieje dokładnie jedno antysymetryczne r-liniowe f : U × . . . × U −→ V
takie, że f (u

, . . . , u

) = v

...l

dla wszystkich l

, . . . , l

∈ {1, . . . , p}, które

spełniają warunek l

< . . . < l

Dowód: Niech l

, . . . , l

∈ {1, . . . , p}. Gdy ciąg l

, . . . , l

nie jest różno-

wartościowy, to musi zachodzić równość f (u

, . . . , u

) = 0, natomiast gdy

jest, to istnieje dokładnie jedna permutacja σ ∈ S

taka, że l

σ(1)

< . . . < l

σ(r)

i musi zachodzić równość f (u

, . . . , u

) = (1/sgn σ) v

σ(1)

...l

σ(r)

. Jak wiemy,

istnieje dokładnie jedno r-liniowe f : U × . . . × U −→ V , które spełnia te
równości dla wszystkich l

, . . . , l

∈ {1, . . . , p}. Pozostało sprawdzić, że f jest

antysymetryczne. Widać, że dla x

p
l

, . . . , x

p
l

mamy f (x

, . . . , x

) =

<...<l

σ∈S

σ(1)

. . . x

σ(r)

sgn σ v

...l

. Załóżmy,

że x

= x

dla i < j. Ponieważ ϕ : T 3 σ −→ σ ◦ (i, j) ∈ S

\ T , gdzie

T = {σ ∈ S

: σ(i) < σ(j)}, jest bijekcją i przy ustalonych l

, . . . , l

i σ ∈ T

sgn ϕ(σ) = −sgn σ, x

ϕ(σ)(i)

= x

σ(j)

i x

ϕ(σ)(j)

= x

σ(i)

, a x

ϕ(σ)(k)

= x

σ(k)

gdy k 6= i i k 6= j, to w sumie po prawej stronie wzoru na f (x

, . . . , x

)

składniki odpowiadające σ i ϕ(σ) wzajemnie się znoszą i f (x

, . . . , x

) = 0.

Twierdzenie. Jeżeli przestrzenie wektorowe U oraz V nad tym samym

ciałem są skończenie wymiarowe, to również przestrzeń wektorowa L

(U, V )

jest skończenie wymiarowa i

dim L

(U, V ) =

dim U

dim V.

Dowód: Niech u

, . . . , u

i v

, . . . , v

będą bazami odpowiednio U i V .

Na podstawie poprzedniego twierdzenia dla każdych j

, . . . , j

∈ {1, . . . , p}

spełniających warunek j

< . . . < j

i i ∈ {1, . . . , q} istnieje dokładnie jedno

antysymetryczne r-liniowe g

...j

: U × . . . × U −→ V takie, że

...j

, . . . , u

) =

, gdy (l

, . . . , l

) = (j

, . . . , j

gdy (l

, . . . , l

) 6= (j

, . . . , j

)

dla wszystkich l

, . . . , l

∈ {1, . . . , p} spełniających warunek l

< . . . < l

. W

celu zakończenia dowodu wystarczy tylko sprawdzić, że te g

...j

tworzą bazę

(U, V ). Są one liniowo niezależne, bo gdy

<...<l

q
i=1

...l

0, to obliczając wartości obu stron tej równości na (u

, . . . , u

) takim, że

< . . . < j

, dostajemy

q
i=1

...j

= 0, i α

...j

= 0, . . . , α

...j

= 0.

Natomiast generują L

(U, V ), bo dla dowolnego h ∈ L

(U, V ) mamy rów-

ność h =

<...<l

q
i=1

...l

, gdzie β

...l

, . . . , β

...l

oznaczają

współrzędne h(u

, . . . , u

) w bazie v

, . . . , v

. A prawdziwość tej równości

łatwo sprawdzić obliczając wartości obu jej stron na ciągach (u

, . . . , u

)

takich, że j

< . . . < j

, i korzystając jeszcze raz z poprzedniego twierdzenia.

Zwróćmy uwagę, że powyższy dowód pokazuje, jak wychodząc od baz

przestrzeni U oraz V skonstruować bazę przestrzeni wektorowej L

(U, V ).

W dowodzie tym wykorzystaliśmy oczywisty fakt, że ilość r-elementowych

silnie rosnących ciągów o elementach ze zbioru {1, . . . , p} jest równa ilości
kombinacji bez powtórzeń p elementów po r elementów. Przypomnijmy, że
ta ilość wyraża się znanym z kombinatoryki wzorem

p
r

r! (p − r)!

Przykład. dim L

, R) =

3
2

·1 = 3. Wychodząc od baz kanonicznych

w R

i R i postępując tak, jak w powyższym dowodzie, dostalibyśmy bazę

przestrzeni L

, R) złożoną z odwzorowań

12,1

: R

× R

3 ((a, b, c), (d, e, f )) −→ ae − bd ∈ R,

13,1

: R

× R

3 ((a, b, c), (d, e, f )) −→ af − cd ∈ R,

23,1

: R

× R

3 ((a, b, c), (d, e, f )) −→ bf − ce ∈ R.

Można się o tym przekonać obliczając wartości tych odwzorowań na ciągach
((1, 0, 0), (0, 1, 0)), ((1, 0, 0), (0, 0, 1)), ((0, 1, 0), (0, 0, 1)).

Dwa następne ćwiczenia są odpowiednikami dwóch ostatnich twierdzeń,

ale dotyczą odwzorowań symetrycznych zamiast antysymetrycznych (dlatego
pojawiają się tam ciągi słabo rosnące zamiast silnie rosnących i w konsekwen-
cji kombinacje z powtórzeniami zamiast bez powtórzeń).

Ćwiczenie. Udowodnić, że jeżeli U i V są przestrzeniami wektorowymi

nad tym samym ciałem, a ciąg u

, . . . , u

jest bazą U, to dla dowolnych

...l

∈ V , gdzie l

, . . . , l

∈ {1, . . . , p} spełniają warunek l

≤ . . . ≤ l

istnieje dokładnie jedno symetryczne r-liniowe f : U × . . . × U −→ V takie,
że f (u

, . . . , u

) = v

...l

dla wszystkich l

, . . . , l

∈ {1, . . . , p}, które speł-

niają warunek l

≤ . . . ≤ l

Ćwiczenie. Udowodnić, że jeżeli przestrzenie wektorowe U oraz V nad

tym samym ciałem są skończenie wymiarowe, to również przestrzeń wekto-
rowa L

(U, V ) jest skończenie wymiarowa i

dim L

(U, V ) =

dim U + r − 1

dim V.

Wyznacznik macierzy kwadratowej

Wprowadzimy teraz bardzo ważne pojęcie wyznacznika macierzy.

Definicja. Niech K będzie ciałem, a n ∈ N. Dla macierzy A z M

n×n

(K)

o wyrazach a

definiujemy jej wyznacznik wzorem

det A =

σ∈S

sgn σ a

1σ(1)

. . . a

nσ(n)

Często zamiast det A pisze się

. . . a

...

. . . a

Przykład. S

= {id

{1}

}, więc |a

| = a

Przykład. S

= {id

{1,2}

, (1, 2)}, więc

¯ = a

− a

Przykład. S

= {id

{1,2,3}

, (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)}, więc

+ a

− a

Ten wzór jest już trudniejszy do zapamiętania. Do obliczania wyznaczników
macierzy z M

3×3

(K) można jednak stosować nastepującą metodę Sarrusa.

Dopisuje się do takiej macierzy jako czwartą i piątą kolumnę jej kolumny od-
powiednio pierwszą i drugą, oblicza iloczyny wyrazów tak powstałej macierzy
z M

3×5

(K) połączonych liniami na schematach

i wreszcie sumuje te iloczyny, mnożąc przy tym przez −1 te, które powstały
z drugiego schematu. Na przykład dla

A =





1 2 3
4 5 6
7 8 9





mamy po dopisaniu kolumn





1 2 3 1 2
4 5 6 4 5
7 8 9 7 8



 ,

więc det A = 1 · 5 · 9 + 2 · 6 · 7 + 3 · 4 · 8 − 3 · 5 · 7 − 1 · 6 · 8 − 2 · 4 · 9 = 0.

Czasem dopisywanie kolumn bywa kłopotliwe. W takiej sytuacji zamiast

poprzednich schematów można użyć następujących

¢ ©

@¢

A ¡

HHA

odnoszących się bezpośrednio do macierzy z M

3×3

(K). Wówczas oblicza się

iloczyny wyrazów leżących na zaznaczonych przekątnych macierzy oraz w
wierzchołkach zaznaczonych trójkątów. Dalej postępuje się jak poprzednio.

Twierdzenie. Dla dowolnej macierzy A z M

n×n

(K) o wyrazach a

det A =

σ∈S

sgn σ a

σ(1)1

. . . a

σ(n)n

Dowód: Twierdzenie zachodzi, bo det A =

σ∈S

sgn σ a

1σ(1)

. . . a

nσ(n)

σ∈S

sgn σ

−1

(1)1

. . . a

−1

(n)n

, a S

3 σ −→ σ

−1

∈ S

jest bijekcją.

Wniosek. Dla dowolnej macierzy A z M

n×n

(K)

det A

∗

= det A.

Może się wydawać dziwne, czemu definicja wyznacznika jest akurat taka,

a nie inna. Z następnego twierdzenia widać, że jest ona uzasadniona, bo
wyznacznik jest jedynym obiektem o pewnych dobrych własnościach.

Twierdzenie. Niech K będzie ciałem, a n ∈ N. Wtedy

1) wyznacznik macierzy z M

n×n

(K) jest antysymetryczną n-liniową funkcją

jej kolumn, to znaczy antysymetrycznym n-liniowym jest odwzorowanie

n×1

(K) × . . . × M

n×1

(K) 3 (A

, . . . , A

) −→ det[A

. . . A

] ∈ K,

2) dla macierzy jednostkowej I z M

n×n

(K)

det I = 1.

Co więcej, przyporządkowanie macierzom z M

n×n

(K) ich wyznaczników jest

jedynym odwzorowaniem M

n×n

(K) −→ K spełniającym warunki 1) i 2)

(należy to rozumieć tak, że jeżeli dla f : M

n×n

(K) −→ K odwzorowanie

n×1

(K) × . . . × M

n×1

(K) 3 (A

, . . . , A

) −→ f ([A

. . . A

]) ∈ K jest an-

tysymetryczne n-liniowe i f (I) = 1, to dla każdej A ∈ M

n×n

(K) zachodzi

równość f (A) = det A).

Dowód: Z poprzedniego twierdzenia widać, że odwzorowanie z punktu

1) jest n-liniowe. Żeby wykazać jego antysymetryczność oznaczmy przez a

wyrazy macierzy A i załóżmy, że A

= A

dla i < j. Ponieważ mamy bijekcję

ϕ : T 3 σ −→ σ ◦ (i, j) ∈ S

\ T , gdzie T = {σ ∈ S

: σ(i) < σ(j)}, i dla

każdej σ ∈ T mamy sgn ϕ(σ) = −sgn σ, a

ϕ(σ)(i) i

= a

σ(j)j

i a

ϕ(σ)(j) j

= a

σ(i)i

, a

ϕ(σ)(k) k

= a

σ(k)k

, gdy k 6= i i k 6= j, to w sumie

σ∈S

sgn σ a

σ(1)1

. . . a

σ(n)n

składniki odpowiadające σ i ϕ(σ) wzajemnie się znoszą i det A = 0. Punkt
2) jest konsekwencją tego, że gdy σ 6= id

{1,...,n}

, to δ

1σ(1)

. . . δ

nσ(n)

= 0, zaś

sgn id

{1,...,n}

. . . δ

= 1. W celu udowodnienia drugiej części twierdzenia

zauważmy, że dim M

n×1

(K) = n, więc dim L

n×1

(K), K) =

n
n

· 1 = 1.

W takim razie odwzorowanie z punktu 1), będąc niezerowym, stanowi bazę
przestrzeni L

n×1

(K), K) i mamy f = λ det dla pewnego λ ∈ K, a skoro

1 = f (I) = λ det I = λ · 1 = λ, to f = det, co kończy dowód.

Oczywiście powyższe twierdzenie pozostanie prawdziwe, gdy zastąpimy

w nim kolumny przez wiersze. W szczególności mamy następujący wniosek.

Wniosek. Niech K będzie ciałem, a n ∈ N. Wtedy wyznacznik macierzy

z M

n×n

(K) jest antysymetryczną n-liniową funkcją jej wierszy, to znaczy

antysymetrycznym n-liniowym jest odwzorowanie

1×n

(K) × . . . × M

1×n

(K) 3 (A

, . . . , A

) −→ det





...



 ∈ K.

Ponieważ antysymetryczne odwzorowanie wieloliniowe zeruje się na ciągu

wektorów liniowo zależnych, dostajemy natychmiast kolejne wnioski.

Wniosek. Dla macierzy kwadratowej jest prawdą, że

1) jeżeli do którejś kolumny dodamy dowolną kombinację liniową pozosta-

łych kolumn, to wyznacznik się nie zmieni,

2) jeżeli którąś kolumnę pomnożymy przez dowolny skalar, to wyznacznik

ulegnie pomnożeniu przez ten skalar,

3) jeżeli zamienimy miejscami dwie kolumny, to wyznacznik zmieni się na

przeciwny.

Wniosek. Dla macierzy kwadratowej jest prawdą, że

1) jeżeli do któregoś wiersza dodamy dowolną kombinację liniową pozosta-

łych wierszy, to wyznacznik się nie zmieni,

2) jeżeli któryś wiersz pomnożymy przez dowolny skalar, to wyznacznik ule-

gnie pomnożeniu przez ten skalar,

3) jeżeli zamienimy miejscami dwa wiersze, to wyznacznik zmieni się na

przeciwny.

Twierdzenie. Niech K będzie ciałem, a p, q ∈ N. Wtedy dla dowolnych

A ∈ M

p×p

(K), B ∈ M

p×q

(K), D ∈ M

q×q

(K)

det

A B

= det A · det D

(oczywiście zero w powyższym wzorze oznacza macierz zerową z M

q×p

(K)).

Dowód: Niech e

oznaczają wyrazy macierzy z lewej strony dowodzonego

wzoru. Wtedy e

σ(1)1

. . . e

σ(p+q) p+q

= 0 dla σ ∈ S

p+q

takiej, że σ(i) > p dla

pewnego i ≤ p. Ale dla σ ∈ S

p+q

takiej, że σ(i) ≤ p dla wszystkich i ≤ p,

istnieją jednoznacznie wyznaczone τ ∈ S

, υ ∈ S

takie, że

σ =

. . .

p + 1

. . .

p + q

τ (1) . . . τ (p) p + υ(1) . . . p + υ(q)

i przy tym jest sgn σ = sgn τ sgn υ. Dlatego oznaczając przez a

i d

wyrazy

macierzy A i D widzimy, że wyznacznik z lewej strony dowodzonego wzoru
równa się

τ ∈S

υ∈S

sgn τ sgn υ e

τ (1)1

. . . e

τ (p)p

p+υ(1) p+1

. . . e

p+υ(q) p+q

, czyli

(

τ ∈S

sgn τ a

τ (1)1

. . . a

τ (p)p

)(

υ∈S

sgn υ d

υ(1)1

. . . d

υ(q)q

), co kończy dowód.

Wniosek. Niech K będzie ciałem, n ∈ N, a a

∈ K dla i, j ∈ {1, . . . , n}.

Jeżeli a

= 0, gdy j > i, to wyznacznik macierzy z M

n×n

(K) o wyrazach a

przedstawia się wzorem

det





. . .

. ..

...



 = a

· . . . · a

czyli wyznacznik macierzy „górnej trójkątnej” jest równy iloczynowi wyrazów
z jej głównej przekątnej.

Dowód: Stosujemy ostatnie twierdzenie i indukcję ze względu na n.

Oczywiście także wyznacznik macierzy „dolnej trójkątnej” (czyli mającej

wyrazy a

takie, że a

= 0, gdy j < i) jest równy iloczynowi wyrazów z jej

głównej przekątnej.

To, co udowodniliśmy do tej pory, pozwala nam obliczać wyznaczniki

macierzy kwadratowych metodą Gaussa. Otóż przy pomocy dwóch operacji
elementarnych: dodawania do któregoś wiersza innego wiersza pomnożonego
przez dowolny skalar i zamiany dwóch wierszy miejscami, z których pierwsza
nie zmienia wyznacznika, a druga zmienia na przeciwny, możemy sprowadzić
macierz do postaci „górnej trójkątnej”, a wyznacznik tej ostatniej już bardzo
łatwo obliczyć mnożąc po prostu wyrazy z jej głównej przekątnej.

Przykład. Przy użyciu operacji elementarnych na wierszach macierz







2 3 1 1
2 3 4 2
4 7 5 6
2 4 7 8







można przekształcić w macierz „górną trójkątną”







2 3 1 1
0 1 3 4
0 0 3 1
0 0 0 2







zamieniając po drodze dwa wiersze miejscami jeden raz. Zatem wyznacznik
rozpatrywanej macierzy jest równy −2 · 1 · 3 · 2, czyli −12.

Wzór Bineta-Cauchy’ego

Sformułujemy i udowodnimy teraz tak zwany wzór Bineta-Cauchy’ego na

wyznacznik iloczynu macierzy.

Twierdzenie. Niech K będzie ciałem, a p, q ∈ N. Wtedy dla dowolnych

A ∈ M

p×q

(K) i B ∈ M

q×p

(K)

det(BA) =

<...<l

det[B

. . . B

] · det





...



 ,

przy czym A

, . . . , A

i B

, . . . , B

oznaczają odpowiednio wiersze macierzy

A i kolumny macierzy B, a sumuje się po wszystkich l

, . . . , l

∈ {1, . . . , p}

takich, że l

< . . . < l

Dowód: Oznaczmy przez a

i b

wyrazy macierzy odpowiednio A i B.

Wyraz macierzy BA leżący na przecięciu k-tego wiersza i i-tej kolumny jest
równy

p
j=1

, czyli i-ta kolumna macierzy BA jest równa

p
j=1

Zatem det(BA) = det[

p
j

, . . . ,

p
j

]. Lecz wyznacznik

macierzy z M

q×q

(K) jest q-liniową funkcją jej kolumn, dlatego det(BA) =

p
j

,...,j

. . . a

det[B

, . . . , B

]. Następnie, ponieważ funkcja ta jest

antysymetryczna oraz każdy różnowartościowy ciąg j

, . . . , j

można jedno-

znacznie zapisać jako l

σ(1)

, . . . , l

σ(q)

, gdzie l

< . . . < l

i σ ∈ S

, dostajemy

równości det(BA) =

<...<l

σ∈S

σ(1)

. . . a

σ(q)

det[B

σ(1)

, . . . , B

σ(q)

] =

<...<l

det[B

, . . . , B

]

σ∈S

sgn σ a

σ(1)

. . . a

σ(q)

, a więc twierdzenie jest

udowodnione, bo

σ∈S

sgn σ a

σ(1)

. . . a

σ(q)

to nic innego, tylko wyznacznik

macierzy o wierszach A

, . . . , A

Przykład. Ze wzoru Bineta-Cauchy’ego mamy

det





8 1 7
9 0 6





0 1
5 4
3 2







 =

8 1
9 0

0 1
5 4

¯ +

8 7
9 6

0 1
3 2

¯ +

1 7
0 6

5 4
3 2

¯ .

Zauważmy, że gdy p < q, to prawa strona wzoru Bineta-Cauchy’ego jest

równa 0, bo nie ma wtedy silnie rosnących q-elementowych ciągów liczb z
{1, . . . , p}. Natomiast dla p = q mamy bardzo ważny przypadek szczególny
nazywany wzorem Cauchy’ego i przedstawiony w poniższym wniosku.

Wniosek. Niech K będzie ciałem, a n ∈ N. Wtedy

det(BA) = det B · det A

dla dowolnych A, B ∈ M

n×n

(K).

Twierdzenie. Niech K będzie ciałem, a n ∈ N. Dla A ∈ M

n×n

(K)

następujące warunki są równoważne

1) A jest odwracalna,
2) istnieje taka B ∈ M

n×n

(K), że BA = I,

3) istnieje taka B ∈ M

n×n

(K), że AB = I,

4) det A 6= 0,
5) rz A = n.

Dowód: Oczywiście z 1) wynikają 2) i 3). Gdy zachodzi 2) lub 3), to

na podstawie wzoru Cauchy’ego zachodzi 4). Z 4) wynika, że kolumny A
są liniowo niezależne, czyli 5). Niech f : K

−→ K

oznacza endomorfizm,

który ma w bazie kanonicznej macierz A. Warunek 5) mówi, że rz f = n,
czyli f jest epimorfizmem, a więc i izomorfizmem. Zatem A jest odwracalna,
bo macierzą do niej odwrotną jest macierz f

−1

w bazie kanonicznej, i tym

samym z 5) wynika 1).

Macierze, które spełniają równoważne warunki z powyższego twierdzenia

nazywa się nieosobliwymi, a pozostałe macierze kwadratowe osobliwymi. A
więc grupa GL(n, K) składa się z tych macierzy algebry M

n×n

(K), które są

nieosobliwe.

Odnotujmy jeszcze jeden wniosek ze wzoru Cauchy’ego.

Wniosek. Niech K będzie ciałem, a n ∈ N. Dla A ∈ GL(n, K) mamy

det A

−1

det A

Wyznacznik endomorfizmu

Definicja. Wyznacznikiem endomorfizmu f : U −→ U skończenie wy-

miarowej przestrzeni wektorowej U nazywa się wyznacznik jego macierzy w
dowolnej bazie (tej samej w dziedzinie i przeciwdziedzinie). Wzór Cauchy’ego
gwarantuje, że taka definicja jest poprawna, to znaczy nie zależy od wyboru
bazy, bo gdy u

, . . . , u

i u

, . . . , u

są bazami U, A i A

macierzami f w bazie

odpowiednio u

, . . . , u

i u

, . . . , u

, a P macierzą przejścia od u

, . . . , u

, to det A

= det(P

−1

AP ) = (1/ det P ) det A det P = det A.

Bezpośrednio z twierdzeń o wyznacznikach macierzy możemy wyciągnąć

następujące wnioski o wyznacznikach endomorfizmów.

Wniosek. Dla dowolnych endomorfizmów f i g skończenie wymiarowej

przestrzeni wektorowej U

det(g ◦ f ) = det g · det f.

Wniosek. Dla endomorfizmu f n-wymiarowej przestrzeni wektorowej

następujące warunki są równoważne

1) f jest automorfizmem,
2) det f 6= 0,
3) rz f = n.

Wniosek. Dla automorfizmu f skończenie wymiarowej przestrzeni wek-

torowej mamy

det(f

−1

) =

det f

Rozwinięcie Laplace’a

Definicja. Przypuśćmy, że K jest ciałem, p, q, r ∈ N, A jest macierzą

z M

q×p

(K) o wyrazach a

, i

, . . . , i

∈ {1, . . . , p} są takie, że i

< . . . < i

i j

, . . . , j

∈ {1, . . . , q} są takie, że j

< . . . < j

. Wyznacznik macierzy

z M

r×r

(K) o wyrazach a

, gdzie k, l ∈ {1, . . . , r}, nazywa się minorem

stopnia r macierzy A. Inaczej mówiąc, taki minor to wyznacznik macierzy
powstałej z A przez skreślenie wszystkich wierszy oprócz tych o numerach
j

, . . . , j

i wszystkich kolumn oprócz tych o numerach i

, . . . , i

Przykład. Macierz

3 1 2
7 4 5

ma 3 minory drugiego stopnia, mianowicie

3 1
7 4

¯ ,

3 2
7 5

¯ ,

1 2
4 5

¯ ,

a 12 minorów pierwszego stopnia (są to po prostu wyrazy tej macierzy).

Ogólnie macierz z M

q×p

(K) ma

q
r

p
r

minorów stopnia r.

Udowodnimy teraz wzór na wyznacznik macierzy kwadratowej nazywany

rozwinięciem Laplace’a wyznacznika względem l-tego wiersza.

Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A macierzą z M

n×n

(K) o

wyrazach a

, to dla każdego l ∈ {1, . . . , n}

det A =

k=1

(−1)

l+k

gdzie A

oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie

jej l-tego wiersza i k-tej kolumny.

Dowód: Niech f : M

n×n

(K) −→ K będzie odwzorowaniem przyjmującym

na macierzach A wartości równe prawej stronie wzoru, który właśnie mamy
dowieść. Gdy wykażemy, że f (A) jest n-liniową i antysymetryczną funkcją
kolumn macierzy A i że f (I) = 1, to dostaniemy równość f (A) = det A dla
każdej A z M

n×n

(K), co zakończy dowód. Ponieważ A

jest (n − 1)-liniową

funkcją wszystkich oprócz k-tej kolumn macierzy A, to a

jest n-liniową

funkcją wszystkich kolumn macierzy A i w konsekwencji jest taką funkcją
również f . Gdy kolumny i-ta i j-ta macierzy A są jednakowe dla i < j,
to A

= 0, jeśli tylko k 6= i i k 6= j, zaś (−1)

l+i

i (−1)

l+j

są

wzajemnie przeciwne, bo a

= a

, a oznaczając przez A

, . . . , A

kolumny

macierzy A z opuszczonymi wyrazami z l-tego wiersza widzimy, że A

i A

to wyznaczniki macierzy odpowiednio [A

. . . A

i−1

i+1

. . . A

j−1

. . . A

]

i [A

. . . A

i−1

i+1

. . . A

j−1

. . . A

], przy czym jedna powstaje z drugiej

drogą j − i − 1 transpozycji kolumn. W takim razie f jest antysymetryczne.
Wreszcie sprawdzenie, że f (I) = 1, jest trywialne.

Transponowanie macierzy kwadratowej nie zmienia jej wyznacznika, więc

ostatnie twierdzenia możemy przeformułować tak, by otrzymać rozwinięcie
Laplace’a wyznacznika względem k-tej kolumny.

Twierdzenie. Jeżeli K jest ciałem, n ∈ N, a A macierzą z M

n×n

(K) o

wyrazach a

, to dla każdego k ∈ {1, . . . , n}

det A =

l=1

(−1)

l+k

gdzie A

oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie

jej l-tego wiersza i k-tej kolumny.

Przykład. Oto rozwinięcie Laplace’a względem drugiego wiersza:

3 2 6 4
1 0 7 5
4 1 2 8
2 3 4 6

= −1

2 6 4
1 2 8
3 4 6

+ 0

3 6 4
4 2 8
2 4 6

− 7

3 2 4
4 1 8
2 3 6

+ 5

3 2 6
4 1 2
2 3 4

Widać, że rozwinięcie Laplace’a sprowadza obliczenie wyznacznika n × n

do obliczenia n wyznaczników (n − 1) × (n − 1).

Ćwiczenie. Niech K będzie ciałem, n ∈ N, x

, . . . , x

∈ K. Wykazać, że

. . .

...

n−1

. . . x

n−1

i<j

− x

przy czym po prawej stronie występuje iloczyn

czynników indeksowanych

takimi parami (i, j) ∈ {1, . . . , n}

, że i < j. Wyznacznik po lewej stronie

nazywa się wyznacznikiem Vandermonde’a.

Wskazówka: dowód powyższego wzoru można przeprowadzić w pięciu

następujących krokach: odjąć pierwszą kolumnę od pozostałych; rozwinąć
wyznacznik względem pierwszego wiersza; wykorzystując wzór skróconego
mnożenia a

− b

= (a − b)(a

k−1

+ a

k−2

b + . . . + ab

k−2

+ b

k−1

) wyłączyć z

wyznacznika czynniki x

− x

, . . . , x

− x

; od wierszy kolejno od ostatniego

do drugiego odejmować wiersz poprzedni pomnożony przez x

; zastosować

indukcję względem n.

Odwracanie macierzy

Twierdzenie. Niech K będzie ciałem, n ∈ N i niech A będzie macierzą

z GL(n, K) o wyrazach a

. Wtedy wyraz macierzy A

−1

leżący na przecięciu

j-tego wiersza i i-tej kolumny jest równy

(−1)

j+i

det A,

gdzie A

oznacza minor macierzy A stopnia n − 1 powstały przez skreślenie

jej i-tego wiersza i j-tej kolumny.

Dowód: Leżący na przecięciu k-tego wiersza i i-tej kolumny wyraz ilo-

czynu macierzy A i macierzy o wyrazach opisanych w tezie twierdzenia jest
równy

n
j=1

(−1)

j+i

/ det A. Lecz

n
j=1

(−1)

i+j

to rozwinięcie

Laplace’a względem i-tego wiersza wyznacznika macierzy powstałej z A przez
zastąpienie jej i-tego wiersza jej k-tym wierszem. Taki wyznacznik jest równy
det A, gdy k = i, a 0, gdy k 6= i. Oznacza to, że iloczyn macierzy A i macierzy
o wyrazach opisanych w tezie twierdzenia jest równy macierzy jednostkowej,
więc czynniki w tym iloczynie są macierzami wzajemnie odwrotnymi.

Dopełnieniem algebraicznym wyrazu a

kwadratowej macierzy A nazywa

się skalar stojący przy a

w rozwinięciu Laplace’a wyznacznika A względem

j-tego wiersza lub i-tej kolumny, czyli skalar (−1)

j+i

, gdzie A

oznacza

minor macierzy A stopnia n − 1 powstały przez skreślenie jej j-tego wiersza
i i-tej kolumny. Ostatnie twierdzenie mówi więc, że wyrazy macierzy A

−1

dopełnienia algebraiczne odpowiednich wyrazów macierzy transponowanej
do A podzielone przez wyznacznik A. Natomiast macierz o takich wyrazach,
ale nie podzielonych przez det A nazywa się macierzą dołączoną do A (zatem
macierz dołączona do nieosobliwej macierzy A to (det A)A

−1

Przykład. Korzystając z ostatniego twierdzenia odwrócimy macierz

A =





1 3 2
2 4 1
2 5 1





o wyrazach rzeczywistych. Ponieważ det A = 3 6= 0, więc A jest odwracalna.

Obliczamy macierz jej minorów stopnia 2







4 1
5 1

2 1
2 1

2 4
2 5

3 2
5 1

1 2
2 1

1 3
2 5

3 2
4 1

1 2
2 1

1 3
2 4











−1

−7 −3 −1
−5 −3 −2



 .

Zmieniamy znaki tak, by otrzymać macierz dopełnień algebraicznych A





−1

−3

−5

−2



 .

Otrzymaną macierz transponujemy i dostajemy macierz dołączoną do A





−1

−5

−3

−2



 .

Dzielimy ją przez wyznacznik A i mamy macierz odwrotną do A





−

1
3

7
3

−

5
3

−1

2
3

1
3

−

2
3



 .

Widać, że odwrócenie taką metodą macierzy n × n wymaga obliczenia

jednego wyznacznika n × n i n

wyznaczników (n − 1) × (n − 1).

Rząd macierzy a jej minory

Udowodnimy teraz użyteczne kryterium pozwalające stwierdzić jaki jest

rząd macierzy na podstawie znajomości jej minorów.

Twierdzenie. Macierz ma rząd równy r wtedy i tylko wtedy, gdy istnieje

jej minor stopnia r różny od 0, ale każdy jej minor stopnia większego od r
jest równy 0.

Dowód: Niech K będzie ciałem, p, q ∈ N i niech A ∈ M

q×p

(K). Ustalmy

, . . . , i

∈ {1, . . . , p} takie, że i

< . . . < i

. Teza twierdzenia stanie się

oczywista, jeśli tylko wykażemy, że kolumny macierzy A o numerach i

, . . . , i

są liniowo zależne wtedy i tylko wtedy, gdy dla każdych j

, . . . , j

∈ {1, . . . , q}

takich, że j

< . . . < j

, minor macierzy A otrzymany w wyniku skreślenia

wszystkich wierszy oprócz tych o numerach j

, . . . , j

i wszystkich kolumn

oprócz tych o numerach i

, . . . , i

jest równy 0. Ale gdy kolumny A

, . . . , A

macierzy A są liniowo zależne, to dla każdych j

, . . . , j

∈ {1, . . . , q} takich,

że j

< . . . < j

, liniowo zależne są również kolumny A

, . . . , A

powstałe

z A

, . . . , A

przez opuszczenie wyrazów ze wszystkich wierszy o numerach

innych niż j

, . . . , j

, więc faktycznie det[A

. . . A

] = 0. Odwrotnie, gdy

wszystkie takie minory są równe 0, to znaczy, że wśród wierszy macierzy
[A

. . . A

] nie ma k liniowo niezależnych, czyli jej rząd jest mniejszy niż k,

czyli jej kolumny A

, . . . , A

są liniowo zależne.

Przykład. Na podstawie ostatniego twierdzenia





1 2 4 3
1 3 5 5
2 5 9 8



 = 2

(przyjmujemy, że ciałem skalarów jest tu R), bo

1 2 4
1 3 5
2 5 9

= 0,

1 2 3
1 3 5
2 5 8

= 0,

1 4 3
1 5 5
2 9 8

= 0,

2 4 3
3 5 5
5 9 8

= 0,

ale na przykład

1 2
1 3

¯ = 1 6= 0.

Twierdzenie Kroneckera-Capelliego

Niech K będzie ciałem, a p, q ∈ N. Rozważmy układ równań liniowych

+ . . . + a

= b

...

+ . . . + a

= b

gdzie a

, . . . a

, . . . , a

, b

, . . . , b

∈ K.

Zajmiemy się najpierw problemem istnienia rozwiązania, czyli istnienia

takiego ciągu (x

, . . . , x

) z K

, dla którego ten układ równań jest spełniony.

Wygodnie będzie zapisywać nasz układ równań liniowych w następującej

(oczywiście równoważnej) postaci macierzowej

Ax = b,

gdzie

A =





. . . a

...

. . . a



 , x =





...



 , b =





...



 .

A nazywa się w tej sytuacji macierzą główną układu równań liniowych, zaś
macierz [A b] należącą do M

q×(p+1)

(K) i otrzymaną z macierzy głównej przez

dopisanie jako ostatniej kolumny macierzy b wyrazów wolnych nazywa się
macierzą rozszerzoną.

Poniższe twierdzenie Kroneckera-Capelliego podaje warunek konieczny i

wystarczający do istnienia rozwiązania układu równań liniowych.

Twierdzenie. Układ równań liniowych

Ax = b,

gdzie A ∈ M

q×p

(K), b ∈ M

q×1

(K), natomiast K jest dowolnym ciałem, ma

rozwiązanie x należące do M

p×1

(K) wtedy i tylko wtedy, gdy

rz [A b] = rz A,

czyli wtedy i tylko wtedy, gdy rzędy macierzy głównej i macierzy rozszerzonej
tego układu są sobie równe.

Dowód: Niech A

, . . . , A

oznaczają kolumny macierzy A. Od razu widać,

że x jest rozwiązaniem układu równań Ax = b wtedy i tylko wtedy, gdy
x

+ . . . + x

= b. Zatem istnienie rozwiązania naszego układu jest

równoważne temu, że b można zapisać w postaci kombinacji liniowej kolumn
A

, . . . , A

, czyli temu, że b ∈ lin {A

, . . . , A

}, a to jest równoważne temu,

że lin {A

, . . . , A

, b} = lin {A

, . . . , A

}, czyli że dim lin {A

, . . . , A

, b} =

dim lin {A

, . . . , A

}, a więc że rz [A b] = rz A.

Wzory Cramera

Wyprowadzimy teraz wzory Cramera dające w jawnej postaci rozwiązanie

układu równań liniowych o jednakowej ilości równań i niewiadomych oraz
różnym od 0 wyznaczniku macierzy głównej.

Twierdzenie. Załóżmy, że K jest ciałem, n ∈ N, A ∈ M

n×n

(K), a

b ∈ M

n×1

(K). Jeżeli det A 6= 0, to układ równań liniowych

Ax = b

ma dokładnie jedno rozwiązanie x ∈ M

n×1

(K). Wyraża się ono wzorami

det[A

. . . A

j−1

b A

j+1

. . . A

]

det A

dla j ∈ {1, . . . , n}, przy czym A

, . . . , A

oznaczają kolumny macierzy A.

Dowód: Ponieważ det A 6= 0, to macierz A jest odwracalna. Mnożąc obie

strony równania Ax = b z lewej strony przez A

−1

widzimy, że ma ono do-

kładnie jedno rozwiązanie x = A

−1

b. Jak wiemy, wyraz macierzy A

−1

leżący

na przecięciu j-tego wiersza i i-tej kolumny jest równy (−1)

j+i

/ det A,

gdzie A

oznacza minor macierzy A powstały przez skreślenie jej i-tego

wiersza i j-tej kolumny. Zatem mamy x

n
i=1

((−1)

j+i

/ det A)b

. Z

drugiej strony rozwinięcie Laplace’a względem j-tej kolumny daje równość
det[A

. . . A

j−1

b A

j+1

. . . A

] =

n
i=1

(−1)

i+j

, na podstawie której jest

już widoczna teza twierdzenia.

Przykład. Rozważmy układ równań liniowych

+3x

= 3,

+2x

= 4,

+3x

+2x

= 5,

który ma rzeczywiste współczynniki. Wyznacznik macierzy głównej

1 3 1
1 2 2
2 3 2

jest równy 3, więc możemy stosować wzory Cramera. Obliczamy każdą nie-
wiadomą dzieląc przez wyznacznik macierzy głównej wyznacznik macierzy

powstałej w wyniku zastąpienia odpowiedniej kolumny w macierzy głównej
kolumną wyrazów wolnych:

3 3 1
4 2 2
5 3 2

2
3

1 3 1
1 4 2
2 5 2

1
3

1 3 3
1 2 4
2 3 5

4
3

Kolejny przykład pokazuje jak używając wzorów Cramera i twierdzenia

Kroneckera-Capelliego rozwiązać układ równań liniowych z parametrem.

Przykład. Rozważmy układ równań liniowych

+ax

= 4,

+3x

+ax

= 6,

+4x

+3x

= 5,

który ma rzeczywiste współczynniki i w którym a jest parametrem. Ponieważ

1 a 1
1 3 a
1 4 3

= (2 − a)(5 − a),

to dla każdego a ∈ R\{2, 5} układ ma dokładnie jedno rozwiązanie. Ponadto
¯

4 a 1
6 3 a
5 4 3

= (9 − 5a)(5 − a),

1 4 1
1 6 a
1 5 3

= 5 − a,

1 a 4
1 3 6
1 4 5

= −5 + a,

zatem według wzorów Cramera rozwiązaniem tym jest x

= (9 − 5a)/(2 − a),

= 1/(2 − a), x

= −1/(2 − a). Dla a = 2 pierwszy z czterech powyższych

wyznaczników jest równy 0, więc macierz główna ma rząd mniejszy niż 3, ale
wśród pozostałych istnieje różny od 0, więc macierz rozszerzona ma rząd 3.
Zgodnie z twierdzeniem Kroneckera-Capelliego układ jest w tym przypadku
sprzeczny. Natomiast dla a = 5 wszystkie cztery wyznaczniki są równe 0, ale
w macierzy głównej można znaleźć różny od 0 minor stopnia 2, na przykład
pomijając trzeci wiersz i trzecią kolumnę dostajemy

1 5
1 3

¯ = −2.

Oznacza to, że macierze główna i rozszerzona mają jednakowy rząd równy 2
i zgodnie z twierdzeniem Kroneckera-Capelliego w tym przypadku układ ma
rozwiązanie. Co więcej, skoro znaleziony różny od 0 minor stopnia 2 mieści
się w obrębie pierwszego i drugiego wiersza, to pierwsze i drugie równanie
układu są liniowo niezależne, więc trzecie musi być od nich zależne i można
je pominąć. Dla a = 5 mamy więc układ

+5x

= 4,

+3x

+5x

= 6,

który najłatwiej rozwiązać metodą Gaussa. Ale można go też przepisać jako

+5x

−x

+4,

+3x

= −5x

+6,

a następnie traktując x

jako parametr obliczyć ze wzorów Cramera x

i x

bo jak już wiemy odpowiedni wyznacznik jest równy −2, czyli różny od 0.
Dostajemy w ten sposób

−x

+ 4

−5x

+ 6 3

−2

= −11x

+ 9,

−x

+ 4

1 −5x

+ 6

−2

= 2x

− 1.

A zatem w przypadku a = 5 wyjściowy układ równań ma nieskończenie wiele
rozwiązań. Każde z nich jest trójką x

, x

, gdzie x

i x

są określone

powyższymi wzorami z dowolnym rzeczywistym x

Algebra zewnętrzna

Przypomnijmy, że charakterystyką ciała K nazywa się najmniejszą liczbę

całkowitą dodatnią m taką, że w K suma 1+. . .+1 o m składnikach jest równa
0, a jeżeli taka m nie istnieje, to mówi się, że charakterystyka K jest równa
0. Na przykład dla każdej liczby pierwszej p ciało Z

ma charakterystykę p,

a Q, R, C mają charakterystykę 0. W dowolnym ciele K dla każdej liczby
całkowitej dodatniej m sumę 1 + . . . + 1 o m składnikach oznacza się przez
m, więc jeśli K ma charakterystykę 0, to istnieje element ciała K odwrotny
do m oznaczany przez 1/m (w Q, R, C jest to zwykła liczba wymierna 1/m).

Niech U będzie przestrzenią wektorową nad ciałem K, a r ∈ N. Każde

odwzorowanie U × . . . × U −→ K r-liniowe i antysymetryczne nazywa się r-
formą na U. Oznaczmy przestrzeń wektorową wszystkich r-form na U przez
Ω

(U) (czyli Ω

(U) = L

(U, K)).

Załóżmy teraz, że K ma charakterystykę 0. Dla r-formy α i s-formy β

na U definiujemy ich iloczyn zewnętrzny α ∧ β : U × . . . × U −→ K wzorem

(α ∧ β)(u

, . . . , u

r+s

) =

r! s!

σ∈S

r+s

sgn σ α(u

σ(1)

, . . . , u

σ(r)

) β(u

σ(r+1)

, . . . , u

σ(r+s)

)

dla dowolnych u

, . . . , u

r+s

∈ U.

Twierdzenie. Tak określone α ∧ β jest (r + s)-formą na U, a

Ω

(U) × Ω

(U) 3 (α, β) −→ α ∧ β ∈ Ω

r+s

(U)

jest dwuliniowe.

Dowód: Weźmy u

, . . . , u

r+s

∈ U takie, że u

= u

dla pewnych i, j

takich, że i < j. Wtedy ϕ : T 3 σ −→ (i, j) ◦ σ ∈ S

r+s

\ T , gdzie T =

{σ ∈ S

r+s

: σ

−1

(i) < σ

−1

(j)}, jest bijekcją oraz (u

(ϕ(σ))(1)

, . . . , u

(ϕ(σ))(r+s)

) =

σ(1)

, . . . , u

σ(r+s)

) i sgn (ϕ(σ)) = −sgn σ dla każdej σ ∈ T . Dlatego dla

każdej σ ∈ T w sumie

σ∈S

r+s

sgn σ α(u

σ(1)

, . . . , u

σ(r)

) β(u

σ(r+1)

, . . . , u

σ(r+s)

)

znoszą się wzajemnie składniki o indeksach ϕ(σ) i σ. Dowodzi to pierwszej
części twierdzenia. Druga jest trywialna.

Twierdzenie. Mnożenie zewnętrzne jest łączne, to znaczy

(α ∧ β) ∧ γ = α ∧ (β ∧ γ)

dla dowolnych α ∈ Ω

(U), β ∈ Ω

(U), γ ∈ Ω

(U).

Dowód: Lewa strona dowodzonej równości na ciągu (u

, . . . , u

r+s+t

) jest

równa 1/(r! s! (r + s)! t!)

σ∈S

r+s+t

τ ∈S

r+s

sgn σ sgn τ α(u

σ(τ (1))

, . . . , u

σ(τ (r))

)

β(u

σ(τ (r+1))

, . . . , u

σ(τ (r+s))

) γ(u

σ(r+s+1)

, . . . , u

σ(r+s+t)

). Jednak każdą τ z S

r+s

możemy także uważać za permutację z S

r+s+t

przyjmując τ |

{r+s+1,...,r+s+t}

i wtedy S

r+s+t

3 σ −→ σ ◦ τ ∈ S

r+s+t

jest bijekcją. Dlatego

((α ∧ β) ∧ γ)(u

, . . . , u

r+s+t

) =

r! s! t!

σ∈S

r+s+t

sgn σ α(u

σ(1)

, . . . , u

σ(r)

) β(u

σ(r+1)

, . . . , u

σ(r+s)

) γ(u

σ(r+s+1)

, . . . , u

σ(r+s+t)

Podobnie pokazuje się, że (α ∧(β ∧γ))(u

, . . . , u

r+s+t

) wyraża się tym samym

wzorem, więc twierdzenie jest udowodnione.

Ćwiczenie. Naśladując ostatni dowód wykazać przez indukcję ze względu

na r, że dla dowolnych α

, . . . , α

∈ U

∗

i u

, . . . , u

∈ U

(α

∧ . . . ∧ α

)(u

, . . . , u

) =

) . . . α

)

...

) . . . α

)

Twierdzenie. Dla dowolnych α ∈ Ω

(U), β ∈ Ω

(U)

β ∧ α = (−1)

α ∧ β.

Dowód: Lewa strona dowodzonej równości na (u

, . . . , u

r+s

) jest równa

σ∈S

r+s

sgn σ β(u

σ(τ (r+1))

, . . . , u

σ(τ (r+s))

) α(u

σ(τ (1))

, . . . , u

σ(τ (r))

), gdzie

τ =

. . .

r + 1 . . . r + s

s + 1 . . . s + r

. . .

a ponieważ S

r+s

3 σ −→ σ ◦ τ ∈ S

r+s

jest bijekcją i sgn τ = (−1)

, to widać,

że taka jest też prawa strona dowodzonej równości na (u

, . . . , u

r+s

), więc

twierdzenie jest udowodnione.

Załóżmy teraz, że przestrzeń wektorowa U nad ciałem K charakterystyki

0 ma skończony wymiar n. Wówczas Ω

(U) = {0} dla każdego r ≥ n + 1.

Oznaczmy

Ω(U) = Ω

(U) × . . . × Ω

(U)

(przy czym Ω

(U) to po prostu K). Zatem Ω(U) jako iloczyn kartezjański

n + 1 przestrzeni wektorowych nad K też jest przestrzenią wektorową nad
K. Ponadto dim Ω(U) =

n
r=0

dim Ω

(U) =

n
r=0

= (1 + 1)

, czyli

dim Ω(U) = 2

W dalszym ciągu wygodnie nam będzie zapisywać wektory z Ω(U) w postaci
α

+ . . . + α

lub

n
r=0

zamiast w postaci (α

, . . . , α

) (sprowadza się to

do utożsamienia dla każdego r ∈ {0, . . . , n} przestrzeni Ω

(U) z jej obrazem

przez monomorfizm Ω

(U) 3 α

−→ (0, . . . , 0, α

, 0, . . . , 0) ∈ Ω(U); przy

takiej interpretacji Ω(U) = Ω

(U) ⊕ . . . ⊕ Ω

(U)).

Dla dowolnych α

, β

∈ Ω

(U), . . . , α

, β

∈ Ω

(U) definiujemy iloczyn

zewnętrzny

n
r=0

n
s=0

wzorem

(

r=0

) ∧ (

s=0

) =

t=0

(

i=0

∧ β

t−i

Twierdzenie. Jeżeli U jest przestrzenią wektorową skończonego wymiaru

nad ciałem K charakterystyki 0, to przestrzeń wektorowa Ω(U) z mnożeniem
zewnętrznym Ω(U) × Ω(U) 3 (α, β) −→ α ∧ β ∈ Ω(U) jest algebrą z jedynką
nad K.

Dowód: Łączność mnożenia zewnętrznego na Ω(U) wynika bezpośrednio

z udowodnionej łączności mnożenia zewnętrznego form, natomiast warunki
2) i 3) z definicji algebry to nic innego jak dwuliniowość mnożenia, a jak łatwo
zauważyć, mnożenie zewnętrzne jest dwuliniowe. Jedynką algebry Ω(U) jest
jedynka ciała K, które traktujemy jako podprzestrzeń Ω

(U) w Ω(U).

Powyższą algebrę Ω(U) nazywa się algebrą zewnętrzną.

Ćwiczenie. Zauważyć, że algebra Ω(U) jest przemienna wtedy i tylko

wtedy, gdy dim U ≤ 1 (wynika to ze wzoru, który już udowodniliśmy).

Twierdzenie. Jeżeli e

, . . . , e

jest bazą przestrzeni wektorowej U, to

∗

∧ . . . ∧ e

∗

gdzie r ∈ {0, . . . , n} i j

, . . . , j

∈ {1, . . . , n} spełniają warunek j

< . . . < j

tworzą bazę Ω(U).

Dowód: Wystarczy połączyć znajomość bazy iloczynu kartezjańskiego lub

sumy prostej ze znajomością bazy przestrzeni wektorowych L

(U, K) oraz

zauważyć, że dla wszystkich l

, . . . , l

∈ {1. . . . , n} spełniających warunek

< . . . < l

zachodzi

∗

∧ . . . ∧ e

∗

)(e

, . . . , e

) =

1, gdy (l

, . . . , l

) = (j

, . . . , j

0, gdy (l

, . . . , l

) 6= (j

, . . . , j

co jest oczywiste na podstawie przedostatniego ćwiczenia.

Na koniec warto jeszcze zwrócić uwagę, że chociaż mnożenie zewnętrzne

wydaje się skomplikowane, to wykonuje się je bardzo łatwo i naturalnie,
gdy zapisuje się elementy algebry zewnętrznej w bazie, która jest opisana
w ostatnim twierdzeniu. Wystarczy wówczas przy mnożeniu pamiętać tylko
o tym, że mnożenie zewnętrzne jest dwuliniowe i łączne, a odwzorowanie
Ω

(U)×. . .×Ω

(U) 3 (α

, . . . , α

) −→ α

∧. . .∧α

∈ Ω

(U) antysymetryczne.

Przykład. Niech e

, e

oznacza bazę kanoniczną R

. Chcemy obliczyć

iloczyn elementów 3 + 4e

∗

+ e

∗

∧ e

∗

i e

∗

+ 2e

∗

∧ e

∗

w algebrze zewnętrznej

Ω(R

). Możemy to zrobić następująco: (3 + 4e

∗

+ e

∗

∧ e

∗

) ∧ (e

∗

+ 2e

∗

∧ e

∗

) =

∗

+ 6e

∗

∧ e

∗

+ 4e

∗

∧ e

∗

+ 8e

∗

∧ e

∗

∧ e

∗

+ e

∗

∧ e

∗

∧ e

∗

+ 2e

∗

∧ e

∗

∧ e

∗

∧ e

∗

+ 6e

∗

∧ e

∗

− 4e

∗

∧ e

∗

+ e

∗

∧ e

∗

∧ e

∗

= 3e

∗

+ 2e

∗

∧ e

∗

+ e

∗

∧ e

∗

∧ e

∗

Wielomian charakterystyczny macierzy i endomorfizmu

Przypomnijmy, że wielomianem jednej zmiennej o współczynnikach z

ciała K nazywa się każdy ciąg (a

)

i∈N

, gdzie a

, a

, . . . ∈ K, dla którego

istnieje liczba całkowita dodatnia d taka, że a

= 0 dla każdego i > d. Jeśli

wielomian nie jest ciągiem stałym równym 0, to najmniejszą taką d nazywa
się jego stopniem. Zbiór wielomianów jednej zmiennej o współczynnikach z K
będziemy oznaczać przez K[X]. Zbiór K[X] jest pierścieniem przemiennym
z jedynką z działaniami, które formalnie definiuje się wzorami

)

i∈N

+ (b

)

i∈N

= (a

+ b

)

i∈N

)

i∈N

)

i∈N

= (

i
j=0

i−j

)

i∈N

Jest on nawet algebrą przemienną z jedynką nad K, jeśli dodatkowo przyjąć
α(a

)

i∈N

= (αa

)

i∈N

, ale mnożenie wielomianów przez skalary to właściwie

szczególny przypadek mnożenia wielomianów, bo dowolny skalar α utożsa-
mia się z wielomianem (αδ

)

i∈N

. Ponadto oznaczając X = (δ

)

i∈N

możemy

dowolny wielomian (a

)

i∈N

zapisać w postaci a

+ a

X + a

+ . . . + a

Zwykle stosuje się właśnie taki zapis i wówczas wszystkie powyższe działania
wykonuje się całkiem zwyczajnie, tak jak w szkole na wielomianach z R[X].

W następnej definicji będzie potrzebny wyznacznik macierzy o wyrazach

z K[X]. Wyznaczniki takich macierzy (i macierzy o wyrazach z dowolnego
pierścienia przemiennego z jedynką), jak również same takie macierze oraz
działania na nich, definiuje się tak samo jak poprzednio, zastepując tylko K
przez K[X] (lub inny pierścień przemienny z jedynką).

Definicja. Niech K będzie ciałem, n ∈ N, natomiast A ∈ M

n×n

(K).

Wielomianem charakterystycznym macierzy A nazywa się wielomian z K[X]
określony wzorem

(X) = det(A − XI),

przy czym A i macierz jednostkową I z M

n×n

(K) traktuje się jako macierze

z M

n×n

(K[X]) utożsamiając w oczywisty (i wspomniany wcześniej) sposób

skalary z K z wielomianami stałymi z K[X].

Przykład. Obliczymy wielomian charakterystyczny macierzy

A =





3 2 4
3 2 1
5 4 3





z M

3×3

(R). Mamy

(X) = det









3 2 4
3 2 1
5 4 3



 − X





1 0 0
0 1 0
0 0 1







 =

3 − X

2 − X

3 − X

= (3 − X)(2 − X)(3 − X) + 2 · 1 · 5 + 4 · 3 · 4

−4(2 − X)5 − (3 − X)1 · 4 − 2 · 3(3 − X) = 6 + 9X + 8X

− X

Twierdzenie. Wielomian charakterystyczny macierzy A z M

n×n

(K) o

wyrazach a

jest równy w

+ w

X + w

+ . . . + w

, gdzie

n−k

= (−1)

n−k

<...<i

. . . a

...

. . . a

dla każdego k ∈ {0, . . . , n} (w powyższym wzorze sumuje się po wszystkich
i

, . . . , i

∈ {1, . . . , n} spełniających warunek i

< . . . < i

Dowód: Wyznacznik macierzy o wyrazach z K[X] jest antysymetryczną

funkcją wieloliniową jej kolumn, przy czym jednorodność zachodzi nie tylko
względem skalarów z K, ale również względem dowolnych elementów z K[X].

Dlatego oznaczając kolumny macierzy A i I przez A

, . . . , A

i I

, . . . , I

oraz

wykorzystując liniowość ze względu na pierwszą kolumnę możemy napisać
W

(X) = det[A

− XI

, . . . , A

− XI

] = det[A

, A

− XI

, . . . , A

− XI

] −

X det[I

, A

− XI

, . . . , A

− XI

]. Podobnie można wykorzystać liniowość

ze względu na pozostałe kolumny i stwierdzić, że współczynnik w

przy X

jest pomnożoną przez (−1)

sumą po j

, . . . , j

∈ {1, . . . , n} spełniających

warunek j

< . . . < j

wyznaczników macierzy powstałych z A przez zastą-

pienie jej kolumn A

, . . . , A

kolumnami I

, . . . , I

. Rozwinięcie każdego

z tych wyznaczników po kolei względem kolumn o numerach j

, . . . , j

daje

natychmiast wzory, które mieliśmy udowodnić.

Wniosek. Wielomian charakterystyczny w

+ w

X + w

+ . . . + w

macierzy A z M

n×n

(K) ma stopień n oraz

= det A,

n−1

= (−1)

n−1

tr A,

= (−1)

Przykład. Na mocy ostatniego twierdzenia współczynniki wielomianu

charakterystycznego w

+ w

X + w

+ w

macierzy z poprzedniego

przykładu są równe

3 2 4
3 2 1
5 4 3

= 6,

= −

µ¯

3 2
3 2

¯ +

3 4
5 3

¯ +

2 1
4 3

= 9,

= 3 + 2 + 3 = 8,

= −1.

Dostaliśmy to samo, co wprost z definicji wielomianu charakterystycznego.

Twierdzenie. Jeżeli K jest ciałem, n ∈ N, A, P ∈ M

n×n

(K) i P jest

odwracalna, to

−1

(X) = W

(X).

Dowód: Ponieważ wzór Cauchy’ego jest słuszny również dla macierzy o

wyrazach z K[X], to możemy napisać W

−1

(X) = det(P

−1

AP − XI) =

det(P

−1

(A − XI)P ) = (1/ det P ) det(A − XI) det P = W

(X).

Definicja. Wielomian charakterystyczny endomorfizmu f : U −→ U

skończenie wymiarowej przestrzeni wektorowej U to z definicji wielomian
charakterystyczny jego macierzy w dowolnej bazie (tej samej w dziedzinie
i przeciwdziedzinie). Ostatnie twierdzenie gwarantuje, że taka definicja jest
poprawna, to znaczy nie zależy od wyboru bazy, bo gdy u

, . . . , u

i u

, . . . , u

są bazami U, A i A

macierzami f w bazie odpowiednio u

, . . . , u

i u

, . . . , u

a P macierzą przejścia od u

, . . . , u

do u

, . . . , u

, to A

= P

−1

AP .

Wniosek. Wielomian charakterystyczny w

+ w

X + w

+ . . . + w

endomorfizmu f n-wymiarowej przestrzeni wektorowej ma stopień n oraz

= det f,

n−1

= (−1)

n−1

tr f,

= (−1)

Twierdzenie Cayleya-Hamiltona

Twierdzenie. Jeżeli w

+ w

X + w

+ . . . + w

jest wielomianem

charakterystycznym macierzy A z M

n×n

(K), to

+ w

A + w

+ . . . + w

= 0.

Dowód: Wygodnie będzie utożsamiać dowolną macierz n × n o wyrazach

ji,k

z K[X] z wielomianem

, którego współczynniki M

są

macierzami z M

n×n

(K) o wyrazach m

ji,k

(działania na takich wielomianach

definiuje się tymi samymi wzorami, co na wielomianach z K[X], i nasze
utożsamienie jest zgodne z działaniami). Połóżmy B = A − XI i oznaczmy
przez C macierz, która dla każdych i, j ∈ {1, . . . , n} ma na przecięciu j-
tego wiersza i i-tej kolumny wyraz (−1)

j+i

, gdzie B

to minor macierzy

B powstały przez skreślenie jej i-tego wiersza i j-tej kolumny. Wówczas
BC = (det B)I (dowód tego faktu dla macierzy o wyrazach z K[X] jest taki
sam, jak dla macierzy o wyrazach z K). Stąd zaraz dostajemy równość BC =
W

(X)I = w

I + w

IX + w

+ . . . + w

. Ale minory stopnia n − 1

macierzy B są wielomianami z K[X] stopnia co najwyżej n − 1, więc istnieją
takie C

, . . . , C

n−1

∈ M

n×n

(K), że C = C

+ C

X + C

+ . . . + C

n−1

W takim razie mamy równość (A−IX)(C

X +C

+. . .+C

n−1

) =

I + w

IX + w

+ . . . + w

, z której po wymnożeniu i porównaniu

współczynników obu stron przy poszczególnych potęgach X otrzymujemy, że
AC

= w

I, AC

− C

= w

I, . . . , AC

n−1

− C

n−2

= w

n−1

I, −C

n−1

= w

Mnożąc te równości z lewej strony odpowiednio przez I, A, . . . , A

n−1

, A

, a

potem wszystkie dodając, dostajemy tezę twierdzenia.

Jak zwykle w podobnych sytuacjach, mamy również twierdzenie Cayleya-

Hamiltona w wersji dotyczącej endomorfizmów zamiast macierzy.

Wniosek. Jeżeli w

+ w

X + w

+ . . . + w

jest wielomianem

charakterystycznym endomorfizmu f : U −→ U n-wymiarowej przestrzeni
wektorowej U, to

+ w

f + w

+ . . . + w

= 0.

Oczywiście f

w powyższym wniosku to potęga w algebrze End(U), więc

oznacza złożenie f ◦ . . . ◦ f , w którym f występuje k razy.

Podsumowując, twierdzenie Cayleya-Hamiltona mówi, że każda macierz

kwadratowa i każdy endomorfizm skończenie wymiarowej przestrzeni wekto-
rowej spełnia swoje „równanie charakterystyczne”.

Wektory własne i wartości własne

Definicja. Załóżmy, że U jest przestrzenią wektorową nad ciałem K, a

f : U −→ U endomorfizmem. Niezerowy wektor u z U nazywa się wektorem
własnym endomorfizmu f , gdy istnieje taka λ ∈ K, że f (u) = λu. W tej
sytuacji λ nazywa się wartością własną endomorfizmu f . Zatem skalar λ z
K jest wartością własną f , gdy istnieje takie u ∈ U \ {0}, że f (u) = λu.

Przykład. Niech G oznacza podprzestrzeń przestrzeni wektorowej R

złożoną z funkcji klasy C

∞

. Dla endomorfizmu G 3 ϕ −→ ϕ

∈ G dowolna

liczba rzeczywista λ jest wartością własną, a odpowiadającym jej wektorem
własnym jest funkcja R 3 x −→ e

λx

∈ R.

Przypomnijmy, że skalar λ z ciała K nazywa się pierwiastkiem wielomianu

+ a

X + a

+ . . . + a

z K[X], gdy a

+ a

λ + a

+ . . . + d

= 0.

Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią

wektorową nad ciałem K, a f : U −→ U endomorfizmem. Skalar λ z K jest
wartością własną endomorfizmu f wtedy i tylko wtedy, gdy jest pierwiastkiem
jego wielomianu charakterystycznego W

(X), czyli

det(f − λid

) = 0.

Dowód: Skalar λ jest wartością własną f wtedy i tylko wtedy, gdy istnieje

takie u ∈ U \ {0}, że f (u) − λu = 0, to znaczy wtedy i tylko wtedy, gdy
ker(f − λid

) 6= {0}, co, jak wiemy, jest równoważne temu, że f − λid

nie

jest monomorfizmem, czyli temu, że det(f − λid

) = 0.

Krotnością wartości własnej λ endomorfizmu f skończenie wymiarowej

przestrzeni wektorowej nad ciałem K nazywa się jej krotność jako pierwiastka
wielomianu charakterystycznego f (a zatem jest ona równa q, gdy W

(X)

dzieli się w K[X] przez (λ − X)

, ale nie przez (λ − X)

q+1

Czasami mówi się również o wartościach własnych i wektorach własnych

macierzy A z M

n×n

(K). Ma się wówczas na myśli wartości własne i wektory

własne endomorfizmu przestrzeni wektorowej K

, który w bazie kanonicznej

ma macierz A.

Przykład. Znajdziemy wartości własne i wektory własne endomorfizmu

3 (x, y, z) −→ (3x + 2y − 4z, x + 2y − 2z, x + y − z) ∈ R

(i tym samym

macierzy

A =





3 2 −4
1 2 −2
1 1 −1





z M

3×3

(R)). Wielomian charakterystyczny jest równy 2 − 5X + 4X

− X

(1−X)

(2−X), a więc wartości własne to 1 i 2, przy czym 1 jest dwukrotna,

a 2 jednokrotna. Przy wyznaczaniu wektorów własnych posłużymy się ma-
cierzami A − 1I i A − 2I. Dowolny wektor własny (x, y, z) o wartości własnej
1 spełnia równanie





2 2 −4
1 1 −2
1 1 −2









x
y



 = 0

i metoda Gaussa pokazuje, że jest on postaci y(−1, 1, 0) + z(2, 0, 1), gdzie
y, z ∈ R, y 6= 0 lub z 6= 0. Natomiast dowolny wektor własny (x, y, z) o
wartości własnej 2 spełnia równanie





1 2 −4
1 0 −2
1 1 −3









x
y



 = 0

i metoda Gaussa pokazuje, że jest on postaci z(2, 1, 1), gdzie z ∈ R, z 6= 0.

Mówi się, że macierz A z M

n×n

(K) o wyrazach a

jest diagonalna, gdy

= 0 dla wszystkich i, j ∈ {1, . . . , n} takich, że i 6= j. Zatem macierz

diagonalna to macierz kwadratowa, która poza główną przekątną ma wy-
razy równe 0. Endomorfizm skończenie wymiarowej przestrzeni wektorowej
nazywa się diagonalizowalnym, gdy istnieje baza tej przestrzeni, w której
ma on macierz diagonalną (ma to być macierz w jednej bazie, tej samej w
dziedzinie i przeciwdziedzinie).

Ćwiczenie. Zauważyć, że endomorfizm f : U −→ U skończenie wymia-

rowej przestrzeni wektorowej U jest diagonalizowalny wtedy i tylko wtedy,
gdy istnieje baza U złożona z wektorów własnych f . Przemyśleć, jak można
opisać działanie takiego endomorfizmu w terminach geometrii.

Czasami mówi się również, że diagonalizowalna jest macierz A z M

n×n

(K),

co oznacza diagonalizowalność endomorfizmu przestrzeni wektorowej K

który w bazie kanonicznej ma macierz A. A więc A jest diagonalizowalna
wtedy i tylko wtedy, gdy istnieje taka P ∈ GL(n, K), że macierz P

−1

AP jest

diagonalna.

Przykład. Jak wiemy, endomorfizm z poprzedniego przykładu ma w

bazie (−1, 1, 0), (2, 0, 1), (2, 1, 1) macierz diagonalną





1 0 0
0 1 0
0 0 2



 ,

a więc jest diagonalizowalny.

Ponieważ macierz diagonalna jest szczególnie prosta, to i w rozważaniach

teoretycznych, i w zastosowaniach praktycznych często pomaga sprowadzenie
diagonalizowalnego endomorfizmu lub diagonalizowalnej macierzy do postaci
diagonalnej. Ilustruje to następny przykład.

Przykład. Słynny ciąg Fibonacciego związany z liczeniem królików jest

określony przez warunki a

= 0, a

= 1, a

= a

k−1

k−2

dla k ≥ 2. Ostatnią

zależność rekurencyjną można zapisać w postaci macierzowej jako

k−1

1 1
1 0

¸ ·

k−1

k−2

co w połączeniu z warunkami początkowymi daje dla wszystkich k ≥ 0 wzór

k+1

= A

1
0

gdzie

A =

1 1
1 0

Postępując jak poprzednio obliczamy, że A ma jednokrotne wartości własne
(1 −

√

5)/2 i (1 +

√

5)/2, a odpowiadające im wektory własne to na przykład

((1 −

√

5)/2, 1) i ((1 +

√

5)/2, 1). Macierz przejścia od bazy kanonicznej do

bazy złożonej z tych wektorów to

Q =

1−

√

dlatego A = QDQ

−1

, gdzie

D =

1−

√

Stąd mamy A

= AA . . . AA = (QDQ

−1

)(QDQ

−1

) . . . (QDQ

−1

)(QDQ

−1

) =

QDD . . . DDQ

−1

= QD

−1

. Ponadto, jak łatwo zauważyć, potęgowanie

macierzy diagonalnej sprowadza się do potęgowania jej wyrazów z głównej
przekątnej, więc

k+1

1−

√

¸ "

(

1−

√

)

(

√

)

# "

−

√

−

1−

√

# ·

1
0

Po obliczeniu drugiego wyrazu iloczynu macierzy z prawej strony tej równości
dostajemy wzór na wyrazy ciągu Fibonacciego

√

(

√

)

− (

1−

√

)

Jednakże, jak pokazuje kolejny przykład, nie wszystkie endomorfizmy i

macierze są diagonalizowalne.

Przykład. Dobrze znanym sposobem łatwo obliczamy, że endomorfizm

f : R

3 (x, y) −→ (x − 4y, x + 5y) ∈ R

ma dwukrotną wartość własną 3

i że dowolny jego wektor własny jest postaci y(−2, 1), gdzie y ∈ R, y 6= 0.
Widać stąd jasno, że nie istnieje baza R

złożona z wektorów własnych f .

Podprzestrzenie pierwiastkowe

Choć nie dla każdego endomorfizmu można znaleźć bazę, w której ma

on macierz diagonalną, to przy założeniu algebraicznej domkniętości ciała
można znaleźć bazę, w której ma on tak zwaną macierz Jordana, będącą
uogólnieniem macierzy diagonalnej. Mówiącemu o tym twierdzeniu Jordana
i związanym z nim zagadnieniom poświęcimy parę najbliższych wykładów.

Niech f : U −→ U będzie endomorfizmem przestrzeni wektorowej U nad

ciałem K. Dla każdej wartości własnej λ endomorfizmu f i każdego k ∈ N
definiujemy

= {u ∈ U : (f − λid

)

(u) = 0}.

Zauważmy, że jest to podprzestrzeń przestrzeni U, bo U

= ker((f − λid

)

Ponadto U

= {0}, natomiast U

składa się z wszystkich wektorów własnych

endomorfizmu f o wartości własnej λ i wektora 0 (dlatego U

nazywa się

podprzestrzenią własną endomorfizmu f o wartości własnej λ). Oczywiście
U

⊂ U

k+1

dla każdego k ∈ N.

Przykład. Dla dowolnego k ∈ N funkcja R 3 x −→ x

λx

∈ R należy

do podprzestrzeni U

k+1

endomorfizmu G 3 ϕ −→ ϕ

∈ G, gdzie G oznacza

podprzestrzeń przestrzeni wektorowej R

złożoną z funkcji klasy C

∞

Podprzestrzeń P przestrzeni wektorowej U nazywa się podprzestrzenią

niezmienniczą endomorfizmu f : U −→ U, gdy f (P ) ⊂ P (czyli f (u) ∈ P
dla każdego u ∈ P ).

Twierdzenie. Każda U

jest podprzestrzenią niezmienniczą f .

Dowód: Jeśli u ∈ U

, to (f − λid

)

(f (u)) = f ((f − λid

)

(u)) = f (0) =

0, więc f (u) ∈ U

Podprzestrzeń pierwiastkowa endomorfizmu f o wartości własnej λ to

∞

[

k=0

Bez trudu można sprawdzić, że U

rzeczywiście jest podprzestrzenią U, bo

⊂ U

⊂ . . . . Oczywiście jest ona podprzestrzenią niezmienniczą f .

Twierdzenie. Niech λ

, . . . , λ

będą wartościami własnymi endomorfi-

zmu f , przy czym λ

6= λ

o ile i 6= j, i niech u

∈ U

, . . . , u

∈ U

. Jeżeli

+ . . . + u

= 0, to u

= 0, . . . , u

= 0.

Dowód: Łatwo sprawdza się, że U

jest podprzestrzenią niezmienniczą

endomorfizmu f − λ

. Pokażemy najpierw, że jeśli i 6= j, to endomorfizm

(f −λ

λi

: U

−→ U

jest monomorfizmem. Weźmy w tym celu wektor

u ∈ ker((f −λ

λi

), a następnie taką liczbę k ∈ N, że (f −λ

)

(u) = 0.

Ponieważ f (u) = λ

u, to 0 = (f − λ

)

(u) = (λ

− λ

)

u i skoro λ

6= λ

to faktycznie mamy u = 0. Aby zakończyć dowód twierdzenia obliczamy dla
każdego i wartości na obu stronach równości u

+ . . . + u

= 0 endomorfizmu

(f − λ

)

. . . (f − λ

i−1

)

i−1

(f − λ

i+1

)

i+1

. . . (f − λ

)

, gdzie

są dobrane tak, że (f − λ

)

) = 0 dla każdego l różnego od i. Dzięki

temu stwierdzamy, że wartość tego endomorfizmu na u

jest równa 0. Stąd

dostajemy u

= 0, jako że złożenie monomorfizmów jest monomorfizmem.

Twierdzenie. Dla dowolnej wartości własnej λ endomorfizmu f i każdej

k ≥ 2 odwzorowanie

k−1

3 [u] −→ [(f − λid

)(u)] ∈ U

k−1

k−2

jest poprawnie określone i jest monomorfizmem.

Dowód: Wprost z definicji otrzymujemy (f − λid

)(U

) ⊂ U

k−1

oraz

(f −λid

)(U

k−1

) ⊂ U

k−2

, a to oznacza, że nasze odwzorowanie jest poprawnie

określone. Jego monomorficzność jest również bardzo łatwa do zauważenia:
jeśli [(f − λid

)(u)] = 0 dla pewnego u ∈ U

, to (f − λid

)(u) ∈ U

k−2

, więc

(f − λid

)

k−1

(u) = 0 i u ∈ U

k−1

, czyli [u] = 0.

Gdy U ma skończony wymiar, co będziemy od tej pory zakładać, to w

ciągu U

⊂ U

⊂ . . . może występować tylko skończenie wiele inkluzji

nie będących równościami. Oznaczmy przez k

najmniejszą liczbę naturalną,

dla której

= U

Okazuje się, że wymiar U

jest równy krotności wartości własnej λ. Teraz

udowodnimy, że wymiar U

jest nie mniejszy niż krotność wartości własnej

λ, a nierówność przeciwna będzie udowodniona po wprowadzeniu macierzy i
baz Jordana.

Weźmy dowolną bazę e

, . . . , e

podprzestrzeni U

i dopełnijmy ją do

bazy e

, . . . , e

całej przestrzeni U. W tej ostatniej bazie endomorfizm f ma

macierz postaci

A B

gdzie A ∈ M

p×p

(K), B ∈ M

p×(n−p)

(K), D ∈ M

(n−p)×(n−p)

(K). Widać stąd,

że wielomian charakterystyczny f jest równy det(A − XI) det(D − XI). Je-
śli krotność wartości własnej λ endomorfizmu f oznaczymy przez q, to ten
wielomian charakterystyczny dzieli się przez (λ − X)

. Aby zakończyć do-

wód nierówności p ≥ q, o którą nam chodzi, wystarczy tylko pokazać, że
jednomian λ − X nie dzieli wielomianu det(D − XI), bo wówczas wielomian
det(A − XI) stopnia p będzie podzielny przez wielomian (λ − X)

stopnia

q. Przypuśćmy więc dla dowodu nie wprost, że λ − X dzieli det(D − XI).
Ale ostatni wielomian jest wielomianem charakterystycznym endomorfizmu
U/U

3 [u] −→ [f (u)] ∈ U/U

. Endomorfizm ten ma więc wektor własny [w]

o wartości własnej λ. Mamy zatem w ∈ U \ U

i f (w) − λw ∈ U

. Te dwa

warunki są ze sobą sprzeczne, bo pierwszy mówi, że (f − λid

)

(w) 6= 0 dla

każdego k, a drugi, że (f − λid

)

(w) = 0.

Macierz Jordana i baza Jordana

Niech λ będzie skalarem z ciała K, a r ≥ 1. Klatką Jordana rozmiaru r

o wartości własnej λ nazywa się macierz z M

r×r

(K) postaci







. .. ...





 ,

czyli mającą na głównej przekątnej wyrazy λ, bezpośrednio pod nią wyrazy
1, a wszystkie pozostałe wyrazy równe 0 (formalnie wyrazy a

tej macierzy

spełniają warunki: a

= λ, gdy j = i, a

= 1, gdy j = i + 1, oraz a

= 0 we

wszystkich pozostałych przypadkach).

Macierzą Jordana nazywa się każdą macierz kwadratową mającą wzdłuż

głównej przekątnej rozmieszczone klatki Jordana, natomiast wszędzie poza
tymi klatkami wyrazy równe 0.

Przykład. Macierz







4 0 0 0 0 0
1 4 0 0 0 0
0 1 4 0 0 0
0 0 0 4 0 0
0 0 0 0 5 0
0 0 0 0 1 5







z M

6×6

(R) jest macierzą Jordana o trzech klatkach: rozmiaru 3 o wartości

własnej 4, rozmiaru 1 o wartości własnej 4, rozmiaru 2 o wartości własnej 5.

Bazą Jordana endomorfizmu f : U −→ U skończenie wymiarowej prze-

strzeni wektorowej U nazywa się dowolną uporządkowaną bazę U, w której
macierz f jest macierzą Jordana.

Twierdzenie. Załóżmy, że f : U −→ U jest endomorfizmem skończenie

wymiarowej przestrzeni wektorowej U, a λ jego wartością własną. Wówczas
dla endomorfizmu f |

: U

−→ U

istnieje baza Jordana.

Dowód: Konstrukcja bazy Jordana przebiega rekurencyjnie ze względu

na k ∈ {1, . . . , k

}. Rozpoczyna się od k

. Załóżmy że już wykonaliśmy

krok odpowiadający k + 1 i mamy skonstruowane niektóre wektory naszej
bazy. Opiszemy jak wykonać krok odpowiadający k i skonstruować kolejne.
Bierzemy mianowicie te spośród już skonstruowanych wektorów, które należą
do U

\ U

k−1

. Zakładamy, że ich klasy abstrakcji w U

k−1

są liniowo

niezależne i dopełniamy je do bazy tej przestrzeni. Wybieramy po jednym
reprezentancie z każdej z dołożonych klas. Powiedzmy, że są nimi u

, . . . , u

Otóż wektory, które dokładamy do naszej bazy w kroku odpowiadającym k
to wektory (f −λid

)

) dla (i, j) ∈ {1, . . . , s}×{0, . . . , k −1} ułożonych w

porządku leksykograficznym (baza Jordana musi być bazą uporządkowaną).
Ponieważ wiemy, że U

k−1

3 [u] −→ [(f − λid

)(u)] ∈ U

k−1

k−2

jest

monomorfizmem i przeprowadza klasy liniowo niezależne na klasy liniowo
niezależne, to warunek, który założyliśmy w kroku odpowiadającym k będzie
również spełniony w kroku odpowiadającym k − 1, skąd wynika poprawność
konstrukcji. Łatwo też zauważyć, że daje ona bazę U

będącą bazą Jordana

f |

. Rzeczywiście, oznaczając v

= (f − λid

)

j−1

) dla j ∈ {1, . . . , k}

widzimy, że f (v

) = λv

+ v

j+1

dla j ∈ {1, . . . , k − 1}, a f (v

) = λv

, więc

macierzą endomorfizmu f |

lin {v

,...,v

}

w bazie v

, . . . , v

jest klatka Jordana.

Ćwiczenie. Niech V będzie przestrzenią wektorową, V

, . . . , V

takimi jej

podprzestrzeniami, że {0} = V

⊂ V

⊂ . . . ⊂ V

l−1

⊂ V

= V , A zaś jej

skończonym podzbiorem. Uzasadnić następujący prosty fakt wykorzystany
w trakcie ostatniego dowodu: jeśli dla każdego k ∈ {1, . . . , l} klasy abstrakcji
[a

], . . . , [a

] z V

k−1

dla a

, . . . , a

takich, że A ∩ (V

\ V

k−1

) = {a

, . . . , a

tworzą bazę V

k−1

, to A jest bazą V .

Twierdzenie. Wymiar podprzestrzeni pierwiastkowej U

endomorfizmu

skończenie wymiarowej przestrzeni wektorowej jest równy krotności wartości
własnej λ.

Dowód: Już wcześniej udowodniliśmy, że p ≥ q, gdzie p oznacza wymiar

, a q krotność wartości własnej λ endomorfizmu f . Nierówność przeciwna

wynika stąd, że U

jest podprzestrzenią niezmienniczą f i dlatego wielomian

charakterystyczny f jest podzielny przez wielomian charakterystyczny f |

a ten ostatni jest równy (λ − X)

jako wielomian charakterystyczny macierzy

Jordana o p wierszach i p kolumnach, w której wszystkie klatki Jordana mają
wartość własną λ, jak to widać z poprzedniego dowodu.

Twierdzenie. Jeżeli endomorfizm skończenie wymiarowej przestrzeni

wektorowej ma wielomian charakterystyczny będący iloczynem wielomianów
pierwszego stopnia, to jego dziedzina jest sumą prostą jego podprzestrzeni
pierwiastkowych.

Dowód: Już wcześniej udowodnione twierdzenie mówi, że odwzorowanie

× . . . × U

3 (u

, . . . , u

) −→ u

+ . . . + u

∈ U jest monomorfizmem.

Pozostało zauważyć, że dim(U

× . . . × U

) = dim U, bo suma krotności

pierwiastków wielomianu charakterystycznego naszego endomorfizmu jest na
podstawie założenia równa jego stopniowi.

Twierdzenie. Jeżeli endomorfizm skończenie wymiarowej przestrzeni

wektorowej ma wielomian charakterystyczny będący iloczynem wielomianów
pierwszego stopnia, to istnieje dla niego baza Jordana.

Dowód: Wiemy, że dziedzina naszego endomorfizmu jest sumą prostą jego

podprzestrzeni pierwiastkowych i że jego zawężenie do każdej z nich ma bazę
Jordana. Ustawiając te bazy jedną za drugą w jeden ciąg otrzymujemy bazę,
której istnienie mieliśmy wykazać.

Zauważmy, że założenie ostatniego twierdzenia (nazywanego twierdzeniem

Jordana) jest spełnione dla każdego endomorfizmu, jeżeli ciało skalarów jest
algebraicznie domknięte, a więc w szczególności dla ciała C.

Twierdzenie. Niech f będzie endomorfizmem, λ jego wartością własną, a

k ∈ N\{0}. Wtedy w każdej macierzy Jordana endomorfizmu f |

ilość klatek

Jordana o rozmiarze nie mniejszym niż k jest równa dim U

− dim U

k−1

Dowód: Niech f |

lin {v

,...,v

}

ma w bazie v

, . . . , v

macierz będącą klatką

Jordana, to znaczy niech będzie f (v

) − λv

= v

j+1

dla j ∈ {1, . . . , r − 1}, a

f (v

)−λv

= 0. Wtedy dla dowolnych skalarów α

, . . . , α

i k ∈ {0, . . . , r−1}

mamy równość (f −λid

)

(α

+. . .+α

) = α

1+k

+. . .+α

r−k

, z której

wynika, że U

∩lin {v

, . . . , v

} = lin {v

r−k+1

, . . . , v

} dla k ∈ {1, . . . , r}. Stąd

różnica dim(U

∩ lin {v

, . . . , v

}) − dim(U

k−1

∩ lin {v

, . . . , v

}) jest równa 1,

gdy k ∈ {1, . . . , r}, a 0, gdy k ≥ r + 1. Sumując takie różnice odpowiadające
wszystkim klatkom Jordana otrzymujemy tezę twierdzenia, bo U

i U

k−1

są

sumami prostymi podprzestrzeni U

∩ lin {v

, . . . , v

} i U

k−1

∩ lin {v

, . . . , v

}

po wszystkich klatkach Jordana o wartości własnej λ, co łatwo sprawdzić.

Istota ostatniego twierdzenia polega na tym, że wymiary podprzestrzeni

endomorfizmu posiadającego bazę Jordana wyznaczają rozmiary klatek

Jordana dowolnej jego macierzy Jordana i na odwrót. Otoż gdy w

oznacza

wymiar U

, a i

ilość klatek Jordana rozmiaru k o wartości własnej λ, to na

podstawie tego twierdzenia mamy dla każdego k ≥ 1

= −w

k−1

+ 2w

− w

k+1

∞

r=1

min{r, k}

(suma jest tu skończona, bo i

6= 0 tylko dla skończenie wielu r).

Powyższe wzory są niełatwe do zapamiętania i niepraktyczne. Związki,

które one opisują, można o wiele przejrzyściej przedstawić na odpowiednim
diagramie. Mianowicie, jeśli narysujemy diagram złożony z kolumn o górnych
końcach leżących na jednym poziomie i długościach równych kolejno różnicom
dim U

− dim U

k−1

dla k ∈ {1, . . . , k

}, to długości wierszy tego diagramu

będą równe rozmiarom klatek Jordana. Objaśnimy to na przykładzie.

Przykład. Przypuśćmy, że dla pewnego endomorfizmu i pewnej jego

wartości własnej λ mamy dim U

= 0, dim U

= 4, dim U

= 6, dim U

= 8,

dim U

= 9, dim U

= 10 dla k ≥ 5. Aby znaleźć ilości klatek Jordana

poszczególnych rozmiarów o wartości własnej λ w macierzy Jordana tego
endomorfizmu obliczamy, że dim U

− dim U

= 4, dim U

− dim U

= 2,

dim U

− dim U

= 2, dim U

− dim U

= 1, dim U

− dim U

= 1 (dalsze

różnice będą równe 0), więc rysujemy diagram o kolumnach kolejno długości
4, 2, 2, 1, 1, umieszczając górne końce kolumn na jednym poziomie.

Długości wierszy tego diagramu są równe 5, 3, 1, 1, i takie też będą rozmiary
klatek Jordana o wartości własnej λ, czyli będzie jedna klatka rozmiaru 5,
jedna rozmiaru 3 i dwie rozmiaru 1. Oczywiście gdybyśmy znali te rozmiary,
to moglibyśmy z nich odtworzyć wymiary podprzestrzeni U

rysując diagram

o wierszach długości 5, 3, 1, 1 (koniecznie w kolejności od największego do
najmniejszego) z lewymi końcami wyrównanymi wzdłuż pionowej linii. Dla
każdego k ∈ N wymiar podprzestrzeni U

jest ilością kratek w k pierwszych

kolumnach tak otrzymanego diagramu.

Zwróćmy uwagę, że w takich diagramach żaden wiersz nie będzie dłuższy

niż poprzedni i żadna kolumna nie będzie dłuższa niż poprzednia.

Obliczanie macierzy Jordana i bazy Jordana

Opiszemy teraz algorytm pozwalający obliczyć macierz Jordana i bazę

Jordana endomorfizmu f : U −→ U, którego wielomian charakterystyczny
rozkłada się na czynniki pierwszego stopnia. Jest on podsumowaniem kilku
dotychczas udowodnionych twierdzeń. W szczególności sama konstrukcja
bazy Jordana będzie powtórzeniem konstrukcji, która pojawiła się w jednym
z dowodów, jednak w celu zwiększenia przejrzystości podzielimy ją tu na
więcej drobniejszych kroków.

Rozpoczyna się od obliczenia wielomianu charakterystycznego oraz jego

pierwiastków, czyli wartości własnych f . Dalszy ciąg algorytmu przebiega
dla każdej wartości własnej λ osobno i daje macierz Jordana i bazę Jordana
zawężenia endomorfizmu f do podprzestrzeni pierwiastkowej U

. Otrzymane

w ten sposób dla poszczególnych wartości własnych macierze należy na końcu
ułożyć wzdłuż głównej przekątnej macierzy Jordana całego f , wypełniając
pozostałe miejsca zerami, a bazy ustawić jedną za drugą w ciąg, który będzie
bazą Jordana całego f .

Dla każdej wartości własnej λ konstruuje się ciąg podprzestrzeni

( U

( . . . ( U

−1

( U

= U

= . . . ,

gdzie U

= {u ∈ U : (f − λid

)

(u) = 0} (przy czym zawsze U

= {0}).

Ciąg ten stabilizuje się od miejsca o numerze oznaczonym przez k

, które

można rozpoznać po tym, że po raz pierwszy inkluzja staje się tam równością
(dalsze inkluzje automatycznie są równościami) lub po tym, że wymiar U

jest równy krotności λ (zatem U

= U

). Następnie najlepiej narysować

diagram złożony z kolumn o górnych końcach leżących na jednym poziomie i
długościach równych kolejno różnicom dim U

−dim U

k−1

dla k ∈ {1, . . . , k

który już daje pełną informację o macierzy Jordana endomorfizmu f |

. Ma

ona mianowicie tyle klatek Jordana, ile ten diagram ma wierszy, a rozmiary
klatek są takie, jak długości wierszy (wartości własne tych klatek są równe
λ). Natomiast konstrukcja bazy Jordana f |

rozpada się naturalnie na tyle

kroków, ile jest wierszy w diagramie. Opiszemy jak wykonać jeden z nich,
przy założeniu, że wykonane są poprzednie, czyli odpowiadające wierszom
położonym wyżej. Niech wiersz odpowiadający temu krokowi ma długość k.
Na początek trzeba wziąć wektor v

z U

wybrany dość dowolnie, byle tylko

klasa abstrakcji [v

] w U

k−1

była liniowo niezależna od klas abstrakcji w

k−1

tych spośród wektorów skonstruowanych w poprzednich krokach,

które należą do U

\ U

k−1

. Następnie rekurencyjnie oblicza się wektory v

(f − λid

)(v

j−1

) dla j ∈ {2, . . . , k}. Dobrze jest po otrzymaniu każdego z

wektorów v

, . . . , v

zaznaczać krzyżykiem kratkę w wierszu odpowiadającym

wykonywanemu krokowi idąc od prawej do lewej (wówczas dla dowolnego
l ∈ {1, . . . , k

} krzyżyki wektorów z U

l−1

będą leżeć w l-tej kolumnie), co

pomaga w orientacji, na jakim się jest etapie. Ponieważ macierzą f |

lin {v

,...,v

}

w bazie v

, . . . , v

jest klatka Jordana, więc wystarczy wektory otrzymywane

w poszczególnych krokach ustawiać w ciąg w kolejności ich konstruowania, a
dostanie się bazę Jordana endomorfizmu f |

. Oczywiście będzie ona miała

tyle elementów, ile kratek ma diagram dla wartości własnej λ.

Warto tutaj dodać, że wartości własne i rozmiary klatek Jordana są przez

endomorfizm wyznaczone jednoznacznie, ale ich kolejność wzdłuż przekątnej
macierzy Jordana już nie. Opisany algorytm grupuje klatki według wartości
własnych, a dla każdej wartości własnej z osobna ustawia je od największej do
najmniejszej. Możemy się więc umówić, że zawsze będziemy ustawiać klatki
w macierzach Jordana zgodnie z tymi regułami. Nadal jednak pozostanie
niejednoznaczność w kolejności wartości własnych, bo poza przypadkiem, gdy
wszystkie wartości własne są rzeczywiste, raczej nie ma jakiegoś naturalnego
sposobu ich uporządkowania. Jeśli chodzi o bazy Jordana, to endomorfizm
może ich mieć wiele, nawet bardzo różnych, i to takich, w których ma taką
samą macierz Jordana. Jest to jasne, skoro nasz algorytm daje dużą swobodę
wyboru po jednym wektorze na każdą klatkę Jordana.

Przykład. Obliczymy według powyższego algorytmu macierz Jordana i

bazę Jordana endomorfizmu f : R

−→ R

, który w bazie kanonicznej ma

macierz







−2 −1 −5

−1 −1 −1 −1





 .

Wielomianem charakterystycznym f jest 24 − 44X + 30X

− 9X

+ X

, czyli

(2 − X)

(3 − X), więc f ma dwie wartości własne: 2, która jest trzykrotna,

i 3, która jest jednokrotna.

Bierzemy wartość własną 2. Macierz f − 2id

w bazie kanonicznej to







−1 −2 −1 −5

−1 −1 −1 −3





 ,

zatem (x

, x

) należy do U

wtedy i tylko wtedy, gdy

−x

−2x

−x

−5x

= 0,

+2x

+5x

= 0,

+3x

+9x

= 0,

−x

−3x

= 0.

Stąd U

= {(x

, x

) ∈ R

: x

= −x

− x

, x

= −2x

} i dim U

= 2.

Macierz (f − 2id

)

w bazie kanonicznej to







−1 0 −1 −1





 ,

zatem (x

, x

) należy do U

wtedy i tylko wtedy, gdy

= 0,

−x

= 0.

Stąd U

= {(x

, x

) ∈ R

: x

= −x

− x

} i dim U

= 3. Widać, że

już U

= U

, więc rysujemy diagram, który ma dwie kolumny o długościach

kolejno dim U

− dim U

= 2 i dim U

− dim U

= 1.

Pojawiły się dwa wiersze o długościach kolejno 2 i 1, dlatego będą dwie
klatki Jordana z wartością własną 2 o rozmiarach kolejno 2 i 1. Konstrukcja
bazy Jordana dla f |

składa się z dwóch kroków. Pierwszy krok odpowiada

pierwszemu wierszowi, który ma długość 2, dlatego wybieramy wektor z U

którego klasa abstrakcji w U

jest liniowo niezależna od klas wcześniej

skonstruowanych wektorów zaznaczonych krzyżykami w drugiej kolumnie.
Skoro żadnych wektorów jeszcze nie skonstruowaliśmy, to ostatni warunek
oznacza tylko tyle, że ta klasa ma być niezerowa, więc sam wektor ma nie
należeć do U

. Wektorem, który spełnia równanie opisujące U

, ale nie rów-

nania opisujące U

, jest na przykład (0, 1, 0, 0). Zaznaczamy go na diagramie.

W pierwszym pierwszym kroku obliczamy (a nie wybieramy) jeszcze jeden
wektor mnożąc przez macierz f −2id

w bazie kanonicznej poprzedni wektor

zapisany w postaci macierzy jednokolumnowej. Otrzymujemy (−2, 2, 3, −1).
Zaznaczamy go na diagramie.

Drugi krok odpowiada drugiemu wierszowi, który ma długość 1, dlatego wy-
bieramy wektor z U

, którego klasa abstrakcji w U

jest liniowo nieza-

leżna od klas wcześniej skonstruowanych wektorów zaznaczonych krzyżykami
w pierwszej kolumnie. Ale U

= {0}, więc niezależność klas jest tym sa-

mym co niezależność ich reprezentantów. Wektorem, który spełnia równania
opisujące U

, ale nie jest liniowo zależny od (−2, 2, 3, −1) jest na przykład

(−1, 0, 1, 0). Zaznaczamy go na diagramie.

Cały diagram jest wypełniony, zatem mamy gotową bazę Jordana f |

Bierzemy wartość własną 3. Macierz f − 3id

w bazie kanonicznej to







−2 −2 −1 −5

−1 −1 −1 −4





 ,

zatem (x

, x

) należy do U

wtedy i tylko wtedy, gdy

−2x

−x

−5x

= 0,

+5x

= 0,

+3x

+2x

+9x

= 0,

−x

−4x

= 0.

Stąd U

= {(x

, x

) ∈ R

: x

= −x

, x

= 0, x

= 0} i dim U

= 1.

Widać, że już U

= U

, więc rysujemy diagram, który ma jedną kolumnę o

długości dim U

− dim U

= 1.

Pojawił się jeden wiersz o długości 1, dlatego będzie jedna klatka Jordana z
wartością własną 3 o rozmiarze 1. Konstrukcja bazy Jordana dla f |

składa

się z jednego kroku. Jedyny krok odpowiada jedynemu wierszowi, który
ma długość 1, dlatego wybieramy wektor z U

, którego klasa abstrakcji w

jest liniowo niezależna od klas wcześniej skonstruowanych wektorów

zaznaczonych krzyżykami w pierwszej kolumnie. Skoro żadnych wektorów
jeszcze nie skonstruowaliśmy, to ostatni warunek oznacza tylko tyle, że ta
klasa ma być niezerowa, więc sam wektor ma nie należeć do U

. Wektorem,

który spełnia równania opisujące U

, ale nie jest zerowy, jest na przykład

(−1, 1, 0, 0). Zaznaczamy go na diagramie.

Cały diagram jest wypełniony, zatem mamy gotową bazę Jordana f |

Ostatecznie macierzą Jordana endomorfizmu f jest







2 0 0 0
1 2 0 0
0 0 2 0
0 0 0 3





 ,

a bazą Jordana (0, 1, 0, 0), (−2, 2, 3, −1), (−1, 0, 1, 0), (−1, 1, 0, 0) (ta baza
Jordana, którą udało się nam znaleźć, jest oczywiście tylko jedną z wielu
możliwych). Łatwo się przekonać, że uzyskany wynik jest prawidłowy: po
obliczeniu w zwykły sposób macierzy endomorfizmu f w znalezionej bazie
Jordana wychodzi znaleziona macierz Jordana.

Klasyfikacja endomorfizmów

Dwa endomorfizmy f : U −→ U i f

: U

−→ U

przestrzeni wektorowych

U i U

nad tym samym ciałem K będziemy nazywać równoważnymi, gdy

istnieje taki izomorfizm g : U −→ U

, że f

◦ g = g ◦ f . Łatwo sprawdzić,

że faktycznie jest to relacja równoważności na dowolnym zbiorze endomorfi-
zmów przestrzeni wektorowych nad K. Z punktu wiedzenia algebry liniowej
endomorfizmy równoważne można uważać za jednakowe.

Twierdzenie. Dwa endomorfizmy skończenie wymiarowych przestrzeni

wektorowych nad tym samym ciałem są równoważne wtedy i tylko wtedy, gdy
istnieją bazy (po jednej dla każdego z nich, tej samej w dziedzinie i przeciw-
dziedzinie), w których mają one jednakowe macierze.

100

Dowód: Jeżeli f : U −→ U i f

: U

−→ U

mają w bazach e

, . . . , e

i e

, . . . , e

jednakowe macierze, to izomorfizm g określony przez warunki

g(e

) = e

, . . . , g(e

) = e

daje równoważność f i f

. Odwrotnie, gdy f i f

są równoważne za pośrednictwem izomorfizmu g, a e

, . . . , e

jest bazą U, to

f i f

mają w bazach e

, . . . , e

i g(e

), . . . , g(e

) jednakowe macierze.

Wzięcie za e

, . . . , e

w przedostatniej linijce bazy Jordana f pokazuje

poprawność określenia następującej bijekcji klasyfikującej endomorfizmy.

Twierdzenie. Istnieje kanoniczna bijekcja między klasami abstrakcji

relacji równoważności endomorfizmów skończenie wymiarowych przestrzeni
wektorowych nad ciałem algebraicznie domkniętym a macierzami Jordana o
wyrazach z tego ciała, o ile utożsamia się macierze różniące się tylko kolej-
nością klatek Jordana. Bijekcja ta przypisuje każdej klasie abstrakcji macierz
Jordana dowolnego jej reprezentanta.

Rozpatrywanej tu relacji równoważności nie wolno mylić z inną, którą też

można by określić na zbiorach endomorfizmów przestrzeni wektorowych nad
tym samym ciałem. Otóż można by f : U −→ U i f

: U

−→ U

uznać za

równoważne, gdy istnieją takie izomorfizmy g : U −→ U

i h : U −→ U

, że

◦ g = h ◦ f . Wówczas twierdzenie klasyfikacyjne byłoby znacznie prostsze:

przy założeniu skończoności wymiarów U i U

takie f i f

są równoważne w

tym drugim sensie wtedy i tylko wtedy, gdy dim U = dim U

i rz f = rz f

Rozkład Jordana

Mówi się, że endomorfizm h przestrzeni wektorowej jest nilpotentny, gdy

istnieje taka k ∈ N, że h

= 0. Podobnie mówi się też, że macierz kwadratowa

N jest nilpotentna, gdy istnieje taka k ∈ N, że N

= 0.

Twierdzenie. Niech f : U −→ U będzie endomorfizmem skończenie

wymiarowej przestrzeni wektorowej, którego wielomian charakterystyczny jest
iloczynem wielomianów pierwszego stopnia. Przy tym założeniu istnieją takie
endomorfizmy g, h : U −→ U, że g jest diagonalizowalny, h jest nilpotentny,
g i h są przemienne (czyli h ◦ g = g ◦ h) oraz

f = g + h.

Co więcej, takie g i h są wyznaczone jednoznacznie.

101

Dowód: Istnienie g i h jest prostym wnioskiem z twierdzenia Jordana, bo

możemy zapisać macierz f w bazie Jordana jako sumę macierzy diagonalnej
D i nilpotentnej N rozkładając każdą klatkę Jordana według wzoru







. .. ...





 =







. ..





 +







. ..





 .

Potęga N o wykładniku równym maksymalnemu rozmiarowi klatek będzie
równa 0, bo jest tak potęga drugiej klatki z prawej strony powyższego wzoru
o wykładniku równym jej rozmiarowi. D i N będą przemienne, bo są takie
klatki z prawej powyższego wzoru. Widać więc, że wystarczy za g i h przyjąć
endomorfizmy, które w rozpatrywanej bazie mają macierze D i N. Ale dowód
jednoznaczności g i h jest trudniejszy. Niech wielomian charakterystyczny f
będzie równy (λ

− X)

. . . (λ

− X)

, gdzie λ

, . . . , λ

są parami różne.

Ponieważ pierścień K[X] jest euklidesowy, a (λ

− X)

λ1

, . . . , (λ

− X)

λm

są

parami względnie pierwsze, to na podstawie chińskiego twierdzenia o resztach
istnieją takie wielomiany P (X), P

(X), . . . , P

(X) ∈ K[X], że dla każdego

i ∈ {1, . . . , m} P (X) = λ

+ P

(X)(λ

− X)

λi

. Stąd dla u ∈ U

dostajemy

(P (f ))(u) = λ

u, czyli P (f )|

λi

= g|

λi

, a skoro U = U

⊕ . . . ⊕ U

, to

g = P (f ). Oprócz tego h = Q(f ), gdzie Q(X) = X − P (X). Jeżeli g

i h

też

spełniają wszystkie warunki wymagane od g i h, to f ◦ g

= (g

+ h

) ◦ g

◦ (g

+ h

) = g

◦ f . W konsekwencji g

jest przemienne również z P (f ), to

znaczy z g. Dzięki temu dowolna podprzestrzeń własna V endomorfizmu g

jest niezmiennicza dla g, bo gdy g

(u) = λu, to g

(g(u)) = g(g

(u)) = g(λu) =

λg(u). Ponadto wielomian charakterystyczny g|

jako dzielnik wielomianu

charakterystycznego g rozkłada się na czynniki pierwszego stopnia, więc g|

ma bazę Jordana, a ponieważ U jest sumą prostą podprzestrzeni własnych
g

, więc g ma bazę Jordana złożoną z wektorów własnych g

. Jednoznaczność

macierzy Jordana g wymusza, że baza ta składa się z wektorów własnych g.
Mamy więc bazę, w której macierze obu endomorfizmów g i g

są diagonalne.

Dlatego diagonalna jest w niej też macierz g − g

. Z drugiej strony h

− h jest

nilpotentny, bo gdy h

= 0 i h

= 0, to (h

− h)

k+k

−1

= 0, skoro h i h

są

przemienne (wykazuje się to tak samo jak przemienność g i g

), co pozwala

zastosować tu wzór Newtona. Wykazaliśmy zatem, że obie strony równości
g − g

= h

− h są równocześnie diagonalizowalne i nilpotentne. Ale każdy

taki endomorfizm musi być równy 0, bo dostatecznie duża potęga każdej jego
wartości własnej musi być równa 0. Stąd już dostajemy g

= g i h

= h.

102

Warto tu odnotować, że w trakcie dowodu udało nam się wykazać istnienie

P, Q ∈ K[X] (gdzie K to ciało skalarów), dla których g = P (f ) i h = Q(f ).

Drugi ważny fakt, który stwierdziliśmy, to że dla dwóch przemiennych

oraz diagonalizowalnych endomorfizmów skończenie wymiarowej przestrzeni
wektorowej istnieje wspólna baza, w której oba mają macierze diagonalne.

Występujący w ostatnim twierdzeniu rozkład endomorfizmu na składowe

endomorfizmy diagonalizowalny i nilpotentny nazywa się rozkładem Jordana.

Oczywiście o macierzach Jordana i bazach Jordana oraz o rozkładach

Jordana można mówić nie tylko w odniesieniu do endomorfizmu, ale i do ma-
cierzy kwadratowej, mając na myśli endomorfizm odpowiedniej przestrzeni
K

, który w bazie kanonicznej ma rozważaną macierz.

Przykład. Przy okazji ciągu Fibonacciego obliczaliśmy potęgi macierzy

korzystając z tego, że była ona diagonalizowalna. O macierzy

A =

1 −4
1

wiemy, że nie jest diagonalizowalna. Zobaczymy teraz jak obliczać jej potęgi
posługując się rozkładem Jordana. Znajdując w dobrze już znany sposób
macierz Jordana i bazę Jordana dostajemy A = Q(D + N)Q

−1

, gdzie

Q =

1 −2
0

D =

3 0
0 3

N =

0 0
1 0

Stąd A

= Q(D + N)

−1

. Dzięki przemienności D i N możemy zastosować

wzór Newtona i mamy (D + N)

k
j=0

k−j

. Ale N

= 0 dla j ≥ 2,

więc (D + N)

= D

+ kD

k−1

N. Ponieważ obliczanie potęg D jest banalne,

to na podstawie powyższych wzorów bez trudu dostajemy

= 3

k−1

3 − 2k

−4k

3 + 2k

W podobny sposób można też potęgować macierz kwadratową większego

rozmiaru, o ile tylko da się ją sprowadzić do postaci Jordana. Ma to duże
znaczenie w zastosowaniach, choćby przy obliczaniu eksponenty macierzy.

103

Kompleksyfikacja

Ciało liczb rzeczywistych nie jest algebraicznie domknięte. Z tego powodu

w przypadku rzeczywistym nie do każdego endomorfizmu można zastosować
dotychczas omówioną teorię Jordana. Jednak ze względu na znaczenie tego
przypadku, specjalnie dla niego została opracowana pewna modyfikacja teorii
Jordana, którą się teraz zajmiemy. Jej istotą jest sprowadzenie przypadku
rzeczywistego do zespolonego przy pomocy tak zwanej kompleksyfikacji.

Dla dowolnej przestrzeni wektorowej U nad ciałem R definiujemy prze-

strzeń wektorową U

nad ciałem C nazywaną kompleksyfikacją U jako zbiór

z działaniami

(u, v) + (w, x) = (u + w, v + x),

(α + iβ)(u, v) = (αu − βv, αv + βu),

przy czym α, β ∈ R.

Ćwiczenie. Sprawdzić, że U

rzeczywiście jest przestrzenią wektorową

nad C (zwróćmy uwagę, że rachunki, które tu trzeba wykonać, do złudzenia
przypominają te, które wykonaliśmy konstruując ciało C z ciała R).

Będziemy utożsamiać dowolny wektor u z U z wektorem (u, 0) z U

. Nie

doprowadzi to do nieporozumień, ponieważ U 3 u −→ (u, 0) ∈ U

jest

monomorfizmem przestrzeni wektorowych nad R (U

można traktować jako

przestrzeń nad R zawężając mnożenie C × U

−→ U

do R × U

). Przy

takim utożsamieniu dowolny wektor (u, v) z U

można zapisywać w postaci

u + iv, co też będziemy robić. Dzięki temu staje się oczywiste, że definicja
mnożenia wektorów przez skalary w U

powinna być właśnie taka, jaka jest.

Ćwiczenie. Niech u

, . . . , u

, v

, . . . , v

, w

, . . . , w

∈ U. Udowodnić, że

ciąg u

, . . . , u

, v

, w

, . . . , v

, w

jest bazą U wtedy i tylko wtedy, gdy ciąg

, . . . , u

, v

+ iw

, v

− iw

, . . . , v

+ iw

, v

− iw

jest bazą U

(nad C).

Dla dowolnego wektora u+iv z U

(przy czym u, v ∈ U) definiujemy jego

sprzężenie u + iv = u − iv

Ćwiczenie. Zauważyć, że p + q = p + q i λp = λ p dla p, q ∈ U

, λ ∈ C.

104

Gdy U i V są przestrzeniami wektorowymi nad R, a f : U −→ V jest

liniowe, to kompleksyfikacją f nazywa się odwzorowanie f

: U

−→ V

określone dla u, v ∈ U wzorem

(u + iv) = f (u) + if (v).

Ćwiczenie. Zauważyć, że f

jest jedynym odwzorowaniem liniowym

−→ V

(nad C), którego zawężenie do U jest równe f (ostatni warunek

ma sens, bo na podstawie opisanego utożsamienia U ⊂ U

i V ⊂ V

Ćwiczenie. Zauważyć, że f

(p) = f

(p) dla p ∈ U

W praktyce kompleksyfikacja przestrzeni wektorowej lub odwzorowania

liniowego okazuje się łatwiejsza, niż by się to mogło wydawać na pierwszy
rzut oka. Otóż można uważać, że (R

)

to po prostu C

, utożsamiając dla

dowolnych a

, . . . , a

, b

, . . . , b

∈ R wektor (a

, . . . , a

) + i(b

, . . . , b

) z (R

)

z wektorem (a

+ ib

, . . . , a

+ ib

) z C

. Wówczas (z

, . . . , z

) = (z

, . . . , z

)

dla (z

, . . . , z

) ∈ C

. Ponadto, jak nietrudno zauważyć, jeśli f : R

−→ R

jest liniowe, to f

: C

−→ C

ma w bazach kanonicznych C

i C

tę samą

macierz, co f w bazach kanonicznych R

i R

(ma to sens, bo R ⊂ C, więc

q×p

(R) ⊂ M

q×p

(C)).

Uogólniona macierz Jordana i baza Jordana

Niech λ = α + iβ, gdzie α, β ∈ R, β 6= 0, i niech s ≥ 1. Uogólnioną klatką

Jordana rozmiaru 2s o wartości własnej λ nazywa się macierz z M

2s×2s

(R)

postaci







. .. ...





 ,

gdzie

L =

−β α

I =

1 0
0 1

Taka klatka ma zatem wzdłuż głównej przekątnej s bloków L, bezpośrednio
pod nią s − 1 bloków I, a wszędzie poza tymi blokami wyrazy równe 0.

105

Uogólnioną macierzą Jordana nazywa się każdą macierz kwadratową o

wyrazach rzeczywistych mającą wzdłuż głównej przekątnej rozmieszczone
klatki Jordana i uogólnione klatki Jordana, natomiast wszędzie poza tymi
klatkami wyrazy równe 0. Jak łatwo się domyślić, uogólnioną bazą Jordana
endomorfizmu f : U −→ U rzeczywistej skończenie wymiarowej przestrzeni
wektorowej U nazywa się dowolną uporządkowaną bazę U, w której macierz
f jest uogólnioną macierzą Jordana.

Udowodnimy teraz uogólnione twierdzenie Jordana.

Twierdzenie. Dla każdego endomorfizmu skończenie wymiarowej rzeczy-

wistej przestrzeni wektorowej istnieje uogólniona baza Jordana.

Dowód: Rozpatrzmy kompleksyfikację f

: U

−→ U

endomorfizmu

f : U −→ U, dla którego ma istnieć uogólniona baza Jordana. Wielomian
charakterystyczny f

jest równy wielomianowi charakterystycznemu f , więc

jego współczynniki są rzeczywiste. Dlatego jeśli λ jest wartością własną f

to jest nią również λ. Będziemy konstruować uogólnioną bazę Jordana f
po kawałku, przy czym każdy z kawałków będzie odpowiadał albo rzeczywi-
stej wartości własnej f

, albo parze wzajemnie sprzężonych nierzeczywistych

wartości własnych f

. W pierwszym przypadku, czyli gdy λ ∈ R, λ jest też

wartością własną f i jako kawałek konstruowanej bazy odpowiadający λ bie-
rzemy bazę Jordana zawężenia f do jego podprzestrzeni pierwiastkowej o
wartości własnej λ. Zauważmy, że wtedy podprzestrzeń pierwiastkowa f

wartości własnej λ jest równa kompleksyfikacji podprzestrzeni pierwiastkowej
f o wartości własnej λ, bo ((f − λid

)

= (f

− λid

)

, i skonstruowany

kawałek jest też bazą Jordana zawężenia f

do jego podprzestrzeni pier-

wiastkowej o wartości własnej λ. Natomiast w drugim przypadku, czyli gdy
λ = α + iβ, gdzie α, β ∈ R, β 6= 0, wychodzimy od bazy Jordana zawężenia
f

do jego podprzestrzeni pierwiastkowej o wartości własnej λ. Jako kawałek

konstruowanej bazy odpowiadający (λ, λ) bierzemy ciąg powstały z tej bazy
Jordana przez zastąpienie każdego z wektorów v + iw, gdzie v, w ∈ U, wek-
torami v, w. Zauważmy, że jeśli f

) = λp

+ p

j+1

dla j ∈ {1, . . . , s − 1}, a

) = λp

, to f

) = λp

+ p

j+1

dla j ∈ {1, . . . , s − 1}, a f

) = λp

Wynika z tego, że jeśli w bazie Jordana zawężenia f

do jego podprzestrzeni

pierwiastkowej o wartości własnej λ zastąpimy każdy wektor jego sprzęże-
niem, to dostaniemy bazę Jordana zawężenia f

do jego podprzestrzeni pier-

wiastkowej o wartości własnej λ. Stąd na podstawie wcześniejszego ćwiczenia

106

widać, że po ustawieniu w ciąg jeden po drugim wszystkich skonstruowanych
kawałków otrzymamy bazę U. Będzie ona uogólnioną bazą Jordana f , bo
jeśli f

+ iw

) = (α + iβ)(v

+ iw

) + v

j+1

+ iw

j+1

dla j ∈ {1, . . . , s − 1}, a

+ iw

) = (α + iβ)(v

+ iw

), gdzie α, β ∈ R, v

, . . . , v

, w

, . . . , w

∈ U,

to f (v

) = αv

− βw

+ v

j+1

, f (w

) = βv

+ αw

+ w

j+1

dla j ∈ {1, . . . , s − 1},

a f (v

) = αv

− βw

, f (w

) = βv

+ αw

. Oznacza to koniec dowodu.

Przeprowadzony dowód zawiera algorytm obliczania uogólnionej macierzy

Jordana i uogólnionej bazy Jordana. Oblicza się je kawałkami, po jednym
kawałku dla każdej rzeczywistej wartości własnej i każdej pary wzajemnie
sprzężonych nierzeczywistych wartości własnych. Dla rzeczywistej wartości
własnej nie dzieje się nic nowego, oblicza się po prostu macierz Jordana i bazę
Jordana zawężenia endomorfizmu do podprzestrzeni pierwiastkowej o tej war-
tości własnej. Natomiast dla pary wzajemnie sprzężonych nierzeczywistych
wartości własnych (λ, λ) oblicza się najpierw macierz Jordana i bazę Jordana
zawężenia kompleksyfikacji endomorfizmu do podprzestrzeni pierwiastkowej
tylko jednej z tych wartości własnych, powiedzmy λ. Z otrzymanej macierzy
Jordana uzyskuje się kawałek uogólnionej bazy Jordana zastępując wyrazy λ
na głównej przekątnej i wyrazy 1 bezpośrednio pod nią odpowiednio blokami

−β α

1 0
0 1

gdzie λ = α+iβ, α, β ∈ R, a z otrzymanej bazy Jordana uzyskuje się kawałek
uogólnionej bazy Jordana zastępując każdy wektor jego częścią rzeczywistą
i urojoną (to znaczy wektor u + iv z U

, gdzie u, v ∈ U, wektorami u, v).

Oczywiście na końcu należy wszystkie tak skonstruowane kawałki macierzy
ułożyć wzdłuż głównej przekątnej szukanej uogólnionej macierzy Jordana,
wypełniając pozostałe miejsca zerami, zaś wszystkie kawałki bazy ustawić
jeden za drugim w ciąg, który będzie szukaną uogólnioną bazą Jordana.

W tym miejscu warto jeszcze zauważyć, że uogólnione macierze Jordana

tego samego endomorfizmu mogą się różnić nie tylko kolejnością klatek, ale
również tym, że wartości własne niektórych uogólnionych klatek Jordana
tych samych rozmiarów zamiast być jednakowe, mogą być tylko wzajemnie
sprzężone. Naturalnie tych niejednoznaczności można by się łatwo pozbyć,
żądając na przykład, by w blokach na głównej przekątnej o wyżej wypisanej
postaci było zawsze β < 0, a wartości własne były uporządkowane rosnąco
względem porządku leksykograficznego na zbiorze R

, którym jest C.

107

Przykład. Znajdziemy uogólnioną macierz Jordana i uogólnioną bazę

Jordana endomorfizmu f : R

3 (x, y) −→ (5x−4y, 2x+y) ∈ R

. Jak wiemy,

przy odpowiednim utożsamieniu f

: C

3 (x, y) −→ (5x − 4y, 2x + y) ∈ C

Wielomian charakterystyczny f

to X

−6X +13, więc wartościami własnymi

są 3−2i i 3+2i. Od dawna znanym sposobem obliczamy, że zawężenie f

do jego podprzestrzeni pierwiastkowej o wartości własnej 3 − 2i ma macierz
Jordana [3 − 2i] i bazę Jordana (1 − i, 1). Zatem f ma uogólnioną macierz
Jordana

3 −2
2

i uogólnioną bazę Jordana (1, 1), (−1, 0) składającą się z części rzeczywistej
i urojonej wektora (1 − i, 1). Łatwo się przekonać, że uzyskany wynik jest
prawidłowy: po obliczeniu w zwykły sposób macierzy endomorfizmu f w zna-
lezionej uogólnionej bazie Jordana wychodzi znaleziona uogólniona macierz
Jordana. Rzecz jasna, f ma także uogólnioną macierz Jordana

−2 3

w uogólnionej bazie Jordana (1, 1), (1, 0), co ilustruje wspomnianą niejedno-
znaczność uogólnionej macierzy Jordana (oczywiście dla każdej z tych dwóch
uogólnionych macierzy Jordana można dobrać wiele różnych uogólnionych
baz Jordana).

Na zakończenie odnotujmy rzeczywistą wersję klasyfikacji endomorfizmów

będącą podsumowaniem uogólnionej teorii Jordana.

Twierdzenie. Istnieje kanoniczna bijekcja między klasami abstrakcji re-

lacji równoważności endomorfizmów skończenie wymiarowych rzeczywistych
przestrzeni wektorowych a uogólnionymi macierzami Jordana, o ile utożsa-
mia się takie macierze, że jedna powstaje z drugiej przez zmianę kolejności
klatek Jordana i uogólnionych klatek Jordana lub przez zastąpienie wartości
własnych niektórych uogólnionych klatek Jordana wartościami własnymi z
nimi sprzężonymi. Bijekcja ta przypisuje każdej klasie abstrakcji uogólnioną
macierz Jordana dowolnego jej reprezentanta.

Sugerowane sposoby zapewnienia jednoznaczności uogólnionych macierzy

Jordana uprościłyby wypowiedź powyższego twierdzenia, jednak nie są one
powszechnie przyjęte.

108

Zespolone przestrzenie wektorowe jako rzeczywiste

Powiedzieliśmy już nieco o kompleksyfikacji, która pozwala wychodząc

od rzeczywistej przestrzeni wektorowej skonstruować przestrzeń wektorową
zespoloną. Przy okazji zauważyliśmy, że zespolona przestrzeń wektorowa U
może być traktowana jako rzeczywista przez zawężenie ciała skalarów, czyli
mówiąc dokładnie zawężenia mnożenia wektorów przez skalary C × U −→ U
do podzbioru R × U. Teraz przedstawimy kilka najbardziej podstawowych
faktów dotyczących tej drugiej operacji, zostawiając ich nietrudne dowody
jako ćwiczenia. Zauważmy też, że operacje kompleksyfikacji i zawężenia ciała
skalarów nie są wzajemnie odwrotne, bo ich złożenie w dowolnej kolejności
podwaja wymiar przestrzeni wektorowych skończonego wymiaru.

Ćwiczenie. Niech u

, . . . , u

będzie bazą przestrzeni wektorowej U nad

ciałem C. Zauważyć, że u

, . . . , u

, iu

, . . . , iu

jest bazą U nad R.

Ćwiczenie. Załóżmy, że u

, . . . , u

i v

, . . . , v

są bazami przestrzeni

wektorowych U i V nad ciałem C, a f : U −→ V . Sprawdzić, że f jest
C-liniowe (czyli liniowe jako odwzorowanie przestrzeni wektorowych nad C)
wtedy i tylko wtedy, gdy jest R-liniowe (czyli liniowe jako odwzorowanie
przestrzeni wektorowych nad R) oraz ma w bazach u

, . . . , u

, iu

, . . . , iu

, . . . , v

, iv

, . . . , iv

macierz postaci

A −B

gdzie A, B ∈ M

q×p

(R) (wtedy f jako odwzorowanie C-liniowe ma w bazach

, . . . , u

i v

, . . . , v

macierz A + iB).

Ćwiczenie. Załóżmy, że f jest endomorfizmem skończenie wymiarowej

przestrzeni wektorowej nad C i oznaczmy przez f

to samo odwzorowanie

f , ale traktowane jako endomorfizm przestrzeni wektorowej nad R, a przez
W

(X) i W

(X) wielomiany charakterystyczne f i f

. Udowodnić, że

(X) = W

(X)W

(X),

gdzie W

(X) oznacza wielomian powstały z W

(X) przez zastąpienie każdego

współczynnika jego sprzężeniem. Zauważyć, że w szczególności

det f

= | det f |

tr f

= 2Re (tr f ).

109

Wskazówka: dla dowolnych A, B ∈ M

p×p

(R[X]) zachodzi równość

A −B

1
2

¸ ·

A − iB

A + iB

¸ ·

−iI

gdzie 0 i I oznaczają macierze zerową i jednostkową z M

p×p

(R) (ale oczywiście

wszystkie bloki są tu traktowane jako macierze z M

p×p

(C[X])); zastosować

do tej równości wzór Cauchy’ego.

Przykład. Dowolny endomorfizm przestrzeni wektorowej C nad ciałem

C jest postaci f : C 3 z −→ λz ∈ C dla pewnego λ ∈ C. Niech λ = α + iβ,
gdzie α, β ∈ R. Macierzą C-endomorfizmu f w bazie 1 jest [λ], czyli [α + iβ].
Dla z = x + iy, gdzie x, y ∈ R, λz = αx − βy + i(βx + αy), więc faktycznie
macierzą R-endomorfizmu f w bazie 1, i jest

α −β
β

Widać to wyraźnie, gdy się pamięta, że C = R

, 1 = (1, 0), i = (0, 1). Jasne

też jest, że każdy C-endomorfizm jest R-endomorfizmem, ale nie odwrotnie,
bo C-endomorfizmami są tylko te R-endomorfizmy, które w bazie 1, i mają
macierz szczególnej, wyżej wypisanej postaci. Na tym prostym przykładzie
można również bezpośrednio zobaczyć zależności między wyznacznikami i
śladami f traktowanego jako C-endomorfizm i R-endomorfizm.

Macierz formy dwuliniowej

Definicja. Niech U i V będą skończenie wymiarowymi przestrzeniami

wektorowymi nad ciałem K, ciągi u

, . . . , u

, v

, . . . , v

niech będą bazami

odpowiednio U i V , natomiast f : U × V −→ K odwzorowaniem dwuliniową
(takie odwzorowania będziemy nazywać formami dwuliniowym). Macierz





f (u

, v

) . . . f (u

, v

)

...

f (u

, v

) . . . f (u

, v

)





nazywa się macierzą formy dwuliniowej f w bazach u

, . . . , u

i v

, . . . , v

Od razu widać, że dla dowolnie ustalonych baz U i V odwzorowanie

L(U, V ; K) −→ M

p×q

(K), które przyporządkowuje formom dwuliniowym ich

macierze w tych bazach, jest izomorfizmem przestrzeni wektorowych.

110

Przykład. Obliczanie macierzy formy kwadratowej jest łatwiejsze niż

obliczanie macierzy odwzorowania liniowego. Jeżeli chcemy znaleźć macierz
f : R

× R

3 ((a, b), (c, d, e)) −→ 2ac + ad − 5bc − 3bd − 4be ∈ R w bazach

(1, 1), (0, 1) i (0, 1, 0), (0, 1, 1), (1, 1, 0), to obliczamy f ((1, 1), (0, 1, 0)) = −2,
f ((1, 1), (0, 1, 1)) = −6, f ((1, 1), (1, 1, 0)) = −5, f ((0, 1), (0, 1, 0)) = −3,
f ((0, 1), (0, 1, 1)) = −7, f ((0, 1), (1, 1, 0)) = −8 i dostajemy

−2 −6 −5
−3 −7 −8

Natomiast macierzą f w bazach kanonicznych jest

−5 −3 −4

co widać bez żadnych obliczeń.

Twierdzenie. Niech U i V będą przestrzeniami wektorowymi nad ciałem

K, u

, . . . , u

i v

, . . . , v

bazami odpowiednio U i V , f : U × V −→ K

odwzorowaniem dwuliniowym oraz niech x ∈ U i v ∈ V . Jeżeli x

, . . . , x

, . . . , y

są współrzędnymi x i y w tych bazach, to

[f (x, y)] =





...





∗





. . . a

...

. . . a









...



 ,

przy czym trzecia z macierzy występujących w tym wzorze jest macierzą f w
bazach u

, . . . , u

i v

, . . . , v

Dowód: f (x, y) = f (

p
i=1

q
j=1

) =

p
i=1

q
j=1

f (u

, v

) =

p
i=1

q
j=1

Przykład. Dla f : R

× R

3 ((a, b), (c, d)) −→ 4ac + 2ad + bc + 3bd ∈ R

dostajemy f ((1, −2), (3, 1)) = 2, bo

[ 1 −2 ]

4 2
1 3

¸ ·

3
1

= [2].

Wykażemy teraz wzór transformacyjny, który pokazuje jak zmienia się

macierz formy dwuliniowej przy zmianie baz.

111

Twierdzenie. Załóżmy, że u

, . . . , u

i u

, . . . , u

są bazami przestrzeni

wektorowej U, v

, . . . , v

i v

, . . . , v

są bazami przestrzeni wektorowej V , zaś

f : U ×V −→ K jest dwuliniowe. Jeżeli A jest macierzą f w bazach u

, . . . , u

i v

, . . . , v

, a A

macierzą f w bazach u

, . . . , u

i v

, . . . , v

, to

= P

∗

AQ,

gdzie P oznacza macierz przejścia od bazy u

, . . . , u

do bazy u

, . . . , u

, a Q

macierz przejścia od bazy v

, . . . , v

do bazy v

, . . . , v

Dowód: Niech x ∈ U, a y ∈ V oraz niech X i X

oznaczają macierze z

p×1

(K), których wyrazy to współrzędne x w bazie odpowiednio u

, . . . , u

i u

, . . . , u

, a Y i Y

macierze z M

q×1

(K), których wyrazy to współrzędne

y w bazie odpowiednio v

, . . . , v

i v

, . . . , v

. Wstawiając X = P X

i Y =

do równości [f (x, y)] = X

∗

AY dostajemy [f (x, y)] = X

0∗

∗

AQY

. Z

drugiej strony [f (x, y)] = X

0∗

. Ponieważ x i y są dowolne, to równość

0∗

= X

0∗

∗

AQ)Y

oznacza, że A

i P

∗

AQ są macierzami w bazach

, . . . , u

i v

, . . . , v

tej samej formy kwadratowej, więc A

= P

∗

AQ.

Dla formy dwuliniowej f : U ×V −→ K określamy L

: V −→ U

∗

wzorem

(v))(u) = f (u, v).

Twierdzenie. Odwzorowanie

L(U, V ; K) 3 f −→ L

∈ Hom(V, U

∗

)

jest izomorfizmem.

Dowód: Liniowość jest oczywista, zaś odwzorowaniem odwrotnym jest

przypisanie dowolnemu L z Hom(V, U

∗

) formy f z L(U, V ; K) określonej

wzorem f (u, v) = (L(v))(u).

Twierdzenie to pozwala utożsamiać formy z L(U, V ; K) z odwzorowaniami

z Hom(V, U

∗

). Następne twierdzenie czyni takie utożsamienie jeszcze bardziej

naturalnym.

Twierdzenie. Niech u

, . . . , u

będzie bazą U, a v

, . . . , v

bazą V . Wtedy

dla dowolnej f ∈ L(U, V ; K) macierz f w bazach u

, . . . , u

i v

, . . . , v

jest

taka sama, jak macierz L

w bazach v

, . . . , v

i u

∗

, . . . , u

∗

112

Dowód: Teza twierdzenia wynika stąd, że L

) =

p
i=1

f (u

, v

∗

, a

ta równość zachodzi, bo wartości obu jej strony na wektorach u

, . . . , u

są

jednakowe, jako że (L

))(u

) = f (u

, v

Rzędem formy dwuliniowej f : U × V −→ K będziemy nazywać rząd

odwzorowania liniowego L

, o ile jest on skończony (a więc w szczególności,

gdy U i V mają skończone wymiary).

Wniosek. Gdy wymiary U i V są skończone, to rząd formy dwuliniowej

U × V −→ K jest równy rzędowi jej macierzy w dowolnych bazach.

Mówi się, ze forma dwuliniowa f : U × V −→ K jest niezdegenerowana,

gdy L

: V −→ U

∗

jest izomorfizmem. Taka forma pozwala utożsamiać V i

∗

poprzez ten izomorfizm. Oczywiście gdy wymiary U i V są skończone, to

f jest niezdegenerowana wtedy i tylko wtedy, gdy jej macierz w dowolnych
bazach jest kwadratowa i ma wyznacznik różny od 0.

Dla form dwuliniowych określonych na iloczynie kartezjańskim dwóch jed-

nakowych przestrzeni szczególne znaczenie mają macierze w jednej bazie, tej
samej w obu tych przestrzeniach (podobnie jak dla endomorfizmów macierze
w tej samej bazie w dziedzinie i przeciwdziedzinie).

Macierz kwadratową A nazywa się symetryczną, kiedy A

∗

= A, zaś anty-

symetryczną, kiedy A

∗

= −A. Obrazowo można powiedzieć, że w macierzy

symetrycznej wyrazy położone symetrycznie po obu stronach głównej prze-
kątnej są równe, a w antysymetrycznej przeciwne. Gdy charakterystyka ciała
skalarów jest rożna od 2, to wyrazy macierzy antysymetrycznej leżące na
głównej przekątnej muszą być równe 0 jako przeciwne same do siebie. Dla
zachowania jednolitości umówmy się zatem w przypadku charakterystyki 2
nazywać antysymetrycznymi tylko te macierze, które spełniają dodatkowo
również i ten warunek.

Przykład. Jeden rzut oka na macierze





−1

−3



 ,





−7

−4

−2





pozwala stwierdzić, że pierwsza jest symetryczna, a druga antysymetryczna.

113

Ponieważ każdy wektor jest kombinacją liniową wektorów bazy, to mamy

prosty sposób rozpoznawania czy forma dwuliniowa jest symetryczna lub
antysymetryczna po wyglądzie jej macierzy zapisanej w jednej bazie.

Twierdzenie. Jeżeli u

, . . . , u

jest bazą przestrzeni wektorowej U nad

ciałem K, f : U × U −→ K formą dwuliniową, a A jej macierzą w bazie
u

, . . . , u

, to

1) f jest symetryczna wtedy i tylko wtedy, gdy A jest symetryczna,
2) f jest antysymetryczna wtedy i tylko wtedy, gdy A jest antysymetryczna.

Twierdzenie Lagrange’a

Twierdzenie. Załóżmy, że U jest skończenie wymiarową przestrzenią

wektorową nad ciałem K charakterystyki różnej od 2, a f : U × U −→ K
symetryczną formą dwuliniową. Wówczas istnieje taka baza przestrzeni U,
w której f ma macierz diagonalną.

Dowód: Niech dim U = n. Opiszemy efektywny algorytm dający bazę,

której istnienie powinniśmy udowodnić. Jest on rekurencyjny ze względu na
k ∈ {1, . . . , n − 1}, przy czym celem k-tego kroku jest skonstruowanie takiej
bazy w

, . . . , w

, że f (w

, w

) = 0 dla i ∈ {1, . . . , k} oraz j ∈ {i + 1, . . . , n}.

Rozpocząć można od dowolnej bazy. Przypuśćmy, że krok k − 1 został już
wykonany i mamy taką bazę u

, . . . , u

, że f (u

, u

) = 0 dla i ∈ {1, . . . , k −1}

oraz j ∈ {i + 1, . . . , n}. Możemy też założyć, że f (u

, u

) 6= 0 dla pewnego

j ∈ {k + 1, . . . , n}, bo inaczej można by natychmiast zakończyć k-ty krok
przyjmując w

= u

, . . . , w

= u

. Najpierw szukamy takiej bazy v

, . . . , v

że nadal f (v

, v

) = 0 dla i ∈ {1, . . . , k − 1} oraz j ∈ {i + 1, . . . , n}, ale

dodatkowo f (v

, v

) 6= 0. Jeśli f (u

, u

) 6= 0, to wystarczy wziąć po prostu

= u

, . . . , v

= u

. W przeciwnym przypadku patrzymy, czy istnieje takie

j ∈ {k + 1, . . . , n}, że f (u

, u

) 6= 0. Jeśli tak, to bierzemy v

= u

i v

= u

zaś v

= u

dla pozostałych i. Jeśli nie, to mamy takie j ∈ {k + 1, . . . , n},

że f (u

, u

) 6= 0, i przyjmujemy v

= u

+ u

i v

= u

− u

, zaś v

= u

dla pozostałych i (wtedy f (v

, v

) = 2f (u

, u

) 6= 0, a v

, . . . , v

jest bazą,

ponieważ u

1
2

+ v

) i u

1
2

− v

), zatem lin {v

, . . . , v

} = U).

Mając już v

, . . . , v

, wykonujemy zasadniczą część k-tego kroku przyjmując

= v

, . . . , w

= v

, w

k+1

= v

k+1

+ α

k+1

, . . . , w

= v

+ α

k+1

, . . . , α

dobranymi tak, aby baza w

, . . . , w

miała żądane własności.

Jak widać, α

= −f (v

, v

)/f (v

, v

) dla j ∈ {k + 1, . . . , n} są dobre.

114

Przykład. Stosując algorytm opisany w dowodzie znajdziemy dla formy

× R

3 ((a, b, c), (d, e, f )) −→ ae − af + bd + 3bf − cd + 3ce ∈ R bazę, w

której ma ona macierz diagonalną. Jej macierz bazie kanonicznej to





1 −1

−1 3



 .

Wyjdziemy od bazy kanonicznej. W pierwszym kroku chcemy uzyskać bazę,
w której macierz formy będzie miała wyrazy równe 0 w pierwszym wierszu
i pierwszej kolumnie, być może poza wyrazem leżącym na ich przecięciu.
Niestety, w bazie u

= (1, 0, 0), u

= (0, 1, 0), u

= (0, 0, 1) macierz formy ma

na przecięciu pierwszego wiersza i pierwszej kolumny wyraz równy 0, musimy
więc najpierw zmienić bazę, by stał się on różny od 0. Co gorsze, wszystkie
dalsze wyrazy z głównej przekątnej też są równe 0, więc nie wystarczy zmienić
kolejności wektorów bazy. Dlatego postępując zgodnie z procedurą tworzymy
bazę v

= (1, 0, 0) + (0, 1, 0) = (1, 1, 0), v

= (1, 0, 0) − (0, 1, 0) = (1, −1, 0),

= (0, 0, 1), w której forma ma macierz





1 −1 0
0









1 −1

−1 3









1 −1 0
0



 =





0 −2 −4
2 −4



 .

Teraz już możemy przystąpić do zasadniczej części pierwszego kroku. Zatem
konstruujemy bazę w

= (1, 1, 0), w

= (1, −1, 0) −

0
2

(1, 1, 0) = (1, −1, 0),

= (0, 0, 1) −

2
2

(1, 1, 0) = (−1, −1, 1), w której forma ma macierz





−1 0

−1 −1 1









1 −1

−1 3









−1

1 −1 −1
0



 =





0 −2 −4
0 −4 −2



 .

Widać, że pierwszy krok został pomyślnie zakończony. Żeby nie komplikować
oznaczeń umówmy się, że te stosowane dotychczas, w następnym kroku już
nie obowiązują. Oczywiście teraz wychodzimy od bazy, do której ostatnio
doszliśmy. W drugim kroku chcemy uzyskać bazę, w której macierz formy
będzie miała wyrazy równe 0 także w drugim wierszu i drugiej kolumnie,
być może poza wyrazem leżącym na ich przecięciu. Na szczęście w aktualnej
bazie u

= (1, 1, 0), u

= (1, −1, 0), u

= (−1, −1, 1) macierz formy ma na

przecięciu drugiego wiersza i drugiej kolumny wyraz różny od 0, więc po

115

prostu przyjmujemy v

= (1, 1, 0), v

= (1, −1, 0), v

= (−1, −1, 1) i od razu

przystępujemy do zasadniczej części drugiego kroku, czyli konstruujemy bazę
w

= (1, 1, 0), w

= (1, −1, 0), w

= (−1, −1, 1) −

(−4)
(−2)

(1, −1, 0) = (−3, 1, 1),

w której forma ma macierz





−1 0

−3









1 −1

−1 3









−3

1 −1



 =





0 −2 0
0



 .

Widać, że drugi i ostatni krok został pomyślnie zakończony.

Twierdzenie Sylvestera

W przypadku rzeczywistym twierdzenie Lagrange’a można wzmocnić.

Twierdzenie. Załóżmy, że U jest skończenie wymiarową rzeczywistą

przestrzenią wektorową, a f : U × U −→ R symetryczną formą dwuliniową.
Wówczas istnieje taka baza przestrzeni U, w której f ma macierz diagonalną,
przy czym na głównej przekątnej tej macierzy występują kolejno: pewna ilość
wyrazów równych 1, pewna ilość wyrazów równych −1, pewna ilość wyrazów
równych 0, i nie występują tam żadne inne wyrazy.

Dowód: Z twierdzenia Lagrange’a mamy bazę u

, . . . , u

, w której f ma

macierz diagonalną z wyrazami a

, . . . , a

na głównej przekątnej. Żądaną

bazę otrzymujemy wymieniając w bazie u

, . . . , u

wektory u

na (1/

|)u

dla takich i ∈ {1, . . . , n}, że a

6= 0, a następnie zmieniając odpowiednio

kolejność wektorów.

Przykład. Symetryczna forma dwuliniowa z poprzedniego przykładu ma

w bazie

√

(1, 1, 0),

√

(−3, 1, 1),

√

(1, −1, 0) macierz





1 0

0 1

0 0 −1



 .

Opisana w ostatnim twierdzeniu specjalna postać macierzy diagonalnej

jest wyznaczona jednoznacznie przez samą formę. Mówi o tym następujące
twierdzenie Sylvestera, nazywane też twierdzeniem o bezwładności.

116

Twierdzenie. Załóżmy, że f : U × U −→ R jest symetryczną formą

dwuliniową, a u

, . . . , u

i v

, . . . , v

bazami przestrzeni wektorowej U nad

ciałem R. Jeżeli macierz f w bazie u

, . . . , u

jest diagonalna i ma na głównej

przekątnej p wyrazów równych 1, q wyrazów równych −1 i n − p − q wyrazów
równych 0, a macierz f w bazie v

, . . . , v

jest diagonalna i ma na głównej

przekątnej r wyrazów równych 1, s wyrazów równych −1 i n − r − s wyrazów
równych 0, to r = p i s = q.

Dowód: Bez straty ogólności możemy założyć, że wyrazy na głównych

przekątnych w obu macierzach są uporządkowane tak, jak w poprzednim
twierdzeniu. Ponieważ każda z sum p + q i r + s jest równa rzędowi f , to
wystarczy dowieść, że r = p. Przypuśćmy dla dowodu nie wprost, że r < p.
Wtedy dim(lin {u

, . . . , u

} ∩ lin {v

r+1

, . . . , v

}) ≥ p + (n − r) − n > 0, więc

istnieje w ∈ (lin {u

, . . . , u

} ∩ lin {v

r+1

, . . . , v

}) \ {0}. Stąd już uzyskujemy

sprzeczność, bo skoro w = λ

+ . . . + λ

, to f (w, w) = λ

+ . . . + λ

> 0,

a skoro w = µ

r+1

+ . . . + µ

, to f (w, w) = −µ

r+1

− . . . − µ

r+s

≤ 0.

Twierdzenie Sylvestera pozwala postawić następującą definicję.

Definicja. Sygnaturą symetrycznej formy dwuliniowej f : U × U −→ R,

gdzie U jest skończenie wymiarową przestrzenią wektorową nad R, nazywamy
parę (p, q), w której p oznacza ilość wyrazów równych 1, a q ilość wyrazów
równych −1 na głównej przekątnej macierzy f w dowolnej bazie U takiej, że
ta macierz jest diagonalna i ma na głównej przekątnej tylko wyrazy 1, −1, 0.

Przykład. Forma z dwóch ostatnich przykładów ma sygnaturę (2, 1).

Dwie formy dwuliniowe f : U × U −→ K i f

: U

× U

−→ K, gdzie

U są przestrzeniami wektorowymi nad ciałem K, nazywa się równoważnymi,
gdy istnieje taki izomorfizm g : U −→ U

, że f

◦ (g × g) = f . Łatwo

sprawdzić, że faktycznie jest to relacja równoważności na dowolnym zbiorze
takich form. Z punktu widzenia algebry liniowej formy równoważne można
uważać za jednakowe.

Ćwiczenie. Zauważyć, że dwie symetryczne formy dwuliniowe na skoń-

czenie wymiarowych przestrzeniach wektorowych nad tym samym ciałem są
równoważne wtedy i tylko wtedy, gdy istnieją bazy (po jednej dla każdej z
nich), w których mają one jednakowe macierze.

117

Następująca klasyfikacja symetrycznych form dwuliniowych na skończenie

wymiarowych rzeczywistych przestrzeniach wektorowych jest wnioskiem z
poprzednich twierdzeń.

Twierdzenie. Jeśli U i U

są skończenie wymiarowymi przestrzeniami

wektorowymi nad R, to symetryczne formy dwuliniowe f : U × U −→ R i
f

: U

× U

−→ R są równoważne wtedy i tylko wtedy, gdy dim U

= dim U

oraz sygnatury f i f

są jednakowe.

W przypadku zespolonym klasyfikacja symetrycznych form dwuliniowych

na przestrzeniach skończonych wymiarów jest prostsza niż w rzeczywistym.

Ćwiczenie. Zauważyć, że dla dowolnej symetrycznej formy dwuliniowej

na skończenie wymiarowej przestrzeni wektorowej nad ciałem algebraicznie
domkniętym charakterystyki różnej od 2 istnieje baza, w której jej macierz
jest diagonalna i ma na głównej przekątnej tylko wyrazy 1 i 0. Wywnioskować
stąd, że takie formy są równoważne wtedy i tylko wtedy, gdy są określone na
przestrzeniach tego samego wymiaru i mają jednakowe rzędy.

Formy kwadratowe

Będziemy tu zakładać, że ciało skalarów ma charakterystykę różną od 2.

Definicja. Formą kwadratową na przestrzeni wektorowej U nad ciałem

K nazywa się każde odwzorowanie h : U −→ K, dla którego istnieje takie
dwuliniowe f : U × U −→ K, że h(u) = f (u, u) dla każdego u ∈ U.

Wykażemy teraz twierdzenie ukazujące ścisły związek między formami

kwadratowymi a symetrycznych formami dwuliniowymi.

Twierdzenie. Jeżeli U jest przestrzenią wektorową nad ciałem K cha-

rakterystyki różnej od 2, to dla dowolnej formy kwadratowej h : U −→ K
istnieje dokładnie jedna symetryczna forma dwuliniowa g : U × U −→ K
taka, że h(u) = g(u, u) dla każdego u ∈ U. Jest ona określona wzorem

g(u, v) =

1
2

(h(u + v) − h(u) − h(v))

dla wszystkich u, v ∈ U.

118

Dowód: Jeżeli f : U × U −→ K jest dwuliniowe i h(u) = f (u, u) dla

każdego u ∈ U, to g : U × U 3 (u, v) −→

1
2

(f (u, v) + f (v, u)) ∈ K jest

symetryczną formą dwuliniową i h(u) = g(u, u) dla każdego u ∈ U, więc
mamy istnienie g. Ponadto jeżeli g : U × U −→ K jest dowolną symetryczną
formą dwuliniową i h(u) = g(u, u) dla każdego u ∈ U, to dla wszystkich
u, v ∈ U jest h(u + v) − h(u) − h(v) = g(u + v, u + v) − g(u, u) − g(v, v) =
g(u, u) + g(u, v) + g(v, u) + g(v, v) − g(u, u) − g(v, v) = 2g(u, v), więc mamy
jednoznaczność g i wzór z drugiej części twierdzenia.

Definicja. Gdy h : U −→ K jest formą kwadratową i charakterystyka K

jest różna od 2, natomiast g : U × U −→ K jest jedyną symetryczną formą
dwuliniową taką, że h(u) = g(u, u) dla każdego u ∈ U, to będziemy mówić,
że h i g są wzajemnie stowarzyszone.

Wzór, który pojawił się w drugiej części ostatniego twierdzenia nazywa

się wzorem polaryzacyjnym. Pozwala on odtworzyć z formy kwadratowej
symetryczną formę dwuliniową z nią stowarzyszoną, albo inaczej, odtworzyć
symetryczną formę dwuliniową U × U −→ K, kiedy zna się jej wartości tylko
na diagonali iloczynu kartezjańskiego U × U.

Jeśli charakterystyka ciała jest różna od 2, to jest jasne, że wszystko, co

powiedzieliśmy o symetrycznych formach dwuliniowych, można przenieść też
na formy kwadratowe, odnosząc to do stowarzyszonych z nimi symetrycznych
form dwuliniowych. Na przykład macierzą formy kwadratowej o dziedzinie
skończonego wymiaru w dowolnej bazie tej dziedziny nazywa się macierz w
tej bazie stowarzyszonej z nią symetrycznej formy dwuliniowej.

Przykład. h : R

3 (x, y, z) −→ x

+ 8xy − 2xz + 5y

+ 6yz − 7z

∈ R

jest formą kwadratową. Faktycznie, łatwo możemy wskazać stowarzyszoną z
h symetryczną formę dwuliniową. Jest nią g : R

× R

−→ R dana wzorem

g((a, b, c), (d, e, f )) = ad + 4ae + 4bd − af − cd + 5be + 3bf + 3ce − 7cf . Stąd
macierz h w bazie kanonicznej to





4 −1

−1 3 −7



 .

(zwróćmy uwagę, że wyrazy poza główną przekątną to połowy odpowiednich
współczynników h, a nie te współczynniki).

119

Ćwiczenie. Zauważyć, że jeśli K jest ciałem, a n ∈ N, to h : K

−→ K

jest formą kwadratową wtedy i tylko wtedy, gdy jest jednorodną funkcją
wielomianową drugiego stopnia, czyli wyraża się wzorem

h(x

, . . . , x

) =

i=1

j=1

dla (x

, . . . , x

) ∈ K

, przy czym a

∈ K (a

mogą tu być dobrane tak, że

= a

, i wtedy są wyrazami macierzy h w bazie kanonicznej).

Podobnie przenosi się na formy kwadratowe definicje niezdegenerowania

i rzędu, twierdzenie Lagrange’a, twierdzenie Sylvestera i definicję sygnatury.

Niech U będzie rzeczywistą przestrzenią wektorową. Mówi się, że forma

kwadratowa h : U −→ R jest dodatnio określona, gdy h(u) > 0 dla każdego
u ∈ U \ {0}, a ujemnie określona, gdy h(u) < 0 dla każdego u ∈ U \ {0}
(oczywiście zawsze h(0) = 0). Oba te pojęcia naturalnie przenosi się z form
kwadratowych na stowarzyszone z nimi symetryczne formy dwuliniowe.

Ćwiczenie. Zauważyć, że jeśli U ma skończony wymiar n, a sygnaturą

h jest (p, q), to h jest dodatnio albo ujemnie określona odpowiednio wtedy i
tylko wtedy, gdy p = n i q = 0 albo p = 0 i q = n.

Iloczyn skalarny

Wprowadzimy teraz pojęcie iloczynu skalarnego, który umożliwi między

innymi mierzenie długości wektorów oraz kątów między nimi. Będzie to więc
bardzo ważny krok na drodze od algebry do geometrii.

Definicja. Niech U będzie przestrzenią wektorową nad R. Iloczynem

skalarnym na U nazywa się symetryczną formę dwuliniową g : U × U −→ R,
która jest dodatnio określona, to znaczy dla każdego u ∈ U spełnia warunki:
g(u, u) ≥ 0 i g(u, u) = 0 tylko wtedy, gdy u = 0.

Przykład. Najważniejszym przykładem jest niewątpliwie standardowy

iloczyn skalarny na przestrzeni wektorowej R

zdefiniowany wzorem

g((x

, . . . , x

), (y

, . . . , y

)) = x

+ . . . + x

∈ R

dla wszystkich (x

, . . . , x

), (y

, . . . , y

) ∈ R

120

Poniższe ćwiczenia zawierają następne przykłady iloczynów skalarnych.

Ćwiczenie. Oznaczmy Q = {(a

)

i∈N

∈ R

: ∃

M ∈R

∀

n∈N

n
i=0

< M }.

Sprawdzić, że Q jest podprzestrzenią przestrzeni wektorowej R

, natomiast

Q×Q 3 ((a

)

i∈N

, (b

)

i∈N

) −→ lim

n→∞

n
i=0

∈ R jest poprawnie określone

i jest iloczynem skalarnym (wskazówka: średnia geometryczna dwóch liczb
nieujemnych nie przekracza ich średniej arytmetycznej).

Ćwiczenie. Sprawdzić, że C × C 3 (ϕ, ψ) −→

ϕ(x)ψ(x)dx ∈ R jest

iloczynem skalarnym na przestrzeni wektorowej C wszystkich funkcji ciągłych
[0, 1] −→ R.

Ćwiczenie. Sprawdzić, że P × P 3 (ϕ, ψ) −→

2π

ϕ(x)ψ(x)dx ∈ R jest

iloczynem skalarnym na przestrzeni wektorowej P ciągłych funkcji R −→ R
okresowych o okresie 2π (przypomnijmy, że ϕ jest okresowa o okresie 2π, gdy
ϕ(x + 2π) = ϕ(x) dla każdego x ∈ R).

Ćwiczenie. Sprawdzić, że R[X]×R[X] 3 (ϕ, ψ) −→

−1

ϕ(x)ψ(x)dx ∈ R

jest iloczynem skalarnym na przestrzeni wektorowej R[X] (tutaj oczywiście
traktujemy wielomiany z R[X] jako funkcje R −→ R).

Do zapisywania iloczynu skalarnego często używa się kropki, to znaczy

zamiast g(u, v), gdzie g : U × U −→ R jest iloczynem skalarnym, a u, v ∈ U,
pisze się po prostu u · v.

Rzeczywistą przestrzeń wektorową wraz z określonym na niej iloczynem

skalarnym nazywa się wektorową przestrzenią euklidesową (lub krócej, ale
mniej ściśle, przestrzenią euklidesową).

Definicja. Dla wektora u z przestrzeni euklidesowej definiuje się jego

długość jako

kuk =

√

u · u.

Zauważmy, że kuk = 0 wtedy i tylko wtedy, gdy u = 0.

Przykład. Wektor (1, 8, 4) z przestrzeni R

ze standardowym iloczynem

skalarnym ma długość

√

+ 8

+ 4

= 9.

121

Widać, że w R

i R

ze standardowym iloczynem skalarnym zdefiniowana

tu długość wektora pokrywa się ze zwykłą znaną ze szkoły długością wektora
obliczaną na podstawie twierdzenia Pitagorasa.

Udowodnimy teraz tak zwaną nierówność Schwarza.

Twierdzenie. Dla dowolnych wektorów u i v z przestrzeni euklidesowej

|u · v| ≤ kukkvk,

przy czym równość zachodzi wtedy i tylko wtedy, gdy u i v są liniowo zależne.

Dowód: Przypadek u = 0 jest trywialny, więc załóżmy, że u 6= 0. Niech

ϕ : R 3 t −→ ktu + vk

∈ R. Ponieważ iloczyn skalarny jest dwuliniowy i

symetryczny, to ϕ(t) = (tu + v) · (tu + v) = kuk

+ 2(u · v)t + kvk

, a więc ϕ

jest funkcją kwadratową. Ponieważ przyjmuje ona tylko wartości nieujemne,
to ma niedodatni wyróżnik, czyli 4(u·v)

−4kuk

kvk

≤ 0. Stąd natychmiast

dostajemy nierówność Schwarza i widzimy, że staje się ona równością wtedy
i tylko wtedy, gdy wyróżnik ϕ jest równy 0. Ten ostatni warunek zachodzi
wtedy i tylko wtedy, gdy istnieje takie t ∈ R, że ϕ(t) = 0, czyli że tu + v = 0,
co oznacza liniową zależność u i v.

Przypomnijmy, że arccos : [−1, 1] −→ [0, π] jest funkcją odwrotną do

funkcji cos |

[0,π]

: [0, π] −→ [−1, 1].

Definicja. Dla różnych od 0 wektorów u i v z przestrzeni euklidesowej

definiuje się kąt między nimi jako

∠(u, v) = arccos

u · v

kukkvk

Zauważmy, że prawa strona tego wzoru ma sens dzięki nierówności Schwarza
oraz że kąt między wektorami jest liczbą rzeczywistą z przedziału [0, π] (lub
mówiąc inaczej, może przyjmować wartości od 0

◦

do 180

◦

Przykład. Skoro dla u = (1, 0, 1) i v = (1, 1, −4) w R

ze standardowym

iloczynem skalarnym mamy u · v = 1 · 1 + 0 · 1 + 1 · (−4) = −3, kuk =

√

i kvk =

√

18, to (u · v)/(kukkvk) = −

1
2

, a więc kąt między tymi wektorami

jest równy

2
3

π (czyli 120

◦

122

W R

i R

ze standardowym iloczynem skalarnym zdefiniowany tutaj kąt

między wektorami pokrywa się ze zwykłym kątem znanym ze szkoły. Widać
to na podstawie szkolnego twierdzenia cosinusów, które można zapisać w
postaci ku − vk

= kuk

+ kvk

− 2kukkvk cos ∠(u, v), i tego, że ku − vk

(u − v) · (u − v) = kuk

+ kvk

− 2(u · v).

Mówi się, że wektory u i v z przestrzeni euklidesowej są prostopadłe (lub

inaczej ortogonalne), gdy u · v = 0. Wprost z tej definicji wynika, że wektor
0 jest prostopadły do każdego wektora z rozpatrywanej przestrzeni, a dwa
wektory różne od 0 są prostopadłe wtedy i tylko wtedy, gdy kąt między nimi
wynosi

1
2

π (czyli 90

◦

Oczywiście dwa różne od 0 wektory z przestrzeni euklidesowej są liniowo

zależne wtedy i tylko wtedy, gdy kąt między nimi jest równy 0 lub π (czyli
0

◦

lub 180

◦

). Można powiedzieć, że takie wektory mają jednakowe kierunki

oraz odpowiednio jednakowe lub przeciwne zwroty.

Twierdzenie. Dla dowolnych wektorów u i v z przestrzeni euklidesowej

ku + vk ≤ kuk + kvk,

przy czym równość zachodzi wtedy i tylko wtedy, gdy któryś z tych wektorów
jest równy 0 lub oba są różne od 0 oraz mają jednakowe kierunki i zwroty.

Dowód: Z nierówności Schwarza dostajemy ku + vk

= (u + v) · (u + v) =

kuk

+ 2(u · v) + kvk

≤ kuk

+ 2|u · v| + kvk

≤ kuk

+ 2kuk · kvk + kvk

(kuk + kvk)

. Stąd widać i dowodzoną nierówność, i to, że równość zachodzi

wtedy i tylko wtedy, gdy u · v = kukkvk, czyli całą tezę twierdzenia.

Norma na przestrzeni wektorowej

Definicja. Niech U będzie przestrzenią wektorową nad ciałem R lub C,

które oznaczamy przez K. Funkcję U 3 u −→ kuk ∈ [0, +∞) nazywa się
normą na przestrzeni wektorowej U, gdy spełnia warunki

1) kuk = 0 wtedy i tylko wtedy, gdy u = 0,
2) kλuk = |λ|kuk dla wszystkich λ ∈ K, u ∈ U,
3) ku + vk ≤ kuk + kvk dla wszystkich u, v ∈ U.

Ćwiczenie. Wydedukować z 3) i 2), że dla u, v ∈ U ku−vk ≥ |kuk − kvk|.

123

Rzeczywistą lub zespoloną przestrzeń wektorową wraz z określoną na niej

normą nazywa się przestrzenią unormowaną.

Określoną wcześniej długość wektora w przestrzeni euklidesowej i normę

wektora w przestrzeni unormowanej oznaczyliśmy tym samym symbolem.
Nie jest to przypadek, mamy bowiem następujące twierdzenie mówiące, że
każda przestrzeń euklidesowa jest rzeczywistą przestrzenią unormowaną.

Twierdzenie. Jeśli U jest przestrzenią euklidesową, to odwzorowanie

U 3 u −→ kuk ∈ [0, +∞) określone wzorem kuk =

√

u · u jest normą na U.

Dowód: Warunki 1) i 2) z definicji normy są trywialne, a warunek 3) był

przedmiotem poprzedniego twierdzenia.

To twierdzenie sugeruje, by normę wektora z przestrzeni unormowanej

interpretować jako jego długość. W związku z tym warunek 3) z definicji
normy bywa nazywany nierównością trójkąta, bo oznacza, że suma długości
dwóch boków trójkąta jest nie mniejsza od długości jego trzeciego boku.

Dla dowolnej przestrzeni unormowanej U definiujemy funkcję

d : U × U 3 (u, v) −→ kv − uk ∈ [0, +∞).

Ćwiczenie. Sprawdzić, że powyższa funkcja jest metryką na U, czyli że

1) d(u, v) = 0 wtedy i tylko wtedy, gdy v = u,
2) d(v, u) = d(u, v) dla wszystkich u, v ∈ U,
3) d(u, w) ≤ d(u, v) + d(v, w) dla wszystkich u, v, w ∈ U.

Zatem każda przestrzeń unormowana jest przestrzenią metryczną i jako

taka jest również przestrzenią topologiczną. Nie będziemy teraz rozwijać tego
tematu, zauważmy tylko, że w przestrzeni euklidesowej R

ze standardowym

iloczynem skalarnym zdefiniowana tu metryka jest najzwyklejszą metryką
euklidesową i w konsekwencji indukowana przez nią topologia też jest zwykła.

Następne ćwiczenie zawiera tak zwany warunek równoległoboku, który

zachodzi w przestrzeniach euklidesowych i mówi, że w tych przestrzeniach
suma kwadratów długości przekątnych dowolnego równoległoboku jest równa
sumie kwadratów długości wszystkich jego boków.

124

Ćwiczenie. Sprawdzić, że dla dowolnych wektorów u i v z przestrzeni

euklidesowej zachodzi równość

ku + vk

+ ku − vk

= 2(kuk

+ kvk

Dzięki warunkowi równoległoboku możemy się przekonać, że nie każda

rzeczywista przestrzeń unormowana jest przestrzenią euklidesową.

Ćwiczenie. Sprawdzić, że C 3 ϕ −→ sup

x∈[0,1]

|ϕ(x)| ∈ [0, +∞) jest

normą na przestrzeni wektorowej C wszystkich funkcji ciągłych [0, 1] −→ R.
Dla tej normy oraz ϕ : [0, 1] 3 x −→ x ∈ R i ψ : [0, 1] 3 x −→ 1 − x ∈ R
mamy kϕk = 1, kψk = 1, kϕ + ψk = 1, kϕ − ψk = 1, a więc norma ta nie
spełnia warunku równoległoboku. Dlatego nie może istnieć iloczyn skalarny
na C, od którego by ona pochodziła.

A zatem norma pochodząca od iloczynu skalarnego spełnia warunek rów-

noległoboku. Twierdzenie odwrotne jest również prawdziwe, to znaczy norma
na rzeczywistej przestrzeni wektorowej spełniająca warunek równoległoboku
pochodzi od pewnego iloczynu skalarnego, ale dowód tego faktu jest znacznie
trudniejszy. Stanowi on przedmiot poniższych ćwiczeń.

Ćwiczenie. Udowodnić, że każda norma na przestrzeni wektorowej U,

która spełnia warunek równoległoboku, spełnia także następujący warunek
równoległościanu: dla każdych u, v, w ∈ U

ku + v + wk

= ku + vk

+ kv + wk

+ kw + uk

− kuk

− kvk

− kwk

(czyli kwadrat normy przekątnej dowolnego równoległościanu jest różnicą
sum kwadratów norm wychodzących z jednego jej końca przekątnych ścian
oraz krawędzi).

Ćwiczenie. Udowodnić, że jeśli norma na przestrzeni wektorowej U nad

ciałem R spełnia warunek równoległoboku, to istnieje na U iloczyn skalarny,
od którego ta norma pochodzi (to znaczy ta norma i ten iloczyn skalarny są
ze sobą związane zależnością kuk =

√

u · u dla każdego u ∈ U). Wskazówka:

u · v =

1
2

(ku + vk

− kuk

− kvk

) dla u, v ∈ U; addytywność prawej strony

ze względu na jedną zmienną przy dowolnie ustalonej drugiej łatwo wykazać
z warunku równoległościanu; z addytywności wywieść Q-liniowość, a z niej
oraz z gęstości Q w R i ciągłości R-liniowość.

125

Zbiory ortogonalne i ortonormalne

Podzbiór A przestrzeni euklidesowej nazywa się ortogonalnym, gdy każde

dwa jego elementy są do siebie prostopadłe, czyli gdy u · v = 0 dla każdych
u, v ∈ A takich, że u 6= v. Taki ortogonalny podzbiór A nazywa się orto-
normalnym, gdy dodatkowo wszystkie wektory z A mają długość równą 1,
czyli kuk = 1 dla każdego u ∈ A (ta nazwa pochodzi stąd, że unormowaniem
różnego od 0 wektora z przestrzeni unormowanej nazywa się pomnożenie go
przez odwrotność jego normy, a więc wektory unormowane to takie, których
norma jest równa 1).

Ćwiczenie. Udowodnić, że każdy zbiór ortogonalny, którego wszystkie

elementy są różne od 0 (a więc w szczególności każdy zbiór ortonormalny)
jest liniowo niezależny.

Ćwiczenie. W przestrzeni euklidesowej P ciągłych funkcji okresowych

R −→ R o okresie 2π z iloczynem skalarnym ϕ · ψ =

2π

ϕ(x)ψ(x)dx roz-

ważmy zbiór T złożony z funkcji R 3 x −→ cos kx ∈ R dla k ∈ N oraz
R 3 x −→ sin kx ∈ R dla k ∈ N \ {0}. Sprawdzić, że T jest ortogonalny, ale
nie ortonormalny, i unormować wszystkie jego elementy.

Pojęcia ortogonalności i ortonormalności można oczywiście przenieść ze

zbiorów na ciągi wektorów, a w szczególności na bazy uporządkowane.

Definicja. Baza e

, . . . , e

przestrzeni euklidesowej jest nazywana bazą

ortonormalną, gdy dla każdych i, j ∈ {1, , . . . , n}

· e

= δ

(jak pamiętamy, δ

to delta Kroneckera równa 1, gdy i = j, a 0, gdy i 6= j).

Przykład. Oczywiście baza kanoniczna przestrzeni euklidesowej R

standardowym iloczynem skalarnym jest ortonormalna.

Jak zobaczymy w dalszym ciągu wykładu, wszelkie obliczenia w prze-

strzeniach euklidesowych znacznie się upraszczają, kiedy się je przeprowadza
w bazach ortonormalnych. Stąd ogromne znaczenie tych baz. Z najbliższego
twierdzenia widać na przykład, jak łatwe i eleganckie jest obliczanie w bazie
ortonormalnej współrzędnych wektora.

126

Twierdzenie. Jeżeli baza e

, . . . , e

przestrzeni euklidesowej jest orto-

normalna, a u = λ

+ . . . + λ

, gdzie λ

, . . . , λ

∈ R, to dla każdego

i ∈ {1, . . . , n}

= u · e

Dowód: u · e

= (λ

+ . . . + λ

) · e

= λ

Przykład. Łatwo sprawdzić, że baza (−

8
9

1
9

4
9

), (

1
9

, −

8
9

4
9

), (

4
9

7
9

) w R

ze standardowym iloczynem skalarnym jest ortonormalna. Zatem nie trzeba
rozwiązywać układu równań, tylko obliczyć, że (−1, −2, 3) · (−

8
9

1
9

4
9

) = 2,

(−1, −2, 3) · (

1
9

, −

8
9

4
9

) = 3, (−1, −2, 3) · (

4
9

7
9

) = 1, po to, by stwierdzić, że

współrzędne wektora (−1, −2, 3) w tej bazie to 2, 3, 1.

Przykład. Wróćmy do przestrzeni euklidesowej P i do jej podzbioru

ortogonalnego T z ostatniego ćwiczenia oraz oznaczmy przez U zbiór orto-
normalny składający się z unormowanych elementów zbioru T . Dla funkcji
ϕ ∈ P liczby rzeczywiste ϕ · ψ, gdzie ψ ∈ U, nazywa się współczynnikami
Fouriera. Funkcje, które należą do lin T nazywa się wielomianami trygonome-
trycznymi. Ponieważ lin T = lin U, to dowolny wielomian trygonometryczny
ϕ jest również kombinacją liniową funkcji z U. Ostatnie twierdzenie mówi,
że współczynniki tej kombinacji liniowej to współczynniki Fouriera ϕ.

Przykład. Obliczymy współczynniki Fouriera funkcji ϕ z P określonej

jednoznacznie przez warunki ϕ(x) = x dla x ∈ [−

] i ϕ(x) = π − x dla

x ∈ [

3π

]. Mamy

2π

ϕ(x)

√

2π

dx = 0,

2π

ϕ(x)

√

cos kx dx = 0 dla każdego

k ∈ N\{0},

2π

ϕ(x)

√

sin kx dx = 0, gdy k z N\{0} jest parzyste, natomiast

2π

ϕ(x)

√

sin kx dx =

√

πk

sin

kπ

, gdy k z N\{0} jest nieparzyste. Zatem ϕ

ma nieskończenie wiele współczynników Fouriera różnych od 0. Nic dziwnego,
przecież nie jest wielomianem trygonometrycznym. Oznaczając k = 2j + 1
możemy współczynnik Fouriera ϕ odpowiadający funkcji

√

sin(2j + 1)x dla

j ∈ N zapisać w postaci

4(−1)

√

π(2j+1)

. Ciekawe, że wielomian trygonometryczny

n
j=0

4(−1)

√

π(2j+1)

√

sin(2j + 1)x dobrze przybliża ϕ, gdy n jest dostatecznie

duże. Można się o tym przekonać rysując przy pomocy jakiegoś programu
komputerowego wykresy tych wielomianów trygonometrycznych dla coraz
większych n i porównując je z wykresem ϕ. Ale ścisły opis tego zjawiska to
już analiza, a nie algebra liniowa.

127

W związku z ostatnim twierdzeniem warto jeszcze dodać, że gdyby baza

, . . . , e

była tylko ortogonalna, to baza

, . . . ,

byłaby już orto-

normalna i dla u = λ

+ . . . + λ

oraz każdego i ∈ {1, . . . , n} mielibyśmy

u · e

128

Wyszukiwarka

Podobne podstrony:
Gewert M, Skoczylas Z Wstęp do analizy i algebry Teoria, przykłady, zadania wyd 2
algebra egzaminy (grupy cegh)
algebra egzaminy (grupy cegh)
Algebra 2 11 grupy
Wstęp do psychopatologii zaburzenia osobowosci materiały
Tajemnica ludzkiej psychiki wstep do psychologii
Wstęp do Kulturoznawstwa 6 7
Wstęp do informatyki z architekturą systemów kompuerowych, Wstęp

więcej podobnych podstron