Teoria kategorii jako ogólny dział algebry wyrosła z prac Samuela Eilenberga i Saundersa MacLane'a: pionierską pracą jest tu General theory of natural equivalences, Transactions of the American Mathematical Society 58 (1945), str. 231-294 - autorzy wprowadzili tam pojęcie kategorii, funktora i naturalnej transformacji funktorów. Teoria kategorii szybko przekroczyła granice algebry i jej język okazał się uniwersalnym sposobem mówienia o innych teoriach matematycznych: logice, teorii zbiorów, topologii, teorii porządku, geometrii, analizie itd. Jak to możliwe? Treść tych wykładów stanowi jedną z odpowiedzi na to pytanie.
Definicja 1.3 [Kategoria]
Kategoria C składa się z następujących danych:
(D1) obiektów:
...,
(D2) morfizmów:
...,
(D3) dwóch operacji
przypisującej każdemu morfizmowi
obiekty
i
,
(D4) operacji
przypisującej każdemu obiektowi
morfizm
nazywany identycznością,
(D5) operacji
przypisującej każdej parze morfizmów
takich, że
morfizm
nazywany złożeniem,
spełniających następujące aksjomaty:
(A1)
;
;
,
(A2)
, gdzie
oraz
,
(A3) jeśli
są składalne oraz
są składalne, to
.
Wiemy więc, z czego składa się kategoria. Nie znamy jednak odpowiedzi na - być może - równie ważne pytanie: czym jest kategoria? W naszym wykładzie przyjmiemy po prostu, że kategorią będzie każda interpretacja aksjomatów przedstawionych w Definicji 1.3 na gruncie teorii mnogości.
Pokażmy, że o kategorii można też myśleć jako o specjalnym grafie skierowanym. Oto druga, równie dobra dla naszych potrzeb, definicja kategorii:
Definicja 1.4 [Kategoria jako graf]
Grafem skierowanym nazywamy kolekcję obiektów (wierzchołków)
, kolekcję strzałek (krawędzi)
i dwie funkcje
W grafie, kolekcja składalnych par strzałek to zbiór
nazywany produktem nad
.
kategorii można myśleć jako o grafie skierowanym
, który posiada dwie dodatkowe funkcje
,
oraz
,
takie, że spełnione są warunki (A1)-(A3) Definicji 1.3.
Poniżej pokażemy trzecią, równoważną, algebraiczną definicję kategorii (na podstawie książki: Peter J. Freyd, Andre Scedrov, Categories, Allegories, North Holland, 1989).
Definicja 1.5 [Kategoria jako algebra]
Kategoria C składa się z dwóch operacji unarnych i jednej częściowej operacji binarnej. Zmienne, na które działają te operacje nazywamy morfizmami (strzałkami). Wartości tych operacji są zapisywane i czytane jako:
Operacje podlegają następującym aksjomatom:
(b1)
jest zdefiniowane wtw, gdy
,
(b2)
oraz
,
(b3)
oraz
,
(b4)
oraz
,
(b5)
.
W tym wypadku równoważność definicji z dwiema pozostałymi (Definicje 1.3 i 1.4) nie jest oczywista. Aby ją wykazać, rozpocznijmy od lematu, który rzuci trochę światła na strukturę algebraiczną, którą przed chwilą opisaliśmy.
Lemat 1.6
Dla morfizmu
następujące warunki są równoważne:
istnieje
taki, że
;
istnieje
taki, że
;
;
;
dla każdego
,
(co oznacza, że jeżeli złożenie
jest zdefiniowane, to jest równe
), dla każdego
,
.
Dowód
(1)
(2) Dla
mamy
. (2)
(3)
. (3)
(4)
. (4)
(5) Załóżmy, że
jest zdefiniowane dla każdego
; to oznacza, że
, czyli z (4),
dla każdego
. A zatem
. (3)
(1) Oczywiste. (4)
(3)
. (5)
(4) Połóżmy
. Mamy
, czyli
istnieje. Z (5) wynika, że
. Ale (b3) implikuje, że
, czyli
. Dowód równoważności (6) z (3) jest podobny do równoważności (5) z (4).
Morfizm
spełniający dowolny z powyższych warunków nazywamy identycznością.
A zatem równoważność trzeciej definicji kategorii z pierwszą uzyskujemy następująco (tak naprawdę, to pokażemy jedynie, że dane Definicji 1.5 wystarczą do zrekonstruowania Definicji 1.3): Identyczność
to zmienna
taka, że
. Dziedziną
jest
, przeciwdziedziną
. Złożenie
to
. Kolekcja obiektów Definicji 1.3 pokrywa się z kolekcją morfizmów identycznościowych Definicji 1.5. Zauważmy, że dla dowolnego
, zarówno
, jak i
są obiektami (identycznościami), bo
,
,
,
.
Sprawdźmy aksjomaty:
. Aby pokazać, że
jest morfizmem, załóżmy, że
(czyli
) oraz
(czyli
). Wówczas
,
.
Załóżmy teraz, że
. Wówczas
. Ostatnia równość wynika z poprzedniego paragrafu. Podobnie,
.
W końcu,
przy odpowiednich założeniach.
Obiektami są zbiory, morfizmami funkcje. Uwaga! W teorii mnogości funkcja jest zdefiniowana jako zbiór par uporządkowanych takich, że
(1)
Aby traktować funkcje jako morfizmy musimy precyzyjnie znać
i
. Na przykład funkcje
oraz
, które mają takie samo działanie na argumentach, będą traktowane jako dwa różne morfizmy. Formalnie, w języku teorii mnogości morfizmem będzie trójka
taka, że
spełnia powyższe równanie (1) wraz z poniższym:
(2)
Wtedy
jest projekcją na pierwszą współrzędną
, a
projekcją na trzecią współrzędną.
Kategoria zbiorów skończonych i funkcji
, jak również wiele innych kategorii, w których obiektami i morfizmami są ograniczone klasy zbiorów i funkcji, np. kategoria wszystkich zbiorów skończonych i injekcji.
Kategorie, w których obiektami są zbiory z pewną dodatkową strukturą algebraiczną, zaś morfizmami te funkcje, które tę strukturę zachowują.
: Przestrzenie wektorowe i odwzorowania liniowe
: Grupy i homomorfizmy grup
: Grupy abelowe i homomorfizmy grup
: Monoidy i homomorfizmy monoidów
: Częściowe porządki i funkcje monotoniczne
: Przestrzenie topologiczne i funkcje ciągłe
: Grafy i homomorfizmy grafów
liczby naturalne
i wszystkie funkcje obliczalne
Mając dowolny częściowy porządek (poset)
definiujemy kategorię o tej samej nazwie
jak następuje: jako obiekty bierzemy elementy
, zaś dla dwóch obiektów
przyjmujemy, że istnieje morfizm z
do
wtedy i tylko wtedy, gdy
. Zauważmy, że wystarczy tu, by
był preporządkiem, tzn. aby relacja
była zaledwie zwrotna i przechodnia.
: Obiektami tej kategorii są zbiory, zaś morfizmami relacje binarne, tzn.
wtedy i tylko wtedy, gdy
. Wówczas rolę identyczności spełniają relacje identycznościowe:
, zaś złożeniem morfizmów jest po prostu złożenie relacji znane z kursu teorii mnogości: mając dane
oraz
przyjmujemy:
Kategorie skończone (skończoność dotyczy ilości istniejących morfizmów, choć nazwy tych kategorii odnoszą się do ilości obiektów:
:Ta kategoria ma jeden obiekt i jedną strzałkę: identyczność.
: Ta kategoria nie ma obiektów i nie ma strzałek.
: Kategoria ta ma dwa obiekty i jedną strzałkę pomiędzy nimi (a także oczywiście dwie wymagane identyczności).
: Kategoria ma trzy obiekty, trzy identyczności, dokładnie jedną strzałkę z obiektu pierwszego do drugiego, dokładnie jedną strzałkę z obiektu drugiego do trzeciego i dokładnie jedną strzałkę z obiektu pierwszego do trzeciego (co oznacza, że ta ostatnia musi być złożeniem dwóch pozostałych nieidentycznościowych strzałek!)
Inne kategorie skończone możemy tworzyć, biorąc skończoną ilość obiektów wraz z odpowiadającymi im identycznościami, a następnie dodając dowolną skończoną ilość morfizmów. W tym wypadku musimy jednak zadbać o to, aby - jeśli morfizmy będą tworzyły cykle - zadeklarować złożenia wszystkich morfizmów w cyklu jako równe odpowiednim identycznościom. W innym bowiem przypadku uzyskana kategoria nie musi już być skończona (może mieć nieskończenie wiele morfizmów odpowiadających wielokrotnościom cyklu).
Kategorie dyskretne są to takie kategorie, w których nie ma innych morfizmów niż identyczności. Łatwo uzmysłowić sobie, że kategorie dyskretne możemy utożsamiać ze zbiorami, bo przecież obiekty możemy interpretować jako elementy zbioru.
Niech
będzie monoidem (
jest jego jedynką). Wówczas biorąc
jako jedyny obiekt, zaś elementy
jako morfizmy (z dziedziną i kodziedziną
), a działanie
jako złożenie morfizmów, otrzymujemy kategorię. Można łatwo pokazać również konstrukcję odwrotną, tj. przekonać się, że każda kategoria z jednym obiektem może być traktowana jako monoid. Mówiąc krótko: kategorie z jednym obiektem to monoidy. (Jak w takim razie traktować grupy? Odpowiedź znajdziemy jeszcze przed końcem wykładu...)
Dla danego rachunku logicznego możemy stworzyć kategorię w ten sposób, że obiektami są formuły:
zaś morfizmem z
do
jest każda dedukcja (dowód)
z założenia
. Złożeniem morfizmów jest wtedy połączenie dowodów, które jest oczywiście łączne. Identyczność
to dowód pusty, bowiem z aksjomatów logicznych zawsze wynika
.
Dla danego typowanego języka funkcyjnego
tworzymy kategorię w ten sposób, że obiektami są typy danych, zaś strzałkami są programy (procedury) języka
. Złożeniem dwóch programów
i
jest program dany poprzez zaaplikowanie wyjścia programu
na wejściu programu
. Identycznością jest procedura, która nic nie robi.
Inne przykłady kategorii zamieścimy w Ćwiczeniach do tego wykładu.
==Izomorfizmy== Definicja izomorfizmu jest pierwszą definicją teorii kategorii, definicją abstrakcyjną, niezależną od specyficznych wymagań konkretnej teorii matematycznej, definicją wyrażoną tylko w języku strzałek (czyli w języku teorii kategorii).
Definicja 1.7 [Izomorfizm]
Niech
będzie dowolną kategorią. Morfizm
jest izomorfizmem, jeśli istnieje morfizm
taki, że
oraz
. Morfizm
nazywa się morfizmem odwrotnym do
. Jeśli dla obiektów
kategorii
istnieje izomorfizm
, to obiekty
i
nazywamy izomorficznymi, co zapisujemy jako
.
Ponieważ dowolny morfizm
posiada dokładnie jeden morfizm odwrotny (dowód?), będziemy go oznaczać jako
. Można łatwo pokazać (dowód?), że morfizm odwrotny do izomorfizmu jest izomorfizmem.
Fakt 1.1 wyraża zatem myśl, że izomorfizmami w
są dokładnie bijekcje. Ale uwaga: w kategoriach, których obiektami są zbiory z pewną strukturą, a morfizmami funkcje zachowujące tę strukturę (kategorie o takich własnościach nazywamy konkretnymi, patrz Definicja 5.9, bijekcje nie zawsze są izomorfizmami. Prosty kontrprzykład stanowi tutaj kategoria
( Zadanie 1.3).
==Podstawy teoriomnogościowe== Teoria mnogości uczy nas, że nie istnieje zbiór wszystkich zbiorów. Jeśli więc rozważamy kategorię
, której obiektami są zbiory, to widzimy, że kolekcja wszystkich obiektów
nie tworzy zbioru (jest zbyt duża!). Podobnie, kolekcja wszystkich morfizmów
jest zbyt wielka, aby być zbiorem (zauważmy, że samych identyczności jest już tyle, ile obiektów). Kategoria
nie jest taką jedyną. W związku z tym definiujemy:
Definicja 1.8
Kategorię
nazywamy małą, jeśli kolekcja wszystkich obiektów
i morfizmów
kategorii
są zbiorami. W przeciwnym wypadku
jest duża.
A zatem Pos, Grp, Vec są duże, zaś kategorie skończone są małe. Kategorie duże wyglądają na pierwszy rzut oka nieprzyjaźnie, część z nich posiada jednak bardzo często następującą cechę:
Definicja 1.9
Kategorię
nazywamy lokalnie małą, jeśli dla każdej pary obiektów
z
kolekcja
jest zbiorem (o takim zbiorze mówimy w skrócie homset, podobnie jak o zbiorze częściowo uporządkowanym przyjęło się mówić: poset).
Większa część teorii kategorii, którą zaprezentujemy w dalszym toku wykładu dotyczy kategorii lokalnie małych (takich jak Pos, Grp, Vec itd. czy wszystkie kategorie małe). Po dalsze wiadomości dotyczące podstaw teoriomnogościowych teorii kategorii odsyłamy do dyskusji tego tematu w podręczniku Categories for the Working Mathematician, Springer, 1997, Saundersa Mac Lane'a. Bardzo ciekawą dyskusję roli teorii kategorii w badaniach nad podstawami matematyki zaproponował Steven Awodey w artykule: An answer to Hellman's question: Does category theory provide a framework for mathematical structuralism?, Philosophia Mathematics (3) vol. 12 (2004), dostępnym również na stronie domowej autora pracy.