r 04 07 GD3BUBOVESM3L7MWGLPEU33DYJYES2LMZ3SIDKY

Rozdział 4. Interfejsy
PostgreSQL
Po zapoznaniu się z podstawowym sposobem interaktywnego dostępu do bazy PostgreSQL z
interpretera psql, który korzysta z języka SQL, możemy zająć się sprawą dostępu do bazy danych z
kodu programu. Odbywa się to bardzo podobnie i wszystkie znane polecenia używane dotychczas
w wierszu poleceń działają w kodzie niemal natychmiast.
Dostęp do PostgreSQL z kodu programu
Do baz PostgreSQL można uzyskać dostęp z wielu języków programowania. Autorzy znają
jedynie takie:
C
C++
Java
Perl
Python
PHP
Tcl
Prawdopodobnie istnieją jeszcze inne języki obsługujące PostgreSQL, ale o nich na razie nic nie
wiemy.
Istnieje także sterownik ODBC, który umożliwia dostęp z wielu innych systemów, włącznie z
klientami MS Windows, które mogą korzystać ze zródeł danych ODBC, takimi jak na przykład
Access.
Głównym językiem używanym w przykładach w naszej książce jest język C i z tego właśnie
języka chcemy mieć dostęp do naszej bazy danych PostgreSQL. Istnieją dwie metody uzyskiwania
dostępu do PostgreSQL z kodu programu.
Pierwszą jest utrzymane w tradycyjnym stylu korzystanie z biblioteki o nazwie libpq. W
celu uzyskania dostępu do bazy trzeba wywoływać funkcje biblioteczne z kodu
programu.
Druga metoda polega na osadzaniu poleceń SQL w kodzie języka C i ich przetwarzaniu
przez preprocesor przed ostateczną kompilacją. Według terminologii PostgreSQL nazywa
się to ecpg. Jest to podejście bardzo podobne do użycia preprocesora języka C
przetwarzającego polecenia #include i #define przed przekazaniem kodu do
głównego kompilatora. Zagadnienie to z pewnością jest znane użytkownikom niektórych
komercyjnych produktów, takich jak PRO*C firmy Oracle i ESQLC firmy Informix,
ponieważ każdy z nich spełnia w większym lub mniejszym stopniu standard ANSI
opisujący osadzanie poleceń SQL.
W tym rozdziale pokażemy praktyczne zastosowanie obydwu metod, co ułatwi dokonanie wyboru
metody najwłaściwszej dla potrzeb użytkownika lub najwygodniejszej do pracy.
Biblioteka libpq
Ogólnie rzecz biorąc, funkcje występujące w bibliotece libpq można pogrupować na trzy
następujące kategorie:
Funkcje do zarządzanie połączeniami.
Funkcje służące do uruchamiania poleceń SQL.
Funkcje zwracające wyniki zapytań.
Omówimy te grupy po kolei. W bibliotece libpq przez lata zgromadziły się pewne przestarzałe
funkcje, które są utrzymywane tylko dla zachowania zgodności ze starymi wersjami. Nie
będziemy się tu nimi zajmować i pokażemy tylko te, które powinny być używane w nowszych
programach. Jeśli przy przeglądaniu jakiegoś starszego kodu libpq spostrzeżemy nieznane
wywołania funkcji bibliotecznych, to zawsze możemy zapoznać się z nimi w dokumentacji
dostępnej na stronie internetowej PostgreSQL pod adresem: http://www.postgresql.org.
Aby skorzystać z którejś funkcji libpq, należy:
Dołączyć plik nagłówkowy libpq-fe.h.
Dopisać katalog pgsql do ścieżki zawierającej biblioteki dołączane podczas kompilacji.
Skonsolidować program z biblioteką pq.
Końcówka fe w nazwie libpq-fe oznacza interfejs (od słów front-end). Aby skompilować
plik używający libpq, należy użyć polecenia:
$ gcc -o program -I/usr/include/pgsql program.c -lpg
Oczywiście, szczegółowe parametry zależą od położenia katalogów instalacyjnych w danym
systemie. Jeśli znajdują się one w innym miejscu, to trzeba będzie inaczej określić położenie
katalogu zawierającego pliki dołączane i wskazać alternatywny katalog biblioteki za pomocą opcji
-L/usr/local/pgsql/lib.
Funkcje do obsługi połączeń z bazą danych
Zaleca się połączenia z bazą danych PostgreSQL za pomocą polecenia PQconnectdb. Czasem
należy użyć opcji -i, gdy ma być uruchomiony demon postmaster nasłuchujący na gniazdach
TCP/IP i domeny UNIX.
PGconn *PQconnectdb(const char *conninfo);
Napis conninfo definiujący połączenie może zawierać sekwencję parametrów i wartości
oddzielonych spacjami. Jeżeli w samej wartości ma znalezć się spacja, to należy ją ująć w
apostrofy. Parametry, którym nie nadaje się wartości w sposób jawny, uzyskują domyślnie
wartości NULL. Również funkcje biblioteczne uzyskują wartości domyślne lub wartości
zdefiniowane przez zmienne środowiskowe. Można definiować następujące parametry połączenia:
host
Nazwa komputera, z którym będzie zestawiane połączenie.
Domyślnie jest to komputer lokalny.
port
Numer portu, na którym będzie utrzymywane połączenie.
Domyślnie jest to standardowy port używany przez PostgreSQL o
numerze 5432.
dbname
Nazwa bazy danych, z którą chcemy się połączyć. Domyślnie jest
to taka sama nazwa jak nazwa zalogowanego użytkownika systemu
Linux.
user
Nazwa użytkownika bazy danych. Domyślnie jest to nazwa
używana przy logowaniu.
password
Hasło dostępu do bazy.
options
Wymagane opcje śledzenia.
tty
Plik lub terminal używany jako wyjście komunikatów o błędach
wytwarzanych przez program.
Za każdym parametrem następuje znak równości, a następnie wartość tego parametru. Do
połączenia się np. z bazą template1 na komputerze gw1 należy użyć następującego polecenia:
conn = PQconnectdb("host=gw1 dbname=template1");
Wskaznik o wartości NULL jest zwracany tylko wtedy, gdy biblioteka nie zdoła przydzielić
obiektu, z którym ma nastąpić połączenie. Nawet jeśli otrzymamy wskaznik nie mający wartości
NULL, to nadal trzeba sprawdzać, czy połączenie nastąpiło musimy w tym celu wywoływać
funkcję PQstatus.
ConnStatusType PQstatus(PGconn *conn);
Funkcja ta zwraca jedną z dwóch wartości: albo CONNECTION_OK, albo CONNECTION_BAD.
Znaczenie ukryte jest w ich nazwach. Po udanym nawiązaniu połączenia z bazą pozostaje ono w
takim stanie, chyba że występują problemy z siecią lub oddalona baza danych zostanie zamknięta.
Jeśli występują problemy z połączeniem, to tekst komunikatu o błędzie można uzyskać poprzez
wywołanie funkcji:
char *PQerrorMessage(PGconn *conn);
Funkcja ta zwraca wskaznik do ustalonego obszaru pamięci, a więc dany tekst komunikatu może
być tekstem generowanym przy pózniejszych wywołaniach funkcji z biblioteki libpq. Jeśli trzeba
zamknąć połączenie z powodu zakończenia pracy programu lub awarii, należy czynić to za
pomocą funkcji:
void PQfinish(PGconn *conn);
Funkcja ta musi być zawsze wywoływana, nawet gdy połączenie się nie udało. Jest to potrzebne,
ponieważ powoduje ona nie tylko zamknięcie połączenia z bazą, ale także zwolnienie obszaru
pamięci i innych zasobów związanych z połączeniem. Niewłaściwie zamknięte połączenie może
spowodować, że program będzie wymagał nadmiernego zwiększenia zasobów systemowych.
Po zamknięciu połączenia wskaznik obiektu połączeniowego nie oznacza niczego sensownego i
nie może być przekazywany jako parametr do jakichkolwiek funkcji. Dobrym zwyczajem
programisty powinno być nadanie mu wartości NULL tuż po wywołaniu funkcji PQfinish.
Znamy już kilka funkcji i możemy napisać pierwszy program służący do połączenia się z
serwerem PostgreSQL. Nie będzie on wprawdzie zbyt użyteczny, ponieważ służy tylko do
testowania połączenia, ale dzięki niemu uczynimy pierwszy krok. Musimy pamiętać o zmianie
nazwy serwera i użytkownika na nazwy używane lokalnie, oraz o utworzeniu bazy danych o
nazwie takiej jak nazwa użytkownika (tworzenie bazy opisaliśmy w poprzednim rozdziale).
#include
#include
#include
int main()
{
PGconn *conn;
const char *connection_str = "host=localhost dbname=template1";
conn = PQconnectedb(connection_str);
if (PQstatus(conn) == CONNECTION_BAD) {
fprintf(stderr, "Connection to %s failed, %s, connection_str,
PQerrorMessage(conn));
} else {
printf("Connected OK\n");
}
PQfinish(conn);
return EXIT_SUCCESS;
}
Program ten bardzo łatwo można przeanalizować: najpierw tworzony jest napis używany jako
parametr połączenia z bazą template1 na serwerze localhost, potem następuje próba
połączenia, wyświetlenie komunikatu (jeżeli wystąpi błąd) i zamknięcie połączenia przed
zakończeniem działania programu.
Uruchamianie poleceń SQL
Okazuje się niespodziewanie, że uruchamianie zapytań na serwerze jest bardzo proste. Istnieje
tylko jedna funkcja służąca do wywołania polecenia i trzy funkcje wykorzystywane do
sprawdzenia wyniku i odczytu informacji o błędach. Uruchomienie polecenia SQL odbywa się
następująco:
PGresult *PQexec(PGconn *conn, const char *sql_string);
Funkcja ta zwraca wskaznik o wartości NULL tylko w nadzwyczajnych okolicznościach, więc musi
on być przechwytywany, ponieważ w przeciwnym wypadku można otrzymać wyniki na podstawie
wskaznika innej funkcji:
ExecStatusType *PQresultStatus(PGresult *result);
Wynik zawiera wyliczenie typu ExecStatusType, które ma jedną z podanych niżej wartości:
PGRES_EMPTY_QUERY
Nic nie zostało zrobione.
PGRES_COMMAND_OK
Polecenie zostało wykonane poprawnie, lecz żadne dane nie zostały
zwrócone, ponieważ nie było to polecenie SELECT.
PGRES_TUPLES_OK
Polecenie zostało wykonane poprawnie i jakieś dane mogły być
zwrócone.
PGRES_COPY_OUT
Trwa operacja kopiowania do pliku zewnętrznego.
PGRES_COPY_IN
Trwa operacja kopiowania z pliku zewnętrznego.
PGRES_BAD_RESPONSE
Zdarzyło się coś nieoczekiwanego.
PGRES_NONFATAL_ERROR
Wystąpił błąd niekrytyczny.
PGRES_FATAL_ERROR
Wystąpił błąd krytyczny.
Zwróćmy szczególną uwagę na definicję PGRES_TUPLES_OK. Otrzymanie takiej odpowiedzi
oznacza, że polecenie SELECT zostało wykonane poprawnie, ale jednocześnie nie znaczy to, że
jakieś dane zostały zwrócone. W następnym podrozdziale zobaczymy, jak sprawdzić, czy
rzeczywiście dane zostały zwrócone. Błędy typu COPY dotyczą ładowania bazy danych lub
tworzenia kopii zapasowej tej bazy.
Jeśli chcemy otrzymać tekst komunikatu o błędzie, to używamy funkcji:
const char *PQresultErrorMessage(PGresult *result);
Zauważmy, że tekstowy komunikat o błędzie otrzymujemy tu w inny sposób niż przy funkcjach
obsługujących połączenia, gdzie stosuje się PQerrorMessage.
Często opłaca się znać liczbę wierszy, na które zadziałało polecenie SQL. Dotyczy to zwłaszcza
polecenia DELETE, ponieważ PostgreSQL traktuje jako udane rónież wykonanie poprawnego
składniowo polecenia, które faktycznie nie usunie żadnych wierszy.
Liczbę wierszy objętych poleceniami INSERT, UPDATE i DELETE można znalezć za pomocą
PQcmdTuples.
const char *PQcmdTuples(PGresult *result);
Zwróćmy uwagę na to, że takie wywołanie zwraca char *result, czyli ciąg cyfr kończący się
wartością NULL w formacie znakowym, a nie liczbę całkowitą, której można się spodziewać.
Wyznaczenie liczby wierszy objętych przez polecenie SELECT jest bardziej złożone i omówimy je
pózniej.
Zakończymy teraz omawianie kodu wynikowego i zajmiemy się przekazaniem do biblioteki
informacji o konieczności zwolnienia przydzielonej pamięci. Podobnie jak w kodzie dotyczącym
połączeń, błąd popełniony tutaj spowoduje wycieki pamięci (ang. memory leaks) w naszej
aplikacji.
void PQclear(PQresult *result);
Inną funkcją, która pasuje do tego podrozdziału i która może być przydatna przy wyszukiwaniu
błędów, jest:
const char *PQresStatus(ExecStatusType status);
Przekształca ona numer statusu na komunikat tekstowy.
Wiemy już teraz wystarczająco dużo, aby napisać nasz pierwszy program w języku C, który
będzie uruchamiał polecenia SQL. Ponieważ nie mówiliśmy jeszcze o tym, jak uzyskiwać wyniki
zapytań, więc na razie zajmiemy się uruchomianiem polecenia DELETE. Oto pierwsza funkcja o
nazwie del1.c wykonująca coś użytecznego i rozszerzająca pierwotną funkcję con1.c.
Będziemy łączyć się z bazą danych rick na serwerze gw1.
W tym rozdziale opiszemy operacje na pojedynczej tabeli o nazwie children w bazie danych,
którą utworzyliśmy w poprzednim rozdziale. Tabelę tę można w razie potrzeby utworzyć
ponownie za pomocą polecenia SQL użytego w interpreterze psql:
CREATE TABLE children (
childno SERIAL,
fname VARCHAR,
age INTEGER
);
W podanym niżej kodzie zaznaczone są różnice między con1.c i del1.c:
#include
#include
#include
int main()
{
PGconn *conn;
PGresult *result;
const char *connection_str = "host=gw1 dbname=rick";
conn = PQconnectdb(connection_str);
if (PQstatus(conn) == CONNECTION_BAD) {
fprintf(stderr, "Connection to %s failed, %s", connection_str,
PQerrorMessage(conn));
} else {
printf("Connected OK\n");
}
result = PQexec(conn, "DELETE FROM children WHERE fname = "'freda'");
if (!result) {
printf("PQexec command failed, no error code\n");
} else {
switch (PQresultStatus(result)) {
case PGRES_COMMAND_OK:
printf("Command executed OK, %s rows
affected\n", PQcmdTuples(result));
break;
case PGRES_TUPLES_OK:
printf("Query may have returned data\n");
break;
default:
printf("Command failed with code %s, error message %s\n',
PQresStatus(PQresultStataus(result)),
PQresultErrorMessage(result));
break;
}
PQclear(result);
}
PQfinish(conn);
return EXIT_SUCCESS;
}
Jeśli upewnimy się, że w tabeli children znajduje się wiersz zawierający w polu fname nazwę
freda, to po kompilacji i uruchomieniu tego programu zobaczymy:
[rick@gw1 psql]$ ./del1
Connected OK
Command executed OK, 1 rows affected
Teraz nie ma już wiersza, który pasowałby do tych kryteriów i mógłby być usunięty. Jeśli więc
uruchomimy program ponownie, to nadal jest on wykonywany poprawnie, ale nie dotyczy
żadnego wiersza:
[rick@gw1 psql]$ ./del1
Connected OK
Command executed OK, 0 rows affected
Należy dokładnie odróżniać polecenia działające i nie wpływające na wiersze tabeli od poleceń,
które nie udają się z powodu błędów składniowych.
Uzyskiwanie wyników zapytań
Przejdziemy teraz do najczęściej używanej, ale także najbardziej złożonej części biblioteki libpq,
czyli do pobierania danych.
Podczas pobierania danych z bazy może się pojawić wiele problemów. Przede wszystkim nie
będziemy wiedzieli z góry, ile wierszy zostanie pobranych. Jeśli uruchamiamy polecenie SELECT,
używając '*' jako nazwy pola (chcąc pobrać wszystkie pola), to możemy nie wiedzieć nawet, ile
pól lub jakiego rodzaju dane znajdują się w pobieranych wierszach. Przewidywanie tych
okoliczności czyni tę część API bardziej złożoną. Nie trzeba jednak popadać w panikę, po prostu
musimy poznać kilka dodatkowych wywołań API.
Najpierw przekształcimy program testowy del1.c na zapytanie zwracające dane i, korzystając z
okazji, nieco go zmodyfikujemy, by łatwiej było dodawać nowe funkcje po wykonaniu polecenia
SQL. Niech nowy plik nazywa się sel1.c:
#include
#include
#include
PGconn *conn = NULL;
void tidyup_and_exit();
int main()
{
PGresult *result;
const char *connection_str = "host=gw1 dbname=rick";
conn = PQconnectdb(connection_str);
if (PQstatus(conn) == CONNECTION_BAD) {
fprintf(stderr, "Connection to %s failed, %s", connection_str,
PQerrorMessage(conn));
tidyup_and_exit();
} else {
printf("Connected OK\n");
}
result = PQexec(conn, "SELECT age, fname FROM children WHERE age < '6'");
if (!result) {
printf("PQexec command failed, no error code\n");
tidyup_and_exit();
} else {
switch (PQresultStatus(result)) {
case PGRES_COMMAND_OK:
printf("Command executed OK, %s rows affected\n",
PQsmdTuples(result));
break;
case PGRES_TUPLES_OK:
printf("Query may have returned data\n");
break;
default:
printf("Command failed with code %s, error message %s\n",
PQresStatus(PQresultStatus(result)),
PQresultErrorMessage(result));
PQclear(result);
tidyup_and_exit();
break;
}
}
/* Tutaj dodany jest nowy kod */
if (result) PQclear(result);
PQfinish(conn);
return EXIT_SUCCESS;
}
void tidyup_and_exit() {
if (conn != NULL) PQfinish(conn);
exit(EXIT_FAILURE);
}
Dodaliśmy tu nową funkcję o nazwie tidyup_and_exit, która pozwala na wyjście z programu
wtedy, gdy nie uda się operacja w bazie danych. Oczywiście, przerywanie działania aplikacji z
powodu jednego nieudanego polecenia SQL jest w kodzie produkcyjnym zbyt rygorystyczne, ale
dla celów testowych łatwiej pracować z kodem działającym w taki sposób. Zmieniliśmy także
polecenie DELETE na polecenie SELECT, które będzie zwracać jakieś dane.
Po uruchomieniu nowej wersji programu można się przekonać, czy kod prawidłowo rozpoznaje
możliwość zwracania danych:
[rick@gw1 psql]$ ./sel1
Connected OK
Query may have returned data
Teraz znajdziemy sposób określenia liczby faktycznie zwracanych wierszy. Możemy to zrobić za
pomocą wywołania Pqntuples (pamiętając, że w PostgreSQL wiersze to krotki ):
int PQntuples(PGresult);
Przy zmianie sel1.c na sel2.c trzeba po prostu zmienić jeden wiersz programu, w którym
sprawdzany jest kod zwracany przez PQresultStatus:
case PGRES_TUPLES_OK:
printf("Query was OK and returned %d rows\n", PQntuples(result));
break;
Po ponownym uruchomieniu zapytania otrzymamy następujący wynik:
[rick@gw1 psql]$ ./sel2
Connected OK
Query was OK and returned 3 rows
Wygląda to obiecująco, ale potrzebujemy przecież dostępu do pobranych danych. Od tego
momentu zajmiemy się więc najszybszym i najprostszym sposobem osiągnięcia tego celu. Sposób
ten polega na użyciu jednej ze specjalnych funkcji z biblioteki psql przekazującej wszystkie dane
w postaci strumienia do pliku. Funkcja ta jest łatwa w użyciu i stanowi dużą pomoc przy
wyszukiwaniu błędów.
Funkcja nazywa się PQprint, a jej wywołanie ma postać:
void PQprint(FILE *stream, PGresult, PQprintOpt *options);
Korzystając z niej, musimy określić strumień wyjściowy, wskaznik wynikowy zwracany przez
polecenie SQL oraz wskaznik do struktury określającej opcje.
Struktura określająca opcje zdefiniowana w pliku nagłówkowym libpq-fe ma następującą
postać:
typedef struct_PQprintOpt
{
pqbool header; /* druk nagłówków pól i zliczenia wierszy */
pqbool align; /* wyrównywanie pól */
pqbool standard; /* przestarzały format */
pqbool html3; /* wyjście w postaci tabel html */
pqbool expanded; /* rozszerzanie tabel */
pqbool pager; /* podział wyjścia na strony, jeśli konieczny */
char *fieldSep; /* separator pól */
char *tableOpt; /* wstaw do HTML: */
char *caption; /* tytuł HTML: