53, ciekawostki, Linux - Ksiega Eksperta, Linux - ksiega eksperta, Linux

Rozdział 53.
Podstawy języka HTML

Tim Parker

W tym rozdziale:

Programy do tworzenia dokumentów HTML
Konserwacja dokumentów HTML
Podstawy języka HTML

Utrzymywanie serwera WWW w sytuacji, gdy nie udostępniamy żadnych stron WWW, nie ma większego sensu, więc trzeba skonfigurować go tak, by inni użytkownicy sieci mieli możliwość przeglądania naszych zasobów. Do tego celu używane są adresy w formacie URL (ang. Uniform Resource Locator, jednolity lokator zasobów) wskazujące na poszczególne pliki. Użytkownik chcący uzyskać dostęp do danego pliku (zasobu) musi znać tylko jego URL. Jeśli nie prowadzisz zbyt rozbudowanej strony głównej, sprawa jest prosta: każdy, kto łączy się z Twoim systemem za pomocą przeglądarki WWW, zobaczy stronę o nazwie index.html, zapisaną w głównym katalogu z dokumentami HTML, lub też informacje o zawartości tegoż katalogu w przypadku, gdy plik o nazwie index.html nie istnieje. Nie jest to jednak zbyt atrakcyjne rozwiązanie, dlatego wielu użytkowników chce udostępniać bardziej wyszukane strony główne. Jeśli chcesz utworzyć własną stronę WWW, musisz nauczyć się posługiwać językiem HTML (HyperText Markup Language).

Strona główna pełni zwykle funkcję głównego menu. Możliwe, że niektórzy użytkownicy nigdy jej nie zobaczą, wchodząc bezpośrednio do podkatalogów systemu lub też uzyskując dostęp do plików za pośrednictwem hiperłączy umieszczonych na jakichś innych stronach WWW. Mimo tego, wielu użytkowników woli rozpocząć przeglądanie zasobów od strony głównej. Strona główna ma zwykle nazwę index.html i znajduje się w głównym katalogu z dokumentami HTML.

Tworzenie dokumentu w języku HTML nie jest zbyt trudne. Język ten opiera się na znacznikach (ang. tags), określających w jaki sposób mają być traktowane poszczególne fragmenty dokumentu (na przykład jako nagłówki, jako główny tekst dokumentu, jako wykres itp.). Najtrudniejszym aspektem języka HTML jest prawidłowe umieszczanie wszystkich tych znaczników. Jego składnia jest bardzo ścisła - jeśli chcesz uzyskać dobre rezultaty, musisz się jej dokładnie trzymać.

Kiedyś wszystkie dokumenty HTML tworzone były za pomocą prostych edytorów tekstów. W miarę, jak strony WWW zdobywały coraz większą popularność, zaczęły powstawać edytory przystosowane do języka HTML, potrafiące rozpoznać i odpowiednio obsłużyć jego składnię. Wkrótce powstały dziesiątki edytorów HTML, filtrów i innych programów użytkowych wspierających i ułatwiających projektowanie stron WWW. Edytory HTML dostępne są dla wielu systemów operacyjnych.

Programy do tworzenia dokumentów HTML

Dokumenty HTML można tworzyć na wiele sposobów. Można używać do tego celu zwykłych edytorów tekstów, można również użyć narzędzi przeznaczonych specjalnie do pracy z tym językiem. Wybór jednej z tych metod zależy od indywidualnych preferencji. Nie bez znaczenia jest również doświadczenie w tworzeniu stron WWW i to, czy akurat masz dostęp do odpowiednich narzędzi. Główną zaletą wspomnianych programów narzędziowych jest fakt, że potrafią one sprawdzić poprawność składniową dokumentu HTML. Są również zwykle nieco łatwiejsze w użyciu niż edytory nie dostosowane do obsługi języka HTML. Z drugiej strony, programiści mające większe doświadczenie w tworzeniu stron WWW często używają edytora tekstów, do którego są przyzwyczajeni, posiłkując się co najwyżej filtrem lub programem kontrolującym poprawność składniową dokumentu.

0x01 graphic

Jeśli szukasz edytora lub filtra HTML, powinieneś odwiedzić węzeł CERN. Zajrzyj pod adres htpp://info.cern.ch/WWW/Tools i obejrzyj zawartość pliku Overview.html. Warto również zajrzeć do węzła NCSA, w którym pod adresem http://www.ncsa.uiuc.edu/SDG/ Software/Mosaic/Docs znajduje się dokument faq-software. html, zawierający aktualną listę dostępnych programów tego typu.

Do tworzenia stron WWW można użyć dowolnego edytora tekstów, nie wyłączając takich programów, jak vi czy emacs. Każdy edytor pozwala na wstawienie do tekstu dowolnego znacznika HTML, ale znaczniki te są traktowane na równi z pozostałym tekstem. Proste edytory nie potrafią sprawdzić, czy w dokumencie nie występują jakieś błędy składniowe, ponieważ nie „rozumieją” języka HTML. Dla edytora emacs i niektórych innych edytorów dostępne są rozszerzenia umożliwiające kontrolę składni w oparciu o proste szablony, ale nie wymuszają one poprawnej składni.

Jeśli chcesz używać jednego z prostych edytorów tekstów, musisz bardzo uważnie sprawdzać składnię swojego dokumentu. Najłatwiej robić to importując dokument do jednego z edytorów HTML umożliwiającego sprawdzanie składni. Można również uruchomić przeglądarkę WWW i sprawdzić, czy dokument przedstawia się zgodnie z oczekiwaniami.

Programy narzędziowe przeznaczone specjalnie do tworzenia dokumentów HTML pod kontrolą systemu Linux są dostępne w różnych zakątkach Internetu, ale nie są one aż tak popularne, jak analogiczne aplikacje przeznaczone do pracy w systemie DOS i Windows (dla tych systemów dostępne są dziesiątki programów tego typu). Jeśli w Twoim systemie zainstalowany jest DOS czy Windows, możesz po prostu wykorzystać odpowiednie oprogramowanie, a następnie przenieść stworzoną stronę WWW do systemu linuxowego. Dla systemu Windows dostępnych jest kilka popularnych edytorów HTML, takich jak HTML Assistant, HTMLed czy HoTMetaL (a także polski Pajączek - przyp. tłum.). Niektóre z tych programów, na przykład HoTMetaL, działają również w systemie X, czyli pod kontrolą Linuxa. Programy tego typu albo opierają się w całości na interfejsie graficznym i technologii przeciągnij-i-upuść, albo bazują na edycji pliku źródłowego w trybie tekstowym. Prawie wszystkie jednak posiadają mechanizmy umożliwiające kontrolę składniową tworzonego dokumentu.

Tworzenie stron WWW w systemie Windows

Jak wspomnieliśmy wcześniej, programów przeznaczonych do tworzenia dokumentów HTML pracujących pod kontrolą Windows jest o wiele więcej niż linuxowych. Jeśli posiadasz oba te systemy, możesz z łatwością tworzyć strony WWW pod Windows, a następnie przenosić je do systemu Linux. Narzędzia do tworzenia dokumentów HTML w systemach DOS i Windows można podzielić na trzy kategorie: programy typu WYSIWYG (ang. What You See Is What You Get - To, co widzisz, jest tym, co otrzymasz), pozwalające na bezpośrednią obserwację efektów pracy, programy nie oferujące takiej możliwości oraz filtry umożliwiające konwersję do formatu HTML dokumentów innego typu (na przykład tworzonych przez programy Word for Windows czy WordPerfect).

Prawdopodobnie najpopularniejszym edytorem HTML dla systemu Windows jest program HTML Assistant. Jest to edytor tekstów wzbogacony o kilka dodatkowych mechanizmów i interfejs graficzny pozwalający łatwo wstawiać najpopularniejsze znaczniki języka HTML. Możliwa jest także równoczesna edycja kilku dokumentów, jak również przenoszenie i kopiowanie fragmentów tekstu pomiędzy nimi.

0x01 graphic

Jeśli chcesz załadować program HTML Assistant za pomocą FTP, zaloguj się jako anonimowy użytkownik do systemu ftp.cuhk.hk i poszukaj w katalogu /pub/www/windows/util pliku o nazwie htmlasst.zip.

Program HTML Assistant ma jedno dość poważne ograniczenie: rozmiar tworzonych za jego pomocą plików nie może przekraczać 32 kB. W związku z tym nie nadaje się on do tworzenia większych stron WWW, chyba że podzielone zostaną one na kilka części, a następnie połączone za pomocą innego edytora. Przy próbie edycji pliku o rozmiarze większym niż 32 kB lub utworzenia pliku zawierającego większą ilość danych wyświetlany jest komunikat Out of Memory (brak pamięci) i może się zdarzyć, że efekty pracy zostaną utracone.

HTML Assistant posiada dobrej jakości pomoc dostępną podczas pracy, a także inne przydatne możliwości, takie jak na przykład możliwość automatycznego ładowania edytowanego dokumentu do przeglądarki, dzięki czemu można na bieżąco śledzić efekty swojej pracy. Przełączanie się pomiędzy edytowanym kodem a wynikiem jego sformatowania nie stanowi żadnego problemu, co pozwala obejść niektóre z niedogodności edytowania dokumentu w trybie tekstowym.

HTML Assistant ułatwia również tworzenie odnośników hipertekstowych, przechowując listę ostatnio używanych adresów w formacie URL i pozwalając na łatwe przechodzenie pomiędzy nimi.

Innym programem służącym do tworzenia stron WWW jest HTMLed, również działający pod kontrolą systemu Microsoft Windows. Jest to szybki edytor, obsługujący znaki międzynarodowe i potrafiący zapisywać i odczytywać pliki zarówno w formacie DOS-owym, jak i UNIX-owym. Użyteczna jest możliwość konwersji adresów URL przechowywanych w pliku MOSAIC.INI do dokumentu HTML z zachowaniem jego oryginalnej struktury. Względnie prosta (w porównaniu z edytorem HTML Assistant) jest również konwersja plików tekstowych do formatu HTML.

0x01 graphic

Kopię programu HTMLed można załadować za pośrednictwem anonimowego FTP z serwera ftp.cuhk.hk - program ten znajduje się w pliku o nazwie htmed10.zip (lub nieco innej, zależnie od wersji programu) w katalogu /pub/www/windows/util.

Program HTMLed nie jest obsługiwany za pomocą wielowierszowego paska z przyciskami odpowiadającymi poszczególnym znacznikom HTML, jak miało to miejsce w przypadku programu HTML Assistant. Zamiast tego poszczególne znaczniki wybiera się z rozwijanego menu lub paska narzędzi, który można również dostosować do własnych potrzeb. Można również utworzyć kilka pasków narzędzi, osadzając w nich poszczególne znaczniki reprezentowane przez ikony. Paski narzędzi mogą być swobodnie rozmieszczane w obrębie okna aplikacji. Aktualna wersja programu HTMLed nie zawiera pomocy dostępnej podczas pracy, ale w przyszłych wersjach pomoc taka ma zostać wprowadzona.

HTMLed dość sprytnie wstawia znaczniki do dokumentu, zapobiegając umieszczaniu wielu znaczników w jednym wierszu tam, gdzie nie jest to dozwolone. Pozwala to unikać najczęściej występujących błędów składniowych dokumentów HTML. Podobnie jak program HTML Assistant, HTMLed udostępnia przycisk pozwalający obejrzeć efekty pracy bezpośrednio w przeglądarce kodu HTML.

Program HoTMetaL firmy Softquad pracuje w trybie zbliżonym do WYSIWYG, w związku z czym jest on prawdopodobnie najatrakcyjniejszy z punktu widzenia użytkowników nie mających doświadczenia w tworzeniu dokumentów HTML. HoTMetaL pracuje pod kontrolą systemu Windows i w niektórych systemach UNIX-owych. Wersja o nieco ograniczonej funkcjonalności (ale wciąż o całkiem sporych możliwościach) jest dostępna za darmo, natomiast pełną wersję komercyjną o nazwie HoTMetaL Pro można zakupić od firmy Softquad.

0x01 graphic

Kopię programu HoTMetaL można załadować w większości węzłów rozprowadzających oprogramowanie użytkowe, takich jak NCSA czy CERN. Zajrzyj na przykład na stronę http://info.cren.ch/hypertext/ WWW/Tools/HoTMetaL.html

HoTMetaL to edytor zintegrowany z przeglądarką WWW. Nie działa on w pełni w trybie WYSIWYG, ale pozwala dobrze ocenić widok końcowy tworzonego dokumentu. HoTMetaL prawie że wymusza użycie prawidłowej składni języka HTML, sprawdzając czy na końcu i początku dokumentu występują odpowiednie znaczniki i pozwalając wstawiać znaczniki tylko tam, gdzie są one dozwolone (pozwala to oszczędzić sporo czasu nowym użytkownikom języka HTML).

HoTMetaL potrafi również sprawdzić składnię dokumentu i poinformować o występujących problemach ze znacznikami (ta możliwość przydaje się szczególnie przy importowaniu dokumentów stworzonych za pomocą innych edytorów, ponieważ HoTMetaL po prostu nie pozwoli na wstawienie nieprawidłowego znacznika). Niestety, sygnalizacja błędów nie działa doskonale - nie zawsze wiersz, w którym wskazywane jest wystąpienie błędu, jest faktycznie tym powodującym problemy.

HoTMetaL ma również kilka innych wad. Obrazki GIF wstawiane do dokumentu nie są widoczne w oknie tego programu (aby je obejrzeć, trzeba uruchomić przeglądarkę stron WWW). Poza tym niektóre dokumenty nie odpowiadające dokładnie składni języka HTML nie mogą zostać załadowane do edytora, co może być problemem w przypadku modyfikowania starszych dokumentów HTML.

Rozwiązaniem alternatywnym do zastosowania dedykowanego edytora HTML jest wzbogacenie edytora pracującego w trybie WYSIWYG o możliwość obsługi kodu HTML. Najczęściej tego typu rozwiązania używane są z takimi programami, jak Word for Windows, WordPerfect czy Word for DOS. Dostępnych jest kilka takich rozszerzeń, różniących się swoją złożonością. Większość z nich działa w systemie Windows, choć kilka przeniesiono również na platformy linuxowe.

Główną zaletą użycia tego typu rozwiązań jest fakt, że przy tworzeniu dokumentów HTML można posługiwać się ulubionym i dobrze znanym edytorem korzystając z oferowanego przez niego trybu WYSIWYG. Choć programy te nie są w stanie przedstawić dokumentu dokładnie tak, jak pojawi się on w przeglądarce WWW, mogą zrobić to na tyle precyzyjnie, by umożliwić uniknięcie większości poważniejszych problemów.

Dla programu Microsoft Word for Windows dostępny jest szablon o nazwie CU_HTML, który umożliwia tworzenie stron WWW niemalże w trybie WYSIWYG. Pod względem wyglądu CU_HTML nie różni się zasadniczo od programu Word w zwykłej postaci, dodając tylko nowy pasek narzędzi i pozycję rozwijanego menu. CU_HTML udostępnia zestaw predefiniowanych stylów i pasek narzędzi umożliwiający łatwy dostęp do najczęściej wykorzystywanych funkcji. Upraszcza również wstawianie odnośników hipertekstowych i inne zadania spędzające sen z powiek nowym użytkownikom języka HTML. W wielu przypadkach wykorzystywane są odpowiednie okna dialogowe, znacznie ułatwiające obsługę programu.

Najważniejszą wadą szablonu CU_HTML jest fakt, że nie umożliwia on edycji istniejących dokumentów HTML nie zapisanych w formacie programu Word. Przy tworzeniu dokumentu HTML za pomocą szablonu CU_HTML zapisywane są dwie wersje dokumentu, jedna w formacie HTML, a druga w formacie .DOC. Dokument nie może być edytowany, jeśli nie są dostępne obie wersje pliku. Istniejący dokument można zaimportować, ale niestety powoduje to utratę wszystkich znaczników.

ANT_HTML to podobny do CU_HTML szablon rozszerzający funkcjonalność programu Word for Windows. Pod niektórymi względami szablon ten jest lepszy od CU_HTML, pod innymi zaś nieco mu ustępuje. Zawiera lepszy system pomocy i wygodniejszy pasek narzędzi, potrafi również automatycznie otwierać i zamykać znaczniki w zależności od potrzeb.

Tworzenie dokumentów HTML w systemie Linux

Wśród użytkowników Linuxa popularność zdobył program narzędziowy o nazwie tkWWW, oparty na języku Tcl i jego rozszerzeniu pozwalającym na korzystanie z interfejsu X o nazwie Tk. Jest to kombinacja przeglądarki WWW i edytora HTML pracującego w trybie zbliżonym do WYSIWYG. Choć program ten pierwotnie przeznaczony był tylko dla systemów UNIX-owych, powstały jego wersje dla innych systemów operacyjnych, w tym Windows i Macintosh.

0x01 graphic

Program tkWWW można załadować poprzez anonimowe FTP z węzła ftp.aud.alcatel.com - znajduje się on w katalogu /tcl. Tcl i Tk można załadować z różnych serwerów, w zależności od systemu operacyjnego, ale języki te są dołączone do większości standardowych dystrybucji Linuxa. Jeśli chcesz załadować wersje tych języków z sieci Internet, zacznij poszukiwania od anonimowego węzła FTP ftp.aud. alcatel.com - zajrzyj do katalogu tcl/extension. Warto również zajrzeć na oficjalną stronę poświęconą językom Tcl/Tk pod adresem http://www.sunscript.com

Podczas tworzenia strony WWW w trybie edycji programu tkWWW można w każdej chwili przełączyć się w tryb przeglądarki i sprawdzić, czy dokument jest sformatowany prawidłowo. Również w trybie edycji większość formatowania jest odpowiednio odwzorowywana na ekranie, ale widoczne są także znaczniki. Takie rozwiązanie umożliwia szybkie opracowywanie nowych stron WWW.

Niestety program tkWWW korzysta z interfejsu udostępnianego przez system Tk, co powoduje że na przeciętnych komputerach działa on dość wolno. Poza tym przeglądarka wbudowana w tkWWW również nie jest najwyższych lotów, opiera się na standardowych ramkach oferowanych przez Tk. Mimo tego tkWWW jest bardzo atrakcyjnym narzędziem do tworzenia stron WWW - jeśli nie w całości, to przynajmniej w ogólnym zarysie, szczególnie wtedy, gdy znasz język Tcl.

Innym rozwiązaniem jest użycie filtra HTML. Program tego typu pozwala utworzyć dokument HTML w oparciu o dokument pochodzący z jakiegoś edytora tekstów (nie wyłączając oczywiście zwykłych plików ASCII). Filtry są przydatne w przypadku, gdy używasz edytora potrafiącego formatować tekst w odpowiedni sposób, jak na przykład Microsoft Word.

Filtry HTML są szczególnie użyteczne, jeśli zamierzasz nadal pracować w swoim edytorze tekstów, a potrzebujesz tylko narzędzia umożliwiającego konwertowanie dokumentów do formatu HTML. Są one dość szybkie i łatwe w obsłudze - zwykle wymagają tylko podania nazwy dokumentu, na podstawie którego ma być wygenerowany plik w formacie HTML. Poziom sprawdzania poprawności składniowej i raportowania zależy od konkretnej implementacji filtra.

Filtry HTML są dostępne dla większości typów dokumentów, a wiele z nich działa bezpośrednio pod kontrolą Linuxa; czasem są one również rozprowadzane w postaci kodu źródłowego, dającego się bez żadnych modyfikacji skompilować w systemie Linux. Dokumenty programu Word w wersji dla Windows i DOS można przełożyć na język HTML za pomocą omówionych wcześniej szablonów CU_HTML i ANT_HTML. Pojawiają się również samodzielne programy do konwersji dokumentów .DOC. Program o nazwie WPTOHTML pozwala utworzyć dokument HTML na podstawie dokumentu w formacie programu Word Perfect. Jest on w zasadzie zestawem makropoleceń programu Word Perfect w wersji 5.1 i 6.0. Filtra tego można również używać z innymi formatami plików, które mogą być zaimportowane do edytora Word Perfect.

Pliki LaTeX i TeX mogą zostać przełożone na język HTML za pomocą kilku różnych programów. Dla systemu Linux dostępnych jest sporo tego typu aplikacji, na przykład LATEXTOHTML, który potrafi obsłużyć nawet równania znajdujące się w wierszu tekstu i odnośniki. Przy konwertowaniu prostszych dokumentów użyteczny może okazać się program VULCANIZE, który jest szybszy, ale nie potrafi radzić sobie z równaniami matematycznymi. Oba te programy są skryptami napisanymi w języku Perl.

0x01 graphic

Program LATEXTOHTML dostępny jest poprzez anonimowe FTP na serwerze ftp.tex.ac.uk w katalogu pub/archive/support, pod nazwą latextohtml. Program VULCANIZE natomiast można otrzymać na stronie WWW pod adresem http://plover.com/ vulcanize.

Program RTFTOHTML pozwala tworzyć dokumenty HTML w oparciu o dokumenty w formacie RTF, obsługiwanym przez wiele edytorów tekstów - można więc zapisać dokument ze swojego ulubionego edytora do formatu RTF, a następnie przekonwertować go do formatu HTML za pomocą programu RTFTOHTML.

0x01 graphic

Program RTFTOHTML jest dostępny na stronie WWW pod adresem http://kali.usask.ca/r2h68k/html/overview.htm

Konserwacja dokumentów HTML

Rola autora strony WWW nie sprowadza się tylko do jej utworzenia i udostępnienia całemu światu. Jeśli strona nie ma postaci prostego dokumentu tekstowego, to najprawdopodobniej znajduje się na niej sporo odnośników do innych stron i serwerów. Odnośniki te muszą być regularnie weryfikowane. Co jakiś czas należy również sprawdzać prawidłowość udostępnianych stron, mając na uwadze fakt, że mogą czytać je ludzie z całego świata.

Na szczęście istnieje kilka programów wspomagających sprawdzanie istniejących na stronie WWW hiperłączy. Pozwalają one również na wyszukiwanie innych węzłów czy dokumentów, do których odnośniki mógłbyś chcieć zamieścić na swojej stronie. Programy takie, często nazywane pająkami lub robotami, potrafią samodzielnie przemieszczać się w sieci, tworząc listę odpowiednich adresów (pająki są podobne do programów użytkowych Archie i Veronica, które jednak nie potrafią poruszać się w całym Internecie).

Choć uważa się je za przydatne tylko dla użytkowników stron WWW (można za ich pomocą uzyskać listę węzłów, które warto odwiedzić), pająki i programy pokrewne mogą również przydać się autorom stron WWW, dostarczając informacji o potencjalnie interesujących odnośnikach, które można zamieścić na stronie WWW. Jednym z bardziej znanych programów tego typu jest program o nazwie World Wide Web Worm, w skrócie WWWW. Pozwala on na wyszukiwanie słów kluczowych i używanie operatorów logicznych. Potrafi przeszukiwać zarówno tytuły dokumentów, jak i same dokumenty; możliwe jest również użycie kilku innych trybów wyszukiwania (włącznie z wyszukiwaniem wszystkich znanych stron WWW).

Podobnym narzędziem jest program o nazwie WebCrawler, pozwalający dodatkowo na wyszukiwanie dowolnych słów kluczowych w treści dokumentów. Lista znalezionych dokumentów uporządkowana jest od najlepiej spełniających kryteria wyszukiwania.

0x01 graphic

Program World Wide Web Worm można załadować ze strony http:// guano.cs.colorado.edu/home/mcbryan/WWWWguano.html, natomiast WebCrawler dostępny jest pod adresem http://www. biotech.washington.edu/WebCrawler/WebCrawler.html.

W przypadku dokumentów HTML bardzo często zdarza się, że w miarę upływu czasu umieszczone w nich hiperłącza tracą ważność, wskazując na pliki lub serwery które w rzeczywistości już nie istnieją (ponieważ zmieniła się ich lokalizacja albo zostały usunięte). Z tego powodu warto regularnie sprawdzać i uaktualniać wszystkie odnośniki na stronach WWW. Pomoże w tym program o nazwie HTML_ANALYZER, który potrafi sprawdzić, czy wszystkie odnośniki na danej stronie są prawidłowe. Po sprawdzeniu danego dokumentu tworzy on plik tekstowy, do którego zapisuje listę wszystkich adresów, również tych nie będących odnośnikami. Przy następnym uruchomieniu sprawdza, czy odnośniki nadal prowadzą w te same miejsca.

HTML_ANALYZER wykonuje trzy rodzaje testów: sprawdza, czy dokument wskazywany przez odnośnik jest dostępny (ang. validation), sprawdza występujące w bazie danych adresy nie będące hiperłączami (ang. completness) i sprawdza, czy zostały zachowane odpowiednie relacje pomiędzy hiperłączami i wskazywanymi przez nie dokumentami (ang. consistency). Wszelkie odchylenia od normy są przedstawiane użytkownikowi.

Użytkownicy programu HTML_ANALYZER muszą dość dobrze znać język HTML, system operacyjny i potrafić używać analizatorów sterowanych z wiersza poleceń. Program ten należy przed użyciem skompilować za pomocą programu narzędziowego make. Przed uruchomieniem programu HTML_ANALYZER trzeba utworzyć kilka katalogów, a podczas działania tworzy on kilka plików tymczasowych, które nie są usuwane. Z tych powodów nie jest to program łatwy w obsłudze dla mniej doświadczonych użytkowników.

Podstawy języka HTML

Język HTML (HyperText Markup Language) jest dość prosty do opanowania i używania, a ponieważ ostatnimi czasy pojawiły się nowe wersje tego języka, jest on również dość potężny. Nie będziemy nawet próbować nauczyć Cię języka HTML w tym jednym niewielkim rozdziale - spróbujemy jednak dokonać swego rodzaju przeglądu możliwości przez niego oferowanych i podać podstawowe informacje odnośnie jego używania na przykładzie prościutkich stron WWW.

Jeśli widziałeś kiedykolwiek jakąś stronę WWW, widziałeś wyniki zastosowania języka HTML. HTML to język używany do opisu stron WWW - z jego pomocą definiuje się wygląd stron WWW pojawiających się w przeglądarce po połączeniu się z serwerem. Serwer przesyła instrukcje języka HTML do przeglądarki, która odpowiednio je interpretuje i formatuje wyświetlany dokument. Do wyświetlania dokumentów napisanych w języku HTML zwykle używa się przeglądarek WWW, choć zadanie to mogą również wykonać inne programy. Obecnie dostępna jest cała gama różnorakich przeglądarek WWW, rozpoczynając od najstarszej chyba aplikacji stworzonej w NCSA - Mosaic. Najczęściej używanymi przeglądarkami są Netscape Navigator i Microsoft Explorer. Jednak to, jakiego programu używasz do przeglądania stron WWW, nie ma w większości przypadków większego znaczenia, ponieważ wszystkie one spełniają tę samą funkcję - wyświetlają kod HTML odebrany od serwera. Przeglądarka WWW prawie zawsze działa jako klient, wysyłając żądania przesłania odpowiednich danych do serwera.

Język HTML jest oparty na innym języku o nazwie SGML (Standard Generalized Markup Language), używanym do opisywania struktury dokumentu i ułatwiającym przenoszenie dokumentów pomiędzy różnymi edytorami tekstów. Język HTML nie określa sposobu, w jaki strona będzie wyświetlana - nie jest to język opisu strony, taki jak na przykład PostScript. Język HTML opisuje strukturę dokumentu. Pozwala wyznaczyć fragment tekstu pełniący rolę nagłówka, zdefiniować treść dokumentu, określić położenie obrazków w tekście. Nie zawiera jednak dokładnych informacji o wyglądzie strony - za to odpowiedzialna jest przeglądarka WWW.

Dlaczego warto używać języka HTML? Przede wszystkim dlatego, że jest to mały język, dzięki czemu możliwe jest szybkie przesyłanie jego poleceń za pośrednictwem sieci. Choć ze względu na swój niewielki rozmiar jest on nieco ograniczony, nowsze wersje coraz bardziej rozszerzają jego możliwości. Inną bardzo ważną zaletą tego języka (z której nie wszyscy zdają sobie sprawę) jest jego niezależność od urządzenia. Nie ma znaczenia, jakiego systemu używasz do przeglądania stron WWW - przeglądarka potrafi przetworzyć plik HTML i wyświetlić go w danym systemie. To przeglądarka jest zależna od urządzenia, natomiast tworząc strony WWW, nie musisz zastanawiać się nad tym, w jakich systemach będą one przeglądane.

Jak wygląda język HTML?

Jak za chwilę się przekonasz, kod w języku HTML jest bardzo prosty. W większości składa się on z zestawu znaczników (ang. tags), opisujących początek i koniec elementu struktury dokumentu (takiego jak na przykład nagłówek, akapit, obrazek, tabela itp.). Każdy z elementów powinien być otoczony znacznikiem rozpoczynającym (otwierającym) i kończącym (zamykającym). Przykładowy kod źródłowy dokumentu HTML przedstawiony jest na rysunku 53.1. Nie przejmuj się, jeśli na razie nie wszystko rozumiesz - w dalszej części tego rozdziału przyjrzymy się wszystkim widocznym na rysunku znacznikom (zrzuty ekranu przedstawione w tym rozdziale zostały wykonane w systemie Windows).

Rysunek 53.1.

Kod źródłowy przykładowego dokumentu
w języku HTML

0x01 graphic

Zanim zaczniemy, wyjaśnijmy kilka ważnych kwestii dotyczących znaczników. W ich nazwach nie są rozróżniane małe i wielkie litery i prawie zawsze występują one parami: znacznik otwierający i znacznik zamykający. Najczęściej spotykanym błędem składniowym w dokumentach HTML jest nieprawidłowo zamknięty lub nie zamknięty znacznik. W wielu przypadkach strona z takim błędem będzie wyświetlana poprawnie, ale w innych okolicznościach może to spowodować poważne problemy z jej sformatowaniem. Ten typ błędów można wyeliminować przez dokładne sprawdzanie kodu źródłowego.

0x01 graphic

Nie wszystkie znaczniki występują w parach. Istnieje kilka znaczników „pojedynczych”, istnieją również znaczniki będące swego rodzaju pojemnikami (ang. containers) przechowującymi dodatkowe informacje. Tego typu znaczniki nie posiadają swych odpowiedników zamykających.

Znaczniki zapisuje się w pojedynczych nawiasach trójkątnych. Nawiasy te informują przeglądarkę o tym, że ich zawartość należy traktować jako instrukcję języka HTML. Fragmenty kodu w języku HTML mają więc zwykle postać:

<nazwa_znacznika_otwierającego> tekst tekst tekst <nazwa_znacznika_zamykającego>

Tego typu para znaczników określa, w jaki sposób traktowany będzie tekst zawarty pomiędzy nimi. Jeśli na przykład są to znaczniki początku i końca nagłówka, tekst zapisany pomiędzy nimi w przeglądarce będzie odpowiednio wyróżniony, np. wytłuszczony czy powiększony.

W jaki sposób tworzy się kod w języku HTML? Można to robić na kilka sposobów. Najprostszym z nich jest użycie dowolnego edytora ASCII. Upewnij się, że nie zapisujesz dokumentu HTML w jakimś specjalnym formacie, na przykład jako dokument programu Word, ponieważ przeglądarki WWW radzą sobie tylko i wyłącznie z plikami w formacie ASCII. Dostępne są również wyspecjalizowane edytory pozwalające na wstawianie znaczników po wybraniu ich z menu i śledzenie na bieżąco efektów formatowania tworzonego dokumentu, które są bardzo przydatne przy pisaniu większych stron WWW, ale dla większości użytkowników prosty edytor tekstów w zupełności wystarczy do poznania podstawowych zasad używania języka HTML.

Początek dokumentu HTML

Dokument HTML powinien rozpoczynać się od znacznika informującego, że jest on napisany właśnie w tym języku. Znacznik ten ma postać <HTML> i na jego podstawie przeglądarka internetowa może zorientować się, że ma do czynienia z początkiem dokumentu w języku HTML. Oto fragment kodu źródłowego przykładowej strony WWW:

Pierwszy i ostatni znacznik - czyli <HTML> i </HTML> - wyznacza początek i koniec kodu w języku HTML. Ukośnik wchodzący w skład drugiego ze znaczników symbolizuje koniec elementu strukturalnego. Znaczniki <HEAD> i </HEAD> oznaczają część wstępną pliku; zwykle umieszcza się pomiędzy nimi tytuł strony i słowa kluczowe, które będą wyświetlane w wyszukiwarkach internetowych (pomiędzy tymi znacznikami dozwolone jest użycie tylko kilku innych znaczników). Znaczniki <TITLE> i </TITLE> pozwalają zdefiniować tytuł dokumentu. Pomiędzy znacznikami <BODY> i </BODY> umieszcza się treść dokumentu. Znaczniki <H1> i </H1> pozwalają wstawić do dokumentu nagłówek pierwszego poziomu.

Powyższy kod może zostać zinterpretowany przez dowolną przeglądarkę internetową - efekt sformatowania dokumentu przedstawia rysunek 53.2. Jak widać, w oknie głównym wyświetlany jest tylko tekst umieszczony pomiędzy znacznikami określającymi treść dokumentu, nie jest natomiast wyświetlany tekst określający jego tytuł - on pojawia się na pasku tytułowym okienka przeglądarki i spełnia funkcję identyfikacyjną.

Rysunek 53.2.

Przykładowy dokument HTML wyświetlony za pomocą przeglądarki Internet Explorer

0x01 graphic

Przedstawiony powyżej przykładowy plik składa się z kilku wierszy tekstu - taki podział nie jest jednak konieczny i ma na celu tylko zwiększenie czytelności kodu. Jeśli chcesz, możesz wszystkie instrukcje umieścić w jednym, długim wierszu, ponieważ w języku HTML znaki białe są domyślnie ignorowane. Jednak ze względu na łatwość wyszukiwania ewentualnych usterek i czytelność kodu warto organizować kod w przejrzysty sposób.

Znacznik <TITLE> powinien zawsze występować w kontekście znacznika nagłówka (<HEAD> i </HEAD>); używa się go do definiowania tytułu strony, który powinien opisywać jej zawartość. Strona może posiadać tylko jeden tytuł. Pomiędzy znacznikami początku i końca nagłówka nie mogą występować żadne inne znaczniki. Tytuł strony powinien być w miarę krótki, a jednocześnie dawać jasne informacje o zawartości strony, dzięki czemu użytkownicy przeglądający dany dokument będą mogli go łatwo zidentyfikować.

Znaczniki <BODY> i </BODY> określają początek i koniec treści dokumentu. Zwykle w dokumencie występuje dokładnie jedna taka para. Wszystkie instrukcje określające zawartość strony, tekst, odnośniki, grafiki itd. powinny znaleźć się pomiędzy tymi znacznikami.

W języku HTML zdefiniowanych jest kilka poziomów nagłówków, dzięki czemu możliwe jest tworzenie rozdziałów, podrozdziałów itd. W przedstawionym wcześniej przykładzie użyliśmy nagłówka definiowanego przez znacznik <H1>, czyli nagłówka pierwszego, najwyższego poziomu. Jeśli struktura dokumentu jest wielopoziomowa, warto zastosować kilka rodzajów nagłówków. Oto przykładowy dokument:

<HTML>
<HEAD>
<TITLE> To jest moja strona WWW! </TITLE> </HEAD>
<BODY>
<H1> To nagłówek typu H1. </H1>
To fragment tekstu.
<H2> To nagłówek typu H2. </H2>
To inny fragment tekstu.
<H3> To nagłówek typu H3. </H3>
Fragment tekstu opisany nagłówkiem poziomu trzeciego.
<H3> To kolejny nagłówek typu H3. </H3>
Inny fragment tekstu opisany nagłówkiem poziomu trzeciego.
<H2> Następny nagłówek typu H2. </H2>
Tekst opisany nagłówkiem H2.
</BODY>
</HTML>

Rysunek 53.3 przedstawia efekt wyświetlenia powyższego dokumentu w przeglądarce WWW. Jak widać, poszczególne nagłówki różnią się nieco od siebie - nagłówki wyższego poziomu są zwykle nieco większe i bardziej się wyróżniają. Dzięki temu możliwe jest podzielenie zawartości strony WWW na jednostki logiczne i przydzielenie każdej z nich nagłówka odpowiedniego poziomu. Nagłówków można używać tak, jak byłyby one stosowane w książce: tekst opisany nagłówkiem pierwszego poziomu (<H1>) może zawierać kilka fragmentów opisanych nagłówkami drugiego poziomu (<H2>), zawierających z kolei fragmenty opisane nagłówkami trzeciego poziomu (<H3>) itd. Choć nie ma żadnych formalnych ograniczeń co do używania i mieszania poziomów nagłówków (nic nie stoi na przeszkodzie, aby na przykład używać tylko nagłówków trzeciego poziomu), zdrowy rozsądek zwykle pomaga w określeniu prawidłowej struktury tworzonego dokumentu.

Rysunek 53.3.

Nagłówki różnych poziomów prezentują się nieco odmiennie

0x01 graphic

Akapity

A co z akapitami? Istnieje kilka sposobów uzyskania prawidłowego podzielenia tekstu na akapity, ponieważ reguły zmieniały się w kolejnych wersjach języka HTML. Najprostszym podejściem jest jednak użycie znaczników <P> i </P> (ang. paragraph), wyznaczających zakres tekstu wchodzącego w skład pojedynczego akapitu. Oto przykładowy dokument w języku HTML zawierający trzy akapity:

<HTML>
<HEAD>
<TITLE> Witamy na pierwszej stronie WWW! </TITLE> </HEAD>
<BODY>
<H1> To nagłówek pierwszego poziomu. </H1>
<P> To jest pierwszy akapit. Jest on bardzo interesujący i ze względu na jego ogromne walory dydaktyczne warto go przeczytać kilka razy. </P>
<P> To drugi akapit. Nie jest on już aż tak ekscytujący jak pierwszy akapit, ale trudno pisać bardzo ekscytujące akapity tak późno w nocy. </P>
<P> Oczywiście ostatni akapit musi wstrząsnąć czytelnikiem - tylko wtedy będzie on zadowolony. Ale nie zawsze musimy spełniać wszystkie zachcianki czytelników. </P>
</BODY>
</HTML>

Efekt przetworzenia tego dokumentu przez przeglądarkę internetową przedstawia rysunek 53.4. Zauważ, że poszczególne akapity są rozdzielone, a pomiędzy nimi zostały wstawione odpowiednie odstępy. Co jednak stało by się, gdyby znaczniki akapitów zostały pominięte? Ponieważ znaki białe - w tym symbole nowego wiersza -są ignorowane przez przeglądarkę stron WWW, cały tekst zostałby wyświetlony jako pojedynczy akapit, tak jak przedstawia to rysunek 53.5. Do rozdzielania poszczególnych akapitów należy więc używać znaczników <P> i </P>. Pamiętaj o tym, że wstawienie nawet większej liczby pustych wierszy pomiędzy fragmentami tekstu nie spowoduje potraktowania ich jako osobnych akapitów - znaki nowego wiersza zostaną zignorowane i tekst zostanie potraktowany jako pojedynczy akapit.

Rysunek 53.4.

Użycie znaczników akapitu powoduje rozdzielenie fragmentów tekstu i wstawienie pomiędzy nie odpowiedniego odstępu

0x01 graphic

Rysunek 53.5.

Bez znaczników akapitu cały tekst traktowany jest jak pojedynczy akapit

0x01 graphic

Mówiąc ściślej, użycie znacznika </P> do oznaczenia końca akapitu nie jest konieczne, ponieważ znacznik <P> powoduje wymuszenie rozpoczęcia nowego akapitu. Znacznik <P> jest więc jednym ze znaczników, które nie muszą występować wraz ze swym odpowiednikiem zamykającym (czyli </P>). Mimo tego, dobrym zwyczajem jest zamykanie również tego znacznika.

A co z komentarzami w kodzie dokumentów HTML? Przecież może zdarzyć się, że będziesz chciał zapisać w dokumencie informację o jego autorstwie, skomentować fragment kodu itp. Komentarz można wstawić do dokumentu w następujący sposób:

<!- To jest komentarz ->

Komentarz powinien być otoczony nawiasami trójkątnymi, jego pierwszym znakiem powinien być symbol wykrzyknika, a na początku i końcu komentarza powinien wystąpić myślnik. Oto przykład kodu w języku HTML zawierającego komentarze:

<HTML>
<!- Autor: TJP, 12/12/95; v1.23 ->
<HEAD>
<TITLE> Witam na mojej stronie WWW! </TITLE> </HEAD>
<BODY>
<H1> To nagłówek pierwszego poziomu. </H1>
<!- ta sekcja dotyczy znaczników akapitu ->
<P> To jest pierwszy akapit </P>
</BODY>
</HTML>

Hiperłącza

Odnośniki pozwalające łatwo przejść do innego fragmentu dokumentu czy innego dokumentu są bardzo ważnym aspektem stron WWW. W języku HTML odnośniki takie tworzy się w bardzo prosty sposób. Rozpoczynają się one od znacznika początku odnośnika <A>, a kończą znacznikiem </A> (ang. anchor - zakotwiczenie; nazwa ta wzięła się od faktu, że odnośnik jest „zakotwiczony” pomiędzy tymi znacznikami).

Znacznik <A> różni się nieco od innych przedstawionych wcześniej znaczników, ponieważ pomiędzy nawiasami trójkątnymi może znaleźć się dodatkowy tekst. Oto przykład:

<A HREF="strona_2.html">Idź do strony 2</A>

W powyższym przykładzie tekst znajdujący się pomiędzy znacznikami zostanie wyświetlony na ekranie, dzięki czemu użytkownik zobaczy tekst Idź do strony 2, zwykle podkreślony czy wyróżniony w jakiś inny sposób wskazujący, że jest on odnośnikiem. Jeśli użytkownik kliknie na takim odnośniku, zostanie odczytana wartość pola HREF wchodzącego w skład znacznika <A>, po czym do przeglądarki zostanie załadowany dokument o nazwie strona_2.html. Skrót HREF pochodzi od angielskich słów Hypertext Reference; można po nim podać nazwę pliku lub URL, do którego będzie prowadził dany odnośnik.

Odnośników można używać zarówno w tekście dokumentu, jak i na przykład jako osobnych pozycji menu. Poniższy dokument HTML prezentuje możliwość wstawienia odnośnika znajdującego się w osobnym akapicie.

<HTML>
<HEAD>
<TITLE> To jest moja strona WWW! </TITLE> </HEAD>
<BODY>
<H1> To pierwszy nagłówek mojej strony głównej. </H1>
To fragment tekstu zamieszczonego na mojej stronie głównej. Mam nadzieję, że przypadła Ci ona do gustu. Jeśli chcesz dowiedzieć się o mnie czegoś więcej, wybierz <A HREF="o_autorze.html"> informacje o autorze, </A> a przedstawię Ci wszystkie moje zalety. </P>
<P><A HREF="biblio.html">Bibliografia</A>
</BODY>
</HTML>

Rysunek 53.6 przedstawia wygląd powyższego dokumentu po sformatowaniu przez przeglądarkę WWW. Każdy z odnośników jest podkreślony, dzięki czemu łatwo jest go zidentyfikować (w niektórych przeglądarkach zamiast podkreślenia stosowana jest zmiana koloru tekstu lub też wyróżnienie innego typu).

Rysunek 53.6.

Dokument zawierający dwa odnośniki

0x01 graphic

Kiedy odnośnik prowadzi do innego dokumentu, trzeba poprawnie podać nazwę pliku, w którym jest on zapisany. Można to zrobić na dwa sposoby: podając nazwę pełną lub względną. Nazwa pełna zawiera ścieżkę dostępu do pliku, natomiast nazwa względna jest odniesiona do bieżącego położenia dokumentu. Oto przykład odnośnika do pliku określonego za pomocą nazwy pełnej:

A HREF="/usr/tparker/html/home.html">

Względne ścieżki dostępu odniesione są do bieżącego położenia dokumentu i mogą zawierać polecenia służące do przemieszczania się w strukturze katalogów, na przykład:

Odnośniki do innych dokumentów dostępnych za pomocą adresów w formacie URL definiuje się w ten sam sposób - wystarczy tylko zamiast nazwy pliku podać lokator URL. Oto przykładowy odnośnik prowadzący do strony głównej wyszukiwarki Yahoo!:

<A HREF="http://www.yahoo.com">Yahoo!</A>

W dokumencie można osadzić dowolną liczbę odnośników. Warto dołączać do nich jak najbardziej treściwe komentarze, dzięki czemu użytkownicy nie będą trafiać na strony, których być może wcale nie mieli zamiaru odwiedzać. Jeśli tworzysz odnośniki do innych stron WWW, powinieneś od czasu do czasu sprawdzać, czy nadal są one dostępne. Wiele stron WWW zmienia lokalizację lub też całkowicie kończy działanie, więc odnośniki powinny być kontrolowane, aby zapobiec nieporozumieniom.

Wyliczenia

Język HTML pozwala na użycie kilku różnych formatów list i wyliczeń, na przykład numerowanych, oznaczanych odpowiednimi etykietami lub symbolami graficznymi. Listy otacza się takimi znacznikami, jak na przykład <OL> i </OL> (ang. ordered list, lista uporządkowana) czy <MENU> i </MENU>. Każda pozycja listy powinna rozpoczynać się od znacznika <LI> lub też innego znacznika o podobnej funkcji. Dostępnych jest również kilka specjalnych znaczników służących na przykład do formatowania słowników, ale nie będziemy ich tu omawiać.

Oto przykład prostej listy definiowanej za pomocą znaczników <UL> i </UL> (ang. unordered list, lista nieuporządkowana):

<HTML>
<HEAD>
<TITLE> Witam na mojej stronie WWW! </TITLE> </HEAD>
<BODY>
<H1> Oto lista książek mojego autorstwa. </H1>
Książki, które napisałem w trakcie zeszłorocznych wakacji:
<UL>
<LI> Gryzą mnie komary
<LI> Zabawy z niedźwiedziami
<LI> Co można zjeść gdy nie ma co jeść
<LI> Dlaczego ciągle pada
<LI> Poradnik dla zagubionych w lesie
</UL>
</BODY>
</HTML>

Lista nieuporządkowana jest podobna do uporządkowanej, z tym że jej elementy nie są numerowane. Efekt sformatowania powyższego kodu przedstawiony jest na rysunku 53.7 - można zauważyć, że poszczególne elementy listy oznaczone są symbolami graficznymi, tworzącymi pionową linię.

Rysunek 53.7.

Nieuporządkowana lista w dokumencie HTML

0x01 graphic

Ten sam dokument może zostać sformatowany w postaci listy uporządkowanej - służą do tego znaczniki <OL> i </OL>. Elementy takiej listy są poprzedzone odpowiednimi numerami, jak widać na rysunku 53.8. Pozostała część dokumentu nie została zmodyfikowana - zamiast znaczników <UL> i </UL> wstawiono odpowiednio <OL> i </OL>.

Rysunek 53.8.

Dokument HTML może również zawierać listę numerowaną

0x01 graphic

Zmiana kroju pisma

W języku HTML zdefiniowano również zestaw znaczników służących do modyfikowania wyglądu znaków. Pozwalają one zarówno na bezpośrednie określenie kroju znaków (na przykład wymuszenie zastosowania kursywy, wytłuszczenia itp.), jak i na logiczne wyróżnienie fragmentu tekstu (na przykład dla zaakcentowania jakiegoś wyrazu, zaznaczenia kodu programu czy tekstu innego typu). Wymuszanie kroju pisma zwykle nie jest najlepszym pomysłem, ponieważ niektóre przeglądarki mogą wyświetlać tekst w sposób inny, niż zamierzony. Mimo tego, można używać tej możliwości, jeśli wiadomo, że dokument będzie wykorzystywany tylko przez użytkowników dysponujących przeglądarkami formatującymi tekst w sposób zgodny z zamierzeniami.

O wiele lepszym pomysłem jest zastosowanie znaczników pozwalających na logiczne wyróżnienie fragmentu tekstu, ponieważ w takim przypadku przeglądarka może samodzielnie zdecydować jaki krój pisma będzie najodpowiedniejszy dla danej platformy. Z tego powodu tym właśnie znacznikom przyjrzymy się nieco bliżej. Język HTML udostępnia osiem powszechnie wykorzystywanych znaczników pozwalających logicznie wyróżniać fragmenty tekstu:

<CITE> - cytat
<CODE> - fragment kodu źródłowego (zwykle czcionka Courier)
<DFN> - wyróżnienie definicji
<EM> - zaakcentowanie fragmentu tekstu (zwykle wyróżnienie kursywą)
<KBD> - fragment tekstu, który użytkownik powinien wprowadzić z klawiatury
<SAMP> - tekst przykładowy, formatowany podobnie jak <CODE>
<STRONG> - tekst wyróżniony (zwykle wytłuszczony)
<VAR> - nazwa zmiennej, wyświetlana kursywą lub podkreślona (zwykle w kontekście znacznika <CODE>)

Poniższy kod źródłowy dokumentu przedstawia zastosowanie niektórych przedstawionych wyżej stylów, a rezultat otwarcia tegoż dokumentu w przeglądarce stron WWW przedstawia rysunek 53.9.

Rysunek 53.9.

Zastosowanie znaczników pozwalających na logiczne wyróżnianie fragmentów
tekstu

0x01 graphic

Jak widać, przedstawiona na rysunku przeglądarka (Internet Explorer) interpretuje znacznik <EM> wyróżniając fragment tekstu kursywą, a znacznik <STRONG> - wytłuszczeniem. Większość przeglądarek interpretuje te znaczniki właśnie w taki sposób, ale inne znaczniki mogą być różnie interpretowane w różnych przeglądarkach.

Jeśli chcesz wymusić określony krój pisma, możesz zastosować znaczniki <B> i </B> (wytłuszczenie, ang. bold), <I> i </I> (kursywa, ang. italics) oraz <TT> i </TT> (czcionka maszyny do pisania, używana zwykle do prezentacji kodu źródłowego).

Inne znaczniki

Przy tworzeniu stron WWW przydaje się również kilka innych znaczników. Jednym z nich jest znacznik <PRE>, umożliwiający poinformowanie przeglądarki, że fragmentu tekstu został sformatowany wcześniej (ang. preformatted). W tekście zawartym pomiędzy znacznikami <PRE> i </PRE> znaki białe nie są ignorowane. Pozwala to na ręczne sformatowanie tabeli czy tekstu innego typu dokładnie w wymagany sposób. Oto przykładowy dokument zawierający te znaczniki:

<HTML>
<HEAD>
<TITLE> Witam na mojej stronie WWW! </TITLE> </HEAD>
<BODY>
<H1> To jest nagłówek pierwszego poziomu. </H1>
<P> To przykładowy tekst zawierający <EM> fragment wyróżniony za pomocą znacznika EM </EM> i inny fragment wyróżniony <STRONG> za pomocą znacznika STRONG. </STRONG> </P>
<PRE>
To fragment
tekstu który został sformatowany wcześniej
i w oknie przeglądarki pojawi się tak, jak został tu wpisany.
</PRE>
</BODY>
</HTML>

Jak widać na rysunku 53.10, we fragmencie otoczonym znacznikami <PRE> zachowane zostały nadmiarowe spacje i znaki nowego wiersza, a nawet zachowana została czcionka użyta do napisania kodu źródłowego (Courier).

Rysunek 53.10.

Znacznik <PRE> pozwala formatować fragment tekstu ręcznie

0x01 graphic

Innym prostym, ale bardzo użytecznym znacznikiem jest znacznik <HR>, pozwalający wstawić do dokumentu poziomą linię. Spróbujmy wzbogacić o ten element przedstawiony powyżej przykładowy dokument:

<HTML>
<HEAD>
<TITLE> Witam na mojej stronie WWW! </TITLE> </HEAD>
<BODY>
<H1> To jest nagłówek pierwszego poziomu. </H1>
<P> To przykładowy tekst zawierający <EM> fragment wyróżniony za pomocą znacznika EM </EM> i inny fragment wyróżniony <STRONG> za pomocą znacznika STRONG. </STRONG> </P>
<HR>
<PRE>
To fragment
tekstu który został sformatowany wcześniej
i w oknie przeglądarki pojawi się tak, jak został tu wpisany.
</PRE>
<HR>
</BODY>
</HTML>

Jak widać na rysunku 53.11, na stronie pojawiły się dwie poziome linie. Ich forma może różnić się w zależności od wykorzystywanej przeglądarki, ale ogólna idea pozostaje taka sama: jest to pozioma linia rozdzielająca fragmenty dokumentu.

Rysunek 53.11.

Znacznik <HR> służy do podziału strony za pomocą poziomej linii

0x01 graphic

Podsumowanie

Jeśli nie chcesz używać generatora ani konwertera kodu, możesz tworzyć strony WWW pisząc je bezpośrednio w języku HTML. Język ten nie jest trudny od strony „programistycznej”, dlatego można go opanować w bardzo krótkim czasie. Do programowania w języku HTML nie jest potrzebne doświadczenie z innymi językami programowania.

Założenie własnej strony głównej wymaga posłużenia się jakimś programem narzędziowym umożliwiającym tworzenie dokumentów HTML lub napisania strony WWW bezpośrednio w języku HTML za pomocą dowolnego edytora tekstów. Dokładne omówienie języka HTML wykracza poza zakres materiału omawianego w tej książce, ale na rynku dostępnych jest obecnie sporo książek na ten temat. Język HTML jest bardzo prosty do opanowania. Opierając się na informacjach podanych w tym rozdziale, powinieneś być w stanie założyć własną stronę główną i udostępnić ją wszystkim użytkownikom Internetu.

Jeśli chcesz dowiedzieć się czegoś więcej o języku Java, za pomocą którego można uatrakcyjnić strony WWW, przejdź do rozdziału 54. „Podstawy języka Java i JavaScript”.

Rozdział 56. „Zarządzanie kodem źródłowym” zawiera informacje, które pozwolą Ci używać systemów zarządzania kodem źródłowym i innych narzędzi tego typu.

Inne aplikacje dla systemu Linux omówione są w rozdziałach od 62. „Adabas-D i inne bazy danych” do 64. „Program Lone-Tar”.

800 Część VII ♦ Konfiguracja węzła internetowego

800 E:\Moje dokumenty\HELION\Linux Unleashed\Indeks\53.DOC

E:\Moje dokumenty\HELION\Linux Unleashed\Indeks\53.DOC 781

Rozdzia³ 53. ♦ Podstawy języka HTML 799

53, ciekawostki, Linux - Ksiega Eksperta, Linux - ksiega eksperta, Linux - księga eksperta