xml sgml podstawy





Podstawy















pl.comp.www FAQ




Następny



Następny rozdział


Rozdział 7. XML/SGML


Poprzedni rozdział



Poprzedni







7.2. Podstawy


Dokument SGML składa się z kilku części:


deklaracji SGMLa

gdzie opisuje się klasę dokumentu, podstawowe parametry jego budowy i
przetwarzania: używane zestawy znaków, dopuszczalne długości literałów
(np. nazwy znaczników czy długość atrybutów), opcje minimalizacji (np. czy
możliwe jest i w jakiej postaci pomijanie znaczników kończących element).



Definicji Typu Dokumentu

---

DTD

, Document Type Definition

--- gdzie jest zakodowana hierarchia elementów wraz z dopuszczalnymi
atrybutami, ich dopuszczalnymi i domyślnymi wartościami, możliwą
zawartością DTD jednoznacznie określa składnie danego typu dokumentu.



zawartości dokumentu

--- tzw.
DOCUMENT INSTANCE

(w wypadku wielu typów dokumentów zawierające także ,,zewnętrzne''
elementy sterujące tzw. ,,processing intructions'' (np. <?php
Date?>))



W wielu wypadkach deklarację stosuje się domyślną, a zamiast całego
DTD umieszcza się Formal Public Indentifier (rozwiązywany zwykle przez
parsery na właściwie DTD katalogu
zawierającego zbiór dopuszczalnych deklaracji wraz z odsyłaczami do
poszczególnych plików). Przy czym istnieje rozróżnienie na identyfikatory
publiczne: czyli
zarejestrowane

i systemowe np.: tworzone ad hoc.

Parser SGML (jak sama nazwa wskazuje) jest programem analizującym składnię
dokumentu i to --- jeśli mowa o tzw.
validating parsers

--- nie tylko samą jednorazową dawkę informacji ale również deklarację
SGML i DTD (wraz z jego składnią). Wyjście z parsera --
ESIS,

czyli
Element Structure Information Set

--- może stanowić podstawę konwersji czy jakiejkolwiek obróbki
dokumentu (łącznie z (re)formatowaniem, przy wykorzystaniu np. arkuszy
stylistycznych
DSSSL.


Składnia DTD:

<ELEMENT nazwa otwarcie zamknięcie (zawartość) > na przykład
<!element linuxdoc o o (sect | chapt | article | report | book |
letter | telefax | slides | notes | manpage ) >

deklarujemy że element linuxdoc (nie obowiązkowy - pozycje ,,otwarcie''
i ,,zamknięcie'' (,,-'' to obowiązkowy, ,,o'' nie obowiązkowy ) może w
sobie zawierać alternatywnie elementy
sect

,
chapt

,
article

i inne.




,

- wszystkie elementy muszą występować w określonym porządku



&

wszystkie elementy muszą występować, ale porządek dowolny



|

rozłączne lub - jeden lub tylko jeden może wystąpić



+

element
musi

wystąpić co najmniej raz



?

element nie obowiązkowy



*

element
może

wystąpić raz lub więcej





ENTITY --- ,,drobinka'': forma makroinstrukcji


ATTLIST --- lista atrybutów ELEMENTU wraz z opcjami:
<ATTLIST linuxdoc LANG (CDATA) #REQUIRED>


#FIXED


#REQUIRED


#CURRENT - z poprzedniego użycia


#CONFREF - referencje


#IMPLIED





Typy danych

PCDATA - parsed character data - zwykłe dane tekstowe (z rozwijaniem
entitles)


RCDATA - replaceable chracter data


CDATA - character data - zwykłe tekstowe --- nie przewidywana dalsza
obróbka


ANY - może zawierać PCDATA i inne elementy


EMPTY


ID - identyfikator SGMLowy


IDREF - odwołanie do tegoż









Patrz też:.



SGML: Introductions and Overviews @ SGML/XML Home Page




TEI's "A Gentle Introduction to SGML."



University of Waterloo.
"SGML Introduction - An Introduction to the Standard Generalized Markup Language (SGML)",











Następny



Spis treści



Poprzedni




XML/SGML


Początek rozdziału


Narzędzia







Wyszukiwarka

Podobne podstrony:
xml sgml
xml sgml narzedzia
Wyk6 ORBITA GPS Podstawowe informacje
Podstawowe informacje o Rybnie
3 podstawy teorii stanu naprezenia, prawo hookea
zestawy cwiczen przygotowane na podstawie programu Mistrz Klawia 6
podstaw uniw
Jezyk angielski arkusz I poziom podstawowy (5)
07 GIMP od podstaw, cz 4 Przekształcenia
Podstawy dzialania routerow i routingu
Podstawy Cyfrowego Przetwarzania Sygnalów

więcej podobnych podstron