17 Co to jest unikod

background image

17. Co to jest unikod?

Unicode – komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na
świecie. Definiują go dwa standardy – Unicode oraz ISO 10646. Znaki obu standardów są identyczne.
Standardy te różnią się w drobnych kwestiach, m.in. Unicode określa sposób składu.

Kodowanie Unicode

Standard Unicode obejmuje przydział przestrzeni numeracyjnej poszczególnym grupom znaków, nie
obejmuje zaś sposobów bajtowego kodowania znaków. Jest kilka metod kodowania, oznaczanych
skrótowcami UCS (Universal Character Set) i UTF (Unicode Transformation Format). Do najważniejszych
należą:

UTF-32/UCS-4

UTF-16

UTF-8.

Mniej popularnymi kodowaniami Unicode są:

UTF-7

UCS-2.

Istnieją również inne kodowania, stanowiące margines lub pozostające na etapie propozycji, na przykład:

UTF-9 i UTF-18

UTF-EBCDIC

UTF-6

UTF-5.


Kody pierwszych 256 znaków Unicode pokrywają się z kodami ISO Latin 1 (czyli ISO-8859-1), przez co
kody pierwszych 128 znaków pokrywają się z ASCII. Należy jednak pamiętać, że jest to zbieżność
wyłącznie numerów przyporządkowanych konkretnym znakom, wartości bajtów użytych do ich zapisania
mogą (i w większości kodowań będą) się różnić od tych, które uzyska się stosując Latin 1 lub ASCII.


Wprowadzanie znaków unicode

Typowe układy klawiatur udostępniają tylko niewielki zbiór znaków, na przykład standardowe polskie
układy klawiatury zawierają wyłącznie polskie litery i znak euro, nie zawierają natomiast znaków
cudzysłowu. Do wprowadzania znaków nieobecnych na klawiaturze można użyć jednej z poniższych metod:

W systemie Windows NT, Mac OS X (od wersji 10.2) oraz w licznych dystrybucjach Linuksa (ze
środowiskiem graficznym) dostępna jest tablica znaków, w której można wyszukać potrzebny znak,
skopiować go do schowka, a następnie wkleić w program. W Systemach Windows 95, 98 i ME tablica
znaków nie daje dostępu do wszystkich znaków Unicode.

Znając numer pozycji znaku (czy to dziesiętny, czy to szesnastkowy), można wprowadzić ten znak na
kilka sposobów (nie wszystkie programy obsługują wszystkie opisane tu sposoby):

Trzymając naciśnięty (lewy) Alt i wpisując z klawiatury numerycznej numer dziesiętny tego znaku,

po czym zwolnić klawisz Alt.

background image

Wpisać numer szesnastkowy tego znaku, a następnie wcisnąć kombinację (lewy) Alt+x. Przed
numerem szesnastkowym nie może być cyfra ani litera z zakresu af (gdyż zostaną uznane jako
część kodu, ewentualnie należy poprzedzić kod np. spacją lub uzupełnić kod wiodącymi zerami, tak
by liczył dokładnie sześć pozycji).

Trzymając naciśnięty (lewy) Alt nacisnąć klawisz plus, wpisać numer szesnastkowy znaku, po czym
zwolnić klawisz Alt. Metoda ta działa w systemie Windows XP i nowszych.

Trzymając naciśnięte klawisze Ctrl+Shift wpisać numer szesnastkowy znaku, a następnie puścić
klawisze. Metoda ta działa w środowisku GNOME. Od wersji GTK+ 2.10 należy nacisnąć
Ctrl+Shift+u, wprowadzić kod szesnastkowy znaku, nacisnąć Enter.


Nazewnictwo


Rada Języka Polskiego proponuje nazwę unikod dla każdego systemu unifikacji kodyfikacji liter.


Wyszukiwarka

Podobne podstrony:

więcej podobnych podstron