2013-01-23
Polskie znaki - standardy kodowania
UTF - Unicode Transformation Format - metody
przechowywania unikodów w pamięci komputera:
- UTF-8- kody znaków wchodzących w skiad podstawowego zestawu ASCII zapisywane są jako wartości jednobajtowe; pozostałe kody zapisywane są na dwóch, trzech, czterech, pięciu lub sześciu bajtach (znaki o kodach zapisywanych na trzech i
- UTF-16 - kody znaków zapisywane są na dwóch, trzech lub czterech bajtach (najczęściej wykorzystywane są znaki o kodach dwubajtowych):
- UTF-32 - kody znaków zapisywane są na 4 bajtach.
Unikod{ ang. Unicode lub UCS - UniversalCharacterSet)~ sposób kodowania znaków uwzględniający większości wykorzystywanych znaków w różnych językach na całym
- dodatkowy zestow znaków - stosowane są kody 32 bitowe.
Unicode jest międzynarodowym standardem zbioru znaków, który może być wykorzystany do pisania dokumentów w niemalże każdym istniejącym języku.
Wersja 4.0.1 z czerwca 2004 roku zawiera 96 447 znaków z prawie wszystkich języków na świecie.
Unicode z łatwością mieści cały alfabet łaciński, ale również pismo pochodzenia greckiego, włączając starożytne i współczesne odmiany oraz cyrylicę używaną np. w Serbii.
Prawdopodobnie jedna osoba na milion obywateli świata obecnie mówi językiem, który nie może być sensownie przedstawiony w Unicode.
18