Kodowanie znaków narodowych w dokumentach w Pajączku
91 wyświetleń
7 sie 2007, Autor: Rafał Płatek Kategoria: HTML i tworzenie stron, Pajączek
Kodowanie znaków narodowych do czasu premiery Pajączka było prawdziwą udręką. Pliki źródłowe tworzyło się w jednym programie, konwertowało następnie do porządanego formatu (najczęściej ISO-8859-2) za pomocą osobnego narzędzia. Pajączek natomiast pozwala na w pełni automatyczne kodowanie znaków w dowolnym standardzie.
Pliki w komputerze tak naprawdę nie składają się z liczb i liter, lecz z pojedynczych liczb. Strona kodowa wskazuje, jaka liczba odpowiada jakiemu znakowi. Dla przykładu, dziesiętna liczba 65 oznacza wielką literę A, 66 oznacza B itd. Jednak w starszych stronach kodowych jest miejsce do określenia jedynie 255 znaków, co jest niewystarczające do oznaczenia wszystkich znaków narodowych. Dlatego każdy język (bądź grupa języków) posiada własną stronę kodową. To, co w jednej stronie kodowej wyświetli literę Ľ (ISO-8859-2), w innej wyświetli znak £ (w tym wypadku w ISO-8859-1)
Aby poprawnie wyświetlać znaki narodowe, program musi wiedzieć, w jakiej stronie kodowej zostały one zapisane w dokumencie. Gdyby istniała tylko jedna strona kodowa dla jednego języka, nie byłoby problemu, jednak dla samego języka polskiego istnieje kilkanaście sposobów kodowania znaków, z czego najczęściej w Internecie używane są trzy:
ISO-8859-2 - strona zgodna z normą ISO, używana w większości systemów,
Unicode - wielonarodowy alfabet znaków coraz częściej używany do kodowania stron
WIN-CP-1250 - strona używana przez MS Windows.
Zalecaną stroną kodową jest strona zgodna z Polską Normą ISO-8859-2. Jest to domyślny sposób kodowania polskich znaków w Pajączku.
Korzystanie z różnych stron kodowych podczas pracy
Pajączek 5 NxG pozwala na tworzenie dokumentów w praktycznie dowolnym języku. Program potrafi również automatycznie rozpoznać stronę kodową, stosowaną w danym dokumencie, na podstawie wpisów w sekcji META. Odpowiednie opcje znajdują się w oknie Ustawienia programu - Dokumenty, a także w Menu pisownia.
Podczas pracy z serwisem, w oknie Właściwości serwisu możesz wskazać kodowanie, jakie ma być domyślnie stosowane dla wszystkich dokumentów tego serwisu. Pozwala to uniezależnić dany serwis od globalnych ustawień programu.
Możesz też szybko otworzyć i zapisać dokument, korzystając z wybranego kodowania za pomocą poleceń w Menu pisownia -> Odczytaj w kodowaniu… i Zapisuj w kodowaniu…, co pozwala dodatkowo korzystać z kodowania niezależnego od ustawień programu i serwisu.
Najczęściej używaną konwersją jest zamiana kodowania znaków z WIN-CP-1250 (strona kodowa używana w MS Windows) na ISO-8859-2 (zgodna z normą ISO strona kodowa używana w większości systemów).
Priorytet najwyższy ma kodowanie dla dokumentu. Następnie kodowanie dla serwisu i na końcu kodowanie ogólne. W przypadku zmiany kodowania do odczytu dla dokumentu następuje ponowne odczytanie dokumentu z konwersją wg wybranego kodowania. W przypadku zmiany kodowania przy zapisie dla dokumentu następuje zapisanie dokumentu w wybranym kodowaniu.
Wspomaganie dla Unicode
W celu poprawienia komfortu pracy podczas korzystania z kodowania za pomocą Unicode stworzony został mini edytorek unicode. Narzędzie to pozwala kopiować i wklejać do dokumentu teksty zawierające encje Unicode, które automatycznie zamieniane będą na znaki UTF.
Konwersja znaków narodowych
Pajączek umożliwia konwersję kodowania znaków na wiele różnych stron kodowych. Możesz ją przeprowadzić na kilka sposobów:
Za pomocą narzędzia Rozszerzone wyszukiwanie i zamiana, które umożliwia konwersję kodowania w aktualnym dokumencie, wszystkich otwartych, a także w wybranych lub wszystkich dokumentach określonego folderu lub Serwisu. Okno możesz otworzyć za pomocą polecenia Konwerter kodowania znaków w menu Pisownia.
Szybką konwersję znaków w bieżącym dokumencie możesz przeprowadzić za pomocą polecenia Znaki narodowe w bieżącym w menu Pisownia.
Możesz też szybko usunąć wszystkie polskie znaki w bieżącym dokumencie lub we wszystkich otwartych dokumentach, używając poleceń Usuń polskie znaki w bieżącym i Usuń polskie znaki w otwartych w menu Pisownia.
Podczas tworzenia nowego dokumentu możesz wybrać stronę kodową w Edytorze sekcji META. Domyślnie jest ustawiona strona ISO-8859-2.