A może Linux?
Rafał Połoński
Miałem okazję spotkać się z kilkoma niewidomymi osobami, które opowiadały mi o swoim
środowisku pracy: DOSowy screenreader (czytnik ekranu) z podłączonym sprzętowym syntezatorem
mowy. Później w etapie trochę przymusowej i kosztownej ewolucji towarzyszyłem im,
gdy przestawiali całe swoje środowisko pracy na MS Windows.
Czy darmowy system operacyjny Linux, który zdobywa coraz większe grono zwolenników,
może być przydatny dla osoby niewidomej? Spróbuję przedstawić moje spostrzeżenia
na ten temat, ukazując słabe i mocne strony systemu.
Linux jest darmowym systemem operacyjnym o dostępnym kodzie źródłowym. Pozwala to
nam na jego modyfikację oraz bezpłatną dystrybucję. Można zupełnie legalnie (nawet
trzeba) robić dowolną ilość kopii i przekazywać je innym. Siła Linuxa leży nie tylko
w samym systemie, ale przede wszystkim w ilości jego użytkowników oraz ich wspólnocie.
Ludzie chętnie wymieniają się informacjami, duży ruch panuje na listach dyskusyjnych,
a lokalne grupy organizują spotkania we własnych okręgach. Dzięki swojej filozofii
Linux zdobywa coraz więcej nowych zwolenników, co wiąże się także z powstawaniem
ogromnej ilości programów. Bez nich sam system nie mógłby istnieć. Więcej o samej
filozofii systemu można przeczytać na stronach:
http://www.linux.org.pl
http://www.jtz.org.pl
Otwartość Linuxa odstrasza niektórych producentów oprogramowania komercyjnego i dlatego
- w porównaniu z Windows - programów specjalistycznych (syntezatory mowy, czytniki
ekranu) jest mniej i są one funkcjonalnie uboższe; przynajmniej na razie.
Dostępne oprogramowanie
Główny serwis z odnośnikami do konkretnych programów przeznaczonych dla osób niewidomych
pracujących pod Linuxem to BLINUX (Blind Linux).
http://leb.net/blinux
Większość dostępnego oprogramowania pracuje w tekstowej konsoli Linuxa. Można to
przyrównać do środowiska MS-DOS, jednak bez jego ograniczeń - jako samego systemu
operacyjnego.
Emacspeak
Emacspeak, według określenia jego autora dr T.V Ramana z Uniwersytetu Cornell, jest
potężnym audiośrodowiskiem przeznaczonym dla osób niewidomych, pracujących w systemie
Unix. Sądzę, że to najbardziej zaawansowana aplikacja specjalistyczna, dostępna za
darmo. Emacspeak nie jest zwykłym czytnikiem ekranu. Analizuje on informacje, które
normalnie zostałyby w całości przekazane naszemu czytnikowi i wypowiada tylko to,
co w danym kontekście jest istotne. Pozwala poruszać się po informacji w sposób strukturalny,
zmieniając zupełnie dotychczasową filozofię pracy. Można go nazwać "gadającą aplikacją".
Emacspeak współpracuje z popularnymi (przynajmniej na Zachodzie) sprzętowymi syntezatorami
mowy: DECtalk Express, DECtalk Multivoice, DoubleTalk, LittleTalk.
Braille Lite, Apollo 2.
Istnieje jednak sporo wad tego systemu. Największa, to trudność nauczenia się obsługi
Emacspeaka. Skróty klawiszowe mogą być mało intuicyjne, zaś sama praca z programem
mocno odbiega od aplikacji windowsowych. Emacspeak w całości napisano po angielsku,
ale przetłumaczenie go na język polski nie będzie łatwe ze względu na wewnętrzną
budowę systemu. Emacspeak jest zestawem makr; swoistą nakładką na potężny edytor
Emacs. To przywiązuje nas do samego środowiska emacsowego i wymusza używanie tylko
tych programów, które także są związane z tym edytorem. Jest ich bardzo dużo i są
one różnorodne, jednak przywiązanie jedynie do programów wywoływanych z wewnątrz
Emacsa można traktować jako pewne ograniczenie. Więcej o Emacspeaku można przeczytać
na stronie:
http://emacspeak.sourceforge.net/
Warto także zajrzeć tutaj:
http://www.linux-doc.org/HOWTO/Emacspeak-HOWTO.html
Speakup
Speakup działa na zupełnie innej zasadzie, niż poprzednio opisywany Emacspeak. Jest
to czytnik ekranu (recenzent ekranu), wykorzystujący skróty (domyślnie klawiatura
numeryczna) do poruszania sie po tekście i odczytywania informacji na ekranie, np.:
KeyPad-8 - powiedz aktualną linię,
InsKeyPad-8 - czytaj od góry ekranu do kursora,
KeyPad-5 - powiedz aktualne słowo,
KeyPad-plus - przeczytaj cały ekran
oraz masę innych dodatkowych skrótów, oczywiście przedefiniowalnych.
Speakup charakteryzuje się tym, że działa jako element jądra Linuxa, co pozwala na
usłyszenie syntezatora już w czasie startu systemu, a nie dopiero po uruchomieniu
odpowiedniego oprogramowania. Do wad Speakupa należy zaliczyć to, że działa on tylko
z syntezatorami sprzętowymi, które - jak wiadomo - są drogie. Dodatkowo wymusza umiejętność
kompilacji jądra systemu, aby wnieść poprawki właśnie w postaci programu Speakup.
Dużą niedogodnością może być fakt, że Speakup nie odczytuje każdej linii, gdy poruszamy
się w edytorze w góre lub w dół, ale potrafi śledzić ruch kursora. My jedynie musimy
co chwilę wymuszać odczytywanie aktualnej linii jednym ze skrótów na klawiaturze
numerycznej.
Obsługiwane syntezatory to:
- DoubleTalk PC
- LiteTalk
- DoubleTalk LT
- Accent PC oraz SA
- Artic Transport
- SpeakOut
- Dectalk zewnętrzny i Express
- Audapter
- Braille 'N Speak
- Apollo2 (chyba jedyny, posiadający wsparcie dla języka polskiego)
Więcej o programie można przeczytać na stronie:
http://www.linux-speakup.org
Screader
Inny, zbliżony do Speakupa, czytnik ekranu to Screader. Obsługuje sprzętowe syntezatory
oraz syntezator Festival i ViaVoice (o nich poniżej). Screader to modyfikacja popularnego,
unixowego programu screen. Screader jest uruchamiany dopiero po wystartowaniu Linuxa
i po zalogowaniu się do niego, inaczej niż ma to miejsce w programie Speakup. Dostępny
jest na stronach autora
http://www.jlemmens.nl/eng-screader.html
Polacy nie gęsi...?
Niestety, większość podanych powyżej programów działa tylko w języku angielskim i
posiada dokumentację tylko w tym języku. Największy jednak problem polega na tym,
że jak na razie jedyny syntezator mówiący po polsku w Linuxie to sprzętowy Apollo
2 - bardzo drogi, o słabej jakości syntezy mowy w języku polskim.
Musimy więc eksperymentować z Linuxem, używając anglojęzycznego syntezatora i oczekiwać,
że w najbliższym czasie powstanie jakiś nowy produkt, który będzie mówił po polsku.
Czy tylko hardware?
Wspominałem cały czas o programach, współpracujących jedynie z syntezatorami sprzętowymi.
Istnieje jednak kilka rozwiązań programowych. Niestety, na razie żadne z nich nie
pozwala na udźwiękowienie Linuxa po polsku. Wydaje mi się, że warto wspomnieć o tych
projektach.
Festival
- darmowy system syntezy mowy powstały na Uniwersytecie w Cambridge. Nie ma oficjalnego
wsparcia dla języka polskiego.
http://www.cstr.ed.ac.uk
MBrola
- system powstały w Belgii, charakteryzujący się doskonałą jakością syntezy. Nie
ma także wsparcia dla języka polskiego. Próba stworzenia takiego modułu dla MBroli
na Uniwersytecie Warszawskim zakończyła się niepowodzeniem.
http://tcts.fpms.ac.be/synthesis/ mbrola.html
ViaVoice
- system syntezy mowy stworzony przez firmę IBM. Charakteryzuje się bardzo dobrą
jakością syntezy. Angielska wersja Linuxowa jest do pobrania ze stron IBM. Osoby
zainteresowane nauką Linuxa po angielsku powinny wybrać właśnie ViaVoice razem z
Emacspeakiem. Te dwa programy tworzą doskonały, w pełni darmowy tandem, pozwalający
na zbudowanie pełnowartościowej końcówki internetowej z szeregiem programów od razu
do wykorzystania, które udźwiękawia właśnie Emacspeak. Mankamentem ViaVoice jest
to, że wymaga on komputera klasy Pentium, najlepiej z 64 MB lub więcej pamięci RAM.
http://www.software.ibm.com/ speech/dev
Syntalk
- z firmy Neurosoft, popularny produkt w środowisku niewidomych pracujących w Windows.
Istnieje wersja beta tego produktu, działająca w Linuxie. Nie ma możliwości użycia
go ani z Emacspeakiem, ani Speakupem, ani żadnym innym programem.
http://www.neurosoft.pl
Spiker
- z firmy IVO, produkt w wersji beta. Na stronach twórcy obiecują wkrótce wersję
działającą w systemie Linux. Niestety, w czasie powstawania tego artykułu taka wersja
jeszcze nie istniała.
http://www.ivo.pl/ivo_spiker.html
Środowisko graficzne
Dobrym posunięciem firmy Microsoft było ujednolicenie interfejsu programowego (Microsoft
Speech API), co ułatwiło programistom tworzącym syntezatory mowy przystosowanie ich
do systemu Windows.
Dwa najpopularniejsze środowiska graficzne, pracujące w systemie Unix (KDE oraz GNOME)
także tworzą podobne API, aby ułatwić twórcom pisanie syntezatorów i ich integrację
z systemem. Mam nadzieję, że to pozwoli w najbliższym czasie udźwiękowić dynamicznie
rozwijające się projekty.
http://accessibility.kde.org/
http://developer.gnome.org/ projects/gap/
Lista dyskusyjna
Przed napisaniem artykułu założyłem listę dyskusyjną, przeznaczoną dla polskich niewidomych
użytkowników systemu Linux. Można zapisać się na nią wysyłając list na adres:
Blinuxpl-request@cogito.univ.gda.pl
z tematem subscribe, a zadać pytanie wysyłając list na adres:
blinuxpl@cogito.univ.gda.pl
Myślę, że poprzez dyskusję i pytania wyjaśni się dużo wątpliwości.
Czy jednak warto?
Mam nadzieję, że zasiałem ziarno wątpliwości i miłośnik komputerów, znudzony już
środowiskiem Windows, spróbuje poeksperymentować z Linuxem. Jeśli będzie większe
zainteresowanie, gotów jestem publikować cykl artykułów, skupiając się już konkretnie
na opisie instalacji poszczególnych rozwiązań.