Pál Zsolt (Pille software) (E-mail: pille@pille.hu)
CHIP XV. évf. 2. szám, 2003 február, 102-104. old.

Beszélőrendszerek látáskárosultaknak 

                    

Hangos szóval

Egyre gyakrabban találkozhatunk gépi hanggal a metróban, bankokban, gyárakban, telefonközpontokban, azaz olyan helyeken, ahol az automatizált beszéd munkaerőt takaríthat meg. Vannak azonban, akiknek ez a technika a teljes értékű élet kulcsát jelenti.

E rendszerek számos területen nyújtanak segítséget. Írásom témájául azért választottuk mégis a vakok általi felhasználásuk bemutatását, mert ez az a terület, mely a legszorosabban fűződik a számítógépekhez. Számtalan ilyen programot írtak már, melyek mindegyike tud valamit, de egyik sem tud mindent. A vakoknak nem csupán szövegfelolvasó rendszerre van szükségük (bár ez lenne a probléma veleje), hanem egy olyan szoftverre, amelynek segítségével a látókkal egyenrangúan tudnak kommunikálni a számítógéppel.

Az ismertetett szoftverek és hardverek leírása -- értelemszerűen -- nem teljes, csupán némi ízelítőt szeretnénk adni e témából. A rendszerek jellemzése talán kissé szubjektív, de remélem, ez megbocsátható.

Lassan már kétszáz éve, hogy először tettek kísérletet az emberi beszéd gépi generálására.  Kempelen Farkas beszélő gépe, amely ugyan eléggé artikulálatlanul, de mégiscsak képes volt emberi hangon kimondani bizonyos betűösszetételeket, szavakat és mondatokat, magyar találmány volt, de világviszonylatban is nagy előrelépést jelentett. Ez a szerkezet az emberi beszédtechnikát utánozva próbált hangokat kiadni. Ahhoz, hogy az ember beszélni tudjon, szüksége van hangszálaira, szájformálásra, és elsősorban levegőre. Kempelen Farkas ezt az utat próbálta követni gépe elkészítésekor, így a levegőt fújtatóval pumpálták, és különböző sípokat, lyukakat irányítottak a levegőáramlás felé. Ez a kezdetleges szerkezet volt -- bár nem tudott minden hangot kiadni -- a beszélőrendszerek őse.

Először a katonai repülésnél terjedtek el a beszélőrendszerek. Előfordul olykor, hogy a pilótáknak több órán keresztül fenn kell maradniuk a levegőben. Előbb-utóbb elfáradnak, s nem igazán tudnak minden műszert szemmel tartani. Egy-két baleset után ezért olyan beszélőrendszereket kezdtek el alkalmazni, amelyek hiba érzékelésekor hangjelzést adtak.

Beszélni nehéz

A hetvenes évek vége felé, amikor a számítógépek (Commodore) már Magyarországon is megjelentek, kezdtek el foglalkozni a "beszélők" köznapi felhasználásával is. Ekkortájt az elérendő cél elsősorban a számítógépes üzenetek kihangosítása volt a vakok számára. A Magyar Tudományos Akadémia munkatársai az 1980-as évek elejére készítették el MEA 8000 névre "hallgató" gépüket, amelynek alapelemei a mostani beszélőkben is megtalálhatók.

Különböző bankoknál, telefontársaságoknál is használnak beszélőrendszereket, amelyek azonban mégiscsak a vakok körében terjedtk el a legjobban.  Ide kapcsolódik egy teljesen magyar fejlesztés, mely a KFKI Mérés és Számítástechnikai Kutató Intézetben kifejezetten vakoknak készült a Home-Lab gépcsalád. A Home-Lab 5-ös verziója, melyet a vak felhasználók igen nagy örömmel vettek, egy (a fentebb említett MEA 8000-res chipre épülő) beszédszintetizátort tartalmazott.  A HomeLab (Home = otthoni, Lab = munka) gépek beszélős változatát BraiLab-nak keresztelték el. Ez utóbbi szóösszetétel eleje a vakok írását, a Braille-írást jelzi, mely domborúan megjelenített hat pont kombinációiból áll.

A Commodore gépekhez is készítettek beszélőrendszert, melyet a gépek párhuzamos portjára csatlakoztatva működtettek, de ez a fajta megoldás nem igazán terjedt el, ki tudja miért? A BraiLab kisgépek ideje már hanyatlóban volt, mikor kiadták a BraiLab Plus nevű rendszert.  Ez a gép már lemezes volt, és CP/M operációs rendszert használt.  A BraiLab Plus artikulálása és hangsúlyozása jobb volt, mint a kis gépeké, de még mindig bőven hagyott kívánnivalót.

Míg a kisebb gépek csak a pontot, a felkiáltójelet és a kérdőjelet ismerték hangsúlyt meghatározó karakterként, a Plus változat már a vesszőt is igen jól hangsúlyozta.  A nagy várakozás ellenére a BraiLab Plus készülékek nem terjedtek el szélesebb körben (csupán mintegy 60 darabot használtak belőle, néhányat a mai napig is - a szerk.). Ennek egyik oka a készülék akkoriban igen magas ára volt.

A BraiLabek beszélőjét a KFKI-ban fejlesztgették a MEA 8000-es minta alapján.  A Lukács testvérpár (Endre és József) aktív közreműködésével Vaspöri Teréz és Arató András fejlesztette ki ezeket a PCF processzorral ellátott gépeket (e cikk szerzője is ezzel a rendszerrel írta kéziratát).

     

Jól ki PC-zték!

Miután vakok is egyre nagyobb előszeretettel kezdték az akkor már Magyarországon nagy népszerűségnek örvendő IBM PC-kompatibilis gépeket használni, csakhamar ezekre is megjelent egy beszélőrendszer. E készülék igen egyszerű volt, egy program és egy kártya, melyet a gép egy szabad bővítő kártyahelyére kellett beépíteni.  Bár a rendszer hivatalos neve VOICE volt, a köztudatban mint "Szűcs-féle beszélő" rögzült az elnevezése.

Szűcs László segédlete képes volt kihangosítani a lenyomott billentyűket, és a BIOS-on keresztülmenő üzeneteket ki tudta mondani. A Szűcs-féle rendszer a KFKI MSZKI-s rendszer másolata volt, melyhez Aratóék utólag hozzájárultak.

Közben az MTA-ban is dolgoztak, és kifejlesztették a MultiVoxot. Ez a beszélőrendszer valahogy nem terjedt el a gyengén látók köreiben, mert nem volt hozzá olyan szoftver, amely "vakossá" tette volna, például billentyűzet-echo, képernyőolvasás stb.

Az ugyanis, hogy a gépben van egy beszélőegység, önmagában még nem biztosítja, hogy egy vak ember tudjon dolgozni vele. Olyan kidolgozott szoftverre is szükség van, amely szinte helyettesíti a képernyőt. A kezdetek kezdetén ezek még DOS-alapú rendszerek voltak, melyek a ROM-BIOS-on keresztül küldték az üzeneteket. Ezt igen egyszerű volt megoldani, hiszen csupán egy olyan rezidens programot kellett megírni, amely figyelte a bejövő szöveget, és azt a beszélőre is kiküldte.

Igen ám, de a technika fejlődésével megszaporodott a tapasztalatlan felhasználók aránya, és a grafikus kezelőfelülettel ellátott programok száma is. Majd jött a Windows, mely meghozta a kívánt egyszerű felületet, legalábbis a látók számára.  Egyszerű, hiszen a képernyőn egy "felhasználóbarát", grafikus ábrákkal teli kommunikációs eszköz segíti hozzá a felhasználókat az információk "könnyebb" eléréséhez.

Ami egyeseknek egyszerű(bb), az másoknak bonyolult(abb) is lett. A vak programozók világszerte szomorúan konstatálták, hogy ez ellen nem sokat lehet tenni.  Vagy talán mégis? Történtek kísérletek a Windows "beszéltetésére" is, például az IBM is megpróbált tenni valamit az ügyben.

Magyarországon a vakok körében leginkább Aratóék BraiLab-PC-je terjedt el (információink szerint mintegy 440 darab működik belőle, a számítógépet használó vakok 99 %-a ezt használja).  Ez egy több szoftverből álló programcsomagot, és egy, a nyomtatóportra köthető hardverelemet tartalmaz.  Mivel a legtöbb vak ezt használja, ez kapja a legtöbb kritikát is.

Annak idején, mikor még az MS-DOS 3.3 volt a sztár, és a programok nagy része is DOS-alapú volt, a többihez képest egész jó kis beszélőnek bizonyult.  Bár a számítástechnika általános haladásával együtt a BraiLab-PC is fejlődött, mégsem eléggé.  A rendszer azért mégiscsak tud valamit: a billentyű-echo mellett felolvassa a BIOS-on átment szövegeket, hangsúlyozza a pontot, a vesszőt, kettőspontot, pontosvesszőt, felkiáltójelet, kérdőjelet is.  Bizonyos mértékig a beszéd paraméterei is változtathatók: hangmagasság, sebesség, tagoltság, stb.  A rendszer hasznos szolgáltatása a kivételszótár használata.  Erre azért volt szükség, mert bár a beszélő magyar fejlesztés és magyar fonetikával beszél, de vannak bizonyos szavak, melyeket másképp írunk, mint ejtünk. Például: technika, Vörösmarty, Kossuth stb. A felhasználó egy 4 KB-os fájlba írhatja be a lecserélendő szavakat. Ezzel a gyakran használt angol szavakat is elfogadhatóbbá lehet tenni.

Mivel a rendszert magyar fonetikával látták el, az idegen szavakat inkább csak imitálni lehet vele: international=internesönel, computer=kompjúter, time=tájm...

A BraiLab szoftverének eddig három verziója jelent meg (kiadás előtt áll a 4. verzió). Készült hozzá egy billentyűzet-átdefiniáló program, és egy olvasóablakokat definiáló program is.  A rendszer azonban megzavarodik, ha menüs programot hívunk be, vagy olyat, amelyik nem a szokásos kurzort használja. Ennek az az oka, hogy csak azt tudja kimondani, ami a BIOS-on keresztülmegy. Egyes menüs programoknál segíthet az offline üzemmód, amely elvileg a képernyőről olvas, de a grafikus képernyőknél ez is felmondja a szolgálatot.

Offline üzemmódban különféle módon olvastatható fel a képernyő. Kijelölhetünk néhány olvasóablakot, így a felhasználó csak ezen a kereten belül mozoghat az olvasókurzorral.  Az offline módban felolvastatható az egész sor, egy adott sor, betűztethető az aktuális karakter... Hiányzik viszont egy fontos szolgáltatás, amely lehetővé tenné, hogy az egész olvasóablakot felolvassa.

Mivel a BraiLab a BIOS-t tünteti ki figyelmével, a billentyűzetmódosító és -kezelő programok nagy része nem használható vele, mert hiába definiálja át a program a billentyűzetet, a beszédszintetizátor csak a lenyomott billentyűt hajlandó kimondani, hiszen erre készült az átdefiniáló program.

A Brailab működtetése elvileg igen egyszerű, hiszen amit a COM4-re irányítunk, az megszólal a beszélőn. Például az MS-DOS-ban kiadható egy ilyen parancs:
      TYPE SZOVEG.TXT >COM4
hatására a rendszer felolvassa a SZOVEG.TXT állomány tartalmát, de maga a szöveg nem íródik ki a képernyőre. Néhány lelkes programozó megpróbált ezen információ segítségével -- kisebb-nagyobb sikerrel -- a BraiLabhoz programozni, és segédleteket írni.

Egy-két éve kezdett elterjedni egy fejlesztői környezet, amelynek segítségével a BraiLab már menüs programot is tud kezelni. A környezet lényegében arra épít, hogy a menüs programokat is billentyűvel kezelik (kivéve persze, ha egérrel), így figyeli a billentyűzetet, és adott kombinációra adott szöveget mond ki. E rendszer programozása nem igazán terjedt el.

Egy érdekes hardverkülönlegesség, hogy bár LPT (azaz printer) portra kell csatlakoztatni a BraiLab-ot, a szoftver mégis COM4-et (azaz soros portot) definiál. Érdekes, de egyben bosszantó dolog! Azt jelenti, hogy ha nyomtatni szeretnénk, azt nem tehetjük meg, hiszen az I/O-kártya printerportja már foglalt. E cikk szerzőjének csak úgy sikerült áthidalnia ezt a problémát, hogy szerzett és beépített a meglévő mellé egy önálló -- második -- párhuzamos portot, ami nem volt könnyű, hiszen erre ritkán van szükség, így nem is nagyon gyártják.

 

PC-Robot

Egy másik, immár kilenc évvel ezelőtti példa a látássérültek számítógéphasználatát megkönnyítő eszköz a PC-Robot, a Nikol Elektronikai GM fejlesztésében készült új rendszer. Ennek fő értéke nem a képernyőolvasás vagy a billentyűzet kihangosítása, hanem a hozzá adott fejlesztői környezet által nyújtott szolgáltatások.

Képernyőolvasásról voltaképpen nem is lehetne beszélni, hiszen csak text-to-speech-re, azaz elektronikus szövegek kimondására készítették fel. A Nikol Elektronikai GM a MEA 8000-es alapú beszélőhöz egy programozói felületet biztosított Pascal-ban, C-ben, és Assembly-ben. Pár hónappal később sikeres kísérletek folytak a vakos felhasználás területén. ESC szekvenciákkal a beszéd paramétereit is igen jól lehet állítani.

Professional Screen Reader

Még 94 őszén jelent meg az AID nevű program, mely a későbbiekben PSR-re "magyarosította" nevét, és direkt a PC-Robotra készült. Az AID program megoldotta az imént említett problémát, hiszen már nem a BIOS-tól, hanem a képernyőről veszi az infókat, és a menüs programokkal is megpróbál valamit kezdeni, sőt, kis gyakorlattal az egér használata is megoldható.

Világszerte képernyőolvasók százait készítik a vakok számára különböző számítógépes platformokra, különböző hardveregységekre, melyek között jók és rosszak egyaránt vannak. Sajnos azonban a vakok sehol sem bizonyulnak "jó üzletnek", hiszen drága külföldi hardvert-szoftvert behozni egy országba egyenlő az azonnali csőddel, így a vakok minden országban külön-külön képernyőolvasó programokat írtak. Többek között készült néhány Windows-alapú képernyőolvasó program is. Érdekesség, hogy a windowsos alkalmazást felolvasni képes magyar nyelvű programot történetesen cseh programozók készítették.