A Magyar Elektronikus Könyvtár szolgáltatásai látássérült felhasználók számára és az XML formátum szerepe

Tapolcai Ágnes

Országos Széchényi Könyvtár

Magyar Elektronikus Könyvtár Osztály

 

Kojnok Krisztina

Empolis Magyarország Kft.

Összefoglalás

A Magyar Elektronikus Könyvtár (MEK) átgondolva látássérült olvasóinak helyzetét új, összetett felületén kívül

egyszerűbb belépési oldalt, letöltésre pedig egyszerű text formátumot kínál, valamint online felolvasási lehetőséget az erre alkalmas dokumentumokra.

 

Az online felolvasás és a text formátum kiinduló pontja egyaránt az XML formátum. Tekintve, hogy ezek elkészítése nagy munka, igyekeztünk minél szabványosabb formában, a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már gépi konverzióval kinyerhető legyen az e-book vagy más, időközben

felmerülő igény.

Előzmények

 

A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók számára kedvezőtlen irányba fordult a grafikus felületek térhódításával. Az eredetileg karakteres programokra kidolgozott felolvasó (text to speech) programok segítségével a bonyolult képeket tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb technológiákra, de, a látássérült olvasók nagy számára való tekintettel, egyidejűleg vakos használatra optimalizált belépési pontot is kíván nyújtani. Ezt a célt szolgálja a https://vmek.oszk.hu internet címen nyíló oldal, az online felolvasás lehetősége, valamint a text formá­tumban is feltöltött szövegek. Az így kialakított oldal egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a grafikus elemek kis száma miatt.

 

A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas HTML oldalak, pdf fájlok, valamint a jövőben várható (esetleg váratlan) igények, mint pl. az e-book.

 

 

Az XML (eXtensible Markup Language) 1998 óta W3C ajánlás. Az XML az ISO szabvány SGML (Standard Generalized Markup Language) leszűkítése. Az SGML-ben formális nyelvtan hozható létre egy-egy speciális nyelv leírására. Használata, definíciója azonban igen bonyolult, ezért csak a nagy szervezetek tudják kihasználni az előnyeit. Óriási figyelmet kapott ez a technológia, amikor a World Wide Web elterjedt, mert a HTML nyelv az SGML egyik alkalmazása.

A HTML korlátainak felismerése tette szükségessé az XML kidolgozását, amely az SGML-hez hasonlóan nyelvek leírására alkalmas, de megszabadították az SGML legnehézkesebb, nehezen feldolgozható elemeitől.

Az XML alkalmas strukturált dokumentumok, vagy más adatok leírására, validitási (érvényességi) kritériumok ellenőrzésére. Szabványos, cég- és platformfüggetlen leírónyelv, mely az információ tartalmi struktúrájára koncentrál. Ez teszi oly népszerűvé mind a tartalomkezelésben, mind kommunikációs adatformátumként.

Az XML fontos tulajdonsága, hogy az információ megjelenítéséről nem rendelkezik. Ezt a hozzá kapcsolódó szabványos XML szintakszisú formázónyelvek oldják meg, így a tartalom és a forma tökéletesen elválik egymástól.

 

A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra a TEI (Text Encoding Initiative, http://www.tei-c.org) ajánlásai alapján készíttetett a MEK minden dokumentumtípusra kiterjedő DTD-t (documentum type definition), amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is felhasználható lesz, ezért elhelyeztük a MEK szerverén. A DTD szabja meg a logikai jelölők neveit és struktúráját, ez az egységesítés kulcsa.

 

A DTD-t az Empolis Magyarország készítette,  az IHM-ITEM  pályázat keretében.

 

A vakok és gyengénlátók internethasználata

 

A látássérültek többsége beszélő rendszerrel használja az  Intermetet (kivételesen braille kijelzővel) Általában karakteres böngészőket használnak DOS és Linux alapon, főként a Kaliforniai Egyetemen kifejlesztett Lynx programot, melyet több platformra is adaptáltak.

 

Windows-t is használnak ma már, de DOS vagy Linux alól könnyebb dolgozni. A „Jaws for Windows”-zal az angol nyelvű honlapokat lehet olvastatni és ehhez hozzákapcsolható a ma már szabadon terjeszthető magyar nyelvű Multivox felolvasó. A windows-os használat jóval költségesebb programokat igényel, azonban bizonyos típusú látásproblémáknál előnyös, és mindenképpen több információval szolgál.

 

Tehát a vakok számára is olvasható Web oldal karakteres és grafikus böngészővel egyaránt értelmes.

Egy rövidített lista arról, milyen legyen az ideális Web hely a WAI (Web Access Initiative) szerint:

1. Az input és output eszközök minél szélesebb skáláját támogassa. Például egér helyett billentyűzet, hang használata, outputként karakteres böngésző, esetleg braille író.

2. Ha olyan tartalom van a lapon, aminek megjelenítéséhez fejlettebb eszközök kellenek, alternatív információ elhelyezése ajánlott, pl. kép helyett szöveges leírás.

3. Biztosítsa, hogy ki lehessen kapcsolni a képek, hangfájlok automatikus letöltődését, ami megakadályozná, hogy az alapinformációhoz hozzáférjenek azok, akik egyszerűbb böngészővel rendelkeznek.

4. A szolgáltatás formája a felhasználó által variálható legyen. Például a színt, betűméretet, szintetizált beszéd esetén sebességet, hangmagasságot állítani lehessen az eredeti beállítások felülbírálásával.

5. Általában a felhasználói felület viselkedése minél inkább állítható legyen a felhasználói oldalon.

6. Legyenek olyan felületek benne, melyekhez kapcsolhatók a kisegítő programok, tudjon ezekkel együttműködni, pl. beszéd szintetizátor.

7. Kövesse a kezelő felületekről kialakult konvenciókat, pl. a menük, billentyűkombinációk tekintetében, megkönnyítve így a kezelést.

9. Kínáljon a tartalomhoz többféle módon is hozzáférést, pl. böngészéssel, kereséssel, többféle struktúra szerinti elhelyezéssel.

10. Adjon visszajelzést, hol áll éppen a felhasználó navigálás közben.

11. Legyen a felületről leírás és súgó.

 

A vakok és csökkentlátók számára használható oldalak ajánlott tulajdonságairól a részletes leírást éppen fordítja a MEK Osztály és a magyar változat  hamarosan felkerül a MEK-be.

 

Az elkészült Web hely  sajátosságai

 

Az oldalak a következő fő tulajdonságokkal rendelkeznek (1. ábra):

1. A képeket minimalizáltuk;

2. A szövegméret  változtatható;

3. Az információ egymás alatti sorokban jelenik meg, még ott is, ahol látszólag táblázat van;

4. Feltördeltük az oldalt kisebb HTML lapokra, ami kiváltja az űrlapos keresés egy részét;

5. Bizonyos részleteket kihagytunk a könnyebb áttekinthetőség végett;

6. Használtuk az ún. accesskey jelenséget, ami alt+betűvel meghatározott helyre ugrik;

7. Minden listát átszerkesztettünk úgy, hogy a lényeges információ legyen elől, tekintve, hogy a sor felolvasását abba lehet hagyatni, de csak a sor elején lehet kezdeni.

 

Ahol lehetett, letöltésre szánt text formátumot is készítettünk, mivel a mostani felolvasó rendszerekkel ez a legkönnyebben hozzáférhető. Egyszerűsége ellenére ez a szöveg is struktúrált, mégpedig a vakok igényei szerint: A sorok 75 karakteresre tördeltek, a bekezdések között soremelés van, hogy különbözzön az egyszerű sorvégtől, a fejezetek vagy egyéb dokumentumrészek között határolókat helyeztünk el, nevezetesen a fejezetcím és egyben a fejezet elején ***-t, a fejezetcím végét pedig +++ jelzi.

 

Online felolvasást integráltunk bele, amely felismeri és kezeli a szöveg logikai egységeit, főleg ott, ahol XML formátumból indulhat ki. Az így feldolgozott szövegben navigálni lehet, ami majdnem olyan, mintha lapozgatnánk egy könyvben.

 

Az igények igen különbözőek a segédprogramok sokfélesége és az olvasók különböző fizikai problémái miatt. Ezért a végleges kialakítást a vak illetve gyengénlátó felhasználókkal történő folyamatos egyeztetés keretében, levelezőlistán tárgyaltuk.

 

Az XML alkalmazásának céljai a MEK-ben

 

A MEK-ben a következő célok, igények fogalmazódtak meg:

 

1. A teljes szöveg keresésnél struktúráltabb keresés lehetővé tétele a művekben. (pl. címben, szövegtestben); a struktúrált XML dokumentum teszi lehetővé.

 

2. Azonos struktúrájú XML dokumentumokat létrehozása, ahol az egyes tartalmi elemek értelmezése és jelölése egységes; ezt a DTD biztosítja.

 

3. Internetes publikáció különböző formátumokban. E-book publikáció. A publikáláshoz  RFT, HTML, PDF, LIT, TXT formátum; XSL/XSLT stíluslapok segítségével.

 

4. Profivox felolvasó rendszer számára text vagy XML formátum biztosítása; szintén a struktúrált XML dokumentum teszi lehetővé.

 

Az XML szerkezetét meghatározó DTD

 

A DTD-t szépirodalmi művek és különböző témájú folyóiratok digitalizálásra fejlesztettük. A DTD céljaként a próza, vers és dráma típusú művek szerkezetének leírását és a MEK által meghatározott tartalmi elemek megjelölésére alkalmas elemek meghatározását tűztük ki.

           

A dokumentum-szerkezet felépítését és a jelölő elemek használatát a „Guidelines for Electronic Text Encoding and Interchange”  szerint határozzuk meg.

 

Dokumentum egység fogalma

 

Szépirodalmi műveknél a legnagyobb egység a digitalizálás alapjául szolgáló kiadvány, a kötet. Így egy egységnek tekintjük a kötetben található művet, és gyűjtemény esetén a kötetben szereplő összes művet is. Egy kötet tartalmazhat azonos műfajú műveket (pl. novellás kötet), és különböző műfajúakat is (pl. antológia). Egy műben előfordulhatnak különböző műfajhoz tartozó szövegrészek (pl. egy regényben versidézetek).

Szemantikus elemek meghatározása

 

A DTD testreszabásának előkészítéseként kiválasztottuk azokat a szemantikus elemeket, amelyeket az XML dokumentumban meg kell különböztetni. Mind a négy típust (próza, vers, dráma, folyóirat) megvizsgáltuk. A szematikus elemeket két nagy csoportra, struktúra elemekre és tartalmi elemekre bontjuk. A struktúra elemek határozzák meg a digitálizált művek szerkezetét, a tartalmi elemek pedig a mű meghatározott részeit jelölik. A DTD kialakításakor minden szemantikus elemet egy TEI által definiált elemnek feleltettünk meg. Ezekből az elemekből épül fel a MEK DTD-je; 52 szemantikus elem és 78 TEI elem került be a DTD-be.

 

Végül öt részből álló TEI alapú DTD készült. Mind a négy fő dokumentumtípushoz (próza, vers, dráma, folyóiratcikk) egy-egy önállóan használható DTD rendelhető és létezik egy "mixed" típusú is, amelyben minden elem szerepel. A mixed típusú DTD-t lehet a különböző dokumentum­típusokat tartalmazó művek, pl. antológiák digitalizálásához használni.

 

Példa egy vers XML feldolgozására és HTML megjelenésére. (2. ábra)

 

Az XML feldolgozás célja tehát az, hogy a tárolás XML formátumban történjen, így a tartalom újra felhasználható sokféle, előre nem látható célra is.


 

 

Ábrák:

 

 

 

1. ábra

A nyitólap

 

 

-------------------------------------------------------------------------------------------------

<?xml version="1.0" encoding="ISO-8859-2"?>

<!DOCTYPE TEI.2 SYSTEM "C:\dtd\dtd\verse\TEI-MEK-verse.DTD">

<?xml-stylesheet type="text/xsl" href="C:\mek\xsl\vers2_html.xslt"?>

<TEI.2 id="MEK-00455">

      <text type="poem">

            <body>

                  <div>

                        <head>

                             <title>WORDSWORTH, William </title>

                        </head>

                        <div>

                             <head>

                                   <title>A SZIVÁRVÁNY</title>

                             </head>

                             <lg type="verse">                       

                                   <l>   Ha fenn a szivárvány ragyog,</l>

                                   <l>   megdobban a szivem:</l>

                                   <l>így volt, hogy kezdtem éltemet,</l>

                                   <l>így van most, hogy év évre megy,</l>

                                   <l>így legyen mindig, s meghalok</l>

                                   <l>   inkább, ha nem!</l>

                                   <l>A férfi apja a gyerek;</l>

                                   <l>hadd fűzze hát napjaimat</l>

                                   <l>egymáshoz a természet-áhitat.</l>

                                   <closer>KÁLNOKY LÁSZLÓ </closer>

                             </lg>

                        </div>

                  </body>

            </text>

</TEI.2>

 

2./a ábra Vers XML formában

 

 

 

2./b ábra Vers HTML-ként