Könyv, Könyvtár, Könyvtáros | 2016/3. szám | 2016-04
http://ki.oszk.hu/3k/category/25-evfolyam/2016-3/


Digitális megőrzés
Tizenötezer dokumentum a Magyar Elektronikus Könyvtárban

Az interjút készítette: Fuchszné Benák Katalin


A Magyar Elektronikus Könyvtár 1994-ben Drótos László és Moldován István kezdeményezésére jött létre és 1999 óta az Országos Széchényi Könyvtárban működik. Drótos Lászlóval, a MEK könyvtárosával beszélgetünk, akihez a digitális könyvek előkészítése, ellenőrzése, valamint a tájékoztatás és a rendszerfejlesztés tartozik. Munkájuk elismeréseként 2008-ban a társalapítóval, Moldován István osztályvezetővel megkapták az eFestivál életműdíját.

Ma már naponta ötvenezer látogatás körül van a MEK forgalma. Az eddig feltöltött dokumentumok száma pedig elérte a tizenötezret.- Mi volt az a fordulópont, amikor elhatározták, hogy életre hívják a MEK-et?

Az ötlet még 1993-ban merült fel, nem sokkal az internet magyarországi megjelenését követően. Az első egyeztetések és kísérleti gyűjtemények után 1994. november 1-én jelent meg a Magyar Elektronikus Könyvtárra vonatkozó Ajánlás, ami egyfajta alapítólevélnek tekinthető. Az internet akkoriban még nagyon szövegalapú volt, a képeket is tartalmazó weboldalak épp csak kezdtek feltünedezni, sőt még az ékezetes betűk továbbítása is komoly technikai problémát jelentett. A magyar felhasználók pedig - kis túlzással - mind ismerték egymást, annyira szűk kör fért még hozzá a nethez. De néhány kollégával ráéreztünk arra, hogy ez a technológia alapvető változást hoz majd, sok minden mellett, a könyvtárosságban is. Az egyszerű szöveges gopher, majd az azt követő grafikus web publikációs eszközök, vagyis a hálózat már nem csupán kommunikációra és adatbázisokban való keresésre alkalmas, hanem a tudás és a kultúra terjesztésére is. Ez vezetett az elektronikus könyvtár gondolatához: a digitális formában megjelenő tudást és kultúrát gyűjteni, rendszerezni és megőrizni kell, ami tipikus könyvtárosi feladat. Nemcsak a könyvtárak cédulakatalógusait szükséges hozzáférhetővé tenni adatbázisok formájában, nemcsak a gyűjteményüket kell digitalizálni, hanem az internet virtuális világába beépülő, azt szolgáló virtuális könyvtárakra is szükség van. A MEK első webes és 3D-s felülete - akárcsak a lovashintókat utánzó első automobilok - egy valódi könyvtárra hajazott: tájékoztató pulttal, olvasó- és kiállítóteremmel, katalógussal, faliújsággal, sőt még ruhatár is volt! ☺

Az évek során szerencsére sokan beszálltak a könyvtár építésébe, a gyűjtemény és a szolgáltatás fejlesztésébe. Rengeteg önkéntes személy, de intézmények is. Az első években az Információs Infrastruktúra Fejlesztési Program jelentette a szervezeti és műszaki hátteret, majd 1999-ben megalakult egy közhasznú egyesület is, és még ugyanebben az évben egy önálló MEK Osztály jött létre az Országos Széchényi Könyvtárban, ahol máig a legjobb helyen van ez a legrégibb és legnépszerűbb magyar online könyvtári szolgáltatás. A jelenleg "E-könyvtári Szolgáltatások" nevű osztály a könyvjellegű dokumentumokat gyűjtő MEK (mek.oszk.hu) mellett most már több más részgyűjteményt is gondoz, köztük az időszaki kiadványokkal, folyóiratokkal foglalkozó Elektronikus Periodika Archívum és Adatbázist (epa.oszk.hu) és a képekre szakosodott Digitális Képarchívumot (dka.oszk.hu).- A napokban töltik föl a Magyar Elektronikus Könyvtárba a 15000. művet. Ez mérföldkő is lehet. Milyen gondolatok fogalmazódnak meg ennek kapcsán?

Az első - kicsit ijesztő - gondolat, hogy ez a 15 ezer dokumentum mind átment a kezem alatt, vagyis inkább a billentyűzetem és az egerem alatt, mert minden tételt ellenőrzök feltöltés előtt. Számos digitális könyvnek külön kis története van: szerencsés véletlen, vagy hosszadalmas levelezés, vagy éppen rengeteg munka kellett ahhoz, hogy a MEK-be kerülhessen. Kollégáimmal ugyanis elég sok hozzáadott értéket is teszünk a legtöbb dokumentumhoz, és itt nemcsak a műveket leíró ú.n. metaadatokra gondolok, hanem szükség esetén javítjuk is a hibás vagy hiányos dokumentumokat, alternatív formátumokra konvertáljuk őket, sőt néha digitalizáltatunk is fontos, keresett műveket.

A kezdetektől eltelt több mint 20 évre visszagondolva az is eszembe jutott, hogy mennyi mindent kellett megtanulnunk közben, milyen sokféle számítástechnikai problémával és új technológiával találkoztunk, amelyeket csak folyamatos önképzéssel lehet megoldani, illetve kiismerni. Mi valóban "tanulva csináljuk" a MEK-et a kezdetek óta. Elsőnek lenni valamiben előny és hátrány is: könnyebb volt ismertséget szerezni és elérni, hogy az emberek hozzánk kössék az elektronikus könyvtár és könyv fogalmát, de ugyanakkor sok mindent nekünk kellett először kitalálni és megvalósítani. Törekszünk is arra, hogy tanfolyamok, előadások formájában továbbadjuk a bevált jó gyakorlatainkat - a téves döntéseinkből levont tanulságokkal együtt - másoknak is, hogy nekik már ne kelljen végigjárni ugyanezt az utat.- Ön szerint arányait tekintve sok ez a 15 ezer digitális kötet a Magyar Elektronikus Könyvtárban, vagy lehetne több is?

Én elsődlegesen, ahogy utaltam is rá az előbb, egyfajta kísérleti műhelynek tekintem a MEK-EPA-DKA hármast, ahol "élőben", valódi gyűjteményekkel és valós felhasználókkal lehet kipróbálni és részletekbe menően tesztelni az új szoftverek, szolgáltatások, digitális eszközök, szabványok stb. könyvtári alkalmazhatóságát. Ilyen szempontból nem az állomány nagysága és gyarapodási üteme az érdekes, hanem inkább a sokfélesége, hogy minél több problémával és lehetőséggel találkozzunk. Ugyanakkor, bár a MEK gyűjteményének mérete elenyésző még egy városi könyvtáréhoz képest is és a copyright miatt a kurrens sikerkönyveket nem szolgáltathatjuk, a havi látogatásszám még mindig meghaladja az 1 milliót. Ez azt jelzi, hogy a szaporodó e-könyvesboltok, self publishing platformok, webkettes fájlmegosztók, más e-könyvtárak és repozitóriumok ellenére milyen sokan ismerik és szeretik a MEK-et, internetes skálával mérve hosszú fennállása és stabilitása miatt mennyire beépült az oktatásba és a tudományos életbe is. Ezt mutatja egyébként az is, hogy egyre több szerző és kiadó ajánlja fel a könyveit és alig várják, hogy megjelenjenek a MEK-ben.

Úgyhogy igyekszünk lépést tartani az igényekkel, amennyire a feldolgozói kapacitásunk engedi, nem lemondva a már szintén említett hozzáadott értékekről, mert ezekkel tudunk többet nyújtani, mint más források. Fontosnak tartom azt is, hogy legyen együttműködés és munkamegosztás a magyar digitális dokumentumgyűjtemények között - beleértve a határon túliakat is -, mert így nem kell mindenkinek mindennel foglalkozni (a MEK szépirodalomban erős, de például sok a könyvtár- és könyvtörténeti munka is benne). Ugyanakkor a szabványos metaadatokkal megoldható lenne egy országos közös kereső (aggregátor) működtetése, ahol a felhasználók egy helyen megtalálnak mindent. Ilyen integrálási törekvések vannak is most az OSZK-ban, első lépésként a saját digitális gyűjtemények együttes kereshetővé tétele a cél.- Egyre több digitalizált és online tartalom jön létre. A kiadók és szerzők kevésbé tudják fölvállalni e tartalmak megőrzését. A MEK szerepe egyre jobban felértékelődik a digitális megőrzés területén végzett tevékenységének köszönhetően. Milyen szervezési és technológiai újítást jelent ez a rendszer fejlesztőinek?

Nemcsak a MEK fontossága nő a digitális tartalom szaporodásával, hanem a nemzeti könyvtáré is, amelynek meg kell oldania ennek a begyűjtését és hosszú távú megőrzését. A MEK csak egy része annak a gyorsan gyarapodó gyűjteménynek, melybe beletartoznak még az OSZK egyes szervezeti egységeiben digitalizált dokumentumok, a más intézményektől átvett digitális anyagok, a kiadók által kötelespéldányként beszolgáltatott e-könyvek is. Mindezek nagy tömegű, hatékony kezelésére jelentős fejlesztések indultak el az OSZK-ban.

Én és a közvetlen kollégáim csak a nyilvánosan szolgáltatható dokumentumokkal foglalkozunk és azok közül sem minden típussal. A növekvő igényt jobb szervezéssel próbáljuk menedzselni: a munkafolyamatot lebontottuk részfeladatokra és mindenki csak néhány ilyen részmunkát csinál, de azt hatékonyan. Szükség esetén persze helyettesíteni is tudjuk egymást. Nagy segítség, hogy a MEK Egyesület keretén belül önkéntesek, vagy - a szponzori támogatásoknak köszönhetően - fizetett külső bedolgozók végeznek el bizonyos munkákat, például az e-könyvek konvertálását, a digitalizált szövegekben előforduló felismerési hibák javítását, a képek metaadatolását, vagy a hangoskönyvek készítésének koordinálását. Erre a fajta civil támogatásra a jövőben is számítunk, mert a feladat nagysága folyamatosan nő.

Egy további lehetőség a más gyűjteményekkel munkamegosztás és integrálódás, amire már utaltam. Ehhez - többek között - szabványos és jó minőségű metaadatok kellenek, úgyhogy mostanában leginkább ezekkel foglalkozunk. Például elkezdtünk névtereket használni a személy- és földrajzi nevek esetében. Az egységes és beazonosítható nevek megteremtik a lehetőségét a szemantikus webnek, vagyis az egymással automatikusan összekapcsolható szolgáltatásoknak. Ugyancsak az idei év újdonsága a MATARKA (matarka.hu) és az EPA további közelítése egymáshoz. A folyóiratok tartalomjegyzékeit szolgáltató miskolci adatbázis és az OSZK periodika archívuma között már régóta jó az együttműködés, de pl. az új fejlesztéseknek köszönhetően ezentúl az EPA látogatói már közvetlenül tudnak keresni a MATARKA cikkadatai között, a MATARKA felhasználók pedig az EPA-ban archivált kiadványok teljes szövegében.- Az exportált metaadatok segítségével a MEK digitális könyvei az olyan nagy országos és nemzetközi adatbázisokban is megtalálhatók, mint a MOKKA (mokka.hu), a tavaly indult ELDORADO (eldorado.oszk.hu), vagy az Europaena (europeana.eu). Ez milyen kihívásokat és lehetőségeket rejt a szakemberek és olvasók számára?

Ezek is jó példák az integrációra. Technikailag és könyvtárszakmailag elég sok probléma fel szokott merülni, amikor különböző forrásokból származó bibliográfiai adatokat kell egyesíteni. Ezeken igyekszünk javítani mi is és a közös rendszereket működtető szakemberek is, de bizonyos szintű kompromisszumok ilyenkor elkerülhetetlenek.

Az olvasóknak - különösen a "Google-nemzedéknek" - kétségtelenül nagy könnyebbség, ha egy helyen tudnak igen nagy, sok forrásból származó adathalmazban keresni, bár az elég vegyes találati listából a releváns tételek kiválogatása lehet, hogy elviszi az így megspórolt időt. Nekem az a tapasztalatom, hogy a felhasználói igények igen sokfélék, így ezeket egyetlen "egyablakos" megoldással szinte lehetetlen kielégíteni (vagy rengeteget kell dolgozni rajta, ahogy a Google teszi). Úgyhogy én az alternatív felületek és formátumok híve vagyok, amelyekkel jobban lefedhető a sokféle igény. Ezért van a MEK-nek a fő honlapja mellett egy egyszerű, a látássérültek által is jól használható (vmek.oszk.hu) és egy telefonokra ill. e-könyvolvasókra optimalizált (m.mek.oszk.hu) változata is, készültek mobil alkalmazások is hozzá, van többféle letöltési lehetőség, a fontosabb könyveknél általában néhány alternatív formátum, a katalógusadatok átvételének köszönhetően pedig egyre több külső rendszerből rá lehet találni a könyvekre a MEK saját - szintén többféle keresőjének - használata nélkül is.- "Mivel a digitális világ nagyon komplex, tünékeny és sokszereplős terület, a tartalmak előállítói és szolgáltatói, az informatikai és internetes vállalkozások, a közgyűjtemények és más kulturális, tudományos szervezetek, valamint a jogalkotók összehangolt munkájára lenne szükség ahhoz, hogy a 20. század vége és a 21. század eleje ne egy újabb sötét középkor legyen az emberiség történetében, amelyből alig maradnak fenn írásos és egyéb típusú digitális dokumentumok." - írta egy cikkben.* Mi jelenthetné a megoldást?

Ha az "őrizzünk meg minden megjelent művet" elvet szeretnénk megvalósítani - ami persze az alexandriai könyvtár óta csak illúzió -, akkor képletesen szólva: az a hajó már elment, de mentőcsónakokat még indíthatunk. Amíg a publikálás egy láncolaton keresztül zajlott: szerző => kiadó => nyomda => kereskedő, addig ennek a csatornának a korlátozott kapacitása miatt a könyvtáraknak volt rá esélyük, hogy a gyűjtőkörükbe tartozó - nemzeti könyvtár esetében pedig a nemzeti bibliográfia részét képező - publikációkból ha nem is teljes, de jelentős állományt hozzanak létre. Ma már, a láncolaton kívüli elektronikus publikálást és digitális tartalomelőállítást is számításba véve, reménytelen még csak egy reprezentatívnak mondható gyűjteményt is felépíteni és fenntartani. A MEK-EPA-DKA esetében alkalmazott egyedi archiválás és katalogizálás eredménye csak csepp a tengerben, és a kötelespéldány törvény kiterjesztése az elektronikus publikációkra sem tudja biztosítani azt, hogy valóban bekerüljön minden fontos kiadvány a nemzeti könyvtárba. Nem beszélve az olyan, hagyományosan nem könyvtári műfajokról, mint a Youtube videók, a Twitter üzenetek, a Facebook bejegyzések, a Wikipédia szócikkek, a blogok, a hírportálok, az intézményi és magánhonlapok, és még hosszan sorolhatnám, amik közül legalább a fontosabbakat mégiscsak meg kellene valahogy őrizni az utókornak.

A jó hír, hogy az a digitális technológia, amely miatt "láncait vesztette" a publikálás, sokat tud segíteni az elszabadult tartalom begyűjtésében és megőrzésében is. Vannak jó példák az internet tömeges archiválására szerte a világban, a legismertebb közülük az Internet Archive (archive.org), mely weblapok százmillárdjait, digitális könyvek, videók, képek és hangfelvételek millióit, szoftverek tízezreit gyűjtötte be és szolgáltatja. Vagy a szintén amerikai Library of Congress, ami a hatalmas weblap-gyűjteménye mellett napi fél milliárd Twitter üzenetet is archivál. Sajnos nálunk még nem sok történt e téren, a Magyar Internet Archívum, melyre 2006-ban javaslatot tettem, máig csak terv formájában létezik. Első lépésben legalább azokat a folyóiratokat, újságokat, híroldalakat és egyéb időszaki kiadványokat jó lenne egy szoftverrel letölteni és eltenni valahová, amelyeket az EPA csak nyilvántart, de nincs módja az egyedi archiválásukra.

A digitális világ megőrzése nemcsak egy kibővített gyűjtőköri feladat a könyvtáraknak, a mérete és változékonysága miatt paradigmaváltást is igényel. Például sok esetben le kell mondani a dokumentumpéldányok egyenkénti nyilvántartásáról és leírásáról, továbbá érdemes bevonni magukat a felhasználókat is a nagy tömegű rutinmunkákba, és elkerülhetetlen a tartalomszolgáltatókkal, az informatikai cégekkel való szoros együttműködés a magas költségek, a műszaki infrastruktúra és a szakemberigény megosztása érdekében. Van ugyanis egy rossz hír is: ha be is kerül egy digitális dokumentum egy könyvtárba, az könnyen lehet, hogy a technológiai elavulás miatt néhány év vagy évtized múlva használhatatlan lesz, mert nem lesz mivel megjeleníteni. Ezért a digitális objektumok állandó gondozást, munkát igényelnek: hozzá kell igazítani őket a mindenkori számítástechnikai körülményekhez és felhasználói igényekhez.

Az idézett cikkben ezt is írtam: "a könyv(szerű dolgok) és a könyvtár(szerű intézmények) még sokáig velünk maradnak, mert olyan rendszerezett hozzáférést nyújtanak az emberi gondolatokhoz, amire mindig lesz igény". Ezt annyival egészíteném ki, hogy valószínűleg a jövő könyveire és könyvtáraira a mai ember éppúgy nem ismer majd rá, mint az ókori agyagtábla-könyvtárak használója a jelenlegiekre. És ehhez nem kell újra több ezer évnek eltelnie, mert a jövő egyre gyorsabban válik jelenné.- Befejezésül még egy kérdés: Min dolgoznak éppen? Van-e valami érdekesség, ami már megosztható az interjú olvasóival?

Hogy keretes legyen ez a beszélgetés, egy olyan sztorit mesélnék el, amely visszakanyarodik a magyar internet kezdeteihez. Néhány napja otthon, portörlés közben kezembe akadt a sokáig a legismertebb magyar nyelvű online fórum, a Hollosi Information Exchange 1998-ban kiadott CD-je, amin a levélarchívumok mellett megtalálhatók az első hazai hírportál, az iNteRNeTTo heti hírlevelének 1996 január és 1998 február között megjelent - pontosabban e-mailben terjesztett - számai. Ugyan a gépem DVD-olvasója már csak akadozva, hangos zúgással volt képes beolvasni ezt az "ősrégi" lemezt, de végül sikerült másolatot készíteni róla. A hírlevél, amelynek első részei még ékezetek nélkül íródtak, rengeteg érdekes információt tartalmaz az akkoriban szövődő World-Wide Webről, a nemzetközi és a hazai hálózatos világról (pl. a MEK-ről is). Pár nappal később pedig a már emlegetett archive.org oldalon kutakodva egy 1999-es interjúra találtam, melyben Vida Andit, szegedi kollégánkat arról kérdezték, hogy milyen az élet nőként és könyvtárosként az interneten? (Úgy látszik, ez még különlegesnek számított akkoriban.) A riport az Internet Kalauzban jelent meg, és néhány kattintás után kiderült, hogy 1996-tól kezdve 87 beszkennelt szám van meg az Internet Archive szerverén ebből a nyomtatott magazinból, mely elsősorban a hálózat és a web érdekességeivel foglalkozott látványos, szórakoztató és ismertterjesztő formában.

Mindkét kiadvány esetében lázas levelezésbe kezdtünk, hogy megtaláljuk az illetékeseket, akiktől engedélyt kérhetünk az EPA-ban való szolgáltatáshoz. Szerencsére mindenki nagyon segítőkész volt, megkaptuk a hozzájárulásokat, sőt a hírlevél esetében a CD-ről hiányzó négy számból hármat pótolni is tudunk, mert a főszerkesztő még megtalálta őket a régi levelezésében. Most dolgozunk a szolgáltatható változaton, és utána a magyar internet sajtótörténetének e két mozaikdarabja mindenki számára hozzáférhető lesz a periodika archívumban.

Ez az eset egyaránt jó példa a digitális megőrzés fontosságára, de arra is, hogy a véletleneknek milyen szerepe van abban, hogy mi marad meg az utókor számára.

A MEK gopher felülete 1995-bőlEgy háromdimenziós változat 1999-bőlA 2003-ban készült jelenlegi honlapMobil eszközökhöz optimalizált, 2011-2012-ben fejlesztett felületJEGYZET


* A könyvszerű dolgok sokáig velünk maradnak. In: DIBIZ digitális magazin, 1. évf. 2. sz. https://mek.oszk.hu/html/irattar/sajto/2015/150708.htm