Útijelentés

Pozsony, 2008. november 6.


Univerzitná Knižnica v Bratislave
Pozsonyi Egyetemi Könyvtár
http://www.ulib.sk

 

November 6-án a Pozsonyi Egyetemi Könyvtárban egy "Digitisation & Indexing" című workshopra meghívást kaptam, amelyen Káldos János kollégával ketten képviseltük az OSZK-t.

A rendezvényt a német ImageWare nevű bonni német cég támogatta. A délelőtti program keretében a cég vezetője, Rolf Rasche tartott két előadást is a cég könyvtári projektjeiről, míg délután a Bajor Állami Könyvtár informatikai vezetője, Dr. Wolf Klostermann tartott közös előadást Mr. Rasche-val a könyvtár tömeges digitalizációjáról.

Az ImageWare cég egyrészt a nálunk is jól ismert BookEye könyvszkennerek forgalmazójaként ismert. 2008. augusztusától azonban a cég jogot szerzett a CeBIT nemzetközi vásáron díjat nyert ScanRobot, automatikus lapozószkenner forgalmazására, amelyet a bécsi Terventus cég fejlesztett ki a közelmúltban. Ezenkívül a cég a tömeges digitalizációt támogató munkafolyamatok kidolgozásában, szervezésében és szoftvertámogatásában nyújt figyelemreméltó teljesítményt.

A délelőtti előadások egy 2005-ben indult projektet mutattak be. A projekt keretében az ú.n. "Catalogue Enrichment"-et megcélozva 2005. augusztusától 4 hónapon belül 180.000 könyv tartalomjegyzékét szkennelték be, ismertették fel és tették hozzáférhetővé a két partnerkönyvtár (University and City Library of Cologne, German National Library of Medicine) online katalógusában. A projekt célkitűzése az volt, hogy a Google és egyéb internetes indexelők használatának nyomasztó fölénye mellett versenyképessé, az olvasók számára hatékonyabbá tegyék a könyvtári katalógusokat. A könyvek hagyományos katalógusleírásai - a tartalmi feltárás ellenére is - sokszor nem adnak kellő információt az olvasóknak, hogy megítéljék, valóban szükségük van-e a könyvre, a számukra releváns információt tartalmazza-e. Ezért sok könyvet feleslegesen kérnek ki a raktárból, vagy kérnek el könyvtárközi kölcsönzés keretében. A gyűjteményes kötetek tartalma sokszor rejtve marad a felhasználók számára, hiszen a részek szerzői, címe, tartalma általában nem jelenik meg a katalógusban.

A bemutató második felében a projekt mintaértékű szervezéséről kaptunk részletes tájékoztatást. A munkafolyamat szervezést az ImageWare MyBib szoftverével végezték. A projekt előtt alapos felmérés, tervezési munka zajlott. A munka során pontos mérések segítették a munka hatékonyságának növelését. Egy átlagos tartalomjegyzék 3,5 oldal. Naponta 2000 könyv tartalomjegyzékét rögzítették. Kiemelkedően fontosnak tartották a minőségellenőrzést. A különböző könyvtárakban zajló rögzítési munka a cég központi szerverén lévő adatbázis támogatta. Így egy elkészült TOC egyből hálózati azonosítót kapott, ami segítette a duplumok kiszűrését. Számunkra kissé meglepő módon a régi könyveknél sokkal jobb eredményekről számoltak be, mint a 20. sz. második felében kiadott, modern könyveknél. A résztvevők az elkészült tartalomjegyzéküket átvették a saját online katalógusukba, amelyre folyamatosan támaszkodtak a munka során. Kiemelkedően fontosnak tartották a kooperációt, a partnerek közötti együttműködést.

A munka sikerességét jelzi, hogy a munka a projekt végén sem állt meg, jócskán bővült az együttműködő könyvtárak köre, a munka a napjainkban is folyik és jelenleg több 100.000 tartalomjegyzéket rögzítettek már digitálisan.

Az egész projektről nekem a MATARKA, a magyar folyóiratok tartalomjegyzék adatbázisa jutott eszembe. Ezt említettem is az ottani kollégáknak, akik azonban közölték, a folyóiratok ügye teljesen más kezelést igényel, mint a könyveké. Utóbbi esetben szorosan a könyvtári katalógusokkal, a meglévő rekordok felhasználásával alakították ki a bővített szolgáltatást. A folyamatok kooperatív, elosztott módon való kivitelezése, a könyvtári dokumentumok információinak mélyebb feltárása azonban számomra mégis hitelessé tette a hasonlóságot. Számomra ugyancsak fontos tanulság mindkét megközelítésben, hogy egyik sem a könyvtári dokumentumaink analitikus feltárását követi hagyományos módon, sok emberi munkával, erre úgy tűnik nemcsak nálunk, hanem a tőlünk fejlettebb könyvtárüggyel rendelkező országokban sincs elegendő forrás. A tartalomjegyzékek gyors, egyszerű digitalizálásával azonban nagy tömegű dokumentum esetén sokkal hatékonyabb keresést tesznek lehetővé a rendelkezésre álló erőforrások sokkal jobb kihasználásával.


A délelőtti program befejezése után az ebédszünetben, néhány szendvics elfogyasztása közben élőben ismerkedhettünk meg a Treventus cég sokat emlegetett lapozó szkennerével, a ScanRobottal. A berendezést már számos német könyvtárban használják és a pozsonyiak is igyekeznek egyet beszerezni minisztériumi támogatással. Részletes ismerkedésre nem, csak néhány kérdésfeltevésre volt idő. A gép könyvkímélő képességeit az támasztotta alá, hogy a müncheni könyvtárban 16-17. századi könyveket is szkenneltek. Papírtól függően percenként 25 oldal szkennelésére képes, egyszerre két oldalt beolvasva. A szkenner beállítható a könyv gerincvastagsága, a papír súlya és egyéb paraméterek által. Az eddig csak az Interneten, videón látott berendezés a szemünk előtt folyamatosan lapozta a kiválasztott, behelyezett könyvet, szép oldalkép minőséget produkálva. A 100 ezer euros beszerzési ár ugyan nem kevés, de a komoly digitalizáló centrumok számára mindenképpen megfontolandó egy ilyen berendezés használata.


A délutáni program keretében a Bajor Állami Könyvtár munkatársa mutatta be a Müncheni Digitalizálási Központ munkáját. A nagyteljesítményű szkennerek olyan tömegben képesek termelni a digitalizált dokumentumokat, amelyek feldolgozása komoly munkaszervezést igényel. A tömeges digitalizálás megszervezésében a könyvtár partnere az ImageWare cég. A munkafolyamatot egy ZEND (Zentrale Erfassungs- und Nachweisdatenbank) nevű szoftver biztosította. A ZEND-et kiegészítve a MyBib-bel, jelenleg az ún. ZENDPro programot használják a sokrétű munkafolyamat összehangolására. Dr. Klostermann elmondta, hogy a tömeges digitalizálás kulcsa nem a szkenner, hanem a szervezésben rejlik. A szervezés elengedhetetlen része a könyvtár különböző, érintett szervezeti egységei munkájának és munkatársainak összehangolása, a raktártól, a feldolgozáson át a katalogizálókig. Nagyon fontos a meglévő problémák, konfliktusok feltárása, ennek elmaradása a későbbiekben jelentős veszteségeket okozhat. A digitalizálási centrum 300 DPI felbontású, színes szkennelést alkalmaz. Havonta kb. 13 terrabyte-nyi digitális dokumentum keletkezik. A nagyfelbontású masterfájlokat azonban nem a könyvtár, hanem a Leibniz Számítógép Központ biztosítja a könyvtárral való kooperációban. A számítógép központ üzemelteti Németország egyik legnagyobb elektronikus archívumát, amely 2007. októberében több mint 45 terrabyte-nyi adatot (több mint 22 millió file-t) archivált. Egy átlagos fizetésű munkaerővel, munkaidővel számolva egy átlag 200 oldalas könyv digitalizálási költsége eredetileg 30-45 euro volt, amelyet a ZENDPro-val a harmadára tudtak leszorítani.

Rolf Rasche az Europeana-val (Az Európai Digitális Könyvtár november végén induló prototípusa) kapcsolatban elmondta, hogy jelenleg az európai könyvtárakban található könyvállomány töredéke, kb. 300.000 könyv található csak digitális formában. A közeljövőben a nagy tömegű digitalizálás széles körű elterjedésével lehet számolni, amelyhez nélkülözhetetlenek a megfelelő szervezeti, munkaszervezési alapok.


Ajánlott Internet források:

A Treventus cég honlapja - ScanRobot
http://treventus.com

Az ImageWare cég honlapja
http://www.imageware.de

MyBib eDoc
http://www.imageware.de/en/software/dokusys/MyBib%20eDoc/

Information Wissenschaft & Praxis, 2005/8
http://www.hbz-nrw.de/dokumentencenter/presse/anw/Scanprojekt_SonderdruckIWP_en.pdf

Library Catalogues Enhanced with Tables of Contents:
http://www.b-u-b.de/0610/summary.shtml

Bayerische Staatsbibliothek - Bavarian State Library
http://www.bsb-muenchen.de

Münchener Digitalisierungs Zentrum
http://www.digital-collections.de

Europeana
http://www.europeana.eu

Moldován István