OSZTOTT KATALOGIZÁLÁS A GYAKORLATBAN - A "VOCAL" RENDSZER
Gyüre Péter, gyp@dataware.hu
Kossuth Lajos Tudományegyetem, Egyetemi és Nemzeti Könyvtár
A VOCAL az osztott katalogizálási rendszerek alapvető működési lehetőségeinek mindegyikét támogatja műszakilag. Erre az a flexibilis és szabványokon alapuló architektúra ad lehetőséget, mely fejlődése során messzemenően figyelembe vette az igények mellett a nemzetközi trendeket is.
A Voyager alaprendszer az Ingres adatbáziskezelőből, a Voyager alap utilityk-ből, a konfigurációs és help állományokból áll. Elsődleges funkciója a modulok munkájának támogatása a keresőrendszerrel (search engine) valamint az alap katalogizáló funkciók tá
mogatása. Elvégezhető vele az adatbázis felépítése, konverziók, az inicializálás és számos más karbantartási feladat.A Voyager WebPAC rendszere a bibliográfiai rekordok, az authority rekordok és a holding információk keresésére, megjelenítésére és letöltésére szolgál. Egyaránt képes a központi VOCAL adatbázisban valamint a háttér (resource) adatbázisokban való keresésre. A WebPAC képes egyszerre párhozamosan több adatbázisban is keresést végrehajtani. A keresési indexek konfigurálhatók, különböző felhasználói jogosultságok számára más és más keresőképernyő használható.
A WebPAC rendszer képes a tárolt bibliográfiai rekordokhoz tartozó holding információk alapján a helyi adatbázisok státusz információnak lekérdezésére és megjelenítésére, melyet a HTTP get_status hívásokra küldenek el a helyi rendszerek. Magyarországon ez a leginkább elterjedt WebPAC rendszer, összesen több mint 20 installációval rendelkezik.
A Voyager WebPAC rendszere nemcsak a VOCAL és más Voyager adatbázisok bibliográfiai rekordjainak keresésére képes, hanem Z39.50 originként tetszőleges Z39.50 kompatibilis adatbázis lekérdezésére is képes. Tesztelésre került az összes magyarországi Z39.50 kompatibilis adatbázisszerver (http://www.dataware.hu/lib/z3950/zlisthu.html). A Z39.50 keresőrendszer a BIB-1 attribútum halmazt alkalmazza, illetve adatbázisonként beállítható.

A VOCAL rendszer architektúrája
Az összes Voyager adatbázis használata lehetséges a Voyager Z39.50 szerveren keresztül.
A Voyager hagyományosan nyújtott karaketeres keresőfelülete megfelel a Z39.58 (CCL) szabványnak, képes keresésre és böngészésre, tetszőleges formátumú megjelenítések konfigurálhatók valamint bináris MARC megjelenítési funkciója használható a rekordok letö
ltésére is.A Voyager JavaCat katalogizáló kliens az első platformfüggetlen szabványos katalogizáló alkalmazás. Gyakorlatilag mindenféle számítógép hardveren képes futni (Windows + PC, Linux + PC
, Sun, HP, RS/6000, Silicon Graphics, Apple) és ugyanazokat a szolgáltatásokat nyújtani, azonos felületen. A rendszer képesA Voyager MarcSender végzi a MARC rekordok felküldését a központi rendszer megadott portjára. Mind interaktív mind ütemezett módon használható.
A nyilvános felhasználók a Voyager WebPAC keresőrendszert használva kereshetnek a VOCAL adatbázisban. A Z39.50 keresési szolgáltatás és az adatletöltés opcionálisan engedélyezhető / letiltható a külső felhasználók számára. A státusz információk lekérdezése a helyi rendszereken keresztül történik.
A VOCAL tagjai számára a fentieken túl lehetőség van a VOCAL adatbázis Z39.50 felületen történő lekérdezésére. Lehetséges a VOCAL authority rekordjainak áttekintése és letöltése. A helyi rendszer a Z39.50 kiterjesztéseként alkalmazott UPDATE service segítségével rekordokat küldhet a VOCAL adatbázisába. Ugyanez a funkció elvégezhető a Voyager MarcSender használatával is. Ez a Voyager - nyílt - protokolljával képes bibliográfiai rekordokat és a hozzájuk tartozó authority rekordokat elküldeni a VOCAL adatbázisba.
A VOCAL adatbázis adminisztrátorai számára JavaCAT alkalmazás ad lehetőséget az adatbázis (authority rekordok, bibliográfiai rekordok, etc.) karbantartására.
A Voyager könyvtári rendszer standard Web felületét a VOCAL használóinak igényeihez idomított (egyszerűsített vagy komplex kereséseket lehetővé tevő) változatban nyújtja. A Web felület képes a VOCAL bibliográfiai rekordjainak megjelenítésére, valamint az authority rekordok keresésére és megjelenítésére. A keresési szempontok tetszőlegesen konfigurálhatók, ugyanígy a megjelenítési lehetőségek is. A rendszerrel megtalált bibliográfiai és authority rekordok letöltéséről a 2.5. pont szól.
A VOCAL adatbázisaiban lehetséges a keresés karakteres keresőfelülettel. Ez a felület a CCL nyelvű parancsokkal használható, szabványos felületet nyújtva bibliográfiai, authority és holding adatok kereséséhez, megjelenítéséhez és letöltéséhez.
A VOCAL adatbázisban minden felhasználó tud Z39.50 szabvánnyal kereséseket végezni, amennyiben van saját (a helyi rendszer részét képező, vagy "third party") Z39.50 kliense. A Z39.50 klienssel történő keresést a Voyager a zserver alkalmazással támogatja.
A bibliográfiai adatok megjelenítésére számos konfigurálható megjelenítési formátum szolgál. Az authority rekordok megjelenítése a böngésző listákban rövid alakban (main heading) történik, és lehetséges a rekordok MARC formátumú megjelenítése is. A lelőhe
lyinformációk mind a default normál mind a default hosszú megjelenítésben láthatók. A státusz információk kezelése egy kicsit komplikáltabb, hiszen a VOCAL nem tartalmazza ezeket az adatokat. Mivel a VOCAL rendszer csak bibliográfiai és lelőhely információkat tárol, az aktuális státusz információk megjelenítése csak a helyi rendszerben tárolt adatok közvetítésével lehetséges. Ennek előfeltétele az, hogy a helyi rendszer státusz információi HTTP protokollal elérhetőek legyenek - ez általában a WebPAC keresőrendszeren át lehetséges.A Voyager alapvetően kétféle módon képes e
rre.JATE - www.lib.jate.hu/vocal_statusz
JPTE - www.lib.jpte.hu/vocal_statusz
....
Ez utóbbi esetben például a KLTE státusz információnak lekérdezése a www.lib.klte.hu/.../vocal_statusz?rekordID URL-ről visszaadott HTML lap megjelenítésével történik. Bár technikailag lehetséges, mégsem javasolt a fenti két módszer együttes használata. A rendszer rugalmassága bizonyos mértékig lehetővé teszi olyan rendszerekből is státusz információ közlését, amelynek nincs Web felülete.
A VOCAL közösség számára a központi rendszer nemcsak a VOCAL adatbázisban, hanem tetszőleges Z39.50 felületen szolgáltatott adatbázisban képes keresni. A konfigurácó tetszőlegesen alakítható ki (Library of Congress - BIBL/AUTH etc.). A keresett rekordok természetesen hasonló módon tölthetők le.
A VOCAL adatbázis szolgáltatását a Voyager Z39.50 szervere végzi. Amennyiben a VOCAL adatbázis használata saját Z39.50 klienssel történik, úgy a megfelelő beállítások annak alapján tehetők meg. A VOCAL adatbázisának elérésére a voyager.iif.hu gép 210-es p
ortja szolgál.A VOCAL-ban megtalált bibliográfiai/authority rekordok letöltése a helyi rendszerbe többféle módon végezhető el.
A VOCAL adatbázisba rekordok mentését, a mentett rekordok törlését és módosítását lehetővé tevő karbantartó program a JavaCAT. A JavaCAT minden olyan funkciót nyújt ami a VOCAL adatbázis bibliográfiai, authority és holding információnak karbantartását teszi lehetővé. A JavaCAT a VCAT protokollt használva teszi lehetővé a VOCAL adatbázisaihoz való kapcsolódást. A JavaCAT programmal létrehozott rekordok szintaktikai ellenőrzés után kerülhetnek az adatbázisba. Erről részletesebben az ellenőrző funkció szól.
A VOCAL működésének kulcsa az, hogy a rendszerek mindegyike képes a szabványos kommunikációra. Ennek az illesztésnek a megkönnyítése végett több opciót adott a feltöltésre, melyek funkcionálisan egyenértékűek.
A Z39.50 Version 3 tartalmaz az EXTENDED szolgáltatások között egy úgynevezett UPDATE service-t. Ennek segítségével minden olyan rendszer, amelyik szabványos Z39.50 kommunikációra képes, elküldheti rekordjait a VOCAL központi rendszerébe a protokoll használatával. A szolgáltatást ugyanaz a Z39.50 target nyújtja, amit a keresésre is használhatunk.
A Voyager VCAT protokoll lehetővé teszi az accounttal rendelkező felhasználók számára az adatbázisrekordok letöltését, visszaküldését valamint az authority kontroll használatát. Ez a protokoll a JavaCAT működésének alapja, amennyiben adatbázis(ok)hoz kapcsolódva használják. A VCAT protokoll tekinthető egy olyan API-nak is, melyhez a tulajdonképpen bármilyen más gyártótól származó helyi rendszer illesztése a forráskód és MARC rekordok birtokában viszonylag egyszerű fejlesztői munkával elvégezhető.
A WebPAC kiegészítéseként lehetséges feljogosított felhasználóknak a központi rendszerbe rekordok feltöltését is kezdeményezni egy űrlapon keresztül. Ilyenkor egy URL-t kell megadni, melyben a batch módon elküldeni kívánt MARC rekordok vannak, és a rendszer azok beindexeléséről maga gondoskodik. Az esetl
eges hibaüzeneteket a felhasználó e-mail útján kapja meg.
Az üzemeltetési környezet - UNIX SVR4 - lehetővé teszi hogy a rendszeradminisztrátorok olyan tevékenységet állítsanak be periodikus végrehajtásra, melyek előre definiálható módon játszódnak le. Ennek megfelelően lehetséges olyan feltöltési eljárás is (az előző pontban használt mechanizmushoz hasonlóan) melynek során a központi szerver tölti a helyi rendszerekből át a rekordokat egy előre megha
tározott periodicitással. A beállításhoz szükséges aAz esetleges hibaüzeneteket a felhasználó e-mail útján kapja meg.
A Voyager MarcSender egy olyan alkalmazás, mely egy spool területre érkező MARC rekordok elküldését végzi Voyager központi adatbázisok számára. A MarcSender a kommunikációt egy saját protokollal végzi, melynek opcionális része lehet az adatok titkosítása is. A MarcSender UNIX környezetre készült, azonban gyakorlatilag bármilyen multitask operációs rendszeren használható. A MarcSender használható crontab beállítással, parancssorból, alkalmazás és eseményvezérelten. Ez lehetőséget a helyi rendszerek számára MARC rekordok felküldésének kezdeményezésére a megfelelő rendszerhívások beiktatásával. Egy MARC export funkcióval rendelkező program számára ez mindössze négy-öt programsorban megoldható.
Könyvtárközi kölcsönzési kérések küldése / fogadásaA Voyager rendszer standard funkciója a könyvtárközi kölcsönzések Web felületen keresztül történő küldésének és fogadásának valamint a dokumentumszolgáltatással kapcsolatos műveletek megvalósítása.
A Voyager authority kontrollAz osztott katalogizálás megvalósításának rendkívül fontos eleme az authority kontroll, ennek megfelelően a Voyager osztott katalogizálási rendszerének kiemelkedő funkcionalitású, szabványos authority kontroll eszközei vannak. Ennek segítségével biztosít
ható a bibliográfiai rekordok kiemelt mezőinek (pl. USMARC 100, 110, 111, 240, 243, 600, 650, 651, 700, 710, 711, 830) egységesítése. A Voyager authority kontroll szolgáltatásának fontos jellemzője az, hogy teljes mértékben szabványosított, azaz az egységes névalakokat nem a rendszeradminisztrátor által meghatározott formában, hanem szabványos MARC authority formátumban kezeli, lehetővé téve a legáltalánosabb célú felhasználást. A Voyager authority kontroll a következő szolgáltatásokat nyújtja:megadása alapján
A bevitt adatok konzisztenciája és minősége alapvetően a feldolgozási eljárás - az osztott katalogizálási munkafolyamat - pontos kidolgozásán és megvalósításán múlik, amelyek humán tényezők. Ugyanakkor számos ponton lehetséges - és egy osztott katalogizál
- duplikátum ellenőrzés a rekordok mentése során
- a rekord szintaktikai ellenőrzése
- MARC szintaktikai ellenőrzés (ISO 2709 conformance)
- kiemelt adatelemek szintaktikai - szemantikai ellenőrzése
A duplikátum ellenőrzés a Voyager osztott katalogizálási rendszerének integráns eleme. Mint minden osztott katalogizálási rendszer, így a VOCAL számára is lényeges hogy az adatbázisban a címek (bibliográfiai leírások) halmazát duplikátumoktól mentesen tartsák. Erre ugyan garanciát ad a követendő munkafolyamat (hiszen minden könyvtáros hasonlítással kezdi a munkáját), ugyanakkor az esetleges emberi hibák valamint a gépi feldolgozás (batch processing) bizonyosan generál ilyen duplumokat. Ezek minimális szinten tartásához ad segítséget
a Voyager dedup rendszere. A dedup rendszer megvalósításakor a következő szempontok játszottak szerepet:A dedup rendszer kialakítása során messzemenően figyelembe vették a nagy konzorciumok gyakorlatát. A duplikátum ellenőrzés algoritmusának előzetes meghatározása nélkül olyan metódus biztosít részletes konfigurációs lehetőségeket melyben a rendszeradminisztrátor beállíthatja hogy az egyedi kulcs milyen módon jöjjön létre.
dedup.cfg
; Voyager deduplication key file for monographs
; Key part after 990th byte is ignored!
;
DEDUPKEYFIX = 000[05-07]
DEDUPKEYVAR = 020$a, 041$a, 100, 110, 111,\
245$a, 245$b, 245$h,\
260$a, 260$b, 260$c[1-4],\
490\
STRICT = ON
CAPITALS = ON
; End of sample
A fentiek közül a 245$a valamint a formátum jelölő kötelező. Az egyedi kulcsok szokás szerint tartalmazhatják az ISBN, ISSN, LCCN, OCLC Control Number adatelemeket is. Az egyedi kulcsokat a rendszer minden rekord esetében létrehozza és tárolja egy táblába
n. Új rekord betöltése esetén a létrehozott kulcs egyediségét vizsgálja a rendszer. Ha a kulcs még nem szerepel az adatbázisban, akkor a rendszer minden további nélkül menti az új rekordot az adatbázisba. Ha ilyen kulcs már van, akkor a rendszer figyelmezteti a katalogizálót erre tényre, az ütközést okozó rekord megjelenítésevel együtt. Ha a katalogizáló úgy dönt hogy a rekordokat összevonja, úgy a rendszer a régi rekord példányadataihoz hozzáírja az új rekord adatait. Ha a rekordok valóban különbözőek, akkor SOFT metódus estén a rendszer lehetővé teszi a katalogizáló számára hogy a mentést az ütközés ellenére megtegye. STRICT metódus esetén a katalogizáló nem mentheti le a rekordot / ilyenkor a tábla szervezése olyan, hogy nem létezhetnek dupla kulcsok, azaz a tábla 'btree unique on (dedupkey)' /. Két mód lehetséges ilyenkor a mentésre. Az egyik a kulcsképzési algoritmus finomítása, a másik pedig az egyediség biztosítása a kulcsképzésben résztvevő adatelemek módosításával.
A rekordok szintaktikai ellenőrzése tartalmazza a
Ezek mindegyike konfigurálható opció a rendszerben
A Voyager nem export-import algoritmusok során kezeli a MARC rekordokat, hanem ez az alapvető belső tárolási formátum. A MARC szerkesztőben létrehozott rekordok tehát azonnal MARC formátumba kerülnek, mely mentes minden a hossz és directory kezelésben fellelhető gyakori problémáktól. Ennek megfelelően a szintaxis ellenőrzés csak a rekord mentésekor (ISO 2709 formátumba alakításakor) történik, valamint külső forrásból származó import esetén. Az ellenőrzés kiterjed a hosszra, a státuszra, a dátumok érvényességére, a directory és a mezőleírók konzisztenciájára valamint az almezőkódokra és indikátorokra. Az egyes speciális adatelemek ellenőrzését bővíthető és konfigurálható algoritmusok segítik (ISBN, szabványos vonalkód)
A rekordok szemantikai ellenőrzése az authority kontroll funkción keresztül valósul meg.