Köszönetnyilvánítások

Hálás vagyok Carol Tenopirnak, aki nemcsak bátorított arra, hogy megírjam ezt a könyvet, hanem írásom szerkesztésére is vállalkozott. Sok fontos megjegyzéssel és javaslattal segített, nagyon értékes volt számomra támogatása és ösztönzése a könyv megírásának három éve alatt.

Rich Lane-nek meg kell köszönnöm, hogy kérlelhetetlenül átvezette a könyvet a szerkesztési folyamaton, Joan Torkildsonnak pedig azt, hogy a nyomtatásra előkészítette a kéziratot, s megóvott azoktól a pontatlanságoktól és következetlenségektől, amelyeket magam az adatbázisokban kritizálok. Rendkívül értékes volt Susan Johnson segítsége a tények ellenőrzésében. Ha maradt bármilyen hiba, az csak az én felelősségem.

Nagyra értékelem Tom Hogan, az Information Today elnöke támogatását, aki lehetővé tette számomra, hogy rendszeres rovatom lehessen újságjaiban és magazinjaiban, s 1990-től az adatbázisok minőségével foglalkozó workshopokat tarthassak a National Online Meetingek során. Nagyra tartom azért, hogy még akkor sem próbált cenzúrázni engem, amikor rendszeresen kritizáltam egy olyan adatbázist, amelyet cége megvásárolt. Ő nemcsak okos üzletember, hanem tiszteletreméltó úriember is.

Köszönetet mondok azoknak, akik az Information Today, Computers in Libraries, Database, Online & CD-ROM Review és az Online Information Review című lapoknál rovataim szerkesztői voltak a múltban vagy most is azok, s különösen azoknak, akik oroszlánrészt vállaltak legtöbb rovatom szerkesztésében: Paula Hane-nek, Marydee Ojalanak, David Hoffmannak és John Eichornnak. A Gale Groupnak azt kell megköszönnöm, hogy a digitális referensz forrásokról szóló havi szemléimnek helyet adott a weben és szerkesztői támogatást is nyújtott hozzá. Ezek az írások segítettek abban, hogy folyamatosan vizsgáljam ezeket a fontos kérdéseket.

A könyv megírása közben nagy örömmel gondoltam legjobb diákjaimra, különösen azokra, akik hozzám hasonlóan érdeklődtek az adatbázisok elemzése iránt: Lois Kiehl, Susan Johnson, Rich Gazan, Pam Cahn, Jennifer Winter, Marcia Kemble, Kimberley Scott, Justin Goo, Beth Tillinghast, Jennifer Jackson, Jessica Gehle, Nancy Kleban, Ellen Peterson, Evangeline Alexander és Marylin Reppun. Állandó készenlétre ösztönöztek okos és provokatív kérdéseikkel és megjegyzéseikkel, ösztönzően aktívak voltak az adatbázisok minőségének és értékelésének kérdéseivel foglalkozó kurzusaim, workshopjaim és szemináriumaim során.

Elismerés illeti Don Hawkinst, az Information Science Abstracts főszerkesztőjét, korábbi vezető technikai szerkesztőjét. Számos szerkesztőségi cikke az ISA weboldalán és hagyományos kiadványokban megjelenő, egy adott adatbázis értelmezéséről és félreértelmezéséről szóló írásai ösztönöztek a könyv megírására. Az, ahogyan egy fájl készítőjeként látja a minőséggel kapcsolatos kérdéseket, gyakran különbözik az én, a használók oldaláról megfogalmazott véleményemtől, s ezzel ki is egészíti azt.

A köszönetmondás nagyon kevés, amikor feleségem, Tiszai Judit rendkívüli támogatását kell elismernem. Nagyszerű partner volt a projekt minden fázisában, az online és offline kutatásban, az eredmények elemzésén alapuló illusztrációk elkészítésében, és a kézirat kezelésének és a bibliográfia összeállításának prózai feladataiban. Még sokkal fontosabb, hogy nagyszerű partnerem maradt életünk munkán kívüli részében is.


Bevezetés

Az adatbázis fogalma általánosan elterjedtté vált az elmúlt évtizedben. Az Amerikai Egyesült Államokban és a többi fejlett országban háziasszonyok és otthonülők, pénztárosok és autószerelők, zenetanárok és pszichológusok, a középiskolából kibukottak és a hajléktalanok is használnak adatbázisokat. Minden egyetemi és főiskolai hallgató és a legtöbb általános iskolai és középiskolai tanuló több adatbázist használ tanulmányai során. Sok vállalat alkalmazottaitól várják el, hogy ismerjenek néhány adatbázist. Másoktól azt követelik meg, hogy új adatbázisokat vizsgáljanak meg, amelyekkel saját és munkatársaik munkája hatékonyabbá válhat.

Mindezt természetesen az internet tette lehetővé, a weben található sok jó minőségű, ingyenes adatbázis. Gomba módra szaporodnak a kiváló és gyenge adatbázisok a weben, mert ott viszonylag könnyen közzé lehet őket tenni. Az arányokat tekintve épp annyi gyenge termék van a hagyományos fizetős online és CD-ROM adatbázisok között, mint a weben születettek között. (Itt kereshető weben született adatbázisok százaira utalok, nem egyszerűen web-helyekre.)

Rendkívüli mértékben növekszik a száma azoknak a végfelhasználóknak (könyvtári olvasók, kutatók, otthoni használók), akiknek ismerniük kell az általuk használt adatbázisok korlátait, erősségeit és gyengeségeit. Ez a könyv elsődlegesen azoknak szól, akik tanácsot adhatnak a végfelhasználóknak a megfelelő adatbázis kiválasztásában: iskolai, főiskolai, nyilvános és szakkönyvtárak könyvtárosainak és információs szakembereinek; továbbá azoknak, akik bírálják és értékelik az adatbázisokat vagy használati útmutatókat és címjegyzékeket készítenek az adatbázisokról (vagy mindezeket együtt végzik).

A könyvtárak maradnak az információkkal kapcsolatos útmutatás központjai akkor is, ha nem ők maguk az információgyűjtemények központjai. A könyvtárosok és információs szakemberek továbbra is a legmegbízhatóbb, kompetens források a végfelhasználók információs igényeinek kielégítésében, legyen szó akár fizetős, akár ingyenes szolgáltatásokról.

Mostanában mindenféle magazinban találhatunk adatbázisokról "kritikákat", a Better Homes and Gardenstől kezdve a Horses and Houndson keresztül a PC Magazine-ig. Ezek gyakran csupán a kiadók reklámjainak kissé átfogalmazott ismétlései. A web sok használója érez sürgetést arra, hogy összeállítsa és közzétegye a legjobb adatbázisok listáját, anélkül, hogy tisztában lenne az adatbázis-elemzés alapjaival, bármit is tudna az adatbázisok elemzésének legalapvetőbb kérdéseiről. Egyes könyvtárosok és információs szakemberek, akik korábban soha nem írtak kritikát referenszforrásokról, most kényszerítve érzik magukat arra, hogy megosszák nem túl éleselméjű véleményüket a weben született adatbázisokról.

Nem véletlen, hogy a legjobb kritikák azoktól származnak, akik a szakmát még a nyomtatott világban sajátítottak el. Jim Rettig, Cheryl LaGuardia, Mary Ellen Bates, Reva Basch, Marydee Ojala, Barbara Quint, Ken Kister és Ken Black a legjobb kritikusok közé tartozik. Megvan annak az oka, hogy miért a könyvtár- és információtudományi folyóiratok, mint a Database, az Information Today, a Choice, a Reference Book Bulletin és a Library Journal az adatbázis kritikák legjobb forrásai. Nem meglepő, hogy könyvtárosok segítettek létrehozni a leghasznosabb webes címjegyzékeket és webkalauzokat, mint a SignPost, a Librarian's Index és az Internet, a BUBL és az INFOMINE, amelyek kiemelkednek az útkeresők tömegéből.

Ez a könyv könyvtárosoknak, információs szakembereknek és adatbázisok kritikusainak szól rendszerező módon, összefoglalja az adatbázisok tartalmának elemzésére használható szempontokat. Az adatbázisok elérésére szolgáló szoftverek és hardverek szempontjaival nem foglalkozunk, bár feltétlenül fontos szerepet játszanak abban, hogy mennyire hatékonyan lehet megtalálni az információt.

Az adatbázisok tartalmának jellegzetességeit írjuk le és magyarázzuk meg. Pozitív és negatív példákat használunk az adatbázisok legfőbb jellegzetességeinek illusztrálására. Az információs szakemberek által használt adatbázisok kiválasztása az illusztrálásra magától értetődő választás volt. A példaként használt többi adatbázis közül sok széles körben népszerű, és az adott szakterületre vonatkozó képzettséggel nem rendelkező emberek is megérthetik. Egyes adatbázisokat azért választottunk ki, mert rendkívül jól illusztrálják a hiányosságokat. Ez a mintaként kiválasztott csoport adatbázisok különböző kategóriáit reprezentálja (címjegyzékek, indexelő, referáló és teljes szövegű adatbázisok). A leggyakrabban az alábbi adatbázisokat használtuk. Másokat csak egyszer vagy kétszer említünk meg, amikor egy meghatározott szempontot nagyon jól illusztrálnak.

Adatbázis

Tartalomszolgáltató

Library and Information Science Abstracts (LISA)

G. K. Saur

Information Science Abstracts (ISA)

Information Today

Library Literature (LibLit)

H. W. Wilson

Internet & Personal Computing Abstracts (IPCA)

Information Today

Social Science Search (Social SciSearch)

Institute for Scientific Information

Psychological Abstracts (PsycINFO)

American Psychological Association

Mental Health Abstracts (MHA)

IFI/Plenum

Ulrich's International Periodicals Directory (Ulrich's)

R. R. Bowker

The Serials Directory (TSD)

EBSCO

ISSN Online International Serials

International Serials Data System

Gale's Directory of Databases

Gale Corporation

World Databases

G. K. Saur

Bowker's Complete Video Directory (BCVD)

R. R. Bowker

A cégek és az adatbázisok neve folyamatosan változik. A könyv megírásának idején a UMI elhagyta nevének feloldását (University Microfilm International), felvette anyacégének nevét, egy minősítő kiegészítéssel (Bell & Howell Learning and Information), azután pedig, amikor a könyv nyomdába ment, hatékony információkereső rendszerének neve után ProQuestre változtatta nevét.

Az egyesülések, megvásárlások és közös kiadások szintén fejfájást okozhatnak. Még könyvem megírása előtt az R. R. Bowker céget az Elsevier megvásárolta. Saját neve alatt számos gyorstájékoztató adatbázisa volt, azután a G. K. Saurral közösen adott ki adatbázisokat Bowker-Saur név alatt, majd épp könyvem befejezésekor szétvált a német cégtől, s amikor ön olvassa a könyvet, elképzelhető, hogy az Elsevier már tovább is adott a vállalaton, vagy legalábbis néhány digitális kincsén.

Néhány fájlkészítő, adatbázis és cég neve meg fog változni addigra, mire ez a könyv megjelenik. Az alábbiakban összefoglaljuk a legfontosabb változásokat, amelyekről tudomást szereztünk:

Régi név

Új név

University Microfilm International (UMI)

Bell & Howell Information and Learning*

Information Access Company (IAC)

Gale Group (része)

Library Literature & Information Science Full Text (LibLit)

Library Literature

              * 2001 júniusában újra megváltoztatta nevét, Proquestre, népszerű szoftverének neve alapján.

Az információs rendszerek egy adatbázist különböző adatbázis (fájl) szám vagy rövidítés alapján azonosítják. Ilyenkor magyarázó leírást használunk, például "az Ulrich's DIALOG-os változata" vagy az "Ulrich's Bowker CD-ROM-os változata", ahelyett, hogy 480-as fájlnak vagy Ulrich's Plus on Discnek neveznénk őket. Más esetekben, amikor egy adatbázisnak csak egy változatát használjuk illusztrálásra az egész könyvben, az a név szerepel, ahogy azt az online rendszerben használják, mint például Social SciSearch az ISI hivatkozási adatbázisának DIALOG-os változatában. Az ábrákon helytakarékossági okokból szerepelhet rövidebb változat (mint például SocSci), de a kapcsolódó magyarázó szöveg az ajánlott hosszabb formát fogja használni. A keresési képernyőképek esetében az adatbázis szolgáltató által használt név vagy kód jelenik meg, mint például File 7 a Social SciSearch esetében. Ebben az esetben is a környező szöveg segít pontosan megadni, miről van szó.

Az adatbázisok tartalmának jellegzetességeit vizsgáló tesztek közül sok szoftverfüggő. A DIALOG nyújtja a legtöbb és messze a legjobb lehetőséget a tesztelésre, ezért szerepel legtöbbször a könyvben. A könyvtár- és információtudományi tanszékek is ezt a szolgáltatást veszik igénybe a legszélesebb körben. Vannak azonban példák az adatbázisok más változataira is, beleértve az Ovid, SilverPlatter, Bell & Howell Information and Learning, H. W. Wilson online és CD-ROM keresőszoftverét, és számos másikat (többségében a webre tervezett változatokat), amelyeket egy adott adatbázis számára egyedileg fejlesztett ki az eredeti tartalomszolgáltató, a Barnes & Noble, az Amazon.com vagy az All Movie Guide. (A szövegben az ingyenes webes adatbázisoknak csak az URL-jét adjuk meg, s csak akkor, ha a specifikus példa szükségessé teheti az olvasó számára, hogy megnézze azt a webhelyet vagy annak meghatározott oldalát. A webhelyeket könnyű megtalálni itt szereplő nevük alapján, különböző webes címjegyzékeket használva.)

Nem biztos, hogy az olvasónak van ideje, lehetősége vagy érdeklődése, hogy valamennyi, a könyvben szereplő szempont szerint értékelje az adatbázisokat. Egyes szempontok esetleg nem alkalmazhatók arra az adatbázisra, amely iránt érdeklődik. Ennek ellenére azonban a szempontok segítséget jelenthetnek abban, hogy összeállítsák a kérdések listáját, amelyet feltehetnek az adatbázisok kiadóinak, különösen fizetős szolgáltatások esetében, amikor joguk lehet arra, hogy részletes választ kapjanak olyan kérdésekre, mint az, hogy miként dolgozzák fel a magfolyóiratokat, milyen időkülönbség van a primer dokumentumok megjelenése és rekordjaiknak az adatbázisban való bekerülése között, a rekordok mekkora részében szerepelnek meghatározott adatelemek (például dokumentumtípus, az LC osztályozási jelzete).

Az adatbázisok tartalma folyamatosan változik, legtöbbször jobb lesz, bár vannak kivételek. Az Information Science Abstractset 1998-ban szerezte meg az Information Today. Bár bizonyos szempontokból fejlődött, minőségileg nem közelítette meg - ahogy várható lett volna - a korábban Microcomputer Abstracts néven ismert Internet & Personal Computing Abstracts (IPCA) adatbázist, amely az Information Today zászlóshajója.

Bár az 1998 után bekerült rekordok között vannak jobb minőségűek (bizonyosan azok, amelyeket az IPCA "adott tovább" nekik), az adatbázisba csak feleannyi rekord került be, mint egy évvel korábban, kihagyott alapvető információtudományi folyóiratokat vagy a minimumra csökkentette feldolgozottságukat, ahogyan azt a 4. és 5. fejezetek illusztrálják az adatbázisok dimenzióiról és az adatbázisokban feltárt forrásokról. Lehetséges, hogy más adatbázis-kiadók időközben megoldották a könyvben tárgyalt problémák némelyikét. Értékelése során önnek az adatbázisok akkori változatát kell vizsgálnia. Ha csak másfajta utalás nem történik rá, a teszteket a könyv számára 1999 júliusa és 2000 novembere között végeztük, egyeseket 2001-ben újra elvégeztünk a könyv korrektúrájának olvasásakor.

Konzultációs szolgáltatásokat végeztem a könyvben említett cégek közül többnek a számára, az Information Today és a Gale Group állandó munkatársa vagyok, amelyek ugyanakkor fájlok készítői, egyes esetekben adatbázisok kiadói. Mindent megtettem, hogy ez a tény ne befolyásolja adatbázisaik minőségéről alkotott ítéletemet.


1. Adatbázis termékek, készítőik és kiadóik

Érdemes ezt a könyvet azzal kezdeni, hogy megmagyarázunk néhány olyan fogalmat, amely többször előfordul majd a szövegben. Egyesek általánosan használatosak, de az olvasók esetleg különbözően értelmezhetik őket. Másoknak speciális jelentése lehet, definíciót és magyarázatot kívánnak a kétértelműség elkerülése érdekében. Az is fontos, hogy világosan lássuk a különbséget az adatbázisok kiadásának módszerei és médiumai között.

Egy adatbázis intellektuális és technikai műveletek láncolatának eredménye. Különböző szervezetek és egyének kapcsolódnak be ezekbe a műveletekbe. Esetenként az adatbázis egy lelkes és hozzáértő személy munkájának eredménye (ez volt a helyzet a kiváló Encyclopaedia of the Orient esetében), máskor emberek kis csoportjáé (egy remekmű, az Internet Movie Database a példa erre). Az adatbázisokat gyakran nagyobb szervezetek vásárolják meg, amelyek adaptálják, és saját szolgáltatásukba integrálják azokat. Ennek a könyvnek a szempontjából az adatbázisokhoz kapcsolódó legalapvetőbb fogalmak meghatározásának legjobb módja az, ha végigkövetjük a műveleteket és bemutatjuk a szereplőket és a termékeket a kezdetektől a közbeeső állomásokon keresztül a végső fázisig.

A folyamat az adatfájlnak nevezett, géppel olvasható fájl előállításával indul. Évtizedeken keresztül az adatfájl volt az a forrás, amely lehetővé tette, hogy a számítógép előállítsa a referáló és indexelő szolgáltatások, teljes szövegű folyóiratok és újságok, szótárak és enciklopédiák nyomtatott változatát. Az adatfájl általában mágnesszalagon van. Ahhoz, hogy adatbázist készítsenek belőle, indexfájlokat kell létrehozni, az adatfájlt át kell szerkeszteni és keresőszoftverrel kell kiegészíteni. Tipikus esetben az adatfájl előállítói az adatfájl tartalmát harmadik fél részére bérbe adják, hogy az adatbázist készítsen az adatfájl tartalmából; innen származik a gyakran használt tartalomszolgáltató (content provider) elnevezés. A szakirodalomban az adatfájl előállítói pedig adatbázis-készítőkként (database producer) is ismertek.

A licenc birtokosai feldolgozzák az adatfájlokat és CD-ROM-on vagy online módon publikálják: ők lesznek az adatbázis kiadói. Az adatbázis-kiadók kifejleszthetik saját indexelő és kereső szoftverüket, vagy licencelhetik azt egy szoftverfejlesztőtől.

Egyes adatbázis-kiadók (ismertek online vendorként vagy online szolgáltatóként is), mint például a DIALOG, tartalomszolgáltatók százaitól vesznek licencbe tartalmat. Egyes adatfájlokat, mint például a Pediatric Renal Diseasest, csak egyetlen adatbázis-kiadónak adnak át; míg másokat, mint például a MEDLINE-t, adatbázis-kiadók tucatjainak. Egyre elterjedtebb gyakorlat, hogy a fájlok előállítói maguk is publikálják saját adatfájljukat vagy adatfájljaikat. Az H. W. Wilson és a Bell & Howell például széles körben bérbe adják adatfájljaikat másoknak, de ugyanakkor saját webhelyükön is közzéteszik azokat.


Adatfájlok és előállítóik

Az adatfájlok előállítói válogatják, gyűjtik, rendszerezik és rögzítik a könyvekkel, cikkekkel, konferencia-előadásokkal, disszertációkkal, cégekkel, emberekkel, szolgáltatásokkal stb. kapcsolatos információkat. Az adatfájlok előállítói a rögzített adatokat valamilyen szerkezetbe rendezik s általában ki is egészítik olyan információkkal, amelyek nem érhetőek el közvetlenül a forrásból. Ez az információ növeli az adatfájl értékét olyan elemek hozzáadásával, mint osztályozási jelzetek, tárgyszavak, referátumok, vagy ezek kombinációja. Mintaként használt csoportunkban az Amerikai Pszichológiai Társaság (American Psychological Association, APA) csupán adatfájl előállító volt, amely harmadik fél részére tartalmat adott át, amelyből klasszikus referáló és indexelő forrásuk, a Psychological Abstracts különböző változatai kiadásra kerültek. (1999-ben az APA is adatbázis-kiadó lett, mivel elkészítette saját adatbázis változatát, a PsycINFO Directet, amelynek van egy ingyenes részhalmaza demonstrációs célokra a http://www.psycinfo.com/demo/ címen.) A tartalomszolgáltató szűkebb fogalom, mint a fájlelőállító, mert lehet, hogy az előbbi nem készít számítógéppel olvasható fájlt, csak licenceli a tartalmat, például egy nyomtatott útikalauzt, változatlan formában, egy harmadik félnek.

Másik oldalról egyes adatfájl előállítók megszerzik a licencet ahhoz, hogy mások létező nyomtatott forrásait feldolgozzák és adatfájllá konvertálják. Például a Microsoft megszerezte a Zagat Restaurant Guide tartalmát, s ebből előállított egy adatbázist saját Sidewalk weboldalán, amelyet később eladott a Ticketmasternek, amely Citysearchcsé alakította át (http://www.citysearch.com/?brand=sidewalk). A Zagat volt a tartalomszolgáltató vagy fájlelőállító (ha fájlként adta át a tartalmat a Microsoftnak), a Microsoft az adatbázis kiadója. A Zagat később adatbázis-kiadóvá is vált, miután saját tartalmát megjelentette a weben, a http://www.zagat.com címen.

Könyvünkben az adatfájl mindig egy géppel olvasható formában levő információgyűjteményre utal. Az adatfájl lehet tisztán szöveges (például egy bibliográfiai adatfájl), szöveges-numerikus (például cégek címjegyzéke, amely leíró és pénzügyi információkat is tartalmaz), döntően numerikus (például egy statisztikai adatfájl). A szövegen kívül az adatfájl tartalmazhat számítógépes grafikát, álló- és mozgóképeket, hangokat és videoklipeket, ez jellemzi az összes, a nagyközönségnek szóló multimédia enciklopédiát. Az adatfájl lehet eredeti dokumentumok hasonmásainak, fakszimiléinek gyűjteménye, mint például az adóhivatal, az Internal Revenue Service (IRS) formanyomtatványai. A hasonmás tartalmának értékét nagy mértékben növelhetik az adatbázis előállításának folyamata során azzal, hogy indextételeket készítenek az egész szöveghez, mint például az International Women's Periodicals fájl vagy a teljes ProQuest adatbáziscsalád esetében.

Az adatfájlok előállítói felajánlhatják licencelésre a teljes tartalmat vagy annak egy részhalmazát. Például az Amerikai Egyesült Államok Nemzeti Orvosi Könyvtára (National Library of Medicine, NLM) a MEDLINE fájl különböző részhalmazait ajánlja fel licencelésre. A részhalmazok létrehozhatók nyelv, időszak vagy a források típusa alapján. Például a MEDLINE CORE nevű adatbázis-változat csak a legalapvetőbb orvosi folyóiratok Brandon-Hill listáján szereplő folyóiratokból származó rekordokat tartalmazza. A lista a http://www.nlm.nih.gov/psr/outreach/branhill.html címen volt elérhető. 2004-ben abbahagyták, utódja a Doody's Core Titles in the Health Sciences (http://www.doody.com/dct/). Mások csak a MEDLINE utolsó néhány évét bérlik, és nem az egész adatbázist, amely 1966-ig megy vissza.

Egy másik példában az Education Resources Information Center (ERIC) adatfájlt egyesek teljes egészében licencelik, mind a folyóiratok, mind a kutatási jelentések részhalmazát, az ERIC Digestek teljes szövegével együtt. Bérelhető például csak a folyóiratok részhalmaza. A Psychological Abstracts adatfile ClinPsych részhalmaza csak azoknak a cikkeknek a rekordjait tartalmazza, amelyek a klinikai gyakorlatot tárgyalják. A Bowker cég mind a szemlékkel, mind azok nélkül licencbe adja Books in Print rekordjait. Egy harmadik változat csak olyan könyvek rekordjait tartalmazza, amelyek már nem kaphatók. Elképzelhető, hogy az adatbázisok neve nem tükrözi ezeket a különbségeket. A DIALOG például a Books in Print nevet használja, bár az ő változatuk csaknem egymillió rekordot tartalmaz már nem kapható (out of print) könyvekről, s könyvkritikák tízezreit is.

Egyre több adatfájl előállító választja azt a lehetőséget, hogy maga is publikálja saját tartalmát a weben. Ezek a változatok gyakran a legjobbak közé tartoznak, mert ők ismerik legjobban a tartalmat, és az annak megfelelő szoftverrel a lehető legtöbbet hozzák ki a fájlból. Az online szolgáltatóknak adatbázisaik tucatjainál vagy alkalmanként akár százainál is használt egységes interfészre, keresési űrlapra és output formátumra való tekintettel kell létrehozniuk újabb adatbázisaikat. Azok a fájlelőállítók, akik csak néhány adatbázist tesznek közzé a weben, tartalmukhoz igazíthatják azokat, annak kényszere nélkül, hogy meg kelljen felelni a meglevő tervezési keretnek, ahogy az a nagy online információszolgáltatók esetében történik.

Például a Responsive Database Services (RSD) számos adatbázis-kiadónak és információszolgáltatónak licencelte négy adatfájlját, de a sajátjuk a legjobb változat. Az ERIC Assesment and Evaluation Clearinghouse-ának (Mérési és Értékelési Ügynökségének, címe http://www.ericae.net) ingyenes ERIC változata összehasonlíthatatlanul jobb, mint a térítéses CARL változat. (A címen most csak az az információ szerepel, hogy az USA Oktatási Minisztériuma 2003. december 13-ával bezárta az összes ERIC Clearinghouse-t, így az ERICAE címe sem működik már, egyes szolgáltatásai más címen megtalálhatók (így a SearchERIC a http://SearchERIC.org címen, más szolgáltatásokat teljesen megszüntettek.) A Restaurant Guide adatbázis esetében a Zagat saját változata (http://www.zagat.com) mérföldekkel jobb az interfész, keresési és output lehetőségek szempontjából, mint amit a valamikori Microsoft Sidewalk változat (http://national.citysearch.com/?brand=sidewalk) ajánlott, annak ellenére, hogy a Microsoft igazán tudja, hogy kell az adatbázisokat megtervezni, s kétségtelenül megvan ehhez a szoftvere és személyzete egyaránt.


Adatbázis-készítő és -kereső szoftverek és készítőik

Ahhoz, hogy egy adatfájlból adatbázis készüljön, sokféle szoftverre van szükség. Két alapvető, egymástól jól elkülöníthető szoftver összetevőt használnak ennek a folyamatnak a során. Az egyik összetevő az adatbázis-építő eszköz, a buildware, amelyet az adatfájl adatelemeinek átszerkesztésére, konvertálására és a különböző indexek előállítására használnak. Ha egyszer az adatfájlt feldolgozták a buildware-rel, az eredmény a dataware, az eredeti tartalom módosított változata. Az adatfájllal ellentétben, amely szabványosított fájlformátum (megcímkézett, vesszőkkel és idézőjelekkel körülhatárolt, MARC [Machine Readable Catalog, format, géppel olvasható katalógus formátum], stb.), amelyet számos különböző program képes feldolgozni, a dataware olyan kizárólagos formátum, amelyet csak a searchware komponens képes olvasni, nem használhatja más szoftver. A searchware tartalmazza az interfészt, a navigációs rendszert, a súgó fájlokat, a parancs értelmezőprogramját és a keresőmotort. A dataware és a searchware együtt alkotja az adatbázist. Ezek integrálása hozza létre az adatbázist az adatfájlból a használók számára, de van egy harmadik összetevő is: a buildware.

Azoknak, akik keresnek az adatbázisban, nem kell tudniuk a buildware-ről, az adatbázis-előállító szoftverről. Ennek azonban fontos hatása van arra, hogyan lehet használni az adatbázist. A buildware határozza meg, melyik adatelemeket választják ki az adatfájlból (melyeket teszik böngészhetővé), hogyan hozzák létre az indexeket, hogyan szegmentálják a rekordot, melyik adatelemek kereshetőek stb.

A buildware-t és a searchware-t általában független szoftverfejlesztők fejlesztik ki, s tőlük licencelik őket azok, akik adatbázisokat akarnak készíteni az adatfájlokból. Ez különösen érvényes a CD-ROM adatbázisokra és azokra a webes adatbázisokra, amelyeket maguk a fájlok előállítói tesznek közzé. A CD-ROM adatbázisok esetében például az Online Computer Systems OptiWare szoftvere nagyon népszerű. Ezt licencelte többek között az R. R. Bowker teljes adatbázis-családja számára, sok nemzeti könyvtár nemzeti katalógusa CD-ROM változata számára és a Public Affairs Information Services PAIS adatbázisa számára. A Dataware Technologies CD-Answer szoftverét használják legszélesebb körben CD-ROM adatbázisokhoz.

Az adatbázisok weben való publikálására számos lehetőség van (Jacsó 1998d). Ezek sokszor létező adatbázis-kezelők továbbfejlesztett változatai. Az egyik legolcsóbb és legegyszerűbb webes adatbázis-kiadó szoftver a Reference WebPoster a Research Information Services cégtől. A Reference WebPoster bármely, a ProCite, Reference Manager és EndNote által készített adatbázist képes jól kereshető webes adatbázissá átalakítani. A jó minőségű szoftverek között megemlíthető az Inmagic Web Publisher szoftvere, amely a DB/Textworks által előállított adatbázisokat alakítja át kifinomult webes adatbázisokká. A CGI cég olcsó, teljes szoftvert ajánl, a Biblioscape-et, amely nem pusztán egy kiegészítő program. Teljes szolgáltatást végez, nemcsak arra képes, hogy meglevő adatfájlból adatbázist hozzon létre, de saját maga is képes adatfájlt készíteni. Ez Paul Chen nagy hozzáértéssel és lelkesedéssel tervezett munkája, aki olyan gyakorisággal aktualizálja és fejleszti szoftverét, hogy azt a legfőbb szoftverfejlesztő cégek is megirigyelhetik. Ez a fajta egyéni teljesítmény a web által kínált lehetőségeknek köszönhető.

Az online információszolgáltatók általában maguk fejlesztették ki és tartják karban buildware-üket és searchware-üket. A DIALOG, LEXIS-NEXIS, Bell & Howell, Ovid) nem adja át másoknak, bár egyesek a keresőszoftvert, a searchware összetevőt átadhatják egyetemeknek és cégeknek a dataware helyi felmásolására. A SilverPlatter esetében elég egyedi a forgatókönyv, mivel WebSPIRS szoftverét átadta az H. W. Wilson cégnek, amely egyik vetélytársa a webes adatbázis-kiadói küzdőtéren. Az OCLC elegáns SiteSearch buildware és searchware szoftverét helyi megvalósításra bármely adatfájl számára licenceli.


Adatbázis-kiadók

Az adatbázis-kiadók azok, amelyek integrálják a dataware-t és a searchware-t, továbbá dokumentációval és segítséggel szolgálják a használókat. A legtöbb adatbázis kiadó (pl. a DIALOG, Ovid, SilverPlatter) nem állít elő saját tartalmat (kivéve a segédfájlokat, mint a DIALOG Finder adatbázisok); helyette másoktól licencelik a tartalmat. Más adatbázis-kiadók csak saját tartalmukat publikálják. Ez a helyzet az H. W. Wilson cég esetében, és ez jellemezte a Bell & Howellt 1998-ig, amíg ez utóbbi kezdett licencelni néhány adatfájlt az H. W. Wilsontól. Egyes kiadók keverik saját tartalmukat másokéval. Az EBSCO Publishing és az OCLC a legjobb példák erre a változatra. Az EBSCO-nak megvannak a saját referáló és indexelő, teljes szövegű és címjegyzék adatbázisai, amelyeket mások által szolgáltatott tartalommal együtt tesz közzé. Az OCLC többek között saját közös katalógusát publikálja, továbbá sok olyan adatbázist, amelynek az adatfájlját másoktól licenceli.

Egyre több adatfájl előállító, tartalomszolgáltató vált maga is kiadóvá, legalábbis a webes platformon. Továbbra is licencelik tartalmukat adatbázis-kiadóknak, de maguk is a webre teszik tartalmukat. Ennek a megközelítésnek vannak hagyományai. A Bell & Howell, az Information Access Company (most a Gale Group része), az H. W. Wilson és a Gale széles körben népszerű tartalomszolgáltató és adatbázis-kiadó egyaránt. Ebben az esetben az arány az, ami új. Azok, akik csak egyetlen vagy néhány fájlt adtak ki, most meglovagolták a konjunktúrát. A Sociological Abstracts az egyik példa erre. Referáló és indexelő fájljukat legalább egy tucat online és CD-ROM kiadónak adták licencbe, és 1998-ban a cég (amely most a Cambridge Scientific Abstracts része) megjelentette saját változatát a weben. Elég szokatlan a fájl-előállítók körében, hogy visszavonják fájljukat az adatbázis kiadóktól akkor, amikor saját változatukat megindítják. Az még szokatlanabb, hogy ezt úgy teszik, hogy csak ingyenes változatot szolgáltatnak, az American Society of Civil Engineers azonban megtette ezt ASCE adatbázisával (Jacsó 1997d).

Az 1990-es évek elejéig a tartalom átadása CD-ROM-os adatbázisok számára kizárólagos volt. A SilverPlatternek volt a legnagyobb használói bázisa amiatt, mert kizárólagos hozzáférést biztosított néhány nagyon népszerű bibliográfiai adatbázishoz, mint például a PsycLIT és a Sociofile. Amikor az exkluzív szerződés lejárt, a CD-ROM-ok licencelése is követte a nem exkluzív licencelési modell mintáját. 2000-re a licencelési stratégiák a lehető legliberálisabbakká váltak, használói piac alakult ki. A Bell & Howell és az H. W. Wilson cégek a legjobb példák a keresztben való licencelésre. A Bell & Howell kiadja zászlóshajói, az ABI/INFORM, a Dissertation Abstracts, a Periodical Abstracts és a Magazine Express adatbázisok online és/vagy CD-ROM változatait, és ugyanakkor licencbe adja sok adatbázis kiadónak is. Ők is licencelik az H. W. Wilson cégtől annak néhány teljes szövegű adatbázisát, közreadva őket webhelyükön és/vagy CD-ROM-on. Referáló és indexelő, teljes szövegű, képi és teljes szövegű és képi változatait is felkínálják fájljaiknak CD-ROM-on és webhelyükön is, saját szoftverüket, a ProQuestet használva. Ezen felül rendelkeznek az INSPEC CD-ROM változatával, valamint az H. W. Wilson cég néhány referáló és indexelő fájljának CD-ROM és online változatával, köztük az Applied Science & Technology adatbázissal.

Az H. W. Wilson cég adatfájljait sok jelentős online szolgáltatónak adja át, köztük van az Ovid, a DIALOG, az OCLC, a SilverPlatter és a Bell & Howell. Az utóbbi kettő ugyancsak közread H. W. Wilson fájlokat CD-ROM-on. Az H. W. Wilson cég rendelkezik összes indexelő, referáló és teljes szövegű adatbázisának CD-ROM és online változatával. A CD-ROM szoftver saját fejlesztésű, a webes szoftver azonban a WebSPIRS szoftver adaptált változata. A fájlok előállítói, szoftverfejlesztők és adatbázis-kiadók közti poligám viszony nagyon előnyös az ügyfelek számára, mivel választhatnak bármilyen formát, amit kedvelnek, olyan szoftverrel, amelyet a legjobban ismernek végfelhasználóik.


Adatbázis szolgáltatási lehetőségek

A cégeknek és a felsőoktatási intézményeknek számos választási lehetőségük van ahhoz, hogy adatbázisaikat elérhetővé tegyék alkalmazottaik és diákjaik számára. Arra is megvan a lehetőségük, hogy teszteljék a lehetőségek hatékonyságát, mert a licenc megállapodások általában egy vagy két évre szólnak. Az adatbázisokat CD-ROM-on vagy online szolgáltathatják.

Hagyományos adatbázisok

Az 1980-as évek végén, az 1990-es évek közepén a CD-ROM nagyon népszerű alternatíva volt. Áttörést jelentett sok könyvtár számára, amely nem engedhette meg magának (s nem is volt képes felügyelni) a hagyományos, a használat mértékén alapuló online szolgáltatások igénybevételét, amelyek díjat fizettettek a kapcsolati időért és a megjelenített vagy kinyomtatott tételekért. Ezek az online szolgáltatások kapcsolt vonalas telefon összeköttetésen vagy bérelt vonalakon keresztül voltak elérhetőek, amelyek növelték a keresés költségeit. Hogy ez ne nőjön még jobban, az adatbázis szolgáltatásokat képzett közvetítők használták, nem a végfelhasználók.

A CD-ROM alternatíva egy vagy több számítógépen rögzített előfizetési díj mellett biztosítottak hozzáférést az adatbázisokhoz. Több használó párhuzamos hozzáféréséhez az adatbázis hálózati változatára volt szükség - általában jelentős többletköltségért. Az ilyen hozzáférés gyakran a válaszadási idő nagy mértékű növekedését eredményezte, s szabályrendszerre volt szükség az adatbázisok használati idejének beosztására. A hálózat működtetése jelentős telepítési és karbantartási erőfeszítéseket követelt meg a könyvtártól. A CD-ROM adatbázisok használata adott helyre korlátozódott. A viszonylag lassú hozzáférés eleve kizárta a távoli kapcsolódást az ilyen adatbázisokhoz, bár voltak sporadikus próbálkozások arra, hogy a CD-ROM adatbázisokat távoli számítógépekről használják. Ezek között a korlátok között hatékonyságuk nem csökkent olyan nagy adatbázisoknál, mint a ProQuest több száz CD-n levő adatbázisai, amelyek dokumentumok millióinak teljes szövegét tartalmazzák, sok közülük szöveg és grafika és képi formában.

A merevlemezek kapacitásának drámai növekedése és az ilyen tárolási eszközök árának hasonló mértékű csökkenése azonban a CD-ROM változat mellett az online változatoknak is utat nyitott. Ezt a folyamatot felgyorsította a gyors internet kapcsolat széleskörű elérhetősége. Az online modellhez való visszatérés kapcsán a legtöbb információszolgáltató elkezdett fix összegű előfizetési díjat kínálni. A díj általában az egyszerre hozzáférést kapó, párhuzamos használók számától függ - ezt automatikusan figyelik -, vagy egy cég alkalmazottainak vagy egy főiskola hallgatóinak teljes létszámától. A hozzáférést jelszóhoz vagy IP címhez köthető.

Az online változat lehet az adatfájl helyileg felmásolt változata, amelyet egy cég, főiskola vagy iskola licencel. Az Online Public Access Catalog (OPAC) programokat olyan lehetőségekkel ruházták fel, amelyek lehetővé teszik adatbázis építését, s olyan választási lehetőségeket kínálnak, amelyek nem voltak az eredeti online katalógus szoftverek részei, mint olyan keresési operátorok használata, amelyekkel meg lehet határozni a szavak sorrendjét és távolságát egy keresőkérdésben, hogy megkülönböztessük egymástól például az information industry és az industry information (információipar és ipari információ) vagy a library school és a school library (könyvtárosképző iskola és iskolai könyvtár) kifejezéseket. Az ilyen lehetőségekre szükség van olyan adatbázisokban, amelyekben hosszú, alapos referátumok vannak, s különösen teljes szövegű adatbázisok esetében. Alternatívaként egy intézmény azt a lehetőséget is választhatja, hogy előfizet távoli online adatbázisra (vagy adatbázisok csoportjára), amely(ek) valamelyik online információszolgáltatónál érhető(k) el. Ilyen esetekben a rendszer működtetésének és karbantartásának felelőssége az információszolgáltatóé.

Az 1990-es évek elejéig a legtöbb online szolgáltatás, amely az Interneten keresztül biztosított hozzáférést, a korlátozott Telnet szoftvertől függött, amely nem tette lehetővé a grafikus interfészt, a legtöbbször tisztán szöveges információkra korlátozódott - ez visszalépést jelentett a CD-ROM változatokhoz képest. Az 1990-es évek közepe óta a online adatbázisokhoz a web böngészőkön keresztüli hozzáférés vált dominánssá, amelyek grafikus interfészt és grafikus tartalmat ajánlanak.

Tenopir és Neufang (1995) vizsgálta azt, hogyan változtak több főiskolai könyvtár preferenciái az adatbázis szolgáltatási lehetőségek között. A tartalom elemzésének szempontjából ezek a szolgáltatási lehetőségek akkor kezdenek szerepet játszani, amikor a változatos tartalomhoz való hozzáférés biztosításának költségeit és hatékonyságát mérlegeljük.

A webre vitt és a weben született adatbázisok

Sok a félreértés a webes adatbázisokkal kapcsolatban. Sokan azt hiszik, hogy a webes adatbázisok ingyenesek. Semmi sem állhat távolabb az igazságtól, mint ez az állítás. Valójában több pénzes adatbázis van a weben, mint ingyenes. Nem segítette a kérdés megvilágítását, amikor a DIALOG korábbi legfőbb vezetője, Dan Wagner azzal a túlzó állítással jött, hogy a DIALOG-nak több információja van, mint ami az egész weben található. Mivel maga a DIALOG is a weben található, ez az állítás kétségtelenül hibás. Talán azt jelenti, hogy a DIALOG-nál több információ érhető el, mint a web többi részén. Ez sem igaz. Ha csak a Lexis-Nexist nézzük, amely szintén elérhető a weben, s még néhányat a weben található legnagyobb pénzes adatbázis szolgáltatások közül, s összeadjuk a rekordszámokat, akkor az is mutatja, hogy mennyire téves ez az állítás.

Amikor egy információforrás elérhető a weben, akkor helyesen webes adatbázisnak nevezhetjük - függetlenül attól, hogy ingyenes vagy pénzes. Ha egy létező adatbázist visznek át a kiadó saját telefonos rendszeréből (ilyen volt a legtöbb szakmai adatbázis), akkor ebben a könyvben az adatbázis webre vitt változataként utalunk rá. Ez illik a könyvben tárgyalt legtöbb online adatbázisra. Másrészt azonban, amikor egy adatbázist először a weben tettek közre, a könyvben weben született adatbázisként utalunk rá. Például a Books in Print adatbázis, amelyet a DIALOG, Ovid, OCLC, SilverPlatter és más hagyományos online szolgáltatók vittek a webre, webre került adatbázis. A Barnes & Noble, Amazon.com és Fatbrain adatbázisai azonban weben született adatbázisok.
Kezdőlap Előre