6. A rekord tartalma

Az adatbázisok jelentős mértékben különböznek egymástól abból a szempontból, hogy mennyi információt szolgáltatnak a forrásdokumentumokról, bemutatott személyekről vagy tárgyakról. A megjelenített információ strukturáltsága szempontjából is nagy különbségek lehetnek. Mindezeknek hatása lesz arra, hogy a tartalom hogyan indexelhető, kereshető vagy jeleníthető meg a képernyőn vagy nyomtatásban. A legfontosabb az, hogy ez lesz a legfőbb oka a végeredmény különbségeinek, annak, amit a használó kap.


Bibliográfiai adatelemek

Azoknak az adatelemeknek a köre, amelyeknek szerepelniük kell egy rekordban, nagyban függ az adatbázistól. Az alapvető bibliográfiai adatokon túl (szerző, cím, folyóiratcím, kronológiai vagy numerikus adatok, oldalszám) a kiegészítő adatelemek azok, amelyek leginkább megkülönböztetik az adatbázisokat. Ezeket az adatelemeket értéknövelt információknak nevezzük, s olyan elemek tartoznak közéjük, amelyek növelik a korábbiakban említett bibliográfiai adatokat, például a következőkkel:

- Címkiegészítés, amely megmagyarázza a címet.

- Az oldalak, sorok vagy szavak teljes száma.

- A grafikonok, fotók és illusztrációk jelzése.

Jól illusztrálja a különbségeket, ha ezeket a bibliográfiai adatokat három bibliográfiai adatbázisban hasonlítjuk össze ugyanarra a cikkre vonatkozóan. Az oldalszám a ProQuest-ben (6.1a. ábra) és a sorok és szavak száma a Magazine Database-ben hasznos tájékoztatást ad. A ProQuestben azonban a különböző azonosítók zavaróak és nem kellene szerepelniük egy bibliográfiai rekordban. A Readers' Guide Abstracts (RGA) (6.1b. ábra) a legvilágosabb a forrás bibliográfiai adatai szempontjából, de más szempontból ez a formátum nem jeleníti meg az RGA legértékesebb tartalmi elemét - a nagyon informatív referátumokat (ezeket később tárgyaljuk meg). A Gale Group Magazine Database-e tartalmazza a legjobb címinformációkat, hosszú alcímmel és informatív címkiegészítéssel (6.1c. ábra).

Nagyítás

6.1a. ábra: Ugyanazon cikk bibliográfiai leírásainak összehasonlítása (ProQuest)

Nagyítás

6.1b. ábra: Ugyanazon cikk bibliográfiai leírásainak összehasonlítása (RGA)

Nagyítás

6.1c. ábra: Ugyanazon cikk bibliográfiai leírásainak összehasonlítása (Gale Group Magazine Database)

A cégek címjegyzékeiben az alapvető elemek közé tartozik a cégek neve, címe, telefon- és faxszámai, e-mail címe (mostanában az URL-je is). Az időszaki kiadványok címjegyzékeiben a minimálisan megkövetelt bibliográfiai adatok közé tartozik a folyóirat címe, korábbi címe, újabb címe, ISSN száma, a kiadás országa, kiadója és indulási éve (megszűnésének éve, ha az is van) (és itt is a kiadónak vagy magának a folyóiratnak az URL-je). Bár ez szoftver kérdése, érdemes megemlíteni, hogy a DIALOG-nak nagy hibája az, hogy nem ajánl fel közvetlenül kattintható ugrópontokat a megjelenített rekordokból azokhoz, amelyekben ugyanaz a szerző, tárgyszó vagy folyóiratcím szerepel, pedig ez általános gyakorlat a legtöbb online információszolgáltatónál. Ennek a funkciónak a hiánya azt is jelenti, hogy a rekordban szereplő URL-ek hidegek (azaz passzívak) a DIALOG-nál. Az Ulrich's Ovid változatában ugyanazon időszaki kiadvány rekordjában olyan közvetlenül kattintható URL van, amely elvisz minket a kiadó vagy a folyóirat weblapjára (6.2. ábra).

Nagyítás

6.2. ábra: Az Ulrich's Ovid változata közvetlenül kattintható
ugrópontot szolgáltat a kiadó és a folyóirat weblapjához.

Egy életrajzi gyűjteményben a legalapvetőbb elemek közé tartozik a név, nem, születési és halálozási dátum, foglalkozás vagy szakma, a híresség oka. A 6.3. ábra megmutatja a Gale Group Biography Resource Centerben elérhető kategóriák választékát. Amit a Gale tömör (egy hüvelykujj körmére ráférő) életrajznak hív, az gyakran sokkal több ennél - közel áll egy életrajzi esszéhez. Az H. W. Wilson cég Biographies Plus Illustrated adatbázisából a 6.4. ábra egy részletet mutat ifjabb JFK jól szerkesztett életrajzából. Ezzel a két életrajzi forrással éles ellentétben állnak - elég csak az alapvető életrajzi információkat megnézni - a Merriam-Webster Biographical Dictionary (6.5. ábra) fájdalmasan rendszerezetlen életrajzi tételei. Ezek a nyomtatott kiadás zsúfolt szerkezetét tükrözik, s nem ajánlanak fel semmilyen külön hozzáférési pontot a tárgyként szereplő személy családi nevén kívül. Ez tankönyvbe illő példája annak, hogyan nem szabad digitális változatot készíteni egy nyomtatott referenszforrásból.

Nagyítás

6.3. ábra: Részlet a Gale Group Biography Resource Centerének egy tételéből.

Nagyítás

6.4. ábra: Részlet az H. W. Wilson cég Biographies Plus Illustrated adatbázisának egy tételéből.

Nagyítás

6.5. ábra: Egy tétel a Merriam-Webster Biographical Dictionaryből.


Értéknövelt adatelemek

Látszólag apró elemek tehetik a keresést sokkal hatékonyabbá, s könnyíthetik meg a legrelevánsabb cikkek kiválasztását az eredmények halmazából. Egyeseket igazán könnyű megadni (mint például a nyelvet vagy a dokumentumtípust), mások több munkát igényelhetnek (mint például a szerző munkahelye, egységesített formában). Meglepő, hogy miért nem használnak egyszerű elemeket rekordok tökéletesítéséhez. Például nehéz megérteni, hogy az Ulrich's International Periodicals Directory miért nem tartalmaz nyelvi mezőt; miért nincs a LISA-ban dokumentumtípus mező (kivéve a folyamatban levő kutatások jelentéseit), hogy el lehessen különíteni a konferencia előadásokat a folyóiratcikkektől és a szemléktől; miért nem szerepel a LISA adatbázisban a kiadás (megjelenés) országa mező; a Merriam-Webster Biographical Dictionary miért nem tartalmazza a nemet, amely gyakran szükséges keresési szempont. Az ilyen adatelemek szerepeltetése a rekordban és indexelése rendkívül egyszerű módja annak, hogy értéket adjunk a rekordokhoz és a keresést sokkal hatékonyabbá tegyük.

A további adatelemek iránti igény az adott adatbázistól függ. Az ember nem várna nyelvi mezőt az ABI/INFORM adatbázisban (de mégis van benne), mert a rekordok 99,99 százaléka angol nyelvű dokumentumokra vonatkozik.

A cikkek hosszúság szerinti osztályozása a UMI Magazine Express adatbázisában (rövid, közepes, hosszú) kiváló eszköz ahhoz, hogy a keresést csak terjedelmes cikkekre korlátozhassuk, elkerülve a rövid cikkek özönét olyan aktuális eseményekről, mint az elnök elleni felelősségrevonási per. A Magazin Express érdemének lehet azt is tekinteni, hogy egyes adatbázisaiban jelzi a folyóirat típusát (akadémiai, a nagyközönségnek szóló stb.), hogy arra lehessen szűkíteni a keresést és orientálni a használót a keresés eredményének áttekintésekor.

Az EBSCO valami hasonló lehetőséget ajánl, lehetővé téve, hogy a keresést a lektorált folyóiratokra lehessen szűkíteni (ennek a kiegészítő adatelemnek a használatával). (A folyóirat lektorált voltáról szóló információ megbízhatósága más kérdés.) Ahogy azt a 7., a pontossággal foglalkozó fejezetben megtárgyaljuk, ez az információ gyakran pontatlan az EBSCO Serials Directory című adatbázisában (és az Ulrich's adatbázisban is). Nyilvánvaló, hogy ez ellehetetleníti ennek az adatelemnek a szűrőként való használatát. Az H. W. Wilson cég adatbázisainak saját WilsonWEB-es változatában szintén szolgáltat olyan értéknövelő információt, mint a folyóiratok lektoráltsága, és - mint általában - ez pontos is a könyvtár- és információtudomány területén, ahol meg tudtam ítélni. Ez a fajta értéknövelt adatelem egyedi, mert nem minden egyes rekordhoz kapcsolják, csak a folyóirathoz.

Az értéknövelt információ hasznos lehet a böngészés, a keresés és az eredmény megjelenítése során. Bár valószínűtlen, hogy bárki böngészni akarná a folyóiratok ISSN mezőjét egy referáló és indexelő adatbázisban annak érdekében, hogy egy ígéretes ISSN számot fogjon ki, a folyóiratok ISSN számának megjelenítése különösen hasznos olyankor, amikor a használónak könyvtárközi kölcsönzési kérésre van szüksége. Az a mód, ahogy a Bell & Howell nem változtatja meg a folyóirat kódját olyankor, amikor a cím megváltozik, egyszerűsítheti a keresést.

Ahelyett, hogy meghatároznánk egy folyóirat korábbi és mostani címét egy keresésben, mint például FIND JN=(Laserdisk Professional OR CD-ROM Professional OR E Media Professional) a DIALOG-nál, a ProQuestnél a folyóirat kódjának JC (LDP) használatával végzett keresés meg fogja találni a rekordokat a folyóirat címe három verziójának bármelyikéből (6.6. ábra). Az más kérdés, hogy a folyóirat új címe sohasem válthatja fel a korábbi címet a rekordokban visszamenőlegesen, mint ahogy az megtörtént a Proquestben néhány folyóirattal, mint például a Database-zel, amely 1999-ben EContentre változtatta címét. Helytelen dolog megjeleníteni rekordokat, mondjuk a folyóirat 1996-os számaiból úgy, hogy a folyóirat címeként EContent szerepel.

A könyvkritikák esetében a kiegészítő adatelemek között szerepelhet a bírált könyv ISBN száma, és az az osztályzat is, amelyet az indexelő adott a kritikus kommentárjainak elemzése után. Ez az utóbbi alkalmazható filmek, színházi előadások és kiállítások kritikáira is (6.7. ábra).

Nagyítás

6.6. ábra: Állandó folyóiratkódok használata a korábbi és a mostani címek megtalálásához.

Nagyítás

6.7. ábra: A kritikák osztályzatai a Periodical Abstracts adatbázisban.

A dokumentumtípusok meghatározása gyakran alkalmazott s jó eszköz a használó számára nem releváns dokumentumtípusok, például jelentések vagy könyvkritikák kiszűrésére. Kevésbé általános az, amikor a cikkek között megkülönböztetik az elméleti és a gyakorlati jellegűeket, ahogy az az INSPEC adatbázisban történik, amely a treatment (téma megközelítési mód) mezőt használja (6.8. ábra). Az ERIC hasonló értéknövelt információt használ a feldolgozott dokumentumok célközönségének (target audience) megkülönböztetésére. Ez az adatbázis Ovid változatában kereshető és böngészhető is (6.9. ábra). A két adatbázis egyikében sem érhetők el ezek az értéknövelt információk minden rekordban.

Nagyítás

6.8. ábra: Az INSPEC adatbázis cikkeinek téma megközelítési mód kódja.

Nagyítás

6.9. ábra: Az ERIC adatbázis célközönség indexe az Ovidnál.

Az értéknövelt információk következő szintjét a forrásdokumentumhoz kapcsolt osztályozási jelzetek és tárgyi kifejezések reprezentálják. Ebből a szempontból nagy változatosság van az adatbázisok között, ahogyan azt a 10., a tárgyi indexelés minőségével foglalkozó fejezetben megtárgyaljuk.

Az eredeti dokumentumok referátumai és összefoglalói értéknövelő elemek maradnak akkor is, amikor a dokumentum teljes szövege elérhető. A referátumok szerkezetének, olvashatóságának és informatív jellegének fontos megkülönböztető funkciója van a legtöbb, a nagyközönségnek szóló periodikumokat feldolgozó adatbázisban. Az ilyen típusú dokumentumokat feldolgozó adatbázisok primer forrásaiban nincs szerzői referátum. Ez különbözik a tudományos és akadémiai folyóiratok többségétől, amelyeket a tudományos, műszaki és orvosi adatbázisok dolgoznak fel. Ezeknek a fájloknak a készítői általában szerepeltetik az eredeti referátumokat, s csak alkalmanként módosítják őket, s nem nagyon készítenek sajátokat.

A referátumok értékelését a 11., a referátumok minőségével foglalkozó fejezet tárgyalja részletesen. Itt elég annyit mondani, hogy a referátumok azok az adatelemek, amelyek a legtöbb intellektuális munkát követelik meg, hacsak nem a folyóiratból emelik ki őket. Érdemes azt is megjegyezni, hogy a referátum hossza nem feltétlenül jelzi a rekord informativitását, de az nyilvánvaló, hogy a hosszabb referátumok nagyobb valószínűséggel tartalmaznak több információt. Ezen felül az értéknövelő információt tartalmazó mezők jelenléte önmagában nem elegendő. A hozzáadott értékek akkor tölthetik be szerepüket, ha következetesen és pontosan alkalmazzák őket. Ezt tárgyaljuk meg a 7., a pontosságról, a 8., a következetességről és a 9., teljességről szóló fejezetben.

A primer dokumentumok teljes szövegének elérhetősége a rekordokban nyilvánvalóan nagy érték. Különböző módjai vannak azonban annak, hogy a teljes szöveget hogyan teszik elérhetővé. A sima ASCII formátum úgy tartalmazza a szöveget, hogy nem őrzi meg az eredeti tipográfiát. Azonban még ezen a szinten is különbségek vannak a szöveg olvashatóságában és az OCR (optikai karakterfelismerési) folyamat minőségében. A 6.10. és a 6.11. ábra ugyannak a teljes szövegű dokumentumnak ugyanazt a részletét mutatja.

Nagyítás

6.10. ábra: Részlet az ABI/INFORM adatbázis egy rekordjából a DIALOG-nál.

Nagyítás

6.11. ábra: Részlet az ABI/INFORM adatbázis egy rekordjából az Ovidnál.

A teljes szöveg kiegészülhet ábrákkal, grafikonokkal, táblázatokkal és fotókkal, amelyeket nem reprodukálnak a cikk teljes szövegű változatában. Az ABI/INFORM megadja az ábrák címét, s jelzi, hogy honnan hagytak ki ábrát a szövegből. A Wilson Business Abstracts and Full Text adatbázis nem említi meg a kihagyást a megfelelő helyen, s csak a cikk legvégén adja meg az ábrák címét. A legegyszerűbb a sima szöveges formátum, amely tartalmazza a képaláírásokat és jelzi az illusztráció helyét (6.12. ábra). A szöveg plusz grafika formátum tartalmazza az illusztrációnak a kisméretű változatát (6.13. ábra). Ez kinagyítható kétszeresére vagy négyszeresére és így jól olvashatóvá válik (6.14. ábra). Az eredeti cikk szöveges része tipográfiájának megtartása kétségtelenül érték.

Sok újságnak és folyóiratnak van jellegzetes betűtípusa és elrendezése, szedéstükre, az eredeti szöveg vastagított és dőltbetűs írásmódjának megőrzése nagy mértékben javíthatja a megértést. A ProQuest harmadik formátuma az eredeti oldal teljes képét visszaadja. A szöveg általában olyan jó, mintha fénymásolóval készült volna (6.15. ábra). Úgy tűnik, hogy az ábrák minősége sokkal inkább az eredetitől függ, mint a szöveges rész minőségétől. Bár több nagyítási lehetőség van ebben a formátumban, mint a szöveg plusz kép formátumban, a minőség nem olyan jó, és az egész oldalt kinagyítják, ez a navigációt valamennyire nehézkessé teszi, de még mindig megéri (6.16. ábra).

Nagyítás

6.12. ábra: Részlet az ABI/INFORM adatbázis egy rekordjából a ProQuestnél.

Nagyítás

6.13. ábra: Szöveg plusz grafika formátum a ProQuestnél.

Nagyítás

6.14. ábra: A kinagyított képi összetevő a ProQuestnél.

Nagyítás

6.15. ábra: Részlet egy ABI/INFORM rekord képi változatából a ProQuestnél.

Nagyítás

6.16. ábra: A kinagyított kép a ProQuestnél.

Egyes online szolgáltatók speciális szolgáltatást ajánlanak, amely különböző referáló és indexelő és teljes szövegű adatbázisok összekapcsolását használják ki. Az Ovid volt az úttörője ennek a technikának, s ők mutatták a legnagyobb fejlődést ezen a területen. Feltételezve, hogy a használóknak hozzáférésük van a megfelelő fájlokhoz, rákattinthatnak egy teljes szövegű adatbázisban a cikk végén a REFERENCES (hivatkozások) feliratra, s megjeleníthetik a teljes bibliográfiai rekordot, benne az indexelő és referáló adatbázisból származó referátummal.

A 6.17. ábra a Mental Health Collection adatbázis Ovid változatának egy teljes szövegű rekordjából mutat egy részletet. A REFERENCES feliratra való kattintás megjeleníti a hivatkozások listáját. Ezek közül egyesek a PsycINFO, a MEDLINE vagy a BIOSIS adatbázishoz (vagy ezek kombinációjához) lesznek ugrópontok (6.18. ábra). Ha ezek valamelyikére rákattintunk, a kiválasztott adatbázisból a teljes bibliográfiai rekord meg fog jelenni, a referátummal együtt. A fordítottja is lehetséges - azaz egy indexelő és referáló adatbázisból átugorhatunk egy teljes szövegű adatbázis egy rekordjába (amelyhez a használónak szintén hozzáférési joga van). Az ugrópontot olyan jól megtervezték, hogy még akkor is képes elérni a rekordot, ha elírások vannak a szerző nevében, mint a BIOSIS rekordja esetében, amelyben a Kanin név Kianin formában szerepel (nincs rá illusztráció).

Nagyítás

6.17. ábra: Részlet az Ovid Mental Health Collectionének egy teljes szövegű rekordjából.

Nagyítás

6.18. ábra: Bibliográfiai adatok a referátumokkal ellátott bibliográfiai rekordokhoz vezető ugrópontokkal.

Az életrajzi gyűjtemények kategóriájában mind a Gale Group Biography Resource Centere (BRC), mind az H. W. Wilson cég Biographies Plus Illustrated adatbázisa teljes szövegű forrásnak minősíthetők alapos és kitűnően strukturált és szerkesztett életrajzaik miatt. Sok értéknövelt információt kínálnak, mint például nem, nemzetiség, születési és halálozási hely és dátum, amelyek a keresést nagyon hatékonnyá teszik.

Más életrajzi forrásokban ezeket az információkat többnyire egybemossák az elég rövid leíró szövegrésszel, ami elég nehézzé teszi azt, hogy úgy keressünk a korábbi információkra, hogy ne találjunk sok hamis rekordot is. A Gale Group (6.19. ábra) és az H. W. Wilson cég (6.20. ábra) életrajzi adatbázisai sok életrajzi tételhez kapcsolnak képet, ahogy azt a 6.3. és a 6.4. ábrák mutatták.

A Gale Group és az H. W. Wilson cég két életrajzi adatbázisa azzal is speciális hozzáadott értéket szolgáltat, hogy a teljes szövegű adatbázisaikban található szemlecikkekkel, kritikákkal és híranyagokkal is összekapcsolják a rekordokat. (Az, hogy a Gale Group 1999-ben megvásárolta az IAC-t, jelentősen gazdagította referensz adatbázisainak gyűjteményét.)

Nagyítás

6.19. ábra: Ugrópont a kritika teljes szövegéhez a BRC adatbázisból.

Nagyítás

6.20. ábra: Ugrópont a kritika teljes szövegéhez a BP adatbázisból.

A kereshetőség szükségessé teszi, hogy meghatározzuk azokat az információkat, amelyek a nyomtatott referáló és indexelő szolgáltatás olvasói számára feltehetőleg egyértelműek, amikor a nyomtatott kötet oldalait átnézik, mint például a nyelv vagy az eredeti dokumentum típusa (konferencia előadás, cikk vagy könyvkritika). Az ilyen jellemzőket egyértelművé kell tenni az eredmények hatékony szűrése érdekében. Még a bibliográfiai leírások strukturálása is fontossá válhat az indexelés és keresés érdekében. A National Criminal Justice Reference Service (NCJRS) előállítója nem különíti el a folyóirat címétől az egyes számok megjelenési idejét és számozását (6.21. ábra).

Ez visszafelé sül el, amikor a folyóiratcímek indexét akarjuk böngészni, s számos képernyőn kell lecsorognunk, amíg az egyik folyóirattól eljuthatunk a következőig, miközben ugyanazon folyóirat különböző köteteire és számaira vonatkozó tételek tucatjain (ha nem százain) kell átküzdenünk magunkat.

Az Adolescence (Kamaszkor) című lap összes tételén való átvergődés még a tinédzser gyerekek szüleit is türelmetlenné tenné. Hasonló módon a PaperChem adatbázisban az Abbey Newsletter tételeinek átnézése (6.22. ábra) egy szent türelmét is próbára tenné. Nem csak arról van szó, hogy ez a szakszerűtlen megoldás ellentétes a folyóiratcímek összehozásának céljával, de sokba is kerül a használónak.

Nagyítás

6.21. ábra: Tételek az évfolyamok, számok és oldalszámok adataival az NCJRS folyóiratindexében.

Az ISA tárgyi kód indexében való böngészés rendkívül zavaró a kódok rosszul szerkesztett szöveges megfelelői miatt (6.23. ábra). Például a 04.08 kód mind az Information Generation and Promulgation, mind az Information Recognition and Description tárgyszóra vonatkozik, ahogyan azt az ábrán található első két tétel sugallná? A 04.09 és a 04.10 kódok szintén ehhez a két fogalomhoz kapcsolódnak? Miért van olyan sok különböző kódja az Information Processing and Control és az Information Systems and Applications fogalmaknak, anélkül, hogy bármilyen különbség lenne szöveges megfelelőjükben?

A válasz ezekre a kérdésekre az, hogy ezek főtárgyszavak, s megkülönböztető altárgyszavak nem láthatók az indexben - s nem is kereshetőek. A rekordokban láthatóak (6.24. ábra). Amikor megjelenítik őket egy, az információtudománnyal foglalkozó adatbázisban, egy kis információs technika és józan ész nem ártana. A tárgyszó szöveges részének két almezőre bontása (főosztály és alosztály) egyszerű módon megoldaná a problémát.

Nagyítás

6.22. ábra: Tételek kronológiai-numerikus adatokkal a PaperChem folyóiratindexében.

Nagyítás

6.23. ábra: Különböző tárgyi kódok szemmel láthatóan ugyanahhoz a tárgyi kifejezéshez kapcsolódóan az ISA indexében.

Nagyítás

6.24. ábra: Tárgyi kódok és szöveges megfelelőjük a megjelenített rekordokban.
Hátra Kezdőlap Előre