KÖZÉPKORI OKLEVELET FÚJ A SZÉL AZ INFO-SZTRÁDÁN

A középkori magyar történelem levéltári forrásainak adatbázisa (DIPL)

Vincze Endréné Géczy Gabriella, vgabi@helka.iif.hu
Magyar Országos Levéltár

Az előadás PowerPoint-os képei

Vissza a főlapra

Abstract

The most precious collection of the National Archives is the "Collection before Mohács (i.e. 1526)". The collection consists of two parts, the so-called Diplomatics Archives (DA) which collects all records before 1526 kept by the Hungarian National Archives (HNA), and the Diplomatics Photocopy Collection (DPC) which contains the photos (hard copies) of the medieval records kept not in the HNA but concerning the history of Hungary before 1526. These two collections - DA and DPC - include about 318.000 texts of docu-ments. The extreme high value and quantity of the collection made the computerized data processing necessary.

Intézményünk, a Magyar Országos Levéltár (MOL) egyik legértékesebb irategyüttese a Mohács előtti Gyűjtemény, amely az 738-1526 előtt keletkezett okleveleket és iratokat egységes rendszerben őrzi és tartja nyilván. A Gyűjtemény két részből áll, az ún. Diplomatikai Levéltárból (DL), amely a MOL-ban őrzött okleveleket, ill. a Diplomatikai Fényképgyűjteményből (DF), amely a történeti Magyarországra vonatkozó, ma már többségében határainkon kívül őrzött oklevelek fényképmásolatait foglalja magába. A DL/DF együttesen mintegy 318.000 dokumentum-szöveget tartalmaz. Az irategyüttes hallatlan értéke és mennyisége , az adatokhoz való hozzáférés és a kutatás elősegítése, valamint állományvédelmi szempontok tették szükségessé a számítógépes adatbázis kialakítását. A DL/DF - ről a Levéltárban két hagyományos segédlet állt korábban a kutatók rendelkezésére. Az irat meghatározó adatait tartalmazó időrendi mutatólap, a katalóguscédula az egyik, az oklevelek magyar nyelvű tartalmi kivonatát tartalmazza a másik (ez az ún. regeszta). A számítógépes feldolgozás első fázisában - 1983-1993 között - az időrendi mutatólapok adatainak bevitelére került sor. Ennek köszönhetően minden oklevélszövegről a nyolc leg-fontosabb adat ma már az adatbázis felhasználóinak rendelkezésére áll. A nyolc adat a következő: sorszám (az időrendi mutatólap sorszáma), az oklevél jelzete, kel-tezése, fennmaradási forma (eredeti, átírás, stb.), megjegyzés, régi jelzet, kiadó (az oklevél kibocsátója), valamint a pecsét adatai.

A munkálatok második szakaszaként 1994-ben megkezdtük a regeszták tartalmi elemzéséhez a szöveganalízis módszereinek kidolgozását, melyet a dokumentumok feltárásának gyakorlati munkája követett. Az adatbázis építésében az 1996-os év fordulópontot jelentett, mert ebben az évben megkezdtük az adatbázisépítés második fázisát. A munka során tükröztük az adatbázisba az adatok attribútumait, és az attribútumok egyedtípusait is, majd illesztettük a regeszta szövegét, és szövegfeldolgozását a már bevitt rekordokhoz.

Az egyedtípusok, melyek lefedik az élet iratokba foglalható lehetséges aspektusainak egészét, ezen aspektusok (másképpen szólva témakörök) szerinti keresésre adnak módot azon túl, hogy a BRS/Search szöveges adatbáziskezelő az attribútumok szerinti keresésre természetes lehetőséget kínál. E kettős lekérdezés megteremtését az indokolja, hogy magában a regesztákban a homonimák és szinonimák előzetes teljes körű feltárására és kiküszöbölésére nem láttunk reális esélyt. Intézményünk erőfeszítései révén és az IIF pályázaton 1996-ra elnyert összeg segítségével 10.000 rekordhoz illesztettünk oklevélszöveg-analitikát, s ezzel az 1438-1453 közötti levéltári források már - a regeszták által feltárt témakörökben - teljeskörűen kutathatók.

Az adatbázis érdeklődésre tarthat számot a történettudomány, a középkor, az oklevéltan, a helytörténet, a társadalomtudomány, gazdaságtörténet, valamint a nyelvészet, a régészet és a geográfia művelőinek körében.

Az adatbázis szerkezete

Az adatbázis megnevezése: A középkori magyar történelem levéltári forrásainak adatbázisa.

Rövidített neve: DIPL

Rekordstruktúra:

Paragrafusnév Rövid magyarázat

-A DOCN paragrafus a rekord azonosítóját tartalmazza,

-a SRSZ paragrafus a katalóguscédula adott éven belüli sorszámát adja meg,

-a KELT paragrafusban, nem teljesen azonosítható keltezés esetén ezt jelezzük: e=előtt, k=körül, u=után keletkezett a dokumentum.

-a FEFO paragrafus rövidítve jelöli az oklevél fennmaradási formáját. Lehetséges variációk: Á = átírás, E = eredeti, F = formulárium, M = másolat, P =protokollum, T = tartalmi átirat, X = áthelyezve. Bizonyos esetekben (átírás, másolat, tartalmi átirat) a paragrafus tartalmaz dátumot vagy évkört;

-a RJEL paragrafus négy numerikus karakterből álló kóddal kezdődik, ami az eredeti oklevélgyűjtő helyet azonosítja.

-a SIGI paragrafus az oklevélen található pecsét(ek)et és azok számát írja le.

Jelölések: A = alul, F = függô, H = hátlapon, Z = záró pecsét, stb.

Személynevek a DIPL adatbázisban:

- a KIBO, a CÍMZ, a KEDV, a SZEM paragrafus mondatokra van felbontva. A mondatok rövid címkékkel kezdődnek. A rövid címkék segítségével a keresőkérdés pontosítható. Pl. SZENTMIHÁLY kérdésre mindazokat az okleveleket megkapjuk, melyekben a SZENTMIHÁLY név helynévként, és személynévként is szerepel. Ha csak az egyikre vagyunk kíváncsiak, akkor további pontosítást kell tennünk a rövid címkék segítségével.

Az adatbázis fenti paragrafusaiban tárolt rövid címkék:

Kiadó adatai

Címzett

Kedvezményezett

Kedvezményezett

Helynevek a DIPL adatbázisban:

Az adatbázis fenti paragrafusaiban tárolt rövid címkék:

Például:

Keltezés helye

Helységnevek:

A megjelenítésre különböző formátumok állnak rendelkezésre.A lehetséges formátumok kikapcsolása után kapjuk meg a nyers adatstruktúrát.

Pl.

ISIS sorszám

Sorszám

Jelzet

Keltezés

Nyelve

Fennmaradási forma

Megjegyzés

Régi jelzet

Kedvezményezett

Személyek adatai

Irattípus

Jog

Keltezés helye

Helységnevek

Történelem

Pecsétek leírása

Regeszta szövege

Az adatbázis a NIIF Helka számítógépén érhető el; a login is, és a password is 'brsguest'.

Az adatbázisban való keresés eredményhalmazainak megjelenítésére különböző formátumok állnak rendelkezésre, melyeket a ..what format paranccsal kérdezhetünk le. A karakteres felületű formátumok a fent bemutatott rekordstruktúrát élvezhető, az olvasott szövegnél megszokott módon tárják elénk, magát a struktúrát csak az érthetőség szintjéig mutatják, a témaköröket megnevezve. Ezen túl grafikus és webes felületet is terveztünk a DIPL-hez, a WEB-es felületű DIPL adatbázis e konferencián Király László-Fazekas Emőke: IIF adatbázisok új, WEB-es köntösben c. előadásában kerül bemutatásra.