KÖZÉPKORI OKLEVELET FÚJ A SZÉL AZ INFO-SZTRÁDÁN
A középkori magyar történelem levéltári forrásainak adatbázisa (DIPL)
Vincze Endréné Géczy Gabriella, vgabi@helka.iif.hu
Magyar Országos Levéltár
Abstract
The most precious collection of the National Archives is the "Collection before Mohács (i.e. 1526)". The collection consists of two parts, the so-called Diplomatics Archives (DA) which collects all records before 1526 kept by the Hungarian National Archives (HNA), and the Diplomatics Photocopy Collection (DPC) which contains the photos (hard copies) of the medieval records kept not in the HNA but concerning the history of Hungary before 1526. These two collections - DA and DPC - include about 318.000 texts of docu-ments. The extreme high value and quantity of the collection made the computerized data processing necessary.
Intézményünk, a Magyar Országos Levéltár (MOL) egyik legértékesebb irategyüttese a Mohács előtti Gyűjtemény, amely az 738-1526 előtt keletkezett okleveleket és iratokat egységes rendszerben őrzi és tartja nyilván. A Gyűjtemény két részből áll, az ún. Diplomatikai Levéltárból (DL), amely a MOL-ban őrzött okleveleket, ill. a Diplomatikai Fényképgyűjteményből (DF), amely a történeti Magyarországra vonatkozó, ma már többségében határainkon kívül őrzött oklevelek fényképmásolatait foglalja magába. A DL/DF együttesen mintegy 318.000 dokumentum-szöveget tartalmaz. Az irategyüttes hallatlan értéke és mennyisége , az adatokhoz való hozzáférés és a kutatás elősegítése, valamint állományvédelmi szempontok tették szükségessé a számítógépes adatbázis kialakítását. A DL/DF - ről a Levéltárban két hagyományos segédlet állt korábban a kutatók rendelkezésére. Az irat meghatározó adatait tartalmazó időrendi mutatólap, a katalóguscédula az egyik, az oklevelek magyar nyelvű tartalmi kivonatát tartalmazza a másik (ez az ún. regeszta). A számítógépes feldolgozás első fázisában - 1983-1993 között - az időrendi mutatólapok adatainak bevitelére került sor. Ennek köszönhetően minden oklevélszövegről a nyolc leg-fontosabb adat ma már az adatbázis felhasználóinak rendelkezésére áll. A nyolc adat a következő: sorszám (az időrendi mutatólap sorszáma), az oklevél jelzete, kel-tezése, fennmaradási forma (eredeti, átírás, stb.), megjegyzés, régi jelzet, kiadó (az oklevél kibocsátója), valamint a pecsét adatai.
A munkálatok második szakaszaként 1994-ben megkezdtük a regeszták tartalmi elemzéséhez a szöveganalízis módszereinek kidolgozását, melyet a dokumentumok feltárásának gyakorlati munkája követett. Az adatbázis építésében az 1996-os év fordulópontot jelentett, mert ebben az évben megkezdtük az adatbázisépítés második fázisát. A munka során tükröztük az adatbázisba az adatok attribútumait, és az attribútumok egyedtípusait is, majd illesztettük a regeszta szövegét, és szövegfeldolgozását a már bevitt rekordokhoz.
Az egyedtípusok, melyek lefedik az élet iratokba foglalható lehetséges aspektusainak egészét, ezen aspektusok (másképpen szólva témakörök) szerinti keresésre adnak módot azon túl, hogy a BRS/Search szöveges adatbáziskezelő az attribútumok szerinti keresésre természetes lehetőséget kínál. E kettős lekérdezés megteremtését az indokolja, hogy magában a regesztákban a homonimák és szinonimák előzetes teljes körű feltárására és kiküszöbölésére nem láttunk reális esélyt. Intézményünk erőfeszítései révén és az IIF pályázaton 1996-ra elnyert összeg segítségével 10.000 rekordhoz illesztettünk oklevélszöveg-analitikát, s ezzel az 1438-1453 közötti levéltári források már - a regeszták által feltárt témakörökben - teljeskörűen kutathatók.
Az adatbázis érdeklődésre tarthat számot a történettudomány, a középkor, az oklevéltan, a helytörténet, a társadalomtudomány, gazdaságtörténet, valamint a nyelvészet, a régészet és a geográfia művelőinek körében.
Az adatbázis szerkezete
Az adatbázis megnevezése: A középkori magyar történelem levéltári forrásainak adatbázisa.
Rövidített neve: DIPL
Rekordstruktúra:
Paragrafusnév Rövid magyarázat
-A DOCN paragrafus a rekord azonosítóját tartalmazza,
-a SRSZ paragrafus a katalóguscédula adott éven belüli sorszámát adja meg,
-a KELT paragrafusban, nem teljesen azonosítható keltezés esetén ezt jelezzük: e=előtt, k=körül, u=után keletkezett a dokumentum.
-a FEFO paragrafus rövidítve jelöli az oklevél fennmaradási formáját. Lehetséges variációk: Á = átírás, E = eredeti, F = formulárium, M = másolat, P =protokollum, T = tartalmi átirat, X = áthelyezve. Bizonyos esetekben (átírás, másolat, tartalmi átirat) a paragrafus tartalmaz dátumot vagy évkört;
-a RJEL paragrafus négy numerikus karakterből álló kóddal kezdődik, ami az eredeti oklevélgyűjtő helyet azonosítja.
-a SIGI paragrafus az oklevélen található pecsét(ek)et és azok számát írja le.
Jelölések: A = alul, F = függô, H = hátlapon, Z = záró pecsét, stb.
Személynevek a DIPL adatbázisban:
- a KIBO, a CÍMZ, a KEDV, a SZEM paragrafus mondatokra van felbontva. A mondatok rövid címkékkel kezdődnek. A rövid címkék segítségével a keresőkérdés pontosítható. Pl. SZENTMIHÁLY kérdésre mindazokat az okleveleket megkapjuk, melyekben a SZENTMIHÁLY név helynévként, és személynévként is szerepel. Ha csak az egyikre vagyunk kíváncsiak, akkor további pontosítást kell tennünk a rövid címkék segítségével.
Az adatbázis fenti paragrafusaiban tárolt rövid címkék:
Kiadó adatai
A: 01
B: KIRÁLY
D: ZSIGMOND
Címzett
A: 35
C:BÍRÓSÁGOK
Kedvezményezett
A: 05
B: HERCEG
C: OPPELNI
D: THEODORUS (KIRÁLY NAGYBÁTYJA)
Kedvezményezett
A: 62
B: JOBBÁGYAI
D: THEODORUS (KIRÁLY NAGYBÁTYJA)
Helynevek a DIPL adatbázisban:
KHLY, HELY paragrafus is mondatokra van felbontva;- a személyeket leíró paragrafusokon kívül ebben a két paragrafusban találunk még helyneveket analitikusan feldolgozott formában. Az analitikus feltárás során kiküszöböltük az azonos lokális jelentésű, írásmódban azonban az írásbeliség fejlődését mutató különböző alakú helynévírási-változatok külön-külön informatikai egységenként való kezelését. A helynevek szerkezetét (a személynevekhez hasonlóan) a paragrafusok szerkezetében tükröztük, éspedig úgy, hogy a paragrafusokat itt is mondatokra bontottuk. A mondatok rövid címkékkel kezdődnek. A keresőkérdésben elegendő csak a standard alakot és az ehhez tartozó 'C:' rövid címkét megadni ahhoz, hogy a találati halmaz az évszázadok alatt sokszor módosult összes névvariánst tartalmazza.
Az adatbázis fenti paragrafusaiban tárolt rövid címkék:
-E: eredeti írásmódú helységnév
(KHLY, HELY)
-C: standard helynév-alak
-F: megye, tartomány, ország, stb.
-G: területkód 1=külföld, 2=tartomány, 3=megye,
4=egyéb földrajzi egység
Például:
Keltezés helye
E: BUDE
C: BUDA
F: PEST
G: 03
Helységnevek:
C: OPPELN
G: 01
A megjelenítésre különböző formátumok állnak rendelkezésre.A lehetséges formátumok kikapcsolása után kapjuk meg a nyers adatstruktúrát.
Pl.
ISIS sorszám
64428
Sorszám
L 0015
Jelzet
083516
Keltezés
1409 01 06
Nyelve
latin
Fennmaradási forma
E
Megjegyzés
sérült
Régi jelzet
0030 2 48 6
Kedvezményezett
A: 33
B: familiárisai
D: Theodorus (király nagybátyja)
Személyek adatai
A: 37
B: országlakók
Irattípus
mentesítő, tiltó
Jog
Felmentés törvénybe ütköző cselekedetek bírósági elítélése alól
Keltezés helye
E: BUDE
C: BUDA
F: PEST
G: 03
Helységnevek
C: OPPELN
G: 01
Történelem
hűtlenség a király ellen
Pecsétek leírása
A
Regeszta szövege
Zsigmond király tudatja a címzettekkel, hogy Theodorus oppelni herceget, beregi ispánt, aki a király nagybátyja, továbbá familiárisait és jobbágyait mentesítette a király szolgálatában a vele szemben hűtlenné lett országlakók és javaik ellen elkövetett károkozások, fosztogatások, emberölések és másfajta ilyen tettek következményei alól és egyben megtiltja, hogy akár a herceget, akár familiárisait és jobbágyait bárki keresetére ezek miatt a tettek miatt birtokaikban károsítsák vagy zaklassák.
Az adatbázis a NIIF Helka számítógépén érhető el; a login is, és a password is 'brsguest'.
Az adatbázisban való keresés eredményhalmazainak megjelenítésére különböző formátumok állnak rendelkezésre, melyeket a ..what format paranccsal kérdezhetünk le. A karakteres felületű formátumok a fent bemutatott rekordstruktúrát élvezhető, az olvasott szövegnél megszokott módon tárják elénk, magát a struktúrát csak az érthetőség szintjéig mutatják, a témaköröket megnevezve. Ezen túl grafikus és webes felületet is terveztünk a DIPL-hez, a WEB-es felületű DIPL adatbázis e konferencián Király László-Fazekas Emőke: IIF adatbázisok új, WEB-es köntösben c. előadásában kerül bemutatásra.