
CÍMLAP
Kornhoffer Mónika
A világhálón található információk gyűjtésének és megőrzésének hazai és nemzetközi áttekintése
TARTALOM, BEVEZETÉS
Tartalom
Bevezetés
1. Mi a web és miért kell archiválni a weben található anyagokat?
2. Mi az, amit archiválni kell?
2.1. Mi a tartalom?
2.2. A weboldalak típusai
2.3. A web szintjei
3. Az internetes tartalom archiválásával kapcsolatos kérdések
3.1. Mit archiváljunk, és mennyi ideig tartsuk meg? A dokumentum elavulása.
3.2. Ki végezze el az archiválást? Kinek a felelőssége legyen?
3.3. Hardver és szoftver gyors fejlődése
3.4. Az eltérő weblap-típusok kérdésköre
3.5. Szerzői és személyiségi jogi szabályozások
4. A weboldalak begyűjtésének módszerei
5. Néhány külföldi példa a webarchívumok működésére
5.1. Internet Archive
5.1.1. Wayback Machine
5.1.2. Archiválási problémák
5.1.3. Hozzáférés a gyűjteményhez
5.1.4. A jövő
5.2. Ausztrália
5.2.1. Begyűjtés
5.2.2. Hozzáférés a gyűjteményhez
5.3. Egyesült Királyság
5.3.1. Begyűjtés
5.3.2. Hozzáférés a gyűjteményhez
5.3.3. Jövőbeli tervek
5.4. Norvégia
5.4.1. Gyűjtemény építése
5.4.2. Archívum kialakításának fő kérdései
5.4.3. A program lezárása és eredményei
5.4.4. A webarchívum jelene
5.5. Litvánia
5.5.1. Gyűjtemény építése
5.5.2. Hozzáférés a gyűjteményhez
5.6. Szlovákia
5.6.1. Kísérleti projekt
5.6.2. Eredmények
5.7. Katalónia
5.7.1. Gyűjtemény építése
5.7.2. Hozzáférés a gyűjteményhez
5.7.3. További fejlesztések
6. Magyar Internet Archívum
6.1. Drótos László tervei a Magyar Internet Archívum létrehozására
6.2. Kísérletek a MIA létrehozására
Összegzés
Bibliográfia
Kulcsszavak
Bevezetés
A mai kor embere azt gondolja, ha bármilyen információra van szüksége, még
a könyvtárba sem kell elmennie, elég ha leül a számítógépe elé, "felmegy"
a világhálóra és ott minden szükséges információt megtalál. Ez részben igaz
is, hiszen ha egy színházi műsorra, vagy menetrendre vagyunk kíváncsiak,
esetleg egy kutató legújabb kutatási eredményeire, az Internet segítségével
és megfelelő keresési módszerekkel ezeket az információkat gyorsan meg
tudjuk találni. De vajon ugyanilyen könnyű dolga lesz-e egy kutatónak is,
aki ötven év múlva a mai weboldalakkal kapcsolatban szeretne tanulmányt
írni?
A legtöbb ember, akinek ezt a kérdést feltesszük, gondolkodás nélkül
rávágja, hogy persze, hiszen miért tűnne el bármi is a világhálóról?
Gondoljuk mindezt annak ellenére, hogy az Interneten böngészve akár naponta
előfordulhat, hogy a keresett oldal helyett csak egy hibaüzenetet találunk,
mely arról tájékoztat, hogy a keresett oldal már nem található. Bár
bosszankodunk ezen, de utána esetleg megváltoztatott paraméterekkel
folytatjuk tovább a keresést, hátha valamilyen más módon el tudjuk érni
a keresett információt.
Bár napjainkban mindennapossá vált, hogy a szükséges információkat a
világhálón keressük meg, mégsem merül fel bennünk, hogy a már jelenleg is
megtalálható hatalmas adatmennyiség napról napra bővül, és ennek a tárolása
nem kis feladat. Ezen kívül az egyre több és több információ közül sokkal
nehezebben tudjuk kiválogatni a számunkra fontosakat, hiszen csak
félrevezeti a keresőt, ha mondjuk olyan cégek honlapjai is megtalálhatók
az Interneten, amelyek már régen megszűntek. A folyamatosan működő
intézmények, vállalatok honlapjainak is követnie kell a képviselt
szervezett működésében, tevékenységében, elérhetőségében stb. bekövetkezett
változásokat, amely a régebbi adatok felülírásával valósul meg. Ezekből a
példákból is látszik, hogy szükséges a régi, elavult információk törlése,
módosítása.
De mi történik azokkal a weblapokkal, amelyeket már nem tudunk elérni?
Gyakorló informatikusként azt gondoltam, hogy azokat a honlapokat,
amelyeket nem tudok elérni, azok is biztosan valahol megtalálhatók
elmentett, archivált formában, hiszen minden cég, minden adatáról (még a
nagyon régiekről is) különböző biztonsági mentéseket tárol. Ehhez képest
nagy meglepetést okozott számomra egy 2008. nyári HVG cikk, ahol pont az
"eltűnő honlapok" témáját járták körül. A cikk szerint a weblapok semmilyen
magyarországi webarchívumban sincsenek eltárolva, hiszen igazából
webarchívumunk sincsen. Ha régebbi vagy az Interneten már nem megtalálható
weblapokat keresünk, akkor csak az Internet Archive - amerikai nonprofit
cég - webarchívumában érdemes keresgélni.
A nyomtatott dokumentumok nyilvántartására, megőrzésére különböző
törvények, rendeletek, szabályozók, stratégiák léteznek, de mi a helyzet
például azokkal a folyóiratokkal, melyek csak elektronikus formában
léteznek? Ugyanúgy "elvesznek", mint bármelyik másik weblap? Egyáltalán
létezik-e bármilyen törvény, vagy szabályozás az elektronikus dokumentumok
megőrzésére Magyarországon és a világ más országaiban? Létrehoztak-e a
különböző országok Internet archívumokat, melyekben a saját nemzeti
dokumentumaikat gyűjtik? Ha léteznek nemzeti Internet archívumok, akkor
milyen elvek alapján válogatják ki és gyűjtik össze a bekerülő
dokumentumokat?
A cikk elolvasása után többek között ezek a kérdések foglalkoztattak és
ezekre szeretnék választ kapni a szakdolgozatomban úgy, hogy a weblapok
feldolgozásával nem foglalkozom.