Tétel adatlapja

CÍMLAP

Kornhoffer Mónika

A világhálón található információk gyűjtésének és megőrzésének hazai és nemzetközi áttekintése

TARTALOM, BEVEZETÉS



Tartalom

Bevezetés

1. Mi a web és miért kell archiválni a weben található anyagokat?

2. Mi az, amit archiválni kell?
2.1. Mi a tartalom?
2.2. A weboldalak típusai
2.3. A web szintjei

3. Az internetes tartalom archiválásával kapcsolatos kérdések
3.1. Mit archiváljunk, és mennyi ideig tartsuk meg? A dokumentum elavulása.
3.2. Ki végezze el az archiválást? Kinek a felelőssége legyen?
3.3. Hardver és szoftver gyors fejlődése
3.4. Az eltérő weblap-típusok kérdésköre
3.5. Szerzői és személyiségi jogi szabályozások

4. A weboldalak begyűjtésének módszerei

5. Néhány külföldi példa a webarchívumok működésére
5.1. Internet Archive
5.1.1. Wayback Machine
5.1.2. Archiválási problémák
5.1.3. Hozzáférés a gyűjteményhez
5.1.4. A jövő
5.2. Ausztrália
5.2.1. Begyűjtés
5.2.2. Hozzáférés a gyűjteményhez
5.3. Egyesült Királyság
5.3.1. Begyűjtés
5.3.2. Hozzáférés a gyűjteményhez
5.3.3. Jövőbeli tervek
5.4. Norvégia
5.4.1. Gyűjtemény építése
5.4.2. Archívum kialakításának fő kérdései
5.4.3. A program lezárása és eredményei
5.4.4. A webarchívum jelene
5.5. Litvánia
5.5.1. Gyűjtemény építése
5.5.2. Hozzáférés a gyűjteményhez
5.6. Szlovákia
5.6.1. Kísérleti projekt
5.6.2. Eredmények
5.7. Katalónia
5.7.1. Gyűjtemény építése
5.7.2. Hozzáférés a gyűjteményhez
5.7.3. További fejlesztések

6. Magyar Internet Archívum
6.1. Drótos László tervei a Magyar Internet Archívum létrehozására
6.2. Kísérletek a MIA létrehozására

Összegzés
Bibliográfia
Kulcsszavak


Bevezetés

A mai kor embere azt gondolja, ha bármilyen információra van szüksége, még a könyvtárba sem kell elmennie, elég ha leül a számítógépe elé, "felmegy" a világhálóra és ott minden szükséges információt megtalál. Ez részben igaz is, hiszen ha egy színházi műsorra, vagy menetrendre vagyunk kíváncsiak, esetleg egy kutató legújabb kutatási eredményeire, az Internet segítségével és megfelelő keresési módszerekkel ezeket az információkat gyorsan meg tudjuk találni. De vajon ugyanilyen könnyű dolga lesz-e egy kutatónak is, aki ötven év múlva a mai weboldalakkal kapcsolatban szeretne tanulmányt írni?

A legtöbb ember, akinek ezt a kérdést feltesszük, gondolkodás nélkül rávágja, hogy persze, hiszen miért tűnne el bármi is a világhálóról? Gondoljuk mindezt annak ellenére, hogy az Interneten böngészve akár naponta előfordulhat, hogy a keresett oldal helyett csak egy hibaüzenetet találunk, mely arról tájékoztat, hogy a keresett oldal már nem található. Bár bosszankodunk ezen, de utána esetleg megváltoztatott paraméterekkel folytatjuk tovább a keresést, hátha valamilyen más módon el tudjuk érni a keresett információt.

Bár napjainkban mindennapossá vált, hogy a szükséges információkat a világhálón keressük meg, mégsem merül fel bennünk, hogy a már jelenleg is megtalálható hatalmas adatmennyiség napról napra bővül, és ennek a tárolása nem kis feladat. Ezen kívül az egyre több és több információ közül sokkal nehezebben tudjuk kiválogatni a számunkra fontosakat, hiszen csak félrevezeti a keresőt, ha mondjuk olyan cégek honlapjai is megtalálhatók az Interneten, amelyek már régen megszűntek. A folyamatosan működő intézmények, vállalatok honlapjainak is követnie kell a képviselt szervezett működésében, tevékenységében, elérhetőségében stb. bekövetkezett változásokat, amely a régebbi adatok felülírásával valósul meg. Ezekből a példákból is látszik, hogy szükséges a régi, elavult információk törlése, módosítása.

De mi történik azokkal a weblapokkal, amelyeket már nem tudunk elérni? Gyakorló informatikusként azt gondoltam, hogy azokat a honlapokat, amelyeket nem tudok elérni, azok is biztosan valahol megtalálhatók elmentett, archivált formában, hiszen minden cég, minden adatáról (még a nagyon régiekről is) különböző biztonsági mentéseket tárol. Ehhez képest nagy meglepetést okozott számomra egy 2008. nyári HVG cikk, ahol pont az "eltűnő honlapok" témáját járták körül. A cikk szerint a weblapok semmilyen magyarországi webarchívumban sincsenek eltárolva, hiszen igazából webarchívumunk sincsen. Ha régebbi vagy az Interneten már nem megtalálható weblapokat keresünk, akkor csak az Internet Archive - amerikai nonprofit cég - webarchívumában érdemes keresgélni.

A nyomtatott dokumentumok nyilvántartására, megőrzésére különböző törvények, rendeletek, szabályozók, stratégiák léteznek, de mi a helyzet például azokkal a folyóiratokkal, melyek csak elektronikus formában léteznek? Ugyanúgy "elvesznek", mint bármelyik másik weblap? Egyáltalán létezik-e bármilyen törvény, vagy szabályozás az elektronikus dokumentumok megőrzésére Magyarországon és a világ más országaiban? Létrehoztak-e a különböző országok Internet archívumokat, melyekben a saját nemzeti dokumentumaikat gyűjtik? Ha léteznek nemzeti Internet archívumok, akkor milyen elvek alapján válogatják ki és gyűjtik össze a bekerülő dokumentumokat?

A cikk elolvasása után többek között ezek a kérdések foglalkoztattak és ezekre szeretnék választ kapni a szakdolgozatomban úgy, hogy a weblapok feldolgozásával nem foglalkozom.


×