A közgyűjtemények webarchiválási feladatairól tanácskoznak az Országos Széchényi Könyvtárban (OSZK) csütörtökön Budapesten.
A harmadik alkalommal megrendezett 404 Not Found - Ki őrzi meg az internetet? szakmai napnak a célja feltérképezni a webes tartalmak archiválásának lehetőségeit és határait - mondta el Hammerstein Judit, az OSZK megbízott főigazgatója a tanácskozás kezdetén.
Az elmúlt mintegy két évtizedben nagyon sok értékes tartalom csak online formában jelent meg, de ha volt nyomtatott változat is, egyáltalán nem biztos, hogy a kettő megegyezik egymással. Ezek a webes tartalmak archiválás nélkül idővel eltűnésre vannak ítélve - tette hozzá.
Hammerstein Judit kiemelte: a teljes magyar internet archiválása egyetlen országos szintű intézmény számára sem lehetséges. Jelenleg 4600 online hírportál, napilap és időszakos kiadvány lementése tűnik megoldhatónak rendszeresen, évente pár alkalommal. A lementett webes tartalmak elérhetőek lesznek az Országos Könyvtári Platformon (OKP) belül.
Latorcai Csaba, az Emberi Erőforrások Minisztériuma közigazgatási államtitkára kiemelte: 2006-ban merült fel először a magyar weboldalak tömeges archiválásának ötlete, amely 2016-ban bekerült az Országos Könyvtári Platform (OKP) 10 milliárd forintos fejlesztésének elemei közé is.
A 2017-ben indult webarchiválási tesztprojekt keretében 2018 decemberében 291 ezer magyar domain cím tartalmát mentették le. A technikai háttér tehát már létezik, a következő lépés a stabil jogszabályi és költségvetési támogatás kidolgozása - tette hozzá az államtitkár.
Latorcai Csaba kitért arra is: a tervek szerint az OSZK-nak 2021-től el kell tudnia látni a magyar vonatkozású webtartalmak mentésének, feldolgozásának, hosszú távú megőrzésének és webarchívumba rendezésének feladatát.
Az internet legkomplexebb médium, amellyel az elmúlt több száz évben valaha is találkoztak a közgyűjtemények. A web egyre nagyobb részét teszik ki a különböző szoftverek, ezért elképesztően nehéz az archiválása - hangsúlyozta Drótos László főkönyvtáros a konferencián.
Kiemelte: a webarchiválási tesztprojekt keretében 2018-ban mintegy 20 ezer webhelyet, 29 terabájt összméretű adatot mentettek le. Az eltárolt fájlok/URL-címek száma megközelíti az 500 milliót. Idén decemberben egy ennél is nagyobb szabású "aratásra" készülnek.
A tanácskozáson szó lesz egyebek mellett az online sajtócikkek adatbázisba rendezéséről, a webhelyek metaadatolási problémáiról, valamint az OSZK országos projektjén belüli, helyi érdekű webarchiválási lehetőségekről is.