Vágólapra másolva!
Lelkes önkéntesek ültek számítógépeik elé arra a hírre, hogy a Yahoo bezárja az egyik legrégebbi ingyenes webtárhelynek számító GeoCitiest. A Jason Scott Sadofsky webtörténész és dokumentumfilmes által vezetett Archive Team pár héten belül letöltötte az 1994 óta működő szolgáltatásban tárolt adatok régebbi felét, majd nekilátott a nehezebben megszerezhető, 2000 utáni honlapok begyűjtésének. Az eletmentők céljairól és a webes kultúráról a csapat vezetőjét kérdeztük.
Vágólapra másolva!

Többnyire az 1999 előttről származó oldalakat emlegeted a Twitteren, azért mindent archiválni akartok?

Igen, az lenne az ideális, ha mindent összeszednénk, ami a GeoCitiesen van vagy a GeoCitieshez kapcsolódik, mindent, amit a Yahoo le fog venni, ha bezárják a szolgáltatást. Azért szoktam 1999-et említeni, mert utána a Yahoo lehetővé tette, hogy mindenféle neveket és struktúrákat használjanak az URL-ekben a felhasználók, így nehezebb megtalálni őket. (Nincs központi lista róluk.) Egészen biztosan kimondhatjuk, hogy az 1999-es és azelőtti címekből minden megvan, a későbbieknél erről meg kell bizonyosodni. Mindent megteszünk, hogy az összes adat meglegyen.

Meg tudnád becsülni, hogy mekkora a GeoCities? Hány fájllal rendelkeztek most?

Nem lehet tudni, hogy most mennyi tárhelyük van - azt tudjuk, hogy 1999-ben 19 terabájtnyi lemezterület állt rendelkezésükre (és, attól függően, kitől kérdezted, ők voltak a harmadik vagy negyedik legnagyobb webes célpont). A felfedező útjaink során világossá vált, hogy nagyon sok adat veszett el - azoknak az adatai, akik nagyobb tárhelyet vettek elő, majd abbahagyták a fizetést, vagy azokéi, akik törölték a weblapjaikat.

Még nem haladtuk meg az egy terabájtnyi adatot, és már letöltöttük a 2000 előtti lapokat. Úgy tűnik, hogy két terabájt elég lesz a teljes GeoCitiesnek.

A wiki csak az akciót irányító három személyt említi, hány önkéntes dolgozik az oldal lementésén?

Néhány tucat ember dolgozik különböző feladatokon, de a nagy kapacitást igénylő munkához csak néhány aktivistára van szükség. Egyesek hihetetlen mennyiségű címeket gyűjtenek össze, ha a nyers erőt használó megközelítés nem működne.

Sokféle feladaton dolgoznak az emberek, de csak kevesen tudnak nagy mennyiségű adatot gyorsan letölteni. Pazarlás lenne gyűjtögetni küldeni többtucatnyi embert. Néhány önkéntesünk pedig névtelen kíván maradni.

Találtatok aktív közösségeket a GeoCitiesen?

Vannak oldalak, amelyeket egészen biztosan használtak közösségek. Ilyenek a rajongók által írt történeteket (fan fiction), kutatási anyagokat (különösen családfakutatást) tartalmazó oldalak, és az olyan lapok, amelyek egyes csoportok klasszikusainak számítanak. Ezeket akkor is látogatják, ha az oldalt már nem frissítik tovább.

Forrás: [origo]
GeoCities: nem a legszebb, de az egyik legelső ingyenes tárhely

Inkább úgy mondanám, hogy az oldalalakat aktív közösségek használják, még ha magukon a lapokon nincsenek is ilyenek. Ha nagyobb mennyiségű oldal áll a rendelkezésünkre, meg tudjuk mondani, hogy hányat frissítettek például az elmúlt évben.

A GeoCitiesen lakik például a hackeres játékokról szóló legjobb lista. Mik voltak a legérdekesebb leletek eddig?

Nos, nem ugyanaz érdekel engem, mint másokat. Ez a lényeg, mindent összegyűjtünk és archiválunk, így a jelen nem ítélkezik az információ felett, megfosztva a jövőt attól, hogy saját döntéseket hozzon az anyagról.

Azok közül, amiket láttam, a nyilvánvalóan hatalmas munkával készült oldalak fogtak meg, amelyeken látszik, hogy valaki hónapokat vagy éveket töltött az információ összeszedésével. Mindig öröm ilyeneket látni, mert tudom, hogy megmentettük egy másolatát a következő generációknak. És azt is tudom, hogy még az olyan esztétikai alapon gyakran kigúnyolt helyeken is, mint a GeoCities, nőnek gyönyörű virágok.

Nyilvánosak lesznek az általatok összegyűjtött adatok?

Nem látom, miért ne lehetne, igaz, most még nem tudom, hogyan lesz - arra fókuszálok, hogy az összes elérhető adatot összeszedjük először.

Hátráltathat titeket a Yahoo?

Igen, lenyomozhatnának és blokkolhatnának minket. Mindeddig nem tették meg, de emögött valószínűleg az áll, hogy a hajót magára hagyták, hadd menjen, amerre akar, mielőtt végleg elsüllyesztenék, nem pedig holmi nagylelkűség vagy könyörületesség.

Láttam a blogodon, hogy hallani sem akarsz az adófizetők pénzének felhasználásáról, és azt hiszem, értem is az okait, de van egy UNESCO-charta a digitális örökség védelméről. Nem tartozik hozzá valami archiváló szervezet?

Úgy találtuk, hogy az ilyenek nagyon lassan dolgoznak. Az Archive Team létrehozása mellett az egyik érv az volt, hogy gyorsan tud dolgozni, amikor sebességre van szükség. Valószínűleg meg fognak jelenni azok a szervezetek, amelyeknek a malmai lassabban őrölnek, és elkérnek egy-egy másolatot.

Mit tanulhatunk egy GeoCities oldalból?

A GeoCities pillanatképeket ad az online kultúráról 1995-től napjainkig, így bármi, ami ebből az időből értékes lehet, valószínűleg ott van a weblapokon. Fontosak még, azt hiszem, a technikai megoldások, az ötletek arról, hogy merre tart a web, és a hallgatósághoz nem szokott emberek által összeszedett információkat tartalmazó oldalak is.

(Az archiválási projektek és a világháló története iránt mélyebben érdeklődőknek mindenképpen érdemes felkeresniük Scott blogját is, ahonnan elérhetők a különböző konferenciákon tartott hasonló témájú előadásai. Szintén Scott működteti a Textfiles.com oldalt, ahol pedig a BBS hirdetőtáblákon lánclevélként, közös tudásként terjedő dokumentumokba lehet beleolvasni.)