1. Idi na sadržaj
  2. Idi na glavnu navigaciju
  3. Idi na ostale ponude DW-a
Digitalni svijetGlobalno

Archive.org: naša digitalna memorija je ugrožena

28. travnja 2026

Wayback Machine, čuvar naše digitalne memorije, bori se za opstanak. Nakon hakerskih napada i tužbi za autorska prava, sve više medijskih kompanija odbija arhivirati svoje sadržaje putem web arhiva.

Mobilna početna stranica Wayback Machine-a
Milijarde internetskih stranica bi mogle nestati u zaborav, ako nestane "Wayback Machine" Milliarden von Websites könnten in Vergessenheit geraten, wenn die "Wayback-Machine" nicht mehr existieFoto: Timon Schneider/SOPA Images/Sipa USA/picture alliance

Internetski portal archive.org već 30 godina arhivira digitalne sadržaje. Wayback Machine obuhvaća više od trilijun pohranjenih web-stranica i smatra se nezamjenjivim alatom za novinare, istraživače, povjesničare i pravnike koji žele pristup izbrisanim ili izmijenjenim sadržajima u njihovu izvornom obliku. No, ovaj jedinstveni projekt neprofitne organizacije sa sjedištem u San Franciscu suočava se s egzistencijalnom krizom – a najnovija prijetnja dolazi upravo od onih kojima je taj arhiv najpotrebniji: samih medija.

Sve veći broj velikih medijskih kuća ovom internetskom arhivu uskraćuje pristup svojim sadržajima. Prema istraživanju Zaklade Nieman za novinarstvo na Sveučilištu Harvard, najmanje 241 novinski portal iz devet zemalja blokira web pretraživače arhiva, uključujući The Guardian, The New York Times, Le Monde i najveći novinski koncern u SAD-u USA Today Co.

Medijske kuće same sebi uskraćuju pristup važnom alatu

USA Today je tako nedavno objavio senzacionalistički izvještaj o tome kako je američka Služba za imigraciju i carine (ICE) sustavno uskraćivala informacije o svojoj zatvorskoj politici. Osnova istraživanja bili su podaci Wayback Machinea na archive.org. Ista medijska kuća koja je ovu priču uspjela napisati zahvaljujući tom arhivu sada blokira pristup vlastitim sadržajima.

No, zbog čega medijske kuće sebi uskraćuju jedan od ključnih alata? Odgovor je jednostavan: strah od umjetne inteligencije (UI). Izdavači se plaše da će kompanije koje se bave umjetnom inteligencijom, poput OpenAI-ja ili Googlea, koristiti arhiv za masovni pristup njihovim novinarskim sadržajima kako bi trenirale svoje jezične modele – bez dozvole i bez naknade. Glasnogovornik New York Timesa, Graham James, o toj se temi javno očitovao: „Problem je u tome što kompanije koje se bave umjetnom inteligencijom koriste sadržaje Timesa u internetskom arhivu kako bi nam izravno konkurirale – pritom kršeći autorska prava.”

Koliko god olakšavala svakodnevicu, na nekim poljima je umjetna inteligencija i prijetnja, odnosno kompanije koje stoje iza UI-aFoto: Jakub Porzycki/NurPhoto/picture alliance

Do deset tisuća zahtjeva UI-botova u sekundi

Podaci pokazuju da je ogroman broj botova bio usmjeren na web-stranicu archive.org, tražeći medijske sadržaje za obuku UI modela – čime su dobili pristup upravo onim podacima koji su im uskraćeni. Mark Graham, direktor Wayback Machinea, potvrdio je u razgovoru za magazin Wired da su pojedine kompanije povremeno pristupale arhivu s desecima tisuća zahtjeva u sekundi – do te mjere da su privremeno preopteretile servere.

Archive.org nije bio pripremljen za takvu situaciju. Ta neprofitna organizacija djeluje prema pravilima otvorenog interneta; njezin moto glasi: „Baš kao i tradicionalna knjižnica, nudimo besplatan pristup istraživačima, povjesničarima, znanstvenicima, osobama s poteškoćama u čitanju i široj javnosti. Naš je cilj osigurati univerzalan pristup svim znanjima.” To se odnosi i na zabranu isključivanja botova i automatskih pretraživača (crawlera) – što je sada dovelo do sankcija koje su uvele velike izdavačke i medijske kuće.

Knjižnice fizički arhiviraju stoljećima staro znanje - ali digitalni sadržaji bi mogli već nakon nekoliko desetljeća nestati ukoliko se ukinu ponude poput Wayback Machine-aFoto: Valentin Wolf/imageBROKER/picture alliance

Fondacija Electronic Frontier (EFF), organizacija za ljudska prava specijalizirana za digitalna pitanja, uspoređuje postupke izdavača s time da „izdavač novina najavljuje da knjižnicama više neće biti dopušteno čuvanje primjeraka njihovih izdanja”.

Povijest interneta mogla bi biti izgubljena

U međuvremenu je više od 100 novinarki i novinara potpisalo peticiju podrške internetskom arhivu. U njihovom otvorenom pismu navodi se: „U digitalnom medijskom pejzažu, gdje članci nestaju zbog gubitka linkova, spajanja kompanija ili mjera štednje, novinari se često oslanjaju na arhivski Wayback Machine kako bi ponovno uspostavili stranice koje bi inače bile izgubljene. Bez ovog kontinuiranog rada na očuvanju interneta, veliki dijelovi novije novinarske povijesti već bi bili izgubljeni.”

Mark Graham je za magazin Wired pojasnio da je u pregovorima s medijskim kompanijama kako bi ponovno uspostavio pristup njihovim sadržajima. Kako će se ti pregovori završiti još nije izvjesno. No njegov zaključak zvuči kao upozorenje: „Nema sumnje da sve veće blokiranje velikih dijelova javnog weba narušava sposobnost društva da razumije ono što se događa u našem svijetu.”

„Web arhiviranje je dio javne infrastrukture”

Novinar i osnivač portala socialmediawatchblog.de, Martin Fehrensen, vidi archive.org kao jedini funkcionalni lanac dokaza za otvoreni web. Ako on više ne može izvršavati svoje zadatke, to će imati značajne posljedice, rekao je u razgovoru za DW: „Milijuni citata koji su izvori Wikipedije izgubit će svoje uporište, odgovornost za istraživanje platformi – odnosno koji će se opći uvjeti i pravila primjenjivati, koja su pravila moderiranja preformulirana i kako – postat će puno teža, a pravno valjani digitalni dokazi nestat će.” Blokiranje arhiva je, kako ističe, potpuno apsurdno, osobito za medijske kuće.

Wikipedia je u međuvremenu mnogima postala izvor znanja koje je potrebno potkrijepiti citatima radi vjerodostojnostiFoto: Sebastian Gollnow/dpa/picture alliance

Kako bi se riješio ovaj sukob, objašnjava on, postoje dva načina: „Potreban nam je dijalog s izdavačima uz jasno tehničko razdvajanje arhiviranja i treniranja umjetne inteligencije – jer je upravo to u biti dovelo do konflikta, a ne sam arhiv.” Srednjoročno, Fehrensen smatra da bi za web-arhive trebalo stvoriti poseban pravni status. Dugoročno gledano, „web-arhiviranje treba tretirati kao javnu infrastrukturu, a ne kao samostalni projekt nevladine organizacije u San Franciscu. Činjenica da ono 2026. godine još uvijek ovisi o jednoj organizaciji predstavlja pravi strukturni neuspjeh.”

Samo jedan od mnogih konflikata – ali najdramatičniji

Ovo nije prvi put da se internetski arhiv bori za svoj opstanak. U rujnu 2024. godine, tijekom hakerskog napada, ukradeni su podaci s 31 milijuna korisničkih računa – težak udarac od kojeg se organizacija mukotrpno oporavljala. Iste godine arhiv je pred američkim žalbenim sudom izgubio spor oko autorskih prava (Hachette protiv Internet Archive): izdavači Hachette, Penguin Random House, HarperCollins i Wiley uspješno su okončali tužbu protiv programa besplatnog posuđivanja e-knjiga koji je arhiv pokrenuo tijekom pandemije Covida. Više od 500.000 knjiga moralo je biti uklonjeno iz servisa posudbe. Unatoč tome, archive.org i dalje se suočava s milijunima dolara odštetnih zahtjeva.

U usporedbi s tim porazima, trenutna prijetnja koju predstavljaju medijske blokade strukturno je ozbiljnija – jer se ne može riješiti sudskom presudom ili tehničkim ažuriranjem. To je rezultat brojnih korporativnih odluka koje zajedno potkopavaju osnovnu djelatnost Wayback Machinea: sveobuhvatnu dokumentaciju javnog weba.

Njemačko selo koje je postalo digitalni prvak svijeta

02:49

This browser does not support the video element.

Preskoči sljedeće područje Aktualno na početnoj stranici

Aktualno na početnoj stranici

Preskoči sljedeće područje Ostale teme