BIZIT 11 - prvi dan

Projekat Internet Arhive rešio problem nepostojećih Wikipedia linkova

Web je živa, promenljiva stvar. Sajtovi se pojavljuju i nestaju preko noći, kad istekne potreba za njihovim postojanjem. Problem nastaje kada neki drugi sajtovi referenciraju na sajtove koji više ne postoje.

PCPress.rs Image

Jedan od drastičnijih primera linkova koji ne vode nikud bila je Wikipedia. Prema njihovim izvorima bilo je čak devet miliona takvih linkova na ovom sajtu. Ipak, to ne znači da se ne može doći do sadržaja na koji oni referenciraju.

Internet Archive čuva kopije velikog broja sajtova napravljenih u različitim vremenskim intervalima tokom njihovog postojanja. Preko ove arhive možete pogledati kako je neki sajt izgledao određenog datuma, kako se razvijao kroz istoriju, ali i pronaći neke starije verzije dokumenata koje više ne postoje na aktuelnim sajtovima.

Jedan od kontributora na Wikipedia portalu, Maksimilijan Doer, napravio je program koji je nazvao IAbot (Internet Archive bot), koji pretražuje arhivu Interneta i iz nje „vadi“ linkove iz prošlosti. Program radi tako što prvo identifikuje da li je neki link neispravan (tako što stranica vraća „Error 404“ ili „Page not found“ poruku). U tom slučaju, počinje pretragu Internet arhive za odgovarajućom stranicom i prikazuje je na ekranu. Na ovaj način oporavljeno je oko šest miliona neispravnih linkova na 22 Wikipedia sajta. Dodatnih tri miliona linkova ručno su popravili volonteri Internet Archive projekta.

Pročitajte i:  Google pretragom do Internet arhive 

Desetodnevno istraživanje koje je Wikipedia sprovela nakon toga, pokazalo je da je najveći broj odlazećih linkova išao na Internet Archive sajt, što pokazuje kolika je bila važnost ovog projekta i koliko je popravljen integritet jednog od najposećenijih sajtova na Internetu.

Izvor: TechCrunch

Facebook komentari:
Računari i Galaksija
Tagovi: , , ,