Na blogu fundacji Internet Archive pojawił się wpis podsumowujący ponadpięcioletnią akcję archiwizowania odnośników w przypisach dodawanych do haseł wikipedystycznych. Tygodniowo we wszystkich wersjach językowych Wikipedii publikowanych jest około 20 milionów odnośników zewnętrznych – wiele z nich po pewnym czasie przestaje być aktywnych lub zmieniają się treści, do których wskazują. Aby gwarantować stabilność linków w przypisach, Fundacja uruchomiła bota śledzącego dodawane URLe i automatycznie wykonującego kopie linkowanych stron.

Jedną z głównych zasad Wikipedii jest weryfikowalność – czytelnicy muszą mieć możliwość potwierdzenia informacji przedstawionych w artykułach. Pewne i stałe treści dostępne w przypisach umożliwiają podstawowe weryfikowanie faktów i danych z treści haseł. Naturalnie sama dostępność linkowanego zasobu nie wystarczy i analizując przypis należałoby zapoznać się z jego treścią – wykonanie kopii zasobu w Wayback Machine zapewnia, że będzie on dostępny do dalszego badania nawet wówczas, kiedy zniknie z oryginalnej strony lub kiedy zmieni się jego treść.

Problem stabilności linków zewnętrznych nie dotyczy wyłącznie Wikipedii. Strony instytucji publicznych, organizacji pozarządowych, otwarte zasoby edukacyjne (podręczniki i skrypty), teksty naukowe – tam, gdzie pojawiają się odnośniki, pojawia się też niebezpieczeństwo, że po pewnym czasie przestaną być aktualne. Warto zadbać o to, aby publikowana treść nie była zubażana przez nieaktywne linki.

Być może da się określić Wayback Machine jako archiwum interwencyje, które – obok prowadzonego regularnie crawlingu i kopiowania witryn akceptuje także zgłoszenia do wykonania kopii wybranych, pojedynczych adresów. W przypadku obaw o stabilność i dostępność jakiegoś zasobu webowego możemy w kilka sekund wykonać jego kopię. Na stronie archive.org/web/ dostępny jest formularz, do którego wystarczy wkleić adres URL:

Inną metodą jest po prostu wklejenie odpowiednio przygotowanego linku do okna przeglądarki:

https://web.archive.org/save/[adres url strony]

Korzystanie z tej metody może być automatyczne, to znaczy można przygotować takie rozwiązania w systemie zarządzania treścią własnej witryny, żeby publikowany link był od razu wysyłany do web.archive.org/save/. Skorzystać przy tym można z gotowych narzędzi – polecam szczególnie Amber opracowane przez Berkman Klein Center for Internet & Society:

Amber działa jako wtyczka do WordPressa i Drupala i pozwala bez żadnej pracy programistycznej zadbać o stabilność linków zewnętrznych publikowanych na stronie. Publikowane w pracach naukowych przypisy zawierające linki zabezpieczać można także z wykorzystaniem usługi Perma.cc.

Opracował: Marcin Wilkowski.

Tekst powstał w ramach działania pracowni WebArch CKC UW w 2018 roku jako część projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).