Successivo
Wayback Machine Logo

HowTo | Internet

Come resuscitare un sito Web defunto con la Wayback Machine

Alfonso Maruccia | 14 Agosto 2018

Servizi Web

Il servizio messo a disposizione da Internet Archive ci permette di recuperare una pagina o un documento Web anche dopo il superamento del “periodo di scadenza” dei server originariamente presenti sulla Internet pubblica.

La cache di Google ci fornisce un sistema prezioso per consultare siti Web temporaneamente inaccessibili, ma quando l’inaccessibilità diventa permanente è necessario rivolgersi a servizi specializzati in grado letteralmente di “resuscitare” un documento o una pagina Web non più disponibili.

Il servizio che andremo ad analizzare in questa guida si chiama Wayback Machine, ed è un’infrastruttura messa a disposizione dall’Internet Archive che dal momento del suo debutto pubblico (più di sedici anni or sono) ha preso a scansionare l’intero Web pubblico salvando e archiviando le pagine per poi metterle a disposizione del pubblico.

Studiosi, professionisti, appassionati o semplici utenti comuni alla ricerca di un’informazione oramai scomparsa da Internet possono rivolgersi ai capaci server della Wayback Machine (nel 2016 i rack del servizio avevano immagazzinato 15 Petabyte di dati) e consultare il suo archivio, nella speranza che la pagina ricercata sia stata salvata per tempo e risulti di nuovo accessibile nella sua interezza.

Il metodo più immediato per “scavare” tra gli oltre 335 miliardi di pagine disponibili consiste nel visitare la homepage ufficiale della Wayback Machine, immettere l’indirizzo che ci interessa nello spazio evidenziato con https:// e premere sul pulsante BROWSE HISTORY.

Se andiamo alla ricerca della cache dell’Archivio dedicata a PC Professionale, ci ritroveremo davanti a un elenco di “istantanee” del sito suddivise per anni e poi per mesi. Da qui è possibile selezionare il giorno in cui è stata salvata una copia per consultarla direttamente.

Vogliamo ad esempio verificare come appariva e di cosa parlava PC Professionale alla fine dell’anno 2007? Basta scegliere anno e data giusti per ritrovarsi catapultati nel passato con Windows Vista, hardware grafico vetusto e hard disk Hitachi da “ben” 1.500 Gigabyte (o 1,5 Terabyte). In genere Wayback Machine visualizza una barra di navigazione nella parte alta dello schermo, ma è in ogni caso possibile disabilitarla (icona a X in alto a destra) per godersi l’istantanea Web in tutto il suo antiquato splendore.

Oltre alle singole pagine archiviate, per ogni sito Web presente nei server della Wayback Machine è possibile consultare un “sommario” dei tipi di dati archiviati e una mappa circolare dei contenuti suddivisi per ogni anno. E se la pagina non è disponibile ma risulta ancora accessibile on-line, Wayback Machine propone di salvarla immediatamente con un nuovo snapshot nei suoi archivi.

Wayback Machine non è ancora una copia “perfetta” della Internet pubblica, anche se vorrebbe diventarlo almeno per quei siti che non hanno deciso di mettere al bando i suoi crawler tramite la policy di robots.txt. Non è raro imbattersi in pagine malfunzionanti, accessibili solo in parte o mancanti dei collegamenti a risorse e download che facevano parte del sito originale.

Per il momento, le istantanee Web che mette a disposizione posso essere una risorsa preziosa per accedere a informazioni non più presenti sui loro server originali. Oltre al sito Web ufficiale, Wayback Machine può essere anche integrata sui browser Web grazie ai tanti componenti aggiuntivi ufficiali e non disponibili.