Come scandagliare le profondità  di Internet

I motori di ricerca, e in particolare Google, funzionano così bene che spesso li si considera onniscienti: bastano pochi secondi per ottenere una risposta a un’enorme varietà  di quesiti, provenienti da milioni di pagine Web sparse per il mondo. Abbiamo affrontato in dettaglio l’argomento nell’articolo dedicato ai motori di ricerca.

La fiducia in questi strumenti porta inevitabilmente a pensare che permettano di raggiungere l’intero patrimonio di informazioni memorizzato su Internet, ma questa convinzione è lontanissima dalla realtà . Anche se è difficile fornire una stima precisa, più fonti ritengono che i motori di ricerca in realtà  accedano solo a una frazione compresa tra il 5 e il 10% dei dati presenti su Internet.

Il motivo è semplice: i motori di ricerca analizzano e catalogano soltanto le informazioni testuali (o in pochi altri formati) accessibili ai loro robot, programmi che si aggirano senza sosta tra le pagine, archiviandole e seguendone i link per creare e aggiornare la mappa delle informazioni. Ma molti dei dati disponibili non vengono raggiunti: per esempio, tutte le informazioni che richiedono un accesso tramite nome utente e password, oppure le pagine mal programmate o ancora i contenuti Flash, non vengono indicizzati dai motori di ricerca e quindi sono virtualmente invisibili.

TorBrowser
Tor Browser è un programma di navigazione derivato da Firefox, che rende semplicissimo il collegamento alla rete Tor: basta premere il pulsante Connetti e attendere qualche secondo.

Esistono poi i siti che non sono neppure accessibili da un normale browser Web, ma richiedono una diversa tecnologia di routing, come per esempio quelli che utilizzano lo standard Tor. In queste profondità  ci si muove come agli albori di Internet, sfruttando le collezioni di indirizzi e i portali che riportano i collegamenti per raggiungere i vari server disponibili. Un elenco per iniziare la navigazione può essere recuperato all’indirizzo https://en.wikipedia.org/wiki/List_of_Tor_hidden_services.

Esistono anche motori di ricerca pensati per analizzare e indicizzare le pagine del network Tor, ma la loro efficacia è molto parziale: gli indirizzi e i contenuti cambiano spesso, e le risorse necessarie per mantenere aggiornato un motore di ricerca sono molto elevate. Un paio di indirizzi da cui partire sono https://ahmia.fi/search e https://search.torhost.net. Come abbiamo già  accennato, per aprire i siti della rete Tor non basta un normale browser Web; la soluzione più semplice è scaricare il Tor Browser Bundle, basato su Firefox, dall’indirizzo https://www.torproject.org (può essere installato in modalità  portable), ma bisogna procedere con cautela: i controlli delle forze dell’ordine sono molto meno pressanti rispetto al Web visibile, e non è infrequente imbattersi in contenuti sgradevoli o addirittura illegali.
Dario Orlandi

Nessun Articolo da visualizzare