In passato erano in voga diversi trucchetti che permettevano di stabilire la data di creazione di una pagina web. Oggi gran parte dei server web trasmettono ai browser web collegati non più pagine statiche (ad esempio, con estensione .html
o .htm
) ma pagine dinamiche. Ciò significa che il contenuto di ogni pagina (.php
, .aspx
, .asp
,…) viene generato dal server web in tutto od in parte ad ogni singola richiesta e solo successivamente trasmesso al browser dell’utente connesso. Una pagina dinamica, quindi, può cambiare continuamente attingendo alle informazioni contenute nei database del sito.
Capire quando è stata pubblicata una pagina web non è quindi sempre facile. C’è però un espediente, d’immediata applicazione, che può essere adoperato per trovare l’informazione cercata. Il motore di ricerca di Google, utilizzando i propri crawler (detti anche spider o robot sono componenti software che analizzano ed indicizzano i contenuti pubblicati sul web in modo metodico ed automatizzato), pone continuamente al vaglio le informazioni che appaiono online. Ogni volta che una pagina web, anche dinamica, appare aggiornata nei suoi contenuti, Google – così come gli altri motori di ricerca – provvede ad adeguare i propri indici.
Ma come fare per scoprire quando è stata pubblicata la pagina web? Premesso che non è possibile stabilire, lato client, quando una pagina web è stata caricata per la prima volta sul server, Google consente di capire quando si è imbattuto per la prima volta nella medesima pagina e, quindi, la prima volta in cui il suo contenuto è stato indicizzato.
Per i siti web più frequentemente analizzati dal motore di ricerca, la procedura che vi illustriamo – che consente di stabilire la data in cui Google ha inserito una pagina, per la prima volta, nei suoi indici – offre, con buonissima approssimazione, l’indicazione sul momento in cui un contenuto è stato diffuso sul web.
Dopo aver aperto il browser web, si provi a digitare, nella barra degli indirizzi, l’URL seguente:
Al posto di http://PAGINA_WEB_DA_CONTROLLARE, si deve sostituire l’indirizzo della pagina web da ricercare negli archivi del motore di ricerca di Google.
Ad esempio, digitando http://www.google.it/search?q=inurl:https://www.ilsoftware.it/Condividere-file-online-allestendo-un-web-server-con-XAMPP_9091&as_qdr=y20
, Google mostrerà quando sono state pubblicate le varie pagine che compongono l’articolo consultabile a questo indirizzo.
Come si vede, la data di pubblicazione restituita da Google è la stessa che, nel nostro caso, riportiamo chiaramente in testa all’articolo.
A compiere tutto il lavoro è il parametro as_qdr
che abbiamo provveduto ad aggiungere in fondo all’indirizzo trasmesso a Google. Tale indicazione permette di specificare la finestra temporale desiderata. Digitando as_qdr=y20
si comunica a Google di cercare la pagina web specificata tra tutte quelle che sono state indicizzate sino a venti (!) anni prima di quest’oggi (la lettera “y” è l’iniziale di years, ossia “anni” in inglese). Se avessimo digitato as_qdr=d7
, Google non avrebbe trovato nulla dal momento che il nostro articolo è stato pubblicato sul web il 3 settembre 2012, quindi più di una settimana fa (“d” sta per days, ovvero “giorni”). Ovviamente al posto delle lettere “y” e “d” è possibile anche utilizzare “m” (months, “mesi”).