Paywall bypass: di cosa si tratta e perché se ne parla tanto

Quali sono le differenze tra le principali modalità di protezione dei contenuti premium utilizzate dagli editori online e in che cosa consiste il paywall bypass.
Paywall bypass: di cosa si tratta e perché se ne parla tanto

Un paywall è un sistema che impedisce l’accesso gratuito a determinati contenuti online e richiede agli utenti di pagare un corrispettivo in denaro per consultarli. Si tratta di un modello spesso utilizzato da tanti siti Web per generare entrate e monetizzare i contenuti. L’espressione paywall bypass si riferisce invece agli strumenti e alle metodologie che, in alcuni casi, permettono di superare il blocco imposto dall’editore al momento della visualizzazione di una pagina Web.

Quali tipi di paywall esistono

Complici anche le restrizioni che, ad esempio, le disposizioni sui cookie hanno a suo tempo introdotto in Europa, tanti editori si sono attivati per esplorare strumenti di monetizzazione alternativi. Tra i più “gettonati”, ci sono appunto i paywall:

  • Hard paywall. Impediscono completamente l’accesso al contenuto senza un pagamento.
  • Soft paywall. Consente un certo numero di visualizzazioni gratuite prima di richiedere il pagamento.
  • Metered paywall. Limita il numero di articoli o pagine che gli utenti possono visualizzare gratuitamente in un determinato periodo di tempo.
  • Modello Freemium. Il sito Web offre contenuti di base gratuitamente ma richiede il pagamento per l’accesso a funzionalità premium o contenuti premium.

Quanto sia opportuno servirsi dei paywall è un argomento dibattuto e in ogni caso la loro efficacia dipende dalla qualità del contenuto offerto, dalla tipologia editoriale di ciascun sito Web e, di conseguenza, dalla disposizione degli utenti a pagare per l’accesso. O per l’attivazione di un abbonamento.

Come funzionano i paywall

Il funzionamento dei paywall dipende da una combinazione di tecnologie e strategie per limitare l’accesso ai contenuti online a chi non ha effettuato il pagamento o non ha un’autorizzazione specifica. Molti siti Web utilizzano cookie per tenere traccia delle attività degli utenti: i cookie possono contenere informazioni sull’autenticazione dell’utente e sul suo stato (ad esempio, se ha già raggiunto il limite di articoli gratuiti).

Un paywall può essere implementato sia lato client che lato server, e spesso l’applicazione Web sfrutta tecnologie su entrambi i lati. Nel caso di tante implementazioni, il codice JavaScript presente nel sorgente HTML controlla il comportamento della pagina funzionando completamente lato client. In questo caso, il contenuto premium è nascosto sul dispositivo dell’utente, mostrando un messaggio che invita a stipulare un abbonamento.

L’accesso ai contenuti premium può essere però controllato anche lato server. Il server verifica se l’utente è autorizzato a visualizzare il contenuto in base alle informazioni di autenticazione fornite.

L’applicazione Web può utilizzare token di accesso generati lato server e utilizzati lato client per sbloccare l’accesso ai contenuti riservati. Le richieste per i contenuti premium possono essere gestite attraverso chiamate API server-side, che controllano l’autenticazione e l’accesso.

Paywall bypass: quali contenuti sono accessibili facilmente

Utilizzo della navigazione in incognito

Se un sito Web limita il numero di articoli visualizzabili gratuitamente, di solito utilizza un cookie per tenere traccia del numero di contenuti già consultati. Spesso, quindi, il semplice utilizzo della modalità di navigazione in incognito consente di azzerare il “contatore”. Basta premere la combinazione di tasti CTRL+MAIUSC+N nei vari browser Web oppure CTRL+MAIUSC+P (nel caso di Mozilla Firefox) e provare.

Sono pochi i siti Web che memorizzano l’indirizzo IP pubblico con cui si presenta il sistema client. In questo caso, l’utilizzo della modalità di navigazione in incognito o la cancellazione dei cookie non funziona.

In questi casi, un servizio VPN di terze parti consente di cambiare indirizzo IP e presentarsi con un IP pubblico diverso da quello assegnato dal provider di telecomunicazioni prescelto. La modifica dell’indirizzo IP pubblico è ottenibile anche con Tor Browser oppure ricorrendo a un semplice server proxy. In un altro articolo abbiamo visto le differenze tra VPN e proxy.

Dal punto di vista degli editori, anche se un’implementazione esclusivamente lato client può offrire una migliore esperienza utente, non dovrebbe essere l’unica barriera tra gli utenti gratuiti e i contenuti premium. Come detto, infatti, la sicurezza complessiva del sistema richiede di solito una combinazione di tecniche server-side e client-side.

Disattivazione JavaScript

Per rendersi conto di quanto siano semplici alcuni paywall, basta accedere alle impostazioni del browser Web e disattivare JavaScript temporaneamente. In Google Chrome e nei browser derivati da Chromium è possibile farlo semplicemente digitando chrome://settings/content/javascript nella barra degli indirizzi quindi selezionando l’opzione Non consentire ai siti di usare JavaScript.

Ricaricando la pagina Web che in precedenza mostrava il paywall, magari aiutandosi eventualmente con la modalità in incognito, quando la protezione è soltanto client-side, si vedrà il contenuto premium nella sua interezza.

Utilizzo della modalità lettura

Lo stesso risultato è ottenibile utilizzando la modalità lettura di Edge. La modalità lettura, prima aggiunta anche a Chrome e poi rimossa, permette di ottenere una versione più leggibile di qualunque articolo pubblicato sul Web.

Nel browser Microsoft, preinstallato in Windows 10 e Windows 11 e in Europa rimovibile su richiesta, si può premere il tasto F9 sulla tastiera per abilitare la modalità lettura. Su alcuni portatili è necessario premere Fn+F9.

Anche in questo caso, qualora il contenuto fosse protetto con un paywall che poggia esclusivamente su codice JavaScript, si accederà al testo completo dell’articolo.

Strumenti per gli sviluppatori

Premendo il tasto F12 per aprire la finestra Strumenti per gli sviluppatori, è possibile – da browser Web – nascondere gli elementi HTML che impediscono la visualizzazione del contenuto sottostante. Per procedere, basta cliccare con il tasto destro del mouse sul paywall, scegliere Ispeziona quindi, in corrispondenza del codice HTML corrispondente, scegliere l’opzione Hide element/Nascondi elemento.

Utilizzo di The Wayback Machine

In alcuni casi, il servizio The Wayback Machine di Internet Archive consente di accedere al contenuto di una pagina che risulta protetta da paywall. Si tratta delle situazioni in cui la stessa pagina fosse stata recuperata e indicizzata dai crawler di Internet Archive.

Per effettuare un tentativo, basta copiare e incollare l’URL nel campo a sinistra del pulsante Browse history. Con un clic si può quindi verificare come si presentava una stessa pagina Web in diversi momenti temporali.

Utilizzare 13ft, ospitabile anche in locale

12ft è un’applicazione Web che aiuta ad aggirare i paywall sfruttando il blocco dell’esecuzione di JavaScript e il comportamento standard dei crawler Web. Il fatto è che ultimamente è diventato meno efficace, in particolare con quelli che implementano misure più sofisticate per distinguere i bot dagli normali utenti.

Ospitabile anche in locale (self-hosted), 13ft è un progetto open source che vuole raccogliere l’eredità di 12ft e offre massimo controllo da parte dell’utente.

13ft utilizza un approccio tradizionale per accedere a contenuti non facilmente leggibili, impersonando GoogleBot per ottenere versioni complete delle pagine. Ovviamente, non può funzionare se i server Web rifiutano di fornire contenuti completi ai bot.

In alto a destra, nel repository GitHub di 13ft, si può provare 13ft fruendo della demo, perfettamente funzionante.

Accesso alla versione AMP della pagina Web

Google AMP, acronimo di Accelerated Mobile Pages, è un’iniziativa volta a migliorare la velocità di caricamento delle pagine Web sui dispositivi mobili. L’azienda di Mountain View ha esortato gli sviluppatori Web, a più riprese, ad abbracciare AMP. Tuttavia, nell’ultimo periodo, la società ne ha parlato di meno e lo sforzo sembra essere destinato a passare nel “dimenticatoio”.

Google, infatti, più che spingere ancora su AMP, ha preferito puntare sui Core Web Vitals per sollecitare i webmaster e gli amministratori di siti Web a migliorare il caricamento delle pagine. I Web Vitals sono diventati infatti fattori di ranking, per il posizionamento delle pagine Web nelle SERP (pagine dei risultati del motore di ricerca).

Per accedere alla versione senza paywall, tavolta è possibile premere CTRL+U in modo da accedere al sorgente della pagina HTML, cercare il tag amphtml (<link rel="amphtml">) quindi copiare l’URL contenuto nell’attributo href. Copiando e incollando tale URL nella barra degli indirizzi di una finestra di navigazione in incognito, è possibile verificare l’eventuale accesso al contenuto.

Utilizzare Google Translate

Un’ulteriore opzione consiste nell’utilizzare il servizio Google Translate. In questo caso basta incollare l’URL della pagina protetta da paywall nel riquadro di sinistra quindi cliccare sul link mostrato a destra. Avendo cura di selezionare Italiano in alto.

Se nella pagina di destinazione comparisse comunque un riferimento al paywall, è possibile disattivare JavaScript così come indicato in precedenza.

Quali paywall non possono essere superati

Come abbiamo visto in precedenza, i paywall che utilizzano tecniche server-side per accertare l’identità dell’utente non possono ovviamente essere superati utilizzando tecniche che disabilitano il codice JavaScript, intervengono sui cookie o effettuano manipolazioni client-side.

Si tratta comunque di una scelta difficile per gli editori: tanti utenti sono riluttanti a pagare per il contenuto online quando c’è tanto materiale gratuito disponibile.

L’implementazione di un paywall che autentica gli utenti potrebbe essere costosa, riducendo allo stesso tempo il numero di visitatori, influenzando la visibilità e la portata del sito.

D’altra parte, i contenuti servono per guadagnare visibilità e posizionarsi sui motori di ricerca. Nascondendoli completamente a Google e agli altri motori, non è possibile raggiungere tali obiettivi.

Conclusioni

Per gli editori online vale però davvero la pena continuare a insistere sui paywall? Sul versante dei lettori, questi ultimi non dovrebbero forse impegnarsi a visitare i siti Web che si sostengono con la pubblicità senza presentarsi con Adblock e strumenti similari? Valutando eventualmente l’acquisto di un abbonamento – ove previsto – per visitare il sito Web senza advertising.

Appare infine opportuno sottolineare che, a seconda di quanto riportato nelle condizioni e nei termini di utilizzo dei siti Web, va detto che l’eventuale superamento del paywall impostato dall’editore può costituire un illecito civile.

Google, da parte sua, ha presentato Privacy Sandbox, una funzionalità descritta come più rispettosa della privacy pur consentendo la visualizzazione di annunci pubblicitari in linea con le aspettative e le preferenze degli utenti. Probabilmente, in futuro assisteremo a una nuova rivoluzione nel settore dell’advertising online che negli ultimi tempi si è fatto molto meno remunerativo.

Credit immagine in apertura: iStock.com/AndreyPopov

Ti consigliamo anche

Link copiato negli appunti