Oscurare dati nei documenti PDF e nelle immagini: attenzione a non commettere errori

La protezione dei dati personali e sensibili è divenuta un aspetto ancora più cruciale nella moderna era digitale. Che si tratti di nomi, loghi o altre informazioni che devono essere nascoste, oscurare dati nei documenti, ad esempio in formato PDF, e nelle immagini è una pratica comune in molti contesti professionali. Il problema è che, come emerge da molteplici incidenti susseguitisi anche in tempi recenti, sono tanti i soggetti che non nascondono i dati in modo corretto.

Avete presente le classiche pecette che trovate su alcuni documenti PDF? Ecco, sappiate che in molti casi quei rettangoli neri che dovrebbero impedire la lettura delle informazioni sottostanti sono apposti in modo assolutamente scorretto. Ci siamo ritrovati spesso ad analizzare documenti PDF contenenti dati oscurati che, in realtà, non erano affatto tali.

In alcuni casi, bastava selezionare il testo cancellato con un riquadro di colore nero per leggere tutte le informazioni (evidentemente, l’autore del PDF si era semplicemente limitato a modificare colore e sfondo del testo…). In altri, il riquadro nero era apposto semplicemente come nuovo livello: bastava aprire il PDF con un editor per rimuovere gli elementi sovrapposti alle informazioni.

In generale, capita spesso che le tecniche usare per oscurare dati, per pixellare e sfocare le immagini si rivelino totalmente inadeguate per proteggere i dati nascosti.

Sfocatura e pixelation: perché non funzionano

Molti di noi usano sfocare o pixellare dettagli indesiderati o sensibili in immagini e documenti. Queste tecniche, però, non sono sicure come si potrebbe pensare. Diversi studi hanno dimostrato che è possibile invertire gli effetti della sfocatura e della pixelation con strumenti relativamente semplici, rivelando così i dettagli nascosti.

Nella sua analisi, Jotham Lim ricorda il caso di un noto criminale che cercò di nascondere il suo volto in alcune foto usando un effetto di distorsione, chiamato filtro swirl. Tuttavia, applicando l’effetto in senso inverso, le Autorità riuscirono a ricostruire il suo volto e ad arrestarlo.

Questi metodi di annullamento delle censure sono diventati sempre più accessibili. Nel caso dei testi, software come Depix e Unredacter utilizzano algoritmi che confrontano le immagini pixellate o sfocate con versioni generate di tutte le possibili combinazioni di caratteri, permettendo così di risalire al testo originale con una certa precisione. Se il tipo di carattere utilizzato nella redazione è noto, il processo di decifrazione diventa ancora più semplice. Ne parlavamo già a inizio 2022 spiegando che pixellare le foto non serve perché i testi si leggono comunque.

Le barre nere: un falso senso di sicurezza

Oscurare dati con l’apposizione di barre nere è forse la tecnica più diffusa per nascondere informazioni importanti nei documenti PDF: ne parlavamo in apertura. Tuttavia, anche questo metodo è ben lontano dall’essere infallibile.

Come accennato, le informazioni coperte da rettangoli neri restano spesso accessibili attraverso semplici strumenti di modifica dei file PDF o addirittura convertendo il PDF in testo.

Se le barre nere non sono state applicate in modo distruttivo (ossia, non eliminano fisicamente i dati sottostanti), possono essere facilmente rimosse o bypassate, rivelando le informazioni che sarebbero dovute restare segrete.

Problemi relativi al ritaglio (cropping) degli screenshot e delle immagini

Un’altra tecnica comune di censura è il ritaglio delle immagini per rimuovere parti indesiderate. Tuttavia, anche questo approccio ha le sue vulnerabilità.

Il cropping, o ritaglio, è una pratica comune per nascondere parti non rilevanti o sensibili di immagini e screenshot. Tuttavia, questo metodo presenta diverse problematiche e rischi che possono compromettere la sicurezza delle informazioni.

Anche se un’immagine è stata ritagliata per rimuovere dettagli specifici, le informazioni originali potrebbero rimanere all’interno del file:

Metadati e dati residui: I file possono contenere metadati che includono informazioni su tutte le parti originali dell’immagine. Questi dati possono contenere informazioni su come l’immagine è stata modificata, informazioni sui pixel rimossi e/o sul dispositivo di origine. Anche dopo il cropping, alcuni di questi metadati possono rivelare dettagli importanti.

Strumenti di recupero delle immagini: Esistono strumenti e tecniche che possono tentare di recuperare le informazioni non visibili. Ad esempio, i file RAW delle immagini possono conservare dati anche dopo il cropping. Le tecniche di analisi dei file possono essere utilizzate per estrarre queste informazioni. Software come ExifTool possono analizzare e mostrare metadati nascosti.

Vulnerabilità in fase di cropping

Il formato di file dell’immagine influisce notevolmente sulla sicurezza del cropping. Alcuni formati JPEG hanno il potenziale per conservare dati extra anche dopo il ritaglio. Un problema noto, chiamato Acropalypse, ha dimostrato che, con alcune versioni di Android, è possibile recuperare informazioni da immagini ritagliate. Lo stesso problema è emerso anche in ambiente Windows, individuato in particolare nello Strumento di cattura integrato nel sistema operativo Microsoft.

Anche se i formati PNG e TIFF gestiscono i dati delle immagini in modo diverso, non sempre rimuovono tutte le informazioni extra dopo il ritaglio. La struttura di questi file può contenere dati residui che potrebbero essere estratti e riutilizzati.

Come oscurare i dati in modo efficace e sicuro

Alla luce delle numerose problematiche emerse negli ultimi anni, splendidamente riassunte da Jotham Lim, è essenziale utilizzare software che eliminano i dati censurati in modo distruttivo. È importante assicurarsi di utilizzare queste funzioni correttamente e non affidarsi a strumenti di modifica generici.

Molto efficace è il software aperto Stirling PDF, per modificare documenti e convertirli in Word. L’applicazione è in grado di rilevare automaticamente e oscurare i dati rilevanti in modo sicuro. Gli sviluppatori precisano però che nel prossimo futuro sarà possibile beneficiare del redacting manuale.

In alternativa, la soluzione più efficace consiste nel sostituire il testo contenente informazioni personali con [RIMOSSO] o qualcosa di simile. Questa pratica non solo oscura il contenuto, ma impedisce a chiunque di stimare la lunghezza del testo nascosto, aggiungendo un ulteriore livello di sicurezza.

La compressione delle immagini e dei documenti può aiutare a rimuovere metadati che potrebbero rivelare informazioni sensibili. È fondamentale utilizzare strumenti che eliminino efficacemente questi dati nascosti.

Per informazioni estremamente sensibili, il metodo più sicuro rimane quello di stampare il documento, tagliare fisicamente le parti sensibili e scansionare nuovamente le pagine nel formato a 2-bit (bianco e nero). Questo metodo, seppur più laborioso, è considerato sicuro al 100%.

Tutti gli sforzi sono vani se i file originali (le versioni senza le censure) finiscono nelle mani sbagliate. È essenziale implementare un sistema sicuro per la gestione e l’archiviazione dei file originali, magari utilizzando nomi di file criptati e volumi crittografati.

Credit immagine in apertura: iStock.com – Christopher Ames