Dati caldi e freddi: qual è la differenza e come gestirli

Business

La crescita esponenziale delle informazioni digitali richiede una strategia efficace per garantire l’accessibilità e l’efficienza nella gestione dei dati. La comprensione della differenza tra dati caldi e freddi è essenziale per capire come ottimizzare la gestione delle informazioni in ambito professionale e all’interno dell’impresa. Trattare i dati in maniera appropriata porta a evidenti benefici anche sul piano dei costi di archiviazione.

Dati caldi e dati freddi: definizioni di base

I dati caldi sono dati recenti: si tratta di informazioni che, ragionevolmente, risulteranno necessarie in un futuro prossimo. Per una realtà aziendale, i dati caldi potrebbero includere le transazioni di vendita della settimana in corso o informazioni relative alle attività svolte nei periodi più vicini nel tempo. Per i ricercatori, ad esempio, potrebbero essere i dati utilizzati negli ultimi 4 mesi.

Archiviazione a caldo

I dati caldi sono dati che restano rilevanti nell’immediato o comunque nel breve termine e di cui ci si aspetta un uso continuativo. I professionisti che operano in settori nei quali sono necessarie elaborazioni di dati in tempo reale e tempi di risposta rapidi (editing Web, montaggio video, sviluppo di applicazioni,…) trovano l’archiviazione calda assolutamente indispensabile.

Per garantire l’accesso rapido ai dati, i dati caldi sono spesso ospitati in ambienti di archiviazione ibridi o stratificati. Più un servizio è “caldo”, più si avvale di tecnologie all’avanguardia, tra cui unità di memorizzazione recenti e veloci, protocolli di trasporto performanti e prossimità rispetto all’utente.

La natura intensiva delle risorse dell’archiviazione calda comporta un costo premium, e i principali fornitori di archiviazione dati cloud come Azure Blobs e AWS S3 riflettono questa realtà.

Anche senza rivolgersi al cloud, per memorizzare i dati caldi in locale si fa uso di unità SSD, capaci di offrire prestazioni I/O nettamente superiori rispetto agli hard disk magnetomeccanici e tempi di accesso notevolmente minori. In un altro articolo abbiamo visto gli hard disk e SSD più diffusi e prestazionali secondo EaseUS.

Archiviazione a freddo

Di contro, i dati freddi sono quei dati che non sono stati utilizzati o referenziati per un certo periodo di tempo e per i quali ci sono poche probabilità che possano risultare necessari nel futuro prossimo. Questi dati sono spesso archiviati ai fini della conformità legale o fiscale: si pensi alle informazioni finanziarie e ai dati dei clienti che le normative vigenti impongono di conservare per un certo numero di anni. Tra i dati freddi ci sono anche dati a cui si spera di non dover mai fare riferimento, come documenti aziendali conservati solo per scopi legali o di controllo.

In generale, i sistemi di archiviazione cloud freddi danno la priorità alla durabilità e alla convenienza rispetto alle capacità di manipolazione dei dati in tempo reale. Servizi come Amazon S3 Glacier e Google Cloud Coldline seguono questa filosofia, offrendo tempi di recupero e risposta più lenti rispetto ai loro equivalenti di archiviazione “calda”.

Ambienti di archiviazione meno performanti e meno costosi, sia in locale che nel cloud, ospitano comunemente dati freddi. Anche perché, come detto, tratta di informazioni che potrebbero restare “inattive” per lunghi periodi: mesi, anni, decenni o forse per sempre.

Ottimizzare la memorizzazione dei dati, a seconda che siano caldi o freddi

La “temperatura del dato” ha sempre suggerito, storicamente, dove le informazioni sono archiviate. I dati caldi venivano conservati vicino al “calore” degli hard disk rotanti e delle CPU: da qui il nome usato ancora oggi. I dati freddi erano invece in genere archiviati in unità di memorizzazione o nastri lontano dai centri di elaborazioni dati più caldi, probabilmente riposti su scaffali o fisicamente posti in luoghi non accessibili in via diretta.

L’importanza di trattare adeguatamente i dati caldi e freddi risiede nella necessità di ottimizzare l’uso delle risorse e minimizzare i costi. I dati caldi presuppongono una gestione più costosa ma garantiscono un accesso rapido e cruciale per le operazioni aziendali e le attività di ricerca. Al contrario, i dati freddi si accontentano di una gestione più economica ma devono comunque essere archiviati in modo sicuro e facilmente recuperabili quando necessario.

Gli aspetti da considerare per lo storage dei dati

Nel caso di grandi quantità di dati da memorizzare e conservare, è fondamentale ottimizzare i costi di archiviazione tenendo conto del costo a Terabyte di ciascun supporto di memorizzazione. Ad esso vanno aggiunti il costo energetico da affrontare per mantenere in piedi le varie soluzioni di storage utilizzate in azienda e i canoni di abbonamento per la memorizzazione dei dati offsite ovvero fuori dalla struttura dell’impresa.

Il backup 3-2-1, misura per la creazione di copie di backup dei dati diventata ormai imprescindibile, prevede la realizzazione e la gestione di una copia offsite ovvero in un luogo sicuro lontano dalla rete che ospita i dati. Questa copia di backup può essere realizzata presso un’altra filiale dell’azienda oppure creata appoggiandosi ai servizi cloud.

La soluzione migliore consiste, di solito, nell’utilizzo di sistemi di archiviazione gerarchica per i dati freddi: in questo modo tali informazioni possono essere spostate su dispositivi di storage meno costosi, come nastri magnetici, mentre i dati caldi rimangono su dispositivi di memorizzazione ad alte prestazioni.

Le caratteristiche dell’archiviazione calda e fredda, a colpo d’occhio

	Dato freddo	Dato caldo
Velocità di accesso	Lenta	Veloce
Frequenza di accesso	Raramente o mai	Frequente
Supporti di memorizzazione	Unità più lente, offline	Unità più veloci, durevoli, SSD
Costo	Inferiore	Più alto

Il contenuto della tabella rispecchia un po’ le storiche definizioni di dato caldo e freddo che, tuttavia, soprattutto con l’avvento di proposte cloud sempre più articolate, versatili e flessibili, sono diventate un po’ più sfumate. Lo vediamo nei paragrafi che seguono.

Definizioni in continua evoluzione

Con il panorama dell’archiviazione dati in continua evoluzione, la definizione di archiviazione fredda è significativamente più estesa rispetto al passato. Nei contesti moderni, dati freddi sono anche quelli che risultano archiviati completamente in modalità offline: le informazioni risiedono al di fuori del cloud e rimangono “sconnesse” da qualsiasi rete.

Questo genere di isolamento, descritto anche con l’espressione inglese “air gapped“, è cruciale per la protezione dei dati personali e riservati. Tecnologie come l’Object Lock, della quale si fa portabandiera in Italia una realtà come Cubbit ma anche produttori di sistemi NAS come QNAP, consentono di impostare restrizioni di blocco sui dati archiviati. Grazie ad Object Lock, è possibile impedire la modifica o la cancellazione dei dati per un periodo di tempo specificato.

Si tratta di una funzionalità che guarda all’immutabilità del dato e risulta particolarmente importante per garantire la sicurezza e l’integrità dei dati riservati o legalmente rilevanti, poiché li protegge costantemente da alterazioni accidentali o intenzionali.

Come funziona Object Lock

Quando si attiva l’Object Lock su un oggetto o un file memorizzato nell’archiviazione cloud, questo oggetto diventa “bloccato” e non può essere modificato o cancellato fino alla scadenza del periodo di blocco. Questo blocco può essere impostato su due modalità principali:

Blocco in modalità Governance: in questa modalità, i dati possono essere sbloccati o cancellati solo da utenti autorizzati con le autorizzazioni appropriate. Si tratta di uno schema utile per garantire il rispetto delle normative e delle politiche aziendali.
Blocco in modalità Compliance: in questo caso, i dati non possono essere sbloccati o cancellati neanche dagli utenti autorizzati. È utile per la conservazione a lungo termine dei dati a fini della conformità legale.

Spesso, l’Object Lock è combinato con il versioning dei dati: le versioni precedenti dei file sono comunque archiviate e mantenute intatte durante il periodo di blocco consentendo un ripristino completo dei dati in caso di necessità.

Anche servizi di archiviazione cloud molto popolari come Amazon S3 e Google Cloud Storage offrono la funzionalità Object Lock, che può essere configurata in base alle specifiche esigenze di archiviazione e di conformità di un’organizzazione.

Evolve anche il concetto di dato caldo

Oggi ci sono molteplici nuovi attori nel mondo delle soluzioni di archiviazione dei dati che, attraverso l’adozione di soluzioni innovative, efficaci ed efficienti, sono in grado di offrire archiviazione cloud allo stesso costo dell’archiviazione “fredda”, ma con le prestazioni e la disponibilità dell’archiviazione “calda”. Questo sia sul cloud che on-premises.

L’organizzazione dei dati in base alla loro “temperatura” è stato a lungo utilizzato da diversi fornitori cloud come Amazon, Microsoft e Google per descrivere i rispettivi servizi di archiviazione a livelli e per stabilire i prezzi di conseguenza. In un panorama cloud definito dall’Internet aperta e dal multicloud, i clienti hanno cominciato a capire il valore e i vantaggi che possono ottenere rivolgendosi a provider che si svincolano dall’approccio storicamente utilizzato.

Alcuni fornitori possono finalmente competere in termini di prezzo con i sistemi di archiviazione a nastro e altri strumenti tradizionalmente “freddi” sebbene i loro servizi di storage siano sfruttabili per applicazioni che coinvolgono l’uso di dati caldi, come la gestione dei media, la collaborazione sui flussi di lavoro, i siti Web e la condivisione di informazioni in tempo reale.

Credit immagine in apertura: iStock.com/Ploystock