Ryan King, uno degli ingegneri di Twitter, ha dichiarato come il social networking e servizio di micro-blogging stia valutando la migrazione al database “Cassandra“, evolutosi in seno alla fondazione Apache e da pochissimo uscito dalla fase di “incubazione”. Il tasso di crescita con cui sta aumentando il quantitativo di dati da gestire sta inducendo Twitter a valutare soluzioni alternative per la memorizzazione delle medesime informazioni: dai due milioni di cinguettii al giorno che si registravano lo scorso anno, a distanza di 24 mesi la mole di dati da trattare è divenuta 25 volte più grande. A gennaio 2010, infatti, su Twitter venivano quotidianamente pubblicati circa 50 milioni di messaggi.
I tecnici di Twitter si augurano che l’adozione di Cassandra possa accelerare le prestazioni del sito e migliorare l’aspetto scalabilità. Inizialmente Twitter manterrà gli attuali database MySQL affiancando loro l’uso di basi di dati Cassandra. Solo non momento in cui sarà verificato il perfetto funzionamento di Cassandra, i tecnici provvederanno ad effettuare la completa migrazione di tutti i dati, processo che dovrebbe richiedere all’incirca una settimana di lavoro.
Così come Twitter e Facebook, anche Digg si sta preparando ad abbracciare Cassandra.
Distributo come prodotto opensource da Facebook già nel 2008, Cassandra nasce come database distribuito ed integra le funzionalità per lavorare su dati memorizzati su diverse macchine. La decentralizzazione è uno dei punti di forza del database che permette di evitare di aver a che fare con la presenza di singoli “punti di rottura” (SPOF, Single point of failure).