Se esiste un tipo di contenuto che i large scale language models (LLM) sembrano aver difficoltà a gestire sono i fogli di calcolo. Le diverse formattazioni, le formule matematiche e le tabelle sembrano proprio non andare a genio all’Intelligenza Artificiale, almeno finora. Microsoft ha infatti annunciato la creazione di SpreadsheetLLM, un LLM progettato appositamente per lavorare con fogli di calcolo Excel e Fogli Google.
In questo caso l’IA lavora convertendo tali documenti in formati più leggibili, attraverso un sistema di codifica chiamato SheetCompressor. In questo modo, per IA come GPT-4 e Llama 2, dovrebbe risultare molto più semplice interagire con questo tipo di contenuto, come testimoniato dai primi test.
Nello specifico, SheetCompressor lavora basandosi su tre principi. Il primo è l’ancoraggio strutturale, utile per identificare righe e colonne, permettendo all’IA di leggere la struttura del documento. Nel secondo caso parliamo della traduzione dell’indice invertito per l’efficienza del token. A dispetto dei termini complessi, si tratta di una tecnica per indicizzare meglio il testo presente nelle celle mantenendo intatta l’integrità dei dati contenuti.
Infine, si parla dell’aggregazione del formato dei dati per celle numeriche. Quest’ultimo principio agisce raggruppando celle con dati simili per ottimizzare l’utilizzo dei token da parte dell’IA.
Con SpreadsheetLLM Microsoft punta sempre più sull’utilizzo dell’IA in uffici e contesti lavorativi
Attraverso il lavoro di SpreadsheetLLM e di SheetCompressor, secondo il team di ricerca che ha lavorato su questa nuova tecnologia, i dati possono essere compressi del 96%, non solo facilitando la lettura dell’IA ma anche limitando in modo significativo lo sforzo per svolgere tale compito. Ciò non è da sottovalutare, anche visto il dispendio in termini energetici necessario per gestire strutture legate a tali tecnologie.
Questo tipo di applicazione dell’IA sui fogli di calcolo permetterà anche di agire sugli stessi per migliorare la formattazione, ottenere il riepilogo dei dati e “pulendo” i file. Microsoft ha già dimostrato di voler integrare l’IA in contesti come Microsoft 365 Copilot e, sotto questo punto di vista, l’arrivo di SpreadsheetLLM rappresenta un ulteriore step per introdurre l’IA in uffici e ambienti lavorativi simili. Al di là dell’annuncio, non è chiaro ancora quando e come questo LLM verrà rilasciato al pubblico.