/https://www.ilsoftware.it/app/uploads/2025/04/wp_drafter_475095.jpg)
Un importante passo avanti nel panorama dell’intelligenza artificiale generativa è stato annunciato da ByteDance, la società madre di TikTok, con il lancio del suo nuovo modello linguistico, Seed-Thinking v1.5. Questo modello si distingue per la sua architettura innovativa e le sue prestazioni superiori, posizionandosi come un serio concorrente nei confronti dei giganti del settore.
Come funziona Seed-Thinking v1.5
La caratteristica principale di Seed-Thinking v1.5 è il suo approccio “chain of thought”, una metodologia che consente al modello di sviluppare ragionamenti complessi in modo sequenziale.
A supportare questa capacità è l’architettura Mixture of Experts (MoE), che attiva selettivamente solo alcuni “esperti” tra i 200 miliardi di parametri totali, garantendo così un’efficienza straordinaria. Questa tecnologia, già vista in altri contesti come il modello Llama 4 di Meta, permette di bilanciare potenza e ottimizzazione delle risorse.
Nonostante vengano attivati solo 20 miliardi di parametri alla volta, il modello ha raggiunto risultati straordinari nei benchmark di settore. Tra i più rilevanti, un punteggio dell’86,7% nel test matematico AIME 2024, il 55% nei test di programmazione su Codeforces e il 77,3% nel benchmark scientifico GPQA. In alcuni casi, come il test ARC-AGI, il modello ha persino superato soluzioni proposte da OpenAI e Google, dimostrando il suo valore sia in termini di precisione che di applicabilità.
Il processo di addestramento del modello è stato altrettanto impressionante, basandosi su un dataset di 400.000 esempi. L’80% di questi dati si concentra su matematica avanzata, giochi e puzzle, rendendo il modello particolarmente competente in questi ambiti. Inoltre, ByteDance ha introdotto strumenti proprietari come Seed-Verifier e Seed-Thinking-Verifier per garantire la correttezza e l’efficacia delle risposte generate, agendo come veri e propri “insegnanti digitali”.
L’innovazione tecnologica si estende anche all’infrastruttura utilizzata per l’addestramento. Il sistema Streaming Rollout System (SRS) accelera il processo di apprendimento triplicandone la velocità rispetto ai metodi tradizionali. L’utilizzo del formato di calcolo FP8 e di strumenti come ByteCheckpoint ottimizza ulteriormente l’efficienza delle risorse, rendendo il modello altamente competitivo nonostante la sua compattezza.
Il team Seed LLM Systems, guidato da Yonghui Wu, ha annunciato ulteriori sviluppi nei prossimi mesi. Tra questi, un focus particolare sarà dedicato ai compiti non verificabili e all’introduzione di benchmark interni come BeyondAIME, progettati per testare il modello in scenari realistici e complessi.
Un altro competitor nell’arena dell’AI
Con Seed-Thinking v1.5, ByteDance dimostra che è possibile competere con modelli più grandi e costosi puntando su efficienza e innovazione. Questo lancio segna un nuovo capitolo per l’azienda, che fino ad oggi è stata leader dei social con il suo TikTok e ora prova a posizionarsi come protagonista nel settore dell’intelligenza artificiale avanzata e offrendo una soluzione che combina potenza computazionale e accessibilità per soddisfare le esigenze del mercato moderno.