Dopo il clamoroso exploit di DeepSeek, le compagnie cinesi sembrano sempre più intenzionate a fare la voce grossa nel contesto dell’Intelligenza Artificiale.
Lo dimostra Alibaba che, attraverso il suo team Qwen, ha lanciato una nuova famiglia di modelli di intelligenza artificiale, ovvero Qwen2.5-VL. Questi si propongono come in grado di eseguire una serie di attività di analisi avanzata di testo e immagini.
Nello specifico, Qwen2.5-VL può analizzare file, comprendere video e contare oggetti nelle immagini. Se ciò non è un qualcosa di clamoroso, visto le potenzialità dei modelli AI in circolazione, quanto proposto da Alibaba ha altri assi nella manica: attraverso tale piattaforma, infatti, Qwen2.5-VL può agire in autonomia per quanto riguarda PC e smartphone.
Inoltre, quando si parla di test, il team Qwen dimostra di aver raggiunto risultati impressionanti. Secondo quanto sostenuto dai suoi creatori, benchmark alla mano, Qwen2.5-VL batte tutta la concorrenza (da GPT-4o a Claude 3.5 Sonnet fino a Gemini 2.0), per quanto concerne aspetti come comprensione video, matematica, analisi di documenti e risposte alle domande.
Alibaba e Qwen2.5-VL: dopo DeepSeek la Cina conquista il settore AI
Come già accennato, una delle peculiarità più interessanti di Qwen2.5-VL è la sua capacità di interagire con il software, sia su PC che su dispositivi mobile. A testimonianza di queste capacità vi è un filmato pubblicato su X da Philipp Schmid, responsabile tecnico di Hugging Face.
Don’t Miss @Alibaba_Qwen 2.5 VL! Despite all the Deepseek Hype, Qwen just dropped the best open Multimodal! Qwen 2.5 VL is a Vision Language Model that can control your computer, similar to the @OpenAI operator, extract structured information from charts, and more!!
TL;DR;
3️⃣… pic.twitter.com/GeEGVdl0tI— Philipp Schmid (@_philschmid) January 27, 2025
Nonostante le enormi potenzialità, Qwen2.5-VL presenta anche diverse “zone d’ombra” che in molti casi ha in comune con DeepSeek. In primis, alcune analisi lasciano intravedere una politica non troppo trasparente per quanto concerne i dati utilizzati per l’addestramento, con potenziali violazioni di copyright. In seconda battuta, vi è sempre il problema riguardante la libertà di parola. Se si interroga Qwen2.5-VL rispetto al governo cinese e alle politiche attuate dallo stesso, l’AI presenta un messaggio di errore.
I modelli AI cinesi devono infatti sottostare a specifiche autorità di regolamentazione. Le stesse, controllano che i chatbot garantiscano risposte che “incarnino i valori socialisti fondamentali“.