Un nuovo generatore di video basato sull’Intelligenza Artificiale si unisce al vasto gruppo di strumenti di questo tipo che affollano il mercato. Stiamo parlando di un modello text-to-video proposto da Alibaba, la multinazionale cinese specializzata nel commercio elettronico.
La nuova piattaforma, annunciata in occasione della conferenza Alibaba Cloud Apsara, rappresenta l’ultima fatica del colosso che sta investendo pesantemente in diversi progetti riguardanti l’IA e i modelli di linguaggio di grandi dimensioni (LLM). Il nome più noto in tal senso SeaLLM, un chatbot diretto concorrente di ChatGPT che ha richiesto ingenti sforzi economici per lo sviluppo.
Il nuovo progetto, battezzato Tongyi Wanxiang, può vantare alcune delle architetture di trasformatori di diffusione (DiT) più avanzate in circolazione. Questa tecnologia permette di ottenere una qualità del video generato elevatissima, che sia un filmato realistico o uno che strizza l’occhio all’animazione.
Alibaba sfida Sora e i tanti altri competitor di un settore ultra competitivo
Come affermato da Alibaba, questa tecnologia potrebbe essere utilizzata in una serie di video dedicati ad ambiti come marketing e intrattenimento ma, in futuro, potrebbe fornire supporto anche in contesti come videogiochi.
Nonostante le ottime premesse, come già accennato, Tongyi Wanxiang dovrà però vedersela con una schiera di competitor che, per numero e qualità, risultano avversari a dir poco ostici. Se OpenAI ha attirato i riflettori con il suo modello Sora, non mancano le tante alternative come Dream Machine, Stability AI, Runway, Pika e Hotshot, solo per citarne alcuni.
All’interno dello stesso contesto cinese, il progetto di Alibaba dovrà vedersela con concorrenti di tutto rispetto come Jimeng di Bytedance, la compagnia proprietaria di TikTok. Una sfida difficile e stimolante, che a quanto pare non intimorisce la multinazionale asiatica.