DeepSeek R1 sembra più vulnerabile a jailbreaking degli altri modelli AI

Dalle armi biologiche alle campagne sui social media dannose, DeepSeek R1 sembra soggetto a jailbreaking: ecco un test inquietante.
DeepSeek R1 sembra più vulnerabile a jailbreaking degli altri modelli AI

R1, l’ultimo modello AI di DeepSeek, ha letteralmente scosso il mondo dell’Intelligenza Artificiale, con conseguenze notevoli tanto presso la Silicon Valley quanto a Wall Street.

Nonostante l’enorme successo ottenuto, il modello AI cinese con il passare dei giorni ha mostrato alcuni aspetti poco chiari, se non preoccupanti. Al di là dei dubbi legati all’addestramento e alla questione spinosa del trattamento dei dati, con tanto di ban in Italia, un nuovo potenziale problema è emerso nelle ultime ore.

Durante un’intervista al Wall Street Journal, Sam Rubin (il vicepresidente senior della divisione di intelligence dell’Unit 42 di Palo Alto Networks) ha lanciato un nuovo allarme. A quanto pare, DeepSeek risulta più vulnerabile ad azioni di jailbreaking rispetto alla concorrenza.

Questo termine, applicato al contesto AI, va a identificare i tentativi di manipolazione da parte degli utenti per creare contenuti illegali o pericolosi.

DeepSeek R1 a rischio jailbreaking? Ecco il confronto con ChatGPT

Lo stesso giornale coinvolto nell’intervista ha testato R1 e, sebbene sembrassero essere presenti delle misure di sicurezza di base, i giornalisti hanno affermato di aver convinto con successo DeepSeek a progettare una campagna sui social media mirata agli adolescenti facendo leva sulle loro debolezze.

Non solo: a quanto pare, il chatbot è stato anche “ingannato”, convincendo lo stesso a fornire istruzioni per un attacco con armi biologiche, a scrivere un manifesto pro-Hitler e a preparare un’e-mail di phishing con tanto di malware. Prompt a confronto, a quanto pare, ChatGPT si è sempre rifiutato di fornire materiale all’utente.

Oltre a questi casi di jailbreaking, R1 ha dimostrato in passato di essere poco “ricettivo” per argomenti strettamente collegati alla Cina, come i fatti di Piazza Tienanmen o l’autonomia di Taiwan. Di fatto, se il modello AI in questione è di certo sorprendente per potenza, nasconde ancora degli aspetti ben poco limpidi.

Ti consigliamo anche

Link copiato negli appunti