Con il termine stilometria ci si riferisce alla misurazione degli indicatori stilistici (o stilemi) nella scrittura così come nel parlato.
Rachel Greenstadt, professore associato presso la Drexel University e Aylin Caliskan hanno verificato che anche il codice di programmazione, come qualunque altra forma espressiva, offre indicazioni sull’identità dell’autore.
In altre parole, è possibile risalire allo sviluppatore che ha realizzato un certo programma o qualunque routine confrontandone il codice con quello già noto.
Il sistema messo a punto dai ricercatori accademici sfrutta il machine learning per risalire all’identità di chi ha scritto qualunque codice.
Per il test è stato fatto uso della piattaforma Google Code Jam dandole in pasto otto diversi campioni di codice per 600 programmatori differenti.
Conclusa la fase di apprendimento, l’intelligenza artificiale è riuscita a riconoscere correttamente l’autore di un programma mai visto prima collegandone la paternità con uno dei 600 sviluppatori coinvolti nel test. Il responso si è rivelato corretto l’83% delle volte. Un risultato ancora ben lontano dalla perfezione, quindi, ma ancora ampiamente migliorabile con una serie di accorgimenti che saranno certamente utilizzati in futuro.
Un’intelligenza artificiale di questo tipo può essere utile per risalire, per esempio, all’autore di un malware oppure per far emergere casi di plagio dei contenuti.