Un altro gioco da tavolo considerato inaffrontabile per le intelligenze artificiali si è dovuto arrendere ai loro progressi. Una AI della DeepMind, il laboratorio spin-off di Google, è diventata tanto esperta in Stratego da potersi battere con i maggiori esperti al mondo di questa sfida da tabellone, che richiede capacità di pensiero tattico e di previsione delle mosse dell'avversario - a fronte di pochissime informazioni disponibili.
Come racconta uno studio pubblicato su Science il 1 dicembre, l'intelligenza artificiale - che è stata chiamata DeepNash in onore del matematico statunitense John Nash - ha imparato a bluffare con i pezzi meno di valore e a sacrificare quelli più pregiati pur di ottenere la vittoria e guadagnare informazioni sulla strategia dell'avversario. Un bagaglio di esperienze che potrebbe tornare utile anche in contesti diversi dal gioco, nella vita di tutti i giorni.
Una sfida difficile. Stratego ha diverse caratteristiche che lo rendono molto più complicato da affrontare rispetto agli scacchi e al gioco cinese del Go, specialità in cui le intelligenze artificiali sono già diventate praticamente imbattibili. In Stratego infatti i due giocatori non vedono le pedine degli avversari a meno che non ci si scontrino direttamente. Ogni giocatore posiziona 40 pezzi e deve cercare di muoverli in modo da eliminare quelli del contendente, con l'obiettivo di catturare la sua bandiera.
Il numero di possibili situazioni che si potrebbero sviluppare nel gioco, in Stratego è pari a 10 alla 535esima. Per fare un confronto, nel Go questo numero è 10 alla 360esima e negli scacchi è di molto inferiore. Tutte queste caratteristiche rendono il gioco particolarmente complesso, in particolar modo per le AI.
Un avversario tosto. Julien Perolat e i colleghi della DeepMind hanno allenato DeepNash facendolo giocare contro se stesso nel corso di 5,5 miliardi di partite, in una simulazione equivalente a centinaia di anni di gioco di Stratego. L'AI non ha sfruttato conoscenze umane pregresse sul gioco né si è esercitata a giocare contro avversari specifici.
Anziché cercare ogni volta la mossa migliore tra tutti i possibili scenari, un'operazione che sarebbe stata impossibile in termini computazionali, DeepNash ha sfruttato un algoritmo che reindirizza continuamente la sua strategia di gioco, rendendosi di fatto imprevedibile. Per esempio ha variato le combinazioni iniziali delle sue pedine al punto da rendere impossibile per l'avversario scorgere degli elementi ricorrenti partita dopo partita. E durante la fase di gioco, ha scelto a caso tra azioni equivalenti per evitare di dare troppi indizi sul suo schema di gioco.
Giocando si impara. Con queste frecce al suo arco DeepNash ha raggiunto l'84% di tasso di vincita durante 50 partite di complessità crescente contro giocatori umani incontrati online, divenendo - all'insaputa degli avversari, ignari di giocare contro un'AI - uno dei tre migliori giocatori. Ha inoltre vinto nel 97% dei casi contro altri bot, che hanno provato a giocare a Stratego con tecniche più tradizionali. Questa capacità di gestire l'imprevedibile potrebbe essere sfruttata in settori in cui le AI devono affrontare esseri umani con comportamenti spesso irrazionali, subottimali e non sempre sequenziali dal punto di vista logico, come nell'ottimizzazione del traffico o nelle auto senza conducente.