Innovazione

AlphaGo Zero, il nuovo campione di Go è del tutto autodidatta

L'ultima versione di intelligenza artificiale di Google DeepMind si chiama AlphaGo Zero, e ha imparato da sola a giocare a Go. In meno di un mese è diventata il giocatore più forte di sempre, macinando da sola millenni di storia del gioco strategico.

Un programma di intelligenza artificiale (AI) sviluppato dalla DeepMind, una società dell'universo Google, ha raggiunto livelli superumani nell'antico gioco di strategia di Go, sbarazzandosi di un ingombrante fardello lungo la sua corsa verso l'apprendimento: l'uomo.

Pochi mesi fa AlphaGo, la versione precedente del campione virtuale, aveva sconfitto i principali campioni umani del gioco. Ora il suo successore, AlphaGo Zero, l'ha persino superato, e senza bisogno di maestri umani.

A differenza della precedente versione, che si era istruita su oltre 100 mila partite umane giocate da esperti, il nuovo software ha ricevuto come input soltanto le regole base, e ha poi iniziato a giocare contro se stesso da zero, come un principiante.

Go è un antico gioco da tavolo cinese, tra i più complessi al mondo in termini di tattica e strategia: esistono più configurazioni delle pedine sulla sua scacchiera che atomi nell'Universo, ed è impossibile persino per un computer conoscere tutte le possibili mosse.

Rapidi progressi. Nel giro di tre giorni la nuova versione di AlphaGo aveva già raggiunto il livello degli attuali campioni, sorpassando millenni di storia di partite e studi di tattiche umani.

Dopo 21 giorni era capace di battere qualunque campione mondiale di Go - incluso quello attuale che ovviamente non è umano, ma è un altro programma della DeepMind, AlphaGo master.

Dopo 40 giorni di allenamento e 30 milioni di partite conosceva mosse mai viste prima, «come se una civiltà aliena avesse inventato la propria matematica», ha spiegato Nick Hynes, ricercatore informatico del MIT, a Gizmodo.

I progressi di apprendimento di AlphaGo Zero nel tempo, a confronto con quelli di altri campioni umani (in verde) o virtuali (in blu) del gioco. Clicca per far partire l'animazione. © DeepMind

Come ci è riuscito? In modo simile ai suoi predecessori, AlphaGo Zero si è affidato a una rete neurale profonda (un tipo di intelligenza artificiale ispirata al cervello umano) per apprendere i concetti astratti alla base del gioco. Ha usato quello che gli esperti chiamano apprendimento per rinforzo, una tecnica che difficilmente funziona con i programmi di intelligenza artificiale, perché richiede costanza e stabilità nell'apprendimento: molto spesso, al contrario, questi software imparano a battere nuovi avversari ma dimenticano come sconfiggere precedenti versioni di se stessi.

Più efficiente. C'è poi una differenza fondamentale rispetto al passato. I software precedenti usavano due reti neurali separate, una per predire le migliori mosse probabili e una per decidere quale, tra queste, avrebbe garantito la vittoria. Nel secondo caso, si affidavano a un processo chiamato rollout, una serie di simulazioni di partite per testare le possibili conseguenze.

AlphaGo Zero ha unito le funzioni in una singola rete neurale alla quale chiede direttamente di predire mossa vincerà: è come chiedere di fare una previsione a un singolo esperto anziché affidarsi a 100 ipotesi di persone comuni.

Possibili utilizzi. Il nuovo software potrebbe trovare applicazioni nella robotica, nella fabbricazione di nuovi materiali e soprattutto, nella chimica. Lo si potrebbe infatti usare in ricerche complesse come quelle su tutte le possibili configurazioni di ripiegamento delle proteine, ambito in cui oggi si deve ricorrere a tecniche costose e macchinari ancora poco diffusi.

19 ottobre 2017 Elisabetta Intini
Ora in Edicola
Scopri il mondo Focus. Ogni mese in edicola potrai scegliere la rivista che più di appassiona. Focus il magazine di divulgazione scientifica più letto in Italia, Focus Storia per conoscere la storia in modo nuovo ed avvincente e Focus Domande & Risposte per chi ama l'intrattenimento curioso e intelligente.

Settant’anni fa agli italiani arrivò un regalo inaspettato: la televisione. Quell’apparecchio – che pochi potevano comprare e quindi si vedeva tutti insieme – portò con sè altri doni: una lingua in comune, l’intrattenimento garantito, le informazioni da tutto il mondo. Una vera rivoluzione culturale e sociale di cui la Rai fu indiscussa protagonista. E ancora: i primi passi della Nato; i gemelli nel mito e nella società; la vita travagliata, e la morte misteriosa, di Andrea Palladio; quando, come e perché è nato il razzismo; la routine di bellezza delle antiche romane.

ABBONATI A 29,90€

I gemelli digitali della Terra serviranno a simularne il futuro indicando gli interventi più adatti per prevenirne i rischi ambientali. E ancora, le due facce dell’aggressività nella storia dell’evoluzione umana; com’è la vita di una persona che soffre di balbuzie; tutti gli strumenti che usiamo per ascoltare le invisibili onde gravitazionali che vengono dall’alba dell’universo; le pillole intelligenti" che dispensano farmaci e monitorano la salute del corpo.

ABBONATI A 31,90€
Follow us