Tra le applicazioni pratiche (o quasi) più curiose e interessanti dell'intelligenza artificiale (AI) c’è anche la previsione del futuro. Niente sfere di cristallo, tarocchi o fondi di caffè: è invece proprio la possibilità di sapere in anticipo, e con un buon grado di affidabilità, quale sarà l’evoluzione di un certo scenario a partire da una serie di dati riferiti al passato.
Magia. Un team di ricercatori del MIT ha compiuto notevoli progressi in questa direzione sviluppando un sistema di intelligenza artificiale in grado di prevedere l’evoluzione di un filmato a partire da un singolo fotogramma.
Il sistema è cioè capace di analizzare un’immagine statica e formulare un’ipotesi sullo sviluppo dei fotogrammi successivi: se “vede” un treno fermo alla stazione, per i secondi successivi proporrà un filmato dello stesso treno che si muove nella direzione in cui è agganciato il locomotore. Se il fotogramma di partenza è quello di una spiaggia, ipotizzerà delle onde che si infrangono sulla battigia. Nella pagina Generating Videos with Scene Dynamics del MIT sono raccolti alcuni risultati di questa tecnologia di estrapolazione del futuro.
Carl Vondrik, coordinatore della ricerca, e i suoi colleghi hanno addestrato il sistema utilizzando oltre 2 milioni di video (presi da Internet). L’hanno poi messo alla prova somministrandogli immagini statiche e lasciando che l'AI sviluppasse le scene successive in base alle conoscenze acquisite.
Futuro istantaneo. Questi stessi filmati sono stati poi sottoposti a un altro sistema di AI che aveva il compito di valutarne il grado di realismo.
Le due intelligenze artificiali sono dunque state messe in competizione: la prima doveva generare video in grado di ingannare la seconda, quest'ultima doveva cogliere in fallo la prima, identificando i "falsi".
Il sistema predittivo è attualmente in grado di generare video in bassa risoluzione della durata di un secondo, per un totale di 32 fotogrammi: in altre parole, prevede il futuro da qui a 1 secondo.
A parte la facile ironia su di un futuro passato prima di riuscire a coglierne il senso... Si tratta in realtà di un risultato decisamente a superiore a quelli ottenuti in passato (più remoto) e le immagini elaborate dal software sono fluide e nitide.
Tecnologia o esperienza? Per quanto evoluto, però, il nuovo sistema predittivo manca ancora del comune buon senso: per esempio, "non sa" che quando il treno lascia la stazione, probabilmente uscirà anche dal fotogramma. «La sua conoscenza del mondo è basata esclusivamente sui 2 milioni di video che ha visionato ed è quindi di gran lunga inferiore a quella di un bambino di 10 anni» si giustifica Vondrick a NewScientist.
L'obiettivo del ricercatore è adesso quello di sviluppare il sistema per realizzare filmati (ossia predizioni) più lunghi e più coerenti con la realtà, con lo scopo, per esempio, di rafforzare l'intelligenza dei veicoli a guida autonoma o di permettere a un drone-fattorino di muoversi in sicurezza tra la folla.