Innovazione

NEIL: il supercomputer che capisce le immagini

Sviluppato alla Carnegie Mellon il più evoluto software per il riconoscimento visivo che impara quasi da solo. Ecco come funziona.

La zebra? Vive nella savana. La ruota? È una parte dell’automobile. La torre pendente? Si trova a Pisa. Se queste affermazioni fossero state formulate da un bambino non avrebbero nulla di staordinario. Sono invece frutto dell’intelligenza (artificiale) di NEIL - Never Ending Image Learner-, un software sviluppato alla Carnegie Mellon University di Pittsburgh, che ha effettuato queste associazioni semplicemente analizzando il contenuto di decine di migliaia di immagini trovate a caso sul Web.

Buon senso digitale
Secondo i suoi progettisti, NEIL è uno tra i più avanzati software per il riconoscimento di immagini mai creato: è cioè capace di guardare una foto pescata da Internet e dire cosa contiene, se un’automobile, un aereo o un cervo, ma anche di inserirla in uno specifico contesto. Insomma, il cervellone è dotato di qualcosa di simile al comune buon senso.
Vi sembra poco? Beh, non lo è, perchè proprio come gli esseri umani, che imparano a fare queste associazioni in base all’esperienza, così anche NEIL è lasciato quasi da solo nel suo processo di apprendimento.

Guarda e impara
Il programma è stato lanciato alla fine di luglio e fino a oggi ha analizzato tre milioni di immagini all’interno delle quali è in grado di riconoscere 1.500 tipologie di oggetti diversi, dalle auto ai pallottolieri, e 1.200 tipi di ambientazioni, dalla città al mare, dal deserto a un supermercato. Queste informazioni, una volta memorizzate, hanno permesso a NEIL di “unire i puntini” e concludere oltre 2.500 associazioni tra concetti.

La prima presentazione
I primi risultati del progetto saranno presentati il prossimo 4 dicembre alla IEEE International Conference on Computer Vision di Sydney, in Australia. Chi volesse dare una sbirciata in anteprima può però collegarsi al sito dedicato a NEIL e seguire in tempo reale i suoi progressi.

Superlavoro
Obiettivo dei ricercatori è quello di creare il più grande database visuale strutturato al mondo, dove oggetti, azioni, ambienti, attributi e le relazioni che li legano sono etichettate e catalogate. «Più dati si hanno a disposizione più è facile addestrare le macchine: lo abbiamo imparato in 10 anni di studi sulla computer vision» spiega Abhinav Gupta, ricercatore al Carnegie Mellon’s Robotic Institute. Il problema è l’enorme mole di dati a disposizone: secondo gli esperti, solo su Facebook, sono archiviati 200 miliardi di immagini. L’unico modo per costruire un database strutturato di questo tipo è fare in modo che i computer possano imparare in completa autonomia.

I prof del computer
Ovviamente anche NEIL sbaglia: una ricerca su Google Immagini può per esempio fargli credere che “pink” sia il nome di una rock star invece di un colore (rosa, in inglese). Ed è qui che interviene l’uomo, guidando manualmente l’apprendimento del robot.
I ricercatori inoltre, “spiegano” quotidianamente a NEIL cosa cercare: oggetti, scene, azioni, anticipandogli con esempi quello che potrebbe trovare. Una ricerca per “apple” può restituire immagini di un frutto ma anche di un computer, di un iPhone o di Steve Jobs. Man mano che la ricerca procede, aiutato dai suoi insegnanti umani, NEIL archivia le informazioni in categorie e sottocategorie e quando trova delle associazioni le evidenzia perchè ne venga verificata la validità.

Il lavoro di NEIL è molto intenso ed è supportato da un hardware eccezionale: il programma lavora infatti su un cluster di computer con oltre 200 processori che lavorano in parallelo.

Ti potrebbero interessare:
Le più spettacolari simulazioni virtuali create con i supercomputer
Il meglio della scienza per immagini

26 novembre 2013 Rebecca Mantovani
Ora in Edicola
Scopri il mondo Focus. Ogni mese in edicola potrai scegliere la rivista che più di appassiona. Focus il magazine di divulgazione scientifica più letto in Italia, Focus Storia per conoscere la storia in modo nuovo ed avvincente e Focus Domande & Risposte per chi ama l'intrattenimento curioso e intelligente.

Settant’anni fa agli italiani arrivò un regalo inaspettato: la televisione. Quell’apparecchio – che pochi potevano comprare e quindi si vedeva tutti insieme – portò con sè altri doni: una lingua in comune, l’intrattenimento garantito, le informazioni da tutto il mondo. Una vera rivoluzione culturale e sociale di cui la Rai fu indiscussa protagonista. E ancora: i primi passi della Nato; i gemelli nel mito e nella società; la vita travagliata, e la morte misteriosa, di Andrea Palladio; quando, come e perché è nato il razzismo; la routine di bellezza delle antiche romane.

ABBONATI A 29,90€

I gemelli digitali della Terra serviranno a simularne il futuro indicando gli interventi più adatti per prevenirne i rischi ambientali. E ancora, le due facce dell’aggressività nella storia dell’evoluzione umana; com’è la vita di una persona che soffre di balbuzie; tutti gli strumenti che usiamo per ascoltare le invisibili onde gravitazionali che vengono dall’alba dell’universo; le pillole intelligenti" che dispensano farmaci e monitorano la salute del corpo.

ABBONATI A 31,90€
Follow us