Innovazione

Inaugurato un supercomputer con un’AI italiana che verrà addestrato (anche) leggendo Focus!

Siamo andati a curiosare nel più potente supercomputer italiano per l'intelligenza artificiale di proprietà di un'azienda privata.

La prima cosa che si sente entrando nella stanza è un rumore incessante di processori al lavoro. Stanno analizzando una mole di dati equivalente a 11 milioni di libri, su cui un LLM (un Modello linguistico di grandi dimensioni) si sta allenando a capire e "parlare" in italiano.

NeXXt AI Factory è il più potente supercomputer disponibile in Italia per l'intelligenza artificiale di proprietà di un'azienda privata. Si chiama Factory, cioè fabbrica, perché le fabbriche del futuro produrranno idee, immagini, testi. E la novità di questa nuova supermacchina è che lo farà interamente nella nostra lingua.

Come funziona l'addestramento

Ma come si addestra un modello linguistico che permetta poi di ottenere un'AI generativa? L'analisi di migliaia o milioni di testi è necessaria per categorizzare ciascuna parola all'interno di una frase e ciascuna frase all'interno di un periodo. Ogni blocco viene taggato, cioè etichettato per descriverne struttura, funzione e significato anche in relazione al contesto in cui è inserito. MIIA, il Modello Italiano Intelligenza artificiale sviluppato da Fastweb, ha avuto a disposizione un database di testi di alta qualità su cui si è allenato per settimane. Ne ha estratto un miliardo e mezzo di token, ovvero blocchi di testo categorizzati, che hanno composto il più grande e affidabile dataset di lingua italiana esistente.

Su quali testi si è allenato

Ad "alimentarlo" sono stati i testi forniti da Istat, Edizioni Bignami e Gruppo Mondadori, che ha messo a disposizione articoli estratti dalle principali testate di Mondadori Media. In questa fase Focus, che  fa parte del gruppo Mondadori, non è stato utilizzato, ma presto anche una parte degli archivi della nostra rivista saranno utilizzati per addestrare l'AI.

«L'intelligenza artificiale si basa sulle parole, che sono il fondamento della nostra cultura e hanno un potere immenso», ha commentato Andrea Santagata, Amministratore delegato di Mondadori Media, «Possono informarci, farci cambiare opinione. Se l'AI non è addestrata sulla nostra lingua, rimane uno strumento in parte diverso da noi. Per un modello linguistico nazionale con questi presupposti è anche fondamentale un ambiente sicuro a cui consegnare i propri dati e che rispetti i diritti di copyright e privacy, due principi che per le più diffuse piattaforme internazionali sembrano rimanere secondari agli obiettivi di business».

Lavorare su una quantità enorme ma pur sempre finita di dati consente di fornire un contesto e porre dei limiti, riducendo così il rischio delle cosiddette allucinazioni: gli errori.

La tecnologia

NeXXt AI Factory si basa sulla tecnologia NVIDIA DGX SuperPOD ed è frutto di un accordo per l'acquisto di 31 nodi NVIDIA DGX H100. È risultato 10 volte più efficiente nell'addestramento di modelli di AI generativa rispetto alla generazione precedente di supercomputer e 30 volte più efficace nell'inferenza, cioè nell'applicazione di quei modelli a nuovi dati mai analizzati prima. Ma il training non si esaurisce in poche settimane e il prossimo materiale su cui studiare saranno dataset pubblici di conversazioni tra chatbot ed esseri umani, chat e domande a risposte multiple. Entro la fine dell'anno si prevede il rilascio di una nuova versione di MIIA.

Come verrà utilizzato

Questo sistema è pensato per supportare le pubbliche amministrazioni, ma anche aziende e start up nei settori più diversi, dall'istruzione alla finanza, dalla sanità alle industrie. La sicurezza e la tutela dei dati è garantita dall'integrazione del supercomputer con quattro Security Operation Center che forniscono massimi livelli di affidabilità e protezione.

I modelli italiani di intelligenza artificiale

È importante lavorare a modelli italiani di intelligenza artificiale e poter fare ricerca su quelli perché «quando il supercomputer è arrivato, nessuno era in grado di farlo funzionare: nel nostro paese non abbiamo una cultura tecnologica adeguata», ha dichiarato Gianluigi Greco del Comitato di Coordinamento sull'AI presso la Presidenza del Consiglio del Ministri e Professore di Informatica all'Università della Calabria. Greco è anche alla guida dell'Advisory Board che monitora l'addestramento di MIIA e garantisce il rispetto di un approccio etico che mette al centro l'essere umano. Per puntare su ricerca e innovazione, altre partnership sono state strette con l'Università Bicocca di Milano e La Sapienza di Roma. «Abbiamo creato da zero delle competenze e delle risorse umane che saranno cruciali per lo sviluppo futuro. L'Italia ha una grande tradizione nell'innovazione industriale e non possiamo lasciare che il treno dell'AI passi senza salirci».

Per competenze non si intendono solo matematici, fisici o informatici. Un sistema che ha le sue radici nelle parole ha bisogno di letterati, umanisti, filosofi. Ha bisogno di essere controllato e indirizzato, affinché sia davvero utile ai nostri scopi.

 

8 luglio 2024 Giulia Dallagiovanna
Ora in Edicola
Scopri il mondo Focus. Ogni mese in edicola potrai scegliere la rivista che più di appassiona. Focus il magazine di divulgazione scientifica più letto in Italia, Focus Storia per conoscere la storia in modo nuovo ed avvincente e Focus Domande & Risposte per chi ama l'intrattenimento curioso e intelligente.

Focus Storia ci porta indietro al 1914, l'anno fatale che segnò l'inizio della Prima Guerra Mondiale. Attraverso un'analisi dettagliata degli eventi, delle alleanze politiche e degli imperi coloniali, la rivista ricostruisce il contesto storico che portò al conflitto.

Scopriremo le previsioni sbagliate, le ambiguità e il gioco mortale delle alleanze che contribuirono a scatenare la guerra. Un focus sulle forze in campo nel 1914 ci mostrerà l'Europa divisa in due blocchi pronti allo scontro, mentre un'analisi delle conseguenze della pace di Versailles ci spiegherà perché non durò a lungo.

Non mancano le storie affascinanti come quella di Agnès Sorel, amante di Carlo VII, e di Moshe Feldenkrais, inventore dell'omonimo metodo terapeutico. Un viaggio nell'arte ci porterà alla scoperta della Street Art e della Pop Art nel nuovo JMuseo di Jesolo, mentre uno sguardo alla scienza ci farà conoscere le scienziate che non hanno avuto i meritati riconoscimenti.

ABBONATI A 29,90€

Focus si immerge nel Mediterraneo con un dossier speciale: un ecosistema minacciato, ma ricco di biodiversità e aree marine protette cruciali. Scopriremo l'importanza della Posidonia oceanica e le minacce alla salute del mare.

La rivista esplora anche scienza e tecnologia, svelando i segreti dei papiri di Ercolano e portandoci dietro le quinte del supercomputer Leonardo. Un viaggio nell'archeoastronomia e un'inchiesta sul ruolo del tatto nella società umana arricchiscono il numero.

Non mancano approfondimenti sulla salute, con un focus sull'Alzheimer e consigli per migliorare il sonno. La tecnologia è protagonista con uno sguardo al futuro dei gasdotti italiani e alle innovazioni nel campo delle infrastrutture. Infine, uno sguardo all'affascinante mondo dell'upupa.

ABBONATI A 31,90€
Follow us