I computer vanno a lezione di lingue e di dizione per interagire con gli esseri umani e proporsi per alcune semplici mansioni nei call center, in ambito medico e a bordo di dispositivi portatili come l'iPhone.
“Dal riconoscimento vocale alla traduzione simultanea il passo è breve”
Avatar del medico - Gli esseri umani a volte non si capiscono a vicenda, pur parlando la stessa lingua, come possono farlo i computer? Beh, un passo alla volta... o meglio, un fonema alla volta. Gli strumenti per il riconoscimento vocale hanno fatto davvero passi da gigante negli ultimi anni e i risultati sono ormai visibili, e soprattutto udibili, in alcune aziende e realtà più all'avanguardia. Mi riferisco, per esempio, al computer che accoglie i visitatori dei laboratori di ricerca Microsoft a Redmond. Si tratta di un avatar con le sembianze di una donna fa parte di un progetto pensato per interagire con i pazienti che arrivano, per esempio, in un pronto soccorso o in uno studio medico. L'avatar in questione è in grado di capire il linguaggio, riconoscere le condizioni mediche di un bambino (tramite ovviamente la mamma) ed effettuare una diagnosi preliminare. Come dire, una prima visita per indirizzare i pazienti nella giusta direzione.
Migliorare si può - Lo stesso concetto può essere, anzi, è già operativo in molti call center. Quando un cliente chiama, un sistema riconosce quello che dice, capisce cosa vuole e la telefonata viene dirottata all'operatore più indicato. Diciamo che questo sarebbe l'obiettivo finale perché spesso il sistema di riconoscimento del parlato fa cilecca, per una serie di motivi non da ultimo i disturbi di sottofondo, generando frustrazione in chi si trova dall'altro capo del telefono che darebbe qualsiasi cosa pur di parlare con un essere umano in carne e ossa.
Traduzione in tempo reale - Il riconoscimento del parlato porta poi dritto verso la traduzione simultanea. Il servizio di sottotitolazione dei video di Google, ancora in fase di test, è uno dei primi esempi che puntano in questa direzione già disponibili al grande pubblico. Anche l'esercito degli Stati Uniti sta sperimentando qualcosa di simile con risvolti spesso comici in Iraq. Se una domanda in inglese del tipo “What are you transporting in your truck?” (cosa stati trasportando nel tuo camion) riceve una risposta in arabo come “I'm carrying tomatoes.” (sto trasportando pomodori), il sistema di traduzione automatica lo interpreterà come “pregnant tomatoes”, ossia “pomodori incinta”, una specie coltivata evidentemente nel Medio Oriente. Ma è solo un esempio che dimostra come sia complicato raggiungere risultati soddisfacenti.
Ai tuoi ordini - Un'altra applicazione dove riconoscimento del parlato è largamente utilizzato è nei dispositivi portatili e in auto in prodotti come i navigatori satellitare. In pratica, senza dover togliere le mani dal volante, si impartiscono comandi al dispositivo. E il settore è talmente promettente che Apple ha acquistato Siri, una software house che ha sviluppato un assistente personale per iPhone in grado di aiutare l'utente nella ricerca delle informazioni desiderate grazie a semplici indicazioni vocali, che all'occorrenza traduce e te li visualizza poi su una mappa. Una sorta di pagine gialle con tanto di cartine che comandi con la voce.