fbpx Le macchine Volanti | Parlare in tutte le lingue del mondo
Parlare in tutte le lingue del mondo

Parlare in tutte le lingue del mondo

18.07.2019 | Grazie all’intelligenza artificiale, la traduzione simultanea diventerà una soluzione per tutti. Ma quali sono i limiti?

Il sogno di poter comprendere e comunicare con tutte le persone sulla Terra, senza alcuna barriera linguistica, è antico almeno quanto il racconto biblico della Torre di Babele. Come viene narrato nella Genesi, la costruzione di questo mitologico edificio rappresentò il momento in cui il Signore decise che gli uomini, precedentemente parte di un solo popolo e con una sola lingua, iniziassero a disperdersi e a parlare idiomi diversi, senza avere più la possibilità di capirsi a vicenda. 

Non è un caso che nella fantascientifica Guida galattica per gli autostoppisti di Douglas Adams si ritrovi il pesce di Babele, un esserino di curiose sembianze che, inserito nel cavo uditivo, permette di comprendere immediatamente qualsiasi lingua parlata sulla Terra. Un traduttore universale che riesce a funzionare nutrendosi di onde cerebrali. Ma se il Bablefish è un’invenzione che supera anche i limiti del surreale, al contrario sono molto concreti gli sforzi che diverse aziende del mondo della tecnologia stanno compiendo nel campo della traduzione simultanea, realizzata grazie all’intelligenza artificiale.

La prima fase di questo processo si basa sulla speech recognition, ossia la stessa tecnologia che permette agli assistenti virtuali di capire cosa stiamo dicendo loro. Il cuore di questi passaggi è però la text-to text translation: la traduzione vera e propria. Una fase evoluta notevolmente nel corso dei decenni e che oggi sfrutta le reti neurali artificiali e il machine learning per ottenere una traduzione il più possibile fedele, sulla base di un’imponente mole di dati; in questo caso parole, costrutti ed espressioni di una certa lingua, con cui la stessa macchina è stata istruita inizialmente. 

Ma la reale complessità di questo processo, che si conclude con la macchina che riproduce con una voce simile a quella umana il testo appena tradotto, non risiede solo nelle difficoltà linguistiche, ma va ricercata all’interno dell’aggettivo “simultaneo”. Questa traduzione, per essere tale, deve infatti avvenire con un ritardo sulle parole pronunciate che non sia superiore a qualche secondo. Un lavoro complesso da portare a termine sia per un interprete in carne e ossa sia per una macchina.
 

Traduzione simultanea: un lavoro complesso da portare a termine sia per un interprete in carne e ossa sia per una macchina

A questo proposito, aveva destato molto interesse l’annuncio del gigante Baidu fatto nell’autunno dello scorso anno. L’analogo cinese di Google aveva infatti presentato il sistema di traduzione simultaneo Stacl, sigla che condensa l’espressione Simultaneous Translation and Anticipation and Controllable Latency. Le caratteristiche peculiari di questa tecnologia stanno nel fatto che la fase di traduzione viene affiancata dalla previsione su come potrebbe continuare la frase, in modo da rendere il processo molto più rapido. Ma i risultati? Secondo lo stesso colosso cinese, l’accuratezza è nettamente inferiore a una traduzione che viene invece realizzata solamente dopo che la frase è stata completata.

Ma Baidu non è stato il primo dei giganti della tecnologia a livello mondiale a concentrarsi sulla traduzione simultanea. Google aveva già lanciato nel 2017 i suoi Pixel Buds, auricolari che – integrando l’assistente virtuale di Mountain View, Assistant, e le reti neurali sfruttate per il servizio Translate – garantivano a tutti gli utenti la comprensione senza sforzo di una quarantina di lingue. Solo un anno più tardi, questa funzionalità è stata estesa anche a tutti gli auricolari che supportano Assistant, mentre a inizio 2019 Google ha annunciato una nuova modalità di interprete – parte integrante dell’assistente virtuale – decisamente più raffinata e complessa di quella presentata solamente due anni prima.

A onor del vero, uno dei primissimi servizi che ha messo a disposizione un traduttore simultaneo è stato Skype, popolarissima app per le videochiamate. Grazie a Skype Translator è da più di tre anni che gli utenti possono disporre di un interprete artificiale per comunicare con i propri contatti in tutto il mondo. Non è un caso che dietro l’applicazione usata da milioni di persone ci sia un altro gigante della tecnologia come Microsoft, impegnato da anni nello sviluppo di soluzioni di traduzioni automatiche. 

Sarebbe però riduttivo pensare che solamente giganti del calibro di Baidu, Google e Microsoft si siano mossi in questo campo di ricerca. Altre realtà meno conosciute hanno già proposto delle loro soluzioni sul mercato. Un esempio è Travis, dispositivo da tenere in mano e che restituisce la traduzione delle proprie parole in ottanta lingue differenti. Il suo punto debole è che funziona solamente se ci si rivolge a breve distanza, ma può tornare comunque molto utile quando si comunica di persona usando lingue differenti. 

Un funzionamento simile è quello di PocketTalk, con la differenza che questo dispositivo è in grado di funzionare solamente con una connessione internet. Tragl è invece una soluzione hands-free lanciata come prototipo sulla piattaforma di crowdfunding Indiegogo e che ha raccolto importanti finanziamenti. Tragl è dotato di auricolare e microfono, ed è capace non solo di tradurre ogni frase che diciamo, ma anche di farci comprendere quelle che ci vengono rivolte dalla persona con cui stiamo parlando.
 

Il contesto assume un ruolo talmente importante che solo una persona calata all’interno può renderne il senso più profondo

Al di là delle singole soluzioni già disponibili e della loro efficacia, la domanda che interessa più di tutte è legata alla possibilità che le macchine possano un giorno davvero soppiantare gli interpreti simultanei umani. Qualche mese fa se lo domandava anche il Guardian, analizzando lo stato dell’arte del settore insieme al professor Alex Waibel, che da anni si occupa proprio di questo campo di ricerca. Come ha sottolineato il quotidiano britannico, gli ostacoli non si limitano solo al tempo necessario per la traduzione o al rumore che la può disturbare. Esistono anche difficoltà legate alla capacità di un sistema intelligente di distinguere il soggetto a cui si sta rivolgendo e le peculiari usanze di una lingua: tutto ciò complica l’operazione di veicolare il messaggio nel modo più personalizzato possibile all’interlocutore.

Jonathan Rechtman, fondatore di una società che si occupa appunto di traduzione, ha elencato in un contributo comparso sul sito del World Economic Forum alcune ragioni per cui gli interpreti umani non saranno mai in realtà davvero sostituibili dalle macchine. Tra i motivi principali c’è il fatto che l’attività di traduzione è molto soggettiva. Nel momento in cui si deve tradurre un discorso articolato, e non semplici domande o frasi standard, il contesto assume un ruolo talmente importante che solo una persona calata all’interno può renderne il senso più profondo. E non si deve dimenticare un altro aspetto fondamentale: le macchine non saranno mai in grado di riprodurre le ambiguità, i doppi sensi e soprattutto l’ironia. Caratteristiche fondamentali del linguaggio umano.

 

l'autore
Enrico Forzinetti

Illustrazione: Francesco Del Re