Agence France-Presse
La science-fiction l’imagine depuis des décennies : la traduction en temps réel, directement au creux de l’oreille, est désormais possible grâce aux dernières avancées de l’intelligence artificielle, qui permet de dialoguer aisément en éliminant les barrières de la langue.
Au Consumers Electronics Show (CES) de Las Vegas, plusieurs entreprises présentent des appareils qui permettent de dialoguer dans différentes langues par l’intermédiaire d’un petit gadget qui tient dans la main ou d’écouteurs sans fil qui se glissent dans l’oreille.
Les écouteurs Pilot de Waverly Labs traduisent en 15 langues et coûtent 240 $. Si les deux interlocuteurs en sont équipés, il est possible de dialoguer directement.
Au cours d’une brève démonstration à Las Vegas, une journaliste de l’Agence France-Presse parlant en français a vu ses propos traduits avec justesse dans l’écouteur d’Andrew Ochoa, patron de Waverly Labs, une entreprise créée en 2014 à New York. L’application mobile a également envoyé le texte de la conversation par écrit sur le téléphone intelligent de M. Ochoa.
L’écouteur, par l’intermédiaire de l’application mobile, « écoute la voix, l’envoie dans le nuage, la transcrit, la traduit et la synthétise » vocalement, explique M. Ochoa.
Il faut compter quelques petites secondes de décalage le temps que la traduction se fasse. « C’est de la traduction “consécutive” [et non exactement simultanée] », poursuit-il.
Des appareils de plus en plus perfectionnés
Les appareils et les logiciels de traduction par synthèse vocale sont arrivés depuis peu sur le marché, car la technologie n’est au point que depuis moins de deux ans.
« Nous appliquons les dernières fonctionnalités de l’intelligence artificielle, comme l’apprentissage machine ou le réseau de neurones artificiels, aux modèles de traduction », a fait savoir Andrew Ochoa.
Désormais, « ces technologies sont suffisamment mûres pour rendre cela possible », se félicite Andrew Ochoa, qui dit avoir vendu 35 000 paires d’écouteurs en moins d’un an, notamment à des hôtels, qui ont à l’évidence besoin de savoir communiquer dans de nombreuses langues avec leurs clients.
Moins discrètes, les oreillettes WT2 de l’entreprise chinoise TimeKettle fonctionnent de façon similaire et sont aussi présentées cette semaine au CES.
En revanche, pas besoin de téléphone intelligent pour utiliser Pocketalk, conçu par l’entreprise japonaise Sourcenext, qui mise fort sur les Jeux olympiques de Tokyo en 2020, car « beaucoup de Japonais ne parlent que japonais », explique Richard Gallagher, chargé des communications.
Selon lui, le petit appareil, qui ressemble à un téléphone mobile d’ancienne génération, peut traduire 74 langues et coûte 330 $.
« Grâce à l’apprentissage des machines, il nous comprend de mieux en mieux au fur et à mesure que l’on s’en sert » et « s’adapte à la prononciation » de l’utilisateur, poursuit-il, démonstration à l’appui.
« C’est une super façon d’interagir avec l’intelligence artificielle », souligne-t-il, affirmant que 200 000 exemplaires de Pocketalk ont déjà été vendus.
La concurrence au rendez-vous
Le chinois iFlytex, un poids lourd de l’intelligence artificielle et de la reconnaissance vocale en Asie, présente lui aussi au CES son Translator 2.0, qui traduit le chinois en une trentaine de langues, et inversement. Le dernier modèle coûte aux alentours de 530 $.
Le néerlandais Travis, qui assure gérer désormais une centaine de langues, dit avoir déjà vendu 120 000 exemplaires de son traducteur de poche, offert au prix de 260 à 330 $.
Le puissant Google, très présent dans la traduction avec son célèbre logiciel écrit Translate, avait ouvert le bal en 2017 en lançant ses Pixel Buds, des écouteurs traducteurs par synthèse vocale.
Au CES, le géant américain a présenté mardi une nouvelle fonctionnalité de traduction liée à son assistant vocal virtuel présent dans de nombreux produits, téléphones intelligents ou enceintes connectées; ceux-ci peuvent désormais écouter une langue et la traduire oralement dans une autre.
Selon Andrew Ochoa, de Waverly Labs, la prochaine étape sera la traduction vraiment simultanée, ce que la technologie ne permet pas encore de faire.