Publicité

Web : de nos doigts à notre voix

Par
Le numéro un mondial de l’e-commerce Amazon (à gauche) s'est lancé dès 2014 sur ce marché, qu'il domine très largement devant Google (à droite) puis d'autres
Le numéro un mondial de l’e-commerce Amazon (à gauche) s'est lancé dès 2014 sur ce marché, qu'il domine très largement devant Google (à droite) puis d'autres
- Images de promotion Amazon / Google

La première enceinte connectée dite "intelligente" surgit en France, dans un marché mondial balbutiant mais particulièrement disputé. Vendu à partir de ce jeudi par Google, ce majordome du XXIe siècle marque peut-être l'accélération d'une nouvelle ère : celle de la reconnaissance vocale.

Le web avait déjà connu une nouvelle vie sur nos téléphones mobiles grâce aux applications. Il se développe désormais directement de nos mots à la machine. Nous faire passer de nos doigts à notre voix, c'est l'un des défis des géants de la technologie grâce à un nouvel outil : l'enceinte connectée avec assistant vocal. Amazon a lancé ce marché fin 2014 avec Echo, rejoint notamment par Google, Microsoft, Apple ou Orange. Un marché encore balbutiant, avec à peine plus de 10 millions d’unités écoulées l’an dernier selon les cabinets d’étude. Ce jeudi, Google ouvre les hostilités en France avec un assistant domestique sans fil vendu 149 euros. Il apprend grâce au "deep learning" et répond à vos demandes musicales ou d'informations, à commencer par la météo. Il vous rappelle vos rendez-vous et peut même aider à régler radiateurs et interrupteurs. Mais au moins deux grandes questions se posent face à ces concentrés de reconnaissance vocale et d'intelligence artificielle : leur fiabilité et leur respect de la vie privée.

Reconnaissance vocale : un taux d'erreur divisé par 7 en 20 ans

La reconnaissance vocale ne cesse de progresser. Dans les usages, déjà un quart des adolescents américains dictent par exemple leurs requêtes à leur téléphone Androïd. Et l'entreprise américaine d'analyse publicitaire Comscore a prédit qu'en 2020 la moitié de toutes les recherches seront lancées par des commandes vocales.

Publicité

Il y a 20 ans, le meilleur logiciel de reconnaissance vocale disponible sur le marché se trompait pour près d’un mot sur deux (43%). Aujourd’hui, le taux d’erreur par mot (WER – word error rate) est de 6,3%, d'après une récente évaluation réalisée par des chercheurs de Microsoft. Et il y a déjà presque un an, une expérience menée par l'université de Stanford montrait par exemple que le logiciel de reconnaissance vocale Deep Speech 2 de Baidu pouvait écrire un message trois fois plus rapidement qu'un humain, et avec une plus grande précision ! Dans son article Numérama précisait aussi que, en moyenne, le logiciel écrit avec un taux d’erreur plus faible que l'homme de 20,4 % pour les textes en anglais.

Pour afficher ce contenu Youtube, vous devez accepter les cookies Publicité.

Ces cookies permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d'intérêt.

Autre preuve de ces progrès : une application de sous-titrage en temps réel pour sourds a été lancée début juillet en France. "Ava" permet de retranscrire par écrit et en moins d'une seconde les échanges verbaux de différents interlocuteurs (jusqu'à 12), à condition qu'ils aient téléchargé l'application et qu'ils parlent près du micro de leur smartphone. "Même si la reconnaissance vocale n'est pas encore au point, le résultat est là. Cela fonctionne assez bien lors des échanges quand on ne parle pas trop vite", a confié à l'AFP Emmanuelle Aboaf, une développeuse numérique sourde de 29 ans qui a testé en avant-première la version française d'Ava.

Ajoutez à cela les milliards d'euros d'investissements dont bénéficie l'intelligence artificielle qui pilote ces hauts-parleurs. Leurs "cerveaux", Google Assistant et Alexa (pour Amazon), sont ainsi censés toujours mieux répondre à nos demandes grâce à l'apprentissage en profondeur, le deep learning. La machine apprend de ses erreurs et fait des choix sans être pré-programmée. Facebook travaille depuis des années à ces développements avec l'aide du Français Yann LeCun et ce qui arrive dans les assistants vocaux domestiques se trouvait déjà dans nos téléphones via Siri, pour Apple, ou Viv, de Samsung. Regardez la démonstration de son PDG Dag Kittlaus en mai 2016 (à partir de 4'33'') :

Pour afficher ce contenu Youtube, vous devez accepter les cookies Publicité.

Ces cookies permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d'intérêt.

Les Républicains américains sont-ils comme les Nazis ? Google Home a pu répondre oui !

Malgré ces progrès, des bugs persistent. Et ils peuvent être d'autant plus inquiétants au moment où Facebook et Google ont été mis en cause dans la diffusion d'informations trompeuses ou terroristes. Au printemps dernier, le blog spécialisé Search Engine Land révélait ainsi que Google Home avait pu affirmer que l'ex-président Barack Obama préparait un coup d'Etat. Ou que les Républicains américains étaient assimilables à des Nazis. Interrogé par l'AFP, l'auteur du blog, Danny Sullivan, a souligné que ces erreurs "ne semblent pas délibérées", mais plutôt "le résultat de mauvaises sélections faites par les algorithmes et l'intelligence artificielle de Google".

Le géant américain a répondu qu'il travaillait pour régler un bug dans ses algorithmes de recherche conduisant à des résultats "inappropriés et trompeurs".

Google a aussi été très rapidement critiqué après une suggestion de nature publicitaire faite par son enceinte. Cette publicité expérimentale jugée trop intrusive a dû être abandonnée, posant la question de la monétisation de ces assistants, raconte Le Figaro.

Et les données privées ?

C'est bien sûr l'autre question, crainte, majeure face à ce nouvel objet connecté : quid de notre vie privée ? Dans cette bataille ouverte pour la conquête de la maison du futur, les rois de la tech ont-ils vraiment fait attention à ce que ces majordomes du XXIe siècle ne se transforment pas en espions ? Volontairement ou pas d'ailleurs. Les piratages d'objets connectés se sont multipliés ces derniers mois. Et le chercheur en cybersécurité pour l’entreprise MWR Labs Mark Barnes vient d'expliquer comment il avait pu pirater les modèles de 2015 et de 2016 de l’enceinte Amazon Echo. On peut ainsi transformer la machine en micro ouvert permanent, à condition d'avoir pu y accéder directement.

Google assure lui que son appareil n'enregistre aucun son tant qu'il n'a pas entendu la phrase clé « Ok Google », suivie de la commande désirée. Par ailleurs, son enceinte est équipée d'un bouton qui permet de couper le micro. Mais dans son test de Google Home, Le Monde précise qu'"en l’absence de comptes familiaux en France (qui n’existent pour l’instant qu’outre-Atlantique), le gestionnaire de l’application a accès à la liste des requêtes de l’ensemble des personnes vivant dans le foyer. A l’installation, Home conseille d’ailleurs de prévenir ses proches sur ce point…"

À réécouter et à lire : Objets connectés : attention, dangers
4 min

Et surtout, Google comme Amazon conservent indéfiniment les données que vous leur envoyez dans le "cloud". Pour son enceinte HomePod, qui n'est pas encore commercialisée, Apple proposerait en revanche de partiellement traiter les données sur l'appareil, puis de les anonymiser et chiffrer avant de les envoyer à distance (effacées après coup), explique l'Usine digitale. Insuffisant d'après la start-up française Snips, relancée en juin par une levée de fonds de plus de 12 millions d'euros. Spécialisée dans l'intelligence artificielle, elle vient de miser tous ses efforts sur une plateforme de reconnaissance vocale basée sur le "privacy by design", soit la garantie que les données des utilisateurs ne sont pas aspirées et restent sur l'enceinte ou tout appareil connecté. Il s'agit aussi, souligne dans Capital Guillaume Degroisse, de l'Atelier BNP Paribas, de développer "une technologie ouverte à tous". "A l'inverse des Gafa qui sont dans une stratégie d'enfermement : Amazon veut rendre ses utilisateurs dépendants de ses services avec Alexa pour point d'entrée."

58 min