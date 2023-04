Imaginez Donald Trump, Barack Obama ou encore Marylin Monroe saluer les auditeurs de France Inter et lancer une émission à l'antenne. Grâce à l'intelligence artificielle, c'est bien possible. En cette journée spéciale IA sur France Inter , c'est d'ailleurs ce que les auditeurs ont pu entendre ce mercredi.

L'IA peut reproduire n'importe quelle voix

Et pour cause, l'intelligence artificielle est en train de révolutionner le monde du son. En effet, il existe notamment un outil, " Eleven Labs ", qui permet de reproduire la voix de n'importe qui et de lui faire dire finalement tout ce que l'on veut.

Directeur de la production et de l'antenne de France Inter, Antoine Blin décrit la manière dont les "habillages" spéciaux de cette journée ont été réalisés avec ce logiciel. "La première étape, c'est d'apprendre à l'intelligence artificielle comment parle une personne. Il faut simplement fournir un extrait d'une minute en son propre, c'est-à-dire sans bruit parasite et bien enregistré, de la voix modèle." Ensuite, "l'intelligence artificielle apprend à reproduire cette voix", poursuit Antoine Blin. "Il suffit de lui écrire son texte pour qu'elle redonne ce texte avec le timbre de la voix original et dans le rythme de parole de la voix originale."

Le tour est joué en quelques minutes. "Par contre, il faut essayer plusieurs façons de ponctuer le texte pour avoir une rythmique de parole qui soit à peu près la bonne", précise Antoine Blin. "Pour avoir quelque chose de vraiment concluant, il faut s'y reprendre à plusieurs fois." Évidemment, cette avancée technologique pose question, car il y a un risque de faire dire n'importe quoi à n'importe qui.

Dans le domaine du son, l'intelligence artificielle offre de nombreuses autres possibilités. Le logiciel Radio GPT propose notamment des flashs d'informations ou encore des bulletins météo, concernant par exemple l'État américain de l'Ohio, sauf que la voix que l'on peut entendre n'est pas celle d'un humain mais reproduite grâce à l'intelligence artificielle. De son côté, Adobe podcast permet d'améliorer la qualité d'un son et de "nettoyer" les imperfections.

Révolution également dans le monde de la musique

Le monde de la musique n'échappe (logiquement) pas à l'arrivée de l'intelligence artificielle. Attention à ne pas tomber dans le panneau : sur Youtube, on trouve désormais de nombreuses vidéos avec des "reprises" faites par l'IA et qui n'ont jamais existé dans la réalité. Ainsi, on peut entendre "Get Lucky" des Daft Punk avec la voix de Mickael Jackson à la place normalement de Pharrell Williams.

On peut également écouter "La Isla Bonita" de Madonna avec non pas la voix de Madonna mais celle, une nouvelle fois, de Michael Jackson.

Autre exemple, cette reprise de "Paparazzi" de Lady Gaga avec la voix de la star américaine Ariana Grande.

Parfois, c'est à s'y méprendre, tellement l'illusion fonctionne. La semaine dernière, le duo franco-américain AllttA a frappé fort en diffusant un morceau, "Savages". On y entend la voix du rappeur Jay-Z. Cependant, ce dernier n'a jamais enregistré de morceau avec le groupe. Sa voix a été entièrement recréée grâce à un logiciel, et le résultat est bluffant.

Mais là encore, cela pose question. "On ne devrait pas pouvoir prendre votre nom, votre image et votre apparence sans votre permission", déplore Young Guru, collaborateur de Jay-Z. Sont ici soulevées les "questions de l'autorisation, du consentement et, en cas d'exploitation commerciale, la notion de personnalité (droit à l'image, voix)", résume auprès de l'AFP Emily Gonneau, autrice de "L'Artiste, le Numérique et la Musique".

"On n'a évidemment pas mis ce titre en distribution commerciale, on veut montrer qu'on est bien dans une zone grise et qu'il y a besoin de réguler", explique de son côté Yann Nédélec, le manager du groupe AllttA. D'ailleurs, "ce morceau ne figurera pas sur le nouvel album.".

"Cette évolution va augmenter le champ des possibles"

"L'IA est partout, depuis quelques années, même si on commence seulement à ranger ça sous un vocable unique", constate Alexandre Lasch, du Syndicat national de l'édition phonographique en France (Snep). Il ne faut pas forcément en avoir peur, selon lui. "C'est le sens des choses : les technologies ont apporté beaucoup à notre industrie musicale, cette évolution va augmenter le champ des possibles", pose Clarisse Arnou, de l'Union des producteurs phonographiques français indépendants (Upfi), qui estime toutefois qu'il est nécessaire "d'encadrer" les pratiques.

Où sont les frontières à ne pas franchir ? David Guetta a utilisé l'IA pour une voix à la façon du rappeur Eminem pour un de ses shows. Le DJ star n'a pas commercialisé ce titre, expliquant à la BBC vouloir "ouvrir la discussion pour une prise de conscience".