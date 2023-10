“La voix avait vraiment ma couleur vocale et mon grain, je me suis reconnu. Elle était juste un petit peu plus métallique”, regrette Emmanuel Karsen, le doubleur de l’acteur américain Norman Reedus, alias Daryl Dixon dans la série The Walking Dead. Le doubleur et comédien français est encore sous le choc, après avoir découvert, mercredi 20 septembre, que la courte bande-annonce pour la série spinoff The Walking Dead : Daryl Dixon avait bénéficié d’un doublage à l’aide de sa propre voix… réalisé grâce à une intelligence artificielle.

Postée sur un groupe Facebook consacrée à la série par un amateur du genre, la vidéo a rapidement récolté un impressionnant nombre de visionnages. "En quelques minutes, il y avait 100 personnes qui disaient à l’auteur de la vidéo que c’était génial et lui il proposait déjà de faire un épisode complet, alors que la série n’a pas encore de diffuseur officiel en France", relève Emmanuel Karsen. "Ce qui m'a aussi choqué, c'est de voir qu’il n’y avait qu’une personne qui était mécontente et signalait que c’était un problème…”

La nouvelle n’a pas surpris la comédienne et doubleuse Pascale Chemin, en guerre avec les intelligences artificielles depuis qu’elle a eu la mauvaise surprise, elle aussi, de voir son travail adapté sans son consentement. “Je suis la voix française pour un jeu vidéo, Yo-kai Watch, qui a plusieurs volets et le doublage s’est arrêté au troisième”, précise l’actrice. “L’éditeur n’a pas cru bon de faire traduire le jeu et de réaliser une version française du quatrième volet” . Pour combler ce manque, des amateurs du jeu se sont donc mis en tête de réaliser leur propre VF… et de doubler le jeu grâce à des IA reproduisant la voix de Pascale Chemin, avant de se rétracter lorsque la comédienne a menacé de saisir la justice. “On ne peut pas détourner les propos de quelqu'un, prendre sa voix, les phonèmes qui font sa spécificité : c’est illégal, c’est du vol”.

Des doublages à l’aide d’IA… faits par des amateurs

Jusqu’ici, les doublages, réalisés à la volée à l’aide de logiciels tels que HeyGen, Murf ou encore Synthesia, sont le fait d’amateurs. Qu'ils soient impatients d’entendre les voix de leurs doubleurs favoris ou bien qu'ils aient envie de s'amuser avec les intelligences artificielles, ils sont souvent inconscients des enjeux que ces avancées technologiques posent pour la profession, se désole Emmanuel Karsen : “Je pense qu'ils font ça sans réfléchir, sans penser aux conséquences. Ce n'est même pas de la méchanceté, c'est de l’ignorance et l'attrait de la nouvelle technologie”.

“Ce qui est inquiétant c’est que ça donne l’impression à tout le monde que n’importe qui peut prendre la voix de quelqu’un sans son consentement pour la plaquer où bon lui semble”, poursuit Pascale Chemin, qui doit dorénavant traquer les vidéos, notamment sur TikTok, où sa voix pourrait avoir été utilisée : “On a l'impression qu'il faut que l'on scrute tout, que l’on épluche tout, pour savoir si nous avons bien enregistré un doublage ou non, si nous avons bien donné notre accord ou non, ça devient infernal”.

Les studios intéressés par les IA ?

Si en France les usages des IA pour reproduire des voix sont plutôt le fait d’amateurs, il serait naïf d’imaginer que les studios de télévision et de cinéma ne sont pas intéressés par les possibilités offertes par les intelligences artificielles. Il faut dire que les progrès de ces dernières sont de plus en plus saisissants : si à l’origine les IA permettaient de créer des voix avec des intonations ou un accent spécifiques, puis de reproduire une voix spécifique, il est désormais possible de traduire une voix en conservant les inflexions de son propriétaire.

L'application HeyGen, très récemment rendue disponible, a prouvé qu’il était désormais possible de modifier les mouvements des lèvres pour que ces derniers correspondent à la traduction dans une nouvelle langue :

“C'est complètement synchronisé ou pratiquement ; c'est devenu très performant”, reconnaît Emmanuel Karsen. “D’ici quelques mois, je ne suis pas sûr qu’on voit encore la différence. C’est ma grande angoisse : on pensait que ça prendrait encore des années, mais ça avance à une rapidité incroyable”.

Aux États-Unis, scénaristes et acteurs ne s’y sont pas trompés. La grève initiée en mai dernier par la Writers Guild of America, et qui a mis à genoux à Hollywood, a fait de la demande de garde-fous contre l’usage de l’intelligence artificielle l’une de ses principales revendications. Et ce avec succès : après cinq mois de lutte, les dirigeants de Netflix, Disney, Universal et Warner Bros se sont engagés à ne pas considérer les IA comme des auteurs, ni à l'imposer à des scénaristes. L’accord, cependant, ne concerne que ces derniers : quelque 160 000 acteurs, doubleurs et autres professionnels restent mobilisés. La SAG-AFTRA, la guilde des acteurs, a d’ailleurs appelé les doubleurs de jeux vidéo à rejoindre la grève à leur tour : ces derniers ont voté à plus de 98 % en faveur d’un mouvement de grève, alors que le syndicat a entamé mardi 26 septembre des négociations contractuelles avec les sociétés de jeux vidéo.

L’IA, un risque en plus pour les doubleurs de jeux vidéo

Car le domaine du jeu vidéo n’échappe pas aux problèmes soulevés par l’essor des intelligences artificielles, et ce malgré des contraintes différentes de celles des comédiens de doublage de séries ou de cinéma, explique Hubert Drac, directeur artistique sur des versions françaises de jeux vidéo : “Du point de vue de la synchronisation labiale, nos contraintes sont moins grandes, car on ne nous fournit pas les images. Mais il faut plus d’endurance et d’imagination : un film, c’est 90 minutes, alors qu’un jeu vidéo peut attendre 300 ou 400 heures. Pour le dernier Assassin’s Creed, il a fallu 120 jours d’enregistrements et 150 comédiens. Un film, même le plus soigné, ça va être 15 jours d’enregistrement au grand grand maximum !”

Plus que les voix des personnages principaux d’un jeu vidéo, ce sont toutes les voix des personnages secondaires qui pourraient bien se voir remplacées par des IA, selon le directeur artistique : “On utilise beaucoup plus de comédiens dans le jeu vidéo, et on peut tout à fait imaginer qu'on va créer des voix sans prendre la voix de quelqu'un, mais que le logiciel en créera une nouvelle, à partir des voix de comédiens dont il a été nourri de façon insidieuse, sans qu’on puisse les identifier. Il utilisera sans le dire des rythmes de différents acteurs et grâce à une compilation de données on pourra choisir, par exemple, “acteur déprimé” ou encore “milieu populaire” pour obtenir la voix voulue”.

Plus largement, pour Hubert Drac, les producteurs américains risquent surtout de proposer à leurs acteurs d’utiliser les IA, moyennant finance, pour conserver les intonations et le timbre de leur voix dans une autre langue. Plus besoin de comédiens de doublage, il suffira d’utiliser la voix de l’acteur originel : “Les producteurs pourront prétendre que c'est ce qui préserve la singularité du jeu original, que c’est une démarche artistique ! J'imagine qu'en France, ils ne le feront pas pour des voix françaises emblématiques. Je pense par exemple à Alain Dorval qui double Stallone. Cela fait trente ans qu'il est dessus et qu'il est formidable, ils ne vont pas la changer. Mais à terme, ça va s'estomper. Les maisons de doublage et l'industrie du doublage en France s'inquiètent de ça, et à raison.”

Devoir vendre l’empreinte de sa voix

Des studios de cinéma ont d’ailleurs d’ores et déjà commencé à inclure, dans leurs contrats, des clauses destinées à leur permettre de synthétiser les voix des acteurs. Dans une interview accordée à Motherboard , Tim Friedlander, le président de la National Association of Voice Actors (NAVA), assure que ces clauses sont de plus en plus prévalentes, et parfois difficiles à comprendre : “Les mots utilisés peuvent être ambigus et porter à confusion. De nombreux acteurs de doublage pourraient bien avoir signé un contrat sans réaliser que de telles clauses ont été ajoutées. [...] On dit même à certains acteurs qu’ils ne seront pas embauchés sans accepter ces conditions”.

Ces inquiétudes ont nourri la grève des acteurs aux États-Unis, alors que les doubleurs s’inquiètent de voir les studios leur demander de vendre définitivement l’empreinte de leur voix et de se voir remplacés. Face à l’essor des intelligences artificielles, de nombreuses associations et syndicats se sont réunis sous la bannière de la United Voice Artists pour dénoncer les risques éthiques posés par l’intelligence artificielle et demander un ajustement des protections légales, que ce soit aux États-Unis ou en Europe, où les travailleurs sont un peu mieux protégés.

Vers un droit à la voix renforcé

Pour endiguer l'avancée des IA, les doubleurs se retranchent à raison derrière le droit. "Il y a un droit à la voix comme il y a un droit à l'image", commente à ce sujet l'avocat Alain Bensoussan, spécialiste des des intelligences artificielles. "En fait, tous les éléments d'expression d'une personne physique sont protégés au titre de son ipséité, qu'on connaît sous la formulation générale de droit à l'image. Mais le droit à la voix est un droit qui est encore assez peu développé : jusqu'alors il n'y avait pas beaucoup de modalités pour réutiliser la voix, ça a donc donné peu de cas d'usages" .

L'avocat réfute l'idée qu'on puisse s'approprier définitivement la voix d'un individu, même s'il lui semble probable que les IA amènent à la création d'une forme de "licence", qui permettra de céder sa voix temporairement, dans un contexte précis. "Cela va consolider le droit à la voix, c'est-à-dire un droit de la personnalité", poursuit l'avocat. "Mais la voix n'est qu'une métrique parmi d'autres. La totalité de ce qui fait la spécificité d'un individu va pouvoir être appropriée par l'IA. C'est sa voix, c'est sa démarche, ses intonations, ses formulations... C'est tout notre double virtuel qui est aujourd'hui en train d'être saisi par les intelligences artificielles de type générative."

Alain Bensoussan imagine déjà tout un nouveau champ du droit à inventer : "Les règles juridiques classiques vont-elles s''appliquer ? Je ne pense pas. Il va falloir réinventer de nouvelles règles, comme cela a été fait pour les logiciels, pour Internet...". Il faudrait dès lors créer un droit de l'avatar, du double virtuel : "L'enjeu va être le droit de la propriété, sur les données personnelles, parmi lesquelles il y a la voix, les mots, l'attitude, etc."

Avec, également, une nuance de droit d'auteur, rappelle de son côté Pascale Chemin : "On ne pourra pas se passer des comédiens", veut-elle croire. "Doubler reste un travail artistique. Et l'art est fait par un être humain".