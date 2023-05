Que devient une demande que vous tapez dans le champ de recherche de ChatGPT ou de Bard, son concurrent chez Google ? D'où viennent les contenus qui ont servi à alimenter et à entraîner ces intelligences artificielles dites génératives, et dont la popularité dépasse désormais le "gadget" expérimental pour déborder dans le monde de l'entreprise ? Car en deux mois, l'outil avait cumulé 100.000 utilisateurs, un chiffre que TikTok a atteint en neuf mois et Instagram... En deux ans et demi.

Autant de questions qui n'ont pas de réponse et qui intéressent un nouveau laboratoire créé au sein de la Cnil, la Commission nationale de l'informatique et des libertés, organisme chargé de veiller au bon respect des données privées en ligne. Une demi-douzaine de chercheurs travaillent sur le fonctionnement des outils d'intelligence artificielle.

"Irruption extrêmement rapide" de ces outils

"La Cnil n'a pas découvert l'intelligence artificielle avec ChatGPT, mais il est vrai que l'irruption extrêmement rapide de ces outils pousse à bien cerner les risques qu'il peut y avoir", explique Marie-Laure Denis, présidente de la Cnil. Parmi ces risques, celui "d'inexactitude des données, ou de reproduction de biais qui sont contenus dans les données – typiquement, une génération d'images montrant quelqu'un en cuisine montrera plus de femmes que d'hommes".

À cela, s'ajoute le risque de désinformation, "puisque c'est un moteur de réponse et pas de recherche", explique la présidente de l'organisation.

Les IA soumises au RGPD

Or, ces outils sont fondés sur des bases de données colossales : 175 milliards d'entrées pour ChatGPT. Ce à quoi il faut ajouter tous les "prompts", les requêtes formulées par les utilisateurs et les utilisatrices du robot conversationnel, qui lui servent aussi à s'améliorer. "Nous souhaitons, avec ce service dédié à l'intelligence artificielle, bien appréhender ce nouvel usage, nous concerter avec les acteurs de l'écosystème et pouvoir proposer d'adopter des lignes directrices, des recommandations", qui porteront notamment sur la façon d'entraîner ces intelligences artificielles tout en respectant les données des utilisateurs.

En effet, ces programmes informatiques sont aussi soumis au RGPD, le règlement général sur la protection des données. Or, aujourd'hui, ils n'y sont pas conformes. "Vous avez le droit d'être informé que vos données sont utilisées, et le droit de vous y opposer le droit échéant", précise Marie-Laure Denis, or ce n'est pas le cas pour le moment. Pour cela, la Cnil entend non seulement proposer des recommandations, mais aussi "accompagner l'innovation pour avoir une intelligence artificielle respectueuse de la vie privée, car c'est en précisant nos attentes en amont que l'on pourra encourager le développement d'IA françaises et européennes".

Vigilance et questionnements

Résultat, pour l'heure, la Cnil ne recommande pas de continuer à utiliser ChatGPT ou au contraire de ne plus y faire appel, comme c'est le cas de certaines entreprises et institutions qui l'ont interdit. "La Cnil est agnostique sur les technologies, ce qui nous intéresse, ce sont les usages", explique sa présidente, "et dans quelle mesure ces usages-là peuvent faire courir des risques (...) Peut-être qu'une solution pourrait être de réussir à identifier une information qui provient d'une intelligence artificielle."

Mais malgré l'absence, pour l'heure, de recommandations, la Cnil est d'ores et déjà saisie de plaintes liées à ChatGPT, en particulier à l'inexactitude des informations que le logiciel affiche . Pour la présidente de la Cnil, le premier bon réflexe, "c'est de se poser des questions". Elle appelle donc à la vigilance de chacun et à "avoir le sentiment qu'en réalité, aujourd'hui, à notre insu et sans qu'il y ait naturellement de caractère intentionnel, nous sommes de fait tracés".