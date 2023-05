Une intelligence artificielle écrira-t-elle un jour, de A à Z, une page Wikipédia ? Il y a quelques jours, le média américain Vice relatait le débat qui agite la communauté de contributeurs concernant l’utilisation potentielle des modèles d’IA générative pour aider les éditeurs. Un débat alimenté par les récents propos de Jimmy Wales, cofondateur de Wikipédia. Interrogé par l’Evening Standard , il se montre intrigué par les avancées de l’intelligence artificielle, tout en restant mesuré : "Nous sommes conscients que les modèles existants ne sont pas encore assez bons."

Jimmy Wales estime aussi "que nous sommes encore loin de l'idée : ‘ChatGPT, écris-nous un article Wikipédia sur l'Empire State Building’". Pour le cofondateur de Wikipédia, l’IA pourrait permettre aussi de repérer des déclarations contradictoires. Mais les erreurs factuelles décrédibilisent l’IA conçue par OpenAI.

Un texte réalisé par l'IA, "c’est repéré par la patrouille"

"Ce n’est pas un débat extrêmement vivace" chez les contributeurs français, affirme Capucine-Marin Dubroca-Voisin, la présidente de l’association Wikimedia France. "ChatGPT ne vient pas remettre en question nos pratiques éditoriales. Pour l’instant, il est clairement inapte à contribuer à Wikipédia, car il invente des références." L’IA a des "hallucinations", comme on dit dans le jargon. Il ne donne pas ses sources, alors que le principe de Wikipédia est de correctement citer ses références et de les mettre à disposition des lecteurs.

Quand le travail d’une IA est repris directement pour rédiger une page, difficile de ne pas l’apercevoir. "C’est repéré par la patrouille. Ce sont des pavés de texte non sourcés. C’est détecté automatiquement", note Capucine-Marin Dubroca-Voisin.

Un robot scrute les nouvelles publications

Chez Wikipédia, "cela fait des années que l’on s’en sert, sauf que cela n’est pas de l’IA sous forme générative", rappelle Capucine-Marin Dubroca-Voisin. Des robots créés par des bénévoles de la communauté permettent de supprimer "les vandalismes triviaux". "Ils relient les dernières modifications, si elles ne sont pas correctes pour lui, il est capable de les enlèver en une ou deux secondes, ils se trompent rarement", ajoute la présidente de Wikimedia France. Elle rappelle que ChatGPT puise une partie de ses informations dans Wikipédia : "On est l’un des grands corpus utilisés pour l’entraînement des IA ces dernières années. L’idée, c’est que la connaissance libre se propage. On en fait partie et cela ne nous pose pas de problème."

ChatGPT "dit beaucoup de bêtises et invente"

En France, ils sont plusieurs centaines à contribuer de façon bénévole et régulière à l’encyclopédie en ligne, à renouveler et actualiser certaines pages. C’est le cas de Cédric, auteur de 20.000 contributions sur Wikipédia. Il a déjà été confronté à ChatGPT et a mené des essais avec des biographies sur lesquelles il a travaillé. "J’ai essayé de voir s’il était capable de faire mieux que nous. Mais on se rend vite compte que cela n’est pas le cas. Il dit beaucoup de bêtises et invente. Il mélange tout", résume Cédric. Il a attribué des inventions faites par d’autres. Les erreurs sont grossières. Sur Twitter, un internaute fait écho de premières tentatives de textes rédigés par ChatGPT introduites dans l'encyclopédie.

Le travail de vérification indispensable

ChatGPT peut être utilisé comme un outil, selon Lionel Barbe, chercheur en sciences de l'information et de la communication. "Les références doivent être vérifiées. Pour l’instant, il y a une faiblesse de côté-là. Il n’en donne pas souvent et en invente parfois. Il va être une aide à la rédaction, mais aussi pour trouver certaines sources. Mais il faut toujours retravailler derrière", précise l’auteur de "Wikipédia, objet scientifique non identifié" (Presses universitaires de Paris Nanterre)

L’intelligence artificielle trouve son intérêt quand il faut "dégrossir" un sujet, comme l’explique l’administrateur Cédric. "Pour une page sur un thème de sociologie, je lui ai demandé des plans détaillés. Il a parcouru pas mal de la littérature technique, donc il propose des bonnes bases, avec des perspectives historiques. Après, il y a tout le travail de vérification avec les sources. Pour une première ébauche, un premier jet, je l’ai utilisé comme ça."

Avec du recul, voici son constat : "Je l’ai trouvé bien pour faire le travail chiant du début, de réfléchir à comment structurer l’information. Ensuite, j’affine." Il reste alors à Cédric le gros du travail, croiser les sources, les vérifier. "C’est un outil. Il n’est pas du tout capable de remplacer un contributeur", conclut-il.