L'intelligence artificielle au service du grand débat

Publicité

L'intelligence artificielle au service du grand débat

Par
Les millions de contributions des Français qui ont participé sur la page internet du grand débat seront analysées par des algorithmes utilisant l'intelligence artificielle.
Les millions de contributions des Français qui ont participé sur la page internet du grand débat seront analysées par des algorithmes utilisant l'intelligence artificielle.
- granddebat.fr

Repères. Deux mois après son lancement, le “grand débat national” touche à sa fin. Pour analyser les millions de contributions, l’intelligence artificielle (IA) sera utilisée : mais pas seulement par le gouvernement ! Pour éviter les biais, la société civile s’y colle aussi et promet ses propres conclusions.

Après le "grand débat", c'est l'heure de la grande synthèse ! Imaginé comme une solution à la crise inédite des "gilets jaunes", le "grand débat national" a été lancé le 15 janvier et doit s'achever au printemps 2019 avec la restitution des propositions faites par les Français. Des millions de contributions ont été reçues par courrier envoyé au gouvernement, dans les cahiers de doléance ouverts dans les mairies et sur la page officielle du grand débat. Pour les analyser, le gouvernement a recours à l'intelligence artificielle (IA), seule capable de traiter une telle masse de données. Mais la société civile aura aussi son mot à dire car les contributions ont été rendues publiques. Des associations feront leurs propres analyses et ainsi, le gouvernement ne sera pas le seul à rendre ses conclusions.

Le gouvernement compte sur l'IA pour tirer les conclusions du "grand débat"

C’est un travail de fourmi qui s’annonce dans les semaines qui viennent pour le gouvernement : synthétiser les millions de réponses envoyées par les Français dans le cadre du “grand débat”. Pour y arriver, plusieurs types d’inventaire sont prévus.

Publicité

Le premier concerne les cahiers de doléance ouverts dans les mairies, les courriers reçus par le gouvernement et les compte-rendus des débats locaux, régionaux et nationaux : tous ces documents imprimés ou manuscrits sont transmis à la Bibliothèque nationale de France qui s’occupe de les numériser. Ils sont ensuite analysés par un groupement piloté par le cabinet de conseil en stratégie Roland Berger, associé à Cognito et Bluenove, spécialisés dans le traitement des données et qui feront émerger les principales propositions des contributeurs au "grand débat".

Pour afficher ce contenu Twitter, vous devez accepter les cookies Réseaux Sociaux.

Ces cookies permettent de partager ou réagir directement sur les réseaux sociaux auxquels vous êtes connectés ou d'intégrer du contenu initialement posté sur ces réseaux sociaux. Ils permettent aussi aux réseaux sociaux d'utiliser vos visites sur nos sites et applications à des fins de personnalisation et de ciblage publicitaire.

Le second mode de traitement s’applique aux contributions laissées sur le site internet officiel du “grand débat” : 1,6 million en tout, qui seront analysées par OpinionWay, l’institut de sondage retenu par l’Etat pour effectuer cette tâche et qui distingue deux cas de figures : les questions fermées et les propositions ouvertes.

Les réponses aux questions fermées seront analysées par une vingtaine de personnes à temps plein de façon simple : “c’est un comptage des occurrences de chacune des réponses que nous transformons ensuite en pourcentage”, explique Frédéric Micheau, directeur du département opinion et politique d’OpinionWay. Les questions portaient sur quatre grands thèmes choisis par le gouvernement : transition écologique, fiscalité et dépenses publiques, démocratie et citoyenneté, organisation de l’Etat et des services publics. Pour chaque thème, une dizaine de questions avait été préparée.

Le site officiel du grand débat proposait aux contributeurs de répondre à des questions rapides - et fermées - sur quatre grands thèmes retenus par le gouvernement.
Le site officiel du grand débat proposait aux contributeurs de répondre à des questions rapides - et fermées - sur quatre grands thèmes retenus par le gouvernement.
- granddebat.fr

Le deuxième cas de figure est plus compliqué à traiter : il s’agit des propositions ouvertes laissées par les contributeurs, “on les appelle les verbatim”, poursuit Frédéric Micheau. "L'engagement du gouvernement et donc d'OpinionWay est de tous les traiter. Pour cela, nous avons fait appel à un prestataire : la société française Qwam. Elle édite un outil d'analyse textuelle en masse (...) capable de lire l'intégralité des verbatim in extenso, avec une précision qui descend jusqu'à la proposition dans la phrase. Une fois qu'on a repéré l'ensemble des notions, elles sont triées par catégories et sous catégories".

Le site internet du "grand débat" proposait aussi aux contributeurs de poster des propositions ouvertes - des "verbatim" - sur les quatre thèmes retenus par le gouvernement.
Le site internet du "grand débat" proposait aussi aux contributeurs de poster des propositions ouvertes - des "verbatim" - sur les quatre thèmes retenus par le gouvernement.
- granddebat.fr

L’intelligence artificielle va classer les contributions dans une quinzaine de grandes catégories, charge à l’IA de reconnaître ce qui relève de la critique, de l’avis favorable ou de la simple proposition. 

Le système ne sera toutefois pas laissé sans surveillance des humains : OpinionWay précise qu’un processus itératif (d’allers-retours) a été conçu entre les superviseurs humains et la machine. L’algorithme travaillera seul dans un premier temps et l’humain interviendra pour vérifier si les résultats sont cohérents : s’il n’est pas satisfait, il pourra alors corriger les paramètres. “Cela permet par exemple de pas avoir deux catégories lorsque quelqu’un écrit sur le ‘prix des autoroutes’ et un autre sur le ‘tarif des péages’ ; les mots sont différents mais la catégorie est la même”, précise Frédéric Micheau dans une interview aux Echos.

Opinion Way affirme que son système est sûr et que le risque de voir les résultats biaisés a été pris en compte. Afin de garantir l’impartialité et l’indépendance des synthèses, un collège de cinq garants a été nommé : cinq personnalités désignées par le le gouvernement, le Sénat, l’Assemblée nationale et le CESE (Conseil économique, social et environnemental). 

Autre risque de biais : et si des internautes s’étaient donnés le mot pour ‘“matraquer” un message unique et ainsi grossir son importance ? Un seul cas aurait été détecté pour l’instant, révèle Paris Match “un texte reproduit près de 6 000 fois critiquant la limitation à 80 km/h”. Les garants assurent que les réponses “dupliquées” seront repérées et éventuellement écartées.

Grand reportage
56 min

Des acteurs de la société civile promettent des synthèses indépendantes

Mais le gouvernement ne sera pas seul à proposer son analyse du "grand débat national" : d'autres conclusions seront également rendues par des acteurs indépendants. C'est une démarche qui a été voulue par l'Etat et mise en œuvre par OpinionWay : "Notre intention est de travailler en 'open data' (donnée ouverte)", expliquait Frédéric Micheau dans une interview à Libération le 15 février, "[pour] que tout le monde puisse examiner notre code et notre méthodologie. Nous sommes favorables à ces pratiques depuis longtemps. Notre institut a été le premier à rendre publics les redressements de 'ses' intentions de vote, lors des présidentielles de 2012 et 2017".

Et pour analyser ces données ouvertes, on trouve beaucoup d'initiatives. Dans un article publié le 15 mars, le Huffington Post en compte des dizaines : menées par des scientifiques, des associations, de simples citoyens, etc.

L'observatoire des débats est un exemple : piloté par une organisation regroupant plusieurs laboratoires scientifiques ( Groupement d'intérêt scientifique Démocratie et participation, sous l'égide du CNRS). Il se propose de constituer un miroir indépendant des réunions publiques, des débats sur internet et les réseaux sociaux, durant le temps du "grand débat national". Des observateurs ont été envoyés lors des débats locaux et d'autres membres s'occupent d'analyser les données récupérées sur internet.

Et certaines équipes de recherches mettent déjà en ligne une partie de leurs travaux. Via la plateforme Cartolabe, utilisée habituellement pour analyser les publications scientifiques, on peut observer la quantité des données classée par thème et sous la forme d'une carte. Autre outil disponible : le Politoscope, développé lors de la campagne présidentielle de 2017 afin de donner du sens à la masse des données générées (voir tweet ci-dessous). Il est développé par le CNRS et l'ISCPIF (Institut des systèmes complexes Paris Ile-de-France) et se présente également sous la forme d'une cartographie.

Pour afficher ce contenu Twitter, vous devez accepter les cookies Réseaux Sociaux.

Ces cookies permettent de partager ou réagir directement sur les réseaux sociaux auxquels vous êtes connectés ou d'intégrer du contenu initialement posté sur ces réseaux sociaux. Ils permettent aussi aux réseaux sociaux d'utiliser vos visites sur nos sites et applications à des fins de personnalisation et de ciblage publicitaire.

Autre initiative lancée par des "citoyens indépendants, chercheurs, datascientists, développeurs, militant pour l'ouverture des données et des codes publics" : La grande annotation. C'est un site internet où les organisateurs proposent aux participants de lire et d'annoter les contributions au "grand débat". "Nous pensons que l'intelligence artificielle seule ne vaut pas une lecture humaine, collaborative et transparente", est-il écrit sur la page d'accueil. 

"La simple lecture nous semble avoir une valeur importante", explique Frédéric Marbath, cofondateur de cette plateforme. "Il y a déjà des questions pour lesquelles 10 000 textes ont été lus et annotés. On fait passer trois personnes sur chaque texte au moins, jusqu’à ce que les trois personnes arrivent à un résumé cohérent et concordant du texte." Une technique évidemment plus lente mais qui avance : mi-mars, 10% du granddebat.fr avait ainsi été lu et annoté d'après La grande annotation.

Enfin, des chercheurs s'intéressent aussi aux "autres données", celles qui ne viennent pas du site officiel du grand débat : la page du " vrai débat", par exemple, créé par des "gilets jaunes" ou encore les pages Facebook ou les publications Twitter créées ou partagées ces derniers mois. Des initiatives existent là aussi. Le Politoscope a ainsi demandé à accéder aux données du "vrai débat". A la fin, le gouvernement sera donc loin d'être seul à rendre ses conclusions.

Hashtag
4 min