Publicité

Une formule mathématique pour remonter aux sources des informations

Par

Pedro Pinto
Pedro Pinto

La découverte pourrait être capitale pour les enquêteurs ou les analystes d'Internet. L'Ecole polytechnique fédérale de Lausanne (EPFL), en Suisse, a annoncé la découverte d'un algorithme mathématique qui permet d'identifier l'origine d'une information qui circule sur un réseau. A l'origine de cette découverte, Pedro Pinto, un jeune chercheur portugais de l'EPFL. C'est la première fois que des chercheurs parviennent à remonter le chemin parcouru par une information. Franceculture.fr décrypte cette découverte en six questions.

De quoi s'agit-il exactement ? C'est un algorithme, une formule mathématique, qui peut s'appliquer à tout réseau connu. En disposant sur ce réseau un certain nombre de capteurs, il permet de remonter à la source de toute information , de toute contamination, ou de toute attaque survenue sur le réseau concerné. Par exemple, sur un réseau social de 500 personnes au sein duquel circule une rumeur, en observant les messages postés par seulement 15 à 20 membres, il est possible de retrouver qui est à l'origine de la rumeur .

Publicité

Quelle est la nouveauté ? Cette étude est l'une des premières à s'intéresser à une question : comment remonter le chemin parcouru par une information ? Les scientifiques, et en particulier les mathématiciens, savent de quelle manière une information, une épidémie, peut se propager, mais ils étaient jusqu'alors incapables de faire le chemin en sens inverse . Les résultats de l'algorithme de Pedro Pinto permettent cela. Si les résultats ne sont pas toujours certains à 100%, le taux de probabilité que la source identifiée soit la bonne reste élevé.

Le principe de triangulation, base de l'algorithme de Pedro Pinto
Le principe de triangulation, base de l'algorithme de Pedro Pinto
© Radio France - Julien Baldacchino

Comment cet algorithme fonctionne-t-il ?
Les combinaisons mathématiques qu'il renferme sont particulièrement complexes. Mais Pedro Pinto, l'inventeur de cette formule, affirme s'être inspiré du système de triangulation .

Ce système est très utilisé dans les réseaux de téléphonie mobile, pour localiser un téléphone portable : en traçant un cercle autour de chacun des trois relais téléphoniques les plus proches, le seul point d'intersection possible est l'emplacement probable du téléphone portable. C'est donc en partant de ce principe de base que Pedro Pinto a développé son algorithme.

Quelles sont ses applications ? Elles sont extrêmement nombreuses, car la formule s'applique aussi bien aux réseaux virtuels qu'aux réseaux physiques. Ce qui fonctionne pour les réseaux sociaux fonctionne donc aussi pour votre réseau de transports en commun, ou pour des réseaux d'évacuation d'eau . Pour preuve, l'une des expériences menées par Pinto et son équipe : en analysant le réseau des fleuves et des rivières en Afrique du Sud, et en les croisant avec des données de centres médicaux, ils sont parvenus à remonter à l'épicentre d'une épidémie de choléra survenue en 2000.

Pedro Pinto, le créateur de l'algorithme, explique sa démarche :

Écouter

1 min

Image d'illustration
Image d'illustration
© Fotolia - Scanrail

Quel futur pour cette formule ? Décrit dans une revue scientifique ce vendredi, l'algorithme verra son code source informatique révélé d'ici quelques jours. Par la suite, Pedro Pinto envisage de développer une commercialisation de sa trouvaille, sous forme d'une application qui pourra servir, par exemple, aux professionnels du marketing pour étudier la diffusion de leurs messages.

Cette découverte présente-t-elle des risques ? Il y a effectivement des risques. Comme la plupart des découvertes scientifiques, elle n'est pas à l'abri d'un détournement à des fins peu éthiques, comme le traçage de dissidents politiques. C'est ce qu'explique Serge Soudoplatoff, chercheur et spécialiste d'Internet, tout en précisant qu'il faut faire preuve de sens éthique pour savoir tirer le meilleur de l'innovation :

Écouter

1 min

L'article scientifique de Pedro Pinto

Dans cet article, Pedro Pinto explique le principe, le fonctionnement et les détails de son algorithme. Le résumé de l'article est accessible gratuitement, l'intégralité du texte est par contre en accès payant.