Publicité

Stocker pour 50 000 ans : des textes historiques sur ADN entrent aux Archives nationales

Par
 La bibliothèque des Archives nationales abrite désormais des documents encodés sur ADN synthétique.
La bibliothèque des Archives nationales abrite désormais des documents encodés sur ADN synthétique.
© Getty - Jean-Marc LOUBAT

C'est une première mondiale : les Archives nationales conservent désormais deux textes historiques numériques encodés sur ADN, ceux des Droits de l'homme et des Droits de la femme. Une technologie nouvelle, possible révolution dans le stockage de nos données numériques, toujours plus volumineuses.

"Les yeux d'un archiviste ne peuvent que briller quand on leur promet une conservation stable sur des centaines de milliers d'années voire au-delà !", s'enthousiasme Bruno Ricard, le directeur des Archives nationales. L'institution, qui conserve dans ses serveurs plus de 70 téraoctets de données numériques (des courriels de cabinets ministériels, l'enregistrement de procès pour crime contre l'humanité ou celui du grand débat national organisé lors de la crise des Gilets jaunes), ne pouvait qu'être séduite par la proposition de Stéphane Lemaire, directeur de recherche au CNRS, et de Pierre Crozet, maître de conférence à Sorbonne Université : conserver des documents sur de l'ADN synthétique.

Et pas n'importe lesquels : la Déclaration des Droits de l'Homme et du citoyen (1789) et la Déclaration des Droits de la femme et de la citoyenne (1791), rédigée par Olympe de Gouges. Ce mardi 23 novembre, les Archives nationales ont ouvert les lourdes portes de l'Armoire de fer, un coffre-fort conservé au cœur des "grands dépôts", pour y déposer deux capsules métalliques de la taille d'une pilule, renfermant les deux textes fondateurs encodés sur de l'ADN artificiel. Une grande première ! Cette technologie émergente d'archivage pourrait être une solution à l'expansion, coûteuse et néfaste pour l'environnement, du stockage de nos données numériques. Comment fonctionne-t-elle ? Quelles sont ses promesses et ses limites ?

Publicité

Bruno Ricard, directeur des Archives nationales : "C'est un acte symbolique très fort"

1 min

L'ADN, une révolution pour le stockage de données ?

Capsules contenant les deux Déclarations encodées sur ADN.
Capsules contenant les deux Déclarations encodées sur ADN.
- © Stéphane Lemaire / CNRS – Sorbonne Université

Le volume de la datasphère, c'est-à-dire l’ensemble des données numériques mondiales, est aujourd’hui estimé à 45 zettaoctets ; en 2025, il devrait en atteindre 175. Mais parmi l’ensemble de ces informations, 70 % sont dites froides. "Ce sont des données que l'on souhaite conserver, mais que l'on ne consulte presque jamais", explique Stéphane Lemaire. Généralement stockées sur des bandes magnétiques, l'archivage de ces données numériques se heurte à trois problèmes : 

- La faible durée de vie des supports de stockage. Nos disques durs, bandes magnétiques ou mémoires flash ne sont pas éternels, et les données qu'ils conservent doivent être régulièrement copiées sur de nouveaux supports.

- Une demande toujours croissante. "Depuis 2010, indique Stéphane Lemaire, la demande de stockage est supérieure à l'offre, à nos capacités".

- Enfin, le coût écologique désastreux des infrastructures de stockage, volumineuses et énergivores. "Les data centers consomment 2% de la production électrique mondiale, souligne le chercheur au CNRS, leur empreinte carbone a même dépassé celle de l’aviation civile". 

3 min

Brevetée par Stéphane Lemaire et Pierre Crozet, la technologie du projet "DNA Drive" entend dépasser ces limites. S'inspirant des mécanismes de la biologie pour copier des données sur des grands fragments d’ADN, elle permet de convertir le code informatique des données numériques en code génétique. Le système binaire, fait de 0 et de 1, devient alors un système quaternaire, l'ADN étant composé de nucléotides symbolisés par les lettres A, T, C et G. Pour ce faire, les chercheurs ont utilisé un algorithme qu'ils ont développé en laboratoire, appelé "DNA Drive". Les molécules d'ADN sont ensuite conservées lyophilisées dans de toutes petites capsules, protégées de la lumière et de l'air. 

Pour récupérer et lire l'information stockée, il suffit d'ouvrir la capsule, ajouter une goutte d'eau et déposer quelques molécules d'ADN sur un séquenceur. "On utilise cette technologie pour relire l'information numérique encodée sur l'ADN", explique Stéphane Lemaire. 

58 min

Une technologie écologique, mais coûteuse

Les capsules sont déposées dans l'Armoire de fer des Archives nationales.
Les capsules sont déposées dans l'Armoire de fer des Archives nationales.
© Radio France - Pauline Petit

Pour l'équipe de Stéphane Lemaire, cette technique de conservation sur ADN, compatible avec tout type d'information numérique, permettrait de réduire l'empreinte environnementale du stockage de données : "L'ADN est la meilleure technologie dont on dispose pour résoudre ces problèmes, car il peut être conservé à température ambiante et sans apport d'énergie. Pour le rendre stable, il suffit de le stocker à l'abri de l'air, de l'eau et de la lumière. Dans ces conditions, on estime que l'ADN est stable pendant plus de 50 000 ans." Une durée de conservation incomparable avec celles de nos supports numériques actuels. 

Stéphane Lemaire : "C'est un stockage à l'échelle moléculaire"

1 min

De plus, cette forme d'archivage est particulièrement compacte. Avec une densité maximale de 450 millions de téraoctets par gramme d’ADN, l’intégralité des données mondiales pourrait tenir dans 100 grammes d’ADN. L'équivalent du "volume d’une tablette de chocolat", sourit le chercheur. Appétissant ! Qu'attendons-nous alors ? Que cette technologie soit moins coûteuse, d'abord. Actuellement, elle s'élève à "environ 1 000 dollars par mégaoctets", indique Stéphane Lemaire. Par ailleurs, la technique nécessite encore quelques améliorations : l'encodage d'un document sur ADN prend plusieurs jours, sa lecture, plusieurs heures. "Il nous reste encore de nombreux défis à relever, souligne Pierre Crozet. Nous allons maintenant travailler à perfectionner notre technologie, bénéficiant des améliorations qui seront faites tant dans la synthèse que le séquençage de l’ADN pour en réduire les coûts. L’objectif est que le DNA Drive soit viable et exploitable dans les data centers d’ici 2030."

Cette technologie concernant avant tout le stockage d'archives à long terme (les données froides), Béatrice Herold, directrice du numérique et de la conservation des Archives nationales, se réjouit pour l'heure de son expérimentation. "Être archiviste c'est penser à l'avenir beaucoup plus qu'au passé, nous sommes donc très attachés aux recherches qui portent sur ces sujets", déclare-t-elle à France Info. Réduites à des molécules, repliées dans des capsules elles-mêmes encloses dans le coffre-fort des Archives nationales aux côtés des originaux, la Déclaration des droits de l'homme et du citoyens et celle des Droits de la femme et de la citoyenne sont, en tout cas, désormais protégées pour au moins plusieurs dizaines de millions d'années…

À réécouter : Histoires d’archives
12 min