Connect with us

Technologie

Le stockage de l’ADN promet une augmentation de la capacité de stockage de 10 millions x

Published

on


Suggérez à un dirigeant principal de l’information qu’il pourrait bientôt stocker 10 millions de fois plus de données que la capacité d’un seul disque dur, et à tout le moins, ils sont susceptibles d’être sceptiques.

Mais de telles avancées pourraient être possibles – et dans les prochaines années. La raison en est le stockage de l’ADN. Au lieu d’utiliser des disques durs, des bandes magnétiques ou de la mémoire flash, le stockage de l’ADN contient des données en utilisant le code de la vie lui-même.

Avec la science d’aujourd’hui, un système de stockage d’ADN peut contenir 10 zettaoctets de données dans un appareil de la taille d’une boîte à chaussures, selon John Monroe, vice-président et analyste chez gartner, chercheur sur l’industrie. « Ces beaux codes à quatre lettres pourraient être le moyen idéal de stocker des données numériques », dit-il. « Il est énorme en termes de capacité – il est plus prometteur que tout autre format de stockage d’archives. »

Les chercheurs estiment que les données stockées dans l’ADN pourraient durer entre 700 000 et un million d’années, bien au-delà de la durée de vie de toute technologie de stockage actuelle. Monroe voit le stockage d’ADN remplacer les bandes ou les lecteurs optiques pour le stockage en ligne ou hors ligne.

L’ADN lui-même est extrêmement robuste, capable de résister à la chaleur et au froid. Et une fois que l’information a été codée et synthétisé dans l’ADN – la phase « d’écriture » – elle n’a pas besoin de pouvoir pour la maintenir dans cet état. Le séquençage et le décodage de l’ADN, la phase de « lecture », reconvertiront le code nucléotidique à quatre lettres de l’ADN en une forme qu’un ordinateur peut traiter.

Mais malgré cette promesse, l’idée est encore loin d’être une technologie pratique. L’industrie informatique n’a pas encore mis au jour des dispositifs de stockage d’ADN fonctionnels à l’échelle de la production. « Les gens ont encore du mal avec l’apparence », admet Monroe.

Il croit que l’équipement aura la taille d’un appareil de cuisine; d’autres prédisent qu’il pourrait s’agir de la taille d’un autobus scolaire. Microsoft a déjà développé une machine de codage et de récupération d’ADN de taille plus pratique, avec l’Université de Washington. Il s’agit cependant toujours d’un prototype et non de quelque chose qu’un service informatique pourrait simplement déposer dans un rack informatique 19U existant.

Romance chimique

Le codage et le séquençage actuels de l’ADN sont encore en grande partie un processus chimique. C’est la raison pour laquelle le prototype de Microsoft et de l’Université de Washington se rapproche de quelque chose que vous pourriez trouver dans un laboratoire de sciences scolaire qu’un centre de données. Et le processus est actuellement coûteux.

Le séquençage de 1 Mo de données coûte environ 3 500 $ (2 500 £). Et bien que les coûts diminuent, c’est beaucoup plus que le coût d’écriture du même volume de données sur flash ou disque. Gartner pense que la technologie ne deviendra pas courante tant que le coût ne tombera pas à environ 0,01 $ par gigaoctet.

Les technologies alternatives comprennent la synthèse enzymatique de l’ADN (EDS), qui est développée par le Wyss Institute, qui fait partie de l’Université Harvard. Les chercheurs croient que cela réduira le coût de la synthèse de l’ADN de plusieurs ordres de grandeur. L’équipe de Wyss développe un dispositif électronique qui peut synthétiser des données en ADN. Ils croient que cela permettra d’intensifier le processus en permettant de paralléliser le processus de synthèse.

Les chercheurs, cependant, sont convaincus que les coûts et les obstacles pratiques seront surmontés, ne serait-ce que parce que peu de technologies, voire aucune, offrent le potentiel de stocker les grandes quantités de données qui peuvent être stockées dans l’ADN.

Sans surprise, les gouvernements et les agences de renseignement sont à l’origine d’une grande partie de l’intérêt pour le stockage de l’ADN. Aux États-Unis, l’Intelligence Advanced Research Projects Activity (IARPA), qui fait partie du Bureau du directeur du renseignement national, gère MIST, le programme de stockage d’informations moléculaires, qui est chargé d’écrire un téraoctet et de lire 10 téraoctets de données dans les 24 heures au coût de 1 000 $.

D’autres chercheurs, du Laboratoire national de Los Alamos, sont financés par l’IARPA pour travailler sur des systèmes permettant de traduire les informations génétiques en code lisible par ordinateur. Leur système, ADS Codex, gère le codage et le décodage en binaire, indépendamment de la méthode utilisée pour la synthèse de l’ADN elle-même.

En outre, ADS Codex fournit une correction d’erreur avancée. Les erreurs d’écriture sont plus élevées dans le stockage de l’ADN que dans le stockage numérique conventionnel, un problème aggravé par le fait que l’ADN a quatre états de lettres, plutôt que les zéros et les uns du binaire. ADS Codex vérifie les données et supprime les erreurs. Le code est disponible sur GitHub.The code is available on GitHub.

L’Europe, elle aussi, a contribué sur le terrain. Le projet DNA DS basé dans l’UE, coordonné par des chercheurs slovènes, cherche à stocker 450 pétaoctets de données dans une seule molécule. Potentiellement, un centre de données entier pourrait tenir dans un seul flacon de liquide. Les chercheurs ont également examiné un autre avantage du stockage de l’ADN. Bien que l’écriture de données sur l’ADN reste lente, même un flacon plein peut être réponduated en quelques heures, avec presque aucun coût et en utilisant peu d’énergie.

Alliance technologique

Maintenant que les chercheurs universitaires ont prouvé que le stockage de l’ADN est possible, l’accent est mis sur les aspects pratiques.

En 2020, un groupe de poids lourds de l’industrie informatique, dont Microsoft et Western Digital, a formé l’Alliance de stockage de données ADN avec les sociétés de biotechnologie Twist Bioscience et Illumina, et des chercheurs universitaires.

L’objectif est de créer un écosystème viable autour du stockage de l’ADN, Microsoft et d’autres soulignant que le domaine passe de la recherche universitaire et scientifique à des applications pratiques de stockage de données pour l’informatique. L’application la plus attrayante, du moins au début, est le stockage à froid des données écrites une fois et lues rarement.

D’autres applications incluent les médias. L’année dernière Twist a encodé – de manière assez appropriée – un épisode de la série Netflix Biohackers à l’ADN. Être capable d’enregistrer efficacement des quantités illimitées de données, de les stocker indéfiniment et de les répliquer rapidement, pourrait convenir au cinéma et à d’autres industries créatives.

D’autres applications potentielles incluent le stockage de données médicales et l’archivage juridique et de conformité.

Cela pose cependant quelques autres problèmes, qui concernent autant les normes que la technologie. « Pour des données telles que WORM – écrire une fois, lire beaucoup – ou WORN – écrire une fois, lire jamais – il est important que les données soient immuables », avertit Gartner’s Monroe. « Vous devez savoir que ce que vous écrivez, disons une image d’un cerveau aujourd’hui, sera exactement le même dans 10 ans. »

Si les chercheurs peuvent s’assurer que c’est le cas, alors la double hélice de la vie pourrait encore apparaître comme le meilleur moyen de stocker nos données dans un avenir lointain.

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Tendance