ARRII Antoine BUGUET Thibaut DERHY Jonathan Thème : Matière et Forme CADN : Disque dur du futur ? OF p g Sommaire I. Différents supports de stockage Il. L’Acide DésoxyriboNucléique : stockage et transmission de l’information génétique. A. L’ADN : les principales dates a retenir depuis sa découverte B. Définition de l’ADN C. l’ADN de synthèse Ill. L’ADN Synthétique comme moyen de stockage de numérique à notre époque : en 201 2 rhumanité a produit de l’information numérique égale à deux piscines olympique remplies de clés USB de 1 téraoctet.
Ainsi, l’ADN semblât à ces hercheurs la meilleure solution, dû à sa faible masse et son volume qui sous forme solide est minime. Notre patrimoine génétique, pourrait devenir aussi notre patrimoine historique. C’est ce qui est venue à l’idée de ces deux équipes. Nous allons donc commencer par voir les différents supports de stockage, puis FADN, pour ensuite pouvoir expliquer l’expérience réaliser par ces deux équipes, et ainsi conclure sur l’impact que cette découverte pourrait avoir. l. Différents supports de stockage.
Depuis de nombreuses années, l’homme cherche à stocker ses données. L’homme utilisa tout d’abord la roche comme upport d’information. En effet afin de « stocker » leur histoire les hommes dessinaient a même la roche. Au furet à mesure l’homme commença à utiliser d’autres supports tels que le papyrus ou le papier. Au milieu du Xème siècle le disque dur est apparu. Grace à cette invention une avancée technologique a été permise dans l’avancée du stockage. Le stockage d’information est aujourd’hui assuré par un support d’information électronique donc matériel.
L’évolution des techniques de stocka e est rapide, et tend vers plus de capacité, plus de v- fiabilité, tout en étant 2 4 aractères, soit environ une journée de frappe d’une opératrice de saisie alors que les clés USB affichent des capacités allant de quelques Mo à 1 To. Voici les principaux supports de stockage utilisés à nos jours : Afin d’augmenter la durée de vie des supports de stockage et donc la perte d’information les chercheurs songent depuis longtemps a utilisé l’ADN comme support de stockage. Il. Cacide désoxyribonucléique : stockage et transmission de A.
L’ADN : les principales dates à retenir depuis sa découverte 1953 : découverte de la structure en double hélice de l’ADN par ‘Américain James Watson et le Britannique Francis Crick. 1977 : premier séquençage de l’ADN du génome d’un organisme biologique (le virus bactériophage phiX174). 2003 : premier séquençage complet du génome humain, dans le cadre du projet Génome humain lancé en 1989. 201 0 : après avoir concurrencé le projet Génome humain avec sa société Celera Genomics, l’Américain Craig Venter synthétise en laboratoire le génome d’une bactérie. 012 : découverte de ridée d’utiliser rADN en tant que support d’information informatique. CADN ou acide désoxyribonucléique est présente dans chaque cellule. Elle renferme l’ensemble des informations nécessaires au développement et au fonctionnement d’un organisme. Cest aussi le support de l’hérédité car il est transmis lors de la reproduction, de manière intégrale ou n nc l’information génétique 3 4 molécule en forme de double hélice droite avec deux brins complémentaires.
Chaque brin est composé de nucléotides, eux- mêmes composés de bases azotées, d’oses (désoxyribose) et de groupes phosphate. Il existe quatre bases azotées différentes, donnant quatre nucléotides différent • Adénine (A) • Thymine (T) • Guanine (G) • Cytosine (C) Ces nucléotides s’enchainent par paires spécifique . • Le T avec le A • Le G avec le C • Le C avec le G C’est l’enchainement de ces nucléotides qui créent le génotype et influe sur l’être-vivant. L’ADN détermine aussi la synthèse des protéines, mais ce n’est pas ce qui nous intéresse ici.
Nous allons ici nous concentrer sur la partie du génotype et plus particulièrement de renchainement des nucléotides sur lequel se base notre expérience. C. L’ADN de synthèse L’encyclopédie Universalis explique ainsi le principe de la synthèse de cet ADN de synthèse que l’on pourrait qualifier d’« artificiel ? : Il s’agit d’effectuer la synthèse chimique d’un chromosome d’origine bactérienne en reliant dans un ordre très précis les quelques milliers de nucléotides qui le constituent.
La complexité de processus réside dans la succession de réactions chimiques, de lavage des réactifs et l’amélioration du rendement de chaque étape. Ce processus est automatisé dans des appareils appelé synthétiseur d’ADN. Un a ine scientifique Science une fois inséré dans une levure ») procure quelques repères historiques intéressants : La synthèse chimique de fragments d’ADN par addition uccessive à partir d’un nucléotide initial immobilisé sur un support insoluble a été relaissé dès la fin des années 60.
Puis les succès scientifiques se sont accélères – 1978 premières productions industrielles d’insuline humaine pa une bactérie transgénique – 1986 premières plantes transgéniques cultivées en plein champ – 2002 premières synthèses du génome fonctionnel du virus de la poliomyélite (7541 bases azoté) – 2007 premiers génomes d’une bactérie transférée à une autre espèce de bactérie. – 2008 premières synthèses du génome d’une bactérie. 2010 premières cellules synthétiques.
Aujourd’hui les synthétiseurs d’ADN permettent la fabrication d’oligonucléotides de 150 à 200 nucléotides qui pourront être ensuite assemblé en fragments plus longs d’ADN. 4 livres de Church lui-même, un essai sur la biologie de synthèse, pour tenter de prouver que 300 pages d’information pouvait être stockes dans de l’ADN. Les différentes étapes de son expérimentation (décrites avec précision mais simplicité dans l’article de Daniel delbecq «une livre entier stocker dans FADN La Recherche octobre 2012) sont les suivantes •
Première traduction en codage binaire, succession de O et de 1, des 53426 mots et des 11 images du livre. Chaque lettre de l’alphabet était ainsi codée par une suite de 8 bit. Deuxième traduction virtuelle selon le code de l’ADN : chaque O a été codé par un nucléotide adénie ou cytosine et chaque 1 a été codé par thymine ou guanine. On obtenait ainsi pour chaque lettre une représentation par 256 motifs différents comme « ATGCACAT » ou « CTGACACT » pour la lettre « a Synthèse de l’ADN avec découpage préalable en 55 000 blocs d’environ 100 nucléotides chacun.
L’équipe de George Church tilise alors le synthétiseur d’ADN (Cf II. 2). Chacun de ses blocs a été identifié par un code barre spécifique, lui aussi écrit en ADN pour ordonner les informations lors de la lecture. es brins d’ADN synthétisé ont ensuite été dupliqués par une technique ben connu en biologie moléculaire, la réaction en chaine par polymérase. La lecture de cette ADN permet de récupérer l’intégralité du livre de G. Church.
Cette lecture se fait au moyen d’un séquenceur automatique. Nous pouvons donc voir que Church est le pionnier en matière de stockage sur ADN. Afin de réaliser cette expérience Georges Church a utilisé des moyens ne venant que de son laboratoire (synthétiseur). Afin de perfectionner l’expé 6 4 utilisé des moyens ne venant que de son laboratoire (synthétiseur). Afin de perfectionner l’expérience de un autre scientifiques a utilisé des techniques plus rapides que nous allons vous présentez. ) Les Travaux de Nick Goldman Malgré la grande avancée sur la problématique avec les travaux de Church des difficultés non négligeables restaient à être résolues. Certaines ont été surmontées par l’équipe dirige par N. Goldman a l’institut européen de Bio-informatique (EMBL, UK) en artenariat avec la compagnie privée « Agilent Technology Inc. » en Californie. *Seul la synthèse de chaines courtes d’ADN été techniquement réalisables. *la synthèse et la lecture d’ADN pouvaient être sujette à des erreurs surtout quand la même lettre de base azotée est répétée.
Notons tout d’abord que Les sources d’information utilisées par Nick Goldman et son équipe même SI elles contiennent le même volume d’informations à stocker (5,27 mégabits) sont plus variees que celle utilisées par Church : 1 enregistrement d’un fichier MP3 de 26 secondes (« I have a ream » de Martin Luther King) une photo de l’institut ou ils travaillent fichier de texte (contenant 154 sonnets de Shakespeare) fichier PDF de l’article historique de Watson et Crick « Structure de l’ADN à double révolution La nouveauté est qu’au lieu de juste utiliser le binaire, Nick Goldman a eu l’idée de coupler binaire, ternaire et code ADN.
En effet, après avoir transcrit son texte en une suite de O et 1, langage binaire, il l’a transcrit de nouveau en une suite de O, 1 et 2, langage ternaire, pour enfin traduire ce dernier langage en code ADN suite de base azotés A angage ternaire, pour enfin traduire ce dernier langage en code ADN suite de base azotés, A, T, G, C. L’avantage de cette possibilité apportée par l’équipe de Goldman, est la rapidité de transcription et de traduction, et la simplification des motifs du code ADN, en en réduisant le nombre et la taille.
Voyons ces étapes un peu plus en détail : Ici les étapes réalisées sont les suivantes . « les données numérique composées de la succession de « O » et de « 1 » ont été transcrites en un code ternaire « 0», « 1 » ou « 2 » puis à nouveau pour les faire correspondre aux 4 bases zotées constitutives de l’ADN : adénine, thymine, guanine et cytosine.
Le codage élaboré par Nick Goldman fait correspondre une série de 8 bits (soit un byte) avec un mot formé par les baes azotées : « TAGAT3 ou « C TAG pour éviter les erreurs de lecture, les chercheurs ont découpe le code en de multiples fragments d’ ADN (17 lettres chacun) se chevauchant dans les deux sens et sont indexés de façon ? indiquer leur position précise dans l’ensemble . entreprise américaine Agilent s’est alors occupé de produire la centaine de milliers de brins d’ADN commandés par les hercheurs, les ont dupliqué à 12 millions d’exemplaires avant de les lyophiliser (conserver dans le froid). L’entreprise a alors renvoyé « le minuscule grain de poussière » obtenu et contenant toutes les données. *L’équipe européenne a alors mis en place des techniques de séquençage pour décoder l’ADN de synthèse reçu.
Ils ont ainsi pu reconstituer les données d’origine sans la moindre erreur. Au-delà d’une prouesse technique, d B4 Au-delà d’une prouesse technique, des faits : -Nick Goldman et son équipe ont réussi à stocker 5,27 millions de bits soit une succession de 5,2 millions de « O » et de « 1 l’ADN permet une formidable condensation de l’information : *un sonnet de Shakespeare ne pèse que 0,3 millionième d’un millionième de gramme.
Dans ces conditions on peut s’amuser à extrapoler : « 1 gramme d’ADN pourrait contenir autant d’informations que dans plus d’un million de CD, et la Grande Bibliothèque de France pourrait contenir dans une petit tube de laboratoire * Le code génétique introduit une dimension en 3 D du fait de sa structure hélicoidale et de l’appariement des baes azotes , ce qui donne une densité beaucoup plus importante , alors que le code binaire ,lui, est plan. n autre fait vient confirmer la fiabilité de l’ADN en tant que support de stockage de données. En effet, selon Nick Goldman, « FADN est un outil de stockage d’informations fiable , car celui qu’on extrait d’os de mammouth laineux, vieux de plusieurs dizaines de milliers d’années est encore exploitable Les performances de ces deux procédés expérimentaux (travaux de Georges Church et Nick Goldman) sont sensiblement équivalentes et permettent d’envisage un stockage de données fiable, illimité et peu énergivore.
Avec la méthode de Goldman, on pourrait envisager l’archivage es données numériques du CERN ( Centre Européen de recherche nucléaire) soit 90 Pétra bytes ( 90x 1015 bytes) sur 41 grammes d Européen de recherche nucléaire) soit 90 Pétra bytes ( 90 x 1015 bytes) sur 41 grammes d’ADN. Résume des étapes clés : Cette photographie nous montre le déroulement afin de stocker un livre sur de l’ADN. Etape 1 et 2 : La lettre « a en système binaire, se code par la suite de huit chiffres 01000001, ce qui pourrait se coder par la séquence de huit nucléotides AGCCACAT ou encore CTAACACG, ou encore ATCAAACT etc.
Mais si l’on utilise le ternaire, la lettre ? a » pourrait être traduite par la suite 01 1 12, donnant en base azoté : CAGAT. On peut donc bien voire la simplification apporté par Goldman. Etape 3 : Après avoir traduit de manière informatique, il faut synthétiser FADN, suite de nucléotide A T G et C. C’est ici que Agilent intervient, proposant au chercheur de leur fournir un modèle d’ADN en tout point semblable a de l’ADN, mais ne venant d’aucun organisme vivant. Etape 4 : Il faut ensuite décomposer la molécule d’ADN en millier de brins composé de 5 à 8 nucléotides selon le langage choisi précédemment.
Ainsi, lors de la lecture, les machines pourront lire plusieurs brins en même temps et seul le temps de retranscription du texte dans l’ordre sera à prendre en compte. Cavantage de séparer PADN en milliers de brins et que le temps de lecture au final, passera de 1 mois pour une molécule d’ADN complète non disloquer, à 1 semaine si elle a été séparé en millier de brins. Etape 5 : Il ne reste plus qu’à traduire les nucléotides lu précédemment, de nouveau en code ternaire et binaire ou seulement binaire, puis en texte. Ainsi la première et deuxième étape sont réalisés dans I’ 0 4